Жуков, Павло Петрович2025-01-302025-01-302021Жуков, П. П. Алгоритми керування агентами у стохастичному оточенні : дипломна робота бакалавра / П. П. Жуков. – Одеса, 2021. – 47 с.https://dspace.onu.edu.ua/handle/123456789/40528Машинне навчання з підкріпленням це облать машинного навчання, яке спеціалізується на навчанні агентів приймати рішення у спецефічних оточеннях. Це може бути щось таке, як класична відеоігра, керування автомобілем, керування роботизованною рукою тощоReinforcement learning is the special area of machine learning, specialised on learning agents to take actions on specific environments. It could be something like playing a classic video game, driving a car, controlling robotic arms or even playing hide and seek!en113 прикладна математикабакалавралгоритмикеруваннястохастичне оточенняalgorithmsmanagementstochastic environmentАлгоритми керування агентами у стохастичному оточенніAlgorithms of controlling agents in stochastic environmentsDiplomas