Безмодельні алгоритми навчання з підкріпленням

Черноіваненко, Сергій Миколайович

Безмодельні алгоритми навчання з підкріпленням

dc.contributor.author	Черноіваненко, Сергій Миколайович
dc.date.accessioned	2024-02-20T11:57:10Z
dc.date.available	2024-02-20T11:57:10Z
dc.date.issued	2023
dc.description.abstract	Метою даної кваліфікаційної роботи є апробація та модифікація алгоритму безмодельного навчання (а саме алгоритм Q-навчання). В процесі досягнення мети роботи був виконаний огляд основних теоретичних положень про область навчання з підкріпленням, були детально розглянуті принципи роботи алгоритмів безмодельного навчання з підкріпленням, запропонована і протестована модифікація алгоритму Q-навчання для прискорення процесу навчання за рахунок використання моделі, а також вивчені результати інших досліджень щодо даної методики. Для практичної апробації була розроблена тестувальна платформа на основі мови програмування Python, бібліотеки оточень агентів навчання з підкріпленням OpenAi Gymnasium та фреймворку машинного навчання загального призначення PyTorch. Результатом даної роботи є бібліотека компонент агентів навчання з підкріпленням, додаток з консольним інтерфейсом для тестування розроблених агентів навчання з підкріпленням та звіт по результатах апробації із рекомендаціями та пропозиціями щодо подальших напрямків дослідження.	uk_UA
dc.description.abstract	The purpose of this qualification work is approbation and modification of the model-free learning algorithm (namely, the Q-learning algorithm). In the process of achieving the purpose of the work, a review of the main theoretical provisions in the field of reinforcement learning was carried out, the working principles of model-free reinforcement learning algorithms were considered in detail, a modification of the Q-learning algorithm was proposed and tested to speed up the learning process through the use of a model, and the results of other studies on similar to prosed acceleration method were also overviewed. For practical approbation, a testing platform was developed based on the Python programming language, the OpenAi Gymnasium reinforcement learning agent environment library, and the PyTorch general-purpose machine learning framework. The result of this work is a library of components of reinforcement learning agents, an application with a console interface for testing the developed reinforcement learning agents, and a report on the results of the approbation with recommendations and suggestions for further research directions.
dc.identifier.citation	Черноіваненко, С. М. Безмодельні алгоритми навчання з підкріпленням : кваліфікаційна робота бакалавра ; Model-free reinforcement learning algorithms / С. М. Черноіваненко. – Одеса, 2023. – 38 с.	uk_UA
dc.identifier.uri	https://dspace.onu.edu.ua/handle/123456789/37608
dc.language.iso	uk	uk_UA
dc.publisher	Одеський національний університет імені І. І. Мечникова	uk_UA
dc.subject	126 інформаційні системи та технології	uk_UA
dc.subject	алгоритм Q-навчання	uk_UA
dc.subject	алгоритму безмодельного навчання	uk_UA
dc.subject	Q-learning algorithm	uk_UA
dc.subject	model-free learning algorithm	uk_UA
dc.title	Безмодельні алгоритми навчання з підкріпленням	uk_UA
dc.title.alternative	Model-free reinforcement learning algorithms	uk_UA
dc.type	Diplomas	uk_UA

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: 126_Chernoivanenko_Serhii_Mykolaiovych.pdf
Розмір:: 621.14 KB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 1.71 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаври МФІТ