Please use this identifier to cite or link to this item:
http://dspace.pdpu.edu.ua/handle/123456789/25363| Title: | Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил |
| Authors: | Рябов, Д. М. Пенко, В. Г. |
| Keywords: | машинне навчання рівняння Беллмана динамічне програмування методи Монте-Карло переривання малоперспективних обчислень |
| Issue Date: | 2026 |
| Publisher: | Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського» |
| Citation: | Рябов Д. М., Пенко В. Г. Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 201-203. |
| Abstract: | Навчання з підкріпленням є одним із підходів машинного навчання, у межах якого агент набуває досвіду шляхом взаємодії з певним середовищем. У цій парадигмі існує низка методів розв’язання задач навчання, зокрема динамічне програмування, що базується на рівнянні Беллмана, методи Монте-Карло, підходи на основі часових різниць та інші [1]. У даній роботі автори пропонують метод покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Метод базується на перериванні малоперспективних обчислень згідно встановленим емпірічним правилам. Така стратегія дозволяє ефективно керувати розподілом обчислювальних ресурсів, покращити результати і зменшити час роботи алгоритмів, не змінюючи їх[2]. Евристика застосовується як додаткова логіка в обгортці середовища (gym.Wrapper), що робить її сумісною з будь-яким RL-алгоритмом, який використовує стандартний API середовища[3]. |
| URI: | http://dspace.pdpu.edu.ua/handle/123456789/25363 |
| Appears in Collections: | Інформатика, інформаційні системи та технології (2026) |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| RIABOV.pdf | 554.6 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.