Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал:
http://dspace.pdpu.edu.ua/handle/123456789/25363| Назва: | Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил |
| Автори: | Рябов, Д. М. Пенко, В. Г. |
| Ключові слова: | машинне навчання рівняння Беллмана динамічне програмування методи Монте-Карло переривання малоперспективних обчислень |
| Дата публікації: | 2026 |
| Видавництво: | Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського» |
| Бібліографічний опис: | Рябов Д. М., Пенко В. Г. Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 201-203. |
| Короткий огляд (реферат): | Навчання з підкріпленням є одним із підходів машинного навчання, у межах якого агент набуває досвіду шляхом взаємодії з певним середовищем. У цій парадигмі існує низка методів розв’язання задач навчання, зокрема динамічне програмування, що базується на рівнянні Беллмана, методи Монте-Карло, підходи на основі часових різниць та інші [1]. У даній роботі автори пропонують метод покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Метод базується на перериванні малоперспективних обчислень згідно встановленим емпірічним правилам. Така стратегія дозволяє ефективно керувати розподілом обчислювальних ресурсів, покращити результати і зменшити час роботи алгоритмів, не змінюючи їх[2]. Евристика застосовується як додаткова логіка в обгортці середовища (gym.Wrapper), що робить її сумісною з будь-яким RL-алгоритмом, який використовує стандартний API середовища[3]. |
| URI (Уніфікований ідентифікатор ресурсу): | http://dspace.pdpu.edu.ua/handle/123456789/25363 |
| Розташовується у зібраннях: | Інформатика, інформаційні системи та технології (2026) |
Файли цього матеріалу:
| Файл | Опис | Розмір | Формат | |
|---|---|---|---|---|
| RIABOV.pdf | 554.6 kB | Adobe PDF | Переглянути/Відкрити |
Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.