Please use this identifier to cite or link to this item:
http://dspace.pdpu.edu.ua/handle/123456789/25363Full metadata record
| DC Field | Value | Language |
|---|---|---|
| dc.contributor.author | Рябов, Д. М. | - |
| dc.contributor.author | Пенко, В. Г. | - |
| dc.date.accessioned | 2026-05-11T12:52:26Z | - |
| dc.date.available | 2026-05-11T12:52:26Z | - |
| dc.date.issued | 2026 | - |
| dc.identifier.citation | Рябов Д. М., Пенко В. Г. Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 201-203. | uk |
| dc.identifier.uri | http://dspace.pdpu.edu.ua/handle/123456789/25363 | - |
| dc.description.abstract | Навчання з підкріпленням є одним із підходів машинного навчання, у межах якого агент набуває досвіду шляхом взаємодії з певним середовищем. У цій парадигмі існує низка методів розв’язання задач навчання, зокрема динамічне програмування, що базується на рівнянні Беллмана, методи Монте-Карло, підходи на основі часових різниць та інші [1]. У даній роботі автори пропонують метод покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Метод базується на перериванні малоперспективних обчислень згідно встановленим емпірічним правилам. Така стратегія дозволяє ефективно керувати розподілом обчислювальних ресурсів, покращити результати і зменшити час роботи алгоритмів, не змінюючи їх[2]. Евристика застосовується як додаткова логіка в обгортці середовища (gym.Wrapper), що робить її сумісною з будь-яким RL-алгоритмом, який використовує стандартний API середовища[3]. | uk |
| dc.language.iso | other | uk |
| dc.publisher | Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського» | uk |
| dc.subject | машинне навчання | uk |
| dc.subject | рівняння Беллмана | uk |
| dc.subject | динамічне програмування | uk |
| dc.subject | методи Монте-Карло | uk |
| dc.subject | переривання малоперспективних обчислень | uk |
| dc.title | Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил | uk |
| dc.type | Article | uk |
| Appears in Collections: | Інформатика, інформаційні системи та технології (2026) | |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| RIABOV.pdf | 554.6 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.