Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил

Рябов, Д. М.; Пенко, В. Г.

Please use this identifier to cite or link to this item: http://dspace.pdpu.edu.ua/handle/123456789/25363

Full metadata record

DC Field	Value	Language
dc.contributor.author	Рябов, Д. М.	-
dc.contributor.author	Пенко, В. Г.	-
dc.date.accessioned	2026-05-11T12:52:26Z	-
dc.date.available	2026-05-11T12:52:26Z	-
dc.date.issued	2026	-
dc.identifier.citation	Рябов Д. М., Пенко В. Г. Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 201-203.	uk
dc.identifier.uri	http://dspace.pdpu.edu.ua/handle/123456789/25363	-
dc.description.abstract	Навчання з підкріпленням є одним із підходів машинного навчання, у межах якого агент набуває досвіду шляхом взаємодії з певним середовищем. У цій парадигмі існує низка методів розв’язання задач навчання, зокрема динамічне програмування, що базується на рівнянні Беллмана, методи Монте-Карло, підходи на основі часових різниць та інші [1]. У даній роботі автори пропонують метод покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Метод базується на перериванні малоперспективних обчислень згідно встановленим емпірічним правилам. Така стратегія дозволяє ефективно керувати розподілом обчислювальних ресурсів, покращити результати і зменшити час роботи алгоритмів, не змінюючи їх[2]. Евристика застосовується як додаткова логіка в обгортці середовища (gym.Wrapper), що робить її сумісною з будь-яким RL-алгоритмом, який використовує стандартний API середовища[3].	uk
dc.language.iso	other	uk
dc.publisher	Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського»	uk
dc.subject	машинне навчання	uk
dc.subject	рівняння Беллмана	uk
dc.subject	динамічне програмування	uk
dc.subject	методи Монте-Карло	uk
dc.subject	переривання малоперспективних обчислень	uk
dc.title	Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил	uk
dc.type	Article	uk
Appears in Collections:	Інформатика, інформаційні системи та технології (2026)

Files in This Item:

File	Description	Size	Format
RIABOV.pdf		554.6 kB	Adobe PDF	View/Open

Show simple item record