Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://dspace.pdpu.edu.ua/handle/123456789/25363
Повний запис метаданих
Поле DCЗначенняМова
dc.contributor.authorРябов, Д. М.-
dc.contributor.authorПенко, В. Г.-
dc.date.accessioned2026-05-11T12:52:26Z-
dc.date.available2026-05-11T12:52:26Z-
dc.date.issued2026-
dc.identifier.citationРябов Д. М., Пенко В. Г. Покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 201-203.uk
dc.identifier.urihttp://dspace.pdpu.edu.ua/handle/123456789/25363-
dc.description.abstractНавчання з підкріпленням є одним із підходів машинного навчання, у межах якого агент набуває досвіду шляхом взаємодії з певним середовищем. У цій парадигмі існує низка методів розв’язання задач навчання, зокрема динамічне програмування, що базується на рівнянні Беллмана, методи Монте-Карло, підходи на основі часових різниць та інші [1]. У даній роботі автори пропонують метод покращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правил. Метод базується на перериванні малоперспективних обчислень згідно встановленим емпірічним правилам. Така стратегія дозволяє ефективно керувати розподілом обчислювальних ресурсів, покращити результати і зменшити час роботи алгоритмів, не змінюючи їх[2]. Евристика застосовується як додаткова логіка в обгортці середовища (gym.Wrapper), що робить її сумісною з будь-яким RL-алгоритмом, який використовує стандартний API середовища[3].uk
dc.language.isootheruk
dc.publisherДержавний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського»uk
dc.subjectмашинне навчанняuk
dc.subjectрівняння Беллманаuk
dc.subjectдинамічне програмуванняuk
dc.subjectметоди Монте-Карлоuk
dc.subjectпереривання малоперспективних обчисленьuk
dc.titleПокращення ефективності алгоритмів навчання з підкріпленням шляхом впровадження емпіричних правилuk
dc.typeArticleuk
Розташовується у зібраннях:Інформатика, інформаційні системи та технології (2026)

Файли цього матеріалу:
Файл Опис РозмірФормат 
RIABOV.pdf554.6 kBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.