Будь ласка, використовуйте цей ідентифікатор, щоб цитувати або посилатися на цей матеріал: http://dspace.pdpu.edu.ua/handle/123456789/25290
Назва: Гібридний метод семантичної фільтрації неінформативних записів у системних логах
Автори: Суходольський, Р.
Ключові слова: системні логи
фільтрація
BERT
Drain
кластеризація
наївний баєсівський класифікатор
нерозмічені дані
Дата публікації: 2026
Видавництво: Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського»
Бібліографічний опис: Суходольський Р. Гібридний метод семантичної фільтрації неінформативних записів у системних логах. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 59-61.
Короткий огляд (реферат): Запропоновано гібридний метод фільтрації неінформативних записів у нерозмічених системних логах, що поєднує шаблонізацію Drain, BERT-векторизацію, кластеризацію K-Means та класифікатор GaussianNB. Оскільки набір даних ZooKeeper (LogHub) не містить ground truth міток, оцінювання виконано як вимірювання здатності класифікатора відтворювати кластерну структуру (proxy-метрика): macro F1 = 0,73–0,81, weighted F1 = 0,96–0,976. Сучасні розподілені системи генерують мільйони лог-записів на добу [1]. Аномальні записи становлять 2–10% обсягу [4], решта – штатні повторювані події. Регулярні вирази не масштабуються при зміні формату логів [3]. Глибокі моделі (DeepLog [7], LogBERT [8]) досягають F1 0,78–0,91 на розмічених датасетах (HDFS, BGL), проте потребують анотованих даних, які рідко доступні [2]. Це мотивує методи для нерозмічених логів.
URI (Уніфікований ідентифікатор ресурсу): http://dspace.pdpu.edu.ua/handle/123456789/25290
Розташовується у зібраннях:Інформатика, інформаційні системи та технології (2026)

Файли цього матеріалу:
Файл Опис РозмірФормат 
SUKHODOLSKYI.pdf555.49 kBAdobe PDFПереглянути/Відкрити


Усі матеріали в архіві електронних ресурсів захищені авторським правом, всі права збережені.