Please use this identifier to cite or link to this item: http://dspace.pdpu.edu.ua/handle/123456789/25290
Title: Гібридний метод семантичної фільтрації неінформативних записів у системних логах
Authors: Суходольський, Р.
Keywords: системні логи
фільтрація
BERT
Drain
кластеризація
наївний баєсівський класифікатор
нерозмічені дані
Issue Date: 2026
Publisher: Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського»
Citation: Суходольський Р. Гібридний метод семантичної фільтрації неінформативних записів у системних логах. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 59-61.
Abstract: Запропоновано гібридний метод фільтрації неінформативних записів у нерозмічених системних логах, що поєднує шаблонізацію Drain, BERT-векторизацію, кластеризацію K-Means та класифікатор GaussianNB. Оскільки набір даних ZooKeeper (LogHub) не містить ground truth міток, оцінювання виконано як вимірювання здатності класифікатора відтворювати кластерну структуру (proxy-метрика): macro F1 = 0,73–0,81, weighted F1 = 0,96–0,976. Сучасні розподілені системи генерують мільйони лог-записів на добу [1]. Аномальні записи становлять 2–10% обсягу [4], решта – штатні повторювані події. Регулярні вирази не масштабуються при зміні формату логів [3]. Глибокі моделі (DeepLog [7], LogBERT [8]) досягають F1 0,78–0,91 на розмічених датасетах (HDFS, BGL), проте потребують анотованих даних, які рідко доступні [2]. Це мотивує методи для нерозмічених логів.
URI: http://dspace.pdpu.edu.ua/handle/123456789/25290
Appears in Collections:Інформатика, інформаційні системи та технології (2026)

Files in This Item:
File Description SizeFormat 
SUKHODOLSKYI.pdf555.49 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.