Please use this identifier to cite or link to this item:
http://dspace.pdpu.edu.ua/handle/123456789/25290| Title: | Гібридний метод семантичної фільтрації неінформативних записів у системних логах |
| Authors: | Суходольський, Р. |
| Keywords: | системні логи фільтрація BERT Drain кластеризація наївний баєсівський класифікатор нерозмічені дані |
| Issue Date: | 2026 |
| Publisher: | Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського» |
| Citation: | Суходольський Р. Гібридний метод семантичної фільтрації неінформативних записів у системних логах. Інформатика, інформаційні системи та технології: тези доповідей двадцять третьої всеукраїнської конференції студентів і молодих науковців (Одеса, 24 квітня 2026 р.) / Державний заклад «Південноукраїнський національний педагогічний університет імені К. Д. Ушинського", ОНУ ім. І. І. Мечнікова. Одеса, 2026. С. 59-61. |
| Abstract: | Запропоновано гібридний метод фільтрації неінформативних записів у нерозмічених системних логах, що поєднує шаблонізацію Drain, BERT-векторизацію, кластеризацію K-Means та класифікатор GaussianNB. Оскільки набір даних ZooKeeper (LogHub) не містить ground truth міток, оцінювання виконано як вимірювання здатності класифікатора відтворювати кластерну структуру (proxy-метрика): macro F1 = 0,73–0,81, weighted F1 = 0,96–0,976. Сучасні розподілені системи генерують мільйони лог-записів на добу [1]. Аномальні записи становлять 2–10% обсягу [4], решта – штатні повторювані події. Регулярні вирази не масштабуються при зміні формату логів [3]. Глибокі моделі (DeepLog [7], LogBERT [8]) досягають F1 0,78–0,91 на розмічених датасетах (HDFS, BGL), проте потребують анотованих даних, які рідко доступні [2]. Це мотивує методи для нерозмічених логів. |
| URI: | http://dspace.pdpu.edu.ua/handle/123456789/25290 |
| Appears in Collections: | Інформатика, інформаційні системи та технології (2026) |
Files in This Item:
| File | Description | Size | Format | |
|---|---|---|---|---|
| SUKHODOLSKYI.pdf | 555.49 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.