Інформаційна технологія виділення та класифікації онейрологічних образів в природньомовному тексті

Вантажиться...
Ескіз
Дата
2024
Науковий керівник
Укладач
Редактор
Назва журналу
ISSN
E-ISSN
Назва тому
Видавець
Одеський національний університет імені І. І. Мечникова
Анотація
В роботі досліджено методи та технології для виявлення та класифікації онейрологічних образів у текстах українською мовою. Основною метою було зменшення кількості помилок другого роду під час обробки текстів снів шляхом налаштування моделей машинного навчання. Розроблено методологію обробки україномовних текстів снів, яка може бути застосована для створення систем автоматичного ведення щоденників сновидінь та адаптована для інших завдань обробки природньомовних текстів. Розглянуто два основні підходи: розділений, що базується на моделях сімейства BERT, та уніфікований з використанням великих мовних моделей (LLM). Для розділеного підходу оцінено різні комбінації моделей сімейства BERT. Для уніфікованого – сучасні великі мовні моделі: GPT-4o та Claude 3.5 Sonnet. Проведено порівняльний аналіз між найкращими комбінаціями моделей сімества BERT та великими мовними моделями.
The paper investigates methods and technologies for detecting and classifying oneirological images in Ukrainian-language texts. The main goal was to reduce type II errors during dream text processing by fine-tuning machine learning models. A methodology for processing Ukrainian dream texts has been developed, which can be applied to create automatic dream diary systems and adapted for other natural language processing tasks. Two main approaches were considered: a separated approach based on BERT family models, and a unified approach using Large Language Models (LLM). For the separated approach, different combinations of BERT family models were evaluated. For the unified approach, modern large language models were tested: GPT-4o and Claude 3.5 Sonnet. A comparative analysis was conducted between the best combinations of BERT family models and large language models.
Опис
Ключові слова
126 інформаційні системи та технології, магістр, онейрологічні образи, природньомовний текст, моделі сімейства BERT
Бібліографічний опис
Жар, М. Ю. Інформаційна технологія виділення та класифікації онейрологічних образів в природньомовному тексті = Information technology for extraction and classification of oneirological images in natural text : кваліфікаційна робота магістра / М. Ю. Жар. – Одеса, 2024. – 139 с.
DOI
ORCID:
УДК