Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів

dc.contributor.authorТолмачевський, Олександр Олександрович
dc.date.accessioned2025-10-22T11:52:26Z
dc.date.available2025-10-22T11:52:26Z
dc.date.issued2025
dc.description.abstractМета роботи полягає у розробці системи автоматичного розпізнавання мовлення з використанням сучасних методів машинного навчання. Для створення моделі застосовано фреймворк PyTorch, бібліотеку NeMo для роботи з акустичними моделями, а також Python як основну мову програмування. Для демонстрації роботи моделі було розроблено веб-сервіс за допомогою Flask для бекенду та React для фронтенду. Додатково використано мовну модель, побудовану з використанням KenLM для покращення якості розпізнавання. У результаті виконання роботи створено ефективну систему, яка може бути використана для автоматичної транскрипції аудіо, створення голосових помічників та інших додатків. Рішення відзначається високою гнучкістю та потенціалом для подальшого розвитку на основі сучасніших архітектур.
dc.description.abstractThe aim of this work is to develop a speech recognition system using modern machine learning methods. The model was created using the PyTorch framework, the NeMo library for working with acoustic models, and Python as the main programming language. A web service was developed to demonstrate the model’s capabilities, using Flask for the backend and React for the frontend. Additionally, a language model built with KenLM was implemented to improve recognition quality. As a result of this work, an efficient system was created that can be used for automatic audio transcription, development of voice assistants, and other applications. The solution is characterized by high flexibility and potential for further development based on more modern architectures.
dc.identifier.citationТолмачевський, О. О. Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів = Development of an intelligent service for generating annotations for audio files : кваліфікаційна робота бакалавра / О. О. Толмачевський. – Одеса, 2025. – 46 с.
dc.identifier.urihttps://dspace.onu.edu.ua/handle/123456789/42843
dc.language.isouk
dc.publisherОдеський національний університет імені І. І. Мечникова
dc.subject122 комп’ютерні науки
dc.subjectбакалавр
dc.subjectрозпізнавання мовлення
dc.subjectPyTorch
dc.subjectNeMo
dc.subjectFlask
dc.subjectReact
dc.subjectKenLM
dc.subjectавтоматична транскрипція
dc.subjectspeech recognition
dc.subjectautomatic transcription
dc.titleРозробка інтелектуального сервісу для генерації анотацій до аудіофайлів
dc.title.alternativeDevelopment of an intelligent service for generating annotations for audio files
dc.typeDiplomas
Файли
Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
122_Толмачевський.pdf
Розмір:
2.63 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: