Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів

Толмачевський, Олександр Олександрович

Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів

dc.contributor.author	Толмачевський, Олександр Олександрович
dc.date.accessioned	2025-10-22T11:52:26Z
dc.date.available	2025-10-22T11:52:26Z
dc.date.issued	2025
dc.description.abstract	Мета роботи полягає у розробці системи автоматичного розпізнавання мовлення з використанням сучасних методів машинного навчання. Для створення моделі застосовано фреймворк PyTorch, бібліотеку NeMo для роботи з акустичними моделями, а також Python як основну мову програмування. Для демонстрації роботи моделі було розроблено веб-сервіс за допомогою Flask для бекенду та React для фронтенду. Додатково використано мовну модель, побудовану з використанням KenLM для покращення якості розпізнавання. У результаті виконання роботи створено ефективну систему, яка може бути використана для автоматичної транскрипції аудіо, створення голосових помічників та інших додатків. Рішення відзначається високою гнучкістю та потенціалом для подальшого розвитку на основі сучасніших архітектур.
dc.description.abstract	The aim of this work is to develop a speech recognition system using modern machine learning methods. The model was created using the PyTorch framework, the NeMo library for working with acoustic models, and Python as the main programming language. A web service was developed to demonstrate the model’s capabilities, using Flask for the backend and React for the frontend. Additionally, a language model built with KenLM was implemented to improve recognition quality. As a result of this work, an efficient system was created that can be used for automatic audio transcription, development of voice assistants, and other applications. The solution is characterized by high flexibility and potential for further development based on more modern architectures.
dc.identifier.citation	Толмачевський, О. О. Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів = Development of an intelligent service for generating annotations for audio files : кваліфікаційна робота бакалавра / О. О. Толмачевський. – Одеса, 2025. – 46 с.
dc.identifier.uri	https://dspace.onu.edu.ua/handle/123456789/42843
dc.language.iso	uk
dc.publisher	Одеський національний університет імені І. І. Мечникова
dc.subject	122 комп’ютерні науки
dc.subject	бакалавр
dc.subject	розпізнавання мовлення
dc.subject	PyTorch
dc.subject	NeMo
dc.subject	Flask
dc.subject	React
dc.subject	KenLM
dc.subject	автоматична транскрипція
dc.subject	speech recognition
dc.subject	automatic transcription
dc.title	Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів
dc.title.alternative	Development of an intelligent service for generating annotations for audio files
dc.type	Diplomas

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: 122_Толмачевський.pdf
Розмір:: 2.63 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 1.71 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаври МФІТ