Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів
| dc.contributor.author | Толмачевський, Олександр Олександрович | |
| dc.date.accessioned | 2025-10-22T11:52:26Z | |
| dc.date.available | 2025-10-22T11:52:26Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Мета роботи полягає у розробці системи автоматичного розпізнавання мовлення з використанням сучасних методів машинного навчання. Для створення моделі застосовано фреймворк PyTorch, бібліотеку NeMo для роботи з акустичними моделями, а також Python як основну мову програмування. Для демонстрації роботи моделі було розроблено веб-сервіс за допомогою Flask для бекенду та React для фронтенду. Додатково використано мовну модель, побудовану з використанням KenLM для покращення якості розпізнавання. У результаті виконання роботи створено ефективну систему, яка може бути використана для автоматичної транскрипції аудіо, створення голосових помічників та інших додатків. Рішення відзначається високою гнучкістю та потенціалом для подальшого розвитку на основі сучасніших архітектур. | |
| dc.description.abstract | The aim of this work is to develop a speech recognition system using modern machine learning methods. The model was created using the PyTorch framework, the NeMo library for working with acoustic models, and Python as the main programming language. A web service was developed to demonstrate the model’s capabilities, using Flask for the backend and React for the frontend. Additionally, a language model built with KenLM was implemented to improve recognition quality. As a result of this work, an efficient system was created that can be used for automatic audio transcription, development of voice assistants, and other applications. The solution is characterized by high flexibility and potential for further development based on more modern architectures. | |
| dc.identifier.citation | Толмачевський, О. О. Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів = Development of an intelligent service for generating annotations for audio files : кваліфікаційна робота бакалавра / О. О. Толмачевський. – Одеса, 2025. – 46 с. | |
| dc.identifier.uri | https://dspace.onu.edu.ua/handle/123456789/42843 | |
| dc.language.iso | uk | |
| dc.publisher | Одеський національний університет імені І. І. Мечникова | |
| dc.subject | 122 комп’ютерні науки | |
| dc.subject | бакалавр | |
| dc.subject | розпізнавання мовлення | |
| dc.subject | PyTorch | |
| dc.subject | NeMo | |
| dc.subject | Flask | |
| dc.subject | React | |
| dc.subject | KenLM | |
| dc.subject | автоматична транскрипція | |
| dc.subject | speech recognition | |
| dc.subject | automatic transcription | |
| dc.title | Розробка інтелектуального сервісу для генерації анотацій до аудіофайлів | |
| dc.title.alternative | Development of an intelligent service for generating annotations for audio files | |
| dc.type | Diplomas |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- 122_Толмачевський.pdf
- Розмір:
- 2.63 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: