Розпізнавання музичних інтервалів в аналоговому звуковому сигналі за допомогою нейронних мереж

dc.contributor.authorГвоздєв, Валерій Дмитрович
dc.date.accessioned2019-12-12T22:33:07Z
dc.date.available2019-12-12T22:33:07Z
dc.date.issued2019
dc.description.abstractНині комп’ютер є основним засобом зберігання та обробки інформації про музику. Це можуть бути ноти, композиції цілком, метадані про звук. Як наслідок необхідності отриманні інформації про цифровий або аналоговий звук, з’являється велика кількість задач, що пов’язані з обробкою звуку – ідентифікація композиції, пошук схожих композицій та інші. Метою роботи є розробка методу розпізнавання послідовності акордів в звуковому сигналі, над яким зроблено аналогово-цифрову трансформацію. Цей метод дозволить з високою точністю вказати акорд, що звучить в певний момент часу цього звукового сигналу. В результаті аналізу та порівняння існуючих методів вирішення задачі, запропонований та обґрунтований метод розпізнавання на основі згортальної нейронної мережі. Реалізована система, що складається з модулів генерації та розмітки даних, навчання нейронної мережі, розмітки WAV-файлів. Розпізнаючий компонент системи – згортальна нейронна мережа. WAV-файли трансформуються в вектори за допомогою віконного семплювання. З семплів та файла розмітки формується набір даних для навчання нейронної мережі. За допомогою цих даних навчається нейронна мережа. На базі рішення нейронної мережі про те, який акорд звучить в даному семплі та алгоритмі згладжування результату розмічаються WAV файли, що відповідають умовам задачі. Якість результату визначається метрикою accuracy нейронної мережі та фактичною точністю розпізнавання послідовності акордів у WAV-файлі. До системи можна додати більше акордів та відрегулювати параметри векторизації WAV-файла з метою подальшої розробки та покращення результату.uk_UA
dc.description.abstractВ настоящее время компьютер является основным средством хранения и обработки информации о музыке. Это могут быть ноты, композиции целиком, метаданные о звуке. Как следствие необходимости получения информации о цифровом или аналоговом звуке появляется значительное количество задач, которые связаны с обработкой звука – идентификация композиции, поиск похожих композиций и другие. Целью работы является разработка метода распознавания последовательности аккордов в звуковом сигнале, над которым сделано аналогово-цифровую трансформацию. Данный метод позволит с высокой вероятностью указать аккорд, звучащий в определенный момент времени этого звукового сигнала. В результате исследования и сравнения существующих методов решения задачи, предложен и обоснован метод распознавания на основе сверточной нейронной сети. Реализована система, состоящая из модулей генерирования и разметки данных, обучения нейронной сети, разметки WAV файлов. Распознающий компонент системы – сверточная нейронная сеть. WAV-файлы трансформируются в векторы с помощью оконного семплирования. Затем, из семплов и файла разметки формируется набор данных для обучения нейронной сети. С помощью набора данных тренируется нейронная сеть. На основании решения нейронной сети о том, какой аккорд звучит в этом семпле и алгоритме сглаживания результата размечаются WAV файлы, соответствующие ограничениям задачи. Оценка качества результата определяется метрикой accuracy нейронной сети и фактической точностью распознавания последовательности аккордов в WAV файле. В систему можно добавить больше аккордов, отрегулировать параметры векторизации WAV файла с целью дальнейшего исследования и улучшения результата.
dc.description.abstractNowadays, computer is a main instrument to store and process sound information. It includes notes, songs, sound metadata. As a consequence of necessity to get information of digital or analog sound, lots of sound-processing tasks appeared: identification, search of similar compositions, etc. The aim of this thesis is development of the algorithm, which is capable of chord sequence recognition from the sound signal, over which digital-analog transformation has been made. This approach should determine the chord which sounds at certain time of musical composition. As the result of research and analysis of existing approaches to this task, convolutional neural network-based method is proposed. Implemented system consists of data generation and markup module, neural net training module, WAV files markup module. Solving component of system is convolutional neural network. WAV files are transformed to input vectors with sliding window sampling. Test and train data are created based on samples and markup file. Neural net is trained with that dataset. WAV files that confirm to task restrictions are translated into chords basing on neural net chord recognition and chord wiping algorithm. Result quality evaluation is defined by accuracy metrics of neural network and actual chord recognition precision in WAV file. System is capable of known chord list expansion, WAV vectorization parameters change to continue research and improve existing result.
dc.identifier.citationГвоздєв, В. Д. Розпізнавання музичних інтервалів в аналоговому звуковому сигналі за допомогою нейронних мереж : дипломна робота бакалавра / В. Д. Гвоздєв. – Одеса, 2019. – 46 с.uk_UA
dc.identifier.urihttps://dspace.onu.edu.ua/handle/123456789/26616
dc.language.isoukuk_UA
dc.publisherОдеський національний університет імені І. І. Мечниковаuk_UA
dc.subject6.050102 комп’ютерна інженеріяuk_UA
dc.subjectмузичний інтервалuk_UA
dc.subjectаналоговий звуковий сигналuk_UA
dc.subjectнейронні мережиuk_UA
dc.titleРозпізнавання музичних інтервалів в аналоговому звуковому сигналі за допомогою нейронних мережuk_UA
dc.title.alternativeMusical intervals recognition in the analog sound signal based on the neural networksuk_UA
dc.typeDiplomasuk_UA
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
6.050102_Hvozdiev Valerii Dmytrovych_1.pdf
Size:
217.66 KB
Format:
Adobe Portable Document Format
Description:
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: