Метод побудови ансамблевих класифікаторів для розпізнавання аудіо-даних різної природи

Андронаті, Олександр Кирилович; Andronati, Oleksandr K.; Арсірій, Олена Олександрівна; Arsirii, Olena O.; Ніколенко, Анатолій Олександрович; Nikolenko, Anatoly O.; Кундієв, Олег Ігорович; Kunditv, Oleg  I.

eONPUIR
→
2. Матеріали конференцій
→
2024
→
«Informatics. Culture. Technology» = «Інформатика. Культура. Техніка»
→
Посмотреть элемент

dc.contributor.author	Андронаті, Олександр Кирилович
dc.contributor.author	Andronati, Oleksandr K.
dc.contributor.author	Арсірій, Олена Олександрівна
dc.contributor.author	Arsirii, Olena O.
dc.contributor.author	Ніколенко, Анатолій Олександрович
dc.contributor.author	Nikolenko, Anatoly O.
dc.contributor.author	Кундієв, Олег Ігорович
dc.contributor.author	Kunditv, Oleg I.
dc.date.accessioned	2024-10-09T12:27:40Z
dc.date.available	2024-10-09T12:27:40Z
dc.date.issued	2024-09-26
dc.identifier.issn	2522-1523
dc.identifier.uri	http://dspace.opu.ua/jspui/handle/123456789/14650
dc.description.abstract	У роботі розроблено метод побудови ансамблевих класифікаторів для розпізнавання аудіо-даних різної природи. Метод є дата орієнтовним та потребує виконання наступних кроків. На першому кроці обираються вхідні датасети, які трансформуються та розподіляються на навчальні та тестові вибірки відповідно. Для задачі розпізнавання аудіо-емоцій обрано набори даних RAVDESS, розпізнавання жанру музики виконується на датасеті GTZAN. На другому кроці як елементи ансамблевих класифікаторів створено та досліджено сім наступних класифікаторів: K Nearest Neighbors, Support Vector Machine, Random Forest, XGBoost, Multilayer Perceptron, Convolutional Neural Network і Long Short-term Memory. В процесі навчання елементарних класифікаторів налаштування відпопідних гіперпараметрів виконувалось за допомогою підходу Grid Search. На третьому кроці елементарні класифікатори об’єднувались з використанням методу ансамблювання stacking з такими видами агрегування, як soft voting, hard voting, soft voting з використанням функції GOMPERTZ. Було перевірено всі можливі ансамблеві комбінації починаючі із трьох елементарних класифікаторів для розпізнавання аудіоемоцій та музичних жанрів. Тому загальна кількість ансамблів, які досліджувались в роботі становила 297. Результати дослідження для проблеми класифікації аудіо-емоцій показали, що точність розпізнавання за метрикою Accuracy кращого ансамблевого класифікатора на 8.1% вища, ніж у кращого із елементарних класифікаторів у його складі, якій базується на MLP, а за метрикою F1 цей показник є вищим на 8 %. Для задачі розпізнавання музичних жанрів відповідні показники вище на 5.6 % та на 5.2 % відповідно.	en
dc.description.abstract	The work developed a method of building ensemble classifiers for recognizing audio data of various nature. The method is a tentative date and requires the following steps. In the first step, the input datasets are selected, which are transformed and divided into training and test samples, respectively. RAVDESS datasets are chosen for the task of audio emotion recognition, music genre recognition is performed on the GTZAN dataset. In the second step, the following seven classifiers were created and investigated as elements of ensemble classifiers: K Nearest Neighbors, Support Vector Machine, Random Forest, XGBoost, Multilayer Perceptron, Convolutional Neural Network and Long Short-term Memory. In the process of training elementary classifiers, the corresponding hyperparameters were adjusted using the Grid Search approach. In the third step, elementary classifiers were combined using the stacking ensemble method with such types of aggregation as soft voting, hard voting, soft voting using the GOMPERTZ function. All possible ensemble combinations starting with three elementary classifiers for recognizing audio emotions and music genres were tested. Therefore, the total number of ensembles studied in the work was 297. The research results for the problem of audio emotion classification showed that the accuracy of recognition according to the Accuracy metric of the best ensemble classifier is 8.1% higher than that of the best elementary classifier in its composition, which is based on on MLP, and according to the F1 metric, this indicator is 8% higher. For the task of recognizing music genres, the corresponding indicators are higher by 5.6 % and 5.2 %, respectively.	en
dc.language.iso	uk	en
dc.publisher	Odessа Polytechnic National University	en
dc.subject	ансамблеві класифікатори	en
dc.subject	налаштування гіперпараметрів машинне навчання	en
dc.subject	глибоке навчання	en
dc.subject	аудіо-дані	en
dc.subject	Ensemble classifiers	en
dc.subject	hyperparameter tuning	en
dc.subject	machine learning	en
dc.subject	deep learning	en
dc.subject	audio data	en
dc.title	Метод побудови ансамблевих класифікаторів для розпізнавання аудіо-даних різної природи	en
dc.title.alternative	A method of developing ensemble classifiers for recognizing audio data of various nature	en
dc.type	Article	en
opu.citation.journal	Інформатика. Культура. Техніка = Informatics. Culture. Technology	en
opu.citation.volume	1	en
opu.citation.firstpage	160	en
opu.citation.lastpage	166	en
opu.citation.conference	Х МІЖНАРОДНА НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЯ «Інформатика. Культура. Техніка» = X International conference "INFORMATICS. CULTURE. TECHNIQUE"	en
opu.citation.issue	1	en

Файлы, содержащиеся в элементе

Имя: 23__1-3_Андронати ...

Размер: 1.080Мб

Формат: PDF

Посмотреть/Открыть

Этот элемент содержится в следующих коллекциях

«Informatics. Culture. Technology» = «Інформатика. Культура. Техніка»
PROCEEDINGS OF THE Х INTERNATIONAL SCIENTIFIC CONFERENCE SEPTEMBER 26-27, 2024 = МАТЕРІАЛИ Х МІЖНАРОДНОЇ НАУКОВО-ПРАКТИЧНА КОНФЕРЕНЦІЇ 26-27 ВЕРЕСНЯ 2024 РОКУ

Показать сокращенную информацию

Поиск в DSpace

Продвинутый поиск

Просмотр

Весь DSpace
Эта коллекция

Мой профиль

Статистика

View Usage Statistics

Метод побудови ансамблевих класифікаторів для розпізнавання аудіо-даних різної природи

Файлы, содержащиеся в элементе

Этот элемент содержится в следующих коллекциях

Поиск в DSpace

Просмотр

Весь DSpace

Эта коллекция

Мой профиль

Статистика