Розвиток інформаційних технологій, зокрема штучного інтелекту, призводить до широкого їх застосування у багатьох сферах нашого життя. Із стрімким розвитком штучного інтелекту зростає кількість випадків його застосування для генерації цифрових зображень, аудіо, відео тощо. Підробка цифрових аудіофайлів є небезпечною з точки зору використання зловмисниками для чинення інформаційно-психологічного впливу та маніпуляцій суспільством та окремими індивідами. Існують сучасні методи виявлення аудіо-підробок, виконаними засобами штучного інтелекту. Вони мають високу точність, при цьому не позбавлені недоліків. Основним недоліком є складна архітектура та висока ресурсоємність. Метою даної роботи є розробка нейронної мережі, яка дозволила б з задовільною точністю виявляти аудіо-підробку, та навчання якої не вимагало б значних обчислювальних ресурсів. Було обрано метод для модифікації, а саме метод виявлення аудіо підробок з використанням згорткової нейронної мережі. Було модифіковано метод виявлення аудіо підробок шляхом побудови моделі з новою архітектурою з меншою кількістю шарів, що дозволило значно скоротити часові витрати та потреби в значних обчислювальних ресурсах в порівнянні з аналогами. Отримані результати експериментів із застосуванням модифікованого методу показують задовільну ефективність і точність системи. Помилки 1 роду склали 24%, помилки другого роду - 9%. Розроблену модифікацію реалізовано в програмному додатку із зручним і простим інтерфейсом.
The development of information technologies, including artificial intelligence, is leading to their widespread use
in many areas of our lives. With the rapid development of artificial intelligence, the number of cases of its
application to generate digital images, audio, video, etc. is growing. Counterfeiting digital audio files is dangerous
from the point of view of being used by criminals to exert information and psychological influence and manipulate
society and individuals. There are modern methods for detecting audio fakes made by artificial intelligence. They
are highly accurate, but not without drawbacks. The main drawback is the complex architecture and high resource
intensity. The aim of this paper is to develop a neural network that would allow detecting audio fakes with
satisfactory accuracy and whose training would not require significant computing resources. A method was chosen
for modification, namely, the method of detecting audio fakes using a convolutional neural network. The method
for detecting audio fakes was modified by building a model with a new architecture with fewer layers, which
significantly reduced the time and computational resources required compared to analogues. The experimental
results obtained using the modified method show satisfactory efficiency and accuracy of the system. Errors of the
first kind amounted to 24%, errors of the second kind - 9%. The developed modification is implemented in a
software application with a convenient and simple interface.