Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://dspace.opu.ua/jspui/handle/123456789/14511
Название: Information system for analyzing public sentiment in web platforms based on machine learning
Другие названия: Інформаційна система аналізу громадського настрою у веб-платформах на основі машинного навчання
Авторы: Uhryn, Dmytro I.
Угрин, Дмитро Ілліч
Karachevtsev, Artem O.
Карачевцев, Артем Олегович
Tomka, Yurii Ya.
Томка, Юрій Ярославович
Zakharov, Mykyta M.
Захаров, Микита Миколайович
Troianovska, Yuliia L.
Трояновська, Юлія Людвигівна
Ключевые слова: Web platform
information system
public mood
propaganda
disinformation
fake
message
text
data mining
artificial intelligence
machine learning
веб-платформа
інформаційна система
громадський настрій
пропаганда
дезінформація
фейк
повідомлення
текст
інтелектуальний аналіз даних
штучний інтелект
машинне навчання
Дата публикации: 24-Май-2024
Издательство: Odessа Polytechnic National University
Краткий осмотр (реферат): The systems for studying public sentiment in web platforms are analyzed. Various tools and methods for effectively determining the mood in textual data from web platforms are described, including the formalization of the social graph and the content graph. The process of classifying comments, which includes the systematization and categorization of statements, is investigated. Based on the studied dataset, information on customer reviews and hotel ratings in Europe from the booking.com web platform is selected. Taking into account the requirements of the information system and the results of the analysis, it is determined that in order to obtain better results in determining the emotional connotation of the texts of reviews and messages from users, the most appropriate is the use of machine learning methods, taking into account natural language methods for processing text data. When choosing a text vectorization method for machine learning, the Term Frequency Inverse Document Frequency Vectorizer was chosen as the most effective among the studied methods. The architectural structure of the studied system is proposed, which is aimed at effective interaction between components and modules. The LogisticRegression model is chosen to determine the public mood. An information system has been developed that analyzes public sentiment about objects, uses advanced machine learning technologies to assess the emotional connotation of text comments, and provides users with insights and analysis of the results.
Проведено аналіз систем для вивчення громадського настрою у веб-платформах. Описано різні засоби та методи для ефективного визначення настрою у текстових даних з веб-платформ, включаючи формалізацію соціального графу та графу контенту. Досліджено процес класифікації коментарів, що включає систематизацію та розподіл висловлювань на категорії. На основі дослідженого набору даних відібрана інформація про відгуки від клієнтів та оцінки готелів у Європі з вебплатформи booking.com. З урахуванням вимог інформаційної системи та результатів аналізу визначено, що для отримання кращих результатів у визначенні емоційного відтінку текстів відгуків та повідомлень від користувачів найбільш відповідним є застосування методів машинного навчання, враховуючи методи природної мови для обробки текстових даних. У виборі методу векторизації тексту для машинного навчання обрано Term Frequency Inverse Document Frequency Vectorizer як більш ефективного серед досліджених методів. Запропонована архітектурна структура досліджуваної системи, що спрямована на ефективну взаємодію між компонентами та модулями. Обрано модель LogisticRegression для визначення громадського настрою. Розроблена інформаційна система, що аналізує громадський настрій щодо об'єктів, використовує передові технології машинного навчання для оцінки емоційного відтінку текстових коментарів і забезпечує користувачам інсайти та аналіз результатів.
URI (Унифицированный идентификатор ресурса): http://dspace.opu.ua/jspui/handle/123456789/14511
ISSN: 2663-0176
2663-7731
Располагается в коллекциях:2024, Vol. 7, № 2

Файлы этого ресурса:
Файл Описание РазмерФормат 
7_Uhryn.pdf1.23 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.