Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://dspace.opu.ua/jspui/handle/123456789/14511
Название: | Information system for analyzing public sentiment in web platforms based on machine learning |
Другие названия: | Інформаційна система аналізу громадського настрою у веб-платформах на основі машинного навчання |
Авторы: | Uhryn, Dmytro I. Угрин, Дмитро Ілліч Karachevtsev, Artem O. Карачевцев, Артем Олегович Tomka, Yurii Ya. Томка, Юрій Ярославович Zakharov, Mykyta M. Захаров, Микита Миколайович Troianovska, Yuliia L. Трояновська, Юлія Людвигівна |
Ключевые слова: | Web platform information system public mood propaganda disinformation fake message text data mining artificial intelligence machine learning веб-платформа інформаційна система громадський настрій пропаганда дезінформація фейк повідомлення текст інтелектуальний аналіз даних штучний інтелект машинне навчання |
Дата публикации: | 24-Май-2024 |
Издательство: | Odessа Polytechnic National University |
Краткий осмотр (реферат): | The systems for studying public sentiment in web platforms are analyzed. Various tools and methods for effectively
determining the mood in textual data from web platforms are described, including the formalization of the social graph and the
content graph. The process of classifying comments, which includes the systematization and categorization of statements, is
investigated. Based on the studied dataset, information on customer reviews and hotel ratings in Europe from the booking.com web
platform is selected. Taking into account the requirements of the information system and the results of the analysis, it is determined
that in order to obtain better results in determining the emotional connotation of the texts of reviews and messages from users, the
most appropriate is the use of machine learning methods, taking into account natural language methods for processing text data.
When choosing a text vectorization method for machine learning, the Term Frequency Inverse Document Frequency Vectorizer was
chosen as the most effective among the studied methods. The architectural structure of the studied system is proposed, which is
aimed at effective interaction between components and modules. The LogisticRegression model is chosen to determine the public
mood. An information system has been developed that analyzes public sentiment about objects, uses advanced machine learning
technologies to assess the emotional connotation of text comments, and provides users with insights and analysis of the results. Проведено аналіз систем для вивчення громадського настрою у веб-платформах. Описано різні засоби та методи для ефективного визначення настрою у текстових даних з веб-платформ, включаючи формалізацію соціального графу та графу контенту. Досліджено процес класифікації коментарів, що включає систематизацію та розподіл висловлювань на категорії. На основі дослідженого набору даних відібрана інформація про відгуки від клієнтів та оцінки готелів у Європі з вебплатформи booking.com. З урахуванням вимог інформаційної системи та результатів аналізу визначено, що для отримання кращих результатів у визначенні емоційного відтінку текстів відгуків та повідомлень від користувачів найбільш відповідним є застосування методів машинного навчання, враховуючи методи природної мови для обробки текстових даних. У виборі методу векторизації тексту для машинного навчання обрано Term Frequency Inverse Document Frequency Vectorizer як більш ефективного серед досліджених методів. Запропонована архітектурна структура досліджуваної системи, що спрямована на ефективну взаємодію між компонентами та модулями. Обрано модель LogisticRegression для визначення громадського настрою. Розроблена інформаційна система, що аналізує громадський настрій щодо об'єктів, використовує передові технології машинного навчання для оцінки емоційного відтінку текстових коментарів і забезпечує користувачам інсайти та аналіз результатів. |
URI (Унифицированный идентификатор ресурса): | http://dspace.opu.ua/jspui/handle/123456789/14511 |
ISSN: | 2663-0176 2663-7731 |
Располагается в коллекциях: | 2024, Vol. 7, № 2 |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
7_Uhryn.pdf | 1.23 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.