Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://dspace.opu.ua/jspui/handle/123456789/15086
Название: | Machine learning models for predicting payment status on an online car rental platform |
Другие названия: | Моделі машинного навчання для прогнозування статусу платежів на онлайн-платформі оренди авто |
Авторы: | Arsirii, Olena O. Арсірій, Олена Олександрівна Krantovskyi, Illia O. Крантовський, Ілля Олександрович Rudenko, Olexandr V. Руденко, Олександр Володимирович Glava, Maria G. Глава, Марія Геннадіївна |
Ключевые слова: | Machine learning payment prediction naive bayes classifier logistic regression support vector machine ensemble models financial risk assessment Машинне навчання прогнозування платежів наївний байєсівський класифікатор логістична регресія метод опорних векторів ансамблеві моделі оцінка фінансових ризиків |
Дата публикации: | 4-Апр-2025 |
Издательство: | Odessа Polytechnic National University |
Краткий осмотр (реферат): | It has been demonstrated that the detailed data collected on online platforms are heterogeneous, semantically inconsistent, and weakly structured. Therefore, the use of machine learning for their aggregation, structuring, and analysis is well-justified. As a case study for developing machine learning models, the task of predicting the payment behavior of clients on an online car rental platform was considered. Input data were automatically generated based on users’ actions on the platform. Subsequently, the data were aggregated and structured through feature engineering, time field transformation, and the removal of redundant attributes to enhance model quality. Five classification models were developed: Support Vector Machine, Naive Bayes classifier, Logistic Regression, and two ensemble models (Soft Voting and Stacking). The results showed that Logistic Regression and ensemble models (particularly Stacking) achieved the best precision and recall, making them the most reliable for predicting on-time payments. Ensemble models, especially stacking, demonstrated high efficiency by combining the strengths of different base models. Although SVM can account for complex relationships between features, it showed the weakest performance in distinguishing payment statuses. The findings contribute to a better understanding of customer payment behavior and highlight the importance of choosing appropriate classification models for financial risk assessment. Future research will focus on improving model performance through enhanced feature selection, class imbalance correction, and the integration of additional data sources such as customer credit history. The use of such models can significantly improve automated risk management and enhance decision-making efficiency for companies dealing with payment obligations. Показано, що деталізовані дані, які збираються на онлайн платформах є гетерогенними семантично неоднорідними та слабко структурованими. Тому є виправданим використання машинного навчання для їх агрегації, структуризації та аналізу. Як приклад для розробки моделей машинного розглянуто задачу прогнозування платіжної поведінки клієнтів онлайн платформи оренди авто. На основі дій користувачів цієї платформи автоматично формувалися вхідні данні. В подальшому дані агрегувалися та структуризувалися шляхом створення нових ознак, перетворення часових полів та видалення надлишкових атрибутів для підвищення якості моделей. Було розроблено п'ять класифікаційних моделей: метод опорних векторів (support vector machine), наївний байєсівський класифікатор, логістичну регресію та дві ансамблеві моделі (м'яке голосування та стекування). Результати показали, що логістична регресія та ансамблеві моделі (стекування) забезпечили найкращі показники точності та повноти, що робить їх найбільш надійними моделями для прогнозування своєчасних платежів. Ансамблеві моделі, особливо стекування, показали високу ефективність, поєднуючи переваги різних базових моделей. Метод опорних векторів, хоча і здатний враховувати складні взаємозв’язки між ознаками, продемонстрував найгіршу ефективність у розрізненні статусів платежів. Отримані результати дозволяють краще зрозуміти платіжну поведінку клієнтів та підкреслюють важливість правильного вибору класифікаційних моделей для оцінки фінансових ризиків. Подальші дослідження будуть спрямовані на оптимізацію продуктивності моделей шляхом розширеного вибору ознак, усунення дисбалансу класів та інтеграції додаткових джерел даних, таких як кредитна історія клієнтів. Використання цих моделей може значно покращити автоматизоване управління ризиками та підвищити ефективність прийняття рішень для компаній, що працюють з платіжними зобов’язаннями. |
URI (Унифицированный идентификатор ресурса): | http://dspace.opu.ua/jspui/handle/123456789/15086 |
ISSN: | 2617-4316 2663-7723 |
Располагается в коллекциях: | 2025, Vol. 8, № 1 |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
1_Arsirii.pdf | 816.07 kB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.