eONPUIR

Machine learning models for predicting payment status on an online car rental platform

Показать сокращенную информацию

dc.contributor.author Arsirii, Olena O.
dc.contributor.author Арсірій, Олена Олександрівна
dc.contributor.author Krantovskyi, Illia O.
dc.contributor.author Крантовський, Ілля Олександрович
dc.contributor.author Rudenko, Olexandr V.
dc.contributor.author Руденко, Олександр Володимирович
dc.contributor.author Glava, Maria G.
dc.contributor.author Глава, Марія Геннадіївна
dc.date.accessioned 2025-04-17T20:31:50Z
dc.date.available 2025-04-17T20:31:50Z
dc.date.issued 2025-04-04
dc.identifier.issn 2617-4316
dc.identifier.issn 2663-7723
dc.identifier.uri http://dspace.opu.ua/jspui/handle/123456789/15086
dc.description.abstract It has been demonstrated that the detailed data collected on online platforms are heterogeneous, semantically inconsistent, and weakly structured. Therefore, the use of machine learning for their aggregation, structuring, and analysis is well-justified. As a case study for developing machine learning models, the task of predicting the payment behavior of clients on an online car rental platform was considered. Input data were automatically generated based on users’ actions on the platform. Subsequently, the data were aggregated and structured through feature engineering, time field transformation, and the removal of redundant attributes to enhance model quality. Five classification models were developed: Support Vector Machine, Naive Bayes classifier, Logistic Regression, and two ensemble models (Soft Voting and Stacking). The results showed that Logistic Regression and ensemble models (particularly Stacking) achieved the best precision and recall, making them the most reliable for predicting on-time payments. Ensemble models, especially stacking, demonstrated high efficiency by combining the strengths of different base models. Although SVM can account for complex relationships between features, it showed the weakest performance in distinguishing payment statuses. The findings contribute to a better understanding of customer payment behavior and highlight the importance of choosing appropriate classification models for financial risk assessment. Future research will focus on improving model performance through enhanced feature selection, class imbalance correction, and the integration of additional data sources such as customer credit history. The use of such models can significantly improve automated risk management and enhance decision-making efficiency for companies dealing with payment obligations. en
dc.description.abstract Показано, що деталізовані дані, які збираються на онлайн платформах є гетерогенними семантично неоднорідними та слабко структурованими. Тому є виправданим використання машинного навчання для їх агрегації, структуризації та аналізу. Як приклад для розробки моделей машинного розглянуто задачу прогнозування платіжної поведінки клієнтів онлайн платформи оренди авто. На основі дій користувачів цієї платформи автоматично формувалися вхідні данні. В подальшому дані агрегувалися та структуризувалися шляхом створення нових ознак, перетворення часових полів та видалення надлишкових атрибутів для підвищення якості моделей. Було розроблено п'ять класифікаційних моделей: метод опорних векторів (support vector machine), наївний байєсівський класифікатор, логістичну регресію та дві ансамблеві моделі (м'яке голосування та стекування). Результати показали, що логістична регресія та ансамблеві моделі (стекування) забезпечили найкращі показники точності та повноти, що робить їх найбільш надійними моделями для прогнозування своєчасних платежів. Ансамблеві моделі, особливо стекування, показали високу ефективність, поєднуючи переваги різних базових моделей. Метод опорних векторів, хоча і здатний враховувати складні взаємозв’язки між ознаками, продемонстрував найгіршу ефективність у розрізненні статусів платежів. Отримані результати дозволяють краще зрозуміти платіжну поведінку клієнтів та підкреслюють важливість правильного вибору класифікаційних моделей для оцінки фінансових ризиків. Подальші дослідження будуть спрямовані на оптимізацію продуктивності моделей шляхом розширеного вибору ознак, усунення дисбалансу класів та інтеграції додаткових джерел даних, таких як кредитна історія клієнтів. Використання цих моделей може значно покращити автоматизоване управління ризиками та підвищити ефективність прийняття рішень для компаній, що працюють з платіжними зобов’язаннями. en
dc.language.iso en en
dc.publisher Odessа Polytechnic National University en
dc.subject Machine learning en
dc.subject payment prediction en
dc.subject naive bayes classifier en
dc.subject logistic regression en
dc.subject support vector machine en
dc.subject ensemble models en
dc.subject financial risk assessment en
dc.subject Машинне навчання en
dc.subject прогнозування платежів en
dc.subject наївний байєсівський класифікатор en
dc.subject логістична регресія en
dc.subject метод опорних векторів en
dc.subject ансамблеві моделі en
dc.subject оцінка фінансових ризиків en
dc.title Machine learning models for predicting payment status on an online car rental platform en
dc.title.alternative Моделі машинного навчання для прогнозування статусу платежів на онлайн-платформі оренди авто en
dc.type Article en
opu.citation.journal Applied Aspects of Information Technology en
opu.citation.volume 1 en
opu.citation.firstpage 13 en
opu.citation.lastpage 23 en
opu.citation.issue 8 en


Файлы, содержащиеся в элементе

Этот элемент содержится в следующих коллекциях

Показать сокращенную информацию