Scoring models in solvency evaluation
Loading...
Date
2022
Authors
Недождій, Михайло
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Ukrainian financial institutions and banks currently face a problem of a high number of non-performing loans. This study aims to propose a solution to that problem, by creating a machine learning-enabled credit scoring model, training it on an open source dataset, and applying it on to a set of potential Ukrainian borrowers. The hypothesis is that the methods of credit scoring used by financial institutions in Ukraine are ineffective and could be vastly improved by implementing decision tree machine learning algorithms into day-to-day operations to increase the accuracy of default probability for individual borrowers. The results show that while these methods can be successfully applied for Ukrainian borrowers, the dataset to train the algorithm on has to be carefully picked to fit with the information that you can easily collect during a credit application process. These results suggest that if the proposed prediction algorithms are trained on a diversified dataset, they can vastly reduce the amount of NPLs being given out by banking institutions in Ukraine.
Українські фінансові установи та банки зараз стикаються з проблемою великої кількості проблемних кредитів. Це дослідження має на меті запропонувати вирішення цієї проблеми шляхом створення моделі кредитного скорингу за допомогою машинного навчання, навчання її на загальнодоступному наборі даних та застосування на наборі даних потенційних українських позичальників. Наша гіпотеза полягає в тому, що методи кредитного скорингу, які використовуються фінансовими установами в Україні, неефективні та можуть бути значно покращені шляхом впровадження алгоритмів машинного навчання (дерева рішень) для підвищення точності передбачення ймовірності дефолту для позичальників. Результати показують, що хоча ці методи можна успішно застосовувати для українських позичальників, набір даних для навчання алгоритму має бути ретельно відібраний, щоб він відповідав інформації, яку ви можете легко зібрати під час процесу отримання заявки на кредит. Ці результати свідчать про те, що якщо запропоновані алгоритми прогнозування навчати на наборі даних, що рівномірно розподілений, вони можуть значно зменшити кількість проблемних кредитів, які видають банківські установи в Україні.
Українські фінансові установи та банки зараз стикаються з проблемою великої кількості проблемних кредитів. Це дослідження має на меті запропонувати вирішення цієї проблеми шляхом створення моделі кредитного скорингу за допомогою машинного навчання, навчання її на загальнодоступному наборі даних та застосування на наборі даних потенційних українських позичальників. Наша гіпотеза полягає в тому, що методи кредитного скорингу, які використовуються фінансовими установами в Україні, неефективні та можуть бути значно покращені шляхом впровадження алгоритмів машинного навчання (дерева рішень) для підвищення точності передбачення ймовірності дефолту для позичальників. Результати показують, що хоча ці методи можна успішно застосовувати для українських позичальників, набір даних для навчання алгоритму має бути ретельно відібраний, щоб він відповідав інформації, яку ви можете легко зібрати під час процесу отримання заявки на кредит. Ці результати свідчать про те, що якщо запропоновані алгоритми прогнозування навчати на наборі даних, що рівномірно розподілений, вони можуть значно зменшити кількість проблемних кредитів, які видають банківські установи в Україні.
Description
Keywords
credit scoring, machine learning, banking, decision tree, gradient boosting, bachelor thesis, кредитний скоринг, машинне навчання, банківська справа, дерево рішень, градієнтне підсилювання