Modelos predictivos competitivos de morosidad crediticia para entidades argentinas Análisis descriptivo y predictivo con datos públicos
View/ Open
Metadata
Show full item recordAuthor/s:
Soules, Lucas M.
Advisor/s:
Gálvez, Ramiro H.
Thesis degree name:
Master in Management + Analytics
Date:
2020Abstract
Una importante característica del mercado de créditos en la Argentina es la marcada diferencia que existe en el acceso a la información entre las entidades grandes (mayoritariamente bancos) y las entidades chicas (sociedades anónimas, mutuales y cooperativas), a lo que se suma una menor capacidad analítica de estas últimas (generalmente por no disponer de equipos internos plenamente desarrollados y abocados a la tarea). Esto lleva a que en su operatoria sea común que entidades pequeñas deban recurrir a costosos servicios externos, lo que no sólo impacta en su rentabilidad, sino también en los clientes que efectivamente pueden atender. El objetivo de esta tesis es desarrollar y evaluar una herramienta que, utilizando algoritmos de aprendizaje automático y datos enteramente públicos, prediga morosidad futura en personas que hasta el momento tienen todas sus deudas en situación regular.
Una herramienta de estas características permitiría, principalmente a entidades pequeñas, aumentar sus ingresos, reducir sus costos operativos y proyectar mejor sus flujos de fondos. Los resultados obtenidos sugieren que, tomando como insumo datos de la Central de Deudores del Banco Central de la República Argentina y haciendo uso de metodologías modernas de aprendizaje automático, se pueden desarrollar modelos predictivos de detección de mora, los cuales alcanzan resultados competitivos cuando se los compara con la literatura previa. En este trabajo se detalla las diferencias entre ambos tipos de entidades, se presenta en detalle las decisiones metodológicas detrás de los modelos desarrollados, se analiza el efecto marginal que genera la incorporación de variables de tendencias, se evalúa la performance de los mismos utilizando datos reales, y se lleva adelante un ejercicio de interpretación de modelos; finalmente, se discute cómo estos modelos pueden ser aplicados para generar valor en una entidad crediticia. One of the most important characteristics of the Argentine credit market is the strong difference between large entities (mostly banks) and small entities (limited companies, mutuals and cooperatives) in their capability to obtain information. In addition to this, the smaller ones usually have fewer resources to analyse data, mostly because of their lack of internal analytical skills. The result is such that small entities are forced to incur in costly external services, affecting not only their earnings, but also the type and amount of customers they can serve. The purpose of this thesis project is to develop and test a tool, using machine learning algorithms with public data, in order to predict future credit loans default in people that, at the moment, have met all their debt obligations. This tool would allow both types of entities, but mostly smaller ones, to raise their revenue, reduce operating costs and project more accurately future cash flows. The final results suggest it is possible to create competitive and marketable default predictive models using modern machine learning techniques and public data from the Central Bank of Argentina. In this thesis, differences between both types of entities are studied. Moreover, the methodological decisions and the performance behind the created models are exhibited. Also, the marginal effects of using tendency variables in the models are calculated. Finally, a discussion on model interpretation and on how this tool can create value to a company are included.