Modelos Logísticos en Alta Dimensión: Un Caso de Estudio en la Industria Financiera
Metadata
Show full item recordAuthor/s:
Dip, Yanina Soledad
Advisor/s:
Martos Venturini, Gabriel
Thesis degree name:
Maestría en Econometría
Date:
2020Abstract
El objetivo de este trabajo es estimar la probabilidad de default de los clientes “Pasivos” de una institución bancaria. Una fracción importante de las personas jurídicas que conforman la muestra con la que se estimarán los diferentes modelos presentados en la sección nº4, tiene productos pasivos contratados; y, por el contrario, una fracción pequeña de clientes tiene contratado productos de riesgo, pero no los utilizan.
El problema de estimación se enmarca en el contexto del "Big Data"; se dispone de un conjunto de más de 600 co-variables para ajustar los modelos. En consecuencia, el elevado número de regresores en el modelo, y la eventual existencia de fuertes relaciones de colinealidad entre los mismos, producen efectos adversos, no solo en términos de las propiedades estadísticas de los parámetros a estimar. Esta particular situación, conocida en la literatura como la "maldición de la dimensión", tiene también un impacto negativo respecto de la capacidad predictiva del modelo. Por este motivo, se explora la utilización de métodos de regularización (LASSO) que producen un efecto de achicamiento (shrink) en los estimadores, y eventualmente eliminan co-variables innecesarias en el modelo. Si bien este mecanismo produce sesgo en los estimadores, también reduce de manera ostensible la variabilidad de los mismos.