Predicción de comportamiento crediticio

Cargando...
Miniatura

Fecha

2023-09

Autores

Villarreal-Palomino, Aldo E.

Título de la revista

ISSN de la revista

Título del volumen

Editor

ITESO

Resumen

Descripción

Este trabajo se centra en mejorar la evaluación del riesgo crediticio utilizando el conjunto de datos South German Credit. El objetivo principal es seleccionar el mejor modelo de clasificación entre Regresión Logística, Support Vector Machine (SVM), Árboles Aleatorios y Árboles de Decisión para predecir si un cliente es "bueno" o "malo" en términos de crédito. Los objetivos específicos del trabajo son describir el conjunto de datos, encontrar el mejor modelo de clasificación utilizando el Accuracy como métrica principal. En el desarrollo del trabajo, se realiza una descripción detallada del conjunto de datos, incluyendo su origen, tamaño, atributos y objetivo. También se justifica la elección de los cuatro modelos de clasificación mencionados y se describe brevemente cada uno de ellos. Se realiza un análisis de correlación para identificar las relaciones entre las variables del conjunto de datos y su influencia en el riesgo crediticio. Se destaca qué variables, como la duración del crédito, el monto del crédito, la edad del solicitante y la tasa de interés, tienen correlación con el riesgo crediticio. Se opta por utilizar todas las variables del conjunto de datos. Se resalta la importancia de la medida de Accuracy para evaluar el rendimiento de los modelos de clasificación en este problema y se presentan los resultados obtenidos en siete experimentos. Los principales cambios entre los experimentos fueron los tratamientos de las variables categóricas, utilizando principalmente LabelEncoder y OneHotEncoder para evitar una jerarquización falsa. Se presentan las Accuracy obtenidas para cada modelo en todos los experimentos y se selecciona el mejor de ellos. El mejor modelo fue el SVM con grid search para la afinación de los hiperparámetos, con lo cual se obtuvo un Accuracy de 83.92%.

Palabras clave

Predicción Crediticia, Riesgo Crediticio, Support Vector Machine, Árboles de Decisión

Citación

Villarreal-Palomino, A. E. (2023). Predicción de comportamiento crediticio. Trabajo de obtención de grado, Maestría en Ciencia de Datos. Tlaquepaque, Jalisco: ITESO.