Clasificación de abandono de alumnos en una ingeniería de universidad privada mexicana
Fecha
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Resumen
Actualmente el ITESO cuenta con modelos de estimación de abandono, cambio de carrera y egreso a nivel de la universidad y de grupos de alumnos (mujeres, hombres, por carreras, por rangos de edades, etc.), así como modelos predictivos a nivel individual. Para estos últimos se emplearon técnicas estadísticas como regresión semi paramétrica de Cox, modelos de Cox extendidos (Li et al., 2017; Tay et al., 2022) y modelos de aprendizaje de máquina como los árboles de supervivencia aleatorios (RSF). También se cuenta con modelos de clasificación de abandono para las carreras de ingeniería usando regresión logística.
En este trabajo se presentan modelos de clasificación de abandono en la Ingeniería en Sistemas Computacionales (ISC) del ITESO para predecir si en el momento del ingreso un alumno abandonará o no la carrera al 2do semestre. Se emplearon 27 modelos de aprendizaje automático (AA) utilizando la librería H2O de Python y la metodología de Minería de Datos CRISP-DM. Se utilizaron variables predictoras asociadas directamente con el alumno o con la preparatoria, tanto demográficas, académicas, socioeconómicas como de comportamiento. Finalmente se comparó la calidad de los modelos en cuanto a área bajo la curva (AUC), sensibilidad, especificidad, puntuación F1, error cuadrático medio y precisión, encontrando que dos modelos de Máquina de Potenciación del Gradiente (GBM) y uno de Conjunto de modelos (Stacked Ensemble) arrojaron mejores resultados que el modelo base de Regresión Logística. De estos tres el mejor resultó el modelo GBM_1_AutoML_1 en el que se obtuvo una sensibilidad del 64.3 %, una especificidad del 85.1 %, AUC del 76 % y una precisión del 86.4 %. Las variables predictoras más importantes para este modelo fueron: Probabilidad histórica promedio de abandono de alumnos de una misma preparatoria en la universidad estudiada (Prepa_Encode_Prob_abandon), Índice de calidad de preparatoria en la prueba PLANEA 2015 (ind_planea), Promedio de preparatoria (PromPre), Categoría de beca (CatBeca), Local o foráneo (Local) y Edad de ingreso (EdadIng).