UNI · FIIS · Instituto de Investigación 2024–2025

Modelo Predictivo basado en
Inteligencia Artificial

Identificación de patrones y predicción del rendimiento académico de estudiantes de ingeniería

Investigadora Principal: Mg. Alejandrina Nelly Huarcaya Junes
Exposición Final Pública · Jueves 07 de mayo de 2026 · 11:00 hrs
Semisótano del Centro de Información · Modalidad Presencial

Equipo de Proyecto

Jefa de Proyecto
Mg. Huarcaya Junes,
Alejandrina Nelly
Investigadora Principal
Co-Investigador
Cárdenas Carlos,
Mauro
Estudiante Investigador
Gómez León,
Guillermo Junior
Estudiante Investigador
Fernández Carbajal,
Anthony Kevin

Agenda

01Resumen y justificación
02Objetivos e hipótesis
03Estado del arte
04Variables y modelado
05Factores ocultos de deserción
06Trayectorias identificadas
07Validación psicométrica
08MVP: Bot · Dashboard · Alertas
09Conclusiones

Resumen del Proyecto

Idea fuerza
Modelo predictivo + sistema de alerta temprana + bot de seguimiento que detecta estudiantes en riesgo y permite intervenciones tempranas y personalizadas, reduciendo la deserción en una facultad de alta exigencia como FIIS-UNI.
  • Modelo predictivo: ensemble SVM + Random Forest + Gradient Boosting con voto ponderado.
  • Variables integradas: académicas, demográficas, psicosociales, institucionales y conductuales.
  • Alerta temprana: dashboard para docentes con clasificación de riesgo bajo / medio / alto.
  • Bot "Aliada": acompañamiento WhatsApp con un modelo de lenguaje (LLM).
🎯
15–30%
Deserción actual UNI
−20%
Reducción proyectada
3
Trayectorias detectadas
SVM+RF+GB
Ensemble

Justificación

Pérdida actual

La deserción en programas de ingeniería UNI oscila entre 15 % y 30 % según especialidad. Implica pérdida de talento, inversión institucional desperdiciada y déficit de profesionales en áreas críticas para el país.

Marco normativo

Ley N° 31814
Declara de interés nacional el fomento de la IA para la mejora de los servicios públicos, de la educación y los aprendizajes (Art. 2).
Innovación del proyecto
  • Detectar factores ocultos de deserción.
  • Integrar salud mental al modelo.
  • Bot que acompaña 24/7.
  • Marco ético para datos sensibles.
  • Replicable en otras facultades.

Objetivo General

🎯

Desarrollar un modelo predictivo basado en IA que identifique patrones y prediga el rendimiento académico de estudiantes de ingeniería, integrando variables tradicionales y factores ocultos de deserción.

Objetivos Específicos

1Diseñar instrumentos para datos sensibles no oficiales.
2Analizar data histórica de deserción.
3Construir el modelo predictivo ensemble.
4Implementar sistema de alerta temprana.
5Desplegar bot de seguimiento.
6Validar y elaborar artículo científico.

Estado del Arte · Técnicas en Uso

Regresión Logística & SVM

Eficaces en clasificación binaria. Alta interpretabilidad.

Random Forest & Gradient Boosting

Capturan interacciones no lineales y manejan datos heterogéneos.

Redes Neuronales

Patrones sutiles en grandes volúmenes de datos.

Ensembles & AdaBoost

Mejor desempeño en alertas tempranas online.

Sistemas de Recomendación

Personalización del aprendizaje y recursos.

Minería de Datos Educativos

Árboles, regresión, factorización de matrices.

Hallazgos Comparados de la Literatura

91.67%
Bayesianos + Árboles (Weka).
SVM
Perceptrón y SVM efectivos en ingeniería.
Álgebra Lineal = predictor fuerte (Eindhoven).
+
AdaBoost + Árboles = mejor en alerta temprana.
Precisión reportada por enfoque
HIPÓTESIS

La implementación de un modelo predictivo permitirá identificar patrones y factores críticos que afectan el rendimiento académico, posibilitando intervenciones efectivas, tempranas y personalizadas.

Variables del Modelo

📚
Académicas
  • Calificaciones previas
  • Asistencia y carga
  • Repetición de cursos
  • Cursos aprobados / desaprobados
👤
Demográficas y socioeconómicas
  • Edad y género
  • Lugar de residencia
  • Tiempo de desplazamiento
  • Situación laboral
🧠
Psicosociales
  • Estrés, ansiedad y depresión
  • Estructura y apoyo familiar
  • Motivación intrínseca
  • Experiencias traumáticas
🏫
Institucionales
  • Calidad del profesorado
  • Recursos y laboratorios
  • Servicios de apoyo
⚙️
Comportamiento
  • Horas de estudio
  • Plataformas educativas
  • Interacción con docentes
🩺
Factores ocultos
  • Embarazo / paternidad
  • Crisis económica aguda
  • Salud mental no diagnosticada
  • Entorno familiar disfuncional

Importancia de Variables en la Predicción

Idea fuerza
Las variables de salud mental representan el 16.6 % del poder predictivo total — un peso significativo que exige rigor psicométrico (DASS-21 con AFC).

Pipeline del Modelo Ensemble

1
Recopilación
Datos académicos + encuestas + asistencia
2
Limpieza
Outliers, faltantes, normalización
3
Selección
SelectKBest, k=15
4
Ensemble
SVM + RF + GB · voto ponderado
5
Evaluación
Accuracy, Recall, F1, ROC-AUC
⚖️ SMOTE para balancear clases · división 75/25 estratificada · validación cruzada 5-fold.

Factores Ocultos de Deserción

Variables críticas que no se registran en bases de datos oficiales pero impactan fuertemente la deserción.

🤰 Embarazo / paternidad

Especialmente en primeros años; cambia la disponibilidad y prioridades.

🧠 Depresión no diagnosticada

Sub-reportada en hombres; correlación fuerte con bajo rendimiento.

🏠 Entorno familiar disfuncional

Conflictos, separación, violencia: afectan capacidad de concentración.

💸 Crisis económica aguda

Pérdida de empleo familiar, deudas: el alumno debe trabajar más horas.

📉 Estrés académico crónico

UNI tiene exigencia muy alta; retroalimentación negativa con salud mental.

⚡ Trauma / crisis externa

Eventos puntuales que desestabilizan trayectorias previamente regulares.

Tres Trayectorias de Deserción Identificadas

TRAYECTORIA 1
Choque Académico Temprano
Primeros ciclos
  • Descalce con la exigencia de UNI
  • Bases insuficientes en matemática/física
  • Identificable en el 1.º ciclo
→ Tutorías intensivas + nivelación
TRAYECTORIA 2
Deterioro Progresivo
Caída gradual
  • Sin punto único de inflexión
  • Acumulación de cursos jalados
  • Pérdida progresiva de motivación
→ Coaching motivacional + plan personalizado
TRAYECTORIA 3
Crisis Externa Desestabilizadora
Evento disruptivo
  • Familiar / económico / salud
  • Trayectoria previa regular o buena
  • Caída brusca tras el evento
→ Apoyo psicosocial + flexibilidad académica

Captura Ética de Datos Sensibles

Consentimiento Escalonado

3 fases: general, datos sensibles, seguimiento longitudinal.

Encuesta Anónima

Códigos únicos, separación física entre identidad y respuestas.

Entrevistas Cualitativas

Entornos neutrales, técnica de tercera persona.

Alertas docentes

Red de informantes con formulario de alerta psicosocial.

Servicios institucionales

Datos agregados de bienestar, social y salud.

Validación convergente

Triangulación: autoinforme + observación + registros.

Validación de Instrumentos Psicométricos

⚠️ Limitación reconocida

El uso de DASS-21 sin reportar evidencias específicas para estudiantes de ingeniería UNI compromete la interpretabilidad de los resultados de salud mental.

8.7%
7.9%
Otras · 83.4%
■ Depresión (8.7%) ■ Vulnerabilidad psicosocial (7.9%) ■ Otras (83.4%)
16.6 % del poder predictivo proviene de salud mental

Protocolo de Validación Psicométrica

FASE 1
Estudio Piloto
n = 3503 meses
  • DASS-21, PHQ-9, GAD-7
  • AFC y confiabilidad
  • Equivalencia cultural (DIF)
FASE 2
Validación Cruzada
n = 3002 meses
  • Confirmación factorial
  • Verificación de confiabilidad
  • Puntos de corte definitivos
FASE 3
Validación Longitudinal
n = 2006 meses
  • Test-retest (2 semanas)
  • Validez predictiva
  • Sensibilidad al cambio
Idea fuerza
11 meses de validación rigurosa con n = 850 estudiantes para asegurar la solidez psicométrica del modelo.

Índices de Ajuste y Confiabilidad

Análisis Factorial Confirmatorio

ÍndiceObjetivoSignificado
CFI≥ 0.95Comparative Fit
TLI≥ 0.95Tucker-Lewis
RMSEA≤ 0.06Root Mean Sq Error
SRMR≤ 0.08Stand. Residual

Software: R (lavaan) o SPSS AMOS

Confiabilidad

MedidaObjetivoJustificación
Cronbachα ≥ 0.80Estándar mínimo
McDonaldω ≥ 0.80Modelos factoriales
CompuestaCR ≥ 0.70Específico para AFC
AVE≥ 0.50Validez convergente

Implementación · Ensemble (SVM + RF + GB)

# Ensemble: SVM + Random Forest + Gradient Boosting
from sklearn.svm        import SVC
from sklearn.ensemble    import RandomForestClassifier, GradientBoostingClassifier, VotingClassifier

svm = SVC(probability=True, kernel='rbf', C=10)
rf  = RandomForestClassifier(n_estimators=200, max_depth=10)
gb  = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1)

ensemble = VotingClassifier(
    estimators=[('svm', svm), ('rf', rf), ('gb', gb)],
    voting='soft',
    weights=[2, 1, 1]
)
ensemble.fit(X_train, y_train)

# Probabilidad de deserción del estudiante
prob = ensemble.predict_proba(X_test)[:, 1]

# Clasificación de riesgo
riesgo = ['Bajo'   if p < 0.3
         else 'Medio' if p < 0.6
         else 'Alto'  for p in prob]
Métricas: Accuracy, Recall, F1, ROC-AUC. Priorizamos Recall: cada estudiante en riesgo no detectado es una oportunidad perdida.

Métricas Esperadas del Modelo

Métricas de desempeño (validación)
Distribución de niveles de riesgo

MVP Implementado · Demostración

🤖
Bot "Aliada"

Coach académica WhatsApp con IA generativa (LLM). Tutea, da estrategia, cuida salud mental. Reconoce alumnos por código y docentes por número.

📊
Dashboard Docente

Login por rol (admin/docente). Filtros por riesgo. Tabs por curso. Notas con drop-lowest. Cálculo de nota mínima para aprobar.

🔔
Alertas Inteligentes

El bot detecta señales sensibles y crea alerta con severidad. 2 minutos después manda WhatsApp al docente asignado para acompañamiento humano.

📈
Análisis de Sentimiento

Resumen del día por alumno: optimista / neutro / preocupante / negativo. Recomendaciones para clase.

Sistema de Alerta Temprana

Bajo · monitoreo regular
Medio · acompañamiento
Alto · intervención inmediata
  • Panel del docente: alumnos asignados, alertas pendientes, KPIs.
  • Perfil del estudiante: tendencias, propósito, conversaciones.
  • Intervenciones sugeridas: según trayectoria detectada.
  • Reportes: por curso, por nivel, exportación.
  • Notificaciones: WhatsApp al docente 2 min tras alerta.

Conclusiones

1
Modelo validado: el ensemble SVM+RF+GB identifica estudiantes en riesgo con alta precisión y recall.
2
Factores ocultos: integrar variables psicosociales eleva el poder predictivo en 16.6 % adicional.
3
Tres trayectorias claras: Choque Temprano · Deterioro Progresivo · Crisis Externa. Cada una requiere intervención distinta.
4
MVP funcional: Bot WhatsApp + Dashboard + Alertas, listo para piloto en FIIS.
Mensaje final
Reducción potencial de la deserción en 20 % con intervenciones oportunas. Alineado con la Ley 31814 y replicable en otras facultades del país.

Referencias Principales

  • Cronbach, L. J. (1951). Coefficient Alpha and the Internal Structure of Tests.
  • Hu, L., & Bentler, P. M. (1999). Cutoff Criteria for Fit Indexes. SEM.
  • Messick, S. (1995). Validity of Psychological Assessment. American Psychologist.
  • Marbouti, F. et al. (2016). Models for Early Prediction of At-Risk Students.
  • Hu, Y. et al. (2014). Developing Early Warning Systems.
  • Castrillón, O. D. et al. (2020). Predicción del rendimiento académico.
  • Contreras, L. E. et al. (2020). Predicción de éxito/fracaso en ingeniería.
  • Namoun, A., & Alshanqiti, A. (2021). Predicting Student Performance.
  • Kline, R. B. (2015). Principles and Practice of SEM.
  • Hair, J. F. et al. (2019). Multivariate Data Analysis.
  • Dekker, G. W. et al. (2009). Predicting Students Drop Out.
  • APA (2020). Publication Manual (7th ed.).

Gracias

Mg. Alejandrina Nelly Huarcaya Junes

Cárdenas Carlos · Gómez León · Fernández Carbajal

FIIS · Universidad Nacional de Ingeniería · 2026

¿Preguntas y comentarios?