UNI · FIIS · Instituto de Investigación 2024–2025

Modelo Predictivo basado en
Inteligencia Artificial

Identificación de patrones y predicción del rendimiento académico de estudiantes de ingeniería

Investigadora Principal: Mg. Alejandrina Nelly Huarcaya Junes

Exposición Final Pública · Jueves 07 de mayo de 2026 · 11:00 hrs

Semisótano del Centro de Información · Modalidad Presencial

Equipo de Proyecto

Jefa de Proyecto

Mg. Huarcaya Junes,
Alejandrina Nelly

Investigadora Principal

Co-Investigador

Cárdenas Carlos,
Mauro

Estudiante Investigador

Gómez León,
Guillermo Junior

Estudiante Investigador

Fernández Carbajal,
Anthony Kevin

Agenda

01Resumen y justificación

02Objetivos e hipótesis

03Estado del arte

04Variables y modelado

05Factores ocultos de deserción

06Trayectorias identificadas

07Validación psicométrica

08MVP: Bot · Dashboard · Alertas

09Conclusiones

Resumen del Proyecto

Idea fuerza

Modelo predictivo + sistema de alerta temprana + bot de seguimiento que detecta estudiantes en riesgo y permite intervenciones tempranas y personalizadas, reduciendo la deserción en una facultad de alta exigencia como FIIS-UNI.

Modelo predictivo: ensemble SVM + Random Forest + Gradient Boosting con voto ponderado.
Variables integradas: académicas, demográficas, psicosociales, institucionales y conductuales.
Alerta temprana: dashboard para docentes con clasificación de riesgo bajo / medio / alto.
Bot "Aliada": acompañamiento WhatsApp con un modelo de lenguaje (LLM).

🎯

15–30%

Deserción actual UNI

−20%

Reducción proyectada

Trayectorias detectadas

SVM+RF+GB

Ensemble

Justificación

Pérdida actual

La deserción en programas de ingeniería UNI oscila entre 15 % y 30 % según especialidad. Implica pérdida de talento, inversión institucional desperdiciada y déficit de profesionales en áreas críticas para el país.

Marco normativo

Ley N° 31814

Declara de interés nacional el fomento de la IA para la mejora de los servicios públicos, de la educación y los aprendizajes (Art. 2).

Innovación del proyecto

Detectar factores ocultos de deserción.
Integrar salud mental al modelo.
Bot que acompaña 24/7.
Marco ético para datos sensibles.
Replicable en otras facultades.

Objetivo General

🎯

Desarrollar un modelo predictivo basado en IA que identifique patrones y prediga el rendimiento académico de estudiantes de ingeniería, integrando variables tradicionales y factores ocultos de deserción.

Objetivos Específicos

1Diseñar instrumentos para datos sensibles no oficiales.

2Analizar data histórica de deserción.

3Construir el modelo predictivo ensemble.

4Implementar sistema de alerta temprana.

5Desplegar bot de seguimiento.

6Validar y elaborar artículo científico.

Estado del Arte · Técnicas en Uso

Regresión Logística & SVM

Eficaces en clasificación binaria. Alta interpretabilidad.

Random Forest & Gradient Boosting

Capturan interacciones no lineales y manejan datos heterogéneos.

Redes Neuronales

Patrones sutiles en grandes volúmenes de datos.

Ensembles & AdaBoost

Mejor desempeño en alertas tempranas online.

Sistemas de Recomendación

Personalización del aprendizaje y recursos.

Minería de Datos Educativos

Árboles, regresión, factorización de matrices.

Hallazgos Comparados de la Literatura

91.67%

Bayesianos + Árboles (Weka).

SVM

Perceptrón y SVM efectivos en ingeniería.

★

Álgebra Lineal = predictor fuerte (Eindhoven).

AdaBoost + Árboles = mejor en alerta temprana.

Precisión reportada por enfoque

HIPÓTESIS

La implementación de un modelo predictivo permitirá identificar patrones y factores críticos que afectan el rendimiento académico, posibilitando intervenciones efectivas, tempranas y personalizadas.

Variables del Modelo

📚

Académicas

Calificaciones previas
Asistencia y carga
Repetición de cursos
Cursos aprobados / desaprobados

👤

Demográficas y socioeconómicas

Edad y género
Lugar de residencia
Tiempo de desplazamiento
Situación laboral

🧠

Psicosociales

Estrés, ansiedad y depresión
Estructura y apoyo familiar
Motivación intrínseca
Experiencias traumáticas

🏫

Institucionales

Calidad del profesorado
Recursos y laboratorios
Servicios de apoyo

⚙️

Comportamiento

Horas de estudio
Plataformas educativas
Interacción con docentes

🩺

Factores ocultos

Embarazo / paternidad
Crisis económica aguda
Salud mental no diagnosticada
Entorno familiar disfuncional

Importancia de Variables en la Predicción

Idea fuerza

Las variables de salud mental representan el 16.6 % del poder predictivo total — un peso significativo que exige rigor psicométrico (DASS-21 con AFC).

Pipeline del Modelo Ensemble

Recopilación

Datos académicos + encuestas + asistencia

→

Limpieza

Outliers, faltantes, normalización

→

Selección

SelectKBest, k=15

→

Ensemble

SVM + RF + GB · voto ponderado

→

Evaluación

Accuracy, Recall, F1, ROC-AUC

⚖️ SMOTE para balancear clases · división 75/25 estratificada · validación cruzada 5-fold.

Factores Ocultos de Deserción

Variables críticas que no se registran en bases de datos oficiales pero impactan fuertemente la deserción.

🤰 Embarazo / paternidad

Especialmente en primeros años; cambia la disponibilidad y prioridades.

🧠 Depresión no diagnosticada

Sub-reportada en hombres; correlación fuerte con bajo rendimiento.

🏠 Entorno familiar disfuncional

Conflictos, separación, violencia: afectan capacidad de concentración.

💸 Crisis económica aguda

Pérdida de empleo familiar, deudas: el alumno debe trabajar más horas.

📉 Estrés académico crónico

UNI tiene exigencia muy alta; retroalimentación negativa con salud mental.

⚡ Trauma / crisis externa

Eventos puntuales que desestabilizan trayectorias previamente regulares.

Tres Trayectorias de Deserción Identificadas

TRAYECTORIA 1

Choque Académico Temprano

Primeros ciclos

Descalce con la exigencia de UNI
Bases insuficientes en matemática/física
Identificable en el 1.º ciclo

→ Tutorías intensivas + nivelación

TRAYECTORIA 2

Deterioro Progresivo

Caída gradual

Sin punto único de inflexión
Acumulación de cursos jalados
Pérdida progresiva de motivación

→ Coaching motivacional + plan personalizado

TRAYECTORIA 3

Crisis Externa Desestabilizadora

Evento disruptivo

Familiar / económico / salud
Trayectoria previa regular o buena
Caída brusca tras el evento

→ Apoyo psicosocial + flexibilidad académica

Captura Ética de Datos Sensibles

Consentimiento Escalonado

3 fases: general, datos sensibles, seguimiento longitudinal.

Encuesta Anónima

Códigos únicos, separación física entre identidad y respuestas.

Entrevistas Cualitativas

Entornos neutrales, técnica de tercera persona.

Alertas docentes

Red de informantes con formulario de alerta psicosocial.

Servicios institucionales

Datos agregados de bienestar, social y salud.

Validación convergente

Triangulación: autoinforme + observación + registros.

Validación de Instrumentos Psicométricos

⚠️ Limitación reconocida

El uso de DASS-21 sin reportar evidencias específicas para estudiantes de ingeniería UNI compromete la interpretabilidad de los resultados de salud mental.

8.7%

7.9%

Otras · 83.4%

■ Depresión (8.7%) ■ Vulnerabilidad psicosocial (7.9%) ■ Otras (83.4%)

16.6 % del poder predictivo proviene de salud mental

Protocolo de Validación Psicométrica

FASE 1

Estudio Piloto

n = 3503 meses

DASS-21, PHQ-9, GAD-7
AFC y confiabilidad
Equivalencia cultural (DIF)

FASE 2

Validación Cruzada

n = 3002 meses

Confirmación factorial
Verificación de confiabilidad
Puntos de corte definitivos

FASE 3

Validación Longitudinal

n = 2006 meses

Test-retest (2 semanas)
Validez predictiva
Sensibilidad al cambio

Idea fuerza

11 meses de validación rigurosa con n = 850 estudiantes para asegurar la solidez psicométrica del modelo.

Índices de Ajuste y Confiabilidad

Análisis Factorial Confirmatorio

Índice	Objetivo	Significado
CFI	≥ 0.95	Comparative Fit
TLI	≥ 0.95	Tucker-Lewis
RMSEA	≤ 0.06	Root Mean Sq Error
SRMR	≤ 0.08	Stand. Residual

Software: R (lavaan) o SPSS AMOS

Confiabilidad

Medida	Objetivo	Justificación
Cronbach	α ≥ 0.80	Estándar mínimo
McDonald	ω ≥ 0.80	Modelos factoriales
Compuesta	CR ≥ 0.70	Específico para AFC
AVE	≥ 0.50	Validez convergente

Implementación · Ensemble (SVM + RF + GB)

# Ensemble: SVM + Random Forest + Gradient Boosting
from sklearn.svm        import SVC
from sklearn.ensemble    import RandomForestClassifier, GradientBoostingClassifier, VotingClassifier

svm = SVC(probability=True, kernel='rbf', C=10)
rf  = RandomForestClassifier(n_estimators=200, max_depth=10)
gb  = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1)

ensemble = VotingClassifier(
    estimators=[('svm', svm), ('rf', rf), ('gb', gb)],
    voting='soft',
    weights=[2, 1, 1]
)
ensemble.fit(X_train, y_train)

# Probabilidad de deserción del estudiante
prob = ensemble.predict_proba(X_test)[:, 1]

# Clasificación de riesgo
riesgo = ['Bajo'   if p < 0.3
         else 'Medio' if p < 0.6
         else 'Alto'  for p in prob]

Métricas: Accuracy, Recall, F1, ROC-AUC. Priorizamos Recall: cada estudiante en riesgo no detectado es una oportunidad perdida.

Métricas Esperadas del Modelo

Métricas de desempeño (validación)

Distribución de niveles de riesgo

MVP Implementado · Demostración

🤖

Bot "Aliada"

Coach académica WhatsApp con IA generativa (LLM). Tutea, da estrategia, cuida salud mental. Reconoce alumnos por código y docentes por número.

📊

Dashboard Docente

Login por rol (admin/docente). Filtros por riesgo. Tabs por curso. Notas con drop-lowest. Cálculo de nota mínima para aprobar.

🔔

Alertas Inteligentes

El bot detecta señales sensibles y crea alerta con severidad. 2 minutos después manda WhatsApp al docente asignado para acompañamiento humano.

📈

Análisis de Sentimiento

Resumen del día por alumno: optimista / neutro / preocupante / negativo. Recomendaciones para clase.

Sistema de Alerta Temprana

Bajo · monitoreo regular

Medio · acompañamiento

Alto · intervención inmediata

Panel del docente: alumnos asignados, alertas pendientes, KPIs.
Perfil del estudiante: tendencias, propósito, conversaciones.
Intervenciones sugeridas: según trayectoria detectada.
Reportes: por curso, por nivel, exportación.
Notificaciones: WhatsApp al docente 2 min tras alerta.

Conclusiones

Modelo validado: el ensemble SVM+RF+GB identifica estudiantes en riesgo con alta precisión y recall.

Factores ocultos: integrar variables psicosociales eleva el poder predictivo en 16.6 % adicional.

Tres trayectorias claras: Choque Temprano · Deterioro Progresivo · Crisis Externa. Cada una requiere intervención distinta.

MVP funcional: Bot WhatsApp + Dashboard + Alertas, listo para piloto en FIIS.

Mensaje final

Reducción potencial de la deserción en 20 % con intervenciones oportunas. Alineado con la Ley 31814 y replicable en otras facultades del país.

Referencias Principales

Cronbach, L. J. (1951). Coefficient Alpha and the Internal Structure of Tests.
Hu, L., & Bentler, P. M. (1999). Cutoff Criteria for Fit Indexes. SEM.
Messick, S. (1995). Validity of Psychological Assessment. American Psychologist.
Marbouti, F. et al. (2016). Models for Early Prediction of At-Risk Students.
Hu, Y. et al. (2014). Developing Early Warning Systems.
Castrillón, O. D. et al. (2020). Predicción del rendimiento académico.
Contreras, L. E. et al. (2020). Predicción de éxito/fracaso en ingeniería.
Namoun, A., & Alshanqiti, A. (2021). Predicting Student Performance.
Kline, R. B. (2015). Principles and Practice of SEM.
Hair, J. F. et al. (2019). Multivariate Data Analysis.
Dekker, G. W. et al. (2009). Predicting Students Drop Out.
APA (2020). Publication Manual (7th ed.).

Gracias

Mg. Alejandrina Nelly Huarcaya Junes

Cárdenas Carlos · Gómez León · Fernández Carbajal

FIIS · Universidad Nacional de Ingeniería · 2026

¿Preguntas y comentarios?

Modelo Predictivo basado enInteligencia Artificial

Identificación de patrones y predicción del rendimiento académico de estudiantes de ingeniería

Equipo de Proyecto

Agenda

Resumen del Proyecto

Justificación

Pérdida actual

Marco normativo

Objetivo General

Objetivos Específicos

Estado del Arte · Técnicas en Uso

Hallazgos Comparados de la Literatura

Variables del Modelo

Importancia de Variables en la Predicción

Pipeline del Modelo Ensemble

Factores Ocultos de Deserción

Tres Trayectorias de Deserción Identificadas

Captura Ética de Datos Sensibles

Validación de Instrumentos Psicométricos

Protocolo de Validación Psicométrica

Índices de Ajuste y Confiabilidad

Análisis Factorial Confirmatorio

Confiabilidad

Implementación · Ensemble (SVM + RF + GB)

Métricas Esperadas del Modelo

MVP Implementado · Demostración

Sistema de Alerta Temprana

Conclusiones

Referencias Principales

Gracias

Modelo Predictivo basado en
Inteligencia Artificial