Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral

Artificial Intelligence Models in Educational Data Mining for Predicting Dropout in Higher Education: A Comprehensive Review

Autores/as

Palabras clave:

Student dropout, machine learning algorithms, predictive models, artificial intelligence (en).

Palabras clave:

Deserción estudiantil, algoritmos de aprendizaje automático, modelos predictivos, inteligencia artificial (es).

Descargas

Resumen (es)

Contexto: la deserción estudiantil en educación superior afecta la calidad y permanencia educativa. La inteligencia artificial (IA) emerge como herramienta clave para predecir y prevenir este fenómeno, a través de modelos aplicados en minería de datos educativos.
Objetivo: analizar modelos de IA utilizados para predecir la deserción en educación superior, identificar variables frecuentes y evaluar la precisión y exactitud de los algoritmos aplicados.
Metodología: se realizó una revisión integral de literatura científica, centrada en estudios recientes que aplican IA en entornos educativos. Se compararon modelos según su rendimiento y frecuencia de uso, así como las variables
más empleadas en los procesos predictivos.
Resultados: los modelos más destacados por su rendimiento fueron bosques aleatorios, redes neuronales artificiales y redes profundas. Las variables académicas, demográficas y socioeconómicas fueron las más significativas en
los modelos predictivos.
Conclusiones: la IA permite anticipar riesgos de deserción con alta eficacia. Su aplicación depende de factores técnicos y contextuales. Se recomienda profundizar en nuevas variables y combinar enfoques tradicionales con aprendizaje profundo para mejorar la capacidad predictiva.
Financiamiento: Este estudio hace parte de un proyecto de investigación aprobado por la Universidad de Pamplona, con financiación de recursos propios y apoyo institucional.

Resumen (en)

Context: Student dropout in higher education affects both educational quality and student retention. Artificial intelligence (AI) emerges as a key tool to predict and prevent this phenomenon through models applied in educational
data mining.
Objective: To analyze AI models used to predict dropout in higher education, identify frequently used variables, and evaluate the precision and accuracy of the applied algorithms.
Methodology: A comprehensive review of scientific literature was conducted, focusing on recent studies that apply AI in educational settings. Models were compared based on their performance and frequency of use, as well as the
most commonly employed variables in predictive processes.
Results: The models that stood out for their performance were Random Forests (RF), Artificial Neural Networks (ANN), and Deep Neural Networks (DNN). Academic, demographic, and socioeconomic variables proved to be
the most significant in predictive models.
Conclusions: AI enables the anticipation of dropout risks with high effectiveness. Its application depends on technical and contextual factors. It is recommended to explore new variables and combine traditional approaches with
deep learning to enhance predictive capacity.
Funding: This study is part of a research project approved by the University of Pamplona, funded through personal resources and institutional support.

Biografía del autor/a

José Leonardo Pérez Niño, Universidad de Pamplona,University of Pamplona

Ingeniero Mecatrónico, Magister en controles industriales (c), Facultad de Ingenierías y arquitectura, Universidad de Pamplona, Pamplona, Colombia.

Oscar Eduardo Gualdrón Guerrero, Universidad de Pamplona,University of Pamplona

Ingeniero Electrónico, PhD en Ingeniería Electrónica. Profesor titular, Facultad de Ingenierías y arquitectura, Universidad de Pamplona, Pamplona, Colombia.

Diego José Barrera Oliveros, Universidad de Pamplona,University of Pamplona

Ingeniero Mecatrónico, Mg en controles Industriales. Doctor en automática (c). Profesor de tiempo completo, Facultad de Ingenierías y arquitectura, Universidad de Pamplona, Pamplona, Colombia.

Referencias

Abideen, Z. U., Mazhar, T., Razzaq, A., Haq, I., Ullah, I., Alasmary, H., y Mohamed, H. G. (2023). Analysis of enrollment criteria in secondary schools using machine learning and data mining approach. Electronics (Switzerland), 12(3), 694. https://doi.org/10.3390/electronics12030694

Abu Saa, A., Al-Emran, M., y Shaalan, K. (2019). Factors affecting students’ performance in higher education: a systematic review of predictive data mining techniques. Technology, Knowledge and Learning, 24(4), 567-598. https://doi.org/10.1007/s10758-019-09408-7

Agudelo, O. (2023). Identificación de deserción temprana en la Universidad de Manizales con aprendizaje automático, como parte de la estrategia de prevención [Tesis de maestría, Universidad de Manizales]. Repositorio Institucional UM. https://ridum.umanizales.edu.co/handle/20.500.12746/647

Akour, M., Sghaier, H. Al, y Al Qasem, O. (2020). The effectiveness of using deep learning algorithms in predicting students achievements. Indonesian Journal of Electrical Engineering and Computer Science, 19(1), 388. https://doi.org/10.11591/ijeecs.v19.i1.pp388-394

Alalawi, K., Athauda, R., y Chiong, R. (2023). Contextualizing the current state of research on the use of machine learning for student performance prediction: a systematic literature review. Engineering Reports, 5(12). https://doi.org/10.1002/eng2.12699

Albreiki, B., Zaki, N., y Alashwal, H. (2021). A systematic literature review of student’s performance prediction using machine learning techniques. Education Sciences, 11(9), 552. https://doi.org/10.3390/educsci11090552

Ali Khan, M. A., Ma, H., Farhad, A., Mujeeb, A., Mirani, I. K., y Hamza, M. (2024). When LoRa meets distributed machine learning to optimize the network connectivity for green and intelligent transportation system. Green Energy and Intelligent Transportation, 3(3), 100204. https://doi.org/10.1016/j.geits.2024.100204

Aljohani, N. R., Fayoumi, A., y Hassan, S.-U. (2019). Predicting at-risk students using clickstream data in the virtual learning environment. Sustainability, 11(24), 7238. https://doi.org/10.3390/su11247238

Alnasyan, B., Basheri, M., y Alassafi, M. (2024). The power of deep learning techniques for predicting student performance in virtual learning environments: a systematic literature review. Computers and Education: Artificial Intelligence, 6, 100231. https://doi.org/10.1016/j.caeai.2024.100231

Aslam, N. M., Khan, I. U., Alamri, L. H., y Almuslim, R. S. (2021). An improved early student’s academic performance prediction using deep learning. International Journal of Emerging Technologies in Learning (IJET), 16(12), 108-122. https://doi.org/10.3991/ijet.v16i12.20699

Ávila Pérez, M. L. (2021). Modelo de predicción de deserción estudiantil, apoyado en tecnologías de data mining, en un curso de primera matrícula de la escuela ECBTI de la UNAD [Tesis de maestría, Universidad Nacional Abierta y a Distancia]. Repositorio Institucional UNAD. https://repository.unad.edu.co/handle/10596/42544

Caicedo Castro, I. (2023). Course prophet: a system for predicting course failures with machine learning: a numerical methods case study. Sustainability, 15(18), 13950. https://doi.org/10.3390/su151813950

Chanchí Golondrino, G. E., Ospina Alarcón, M. A., y Campo Muñoz, W. Y. (2024). Construction of a virtual usability laboratory for conducting user tests during remote attendance. Revista Colombiana de Tecnologías de Avanzada (RCTA), 2(44), 35-44. https://doi.org/10.24054/rcta.v2i44.2713

Chen, G. (2022). Pinning control of complex dynamical networks. IEEE Transactions on Consumer Electronics, 68(4), 336-343. https://doi.org/10.1109/TCE.2022.3200488

Chen, H., Wang, Y., Li, Y., Lee, Y., Petri, A., y Cha, T. (2023). Computer science and non-computer science faculty members’ perception on teaching data science via an experiential learning platform. Education and Information Technologies, 28(4), 4093-4108. https://doi.org/10.1007/s10639-022-11326-8

Colak Oz, H., Güven, Ç., y Nápoles, G. (2023). School dropout prediction and feature importance exploration in Malawi using household panel data: machine learning approach. Journal of Computational Social Science, 6(1), 245-287. https://doi.org/10.1007/s42001-022-00195-3

Díaz, A. (2009). Análisis sobre la deserción en la Educación Superior a distancia y virtual: el caso de la UNAD – Colombia. Revista de Investigaciones UNAD, 8(2), 117-149.

González Castro, Y., Peñaranda Peñaranda, M. M., y Manzano Durán, O. (2019). Innovaciones tecnológicas en las prácticas académicas virtuales. Revista Colombiana de Tecnologías de Avanzada (RCTA), 1(33), 69-77. https://doi.org/10.24054/rcta.v1i33.87

Guo, B., Zhang, R., Xu, G., Shi, C., y Yang, L. (2015). Predicting students performance in educational data mining. En 2015 International Symposium on Educational Technology (ISET) (pp. 125-128). Wuhan, República Popular de China. https://doi.org/10.1109/ISET.2015.33

Gutiérrez A., D., Vélez Díaz, J. F., y López M., J. (2021). Indicadores de deserción universitaria y factores asociados. EducaT: Educación Virtual, Innovación y Tecnologías, 2(1), 15-26. https://doi.org/10.22490/27452115.4738

Haron, N. H., Mahmood, R., Amin, N. M., Ahmad, A., y Jantan, S. R. (2024). An Artificial Intelligence Approach to Monitor and Predict Student Academic Performance. Journal of Advanced Research in Applied Sciences and Engineering Technology, 44(1), 105–119. https://doi.org/10.37934/araset.44.1.105119

Hien, D. T. T., Thi, C., Kim, T., The, D., y Nguyen, C. (2020). Optimize the combination of categorical variable encoding and deep learning technique for the problem of prediction of vietnamese student academic performance. International Journal of Advanced Computer Science and Applications, 11(11). https://doi.org/10.14569/IJACSA.2020.0111135

Hoyos, W., y Caicedo Castro, I. (2024). Tuning data mining models to predict secondary school academic performance. Data, 9(7), 86. https://doi.org/10.3390/data9070086

Iqbal, Z., Qayyum, A., Latif, S., y Qadir, J. (2019). Early student grade prediction: an empirical study. En 2019 2nd International Conference on Advancements in Computational Sciences (ICACS) (pp. 1-7). Lahore, Pakistán. https://doi.org/10.23919/ICACS.2019.8689136

Kavipriya, T., y Sengaliappan, M. (2021). Adaptive weight deep convolutional neural network (AWDCNN) classifier for predicting student’s performance in job placement process. Annals of the Romanian Society for Cell Biology, 25(1), 507-518.

Khan, I., Al Sadiri, A., Ahmad, A. R., y Jabeur, N. (2019). Tracking student performance in introductory programming by means of machine learning. En 2019 4th MEC International Conference on Big Data and Smart City (ICBDSC) (pp. 1-6). Mascate, Omán. https://doi.org/10.1109/ICBDSC.2019.8645608

Kostopoulos, G., Karlos, S., y Kotsiantis, S. (2019). Multiview learning for early prognosis of academic performance: a case study. IEEE Transactions on Learning Technologies, 12(2), 212-224. https://doi.org/10.1109/TLT.2019.2911581

L. F. Vargas Tamayo, H. R. Tocasuche González, & J. A. Tristancho Ortiz. (2013). Nuevo software para la administración y control académico de estudiantes en ingeniería industrial. Tecnura, 17(1), 174–189. https://doi.org/10.14483/22487638.7247

Li, B., Lowell, V. L., Wang, C., y Li, X. (2024). A systematic review of the first year of publications on ChatGPT and language education: examining research on ChatGPT’s use in language learning and teaching. Computers and Education: Artificial Intelligence, 7, 100266. https://doi.org/10.1016/j.caeai.2024.100266

Liu, T., Wang, C., Chang, L., y Gu, T. (2022). Predicting High-Risk Students Using Learning Behavior. Mathematics, 10(14), 2483. https://doi.org/10.3390/math10142483

Llanos Mosquera, J. M., Hidalgo Suarez, C. G., & Bucheli Guerrero, V. A. (2021). Una revisión sistemática sobre aula invertida y aprendizaje colaborativo apoyados en inteligencia artificial para el aprendizaje de programación. Tecnura, 25(69), 196–214. https://doi.org/10.14483/22487638.16934

Mariano, A. M., Ferreira, A. B. de M. L., Santos, M. R., Castilho, M. L., y Bastos, A. C. F. L. C. (2022). Decision trees for predicting dropout in engineering course students in Brazil. Procedia Computer Science, 214, 1113-1120. https://doi.org/10.1016/j.procs.2022.11.285

Mengash, H. A. (2020). Using data mining techniques to predict student performance to support decision making in university admission systems. IEEE Access, 8, 55462-55470. https://doi.org/10.1109/ACCESS.2020.2981905

Ministerio de Educación Nacional. (12 de febrero de 2025). Estadísticas de deserción y permanencia en Educación Superior (SPADIES 3.0). Indicadores 2021. https://www.mineducacion.gov.co/sistemasinfo/spadies/secciones/Estadisticas-de-desercion/

Observatorio de Educación Superior de Medellín. (2017). Deserción en la educación superior. https://www.sapiencia.gov.co/wp-content/uploads/2017/11/5_JULIO_BOLETIN_ODES_DESERCION_EN_LA_EDUCACION_SUPERIOR.pdf

Paniagua Medina, J. J., Vargas Rodríguez, E., y Guzmán Cabrera, R. (2023). Aprendizaje automático y la Colección Reuters-21578 en la clasificación de documentos. Revista Colombiana de Tecnologías de Avanzada (RCTA), 2(40), 39-46. https://doi.org/10.24054/rcta.v2i40.2344

Poudyal, S., Mohammadi-Aragh, M. J., y Ball, J. E. (2022). Prediction of student academic performance using a hybrid 2D CNN model. Electronics, 11(7), 1005. https://doi.org/10.3390/electronics11071005

Rabelo, A. M., y Zárate, L. E. (2024). A model for predicting dropout of higher education students. Data Science and Management, 8(1), 72-85. https://doi.org/10.1016/j.dsm.2024.07.001

Ramírez, P. E., y Grandón, E. E. (2018). Predicción de la deserción académica en una universidad pública chilena a través de la clasificación basada en árboles de decisión con parámetros optimizados. Formación Universitaria, 11(3), 3-10. https://doi.org/10.4067/S0718-50062018000300003

Roslan, N., Jamil, J. M., Mohd Shaharanee, I. N., y Sultan Alawi, S. J. (2024). Prediction of student dropout in malaysian’s private higher education institute using data mining application. Journal of Advanced Research in Applied Sciences and Engineering Technology, 45(2), 168-176. https://doi.org/10.37934/araset.45.2.168176

Timarán Buchely, A., y Timarán Pereira, R. (2023). Minería de datos educativa para descubrir patrones asociados al desempeño académico en competencias genéricas. Revista Colombiana de Tecnologias de Avanzada (RCTA), 2(38), 87-95. https://doi.org/10.24054/rcta.v2i38.1282

Tsiakmaki, M., Kostopoulos, G., Kotsiantis, S., y Ragos, O. (2019). Implementing autoML in educational data mining for prediction tasks. Applied Sciences, 10(1), 90. https://doi.org/10.3390/app10010090

Universidad de los Andes, Facultad de Economía, Centro de Estudios sobre Desarrollo Económico CEDE. (2014). Informe Determinantes de la deserción “Informe mensual sobre el soporte técnico y avance del contrato para garantizar la alimentación, consolidación, validación y uso de la información del SPADIES”. Bogotá D.C.: Colombia. https://www.mineducacion.gov.co/sistemasdeinformacion/1735/articles-254702_Informe_determinantes_desercion.pdf

Xie, Y. (2021). Student performance prediction via attention-based multi-layer long-short term memory. Journal of Computer and Communications, 09(08), 61-79. https://doi.org/10.4236/jcc.2021.98005

Zhang, H., Li, K., y Fu, X. (2010). On pinning control of some typical discrete-time dynamical networks. Communications in Nonlinear Science and Numerical Simulation, 15(2), 182-188. https://doi.org/10.1016/j.cnsns.2009.01.019

Cómo citar

APA

Pérez Niño, J. L., Gualdrón Guerrero, O. E., y Barrera Oliveros, D. J. (2024). Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral. Tecnura, 28(82), 134–155. https://doi.org/10.14483/22487638.23670

ACM

[1]
Pérez Niño, J.L. et al. 2024. Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral. Tecnura. 28, 82 (dic. 2024), 134–155. DOI:https://doi.org/10.14483/22487638.23670.

ACS

(1)
Pérez Niño, J. L.; Gualdrón Guerrero, O. E.; Barrera Oliveros, D. J. Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral. Tecnura 2024, 28, 134-155.

ABNT

PÉREZ NIÑO, José Leonardo; GUALDRÓN GUERRERO, Oscar Eduardo; BARRERA OLIVEROS, Diego José. Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral. Tecnura, [S. l.], v. 28, n. 82, p. 134–155, 2024. DOI: 10.14483/22487638.23670. Disponível em: https://revistas.udistrital.edu.co/index.php/Tecnura/article/view/23670. Acesso em: 8 dic. 2025.

Chicago

Pérez Niño, José Leonardo, Oscar Eduardo Gualdrón Guerrero, y Diego José Barrera Oliveros. 2024. «Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral». Tecnura 28 (82):134-55. https://doi.org/10.14483/22487638.23670.

Harvard

Pérez Niño, J. L., Gualdrón Guerrero, O. E. y Barrera Oliveros, D. J. (2024) «Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral», Tecnura, 28(82), pp. 134–155. doi: 10.14483/22487638.23670.

IEEE

[1]
J. L. Pérez Niño, O. E. Gualdrón Guerrero, y D. J. Barrera Oliveros, «Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral», Tecnura, vol. 28, n.º 82, pp. 134–155, dic. 2024.

MLA

Pérez Niño, José Leonardo, et al. «Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral». Tecnura, vol. 28, n.º 82, diciembre de 2024, pp. 134-55, doi:10.14483/22487638.23670.

Turabian

Pérez Niño, José Leonardo, Oscar Eduardo Gualdrón Guerrero, y Diego José Barrera Oliveros. «Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral». Tecnura 28, no. 82 (diciembre 28, 2024): 134–155. Accedido diciembre 8, 2025. https://revistas.udistrital.edu.co/index.php/Tecnura/article/view/23670.

Vancouver

1.
Pérez Niño JL, Gualdrón Guerrero OE, Barrera Oliveros DJ. Modelos de inteligencia artificial en minería de datos educativos para predecir la deserción en Educación Superior: una revisión integral. Tecnura [Internet]. 28 de diciembre de 2024 [citado 8 de diciembre de 2025];28(82):134-55. Disponible en: https://revistas.udistrital.edu.co/index.php/Tecnura/article/view/23670

Descargar cita

Visitas

134

Dimensions


PlumX


Descargas

Los datos de descargas todavía no están disponibles.

Artículos más leídos del mismo autor/a

Loading...