Propuesta de un modelo logístico para la probabilidad de instalación de datáfonos en una empresa ubicada en Bogotá

  • Elkin Javier Cruz Hurtado
  • Manuel Francisco Romero FUNDACION UNIVERSITARIA LOS LIBERTADORES
Palabras clave: Datafono, Regresión Logística, Especificidad, Sensibilidad, Curva ROC. (es_ES)

Resumen (es_ES)

El objetivo de este articulo es dar a conocer una propuesta de un modelo de regresión logística múltiple comparado con un modelo de árbol de decisión que permita predecir la probabilidad de instalaciones exitosas en la empresa, con el fin de determinar el mejor modelo y así poder su aumentar su participación en el mercado realizando mejoras al interior de las áreas involucradas. Para el desarrollo del proyecto se tuvieron en cuenta nueve variables categóricas con 5534 individuos, con la información obtenida se identificaron las variables mas significativas para el modelo de regresión logística. En el desarrollo de este artículo se encuentra los datos analizados, las características de las variables, estimación de predicciones, matriz de confusión, diseño del área bajo la curva (curva ROC). En los resultados obtenidos la probabilidad de instalaciones de datáfonos exitosa es del 69% con las variables significativas arrojadas por el modelo de regresión  logística, el análisis efectuado en el área bajo la curva de los dos modelos expuestos en el proyecto se determino que el mejor modelo para predecir los aciertos de las instalaciones tanto exitosas como fallidas frente a los datos observados es el modelo de la regresión logística múltiple con una efectividad del 76,7%.

 

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Elkin Javier Cruz Hurtado

Especialización en Estadística Aplicada

Referencias

Alvear, J. O. (16 de 11 de 2018). Arboles de decision y Random Forest. Obtenido de bookdown: https://bookdown.org/content/2031/

BBVA. (2017 de 05 de 2017). ¿Qué es el TPV? Obtenido de BBVA: https://www.bbva.com/es/que-es-el-tpv/

Blissett, R. (26 de 11 de 2017). Logistic Regression in R. Obtenido de RPubs by RStudio: https://rpubs.com/rslbliss/r_logistic_ws

Colombia, S. F. (2008). Datáfonos, servicios y comisiones.

Colombia, S. F. (2011). Informe de transacciones y operaciones.

Camargo, J. J., Joyanes, L. y Giraldo, L. M. (2016). La inteligencia de negocios como una herramienta en la gestión académica Revista Científica, 1(24). https://doi.org/10.14483/udistrital.jour.RC. 2016.24.a11

CREDIBANCO. (15 de 05 de 2020). Soluciones en punto de Venta. Obtenido de Credibanco: https://www.credibanco.com/soluciones-para-comercios/soluciones-en-punto-de-venta

Fernández, S. d. (2011). REGRESIÓN LOGÍSTICA. Madrid.

Hilbe, J. M. (2016). Practical Guide to Logistic Regression. En J. M. Hilbe, Practical Guide to Logistic Regression (pág. 6).

Kaggle. (2020). Kaggle. Obtenido de Logistic Regression and ROC Curve Primer: https://www.kaggle.com/captcalculator/logistic-regression-and-roc-curve-primer/code

Klein, D. G. (2002). Logistic Regression: A Self-Learning Text, Second Edition.

Lemeshow, D. W. (2000). Applied Logistic Regression.

Li, J. (07 de 11 de 2018). Data Analysis on the Credit Card Fraud Detection dataset from Kaggle. Obtenido de RPubs by RStudio: https://rpubs.com/Kertoky/438939

Logistic Regression. (2 de 10 de 2018). Obtenido de UC Business Analytics R: https://uc-r.github.io/logistic_regression

Lozano -Forero, S, Ballesteros-Ballesteros, V., & Nisperuza- Toledo, J. L. (2018). Gradient Statistic: An option for conducting hypothesis testing in small sample size scenarios. International Journal of Applied Engineering Research, 13(23), 16368-16375.

Machine Learning con R. (28 de 02 de 2015). Obtenido de Apuntes-r.blogspot.com: http://apuntes-r.blogspot.com/2015/02/curva-roc-con-package-rocr.html

Medina, M. C. (2011). Generalidades de las pruebas diagnósticas,. Rev. Colomb. Psiquiat.

Méndez Hincapié, N. F. (2019). Introducción del concepto de probabilidad en Física desde la Mecánica Estadística. Revista Científica, 280-292. Recuperado a partir de https://revistas.udistrital.edu.co/index.php/revcie/article/view/14500

Monterrosa, H. (10 de 7 de 2019). Cada día se emiten más de 12.000 tarjetas de crédito y más 15.000 de débito. Obtenido de La republica.com: https://www.larepublica.co/finanzas/cada-dia-se-emiten-mas-de-12000-tarjetas-de-credito-y-15000-de-debito-2882840

Nacional, R. (23 de 07 de 2019). En promedio, cerca de 1.136 personas son víctimas de hurto cada día en Colombia. Obtenido de El Espectador: https://www.elespectador.com/noticias/nacional/en-promedio-cerca-de-1136-personas-son-victimas-de-hurto-cada-dia-en-colombia-articulo-872344

Navarro, Y. P. (2007). Factibilidad para la creación de una empresa para pagos de servicios públicos con datáfono en barrancabermeja (tesis de pregrado). Barrancabermeja.

Ochoa , C y Orejas, G. (1999). Epidemiología y metodología. Epidemiología y metodología científica aplicada a la pediatría (IV), 303.

R (lenguaje de programación). (6 de 5 de 2020). Obtenido de Wikipedia: https://es.wikipedia.org/wiki/R_(lenguaje_de_programaci%C3%B3n)

R Notebook - Ejemplo ML para detección de fraude en TC. (s.f.). Obtenido de R Pubs: https://rstudio-pubs-static.s3.amazonaws.com/298528_845f68bfb9814f05bade678fc770bc99.html

Rickert, J. (01 de 03 de 2019). Some R Packages for ROC Curves. Obtenido de R Views: https://rviews.rstudio.com/2019/03/01/some-r-packages-for-roc-curves/

Rodrigo, J. A. (8 de 2016). Regresión logística simple y múltiple . Obtenido de RPubs by RStudio: https://rpubs.com/Joaquin_AR/229736

Solarte, G. y Soto, J. (2011). Arboles de decisiones en el diagnóstico de enfermedades cardiovasculares. Scientia et Technica Año XVI, 104

Wikipedia. (20 de 3 de 2020). Matriz de confusión. Obtenido de Wikipedia: https://es.wikipedia.org/wiki/Matriz_de_confusi%C3%B3n

Zapata Ceballos, H. A., Bustince, H., & Dimuro, G. (2020). Funciones t-migrativas t-overlap: una generalización de migratividad en funciones t-overlap. Revista Científica, 2(38). https://doi.org/10.14483/23448350.15601

Cómo citar
Cruz Hurtado , E. J., & Romero , M. F. (2020). Propuesta de un modelo logístico para la probabilidad de instalación de datáfonos en una empresa ubicada en Bogotá . Noria Investigación Educativa , 1(5), 41-53. https://doi.org/10.14483/25905791.16452
Publicado: 2020-06-01
Sección
Investigación e Innovación