Minería de datos aplicada a la demanda del transporte aéreo en Ocaña, Norte de Santander

Data mining applied to demand of air transport in Ocaña, Norte de Santander

  • Alveiro Alonso Rosado Gómez Universidad Francisco de Paula Santander
  • Alejandra Verjel Ibáñez Universidad Francisco de Paula Santander
Palabras clave: data mining, decision trees, modes of transport, WEKA (en_US)
Palabras clave: árboles de decisión, minería de datos, modos de transporte, WEKA (es_ES)

Resumen (es_ES)

Este artículo muestra la aplicación de la minería de datos para predecir la demanda del servicio aéreo en Ocaña, Norte de Santander, respecto a los pares origen-destino Ocaña-Bogotá, Ocaña-Bucaramanga, Ocaña-Medellín, Ocaña-Cúcuta, Ocaña-Barranquilla; se utilizan datos de estudios realizados para estimar la demanda de un nuevo medio de transporte en la ciudad. Esta investigación sigue las fases del proceso de extracción del conocimiento en bases de datos. En la etapa de minería de datos se seleccionó como técnica los árboles de decisión y como algoritmo el J48. Con la aplicación de este algoritmo se encontró que las personas que viajan mensual y semanalmente eligen el avión, igual que si viajan por motivos de salud; si trabajan y se dirigen a Barranquilla, Bogotá y Medellín, eligen la buseta.

Resumen (en_US)

This paper shows data mining techniques to predict air tickets demand in Ocaña, North Santander, regarding to origin-destination: Ocaña-Bogota, Ocaña - Bucaramanga, Ocaña - Medellín, Ocaña – Cúcuta and Ocaña-Barranquilla. Some data studies were used to estimate new means of transportation demand in Ocaña. This research follows the process of knowledge extraction in databases. In the data mining process stage, it was selected decision trees technique and as algorithm J48. With this algorithm application, we found that people who travel monthly and weekly choose the plane, alike if they travel by health issues; otherwise, but if they travel to Barranquilla, Bogotá and/or Medellin for work, they choose bus.

Descargas

La descarga de datos todavía no está disponible.

Biografía del autor/a

Alveiro Alonso Rosado Gómez, Universidad Francisco de Paula Santander
Ingeniero de sistemas, magister en Gestión, Aplicación y Desarrollo de Software. Director del Departamento de Sistemas e Informática, Universidad Francisco de Paula Santander Ocaña, Ocaña.
Alejandra Verjel Ibáñez, Universidad Francisco de Paula Santander
Ingeniera de sistemas. Profesional de apoyo, Universidad Francisco de Paula Santander, Ocaña

Referencias

Baumgartner, D., & Serpen, G. (2009). Large Experiment and Evaluation Tool for WEKA Classifiers. DMIN, 16, 340-346.

Agrawal, D., & Aggarwal, C. (2001). On the design and quantification of privacy preserving data mining algorithms. Proceedings of the twentieth ACM SIGMOD-SIGACT-SIGART symposium on Principles of database systems. (págs. 247-255). ACM.

Akiva, B., & Lerman, S. (1985). Discrete choice analysis: theory and application to travel demand. (Vol. 9). MIT press.

Alcaldía de Ocaña. (2010). http://ocana-nortedesantander.gov.co/. Recuperado el 29 de Septiembre de 2014, de http://ocana-nortedesantander.gov.co/apc-aa-files/38343339653963383637363461323363/INFORME_GENERAL_DEL_MUNICIPIO.pdf

Arentze, T., & Timmermans, H. (2007). Parametric action decision trees: Incorporating continuous attribute variables into rule-based models of discrete choice. Transportation Research Part B: Methodological, 41, 772-783.

Bresfelean, V. P. (2007). Analysis and predictions on students' behavior using decision trees in Weka environment. Information Technology Interfaces, 2007. ITI 2007. 29th International Conference on. IEEE, (págs. 51-56).

Caruana, R., & Niculescu, A. (2006). An empirical comparison of supervised learning algorithms. Proceedings of the 23rd international conference on Machine learning. (págs. 161-168). ACM.

Castillo, C., Mendoza, M., & Poblete, B. (2011). Information credibility on twitter. WWW '11 Proceedings of the 20th international conference on World wide web (págs. 675-684 ). New York: ACM.

De Oña, J., De Oña, R., & Calvo, F. (2012). A classification tree approach to identify key factors of transit service quality. Expert Systems with Applications 39.12, 11164-11171.

Fawcett, T. (2004). ROC graphs: Notes and practical considerations for researchers. Machine Learning, 31, 1-38.

Fayyad, U. M., Piatetsky, G., Smyth, P., & Uthurusamy, R. (1996). From Data Mining to Knowledge Discovery in Databases. AI Magazine, 17, 37-54.

Ferri, C., Flach, P., & Hernández-Orallo, J. (2002). Learning decision trees using the area under the ROC curve. ICML., 2, 139-146.

Goebel, M., & Gruenwald, L. (1999). A survey of data mining and knowledge discovery software tools. ACM SIGKDD Explorations Newsletter, 1(1), 20-33.

Guerrero, T., Criado, E., & León, I. (2013). Análisis de la demanda de viajes interurbanos combinando datos de diferentes fuentes. Ingeniería y competitividad-Universidad del Valle (En revisión).

Guyon, I., & Elisseeff, A. (2003). An introduction to variable and feature selection. The Journal of Machine Learning Research, 3, 1157-1182.

Hall, M. A., & Holmes, G. (2003). Benchmarking attribute selection techniques for discrete class data mining. Knowledge and Data Engineering, IEEE Transactions on, 15(6), 1437-1447.

Hall, M., Eibe, F., Holmes, G., Pfahringer, B., Reutemann, P., & Witten, I. (2009). The WEKA data mining software: an update. ACM SIGKDD explorations newsletter, 11, 10-18.

Kohavi, R., & Quinlan, R. (2002). Data mining tasks and methods: Classification: decision-tree discovery. En W. Klösgen, & J. Zytkow, Handbook of data mining and knowledge discovery (págs. 267-276).

Marozzo, F., Talia, D., & Trunfio, P. (2013). Scalable script-based data analysis workflows on clouds. 8th Workshop on Workflows in Support of Large-Scale Science (págs. 124-133). New York: ACM, New York.

Martínez, G., Solarte, R., & Soto, J. (2011). Árboles de decisiones en el diagnóstico de enfermedades cardiovasculares. Scientia et Technica, 3(49), 104-109.

Nishimura, K., & Hirose, M. (2007). The study of past working history visualization for supporting trial and error approach in data mining. Proceedings of the 2007 conference on Human interface: Part I (págs. 327-334 ). ACM.

Quinlan, R. (1986). Induction of decision trees. Machine learning, 1, 81-106.

Quinlan, R. (1989). Unknown attribute values in induction. En M. Kaufmann, Machine Learning Proceedings 1989 (págs. 164-168).

Roland, E., Uhrmacher, A., & Saha, K. (2009). Data mining for simulation algorithm selection. Proceeding Simutools '09 Proceedings of the 2nd International Conference on Simulation Tools and Techniques (pág. Article No. 14 ). Brussels: ICST.

Siddharthan, A., & Katsos, N. (2010). Reformulating Discourse Connectives for Non-Expert Readers. Human Language Technologies: The 2010 Annual Conference of the North American Chapter of the ACL (págs. 1002–1010). Los Angeles: Association for Computational Linguistics.

Van Hulse, J., M. Khoshgoftaar, T., & Napolitano, A. (2007). Experimental Perspectives on Learning from Imbalanced Data. International Conference on Machine Learning (págs. 935-942). New York: ACM New York.

Witten, I., Hall, M., Holmes, G., Pfahringer, B., & Reutemann, P. (2009). The WEKA data mining software: an update. ACM SIGKDD explorations newsletter, 11, 10-18.

Xie, C., Lu, J., & Parkany, E. (2003). Work travel mode choice modeling with data mining: decision trees and neural networks. Transportation Research Record: Journal of the Transportation Research Board, 4, 50-61.

Yoav, F., & Schapire, R. (1996). Experiments with a new boosting algorithm. ICML, 96, 148-156.

Cómo citar
Rosado Gómez, A. A., & Verjel Ibáñez, A. (2015). Minería de datos aplicada a la demanda del transporte aéreo en Ocaña, Norte de Santander. Tecnura, 19(45), 101-114. https://doi.org/10.14483/udistrital.jour.tecnura.2015.3.a08
Publicado: 2015-07-01
Sección
Investigación