DOI:
https://doi.org/10.14483/2322939X.4103Publicado:
2006-12-01Número:
Vol. 3 Núm. 1 (2006)Sección:
Investigación y DesarrolloPROTOTIPO DE SOFTWARE PARA LA CLASIFICACIÓN DE DATOS MEDIANTE EL MÉTODO BAYESIANO TAN – “udTAN”
Palabras clave:
Clasificar, dependencia, probabilidad, información mutua y método bayesiano. (es).Descargas
Resumen (es)
En este artículo se plasma la implementación del método TAN (del inglés Tree Augmented Naive Bayes), aplicado a la clasificación de datos. TAN constituye una extensión del clasificador Naïve Bayes (NB), cuya idea es construir una red bayesiana un poco más compleja que el NB, pero donde se da un tratamiento especial a la variable clase; por tanto, se enmarca en la filosofía de aprender redes bayesianas orientadas a clasificación. Con TAN se pretende mantener la simplicidad computacional del clasificador NB pero intentando mejorar la efectividad de la clasificación. Para ello, en lugar de suponer todas las variables independientes, dada la clase, se admiten ciertas dependencias entre los atributos. En concreto, se supone que los atributos constituyen una red bayesiana con forma de árbol. Este algoritmo se basa en el concepto de información mutua.
Referencias
CHOW, C.; LIU, C. Approximating discrete probability distributions with dependence trees. IEEE Transactions on Information Theory, 1968.
FRIEDMAN, N.; GEIGER, D.; GOLDIZMITDT, M. “Bayesian networks classifiers”. Machine Learning, 1997.
KEOGH, E. J.; PAZZANI, M. Learning augmented Bayesian classifiers: a com-parison of distribution-based and non distribution-based approaches. Proceedings of the 7th International Workshop on Artificial Intelligence and Statistics, 1999.
LARRAGAÑA, P.; LOZANO, J.A. Estimation of Distribution Algorithms. A New Tool for Evolutionary Computation. Kluwer Academic Publishers, 2002.
MITCHELL, T.M. Machine Learning. Mc Graw Hill, 1997.
PEARL, J. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kaufmann, 1988.
HAN, J. and KAMBER, M. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers. San Francisco (USA), 2001.
HERNÁNDEZ, J., RAMIREZ, M., FERRI, C. Introducción a la Minería de Datos. Prentice Hall. España, 2004.
LARRAGAÑA, P.; INZA, I. Clasificadores Bayesianos. (Sitio en Internet) Disponible en: http://www.sc.ehu.es/ccwbayes/docencia/mmcc/docs/t6bayesianos.pdf. Acceso el 26 octubre 2005.
MOLINERO, L. El método bayesiano en la investigación médica. (Sitio en Internet) Disponible en http://www.seh-lelha.org/bayes1.htm. Acceso el 7 septiembre 2005. Publicado en mayo 2002.
MORALES, E. Redes Bayesianas en Minería de Datos. (Sitio en Internet) Disponible en: http://dns1.mor.itesm.mx/~emorales/Cursos/KDD03/node44.html. Acceso el 26 octubre 2005. Publicado el 13 septiembre 2005.
MOREA, L. Curso de Java. (Sitio en Internet) Disponible en: http://www.monografias.com/trabajos/java/java.shtml#top. Acceso el 7 noviembre de 2005. Publicado 1997.
SEDA, J. Teorema de Bayes. (Sitio en Internet) Disponible en: http://thales.cica.es/rd/Recursos/rd98/Matematicas/28/8.html. Acceso el 22 agosto 2005. Publicado el 12 junio 2005.