Implementación del método de optimización de máquinas de soporte vectorial en R

Diego Armando Poveda García; Martha Elva Ramírez Guzmán; Yolanda Margarita Fernandez-Ordoñez; Erwin Fabián García López

doi:10.14483/22487638.20326

Autores/as

Diego Armando Poveda García Universidad Nacional de Colombia https://orcid.org/0000-0002-9096-4000
Martha Elva Ramírez Guzmán Colegio de Postgraduados https://orcid.org/0000-0002-8840-3706
Yolanda Margarita Fernandez-Ordoñez Colegio de Postgraduados
Erwin Fabián García López Universidad Nacional de Colombia https://orcid.org/0000-0002-8338-3566

Palabras clave:

Support Vector Machine, Optimization, R, e1071 library, Supervised Learning (en).

Palabras clave:

máquina de soporte vectorial, optimización, R, librería e1070, aprendizaje supervisado (es).

Descargas

PDF

Resumen Autores/as Métricas disponibles Referencias Cómo citar

Resumen (es)

Contexto: La optimización de máquinas de soporte vectorial (SVM, por su sigla en inglés) ha sido un tema recurrente en diversos foros y publicaciones relacionadas con la inteligencia artificial (IA) y el aprendizaje automático. A pesar de su relevancia, existe una notable ausencia de directrices claras para la selección y optimización de los hiperparámetros asociados a las distintas funciones kernel utilizadas en SVM, lo cual puede comprometer la eficacia de estas herramientas en tareas de clasificación y regresión.
Objetivo: Este estudio tiene como objetivo general presentar un método detallado y riguroso para la optimización de los hiperparámetros en SVM, mediante el uso de la librería e1071 en R. Se busca, así, proporcionar una guía clara para futuros investigadores y practicantes en el campo, que les permita implementar de manera efectiva SVM en
sus proyectos.
Metodología: Se emplearon las librerías e1071 y scales en R para estandarizar los datos y ajustar los modelos SVM con diferentes tipos de kernel (lineal, radial, sigmoide y polinomial). Se procedió a la optimización de hiperparámetros mediante la función “tune”, con análisis de conjuntos de entrenamiento y prueba para verificar la bondad de ajuste. Se utilizó una metodología detallada para seleccionar los hiperparámetros óptimos de cada kernel, a partir del estudio de la eficacia de la clasificación y la minimización del error.
Resultados: Los resultados destacan la correcta selección y optimización de los hiperparámetros en SVM, y demuestran mejoras significativas en la clasificación al aplicar el método propuesto. Se encontró que la elección de hiperparámetros óptimos varía considerablemente entre los diferentes tipos de kernel y que su adecuada optimización contribuye a la precisión del modelo.
Conclusiones: La implementación detallada y el ajuste de los hiperparámetros en SVM son cruciales para maximizar su desempeño. Este artículo proporciona un código optimizado y una metodología clara para su implementación
en R, lo cual facilita la tarea de investigadores y analistas en el campo del aprendizaje automático. Se enfatiza la necesidad de considerar la especificidad de cada conjunto de datos y la relevancia de la experiencia en la selección de hiperparámetros. También, se sugiere, para futuras investigaciones, explorar y expandir las fronteras de las SVM en la solución de problemas complejos de clasificación.

Resumen (en)

Context: The optimization of Support Vector Machines (SVM) has been a recurring theme in various forums and publications related to artificial intelligence and machine learning. Despite its relevance, there is a notable absence of clear guidelines for the selection and optimization of parameters associated with the different kernel functions used in SVMs, which can compromise the effectiveness of these tools in classification and regression tasks.

Objective: The overall objective of this study is to present a detailed and rigorous method for the optimization of parameters in SVMs, using the e1071 library in R for this purpose. Thus, it seeks to provide a clear guide for future researchers and practitioners in the field, enabling them to effectively implement SVMs in their projects.

Methodoly: The e1071 and scales libraries in R were used to standardize the data and adjust the SVM models with different types of kernels (linear, radial, sigmoid, and polynomial). Parameter optimization was carried out using the tune function, analyzing training and test sets to verify the goodness of fit. A detailed methodology was used to select the optimal parameters for each kernel, based on the analysis of classification efficacy and error minimization.

Results: The results highlight the importance of correct parameter selection and optimization in SVMs, showing significant improvements in classification when applying the proposed method. It was found that the choice of optimal parameters varies considerably among the different types of kernels, and their proper optimization contributes
to the precision of the model.

Conclusions: Detailed implementation and parameter adjustment in SVMs are crucial to maximizing their performance. This article contributes to the existing literature by providing optimized code and a clear methodology for
its implementation in R, facilitating the work of researchers and analysts in the field of machine learning. It emphasizes the need to consider the specificity of each data set and the relevance of experience in parameter selection, inviting future research to explore and expand the boundaries of SVMs in solving complex classification problems.

Biografía del autor/a

Diego Armando Poveda García, Universidad Nacional de Colombia

Economista. M. Sc. Estadística. Científico de datos corporativo.

Martha Elva Ramírez Guzmán , Colegio de Postgraduados

Licenciada en Actuaría, M. Sc. Estadística. Ph. D. Statistics. Profesora investigadora titular

Yolanda Margarita Fernandez-Ordoñez, Colegio de Postgraduados

Licenciada en Matemáticas. M. Sc. Computación. Ph. D. Computación. Profesora investigadora titular

Erwin Fabián García López, Universidad Nacional de Colombia

Administrador de Empresas. Especialista en Administración Financiera. Magíster en Educación. Profesor investigador ocasional.

Referencias

Amat, J. (abril de 2017). Máquinas de vector soporte (support vector machines, SVMs). RPubs.com. https://rpubs.com/Joaquin_AR/267926

Ávila, P., González, J., Vargas, D. y Pérez, P. (2022). Predicción del rezago social en México: un enfoque de aprendizaje automático a partir de datos de unidades económicas. Agrociencias, 56(2), 248-263. https://doi.org/10.47163/agrociencia.v56i2.2768

Berrendero, J. (2016). Máquinas de vectores soporte con R. Rpubs.com. https://rpubs.com/joser/svm

Betancourt, G. (2005). Las máquinas de soporte vectorial (SMV). Scientia et Technica, 11(27), 67-72. https://dialnet.unirioja.es/descarga/articulo/4838384.pdf

Calvo, D. (3 de octubre de 2016). SVM-Máquinas de vectores de soporte en R. Diegocalvo.es. https://www.diegocalvo.es/svm-maquinas-de-vectores-de-soporte-en-r/

Campo, E. (2016). Introducción a las máquinas de vector soporte (SVM) en aprendizaje supervisado [Tesis de grado]. Universidad de Zaragoza. https://zaguan.unizar.es/record/59156/files/TAZ-TFG-2016-2057.pdf

Chih, C., Chih, L., Dimitriadou, E., Hornik, K., Leisch, F., Meyer, D. y Weingessel, A. (2021). Misc functions of the Department of Statistics, probability theory group (formerly: e1071), TU Wien. Cran.R-project.org. https://cran.r-project.org/web/packages/e1071/e1071.pdf

Cuenca, D. y León, D. (2019). Support vector machine. Rpubs.com. https://rpubs.com/Dario_BSC/SVM

Gil, C. (junio de 2018). Máquinas de vector soporte. Rpubs.com. https://rpubs.com/Cristina_Gil/SVM

Gomila, J. (2018). 24 - Support vector machines en RStudio [Archivo de video]. YouTube. https://youtu.be/_JdK4FMzd28

Méndez, H. (2003). Algunas propiedades del kernel empleado en máquinas de soporte vectorial para clasificación [Tesis de posgrado]. Centro de Investigación en Matemáticas A.C. https://cimat.repositorioinstitucional.mx/jspui/bitstream/1008/11/2/TE%20118.pdf

Paredes, D. (26 de 06 de 2020). Data Science con R. Análisis de datos y algoritmos de predicción con R. Bookdown.org. https://bookdown.org/dparedesi/data-science-con-r/

Rodríguez, E., Vinante, C. y Leal, M. (2009). Enfoque óptimo del método kernel cuadrados mínimos parciales. Saber, 21(2), 172-178. https://www.redalyc.org/pdf/4277/427739440010.pdf

Sosa, S. (23 de abril de 2021). Support vector machine. Rpubs.com. https://rpubs.com/sebas_Alf/759517

Tinoco, C. (2019). Laboratorio 9.6. Máquinas de vectores de soporte. Rpubs.com. https://rpubs.com/cesar_tinoco/511674

Vargas, M. (30 de abril de 2020). Máquinas de Soporte Vectorial (support vector machine, SVM) en regresión. Rpubs.com. https://rpubs.com/movo/607465

Cómo citar

APA

Poveda García, D. A., Ramírez Guzmán , M. E., Fernandez-Ordoñez, Y. M., y García López, E. F. (2024). Implementación del método de optimización de máquinas de soporte vectorial en R. Tecnura, 28(80). https://doi.org/10.14483/22487638.20326

ACM

[1]

Poveda García, D.A. et al. 2024. Implementación del método de optimización de máquinas de soporte vectorial en R. Tecnura. 28, 80 (abr. 2024). DOI:https://doi.org/10.14483/22487638.20326.

ACS

(1)

Poveda García, D. A.; Ramírez Guzmán , M. E.; Fernandez-Ordoñez, Y. M.; García López, E. F. Implementación del método de optimización de máquinas de soporte vectorial en R. Tecnura 2024, 28.

ABNT

POVEDA GARCÍA, Diego Armando; RAMÍREZ GUZMÁN , Martha Elva; FERNANDEZ-ORDOÑEZ, Yolanda Margarita; GARCÍA LÓPEZ, Erwin Fabián. Implementación del método de optimización de máquinas de soporte vectorial en R. Tecnura, [S. l.], v. 28, n. 80, 2024. DOI: 10.14483/22487638.20326. Disponível em: https://revistas.udistrital.edu.co/index.php/Tecnura/article/view/20326. Acesso em: 28 abr. 2025.

Chicago

Poveda García, Diego Armando, Martha Elva Ramírez Guzmán, Yolanda Margarita Fernandez-Ordoñez, y Erwin Fabián García López. 2024. «Implementación del método de optimización de máquinas de soporte vectorial en R». Tecnura 28 (80). https://doi.org/10.14483/22487638.20326.

Harvard

Poveda García, D. A. (2024) «Implementación del método de optimización de máquinas de soporte vectorial en R», Tecnura, 28(80). doi: 10.14483/22487638.20326.

IEEE

[1]

D. A. Poveda García, M. E. Ramírez Guzmán, Y. M. Fernandez-Ordoñez, y E. F. García López, «Implementación del método de optimización de máquinas de soporte vectorial en R», Tecnura, vol. 28, n.º 80, abr. 2024.

MLA

Poveda García, Diego Armando, et al. «Implementación del método de optimización de máquinas de soporte vectorial en R». Tecnura, vol. 28, n.º 80, abril de 2024, doi:10.14483/22487638.20326.

Turabian

Poveda García, Diego Armando, Martha Elva Ramírez Guzmán, Yolanda Margarita Fernandez-Ordoñez, y Erwin Fabián García López. «Implementación del método de optimización de máquinas de soporte vectorial en R». Tecnura 28, no. 80 (abril 1, 2024). Accedido abril 28, 2025. https://revistas.udistrital.edu.co/index.php/Tecnura/article/view/20326.

Vancouver

1.

Poveda García DA, Ramírez Guzmán ME, Fernandez-Ordoñez YM, García López EF. Implementación del método de optimización de máquinas de soporte vectorial en R. Tecnura [Internet]. 1 de abril de 2024 [citado 28 de abril de 2025];28(80). Disponible en: https://revistas.udistrital.edu.co/index.php/Tecnura/article/view/20326

DOI:

Publicado:

Número:

Sección:

Implementación del método de optimización de máquinas de soporte vectorial en R

Implementation of the Support Vector Machine Optimization Method in R

Autores/as

Palabras clave:

Palabras clave:

Descargas

Resumen (es)

Resumen (en)

Biografía del autor/a

Diego Armando Poveda García, Universidad Nacional de Colombia

Martha Elva Ramírez Guzmán , Colegio de Postgraduados

Yolanda Margarita Fernandez-Ordoñez, Colegio de Postgraduados

Erwin Fabián García López, Universidad Nacional de Colombia

Referencias

Cómo citar

APA

ACM

ACS

ABNT

Chicago

Harvard

IEEE

MLA

Turabian

Vancouver

Descargar cita

Visitas

Dimensions

PlumX

Descargas

Licencia

copyright

botones

bloque_informacion

Idioma

Palabras clave

Normatividad académica