
DOI:
https://doi.org/10.14483/22487638.20326Publicado:
01-04-2024Número:
Vol. 28 Núm. 80 (2024): Abril - JunioSección:
InvestigaciónImplementación del método de optimización de máquinas de soporte vectorial en R
Implementation of the Support Vector Machine Optimization Method in R
Palabras clave:
Support Vector Machine, Optimization, R, e1071 library, Supervised Learning (en).Palabras clave:
máquina de soporte vectorial, optimización, R, librería e1070, aprendizaje supervisado (es).Descargas
Resumen (es)
Contexto: La optimización de máquinas de soporte vectorial (SVM, por su sigla en inglés) ha sido un tema recurrente en diversos foros y publicaciones relacionadas con la inteligencia artificial (IA) y el aprendizaje automático. A pesar de su relevancia, existe una notable ausencia de directrices claras para la selección y optimización de los hiperparámetros asociados a las distintas funciones kernel utilizadas en SVM, lo cual puede comprometer la eficacia de estas herramientas en tareas de clasificación y regresión.
Objetivo: Este estudio tiene como objetivo general presentar un método detallado y riguroso para la optimización de los hiperparámetros en SVM, mediante el uso de la librería e1071 en R. Se busca, así, proporcionar una guía clara para futuros investigadores y practicantes en el campo, que les permita implementar de manera efectiva SVM en
sus proyectos.
Metodología: Se emplearon las librerías e1071 y scales en R para estandarizar los datos y ajustar los modelos SVM con diferentes tipos de kernel (lineal, radial, sigmoide y polinomial). Se procedió a la optimización de hiperparámetros mediante la función “tune”, con análisis de conjuntos de entrenamiento y prueba para verificar la bondad de ajuste. Se utilizó una metodología detallada para seleccionar los hiperparámetros óptimos de cada kernel, a partir del estudio de la eficacia de la clasificación y la minimización del error.
Resultados: Los resultados destacan la correcta selección y optimización de los hiperparámetros en SVM, y demuestran mejoras significativas en la clasificación al aplicar el método propuesto. Se encontró que la elección de hiperparámetros óptimos varía considerablemente entre los diferentes tipos de kernel y que su adecuada optimización contribuye a la precisión del modelo.
Conclusiones: La implementación detallada y el ajuste de los hiperparámetros en SVM son cruciales para maximizar su desempeño. Este artículo proporciona un código optimizado y una metodología clara para su implementación
en R, lo cual facilita la tarea de investigadores y analistas en el campo del aprendizaje automático. Se enfatiza la necesidad de considerar la especificidad de cada conjunto de datos y la relevancia de la experiencia en la selección de hiperparámetros. También, se sugiere, para futuras investigaciones, explorar y expandir las fronteras de las SVM en la solución de problemas complejos de clasificación.
Resumen (en)
Context: The optimization of Support Vector Machines (SVM) has been a recurring theme in various forums and publications related to artificial intelligence and machine learning. Despite its relevance, there is a notable absence of clear guidelines for the selection and optimization of parameters associated with the different kernel functions used in SVMs, which can compromise the effectiveness of these tools in classification and regression tasks.
Objective: The overall objective of this study is to present a detailed and rigorous method for the optimization of parameters in SVMs, using the e1071 library in R for this purpose. Thus, it seeks to provide a clear guide for future researchers and practitioners in the field, enabling them to effectively implement SVMs in their projects.
Methodoly: The e1071 and scales libraries in R were used to standardize the data and adjust the SVM models with different types of kernels (linear, radial, sigmoid, and polynomial). Parameter optimization was carried out using the tune function, analyzing training and test sets to verify the goodness of fit. A detailed methodology was used to select the optimal parameters for each kernel, based on the analysis of classification efficacy and error minimization.
Results: The results highlight the importance of correct parameter selection and optimization in SVMs, showing significant improvements in classification when applying the proposed method. It was found that the choice of optimal parameters varies considerably among the different types of kernels, and their proper optimization contributes
to the precision of the model.
Conclusions: Detailed implementation and parameter adjustment in SVMs are crucial to maximizing their performance. This article contributes to the existing literature by providing optimized code and a clear methodology for
its implementation in R, facilitating the work of researchers and analysts in the field of machine learning. It emphasizes the need to consider the specificity of each data set and the relevance of experience in parameter selection, inviting future research to explore and expand the boundaries of SVMs in solving complex classification problems.
Referencias
Amat, J. (abril de 2017). Máquinas de vector soporte (support vector machines, SVMs). RPubs.com. https://rpubs.com/Joaquin_AR/267926
Ávila, P., González, J., Vargas, D. y Pérez, P. (2022). Predicción del rezago social en México: un enfoque de aprendizaje automático a partir de datos de unidades económicas. Agrociencias, 56(2), 248-263. https://doi.org/10.47163/agrociencia.v56i2.2768
Berrendero, J. (2016). Máquinas de vectores soporte con R. Rpubs.com. https://rpubs.com/joser/svm
Betancourt, G. (2005). Las máquinas de soporte vectorial (SMV). Scientia et Technica, 11(27), 67-72. https://dialnet.unirioja.es/descarga/articulo/4838384.pdf
Calvo, D. (3 de octubre de 2016). SVM-Máquinas de vectores de soporte en R. Diegocalvo.es. https://www.diegocalvo.es/svm-maquinas-de-vectores-de-soporte-en-r/
Campo, E. (2016). Introducción a las máquinas de vector soporte (SVM) en aprendizaje supervisado [Tesis de grado]. Universidad de Zaragoza. https://zaguan.unizar.es/record/59156/files/TAZ-TFG-2016-2057.pdf
Chih, C., Chih, L., Dimitriadou, E., Hornik, K., Leisch, F., Meyer, D. y Weingessel, A. (2021). Misc functions of the Department of Statistics, probability theory group (formerly: e1071), TU Wien. Cran.R-project.org. https://cran.r-project.org/web/packages/e1071/e1071.pdf
Cuenca, D. y León, D. (2019). Support vector machine. Rpubs.com. https://rpubs.com/Dario_BSC/SVM
Gil, C. (junio de 2018). Máquinas de vector soporte. Rpubs.com. https://rpubs.com/Cristina_Gil/SVM
Gomila, J. (2018). 24 - Support vector machines en RStudio [Archivo de video]. YouTube. https://youtu.be/_JdK4FMzd28
Méndez, H. (2003). Algunas propiedades del kernel empleado en máquinas de soporte vectorial para clasificación [Tesis de posgrado]. Centro de Investigación en Matemáticas A.C. https://cimat.repositorioinstitucional.mx/jspui/bitstream/1008/11/2/TE%20118.pdf
Paredes, D. (26 de 06 de 2020). Data Science con R. Análisis de datos y algoritmos de predicción con R. Bookdown.org. https://bookdown.org/dparedesi/data-science-con-r/
Rodríguez, E., Vinante, C. y Leal, M. (2009). Enfoque óptimo del método kernel cuadrados mínimos parciales. Saber, 21(2), 172-178. https://www.redalyc.org/pdf/4277/427739440010.pdf
Sosa, S. (23 de abril de 2021). Support vector machine. Rpubs.com. https://rpubs.com/sebas_Alf/759517
Tinoco, C. (2019). Laboratorio 9.6. Máquinas de vectores de soporte. Rpubs.com. https://rpubs.com/cesar_tinoco/511674
Vargas, M. (30 de abril de 2020). Máquinas de Soporte Vectorial (support vector machine, SVM) en regresión. Rpubs.com. https://rpubs.com/movo/607465
Cómo citar
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Descargar cita
Licencia
Derechos de autor 2025 Diego Armando Poveda García, Martha Elva Ramírez Guzmán , Yolanda Margarita Fernandez-Ordoñez, Erwin Fabián García López

Esta obra está bajo una licencia internacional Creative Commons Atribución-CompartirIgual 4.0.
Esta licencia permite a otros remezclar, adaptar y desarrollar su trabajo incluso con fines comerciales, siempre que le den crédito y concedan licencias para sus nuevas creaciones bajo los mismos términos. Esta licencia a menudo se compara con las licencias de software libre y de código abierto “copyleft”. Todos los trabajos nuevos basados en el tuyo tendrán la misma licencia, por lo que cualquier derivado también permitirá el uso comercial. Esta es la licencia utilizada por Wikipedia y se recomienda para materiales que se beneficiarían al incorporar contenido de Wikipedia y proyectos con licencias similares.