Normalización en desempeño de k-means sobre datos climáticos

Juan Sebastián  Ramírez Gómez; Néstor Dario Duque Méndez; Jorge Julián  Vélez Upegui

doi:10.14483/2322939X.15550

Autores/as

Juan Sebastián Ramírez Gómez Universidad Nacional de Colombia, Sede Manizales https://orcid.org/0000-0001-8876-5371
Néstor Dario Duque Méndez Universidad Nacional de Colombia, Sede Manizales https://orcid.org/0000-0002-4608-281X
Jorge Julián Vélez Upegui Universidad Nacional de Colombia, Sede Manizales https://orcid.org/0000-0003-3856-1105

Palabras clave:

clustering, K-Means, machine learning, normalization, short-time Fourier transform (en).

Palabras clave:

clustering, K-Means, machine learning, normalización, transformada de Fourier a corto plazo (es).

Descargas

PDF

Resumen Métricas disponibles Referencias Cómo citar

Resumen (es)

El análisis de clúster sobre datos climatológicos es usado en diversas investigaciones dado que permite obtener resultados interesantes para cada enfoque propuesto. Por tanto, en este trabajo se presenta la evaluación de desempeño del algoritmo de agrupamiento K-Means a partir del uso de normalización aplicada a un conjunto de datos con cuatro variables climatológicas (temperatura, precipitación, humedad relativa y radiación solar) para una estación ubicada en la ciudad de Manizales, Colombia. Esto con el fin de determinar el efecto de aplicar, o no, la normalización en la calidad de los clústeres y evaluar el costo computacional del algoritmo según las características establecidas. Para ello se definen seis escenarios de ejecución para 2, 3 y 5 clústeres con diferente cantidad y agrupación de variables utilizando distancia euclidiana como medida de alejamiento, Davies-Bouldin como método evaluación de calidad de los clústeres y la aplicación de normalización con Z-transformation y Range transformation. Se concluye que, a través de una comparación con k-medoides y aplicación STFT (Transformada de Fourier de Tiempo Reducido), la normalización mejora los resultados y con Z-transformation se obtienen los mejores desempeños de agrupamiento según el índice de Davis-Bouldin.

Resumen (en)

Cluster analysis of climatological data is used in various investigations as it allows interesting results to be obtained for each proposed approach. Therefore, this paper presents the performance evaluation of the K-Means clustering algorithm from the use of standardization applied to a data set with four climatological variables (temperature, precipitation, relative humidity and solar radiation) for a station located in the city of Manizales, Colombia. This in order to determine the effect of applying, or not, the normalization in the quality of the clusters and to evaluate the computational cost of the algorithm according to the established characteristics. For this purpose, six execution scenarios are defined for 2, 3 and 5 clusters with differentquantity and grouping of variables using Euclidean distance as a distance measure, Davies-Bouldin as a quality evaluation method of the clusters and the application of normalization with Z-transformation and Range transformation. It is concluded that, through a comparison with k-medoides and STFT application (Fourier Transform of Reduced Time), the normalization improves the results and with Z-transformation the best grouping performances are obtained according to the Davis-Bouldin index.

Referencias

[1] Á . Arroyo, Á. Herrero, V. Tricio y E. Corchado, “Analysis of meteorological conditions in Spain by means of clustering techniques,” J. Appl. Log., vol. 24, pp. 76–89, 2017. https://doi.org/10.1016/j.jal.2016.11.026

[2] M. A. Asadi Zarch, B. Sivakumar y A. Sharma, “Assessment of global aridity change,” J. Hydrol., vol. 520, pp. 300–313, 2015. https://doi.org/10.1016/j.jhydrol.2014.11.033

[3] M. Bador, P. Naveau, E. Gilleland, M. Castellà y T. Arivelo, “Spatial clustering of summer temperature maxima from the CNRM-CM5 climate model ensembles & E-OBS over Europe,” Weather Clim. Extrem., vol. 9, pp. 17–24, 2015. https://doi.org/10.1016/j.wace.2015.05.003

[4] L . Carro-Calvo, C. Ordóñez, R. García-Herrera y J. L. Schnell, “Spatial clustering and meteorological drivers of summer ozone in Europe,” Atmos. Environ., vol. 167, pp. 496–510, 2017. https://doi.org/10.1016/j.atmosenv.2017.08.050

[5] M. J. Carvalho, P. Melo-Gonçalves, J. C. Teixeira y A. Rocha, “Regionalization of Europe based on a K-Means Cluster Analysis of the climate change of temperatures and precipitation,” Phys. Chem. Earth, vol. 94, pp. 22–28, 2016. https://doi.org/10.1016/j.pce.2016.05.001

[6] M. I. Chidean, A. J. Caamaño, J. Ramiro-Bargueño, C. Casanova-Mateo y S. Salcedo-Sanz, “Spatio-temporal analysis of wind resource in the Iberian Peninsula with data-coupled
clustering,” Renew. Sustain. Energy Rev., vol. 81, June, pp. 2684–2694, 2018. https://doi.org/10.1016/j.rser.2017.06.075

[7] M. I. Chidean, J. Muñoz-Bulnes, J. Ramiro-Bargueño, A. J. Caamaño y S. Salcedo-Sanz, “Spatio- temporal trend analysis of air temperature in Europe and Western Asia using data-coupled clustering,” Glob. Planet. Change, vol. 129, pp. 45–55, 2015. https://doi.org/10.1016/j.gloplacha.2015.03.006

[8] R. Falquina y C. Gallardo, “Development and application of a technique for projecting novel and disappearing climates using cluster analysis,” Atmos. Res., vol. 197, July, pp. 224–231, 2017. https://doi.org/10.1016/j.atmosres.2017.06.031

[9] M. Ghayekhloo, M. Ghofrani, M. B. Menhaj y R. Azimi, “A novel clustering approach for short-term solar radiation forecasting,” Sol. Energy, vol. 122, pp. 1371–1383, 2015. https://doi.org/10.1016/j.solener.2015.10.053

[10] S. Li, H. Ma, y W. Li, “Typical solar radiation year construction using k-Means clustering and discrete-time Markov chain,” Appl. Energy, vol. 205, May, pp. 720–731, 2017. https://doi.org/10.1016/j.apenergy.2017.08.067

[11] X. Wang et al., “A stepwise cluster analysis approach for downscaled climate projection - A Canadian case study,” Environ. Model. Softw., vol. 49, pp. 141–151, 2013.

[12] Y. Zheng et al., “Assessment of global aridity change,” Ecol. Indic., vol. 75, no. September 2016, pp. 151–165, 2016.

[13] Y. Zheng et al., “Vegetation response to climate conditions based on NDVI simulations using stepwise cluster analysis for the Three-River Headwaters region of China,” Ecol. Indic.,.
September 2016, pp. 0–1, 2017. https://doi.org/10.1016/j.ecolind.2017.06.040

[14] J. Parente, M. G. Pereira y M. Tonini, “Space-time clustering analysis of wildfires: The influence of dataset characteristics, fire prevention policy decisions, weather and climate,” Sci.
Total Environ., vol. 559, pp. 151–165, 2016. https://doi.org/10.1016/j.scitotenv.2016.03.129

[15] F. Mokdad y B. Haddad, “Improved infrared precipitation estimation approaches based on k-means clustering: Application to north Algeria using MSG-SEVIRI satellite data,” Adv. Sp.
Res., vol. 59, no. 12, pp. 2880–2900, 2017. https://doi.org/10.1016/j.asr.2017.03.027

[16] C. C. Aggarwal y C. K. Reddy, "DATA Custering Algorithms and Applications". CRC Press, 2013.

[17] T. T. Nguyen, A. Kawamura, T. N. Tong, N. Nakagawa, H. Amaguchi y R. Gilbuena, “Clustering spatio-seasonal hydrogeochemical data using self-organizing maps for groundwater quality assessment in the Red River Delta, Vietnam,” J. Hydrol., vol. 522, pp. 661–673, 2015. https://doi.org/10.1016/j.jhydrol.2015.01.023

[18] Y. Chen et al., “Air quality data clustering using EPLS method,” Inf. Fusion, vol. 36, pp. 225–232, 2017.

[19] A. Ruzmaikin y A. Guillaume, “Clustering of atmospheric data by the deterministic annealing,” J. Atmos. Solar-Terrestrial Phys., vol. 120, pp. 121–131, 2014. https://doi.org/10.1016/j.jastp.2014.09.009

[20] C. Li, L. Sun, J. Jia, Y. Cai y X. Wang, “Risk assessment of water pollution sources based on an integrated k-means clustering and set pair analysis method in the region of Shiyan,
China,” Sci. Total Environ., vol. 557–558, pp. 307–316, 2016. https://doi.org/10.1016/j.scitotenv.2016.03.069

[21] T. R. Sivaramakrishnan y S. Meganathan, “Point rainfall prediction using data mining technique,” Res. J. Appl. Sci. Eng. Technol., vol. 4, no. 13, pp. 1899–1902, 2012.

[22] C. Marzban y S. Sandgathe, “Cluster Analysis for Verification of Precipitation Fields,” Weather Forecast., vol. 21, no. 5, pp. 824–838, 2006. https://doi.org/10.1175/waf948.1

[23] H. Yahyaoui y H. S. Own, “Unsupervised clustering of service performance behaviors,” Inf. Sci. (Ny)., vol. 422, pp. 558–571, 2018. https://doi.org/10.1016/j.ins.2017.08.065

[24] G. Gan, C. Ma y J. Wu, "Data Clustering: Theory, Algorithms, and Applications". SIAM - Society for Industrial and Applied Mathematics. Philadelphia, Pennsylvania, 2007.

Cómo citar

IEEE

[1]

J. S. . Ramírez Gómez, N. D. Duque Méndez, y J. J. . Vélez Upegui, «Normalización en desempeño de k-means sobre datos climáticos», Rev. Vínculos, vol. 16, n.º 1, pp. 57–72, jun. 2019.

ACM

[1]

Ramírez Gómez , J.S. et al. 2019. Normalización en desempeño de k-means sobre datos climáticos. Revista Vínculos. 16, 1 (jun. 2019), 57–72. DOI:https://doi.org/10.14483/2322939X.15550.

ACS

(1)

Ramírez Gómez , J. S. .; Duque Méndez , N. D.; Vélez Upegui, J. J. . Normalización en desempeño de k-means sobre datos climáticos. Rev. Vínculos 2019, 16, 57-72.

APA

Ramírez Gómez , J. S. ., Duque Méndez , N. D., y Vélez Upegui, J. J. . (2019). Normalización en desempeño de k-means sobre datos climáticos. Revista Vínculos, 16(1), 57–72. https://doi.org/10.14483/2322939X.15550

ABNT

RAMÍREZ GÓMEZ , Juan Sebastián; DUQUE MÉNDEZ , Néstor Dario; VÉLEZ UPEGUI, Jorge Julián. Normalización en desempeño de k-means sobre datos climáticos. Revista Vínculos, [S. l.], v. 16, n. 1, p. 57–72, 2019. DOI: 10.14483/2322939X.15550. Disponível em: https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550. Acesso em: 21 feb. 2026.

Chicago

Ramírez Gómez , Juan Sebastián, Néstor Dario Duque Méndez, y Jorge Julián Vélez Upegui. 2019. «Normalización en desempeño de k-means sobre datos climáticos». Revista Vínculos 16 (1):57-72. https://doi.org/10.14483/2322939X.15550.

Harvard

Ramírez Gómez , J. S. ., Duque Méndez , N. D. y Vélez Upegui, J. J. . (2019) «Normalización en desempeño de k-means sobre datos climáticos», Revista Vínculos, 16(1), pp. 57–72. doi: 10.14483/2322939X.15550.

MLA

Ramírez Gómez , Juan Sebastián, et al. «Normalización en desempeño de k-means sobre datos climáticos». Revista Vínculos, vol. 16, n.º 1, junio de 2019, pp. 57-72, doi:10.14483/2322939X.15550.

Turabian

Ramírez Gómez , Juan Sebastián, Néstor Dario Duque Méndez, y Jorge Julián Vélez Upegui. «Normalización en desempeño de k-means sobre datos climáticos». Revista Vínculos 16, no. 1 (junio 12, 2019): 57–72. Accedido febrero 21, 2026. https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550.

Vancouver

1.

Ramírez Gómez JS, Duque Méndez ND, Vélez Upegui JJ. Normalización en desempeño de k-means sobre datos climáticos. Rev. Vínculos [Internet]. 12 de junio de 2019 [citado 21 de febrero de 2026];16(1):57-72. Disponible en: https://revistas.udistrital.edu.co/index.php/vinculos/article/view/15550

DOI:

Publicado:

Número:

Sección:

Normalización en desempeño de k-means sobre datos climáticos

Normalization in k-means performance on climate data

Autores/as

Palabras clave:

Palabras clave:

Descargas

Resumen (es)

Resumen (en)

Referencias

Cómo citar

IEEE

ACM

ACS

APA

ABNT

Chicago

Harvard

MLA

Turabian

Vancouver

Descargar cita

Visitas

Descargas

Licencia

Artículos más leídos del mismo autor/a

Idioma

botones

Número actual

Palabras clave

InformaciónUniversidad Distrital
Francisco José de Caldas
NIT. 899.999.230.7

Redes sociales

Normatividad general

Normatividad académica

Contáctenos