


Vol. 29 Núm. 2 (2024): Mayo-agosto


Ingeniería Civil

Community-Based Early Warning System Model for Stream Overflow In Barranquilla

Modelo de sistema de alerta temprana para desbordamiento de arroyos en barranquilla basado en la comunidad


Palabras clave:

stream overflow, social network, machine learning, natural language processing (en).

Palabras clave:

arroyos, redes sociales, aprendizaje automático, procesamiento de lenguaje natural (es).

Resumen (en)

Context: This work aims to design and create a community-based early warning model as an alternative for the mitigation of disasters caused by stream overflow in Barranquilla (Colombia). This model is based on contributions from social networks, which are consulted through their API and filtered according to their location.

Methods: With the information collected, cleaning and debugging are performed. Then, through natural language processing techniques, the texts are tokenized and vectorized, aiming to find the vector similarity between the processed texts and thus generating a classification.

Results: The texts classified as dealing with stream overflow are processed again to obtain a location or assign a default one, in order to for them to be georeferenced in a map that allows associating the risk zone and visualizing it in a web application to monitor and reduce the potential damage to the population.

Conclusions:  Three classification algorithms were selected (random forest, extra trees, and k-neighbors) to determine the best classifier. These three algorithms exhibited the best performance and R2 regarding the data processed in the regressions. These algorithms were trained, with the k-neighbor algorithm exhibiting the best performance.


Resumen (es)

Contexto: Este trabajo tiene como objetivo diseñar y crear un modelo de alerta temprana basado en la comunidad como alternativa para la mitigación de desastres causados por el desbordamiento de arroyos en Barranquilla (Colombia). Este modelo se basa en contribuciones de redes sociales, que se consultan a través de su API y se filtran según su ubicación.

Métodos: Con la información recogida, se realiza una limpieza y depuración. Luego, mediante técnicas de procesamiento de lenguaje natural, los textos se tokenizan y vectorizan, buscando encontrar la similitud vectorial entre los textos procesados y así generar una clasificación.

Resultados: Los textos clasificados como relacionados con el desbordamiento de arroyos se procesan nuevamente para obtener una ubicación o asignar una por defecto, con el fin de georreferenciarlos en un mapa que permita asociar la zona de riesgo y visualizarla en una aplicación web, en aras de monitorear y reducir el daño potencial a la población.

Conclusiones: Se seleccionaron tres algoritmos de clasificación (bosque aleatorio, árboles extra y k-vecinos) para determinar el mejor clasificador. Estos tres algoritmos mostraron el mejor rendimiento y R2 con respecto a los datos procesados en las regresiones. Estos algoritmos fueron entrenados, y se encontró que el algoritmo k-vecinos tuvo el mejor rendimiento.

Biografía del autor/a

Iván Andrés Felipe Serna-Galeano, Universidad Distrital Francisco José de Caldas

Cadastral and Geodetic Engineer from  Universidad Distrital Francisco José de Caldas and Master 's  student in information and communications sciences from  Faculty of Engineering at Universidad Distrital Francisco José de Caldas in Bogotá, Colombia. 

Ernesto Gómez-Vargas, Universidad Distrital Francisco José de Caldas

Full professor at the Department of Engineering of Universidad Distrital Francisco José de Caldas in Bogotá, Colombia

Julián Rolando Camargo-López , Universidad Distrital Francisco José de Caldas

Full professor at the Department of Engineering of Universidad Distrital Francisco José de Caldas in Bogotá,


