ARQUITECTURA BASADA EN SERVICIOS PARA LA INTEGRACIÓN DE BASES DE DATOS ESPACIALES

Architecture based services for the integration spatial database

Janneth Pardo Pinzón 1* & Rubby Stella Pardo Pinzón 1**
1Universidad Distrital Francisco José de Caldas, Facultad del Medio Ambiente y Recursos Naturales.
Correspondencia: *jpardop@udistrital.edu.co **rspardop@udistrital.edu.co.


RESUMEN

Un elemento efectivo para la planeación y toma de decisiones a nivel organizacional es la información geoespacial, que día a día se ha ido incorporando en cada uno de los procesos al interior de las organizaciones. Por lo tanto, existe la creciente necesidad de compartir repositorios de datos espaciales para el manejo eficientemente de los recursos y el adecuado engranaje institucional.

Básicamente, la manipulación, organización y análisis de los datos espaciales que realizan en las diferentes dependencias de las organizaciones, se hace mediante un Sistema de Información  Geográfica (SIG). El problema radica tanto en la proliferación de las bases de datos espaciales heterogéneas, como en la creciente necesidad de  minimizar esfuerzos y crear nuevos desarrollos tecnológicos que faciliten el acceso a los recursos.

Existen  hoy en día diversos contextos y sistemas de aplicación que se han desarrollado orientados en superar la complejidad y la inflexibilidad de los sistemas locales. En este orden de ideas, y como un aporte a la solución del problema de interoperabilidad entre bases de datos espaciales heterogéneas, en el presente documento se proponer una arquitectura basada en servicios para la integración de repositorios de bases de datos espaciales, usando para ello la  Arquitectura Orientada a Servicios SOA, que permita a los usuarios utilizar una interfaz estándar para la consulta de los recursos espaciales.

Palabras clave: Arquitectura  Orientada a Servicios (SOA), bases de datos espaciales, integración de aplicaciones, Sistemas de Información Geográfica (SIG).


ABSTRACT

Geospatial Information is an effective element for planning and decision making at the organizational level, particularly because it is incorporated in each of the processes within an organization on a daily basis. Therefore, there is a growing need to share spatial data repositories for efficient management of resources and appropriate institutional machinery.

Basically, manipulation, organization and analysis of spatial data held in the various departments of an organization require a Geographic Information System (GIS). The problem lies in three main aspects, namely the proliferation of heterogeneous spatial databases, the growing need to minimize efforts, and the creation of new technological developments that facilitate access to resources.

Although there is a variety of contexts and application systems that have been developed aiming at overcoming the complexity and inflexibility of local systems, there is still a need for a seamless integration system that allows data complex-access.

In this paper, a service-based architecture for integrating repositories of spatial data bases is proposed. In this architecture, the use of the Service Oriented Architecture SOA is analyzed, specifically with regard to the construction of a middleware that allows customers to use a standard interface to query space resources.

Keywords: Service Oriented Architecture (SOA), spatial databases, application integration, Geographic Information Systems (SIG).


INTRODUCCIÓN

Las organizaciones invierten grandes cantidades de dinero en la adquisición de aplicaciones que les permita el manejo de la lógica de sus negocios, así como superar el reto de la interoperabilidad entre los diferentes sistemas de información que poseen (Ross et al. 2006). Gran parte de la información que se maneja con los SIG se trabaja por hilos de información o por una gran diversidad de proyecto que no están interconectados y que hacen difícil aprovechar los procesos dinámicos del negocio.

Las compañías privadas así como las entidades gubernamentales demandan continuamente proyectos relacionados con una localización inteligente, es decir, demandan la integración de los datos espaciales con la inteligencia de negocios. Frente a esta problemática se han diseñado diversas estrategias que permiten correlacionar los modelos organizacionales y proveer soluciones estándar, como el desarrollo de plataformas empresariales y nuevas aplicaciones que permitan compartir servicios entre diferentes sistemas o aplicaciones, algunas de estas estrategias son la Arquitectura Orientada a Servicios (SOA) y todo lo relacionado con los servicios Web.

SOA se ha convertido en una corriente importante para la ingeniería de software y para las redes de nueva generación,            gracias a que mediante interfaces bien definidas entre los módulos de las aplicaciones permite el intercambio de datos, la reutilización de funcionalidades (Xiaofeng et al. 2007; Walend, 2006) y el proceso de hacer más escalables y extensibles cada uno de los sistemas que hacen parte de las organizaciones. Los SIG se encasillan dentro de esos sistemas porque utilizan la arquitectura  SOA para el intercambio de información geográfica dando origen a la nueva era de los sistemas de gestión basados en servicios de geoinformación.

El artículo está dividido en tres secciones: la primera presenta una breve reseña de los conceptos básicos relacionados con algunas tecnologías que se han diseñado para el proceso de intercambio de información así como una reseña de la importancia de los SIG  y de los repositorios de bases de datos espaciales, la segunda presenta la arquitectura   propuesta como método de integración de las bases de datos espaciales y finalmente se cierra con algunas conclusiones.


ANTECEDENTES

En el marco de lo que se refiere tanto a la planificación urbana y rural, así como la planificación de los diversos proyectos corporativos, es necesario resaltar el acceso a los sistemas de gestión basados en los servicios SIG, así como el extraordinario desarrollo de las diferentes plataformas para los procesos de interoperabilidad de información, específicamente lo relacionado con la información espacial.

Si bien, las herramientas desarrolladas son realmente robustas es claro que en la mayoría de las organizaciones las aplicaciones trabajan de manera autónoma y desacoplada (Curl et al. 2009) no existe una interconexión entre los sistemas porque no se han desarrollado arquitecturas de software que permitan la orquestación entre funcionalidades y entre los procesos de cada uno de los aplicativos.

La carencia de una estructura de interoperabilidad se fundamenta en que cada una de las dependencias al interior de las organizaciones automatiza separadamente sus requerimientos sin tener en cuenta los mecanismos de accesibilidad que se deben generar tanto para los nuevos desarrollos como para los demás sistemas existentes (Len-Bass et al. 1998, Rim et al. 2009).

En este sentido, son varias las organizaciones que han intentado desarrollar  soluciones integradas para compartir la información haciendo así frente a los desafíos actuales y mejorando sus procesos y servicios.

Algunas de las técnicas adoptadas para la integración de datos espaciales son las relacionadas con los datawarehouse (Pascuale 2008), sistema mediante el cual se construye una bodega de datos central en donde se almacena la información de los diversos repositorios de datos, y así generar un único mecanismo de consulta con información debidamente actualizada. El problema consiste  en diseñar  una base de datos con un esquema global que sería la solución para un conjunto de aplicaciones.

Otro mecanismo consiste en utilizar los estándares abiertos propuestos por la OGC para el dominio de datos espaciales; además se ha propuesto el desarrollo de una arquitectura basada en wrapper para acceso directo a los servicios y una arquitectura cliente/servidor, en donde haya una entidad que exponga los servicios y otra que esté interesada en consumirlos. Sin embargo, las tecnologías antes mencionadas carecen de robustez y flexibilidad para el descubrimiento de servicios. El objetivo es seleccionar una arquitectura que permita manejar los sistemas de forma desacoplada, de manera que se pueda diseñar un proceso de consulta de la información más complejo.


MARCO CONCEPTUAL PARA LA IMPLEMENTACIÓN DE LA ARQUITECTURA ORIENTADA A SERVICIOS (SOA) Y LOS SISTEMAS DE INFORMACIÓN GEOGRÁFICA (SIG)

Arquitectura integración de Aplicaciones Empresariales (EAI)

A nivel organizacional uno de los retos es la llamada integración de aplicaciones para resolver el problema de intercambio de información,  cada vez  es más necesario proporcionar un marco que sirva de puente entre las diversas bases de datos y los programas de aplicación que se encuentran dispersos en casi todas las empresas. De manera, que fluya con mayor facilidad la transferencia de archivos entre las dependencias, se logre una transparencia en los datos intercambiados y se fortalezca la integración en las consultas una vez que los datos han sido debidamente compartidos (Land et al. 2009). Sin embargo, la mayoría de las organizaciones no cuentan con tecnologías que se adapten a esos cambios, pero la solución  no es atiborrarse de software o de hardware para  lograr  alcanzar  la  competitividad deseada, por el contrario la solución requiere de una planeación estratégica que sea la base para la implementación de iniciativas. (Finkelstein 2006, Lynn et al. 2008)

La planeación estratégica        requiere entonces un conjunto de técnicas y de diagramas que describan perfectamente la lógica del negocio y permitan realizar a partir de ellas un modelo corporativo integrado. La arquitectura diseñada no sólo debe mostrar todas las conexiones posibles  y flujo de datos entre los sistemas (Mecella 2000), sino que además debe ser flexible y de fácil ensamblaje, que pueda adaptarse a las nuevas estrategias del negocio y asegure la conexión, acoplamiento y la reutilización entre los sistemas existentes (Land et al. 2009).
 
Pero, para identificar apropiadamente el tipo de conexiones y desarrollar un esquema que exprese la orquestación empresarial adecuada se deben definir claramente los objetivos empresariales, tratar de maximizar la reusabilidad (De María, 2002) y la interoperabilidad y pensar en adaptarse a soluciones comerciales y no a soluciones propias (Land et al. 2009) para esto, se  puede iniciar aplicando el  framework de Zachman (Vargas 2003), que es una herramienta básica para recopilar la información, datos, objetivos,  recursos  y determinar  el  traslapo  funcional y el potencial reúso (Finkelstein 2006, Lynn et al. 2008).

Arquitectura Orienta a Servicios SOA

Una  forma de integración de los sistemas de información que ha ganado suficiente importancia en los últimos años es la Arquitectura Orientada a Servicios (SOA), y que puede ser definida como una arquitectura de integración  basada en el concepto de servicios, sin embargo, no existe un criterio estándar para definirla sino que se puede interpretar como una estructura flexible diseñada para envolver el problema de la interoperabilidad entre sistemas (Jeng et al. 2007), este esquema no solo permite el acoplamiento entre los módulos de los diferentes servicios sino promueve la reutilización de funcionalidades distribuidas optimizando con ello el flujo de la información.

La interoperabilidad entre sistemas se logra cuando se establece una relación entre sus componentes (Len-Bass et al. 1998), básicamente utilizando interfaces flexibles que permitan compartir recursos (Maozhen et al. 2000); lo que se constituye en una poderosa herramienta para coordinar una red de servicios en este caso concreto lo relacionado con los SIG, de esta manera obtener una adecuada elasticidad en el flujo de la información dentro de la dinámica organizacional.

Los servicios web se constituyen en la forma más utilizada para lograr la implementación de SOA y utiliza esquemas XML para representar los datos (estándar recomendado por W3C (W3C 2001); otras formas de implementación son WSDL (Web Services Description Language) para describir las interfaces, SOAP (Simple Object Access Protocol) para generar intercambio de datosy ESB (Bus de Servicios Empresariales) para generar interoperabilidad mediante mensajería (Xiaofeng et al. 2007, Thiran et al. 2001).

Sistemas de Información Geográfica SIG

Los SIG se han posicionado como una de las tecnologías más importantes para capturar, almacenar, manipular, clasificar, analizar y representar los datos que tienen un componente espacial. Cabe resaltar que los SIG no son programas para producir cartografía, sino que gracias a su capacidad para de manejo de los datos se convierten en una poderosa herramienta  para la planificación, gestión y la toma de decisiones.

Un SIG permite modelar la realidad de un territorio en el ordenador bajo ciertos criterios previamente seleccionados, el usuario recoge una información parcial de los aspectos que resultan de su interés y el sistema le permite almacenar esa información a modo de capas o layers. Sin embargo, la organización de las capas se debe hacer de manera inteligente, es decir que cada una de ellas debe representar un aspecto. Por lo tanto, esa diseminación de la realidad implica relaciones y combinaciones con multivariada información.

Esa representación del territorio en multicapas de información conlleva a definir los modelos de datos de los  SIG, entre ellos es necesario resaltar los que a continuación se describen.

El modelo vectorial que utiliza para la representación de los elementos espaciales figuras geométricas convencionales como el punto, la línea y los polígonos, por supuesto una vez establecido un previo diseño lógico de mapas.

El modelo raster se caracteriza porque adopta una unidad estándar para la representación de las entidades del mundo real, en este modelo se concibe el territorio como si fuera cubierto por una malla regular de celdas o teselas, cada celda también denominada pixel que hace referencia a una unidad de información y que dependiendo de los intereses del usuario el tamaño del pixel puede cambiar en cada tipo de estudio.

Otra forma avanzada de representar la realidad es la que ofrece el modelo de datos orientado a objetos (MDOO), en donde cada objeto de la realidad se refiere a una entidad real para la cual se definen una figura geométrica, unos atributos y una forma de comportamiento que puede presentar una abanico de posibilidades. Por lo tanto, es necesario catalogar cada objeto en unas clases y subclases que permitan definir su comportamiento, este comportamiento representa las operaciones que puede realizar el objeto; lo robusto en este tipo de modelos es que cada objeto puede ser definido una sola vez pero puede ser instanciado varias veces dentro del mismo proyecto o por proyecto independientes.

De esta manera se puede afirmar, que los datos geoespaciales son inmensamente heterogéneos y comienzan a estar disponibles en múltiples formatos, tales como estructuras raster, vector o bases de datos relacionales entre otros, y además, son almacenados en diferentes  formas, Actualmente los estándares para el manejo de los datos SIG están siendo desarrollados por la OGC, la cual propone el uso de esta información mediante la construcción de bloques de sistemas basados en servicios.


REQUERIMIENTOS PARA EL MANEJO DE LOS GEODATOS EN LA PLATAFORMA DE INTERCAMBIO

La integración de los SIG con otros sistemas del negocio pueden aumentar la eficiencia y la productividad organizacional, para lo cual, es necesario construir plataformas de intercambio de información o arquitecturas similares como SOA espacial, de manera que los contenidos de la plataforma contengan datos geográficos, imágenes satelitales, ortofotografías, bases de datos espaciales y demás atributos especiales espaciales que estén directamente relacionados con los formatos del negocio.

Una de las primeras fases para el diseño de la plataforma de intercambio consiste en identificar y clasificar adecuadamente los tipos de datos que harán parte del sistema de intercambio, y básicamente se pueden definir tres categorías:

  1. Datos acceso común: lo conforman los datos que no requieren confidencialidad al interior de la organización, son recursos comunes que pueden ser fácilmente consultados y, a nivel de los datos espaciales se trata de las consultas a las dos estructuras básicas de los SIG,  los datos raster y los datos vectoriales, estos datos pueden ser descargados o consultados por los usuarios de cada una de las dependencias de la organización, o pueden ser consultados por  cualquier entidad que solicite acceso al servicio.

 

  1. Datos Intercambiables: incluye los datos que pueden ser compartidos por algunas dependencias o entre diversas entidades, y la forma de acceso a la información así como su distribución se realiza mediante una estructura estándar de datos que gestione la solicitud e identifique los datos que pueden ser compartidos.
  1. Datos no Intercambiables: hace referencia a los datos que no pueden ser compartidos por todas las dependencias o por todos los usuarios, por efecto de confidencialidad. Para lo cual se genera un esquema jerárquico de roles y permisos de los clientes que hacen parte del sistema.

 

Con las categorías de datos anteriormente descritas se pueden componer diversos tipos de consultas, análisis y simulaciones que aportan sustancialmente a los procesos del negocio en cada una de las dependencias; para lo cual, los datos que se requieran deben estar correlacionados espacialmente, es decir, estar bajo el mismo sistema de coordenadas, ajustarse a las relaciones topológicas y garantizar que cada elemento espacial posea un clave que le permita identificarse y asociarse a la demás información atributiva.

Los datos debidamente categorizados podrán ser intercambiados a través de una interfaz de usuario unificada y el acceso a cada uno de ellos dependerá si el dato presenta una clave pública o privada para el proceso de intercambio. El sistema de intercambio permitirá mapear las fuentes de datos inscritas de manera que se puedan registrar los datos así como sus estructuras   para poderlas clasificar dentro de las categorías anteriormente expuestas.


PROTOTIPO DE LA ARQUITECTURA BASADA EN SERVICIOS PARA LA INTEGRACION DE LAS BASES DE DATOS ESPACIALES

A fin de contribuir con el enfoque de interacción entre sistemas se propone el modelo arquitectónico que se esquematiza en la figura 2 donde se muestran las diferentes capas o niveles de información y los componentes de las mismas.

La propuesta es una arquitectura multicapa en donde los usuarios que requieren el acceso a los servicios deben estar registrados de forma jerárquica, de manera que se establezca un rol de autorizaciones para el acceso a los datos y para poder compartir la configuración dinámica de los servicios; el usuario debe estar relacionado con alguna dependencia que haga parte de la organización y que esté inscrita al sistema de intercambio.


Figura  2. Arquitectura para la Integración de Bases de Datos espaciales.

La capa de aplicación: a esta capa se  pueden conectar una serie de sistemas y aplicaciones que son completamente independientes una de la otra pero que satisfacen los requerimientos de las organizaciones y dependencias a las cuales pertenecen y que hacen parte del sistema de intercambio; la conexión se realiza teniendo como base los servicios web proporcionados por la capa de servicios. Los usuarios se comunican a través de la interfaz de la plataforma de integración para enviar o recibir servicios.

La capa de Servicios: esta capa contiene diferentes tipos de servicios de información geográfica relacionados con los procesos de acceso, consulta y análisis de la información espacial, que se ejecutan independientes de los procesos del negocio pero que están directamente relacionados con ellos. Se incluyen funcionalidades básicas de consulta, registros y solicitudes pero también provee servicios más complejos relacionados con el análisis de la información.

La capa de acceso a Datos: los recursos de los servicios pueden estar distribuidos en cualquier dependencia de la organización y pueden ser repositorios de datos que contengan datos básicos, datos transversales a toda la organización o datos no compartidos, ya sean de tipo espacial o no espacial; sin embargo, se presentan  al usuario como un repositorio centralizado.


CONCLUSIONES

Este artículo presenta un prototipo de integración de información geoespacial mediante SOA, que pretende a través del sistema  las aplicaciones dentro de las organizaciones lograr una integración exitosa entre bases de datos heterogéneas.

El artículo mostró algunos mecanismos que se han desarrollado para generar interoperabilidad entre sistemas de información de datos espaciales, pensado en el acceso a nuevos desarrollos. Los dispositivos propuestos deben ser creados forma independiente y deben tener en cuenta una serie de criterios y esquemas. Sin embargo, no se vislumbra una arquitectura que soporte todas las necesidades de conexión y de consulta de forma integral, sino que se pueden reconocer algunas limitaciones como que la mayoría de las estructuras propuestas generan una transformación punto a punto entre los sistemas que necesitan interactuar, pero no se propone una solución cuando se requiere un mayor número de sistemas a interoperar.


BIBLIOGRAFÍA

Curl, A. & J. K. Fertal. 2009. A review of enterprise IT integration methods. Paper presented at the Information Technology Interfaces, 2009. ITI´09. Proceedings of the ITI 2009 31 st International Conference on. p. 107 – 112.

De María J. A. 2002. "Integración de Aplicaciones encapsuladas  para el desarrollo de Sistemas de Información Cooperativos. Instituto de Computación – Facultad de Ingeniería Universidad de la República. Montevideo, Uruguay 146 p.

Finkelstein, C. 2006.  Enterprise Architecture for Integration: Rapid Delivery Method and Technologies. Artech House. Boston, London.

Jeng, J.J., & A. Lianjun. 2007. System Dynamics Modeling for SOA Project Management. Paper presented at the Service Oriented Computing and Applications. SOCA ´07.IEEE International Conference on. p. 286 – 284

Len-Bass, P.,  P. Clements & R. Kazman. 1998. Software Architecture in Practice, SEI Series in Software Enginering. Addison Wesley.

Maozhen, L., O. F. Rana & Walker, D.W. 2000. An XML-Based component model for wrapping legacy codesas Java/CORBA components. Paper presented at the High Performance Computing in the Asia-Pacific Region. Proceedings. The Fourth International Conference/Exhibition on. p. 507 – 512.

Mueller, L., M. Magee, P. Marounek & A. Phillipson. 2008. IBM IT Governance Approach:Business Performance through IT Execution. IBM International Technical Support  Organization. Redbooks. ibm.com/redbooks.

Mecella,M., & Batini, C. 2000.Cooperation of Heterogeneus Legacy Information Systems: A Methodological Framework. Paper presented at the Enterprise Distributed Object Computing Conference, 2000. EDOC 2000. Proceedings. Fourth International. p. 216 – 225.

Land, M., J. Waage,  E. Proper &  C. Steghuis. 2009. Enterprise Architecture. Creating Value by Informed Governance.  Springer. 146 p.

Pascuale, C.C., B. Lonescu, D. Lonescu,  V. di Lecce & A. Gurerero. 2008. Virtual Data Warehouse architecture for real-time Web GIS. Paper presented at the Virtual Environments Human-Computer Interfaces and Measurement Systems. VECIMNS 2008. IEEE Conference on.

Rim, H., Y. Hyunsang & L. Eunseok. 2009. Service  oriented architecture implementation model for enterprise collaboration. Paper presented at the Communications and Information Technology. ISCIT 2009. 9thInternational Symposium on.

Ross  J., P. Weill & D. Robertson. 2006. Enterprise Architecture as Strategy: creating a foundation for business execution. Harvard Business School Press. 234 p.

Thiran, P. & J. L. Hainaut. 2001. Wrapper Development for Legacy Data Reuse. Paper presented at the Reverse Engineering. Proceedings. Eighth Working Conference on. p. 198 – 207.

Vargas, M. 2003. Zachman framework in teaching information systems. Paper presented at the Information Technology Interfaces. ITI 2003. Proceeding of the 25th International Conference on.

Walend, D. 2006. Understanding service orientedarchitecture. Developer Network. Copyright O´Reilly Media. Version en linea: (http://dev.aol.com/understanding_soa). Fecha de consulta: 01-2011

W3C. World Wide Web Consortium. XML Technology. Version en linea: (http://www.w3.org/standards/xml/core). Fecha de consulta: 01-2011

Xiaofeng, W., S. X. K. Hu, E. Haq & H. Garton. 2007. Integrating Legacy Systems within the Service-oriented Architecture. 1 – 7. Paper presented at the Power Engineering Society General Meeting. IEEE.