DOI:
https://doi.org/10.14483/23448393.1877Published:
2004-11-30Issue:
Vol. 10 No. 1 (2005): January - JuneSection:
Science, research, academia and developmentValidación de una Metodología de Clasificación de Imágenes Satelitales en un Entorno Orientado a Objetos
Evaluation Of An Object Oriented Image Classification Methodology In Satelite Images
Keywords:
Clasificación de Imágenes, Extracción de información temática, Orientación a objetos, Segmentación (es).Downloads
References
Juan Pablo Ardila y Oscar Javier Espejo, "Clasificación extracción de información temática en imágenes satelitales de zonas rurales mediante la validación y aplicación de una metodología orientada a objetos y clasificadores basados en lógica difusa", Tesis de Grado, Facultad de Ingeniería, Universidad Distrital Francisco José de Caldas, Bogota, Colombia, 2004.
John Jensen, Introductory digital image processing: a remote sensing perspective. Segunda Edición. Prentice Hall. New Jersey, 1996. pp 316.
Emilio Chuvieco, Fundamentos de teledetección espacial, Tercera Edición, Ediciones RIALP, Madrid, 1991. pp 568.
Nilda Sánchez, Panorama actual de las técnicas mixtas de clasificación de imágenes mediante segmentación espectral y por texturas. Aplicación a las imágenes de alta resolución espacial. 2003. Disponible en http://www.mappinginteractivo.com/plantilla-egeo.asp?id_articulo=288.
Chulhee Lee y David Landgrebe, Feature extraction and classification algorithms for high dimensional data, School of Electrical Engineering Purdue University. West Lafayete. 1993. pp 227.
Thomas Blaschke y Josef Strobl, What's wrong with pixels? Some recent developments interfacing remote sensing and GIS. GeoBIT/GIS, vol. 6. 2001. pp 6.
Thomas Blaschke y Charles Burnett, A multi-scale segmentation/object relationship modelling methodology for landscape análisis, 2003 Disponible en: www.geo.sbg.ac.at/larg/099_full.pdf. pp 17.
Thomas Blaschke, Stefan Lang, Eric Lorup, Josef Strobl y Peter Zeil, Object-oriented image processing in an integrated gis/ remote sensing environment and perspectives for environmental applications. environmental Information for Planning, Politics and the Public. Metropolis Verlag, Vol 2. Marburg: 2001. pp 16.
Ray Forman, Land mosaics: the ecology of landscapes and regions. Cambridge University Press, Cambridge, 1995. pp 400.
John Cushnie, The interactive effect of spatial resolution and degree of internal variability within land-cover types on classification accuracies. International Journal of Remote Sensing, 1985, pp 155.
Day R.H, Psicología de la Percepción Humana. Ed. Limusa Wiley, México D. F., 1973. pp 227.
John Gauch, Robin Horne y Stephen Sangwine, The colour image processing handbook. Chapman & Hall. Londres: 1998. pp 440.
Thomas Blaschke, Manuel Conradi y Stefan Lang, Multi-scale image analysis for ecological monitoring of heterogeneous, small structured landscapes. Proceedings of SPIE, Toulouse. 2001. pp 10.
Martin Baatz, Ursula Benz, Seyed Dehghani, Markus Heynen, Astrid Höltje, Peter Hofmmann, Iris Lingenfelder, Matthias Mimler, Malte Sohlbach, Michaela Weber y Gregor Willhauck, Object Oriented Image Analysis. eCognition 3 User Guide. München: 2003. pp 480.
Martin Baatz y Arno Schäpe, Multiresolution Segmentation: an optimization approach for high quality multi-scale image segmentation. Disponible en: http://www.agit.at/papers/2000/baatz_FP_12.pdf. pp 12.
Michael Bock y Rolf Lessing. Remote sensing, formation of objects and determination of quality. Disponible en: http:// enviroinfo.isep.at/UI%20200/BockM300700.el.hsp.pdf. pp14.
How to Cite
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Download Citation
Ingeniería, 2005-00-00 vol:10 nro:1 pág:61-69
Validación de una Metodología de Clasificación de Imágenes Satelitales en un entorno Orientado a Objetos
Evaluation of an object oriented image classification methodology in satellite images.
Juan Pablo Ardila López
Ingeniero Catastral y Geodesta
Oscar Javier Espejo Valero
Ingeniero Catastral y Geodesta
José Luís Herrera Escorcia
Profesor de Ingeniería de la Universidad Distrital en el área de la Geomática y Procesamiento digital de imágenes.
Resumen
El presente documento da a conocer los resultados de la investigación realizada como trabajo de grado, cuyo propósito fue la introducción y validación de una metodología de clasificación y extracción de información temática en un entorno orientado a objetos frente a la metodología tradicional de clasificación basada en píxeles individuales. Se revisan los conceptos teóricos y el cambio metodológico a nivel de procesamiento de imágenes que representa la introducción de los objetos como unidad mínima de información en lugar del píxel, unidad tradicional del análisis de imágenes. Se analiza teóricamente la metodología orientada a objetos y se presenta una comparación y evaluación de la misma frente a la metodología tradicional basada en píxel; se formulan experimentos, se observan resultados y se obtienen conclusiones a nivel de exactitud temática y enfoque teórico práctico desde un punto de vista cuantitativo y cualitativo.
Palabras clave:
Clasificación de Imágenes, Extracción de información temática, Orientación a objetos, Segmentación
Abstract
This paper presents the results of the undergraduate thesis work, which aim was the introduction and comparison of a thematic information image extraction procedure based on an object oriented approach versus a traditional per pixel classification methodology. The document reviews theoretical concepts and the methodological implications of the shift towards and object oriented image classification process, in which the object is considered as the main block of image analysis contrary to the traditional pixel approach. The background of an object oriented classification process is introduced, hypothesis and experiments are described, results are reported and finally conclusions are presented from on a quantitative and qualitative point of view.
1. INTRODUCCIÓN
Actualmente los requerimientos de información espacial de gran calidad representan una de las necesidades más comunes en todas las actividades humanas, pues es necesario y relevante conocer con mayor exactitud y velocidad los cambios que se originan sobre la superficie terrestre [1]. Diariamente existe una gran demanda de información espacial de alto nivel de detalle, demanda que es cubierta en su mayor grado por la información proveniente de imágenes satelitales obtenidas por diferentes tipos de sensores remotos que orbitan la superficie terrestre. Las imágenes se obtienen en formato raster o matricial donde el valor de cada píxel o mínima unidad espacial detectada por el sensor corresponde a su nivel digital, el cual se encuentra estrechamente relacionado con los valores de reflectancia espectral propios de la superficie cubierta por dicho píxel y el rango del espectro electromagnético en el cual captura información el sensor [2].
La imagen así dispuesta constituye una herramienta bastante útil para reconocer un área y realizar una evaluación visual del espacio geográfico presente. Sin embargo para generar información temática los píxeles individuales que conforman la imagen deben ser discretizados o agrupados en categorías de interés que son definidas por el intérprete de acuerdo a sus objetivos y necesidades. Este agrupamiento de píxeles se realiza tradicionalmente mediante un proceso de agrupamiento de datos estadístico (clustering) en el que cada píxel es asignado a un grupo o categoría de acuerdo a su correspondiente nivel digital, es decir se realiza una clasificación basada en respuesta espectral de píxeles individuales [3].
El anterior enfoque de clasificación basado en píxel o respuesta espectral corresponde a la forma tradicional de extracción de información temática en imágenes satelitales y se emplea de forma generalizada en todo tipo de proyectos desde los inicios de la interpretación de imágenes asistida por computador en la década de los setenta [2] [3].
Existen igualmente métodos alternativos de clasificación [2] [3] [4] [5], los cuales son el resultado de investigaciones académicas involucradas en el campo del procesamiento. Dichos procedimientos buscan la implementación de métodos de clasificación que involucren técnicas alternativas de asignación de píxeles a la tradicional basada en respuesta espectral. Entre los resultados se cuentan métodos de clasificación como los clasificadores difusos, clasificadores subpixel, la aplicación de redes neuronales o los clasificadores de contexto. Si bien dichos experimentos de clasificación muestran algunas veces resultados prometedores en aplicaciones puntuales no existe una metodología alternativa, general, oportuna y eficaz de clasificación que sea reconocida, aceptada e implementada satisfactoriamente en los trabajos de procesamiento de imágenes [6].
La investigaciónn presentada en este artículo tiene como objeto el estudio y aplicación de una metodología de clasificación orientada a objetos, método de clasificación alternativo que se explica a continuación. La hipótesis verificable de la investigación plantea que una clasificación orientada a objetos produce resultados de mayor exactitud y consistencia frente a la metodología de clasificación tradicional basada en píxel a la vez que la consideración de objetos como unidades fundamentales de procesamiento tienen un impacto positivo en el proceso conceptual y metodológico de la clasificación.
2. PLANTEAMIENTO DEL PROBLEMA Y JUSTIFICACIÓN
Las capacidades tecnológicas disponibles han dado un gran impulso al campo de la adquisición de imágenes satelitales, hoy en día existe un gran volumen de información espacial de alta calidad que requiere ser interpretada y que capurada con alto nivel de detalle y frecuencia en el tiempo, constituyen herramientas fundamentales para la toma de decisiones de carácter espacial. Las capacidades computacionales por su parte, se han incrementado dramáticamente desde la aparición de las primeras técnicas de clasificación en los años setenta; hoy la capacidad de procesamiento y almacenamiento de la información es superior a la disponible hace algunos años. Sin embargo el procesamiento de imágenes o algoritmos para clasificación y extracción de información temática es un campo que parece estar en mora de evolucionar a la par de los demás procesos de la teledetección [7].
De forma general (y salvo contados casos particulares) aún se aplican las mismas técnicas de clasificación de los años setenta [8], y si bien la investigación y el desarrollo de métodos avanzados de clasificación ha rendido frutos aún no se ha identificado un método que sea aceptado por la comunidad y que compita directamente con los algoritmos tradicionales; prueba de ello es que los paquetes de procesamiento implementan de forma genérica y habitual la clasificación supervisada basada en píxel y no proveen métodos adicionales de clasificación consolidados, los métodos alternativos varían en cada paquete y son introducidos de forma experimental.
El problema no es simplemente un estancamiento en las técnicas aplicadas para extracción de información temática, ni se busca un método alternativo de clasificación per se, la comunidad involucrada ha identificado que el tradicional procedimiento basado en respuesta espectral deja vacíos e incertidumbres en cuanto al enfoque simplemente estadístico utilizado y a los resultados ofrecidos con imágenes de alta resolución espacial, espectral y radiométrica [3] [6]. El campo del procesamiento digital de imágenes actualmente se caracteriza por un alto volumen de información satelital de alta calidad y por la existencia de técnicas de extracción de información temática que no brindan resultados oportunos a menos que se involucre un detallado y dispendioso trabajo de edición.
Es evidente que el método de clasificación basado en píxel presenta algunas falencias o debilidades en cuanto a sus fundamentos o concepción teórica. La generación de información temática asistida por computador es un problema de reconocimiento de patrones espaciales y que en últimas debe corresponder aproximadamente con la percepción humana y concepción de imágenes y estructuras espaciales en nuestro cerebro [9]; el hecho de considerar como criterio único de clasificación la respuesta espectral de los píxeles que conforman la imagen y de trabajar el píxel individual como unidad fundamental de información y análisis hace que dicha técnica resulte limitada a la vez que obvia la realidad de la estructura lógica de percepción humana. Las técnicas actuales de clasificación reducen el proceso a la aplicación de cálculos estadísticos basados en respuesta espectral y trabajan con unidades espaciales inadecuadas y que no corresponden con la realidad geográfica.
Ante la difusión de imágenes de alta resolución, en las que un objeto o elemento de la superficie terrestre se compone por un conjunto de píxeles y las mejoras en radiometría que permiten obtener imágenes con alta información textural, las técnicas tradicionales de clasificación presentan inconvenientes en cuanto al proceso de clasificación, y en muchas ocasiones ofrecen resultados que son incoherentes espacialmente, que tienen un efecto pixelado o de ruido y que requieren un tratamiento adicional de corrección de errores luego del proceso de clasificación [10]. El tratamiento post clasificación de una imagen, en el que generalmente se aplican filtros de suavizado al resultado obtenido es un proceso que demanda recursos y tiempos adicionales, y que va en contra de la velocidad con que la información temática requiere ser generada para la atención de problemas y estudios de tipo geográfico [6].
El paradigma del análisis y clasificación de píxeles individuales, no es por lo tanto el más adecuado para las tareas y requerimientos de información hoy en día establecidos y es necesario investigar y desarrollar una técnica de clasificación que brinde resultados oportunos y adecuados y que desde su concepción corresponda en mayor grado con la realidad geográfica y la percepción humana de la organización espacial del territorio.
3. MARCO CONCEPTUAL DE LA INVESTIGACIÓN
La metodología de clasificación orientada a objetos investigada se sustenta en el siguiente marco conceptual:
3.1. Estructuralismo
La percepción humana, uno de los procedimientos más complejos y esenciales de nuestra vida, nos permite conocer y aprehender la realidad a partir de procesos de estructuración de la información que por multiplicidad de medios llega a nuestro cerebro; la forma en que podemos interpretar las formas, sonidos o sensaciones es un proceso de análisis estructurado, donde percibimos la realidad como un todo compuesto de unidades básicas de información u objetos organizados y relacionados, más que como partes separadas y aisladas; no vemos pequeños fragmentos desorganizados al abrir nuestros ojos para ver el mundo, vemos regiones significativas con formas y patrones bien definidos. El todo que percibimos es algo más estructurado y coherente que un grupo de fragmentos aislados, su forma y comportamiento es más que la simple unión de los fragmentos que lo componen [11].
La percepción y abstracción que hace el cerebro del entorno y de las imágenes que este percibe es un sistema bastante complejo, hasta ahora no entendido del todo por la ciencia; sin embargo, se sabe que existe un proceso económico de procesamiento de información donde las señales luminosas son enviadas al cerebro y allí éste descompone y abstrae únicamente la información relevante y los patrones regulares existentes. La imagen es descompuesta en regiones y las relaciones entre estas regiones transmiten la información relevante presente en la imagen disminuyendo así el volumen de datos que deben ser procesados con cada estímulo recibido [11].
Las ciencias de la computación no son ajenas al proceso de percepción humana, y han mostrado una constante evolución de teorías y métodos que permiten dar a los sistemas una mayor lógica e inteligencia ante la necesidad de software que permitan manejar procesos más dinámicos y consistentes con la realidad del intérprete [12]. Esta consideración de la realidad se aproxima de forma idealizada a la aplicación del concepto de orientación a objetos, donde se construyen entidades o unidades denominadas objetos que permiten definir una representación de la realidad y que a partir de ciertos atributos y acciones especificas permiten modelar con mayor facilidad y lógica los procesos necesarios para la resolución de los problemas planteados [7].
3.2. La imagen concebida en objetos
Como se indicó anteriormente el proceso cognitivo del mundo exterior o de una imagen a pesar de ser complejo puede ser idealizado o modelado mediante la identificación de regiones, o áreas significativas dentro de la información percibida. La presente investigación se fundamenta en un cambio de paradigma en el cual las unidades básicas de información no corresponden ya a píxeles aislados sino a regiones homogéneas y significativas capaces de presentar de forma resumida y eficiente las entidades y relaciones presentes en la imagen; los objetos así considerados sobre una imagen corresponden en mayor grado con la realidad espacial y geográfica capturada en una imagen satelital [13]. El objeto generado en una imagen corresponde entonces a una estructura con atributos propios obtenido mediante el agrupamiento de píxeles con cierta homogeneidad de acuerdo a parámetros definidos, el resultado, unidades que se aproximan en mayor medida a los elementos del mundo real representados en la imagen.
3.3. Generación de objetos en una imagen
Una imagen se dispone en su forma elemental de un arreglo matricial de píxeles con valores digitales que dispuestos de forma adecuada transmiten la información capturada. Para poder trabajar con objetos sobre la imagen es necesario realizar un proceso de generación de regiones en el que de acuerdo a ciertos parámetros se obtenga información lo más resumida pero simultáneamente lo más significativa posible. Dicho proceso se conoce en el procesamiento de imágenes como segmentación; la cual se define como el proceso por el cual se extrae información significativa de una imagen a partir de su división en diferentes regiones homogéneas, las cuales corresponden de forma aproximada con zonas de interés en la misma [14] (ver Figura 1).
La segmentación de imágenes no es un concepto nuevo, existen varios desarrollos e investigaciones en cuanto a técnicas de segmentación [7]. Debido a que no existe una única forma de generar objetos en una imagen, siempre es posible variar los parámetros de generación de regiones y por supuesto los resultados obtenidos. En todo caso la pertinencia de un método de clasificación se juzga en función de la información extraída de la imagen, y si los objetos generados representan o no información significativa y acorde con el propósito de estudio de la imagen.
3.3.1 Formulamiento matemático de la segmentación
El algoritmo matemático de segmentación empleado en la presente investigación genera regiones no determinísticas de acuerdo a parámetros de escala y homogeneidad definidos por el intérprete, lo cual brinda al método una alta flexibilidad en cuanto es posible sobre una misma imagen generar objetos de diferente tamaño y con una diferente configuración de los parámetros empleados. La técnica de segmentación aplicada fue desarrollada por Baatz [15] y parte del concepto general de un crecimiento de regiones bottom up [12], donde a partir de un determinado punto definido por los criterios de clasificación establecidos por el usuario, y mediante un determinado valor de tolerancia en las variaciones de color y forma que una región presenta, se desarrolla un proceso iterativo de crecimiento, donde a un único píxel inicialmente identificado se agregan de forma controlada nuevos píxeles hasta que el criterio de homogeneidad es sobrepasado, punto en el que el proceso se detiene. El resultado es un conjunto finito de objetos primitivos, que carecen aún de significado, pero que se constituyen en los bloques de información primaria para un posterior proceso de clasificación [15].
3.3.2 Parámetro de Homogeneidad
La definición de la homogeneidad (ø) de acuerdo con Baatz [15] se relaciona generalmente con el tamaño de los objetos obtenidos, ya que una menor tolerancia de heterogeneidad permitida redunda en objetos con una mínima variabilidad que agrupan píxeles de diferentes valores digitales altamente correlacionados y viceversa. La variación máxima permitida en la heterogeneidad de un objeto al adicionarse nuevos píxeles u objetos se evalúa de dos formas: una variabilidad permitida en el color o variabilidad espectral y una variabilidad permitida en la forma, dichas variabilidades son posteriormente ponderadas y evaluadas de acuerdo a la expresión:
Donde f es el valor de fusión, ω el peso o ponderación para la variabilidad en color, hcolor, será la variabilidad permitida en color y hforma la variabilidad permitida en forma. La variación permitida en color se obtiene a partir de la siguiente expresión:
Donde ωc es el peso o ponderación de la banda c, nf es el número de píxeles del objeto resultante de la fusión de los objetos 1 y 2, ó fc es la desviación estándar del objeto resultante en la banda c, ócobj1 y ócobj2 son las desviación estándar de los objetos 1 y 2 en la banda c,nobj1 y nobj2 son los números de píxeles de los objetos 1 y 2. Dicha variabilidad en color busca minimizar la heterogeneidad espectral del objeto a generar. Como se observa, esta definición permite ponderar la información de cada una de las bandas espectrales que componen la imagen satelital y a partir de las variaciones de los píxeles que componen los objetos a evaluar, representada esta por la desviación estándar y ponderadas además por sus tamaños de acuerdo al número de píxeles que los componen, se hace una evaluación simétrica de la variación de heterogeneidad en el objeto resultante.
La variabilidad permitida en forma se define matemáticamente a partir del resultado del cálculo de dos criterios complementarios: Variabilidad en Lisura de bordes y Variabilidad en Compactación [15]. La variabilidad permitida en forma es definida de acuerdo a:
En la que ωcompact es el peso o ponderación dada al parámetro de compactación y es complementario a 1 del peso del parámetro de lisura. La variabilidad permitida en la compactación del objeto resultante se define como la desviación que presenta el objeto con la adición de un nuevo píxel u objeto de tener una forma compacta y se calcula como la razón entre el perímetro del objeto (l) y la raíz cuadrada del número de píxeles (n) que forman los objetos en cuestión. La expresión utilizada pondera el valor por compactación para los objetos constituyentes así como para el objeto resultante por su tamaño en píxeles, para así comparar adecuadamente la situación antes y después de la fusión. La definición de este parámetro entonces se realiza a partir de la siguiente expresión:
La variabilidad permitida en la Lisura de Bordes (5) se define como la desviación que presentan los bordes del objeto resultante, de un criterio de regularidad que puede definirse como la relación entre el perímetro del objeto (l) y la menor longitud del borde de la caja que lo inscribe (b), es decir cuál es la relación entre el exceso en longitud en el perímetro del objeto con relación al perímetro regular definido dicho rectángulo, dicho valor es ponderado para cada objeto por su correspondiente tamaño en píxeles para comparar adecuadamente la situación antes y después de la fusión. La definición de este parámetro entonces se realiza a partir de la siguiente expresión:
La variabilidad en heterogeneidad (1) para el objeto resultante se define finalmente como la suma de la heterogeneidad en color (2) y la heterogeneidad en la forma (3) del objeto multiplicado por sus pesos respectivos, estos pesos son seleccionados por el usuario y deben sumar 1. El valor final de fusión f obtenido de la evaluación de cada uno de los parámetros anteriormente mostrados, corresponde a la evaluación de la variabilidad general del objeto resultante. Dicho valor es comparado con el parámetro de homogeneidad y por medio del siguiente criterio de decisión se evalúa la pertinencia en la adición de cada píxel a un objeto ya existente de acuerdo al criterio de homogeneidad establecido:
Si ø2 > ƒ
entonces adicione el píxel u objeto al objeto n
Si ø2 > ƒ
entonces detenga el crecimiento del objeto n, no adicione el píxel u objeto en cuestión
3.3.3 Segmentación en múltiples resoluciones
Si bien la extracción de información significativa a partir de procedimientos de segmentación es un proceso desarrollado en múltiples aplicaciones [12], las características de la información espacial que se maneja, sintetizadas de cierta forma en una imagen satelital, requieren de técnicas de segmentación más avanzadas y coherentes que permitan describir las características y estructuras de la realidad geográfica a partir de objetos que posean un determinado significado a diferentes escalas en la imagen.
La información que se reconoce como significativa en una imagen satelital, se presenta como la interacción de zonas o regiones de interés que a diferentes escalas poseen un significado propio de acuerdo con el propósito del análisis; se entiende entonces que objetos de interés caracterizados por presentar diferentes patrones y comportamientos de acuerdo a la escala, no puedan ser extraídos a partir de la aplicación de un proceso de segmentación basado en un único criterio de homogeneidad [16]; es por ello que la segmentación debe realizarse buscando generar objetos que a diferentes escalas y en una misma estructura permitan combinar sus resultados y modelar características y patrones de interés que representan información geográfica significativa. La segmentación en múltiples resoluciones, permite solventar este obstáculo y generar así diferentes niveles de segmentación que contienen objetos generados con diferentes parámetros de homogeneidad. Estos niveles de segmentación se relacionan entre sí a través de una red jerárquica de objetos, donde se establecen relaciones y propiedades tales como la herencia entre objetos. Dentro de la red jerárquica constituida, cada objeto de un nivel dado conoce sus vecinos, así como sus subobjetos (ubicados en niveles de menor escala) y súper objetos (ubicados en niveles de mayor escala).
3.4. Clasificación en un entorno orientado a objetos
Los objetos de la red estructural a diferentes niveles de escala constituyen las unidades básicas del procesamiento de un análisis orientado a objetos. Dichos objetos presentan y albergan información de ellos mismos, es decir tienen características o atributos que definen su estado, cada objeto en la red posee atributos intrínsecos que definen características inherentes al objeto como su área y forma; atributos semánticos, que describen relaciones contextuales a otros objetos, tales como la existencia o no de un cierto tipo de objetos en un nivel determinado de la estructura; y atributos topológicos, que describen relaciones geométricas y de ubicación del objeto con respecto a los demás objetos dentro de la red, tales como la distancia a un cierto objeto o la longitud del perímetro que se comparte con otro. Es a partir de este conjunto de atributos que se formulan las características de las clases temáticas de interés y que permiten llevar a cabo la clasificación de los objetos. La clasificación se torna entonces en un proceso en el que se busca uno o más atributos que permitan la discriminación de objetos que presentan un determinado comportamiento, no sólo espectral sino también de tipo espacial o relacional con otros objetos o clases en la imagen. Los objetos son asignados finalmente a las clases de interés de acuerdo a la evaluación de las reglas o restricciones basadas en atributos que se generan para cada clase de acuerdo a una lógica difusa o binaria [16].
3.5. Evaluación de exactitud temática en imágenes satelitales
La verificación de la hipótesis planteada se basó en la evaluación de la exactitud temática de clasificaciones realizadas en tres zonas del país, donde cada zona constituye un caso de estudio. El primer tipo de evaluación consiste en realizar un análisis cualitativo de los resultados, en el que se examina visualmente el grado de correspondencia entre las clasificaciones y la imagen satelital. Igualmente se aplica una evaluación cuantitativa a través de una matriz de confusión o de errores, la cual es una herramienta analítica que permite evaluar la exactitud temática de una clasificación, mediante la comparación de una clasificación determinada frente a una clasificación de referencia la cual es asumida como el valor verdadero (confianza del 100%). En dicha matriz sobre las columnas tienen entrada los píxeles de clasificación de referencia y en las filas los píxeles de la clasificación a evaluar. La matriz permite entonces mediante indicadores medir el grado de concordancia o coincidencia entre la clasificación evaluada y la clasificación de referencia. Un indicador bastante representativo obtenido de la matriz es el de exactitud promedio, el cual expresa el grado de concordancia entre las dos clasificaciones para las clases evaluadas [2].
4. ASPECTOS METODOLÓGICOS
Mediante un método de investigación lógico deductivo, se plantea un conjunto de preguntas o hipótesis que buscan establecer una validación y alcance de la metodología de clasificación orientada a objetos frente a la metodología tradicional de clasificación por respuesta espectral (ver esquema metodológico figura 2). Las preguntas se responden mediante un proceso de experimentación y deducción, en el cual se llevan a cabo tres experimentos o evaluaciones principales, cada uno de ellos sobre la misma área geográfica que es cubierta por un par de imágenes de distinto tipo (ver tabla 1), se llevan a cabo entonces la clasificación de cada imagen por medio de las dos metodologías de clasificación (supervisada basada en píxel y orientada a objetos). Para la clasificación basada en píxel se utiliza el software de procesamiento PCI Geomatica versión 9 y para la orientada a objetos el software eCognition versión 3.0.
Los resultados de dichas clasificaciones son contrastados cuantitativamente frente a un valor que se asume como verdadero o de referencia, el cual consiste en una clasificación compuesta por muestras tomadas aleatoriamente. El tamaño de la muestra tomada corresponde a un muestreo estratificado proporcional, y los correspondientes indicadores de exactitud se obtienen mediante una matriz de confusión; adicionalmente sobre los resultados de clasificación conseguidos se realiza una evaluación cualitativa de la extracción de información, mediante la evaluación visual de los resultados de la clasificación obtenida.
5. RESULTADOS OBTENIDOS
El análisis de los resultados mediante indicadores de exactitud temática ofrece una apreciación acerca de la calidad en cuanto a exactitud se refiere de las imágenes clasificadas por las metodologías evaluadas. Se analiza a continuación el indicador de exactitud promedio de la matriz de confusión el cual permite realizar una inferencia acerca de la exactitud temática de cada una de las imágenes clasificadas mediante un indicador único que resume así la exactitud general de las coberturas clasificadas. El análisis de los indicadores adicionales de exactitud del intérprete y del usuario no se exponen en este documento, pero debe considerarse que el indicador de exactitud promedio se relaciona directamente con dichos indicadores.
De acuerdo al indicador calculado existe una diferencia promedio de exactitud de 8 puntos porcentuales a favor de la metodología orientada a objetos respecto a la metodología basada en píxel. Dicho indicador de exactitud varia en la metodología orientada a objetos entre el 85% y 91% de exactitud, brindando mayores grados de confiabilidad en los mapas temáticos obtenidos, frente a un máximo de 84% de exactitud en la metodología basada en píxel. Se observa además una mayor exactitud temática de la clasificación orientada a objetos para las tres imágenes LandSat clasificadas (entre el 4.5% y 13%), y en el caso de imágenes de alta resolución se presenta igualmente una mayor exactitud temática para los resultados de clasificación de la metodología orientada a objetos, dicha superioridad es de 11 puntos para la imagen SPOT (alta resolución espacial), 8 puntos para la imagen IKONOS (alta resolución radiométrica y espacial) y 5 puntos para la imagen ASTER (alta resolución espacial y radiométrica).
De acuerdo entonces a los resultados cuantitativos la metodología de clasificación orientada a objetos presenta una mayor superioridad en exactitud temática para las imágenes LandSat trabajadas sobre la metodología basada en píxel, pero dicha metodología presenta una mayor fortaleza o superioridad frente a la metodología píxel cuando se utilizan imágenes de alta resolución ya sea espacial, radiométrica o espectral, en este caso las imágenes ASTER, SPOT e IKONOS.
La evaluación cualitativa realizada mostró claramente que al considerar únicamente los niveles digitales de los píxeles que componen la imagen, los resultados de una clasificación basada en píxel en muchas ocasiones no son coherentes espacialmente, ni corresponden a los patrones espaciales ni a las características propias de varias coberturas en la imagen; se presentan efectos de respuesta local o efecto pixelado donde se observan píxeles individuales aislados con un cierto valor temático y que no representan información significativa generando confusión en el mapa de clasificación y dificultando así su interpretación (ver Figura 3). Por su parte en la clasificación orientada a objetos la consideración de relaciones espaciales e información de contexto permiten la obtención de resultados mucho más coherentes y consistentes con la realidad geográfica, pues la introducción de un análisis espacial sobre la red de objetos que componen la imagen reduce los grados de libertad de un objeto de ser erróneamente asignado a una clase.
6. CONCLUSIONES
Los objetos tiene su sustento en la clasificación de imágenes desde el punto de vista del estructuralismo, la percepción humana no concibe el mundo como imágenes compuestas de píxeles individuales, sino más bien a través de estructuras que se asocian para conformar regiones u objetos elementales donde existen relaciones de agregación y conectividad. Al aplicar un procedimiento de segmentación para la extracción de la información relevante en imágenes satelitales, se generan objetos significativos que obedecen a un conjunto de parámetros espectrales y geométricos, y que constituyen las unidades básicas para el desarrollo de un procedimiento de clasificación orientado a objetos.
El proceso de segmentación basado en características espectrales y geométricas permite obtener objetos que representan adecuadamente las diferentes coberturas en la imagen; los límites entre objetos representan las más importantes variaciones y límites entre las diferentes coberturas. El establecimiento de relaciones semánticas y topológicas entre los objetos de la red, tanto horizontales con los objetos del mismo nivel, como verticales con los objetos de niveles superiores o inferiores, permite obtener resultados más consistentes con la realidad geográfica observada en la imagen y conocida por el intérprete, pues la distribución de la información de interés sobre la superficie se presenta en diferentes escalas, y no es posible extraer esta a partir de un único grado de abstracción o detalle.
La salida o mapa temático obtenido en una clasificación orientada a objetos no solo resulta más consistente y coherente que una clasificación basada en píxel debido a la restricciones semánticas y topológicas impuestas sobre las clases definidas sino que igualmente se obtiene mapas mucho más fáciles de observar e interpretar al obtenerse salidas sin el característico efecto píxelado, a la vez que se reduce el tiempo y energía dedicados a los trabajos de edición y corrección de errores.
El proceso de clasificación y extracción temática es un problema que va del estudio de reflectividad de las coberturas presentes en la imagen y de la distribución espacial de las coberturas sobre la zona trabajada, siendo así más que necesario tener presente este último componente en el proceso de clasificación a través de reglas espaciales, semánticas y de contexto que son conocidas por el intérprete; el problema de la clasificación debe considerar por su naturaleza el componente espacial, aproximación que es muy bien lograda en una metodología orientada a objetos y omitido en una clasificación basada en respuesta espectral.
El desarrollo metodológico de la clasificación orientada a objetos permite que el intérprete juegue un papel fundamental y relevante en el proceso de clasificación. No sólo éste debe conocer el comportamiento espectral de las coberturas presentes en la imagen sino que igualmente juega un papel relevante en el tipo de análisis y relaciones espaciales implementados en la clasificación, convirtiéndose en un proceso mucho más inteligente, donde el intérprete debe considerar adicionalmente la información semántica y el contexto de las coberturas que pretende identificar, generando entonces resultados más exactos y coherentes con la percepción de la realidad.
En el contexto colombiano y quizás latinoamericano, el utilizar metodologías diferentes a las basadas principalmente en el análisis cuantitativo de las respuestas espectrales de las diferentes coberturas, para la clasificación y posterior realización de mapas de uso y cobertura, -caso concreto la metodología evaluada apoyada en fundamentos de matemática difusa y objetos-, se considera innovador y de acuerdo a los resultados obtenidos con una mayor exactitud temática. Este cambio de paradigma, propuesto y evaluado no solamente en este artículo sino en el proyecto de grado que lo soporta, propone a la comunidad de especialistas en la materia, una nueva conceptualización en la labor diaria, esto es, no dedicarse únicamente al manejo y conocimiento de las firmas espectrales, sino también al análisis y relación de los objetos que son posibles de abstraer a partir de las imágenes, de acuerdo principalmente a las resoluciones espacial y espectral y del catálogo de objetos utilizado.
Agradecimientos
La presente investigación no se hubiese podido llevar a cabo de no ser por el incondicional apoyo del proyecto SIMCI de las Naciones Unidas, el cual mediante sus recursos y personal humano contribuyeron exitosamente a la consecución de los resultados.
REFERENCIAS BIBLIOGRÁFICAS
[1] Juan Pablo Ardila y Oscar Javier Espejo, "Clasificación extracción de información temática en imágenes satelitales de zonas rurales mediante la validación y aplicación de una metodología orientada a objetos y clasificadores basados en lógica difusa", Tesis de Grado, Facultad de Ingeniería, Universidad Distrital Francisco José de Caldas, Bogota, Colombia, 2004.
[2] John Jensen, Introductory digital image processing: a remote sensing perspective. Segunda Edición. Prentice Hall. New Jersey, 1996. pp 316.
[3] Emilio Chuvieco, Fundamentos de teledetección espacial, Tercera Edición, Ediciones RIALP, Madrid, 1991. pp 568.
[4] Nilda Sánchez, Panorama actual de las técnicas mixtas de clasificación de imágenes mediante segmentación espectral y por texturas. Aplicación a las imágenes de alta resolución espacial. 2003. Disponible en http://www.mappinginteractivo.com/plantilla-egeo.asp?id_articulo=288.
[5] Chulhee Lee y David Landgrebe, Feature extraction and classification algorithms for high dimensional data, School of Electrical Engineering Purdue University. West Lafayete. 1993. pp 227.
[6] Thomas Blaschke y Josef Strobl, What's wrong with pixels? Some recent developments interfacing remote sensing and GIS. GeoBIT/GIS, vol. 6. 2001. pp 6.
[7] Thomas Blaschke y Charles Burnett, A multi-scale segmentation/ object relationship modelling methodology for landscape análisis, 2003 Disponible en: www.geo.sbg.ac.at/larg/099_full.pdf. pp 17.
[8] Thomas Blaschke, Stefan Lang, Eric Lorup, Josef Strobl y Peter Zeil, Object-oriented image processing in an integrated gis/ remote sensing environment and perspectives for environmental applications. Environmental Information for Planning, Politics and the Public. Metropolis Verlag, Vol 2. Marburg: 2001. pp 16.
[9] Ray Forman, Land mosaics: the ecology of landscapes and regions. Cambridge University Press, Cambridge, 1995. pp 400.
[10] John Cushnie, The interactive effect of spatial resolution and degree of internal variability within land-cover types on classification accuracies. International Journal of Remote Sensing, 1985, pp 155.
[11] Day R.H, Psicología de la Percepción Humana. Ed. Limusa- Wiley, México D. F., 1973. pp 227.
[12] John Gauch, Robin Horne y Stephen Sangwine, The colour image processing handbook. Chapman & Hall. Londres: 1998. pp 440.
[13] Thomas Blaschke, Manuel Conradi y Stefan Lang, Multi-scale image analysis for ecological monitoring of heterogeneous, small structured landscapes. Proceedings of SPIE, Toulouse. 2001. pp 10.
[14] Martin Baatz, Ursula Benz, Seyed Dehghani, Markus Heynen, Astrid Höltje, Peter Hofmmann, Iris Lingenfelder, Matthias Mimler, Malte Sohlbach, Michaela Weber y Gregor Willhauck, Object Oriented Image Analysis. eCognition 3 User Guide. München: 2003. pp 480.
[15] Martin Baatz y Arno Schäpe, Multiresolution Segmentation: an optimization approach for high quality multi-scale image segmentation. Disponible en: http://www.agit.at/papers/2000/baatz_FP_12.pdf. pp 12.
[16] Michael Bock y Rolf Lessing. Remote sensing, formation of objects and determination of quality. Disponible en: http://enviroinfo.isep.at/UI%20200/BockM300700.el.hsp.pdf. pp14.
Juan Pablo Ardila López
Ingeniero Catastral y Geodesta U. Distrital Francisco José de Caldas. Tesis meritoria "CLASIFICACION Y EXTRACCION DE INFORMACION TEMÁTICA EN IMÁGENES SATELITALES EN ZONAS RURALES MEDIANTE LA VALIDACION Y APLICACIÓN DE UNA METODOLOGIA ORIENTADA A OBJETOS Y CLASIFICADORES BASADOS EN LOGICA DIFUSA". Actualmente se desempeña como Ingeniero de Procesamiento Digital de Imágenes en la oficina de las Naciones Unidas contra la Droga y el Delito en Colombia. juan.ardila@unodc.org
Oscar Javier Espejo Valero
Ingeniero Catastral y Geodesta U. Distrital Francisco José de Caldas. Tesis meritoria "CLASIFICACION Y EXTRACCION DE INFORMACION TEMÁTICA EN IMÁGENES SATELITALES EN ZONAS RURALES MEDIANTE LA VALIDACION Y APLICACIÓN DE UNA METODOLOGIA ORIENTADA A OBJETOS Y CLASIFICADORES BASADOS EN LOGICA DIFUSA". Actualmente se desempeña como Ingeniero de Procesamiento Digital de Imágenes en la oficina de las Naciones Unidas contra la Droga y el Delito en Colombia. oscar.espejo@unodc.org
José Luís Herrera Escorcia
Ingeniero Catastral y Maestro en Geografía Universidad Tecnológica y Pedagógica de Colombia. Se ha desempeñado como profesor de Ingeniería de la Universidad Distrital en el área de la Geomática y Procesamiento digital de imágenes. Actualmente se encuentra en año sabático. jlherreraescorcia@udistrital.edu.co
Creation date:
License
From the edition of the V23N3 of year 2018 forward, the Creative Commons License "Attribution-Non-Commercial - No Derivative Works " is changed to the following:
Attribution - Non-Commercial - Share the same: this license allows others to distribute, remix, retouch, and create from your work in a non-commercial way, as long as they give you credit and license their new creations under the same conditions.