Visión de caso
Ingeniero en Control Electrónico e Instrumentación de las Unidades Tecnológicas de Santander, miembro del Grupo de Investigaciones en Control Inteligente, de las mismas Unidades. Correo electrónico: eguerra_inpesa@ yahoo.es .
El presente trabajo muestra una metodología para el reconocimiento y clasificación de cuatro, primitivas tridimensionales como son: cilindro, cubo, esfera y cono, las cuales están contenidas en imágenes de 128X128 pixeles. La metodología se fundamenta en la aplicación de un algoritmo de autocorrelación, para la extracción de características en las imágenes, y el proceso de clasificación se realiza mediante ANFIS, que es un híbrido entre las redes neuronales artificiales y la lógica difusa. En la fase de operación, el sistema deber ser capaz de diferenciar las primitivas mencionadas, en forma independiente del ángulo de adquisición de la imagen. El sistema descrito, por ejemplo puede ser acoplado a un brazo robótico, para realizar tareas de clasificación de objetos según su forma.
Palabras clave
Primitivas .3D, visión artificial, correlación, NeuroFuzzy.
The present work shows a methodology for recognition and classification of four (4), primitive three-dimensional such as: cylinder, cube, sphere and cone, which are contained in images of 128X128 pixels. The methodology is based on the application of autocorrelation algorithm, for the extraction of characteristics in images, and the classification process is made by means of ANFIS, that is a hybrid between the artificial neuronal networks and the fuzzy logic. In the phase of operation, the system must be able to dif- ferentiate the primitive ones mentioned, in an independent way of the angle of acquisition of the image. The described system, for example, can be connected to a robotic arm stops to perform tasks of classification of objects according to its form.
Keywords
Primitive 3D, artificial vision, correlation, NeuroFuzzy
Día a día, los sistemas de control basados en visión artificial tienen mayor aplicación en el campo industrial, siendo un reto inte- resante el reconocimiento de estructuras fí- sicas (en forma independiente su ángulo de adquisición), para la generación de acciones de control. Aquí se describe una metodología que utiliza un algoritmo para autocorrela- ción para la extracción de características en las imágenes. En la primera fase esas características extraídas se utilizan para construir patrones para entrenar el ANFIS que actúa como clasificador. En la fase de operación las características son entrega- das al clasificador y éste responde con la categoría a la que pertenece la primitiva evaluada.
En la figura 1 se encuentran las cuatro primitivas consideradas que fueron escogidas para su identificación y clasificación, porque éstas constituyen la base de estructuras más complejas.
Las primitivas se encuentran contenidas en imágenes de 128x128 píxeles, que pueden proceder de una cámara o ser generadas en un PC.
Las imágenes contienen una gran cantidad de información, situación que imposibilita su utilización para entrenar directamente el ANFIS, por ello deben ser tratadas previamente mediante el algoritmo de autocorrelación que, en esencia, transforma cada imagen en una pareja de datos, con el propósito de reducir o eliminar la información redundante que puedan contener.
Terminado el paso anterior el híbrido es configurado y entrenado para reconocer las primitivas citadas. Finalmente, una vez la termina el entrenamiento, el sistema debe ser evaluado con datos no mostrados en la fase de entrenamiento, que pueden ser imágenes contaminadas con ruido, para valorar su capacidad de respuesta ante este tipo de información.

Las Redes Neuronales Artificiales (RNA) son un conjunto de elementos simples, fuertemente interconectados y de procesamiento paralelo. Su mecanismo para procesar la información se encuentra inspirado en la naturaleza cerebral. Las RNA hacen parte de la inteligencia artificial, donde ocupan un lugar privilegiado, gracias a su amplia aplicación en múltiples áreas.
Las principales características de las RNA son:

La red BackPropagation (BP) es una de las una de las más utilizadas por su capacidad de aprendizaje y generalización, caracte- rísticas necesarias para determinar las relaciones que existen entre un conjunto de datos de entrada y salida y así poder realizar una buena aproximación. El apren- dizaje consiste en la presentación iterada de los datos y la modificación sistemática de los pesos de la red, según el algoritmo de retropropagación del error BP. Los datos utilizados para el entrenamiento deben ser previamente escalados a valores compren- didos entre: O y 1 o --1 y 1.

La Lógica Difusa (LD), es la rama de las matemáticas que se encarga del procesamiento de información ambigua, que puede expresarse en forma de reglas lingüísticas, como por ejemplo: si temperatura es agradable entonces velocidad_ventilador es baja.
La LD aparece como respuesta a las dificultades presentadas por la lógica tradicional binaria, en la que no existen estados intermedios. Mediante LD es posible establecer el grado de pertenencia de un elemento a uno o varios de los conjuntos con que se encuentra relacionado. El grado de pertenencia puede tomar valores dentro del rango continuo [0,1], incluyendo los extremos y es determinado mediante las Funciones de Pertenencia (FP).
Los sistemas difusos se caracterizan por:

Existen diferentes formas de combinar las redes neuronales con la LD, pero una de las más exitosas en el modelado de sistemas continuos nolineales es el Adaptive Neuro Fuzzy Inference System (ANFIS) que conserva la estructura de una red neuronal, siendo sus conexiones de tipo difuso. El ANFIS es multientrada con única salida, está constituido por cinco capas de neuronas. El aprendizaje se realiza mediante BackPropagation o BackPropagation modificado.
Las características más importantes del ANFIS son:
El algoritmo de correlación típico (ecuación 1) se utiliza para determinar el grado de similitud entre dos series de datos; éste brinda un resultado que varia entre -1 y 1, representado -1 una similitud inversa, el cero ninguna similitud y el 1, una completa similitud.
(1)
En la ecuación anterior Xm y Ym, corresponden con la media de cada serie y d, corresponde con la ventana de tiempo y tiene la desventaja que la correlación no es absoluta. Para superar la dificultad anterior se plantea una modificación de la ecuación anterior en la ecuación 2.
(2)
A continuación se describen los pasos necesarios para construir el sistema de reconocimiento de primitivas 3D.
La figura 5, muestra un cubo en escala de grises. Las gráficas 1 y 2 muestran la autocorrelación para el cubo en la dirección X e Y, respectivamente.
Los resultados del procesamiento para las otras tres primitivas fueron semejantes a los presentados para el cubo.
La gráfica 3 muestra el resultado de la clasificación mediante el ANFIS. En ésta los datos en azul representan la salida ideal, los datos en verde son los de entrenamiento y los datos en rojo corresponden a los patrones de prueba que nunca fueron mostrados en la fase de entrenamiento.





El sistema fue probado con datos contaminados con ruido, pero su desempeño fue pobre, porque sólo responde adecuadamente hasta un nivel de ruido del 5%. que incluya una mayor cantidad de información de las primitivas.