Sistemas Vision

ndice

INTRODUCCIN ..................................................................................................................... 11 1.1 MARCO DE LA TESIS .............................................................................................................11 1.1.1 ALCANCE DE LA TESIS ...................................................................................................12 1.2 OBJETIVOS ............................................................................................................................13 1.3 ESTRUCTURA DE LA TESIS ....................................................................................................14
PROBLEMTICA DE LA INSPECCIN VISUAL AUTOMATIZADA ........................... 17 2.1 LA INSPECCIN INDUSTRIAL ................................................................................................18 2.1.1 TAXONOMA DE LOS PROBLEMAS DE INSPECCIN .........................................................19 2.2 INSPECCIN VISUAL AUTOMATIZADA ................................................................................20 2.2.1 VENTAJAS DE LA INSPECCIN AUTOMATIZADA VISUAL ...............................................21 2.2.2 LIMITACIONES DE LOS SIVA..........................................................................................23 2.2.3 CLASIFICACIN DE LOS SISTEMAS DE INSPECCIN VISUAL AUTOMATIZADA ................24 2.2.4 IMPLEMENTACIN DE SIVA...........................................................................................26 2.2.5 LITERATURA DE LOS SIVA ............................................................................................27 2.3 CONCLUSIONES .....................................................................................................................28
DISAM-UPMT-98-015
Inspeccin automatizada de superficies homogneas mediante Visin Artificial
Carlos Platero
FORMACIN DE IMGENES EN SISTEMAS DE INSPECCIN VISUAL AUTOMATIZADA (SIVA) ....................................................................................................... 29 3.1 CARACTERIZACIN DE IMGENES DIGITALES ...................................................................31 3.1.1 DEFORMACIONES DE LAS IMGENES .............................................................................33 3.2 REALCE VISUAL DE SUPERFICIES PLANAS...........................................................................37 3.2.1 MECANISMOS DE REFLEXIN DE LA LUZ SOBRE SUPERFICIES PLANAS ..........................38 3.2.2 MODELO DE LA CMARA................................................................................................52 3.3 MODELOS DE FUENTES LUMINOSAS E ILUMINACIN UNIFORME EN SUPERFICIES PLANAS ...................................................................................................................................54 3.4 SISTEMA DE ILUMINACIN PARA LOS SIVA IMPLEMENTADOS .........................................58 3.4.1 METODOLOGA A EMPLEAR PARA EL DISEO DEL SISTEMA DE ILUMINACIN...............58 3.5.1 SISTEMA DE ILUMINACIN PARA LA INSPECCIN DEL PAPEL ........................................60 3.5 ARQUITECTURA DE CMARAS CCD EN SIVA ....................................................................72 3.5.1 FACTORES A CONSIDERAR EN LA ELECCIN DE LAS CMARAS .....................................72 3.5.2 CMO ELEGIR LA CMARA.............................................................................................78 3.5.3 EJEMPLOS DE FORMACIN DE IMGENES EN ESCENAS SIVA ........................................84 3.6 CONCLUSIONES .....................................................................................................................85
DETECCIN VISUAL DE DEFECTOS LOCALES ............................................................ 87 4.1 LA DETECCIN COMO UN PROCESO DE DECISIN..............................................................89 4.2 REALCE DE LOS DEFECTOS LOCALES ..................................................................................92 4.2.1 FILTROS LINEALES DISCRETOS .......................................................................................93 4.2.2 CONVOLUCIN Y CORRELACIN ESPACIAL..................................................................100 4.2.3 MODELO DE REGRESIN CON VARIABLES CUALITATIVAS ...........................................102 4.2.4 FILTROS NO LINEALES: PROCESAMIENTO MORFOLGICO ...........................................106 4.3 ETAPA DE DECISIN ............................................................................................................117 4.3.1 MODELIZACIN DEL PROBLEMA MEDIANTE LAS FUNCIONES DE DENSIDAD................117 4.3.2 ESTRATEGIAS DE DECISIN ..........................................................................................119 4.3.3 IMPLEMENTACIN DE LA DECISIN: SEGMENTACIN DE IMGENES...........................124 4.3.4 UMBRALIZACIN PARA LA DETECCIN DE DEFECTOS .................................................125 4.4 AGRUPACIN DE PXELES BINARIZADOS...........................................................................130 4.4.1 ELIMINACIN DE FALSAS ALARMAS ............................................................................130 4.4.2 RECONSTRUCCIN DEL DEFECTO .................................................................................131 4.5 MEDIDA DE CALIDAD DE UN PROCEDIMIENTO PARA LA DETECCIN DE DEFECTOS LOCALE.................................................................................................................................132 4.5.1 MEDIDAS BASADAS EN EL ERROR DE BAYES ...............................................................132 4.5.2 MEDIDAS BASADAS EN LAS FUNCIONES DE DISTRIBUCIN ..........................................133 4.6 DISEO DEL SISTEMA DE DETECCIN DE DEFECTOS LOCALES EN LA PASTA DE PAPEL....................................................................................................................................135
DISAM-UPMT-98-015
Carlos Platero
ndice
4.6.1 REALCE DE LOS DEFECTOS LOCALES EN LA PASTA DE PAPEL ......................................136 4.6.2 VALIDACIN DE LAS HIPTESIS DE NORMALIDAD .......................................................139 4.6.3 PARMETROS DEL SISTEMA DE DETECCIN DE DEFECTOS ..........................................141 4.7 CONCLUSIONES ...................................................................................................................145
ANLISIS DE LOS DATOS....................................................................................................147

5.1 ANLISIS DE LOS DATOS CON MAPAS AUTO ORGANIZADOS ...........................................149 5.1.1 MAPAS AUTO ORGANIZADOS .......................................................................................150 5.1.2 CONCLUSIONES SOBRE LOS MAPAS AUTO ORGANIZADOS ...........................................161 5.2 SOM COMO HERRAMIENTA DE CLUSTERING ...................................................................162 5.2.1 DEFICIENCIAS DE LOS MAPAS DE KOHONEN EN EL PROCESO DE CLUSTERING .............163 5.2.2 MTODO U-MATRIZ .....................................................................................................164 5.3 REFINAMIENTO DE LA TCNICA DE CLUSTERING.............................................................166 5.3.1 DISTRIBUCIONES MULTINORMALES .............................................................................169 5.3.2 TRANSFORMACIONES NORMALIZANTES ......................................................................176 5.3.3 LA ESTIMACIN DE MV DE LAS TRANSFORMACIONES BOX COX ................................177 5.3.4 CAMBIOS DE ESCALA DE LA POBLACIN ......................................................................179 5.3.5 DETERMINACIN DE ...............................................................................................180 5.3.6 INTERVALOS DE CONFIANZA Y PRUEBA DE NORMALIDAD ...........................................181 5.4 AGRUPACIN DE DATOS EN LOS DEFECTOS DE PLANCHAS DE ALUMINIO ......................183 5.4.1 EXTRACCIN DEL VECTOR DE CARACTERSTICAS .......................................................184 5.4.2 ANLISIS DE LOS DATOS ..............................................................................................187 5.4.3 APLICACIN DE LAS U-MATRIZ AL ANLISIS DE LOS DEFECTOS DEL ALUMINIO ........189 5.4.4 ELIMINACIN DE COMPONENTES SIN INFORMACIN ESTADSTICA..............................194 5.4.5 BSQUEDA DE ESPACIO NORMALES .............................................................................195 5.5 CONCLUSIONES ...................................................................................................................197
CLASIFICADORES ESTTICOS .........................................................................................199

6.1 CLASIFICADORES PARAMTRICOS ....................................................................................200 6.1.1 CLASIFICACIN A DOS GRUPOS ....................................................................................203 6.1.2 EXPRESIN GENERAL DEL ERROR PARA LA CLASIFICACIN DE DOS GRUPOS ..............204 6.1.3 DISEO DE CLASIFICADORES LINEALES PTIMOS ........................................................215 6.1.4 DISEO DE CLASIFICADORES CUADRTICOS................................................................220 6.2 ESTIMACIN DE LOS PARMETROS MEDIANTE UN CONJUNTO FINITO DE MUESTRAS ............................................................................................................................223 6.2.2 EFECTO DEL NMERO DE MUESTRAS EN EL DISEO DE CLASIFICADORES PARAMTRICO .......................................................................................................................229 6.3MTODO DE PARAMETRIZACIN DE LOS CLUSTER DOS A DOS ........................................240
DISAM-UPMT-98-015
Carlos Platero
6.3.1 REDUCCIN DE LA DIMENSIN: SELECCIN DE LAS CARACTERSTICAS......................240 6.3.2 CLUSTERING PARAMTRICO.........................................................................................243 6.4CLASIFICADORES NO PARAMTRICOS: MTODO DE APRENDIZAJE SUPERVISADO LVQ......................................................................................................................................246 6.4.1 INTRODUCCIN ............................................................................................................246 6.4.2 ALGORITMO LVQ ........................................................................................................247 6.4.3 MODIFICACIONES REALIZADAS EN EL ALGORITMO LVQ1 ..........................................253 6.5 APLICACIN A LA CLASIFICACIN DE DEFECTOS LOCALES EN PLANCHAS DE ALUMINIO COLADO ..............................................................................................................256 6.5.1 PARAMETRIZACIN DOS A DOS DE LOS CLUSTER SEGN MTODO PRESENTADO ........256 6.5.2 DISEO DE LOS CLASIFICADORES PARAMTRICOS.......................................................258 6.5.3 MODIFICACIN DEL ALGORITMO NO PARAMTRICO OLVQ........................................262 6.5.4 COMPARACIN CON OTRAS TCNICAS TRADICIONALES DE CLASIFICACIN ...............264 6.6CONCLUSIONES ....................................................................................................................265
APLICACIONES INDUSTRIALES DE LA TESIS ..............................................................267

7.1 INSPECCIN VISUAL DEL ALUMINIO COLADO ...................................................................267 7.1.1 PROCESO DE OBTENCIN DEL ALUMINIO COLADO .......................................................268 7.1.2 SIVA APLICADO A LAS PLANCHAS DE ALUMINIO COLADO ..........................................270 7.2 INSPECCIN VISUAL DE LA PASTA DE PAPEL.....................................................................276 7.2.1 PROCESO DE OBTENCIN DE LA PASTA DE PAPEL ........................................................276 7.2.2 INSPECCIN DE LA PASTA DE PAPEL.............................................................................276 7.2.3 SIVA IMPLEMENTANDO PARA LA LIMPIEZA DE LA PASTA DE PAPEL...........................278 7.2.4 RESULTADOS ................................................................................................................282 7.3 CONCLUSIONES ...................................................................................................................283
CONCLUSIONES.................................................................................................................... 285 8.1 APORTACIONES DE LA TESIS ..............................................................................................288 8.2 FUTUROS TRABAJOS ...........................................................................................................289
DISAM-UPMT-98-015
Carlos Platero
ndice
BIBLIOGRAFA ........................................................................................................................... 291
NDICE DE FIGIRAS .................................................................................................................. 303
NDICE DE TABLAS ................................................................................................................... 309
DATOS BIOGRFICOS .............................................................................................................311
DISAM-UPMT-98-015
Carlos Platero
Captulo 1: Introduccin

1.1
Introduccin
Marco de la tesis
La tesis presente se enmarca en el mbito cientfico de la Inspeccin automatizada, con el empleo de tcnicas de Visin artificial e Inteligencia artificial. El control de calidad es uno de los aspectos ms importantes en la competitividad industrial. El alto coste de la inspeccin humana ha hecho promover y desarrollar sistemas capaces de resolver las tareas de forma automtica. Una de las mayores dificultades dentro de la Inspeccin es la supervisin de la apariencia visual. sta es encargada, en la mayora de las ocasiones, a inspectores humanos. El sistema de visin humano es adecuado para su funcionamiento en un mundo de variedad y cambio, mientras que el proceso de inspeccin visual industrial, requiere de la observacin de una escena repetida de forma que se puedan detectar anomalas. La exactitud del sistema humano de visin empeora con el trabajo repetitivo y montono. El resultado es una inspeccin lenta, cara y errtica. La inspeccin visual automatizada es, obviamente, la alternativa a los inspectores humanos, liberndolos de tan alienante trabajo. De entre los posibles escenarios de los Sistemas de Inspeccin Visual Automatizada, SIVA, esta tesis se ha centrado en la inspeccin visual de superficies planas y homogneas. Las razones de estas restricciones vienen dadas por las complejidades de diseo de estos sistemas en trminos generales. No obstante, esta acotacin del problema resulta vlida en el
DISAM-UPMT-98-015
11
Inspeccin automatizada de superficies homogneas mediante Visin artificial
Carlos Platero
desarrollo de muchas aplicaciones SIVA para las necesidades de la industria actual. De hecho, a lo largo de los ltimos aos se han desarrollado mltiples arquitecturas para la deteccin de defectos visuales en superficies planas y homogneas, tales como textiles, maderas, aceros, aluminio, plsticos, pasta de papel y un sinfn de productos industriales, mostrando un gran inters tanto para la industria como para la investigacin aplicada. Si bien hay constatacin de mltiples sistemas de inspeccin de superficies [Piiro90][Oulu97][Parsy97][EES92], en ningn caso existe una metodologa completa que permita, independientemente de las caractersticas del proceso, configurar el sistema de inspeccin visual automatizado[Newma95]. Los trabajos presentados muestran soluciones particulares atendiendo a las condiciones de la inspeccin. An as, de todos ellos se desprende una filosofa comn, caracterizada por tres bloques. Una primera etapa encargada de la formacin de imgenes, con los objetivos de realzar los defectos visuales en la escena y trasladarlos a la memoria del computador. Un segundo bloque llamado sistema de deteccin de defectos, que trata de localizar los defectos de apariencia visual. Y por ltimo, un tercer bloque de clasificacin, convirtiendo la informacin seleccionada en una etiqueta de catalogacin. A veces resulta este ltimo bloque como optativo. El desarrollo de esta tesis pretende ofrecer una solucin metdica al diseo de sistemas de inspeccin visual automatizada de superficies planas y homogneas. La consecucin de este objetivo debe cubrir los fundamentos y criterios para el diseo del sistema de iluminacin sobre superficies planas, estrategias de arquitectura de adquisicin de escenarios SIVA, la elaboracin de algoritmos de deteccin de defectos locales, la representacin virtual de los defectos junto con la seleccin de las mejores caractersticas y por ltimo, la clasificacin de los defectos. Como marco del desarrollo experimental de la tesis, as como de aplicacin industrial, se ha participado en la implementacin de dos sistemas de inspeccin. Un primer SIVA dedicado a la deteccin y clasificacin de faltas visuales en el aluminio colado, capaz de discernir la ausencia/presencia de defectos locales en las planchas de aluminio, as como de su clasificacin. Y un segundo sistema diseado para la deteccin de defectos locales en la pasta de papel. Las arquitecturas desarrolladas han servido de bancada para probar la bondad de las propuestas presentadas en esta tesis. 1.1.1 Alcance de la tesis La determinacin en superficies planas y homogneas de la presencia o ausencia de defectos, as como de su clasificacin, mediante tcnicas de Visin artificial e Inteligencia artificial ha sido tema de estudio por mltiples autores. Todos coinciden bsicamente en el planteamiento de tres hitos importantes: formacin de imgenes, algoritmos de deteccin y en menor medida la clasificacin de los defectos. El primer hito cubre desde la iluminacin hasta el almacenamiento de la seal en la memoria del computador. En referencia al sistema de iluminacin, la problemtica se centra en la colocacin ptima entre los focos luminosos, la superficie a inspeccionar y las disposiciones de los sensores. Con tal propsito, se requieren conocer los modelos sobre la
12
DISAM-UPMT-98-015
Carlos Platero
reflexin de la luz en superficies planas [Nayar91], los comportamientos de los focos luminosos [Genn94] y las actuaciones de los sensores [Holst96]. De esta forma se podr determinar la colocacin geomtrica de los focos y las cmaras respecto de las superficies a revisar. No hay que olvidar que el propsito de este bloque es aumentar todo lo posible el realce en la escena. En cuanto a la instrumentacin asociada a la adquisicin de imgenes, depende fundamentalmente de la velocidad de desplazamiento de la superficie y del tamao de los defectos. Es el proceso industrial el que va a definir qu tipo de tecnologas de cmaras se necesitan, cules deben ser sus resoluciones y el nmero de sensores que son imprescindible para la inspeccin. En cuanto a las tcnicas empleadas para la deteccin de defectos, stas se han centrado en el procesamiento y segmentacin de las imgenes recibidas[Norton82][Brads94][Macai93], con el objeto, primero, de aumentar el realce entre defecto y fondo, y segundo, segmentar las imgenes para la localizacin de los defectos locales. Para el realce de los defectos se han utilizado tanto filtros lineales como no lineales, mientras las tcnicas de segmentacin empleadas se basan en las propiedades de los histogramas. Menos explotado y extendido es el estudio de la clasificacin de los defectos detectados. En parte porque las exigencias industriales no lo precisan, o bien porque son sencillos clasificadores basados en alguna propiedad directa de los objetos defectuosos detectados. Sin embargo, a veces se necesita la catalogacin de faltas complejas. Estos clasificadores presentan algunas peculiaridades. Suele suceder que algunos tipos de defectos tienen frecuencias bajas de aparicin, por lo que no se tienen muestras o el nmero de ellas es poco representativo. Adems, tambin ocurre que el precio de tener un universo del problema sea econmicamente costoso, por lo que las poblaciones que se parten para el diseo de estos clasificadores suelen ser escasas. En esta tesis se abordan estos tres hitos, intentando dar soluciones y caminos que ofrezcan mtodos rigurosos de anlisis, para que en una fase posterior se pase al diseo de cada uno de estos sistemas. Los prximos captulos exponen de forma ordenada el planteamiento del problema en concreto, su anlisis, las tcnicas a emplear y por ltimo se muestra el trabajo experimental desarrollado.
1.2
Objetivos
El objetivo general de esta tesis es el desarrollo de tcnicas de Visin e Inteligencia artificial conducentes tanto a la caracterizacin de defectos en superficies planas y homogneas, como a la deteccin y clasificaciones de tales defectos, de forma que la informacin obtenida sea integrable en tiempo real dentro del proceso productivo. Con tal fin, los objetivos desglosados en puntos correspondern a: Proposicin de una arquitectura general para el sistema de inspeccin automatizada de superficies planas y homogneas.
DISAM-UPMT-98-015
13
Carlos Platero
Estudio de la problemtica de iluminacin sobre superficies planas. Diseo del sistema de iluminacin, constituido por las fuentes luminosas y los sensores. Localizacin de los elementos de iluminacin y adquisicin junto con las tecnologas a emplear. Estudio sobre la adquisicin de seales de vdeo, su resolucin y exactitudes de las medidas tomadas. Planteamiento de una solucin que permita explorar el 100% de la superficie analizada sin que sta se detenga ante el dispositivo de captacin y que no intervenga en el proceso productivo. Desarrollo de algoritmos de realce de defectos locales basados en el diseo de filtros lineales y no lineales. Mtodos de segmentacin para la deteccin de defectos locales basados en el anlisis del histograma. Desarrollo de medidas de calibracin sobre las distintas tcnicas empleadas para la deteccin de los defectos. Estudio y desarrollo de tcnicas de modelizacin de los defectos, consistencia de la representacin virtual y extraccin y seleccin de las mejores caractersticas. Anlisis exploratorio de los datos para la decantacin de las distintas subclases de defectos. Desarrollo de la metodologa para el reconocimiento de defectos haciendo uso de tcnicas estadsticas y cognitivas.
1.3
Estructura de la tesis
La configuracin de la tesis en captulos viene dada como sigue: un captulo inicial sobre la problemtica concerniente a la inspeccin visual automatizada, para pasar a desarrollar en los siguientes cuatro captulos el anlisis y diseos de las cuestiones planteadas, esto es, formacin de imgenes, deteccin de los defectos locales, anlisis de los datos y clasificacin de los defectos. Para acabar se muestran las aplicaciones industriales elaboradas, las cuales han servido como marco de trabajo experimental. Una explicacin ms detallada de los siguientes captulos se muestra a continuacin con el objeto de ilustrar por separado qu problemtica se estudia en cada tema. El captulo segundo presenta la problemtica de la Inspeccin visual automatizada. Se empieza con una evolucin histrica de la Inspeccin industrial llegando a la conclusin de la necesidad de insertar las operaciones de inspeccin dentro del proceso manufacturero. Adems, tambin se concluye que la inspeccin visual automatizada es ideal para la mejora de la produccin y de la competitividad de las empresas. Llegado a este punto, se centra la problemtica sobre los SIVA, indicando sus ventajas e inconvenientes. Luego se pasa a un
14
DISAM-UPMT-98-015
Carlos Platero
anlisis de los SIVA mediante la clasificacin de stos atendiendo al tipo de informacin a tratar, a las tcnicas empleadas y a la geometra de las superficies a inspeccionar. La exposicin concluye con referencias a SIVA implementados y a la literatura especializada. El estudio sobre la formacin de imgenes en SIVA ser desarrollado en el tercer captulo. El primer problema a resolver trata sobre la ubicacin ptima de los focos luminosos y sensores respecto a la superficie a inspeccionar, por lo que se hace necesario el estudio sobre el comportamiento de la luz en superficies planas, as como el desarrollo de modelos sobre las fuentes luminosas y los captadores. A partir de stos se ha intentado o bien una iluminacin uniforme sobre la superficie a inspeccionar, o bien se ha buscado qu componentes de la luz reflejada tienen mayor nivel de informacin. Se ha trabajado sobre una metodologa basada en las expresiones analticas de las fuentes luminosas y en sus desarrollos de Taylor, de manera que determine la ubicacin correcta de los focos y elementos complementarios para una iluminacin uniforme sobre la escena. Tambin se ha trabajado sobre el comportamiento de la luz en superficies lisas para la ptima localizacin de focosensor. Presentndose una de las aportaciones de la tesis, en referencia a la metodologa empleada para el diseo del sistema de iluminacin y su ubicacin. El segundo problema se refiere a la tecnologa de los sensores y a la arquitectura empleada. Se hace un planteamiento sobre los factores a considerar en la eleccin de las cmaras de vdeo. Por ltimo, se dan referencias bibliogrficas de cmo ha sido resuelto el problema de formacin de imgenes en SIVA documentados. A partir del cuarto captulo, se pretende mostrar una metodologa sobre la deteccin de defectos locales en superficies planas y homogneas. El planteamiento pivota en tres bloques: realce, deteccin y eliminacin de falsas alarmas. Sobre el realce de los defectos se plantea el diseo de filtros lineales y no lineales, ofreciendo un mtodo para la determinacin de la mscara de convolucin lineal, presentndose como novedoso. En cuanto a la deteccin, sta se basa en las funciones de densidad del fondo y del defecto, desarrollando tcnicas de segmentacin basadas en el anlisis del histograma. Respecto a la eliminacin de falsas alarmas, se proponen tcnicas de procesamiento morfolgico con el objetivo de mejorar los resultados de la deteccin. El captulo acaba mostrando un procedimiento que permita calibrar cul de las tcnicas propuestas para la deteccin da el mejor resultado, siendo sta otra de las aportaciones de esta tesis. Una vez detectados los defectos locales en la superficie y determinada la conversin de la imagen segmentada en un vector de caractersticas, se pasan las faltas a la etapa de clasificacin. Los dos siguientes captulos tienen como objetivo, dar una metodologa de actuacin para la catalogacin de las muestras. La idea bsica es integrar tanto las tcnicas estadsticas como las tcnicas cognitivas en la resolucin del problema. El quinto captulo trata del anlisis exploratorio de los datos, etapa encargada de la bsqueda de los grupos inherentes del universo del problema. Se han utilizado como base los mapas auto organizados. Sin embargo, muestran algunas limitaciones, que son analizadas para pasar a rengln seguido a proponer una nueva metodologa. El fundamento del mtodo propuesto se sustenta en la parametrizacin de los grupos mediante funciones de densidad. En general, en un SIVA se trata de clasificar las formas de los defectos locales, ofrecindose stos como patrones de tipo esttico. Otra de las peculiaridades de estos sistemas
DISAM-UPMT-98-015
15
Carlos Platero
es la falta de muestras para el diseo de los clasificadores. El sexto captulo aborda el diseo de los clasificadores paramtricos y no paramtricos, sujetos a las mencionadas condiciones, indicndose expresiones analticas tanto del error de clasificacin como su sesgo, siendo unas de las aportaciones ms significativas de la tesis. Tambin, es presentado un novedoso mtodo de parametrizacinseleccin de las caractersticas basadas en transformaciones Box Cox y en las distancias de Bhattacharyya. Por ltimo se comparan los resultados obtenidos con las tcnicas de Reconocimiento de formas tradicionales. El captulo 7 describe las aplicaciones industriales acometidas durante la realizacin de esta tesis. Se presenta tanto el SIVA elaborado para el aluminio colado como para la pasta de papel. El esquema empleado trata de exponer la problemtica a resolver y cmo se ha diseado la formacin de imgenes, la deteccin de los defectos y su clasificacin para cada uno de stos. Por ltimo, en el captulo octavo se hace un resumen del trabajo realizado as como de las aportaciones novedosas presentadas. Para acabar indicando algunas posibles lneas de trabajo a investigar en el futuro.
16
DISAM-UPMT-98-015
Carlos Platero
Captulo 2: Problemtica de la Inspeccin visual automatizada
Problemtica de la Inspeccin visual automatizada
En este captulo se presenta la problemtica de la Inspeccin visual automatizada. Se empieza con una evolucin histrica de la Inspeccin industrial, recalcando la necesidad de insertar las operaciones de inspeccin dentro del proceso de produccin (2.1). De esta idea y dentro de las diferentes tcnicas que pueden ser empleadas, la automatizacin de las operaciones de inspeccin visual resulta de las que mejor encaja, presentndose en muchos casos ser vital en la mejora del proceso productivo y en su competitividad (2.1.1). Llegado a este punto, se centra la problemtica en la Inspeccin visual automatizada (2.2). Son presentadas las ventajas e inconvenientes de los SIVA (2.2.1 y 2.2.2). Seguidamente se pasa a la clasificacin de los SIVA atendiendo a la geometra de las superficie (2.2.3.1), al tipo de informacin recogida (2.2.3.2) y a las tcnicas empleadas(2.2.3.3). Estas dicotomas permiten establecer el marco de trabajo dentro de la filosofa SIVA. Las referencias a SIVA implementados ensean algunas de las soluciones tomadas(2.2.4). Por ltimo, una gua sobre literatura SIVA muestra la cantidad de libros, artculos y ponencias, indicando la efervescencia de un campo de investigacin en alza (2.2.5).
DISAM-UPMT-98-015
17
Inspeccin automatizada se superficies homogneas mediante Visin artificial
Carlos Platero
2.1
La Inspeccin industrial
La inspeccin fue uno de los motores de la Revolucin industrial, al ayudar a la realizacin de productos con dimensiones consistentes. Con partes estndar, la nocin de intercambiabilidad fomentada por Whitney fue finalmente una realidad. La produccin en serie era posible y las organizaciones tendieron a ser ms complejas. A principios de siglo, con el aumento de la complejidad se vio la necesidad de separar y formar departamentos de inspeccin. Durante las tres cuartas partes del siglo, el nmero de inspectores se ha incrementado paulatinamente, asegurndose stos la responsabilidad de la calidad de los productos. Los inspectores han actuado cuando detectaban alguna anomala en el proceso. Pero frecuentemente, esta actitud significaba que mientras se localizaba la mala calidad del producto, algunos productos ya haban sido embarcados y recibidos por el cliente. Durante la mayor parte del siglo XX, la organizacin de la inspeccin estaba normalmente separada del proceso productivo. La responsabilidad de la inspeccin de los productos dependa del departamento de calidad. Sin embargo, la constatacin de que la calidad del producto no poda darse desde fuera, sino en su propio proceso, supuso un punto de inflexin en la Inspeccin industrial. En una industria cada vez ms automatizada, donde el diseo de los productos puede ser modificado, las operaciones del proceso cambian de secuencia con slo variar las rdenes en un programa. Es este ambiente el que propicia que las operaciones de inspeccin no estn aisladas del proceso, al contrario, deben formar parte de ste. Aun ms, la mejora de la produccin manufacturera va a depender de la integracin de sistemas de inspeccin dentro del proceso [Winch96]. En el proceso productivo, el resultado es un producto cuyas propiedades varan dentro de un rango. Las causas de esta variabilidad son debidas, a las propiedades estocsticas del control del proceso, la falta de uniformidad de las materias primas, las variaciones ambientales, como temperatura, humedad, vibraciones, y por supuesto los errores humanos. La variabilidad del proceso productivo es una de sus caractersticas. Luego, la inspeccin se encuentra dentro de un mundo variable, en el cual va a tratar de identificar la extensin de la variabilidad. Por estas razones, es frecuente representar las medidas mediante distribuciones normales. Algo muy utilizado y que en esta tesis tambin se va a aplicar. Dependiendo de la variabilidad un proceso podra producir productos aceptables, rechazables o bien provocar el reajuste del propio proceso. Este conocimiento es crtico en cualquier proceso y continuar siendo crtico en el futuro. En trminos simples, la inspeccin puede ser vista como el examen de alguna caracterstica del producto, la cual trata de determinar si se encuentra dentro de los valores esperados. Para su determinacin debe considerarse el emplazamiento, los mtodos, los instrumentos y si hay necesidad de realizar historiales.
18
DISAM-UPMT-98-015
Carlos Platero
2.1.1
Taxonoma de los problemas de inspeccin Una primera ayuda para adentrarse en la inspeccin, es realizar una catalogacin de atributos alrededor de sta: dnde se hace el control de calidad, qu parte de la produccin es considerada, qu medidas se realizan o qu tipo de tecnologa se emplea. A continuacin se exponen los conceptos bsicos de la problemtica de la inspeccin Una primera clasificacin se establece en la ubicacin del control de calidad. Las inspecciones pueden empezar en la recepcin de las materias primas, continuar en puntos del proceso, y concluir en el empaquetado y embarque. El control de recepcin se aplica a las partidas de nuevos productos, sean stas materias primas, productos semiacabados o acabados, las cuales se inspeccionan para verificar las especificaciones establecidas. El control en curso de fabricacin se realiza continuamente durante la fabricacin del producto, a intervalos de tiempos fijos, y tiene por objeto vigilar el funcionamiento del sistema en las mejores condiciones posibles y recoger informacin para mejorarlo. El control de fabricacin produce, a la larga, los mayores beneficios. Adems de las funciones de inspeccin, que comparte con el control de recepcin, permite aprender sobre las causas de variabilidad del proceso, aportando datos para mejorarlo. Por esta razn, el control de fabricacin es una herramienta imprescindible para la evaluacin de acciones encaminadas a prevenir fallos, y a perfeccionar el proceso productivo. Las inspecciones en la salida van dirigidas aceptar o rechazar el producto. Es frecuente utilizar secuencias estadsticas sobre la produccin final, con el objetivo de descubrir tendencias de desajuste del proceso. Una segunda divisin se encuentra en el tipo de medida a realizarse. Pueden tomarse medidas sobre una caracterstica de calidad medible (longitud, masa, contenido de impurezas, etc.), o sobre atributos o caractersticas cualitativas que el producto posee o no posee (control pasa/no pasa, por piezas defectuosas). El control por caractersticas medibles o por variables es ms informativo que por atributos, ya que indica no slo si un elemento es o no defectuoso, sino, adems, la magnitud del defecto. No es lo mismo que un elemento tenga una longitud fuera de tolerancia por micras que por centmetros. En consecuencia, es mucho ms eficaz para identificar las causas de los problemas de calidad mediante variables cuantitativas. Lo que justifica que se utilice especialmente en el control de procesos. Cuando el objetivo del control no es establecer acciones preventivas, sino nicamente verificar las especificaciones (como ocurre en el control de recepcin), el control por atributos es el ms adecuado. Por ser ms rpido y simple de aplicar y, por tanto, ms econmico. Una tercera dicotoma est en los mtodos a emplear. Estas operaciones pueden ser realizadas por operadores o automticamente. Ambas deben ser consideradas para la mejora de la calidad del producto. La capacidad de razonamiento del humano es un elemento muy importante en estas operaciones, su habilidad y flexibilidad no puede ser comparada con ninguna mquina. Sin embargo, los aspectos de fatiga y cansancio, hacen mella en el operario, tomando a veces actitudes subjetivas. En cambio la automatizacin de la inspeccin, permite dar un juicio invariable en el tiempo, aunque este juicio no sea tan rico en matizaciones como el del humano.
DISAM-UPMT-98-015
19
Carlos Platero
Esta tesis, como fue comentado en el anterior captulo, se enmarca dentro de la Inspeccin visual automatizada, por lo que se procede al estudio de su problemtica.
2.2
Inspeccin Visual Automatizada

La inspeccin visual de objetos forma parte del proceso de fabricacin. La automatizacin de esta tarea est siendo realizada de manera lenta, si se compara con otros eslabones de la cadena de produccin, como transporte de materias primas o ms recientemente la mecanizacin y ensamblaje de productos. La razn de esta languidez hay que buscarla en su enorme dificultad. Su complejidad viene originada, por la cantidad de capacidad de razonamiento que es necesaria implementar, ya sea para aceptar/rechazar un producto o clasificarlo segn un tipo de defecto. La complicacin del problema es tan elevada, que excepto unos pocos sistemas experimentales [Marsh90], el diseo se orienta a la inspeccin de una tarea altamente especificada. La construccin de un Sistema de Inspeccin Visual Automatizada, SIVA, y en ingls conocido como Automated Visual Inspection, AVI, requiere de la intervencin de mltiples disciplinas, tales como la Automtica, la Visin e Inteligencia artificial o la Mecnica. An siendo de una gran complejidad, con unos costes elevados, aunque decrecientes, y enmarcado en un contexto internacional de economas abiertas, la automatizacin de las tareas de inspeccin visual se convierte en exigencia en sectores productivos con altos niveles de competencia. En los ltimos aos, ha habido un aumento de atencin por parte de la comunidad cientfica y tcnica en el desarrollo de los SIVA, primero por lo apuntado anteriormente, una necesidad industrial con creciente prioridad. En segundo lugar, porque ha lanzado a la comunidad un conjunto de retos asociados a la Visin artificial y al Reconocimiento de Formas. Y por ltimo, el aumento de capacidad de trabajo de las computadoras, as como de soporte fsico especializado, ha roto las fronteras de imposibilidad de operatividad en lnea, junto con un abaratamiento de los costes. Todo ello ha impulsado, a una efervescencia en torno a los SIVA, que queda reflejado por el aumento de sistemas instalados, as como por la proliferacin de literatura especializada y de congresos monotemticos. Si bien cabe decir que no es una acepcin universal, dentro de la nomenclatura SIVA hay que distinguir los conceptos de inspeccin, test y reconocimiento. Inspeccionar es el proceso de determinacin de si un objeto se desva de un conjunto de especificaciones. Generalmente, la inspeccin visual implica medidas de los objetos, acabados superficiales y ensamblajes de elementos. La inspeccin es una tarea dentro del control de calidad, pero se distingue de una labor de test, pues la primera implica un examen completo del producto y la segunda una exploracin espordica. El reconocimiento consiste en la identificacin positiva de los objetos detectados en la fases de inspeccin o de test. La identificacin del objeto dentro de los SIVA, en general, no es necesario, ya que sta asume un conocimiento a priori del problema. Por tanto, inspeccin, test, y reconocimiento son distintas pero tareas que estn relacionadas. Una pieza puede ser
20
DISAM-UPMT-98-015
Carlos Platero
inspeccionada y detectadas sus anomalas, pero su identificacin y catalogacin corresponder a una etapa de reconocimiento. Con dicho motivo, el desarrollo de esta tesis lleva dos lneas claramente definidas, una basada en la deteccin de los defectos, ntimamente ligada al Procesamiento de imgenes, y la otra, en la clasificacin de las faltas asentada en el Reconocimiento de formas. 2.2.1 Ventajas de la Inspeccin Automatizada Visual En el mundo industrial, las tareas de inspeccin han sido realizadas tradicionalmente por operarios humanos, bien sea en su totalidad o por muestras representativas del lote. Algunas experiencias [Barri69] han indicado que los inspectores humanos tienden a ser ms exactos, en la inspeccin por lotes muestreados que en la modalidad de 100 % del producto, probablemente por razones de fatigamiento y alienacin. Como resultado, la inspeccin del 100% con operadores humanos requiere de altos niveles de redundancia, lo cual incrementa el coste y el tiempo para la inspeccin. Sin embargo, sea por razones de competitividad, como ocurre en las industrias transformadoras de materias primas, acero, aluminio, papel, ..., o porque corresponde con aplicaciones crticas, tales como industria farmacutica o aerospacial, donde un simple fallo es inaceptable, la mayora de estas empresas son conscientes de la importancia de la calidad del producto. El coste de una pobre calidad en los componentes ha sido estimada, en trminos de ventas perdidas, entre un 5% y un 10%, y aproximadamente un 20% de ventas sobre productos finales [LeBea90]. Por tanto, el 100 % de la inspeccin es deseable. La inspeccin basada en el muestreo de la produccin tiene dos inconvenientes: el riesgo del fabricante y el riesgo del consumidor, la primera viene originada por el error producido al rechazar un lote cuando ste cumple con los requisitos, mientras el riesgo del consumidor es la aceptacin de un lote de baja calidad. Las consecuencias asociadas a estos errores son, la prdida de confianza y de reputacin de los productores. La reduccin de los errores de inspeccin tienden a anularse cuando se examina el 100 % del producto. La inspeccin automatizada es necesaria, pues los inspectores humanos no son siempre evaluadores conscientes de los productos. De hecho, en los estudios llevados a cabo [Smith93], se ha observado que la inspeccin visual humana tiene, en el mejor de los casos, una efectividad del 80 %, y adems sta se consigue con una frrea estructura de chequeo. En contraste con estos datos, los sistemas de inspeccin basados en Visin artificial, resultan tener menores costes laborales y con una medida de calidad objetiva, medible y mejorable. Aun con mayor motivo, los SIVA se presentan como la solucin perfecta en ambientes insalubres. Normalmente, muchas tcnicas de inspeccin son ejecutadas con la intervencin de dispositivos que se ponen en contacto con el objeto a examinar, necesitando, a veces, detenerlos y colocarlos segn posicin y orientacin. Mientras en la filosofa SIVA, la posibilidad de colocar los sensores pticos en los lugares apropiados, permitirn las observaciones sin necesidades de detencin. Adems, los controles visuales no implican contactos con los objetos, disminuyendo los riesgos de deterioro de los productos.
DISAM-UPMT-98-015
21
Carlos Platero
Tradicionalmente, las operaciones de inspeccin suelen realizarse al finalizar el ensamblaje del producto. Sin embargo, la inspeccin durante el proceso de produccin ofrece ciertas ventajas. En el caso de slo detectar fallos en la ltima fase, los materiales empleados, el tiempo consumido y la mano de obra utilizada, han sido desperdiciados. Por ejemplo, dentro de la industria de PCB, se ha estimado que encontrar un fallo antes de montar los componentes sobre el circuito impreso, costara alrededor de 25 centavos, mientras el mismo defecto localizado al termino del montaje de componentes, tendra un coste aproximado de 40 dlares [Zeuch88]. Nada impide utilizar SIVA en cualquier parte del proceso, a diferencia de los inspectores humanos que requieren un determinado espacio y un ambiente salubre. Los procesos de ensamblaje con multitud de movimientos en poco tiempo, hace fsicamente imposible la inspeccin visual humana. Otro tanto sucede, cuando se trata de examinar bandas de materias primas. Las velocidades con que se mueven, como es el caso del acero, el papel, la madera, suelen ser tan elevadas, que la efectividad del operario es decreciente con el paso del tiempo. En definitiva, el operario muestra poca eficacia en ambiente repetitivos con escenas poco cambiantes o con movimientos a gran velocidad. Una de las mayores prestaciones de los SIVA, es su utilidad como elemento de realimentacin en el proceso productivo. Una elevada frecuencia de aparicin de un determinado tipo de defecto, podra indicar el mal funcionamiento de una herramienta o de una mquina, en el ciclo. Por ejemplo, dentro de los SIVA implementados en el contexto de esta tesis, la aparicin de un determinado nivel de defectos del tipo shive en la pasta de papel, indicaba la mala coccin de la madera. Y en el caso de aluminio colado, la falta llamada sticking, vena originada por el desgaste de los rodillos de prensado. Resumiendo, las ventajas atractivas de las mquinas industriales de Visin artificial respecto al sistema de visin humano son : La inspeccin humana es vulnerable. Los SIVA pueden ser emplazados en ambientes peligrosos y en condiciones extremas de espacio. La inspeccin humana es subjetiva. Los SIVA pueden realizar medidas con gran objetividad y repetitividad. La inspeccin humana es falible. Los SIVA nunca comenten un error por aburrimiento o por falta de atencin. La inspeccin humana puede ser demasiada lenta. Los SIVA suelen trabajar en tiempo real respecto al proceso manufacturero. La inspeccin humana es insensible a cambios sutiles que afectan a la totalidad de la escena. Los SIVA pueden observar tales cambios y reaccionar ante ellos con objetividad.
22
DISAM-UPMT-98-015
Carlos Platero
La inspeccin humana es reticente. Los SIVA pueden estar integrados en el proceso manufacturero, haciendo de bucle de realimentacin.
2.2.2
Limitaciones de los SIVA Aunque la Inspeccin Visual Automatizada pudiera parecer la panacea en la reduccin de costes y en el aumento de la calidad, esta solucin no es siempre posible. La viabilidad del sistema de inspeccin depende de varios factores, de su funcionamiento en tiempo real y de su consistencia, robustez y eficiencia. Es difcil definir formalmente el significado de inspeccin en tiempo real, si bien Van Gool et al [VanGo91] han sugerido una definicin de trabajo, que el sistema de inspeccin visual no sea el mayor cuello de botella en la reduccin del ciclo de trabajo o en la velocidad de operacin del robot. Desde la problemtica del tiempo real, la validez del sistema depende de la capacidad de procesar el volumen informativo que le llega desde los sensores y consiga catalogar el producto. Por ejemplo, en el caso de examinar una banda de produccin, la velocidad de sta es crtico en la operatividad del sistema. En la prctica y dentro de la inspeccin de superficies planas, hay velocidades de bandas de acero por encima de los 600 m/min [Dahle90], mientras que en el aluminio colado es de 2 m/min [Plate95a]. De otro lado, la inversin inicial de los SIVA es elevada y consumen mucho tiempo en el desarrollo. Los coste de diseo pueden superar por encima de los 100.000 dlares [VanGo91]. Y generalmente, los costes de ingeniera no pueden ser amortizados entre varios sistemas, por el carcter especfico de cada uno de ellos. Casi obligando en cada nuevo diseo a empezar desde cero. Por tanto, la inspeccin automatizada visual es slo posible cuando la aplicacin va a trabajar sobre un gran volumen de negocio, cuando se demande medidas muy precisas, se requiera inspeccin consistente o se trabaje en un ambiente muy inhspito. Las complejidades de procedimientos existentes en los SIVA, pueden ser reducidas con los emplazamientos adecuados de los objetos a examinar. Cintas transportadoras, tablas rotatorias, sistemas de posicionamiento y mltiples sistemas mecnicos, estn siendo usadas para facilitar las tareas de inspeccin. Los sistemas mecnicos son piezas fundamentales en el diseo. Por ejemplo, en la inspeccin de baldosas cermicas de Fernndez [Fernn97a], los algoritmos de deteccin de faltas en la serigrafa, basados en template matching, resulta muy crtico el sistema mecnico de parada y posicin de las baldosas. Similares preocupaciones se encuentran en la inspeccin de pliegos de billetes de bancos de Sebastin [Sebas95]. Las tcnicas de iluminacin son otra baza en la simplificacin del problema. Iluminacin a contra luz suele ser frecuente en la inspeccin de simples objetos. Diferentes tcnicas de contraste de iluminacin, como uso de la componente especular o luz estructurada, han sido exitosas en la inspeccin en altas velocidades. Desafortunadamente, los sistemas mecnicos de posicionamiento y las arquitecturas de iluminacin no son suficientes para atacar el examen de superficies complejas. La flexibilidad humana de cambiar los puntos de vista, tanto de posicin como de luz recibida, hacen de estas virtudes irremplazables por ningn sistema automtico.
DISAM-UPMT-98-015
23
Carlos Platero
Las riquezas de matices de los inspectores humanos no pueden ser desestimadas. Wright [Wrigh88] ha observado como los operarios realizan inspecciones precisas y bajo razonamientos de aceptacin / rechazo extremadamente complejos, siendo especialmente cierto cuando es aplicado a formas arbitrarias. Por ejemplo, en el proceso de montajes de piezas aerospacial, la conjuncin de maquinaria en la realizacin de las tareas es de una dificultad tan elevada, que se llega afirmar que el ciclo de trabajo es no determinista e inestable, y que las valoraciones y habilidades de los operarios son absolutamente necesarios dentro de la monitorizacin del proceso. La automatizacin de inspeccin inteligente y flexible seguir siendo un reto de investigacin en los aos venideros. 2.2.3 Clasificacin de los Sistemas de Inspeccin Visual Automatiza (SIVA) 2.2.3.1 Clasificacin atendiendo a la geometra de la superficies a inspeccionar Newman [Newma95] ha realizado una clasificacin sobre los posibles Escenarios de Inspeccin escenarios en los que se enfrentan la inspeccin visual. Su clasificacin se Objetos compuestos por Objetos compuestos por basa en las geometras de las superficies a superficies arbitrarias superficies cuadrticas observar. La figura 2.1 muestra la dicotoma segn el tipo de superficie del Identificacin Identificacin objeto a inspeccionar. En el primer nivel conocida desconocida del rbol dicotmico, la separacin se Posicin Posicin Posicin Posicin produce por el tipo de superficie que desconocida conocida desconocida conocida constituyen los objetos a inspeccionar, distinguindose entre superficies arbitrarias y superficies cuadrticas. Muchos de los objetos industriales pueden modelarse usando slo planos y Figura 2.1 Escenarios de inspeccin segn unas pocas primitivas cuadrticas, como geometra de superficies esferas y cilindros. Por tanto, la mayora de los sistemas de inspeccin no tratan con las complicaciones de superficies arbitrarias. Sin embargo, con el incremento del uso de plsticos en la industria, las superficies de los objetos tienden a tener formas libres y complejas, generando una demanda de SIVA que manejen geometra de superficies libres. En el nivel siguiente del rbol indica si la inspeccin requiere de la solucin de un sistema de reconocimiento de formas. Los objetos que son expuestos delante de los sensores pueden ser conocidos o no de antemano. En el caso normal, las escenas son estructuradas y todos los elementos se encuentran en la base de datos del SIVA. Por ltimo, en el nivel ms bajo del rbol est si se conoce o no la posicin de los objetos. En la mayora de los sistemas reportados focalizan el problema bajo el dominio de identificados los objetos y conocidas las posiciones.
24
DISAM-UPMT-98-015
Carlos Platero
En esta tesis, se ha enfrentado al problema de escenarios de superficies modeladas con planos, objetos identificados, entendindose que todos los posibles defectos son conocidos y sus posiciones tambin estn encuadradas dentro del escenario SIVA. 2.2.3.2 Clasificacin atendiendo al tipo de imgenes adquiridas Segn el tipo de informacin dada por los sensores, los SIVA se pueden clasificar en inspeccin basada en imgenes binarias, en niveles de grises, en imgenes de color o en imgenes tridimensionales. Histricamente, la mayora de los sistemas de visin comercial para la inspeccin automtica han usado imgenes binarias. Muchos de estos sistemas utilizan imgenes de baja resolucin y sus prestaciones suelen ser simples verificaciones, tales como test o presencia de alguna parte [King85]. La informacin binaria es suficiente para la inspeccin de muchos objetos industriales, a los cuales basta con representarlos mediante su silueta. Esta arquitectura ofrece ventajas de tipo econmico, al ser constituido por sensores de bajo costo, en conjuncin de sistemas de iluminacin simples, como de tipos a contraluz. La informacin adquirida permite inspeccionar objetos de altos contrastes entre s, pero resulta difcil o imposible determinar su orientacin o su textura. De otro lado, el nivel de datos a procesar se reduce considerablemente, lo que ayuda tanto en los requerimientos de velocidad de procesado como de los costes[Chin92]. Tpicamente, los sistemas de visin de imgenes binarias son empleadas en simples verificaciones de las escenas, como puede ser el examen de contornos. Mltiples sistemas de inspeccin basados en niveles de grises han sido presentados en la literatura. Sin embargo, hay muy pocos sistemas que sean capaces de ejecutar inspeccin visual en ambientes complejos, aunque esta matizacin se puede generalizar para cualquier tipo de informacin. La mayora de estos SIVA localizan los defectos mediante el anlisis del histograma o utilizando sustraccin de imgenes[Batch92]. No obstante, el avance de las tecnologas de procesamiento de seales ha permitido dar un impulso muy importante durante la dcada de los 90 a SIVA con imgenes en niveles de grises, de hecho en la tabla 2.1 queda reflejada la tendencia actual, imprimida en anlisis de imgenes basadas en niveles de grises. Se ha observado que el color es un factor importante en la inspeccin tanto de textiles como de alimentos, donde las variaciones de color indican la posibilidad de defectos. Los humanos no suelen utilizar el color para la inspeccin, pues no se tiene buena memoria para los colores. Sin embargo, la inspeccin de tareas mediante color son muy apropiadas para la automatizacin. No obstante, la necesidad de ms capacidad de procesamiento ha limitado por ahora un tanto su difusin. Adems, factores como la intensidad de la fuente luminosa, el ngulo de incidencia, el nivel de temperatura del foco, la apertura de la lente resultan cruciales en la exactitud del color, lo que dificultan aun ms las tareas de inspeccin[Parth87]. En muchas aplicaciones, se precisa de una informacin tridimensional. Las piezas mecnicas de superficies complejas requieren de un anlisis dimensional, donde la
DISAM-UPMT-98-015
25
Carlos Platero
informacin 3D es necesaria. En estos casos, la solucin no puede estar dada en procedimientos 2D de Visin artificial, habr de recurrir a la inspeccin visual con tcnicas 3D, tales como pares esteroscpicos, luz estructurada o sensores de rango [Gonz98]. 2.2.3.3 Clasificacin atendiendo a las tcnicas empleadas de deteccin Las tcnicas de los SIVA pueden clasificarse en dos grandes grupos. El primero comprenden las tcnicas de casamiento de patrones, template matching, mediante las cuales se detectan anomalas visuales comparando las imgenes del producto sometido a inspeccin con imgenes que no contienen defectos. El segundo grupo incluyen aquellas tcnicas basadas en la extraccin de caractersticas desde la imagen, que comparan los valores con modelos de reglas, cognitivos o estadsticos. La inspeccin visual mediante el casamiento con un patrn consiste en una comparacin pixel a pixel de dos imgenes: una del producto sometido a inspeccin y otra del producto ideal, sin defectos. Esta segunda imagen patrn se encuentra almacenada en el sistema y puede ser una imagen obtenida por una cmara, por un conjunto de imgenes procesadas o de un modelo sinttico obtenido por CAD. Se suele presentar como una comparacin multinivel con correlacin normalizada [Matrox97]. Las tcnicas de comparacin con patrn son flexibles y resultan, en muchos casos, la nica forma posible de realizar una inspeccin fiable. No obstante, presentan inconvenientes cuando hay que buscar un modelo en una imagen en la cual se desconoce su posicin aproximada. E incluso un cambio de la orientacin del modelo puede resultar insalvable. La mayora de los SIVA implementados en la industria y recogidos en la literatura, usan mtodos basados en la extraccin de caractersticas. Se fundamentan en una adecuada parametrizacin del producto, o lo que es ms habitual, una parametrizacin de los posibles defectos que hacen que el producto sea rechazado. Esta modelizacin consiste en una serie de caractersticas extradas de la imagen, lo que se conoce como vector de caractersticas. Estos parmetros pueden ser reas, texturas, momentos de inercia, histogramas, etc. Una vez obtenido el modelo de la imagen, se clasifica mediante algunas de las tcnicas del Reconocimiento de Formas. Una ventaja inherente a este tipo de mtodo de inspeccin es la falta de necesidad de mantener almacenada una extensa base de datos de imgenes de patrones. Por otra parte, dichos mtodos de inspeccin presentan la desventaja de que cambios en el diseo del producto inspeccionado exigen una etapa de fuera de lnea. 2.2.4 Implementacin de SIVA La tabla 2.1 recoge una seleccin de SIVA implementados en la industria actual. En ella se ven los atributos segn tipo de informacin, mtodo utilizado y geometra de las superficies.
26
DISAM-UPMT-98-015
Carlos Platero
Tabla 2.1 Referencias de SIVA implementados Aplicacin Acero Agricultura Aluminio Baldosas Circuito impreso Circuito impreso Fecha de caducidad Madera Pasta de papel Pliego de billetes Textiles Tipo de informacin niveles de grises color niveles de grises niveles de grises color binaria niveles de grises Mtodo caractersticas caractersticas caractersticas casamiento caractersticas casamiento casamiento Geometra plana arbitraria plana plana plana plana plana Referencia Parsy97 Poole89 Plate94 Fern97 Xie91 Ninom92 Plate97a
color niveles de grises niveles de grises niveles de grises
caractersticas caractersticas casamiento caractersticas
plana plana plana plana
Oulu97 Plate98 Sebas95 Serran95
2.2.5
Literatura de los SIVA Muchos sistemas de inspeccin visual automatizada han sido presentados en la literatura especializada. Chin y y Harlow hicieron un primer resumen sobre SIVA [Chin82]. Un segundo trabajo del estado de la tcnica, cubriendo el periodo 1981 a 1987, fue publicado de nuevo por Chin [Chin88]. Newman y Jan [Newma95] abordan el examen desde 1988 a 1993. La literatura sobre SIVA es muy amplia y no slo restringido en artculos y ponencias en el mundo de la Visin Artificial, sino tambin en Robtica, CAD y en otras disciplinas de la Ingeniera. Adems de la aparicin de artculos regulares en revistas como CVGIP Graphic Modelling and Image Processing, CVGIP Image Understanding, Int. Journal of Computer Vision, Machine Vision and Applications, IEEE Pattern Analisys and Machine Intelligence, es posible encontrar sesiones monotemticas del SPIE o congresos internacionales especficos como los celebrados en Francia (Bourde
DISAM-UPMT-98-015
27
Carlos Platero
95, LeCrouest 97), Italia (Florencia 98) y Japn (Tokio 98). Muchos otros sistemas de inspeccin no han sido ni incluso reportados, probablemente debido a consideraciones de privacidad. Coma ya ha sido comentado anteriormente, dos son los problemas generales: las tcnicas dedicadas a la deteccin de los defectos, y las referentes a la clasificacin de las faltas. Estas dos problemticas suelen presentarse por separado. Las primeras se especializan en los algoritmos de procesamiento de imgenes, sobre todo, si son defectos locales, en el contraste de los defectos, la aplicacin de mscaras, template matching, etc. son habituales. Por otro lado, est la clasificacin de defectos, que en general parten de un vector de caractersticas y utilizan tcnicas que van desde sistemas expertos a redes neuronales, pasando por clasificadores paramtricos y una multitud de procedimientos especficos. Todas estas tcnicas, tanto las de Procesamiento de imgenes como las de Reconocimiento de Formas, son expuestas en multitudes de libros, artculos, ponencias, documentaciones internas as como pginas WWW, mostrando el auge de una investigacin en alza.
2.3
Conclusiones
Se ha abordado la problemtica de la Inspeccin industrial concluyendo en la necesidad creciente de insertar las operaciones de inspeccin dentro del proceso productivo. De las muchas tcnicas empleadas, la inspeccin visual automatizada es una rama fundamental para esta nueva filosofa, sobre todo para las industrias de materias primas o sectores que requieren el 100% de la inspeccin. No obstante, las dificultades de esta tecnologa hacen lenta su evolucin, convirtindose en tema de estudio para muchos investigadores.
28
DISAM-UPMT-98-015
Carlos Platero
Captulo 3: Formacin de imgenes en SIVA
Formacin de imgenes en Sistemas de inspeccin visual automatizada (SIVA)

Los SIVA se encuentran con escenas visuales de informacin en el espacio continuo y sin embargo el desarrollo y diseo de los SIVA se sustenta en tecnologa digital. Luego se evidencia el paso de informacin continua en el tiempo a discreta. La captacin de la informacin presente en el espacio continuo, as como la forma en que sta va a ser alterada, como consecuencia de la transformacin a datos discretos, requiere ser estudiada con cierta profundidad para comprender las limitaciones de resolucin que impone el sistema de adquisicin en su conjunto. Las escenas que aborda esta tesis, consisten en superficies planas, las cuales van a ser inspeccionadas en la localizacin visual de defectos en el material. La capacidad de respuesta de los SIVA depender, en un primer paso, de la posibilidad de captar la informacin del exterior lo ms fiablemente posible. An ms, en esta fase, crucial en el
DISAM-UPM DISAM-UPMT-98-015
29
Carlos Platero
diseo, se requiere reconstruir una visin virtual1 de la escena, que sea consistente con la realidad puesta delante del sistema de adquisicin. La transformacin de la realidad en virtual, debe cumplir con los criterios de la deteccin de los defectos y an ms importante, con la mtrica entre lo real y lo adquirido, esto es, que si se detecta un defecto, el nmero de pxeles asociados a ste debe ser proporcional al rea del defecto. As en los casos prcticos utilizados en esta tesis, ha sido necesario detectar defectos por debajo de 0.04 mm2 en la pasta de papel [Ence94], mientras en el aluminio colado las faltas ms pequeas eran de 1 mm2[Brite92]. La figura 3.1 muestra un esquema de adquisicin de escenas visuales de inspeccin superficial. El motivo es iluminado de manera ptima, tal que aumente el contraste entre el fondo y el defecto; la luz reflejada o transmitida pasa a travs de un sistema ptico, adecuando la escena al tamao del elemento sensor. El transductor est constituido por elementos sensores, que convierten los fotones recibidos en una seal elctrica. La cmara de estado slido da un formato a la imagen recibida en seal elctrica, pudiendo ser de tipo Figura 3.1 Elementos constituyentes digital o analgico. sta es transmitida hasta el de formacin de imagenes en SIVA computador, ya sea para su monitorizacin o procesamiento. En el caso de utilizar seal elctrica analgica, se requiere de la conversin a formato digital. Sea como fuese, se habr generado una correspondencia entre la realidad y lo almacenado en el computador.
Sistema de iluminacin ptica Batera de cmaras
Movimientos de la banda
Escena
Lnea de inspeccin
Se pretende abordar las capacidades de medidas de los SIVA y stas estn ntimamente ligadas a las calidades de las imgenes adquiridas. Como se ha podido observar, las posibilidades mtricas dependen de una multitud de factores; si se considera slo la etapa de adquisicin de imgenes, los elementos a tratar son los sistemas de iluminacin, las caractersticas de los sensores y las transmisiones y adquisiciones de las seales de vdeo. El diseo de una aplicacin adecuada, requiere del anlisis de todos los factores que influyen en las prestaciones, buscando, adems, las fuentes de degradacin. Esta ltimas pueden ser eliminadas y/o compensadas, mediante la seleccin apropiada de soporte fsico, compromisos de medidas y tcnicas de calibracin. El exacto conocimiento de los factores que influyen en la calidad de la imagen, permitir con posterioridad la seleccin correcta de los componentes. El desarrollo de este captulo va a tratar de cmo afectan los diferentes elementos del sistema de adquisicin de imgenes a la mtrica virtual (3.1), centrndose especialmente en el subsistema de iluminacin (3.3) y en la seleccin de arquitecturas de
El concepto de virtual hace referencia a la aplicacin unvoca entre la informacin visual real y su representacin almacenada en el computador
30
DISAM-UPMT-98-015
Carlos Platero
cmaras de estado slido (0). Los motivos son que stos representan los elementos ms crticos en la calidad de la imagen y por ende en la mtrica. Adems son subsistemas genricos de los SIVA, a diferencia de otros, como el entorno de trabajo, que dependen de la naturaleza del producto concreto a inspeccionar. Adems tambin se estudiarn los modelos de comportamiento de las superficies ante la luz (3.2), que junto con los modelos de fuentes luminosas podrn permitir presentar una metodologa para el diseo del sistema de iluminacin de los SIVA (3.4). Para acabar se muestran algunos ejemplos de formacin de imgenes en SIVA documentados (3.5.3).
3.1
Caracterizacin de imgenes digitales

La calidad de una imagen es una impresin subjetiva, que va desde pobre hasta excelente. La habilidad de la percepcin realizada por el cerebro, viene afectada no slo por el sistema de visin humano, sino tambin de otros sistemas sensoriales, junto con los emocionales, ms del aprendizaje y de la memoria. Las relaciones entre stas son complejas, intrincadas y no comprendidas. Los juicios personales varan ante una misma imagen y las valoraciones pueden ser muy dispares. Muchas expresiones han sido dadas para categorizar una imagen, cada una es apropiada segn un particular conjunto de condiciones. Estas expresiones suelen ser obtenidas desde las observaciones empricas, donde un grupo de imgenes son ordenadas y posteriormente se infiere alguna ecuacin que justifique la clasificacin. En un principio, la calidad de la imagen estaba relacionada con las lentes y la funcin de transferencia de modulacin, MTF (Modulation Transfer Function), de la que se hablar ms adelante. Con el avance de la tecnologa, la calidad se ha centrado en la minimizacin de la relacin seal ruido, SNR, y en la arquitectura de las cmaras. Muchos tests han dado medidas sobre la calidad de la imagen. La mayora de las mtricas estn relacionadas con la MTF, la resolucin, la velocidad de las imgenes o la relacin seal ruido. En general, las imgenes con altos valores de MTF y bajo ruido son clasificadas como imgenes de gran calidad. Las prestaciones del sistema de visin dependen de las cmaras, lentes, monitores, iluminacin, etc. Y slo al final se puede plantear la calidad de la imagen. Los ms importantes factores que afectan a la calidad geomtrica y radiomtrica de una imagen adquirida por cmaras de estado slidos son los siguientes: Iluminacin Superficie a inspeccionar ptica Sensores
31
Carlos Platero
Cmaras Transmisin y digitalizacin de imgenes Entorno
La seleccin de una apropiada iluminacin es una pieza clave en las tareas de inspeccin. La uniformidad de luminosidad en la superficie, la estabilidad temporal y su respuesta espectral, as como las propiedades pticas del entorno deben ser consideradas. La falta de homogeneidad de intensidad luminosa en la superficie inspeccionada, puede acarrear que cientos de pxeles aparezcan como defectuosos, cuando stos no lo son. Por la extensin y la importancia en el buen funcionamiento de los SIVA, se ha dedicado un apartado aparte para abordar el estudio de las fuentes luminosas (3.3). Estos estudios permitirn con posterioridad establecer criterios cientficos en la colocacin ptima de los focos luminosos y las cmaras respecto a las superficies a inspeccionar. El segundo aspecto se refiere a la naturaleza del producto a inspeccionar. El tipo, el color, el tamao y forma del defecto junto con su fondo, obviamente influyen en las exactitudes de las medidas. stas dependen sobre todo del tamao del defecto y de su contraste. En la figura 3.2, se muestra un defecto con resolucin variable de 2 a 17 pxeles/mm, junto con la precisin del sistema en su localizacin. Como se observa existe un fuerte incremento en precisin, cuando el defecto pasa de 2 a 6 pixel/mm, aunque slo un suave aumento si se pasa a mayor resolucin. En el primer caso, ha habido un incremento de contraste que haba sido degradado por la propia MTF del sistema. Un aumento desmedido de la resolucin, provoca una disminucin del gradiente entre el fondo y defecto, que tiene como efecto una degradacin del contraste. Por la propia naturaleza, este Repetitividad [Pixel] factor hay que considerarlo segn el problema en concreto. No obstante, como se ver en el apartado sobre seleccin de cmaras, el tamao del defecto definir el campo visual de inspeccin por cada cmara, mientras el contraste entre defecto y fondo, es tema de [pixel ] trabajo abordado desde el tipo de iluminacin empleada y las tcnicas de procesamiento de imgenes digitales. Figura 3.2 Precisin y resolucin Los aspectos referidos a las pticas, sensores, cmaras y digitalizadoras van a ser abordados con mayor detalle, en una doble vertiente. En el siguiente subapartado, las pticas, los sensores y las tarjetas de adquisicin son estudiadas, dejando para ms adelante la seleccin definitiva de arquitectura de cmaras. Las razones son que estas ltimas dependen del tipo de iluminacin. Luego ser necesario tratar previamente el diseo de la iluminacin para establecer que tipos de cmaras son las ms adecuadas. Por ltimo, respecto al entorno, hay que citar la temperatura, la humedad, las vibraciones y las iluminaciones ambientales. Por ejemplo el efecto de la temperatura, ste
32
DISAM-UPMT-98-015
Carlos Platero
puede producir profundos cambios en las cmaras desde que se enciende hasta que alcanza su rgimen permanente. Estos cambios provocan errores en magnitudes de pxeles. Sus causas se encuentran en las deformaciones mecnicas y en las variaciones en la frecuencia del reloj, debidos a los cambios de temperatura. Hay casos de multitud de cmaras que requieren ms de dos horas antes de alcanzar su estado estable [Sanch98]. 3.1.1 Deformaciones de las imgenes debidas a las pticas, sensores y tarjetas de adquisicin 3.1.1.1 ptica Las cmaras de estado slido, como muestra la figura 3.3, estn constituidas por un numeroso conjunto de elementos pticos. En cualquier aplicacin prctica en la que un objeto o una escena es captada por un dispositivo ptico, el tamao de la imagen formada es proporcional a la distancia entre el objeto y las lentes. Cristal protector Los sistemas pticos estn formados por lentes, espejos, prismas y dems elementos, que en conjunto actan estableciendo una transformacin determinista de una distribucin espacial de luz de entrada hacia una distribucin espacial de la luz de salida. Tambin se puede hacer uso del concepto de sistema para Lente Filtro IR Difusor Sensor comprender la propagacin de la luz espacial a travs del espacio o a travs de algn medio dielctrico. A medida que la distancia al objeto se incrementa, el tamao de la imagen decrece y al contrario, a medida Figura 3.3 Elementos pticos de una que la distancia al objeto disminuye el tamao de la cmara de estado slido imagen aumenta [Hect84]. Sin embargo no es posible modelar el comportamiento del sistema ptico nicamente por esta situacin. A pesar de que la imagen se encuentre perfectamente enfocada en el plano imagen del sensor, es necesario evaluar las posibles distorsiones o aberraciones que se pueden originar como consecuencia del paso de la imagen por este sistema fsico y que provocan una fuente de error en el proceso completo de adquisicin de una imagen. En ocasiones ser importante considerar esta fuente de error presente en la imagen digital de partida. No obstante, por el nivel tecnolgico actual de estos productos, es tan elevada su exactitud que no afecta en la precisin de equipos por debajo de 1/50 pxeles [Beyer93]. Para el siguiente estudio sobre las fuentes de degradacin de las lentes, se asume la simplificacin de que los rayos de la luz siempre viajan en lnea recta a travs de un medio homogneo. Segn esta hiptesis, un haz que pase a travs de una apertura, produce una proyeccin de luz sobre una pantalla con una forma geomtrica dependiente de la apertura del sistema ptico[Sebas90]. De cualquier modo, si la distribucin de luz en la regin entre las reas oscuras y claras sobre el plano de imagen sensor se examina con cierto grado de detalle, se evidencia que la frontera no se encuentra muy definida. Este efecto es ms pronunciado a medida de que el tamao de la apertura crezca. Desde un punto de vista simplista, la apertura provoca una inclinacin de los rayos llamados difraccin. Esto provocar un error en la imagen proyectada sobre el plano de imagen del sensor.
33
Carlos Platero
Si bien la mayor fuente de error en la obtencin de la imagen captada a su paso por el sistema ptico viene provocada por este efecto, existen otras tpicas fuentes de error introducidas por la ptica empleada y que se suelen catalogar dentro de uno de los siguientes tipos[Hect84][Jain89]: aberracin cromtica, astigmatismo, coma, Todas estas aberraciones y distorsiones originan una imagen proyectada sobre el sensor de captura, con una cierta deformacin, que ser necesario tener en cuenta en el proceso de modelado de la captura de la imagen. Las distorsiones de las lentes pueden ser modeladas y por tanto es posible fijar el valor de degradacin admisible, dependiendo de la tecnologa a emplear. Otro inconveniente menos estudiado es el alineamiento de la lente con el sensor, as como la situacin del filtro IR, difusor y cristal difusor, que no suelen estar especificadas por el fabricante. En la mayora de los sistemas de formacin de imagen pticas, la radiacin ptica emitida por un objeto procede de la luz transmitida o reflejada a partir de una fuente de luz incoherente. La radiacin de la imagen puede ser en la mayora de los casos considerada monocromtica, en el sentido de que el ancho de banda espectral de la radiacin de la imagen detectada en el plano de imagen, es pequea respecto a la longitud de onda central de la radiacin [Pratt91]. Bajo esta hiptesis el sistema de la imagen responder como un sistema lineal en trminos de la intensidad de entrada y salida, permitiendo utilizar los conceptos de respuesta en frecuencia, modelizando la funcin de transferencia en el domino de la frecuencia. As, se define la Funcin de Transferencia Optica (OTF) como la transformada de Fourier normalizada, pasando del dominio de la intensidad al dominio de las frecuencias. A partir de la OTF se puede deducir las fuentes de error generadas por la imperfeccin del sistema ptico. Tal como ha sido comentado anteriormente, el nivel tecnolgico de los sistemas pticos empleados en los trabajos prcticos de esta tesis, no ha hecho precisar un estudio que abordase las deformaciones originadas por la ptica. No obstante, si se han utilizado recomendaciones prcticas como hacer uso de la apertura mnima del iris en la adquisicin de las imgenes. 3.1.1.2 Sensores Los fotodetectores son los encargados de transformar la informacin lumnica de entrada, en informacin elctrica de salida. La mayora de los sensores utilizados en Visin artificial son los dispositivos de estado slido conocidos como CTD (Charge Transfer Devices)[Amore90][Beyer93a].Existen dos tipo principales de dispositivos con caractersticas claramente diferenciales entre s: los CCD ( Charge Coupled Devices), y los CID (Charge Injection Devices), cuyas diferencias estn bien recogidas en la bibliografa [Holst96]. Sern tratadas ms adelante (0), en el estudio de las arquitecturas de cmaras. Una caracterstica de muchas cmaras de estado slido con dispositivos CCD, que afecta enormemente a la resolucin de la imagen obtenida, es la presencia de regiones no sensibles en la matriz de elementos CCD sobre la que se proyecta la imagen tras el sistema ptico, es decir, la presencia de zonas del sensor no activas. Aunque se abordar en el apartado relacionado con la seleccin de cmaras, el tipo de transferencia entre el sensor y los registros de desplazamiento, en algunas estructuras, provoca esta prdida de zona sensible.
34
DISAM-UPMT-98-015
Carlos Platero
A pesar de ser ste el problema fundamental que produce una prdida significativa de resolucin espacial al utilizar este tipo de dispositivos, existen otras propiedades en estos sistemas que originan deformaciones en el tratamiento de la imagen. Idealmente el fotodetector acta como un convertidor de intensidad ptica a corriente del detector, esto es, acta como un convertidor de fotones incidentes a electrones recibidos por el detector[Pratt91][Jain89]. El detector produce una corriente de seal a travs de un filtro paso bajo, creando una tensin a travs de una carga. La fuente de error ms comn asociada con los fotodetectores, respecto a la electrnica asociada, consiste en el ruido trmico resultante de las fluctuaciones de electrones aleatorios en elementos resistivos dentro del amplificador del sensor. Segn Pratt, el ruido trmico puede ser modelado como un proceso estocstico normal aditivo, independiente del campo de imagen sensitivo. Un anlisis ms detallado, requiere del conocimiento de la circuitera del sensor. No obstante, la corriente de ruido trmico generada se puede modelar como un proceso aleatorio gaussiano de media cero y varianza dependiente del sensor utilizado. Por otro lado aun no teniendo en cuenta este ruido trmico generado, la corriente del fotodectector no tiene un valor verdaderamente constante an cuando la intensidad de luz incidente sea la misma. Los sensores fotoelctricos exhiben una incertidumbre como consecuencia de la naturaleza mecnica - cuntica de la luz. A niveles bajos de luz, el nmero de electrones emitidos por un fotodetector est gobernado por una densidad de probabilidad de Poisson. La incertidumbre resultante en el conocimiento de la corriente del detector, se denomina ruido de disparo (shot) en detectores fotoemisivos, y ruido de generacin recombinacin en conductores fotoconductivos y fotovoltaicos [Reino96]. En definitiva, el comportamiento de los sensores fotoelctricos es un comportamiento no lineal, siendo esta no linealidad dependiente de las caractersticas del sensor utilizado. Adems del efecto de la no linealidad del sensor y del ruido trmico, hay que considerar las interacciones locales entre elementos adyacentes en el array, que en su conjunto deforman la informacin recibida. Por estos motivos, es requerida la modelizacin del comportamiento del plano sensor, que es realizada mediante lo que se conoce como funcin de extensin puntual (PSF, Point Spread Function), cuyo anlisis desborda el temario de esta tesis. Esta funcin refleja las limitaciones del sensor para representar de una forma precisa cada punto sin la influencia de los vecinos. Las caractersticas radiomtricas y geomtricas de los sensores de estado slido han mejorado drsticamente, hasta tal punto, que puede considerarse como el mejor elemento del sistema de imgenes digitales[Beyer93]. Las prestaciones de los parmetros radiomtricos, tales como relacin seal ruido (SNR), no-uniformidad de corriente oscura (DSNU), respuesta fotnica no uniforme (PRNU) son excelentes. Un elemento de potenciales problemas es el tamao de la superficie y su topografa. Los sensores de gran tamao son usados para longitudes de onda superiores a los 500 nm [Blouk87]. Mientras, las diagonales de los sensores estn normalizados a , 1/3, y 2/3. El efecto de la topografa de la superficie (estructura de las puertas, microlentes) no ha sido investigado hasta la fecha.
35
Carlos Platero
Sin embargo, las cmaras por la multitud de componentes que las constituyen, representan uno de los elementos ms crticos. Algunos de los elementos que inducen a la degradacin son: la autoganancia (AGC), los filtros paso bajo, correcciones de gamma y control del iris [Balts92]. La estabilidad mecnica entre el sensor y los elementos pticos, frecuentemente resulta insuficiente. Slo algunos fabricantes usan la suficiente estabilidad. Por estos motivos, volver a tratarse la eleccin del tipo de cmara, al resultar ser un elemento fundamental en la calidad de la imagen. 3.1.1.3 Digitalizadoras El digitalizador es el ltimo componente fsico presente en el proceso de formacin de una imagen digital. En este elemento se realizan dos procesos diferentes, la cuantificacin de la seal y su muestreo. Para comprender los errores que se introducen en el proceso de formacin de la imagen discreta, como consecuencia nicamente de la accin del convertidor analgico/digital, se van abordar por separado el proceso de cuantificacin y el de muestro. Aunque estos dos procesos tienen componentes interrelacionadas, es bueno considerarlos como separados para estudiar los errores debidos a unos y a otros, pues simplifica la exposicin. Los errores de muestreo son originados por no cumplir el teorema de Nyquist, provocando el efecto de solapamiento en frecuencias o aliasing, llevando consigo una prdida de informacin en la seal discreta de salida. Para evitar esta falta se recurre a la utilizacin de filtros anti-aliasing, cuyo inconveniente es la perdida de informacin correspondiente a las componentes de alta frecuencia. No obstante, las prdidas de precisin son del orden de 0.08 para casos extremos [Reino96]. De otro lado, en el proceso de cuantificacin se mejora la precisin al aumentar el nmero de niveles de grises. La incertidumbre introducida por la cuantificacin de la seal analgica en niveles de grises implica que las caractersticas geomtricas de los objetos disminuyen con una disminucin del rango de niveles de grises. Pero hay otros factores que tambin juegan en la determinacin de resolucin en la digitalizadora. Imgenes con elevado nmero de grises son ms difciles de tratar computacionalmente, requieren de ms memoria para ser almacenadas y su procesamiento necesita ms tiempo. Por lo que suelen utilizarse imgenes con 256 niveles de grises, requisito suficiente para la mayora de las aplicaciones SIVA. Otro aspecto a destacar es la sincronizacin entre el digitalizador y la seal enviada por la cmara. La mayora de los digitalizadores establecen sincronismo de lnea (PLL), esto es, utilizan una sincronizacin entre el digitalizador y la seal proveniente de la cmara al comienzo del cuadro, recuperando la prdida de sincronismo en cada lnea. Ello introduce una inestabilidad posicional de varias centsimas de pixel, es decir, cada lnea se encuentra desplazada con respecto a su lnea contigua (en el campo) un cierto valor[Beyer93a]. En cambio, si se usa un muestreo de pixel sncrono, es decir, se establece lneas de control para muestrear en cada instante el pixel correspondiente, se asegura una sincronizacin precisa con los datos obtenidos a la salida del digitalizador, presentado una mayor fiabilidad. Este tipo de transmisin es tan efectiva como la utilizada en cmaras digitales. Para estos ltimos casos, se puede obtener una precisin de 0.004 pxeles[Beyer93a].
36
DISAM-UPMT-98-015
Carlos Platero
Resumiendo, desde que se tiene la imagen en el entorno que se desee captar, hasta que se enva a la memoria del computador, sta ha sufrido diversas degradaciones que son necesarias modelar. La funcin de transferencia ptica (OTF) se encarga de modelar la componente difuminadora de las lentes, siendo la OTF una medida de la deformacin producida en la imagen captada como consecuencia de la distorsin geomtrica. La funcin de extensin puntual (PSF) modela las caractersticas de muestreo espacial por parte de los fotosensores, encargados de captar la imagen del entorno. El nivel tecnolgico actual es tan elevado en la fabricacin de estos componentes que las prdidas de precisin son del orden de magnitud de 1/50 de pixel. De otro lado, las prestaciones de las tarjetas digitalizadoras son tan variadas como modelos hay en el mercado. Numerosos problemas tienen las digitalizadoras, tales como prdidas de sincronismo, no linealidades y efectos de solapamiento en frecuencias (aliasing). La mayora de los factores afectan a la exactitud de la mtrica, pudiendo provocar errores de hasta 0.5 pxeles. Las diferentes tcnicas de sincronizacin es uno de los factores ms decisivo. Si se utiliza sincronizacin de lnea el error va desde 0.5 pixel a 1 pixel, mientras una sincronizacin por pixel reduce el error a 0.05. Slo queda por resear algunas consideraciones prcticas efectuadas a lo largo del proceso experimental, como ha sido el uso de lentes de mayor formato que el plano sensor, utilizando exclusivamente la zona central de la lente, evitando la mayora de las degradaciones pticas. Conjuntamente a esta accin, se ha tomado imgenes con el iris lo ms cerrado posible, favoreciendo la concentracin de los rayos sobre el foco. Respecto al digitalizador y al utilizar cmaras sin capacidad de sincronismo, se han definido drivers que pudieran sincronizar todo lo ms posible con el pixel, en el sentido de slo muestrear tanto en horizontal como en vertical por el nmero de pxeles existentes en el plano sensor. De este estudio preliminar se desprende que, la calidad de la imagen depende, sobre todo, de una iluminacin eficaz y una eleccin ptima de las cmaras. Por tanto, los siguientes puntos tratan sobre el realce visual de superficies planas y de cmo determinar los criterios para una buena seleccin de cmaras atendiendo a la aplicacin en concreto.
3.2
Realce visual de superficies planas

El realce visual de la escena es el primer subsistema del modelo genrico de los SIVA. Es una de las llaves en la solucin de problemas de Visin artificial. El diseador debera tener en mente dos ideas al considerar el sistema de iluminacin: Maximizar el conocimiento a priori de la escena. Intentar trivializar el problema de anlisis de imgenes, tanto como sea posible. Un eficiente sistema de iluminacin requiere un menor tratamiento de la seal.
37
Carlos Platero
Para maximizar el contraste en la escena hay que explotar el conocimiento a priori en varias direcciones. Una de ellas es el estudio de las propiedades de los materiales ante una excitacin luminosa. La cantidad de luz reflejada en una superficie depende en gran medida de su rugosidad. Es marcadamente diferente la repuesta de una superficie lisa a otra rugosa. De hecho se ha utilizado el comportamiento desigual del material defectuoso respecto al no defectuoso ante una exposicin lumnica. para incrementar el realce entre ambos. Luego se requiere estudiar el comportamiento de reflexin de la luz en superficies planas. Otra de las direcciones tratada es la ptima posicin del foco luminoso y la cmara ante la superficie a inspeccionar. Partiendo del modelo de comportamiento de superficies, se trata de investigar cual es la posicin ms adecuada de los focos y las cmaras, con el propsito de aumentar el contraste entre los defectos y el fondo. Respecto a la trivializacin del problema para aplicaciones SIVA, la problemtica de identificacin de faltas se simplifica, muchas veces, consiguiendo una iluminacin uniforme en el campo visual. Este tema tambin ser objeto de estudio, de cmo disear la fuente luminosa para conseguir una ptima iluminacin. A continuacin se va a desarrollar una metodologa de trabajo para construir el equipo de iluminacin, basndose en el estudio de reflexin de la luz en superficies planas, bsqueda ptima de foco - superficie - cmara y de cmo tratar de obtener una iluminacin uniforme en el campo visual. 3.2.1 Mecanismos de reflexin de la luz sobre superficies planas Dentro de la problemtica de la iluminacin, la luz reflejada en superficies planas ha sido motivo de estudio en esta tesis. Detectar defectos visuales en el aluminio, por ejemplo, precisa de la ptima localizacin de los focos luminosos y de los sensores. Para la determinacin geomtrica de ambos, se requiere del estudio de los mecanismos de reflexin de la luz. Se pretende mostrar en las siguientes pginas, los modelos de reflexin proveniente de una luz incidente sobre superficies planas, y de cmo aplicar los resultados en el diseo del sistema de iluminacin de un SIVA. Hay dos filosofas distintas para abordar los estudios de la reflexin de la luz: modelos pticos geomtricos y modelos pticos fsicos. Los primeros asumen que las trayectorias de la luz van en lnea recta, mientras los segundos las tratan como ondas electromagnticas, cuyos comportamientos siguen las ecuaciones de Maxwell. Los modelos usados por los investigadores actuales se fundamentan en los trabajos de Phong, Torrance Sparrow, Lambert, y Beckmann-Spizzichino. Antes de exponer los modelos de reflexin, se tratan los conceptos bsicos de la Radiometra y de los modelos de superficie, fundamentales para entender las diferentes modelizaciones.
38
DISAM-UPMT-98-015
Carlos Platero
3.2.1.1 Conceptos bsicos de Radiometra La energa radiante emitida por una fuente luminosa, por unidad de tiempo y por unidad de rea, depende de la naturaleza de la superficie y de su temperatura. Esta radiacin es una mezcla de diferentes longitudes de onda. Por ejemplo, a la temperatura de 300C, la ms intensa de estas ondas tiene una longitud de 500nm, que se encuentra en la regin del infrarrojo, mientras a 800C, un cuerpo emite bastante energa radiante visible para ser luminosos por si mismo y parece incandescente; no obstante, la mayor parte de la energa emitida es transportada, con mucho, por ondas infrarrojas. A 3000C, que es aproximadamente la temperatura del filamento de una lmpara de incandescencia, la energa radiante contiene bastantes longitudes de onda visibles, de las comprendidas entre 400nm y 700nm, de modo que el cuerpo parece casi rojo blanco [Sears81]. El flujo luminoso emitido por un manantial luminoso Flujo luminoso depende de la abertura y del tamao del cono de radiacin, d esto es, del ngulo slido. Se considera el manantial luminoso puntual S de la figura 3.4. Y sea d el flujo luminoso que atraviesa una seccin cualquiera de un estrecho cono de ngulo slido d estereorradianes, cuyo S ngulo slido d Manantial luminoso vrtice coincida con el manantial. La intensidad luminosa dA del manantial, en la direccin del cono, se define como la razn del flujo, d, al ngulo slido, d, o sea, como el flujo luminoso emitido por unidad de ngulo slido. La Figura 3.4 Flujo luminosos intensidad luminosa se representa por I:
S
I =
d d
( 3.1 )
La unidad de intensidad es vatio por estereorradin. La mayor parte de los manantiales no emiten cantidades iguales de flujo por unidad de ngulo slido en todas las direcciones. Sea dA, en la figura 3.5, un elemento de superficie cuya normal n forma un ngulo cenital y acimut respecto a un manantial puntual S. Asumiendo que la fuente se encuentra z S en el plano X-Z y determinado segn la Luz reflejada Luz incidente direccin del ngulo cenital i. La relacin entre n d el flujo incidente en la superficie respecto al rea, define la iluminacin incidente como:
i r r
dA
Ei =
di dA
( 3.2 )
Figura 3.5 Sistema de coordenadas locales
De otro lado, a la fraccin del flujo incidente que sea reflejada en la direccin (r r), desde la superficie al sensor se la llama
39
Carlos Platero
radiacin reflejada. La radiacin reflejada de la superficie es definida como el flujo emitido por unidad de rea reflejada y por unidad de ngulo slido en la direccin vista por el sensor, as se define la radiacin radiada, L, como: d 2 L= dA r dr
( 3.3 )
donde dr es el ngulo slido del sensor visto desde la superficie reflejada. Considerando que la superficie es iluminada desde una direccin i, se define la funcin de distribucin reflejada bidireccional ( bi-directional reflectance distribution function, BRDF), Fr de una superficie, como el nivel de radiacin reflejada de una luz incidente vista desde (r r) por unidad de iluminacin incidente Fr (i r r ) = Lr (i r r ) Ei (i ) ( 3.4 )
Por ltimo, el principio de conservacin de la energa indica que la radiacin incidente en un objeto, parte de ella es transmitida (refraccin), otra absorbida y la dems ser reflejada, esto es: INCIDENTE = TRANSMITIDA + ABSORBIDA + REFLEJADA ( 3.5 )
En la tabla 3.1 aparecen las magnitudes radiomtricas en el Sistema Internacional
Magnitud fsica Flujo luminoso Intensidad luminosa Iluminacin Radiacin
Smbolo I E L
Unidad en S.I. W W sr-1 W m-2 W m-2 sr-1
Tabla 3.1 Unidades del S.I. de las magnitudes de Radiometra
3.2.1.2 Modelos de superficie planas La manera en la que la luz es reflejada en una superficie, depende de entre muchos factores, de las formas macroscpicas que constituyen las superficies. As mientras en
40
DISAM-UPMT-98-015
Carlos Platero
superficies lisas al ser iluminadas con un haz incidente, la luz reflejada sobre ellas toma una sola direccin, en superficies rugosas tienden a difuminarse en mltiples direcciones. Para establecer con exactitud el fenmeno de la reflexin, es necesario tener un conocimiento a priori de la estructura de la superficie, es decir, un modelo de stas. Se pueden catalogar en dos clases: mapas de perfiles y modelos aleatorios. Un exacto perfil puede ser determinado con las medidas de alturas en cada punto de la superficie, por algn tipo de dispositivo existente en el mercado. No obstante, este mtodo es caro e impracticable en muchos casos. Por lo tanto, suele modelarse mediante funciones bidimensionales de distribucin que tienden aproximarse al verdadero comportamiento de la superficie ante un haz de luz incidente.
3.2.1.2.1
Modelos basados en funciones de distribucin de ngulos de inclinacin
Una superficie puede ser modelada a partir de una coleccin de microsuperficies planas, tal como queda reflejado en la figura 3.6. Cada microsuperficies tiene su propia orientacin. El ngulo de inclinacin, , es el parmetro que n determina el grado de oblicuidad respecto a la Microsuperficies planas normal del plano medio. En el caso de superficies isotrpicas, la distribucin de sera uniforme, y las microsuperficies estaran rotadas respecto a n con igual probabilidad. Esto lleva, a que puede modelarse la superficie mediante una funcin de distribucin unidimensional. Por ejemplo, la Figura 3.6 Superficie formada por superficie responde a una funcin de densidad microfacetas gaussiana para el nivel de microfacetas, con N( , ). Grandes valores en la varianza, , indicarn la presencia de superficies rugosas, y al contrario, valores pequeos sealarn superficies lisas. Los modelos basados en la funcin de distribucin del ngulo de inclinacin en las microsuperficies son muy populares, pues la difusin de la luz reflejada es explicada por los niveles de inclinacin y no por la cartografa (altura) de la superficie. Por esta razn, los modelos de inclinacin, aunque relativamente ambiguos, son ampliamente utilizados en los problemas de reflexin de la luz en superficies.
3.2.1.2.2 Modelos basados en funciones de distribucin de perfiles
La altura de la superficie puede ser expresada en funcin de las coordenadas (x, y), como muestra la figura 3.7. La forma de la superficie es determinada por la funcin de distribucin de la altura, h. Sea por ejemplo h con distribucin normal, media cero y varianza h, la funcin de densidad viene dada por:
41
Carlos Platero
ph =
2 1 e (h 2 h
2 2 h
( 3.6 )
Rugosidad de la superficie h(x,y)
h representa la rugosidad de la superficie. No obstante, las superficies no estn unvocamente relacionadas con la funcin de distribucin de las alturas; no dice nada sobre las separaciones entre valles y colinas existentes. Dos superficies pueden tener igual media y varianza, mientras sus apariencias son totalmente distintas. Con objetivo de reforzar el modelo, se define un coeficiente de correlacin, C(), que mide la relacin entre la altura estimada y la de dos puntos de la superficie separados una distancia : C = e (
2
Figura 3.7 Niveles de altura en la superficie
T2
( 3.7 )
donde T es la distancia de correlacin. La variacin de los parmetros h y T de los modelos de superficie, generan aproximaciones que casan con la apariencia real de la superficie. 3.2.1.3 La rugosidad de las superficies La impresin visual de los humanos es bastante vaga con el concepto de rugosidad. De manera que una superficie vista de cerca parece rugosa y algo ms alejada, puede llevar a la conclusin de calificarla como lisa. De hecho, en la determinacin de faltas visuales, el inspector, a veces, hace cambios de vistas para ayudarse en el juicio de si es defecto o no. A diferencia de las valoraciones humanas, la teora de reflexin tiene bien definida el concepto de rugosidad; sta debe relacionar las irregularidades de la superficie con las direcciones que tome la luz ante un haz de luz incidente. Para superficies cuyas irregularidades son menores que la longitud de onda de la luz, la mayor parte del flujo incidente ser reflejada especulrmente en una sola direccin. En caso contrario, si las irregularidades superan la longitud de onda del haz, la superficie difuminar la luz en mltiples direcciones. En el mundo industrial, la rugosidad se define como el valor medio de las alturas de la superficie, y esta definicin ha sido objeto para medir el acabado superficial de los productos manufactureros[ANSI78]. 3.2.1.4 Modelos pticos geomtricos La ptica geomtrica es aplicable en situaciones, donde el carcter electromagntico de la luz, puede ser ignorado. Una de las caractersticas de la luz visible es su corta longitud de onda. En general, la longitud de onda de la luz incidente es mucho
42
DISAM-UPMT-98-015
Carlos Platero
ms pequea que las dimensiones de las imperfecciones, y en estos casos, es posible resolver, de manera aproximada, el problema de la reflexin.
3.2.1.4.1 Modelo de Phong
El modelo de Phong [Phong75] fue desarrollado dentro de la comunidad de computadoras grficas, y est siendo ampliamente usado debido a su sencillez. Este modelo explica bien el efecto de reflexin de la luz sobre materiales dielctricos, para el caso de ngulo de incidencia y reflexin sean significativamente inferiores a /2. El modelo predice la reflexin basndose en el ngulo de incidencia, i, y en el ngulo entre la direccin especular y la direccin del plano sensor, . En l se asume que la mxima reflexin se obtiene cuando coincide el ngulo de reflexin con la direccin especular, esto es, i=e y e=0. Para el modelo de Phong la radiacin reflejada sigue la expresin: Fr = kLr = A + B cos n cos i
( 3.8 )
donde k, A y B son constantes y n es un ndice que muestra la rugosidad de la superficie. De su simplicidad hace que el modelo falle al predecir una importante caracterstica: el halo especular. Aun ms, la mxima reflexin de las superficies no ocurre en la direccin especular, tal como predice dicho modelo. Por lo que es necesario buscar un mejor modelo, como el que se presente a continuacin, el de Torrence Sparrow
3.2.1.4.2 Modelos de Torrence Sparrow
El modelo de Torrence Sparrow[Torre67] se basa en los conceptos vistos con anterioridad sobre superficies formadas por microfacetas. La superficie tiene una orientacin media n, y la inclinacin de cada microsuperficie, , est definida por una funcin de densidad referenciada sobre n. Cada microsuperficie refleja slo la componente especular segn su propia inclinacin. Luego, al haber una distribucin aleatoria de las microsuperficies, la luz incidente sobre la superficie, no slo considera el elemento especular, sino adems componentes de la luz difusa, permitiendo determinar la radiacin superficial en cualquier direccin. Torrence y Sparrow asumen que la funcin de densidad es normal. Adems, tambin parte de tener rotaciones sobre la normal a la superficie de carcter simtrico. Por tanto, se tendr una distribucin unidimensional N(0,). p( ) = ce (
2
2 2 )
( 3.9 )
43
Carlos Platero
donde c es una constante, y la varianza, como ya se vio, representa la rugosidad del modelo.
Luz incidente di
z n' i d r Luz reflejada
i Considrese la geometra n dr mostrada en la Figura 3.8. El rea de superficie dAS est localizado en el origen de coordenadas del marco, y la x dAs r normal a la superficie, n, coincide con la direccin de z. La fuente luminosa Modelo de Torrence - Sparrow se sita en el plano (x-z), y ste es incidente a la superficie con un ngulo i. El modelo pretende calcular la radiacin, Lr, en cualquier direccin definida por r y r. Figura 3.8 Relaciones geomtricas del modelo de
Torrence -Sparrow
Slo algunas microfacetas radiarn componente especular en la direccin del ngulo slido dr (r r), y stas tendrn como normal n, fijada por el nivel de inclinacin y ngulo de incidencia i. El nmero de facetas por unidad de superficie orientadas dentro del ngulo slido d, es igual a p()d. Por tanto, el rea de puntos en dAs orientados dentro de d es igual a p()ddAs. Considerando af el rea de cada microsuperficie, el rea de puntos dentro de dAs que refleja luz incidente con ngulo i, dentro del ngulo slido dr, es igual a af p()ddAs. Todas las microsuperficies son asumidas con el mismo ngulo de incidencia i. El flujo incidente en el conjunto de facetas reflejadas se determina por: d 2 i = Li di a f p( )d dAS
( 3.10 )
Donde Li es la radiacin incidente. La fraccin de luz incidente que es reflejada por cada microsuperficie est determinada por los coeficientes de reflexin de Fresnel. Los coeficientes F(i,) y F(i,) de Fresnel determinan el campo electromagntico reflejado segn la componente especular[Nayar91][Ikeuc94]. El coeficiente de Fresnel F(i, ) para la luz incidente puede ser expresado como combinacin lineal de los coeficientes de Fresnel paralelo y perpendicular de las ondas incidentes: F ( i, ) = h F|| ( i, ) + v F ( i, )
2 2
( 3.11 )
donde h, v 0 y h + v = 1 ( 3.12 )
44
DISAM-UPMT-98-015
Carlos Platero
Torrence y Sparrow tambin consideraron el efecto de sombras de unas microsuperficies sobre otras. Las facetas adyacentes pueden obstruir tanto el flujo incidente como el reflejado. Para compensar estos efectos, los autores introducen el concepto de efectos de atenuacin geomtrica, G( i, r, r ), cuyo rango se encuentra entre cero y uno. Partiendo de las consideraciones hechas, el flujo reflejado, dr, dentro del ngulo slido d, el cual fija el flujo incidente, di, que refleja en la direccin (r,r), estar determinado por: d 2 r = F ( i, )G ( i , r , r )d 2 i la radiacin, Lr, de dAs en la direccin ( r, r ), vendr dada por: Lr = d 2 r d r dAs cos r ( 3.13 )
( 3.14 )
introduciendo las ecuaciones de ( 3.9 ) a ( 3.14 ) quedar como: Lr = F ( i, )G ( i , r , r )Li d i (a f p( )d dAs )cos i d r dAs cos r ( 3.15 )
al haber partido de aquellas microsuperficies cuyas normales estn dentro del ngulo slido d, capaces de reflejar la luz en el ngulo slido dr, ambas se encuentran relacionadas por la expresin: d = d r 4 cos i
( 3.16 )
insertando la relacin entre ngulos slidos y la funcin de densidad de las microfacetas, la radiacin queda como: Lr = k k= Li d i ( 2 / 2 2 ) e cos r ca f F ( i, )G ( i , r , r ) 4 ( 3.17 )
3.2.1.4.3
Modelo de Lambert
45
Carlos Platero
Lambert [Lamb60] fue el primero en investigar los mecanismos de reflexin Fuente difusa. Las superficies que satisfacen las dA d leyes de Lambert, aparecen igualmente iluminadas en todas las direcciones. n Como muestra la Figura 3.9, la luz r penetra en la materia y se encuentra heterogeneidad microscpica, provocando d Superficie en la luz componente de reflexin y dA refraccin. Las componentes especulares cruzan sus trayectorias con una variedad Modelo de Lambert de direcciones, resultando una reflexin difusa. Cuando la radiacin es constante en toda la superficie, se denomina Figura 3.9 Relaciones geomtricas en el modelo reflexin lambertiana. de Lambert
i i i S S
La radiacin de una superficie lambertiana, Lr, es proporcional a su radiada. Considerando una superficie de rea infinitesimal, dAs, iluminada desde un manantial, dAi. El flujo incidente en dAs ser determinando desde la radiacin fuente, Li, como: d 2 i = Li d s dAi Teniendo en cuenta las relaciones entre la superficie y el ngulo slido dAi = r 2 d i cos i dAs d s = r2 Introduciendo las relaciones geomtricas, queda: d 2 i = Li d i dAS cos i la iluminacin en la superficie est determinada por: Ei = d i dAs ( 3.20 ) ( 3.18 )
( 3.19 )
( 3.21 )
y como la radiacin reflejada es proporcional a su rradiada, Ei. Obsrvese que Ei es cero cuando el ngulo de incidencia sea /2. Luego, la radiacin en la superficie puede ser escrita como:
46
DISAM-UPMT-98-015
Carlos Platero
Lr = k dif Li d i cos i donde kdif determina la fraccin de la energa incidente que es reflejada. 3.2.1.5 Modelos fsicos pticos
( 3.22 )
La luz es un fenmeno electromagntico. Por tanto, en un sentido estricto, los problemas pticos deberan ser planteados desde la Electrodinmica. El modelo de Beckmann-Spizzichino [Beckm63] describe los fenmenos de reflexin tanto de superficies lisas como rugosas. Plano del sensor dA Superficie
l
Lente dAs
3.2.1.5.1
Modelo de Beckmann-Spizzichino
R0 P
El modelo de reflexin de Beckmann d Spizzichino explica el comportamiento de la f z dA energa electromagntica especular, procedente de un haz luminoso incidente sobre una Modelo de Beckmann - Spizzichino superficie rugosa. Como en los anteriores modelos, se pretende calcular la radiacin de la superficie en componentes especulares. Considerando la formacin geomtrica de una Figura 3.10 Relaciones geomtricas del modelo de Beckmann-Spizzichino imagen en un sensor (por ejemplo, una cmara CCD), segn muestra la figura 3.10, se definen, dAS como el elemento de superficie y dAim la proyeccin dAS de dentro del rea del sensor. La relacin entre ambas coincide con el ngulo slido, cuyo vrtice es el del foco principal de la lente, P, llegando a:
r im
dA cos dAS = im cos r
z f
( 3.23 )
dAim coincidir con el rea del elemento bsico del sensor (pixel). Si dAim es constante para un sensor dado, dAs est determinado por su geometra y por el tamao del pixel. Todos los rayos luminosos radiados por dAS, que son incidentes dentro del rea de la lente, dAl, son proyectados dentro del rea de la imagen, dAim. Luego, el ngulo slido de la radiacin reflejada, dr, cuando es visto desde dAS quedar como: d r = dAl cos 2 R0
( 3.24 )
El flujo reflejado, dr, es la energa de luz recibida por el rea de la lente. Haciendo uso del vector complejo de Poynting, S, para definir el campo electromagntico descrito por una onda, se tiene:
47
Carlos Platero
S = ExH
( 3.25 )
donde E representa la intensidad del campo elctrico (no confundir ahora con la iluminacin, tambin llamada E) y H la intensidad del campo magntico. Siendo la parte real de S la que define el valor medio de energa emitida por unidad de rea, cuya dimensin ser vatio por metro cuadrado: S a = Re[S ] = 1 Re[ExH ] 2
( 3.26 )
Y al estar relacionados ambos por la permitividad y la permeabilidad H=
( 3.27 )
el valor medio del flujo de energa por unidad de rea est definido por Sa = 1 2 1 E = H 2 2
2
( 3.28 )
2
segn Beckmann-Spizzichino, la energa media especular estimada, E , originada por una fuente luminosa de longitud de onda , con ngulo de incidencia i, sobre una superficie rugosa de tamao A, con distribucin normal de alturas, media cero, varianza h y distancia de correlacin T que refleja en la direccin (r,r), es:
2 2 T 2 D 2 E 2 A 2 cos 2 E = 01 2 2 i e g 0 + A R0
g m v 2xy T 2 / 4 m 1 m!m e m=
( 3.29 )
donde
48
DISAM-UPMT-98-015
Carlos Platero
(v , v
x
, v z ) = k ( sin i sin r cos r ) x,+ k ( sin r sin r ) y, k (cos i + cos r ) z

2
g = 2 h (cos i + cos r ) o = sinc(v x Ax )sinc(v y Ay ) D=
1 + cos i cos r sin i sin r cos r cos i (cos i + cos r ) ( 3.30 )
2 2 v xy = v x + v y
siendo E01 la amplitud del campo elctrico y Ax y Ay denotan la superficie rectangular de A, evaluada en la integral de Helmholtz. El flujo radiado a partir de este modelo ser: d r = S a dAl cos = 1 2 E dAl cos 2
( 3.31 )
introduciendo ( 3.23 ), ( 3.24 ) y ( 3.31 ), en la definicin de radiacin ( 3.3 ):

2 2 1 R0 f E Lr = 2 z 2 dAim cos 2
( 3.32 )
No es posible determinar el valor exacto de la radiacin desde el clculo estimado de la energa especular. La radiacin de la ecuacin anterior es realmente el valor esperado de sta, es decir, Lr . En el modelo de Beckmann-Spizzichino, el valor medio de EE * es determinado como la integral extendida en toda la superficie del objeto. Obsrvese que si la dimensin del pixel es conocida, dAim = dApixel, y recibe la luz radiada de dAS, entonces el valor esperado de la energa especular puede ser computado dentro del rea A = dAS. Si dApixel es conocido y constante, A es determinado por ( 3.23 ) Insertando de ( 3.23 ) a ( 3.32 ), Lr es:
2 2 2 E 01 cos i g z dA pixel cos 2 T 2 D 2 0 + e f cos r 2 2 cos 2 r
2 g m v xyT 2 / 4 1 m!m e m= ( 3.33 )
Lr =
Lr es la suma de dos componentes: el pico especular y el halo especular. En la ltima expresin se decanta que la componente pico especular es proporcional al rea vista dAS. Sin embargo, se puede demostrar que la integral de 02 es inversamente proporcional a dAS. En otras palabras, aunque la magnitud del pico especular es proporcional a dAS, la energa contenida en l es independiente de la cantidad de superficie.
49
Carlos Platero
Las expresiones de radiacin para superficies rugosas y lisas, pueden ser determinadas desde las expresiones de energa especular obtenidas por BeckmannSpizzichino, obtenindose las siguientes formulaciones:
2 2 2 2 E 01 cos i g z dApixel cos 2 T 2 D 2 g v xyT 2 / 4 0 + e e (g << 1) f cos 2 r 22 cos r
Lr (lisas ) =
Lr ( rugosas ) =
2 2 2 2 2 vxyT 2 E 01 cos iT D 2 2 exp 22 cos r 4v z h
(g >> 1)
( 3.34 )
3.2.1.6 Modelos de reflexin para la inspeccin de superficies planas Los modelos de reflexin descritos son demasiado complicados de utilizar en Visin artificial. Diversos modelos aproximativos han sido propuestos por la comunidad cientfica. Nayar, Ikeuchi y Kanade [Nayar91] han examinado los modelos de TorrenceSparrow y de Beckmann-Spizzichino, de manera exhaustiva en simulacin por computador. Ellos han encontrado que la solucin para superficies rugosas, pueden ser aproximadas mediante funciones de densidades normales, y adems las soluciones coinciden con los modelos de Torrence-Sparrow, bajo las condiciones expuestas. Tambin han encontrado soluciones para superficies lisas aproximndolas a superficies rugosas mediante funciones deltas. Para estas deducciones, han elaborado un modelo de tres componentes: Lr (i r r ) = Cb
i +
Csl ( 2 e r
2 2
) + C ( ) ( ) ss i r r
( 3. 35)
50
DISAM-UPMT-98-015
Carlos Platero
la primera componente corresponde con la reflexin difusa explicada por el modelo lambertiano. La segunda componente corresponde al halo especular, est relacionada con la segunda solucin de Beckmann-Spizzichino y el modelo de Torrence-Sparrow. Y la tercera componente, referente al haz especular, corresponde a superficies lisas. La Figura 3.11 muestra un esquema del modelo.
Sensor Manantial Luz incidente n i Halo difuso i Halo especular r Pico especular
Figura 3.11 Modelo de Nayar
Las conclusiones de Nayar et al[Nayar91] pueden ser resumidas en los siguientes puntos: El modelo lambertiano puede ser usado para representar las componentes de halo difuso. Este modelo est siendo usado para el reconocimiento de formas desde sombras y en tcnicas de fotometra estreo. Los resultados indican buenas prestaciones. Los modelos de reflexin de Beckmann-Spizzichino predicen tanto la componente de halo especular como haz especular para superficies muy lisas (h << ). La componente de haz especular domina respecto al halo, y la superficie se comporta como un espejo. En la medida de mayor rugosidad en la superficie, decrece la componente de haz y empieza a dominar el halo especular. Las dos componentes son simultneamente significativas para un estrecho rango.
51
Carlos Platero
El haz especular tiende a concentrarse, a medida que la superficie sea cada vez ms lisa, h / < 1.5, y/o bien cuando el halo especular se concentra debido a que la superficie es suavemente ondulada, h / T < 0.025. El modelo de Torrence-Sparrow da una buena aproximacin para la componente halo especular de Beckmann-Spizzichino. Ambos modelos son exitosos en la prediccin del halo especular. Al ser ms simple de implementar el modelo de Torrence-Sparrow, ste debe ser empleado para representar la componente halo especular. El modelo de Torrence-Sparrow no es capaz de describir el comportamiento especular en superficies lisas, luego imposibilita utilizarlo para simular el haz especular. Aunque los dos modelos parten de diferentes supuestos, sus parmetros rugosos, h y , se encuentran relacionados por comparacin de las ecuaciones que describen el comportamiento del halo especular.
Estas conclusiones permitirn deducir cual de los modelos explicados debe utilizarse dependiendo de las caractersticas de las superficies a inspeccionar. 3.2.2 Modelo de la cmara
Superficie a inspeccionar
Cmara
A0
Asensor R2 Apixel R1
Si el sistema de adquisicin de imgenes, lente ms cmara (ver Figura 3.12), se encuentra a una distancia de R1, desde la superficie de inspeccin, el nmero de fotones incidentes dentro del sistema ptico, de rea A0 y durante el tiempo de integracin, tI, es de: nlente = Lr A0 AS At I R12
Lente
AS
( 3.36 )
Figura 3.12 Modelo de camara
donde Lr es la radicin refleja en la direccin del sensor y A es el coeficiente de transmisin atmosfrica. El nmero de fotones que alcanza el sensor ser: nsen sor = Lr A0 AS A Ot I 2 R2
( 3.37 )
O es la transmitancia del sistema ptico. Y el nmero de fotones incidentes en un pixel, es una relacin de reas:
52
DISAM-UPMT-98-015
Carlos Platero
n pixel = nsen sor
Apixel Asen sor ( 3.38 )
usando la aproximacin de ngulo pequeo para rayos axiales: As Asen sor = R12 2 R2
( 3.39 )
e introduciendo los conceptos de magnificacin ptica, MO, que es la relacin entre R2/R1. Adems, stas estn relacionadas con la distancia focal efectiva de la lente, luego: 1 1 1 + = R1 R2 f el nmero de fotones que recibe el pixel ser: n pixel = Lr A0 Apixel
( 3.40 )
f (1 + M 0 )
2
A Ot I
( 3.41 )
asumiendo una apertura circular e introduciendo el concepto de F - nmero, como la relacin entre f /D, siendo D el dimetro de la ptica, quedar: n pixel =
Lr Apixel A Ot I 4 F 2 (1 + M 0 )2
( 3.42 )
Todas las variables son funcin de la longitud de onda y de la energa de los fotones, y a su vez de la temperatura del foco luminoso. Por ltimo, el nmero de fotoelectrones generados en un detector de estado slido es: n pe = Rr ( )n pixel ( , TIlum )d
1 2
n pe = Rr ( )
1
Lr ( , TIlum )Apixel A ( ) O ( )t I d 4 F 2 (1 + M 0 )2
( 3.43 )
siendo R() la respuesta espectral del detector ante la luz.
53
Carlos Platero
3.3
Modelos de fuentes luminosas e iluminacin uniforme en superficies planas

La iluminacin uniforme de las superficies planas a inspeccionar es un requerimiento frecuente en los SIVA. En gran medida, porque facilita el procesamiento de la imagen adquirida, con lo que se disminuye el nmero de operaciones a realizar, llegando a abaratar los costes del soporte fsico (HW) y/o el tiempo computacional en el anlisis de imgenes. Los siguientes prrafos tienen como objetivo, mostrar un mtodo de diseo para la ptima colocacin del sistema luminoso, tal que consiga como efecto una distribucin uniforme de luz en el campo visual. El primer paso es intentar modelar la iluminacin producida por las fuentes de luz tipo reas, lneas, puntos y coronas, as como combinaciones de ellas. Una vez conocidas las funciones de comportamientos, es posible investigar los efectos de la seleccin del tipo de iluminacin y su lugar ms apropiado. Se considera que las superficies planas son iluminadas por fuentes monocromticas e incoherentes, de cuatro tipos: primera, fuentes de rea infinita, segunda, fuentes de luz uniforme lineal de anchura infinitesimal y longitud infinita, tercera, puntos infinitesimales de luz uniforme y cuarta, coronas de luz de ancho infinitesimal y radio finito. Las implicaciones de utilizar estos modelos simples para representar el comportamiento real del sistema de iluminacin, han sido discutidos por Gennert et al[Genne93] y van a ser tambin tratados en esta tesis. Considerando un nmero de modelos de fuentes, del mismo tipo o diferentes, tal que representen el sistema de iluminacin, la funcin de iluminacin E(x,y) evaluar la iluminacin total en el punto arbitrario (x,y) de la superficie a inspeccionar. Sin prdida de generalidad, se selecciona un sistema de coordenadas, en el cual el eje z es normal a la superficie. La orientacin de los ejes x-y con el plano de inspeccin ser coplanar y arbitrario, seleccionndose de la forma que mejor convenga. Al utilizar luz incoherente, la iluminacin sobre la superficie es la suma algebraica de las n contribuciones de las distintas fuentes luminosas
x0 x Lnea (superficie
E (x, y ) = I k Ek ( x, y )
k =1
z0
( 3.44 )
donde Ik y Ek representan la intensidad lumnica y la disposicin geomtrica del k foco. Foco El aspecto cuantitativo de Ik depende de la naturaliza del foco, pero sta no es importante en la determinacin de la uniformidad, excepto en lo Figura 3.13 Modelo 2D para que se refiere a la contribucin relativa desde una iluminacin iluminacin de mltiples focos. Esta notacin permite utilizar una funcin que separa la potencia luminosa, Ik, de la colocacin geomtrica foco superficie, Ek(x,y).
54
DISAM-UPMT-98-015
Carlos Platero
Para entender Ek(x,y), se hace el estudio en un espacio 2D con el fin de facilitar la explicacin (Figura 3.13). La iluminacin alcanzar su mximo, justo en la normal de la lnea (plano) que pasa por el foco, E ( x0 ) = I 1 = IE (x0 ) 2 z0
( 3.45 )
mientras la intensidad en un punto arbitrario, x, ser: z0 I cos z0 E ( x) = = I r2 = I 2 r r (x x0 )2 + z0 2
3/ 2
= IE(x ) ( 3.46 )
de lo que se desprende que E(x) slo depender de la coordenada del punto en la superficie y de la localizacin de la fuente. Por ltimo, como lo que se trata es de ver las irregularidades del flujo radiado sobre la superficie, la expresin puede normalizarse de 0 a 1 por cada contribucin del foco, al relativizarlo respecto a su valor mximo, E * ( x) = E ' ( x) E ' ( x0 )
( 3.47 )
E* se llama la iluminacin normalizada, que para el ejemplo utilizado ser: z0 3 3 z0 E * ( x) = r = 1 (x x0 )2 + z02 I z0 I
3/ 2
( 3.48 )
Por tanto, se desprende que el comportamiento del sistema luminoso depende de la colocacin de los focos respecto a la superficie plana a inspeccionar, siendo necesario determinar la contribucin de cada fuente. La prestacin definitiva es la suma ponderada de cada manantial luminoso, por lo que se pasa a estudiar las funciones de iluminacin de cada tipo de fuente. 3.3.1.1 Foco tipo rea Una fuente uniforme de tipo rea (figura 3.15), de extensin infinita y localizada paralelamente a la superficie plana a inspeccionar, produce una iluminacin normalizada E * ( x, y ) = 1
55
Carlos Platero
( 3.49 ) es fcilmente entendible al suponer que el rea est constituido por infinitos puntos luminosos y la aportacin luminosa en cada punto a de la superficie ser la misma.
z y superficie x
z y superficie x
iluminacin
iluminacin
Figura 3.15 Foco tipo rea
Figura 3.14 Foco tipo lnea
3.3.1.2 Foco tipo lnea La fuente lnea (figura 3.14), infinitesimal en dimetro, infinita en extensin y localizada paralela al plano de referencia, tendr una funcin normalizada de iluminacin E ( x, y ) =
* 3 z0 2 2 + z0
((x x )
0
3/ 2
( 3.50 )
donde x0 y z0 son las distancia entre el origen de coordenadas y el foco. Por conveniencia matemtica, el eje y ha sido elegido paralelo a la fuente de iluminacin. La deduccin de la expresin es similar a la empleada en el modelo 2D. 3.3.1.3 Foco tipo punto El manantial punto, infinitesimal en extensin y localizado en el punto P con coordenadas (x0, y0, z0), figura 3.16, la funcin de luminosidad respecto a la superficie es: E * ( x, y ) =
((x x ) + (y y ) + z )
2 2 0 0
3 z0
2 3/ 2 0
( 3.51 )
56
DISAM-UPMT-98-015
Carlos Platero
3.3.1.4 Foco tipo corona Esta fuente de ancho infinitesimal y de radio finito de valor R, figura 3.17, situada en un plano paralelo a la referencia y a una altura z0, produce una iluminacin [Genne94]: E (r ) =
2 2 R 2 + z0
2 2 (R 2 + z0 + r 2 2 Rr )(R 2 + z0 + r 2 + 2 Rr )
3/ 2 1/ 2
e m
( )
( 3.52 )
donde r = x2 + y2 m=
2
1/ 2
4 Rr R + z + r 2 + 2 Rr
2 0
e m = 1 m sen 2 d
0
( )
( 3.53 )
obsrvese de la expresin ( 3.52 ) que se tiene una iluminacin de isoluxes en forma circular.
z z y y superficie x (x,y) x superficie
iluminacin
iluminacin R P(x0, y0, z0) P(x0,y0,z0)
Figura 3.17 Foco tipo corona
Figura 3.16 Foco tipo punto
3.3.1.5 Iluminacin ptima uniforme En general, la iluminacin total E(x,y) sobre la superficie debe ser optimizada, tal que la adiccin de contribuciones est relacionada con el propsito de realce visual de la escena. Asumiendo que la funcin E(x,y) es analtica y conocida, un supuesto vlido al haber modelado las fuentes de iluminacin, esta expresin puede ser desarrollada en series
57
Carlos Platero
de Taylor alrededor del plano referencia. Para un punto cerca del origen,(x,y), la iluminacin total ser: E (x, y ) = E (x0 , y0 ) + E E x + y + ... x x = x0 y y = y 0
( 3.54 )
luego el criterio para optimizar, en el sentido de tener iluminacin uniforme, es hacer lo posible para eliminar todos los trminos del desarrollo de Taylor, excepto el de orden cero. Dependiendo de la expresin de E(x,y) podr disearse el sistema para la ptima iluminacin uniforme de la escena SIVA. Por lo que se presenta a continuacin cmo se han empleado los modelos de focos y superficies para el diseo de los sistemas de iluminacin para los dos SIVA implementados en el transcurso de esta tesis.
3.4
Sistema de iluminacin para los SIVA implementados

En la construccin de los dos SIVA implementados en el transcurso de esta tesis, hay dos problemas diferentes en el diseo del sistema de iluminacin: el primero es obtener una fuente luminosa que sea capaz de iluminar uniformemente el escenario SIVA, y el segundo, es determinar la localizacin del foco y la cmara respecto a la superficie. De ambos problemas se trata a continuacin, aunque slo se aborda en su totalidad el sistema de iluminacin para la inspeccin de la pasta de papel, pues el dedicado para el aluminio ya ha sido tratado por Fernndez [Fernn97]. De la citada motivacin, se pretende conseguir un modelo para la simulacin, de manera que con l se pueda decidir la forma y localizacin ptima de las fuentes luminosas. Con tal propsito se va a desgranar el mtodo empleado, basado en el diseo de sistemas de iluminacin uniforme y en el estudio de las propiedades de reflexin en la superficie a inspeccionar.
3.4.1
Metodologa a emplear para el diseo del sistema de iluminacin Hay dos aspectos distintos a resolver, el primero es la construccin de las fuentes luminosas que sean capaces de dar una iluminacin uniforme en la escena SIVA y el segundo es la localizacin del binomio fuente luminosa cmara, capaz de realzar los defectos superficiales. Para la construccin del sistema de iluminacin uniforme se utilizar los modelos de fuentes luminosas y se aplicar el desarrollo de Taylor en la iluminacin recibida, con el objeto de eliminar todos los trminos excepto el correspondiente al orden cero, consiguiendo el objetivo de iluminacin uniforme. Este mtodo podr verse con todo detalle en el diseo de las fuentes luminosas para la pasta de papel. Una vez obtenido el sistema de iluminacin uniforme se pasar al estudio sobre el comportamiento de la superficie ante la luz, empezando con la respuesta espectral de la luz. As la respuesta espectral de un sensor CCD difiere significativamente del ojo humano. El ojo humano es ms sensible en la longitud de onda de alrededor de los 500 nm,
58
DISAM-UPMT-98-015
Carlos Platero
correspondiente a la zona del espectro del verde y amarillo. En cambio un CCD es ms sensible al rojo, el rango espectral tpico va desde los 300 a los 1200nm, por lo que el primer paso a efectuar es estudiar la reflexin del material en la regin visible del CCD mediante algn espectrgrafo. El objetivo es encontrar, si hubiera, alguna regin del espectro de la luz que tuviera un efecto dominante en el contraste de los defectos. Este fenmeno es aplicado cuando los defectos tienen un color especfico o en materiales con componentes de reflexin difusos, por ejemplo en inspeccin de textiles o de madera. Sin embargo hay otros materiales como el acero, cuyas propiedades de reflexin muestran uniformidad en el rango visible del sensor. Para los materiales tratados hay que decir que este experimento no se ha efectuado para el aluminio colado, pero si se ha hecho para la pasta de papel, ms concretamente se ha buscado la regin del espectro que aumente el contraste de un tipo de defectos llamados shive ( ver 7.2 ). No obstante, para el caso del aluminio se ha supuesto que el antecedente del acero puede utilizarse para considerar uniformidad de comportamiento de las propiedades de reflexin en el rango espectral del CCD (ver figura 3.19). De otro lado se encuentra el dato sobre la rugosidad de la superficie. As por ejemplo, para el caso del aluminio, su rugosidad va desde los 50 m a los 75 m, dependiendo del tipo de acabado superficial ( ver 7.1 ). Esta informacin es extraordinariamente valiosa, primero porque segn las conclusiones de Nayar (3.2.1.6), esta superficie es clasificada de tipo rugosa y no lisa, lo que implica que la componente de luz reflejada es un halo especular y no un pico especular. Adems, tambin se concluye que el modelo ptimo a implementar es el de Torrence- Figura 3.19 Reflexin de la luz en el Sparrow, lo que permitir simular el acero en el rango de los 400 a 1100nm [Miett93] comp ortamiento de la radiacin reflejada de material no defectuoso, dependiendo tanto de la posicin c del manantial luminoso como del sensor b a respecto a la superficie. Slo resta para iniciar la simulacin, la modelizacin de los defectos. stos pueden ser r simplificados mediante geometras sencillas, d por ejemplo como las indicadas en la figura 3.18, cuyas dimensiones sern dadas mediante un anlisis superficial de los defectos. Todo ello Figura 3.18 Modelos geomtricos de los permitir localizar la ptima posicin de los defectos focos y los sensores mediante la simulacin en las diferentes posiciones espaciales, cuya funcin objetivo es la maximizacin del realce visual.
59
Carlos Platero
Esta metodologa propuesta por Miettinen et al[Miett93], puede ser contemplada para el caso del acero, en el que se ha procedido a modelar la superficie mediante el modelo de Phong, y se han considerado tres ngulos de ncidencia, 20, 45 y 70, concluyendo que el mejor ngulo para el realce es el de 45.
Manantial Luz incidente n i Sensor
Figura 3.20 a) Modelo empleado b)simulacin de araazo c) simulacin de falta de material d)simulacin de rugosidad local
3.4.2
Sistema de Iluminacin para la inspeccin del papel Se pretende construir un sistema de iluminacin para la inspeccin de pasta de papel segn la norma ENCE 404. Dicha normativa marca cmo debe iluminarse la pasta de papel para la localizacin de defectos locales. El sistema empleado se basa en la exposicin de los pliegos de papel ante una iluminacin de luz transmitida, esto es, el papel se deposita entre la fuente luminosa y el inspector humano. La informacin lumnica recibida por el ojo humano ser utilizada para la localizacin de las faltas. Una descripcin ms detallada sobre este mtodo podr ser obtenida en el captulo 7. Para el proceso de automatizacin de las tareas de inspeccin visual, lo primero a realizar ser el diseo del sistema de iluminacin. No necesariamente, el sistema de iluminacin utilizado por el inspector humano puede ser empleado por el SIVA, por las razones ya esgrimidas en el anterior captulo. El operario puede considerar cambios de posicin para tomar puntos de vistas complementarios, o por otro lado sombras generadas por la luz ambiental no hacen cambiar la opinin del operario pero puede perjudicar enormemente la decisin del SIVA. Sin embargo, la experiencia acumulada por parte del inspector y sus conclusiones, pueden dar una gran cantidad de pistas iniciales sobre cmo
60
DISAM-UPMT-98-015
Carlos Platero
puede estar constituido el sistema de iluminacin para el SIVA y cules deben ser sus caractersticas esenciales para la formacin de la imagen. Pues bien, la primera caracterstica del sistema de iluminacin para este SIVA debe ser que tiene que fundamentarse en iluminacin transmitida. Adems por la arquitectura que va a ser presentada, la superficie de inspeccin se ha dividido en cuatro regiones complementarias, con el motivo de disminuir los tiempos de inspeccin por cada pliego de papel. Su argumentacin ser dada en el captulo 7. Esta matizacin implica que en vez de un nico escenario SIVA, se va a tener cuatro escenarios independientes pero complementarios. Por lo que cada escenario estar constituido por un foco luminoso, un trozo de superficie a inspeccionar y una cmara. De forma que los cuatro escenarios, adyacentes entre s, cubran en su totalidad la superficie a inspeccionar que marca la norma. Una vez definidos los requisitos bsicos, se plantea a continuacin cules deben ser los objetivos del sistema de iluminacin. Como se ha comentado en este captulo, el sistema de iluminacin intentar trivializar todo lo posible el anlisis de las imgenes. Atendiendo a esta premisa, se pretender que la informacin luminosa que le llega al plano sensor de la cmara sea debida exclusivamente a la textura de la superficie. Adems deber exigirse que los datos captados por la cmara tengan la suficiente capacidad como para poder discernir qu es defecto y qu no lo es. Para poder cumplir con el primer objetivo, ser necesario que la iluminacin sobre la superficie a inspeccionar sea uniforme en el campo visual de la cmara. Y en cuanto al segundo requisito, habr de buscar el foco luminoso que tenga la conveniente potencia lumnica como para poder captar los suficientes fotones recibidos por el sensor durante el tiempo de integracin de la cmara. El primer objetivo va a depender de la disposicin fsica de los elementos del escenario SIVA, esto es, se va a tratar sobre la localizacin ptima del foco, la superficie y la cmara. En cuanto al segundo punto, resulta un problema de la eleccin de la tecnologa a emplear tanto del tipo de foco como de cmara. Por lo que se abordar en estos momentos la ubicacin correcta de los elementos, sin entrar en cules deberan ser sus caractersticas tcnicas, de las que sern comentadas en el mencionado captulo 7. 3.4.2.1 Disposicin ptima de los focos luminosos respecto a la superficie a inspeccionar Debido al tamao de los defectos a localizar y al tipo de sensor empleado, el escenario SIVA tiene una dimensin de 73 mm por 48 mm. Esta superficie es la captada por la cmara cada vez que toma una Figura 3.21 Diposicin geomtrica de los imagen, su justificacin viene avalada por focos las dimensiones de las faltas y por el tipo de arquitectura de sensores empleados (ver 3.5.2). Por ese motivo se hizo uso de focos luminosos puntuales, capaces tecnolgicamente
61
Carlos Platero
de mantener una iluminacin cuasi uniforme en esta superficie. De otro lado, por las estrategias de inspeccin sobre el pliego de pasta de papel, los susodichos focos estn separados de entre s 292 mm y 240 mm ( ver figura 3.21 ). Adems, se tiene que las fuentes de luz estn situadas en el mismo eje que las cmaras (transversal al papel), con la intencin de aprovechar al mximo la uniformidad del foco puntual y su mxima potencia. En la figura 3.21 se muestra las disposiciones mencionadas y las separaciones entre los focos, la superficie y las cmaras. De esta manera, se ha hecho una descripcin del modelo de iluminacin empleado, el cual podr ser simulado mediante las expresiones vistas en 3.3. Para una variacin de uniformidad de luz de un 2% en el escenario SIVA, segn el modelo expresado en ( 3.51 ), el foco deber estar situado a una distancia de 640 mm respecto al papel. La figura 3.23 muestra los resultados de la simulacin de la radiacin incidente en el rea de inspeccin. Los resultados de la simulacin muestran que la iluminacin con un solo foco es totalmente satisfactoria, pero que existen acoplamientos lumnicos como consecuencia de la proximidad Figura 3.22 Distancia entre focos, existente entre ellos, eliminando la propiedad de superficie y cmaras uniformidad en la radiacin luminosa incidente en la superficie del papel. Por lo que obligar a buscar algn remedio que evite las interferencias entre los diferentes focos. El mtodo empleado consiste en insertar cuerpos negros con el objeto de evitar la conexin entre focos, a la vez que se disminuya todo lo posible la radiacin reflejada de estos cuerpos. Pero antes de entrar en su anlisis, se van a contrastar los resultados de la simulacin con las observaciones experimentales.
62
DISAM-UPMT-98-015
Carlos Platero
Figura 3.23 Distribucin de la radiacin luminosa en un rea de inspeccin considerando: a) un solo foco, b) con dos focos, situado el segundo a 240 mm en Y, c) tres focos, con el tercero situado a 292 mm en X y d) con cuarto focos, con el ltimo a 292 mm de X y 240 mm de Y
3.4.2.2 Validacin de los modelos de focos luminosos puntuales Se pretende verificar que los modelos empleados y descritos en 3.3 se corresponden con los valores experimentales tomados. A tal fin, se ha hecho una plantilla de acetato cuadriculado con celdas de 50 mm x 50 mm y han sido tomadas medidas con un luxmetro. ste fue ubicado en la superficie de inspeccin, con el objeto de medir la radiacin recibida por uno, dos, tres y cuatro focos. Los resultados obtenidos si bien mantenan similares tendencias, sus valores no correspondan con los obtenidos por la simulacin (ver figura 3.24). Esta conclusin era de esperar, pues el foco utilizado es muy direccional, as su ngulo de apertura mximo es de 30. Recurdese que en el modelo de foco puntual, ste radiaba por igual en todas las direcciones. Adems fsicamente no es una fuente puntual, sino una superficie luminosa circular de 50 mm de dimetro, tal como se puede contemplar en la figura 3.21.
63
Carlos Platero
Ante el fracaso del mencionado modelo para recrear de forma terica los resultados experimentales, se pens en nuevas alternativas. Para ello, vase en que se aparta la realidad del modelo ideal. En primer lugar se ha considerado que la fuente de luz es un punto luminoso, sin dimensiones espaciales, lo cual no es as: el chorro de luz procede una superficie finita, lo que sugiere emplear una composicin de focos puntuales distribuidos homogneamente en la superficie luminosa. Por otro lado, la luz no es proyectada por igual en todas las Figura 3.24 Distribucin terica y direcciones del espacio, sino que existe un experimental sobre la superficie de cono de proyeccin predominante. Los inspeccin rayos del foco son tanto ms dbiles cuanto ms se alejan de su normal. Podra pensarse en ponderar la funcin de luminosidad mediante una funcin del tipo cosn, donde es el ngulo que forma el foco y el punto a estudiar de la superficie. En la funcin propuesta, independientemente del valor de n est acotada entre los valores de 0 y 1, aun ms, para = 0 vale 1 y 0 para = /2, para cualquier valor de n. El valor de n determina la forma que toma la distribucin: cuanto ms se aleje de 0, ms cncava ser la curva. 3.4.2.3 Modelo de puntos luminosos distribuidos Cada foco no es exactamente un punto infinitesimal desde el cual se proyecta toda la luz, sino que presenta una cierta superficie sobre la cual se distribuye el total de la emisin de luz. Esta superficie podra simularse mediante una fuente luminosa plana, que considera que cada punto emite una cantidad infinitesimal de luz, con lo cual la
Figura 3.26 Modelos basados en cargas puntuales distribuidas
Figura 3.25 Comparacin entre los resultados experimentales y un modelo de 7 focos
iluminacin total se obtiene integrando el valor de la intensidad luminosa por unidad de superficie sobre el rea de foco. Una forma de aproximarse a este modelo consiste en sustituir un solo punto luminoso en varios distribuidos sobre el rea del foco. As, se han
64
DISAM-UPMT-98-015
Carlos Platero
calculado los resultados de aplicar esta teora para dos, cinco y siete puntos luminosos distribuidos segn muestra la figura 3.26. A cada punto luminoso le corresponde una fuente cuya intensidad es igual al resultado de dividir la intensidad total por el nmero de puntos luminosos usados en la distribucin. Los resultados obtenidos son decepcionantes, ya que apenas hay diferencia con la simulacin de aplicar un solo punto luminoso. La debilidad de los resultados viene motivada por no considerar sus direcciones privilegiadas de radiacin, al haber repartido los focos homogneamente en la superficie de radiacin. 3.4.2.4 Modelo mediante funcin ponderacin Como se ha comentado anteriormente, una forma de reproducir la cada tan fuerte de la luminosidad conforme se aleja del eje de mxima radiacin del foco es utilizar funciones que tiendan a 0 para ngulos cercanos a los 90. Las funciones ms triviales que cumplen esta caracterstica son el conjunto de cosn. Al tener un parmetro indeterminado, permite tener un grado de libertad capaz de elegir aqul que ms se aproxime la curva real con la terica. Para elegir Figura 3.27 Geometra entre foco y dicho valor se ha utilizado una funcin de coste superficie basada en el sumatorio de las distancias entre la curva real y la terica. Y a esta funcin se ha buscado el mnimo, determinando el valor de n. El algoritmo queda as establecido:
m * * min J = E P ,i ( x, y ) ET ,i ( x, y ) i =1 r 2 cos n r02 + n * E T ,i ( x, y ) = 0 2 = 2+ n r r
)
2
( 3.55 )
donde m es el nmero de muestras tomadas, mientras EP,i*(x,y) y ET,i*(x,y) son las intensidades normalizadas experimentales y tericas, para un punto (x,y), situado en el plano de inspeccin. Derivando respecto de n e igualando a cero quedar: m * E P,i ( x, y) ET* ,i ( x, y ) n i =1
=0
* m * ET ,i ( x, y ) E , ( x, y ) E * , ( x, y ) = 0 T i i =1 P i n
( 3.56 )
Introduciendo la derivada en esta ecuacin se podr despejar el valor de n, quedando:
65
Carlos Platero
m * r 2+ n E P ,i ( x, y ) 0 i =1 r 2+ n
r02 + n r 2 + n log 0 r r
= 0
( 3.57 )
Se ha aplicado este algoritmo a las distintas mediciones experimentales, esto es, considerando la influencia de uno, dos, tres y cuatro focos sobre el escenario SIVA, segn la disposicin vista en 3.4.2.1, arrojando los siguientes resultados:
Tabla 3.2 Valores de n para las distintas pruebas experimentales Nmero focos 1 2 3 4 N 22,19 19,92 20,05 19,93
Mostrando que el valor de n es slido y que slo depende de la naturaleza del foco utilizado. Obsrvese que para n = 20, el modelo terico se ajusta bien al caso real ( ver figura 3.28). Por ltimo, para aclarar lo expuesto se muestra un resumen de las distribuciones lumnicas y un corte transversal en el eje y para apreciar mejor las diferencias. Para mayores detalles sobre los experimentos ver el trabajo de Garca [Garci98].
Figura 3.28 Comparacin entre los valores experimentales y el modelo de n cos
66
DISAM-UPMT-98-015
Carlos Platero
Figura 3.29 Diferencias entre los resultados experimentales y los obtenidos con los diferentes modelos
67
Carlos Platero
3.4.2.5 Diseo de las pantallas lumnicas Habiendo conseguido un modelo analtico sobre la radiacin lumnica del foco, y mostrndose la imposibilidad de iluminacin uniforme en el escenario SIVA a consecuencia del acoplamiento entre los focos, se pasa al diseo de cuerpos negros capaces de individualizar cada escenario para obtener una iluminacin cuasi-uniforme. Se trata a continuacin sobre cul debe ser la geometra y ubicacin de los cuerpos negros. Es evidente que la colocacin de los focos en el espacio, limita extraordinariamente las posibilidades tanto geomtricas como de localizacin espacial de los cuerpos. De otro lado, no existe fsicamente el concepto de cuerpo negro en el sentido de que toda la radiacin incidente sobre l sea totalmente absorbida. Todo ello conduce a que se deberan emplazar las pantallas lumnicas lo ms alejado posible del foco, con el objeto de disminuir la radiacin de reflexin de las pantallas en el escenario de inspeccin. Pero las distancias entre las fuentes luminosas no permiten ubicaciones de las pantallas muy alejadas. Aun ms, la separacin de los focos imponen las distancias mximas a las que pueden estar puestas las pantallas, siendo justamente la mitad de distancia entre focos, esto es, 145 y 120 mm respectivamente. En cuanto a su geometra y a su facilidad constructiva, podra pensarse o bien en un cilindro o bien en un paraleleppedo. El inconveniente de cilindro es su radio, ste como mximo podra ser de 120 mm, pues de mayor tamao interseccionara con cilindros adjuntos. Luego por cuestiones de radiacin reflejada y de diseo mecnico, la solucin es el paraleleppedo. El tamao del paraleleppedo y su exacta ubicacin debe cumplir con el doble objetivo de desacoplar las interferencias entre focos y minimizar el efecto de radiacin reflejada en el escenario. El primer objetivo se consigue con la colocacin de cuerpos opacos negros. Desde el punto de vista constructivo se han diseado paraleleppedos de aluminio revestido, o bien con pintura negra mate o bien con aironfix2 de terciopelo negro. En cuanto al segundo objetivo, se ha tratado de determinar sus dimensiones tal que se minimice el efecto de radiacin reflejada. Con tal propsito, se ha considerado que las separaciones lumnicas se comportan como superficies lambertinas, esto es, reflejan por igual en todas las direcciones. De esta manera, se puede conseguir un modelo analtico de su comportamiento. Y a partir de esta modelizacin se podr ubicar el paraleleppedo y sus dimensiones, atendiendo al objetivo de iluminacin uniforme en la superficie de inspeccin segn se vio en 3.3.1.5. En primer lugar habr de verificar la coincidencia entre la radiacin estimada y la medida, para ello se considera que la radiacin incidente sobre una de las pantallas seguir la siguiente expresin:
Producto comercial registrado
68
DISAM-UPMT-98-015
Carlos Platero
E ( x, z ) =
Iy 0 I cos 1 = 2 2 2 r1 x + y0 + z 2
3/ 2
( 3.58 )
donde y0 es la distancia entre la fuente y la pantalla, figura 3.31. Normalizando la expresin a E*(x,z), tanto la experimental como la analtica, se observa (ver figura 3.30 ) la validez del planteamiento, sin necesidad de recurrir a utilizar funciones ponderadas.
Figura 3.30 Radiacin incidente en una pantalla
En ( 3.58 ) no se ha aplicado ponderacin como en el caso anterior, pues la iluminacin recibida se encuentra fuera del cono luminoso de la fuente, recurdese que la apertura de la lmpara era de 30. Una vez estudiada la radiacin incidente sobre las pantallas, se pasa a determinar la ptima colocacin respecto al centro del foco. Considerando que las superficies del paraleleppedo radian por igual en todas las direcciones, esto es, se comporta segn la ley de Lambert, la distribucin luminosa debida a la radiacin reflejada de las pantallas en el escenario SIVA ser: E ( x1 , y1 ) = Ik dif
i =1 4
z superficie a inspeccionar x1,y1,z0
r2 z0 x,y0,z r1
x y
y0 pantalla lumnica
Figura 3.31 Geometra pantallas y la escena SIVA
de
las
cos 1,i cos 2,i r12i ,
dS r22,i ( 3.59 )
siendo el sumatorio extendido para las cuatro paredes y kdif el coeficiente de reflexin. Si se introduce las relaciones geomtricas existentes quedar:
69
Carlos Platero
E ( x1 , y1 ) = Ik dif
i =1 x , z
(x
y 0 ,i
2 2 + y 0,i + z
2 3/ 2
) ((x
1
2 1 x ) + (y1 y 0 ,i ) + z 2 2
z0 z
3/ 2
dxdz +
Ik dif
i =1 y , z
(x
x 0 ,i
2 0 ,i
+ y2 + z
2 3/ 2
) ((x
x 0,i
) + (y
2
z0 z
1
y) + z
2
2 3/ 2
dydz + ( 3.60 )
donde y0,i y x0,i son las distancias entre las pantallas y el foco, junto con z0 que representa la separacin entre la superficie de inspeccin y el foco. Si se analiza el desarrollo de Taylor sobre la radiacin reflejada de un par de pantallas para un dS, quedar los trminos de primer y segundo orden como: y (z z )( y y 0 a ) y (z z )( y + y 0 b ) E ( x1 , y1 ) = 3 0 a 0 3 5 1 3 0b 0 3 5 1 y1 r1a r2 a r1a r2 a
2
y (z z )( y y 0 a ) y (z z ) 2 E ( x1 , y1 ) = 15 0 a 0 3 7 1 3 0a 3 0 5 2 r1a r2 a r1a r2 a y1
2
y (z z )( y + y 0b ) y (y + y ) + 15 0 a 0 3 7 1 3 0 b 31 5 0 b r1a r2 a r1a r2 a ( 3.61 ) La condicin de uniformidad exigir que la separacin a pares de las pantallas sean idnticas, ya que esta condicin tender a cancelar todos los trminos excepto el de orden cero. Si en ( 3.61 ) se hace y0a = y0b, las primeras derivadas se anulan en la normal al foco.
Figura 3.32 Desarrollo de Taylor de la radiacin incidente de dos pantallas simtricas debida a un dS. a)Primeras derivadas, b) Radiacin para un dS y sus primeras derivadas
70
DISAM-UPMT-98-015
Carlos Platero
Por ltimo quedar comparar los resultados experimentales con los conseguidos por el modelo. Respecto a los valores medidos, stos se obtendrn de la resta entre los evaluados para un foco con el paraleleppedo y sin l. Se observa en primer lugar, que el efecto de la reflexin es de un orden de magnitud menor que la radiacin incidente de la fuente. Tambin es destacable cmo algunos valores se hacen negativos, lo cual no es
Figura 3.35 Medida de la luminosidad en el escenario SIVA a) con foco y paraleleppedo b) con slo foco c) slo efecto de reflexin debida al paraleleppedo
posible, lo que indica una falta de precisin en las medidas tomadas como consecuencia de la baja precisin del luxmetro utilizado. En tercer lugar, se observa el nivel de discrepancia entre los valores medidos de reflexin y el modelo terico obtenido de ( 3.60 ). Y por ltimo, se ha observado empricamente que el aironfix tiene menor coeficiente de reflexin. No obstante, se ha utilizado la pintura mate en el recubrimiento del paraleleppedo, pues el aironfix es ms receptivo de absorber polvo, lo que hara decrecer sus propiedades de cuerpo opaco con el paso del tiempo. El resultado conseguido es que la informacin recibida por el sensor slo se debe a la textura del papel y no a la intensidad luminosa recibida, esto Figura 3.34 Discrepancia entre el es, que la distribucin del histograma de la modelo terico y los valores medidos imagen se debe slo a la constitucin del material ante una radiacin luminosa transmitida, siendo esta ltima de igual valor en todos los puntos del espacio de medida.
Figura 3.33 Imagen recibida por el sensor y su hitograma DISAM-UPM DISAM-UPMT-98-015 71
Carlos Platero
3.5
Arquitectura de cmaras CCD en SIVA

Hay muchos factores a considerar cuando se va a elegir una cmara para un problema de inspeccin. Los aspectos primordiales se refieren a caractersticas tales como la arquitectura del array, la resolucin, la sensibilidad, la relacin seal ruido y las condiciones ambientales a las que las cmaras estn sujetas. Otros factores como la velocidad de la aplicacin, la respuesta espectral, y el coste de las cmaras tambin juegan un papel importante. Por lo que a continuacin se exponen los conceptos bsicos sobre cmaras CCD, para permitir posteriormente proponer un mtodo sobre la eleccin de arquitectura de cmaras en funcin de la aplicacin SIVA en cuestin.
3.5.1
Factores a considerar en la eleccin de las cmaras 3.5.1.1 Arquitectura de array La arquitectura del array depende del tipo de aplicacin a realizar. Por ejemplo, y en trminos generales, las cmaras lineales, progresivas y TDI son las ms utilizadas en inspeccin de superficies en movimiento. Mientras las cmaras entrelazadas son usadas, cuando se aplica supervisin en las que se puede parar el movimiento. Este botn de muestra, indica la importancia del tipo de arquitectura del sensor, por lo que se pasa a ver las ideas generales de cada una de ellas.
3.5.1.1.1 Cmaras lineales
Si bien es posible encontrar cmaras matriciales de hasta 5120 x 5120 [Chamb95], stas exigen anchos de bandas muy elevados. Por ejemplo, si se desean 25 imgenes por segundo, el volumen de informacin es de 640 Mpixel/s, hacindose prohibitivo para la mayora de las aplicaciones industriales. Con el fin de evitar este exceso de informacin, y si se desea alta resolucin, la solucin hay que encontrarla en las cmaras lineales. Las cmaras lineales son usadas en aplicaciones donde, bien la cmara o bien el objeto estn en movimiento en direccin perpendicular a la fila de sensores. Muy tpicos de inspeccin de superficies continuas en movimiento. Constructivamente las cmaras lineales carecen de distancia interpixel, esto es, no existen zonas no sensibles. Ello es debido a que el registro de desplazamiento se encuentra a uno de los lados de los fotosensores, y aunque
detectores
Registro de desplazamiento
a)
detectores
b)
Figura 3.36 a) un nico registro de desplazamiento b) doble registro
72
DISAM-UPMT-98-015
Carlos Platero
ste tambin es sensible a la luz, se cubre con una capa protectora. No obstante, el tamao total del pixel est limitado por la puerta de control. As en un sistema de dos fases de transferencias de carga, esto es, dos seales desfasadas, V1 y V2, que son utilizadas para transferir las cargas desde los fotosensores al registro de lectura mediante el efecto CCD (como se observa en la figura 3.38), la anchura del pixel depende del ancho de la puerta (el lector puede encontrar bibliografa variada en torno a las transferencias de carga y la estructura misma de los CCD, por ejemplo [Holst96] ). En el ejemplo de la ilustracin, se ve que el pixel debe ser de dos veces la anchura de una puerta, es decir, el tipo de transferencia de las cargas impone el tamao del pixel. Por eso, con el objeto de aumentar el nmero de pxeles e incrementar la resolucin, se puede reducir el ancho del pixel
V1 V2 Pixel Pixel T1 Carga T2 T3 T4
Puerta
Figura 3.38 Transferencia de carga en dos fases
mediante un doble registro (Figura 3.36b). Pudindose en este caso doblar la resolucin de la cmara lineal.
3.5.1.1.2 Cmaras entrelazada
Fotodiodos Registro de desplazamiento vertical Fotodiodos
Otro tipo de cmaras ampliamente usadas son las entrelazadas, stas consisten en un array de fotodiodos separados por registros de transferencia vertical, que son cubiertos por una capa opaca de metal (Figura 3.37). Despus de la integracin, las cargas generadas por los fotodiodos son transferidas al registro vertical CCD en un tiempo de 1s, minimizando los efectos de mancha. La principal ventaja de esta transferencia es la rapidez, del paso de la carga del sensor a la zona de
Registro serie de lectura Matriz de almacenamiento
Registro serie de lectura
Figura 3.37 Arquitectura de transferencia entrelazada a) registro b) zona de almacenamiento
73
Carlos Platero
almacenamiento, por lo que no hay necesidad de utilizar obturadores. La desventaja es que este tipo de salida implica una menor zona activa del sensor. El rea efectiva puede estar por debajo del 20%. Aunque este factor puede ser ampliado mediante el uso de microlentes. Existen variedades de arquitecturas de transferencias. Operan con dos, tres y cuatro fases. El nmero depende de la aplicacin, pero para vdeo estndar los registros de desplazamiento son de cuatro fases, cuyas cargas son almacenadas en dos puertas (Figura 3.39). Con 2:1 entrelazado, ambos campos son almacenados simultneamente pero ledos alternativamente, conocindose como integracin por cuadro. Con estndar CCIR cada campo es adquirido cada 1/50 s, as que el mximo tiempo de integracin llegar a ser de 1/25 s.
1 1 1 1 2 2 2 2 3 4 3 4 3 4 3 4
Figura 3.39 a) Integracin por cuadro b)Integracin por campo
Otra variante de integracin para esta arquitectura, es la llamada integracin por campo (Figura 3.39b), cambia el control de las puertas, tal que suma dos cargas en direccin vertical, generando un 50% de solapamiento entre los dos campos. Al tomar un par de pxeles se incrementa el doble de rango dinmico de la seal. Sin embargo reduce al 50% la MTF vertical.
Mientras que cualquier arquitectura puede ser usada para leer las cargas, al final el formato de vdeo limita la seleccin. Aunque las cargas son adquiridas en filas y columnas, las cmaras dan un formato de Impar datos en serie, consistente con los monitores. Par En la Figura 3.40 se observan los estndares } }} } tanto para dispositivos entrelazados como los } } seudo - entrelazados.
a a+b b c b+c d c+d
} } La ventaja del formato entrelazado es que permite disminuir los anchos de banda, manteniendo una consistencia debida a la inercia de la retina humana. El hecho de transmitir en dos campos las lneas pares e impares, ha provocado que los diseadores de Figura 3.40 Video entrelazado y seudocmaras CCD entrelazadas hayan aprovechado entrelazado este evento, como para hacer arquitecturas que comparten los recursos de lectura entre las lneas, obligando a que los tiempos de integracin no coincidan entre lneas pares e impares. Este motivo obliga a detener la escena, al menos durante el tiempo necesario para la adquisicin de la imagen, lo que supone un inconveniente grave.
74
DISAM-UPMT-98-015
Carlos Platero
3.5.1.1.3
Cmaras progresivas
La mayor desventaja de las cmaras entrelazadas est en el desfase de los tiempos de integracin, bien sea entre lneas o entre campos. Con el objeto de evitar parar las superficies que estn en movimientos accin requerida con cmaras entrelazadas, aparecen las cmaras progresivas. stas escanean secuencialmente lnea a lnea las imgenes. La primera ventaja de las cmaras progresivas es la de tomar imgenes en un mismo instante, en contraste con los sistemas entrelazados que adquieren secuencialmente la imagen en el tiempo. As cualquier movimiento vertical producido entre campos, provocar manchas en la imagen, mientras movimientos horizontales originan cortes en las lneas verticales. An en el caso de utilizar luces estroboscpicas para parar el movimiento, se tienen imgenes continuas slo en el campo que fue activado el pulso de luz. Cuando hay movimiento, slo un campo puede ser usado para el procesamiento de imgenes, reduciendo en un 50% la resolucin. En la figura 3.41 se aprecia la discontinuidad de las cmaras entrelazadas y la mejora de las progresivas, aumentando la resolucin vertical respecto a las entrelazadas.
fotodiodo CCD vertical

V1 V2 V3 V4
1 2
fotodiodo CCD vertical

V1 V2 V3 V4
1 2
3 4
3 4
Transferencia entrelazada
Transferencia progresiva
Figura 3.41 Efecto del movimiento a)carcter en movimiento horizontal b) Discontinuidad de la imagen debido al sistema entrelazado c) salida de una cmara progresiva
Figura 3.42 Diferencias constructivas entre entrelazada y progresiva
La diferencia entre progresivas y entrelazadas puede ser vista desde el punto de vista constructivo. Obsrvese en la figura 3.42 como las cmaras progresivas, de cuatro fases, difieren en su diseo, permitiendo almacenar cargas en el mismo instante de tiempo.
3.5.1.1.4 Cmaras TDI
Por ltimo, las cmaras TDI (TimeDelay and Integration) han representado una pequea revolucin en el campo de la inspeccin de superficies continuas. TDI implica los conceptos de mltiples exposiciones del objeto ante la cmara y su posterior suma. La conjuncin de desplazamientos automticos de las cargas, de un detector a otro, junto con los tiempos de exposicin, producen mltiples imgenes. La figura 3.44 muestra el efecto TDI. La lente de la cmara invierte el movimiento del objeto, recorriendo la matriz de detectores, mientras las cargas de un sensor a otro son desplazadas a la misma velocidad.
75
Carlos Platero
La sincronizacin entre la cmara y la superficie en movimiento, es realizada mediante el conocimiento de la velocidad de sta, por ejemplo a travs de un encoder.
Direccin del objeto
Cmara TDI Elementos TDI

T1
T2
Lneas de inspeccin
T3
T4
Figura 3.44 Inspeccin con cmaras TDI
Figura 3.43 Concepto TDI
Para entender el modo de operar de una cmara TDI, se sigue la figura 3.43. En el tiempo T1, la imagen se sita en el primer detector y crea una carga. Llegado el tiempo T2, la imagen se ha desplazado al segundo detector. Simultneamente, el reloj del pixel ha movido la carga del primero al segundo. En este punto, se crea una imagen formada por la carga anterior aadindose la nueva creada en el segundo detector, y as sucesivamente. La carga (seal) se incrementa linealmente con el nmero de detectores, tambin lo hace el ruido pero no proporcionalmente sino con la raz cuadrada del nmero de elementos TDI, NTDI[Holst96]. El resultado es una mejora de la relacin seal ruido en NTDI . No obstante, existe un lmite mximo de elementos TDI que puedan ser utilizados. Es evidente que una prdida de sincronismo afecta negativamente en la MTF de la cmara. La exactitud en el conocimiento de la velocidad de la imagen, es la que limita el nmero de TDI que van a ser usados en cada etapa de mltiples exposiciones.
3.5.1.2 Resolucin Una de las caractersticas ms importantes dentro de las cmaras de estado slido es la resolucin. La resolucin puede referirse tanto al nmero de pxeles contenidos en la matriz sensorial, como al nmero de lneas de televisin producidas. Las lneas de televisin es un viejo estndar que permaneci durante la primera expansin de cmaras de tubo de vaco. Este estndar se encuentra en desuso, aunque suele estar presente en muchos catlogos de productos referidos a cmaras. Las lneas de televisin se refieren a la frecuencia en que una imagen es dividida por un modelo peridico. A este respecto, las lneas televisin corresponden con el sistema de visualizacin, en comparacin al detector que hace referencia al nmero de pxeles en filas y columnas.
76
DISAM-UPMT-98-015
Carlos Platero
Si la resolucin viene dada en pxeles, se especifican, normalmente, por separado las dos direcciones, es decir, la horizontal y la vertical. Principalmente, este factor determina el elemento ms pequeo en que una imagen puede ser fraccionada. Tamaos tpicos de arrays de pxeles van desde 240x320 hasta 1024x1024. Es importante hacer notar que, aunque un mayor nmero de pxeles produce un aumento de la resolucin, tambin es cierto que se traduce en una superlativa informacin a procesar. A este respecto, una mayor resolucin tiene un aspecto negativo frente a la velocidad de procesado de esta informacin. Si la resolucin se basa en la capacidad de las cmaras de distinguir ms objetos dentro de la escena, este concepto no depende slo del nmero de pxeles. La resolucin final de una cmara depender de las lentes que se usen, del numero de pxeles contenidos en el sensor, del tipo de mecanismo de transferencia del chip detector y de la tarjeta digitalizadora empleada. Por lo que habr de considerar la resolucin en su globalidad y no slo en el nmero de pxeles. 3.5.1.3 Sensibilidad La sensibilidad es el trmino usado para describir la mnima cantidad de intensidad de luz que un sensor de una cmara es capaz de detectar y, por tanto, obtener un nivel de tensin en la salida. Esta caracterstica puede ser un factor determinante en la eleccin de la cmara. Las tpicas CCD tienen un rango de 0.015 luxes a 5 luxes. Las cmaras que son muy sensibles pueden ser muy tiles en aplicaciones con bajos niveles de luz, tales como la inspeccin de pelculas de fotografa. Para niveles bajos de luz, las tecnologas de cmaras CCD han creado lo que se conoce como ICCD cmaras (Intensified CCD), las cuales incorporan un intensificador de luz consistente en una pantalla de fsforo y un ctodo que est acoplado al sensor del CCD. Estos tipos de cmaras no son apropiados para procesos o entornos donde hay mucha intensidad de luz, debido a que se pueden producir saturaciones. 3.5.1.4 Velocidad/Tiempo de integracin La velocidad o la frecuencia vertical de una cmara tpica CCD es de 25 cuadros por segundo (estndar CCIR vdeo). Una pantalla de un vdeo se compone normalmente de dos campos separados que son adquiridos a una frecuencia de 50 hertzios. Esta frecuencia es normalmente insuficiente para la mayora de las aplicaciones de inspeccin en lnea. El tamao del array de los pxeles tambin influyen en la frecuencia. La razn es que a ms pxeles a leer, ms tiempo llevar, por lo que una ganancia en resolucin conlleva un sacrificio de la velocidad. El tiempo de integracin debe ser considerado cuando se trabaja con altas velocidades. El tiempo de integracin es el perodo de tiempo durante el cual a un pixel se le permite acumular carga. Las aplicaciones que tienen altas velocidades a menudo requieren reducidos tiempos de integracin para evitar manchas en las imgenes o desenfoques en las mismas. Para bajos tiempos de integracin, el obturador electrnico
77
Carlos Platero
puede ser una buena solucin. Estas cmaras que llevan incorporado el obturador, impiden la acumulacin de cargas filtrando las mismas dentro del substrato detector segn varios y diferentes mtodos. La velocidad de estos obturadores vara entre 1/60 segundos y 100 microsegundos para aplicaciones que requieran las ms altas velocidades. Las cmaras con obturador electrnico contienen adems un cristal con un liquido ferroelctrico para proveer del mecanismo del obturador. Este cristal lquido est localizado justo detrs de las lentes. En algunas aplicaciones es necesario que la cmara se pueda disparar (reseteable), esto es, que la acumulacin de la carga pueda ser eliminada de manera asncrona. Su origen viene dado por la necesidad de adquirir la imagen tras efectuarse un evento, lo cual se determina, normalmente, por una seal de disparo, provocada por el sistema, el cual enva una seal de reset para que la cmara pueda adquirir una imagen ante el suceso. Como se ha indicado, a veces la aplicacin requiere de una disminucin del tiempo de integracin, pero ello obligar a aumentar la potencia luminosa, con el objeto de mantener el suficiente rango dinmico en la seal de video. 3.5.1.5 Seal de ruido La relacin seal/ruido, SNR, indica la proporcin de potencia entre una seal y la cantidad de ruido presente en sta, esto es, muestra la proporcin de energa de una seal que puede ser considerada til, lo que viene a significar que a menor SNR, menos til es la seal. Este aspecto est ntimamente relacionado con la discusin de la MTF. La mayora de las cmaras de estado slido CCD tienen alta relacin seal/ruido, tpicamente oscilan entre 45 dB y 65 dB, que es prcticamente la ausencia de ruido para la mayora de las aplicaciones. La relacin seal/ruido depende enormemente de algunos factores tales como la temperatura, el contraste, la longitud de onda y la intensidad de luminosidad. 3.5.1.6 Respuesta del espectro La respuesta espectral de una cmara se refiere a la regin del espectro electromagntico en el que una cmara es sensible. Por ejemplo, el ojo humano tiene una respuesta mxima espectral entre la regin del azul y el verde del espectro visible. Las cmaras de estado slidos son sensibles en un rango de 200 nm a 1100nm. La mxima respuesta se encuentra en torno a los 800 nm de longitud de onda, la cual se encuentra cerca del final de la zona infrarroja del espectro. sta es la causa por la que la mayora de las cmaras de estado slido vienen con un filtro IR incorporado. De otro lado, la respuesta espectral difiere enormemente de un comportamiento ideal, pues dependiendo de cada longitud de onda su ganancia vara, esto es, la respuesta es altamente no lineal. El tipo de aplicacin y en particular el sistema de iluminacin, obligar a una seleccin de cmara atendiendo a su respuesta espectral.
78
DISAM-UPMT-98-015
Carlos Platero
3.5.1.7 MTF La funcin de transferencia de modulacin (Modulation Transfer Function) es una medida de cmo el sistema de imagen es capaz de reproducir con fidelidad la escena adquirida. Matemticamente, representa el mdulo del valor complejo de la funcin de transferencia ptica (OTF), por tanto representa la ganancia del sistema ptico para cada frecuencia, es evidente que la MTF carece de informacin sobre el nivel de intensidad de la seal. La MTF es calibrada generalmente entre el contraste en la salida respecto a la cantidad de lneas por milmetro visibles que se pueden obtener. La MTF de una cmara puede ser medida de diferentes formas, siendo una de las ms comunes aquella que determina cmo recoge una cmara unas series de pares de lneas blancas y negras de frecuencia variable. La medida se determina con el nivel de tensin producido por la cmara al ver los pares de lneas blancas y negras. Obsrvese que al hablar sobre la OTF, no slo se trata a la cmara, sino a la conjuncin de elementos de captacin, es decir, ptica, detector, transmisin y adquisicin. 3.5.1.8 Entorno Quizs uno de los aspectos ms importantes, que hay que considerar en la eleccin de una cmara de estado slido, para una aplicacin de inspeccin, es el entorno donde la cmara va a operar. A este respecto, tendr poco sentido elegir una cmara con todas las caractersticas correctas si la cmara no soporta el ambiente de trabajo. Los factores del entorno como temperaturas, vibraciones, contaminantes en el ambiente, etc. necesitan ser estudiados para saber qu cmara es la que se adapta mejor a estos ambientes. En algunos casos se hace necesario el encapsulado apropiado de las cmaras para protegerlas. Algunos fabricantes suelen ofrecer sus cmaras con encapsulamientos especiales para incrementar su resistencia a todos estos factores que han sido mencionados. Por ejemplo, Peafiel et al[Peaf94] utilizan cmaras protegidas contra la radiacin, para la inspeccin de intercambiadores de calor en centrales nucleares. 3.5.1.9 Coste En trminos generales y para una misma arquitectura de array, las cmaras con mayor nmero de pxeles poseen precios ms altos. Lo que s se puede tener en cuenta a la hora de comprar una cmara son algunas apreciaciones o alternativas. Por ejemplo, si se necesita alta resolucin, puede ser ms barato usar varias cmaras de baja resolucin que solamente una cmara con una muy alta resolucin. Frecuentemente no hay una nica solucin para una determinada aplicacin, lo que permite una cierta flexibilidad en la eleccin de la cmara.
79
Carlos Platero
3.5.2
Cmo elegir la cmara Una vez definidas las caractersticas bsicas de la escena a adquirir, se propone el siguiente proceso para la eleccin adecuada de la arquitectura de cmaras, atendiendo al objetivo de inspeccin de superficies, con tal propsito habr de responder a las siguientes preguntas: 1.-Qu resolucin se necesita? Para determinar la resolucin requerida, hay que determinar dos factores. El primero, cul es la caracterstica ms pequea a observar, y segundo, cul es el campo de visin deseado a adquirir. Para obtener la resolucin de una cmara, simplemente se divide el campo de visin por el tamao de la caracterstica ms pequea de inters. Como regla general, lo mejor es permitir que la caracterstica ms pequea sea representada por, al menos, un cuadrado de 2x2 pxeles[Vando90]. Pero en esta tesis, la resolucin se ha hecho depender de los tipos de algoritmos de deteccin de defectos. Por ejemplo, en la aplicacin desarrollada para la inspeccin de papel, cuyo fundamento se basa en pxeles de alto contraste (ver capitulo 4), el tamao del defecto ms pequeo se hace corresponder con el rea de un pixel, que en el caso del papel es de 0.015 mm2. Por otro lado, el campo de visin suele venir dado por la capacidad del sistema de iluminacin, ya que en general se pretende una intensidad luminosa uniforme en toda la superficie a inspeccionar por la cmara. En el ejemplo del papel, tal como se vio en 3.4.2, se tiene 50 mm longitudinales por 75 mm transversales de campo visual, en el que aparece una distribucin cuasi-uniforme de intensidad lumnica. Por tanto se plantea el problema en los siguientes trminos: Defecto ms pequeo (atendiendo a la caracterstica ms pequea, pxeles de alto contraste): 0.015 mm2 ( 0.1 mm x 0.15 mm ) Campo de visin (superficie con iluminacin uniforme): 50 mm x 75mm (proporcin 2 , tpica de la arquitectura de video) Resolucin (horizontal) = (50 mm/0.1 mm) x 1 pixel de alto contraste = 500 pxeles. Resolucin (vertical) = (75 mm/0.15 mm) x 1 pixel de alto contraste = 500 pxeles Para el ejemplo, se elegira una densidad de pxeles en el array detector de al menos 500 x 500 pxeles. Adems implica, que una vez decidido el tipo de cmara, el rea del pixel es fija y conocida, por lo que se est definiendo tambin la geometra del sistema de adquisicin de imgenes y la ptica necesaria. As, el campo de visin se usa tambin para calcular la cantidad de aumentos necesario. Para determinarlo, se tiene que dividir el tamao del array por la dimensin del campo de visin deseado. Para la situacin descrita arriba, el tamao del array detector es de 4.5mm x 7.3mm (cmara tipo WATEC902A). En este caso,
Campo de visin Superficie iluminada cuasi uniforme
Focos luminoso
Figura 3.45 inspeccin
Campo
visual
de
80
DISAM-UPMT-98-015
Carlos Platero
si se divide 50 mm entre 4.5 mm, se obtienen los aumentos necesarios de 11X. Esta informacin puede ser usada despus para identificar las lentes necesarias para la cmara seleccionada. En el caso de obtener una resolucin elevada, se puede optar por dos soluciones. Si es posible parar la escena, puede resultar ser ms ventajoso utilizar varias cmaras de baja resolucin en lugar de una de alta resolucin, pues se consigue disminuir anchos de banda puntuales y resulta ser una solucin ms econmica. Si la escena no se puede detener y el nmero de detectores a utilizar es elevado, bien porque la arquitectura de iluminacin slo permite iluminar uniformemente una estrecha banda, o bien porque se quiere cubrir el ancho de la banda del material a inspeccionar, las cmaras lineales y TDI son las ms apropiadas. Estas cmaras tienen la ventaja de poner decenas de miles de pxeles en lnea, cubriendo toda la cubierta de la superficie y con una resolucin muy alta. La adquisicin de una sola lnea permite un ancho de banda razonable, aun con centenas de miles de detectores. Por otro lado, las altas velocidades hacen que los tiempos de exposicin sean muy pequeos, obligando a aumentar la intensidad luminosa. Esta consecuencia, puede ser disminuida con cmaras TDI, siendo la ms utilizada en inspeccin de superficies continuas en lnea. 2.- Es estacionaria la superficie ? La respuesta a esta pregunta determinar el uso de iluminacin especial y el tipo de arquitectura de las cmaras. El propsito de usar iluminacin especial, como pueden ser luces estroboscpicas, o la obturacin automtica, es congelar el movimiento de un objeto para eliminar las manchas producidas por el movimiento de la imagen. Hay que tener en cuenta que, una cmara cunto ms rpido se obture ms luz se necesita. Esto es debido a que la cmara tiene menos tiempo para acumular fotones. Para superficies continuas de alta velocidad, como la produccin de acero[Domin94], los tiempos de integracin son muy pequeos, por lo que se requiere gran intensidad luminosa. Como ha sido comentado, las cmaras TDI son la solucin, pues permiten aumentar el rango dinmico a consecuencia de la suma de cargas en elementos TDI. Si la resolucin es media y es posible conseguir iluminacin uniforme en el campo de visin, las cmaras progresivas pueden ser empleadas. Y para baja resolucin, cmaras entrelazadas con integracin por campo y sub-muestreo en la seal de vdeo, pueden ser elegidas por su bajo costo y formato de salida estndar. Obsrvese que emplear integracin por campo en vez de por cuadro, permite a la imagen mayor continuidad y por ende mayor MTF. Si se hubiera utilizado integracin por cuadro con sub-muestreo, al ver slo un bloque de lneas, pares o impares, se apreciara una discontinuidad en la imagen y por tanto degenerar su calidad.
81
Carlos Platero
Las figuras 3.46 y 3.47 muestran las dos arquitecturas bsicas de inspeccin superficial, la primera basada en cmaras matriciales y la segunda en lineales.
Sistema de iluminacin
Batera de cmaras matriciales
Sistema de iluminacin
Batera de cmaras lineales
rea de inspeccin
Lnea de inspeccin
Figura 3.46 Inspeccin de superficies con cmaras matriciales
Figura 3.47 Inspeccin de superficies mediante cmaras lineales
3- Qu tipo de inspeccin va a realizarse ?. Difiere si se va hacer a modo de muestreo o en su totalidad. Para el primer caso, se trata de capturar un conjunto de muestras de la globalidad. El efecto sobre la eleccin de la cmara es la posibilidad de relajar las exigencias, pues el volumen de informacin puede ser regulado segn el soporte fsico elegido. Aqu no aparece el concepto de tiempo real, el sistema de inspeccin no est obligado por el proceso fsico a detectar a una velocidad determinada. La solucin es el uso de cmaras entrelazadas, cuando la superficie est inmvil, o bien, cmaras progresivas cuando se est en movimiento. Si la inspeccin es realizada en la totalidad de la banda, y las bobinas tienen transversalmente gran dimensin, se hace necesario el uso de cmaras lineales y en altas velocidades, cmaras TDI. Las razones son por un lado la necesidad de colocar miles de detectores por lnea, implicando un gran volumen de informacin, y de otro el movimiento en lnea, que exige de un procesamiento en tiempo real, slo abordable desde cmaras lineales o TDI. 4.- Una vez que los requerimientos de arquitectura del array, resolucin y tiempo de integracin han sido fijados, se pueden comparar las caractersticas de las cmaras comerciales, dentro del mismo tipo. Es el momento de establecer la solucin definitiva atendiendo a costes, sensibilidad, MTF, entorno, etc. Habr de atender a todo lo expuesto sobre la formacin de las imgenes digitales.
82
DISAM-UPMT-98-015
Carlos Platero
Para terminar, la figura 3.48 presenta un flujograma, a modo de resumen, que pueda ayudar en la seleccin de la cmara ante una tarea de inspeccin superficial. La primera divisin que se observa, es si la superficie est en reposo o en movimiento. Para superficies
Seleccin de cmaras para inspeccin superficial
esttica La superficie est ... media resolucin alta discreta
movimiento
continua La superficie es...
Cmaras entrelazadas Iluminacin constante
muestro Cmaras lineales
total La inspeccin es...
rpida Paso a paso El movimiento es... continuo Cmaras matriciales, parar movimiento Iluminacin constante alta resolucin
La velocidad es... Muy rpida
Cmaras entrelazadas Iluminacin constante
baja
Cmaras lineales
media Cmaras entrelazada Integracin por campo Cmaras progresiva Cmaras TDI Cmaras lineales o TDI
Figura 3.48 Flujograma para la seleccin de las cmaras ms adecuadas
estticas depender del tipo de resolucin, ya que como se ha visto, un nmero elevado de pxeles obligar a hacer uso de cmaras lineales. Cuando la superficie est en movimiento y sta es continua, caso del acero, el aluminio, etc., con el objetivo de cubrir todo el ancho de las bandas es necesario recurrir a cmaras lineales o ltimamente a cmaras TDI. La diferencia entre una y otra est en la sincronizacin de velocidad del proceso, una mejora de la relacin seal-ruido y que necesita menos intensidad luminosa la segunda respecto a la primera. Para el caso de inspeccin basada en muestreo, si se permite parar la imagen durante el tiempo de adquisicin, se puede utilizar cmaras entrelazadas y si hay movimiento cmaras progresivas. Para superficies discretas y con desplazamiento paso a paso, es decir, exposicin del material sobre las cmaras y retirada, caso de inspeccin de baldosas[Fernn97a] o billetes de banco[Sebas95], se puede emplear cmaras entrelazadas. Mientras para productos que se mueven continuamente, por ejemplo la inspeccin de etiquetas sobre
83
Carlos Platero
superficies planas [Plate98a], dependiendo de la resolucin se suele utilizar entrelazadas con integracin de campo, progresivas o TDI, segn sea baja, media o alta resolucin. 3.5.3 Ejemplos de formacin de imgenes en escenas SIVA En este ltimo apartado, se recoge en la tabla 3.3, a modo de resumen, las tcnicas empleadas en la adquisicin de imgenes de SIVA industriales, aplicados a superficies planas.
Tabla 3.3 Formacin de imgenes de SIVA Material a inspeccionar Acero Tipo de inspeccin (superf./veloc.) en lnea, alta velocidad (15m/s) en lnea, baja velocidad (2m/min) Iluminacin Arquitectura de cmaras Cmara lineal de 2048 pxeles Cmaras matriciales entrelazadas, 4 cmaras por cada cara Batera de cmaras progresivas de 512x512 Referencia
Uniforme controlada
[Domin94]
Aluminio colado
tipo rea uniforme, formada por tubos fluorescentes y difusor. Componente especular
[Plate94]
Baldosas
Discreta, paso a paso
tipo rea uniforme, formada por focos puntuales de naturaleza halgena. Componente especular Focos halgenos puntuales. Componente difusa Foco corona. Componente difusa 1 o 2 lseres de 780nm
[Ferna97a]
Billetes de banco Etiquetas farmacuticas Genrico (acero, plstico, madera) Genrico (productos continuos) Pasta de papel, mtodo ENCE
Discreta, paso a paso
Batera de cmaras entrelazadas 768x571 Integracin por campo Cmaras lineales
[Sebas95]
discreta, continua y media velocidad En lnea, continuo y en movimiento
[Plate97a]
[Intec93a]
En lnea, continuo y en movimiento
Luces estroboscpicas
Bateras de cmaras entrelazadas, 510x485 Cuatro cmaras entrelazadas, 500x576 Cmaras lineales
[Aero93]
Muestro
Tipo puntual con pantallas. Componente transmitida.
[Plate98]
Pasta de papel, mtodo TAPI
Muestro
Tipo lnea. Componente reflejada
[Intec93b]
84
DISAM-UPMT-98-015
Carlos Platero
Pelculas
En lnea
Fluorescentes VHO a 60 kHz. Componente transmitida Tubo fluorescente de alta frecuencia. Componente especular Fluorescente. Componente reflejada
Batera de cmaras TDI Cmara lineal de 2048 pxeles
[Rober93]
Planchas metlicas galvanizadas Textiles
En lnea
[Macai93]
Muestro
Entrelazada 768x756
[Serran95]
3.6
Conclusiones
En este captulo se han analizado los factores que intervienen en la adquisicin de imgenes digitales, siendo los ms importantes la iluminacin, los elementos pticos, los sensores y las tarjetas de adquisicin. Adems, se indica que dependiendo de la mtrica requerida, se necesita considerar ms o menos elementos a tener en cuenta para el diseo del sistema de adquisicin de imgenes. Por el nivel tecnolgico y las prestaciones requeridas para los SIVA implementados, slo se ha abordado el diseo del sistema de iluminacin y la eleccin de cmaras de estado slido. Para el diseo del sistema de iluminacin se precisa del estudio sobre el comportamiento de las superficies ante la radiacin luminosa, exponindose los diferentes modelos existentes, as como indicando la validez de cada uno de ellos. Adems tambin se pasa al anlisis de las fuentes luminosas, indicando sus caractersticas y las ecuaciones de comportamiento. Por otro lado, y en trminos generales, se suele requerir una iluminacin uniforme en el escenario SIVA, con tal propsito es necesario conseguir la expresin analtica de la radiacin incidente en la superficie a inspeccionar, para a rengln seguido buscar las condiciones geomtricas que intenten anular los trminos de primer orden y superior del desarrollo de Taylor. Tambin se ha presento una metodologa para el diseo del sistema de iluminacin, que consta de la definicin del tipo de fuentes luminosas ms la localizacin del binomio fuentes cmara respecto a la superficie. El mtodo se basa en un procedimiento de cuatro puntos: primero, estudio sobre el espectro de la luz para determinar la regin de sta que aumente el realce de los defectos; segundo, determinacin de las componentes de la luz a adquirir junto con el modelo de superficie a utilizar, tal que explique la respuesta de sta ante la excitacin luminosa; tercero, modelizacin de las fuentes luminosas, el material no defectuoso y el defectuoso; y cuarto, simulacin de la escena en diferentes posiciones espaciales. Parte de esta metodologa ha sido empleada en el diseo del sistema de iluminacin para la inspeccin de pasta de papel. Para terminar, se ha pasado al anlisis de los factores que influyen en la eleccin de una arquitectura de cmaras CCD, poniendo especial nfasis en la arquitectura del sensor. Proponindose a continuacin un mtodo bsico para la seleccin de las cmaras atendiendo a las especificaciones del SIVA a implementar.
85
Carlos Platero
Captulo 4: Deteccin visual de defectos locales
Deteccin locales
visual
de
defectos
Se pretende mostrar una metodologa sobre la deteccin de defectos locales en superficies homogneas, mediante tcnicas de Visin artificial, y que adems, sta pueda ser aplicada de manera industrial. Bajo este epgrafe aparecen las definiciones que delimitan el problema a resolver. En primer lugar, el material a inspeccionar debe ser homogneo, esto es, que su composicin y estructura sean uniformes [RealA96], como es el caso del acero, el aluminio, el papel, y otros materiales artificiales. El estudio se centra en la deteccin de defectos de carcter local, anomalas puntuales en la materia que no hacen cambiar significativamente las propiedades fsicas y qumicas globales de la materia, sino slo faltas visuales con influencias locales en las caractersticas de las sustancias. Aunque estas faltas locales repartidas en el material, definen el tipo de calidad del material y por ende las propiedades del producto. La aplicacin de tcnicas de Visin artificial implica que los defectos deben tener una apariencia visual distinta del resto de la materia que es catalogada como no defectuosa. Adems, en este marco de trabajo, se exige que con slo la componente de luminancia de la luz recibida por el sensor, sea capaz de discernir entre defecto o no. Esta restriccin es muy importante, al no abordar la inspeccin visual con tratamiento de colores. No obstante, sta es una prctica comn en estos tipos de SIVA [Newma95], que por otro lado minimizan la cantidad de informacin a procesar.
DISAM-UPMT-98-015
87
Carlos Platero
Y por ltimo, si la aplicacin debe ser industrial, el procesamiento de deteccin tiene restricciones de tiempo, definiendo las prestaciones de soporte fsico (hardware) y de ejecucin de algoritmos, acotando an ms los posibles caminos de actuacin. As si se utilizan, por ejemplo, medidas de texturas basadas en matrices de coocurrencia [Fern97][Cases97], el coste computacional es tan elevado que slo se podra realizar inspeccin de tipo muestreo, no permitindose trabajos de observacin al 100%. La problemtica de la deteccin, circunscrita al marco de esta tesis, consiste en un proceso de decisin entre dos alternativas: qu parte de la seal recibida corresponde a material local defectuoso y qu otra parte es buen material, a las que se llamarn defecto y fondo, respectivamente. En general, la informacin adquirida de la superficie a estudiar suele estar entremezclada. La parte de los datos recibidos que representa el defecto visual suele ser minoritaria respecto al volumen total de informacin. Y de otro lado, la informacin del fondo, a parte de ser mayoritario, tiende a cancelar el mensaje de la porcin defectuosa. En definitiva, la deteccin de defectos se presenta como un proceso de decisin donde la informacin est intrincada. Luego el xito de este bloque depender de su nivel de acierto. Un buen diseo en esta fase simplificar la construccin de un presumible clasificador de tipos de defectos. Es esta etapa la que reemplaza el juicio subjetivo, pero flexible, del inspector humano por la decisin inflexible de la mquina. Por lo tanto, las especificaciones de requerimiento para la deteccin deben ser extremadamente cuidadas, buscando un criterio de calidad compatible entre el hombre y la mquina. En este contexto, diseador y cliente tienen que decidir cuales deben ser las especificaciones del control de calidad, rea de inspeccin, tamaos de los defectos, faltas que podran no ser consideradas, etc. El conjunto de pautas debern ser lo suficientemente claras como para delimitar qu se detecta y cules no sern descubiertas, verifincndose con posterioridad el nivel aceptable de coherencia entre la inspeccin automatizada y la manual. Las figuras siguientes muestran lo anteriormente mencionado. En la figura 4.1 se muestra pasta de papel con un defecto local, del tipo llamado pitch. Obsrvese en las figuras 4.2 y figuras 4.3, representacin en 2D y 1D del defecto, correspondiente a un entorno de vecindad y a una fila con aparicin del defecto, donde no existe una evidencia certera del defecto, aunque ste existe y es visualmente localizable.
88
DISAM-UPMT-98-015
Carlos Platero
Figura 4.3 Pasta de papel con defecto tipo pitch
Figura 4.2 Textura del papel con inclusin de defecto
Figura 4.1 lnea 200 conteniendo defecto pitch
4.1
La deteccin como un proceso de decisin

La deteccin es fundamentalmente un proceso de decisin, la cual recibe normalmente una seal representativa de la apariencia visual, constituyendo la entrada del sistema, y devuelve a su salida una variable binaria. Suele etiquetarse con 1 aquellos pxeles representativos de material defectuoso, mientras un 0 indicar que son pxeles del fondo.
DISAM-UPMT-98-015
89
Carlos Platero
Como todo proceso de decisin, de manera inexorable, la salida estar errada. Un eficiente detector es aquel que minimice el error de clasificacin. Hay dos tipos de error: etiquetar con 1 material no defectuoso, al que tradicionalmente se llaman falsa alarmas, o el caso contrario, material defectuoso etiquetado con 0, denominado defecto no encontrado. En definitiva, el mejor detector es aqul que minimice estos dos fallos. Tal como acaba de reflejarse, es menester conocer algunas propiedades de la seal. Se considerar que un mensaje est presente, cuando ste cruce un determinado umbral. A veces es suficiente con la amplitud instantnea de la seal, como el utilizado para la inspeccin del acero[EES92], pero en general, ser necesario un tratamiento previo para aumentar el contraste entre fondo y defecto, con el propsito de poder ser detectado ms fcilmente. Este proceso de incrementar el contraste, requiere de una etapa previa antes del bloque de decisin. A este nuevo bloque se le llama realce o etapa de procesado. Las tcnicas a emplear son mltiples y sern objeto de estudio en el siguiente apartado (4.2). La definicin de esta etapa requiere de conocimiento explcito tanto de la seal del fondo como del defecto. Las tcnicas que incrementan el contraste para la deteccin de los defectos, suelen basarse en operacionales, lineales o no, en el entorno de vecindad. En el proceso de decisin, etapa clave del sistema de deteccin de defectos, la seal que proviene del fondo, a veces supera el umbral, generando falsas alarmas, o bien el mensaje del error no alcanza el umbral. La colocacin de este umbral debe ser tal que minimice estas faltas. Un aumento restrictivo del umbral, implicar una reduccin de defectos sin detectar, y de otro lado, una disminucin del umbral lleva consigo un aumento de falsas alarmas. Por eso la seleccin del umbral ptimo implica una solucin de compromiso. La deteccin vendr concebida cuando la amplitud de la seal, tratada o no, exceda, por arriba o por abajo, de un determinado umbral. En esencia, se buscarn picos o depresiones en la amplitud de la seal. Si el mensaje se manifiesta de otra forma, tal como un cambio global de la textura, sta llevar consigo un cambio en la distribucin espectral de la seal. Obsrvese que el planteamiento es totalmente distinto. En el primer caso, hace referencia a defectos locales, mientras en el segundo supuesto es un cambio no local del defecto. Pero recurdese que aqu, slo ser tratado de manera exhaustiva el caso de defectos locales. La seal podra cruzar el umbral debido a las fluctuaciones de luminancia del material, como consecuencia de su propia textura, incluso cuando no est presente ningn tipo de defecto local. El contraste entre el defecto y el fondo, es justamente el elemento esencial en este tipo de desarrollos. Las prestaciones de proceso de decisin se optimizarn en la medida de poder aumentar el contraste entre el fondo y el defecto, y en la eleccin adecuada del tipo de umbralizacin. En la mayora de las aplicaciones prcticas, las falsas alarmas tienden a distribuirse uniformemente sobre la superficie a inspeccionar. En cambio, los defectos al ser materia contigua tienden a formar grupos (cluster) de pxeles defectuosos. Parece pues, que pxeles aislados etiquetados como defectuosos, corresponderan con falsas alarmas, mientras que pxeles segmentados como defectuosos y que se agrupan bidimensionalmente sern buenos
90
DISAM-UPMT-98-015
Carlos Platero
candidatos. Esta propiedad puede ser utilizada como fase de post-procesamiento en la deteccin de los defectos. Concluyendo, un sistema de deteccin de defectos locales podra estar formado por tres componentes bsicos, tal como muestra la figura 4.4. Un primer bloque de realce de los defectos, cuya misin sea el aumento de contraste entre la zona defectuosa y el fondo. El segundo bloque corresponder a la toma de decisin basada en la amplitud de la seal, operacin no lineal e irreversible. Y el tercer bloque tratara de distinguir entre defecto y falsas alarmas, basndose en propiedades de continuidad de la materia y distribucin uniforme de las falsas alarmas.
Realce de los defectos (Procesado)
Deteccin de los defectos (Segmentacin)
Agrupacin de pixeles defectos (post-procesado)
Figura 4.4 Esquema general del proceso de deteccin
Las actuaciones de los bloques estn interaccionadas, no son bloques cuyos diseos puedan ser considerados como independientes. Por ejemplo, una accin de eliminacin de componentes de altas frecuencias del espectro de la seal, producido en el primer bloque, reducira la efectividad de la tercera etapa. El diseo ptimo de cada uno no es algo exacto sino que tiene componentes de ingenio, pues su formulacin en trminos formales no ha sido posible realizar. De esta manera surgen preguntas como Cul es el mejor filtro que aumente el contraste? Qu umbral optimiza el compromiso entre falsas alarmas y ocultacin de defectos? Cul es la tcnica de clustering capaz de distinguir ruido de defecto?. No existe una respuesta general, todo va a depender del conocimiento del problema y de la habilidad del diseador. Los siguientes puntos van a versar sobre estos tres bloques, intentado responder de forma metodolgica a las preguntas formuladas, para acabar con un criterio de medida sobre la eficacia del sistema detector.
DISAM-UPMT-98-015
91
Carlos Platero
4.2
Realce de los defectos locales

Los mtodos de realce de defectos pueden estar basados en tcnicas en el dominio espacial o frecuencial. No obstante, el procesamiento en el dominio de las frecuencias en inspeccin automatizada, no se puede contemplar el tratamiento en tiempo real desde el estado actual de la tcnica1. Dichos mecanismos de procesamiento de imgenes, aunque potentes y verstiles, estn reservados para implementaciones no crticas respecto al tiempo o en aplicaciones fuera de lnea. Las instalaciones en lnea, en general crticas en el tiempo de ejecucin, no pueden permitirse realizar procesamiento frecuencial. Sin embargo, estn apareciendo metodologas hbridas, haciendo uso de mtodos pticos analgicos y conversin a imgenes digitales capaces de reducir los tiempos. Esta lnea de trabajo novedosa y dentro del campo experimental, no ha sido contemplada en la realizacin de esta tesis. Slo se van a contemplar mtodos digitales basados en el dominio espacial. Dentro del dominio espacial hay que distinguir entre tcnicas pixel a pixel y tcnicas en entornos de vecindad. Si bien las operaciones de procesamiento pixel a pixel son muy tiles para el realce de los defectos, pues stas estn ntimamente ligadas al rango dinmico de la seal, este tipo de proceder no ha sido objeto de estudio, mas en lo que pudiera contribuir para una mejora de calidad de las imgenes adquiridas. En cambio, s se ha puesto nfasis en la investigacin de las relaciones espaciales de pxeles en pequeos entornos de vecindad, al ser sta la primera seal de reconocimientos de objetos en la imagen. Al tomar una imagen con defectos locales e iluminacin uniforme en la escena, un cambio en la tendencia de los niveles de grises en un entorno de vecindad, permitir detectar la presencia de faltas. Obviamente este proceder no es posible desde el procesamiento pixel a pixel. El resultado de operaciones de vecindad es generar otra imagen, distinta a la adquirida, con el objetivo de aumentar el contraste entre fondo y defecto. Al procesar la imagen para realzar ciertas caractersticas, va a implicar una prdida de la informacin original, por lo que tambin se suele llamar a las operaciones de vecindad filtros de procesamiento, en el sentido de transmitir una determinada parte del espectro de la seal. Los filtros espaciales se clasifican en lineales y no lineales. Los filtros lineales estn caracterizados por la convolucin entre mscara e imagen, coincidiendo con la inversa de la transformada de Fourier del producto de ambas transformadas. As son llamados filtros paso bajo, aquellos que permiten pasar las componentes de baja frecuencia y atenan las componentes de alta frecuencia. Las componentes de alta frecuencia caracterizan discontinuidades luminosas en la imagen, como bordes o detalles finos. De igual forma las componentes de baja frecuencia se relacionan con distribuciones espaciales homogneas.
En 1998, la tarjeta Genesis de Matrox realiza una transformada discreta de Fourier 2D, en una imagen de 512x512 con 8 bits en 2 s aproximadamente
92
DISAM-UPMT-98-015
Carlos Platero
Concluyendo, un filtro paso bajo generar un suavizado de la imagen mientras un filtro paso alto servir para la localizacin de bordes y de detalles en la imagen. Un tercer tipo de filtros son los llamados paso banda, eliminando las componentes de alta y baja frecuencia. Estos filtros son utilizados para la reconstruccin de imgenes y raramente para el realce. Los filtros espaciales no lineales tambin operan en entornos de vecindad. En general, el procesado se basa en alguna caracterstica de la vecindad, no utilizando explcitamente el uso de coeficientes de la mscara como en el procesado lineal. Por ejemplo, es comn realizar una eliminacin de ruido con la aplicacin de una mediana en el entorno de vecindad. Otro ejemplo, puede ser el aumento del brillo de la imagen, mediante el reemplazamiento de pixel de mayor intensidad en la mscara. Todas estas operaciones de maximizado, mediana, etc. son operaciones no lineales. Realizado este primer anlisis sobre las posibilidades de realce de defectos, las siguientes pginas van a desarrollar, el anlisis y sntesis de filtros espaciales lineales o no. No olvidando que el objetivo ltimo es el aumento de contraste entre el defecto y el fondo. Primero se abordan las tcnicas lineales para pasar luego a las no lineales. 4.2.1 Filtros lineales discretos El procesamiento lineal se fundamenta en la combinacin de pxeles mediante la multiplicacin de cada pixel por un factor, para proseguir con la suma de los productos, escribiendo el resultado sobre el pixel que sirvi de pivote, ver figura 4.5. Desde el punto de vista matemtico y considerando H el operador mscara y G la imagen, el resultado quedar como: G' = H * G g m,n =
M 1 N 1 k = 0 l =0
k ,l
g m k , n l
( 4.1 )
obsrvese detenidamente este proceder, primero es una transformacin lineal, segundo describe una operacin de convolucin discreta, reemplzese la integral por suma de elementos discretos y, tercero, una convolucin discreta coincide con un filtro lineal discreto, por la propia definicin que se ha dado. Estas ideas son la base del trabajo que se va a exponer a continuacin. Parece evidente que los resultados de la imagen de salida dependern del tipo y la forma de la convolucin, por tanto el problema que se estudia, es de cmo se va a disear la mscara de convolucin. Y por lo expresado se puede optar por dos vas, el diseo en el espacio temporal y en el basado en el espacio frecuencial, sabiendo adems la correspondencia biunvoca entre estos dos espacios. A partir de estos momentos se hablar de filtros o mscaras indistintamente. Antes de entrar en detalle sobre el anlisis y diseo de las mscaras, vanse algunas consideraciones prcticas. Desde el punto de vista terico y por lo mencionado anteriormente, se desprende la no existencia de lmites en el tamao de la mscara de convolucin. Pero en la prctica dos problemas hay que considerar, el primero y ms importante, a medida de que se tenga mscaras de mayor tamao, ms grande ser el esfuerzo coumputacional, por lo que se deber emplear mscaras de la menor extensin
DISAM-UPMT-98-015
93
Carlos Platero
posible. El segundo problema es el efecto de bordes y ruptura del teorema de convolucin. La adquisicin prctica de una imagen en un buffer de memoria, supone una discontinuidad en la convolucin al carecer de informacin ms all de las fronteras de la imagen. Con el objeto de evitar este inconveniente, se suelen utilizar bien buffers de procesamiento ms pequeos que el adquirido o bien, utilizar tcnicas llamadas overscan, consistentes en dar un valor fijo determinado o la media de los que tiene, emplazando los valores fuera de las fronteras por las calculadas. Todo ello lleva a utilizar mscaras lo ms pequeas posible, con el objeto de disminuir el nmero de operaciones y evitar las discontinuidades originadas por la falta de datos en las fronteras. Se trata pues de buscar filtros potentes y flexibles con el menor nmero de operaciones.
n-1
n+1
m-1 m 1 2 4 2 1 m+1 m
1 2 1
2 4 2
1 2 1
2 1
2 1
Figura 4.5 Operacin de convolucin discreta con mscara 3x3
Dentro de este apartado se va hacer el siguiente planteamiento: primero se van a estudiar las propiedades de las mscaras, mediante el uso del dominio de las frecuencias, de las que se van a desprender un conjunto de propiedades a tener en cuenta para la fase de diseo; segundo, se desarrolla la relacin existente entre convolucin y correlacin, y tercero, se expone, como proceso de sntesis, la utilizacin del mtodo de regresin de variable cualitativa para el diseo de mscaras. 4.2.1.1 FIR e IIR Hay dos tipos de filtros, los filtros no recursivos llamados FIR (finite impulse response) y los filtros recursivos bajo el nombre de IIR (infinite impulse response). Para sus estudios se empezar por abordar el caso de filtros unidimensionales. La funcin de transferencia de un filtro de tipo FIR, en transformadas en z y su ecuacin en diferencias es del tipo:
94
DISAM-UPMT-98-015
Carlos Platero
F ( z ) = a 0 + a1 z 1 + ... + a n z n y (k ) = a 0 x( k ) + a1 x(k 1) + ... + a n x(k n)
( 4.2 )
donde n es el orden del filtro. Obsrvese que en estos tipos de filtros cada valor de la secuencia de salida slo depende del nmero finito de valores de la secuencia de entrada. En cambio, las expresiones de los filtros recursivos corresponden a la forma de:
F ( z) = y (k ) = a 0 + a1 z 1 + ... + a m z m b0 + b1 z 1 + ... + bn z n ,n m
1 [a 0 x(k ) + a1 x(k 1) + ... + a m x(k m) b1 y(k 1) ... bn y(k n)] b0
( 4.3)
en estos casos, las secuencias de salida dependen tanto de la entrada como de la salida. De estas ecuaciones se deducen las siguientes propiedades, primero la respuesta impulsional es infinita para los filtros IIR, aun teniendo un nmero finito de coeficientes. Mientras la respuesta impulsional de un filtro no recursivo es siempre finita e igual al tamao de la mscara (figura 4.6). En segundo lugar, los FIR son siempre estables, esto es, el resultado del filtrado es otro valor finito. No es el caso de los filtros recursivos, su estabilidad depende de los coeficientes. La estabilidad de los filtros recursivos es muy difcil de analizar y especialmente cuando es de dos o ms dimensiones [Jhne97]. Tercera, cualquier filtro recursivo puede ser reemplazado por otro no recursivo con infinitos coeficientes, sus valores vendrn dados por la respuesta impulsional del IIR. La conclusin inversa no se cumple, slo hay que observar en la inestabilidad de los IIR y la estabilidad siempre de los FIR.
Figura 4.6 Respuesta impulsionales de FIR, IIR
4.2.1.2 Propiedades de los filtros lineales discretos Antes de entrar en el anlisis de mscaras, se van a comentar sucintamente las propiedades de los filtros lineales. stas, luego, sern utilizadas para el diseo de las mscaras de convolucin. Se denotar la mscara como el operador H, el cual transforma
DISAM-UPMT-98-015
95
Carlos Platero
una imagen G en G. En este apartado se van a tratar las propiedades del operador H, para llegar a que ste cumple con las caractersticas de linealidad e invarianza a traslaciones. El operador H tiene la propiedad conmutativa, esta propiedad es fcil de demostrar en el dominio de la frecuencia. H * H = H * H ( 4.4 )
Tambin tiene la propiedad asociativa, pudiendo componer un operador complejo a partir de operadores simples H * ( H '*H ' ' ) = ( H * H ) * H ( 4.5 )
por ejemplo, en vez de utilizar un filtro binomial de 5 x 5, llevando 25 multiplicaciones y 24 sumas, stas podran ser reducidas por la propiedad asociativa a 10 multiplicaciones y 8 sumas 1 4 6 4 1 4 6 4 16 24 16 24 36 24 16 24 16 4 6 4 1 4 6 4 1 = 1 4 6 * (1 4 6 4 1) 4 1
( 4.6 )
adems al estar el operador H constituido por elementos de un mismo espacio vectorial, se puede aplicar la propiedad distributiva respecto a la suma H + H = H
4.2.1.2.1 Linealidad e invarianza a traslaciones
( 4.7 )
El operador H tiene la propiedad de linealidad, as a dos imgenes, G y G de tamao P x Q, al ser operadas con dos escalares cualesquiera, a y b, cumple con la siguiente igualdad: H * (aG + bG ) = aH * G + bH * G ' que puede generalizarse para cada una de las entradas ( 4.8 )
96
DISAM-UPMT-98-015
Carlos Platero
H a k Gk = ak HGk k k
( 4.9 )
La propiedad de superposicin hace que el operador sea lineal. Esta propiedad es muy til al poder descomponer la imagen por cada una de las componentes que la constituyen. Formalmente, esto significa que la imagen es compuesta a travs de una imagen base, de manera que se puede escribir:
mn
1 m, n P= 0 en caso contrario
M 1 N 1 m =0 n =0
G = Gmn mn P
( 4.10 )
mostrndose el operador P como una funcin discreta dirac en 2D. Otra importante propiedad es la invarianza a traslaciones, esto es, el resultado del operador no depende explcitamente de la posicin de la imagen. Si se traslada en posicin, la imagen de salida es la misma pero desplazada. Se puede formular mediante el operador desplazamiento, mnS, como que cumple con:
mn
Sg m,n = g m ' m ,n ' n
( 4.11 )
El operador es invariante a cambios, al conmutar el operador H por el operador desplazamiento : H ( mn SG )= mn S ( HG ) obsrvese que el operador desplazamiento invariante a cambios. 4.2.1.3 Simetra La simetra de las mscaras tanto en tamao como en coeficiente es una propiedad muy utilizada en la prctica y, preferentemente se suelen utilizar mscaras de tamao impar. La convolucin de una mscara de tamao impar y centrada en el origen de sta, vendr dado por: g m,n =
mn
( 4.12 ) S, tambin es un operador lineal e
k = rl = r
k , l
g m+ k ,n +l
( 4.13 )
Las asimetras de los coeficientes de las mscaras no son utilizadas para el procesamiento de imgenes, ya que producen traslaciones en la estructura de la imagen. Un filtro simtrico transforma las caractersticas del entorno de vecindad, pero no cambia su
DISAM-UPMT-98-015
97
Carlos Platero
centro de gravedad [Jhne97]. Si se hacen traslaciones en los pxeles, no sern posibles las medidas de posicin de los pxeles. Y sta es una caracterstica importante en los equipos de inspeccin. Se puede distinguir dos tipos de simetra, par e impar, con la condicin de cumplir en una o en ms direcciones, las siguientes igualdades:
h k , l = h k ,l o h k , l = h k ,l
( 4.14 )
donde el signo + y hace referencia a simetra par o impar. Desde esta definicin y para el caso de un filtro unidimensional, la expresin ( 4.13 ) quedar como:
g m , n = h0 g m , n + g ,n = m
h (g
l l =1
m,n l
+ g m,n +l )
par impar
h (g
l l =1
m , n l
g m,n + l )
( 4.15 )
La suma slo recorrer la mitad de la mscara, excluyendo el pixel central, al cual habr de tratar aparte. En el caso de filtro impar, por la definicin dada en ( 4.14 ), el coeficiente del pixel central debe ser cero. Para el caso de mscaras bidimensionales, las simetras pueden ser diferentes por cada direccin. En el caso de imgenes bidimensionales existen cuatro tipos de direcciones principales: de abajo arriba, de izquierda a derecha, de la esquina superior izquierda a la esquina inferior derecha y, de la esquina superior derecha a la esquina inferior izquierda. Las expresiones de la convolucin dependern de las diferentes simetras que se den en cada una de estas direcciones. Sea ahora el caso ms general, es decir, se considera una convolucin constituida por un filtro IIR y FIR, las imgenes resultantes sern del tipo:
g m,n =
m '= 0 n '= 0
rm, n g m, n +
m '= r n '= r
m , n g m m , n n
( 4.16 )
donde los primeros sumandos corresponden al IIR, cuyos coeficientes son tomados del primer cuadrante, exceptuando el origen. Tal restriccin es necesaria, al considerar en el algoritmo recursivo slo los pxeles ya calculados. El signo de los ndices (m,n) determinarn la direccin en el que es aplicado el filtro recursivo. Los segundo sumandos representan el FIR de mscara (2r+1) (2r+1). Las funciones de transferencia de los filtros IIR no suelen ser simtricas, ms bien tienden a la direccin de propagacin del algoritmo recursivo. Si se requiere el diseo de filtros simtricos, debe ejecutarse el mismo filtro en todas las direcciones, o al menos en sentidos contrarios, sumndose o restndose los distintos resultados. De esta forma las asimetras pueden ser compensadas, unas con otras.
98
DISAM-UPMT-98-015
Carlos Platero
Para el caso de los filtros FIR, se puede hacer uso de la propiedad asociativa para el diseo de mscaras que fuesen simtricas en las cuatro direcciones. 4.2.1.4 Respuesta en frecuencia En el dominio de la frecuencia, un filtro se representa por su respuesta espectral. sta mostrar como cambia la amplitud y fase del filtro en funcin de la k-sima componente de frecuencia. La relacin entre el dominio frecuencial y espacial vendr dado por la transformada discreta de Fourier. La transformada del operador H, omitiendo el factor 1/MN para una representacin normalizada, ser:
hu , v =
m =0 n =0
m,n
2jmu 2jnv exp exp M N
( 4.17 )
Esta expresin puede ser simplificada si se aplican propiedades de simetras par e impar. La combinacin de los trminos simtricos hm,n y de h-m,-n quedar como:
hu , v = h0 , 0 +
( m , n )Dh
m,n
2jmu 2jnv exp exp M N
2jmu 2jnv + h M m, N n exp exp M N
( 4.18 )
donde Dh es el conjunto de ndices que recorre la mitad del espacio. Usando las caractersticas de filtros pares e impares, se desprenden las siguientes expresiones
hu ,v = h00 + hu , v = j
( m , n )Dh
2h
m,n
2mu 2nv + cos par N M impar
( m , n )Dh
2h
m , n sin
2mu 2nv + N M
( 4.19 )
estas ecuaciones se pueden escribir de manera que tambin quede normalizado el ~ eje de las abscisas, o sea, la frecuencia, de forma que se cambie a K = (2u / M ,2v / N ) , estando su rango entre 1 y 1. Las expresiones quedarn:
hu,v = h0,0 + hu,v = j ~ ~ 2h cos[ (mk + nk )] ~ ~ 2h sin[ (mk + nk )]
m,n 1 2 ( m,n)Dh m, n 1 2
par impar
( m,n)Dh
( 4.20 )
Como se ver ms adelante, estas expresiones van a ser muy utilizadas para el anlisis y diseo de las mscaras de convolucin.
DISAM-UPMT-98-015
99
Carlos Platero
4.2.2
Convolucin y correlacin espacial En el apartado anterior ha quedado clara la necesidad de utilizar mscaras simtricas, con el objeto de no introducir traslaciones espaciales en los centros de gravedad del entorno de vecindad. Pero existe otra propiedad ms a estudiar, la coincidencia entre el concepto de convolucin discreta y correlacin espacial. As, se define la correlacin entre una imagen G discreta y un operador H como: g ,n = m
M 1 N 1 k =0 l =0
k ,l
g m + k ,n+l
( 4.21 )
Si se compara esta expresin con la definida en la convolucin discreta, ( 4.1 ), se observar que slo difiere en los signos de los ndices. De hecho, en el dominio de las frecuencias sus transformadas coinciden en mdulo pero no en argumento: G * H GH correlacion(GH ) G * H
DFT DFT
( 4.22 )
En el caso de cumplir el operador H simetra par, la convolucin y la correlacin coinciden. Mientras en simetra impar es igual en mdulo pero de signo contrario. Sea por ejemplo el caso de una mscara unidimensional simtrica H, al que se le pasa por la imagen G para determinar su correlacin. Al aplicar simetra par e impar sobre ( 4.21 ) resultar: g ,n = h0 g m ,n + hl ( g m ,n l + g m ,n + l ) par m
l =1 r
g , n = H l ( g m , n + l g m , n l ) m
l =1
impar
( 4.23 )
Obsrvese que las expresiones ( 4.23 ) y ( 4.15 ) son iguales para simetra par y con distinto signo en simetra impar. Esta propiedad ha sido utilizada por los fabricantes de hardware de procesamiento de imgenes para el diseo de sus tarjetas[Awcoc95]. 4.2.2.1 Regresin mltiple Se ha observado cmo bajo ciertas condiciones de simetra, la convolucin coincide con la correlacin lineal. En todo caso, para cualquier caso de convolucin discreta del operador H sobre una imagen G, esta operacin puede ser presentada como una combinacin lineal de un vector H* por una matriz G*. Vase, partiendo de la definicin dada de convolucin:
100
DISAM-UPMT-98-015
Carlos Platero
g m,n =
k = rl = r
k , l
g m+ k ,n +l
( 4.24 )
Si se tiene un operador H de (2r+1) (2r+1) y una imagen G de PxQ pxeles, el vector H* estar constituido por todos los coeficientes del operador mscara H, esto es, ser un vector columna de (2r+1)x(2r+1) filas, mientras G* ser una matriz formada por PxQ filas y (2r+1)x(2r+1) columnas, quedando como: G* ' = G*H * ( 4.25 )
donde G* representar el vector de salida correspondiente al resultado de la convolucin. El motivo de cambiar el aspecto, viene originado por tratar de presentar el diseo de las mscaras como un problema de regresin mltiple. Si se utiliza notacin de Anlisis multivariante, a G* se la llama la matriz de diseo, mientras que H* ser el vector de parmetros. Segn el modelo lineal presentado: g i* ' = g i*1 h1* + ... + g i*,( 2 r +1)( 2 r +1) h(*2 r +1)( 2 r +1) ( 4.26 )
y suponiendo que (2r+1)x(2r+1) sea menor a PxQ, hace que el rango de G* sea de (2r+1)x(2r+1). Desde el punto de vista de la regresin mltiple, la solucin de los coeficientes de la mscara puede ser calculado mediante mnimos cuadrados. La solucin est definida por: (h ,..., h
* 1 T * ( 2 r +1)( 2 r +1)
) = (G
*T
G * G *T G * '
( 4.27 )
es decir, la mscara H puede ser estimada mediante el uso de la matriz de diseo, G*, y el nivel deseado de salida, G*. Antes de entrar en mayor detalle en la fase de diseo, vanse ms conceptos relacionados con la regresin. As, se define a la relacin lineal g i* ' = g i*1 h1* + ... + g i*,( 2 r +1) 2 r +1) h(*2 r +1) 2 r +1) ( 4.28 )
hiperplano de regresin de G* sobre G*. Y se llama correlacin mltiple al coeficiente de correlacin entre las variables G* y G * ' . Se indica por rg*i = corr ( g i *' , g i ' )
*
( 4.29 )
Si rg* es igual a 1, entonces el valor estimado y el verdadero valor coinciden, g* = g * , es decir la variable g* es combinacin lineal de g*, mientras que si rg* es igual a cero, g* no es combinacin lineal de g*. Obviamente g* es combinacin lineal de g* por la propia definicin dada en ( 4.25 ). Todo este repaso al anlisis de regresin, sirve para ver cmo la mscara de convolucin puede ser calculada desde la bsqueda de correlacin entre mscara y la forma del defecto que se desea detectar. ste es el fundamento de
DISAM-UPMT-98-015
101
Carlos Platero
muchos algoritmos de casamiento de patrones (pattern matching). Pero en este caso, no se pretende exactamente encontrar un patrn, sino el realce de defectos puntuales, esto es, aumentar el contraste entre el fondo y el defecto. En la figura 4.7 se expresa lo que se pretende conseguir, suponiendo un caso unidimensional. Pues bien, en el modelo de regresin no se tiene conocimiento a priori cuantitativo del resultado, esto es, no se sabe cuanto debe valer gm,n, pero si se sabe que se desea aumentar la diferencia entre fondo y contraste, lo que sugiere realizar un modelo de regresin con variable de respuesta cualitativa. 4.2.3
gmn
gmn 1
Figura 4.7 Realce de defecto con variables cualitativas
Modelo de regresin con variables cualitativas La variable respuesta en muchas investigaciones es binaria: por ejemplo, un accidente puede o no ocurrir, un crdito devolverse o no. De igual forma, la salida del proceso de convolucin no es conocida a priori, pero si es posible indicar si el pixel es defectuoso o no, implicando un resultado binario. Efecto que fue mostrado en la anterior grfica. Una solucin estara en formular el modelo de regresin y estimarlo mediante mnimos cuadrados: G*' = G * H * + u (h ,..., h
* 1
T * ( 2 r +1)( 2 r +1)
) = (G
*T
G * G *T G * '
( 4.30 )
donde u es el residuo. Suponiendo gi* como una variable binaria, se proceder a dar valor nulo cuando un pixel corresponde al fondo, y valor uno en las reas de pxeles defectuosas. Este procedimiento se encuentra con los inconvenientes siguientes: 1. Tomando esperanzas en ( 4.30 ) para G* = G*i: E g * ' | G * = Gi* = G * H *
( 4.31 )
si se llama pi a la probabilidad de que g* tome en la poblacin el valor 1 cuando G* = G*i, entonces la esperanza de la variable de salida quedar como:
102
DISAM-UPMT-98-015
Carlos Platero
pi = p ( g *' = 1 | G = Gi* )
E g * '| G * = Gi* = p g * ' = 1 1 + p g * ' = 0 0 = pi = G* H *
] (
( 4.32 )
En consecuencia, la prediccin de g* del modelo estima la probabilidad de que la observacin pertenezca a la clase definida por g*=1. Sin embargo, un inconveniente fundamental con est formulacin es que, aunque pi debe estar entre cero y uno, no hay ninguna garanta de que su prediccin, G * H * , verifique esta restriccin, por lo que puede prever probabilidades mayores de la unidad. 2. Conocido el valor de G*, los nicos valores posibles de g* son 0 y 1. Por tanto, la distribucin de ui es una distribucin discreta con valores (1-pi) y pi. La variable ui tiene media cero, pero no sigue una distribucin normal. En consecuencia, los estimadores mnimos cuadrados del modelo no sern eficientes [Pea87]. 4.2.3.1 El modelo logstico (Logit) La forma de garantizar que la respuesta prevista est entre cero y uno es transformar la variable respuesta, lo que equivale a establecer una relacin no lineal entre la salida y la variable de entrada. Formulando el modelo de manera que la probabilidad de pertenecer al grupo definido por G* igual a 1 sea una funcin no lineal de G* del tipo: pi = F (Gi H * )
*
( 4.33 )
donde F es cualquier funcin de distribucin, garantizando que, sea cual sea el valor de G * H * , el valor de probabilidad estar entre cero y uno. Existen varias funciones, pero la transformacin ms utilizada corresponde con el modelo logstico (logit), dada por: pi = 1 1 + e Gi
*T
H*
( 4.34 )
siendo sta una funcin sigmoide, definida entre cero y uno. Partiendo de una muestra caracterizada por una imagen transformada G*, cuya salida es un vector binario G*. La funcin de probabilidad de una respuesta g*i cualquiera es: P( g i* ' ) = pig i ' (1 pi )1 gi '
* *
g i* ' = 0,1
( 4.35 )
DISAM-UPMT-98-015
103
Carlos Platero
Por tanto, la funcin de probabilidades para la muestra es:

* P( g1 ' ,..., g * ' ) = pig i ' (1 pi )1 g i ' PxQ
* *
PxQ i =1
( 4.36 )
y tomando logaritmos:
PxQ pi PxQ * * ln( P( g1 ' ,..., g PxQ ' )) = g i* ' ln (1 p ) + ln(1 pi ) i =1 i =1 i
( 4.37 )
expresando pi en funcin de los parmetros de inters H * se obtendr su funcin soporte:

*T * * L( H ) = g i* ' Gi*T H ln 1 + eGi H
PxQ i =1
PxQ i =1
( 4.38 )
ya que, segn ( 4.34 ): 1 pi = 1 1 + e Gi

*T
H*
( 4.39 )
Para obtener los estimadores mximos verosmiles, se deriva ( 4.38 ) expresando el resultado como vector columna:
*T * * L( H * ) PxQ * * PxQ * e Gi H = g i ' Gi Gi 1 + e Gi*T * H * H * i =1 i =1
=0
( 4.40 )
que conduce al sistema de ecuaciones:

e Gi*T *H * g ' G = G 1 + e Gi*T *H * i =1 i =1 PxQ PxQ * i * i * i
( 4.41 )
Estas ecuaciones expresan que el producto de los valores observados por las variables explicativas debe ser igual al de los valores previstos. Tambin, que los residuos del modelo, ei = g i* ' g i* ' , deben ser ortogonales a las variables de entrada. La condicin ( 4.41 ) es anloga a la obtenida en el modelo de regresin estndar, pero ahora el sistema resultante no es lineal en los parmetros H * . Para obtener el valor MV de H * que maximiza la funcin soporte, ( 4.40 ), se recurre a un algoritmo tipo Newton-Raphson.
104
DISAM-UPMT-98-015
Carlos Platero
Desarrollando (L( H * ) / H * ) , el vector de tasas de discriminacin alrededor de un punto, se tiene L( H * ) L( H * k ) 2 L( H * k ) * * = + H H k * * * H H H H *T
( 4.42 )
para que el punto corresponda al mximo de verosimilitud su primera derivada debe anularse. Imponiendo la condicin (L( H * ) / H * ) = 0 , se obtiene: 2 L( H * k ) L( H * k ) = H + * *T H H H *
* 1
( 4.43 )
que expresa cmo obtener el punto H * k del mximo a partir de un punto prximo * cualquiera H . La ecuacin depende de la matriz de segundas derivadas, que, en el ptimo, es la inversa de la matriz de varianzas y covarianzas asinttica de los estimadores MV. Derivando por segunda vez en ( 4.40 ) y sustituyendo las derivadas de primer y segundo orden en ( 4.43 ), queda: H * k = H * + G *T VG *
G *T (G * 'G * ' )
( 4.44 )
donde V es una matriz diagonal con trminos pi(1-pi), mientras G * ' es el vector de valores esperados de G*. Esta expresin proporciona el siguiente algoritmo iterativo para obtener el estimador MV de H * . 1. Fijar un valor arbitrario inicial, H * 0 , para los parmetros y obtener el vector * G ' 0 para dicho valor en el modelo logit. 2. Definir una variable auxiliar Z = V 1 (G * 'G * ' ) . 3. Estimar por mnimos cuadrados ponderados una regresin con variable dependiente Z, regresores G* y coeficientes de ponderacin g i+ ' (1 g i+ ' ) . Los parmetros estimados con esta regresin, vendrn dados 1 *T por G *T VG * G (G * 'G * ' ) . Obtener un nuevo estimador de los parmetros utilizando el resultado de la etapa anterior, quedando la expresin:
H * k = H * k 1 + G *T Vk 1G *
G *T (G * 'G * ' k 1 )
( 4.45 )
El proceso se repite hasta obtener la convergencia. De esta forma es posible obtener los coeficientes de los filtros lineales discretos. Se ha transformado el problema de realce en una bsqueda de la correlacin entre la mscara y la forma de los defectos.
DISAM-UPMT-98-015
105
Carlos Platero
4.2.4
Filtros no lineales: Procesamiento morfolgico Dentro de los filtros no lineales destacan las tcnicas basadas en procesamiento morfolgico. El impulso del procesado morfolgico sobre imgenes ha sido desarrollado principalmente por Georges Matheron[Mathe75] y Jean Serra [Serra82]. La Morfologa matemtica se concentra en el anlisis de formas en una imagen. La teora general, desarrollada inicialmente, se restringi a imgenes binarias, siendo ms reciente su aplicacin en imgenes de niveles de gris. Las referencias [Dough92] y[Dough94] tratan de forma didctica este tema. El procesado morfolgico de imgenes constituye en la actualidad una importante herramienta para el anlisis de imgenes con formas predefinidas. Actualmente, estas operaciones resultan ser los procesamientos no lineales ms empleados en la Visin artificial, y la mayora de las tarjetas de procesamiento de imgenes permiten la realizacin en tiempo real de los operadores ms bsicos. Para entender la filosofa de trabajo de los filtros morfolgicos, se inicia a travs de su definicin para imgenes binarias y se ampliar el concepto posteriormente a la morfologa sobre escalas de grises. 4.2.4.1 Procesamiento morfolgico en imgenes binarias La idea bsica en imgenes binarias es la de recorrer la imagen a procesar G con una mscara H, denominado elemento estructurante, que posee un origen como referencia y dnde la pertenencia de un punto a una imagen transformada, se decide comprobando si los conjuntos de H y G verifican una determinada condicin. Aquellos puntos gm,n en los que la respuesta sea afirmativa pasarn a formar parte de la imagen transformada. Con imgenes binarias, las combinaciones de pxeles vecinos vendrn dadas por operaciones basadas en el lgebra de Boole. As, se puede empezar definiendo una posible convolucin binaria tal que reemplace la multiplicacin por el operador lgico and, y la suma por el operador or, el resultado quedar como: g ,n = m
m '= r n '= r
h
m 'n '
g m m ',n n '
( 4.46 )
Los smbolos y representan las operaciones lgicas and y or, respectivamente. La imagen binaria G ha sido convolucionada por el elemento estrcuturante H, de tamao 2r+1x2r+1. Si se asume que todos los elementos de H son unos, al operar segn ( 4.46 ), si al menos un pixel de la imagen G es uno, en la zona que est incluida la mscara, el resultado de la operacin ser un uno, en caso contrario resultar cero. Por lo tanto el objeto ha sido dilatado. Pequeos agujeros o fracturas sern llenados, mientras el contorno de los objetos pasarn a ser suavizados. El operador definido por ( 4.46 ) se llama operador dilatacin.
106
DISAM-UPMT-98-015
Carlos Platero
Con propsito opuesto se puede definir el operador erosin. Los objetos que sean ms pequeos que la mscara desaparecern completamente, mientras grupos de pxeles conectados por puentes sern separados. La erosin de un objeto estar definida por la siguiente convolucin binaria: g ,n = m
m '= r n '= r
h
m 'n '
g m m ',n n '
( 4.47 )
Se ha utilizado esta notacin no convencional del procesamiento morfolgico para transitar fcilmente del procesado lineal al no lineal. Normalmente estas operaciones son definidas sobre la teora de conjuntos. As, se considera G como el conjunto de todos los posibles pxeles de la matriz que sean distintos de cero. H es el conjunto de pxeles distinto de cero del elemento estructurante. Con Hp se denota la traslacin de la mscara respecto al pixel p, pues no necesariamente el centro de la mscara es donde pivota el elemento estructurante. La erosin se definir como: GH = {p : H p G} y la dilatacin como: G H = {p : H p G 0} ( 4.49 ) ( 4.48 )
estas definiciones son equivalentes a ( 4.47 ) y ( 4.46 ) respectivamente. Segn ( 4.48 ), la erosin sobre G con el elemento estructurante H da como resultado todos los pxeles p, para los cuales Hp est completamente contenido en G. Por el contrario, la dilatacin de G por H es el conjunto de todos los pxeles para los cuales la interseccin de G y Hp no es el conjunto vacio. Los operadores dilatacin y erosin son considerados como los operadores elementales de la morfologa, pudindose construir operadores ms complejos a partir de stos.
4.2.4.1.1 Propiedades
Los operadores morfolgicos no comparten todas las propiedades de las convoluciones lineales, vistas en 4.2.1. Invariante a traslaciones: Viene como consecuencia directa de la definicin de erosin y dilatacin como convolucin binaria. Utilizando el operador traslacin mnS y para cualquier operacin morfolgica queda: H ( mnSG )= mnS ( HG ) ( 4.50 )
Superposicin: Con cualquier operador morfolgico y para las siguientes expresiones
DISAM-UPMT-98-015
107
Carlos Platero
H (G G ') = ( HG ) ( HG ' ) H (G G ') = ( HG ) ( HG ' )
( 4.51 )
En trminos generales, los operadores morfolgicos no son aditivos en el sentido de ( 4.51 ). Mientras el operador dilatacin cumplira con el principio de superposicin, la erosin no cumple. La erosin de la unin de dos objetos es un superconjunto de la unin de los dos objetos erosionados:
(G G')H (GH ) (G' H ) (G G ') H = (G H ) (G' H )
( 4.52 )
Conmutativa y asociativa: Los operadores morfolgicos son generalmente no conmutativos H 1H 2 H 2 H 1 H1 H 2 = H 2 H1
( 4.53 )
Es fcil de entender que la erosin no es conmutativa para el caso especial de que H1H2, la erosin de H2 por H1 ser el conjunto vaco, pero el caso contrario no lo es. Sin embargo, las aplicaciones consecutivas de erosiones y dilataciones sobre una misma imagen son conmutativas: (GH 1 )H 2 = G( H 1 H 2 ) = (GH 2 )H 1 (G H 1 ) H 2 = G ( H 1 H 2 ) = (G H 2 ) H 1
( 4.54 )
Estas conclusiones son muy importantes para la implementacin del procesado morfolgico. Generalmente, las operaciones en cascadas con k elementos estructurantes H1, H2, , Hk son equivalentes a la operacin con un nico elemento estructurante H = H1 H2Hk. Concluyendo, un elemento estructurante grande puede ser descompuesto en otros ms pequeos. Un importante ejemplo es la composicin del elemento estructrante en filas y columnas, H=Hx Hy. Otro ejemplo, es la realizacin de un elemento estructurante de tipo circular, ste podra construirse mediante la combinacin de elementos estructurantes unidimensionales que corran en ms direcciones que las axiales. Montonas: La erosin y la dilatacin son operadores montonos G1 G2 G1 H G2 H G1 G2 G1H G2 H
( 4.55 )
La propiedad de ser montonas la erosin y la dilatacin, significa que las relaciones de subconjuntos son invariantes a estos operadores.
108
DISAM-UPMT-98-015
Carlos Platero
Distributiva: Las propiedades distributivas para la dilatacin y la erosin son ms complejas que en los filtros lineales. As, la erosin es distributiva con la interseccin, mientras la dilatacin sobre la unin. (G1 G2 ) H (G1 H ) (G2 H ) (G1 G2 )H = (G1H ) (G2 H ) y (G1 G2 ) H = (G1 H ) (G2 H ) (G1 G2 )H (G1H ) (G2 H )
( 4.56 )
( 4.57 )
Dualidad: La erosin y la dilatacin son operadores duales. Tomando la imagen negada G, la erosin se convierte en una dilatacin y viceversa: G H = G H G H = GH
( 4.58 )
Los fundamentos de las operaciones de Morfologa matemtica, incluyendo las demostraciones de todas las propiedades vistas, pueden ser encontradas en el libro de Serra [Serra82].
4.2.4.1.2 Opening y closing
Usando los operadores elementales de erosin y dilatacin, se pueden disear operaciones de realce de formas de objetos. La erosin suele utilizarse para eliminar pequeos objetos, prctica que ser utilizada posteriormente en la fase de postprocesado. Sin embargo, tiene el inconveniente de disminuir el tamao del resto de los objetos. Este efecto puede ser subsanado con una aplicacin en cascada de erosin y dilatacin con igual elemento estructurante. A esta operacin se la llama opening. G $ H = (GH ) H ( 4.59 )
El opening elimina todos los objetos que no estn completamente contenidos en el elemento estructurante, pero adems no disminuye el tamao a los objetos que superen la erosin. Esta operacin puede ser ideal para la eliminacin de falsas alarmas. Ntese que las fronteras de los objetos tambin sern suavizadas. Por el contrario, la dilatacin opera agrandando los objetos, cerrando los agujeros y las grietas. El ensanchamiento de los objetos puede ser reducido mediante la aplicacin seguida de una erosin. La operacin combinada de dilatacin y erosin es llamada closing:
DISAM-UPMT-98-015
109
Carlos Platero
G H = (G H )H
( 4.60 )
El cambio de reas de los objetos puede ser resumido por las siguientes relaciones, considerando que H contenga el origen: GH G $ H G G H G H Opening y closing son operaciones idempotentes G H = (G H ) H G $ H = (G $ H ) $ H ( 4.61 )
( 4.62 )
esto es, la aplicacin de una segunda vez de un closing o un opening con igual elemento estructurante no muestra cambios de una a otra.
4.2.4.1.3 Operadores hit-miss
La idea de estos operadores es si es posible detectar objetos de una forma determinada. La erosin slo elimina aquellos objetos que no contengan al menos el elemento estructurante, por lo que la deteccin de una forma especfica requiere una combinacin de ms operaciones morfolgicas. Por ejemplo, si se desea encontrar un objeto que tenga la forma H1 = [111] ( 4.63 )
en la imagen G, al aplicar una erosin utilizando como elemento estructurante H 1, se eliminan todos los objetos que no contengan completamente la mscara, pero tambin pasarn objetos de mayor tamao a H1. Se hace necesario aplicar una nueva operacin para eliminar aquellos objetos que han superado la erosin y son mayores a H1. Analizando el fondo de la imagen binaria, se observa que si se hace una erosin con una mscara H2 de tamao 3 x 5, justo la contraria de H1, esto es: 11111 H 2 = 10001 11111
( 4.64 )
al erosionar el fondo con H2 aparecern objetos del fondo con la forma de H2, correspondiendo con formas de igual tamao a H1 o menores. Luego, la interseccin de la primera erosin con la segunda dar todos los pxeles de objetos constituido por una fila de tres pxeles consecutivos. En general, los operadores hit-miss se definen como:
110
DISAM-UPMT-98-015
Carlos Platero
G ( H1 H 2 ) = (GH1 ) (G H 2 ) = (GH1 ) G H 2
( 4.65 )
con la condicin de H1H2 = 0, en caso contrario, el resultado de la operacin podra dar el conjunto vaco. sta es una herramienta muy potente tanto para la deteccin de formas, como para el borrado de objetos con formas determinadas. La versatilidad de stas, pueden ser fcilmente mostradas utilizando una nueva mscara: 1111111 H 3 = 1000001 1111111
( 4.66 )
La erosin del fondo con esta mscara, G H3, dar como resultado la deteccin de objetos que contengan horizontalmente de 1 a 5 pxeles consecutivos, en un fondo de 3x7. Al aplicar el operador hit-miss con H1 y H3, G (H1H3), se tendr como resultado objetos de 3 a 5 pxeles consecutivos con una fila. Siendo las mascaras del hit y el miss disjuntas, se desprende que los 1 en el hit, combinados con los 0 del miss, darn los pxeles del resultado. Obsrvese que aparece un tercer tipo, a lo que se denomina x, los cuales permitirn un cierto grado de libertad en la forma que se busca. Por ejemplo, en la muestra utilizada la mscara hit-miss que localiza objetos que contengan de 3 a 5 pxeles consecutivos en fila ser del estilo 0000000 H = 0 x111x0 0000000
( 4.67 )
Si una mscara hit-miss carece de pxeles de tipo x, extraer las formas de la mscara. Para el caso de que existan x, los 1 de la mscara darn la forma ms pequea, y los 1 con x entregarn las formas ms grandes. Otros ejemplos pueden ser mscaras como HA que encuentran pxeles aislados, o un detector de borde de esquina inferior derecha como HB
DISAM-UPMT-98-015
111
Carlos Platero
000 H A = 010 000
x10 H B = 110 000
( 4.68 )
Figura 4.8 a)Imagen sinttica en la que se pretende realzar figuras de tres, cuatro o cinco pxeles consecutivos horizontales b)erosin con H1, c)erosin con la imagen negada y H2 d) Resultado de 3 pxeles e) Resultado de 3 a 5 pxeles
112
DISAM-UPMT-98-015
Carlos Platero
4.2.4.2 Tratamiento con imgenes multinivel En esta seccin se van a extender las operaciones bsicas de dilatacin, erosin, opening y closing a imgenes con niveles de grises. Como se hizo para imgenes binarias, el objetivo es hacer uso de la morfologa en niveles de grises para el realce de una forma, en este caso de defectos locales dentro de una superficie homognea. Esta tcnica se presenta, en el contexto de esta tesis, para el procesado de la imagen antes de la segmentacin, a diferencia de las prcticas binivel utilizadas en fase de postprocesado. Los operadores morfolgicos actan ahora sobre una imagen digital, esto es, cada pixel de la imagen posee un valor discreto, cuyo rango se encuentra entre 0 y Q-1, siendo G la matriz de estos valores y H el elemento estructurante, el cual es una funcin subimagen. A diferencia del caso binario ya estudiado, cada punto no representa la pertenencia o no a un determinado objeto. Los puntos que se suelen agrupar como objetos diferenciados, pueden presentar valores no homogneos en las caractersticas diferenciadoras.
4.2.4.2.1 Erosin y dilatacin en niveles de grises
Puesto que la erosin y dilatacin satisfacen ciertos nmeros de identidades algebraicas, existe un nmero equivalente de formas de definirlas. La erosin en escala de gris se puede definir como: g m ,n = min{g m + m ',n + n ' hm ',n ' (m + m' , n + n' ) DG ; (m' , n' ) DH } ( 4.69 )
donde DG y DH son los dominios de G y H respectivamente. Geomtricamente, para encontrar la erosin de una seal por un elemento estructurante en un punto gm,n, se desliza el elemento estructurante espacialmente, de forma que el origen se encuentre en el punto gm,n, y entonces se encuentra la mnima cantidad que se puede obtener. Cuando el origen se encuentra dentro de la mscara, la seal erosionada se encuentra por debajo de la seal inicial. La expresin ( 4.69 ) indica que la erosin se basa en la eleccin del valor mnimo de gm+m,n+n-hmn, en el entorno de vecindad definido por el elemento estructurante. Las prestaciones de una erosin en niveles de grises son dos: si todos los elementos de la mscara son positivos, la imagen resultante tiende a ser ms oscura que la imagen de entrada, y segundo, los detalles brillantes en la imagen de entrada que sean ms pequeos que el elemento estructurante sern eliminados.
DISAM-UPMT-98-015
113
Carlos Platero
Como en el caso binario, la dilatacin se define de forma dual a la erosin. As se puede definir como: g m ,n = max{g m + m ',n + n ' + hm ',n ' (m + m' , n + n' ) DG ; (m' , n' ) DH } ( 4.70 )
Puesto que la dilatacin se basa en elegir el valor mximo de gm+m,n+n+hm,n, en el entorno de vecindad definido por la forma del elemento estructurante, el efecto general de realizar la dilatacin sobre una imagen en escala de grises es doble. Si todos los valores del elemento estructurante son positivos, la imagen de salida tiende a ser ms brillante que la imagen de entrada, y dos, los detalles oscuros quedan reducidos o incluso eliminados.
4.2.4.2.2 Maximizados y minimizados espaciales
Por elemento estructurante plano se entiende aquel que es constante en todo su dominio de definicin. Los elementos estructurantes planos han jugado un importante papel en la morfologa multinivel. La clase de elementos estructurantes planos puede verse como aquella definida nicamente por sus dominios y adems de valor nulo en los puntos en los que se encuentra definida, es decir: hm ,n = 0 (m, n) DH ( 4.71 )
De esta forma cuando se aplica la erosin a una imagen G por la mscara H, se tiene: g m ,n = min{g m + m ',n + n ' (m + m' , n + n' ) DG ; (m' , n' ) DH } ( 4.72 )
representando un minimizado espacial de la imagen G sobre la ventana definida por DH. Por igual razonamiento, la dilatacin se convierte en: g m ,n = max{g m + m ',n + n ' (m + m' , n + n' ) DG ; (m' , n' ) DH } ( 4.73 )
obteniendo un maximizado espacial de la imagen G, segn la forma y dimensin del elemento estructurante.
4.2.4.2.3 Opening y closing en escala de grises
Como en el caso binario, ambas operaciones son duales. Anlogamente al mismo, el opening puede definirse como una erosin seguida por una dilatacin: G $ H = (GH ) H ( 4.74 )
El closing en escala de grises se puede definir como una dilatacin seguida de un proceso de erosin:
114
DISAM-UPMT-98-015
Carlos Platero
G H = (G H )H
( 4.75 )
El opening y closing cumplen las propiedades propias de los filtros morfolgicos, es decir, presentan traslaciones invariantes. De igual forma, como todo filtro morfolgico es creciente e idempotente: G ' G G ' H GH G H = (G H ) H G $ H = (G $ H ) $ H ( 4.76 )
( 4.77 )
Adems, aparte de las propiedades lgicas como filtro, el opening es un filtro aniextensivo y el closing resulta ser un filtro extensivo GH G $ H G G H G H
4.2.4.2.4 Transformaciones Top-Hat
( 4.78 )
Como ya se vio en 4.2.4.1.3, la interseccin de dos imgenes binarias con mscaras hit-miss producan la bsqueda de formas determinadas. En escala de grises, este actuar puede ser utilizado para el realce de grupos de pxeles homogneos y contiguos. Obviamente, la interseccin no es posible entre imgenes multinivel, por lo que la tcnica de procesado morfolgico vara, pasando de la interseccin a la substraccin. Aparece un nuevo operador llamado top-hat y definido como: HAT (GH ) = G (G $ H ) ( 4.79 )
Al ser el opening un operador antiextensivo, el resultado de esta operacin estar por debajo de la imagen original, as que la transformacin top-hat dar siempre valores mayores o iguales a cero. Para el realce de valles se usar un operador dual al definido en ( 4.79 ): HAT (GH ) = (G H ) G ( 4.80 )
DISAM-UPMT-98-015
115
Carlos Platero
Consecuentemente, si se elige una mscara mayor que los valles, stos sern eliminados en closing y realzados en la sustraccin. Para detectar conjuntamente picos y valles, se puede en primer lugar realizar transformacin top-hat y localizar el umbral para los puntos brillantes. Y en segundo lugar, lo mismo pero esta vez aplicando el operador dual top-hat. Otro proceder, es aplicar en paralelo un opening y un closing, para seguir con una sustraccin de lo obtenido, (GH)-(G $ H). El operador HAT es ilustrado en la figura 4.9, en la que se aplica una mscara H mayor que el valle del defecto. Obsrvese como stos son eliminados y al sustraerse aparecen realzados.
Figura 4.9 a)Imagen con defecto local de tipo 'pitch' b)Erosin de la imagen c)-HAT umbralizado
116
DISAM-UPMT-98-015
Carlos Platero
4.3
Etapa de decisin: segmentacin

La decisin es la etapa segunda del modelo de deteccin, presentado anteriormente en la introduccin y reflejado en la figura 4.4. Su objetivo es clasificar los pxeles de las imgenes capturadas en defectuosos o no. Es una transformacin no lineal e irreversible, eliminando la mayora de la informacin adquirida. Esta etapa es crucial dentro del sistema de inspeccin, al implicar la seleccin de informacin que ser procesada en etapas posteriores. En el diseo de la etapa de decisin pueden considerarse dos fases, la seleccin de la estrategia de decisin y la seleccin del modo de implementacin. La primera tiene como objeto la determinacin de los parmetros a utilizar, mientras la segunda fase trata de poner en prctica la estrategia de decisin en niveles de grises del umbral. Por tanto, el proceso de anlisis que se plantea a continuacin, trata de establecer la estrategia de decisin para pasar a continuacin a su implementacin. Pero para poder entrar en tal planteamiento, se hace necesario presentar la modelizacin del problema, a partir de las funciones de densidad de las imgenes de escenarios SIVA.
4.3.1
Modelizacin del problema mediante las funciones de densidad Tal como se ha comentado, la decisin es la etapa en que se separa la informacin til de la intil, es decir, distingue entre lo llamado mensaje, seal o defecto (correspondiente a los datos que representan virtualmente al material defectuoso), y lo que se denomina ruido o fondo (representante de material no defectuoso). Puede haber diferentes niveles de decisin, y cada nivel tendr como objeto incrementar la relacin seal - ruido, rechazando una porcin de la componente ruidosa, adems de mantener, en todo lo que se pueda, la componente de mensaje. El rechazo de ruido implica la prdida de informacin, pero sta tambin puede llevar consigo la eliminacin de componente mensaje. Este modo de operar produce dos tipos de errores: el primero es eliminar datos que perteneciendo a la seal defectuosa han sido cancelados, por lo que en fases posteriores de anlisis de la seal no sern considerados. ste es el tipo de error ms grave. El segundo es considerar parte de la informacin del fondo como parte constitutiva del mensaje de defectos. No obstante, ste puede ser subsanado mediante etapas de post procesado, que sern analizadas en el siguiente apartado. El estudio sobre la problemtica de la decisin, se aborda pues desde la modelizacin de la seal adquirida a travs de sus funciones de densidad. Sea una imagen G procesada para el realce de los defectos con Q niveles de grises, de 0 a Q-1 niveles, se definir p(q) como la probabilidad de que un pixel cualquiera tenga el nivel q de gris, gm,n=q. Por tanto esta funcin de densidad discreta cumplir con los requisitos de:
DISAM-UPMT-98-015
117
Carlos Platero
p(q) = 1
q=0
Q 1
p(q) 0
( 4.81 )
Atendiendo a las definiciones dadas, es posible calcular las funciones de densidad en niveles de grises del fondo y del defecto, al que se llamarn respectivamente p(q|F) y p(q|D). stas expresarn las probabilidades de que un pixel del fondo o del defecto tenga el nivel gris q. Los histogramas de las respectivas seales correspondern con las funciones de densidad muestreales, exceptuando el nivel de escala. Cuando la decisin es tomada por la eleccin de un umbral, u, tal que si el nivel de gris del pixel es menor o igual a u, ste ser etiquetado como u p(q|D) p(q|F) defectuoso, en caso contrario se considerar como pixel del fondo. Este mtodo determinar defectos que tengan tonalidad ms oscura que el fondo. De igual forma, se podra definir un umbral u para separar pxeles del fondo de p p defectos de apariencia ms clara. En este caso, aquellos pxeles cuyos niveles Niveles de grises (q) de grises superan a u sern clasificados como defectuosos, el resto correspondern al fondo. Pero en lo que Figura 4.10 Funciones de densidad de fondo y defecto sigue y sin prdida de generalidad, se va a estudiar los efectos de aplicar un nico umbral, por ejemplo u. Las conclusiones que se saquen seguirn siendo vlidas en la aplicacin de u, slo habr de considerar que en este caso la funcin de densidad de defecto se encuentra situada a la derecha respecto a la del fondo.
p(q|D),p (q|F)
FA SD
Al utilizar un umbral u sobre una imagen muestreada, la etapa de decisin clasificar los pxeles en defectuosos o no. Para poder modelizar la respuesta de esta etapa habr que utilizar las funciones de densidad tanto del fondo como del defecto, p(q|F) y p(q|D). Por tanto, los resultados de la etapa de decisin en trminos probabilsticos sern: p DD = p (q | D), p SD =
q =0 u
q = u +1 u
p(q | D)
( 4.82 )
Q 1
p FD =
q =u +1
p(q | F ),
Q 1
p FA = p (q | F )
q =0
118
DISAM-UPMT-98-015
Carlos Platero
pDD y pFD indicarn las probabilidades de pxeles clasificados correctamente, mientras pSD y pFA muestran las probabilidades de pxeles de defectos no detectados y de falsas alarmas. Obsrvese que stas son probabilidades acumulativas, coincidiendo con el concepto de funcin de distribucin. La tabla 4.1 muestra un resumen de lo expuesto:
Tabla 4.1 Resultados de la etapa de decisin Muestra Defecto Defecto Fondo Fondo Decisin Defecto Fondo Fondo Defecto Probabilidad Defecto detectado, pDD Sin detectar, pSD Fondo detectado, pFD Falsas alarmas, pFA
El umbral u se posicionar tal que separe la componente del fondo respecto del defecto. Idealmente, las componentes de ruido y seal deberan estar lo suficientemente alejadas, como para que tanto las probabilidades de las falsas alarmas como de defectos sin detectar sean cero, pero esto no suele suceder. Lo ms comn, es que ambas componentes se solapen, tal como mostraba la figura 4.10, provocando que la colocacin de u sea un compromiso entre pFA y pSD. La seleccin ms apropiada del umbral u es lo que se llama la estrategia de decisin. 4.3.2 Estrategias de decisin El objetivo ltimo de la etapa de decisin consiste en maximizar la probabilidad de deteccin, pDD, minimizando la probabilidad de falsas alarmas, pFA. Obsrvese que representan objetivos contrapuestos, as un aumento de pDD puede originar un incremento fuerte de falsas alarmas, o una disminucin de falsas alarmas puede llevar a una mala deteccin de defectos. Obviamente el grado de compromiso depender del lugar que ocupe el umbral. En el caso de conocer el coste de falsas alarmas, c FA, y el de defecto sin detectar, cSD, es posible establecer una funcin de coste del tipo: l (u ) = c FA (u ) p FA (u ) p ( F ) + c SD (u ) p SD (u ) p ( D) ( 4.83 )
donde el mnimo de l(u), dar el valor de u ptimo. Pero este planteamiento parte de que se conoce tanto las funciones de densidad, como las de coste. Cuando esta informacin no est disponible, hay varias alternativas, de las que algunas son descritas en [Norton82][Brads94]. stas, en general, se basan en el conocimiento de al menos la funcin de densidad de fondo, siendo las ms comunes el observador de Neyman Pearson, o el observador inverso de Neyman Pearson.
DISAM-UPMT-98-015
119
Carlos Platero
4.3.2.1 Las estrategias de Neyman-Pearson Este mtodo plantea la posicin del umbral u a partir de mantener un nivel aceptable de falsas alarmas. Es el ms simple de implementar y no requiere conocimientos de las caractersticas de mensaje. El nombre se deriva del test de Neyman - Pearson, utilizado para la determinacin de validez de una hiptesis estadstica. La eleccin del umbral u vendr dado por el ndice de falsas alarmas que deber estar por debajo de un cierto nivel k p FA (u ) < k ( 4.84 )
La principal ventaja de esta estrategia es la poca informacin a priori que debe ser requerida. No se precisa de la funcin de densidad del defecto y opcionalmente la del fondo. En general, resulta difcil obtener en lnea las caractersticas de los datos de partes defectuosas, mientras resulta relativamente fcil obtener informacin del fondo. Si la funcin de densidad del fondo es conocida, el umbral puede ser calculado para un valor dado de pFA. Incluso si no es conocida p(q|F), es posible determinar u ajustando manualmente hasta alcanzar un nivel aceptable de falsas alarmas. Pero este proceder tiene dos grandes inconvenientes, el primero que no se conoce el nivel de acierto de los defectos y, segundo, una variacin sobre el umbral no predice el mejoramiento o empeoramiento de la deteccin. Por ejemplo, podra suceder que al mover el umbral u, en el sentido de aumentar el nivel de falsas alarmas, se produjese un incremento espectacular de deteccin del defecto, mientras el valor de pFA se ha aumentado levemente. Por lo que no es posible establecer un nivel ptimo de umbral. La estrategia inversa de Neyman-Pearson, consiste en ajustar el umbral mediante la imposicin de un nivel de probabilidad de deteccin de defectos superior a un cierto valor de k, esto es: p DD (u ) > k ( 4.85 )
Esta estrategia es especialmente apta para aquellas aplicaciones donde todos los mensajes deben ser detectados. Las consecuencias pueden ser que los niveles de falsas alarmas sean inaceptables. Pero como ya se dijo tanto en la introduccin del captulo como al inicio de este apartado, es posible aplicar una tercera etapa de post procesado, reduciendo el nivel de falsas alarmas. Para los propsitos de deteccin, esta estrategia es superior a la anterior y por doble motivo. Es posible determinar tericamente los niveles de pDD, pSD, pFD y pFA, y adems es posible poder evaluar los efectos de la modificacin de u. El principal inconveniente est en que se necesita el conocimiento a priori de las seales de los defectos.
120
DISAM-UPMT-98-015
Carlos Platero
4.3.2.2 Funciones de densidad del fondo y de los defectos El anterior apartado ha mostrado cmo la eleccin ptima del umbral depende del conocimiento de las funciones de densidad del fondo y del defecto, por lo que se plantea a continuacin un estudio de las caractersticas de estas seales. Primero se expone las propiedades de las seales del fondo y luego las derivadas de la forma de los defectos.
4.3.2.2.1 Caractersticas de la seal de fondo
Al captar una imagen sin defecto del escenario SIVA, muestra un conjunto de propiedades que van a ser estudiadas. Antes de entrar en el anlisis, se parte de tres supuestos matemticos referidos al modelo espacio-temporal de la distribucin de la intensidad lumnica: 1. La seal es estacionaria, esto es, el valor medio de la seal se mantiene constante en el tiempo. Implica que la iluminacin y los sensores de captacin mantienen sus caractersticas a lo largo del tiempo, si bien en la prctica no es del todo cierto (vase el estudio sobre formacin de imgenes en SIVA) 2. La seal sigue un modelo probabilstico, como consecuencia del proceso de obtencin del material a inspeccionar. sta seguir una determinada ley al ser un proceso estocstico. 3. La seal muestra una textura repetitiva, es decir, un patrn espacial que se repite, habiendo correlacin espacial entre las lneas adquiridas. A partir de estas suposiciones, la seal del fondo tiene tres elementos distinguibles: 1. Una lenta modulacin. Su origen viene dada tanto por los efectos de la iluminacin como por las lentes. Recurdese que la intensidad luminosa disminuye de forma cuadrtica entre la superficie y el foco. Los valores medios de los pxeles en el centro sern mayores que en los bordes. De la misma manera, la transmitancia en el corazn de la lente es distinta que en las partes perifricas. Estos efectos son estacionarios y probabilisticos, pudiendo ser modelizados segn se vio en el captulo 3 de formacin de imgenes.
DISAM-UPMT-98-015
121
Carlos Platero
Figura 4.11 Suave modulacin
2. Las variaciones entre lneas pares e impares generadas por las propias cmaras entrelazadas, o la discontinuidad entre pxeles adyacentes provocadas por zonas no sensibles, provoca una seal discontinua.
Figura 4.12 Variacin pixel a pixel
3. Existe variacin aleatoria de la seal debida a la rugosidad de la superficie a inspeccionar. Segn se vio en la formacin de imgenes, los modelos de superficies homogneas empleadas utilizaban funciones probabilsticas. Un anlisis del histograma de niveles de grises de imgenes que cumplan con estos requisitos, desprender que su funcin de densidad sigue una distribucin normal. La
122
DISAM-UPMT-98-015
Carlos Platero
consecuencia era de esperar, al aplicar el teorema central del lmite, que dice lo siguiente: una variable aleatoria sigue una distribucin gaussiana, cuando sta viene originada por la suma de un nmero creciente de variables aleatorias independientes, que actan conjuntamente formando la seal de medida. Este efecto suele ser comn cuando se efectan medidas, en las que intervienen diversos factores en su obtencin. Tambin indica esta conclusin que la informacin adquirida emana de tres fuentes. 1. El proceso de fabricacin del material. Aunque ste es de carcter estocstico, no implica una respuesta preestablecida sino que introduce desviaciones aleatorias dentro de la seal. 2. Causas aleatorias como consecuencia de la reflexin de la luz en la textura del material. 3. Las caractersticas del sensor y de la electrnica asociada. Los efectos combinados de estas tres fuentes generan que los histogramas de las imgenes adquiridas sigan una distribucin normal. La figura 4.13 muestra una imagen correspondiente a la adquisicin de pasta de papel, donde tambin se presenta el histogramas de la imagen, observando que sigue una distribucin normal.
Figura 4.13 Imagen de pasta de papel sin procesar e histograma
La modelizacin de la seal carente de defecto mediante una distribucin normal, implica el exacto conocimiento de sta desde el punto de vista de la distribucin de niveles de grises en las imgenes adquiridas.
4.3.2.2.2 Caractersticas de la seal de los defectos
Las diferentes formas de defectos generarn un catlogo de funciones de densidad, por lo que no parece que pueda expresarse en trminos generales. Por ejemplo, puede
DISAM-UPMT-98-015
123
Carlos Platero
haber faltas que contengan pxeles de tonalidad oscura y otros de tonalidad clara. Las peculiaridades de cada defecto marcarn distintas funciones de densidad. No obstante en algunas aplicaciones, los defectos locales se caracterizan por puntos de medio y alto contraste respecto a la textura de la materia, entre el 20% al 60% de nivel de contraste [Feng93]. En general sus apariencias, tienden a aproximarse a elipses o a manchas oscuras y menos frecuente es la aparicin de burbujas brillantes. En la experiencia obtenida en el desarrollo de esta tesis coincide con la afirmacin de Feng. As en el caso de fallos en la pasta de papel, en el 96% de los defectos sus apariencias son de puntos oscuros prximos a forma circular. Y en el aluminio colado, las inclusiones de gas originan puntos brillantes mientras el grafito provoca faltas en forma de motas y manchas de tonalidad oscura. Si se considera que para la deteccin de un defecto local es necesario que exista al menos un pixel de alto contraste (full contrast), se est definiendo una nueva estrategia de decisin. La idea de Feng es que la deteccin de los defectos, es un problema de encontrar donde estn los pxeles de alto contraste. En la figura 4.14 se aprecia como el defecto est constituido por pxeles de alto y medio contraste. Luego, si se detecta los pxeles de alto contraste y posteriormente se aplica operaciones morfolgicas y de vecindad (ver prrafos 4.4.2), es posible reconstruir el defecto total o parcialmente.
Pixeles de medio contraste
Pixeles de alto contraste
Figura 4.14 Pxeles de alto y medio contraste
4.3.3
Implementacin de la decisin: Segmentacin de imgenes La segmentacin representa la manera de implementacin de la estrategia de decisin. Segmentar una imagen digital, significa dividirla en zonas disjuntas e individualizadas. En cierta manera, equivale a su reconocimiento, pues como consecuencia de la segmentacin, los diferentes objetos que se encuentran perfectamente ubicados dentro de la imagen son detectados. Asociado a la idea de segmentacin est el concepto de umbral, que queda definido de la forma: u = u (m, n, g m ,n , pm ,n ) ( 4.86 )
124
DISAM-UPMT-98-015
Carlos Platero
donde gm,n es la intensidad del punto situado en las coordenadas m,n, y pm,n representa alguna propiedad local mediada en un entorno de vecindad de este punto. La imagen que se obtiene al llevar a cabo un procesamiento de umbral se define como: 1 g m ,n = 0 g m ,n u g m ,n > u
( 4.87 )
de forma que los pxeles etiquetados con 0 se corresponde con el fondo, mientras que los 1 se corresponden con los defectos. En la ecuacin ( 4.87 ) se supone que la intensidad del defecto es menor que la intensidad del fondo. Cuando en ( 4.86 ), u depende slo de gm,n, el umbral se llama global. Pero si u depende tanto de gm,n como de pm,n, el umbral se denomina local, y cuando adems depende de las coordenadas espaciales, x e y, se llama umbral dinmico. Los umbrales globales tienen aplicacin en situaciones donde existe una clara definicin entre los objetos y el entorno, y cuando la iluminacin es relativamente uniforme. Los sistemas de iluminacin de luz posterior y las tcnicas de iluminacin por franjas pueden dar como resultados imgenes que pueden ser segmentadas mediante el uso de umbrales globales. A menudo, una iluminacin arbitraria del espacio da lugar a imgenes que, si se trabaja con umbrales, requieren de algn tipo de anlisis local para compensar efectos, como las no uniformidades de iluminacin, sombras y reflejos[Marav93]. Por eso, se ha puesto tanto nfasis en el diseo de los sistemas de iluminacin, ya que un buen diseo en esta etapa ahorrar mucho esfuerzo computacional. Ha habido un gran esfuerzo por parte de la comunidad cientfica, en cmo segmentar imgenes mediante umbrales en niveles de grises. El resultado es una gran variedad de algoritmos, un resumen de stos se puede encontrar en [Sahoo88][Glasb93]. Sin embargo, muchas de las tcnicas presentadas, parten de la suposicin de que al menos hay un objeto de inters. Esta hiptesis de trabajo no es admisible para la deteccin de defectos, pues en una imagen capturado puede no haber defectos. El planteamiento de tcnicas de umbral para la deteccin de defectos se esboza a continuacin. 4.3.4 Umbralizacin para la deteccin de defectos La umbralizacin para la deteccin de los defectos no puede asumir la existencia de al menos un defecto en la imagen adquirida. Esta hiptesis de trabajo es, sin embargo, una gran diferencia con los puntos de partida de muchos algoritmos de segmentacin. En general, se suele asumir lo contrario, esto es, que la mayora de las imgenes inspeccionadas carecen de defectos y el umbral es esencialmente utilizado para eliminar la informacin redundante del fondo. Para abordar el diseo del umbral ptimo se recurre a las propiedades de las seales del fondo y de mensaje. De un lado se est suponiendo que al llegar a esta etapa, la funcin de densidad de la seal ruidosa tiene una tendencia a seguir una distribucin gaussiana. Por lo tanto, los parmetros de estas funciones vienen determinadas por sus medias y
DISAM-UPMT-98-015
125
Carlos Platero
varianzas, y . El nivel de falsas alarmas puede ser determinado desde el punto de vista terico, y como es conocido, la pFA depender de la distancia del umbral, u, respecto a la intensidad media de la imagen, pudindose medir mediante k veces la varianza. As, un umbral separado tres veces la varianza respecto a la media, 3 , dar una probabilidad de falsas alarmas de menos de un 1%. Este conocimiento a priori puede ser empleado en la construccin de la etapa de segmentacin. Otra fuente a utilizar viene de la bsqueda de pxeles de alto contraste, el umbral ser determinado tal que slo detecte los pxeles de mayor contraste. Esta premisa permitir disminuir la pFA al poder desplazar u a posiciones ms alejadas respecto a la media. Pero esta actuacin, requerir de una nueva etapa que tenga como objetivo la reconstruccin del defecto a partir de las pxeles de alto contraste. Llegado a este punto, la localizacin del umbral pasa por un lado por la validez de las suposiciones hechas, y en el caso de cumplir se pueden presentar dos tipos de umbral, que atendiendo a la clasificacin anteriormente dada, puede ser de tipo global o de tipo local. Si no cumple las hiptesis iniciales de trabajo habr de recurrir a otras tcnicas que debern ser exploradas. Por tanto, el mtodo tratar en primer lugar de validar las hiptesis de trabajo, en el caso de cumplir se presentan dos tipo de algoritmos de umbralizacin. Mientras habr de recurrir al estado de la tcnica para tratar otros mtodos, por ejemplo el presentado por Macaire [Macai93]. 4.3.4.1 Validez de las conjeturas de normalidad en la seal del fondo Si bien la tendencia, segn se ha visto, es tener imgenes adquiridas en escenas SIVA caracterizadas por distribuirse la intensidad del pixel de forma normal, tambin hay que incidir sobre la posibilidad de haberlas tratada anteriormente en la etapa de realce. Para una transformacin de tipo lineal, la nueva funcin de densidad tambin ser normal, eso s, se habrn modificado los parmetros de la normalidad segn el tipo de mscara utilizada. Obviamente, esta afirmacin no es vlida si el realce no se basa en filtros lineales. Aun en el caso de realces basados en transformaciones lineales, no hay que olvidar que la variable de intensidad es discreta y por tanto finita, pudiendo provocar efectos de saturacin tanto porque de resultados de la convolucin sean menores que cero o superiores al mayor valor de discretizacin. La validez de la conjetura de normalidad en la distribucin de la seal del fondo, puede refrendarse de dos formas: una mediante algn test de normalidad y otra a travs de las propiedades que se derivan de una distribucin normal. Para la primera y aunque existen diferentes posibilidades de abordar este estudio, no todos los contrastes de normalidad se pueden aplicar a este caso en concreto. El mtodo de Shapiro y Wilks no se puede utilizar dado que tan slo se puede aplicar a muestras de pocos datos, tampoco es aplicable el criterio de Kolgomorov-Smirnov dado que su uso est restringido a funciones continuas.
126
DISAM-UPMT-98-015
Carlos Platero
El contraste elegido, dada su sencillez y fcil aplicacin, es el de Jarque y Vera[Gallar97]. Este mtodo basa todo su desarrollo en el hecho de que toda distribucin normal es simtrica y su coeficiente de apuntamiento vale tres. Lo primero es medir la simetra con el coeficiente de asimetra, el cual proviene de dividir el momento de orden tres respecto a la media entre la desviacin tpica al cubo: ( p(q)(q ))
q=0 Q 1 3
CA =
m = 3
( 4.88 )
donde p(q) corresponde con la funcin de densidad de niveles de grises. En cuanto al coeficiente de apuntamiento o curtosis, se calcula su valor con el momento de orden cuatro respecto a la media dividido entre la desviacin tpica a la cuarta: ( p(q)(q ))
q =0 Q 1 4
CA p =
m = 4
( 4.89 )
Jarque y Vera demuestran que bajo condiciones de normalidad, la expresin:

2 CA2 CAp J= + 6 24
( 4.90 )
sigue una distribucin 2 con dos grados de libertad. Por lo tanto, se puede calcular el ndice de confianza de la hiptesis de normalidad. La segunda forma es a travs de sus propiedades. Si la distribucin es normal deber cumplir con los siguientes requisitos: 1. El nivel de falsas alarmas puede ser determinado a travs de la media y la varianza del histograma de la imagen:
u
(q )2
2 2
pFA (u ) = p (q | F )
q =0
1 2
dq
( 4.91 )
DISAM-UPMT-98-015
127
Carlos Platero
La aproximacin se hace al convertir a q de discreta a continua. Por tanto deber coincidir el valor terico dado por ( 4.91 ) y el obtenido al aplicar un umbral u sobre las imgenes capturadas. 2. El nivel de falsas alarmas debe ser igual para u y u, si se hace una umbralizacin del tipo: k . En otras palabras, la distribucin al ser simtrica, las probabilidades de falsas alarmas de tonalidad oscura y clara deben ser iguales. Este efecto puede ser estudiado mediante una doble umbralizacin u, y u, observndose que las apariciones son del mismo orden de magnitud, para un valor de k determinado. 3. Las falsas alarmas debern repartirse uniformemente por toda la imagen. En caso contrario significara una prdida de uniformidad de iluminacin en la escena. Para su verificacin se emplean los conceptos de centros de gravedad de la imagen binarizada. 4.3.4.2 Umbrales para fondos con distribucin normal En el caso de superar el contraste de hiptesis, se podra pensar en dos tipo de algoritmos de umbralizacin. Uno de carcter global, vlido cuando se tenga un sistema de formacin de imgenes uniforme, y otro de corte local, utilizado en escenas con subregiones uniformes y que stas cumplan con una distribucin en niveles de grises gaussiana.
4.3.4.2.1 Umbral global
El umbral global es aplicado sobre toda la imagen, y sus parmetros sern la media y la varianza muestral de la imagen, junto una constate k, que determine la separacin del umbral respecto a tanta veces de la varianza, quedando expresado como: u = k ( 4.92 )
Este mtodo es muy sencillo de implementar y de bajo costo computacional. Sin embargo, la presencia de una falta de iluminacin uniforme afectar negativamente a este tipo de umbral. Suele ser corriente, por el tipo de iluminacin, mantener una luminosidad uniforme en un conjunto de lneas contiguas. Luego, se puede sugerir utilizar una divisin de la imagen en regiones disjuntas, que en su totalidad dan la imagen original, con la ventaja de haber formado subimgenes que cumplan las caractersticas de normalidad. Esto conllevar la necesidad de utilizar un umbral local.
4.3.4.2.2 Umbral local
128
DISAM-UPMT-98-015
Carlos Platero
El problema anteriormente mencionado puede ser resuelto mediante un umbral local. Si en la imagen puede observarse una respuesta uniforme en regiones de sta, se podra aplicar para cada una de las regiones un umbral distinto, del tipo: u i = i k i i ( 4.93 )
donde el ndice i denota la i regin de la imagen. Este modo de actuar eliminar el efecto de lenta modulacin que caracteriza ciertos escenarios SIVA. Ahora el umbral ya no es un escalar, sino un vector.
4.3.4.2.3 El valor de k
Tanto en el umbral global como local necesitan conocer, a parte de la media y varianza, el valor de k. La validacin de contraste de normalidad ms la tcnica de umbraliazcin, permitir utilizar una estrategia de observador de Neyman-Pearson. El valor de k vendr dado por el nivel de falsas alarmas mximo permitido (ver 4.3.2.1). No obstante, como ya fue comentado, este planteamiento tiene inconvenientes, como no saber cul es el nivel de acierto en la deteccin. La alternativa pasa por tener ms conocimiento, en este caso hay que explotar las caractersticas sobre la seal de mensaje. Al utilizar el concepto de deteccin de pxeles de alto contraste, es posible definir cul es la funcin de distribucin, no del defecto sino de los pxeles de altos contrastes. Al basar la deteccin en la localizacin de stos, no se plantea una funcin de coste respecto a la funcin de densidad del defecto, sino a como se distribuyen los niveles de grises de estas semillas. El planteamiento pasar a ser similar a lo expuesto en ( 4.83 ). Pero ahora se utilizar la probabilidad de deteccin de pxeles de alto contraste, definida como: p AC (u ) = p(q | AC )
q=0 u
( 4.94 )
siendo p(q|AC) la funcin de densidad del los pxeles de alto contraste. El valor ptimo de umbral va a depender del coste de falsas alarmas, cFA, y el de no detectar los pxeles de alto contraste, cAC, pudiendo establecer una funcin de coste del tipo: l (u ) = c FA (u ) p FA (u ) p ( F ) + c AC (u )(1 p AC (u )) p ( D) ( 4.95 )
Los valores de cFA y de cAC dependen de la aplicacin en particular y de los criterios de calibracin del sistema global. Recurdese que slo hasta ahora se han detectado las semillas de los defectos, pero faltar una nueva etapa que sirva tanto para la reconstruccin definitiva o parcial del defecto y la eliminacin de las falsas alarmas.
DISAM-UPMT-98-015
129
Carlos Platero
4.4
Agrupacin de pxeles binarizados

Las prestaciones del sistema de deteccin pueden ser mejoradas mediante la adicin de una tercera etapa, llamada agrupacin de pxeles defectuosos. sta fue referenciada como el tercer bloque del modelo de deteccin, a la que tambin se la suele llamar etapa de postprocesado. El objetivo de esta nueva fase es doble, de un lado eliminar falsas alarmas, evitando cancelar la seal de mensaje y de otro, reconstruir el defecto a partir de los pxeles de alto contraste. El fundamento de esta etapa se basa en las caractersticas espaciales de la seal una vez umbralizada y en el procesamiento morfolgico en imgenes binivel. Llegado a este punto, la informacin que se tiene es una imagen binarizada, por lo que se trata ahora de disear los filtros binarios tal que eliminen las falsas alarmas y mantengan las seales que provienen del defecto. En definitiva, disminuir la probabilidad de falsas alarmas de la etapa de decisin, sin distorsionar la informacin del defecto, discutida en el anterior punto. Los filtros binarios son probablemente una de las formas ms comunes de aplicacin del procesamiento morfolgico. Aunque la Morfologa es el estudio de formas y est ampliamente desarrollado desde el punto de vista matemtico, en la prctica de SIVA slo se suele emplear una pequea parte, consistente en la secuencia de operaciones de erosiones y dilataciones sobre imgenes. Serrano [Serran95], Silva [Silva92], Ohta [Ohta86] y Takatoo [Takat88] han utilizado procesamiento morfolgico para la deteccin de defectos, aunque stos no han dado detalles sobre el mtodo empleado, el tipo de elemento estructurante utilizado o las prestaciones de sus operaciones efectuadas. El plan a seguir va estar formado por cmo eliminar falsas alarmas y cmo reconstruir el defecto a partir de las semillas de pxeles de alto contraste. Ambas operaciones van a basarse en operaciones de morfologa.
4.4.1
Eliminacin de falsas alarmas En general, los pxeles de falsas alarmas pueden ser diferenciados de los de alto contraste, despus de la umbralizacin, por su distribucin espacial. En el caso de los pxeles de alto contraste al pasar el umbral formarn un grupo de pxeles contiguos, mientras las falsas alarmas se encuentran dispersas espacialmente en la imagen binarizada. Esta premisa bsica fue explotada por Abbasszadeh [Abbas93] para el desarrollo de su algoritmo STAD. Si la variable del fondo es aleatoria y no muestra correlacin espacial entre pxeles adyacentes, derivar que las falsas alarmas se distribuyan azarosamente en el espacio de la imagen segmentada. En cambio, por la constitucin del defecto habr varios pxeles de alto contrates adyacentes entre s, formado un grupo o cluster de pxeles en el espacio transformado por la umbralizacin. Esta propiedad puede ser detectada por las tcnicas de procesamiento morfolgico. As, un erosionado de la imagen binaria eliminar pxeles aislados, dejando slo aquellos que formen grupos. Si despus se dilata la imagen obtenida, el resultado ser una imagen al
130
DISAM-UPMT-98-015
Carlos Platero
que se ha borrado los pxeles aislados, esto es, la eliminacin de falsas alarmas precisa de una operacin opening. El elemento estructurante depender de la forma de los defectos y de la textura del material a inspeccionar. 4.4.2 Reconstruccin del defecto La filosofa desarrollada sobre deteccin de defectos se basa en la localizacin de pxeles de alto contraste, en el fundamento de que los defectos estn constituidos por pxeles de medio y alto contraste. Una vez que han sido localizados los pxeles de alto contraste, habr de reconstruir el defecto a partir de estas semillas. Para este objetivo tambin se servir del procesamiento morfolgico binivel. Obviamente, por la propia definicin dada de pxeles de medio contraste, stos sern ms prximos al nivel medio de gris de la imagen que los pxeles de alto contraste. Si el fondo sigue una distribucin normal, la determinacin de pxeles de medio contraste estar dada por la expresin: u MC = k MC ( 4.96 )
Donde kMC ser menor que kAC en trminos absolutos. Este actuar necesita de este segundo umbral, uMC, capaz de detectar pxeles de medio contraste. Pero al umbralizar no slo pasarn pxeles del defecto sino adems del fondo, como consecuencia de la variabilidad de la textura del material. No obstante, la definicin previa de los pxeles de alto contraste, Tabla 4.2 Algoritmos de permitir distinguir qu parte depende al defecto y qu reconstruccin de los defectos otra pertenece al fondo. La reconstruccin del defecto est basada en las dos imgenes resultantes de la doble Mtodo 1 umbralizacin, uAC y uMC, junto con la aplicacin de k=1; las tcnicas de procesado morfolgico, llamada Gk=(GACH)GMC dilatacin condicionada. Dos algoritmos han sido Do { diseados con este objetivo. La tabla 4.2 muestra los Gk+1=(GkH)GMC; quehaceres de estas reconstrucciones. Sean GAC y GMC } While(Gk+1-Gk+!= 0) las imgenes binarias de pxeles de alto y medio contraste, respectivamente y H el elemento Mtodo 2 estructurante. El segundo algoritmo es una Gk=(GACH)GMC simplificacin del primero. Este primero resulta ms correcto pero consume ms tiempo que el segundo. Se basa en la dilatacin de la imagen de pxeles de alto contraste con la interseccin de pxeles de medio contraste. Cuando este proceder se vuelve idempotente, se habr finalizado la reconstruccin del defecto. El segundo mtodo slo se efecta una sola vez.
DISAM-UPMT-98-015
131
Carlos Platero
4.5
Medida de calidad de un procedimiento para la deteccin de defectos locales

Ante la pregunta cul de los procesados a realizar resulta el ms conveniente para el realce del defecto?, la respuesta no es inmediata, pues la evaluacin debe ser hecha en la totalidad del bloque de deteccin y no slo en la etapa de procesado de la imagen. La medida de separacin entre defecto y fondo no es cuestin exclusiva de la capacidad de realce, sino tambin del tipo de segmentacin y del post-procesado que vaya a ejecutarse. Para poder explicar el intrincamiento de los tres bloques, se va a desarrollar un conjunto de medidas, con el propsito de ir desgranando el problema hasta encontrar una metodologa que sea capaz de calibrar cul es el mejor procedimiento de deteccin.
4.5.1
Medidas basadas en el error de Bayes stas se basan en las funciones de densidad de la intensidad de defecto y el fondo. El fundamento bsico est en el error originado al aplicar un umbral para la clasificacin de los pxeles entre defectuosos o fondo. En un primer acercamiento a la medida, y desde el punto de vista intuitivo, se dir que existe mayor contraste entre defecto y fondo, cuanta mayor separacin exista entre la funcin de densidad del defecto respecto del fondo. Desde el punto de vista de Bayes, esta idea puede ser expresada en forma de error de clasificacin. En otras palabras, se est equiparando el nivel de contraste con el error de clasificacin entre fondo y objeto. Una definicin ms formal sobre el contraste podra ser, que partiendo de un defecto con una nica tonalidad, sin prdida de generalidad, y teniendo en cuenta p(q|D) y p(q|F), el nivel de contraste para un defecto o el error de clasificacin, para un determinado umbral, u, podr ser definido como: c(u ) = c1
q =u +1
p(q | D) p( D) + c p(q | F ) p ( F )
2 q =0
Q 1
( 4.97 )
siendo c1 y c2 dos constantes que ponderan el coste de tener rea de defecto sin detectar y de masa proveniente de falsas alarmas. En el caso de defecto de tonalidad clara, la expresin ( 4.97 ) slo ser modificada en los intervalos de integracin, quedando como : u 1 c (u ) = c1 p (q | D) p ( D) + c 2
q =0
q =u +1
p(q | F ) p( F )
Q 1
( 4.98 )
Cuando el valor de c tienda a ser nulo indicar que el contraste entre el defecto y el fondo, para el umbral u, tender a ser el acertado. Tal como se ha comentado, es
132
DISAM-UPMT-98-015
Carlos Platero
observable como de una manera directa, este nivel de contraste depende del tipo de umbralizacin, al estar vinculado el ndice de contraste con el valor de nivel de gris de segmentacin, u. Si las dos distribuciones son normales, la distancia de Bhattacharyya puede ser empleada como medida de contraste, al ser sta un ndice superior del error de Bayes. Por tanto, a mayor distancia mayor contraste; expresndose esta medida en funcin de las medias y las varianzas de las dos funciones de densidad, quedando reflejada en:
2 2 F +D 1 ( D F ) 1 2 dc = + ln 2 2 2 2 8 D + F 2 F D 2 2
( 4.99 )
donde F y D son las medias de las distribuciones de niveles de grises del fondo y el defecto, mientras F y D corresponden con las varianzas de stas. No obstante, esta medida de contraste basada en el error de Bayes, slo considera la informacin sobre la distribucin de niveles de grises. No hay ninguna referencia sobre la distribucin espacial del fondo ni la del defecto. La falta de estimacin sobre la distribucin espacial de los pxeles es un gran handicap para esta medida. As el nivel de falsas alarmas, si bien es conocido, no hay conocimiento de cmo se reparte en el espacio, y esta informacin es vital para las etapas de post-procesado. De hecho, la etapa de postprocesado no es considerada en este nivel de medida. En la prctica, se observa que existen procesados con bajos rendimientos sin etapa de post-procesado, pero aumenta considerablemente al aplicar una etapa de eliminacin de falsas alarmas. Y viceversa, realzados de gran contraste en el procesado, tienen mal comportamiento en la eliminacin de falsas alarmas. Adems, el concepto utilizado de masa defectuosa no detectada, no es del todo cierto, pues como ha sido comentado, es posible la reconstruccin de la masa de defecto con operaciones de post-procesado. Las carencias de esta medida se evidencian al no considerar las distribuciones espaciales tanto del defecto como de las falsas alarmas. Esta medida es incompleta y genera errores. Para paliar estas dificultades se hace propuesta de una nueva metodologa de medida de la capacidad de deteccin. 4.5.2 Medidas basadas en las funciones de distribucin de los defectos de pxeles de alto contraste El carcter incompleto de la medida anterior vena dado por, uno, la falta de informacin sobre la distribucin espacial, dos, la no utilizacin del concepto de pixel de alto contraste y tres, el tipo de post-procesado que va a realizarse.
DISAM-UPMT-98-015
133
Carlos Platero
Al considerar que para la deteccin de un defecto local es necesario que exista al menos un pixel de alto contraste capaz de superar el umbral, se est definiendo el proceso de deteccin en su globalidad. El proceso de deteccin queda definido por una etapa de realce, a saber, con la mscara ms adecuada, una segmentacin con un determinado umbral, u, y una eliminacin de falsas alarmas basada en erosiones, cuyo elemento estructurante es una de las variables del proceso. Todo ello deber de decantar los pxeles de alto contraste, al que luego seguir una etapa de reconstruccin del defecto. Las medidas de contrastes, por tanto, se basarn en las funciones de distribucin obtenidas de pxeles de altos contrastes que quedan despus de haber aplicado el proceso de realce, segmentacin y de posible erosionado, tanto para el defecto como para el fondo. Mediante este modo de actuar han quedado definidas, pAC(u) y pFA(u) como las funciones de distribucin de pxeles de alto contraste del defecto junto al fondo, esto es, la probabilidad acumulada de tener pixel de alto contraste hasta el nivel u, despus de haber sido aplicadas las tres etapas. Bajo este perfil, se han definido las siguientes medidas: 1. Valor de pFA(u1) tal que pAC(u1) sea igual a 1. El valor de u1 ser el menor/mayor umbral, segn tonalidad, que garantice la deteccin al 100 % de los pxeles de alto contraste. Esta medida indica el nivel de falsas alarmas cuando se detecta el 100 % de defectos. 2. Valor de pAC(u2) para un valor de u2 tal que la probabilidad de falsas alarmas sea cero, pFA(u2) = 0. El nivel de umbral de u2 para tonalidades oscuras ser el valor mayor de ste, tal que un incremento en el nivel de gris u2, convierta a pFA(u2) distinta de cero. Para el caso de defectos claros, el umbral u2 ser el menor tal que un decremento en el nivel de gris u2, convierta a pFA(u2) distinta de cero. Esta medida indicar el nivel de xito de deteccin de los defectos sin aparicin de falsas alarmas. 3. La mxima discrepancia entre pAC(u) y pFA(u). Las medidas 1) y 3) tienen el inconveniente de dar sus valores sobre el tanto por ciento de falsas alarmas semillas. Pero recurdese que al superar el umbral van a ser utilizadas como pxeles de full-contrast, y por lo tanto alrededor de ellas habr un proceso de reconstruccin. Por eso, es preferible tener una apreciacin ms conservadora, correspondiente a 2). Podra pensarse en vez de utilizar la fase de determinacin de las semillas, hacerlo sobre la imagen resultado, es decir, al finalizar la etapa de decisin, donde los verdaderos defectos y las falsas alarmas son etiquetadas. La ventaja de esta medida, es que considera el proceso de decisin en su globalidad, desde el realce hasta la reconstruccin de las semillas. Igualmente se proponen las tres medidas anteriores, pero ahora habr de utilizar la probabilidad de defecto detectado, pDD, y de falsas alarmas reconstruidas, pFA. No obstante, los resultados pueden ser similares a la anterior medida, esto es, a las magnitudes
134
DISAM-UPMT-98-015
Carlos Platero
basadas en semillas tanto de pxeles de alto contraste como de falsas alarmas, pues en la reconstruccin de los defectos sern proporcionales las reas aditivas alrededor de estas semillas. Ntese que estas medidas son hechas al no tener conocimiento a priori de los costes de falsas alarmas, cFA, ni del precio de falta de deteccin del defecto, cDD. Ser el usuario final el que pueda determinar el valor ptimo a partir de la funcin de coste oportuna.
4.6
Diseo del sistema de deteccin de defectos locales en la pasta de papel

El mtodo de deteccin de defectos propuesto ha sido implementado en la localizacin de faltas locales en la pasta de papel. Si bien en el captulo 7 se hablar con todo detalle del proceso de produccin de pasta de papel y el origen de los defectos locales, es necesario recordar aqu los conceptos bsicos. En este material hay dos tipos bsicos de defectos, llamados pitch y shives. Aun habiendo otros, su probabilidad de aparicin es escasa y no se han considerado, pues no son relevantes en la calidad del papel, y de hecho, slo los pitch son verdaderamente importantes, tal como se argumentar con posterioridad. Todos los defectos tratados presentan una tonalidad oscura en luminancia respecto al fondo. Los defectos se clasifican segn su tamao, habiendo cuatro tipos denominados con las iniciales A, B, C y P. La tabla 4.3 indica los intervalos utilizados para la clasificacin basados en los intervalos de reas, adems muestra el % de aparicin de cada tipo y el % del rea total defectuosa2.
Tabla 4.3 Clasificacin de los defectos en la pasta de papel Tipo de defecto rea de las motas(mm2) Aparicin (pitch) % rea (pitch)% Aparicin (shive)% rea (shive)% -
Menores a 0.04 (no se encuentran) Entre 0.04 y 0.1 Entre 0.1 y 0.3 Entre 0.3 y 0.8 Mayores a 0.8
P C B A
44% 38% 15% 3%
13% 29% 35% 23%
9% 33% 30% 29%
1% 8% 22% 69%
Estos datos emanan del universo entregado a travs de 32 pliegos con ms de 230 defectos
DISAM-UPMT-98-015
135
Carlos Platero
Una vez dada esta breve y primera impresin sobre el problema a resolver se plantean la trayectoria marcada en este captulo para la deteccin de faltas en la pasta de papel, constituida por cuatro fases: 1. Tipo de realce. Estudiando desde el uso de filtros lineales hasta el empleo de tcnicas de procesamiento morfolgico. 2. La estrategia de segmentacin. Para este caso y dada la facilidad de obtencin de muestras, se ha optado por una tctica de observador inverso de NeymanPearson. Por lo que habr de intentar modelar las funciones de densidad tanto del fondo como de los defectos. 3. Validacin de las hiptesis de normalidad de la seal del fondo. En caso contrario, buscar otro modelo de funcin de densidad. 4. Y por ltimo, fijar los parmetros del sistema de deteccin mediante las medidas de calibracin explicadas. Este proceso determinar: Filtro lineal o no lineal, modelos de mscaras o elementos estructurantes, tipo de umbral, operaciones de post-procesado y reconstruccin de semillas, dando un nivel de falsas alarmas y de defectos localizados. El primer paso consistir en la determinacin de las posibles operaciones lineales o no que aumenten el realce de los defectos. Las mscaras de convolucin a testear salen de la bibliografa especializada y del mtodo propuesto mediante correlacin de variable cualitativas (explicado en 4.2.3). Respecto al procesado morfolgico se exploran las transformaciones top-hat. En segundo lugar, las estrategias de segmentacin se basan en el anlisis del histograma, al validarse la normalidad de distribucin en niveles de grises. Por ltimo, se proceder a la calibracin de los parmetros. En los prrafos siguientes se desmenuza este proceder sobre la inspeccin en la pasta de papel. 4.6.1 Realce de los defectos locales en la pasta de papel Como ya se ha dicho, los defectos de la pasta de papel analizados tienen una apariencia oscura respecto al fondo. Desde el punto de vista de las formas, sus tendencias son a ser elpticos. Y en cuanto a la distribucin de los niveles de grises, es decreciente de manera convexa, a modo de agujero. La figura 4.15 ilustra el aspecto tanto espacial como en niveles de grises de los defectos en la pasta de papel. Este conocimiento a priori permite determinar algunas propiedades sobre la mscara de convolucin. El carcter convexo de la forma del defecto junto el uso de mscaras simtricas, para evitar trasladar el centro de gravedad
Figura 4.15 Relieve de un defecto tipo pitch
136
DISAM-UPMT-98-015
Carlos Platero
en niveles de grises del defecto, orienta ambas razones a utilizar simetra par en las cuatro direcciones. En cuanto al tamao de las mscaras, depende tanto del algoritmo como del nmero de pxeles que representan el defecto. El tipo de algoritmo para la deteccin, se basa en la localizacin de pxeles de alto contraste. Respecto a la resolucin tomada es aproximadamente de 0.015 pixel/mm2, y segn la base de datos, los defectos estn en subimgenes que tienen tamaos desde 3 x 2 hasta ms de 15 x 14, correspondientes a defectos que van desde el tipo P hasta A. Por tanto, el tamao de la mscara debe ser tal que al situarse su centro sobre un pixel de alto contraste, los pxeles adyacentes fuesen otros de alto y medio contraste. La motivacin est en que los coeficientes de la mscara encuentren correlacin con los defectos. Por las caractersticas morfolgicas deberan ser de 3 x 3. Mayores tamaos podran desfigurar el realce de los defectos ms pequeos, pues tomara en la convolucin pxeles del fondo. No obstante, el rea de los defectos mayores representa casi un 90% del rea total para los pitch y un 99% para los shives, segn se desprende de la informacin de la tabla 4.3. Por lo que podra considerarse entornos de vecindad 5 x 5, incluso mayores. Para mscaras de mayor tamao podrn ser obtenidas como proceso de aplicacin de la propiedad asociativa de la convolucin, esto es, para su decantacin se pasar aplicar dos o ms etapas de procesado con mscaras 3 x 3 5 x 5. Concluyendo, por el carcter convexo de los defectos, por la resolucin tomada y por el algoritmo a emplear, las mscaras a utilizar son del tipo representado por: fedef ecbce H 3 = dbabd ecbce fedef jihkl fecdg H 4 = dbabd gdcef lkhij
cbc H1 = bab cbc
ecd H 2 = bab dce
( 4.100 )
Al no haber direcciones privilegiadas en la orientacin de los defectos, los filtros lineales debern ser isotrpicos. Para observar la tendencia de isotropa se realizar respuesta en frecuencia de las mscaras, de este proceder quedar reflejado la variacin de ganancia en cualquier direccin. La determinacin de los coeficientes de la mscara se hace considerando el grado de correlacin entre sta y la forma del defecto. Al utilizar el mtodo de correlacin lineal con variable cualitativa, el problema de localizacin de los coeficientes se convierte en la determinacin del hiperplano de serparacin entre defecto y fondo. Con tal propsito se construye la matriz de diseo G*, constituida por vectores asociados al defecto y al fondo. El tamao del vector de caractersticas viene definido por el tipo de mscara. La utilizacin de simetra par y defectos de carcter convexo, hace que estos espacios sean de dimensin 3 5 para mscaras de 3 x 3, mientras para mscaras de 5 x 5 sern de 6 u 11, vase ( 4.100 ). Los vectores de los defectos estn constituidos por la informacin de los pxeles de alto contraste y sus adyacentes, dependiendo del tamao de la mscara. En cambio, los vectores del fondo sern una poblacin representativa de su funcin de densidad. De otro lado, G* estar formado por ceros y unos. Cero donde corresponda con un vector del fondo y uno cuando se le asocie un vector defecto, recurdese la figura 4.7. No obstante, asignacin de G* contraria, dar el mismo resultado en trminos absolutos pero de signo contrario. Al desearse justamente que cuando exista defecto, su nivel de gris sea menor,
DISAM-UPMT-98-015
137
Carlos Platero
mientras que con pxeles del fondo se mantenga o aumente, se fija cero en el defecto y uno en el fondo. Debido a las caractersticas propias de cada cmara e iluminacin, correspondientes al sistemas de adquisicin de imgenes del papel, las muestras tomadas requieren de un proceso de normalizacin. De esta forma, se puede crear una poblacin de defectos y fondos comparables entre si. La unificacin de las muestras ha sido realizada mediante la traslacin de las imgenes a igual media para todo el universo. Este proceder se justifica en la medida de que todas las imgenes capturadas tienen similar varianza pero diferente media, lo que viene a indicar que la variabilidad de la informacin est definida por la textura del material y que con slo corregir la intensidad lumnica se hacen comparables las muestras. Una vez preparadas las muestras, se pasar a determinar los coeficientes por el mtodo Logit. El resultado corresponder con la variacin de correlacin entre la mscara y el entorno de vecindad. Por dicho motivo habr de sumar adems de la ponderacin oportuna de la correlacin, el nivel de gris de los pxeles. La ponderacin del resultado logit depender del nivel de discretizacin de la seal, evitando que se produzca saturaciones. De esta forma quedar definida la mscara, slo resta colocar los coeficientes para que sean efectuados de forma eficiente por el procesador, esto es, prximo a potencias de 2n. En la tabla 4.4 se expone un ejemplo. Tambin se emplear otras mscaras como las correspondientes a filtros binomiales, por ser muy extendido dentro de la bibliografa SIVA.
Tabla 4.4 Resultados del mtodo logit para una mscara 3x3 Resultado logit Suma del vector Mscara optimizada
2 0 4 1 (0.49 0.03 0.008 0.14 0.06) (1.49 0.03 0.008 0.14 0.06) 1 48 1 32 4 0 2
Respecto al procesamiento morfolgico, si se desea realzar defectos de tonalidad oscura se precisa de transformaciones top-hat, ver 4.2.4.2.4. Un estudio de la base de datos de los defectos muestra que los pxeles de alto contraste son pocos y prximos entre si, por lo que sugiere utilizar elementos estructurantes de conectividad 4 pxeles en cruz, por ser los ms prximos o bien probar con conectividad de 8 vecinos. En mayor tamao podra pensarse en 11 e incluso 24 vecinos. La ecuacin ( 4.101 ) muestra los elementos estructurantes propuestos.
138
DISAM-UPMT-98-015
Carlos Platero
010 H1 = 111 010
111 H 2 = 111 111
00100 01110 H 3 = 11111 01110 00100
11111 11111 H 4 = 11111 11111 11111
( 4.101 )
En cuanto a las medidas de realce se ha utilizado, las distancias de Bhattacharyya y medidas relacionadas con las funciones de distribucin tanto de pxeles de alto contraste como de falsas alarmas, tal como fue comentado en 4.5.2. Por lo que se necesita estudiar la viabilidad de normalidad de las distribuciones. 4.6.2 Validacin de las hiptesis de normalidad Se va a intentar validar la normalidad de la seal del fondo. Mientras que la funcin de distribucin de los pxeles de alto contraste, es posible conseguirla, gracias a un conjunto extenso de muestras superiores a 230 defectos distintos. En la tabla 4.5 se presentan los resultados de validacin de normalidad sobre la seal del fondo y la distribucin de pxeles de alto contraste, F y AC. Para el caso de las convoluciones, esto es, de procesado lineal, si la seal captada sigue una distribucin normal, la procesada tambin tendr una funcin de densidad normal. No obstante, el carcter discreto de los datos, puede generar una dispersin de los valores que provoquen saturaciones, tanto por el valor inferior como superior, rompiendo con la modelizacin prevista. Obsrvese que la distribucin del fondo si es normal, no as la densidad de los pxeles de alto contraste. Si de filtros no lineales se trata, habr que estudiar su normalidad pasada la etapa de realce, pues es esta imagen la que ser posteriormente segmentada. Las especificaciones de los parmetros del test fueron vistas en 4.3.4.1. El modo de actuar consisti en tomar las imgenes procesadas, siendo unas muestras lo suficientemente extensas para la validacin rechazo de la hiptesis. De stas se extraen sus histogramas y se calculan los coeficientes de asimetras y apuntamientos, determinndose mediante el test de Jarque y Vera el ndice de confianza. Adems, sobre estas imgenes se calcula el centro de gravedad para observar que las falsas alarmas se distribuyen de manera aleatoria en todo el espacio de la imagen captada, mostrando con ello una iluminacin uniforme y la posibilidad de tomar umbrales globales. En la tabla siguiente se ilustra algunas de las ms de veinte mscaras probadas, junto con sus parmetros, niveles de confianza y distancia de Bhattacharyya. Hay mscaras de 3x3 y de 5x5 segn ( 4.100 ), adems se muestran diferentes resultados de aplicar la correlacin ponderada con el nivel de gris.
DISAM-UPMT-98-015
139
Carlos Platero
Tabla 4.5 Mscaras de procesado Mscara Funciones de densidad Respuesta en frecuencia F Parmetros F AC AC Normalidad F AC dB
178 -
13
83
25
0.4
0.04
8 1 8 1 1 64 1 32 8 1 8
156
18
43
29
0.3
0.24 2.7
1 0 1 1 0 12 0 8 1 0 1
178
16
69
28
0.4
0.04
1 2 1 1 2 4 2 16 1 2 1
178
11
98
24
0.4
0.1
2.5
140
DISAM-UPMT-98-015
Carlos Platero
2 0 6 1 1 32 1 16 6 0 2
157
18
43
29
0.1
0.25 2.6
2 0 4 1 1 48 1 32 4 0 2
189
16
76
28
0.5
0.04
8 3 1 8 32 3 8
3 8 3 8 1 2 1 3 2 56 2 8 1 2 1 3 3 8 3 8
156
22
16
35
0.3
0.1
2.8
8 2 1 8 64 2 8
2 8 2 8 1 2 1 2 2 85 2 8 1 2 1 2 2 8 2 8
136
17
28
27
0.4
0.09
La primera conclusin que se puede aportar de esta tabla es la suficiencia de la distribucin del fondo como normal, no siendo as para el caso de los pxeles de alto contraste. Y como corolario la no validez de la distancia de Bhattacharyya, pues la distribucin de los pxeles de alto contraste no sigue la normalidad. De otro lado, las mscaras obtenidas de la correlacin muestran una tendencia a favorecer las componentes de alta frecuencia. 4.6.3 Parmetros del sistema de deteccin de defectos La determinacin de los parmetros del sistema de deteccin vendrn dados de manera experimental, mediante el calibrado del conjunto de muestras a partir de las medidas explicadas en 4.5. Sobre la base de datos de que se dispone, y para cada estrategia de deteccin basada en etapa de realce, umbralizacin y post-procesado, se calcula la funcin de distribucin de los pxeles de alto contraste y de falsas alarmas en funcin del
DISAM-UPMT-98-015
141
Carlos Platero
valor de k. Esta fase de calibracin definir la etapa de realce, el umbral u* y por ende k*, junto al tipo de postprocesado. Para el caso de la pasta de papel, los pxeles de alto contraste vendrn ponderados por el tipo de defecto, pues stos se clasifican atendiendo al tamao de sus defectos. No es lo mismo un pixel de alto contraste de un defecto de tipo P que otro de tipo A, pues los primeros slo representan un 0.04 mm2 y los segundos un mm2, segn se vio en la tabla 4.4. A continuacin se presentan los resultados de las distintas estrategias de deteccin de defectos. En la Tabla 4.6 aparece en la primera columna el tipo de procesado, en la segunda las funciones de distribucin de los pixeles de alto contraste ponderados y falsas alarmas con y sin post procesado. El post procesado utilizado ha sido el explicado en 4.4.1 con 8 vecinos. Y las ltimas columnas hace referencia a las medidas de probabilidad de deteccin sin pixeles de falsas alarmas, pAC(pFA=0), sin y con post procesado ( - o + ), ms la probabilidad de falsas alarmas cuando se detectan al 100 % de los defectos. La ltima fila est reservada al procesado morfolgico tipo top hat, al que se le aplicado vecindad a 4 y 8 vecinos.
Tabla 4.6 Resultados de las diferentes estrategias de deteccin Procesado Funciones de distribucin pAC(pFA=0) pFA (pAC=1) + +
77.6 68.8 55.3 92.2
142
DISAM-UPMT-98-015
Carlos Platero
8 1 8 1 1 64 1 32 8 1 8
29.9 64.9 85.4 91.3
1 0 1 1 0 12 0 8 1 0 1
78.3 72.1 61.1 89.3
1 2 1 1 2 4 2 16 1 2 1
90.1 75.0 69.9 92.2
2 0 6 1 1 32 1 16 6 0 2
65.8 72.1 96.1 89.3
2 0 4 1 1 48 1 32 4 0 2
67.1 65.8 69.9 92.2
DISAM-UPMT-98-015
143
Carlos Platero
8 3 1 8 32 3 8
3 8 3 8 1 2 1 3 2 56 2 8 1 2 1 3 3 8 3 8
33.1 60.3 88.3 76.5
8 2 1 8 64 2 8
2 8 2 8 1 2 1 2 2 85 2 8 1 2 1 2 2 8 2 8
2.6
5.2 95.1 76.7
Top-hat
39.7 40.5 97.1 97.1
De la tabla se desprende que el mejor procesado es la aplicacin de un filtro binomial ( smooth ) sin aplicacin de post procesado, alcanzando un 90.1 % de deteccin sin falsas alarmas. Tambin se observa que las mscaras obtenidas mediante correlacin con variable cualitativa mejoran sus prestaciones de deteccin cuando se le aplica las etapas de post procesado. Su explicacin viene dada por el hecho de que estas mscaras tienen bandas pasantes de alta frecuencia, por lo que pixeles aislados de falsas alarmas luego sern eliminados como consecuencias de la discontinuidad de la materia. Seguidamente se pasar a calcular el valor del segundo umbral, kMC, tal que a partir de las semillas reconstruya el defecto, segn se explic en 4.4.2. La forma de actuar consistir una vez localizadas las semillas y conocido el tamao del defecto, obtener el valor ptimo de kMC tal que reconstruya el defecto sin aadir pxeles del fondo. Obsrvese que un valor pequeo de kMC puede suponer un engrosamiento del defecto, y como resultado un rea mayor que la verdadera. Por el contrario, un elevado valor de kMC puede llevar a la situacin contraria. Por ltimo, faltar determinar la relacin de probabilidad de defecto detectado, p DD, y la de falsas alarmas del sistema de deteccin. A partir del conjunto de muestras, se puede
144
DISAM-UPMT-98-015
Carlos Platero
calcular la relacin entre la masa de defecto detectado y de falsas alarmas para cada valor de k. Estas funciones son de gran utilidad de cara al producto final, en el que el propio cliente es el que deber decidir, con su conocimiento del sistema, el coste de la falta de deteccin y de falsas alarmas.
4.7
Conclusiones
Se ha presentado un esquema metodolgico para la deteccin de defectos locales en superficies homogneas y planas. El sistema de inspeccin se basa en tres etapas: realzado, segmentacin y post procesado. Respecto al realzado, se han estudiado los filtros lineales discretos, proponiendo una tcnica novedosa basada en el uso de correlacin lineal con variables cualitativas. Adems tambin se han explorado tcnicas de realce soportado en procesamiento morfolgico. En cuanto a la etapa de segmentacin fue abordada desde las funciones de densidad en niveles de grises del defecto y del fondo, introducindose el concepto de pxeles de alto y medio contrastes. Convirtiendo el problema de umbralizacin, en la localizacin ptima del umbral mediante una funcin de coste, donde se tiene en cuenta los dos errores tpicos, defectos sin detectar y falsas alarmas. Las tcnicas de post procesado han sido aplicadas con una doble intencionalidad, eliminacin de falsas alarmas y reconstruccin de defectos a partir de los pxeles de alto contraste. A continuacin se ha definido un conjunto de medidas con el objeto de calibrar cul es el mejor mtodo de deteccin de defectos. stas se basan en las funciones de distribucin en niveles de grises del fondo y de los defectos. Por ltimo, se ha implementado esta metodologa para la deteccin de faltas locales en la pasta de papel. Donde se ha desarrollado experimentalmente la tcnica propuesta, dando los resultados de diseo para cada una de las etapas y cmo han sido stas evaluadas.
DISAM-UPMT-98-015
145
Carlos Platero
Captulo 5: Anlisis de los datos
Anlisis de los datos
Una vez detectados los defectos locales en la superficie, se determinada la conversin de la imagen segmentada en un vector de caractersticas. Existen mltiples tcnicas para la obtencin de este vector, de esa variedad se ha utilizado los mtodos sintcticos y su posterior conversin a vectores de caractersticas. Sin embargo, en esta tesis el estudio se ha centrado sobre todo en la etapa de clasificacin, dejando slo constancia de cmo se ha procedido experimentalmente para la formacin del vector de caractersticas. Los dos siguientes captulos tienen como objetivo, dar una metodologa de actuacin en la catalogacin de las muestras a partir de la informacin obtenida de la etapa de deteccin de los defectos. La idea bsica es integrar tanto las tcnicas estadsticas como las cognitivas en la resolucin del problema. La experiencia ha demostrado que los resultados de la clasificacin mejoran sensiblemente con acciones hbridas, y que, sustancial mejora se encuentra en la introduccin del conocimiento humano sobre el problema. Los mtodos cognitivos presentan las caractersticas de aprendizaje mediante ejemplos, y cuyos resultados, algunas veces, no cumplen con los criterios de generalidad y exactitud del sistema. Tienen adems inconvenientes en la insercin de conocimiento a priori, y en trminos generales, no es posible saber el sesgo y la varianza derivada de un entrenamiento basado en un conjunto finito de muestras. No obstante, son herramientas de gran valor y que deben verse como elementos potentes en el proceso de decisin, pero no exclusivos. Son los mtodos basados en la modelizacin de funciones de densidad los que pueden ayudar y refinar la decisin, por los motivos que van a ser a continuacin abordados.
DISAM-UPMT-98-015
147
Carlos Platero
Bajo estas consideraciones, la primera pregunta es: Hay posibilidad de clasificar el universo del problema a partir de un conjunto finito de muestras?. La respuesta es si, siempre y cuando exista conocimiento a priori del problema. En la medida de que esta informacin sea ms precisa, ms fcil ser la construccin del clasificador y ms sencillo y rpido la decisin de ste. La pregunta siguiente ser Cmo se aborda la introduccin del conocimiento previo en el clasificador?. Si se considera, hoy por hoy, que la mejor fuente de bsqueda de modelos es el hombre Cmo puede ste introducir sus conocimientos dentro del computador?. La respuesta se encuentra en dos facetas: la primera conseguir una imagen en el computador que identifique unvocamente las realidades fsicas con la informacin depositada, etapa que fue realizada en la deteccin de defectos y en la extraccin de las caractersticas, y la segunda, buscar las relaciones entre las caractersticas de los objetos etiquetados como defectuosos, de manera que se pueda aumentar el poder de discriminacin entre los distintos tipos de defectos a clasificar. El mtodo a seguir estar formado, por este primer captulo encargado de obtener los grupos homogneos inherentes de los datos de entrada, a partir de los mapas auto organizados y tcnicas estadsticas. Mientras en el captulo siguiente, se abordar la seleccin de las caractersticas y la clasificacin mediante mtodos estadsticos, cognitivos y tcnicas hbridas. En el anlisis de datos se trata de localizar los grupos o clusters dentro de la informacin recogida para su clasificacin. Estos grupos forman un conjunto de datos homogneos entre si y diferentes respecto al resto. Existen mltiples tcnicas de clustering, como el algoritmo ISODATA [Hall65] o basados en los k-vecinos ms cercanos. Por las caractersticas del algoritmo de mapas auto organizados, se han explorado las posibilidades que ste tiene para la formacin de un mtodo de agrupamiento, no slo por ser prximo a algoritmos de vecindad sino por la tendencia a representar la funcin de distribucin de la variable de entrada. La bsqueda de subespacios normales liga el anlisis de datos con la seleccin de las caractersticas, permitiendo decantar un algoritmos de agrupamiento de tipo paramtrico. Y aunque es en este captulo donde se habla de transformaciones normalizantes, no se ver concluido el mtodo de parametrizacin hasta el prximo captulo, al requerir introducir un estudio previo sobre clasificadores paramtricos y medidas de error. El planteamiento en este captulo es el siguiente, en primer lugar se exponen las ideas generales sobre mapas auto organizados (5.1). En segundo lugar, se trata de mostrar las cualidades de los mapas auto organizados de Kohonen para el anlisis de los datos (5.2). Seguidamente se estudian las deficiencias del mtodo, para presentar a rengln seguido una nueva metodologa, con el objetivo de modelizar el problema mediante funciones de densidad de cada grupo (5.3). Por ltimo, se expone como se ha utilizado el mtodo propuesto en el anlisis de datos proveniente de defectos locales en el aluminio colado (5.4).
148
DISAM-UPMT-98-015
Carlos Platero
5.1
Anlisis de los datos con mapas auto organizados

Se pretende ver la posibilidad de utilizar los mapas auto organizados para el anlisis de datos. Previamente, se exponen de forma somera, las bases de los mapas y posteriormente se expone la teora que soporta el anlisis de los datos. En el mapa auto organizado (self-organizing) no existe ningn maestro que indique si la red neuronal est operando correcta o equivocadamente, pues no se define ningn tipo de realimentacin entre la salida actual y la deseada. As durante el proceso de aprendizaje, el sistema debe descubrir por si mismo patrones, regularidades, correlaciones o categoras en los datos de entrada, y codificarlos internamente en su estructura. Los modelos no supervisados tienen un campo de aplicacin propio, relacionado en general con el anlisis exploratorio de los datos. Estos modelos suelen ser simples, monocapa y con algoritmos sencillos y rpidos, ms prximos a la biologa. Se pueden clasificar en dos grandes grupos, redes no supervisadas hebbianas, basada en las reglas de Hebb, y modelos auto organizados, denominadas redes no supervisadas competitivas, en las que solamente una neurona ( o un grupo de vecinas ), pueden quedar finalmente activadas. El SOM o mapa auto organizado de Kohonen fue desarrollado a lo la largo de la dcada de los ochenta por el finlands Teuvo Kohonen, y representa una continuacin natural de la lnea de desarrollo de redes competitivas iniciado por von der Malsburg [Malsb73]. Las primeras publicaciones sobre el SOM [Kohon82,Kohon82a] presentaban el diseo de un eficiente y sencillo algoritmo de computador para la auto organizacin de mapas de rasgos; este algoritmo ha resultado ser una plataforma muy importante para multitud de aplicaciones.
DISAM-UPMT-98-015
149
Carlos Platero
5.1.1
Mapas Auto organizados La idea de los mapas auto organizados (SOM = Self-Organizing Maps), surgi del deseo de modelar la organizacin de los tejidos cerebrales. Se ha establecido experimentalmente que en el cortex de los animales superiores existen zonas donde las neuronas detectoras de rasgos se encuentran topolgicamente ordenadas. La corteza cerebral parece estar ordenada desde varios puntos de vista y niveles de abstraccin. Los centros responsables de actividades diversas como la visin, el odo, las funciones motoras, etc. yacen en zonas especficas de la corteza, y estas zonas guardan entre ellas una cierta topologa. Asimismo, las zonas individuales muestran una ordenacin respecto a su funcionalidad. Un ejemplo de ello es el mapa tonotpico de las regiones auditivas, en el cual neuronas prximas entre si responden a frecuencias de sonido similares segn una sucesin ordenada, desde los tonos ms altos a los ms bajos. Las regiones tales como el mapa tonotpico, suelen recibir el nombre de mapas de correspondencias ordenadas de caractersticas. El algoritmo de Kohonen surgi del deseo de modelar la manera natural en que se desarrollan estos mapas de caractersticas ordenadas. 5.1.1.1 Arquitectura
ci ca ifi as an re Pl e ta d
nc ion es mo tr en ica sor s ial
iento
Ma
pa s
Alto
Bajo
Fu
Pen
to en mi oci s con do Re soni de
Ha
bla
to ie n cim no ras eco alab R p de
sam
to imien Mov s de ojo
Visin
Figura 5.1 reas de influencia
Figura 5.2 Mapa tonotpico (de gato)
La arquitectura general de un SOM puede describirse de la siguiente manera: se tiene un conjunto de N nodos (neuronas) I = {1,2,..N}, los cuales se disponen en una malla, generalmente de una, dos o tres dimensiones. A cada nodo i de esa malla (usualmente conocida como capa de competicin), se le asocia un vector de peso Mi = [i1, i2,..., in] n. La forma de la malla puede ser definida rectangular , hexagonal o incluso irregular. Dentro de la malla se define un conjunto de vecindad Ni alrededor del i-simo nodo, que puede adoptar diversas formas. La entrada es un vector X(t) = [x1, x2, ..., xn] n que se conecta, en el caso ms sencillo, en paralelo a todas las neuronas de la malla de competicin (pueden haber otros esquemas de conexin). El peso de conexin entre la neurona Mi y el j-simo componente de la seal de entrada viene dado por ij
150
DISAM-UPMT-98-015
Carlos Platero
V ecindadN i m alla
M i(t) sinapsis 1 2 n
X (t)
Figura 5.3 Arquitectura SOM
5.1.1.2 El algoritmo El objetivo del algoritmo de Kohonen consiste en adaptar los pesos ij de las neuronas de la malla, segn una regla de aprendizaje no supervisado, hasta conseguir una malla ordenada topolgicamente, en el que cada neurona est especialmente sensibilizada en un dominio de la seal de entrada. La modificacin de los pesos ij se realiza selectivamente de acuerdo al siguiente criterio: Al encontrar el nodo ganador, se modifica el peso de ste y de todos aquellos que se encuentran dentro del conjunto de vecindad definido (verdadera aportacin de Kohonen en el aprendizaje competitivo). El nodo ganador es el nodo de la malla que, en alguna mtrica, est ms cerca o mejor casa con la entrada que se presenta en el ciclo de modificacin (aprendizaje). El algoritmo de Kohonen puede ser expresado por un conjunto de pesos, los cuales se repiten iterativamente hasta conseguir un orden topolgico en la capa de competicin (fase de aprendizaje). Una vez conseguido el orden, se continua aplicando el algoritmo para afinar los pesos de los nodos ya ordenados (fase de convergencia). En esta etapa, la topologa de la red se preserva, esto es, el mapa conserva su distribucin a pesar de continuar sometiendo a la red, a nuevos ciclos de aprendizaje. Los pasos del algoritmo son: 1.Inicializacin de los pesos: En un principio, t = t0, la red se encuentra en un estado inicial desordenado, los pesos de los nodos de la capa de competicin toman valores aleatorios.
DISAM-UPMT-98-015
151
Carlos Platero
2.Presentacin de la entrada: Es presentado a la red un vector de entrada aleatorio X(t) n. 3.Bsqueda del nodo ganador: El vector de entrada X(t) se compara con todos los vectores de referencia Mi(t), hasta encontrar el nodo Mc ms cercano o que ms case con el vector de entrada X. Es utilizado frecuentemente la mtrica eucldea, pero puede utilizarse otro tipo de mtrica. X t M c t = min X t Mi t
i
( 5.1 )
4.Modificacin de los pesos: Los pesos de los nodos de la capa de competicin son modificados segn la ley de aprendizaje M i t + 1 = M i t + hci t X t M i t ( 5.2 )
la funcin hci se conoce como funcin de vecindad, y juega un papel central en el desempeo del algoritmo. Mantiene el aspecto de un kernel (rejilla) de radio de accin que acta sobre la neurona ganadora y sus vecinas seleccionadas. Para la convergencia del proceso de aprendizaje, es necesario que hci(t)0 cuando t. Usualmente hci(t) = hci(rc - ri,t) donde rc, ri 2, correspondientes al vector de localizacin de los nodos de la malla; tal que con incrementos de rc - ri decrezca hci0 espacialmente. En la literatura de los SOM hay dos tipos bsicos de funcin de vecindad. La ms simple est basado en el conjunto de vecindad Nc, establecindose que hci(t) = (t) si i Nc(t), en caso contrario hci(t) = 0 para i Nc(t). El valor de (t) es identificado como el factor de aprendizaje (0 < (t) < 1). Ambos (t) y Nc(t) son montonos decrecientes en el tiempo (ver Figura 5.4 )
Figura 5.4 Conjunto de vecindad
Otra rejilla aplicada es un kernel en trminos de funcin gaussiana
152
DISAM-UPMT-98-015
Carlos Platero
r c ri
h ci ( t ) = ( t ) e
(t )
( 5.3 )
donde (t) y (t) definen el ancho de la rejilla. Es normal utilizar una estrategia separada en la ordenacin y en la convergencia. As durante la fase de aprendizaje habr una evolucin tanto de la funcin de vecindad como del factor de aprendizaje, mientras en la convergencia se mantiene la vecindad siguiendo decreciendo (t). 5.Volver al paso 2: Mientras no se haya alcanzado un estado de orden en la malla de competicin, el algoritmo regresa al nivel 2 hasta que los nodos estn adecuadamente afinados. Aunque los principios bsicos del algoritmo de Kohonen parecen simples, y la dinmica del algoritmo ha sido ampliamente observada en forma practica, sta ofrece todava muchos interrogantes acerca del fenmeno de ordenacin topolgica y convergencia. Desde el punto de vista del anlisis de datos, las preguntas que debera responder el algoritmo son:
Los mapas obtenidos son nicos, en el sentido de que a partir de pesos iniciales
distintos, la respuesta sea siempre la misma ?
Los vectores de referencia tienden a representar la funcin de densidad del

vector de entrada ?
Cmo definir los mejores mapas, tal que stos cumplan con el objetivo de ser
fiel reflejo del espacio de entrada sobre una dimensin reducida ? Estas cuestiones que aqu son emplazadas caen dentro de la discusin terica de las SOM, que lleva ms de una dcada buscando respuestas. Segn Kohonen [Kohon95], hay cuatro clases de problemas en las discusiones sobre los mapas auto organizados. 1. Ordenamiento topolgico de los mapas 2. Convergencia de los vectores de referencia, Mi. 3. Funcin de densidad, p(X), versus vectores de referencia 4. ptima funcin de vecindad, hci, y factor de aprendizaje Las respuestas que se tienen a estas preguntas son parciales, especialmente en un sentido estrictamente matemtico. Se han hecho diferentes esfuerzos con diversos mtodos
DISAM-UPMT-98-015
153
Carlos Platero
y herramientas matemticas para describir en forma general los fenmenos de orden y convergencia, pero hasta ahora no se tienen soluciones globales. Las soluciones o aproximaciones existentes se refieren a casos especficos o con condiciones limitadas. El nico anlisis matemtico completo que se tiene hasta ahora es para el caso unidimensional, el vector de entrada es de dimensin unitaria y la malla la componen unidades dispuestas a modo de secuencia de nodos unidimensionales. Cottrell y Fort [Cottr87] presentan un tratamiento completo y riguroso de las propiedades de auto organizacin y convergencia del SOM, cuando se cumplen los requisitos de funcin de densidad de entrada continua y funcin de vecindad tipo escaln. 5.1.1.3 Ordenamiento de los vectores de referencia Un aspecto interesante consiste en averiguar, si los vectores de pesos, inicialmente aleatorios, se ordenan por medio de la regla de aprendizaje, de modo que preserven la topologa del espacio de entrada. Pero cmo expresar matemticamente, que un array o malla est ordenado ? Qu es exactamente un orden topolgico ?. El concepto de orden es trivial en el caso unidimensional, definiendo una funcin objetivo J y asumiendo un conjunto de nmeros escalares i, i = 1,2, ..., N, luego J = i i 1 N 1
i =2 N
( 5.4 )
es mnimo, y en este caso cero, si y solo si los i estn ordenados numricamente en secuencias ascendentes o descendentes. Considerando un proceso de auto organizacin, con un vector de entrada unidimensional y los i que corresponden a los escalares de referencia, Mi, el array lineal tender a J = 0, a un estado absorbente en el sentido markoviano1, esta condicin de orden no cambia aun cuando el proceso de aprendizaje contine con la exposicin de ms entradas. Cottrell y Fort [Cottr87] han presentado una exhaustiva demostracin del proceso de ordenamiento para el caso unidimensional. La propiedad general demostrada del ordenamiento de un mapa de Kohonen unidimensional se establece como: Siendo una variable estocstica y habiendo empezado con pesos iniciales aleatorios para cada i, estos pesos modificados por el proceso de aprendizaje segn( 5.1 ) y ( 5.2 ), junto con una funcin de vecindad de i-1 e i+1, tal que cuando t, el conjunto de pesos {1,2,...,n} tendern ha ordenarse en secuencia ascendente o descendente. Una
Las tcnicas de Markov se utilizan principalmente para el estudio de la auto organizacin. Se trata de aplicar los resultados conocidos de la teora de Markov al proceso de organizacin topolgica. As, para la prueba de auto organizacin, lo que se pretende es probar la existencia de un estado absorbente, al cual en el proceso de aprendizaje de los vectores de referencia, entrarn en el estado ordenado con probabilidad uno despus de un tiempo determinado.
154
DISAM-UPMT-98-015
Carlos Platero
vez el conjunto ordenado, ste no podr ser desordenado aunque existan etapas de actualizacin Para mayores dimensiones es muy difcil definir un orden topolgico. Por lo menos as lo han mostrado los diversos trabajos, en lo que para cada sugerencia hecha de la funcin J, siempre se ha encontrado un contraejemplo que contradice la existencia de un estado absorbente. Al menos lo que s siempre se ha cumplido en las SOM, es que el orden refleja propiedades de la funcin de densidad de la variable de entrada, p(X). Parece que debera definirse el concepto de orden, en trminos de minimizar alguna condicin expresada como funcin de error medio esperado entre la distribucin de los vectores de referencia y p(X). Efectivamente, en las pruebas constructivas y para el caso especfico de igual dimensin en el espacio de entrada y en la malla, el ordenamiento est ligado al compromiso geomtrico de los nodos con la variable de entrada.
Figura 5.5 Distribucin de p(x) uniforme en un rectngulos (2D)
Figura 5.6 Distribucin de p(x) uniforme en un cactus (3D)
5.1.1.4 Convergencia de los vectores de referencia Una vez acabada la fase de ordenacin y sabiendo que cualquier actualizacin no variar el orden, los mapas tienden a converger, de forma ptima en el sentido, tal que stos representen imgenes de la funcin de densidad de las variables de entrada. Una solucin formal para la determinacin de los Mi no esta disponible actualmente, al menos con una proposicin genrica de p(X). Kohonen ha demostrado la validez de la formula del descenso del gradiente para SOM de orden topolgico cero2, derivable del error de cuantizacin medio esperado.
Sin vecindad, correspondiente a los mtodos clsicos de Vector Quantization (VQ)
DISAM-UPMT-98-015
155
Carlos Platero
Los algoritmos VQ representan una clsica aplicacin del mtodo de aproximacin de la funcin de densidad de una seal, p(X), usando un nmero finito de vectores de referencia Min, i = 1,2,..., k. Uno de los vectores de referencia, Mc, es elegido al estar ms prximo al vector de entrada, X. X Mc = i { X Mi }
( 5.5 )
El ndice c es actualizado en el proceso de aprendizaje para cada nueva entrada. Una ptima seleccin de Mi podra consistir en minimizar el valor cuadrtico medio del error de cuantizacin, definido como: E = X Mc
2
p(X) dX
( 5.6 )
donde la norma es eucldea. Obsrvese que el subndice "c" es una funcin de la seal de entrada, X, y de todos los vectores de referencias Mi, de manera que el clculo del error no se puede realizar de manera sencilla, al variar Mi su posicin en el espacio de entrada por la propia evolucin de aproximacin a la funcin de densidad de X. Sin demostrarlo [Zador82], la optima posicin de los Mi tal que se aproxime a la funcin de densidad de X es [p(X)]n/(n+2), siendo n la dimensin del espacio de entrada; en el caso de tener n >> 2, los vectores de referencia se aproximan a la funcin de densidad con un nmero finito de vectores. Kohonen demuestra que los codebook vectors siguen un proceso similar al mtodo de aproximacin estocstico de Robbins-Monro en su dinmica de acercamiento a posiciones ptimas. La idea que introducen Robbins y Monro[Robbi51] es el clculo de M(t) (vector de pesos) en la red de Adaline de Widrow [Widro62]. Sugieren que el valor del vector de pesos se calcule en cada paso de forma iterativa. Partiendo del clculo de la funcin objetivo, J, como la media esperada del error cuadrtico J = E MT X
2
( 5.7 )
siendo = MTX + la dependencia lineal de la red y el error estadstico con valor esperado nulo; donde E{.} denota la esperanza matemtica sobre el conjunto infinito de muestra. Si p(X) es la funcin de densidad de la variable de entrada, se puede reescribir como J =
X 2 p X dX
( 5.8 )
156
DISAM-UPMT-98-015
Carlos Platero
donde dX es un elemento diferencial de volumen en el hiperespacio n-dimensional de los valores de la seal sobre la cual se realiza la integral. El problema es encontrar el valor M* tal que minimice J. La condicin para el mnimo local es J J J m J = , ,..., =0 n 1 2
T
( 5.9 )
Ya que la funcin de densidad p(X) no se conoce normalmente en su forma analtica (en la mayora de los casos se tiene nicamente una distribucin de muestras experimentales de X), se debe aproximar J usando los valores disponibles de X. Se puede establecer entonces una funcin muestra de J mediante J1(t): J1 t = [ M T t X t
( 5.10 )
donde t = 0,1,2, es un ndice de la muestra, y M(t) es una aproximacin, ms o menos buena, de M en un tiempo t. La aportacin fue determinar M(t) en cada paso de una recursin, donde el gradiente de J se aproxima por el gradiente de J1(t) con respecto a M(t). A partir de esta idea se mostr que empezando con valores arbitrarios iniciales M(0), la secuencia {M(t)} converge a una vecindad del vector ptimo M*. Esta recursin se define como una serie de pasos de gradiente MT t + 1 = MT t + t t MT t X t XT t ( 5.11 )
Robbins y Monro probaron que esta secuencia converge con probabilidad uno hasta el ptimo local de M*, para la cual J es mnimo, si y solo si, se cumplen las siguientes condiciones:
( t ) = ,
t =0 t =0
(t ) <
( 5.12 )
Lo relevante de esta aproximacin es que el algoritmo utilizado en las SOM de orden topolgico cero es [Kohon95]: M i (t + 1) = M i (t) + (t) ci [X(t) - M i (t)] ( 5.13 )
siendo ci delta Kronecker ( 1 para c = i, 0 en caso contrario). Esta regla es obtenida a partir de tratar de minimizar la funcin objetivo de valor cuadrtico medio del error de cuantizacin, definido como
DISAM-UPMT-98-015
157
Carlos Platero
E =
X M c p X dX
( 5.14 )
donde la norma es eucldea. La comparacin entre ambas ( 5.11 ) y ( 5.13 ), muestra que la condicin de convergencia planteada por Robbins y Monro puede aplicarse al algoritmo de Kohonen. As el factor de aprendizaje, (t), debe cumplir que la secuencia decrezca a cero cuando t; la secuencia {(t) | t = 0,1,} debe satisfacer las condiciones puestas en ( 5.12 ). Atendiendo a las propiedades generales de la aproximacin estocstica, junto con la convergencia a un estado absorbente, los valores esperados de Mi(t+1) y de Mi(t) para t deben ser iguales, incluso cuando hci(t) fuese seleccionado distinto de cero. En otras palabras, cuando la red se encuentre en estado estacionario deber cumplir: E hci X Mi =0 i ( 5.15 )
En el caso ms simple de hci(t), donde fuese declarado como 1 para aquellos nodos que perteneciesen al conjunto topolgico de Nc y nulo para el resto, el vector de referencia se posicionar:
Mi =
Vi
Xp X dX
Vi
p X dx
( 5.16 )
donde Vi es el conjunto de todos los valores de X que han actualizado al vector Mi. Estas condiciones de equilibrio significan que cada Mi* debe coincidir con el centroide de su regin de influencia, ms aun, representa el centroide de p(X) sobre la parte la regin que le ha tocado dominar. ste podra ser definido como el estado ordenado. Intuitivamente deja claro que para cualquier dimensin, el equilibrio slo podra conseguirse con una particular configuracin de Mi. 5.1.1.5 Mosaico de Voronoi
Un concepto ampliamente utilizado tanto en los mtodos VQ como en redes neuronales es el mosaico (tessellation) de Voronoi. La figura 5.7 muestra como los finitos vectores de referencia en 2, presentados como puntos, han dividido el espacio en regiones de influencia, limitada por bordes lineales ( en general, hiperplanos), tal que cada particin contiene un vector de referencia, siendo ste el vector dominante dentro del rea. Al conjunto de lneas que rodean al vector de referencia se le llama mosaico de Voronoi. Y a todos los infinitos vectores que estn dentro del entorno se dice que forman un conjunto de Voronoi.
158
DISAM-UPMT-98-015
Carlos Platero
Figura 5.7 Mosaico de Voronoi
5.1.1.6 ptimo ritmo de aprendizaje El periodo de ordenacin suele ser corto, llevndose casi todo el tiempo de aprendizaje en la fase de convergencia, con el objetivo de obtener una fiel aproximacin estadstica de la funcin de densidad de la entrada. No est claro como debera optimizarse el ritmo de aprendizaje en la primera fase de ordenacin, ya de por si difcil, ms aun cuando tambin participa en la modificacin de los vectores de referencia, la funcin de vecindad asociada a cada neurona ganadora. En cambio, durante la fase de convergencia, el hecho de mantener fijo el ancho de vecindad, hace ms factible determinar algn tipo de secuencia ptima {(t)}. El carcter recursivo del algoritmo ( 5.1 )( 5.2 ) incita a que el vector de referencia siga la traza de las muestras de entrada que caen dentro de su dominio de influencia. La Figura 5.8 y la Figura 5.9 sealan como la regla de aprendizaje asume la historia de los vectores de entrada que casan con la neurona. Y es aqu donde el ritmo de aprendizaje tiene mucho que ver con la convergencia.
Figura 5.9 Interpretacin geomtrica del factor de aprendizaje
Figura 5.8 Proceso de aprendizaje en 2D a) Inicio b) Ordenamiento c) Convergencia
En esta etapa de convergencia, caracterizada por una funcin de vecindad constante, s existen dos entradas X(t1) y X(t2) que casan con diferentes neuronas y con t2
DISAM-UPMT-98-015
159
Carlos Platero
> t1, pero que la aportacin a sus correspondientes neuronas deberan ser las mismas, por ser presentadas en el mismo orden, aunque eso si, separado en el tiempo, la ley de la secuencia podra estimarse de diferentes ritmos de aprendizaje para cada una de ellas. Si adems deben cumplir los requisitos de aproximacin estocstica del proceso, ( 5.12 ), una propuesta correspondera a :
c (t + 1) =
c (t ) 1 + c (t )
( 5.17 )
slo seran actualizados aquellos ritmos de aprendizaje pertenecientes a neuronas ganadoras, el resto no mantendran cambios. Esta especulacin terica no es compartida como la mejor forma de aprendizaje en la prctica, debido a los variados valores de i obtenidos en la ejecucin del algoritmo de aprendizaje. Es una contradiccin que los vectores de referencia, fieles representantes de alguna funcin montona de p(X), sean bruscamente orientados por los diferentes ritmos de aprendizaje. Por el anterior razonamiento parece justificado mantener un (t) global en toda la malla y buscar un ritmo ptimo medio. Mulier y Cherkassky [Mulie92] han propuesto una expresin de la forma:
(t ) =
A B+t
( 5.18 )
donde A y B son unas constantes elegidas. Al menos esta forma satisface las condiciones de aproximacin estocstica. La principal justificacin es que las muestras ms recientes son consideradas dentro del entorno de evolucin. 5.1.1.7 Efecto de la forma de la funcin de vecindad Para una buena fase de ordenacin es imprescindible empezar con radios de vecindad de la mitad de la red, Nc(0), evitando la aparicin de mapas configurados metaestables, recibiendo este nombre cuando la distorsin media esperada o error de cuantizacin cae dentro de un mnimo local y no global. Erwin et al.[Erwin92] han analizado los estados metaestables en mallas de una nica dimensin, definiendo que una funcin de vecindad es convexa dentro de un cierto intervalo I{0,1,2,...N}, si las condiciones s-q>s-r y que s-q>r-q implican que [h(s,s) + h(s,q)] < [h(s,r) + h(r,q)] para todo s,r,q I, en caso contrario la funcin de vecindad es cncava. El principal resultado que obtuvieron fue que si la funcin es convexa no existen estados que no estn ordenados, mientras que con el uso de funciones cncavas aparecen estados metaestables que podran relentizar el proceso de ordenamiento. Por lo tanto, si en el principio del proceso se utiliza una funcin de vecindad convexa, el ordenamiento es
160
DISAM-UPMT-98-015
Carlos Platero
casi seguro, y posteriormente la funcin de vecindad puede ser contraida para mejorar la aproximacin a p(X). 5.1.1.8 Factor de magnificacin Desde el punto de vista de los mapas biolgicos cerebrales, existe correspondencia entre el volumen de informacin a representar y la densidad de clulas receptoras, definindose factor de magnificacin como el nmero de neuronas por unidad de rea. Algo similar sucede en los SOM, donde el rea reservado en la representacin de los patrones es proporcional a la frecuencia estadstica de la ocurrencia del patrn en las observaciones. Ritter et al. [Ritte88] han analizado el factor de magnificacin en mapas unidimensionales con gran cantidad de vectores de referencia sobre un rea finita. Si N es el nmero de vecinos incluidos en el conjunto de vecindad, se demuestra que la densidad de vectores de referencia es proporcional a p(X)r, donde el exponente es r= 2 1 2 3 3N + 3( N + 1)
( 5.19 )
Obsrvese que para N=0, caso VQ, la densidad de vectores se aproxima con un valor bajo, r = 1/3, considerndolo como un handicap. En cambio, si N tiende a ser elevado r2/3 ms prximo a la concepcin hipottica de ordenacin, segn modelos biolgicos. Por ltimo, si en la fase de convergencia ya no es tan importante el ancho de vecindad, especialmente si es utilizado un kernel gaussiano, se puede llegar al caso extremo de topologa de orden cero, es decir, slo el ganador es actualizado. Sin embargo, la falta de interaccin con los vecinos, en esta fase de aprendizaje, puede llevar a situaciones de prdida del estado de ordenamiento. Concluyendo, debe existir un compromiso entre la mejor aproximacin a la funcin de densidad p(X), cuyo mejor caso es el VQ, y la estabilidad del ordenamiento, para lo que se hace necesario mantener las interacciones con los vecinos. 5.1.2 Conclusiones sobre los mapas auto organizados Las conclusiones que se pueden extraer del estudio anterior, para enfrentarse posteriormente a la utilidad de las SOM como parte del anlisis de datos, estn reflejadas en los siguientes puntos: Primero, desde el punto de vista del ordenamiento, cabe decir que se ha demostrado la existencia de un estado absorbente y ordenado para el caso unidmensional, y que para dimensiones mayores se sospecha que el orden topolgico est ntimamente ligado con la funcin de densidad de la variable de entrada. Estos supuestos son ratificados por las pruebas constructivas.
DISAM-UPMT-98-015
161
Carlos Platero
Segundo, una vez ordenado topolgicamente la malla, sta no sufre alteraciones de orden aunque existan nuevas actualizaciones, siempre y cuando se mantenga un cierto nivel de interacciones laterales. Tercero, la fase de convergencia hace tender los vectores de referencia hacia los centroides de las regiones de influencia o entornos de Voronoi, que les correspondan dominar. Cuarto, la plausibilidad de aproximacin estocstica del proceso impone restricciones al factor de aprendizaje, como una secuencia montona decreciente. Quinto, la funcin de vecindad debe incializarse con radios de vecindad mitad el tamao de la malla, evolucionando en el tiempo de forma decreciente hasta mantenerse constante en la fase de convergencia. Las funciones de vecindad deben ser convexas para evitar configuraciones metaestables. Sexto, el orden topolgico tambin se relaciona con la densidad de vectores, en aquellas reas de mayor cantidad de informacin a representar, mayor densidad de vectores de referencia se necesitan. Sptimo, los mapas SOM deben ser un compromiso entre el ordenamiento topolgico, que depende mucho de las interacciones laterales entre vecinos, y la aproximacin estadstica a p(X), cuyo ptimo se encuentra en las configuraciones VQ. Las SOM no slo tienden a reflejar la funcin de densidad de la variable de entrada, sino que adems muestran caractersticas de ordenamiento topolgico, siendo este concepto recogido de imitacin a mecanismos orgnicos, en el sentido de considerar a los cerebros ordenados. Llegando a decir, que los SOM permiten conocer la naturaleza de la informacin mediante la aproximacin a la funcin de densidad, pero adems aporta, que aquellas regiones de n ms excitadas le correspondern ms neuronas, extrayendo los polos de atraccin y homogeneidad de los grupos inherentes existentes.
5.2
SOM como herramienta de clustering

Si bien es conocido el xito de la clasificacin de los mapas auto organizados, stos podran ser mejorados si el diseador introdujera conocimiento a priori del problema, siendo sta la nica manera conocida, hasta el momento, para producir mejores clasificadores. La forma de actuar consiste en aumentar la discriminacin mediante alguna transformacin en los datos. Este tipo de actuacin slo se puede hacer desde una interpretacin inteligente, por lo que queda la intervencin del raciocinio humano para que busque la ptima proyeccin de la informacin.
162
DISAM-UPMT-98-015
Carlos Platero
Un buen inicio en la construccin del clasificador, es la obtencin de un mapa auto organizado sobre la informacin a catalogar. Y este pensamiento se sustenta en las inmejorables caractersticas que otorgan las SOM. Las principales ventajas que afirman la anterior sentencia vienen avaladas en: 1. El mapa refleja la funcin de densidad de la variable de entrada, lo que permitir sugerir funciones de densidad condicionada de los grupos inherentes existentes. 2. Los patrones similares corresponden a neuronas vecinas, y stas al proyectarse sobre una dimensin reducida ayudarn a conocer los cluster existentes. 3. Al ser aprendizaje no supervisado se hace una exploracin de los datos, conociendo la estructura inherente de stos. 4. Divide el espacio de entrada en diferentes regiones de inters, elemento esencial en la introduccin de conocimiento a priori. En general, no existe una nica transformacin global que ayude a aumentar el poder de discriminacin, sino de alguna transformacin local, lineal o no, que mejore la discriminacin. Derivando el problema en la configuracin de diferentes clasificadores para cada regin. Los siguientes prrafos tienen como objetivo cmo decantar a partir de la informacin de los mapas de Kohonen los clusters que contiene el espacio de medidas.
5.2.1
Deficiencias de los mapas de Kohonen en el proceso de clustering Tal como se ha comentado, una de las propiedades de los mapas de Kohonen es mantener fielmente reflejado el vector de entrada en una dimensin reducida (p.ej n >> 2). Esta virtud es aplicada para el anlisis de los datos, de manera que los grupos inherentes en los datos de entrada corresponderan con neuronas prximas entre s y delimitaran una regin determinada. As, a cualquier grupo en n debera corresponderle una regin de menor dimensin sobre el mapa. Con el objetivo de mostrar las deficiencias de los mapas de Kohonen en clustering, es repetido brevemente el experimento realizado por Ultsch et al [Ultsc90]. Se eligen 4 puntos en tres dimensiones (ABCD), correspondientes al vrtice de un tetraedro (Figura 5.10). Para cada uno de los puntos se toman vectores aleatorios, con una distancia comprendida entre 0.1 y 0.4 tomando un valor medio de 0.2 respecto a cada uno de los vrtices, generndose una nube de puntos por cada punta de la figura geomtrica. Todos los vectores estn escalados, de manera que la globalidad de los datos estn inscritos en un cubo unidad (Figura 5.11).
DISAM-UPMT-98-015
163
Carlos Platero
Figura 5.10 Vrtices del tetraedro
Figura 5.11 Puntos sobre los vrtices
Los algoritmos de clustering deberan separar el conjunto de datos en cuatro subconjuntos e indicar la disimilaridad de stos. Para verificar el mapa de Kohonen se hace uso de una red de 64 neuronas y con un entrenamiento de 40 vectores. Las Figura 5.11y Figura 5.12 muestran la distribucin inicial de los vectores de referencia y como despus de 50.000 pasos de entrenamiento aparecen ntidamente los cuatro cluster.
Figura 5.13 Vectores iniciales
Figura 5.12 Vectores despus de 50000 pasos
El comportamiento de los mapas auto organizados muestra que quedan reflejadas las funciones de densidad del vector de entrada sobre ellos. No obstante, las distancias entre los datos tambin aparecen distribuidas. Las posiciones fronteras entre grupos dentro de la red no reflejan las separaciones eucldeas de los datos. Otros experimentos realizados con funciones de vecindad distintas (hexagonales y octogonales) fueron probados con iguales comportamientos. 5.2.2 Mtodo U-Matriz Ultsh y Siemon proponen utilizar un mtodo complementario al algoritmo del SOM, que es el clculo de la matriz llamada U-Matriz; permitiendo obtener un mapa superpuesto al SOM que remarque ms la distribucin del vector.
164
DISAM-UPMT-98-015
Carlos Platero
Para cada unidad aij del mapa auto organizado se definen cuatro tipos de distancia a sus inmediatos vecinos. d x (i, j ) = d (u i , j , u i +1, j ) d y (i, j ) = d (u i , j , u i , j +1 ) d xy (i, j ) = d (u i , j , u i +1, j +1 ) d yx (i, j ) = d (u i , j +1 , u i +1, j ) Y se propone la siguiente matriz que combina las cuatro distancias con una dimensin de 2 n 1x 2 n 1 como sigue: ( 5.20 )
Tabla 5.1 Matriz de distancia U-Matriz 2i-1 2i 2i+1 2j-1 dz (i,j-1) dx(i,j-1) dz(i,j-1) 2j dy(i-1,j) du(i,j) dy(i,j) 2j+1 dz(i-1,j) dx(i,j) dz(i,j)
donde dz(i,j) es el valor medio de dxy(i,j) y dyx(i,j) y du puede ser elegida arbitrariamente. Este valor puede ser, por ejemplo, la distancia de esta entrada a la unidad aij. Por cada unidad aij hay un correspondiente elemento du(ij) conteniendo la distancia dy, dx y la distancia diagonal con sus vecinos. La distancia diagonal es representada en la UMatriz como medias aritmticas de dxy y dyx. La U-Matriz contiene por tanto una correcta aproximacin de la distribucin del vector en el mapa de Kohonen. Para obtener una presentacin de las caractersticas de U-Matriz se visualizar de forma tridimensional, mostrando la altura el nivel de separacin de las neuronas. As neuronas prximas entre s correspondern con una presentacin cartogrfica de valles que indicarn proximidad de los pesos en n y las colinas o muros muestran vectores de referencia prximos entre si en el mapa auto organizado pero distantes en n . Las Figura 5.14 y Figura 5.15 reflejan la disposicin de la U-Matriz en el caso de los datos del tetraedro y un hexaedro; obsrvese que el mapa es dividido en cuatro o seis regiones diferentes, correspondiente a los cuatro o seis clusters.
DISAM-UPMT-98-015
165
Carlos Platero
Por tanto, para explorar las caractersticas intrnsecas en datos n-dimensionales se propone utilizar U-Matriz, con el siguiente mtodo:
Figura 5.14 Cluster del hexaedro
Figura 5.15 Cluster del tetraedro
1. Construir el mapa auto organizado de dos dimensiones 2. Calcular la U-Matriz como se ha comentado anteriormente. 3. Interpretar la matriz como sigue: Puntos en n prximos entre s que formen un grupo, mantendrn posiciones valles en la presentacin de la SOM con el relieve otorgado por la matriz. En caso de disimilaridad los vectores se situaran en zona de colinas, mostrando de esta forma la falta de consistencia en la formacin de un grupo homogneo.
5.3
Refinamiento de la tcnica de clustering

El refinamiento de clusters puede ser conseguido si adems se desea parametrizar el espacio. El objetivo de modelar el espacio es un paso previo para disear clasificadores paramtricos, es decir, la capa de clasificacin puede ser utilizada como realimentacin a la fase de anlisis de los datos. Al introducir la condicin de normalidad en el tipo de distribucin de los clusters, sta podra fijar definitivamente la separacin/agrupacin de los datos, y por lo tanto, tambin ser posible disear clasificadores paramtricos. La tcnica que sustenta este proceder, va a ser expuesta en las prximas secciones y captulos; sus soportes estn en el test de normalidad, las transformaciones Box-Cox y la distancia de Bhattacharyya. Ya ha habido varios estudios que han puesto sus esfuerzos en el uso de los mapas auto organizados de Kohonen [Mart95][Varfi92], como tcnica de anlisis de los datos. En los apartados anteriores se expuso que, los mapas auto organizados tienden a un supuesto orden topolgico, tal que combinan la interaccin de las neuronas vecinas con la aproximacin a reflejar la funcin de densidad de la variable de entrada. Las proyecciones de n sobre una menor dimensin (p.ej. 2) permiten fcilmente definir las posibles
166
DISAM-UPMT-98-015
Carlos Platero
regiones existentes entre los datos, as a cualquier grupo en n le corresponde una regin sobre el mapa. No obstante, el uso de los mapas de Kohonen como tcnica de anlisis es incompleta, al desaparecer la distancia eucldea entre los datos. Ultsh et al [Ultsh90] proponen utilizar un mtodo complementario al algoritmo del SOM, que es el clculo de la llamada U-Matriz. ste permite obtener un mapa superpuesto al SOM que remarque ms la distancia en el espacio de medidas. No obstante, en las observaciones experimentales, los resultados no fueron los esperados, al no encontrar de forma ntida y clara las fronteras entre cluster. En los prrafos anteriores, han sido comentadas las caractersticas de los mapas de Kohonen, y al hablar sobre la convergencia, se expona la idea de que los vectores de referencia se encaminan a representar la funcin de densidad de la variable de entrada, p(X). Llegndose a indicar por Kohonen, que los vectores de referencia tienden a ser los centroides de los conjuntos de Voronoi, esgrimindose la expresin:
Mi =
Ui
Xp X dX
Ui
p X dX
( 5.21 )
Si en esta expresin se expresa p(X), en relacin con las probabilidades condicionadas de los grupos dentro del conjunto de Voronoi, Ui, de la neurona i: pX =
pX
j =1
hj
p j
( 5.22 )
teniendo a hj como el nmero de grupos existente en Ui. La expresin resultante ser: M i p X dX =

Ui
Ui
X p X j p j dX
j =1
hj
( 5.23 )
desprendindose el significado de Mi, como elemento representativo del dominio que le corresponde, en otras palabras, la mejor aproximacin de p(X) en esta limitada regin. Luego es posible buscar cual es la funcin de densidad condicionada que refleje a p(X). Si se hace minimizar la expresin siguiente:
min
Ui
Mi X
p X
j =1
mj
p j dX
( 5.24 )
DISAM-UPMT-98-015
167
Carlos Platero
el planteamiento supone tener un conocimiento del nmero de clases distintas que caen dentro del entorno Ui, y del tipo de funcin a utilizar con sus correspondientes parmetros. En definitiva, la problemtica se cierne sobre el nmero de clusters que tiene el clasificador y la naturaleza de las funciones de densidad. Segn lo apuntado hasta ahora, si se hace aproximar p(X) en cada conjunto de Voronoi, el nmero de clusters queda definido, tantos grupos como neuronas contenga el mapa. En cuanto a las funciones condicionadas, hay que observar, cmo las neuronas errneas, es decir aquellas activadas con muestras de dos o ms grupos, son sus conjuntos Ui remansos de funciones de densidad. Este motivo sugiere utilizar una tcnica de slo etiquetar aquellas neuronas que, sean ganadoras de un nico tipo de patrn. Si se acepta tal precepto la expresin quedar como: min
Ui
M i X p X j dX
( 5.25 )
siendo j la nica clase que cae dentro de Ui. Por ltimo, quedar conocer cual es la parametrizacin ptima a considerar y en funcin de sta el nmero de parmetros a determinar, quedando reflejado en: min
Ui
M i X p X j 1 j 2
jr dX
( 5.26 )
el mtodo presentado lleva grandes dificultades prcticas, algunas de tipo tcnico, como es la integral extendida en el dominio Ui y otras en cuanto que las conclusiones extradas de exclusin de otras clases ( p(k) sean nulas para toda k distinto de j ), es en la mayora de las veces, inferidas a partir de un nmero de muestras insuficientes. La observacin emprica de los mapas, muestra como los patrones similares tienden a estar prximos entre s, caractersticas propias del SOM. De lo que se desprende que podran unirse en la formacin de un cluster, pero cmo se podra decidir la unin?. En principio, por aquellas neuronas que tengan la misma etiqueta, sean vecinas, y que adems sugieran alguna funcin de distribucin conocida. Luego se podra expresar el objetivo de determinacin del cluster y parametrizacin como: min M i X p X j 1 j 2
i = 1 Ui H
rn dX
( 5.27 )
donde H es el numero de entornos unidos en la formacin del cluster. sta es la expresin genrica de construccin de un cluster parametrizado. Sin embargo, tiene las dificultades de no ser conocido el nmero de neuronas que integrarn el cluster, H, ni se conoce que tipo de funcin de densidad siguen. Por lo que se plantea un proceso iterativo de localizacin del cluster mediante la siguiente tcnica: primero, etiquetar nicamente las neuronas bajo las hiptesis de trabajo marcadas, a decir, aquellas que se activen mediante un nico tipo de patrn, a diferencia del mtodo de votacin usado por Kohonen. Segundo, iniciar un diseo de los clusters basados en las U-Matriz y en el aspecto descriptivo de los
168
DISAM-UPMT-98-015
Carlos Platero
patrones, y tercero, se pasar al refinamiento de los cluster mediante la aproximacin a alguna funcin de densidad conocida, proponindose la normalidad en cada cluster por las razones que se van a ver a rengln seguido. Paso previo a la normalidad es la desaparicin de las componentes discretas en la nueva fase. La actuacin viene avalada por motivos diversos. Primero, al introducir estas variables en el test de normalidad, no pasarn la prueba al mantener el mismo valor dentro del cluster. Segundo, el modelaje del espacio se va a realizar sobre variables continuas. En un primer paso de la tesis, la informacin de las componentes discretas no va a ser considerada en esta nueva fase de diseo, en la hiptesis de que es posible construir clasificadores paramtricos con variables continuas que cumplan con los requisitos de error mnimo deseado. No obstante, existe la posibilidad de que en un grado ms de introduccin de conocimiento a priori, se diseen clasificadores hbridos de variables continuas y discretas. Si esta posibilidad no es introducida en este momento, es porque como tal implica una accin de razonamiento humano y por ende no hay posibilidad de implementacin como algoritmo de computador. En este proceder hay tambin implcita una seleccin de las caractersticas. Ya que la eliminacin de componentes implicar la bsqueda de un subespacio del cluster que siga una determinada ley de distribucin. A continuacin se presenta el refinamiento del cluster mediante la bsqueda de subespacios normales. 5.3.1 Distribuciones multinormales Se considera una de la ms importante de las distribuciones multivariantes. Es una generalizacin n-dimensional de la normal univariante. En general, se asimilan a esta distribucin conjuntos de variables tales como bateras de tests psicolgicos, medidas biomtricas, variables socioeconmicas, etc. En Reconocimiento de Formas, es una de las distribuciones ms utilizadas. Las causas son mltiples, algunas razones a destacar son, la aplicacin del teorema de valor central, tal como se vio en la deteccin de defectos, la facilidad del diseo de clasificadores, la aplicacin de la distancia de Bhattacharrya como lmite superior del error de Bayes, las sencillas expresiones del sesgo y la varianza para distribuciones normales, etc. Se dice que las variables aleatorias x1,....,xn siguen una distribucin normal, si existen n variables independientes y1,...,yn ,con distribucin N(0,1), verificndose : xi = mi + ai1 y1 + + ain yn i =1 n ( 5.28 )
donde m1,..., mn son constantes y A = (aij) es una matriz n x n no singular. Indicando X= (x1,....,xn)T, Y= (y1,....,yn)T y M= (m1,....,mn)T, ( 5.28 ) se expresa tambin en la forma :
DISAM-UPMT-98-015
169
Carlos Platero
X = AY + M
( 5.29 )
Se designar la distribucin normal multivariante por N(M,). Es una distribucin que depende solamente de los n parmetros de M y de los n(n+1)/2 de la matriz de covarianza . 5.3.1.1 Propiedades de la normal multivariante 1. M es el vector de medias y es la matriz de covarianzas. En efecto, al ser E{yi} = 0 se deduce E{xi} = mi ; adems, como E{yiyj} = 0, E{yi2} = 1, se tiene que : ci , j = E ( xi mi ) x j m j
)} = E a
h
ih
yh a jk yk = k ( 5.30 )
n E aih a jk yh yk = aih a jh h ,k h =1 relacin que equivale al producto matricial = AAT La funcin de densidad conjunta de x1,..., xn es f ( x1 ,..., x n ) = 1 1 exp ( X M ) T 1 ( X M ) 2
( 5.31 )
(2 )
n/2
1/ 2
( 5.32 )
siendo X = (x1,..., xn)T. Indicando tambin Y= (y1,..., yn)T, como las variables independientes y1,..., yn, su funcin de densidad conjunta es: f ( y1 ,..., y n ) = 1 1 exp Y T Y n/2 (2 ) 2
( 5.33 )
la transformacin que pasa de Y a X es lineal, vindose que el jacobiano de la transformacin inversa es J=A-1, cuyo determinante es J = 1 Y T Y = ( A 1 ( X M )) ( A 1 ( X M )) = ( X M ) 1 ( X M )
T T 1/ 2
. Entonces ( 5.34 )
170
DISAM-UPMT-98-015
Carlos Platero
2) La distribucin de toda variable marginal xi es normal univariante 3) La distribucin marginal tambin es normal univariante 4) Si X es N(M,) y B es una matriz p x n y V es un vector 1 x n, entonces Z = BX + V es normal N(BM + V, BBT) Al aplicar la transformacin a X = AY + M, quedar Z = BM + V + BAY, siendo la matriz de covarianzas Z = BAATBT=BBT 5) Cualquier subconjunto formado por m variables (m < n) de X sigue tambin la distribucin normal multivariante. 6) Incorrelacin implica independencia estadstica, es decir, si es una matriz diagonal, las variables x1,..., xn son estadsticamente independientes. En efecto, sustituyendo en ( 5.32 ), se obtiene que la densidad conjunta es igual al producto de las marginales 7) Si las variables x1,..., xn son N(M,2In), y por lo tanto independientes, y Z = TX es una transformacin lineal definida por una matriz ortogonal, entonces las variables z1,..., zn son tambin independientes. Al utilizar la propiedad 5), la nueva matriz Z = T 2In TT = 2In 8) Si X es N(M, ) entonces la distancia de Mahalanobis, (X-M)T -1(X-M), sigue una n2. Al realizar una transformacin Z = -1/2(X-M), por la propiedad 5), Z es N(0,I), luego
2 Z T Z = z12 +...+ z n
( 5.35 )
es la distribucin de la suma de cuadrados de n variables N(0,1) independientes, es decir, definicin de una n2. Para la distribucin normal multivariante, la independencia estadstica queda caracterizada por la incorrelacin y la regresin es siempre de tipo lineal. En consecuencia esta distribucin se adapta muy bien a determinados mtodos de Anlisis multivariante, que expresan relaciones de dependencia segn modelos lineales. La normalidad univariante de cada una de las variables xi, no es condicin suficiente de normalidad multivariante. Se pueden construir diferentes familias de distribucin multivariante no normales, cuyas marginales sin embargo lo sean. Existen diferentes pruebas para comprobar si una muestra aleatoria simple, de tamao N, se ajusta a una distribucin normal multivariante. Se pueden citar mtodos basados en la comparacin de la distancia de Mahalanobis respecto a una 2 de carcter grfico, distribuciones , test de Box Cox, o normalidad de marginales. No obstante, de los
DISAM-UPMT-98-015
171
Carlos Platero
mtodos mencionados, se ha utilizado la verificacin de normalidad proyectando las muestras en componentes principales, por ser un test fcilmente implementable en algoritmo de computador. Por lo que procede estudiar la posibilidad de parametrizar las funciones de densidad de los clusters mediante funciones normales. Con este objetivo se va a desarrollar una metodologa de bsqueda de la normalidad mediante el test oportuno o en caso de no cumplir el criterio, buscar la transformacin adecuada para convertir la poblacin en normal. 5.3.1.2 Test de normalidad El test de multinormalidad consistira en comprobar la normalidad de cada variable xi, aplicando algn test existente ( rectas de Henry, pruebas 2, test de Kolmogorov, etc. ). Sin embargo, esta condicin es necesaria pero no suficiente. Aunque, en el caso de tener una sola de las variables que se desva de la normalidad, implicar la falta de validez de la hiptesis de partida. sta herramienta ser posteriormente utilizada para la exploracin de los posibles espacios normales. Si se efecta la proyeccin de la poblacin sobre componentes principales, y seguidamente se aplica un anlisis de normalidad a cada una de ellas, la prueba de multinormalidad cumple con el requisito de ser necesaria y tambin suficiente. En efecto, la distribucin de x1, x2, ..., xn es normal multivariante si y solo si es normal univariante la distribucin de cada una de las n componentes. Es una consecuencia de la propia definicin de normal multivariante. Adems, es aconsejable tambin aplicar las desigualdades de Bonferroni[Cox78], esto es, si H1, H2, ..., Hn, representan las afirmaciones hipotticas de "F1 es normal", "F2 es normal", etc, siendo F1, F2,.. las componentes principales, entonces se verifica que: P H1
H
1 P
i =1
( 5.36 )
siendo P( Hi ) la probabilidad de que la afirmacin "Fi es normal" sea rechazada cuando es cierta, y P(H1 ... Hn) es la probabilidad de que las n afirmaciones de normalidad sobre las componentes sean aceptadas cuando son ciertas, y exista por tanto, normalidad multivariante. Suponiendo que el nivel de significacin para el test de normalidad sobre cada componente sea /n, es decir, P( H i ) = / n (probabilidad de equivocarse al rechazar Fi como normal); la probabilidad de acertar al afirmar que la distribucin es normal multivariante ser:
172
DISAM-UPMT-98-015
Carlos Platero
P( H1 ... H n ) 1 n
( 5.37 )
y el nivel de significacin de esta prueba conjunta ser inferior a . Por ejemplo, si se desea comprobar la normalidad multivariante con un nivel de significacin de 0.05 y el espacio es de dimensin 5, se verificar la normalidad de cada componente (prueba de 2, tests de Kolmogorov o Shapiro, etc.) con un nivel de significacin de 0.01. No existe un contraste ptimo para probar la hiptesis de normalidad. La razn es que la eficacia de la prueba depende del tamao muestral, y de la verdadera distribucin de los datos. Desde un punto de vista poco riguroso, el contraste de Shaprio y Wilks es, en trminos generales, el ms conveniente en muestras pequeas ( N < 30 muestras ), mientras los contrastes 2 de Pearson y de Kolmogorov-Smirnov, son ms adecuados para muestras grandes. Para el caso de patrones de defectos en planchas de aluminio, ha sido utilizado como mtodo de contraste de normalidad el de Shapiro y Wilks. El motivo es el nmero de muestras en los clusters que era bajo, entre seis y la treintena de ejemplos. Este contraste mide el ajuste de la muestra al dibujarla en papel probabilstico normal a una recta. Se rechaza la normalidad cuando el ajuste es bajo, que corresponde a valores pequeos del estadstico. La justificacin del contraste se basa que cuando la muestra est ordenada x1 x2 x N ( 5.38 )
en la hiptesis de que estos valores provienen de una distribucin normal con media y varianza 2, los valores estandarizados x1 x2 xN
( 5.39 )
sern una muestra ordenada de una poblacin N(0, 1), cuyos valores estn tabulados. Sea Ci,N el valor esperado del trmino que ocupa el lugar i en una muestra de tamao N de una poblacin normal, es decir : x i E = Ci N entonces :
( 5.40 )
DISAM-UPMT-98-015
173
Carlos Platero
E x i = + Ci N
[ ]
( 5.41 )
Por tanto, el grfico de x(i) respecto a Ci,N ser, aproximadamente una recta cuya ordenada en el origen estimar y con pendiente . La expresin de los coeficientes de Ci,N es complicada, pero puede aproximarse por : i3 8 Ci N = 1 N + 1 4
( 5.42 )
La construccin del test de normalidad consiste en medir el ajuste de los puntos a una recta por el cuadrado del coeficiente de correlacin lineal: N x i Ci N r 2 = i =1 N N Ci2N i =1
2
( 5.43 )
Al tener los coeficientes simetra, el test resultante puede escribirse en la forma: 1 h A2 w= a x xj = N 2 j = 1 j n N j + 1 N 2
( 5.44 )
donde 2 es la varianza muestral, h es N/2 si N es par y (N-1)/2 si es impar y los coeficientes aj,N se obtienen con: Cj N
aj N =
C
j =1
jN
( 5.45 )
Shapiro y Wilks han tabulado los valores exactos de aj,N sin utilizar la aproximacin de ( 5.42 ). Las pruebas experimentales fueron realizadas mediante la insercin de dichas tablas.
5.3.1.3 rbol de bsqueda de espacios normales Considerando las propiedades de normalidad de las poblaciones, se pas a la bsqueda de esta propiedad. El refinamiento de clustering viene dado al imponer la condicin de distribucin normal. Una vez eliminadas las variables discretas se pasa a
174
DISAM-UPMT-98-015
Carlos Platero
localizar los subespacios normales. El mtodo de actuacin consiste en la generacin de un rbol de bsqueda de los posible espacios normales en cada cluster. n Aunque la bsqueda de espacios normales pudiera parecer explosiva, por ser m combinaciones con m = 1,..., n, al aplicar la condicin necesaria, de que cualquier subconjunto debe ser tambin normal, limitar las posibilidades de exploracin. Para el examen de los posibles espacios, se va a generar un rbol que indique los espacios normales. La construccin del rbol se hace atendiendo a los siguientes criterios: 1. Del nodo raz colgarn todas las componentes que cumplan normalidad, enumerndose de izquierda a derecha, de 1 hasta m1. La notacin mi indica el nmero mximo de nodos en la capa i. 2. Los nodos que no pasen el test de normalidad no tendrn descendencia. El subespacio estar formado por las componentes que van desde la raz hasta el nodo antes de no tener descendencia. 3. Los descendientes de cada nodo estarn constituidos por componentes situadas a la derecha segn enumeracin. Por ejemplo, si el nodo corresponde a la componente etiquetada 3 y hay 6 componentes, tendr como descendientes, 4, 5 y 6. 4. La mxima profundidad del rbol indicar la mayor dimensin del subespacio normal del cluster Para la implementacin del rbol se ha utilizado el siguiente algoritmo:
I. Inicializacin : A. Construccin de un vector gua formado por las caractersticas del espacio, V B. Inicializar V = [ 0 ], luego dimensin 1, dim(V) = 1. C. Definir la dimensin mxima del espacio, n Mientras dim(V) sea distinta de cero A. Incrementar en uno V(1) B. Test de normalidad en las dos poblaciones, C. Si el min(1, 2) > c hacer II.D en caso contrario saltar a II.E D. Aumentar la dimensin del vector V con dicha componente V(1), 0 E. V=[ V(1) V ] F. Si la dimensin de V es igual a n, eliminar la primera componente de V 3 4 5 G. Saltar a II
5 5
II.
5 3
Figura 5.16 bsqueda
rbol
de
El procedimiento genera un rbol de los posibles espacios normales. La figura 5.16 muestra un grfico de como queda la exploracin con una dimensin n = 5, las aspas indican que no ha pasado el test de normalidad. Los posibles recorridos del rbol desde la raz hasta cada nivel, determinarn las posibles soluciones del espacio. Una buena medida para ahorrar tiempo computacional
DISAM-UPMT-98-015
175
Carlos Platero
es ordenar las caractersticas de menor a mayor ndice de normalidad, llamando 1 a la caracterstica de menor normalidad y n la de mayor ndice marginal de normalidad. Otra posibilidad sera realizar transformaciones no lineales capaces de buscar subespacios normales, con tal motivo se pasa a su estudio. 5.3.2 Transformaciones normalizantes Se sabe que slo una transformacin lineal de las variables X con distribucin normal multivariante da lugar a otra distribucin del mismo tipo. Sea entonces una familia de transformaciones X = x1 xn X
= x11
xnn
( 5.46 )
y supngase que para alguna transformacin particular 0 las variables transformadas siguen la distribucin normal multivariante. Luego X es normal multivariante si y slo si 0 es lineal. Pudiendo construir una prueba de normalidad planteando el contraste H0 = 0 (lineal)
Rechazar H0 quiere decir que existe una transformacin no lineal tal que X() es normal multivariante y por tanto significa rechazar la normalidad de X. Si X es un vector aleatorio que no sigue una distribucin normal, existe una potente familia de transformaciones no lineales estudiada por Andrews et al[Andre71], capaz de normalizar los datos observados, siendo una generalizacin de las transformaciones univariantes Box Cox[Box64]. Cada transformacin viene definida por el vector de parmetros, = (1, , n)T, de la siguiente forma x jk + m K 1 = k x jk + m para k 0 para k = 0 ( 5.47 )
x jk k
con j = 1,, N y k = 1,, n, siendo N el nmero de muestras, n la dimensin del espacio y m se elige de forma que para cualquier x + m sea siempre positivo. Por lo tanto, m ser cero si se trabaja con datos positivos e igual en valor absoluto al valor ms negativo observado. Suponiendo m=0 y en el caso unidimensional, es fcil ver que el logaritmo es la transformacin lmite cuando tiende a cero. Escribiendo x como elnx,
176
DISAM-UPMT-98-015
Carlos Platero
x =
( 5.48 )
cuando tiende a cero la transformacin anterior queda indeterminada. Utilizando la regla de LHpital y derivando numerador y denominador : lim x ( ) = lim
0
e ln x ln x = ln x 0 1
( 5.49 )
esta familia incluye transformaciones logartmica, lineal, raz cuadrada y la inversa. Cuando > 1, la transformacin produce una mayor separacin o dispersin de los grandes valores de x, tanto ms acusada cuanto mayor sea el valor de , mientras que < 1 el efecto contrario : los valores de x grandes tienden a concentrarse y los valores pequeos a dispersarse. Si es la unidad, habr transformacin lineal, es decir, la muestra sigue normalidad. 5.3.3
()
La estimacin de MV de las transformaciones Box Cox La relacin entre el modelo para los datos originales X y para los transformados ser : f X = f X
J X
( 5.50 )
siendo J(X) el determinante jacobiano de la transformacin inversa X() X, que es J X =
J
k =1
=
k =1 j =1
dx jk k
dx jk
=
k =1
x
j =1
k 1
jk
( 5.51 )
Suponiendo que X() sigue una N(,) para un determinado . La funcin de densidad de las variables originales ser : f X = 1
2
n 2
1 X j M 2
1 X j J X
( 5.52 )
Por tanto, la verosimilitud de la muestra es una funcin del vector de medias , la matriz de covarianza y el vector
DISAM-UPMT-98-015
177
Carlos Platero
LM =
j =1
1 2
n 2
1 T 1 X j X j J X 2
( 5.53 )
el logaritmo de la verosimilitud es (salvo una constante) N L = 2 1 N traza 1 X j X j 2 j =1
}+
J X
( 5.54 )
indica la regin de los n+n(n+1)/2 +n parmetros de , y . Para unos parmetros fijados 1, ,n, la estimacin mximo-verosmil de y es M
= x1 1
x n n con
xk k =
1 N
x
j =1 T
k jk
( 5.55 )
1 = N
i =1
Xi M Xi M
( 5.56 )
Al sustituir estos valores en la verosimilitud se obtendr lo que se denomina la funcin de verosimilitud concentrada en . Su expresin es, prescindiendo de constantes L = max L =
MC
N 2
J x
( 5.57 )
Esta funcin slo depende de y los datos originales X. El siguiente paso consiste en hallar el mximo de L() mediante algn algoritmo numrico. Definiendo X() como la matriz de N x n de datos transformados L = N 2 X
T
I n 1N 1N T
N X
J x
( 5.58 )
considerando para cada columna k de la base de datos X(), el vector de variables 1 zij k = xijk J k N normalizadas Zk k = zij k LEMA 1: Siendo Z = Z11 Z22 Zn n una matriz de N x n variables normalizadas. La funcin de mxima verosimilitud para es :
178
DISAM-UPMT-98-015
Carlos Platero
Lmax = Demostracin :
N 2
Z T I n 1n1n T D =
N Z
1 ( J 1 N 1 Jn N )
( 5.59 ) as que
Definiendo
diag
2 N 2 J N X = N 2 D 2 . Desprendindose que las variables normalizadas se pueden poner como Z()= X()D-1,
L =
N 2
D 1 D T I N 1N 1N T
N X
D 1 D +
J x
( 5.60 )
Para propsitos computacionales, la expresin ( 5.60 ) muestra que el estimador de mxima verosimilitud consiste en minimizar en el determinante : Z T I N 1N 1T Z N ( 5.61 )
En principio, la minizacin de ( 5.61 ) puede ser realizada mediante la apropiada subrutina numrica. Sin embargo, es comn encontrar problemas en el determinante del jacobiano, J(X), particularmente cuando N es grande. Considerando el lema anterior se deduce la propiedad de invariante de ante escalamientos, recurso que es utilizado para salvar el mencionado problema. 5.3.4 Cambios de escala de la poblacin Teorema : Siendo S = diag (s1,...., sn) donde sj > 0, para j = 1,..., n, y considerando el cambio de escala X = XS 1 . Escribiendo, en la anterior notacin, la correspondiente matriz normalizada a Z = Z 1 Z n . El resultado es: Z
T
I N 1N 1T Z N
= S 2 Z T I N 1N 1T Z N
( 5.62 )
Demostracin:
q j = s1 J j1 j n
Escribiendo X = x1
xn tal
que
xj = xj
j 1
ij
sj ,
llamando
x j s j j , para j = 1,...,n, adems J j x j =

j
x
i =1
= sn 1 j J j x j . Por lo j
que no es difcil llegar a demostrar que zij con:
= J
1 n j
x j xij j = s 1zij j + q j . Concluyendo j
DISAM-UPMT-98-015
179
Carlos Platero
Z = Z S 1 + 1n Q T
( 5.63 )
donde el vector Q = (q1,..., qn)T. La expresin ( 5.62 ) se obtiene de ( 5.63 ), observando que (IN-1n1nT/N) = 0. Como consecuencia de ( 5.62 ), el determinante de no es afectado por el escalamiento de la matriz de datos, por una coleccin de constantes {sj}. Por ejemplo en la prctica, es usual elegir el j-simo componente como s j = max xij , tal que en la nueva
1 i n
matriz X de datos, sus valores se encuentran entre 0 y 1.
5.3.5
Determinacin de Aunque algunos autores[McLac92] recomiendan evitar el problema de optimizacin de ( 5.61 ) mediante la estimacin marginal, M = jM , sin embargo, Velilla [Velil92] deja constancia de la posibilidad de obtener un ptimo estimador , a partir de las soluciones marginales. El mtodo propuesto por l es el siguiente: 1. Seleccionar el valor inicial a partir de los estimadores marginales, M . 2.Utilizar el mtodo numrico de Newton-Raphson, empezando con el valor inicial del punto anterior. El ptimo valor de se obtiene mediante la minimizacin de ( 5.61 ) t +1 = t L
1
( 5.64 )
En aplicaciones, la funcin -L() es tpicamente convexa y el algoritmo converge despus de pocas iteraciones. Las expresiones del vector del gradiente y la matriz Hessiana tambin se encuentran en [Velil92]. Haciendo uso de la nomenclatura de transposicin de vectores en una matriz, sea una matriz H= (H1,...,Hn), de tamao N x n, Hj(u) significa reemplazar en la columna j de H el vector columna u, adems, Hjk(u,v) es el reemplazamiento de las columnas j y k por los vectores columna u,v, respectivamente. Del trabajo de Velilla se deducen los coeficientes del gradiente y de la matiz Hessiana como:
L = n M r
Zr T (Wr r ) AZ
( 5.65 )
180
DISAM-UPMT-98-015
Carlos Platero
2L = n M 2 r 2L = n M r s
[Z
T r
(W ) AZ (W ) + Z
r
AZr (U r r
)]
)]
( 5.66 )
[Z
T rs
(W
Ws s ) AZ + Zr T (Wr r ) AZs (Ws s
( 5.67 )
Para todo r,s = 1 ,...,n la notacin empleada es A = (In - 1nT1n), M() = Z()TA Z(), Wj j = Z j j
j j j j
j y
2 j . Las expresiones para Wj y U j son dadas por U j = 2Z j Atkinson[Atkin89]. Similares expresiones han sido deducidas, considerando los vectores N x 1 de Wj j = w jk j y U j j = u jk j :
x k jk w jk =
x jk x jk k
x
1 Jk n
k jk
N xlk l =1
1 N
( 5.68 )
2 x jk k x k jk
x jk
x +
k jk
x jk
k jk
= w jk
2 k
N + xlk l =1 k
1 N
(x
k jk
x k jk
x jk
1 Jk n
N xlk l =1
1 N
( 5.69 )
5.3.6
Intervalos de confianza y prueba de normalidad Este procedimiento proporciona adems intervalos de confianza para el valor de y un test de normalidad. En efecto, la distribucin del logaritmo del ratio de verosimilitudes es asintticamente una 2 con n grados de libertad. Al estar prximo el estimador de su verdadero valor , sus verosimilitudes sern puntos anlogos. Desarrollando en serie L() alrededor de 1 L L + L + TH 2
( 5.70 )
DISAM-UPMT-98-015
181
Carlos Platero
donde L() representa el vector de las primeras derivadas, y H() es la matriz hessiana de segundas derivadas, ambas evaluadas en el punto = ; como, por definicin, las primeras derivadas son nulas en el mximo, y la matriz hessiana es, en ese punto, definida negativa. El contraste de razn de verosimilitudes, es : 2 L L T H ( 5.71 )
que es la distancia de Mahalanobis entre y . En efecto, si es cierto que estn prximas, asintticamente es centrado, con media en el verdadero valor y matriz de varianzas y covarianzas (-H( ))-1, teniendo adems una distribucin normal. Como sea cierta la hiptesis, el contraste sigue una 2 con n grados de libertad. Fijando un nivel de confianza , se puede construir un intervalo de confianza para el valor de la funcin de verosimilitud en el verdadero valor de . Sea 2() el valor de la distribucin 2 con n grados de libertad que deja la probabilidad a la izquierda, entonces: 1 L L n2 2
( 5.72 )
que implica: 1 L L n2 2
( 5.73 )
^ L()
L()
cortando la funcin L() con la ordenada 1 L n2 se obtendrn dos valores para el 2 parmetro que definirn un intervalo de confianza para . Si el valor de est incluido en dicho intervalo, se aceptar la hiptesis de normalidad con un nivel de significacin , mientras que se rechazar la normalidad en otro caso. Este contraste es muy potente para detectar asimetra, pero poco eficaz para el apuntamiento[Pea87].
Figura 5.17 Estimacin grfica de y de un intervalo de confianza
182
DISAM-UPMT-98-015
Carlos Platero
5.4
Agrupacin de datos en los defectos de planchas de aluminio

Para ilustrar la forma de abordar este tipo de tareas, se utiliza el estudio de la clasificacin de defectos en planchas de aluminio mediante colada continua. Conviene tener presente que la metodologa que aqu se desarrolla, en principio, podra ser aplicable a problemas de muy diferentes campos, con el Reconocimiento de formas como denominador comn. Partiendo de las imgenes segmentadas, conseguidas mediante el sistema de deteccin de defectos locales, se tiene la intencin de clasificar los defectos en cinco u ocho clases, segn se puede ver en la Tabla 5.2. Las imperfecciones obtenidas en el proceso de obtencin del aluminio, quedan reflejadas en su apariencia, de esta manera es posible manejar el tipo de problema que se ha producido en la planta, mediante la inspeccin visual de la superficie. Las diferencias a cinco u ocho consisten en una subclasificacin de tres defectos principales. A ocho tipos, adems de los cinco anteriores, se distinguirn faltas de material pequeas o grandes, lneas calientes o araazos y bandas transversales claras o pegados. El captulo 7 muestra las formas visuales de los diferentes tipos de alteraciones producidas en las planchas.
Tabla 5.2 Defectos del aluminio colado

Nombre del defecto Apariencia Causa
Carencia de material (La) (Lg)
Faltas de material en secciones de la lmina
Insuficiente suministro de nivel de caja
Cristalizacin anormal (Cr)
Presentacin de bandas opacas longitudinales en la superficie
Exceso de grafito
Adhesiones (St)
Bandas transversales oscuras y distorsiones en la lmina
Insuficiente lubricacin
Bandas brillantes(Br)
Presencia de bandas transversales brillantes
Presencia de burbujas
Lneas calientes (Lo) (Ar)
En una primera etapa bandas oscuras y longitudinales, y luego superficie con agarrones
Incremento de temperatura
Desconches en el fundido (Tr)
Reconocible por la presencia de bandas transversales oscuras
Atascamiento de tolva
DISAM-UPMT-98-015
183
Carlos Platero
5.4.1
Extraccin del vector de caractersticas La metodologa a partir de la deteccin de los defectos, consiste primeramente en el estudio de las caractersticas obtenidas de la etapa de extraccin, en segundo lugar es preciso realizar una seleccin de las mejores caractersticas tomando la informacin ms relevante. Para una mayor interpretacin de la estructura de los patrones se le someter a anlisis de los datos, con el fin de conocer las posibles subclases subyacentes en la muestra controlada. Estos grupos servirn para el diseo de los futuros clasificadores. Para la primera etapa se hace uso de tcnicas de anlisis sintctico[Fu88][Fu82] para la representacin del defecto y se extrae el mayor nmero posible de atributos de los objetos, caractersticas de la forma de los lmites y de las regiones con tcnicas de transformacin escalar, atendiendo a la clasificacin de Pavlidis[Venon91]. Las diferentes fases de decantacin de las primitivas provocaron la seleccin de los descriptores de los objetos. El conocimiento de direcciones privilegiadas de los defectos en bandas transversales, horizontales o en manchas, hizo sugerir la utilizacin de algoritmos de continuidad de la masa defectuosa, obtenindose la transformacin de objetos a elementos terminales comunes a todas las gramticas. Y asociados con los elementos terminales se pasan atributos de mayor nivel de abstraccin que en la anterior etapa. Estos elementos terminales sern las fuentes de informacin para los siguientes mdulos. 5.4.1.1 Mtodo de obtencin de las elementos terminales Una vez detectado el defecto, segmentado y etiquetado. La tarjeta de visin pasar los descriptores de los objetos que servirn de vector de entrada al algoritmo de agrupacin. Posteriormente se hace una ordenacin por reas de los objetos en cada regin de imagen de inters, pasando seguidamente a caracterizar cada objeto por su forma (puntos, manchas, cuerpos longitudinales y cuerpos transversales) y por su compacidad. Seguidamente se asocian objetos a un elemento terminal a partir de los objetos ms significativos (semillas), utilizando principios de continuidad y proximidad. Ultimando la operacin con el etiquetado y paso de caractersticas de medio nivel de los elementos terminales. La tonalidad del defecto supone etiquetamientos separados, de un lado defectos con apariencias claras y posteriormente defectos tipos oscuros.
Figura 5.18 Asociacin de objetos a un elemento terminal
184
DISAM-UPMT-98-015
Carlos Platero
Por cada defecto se tendr un rbol de informacin, en el que cada nodo de este rbol, estarn presentes los elementos terminales y la informacin de medio nivel, de cada una de las regiones de imagen de inters implicados en el defecto. La figura 5.19 muestra la forma de actuar con dos tipos de defectos. Llegado a este punto se tendr una coleccin de elementos terminales dispuesta a ser analizada por los clasificadores basados en reglas de concatenacin, pero tambin es requerido un vector de caractersticas para los clasificadores basados en datos. Se necesita aplicar una transformacin desde la agrupacin secuencial de elementos terminales a un vector de caractersticas con dimensin n. Si la representacin de los objetos mediante elementos terminales es posible y fiable, para el caso aqu tratado as lo muestran las representaciones virtuales y los Figura 5.19 Ejemplos de resultados de los clasificadores sintcticos, stas se pueden descripcin de defectos mediante convertir en fuentes de entrada para clasificadores basados elementos terminales en un vector de caractersticas. Luego, la idea es condensar la informacin de elementos terminales en un vector. Para tal fin, se puede hacer uso de las reas asociadas a cada tipo de elementos terminales, momentos de inercia, suma de permetros de los elementos terminales y otras posibles caractersticas que pudieran integrar el vector de caractersticas. Este mtodo ofrece mltiples ventajas. Primero si hay fiabilidad de la representacin de los objetos mediante elementos terminales, la informacin generada es infinitamente menor y por ende el vector de caractersticas tiene una dimensin muy reducida. Segundo, la calidad del vector de caractersticas viene determinado por la calidad de informacin de los elementos terminales. La informacin de los elementos terminales es de un nivel muy superior a los descriptores clsicos pues tiene informacin de la estructura del defecto (si es alargado, tiene bandas, su situacin espacial,...). Tercero, el vector de caractersticas se forma una vez que se tiene detectado la totalidad del defecto. No hay un vector de caractersticas por cada imagen obtenida sino por la globalidad de imgenes que constituyen el defecto. Cuarto, las caractersticas son muy homogneas si se utilizan criterios comunes en la seleccin de stas. Por ejemplo, la suma de las reas de cada uno de los elementos terminales existentes. Quinto, la dimensin del vector de caractersticas es muy pequea, ya que la informacin contenida en cada uno de los elementos, es una informacin cualitativa y no
DISAM-UPMT-98-015
185
Carlos Platero
cuantitativa. La conclusin es inmediata, los clasificadores basados en vectores sern muy rpidos y permitirn el uso de varios clasificadores complementarios en lnea. El siguiente problema es construir el vector de caractersticas tal que ayudar al correcto diseo de los clasificadores basados en datos. 5.4.1.2 Transformacin de elementos terminales a vector de caractersticas La transformacin de la informacin de elementos terminales a vector de caracterstica est formada por dos grupos de caractersticas, datos generales que hacen referencias a las magnitudes de los defecto, y datos de la estructura interna, indicando los porcentajes de las diferentes topologas que conforman el defecto total. -Datos generales: Se especificar el ancho y largo de la totalidad del defecto, mediante radios de giro para evitar la influencia de errores producidos por la segmentacin. Tambin se aaden las coordenadas de sus centros de gravedad, junto con los momentos de inercia del defecto total respecto de rectas horizontal y vertical que pasan por el centro de masas. Estos cinco datos se calculan por separado para la parte del defecto que tenga tonalidad oscura y para la que es clara, teniendo as los primeros 10 datos de entrada al vector. -Datos de estructura interna: Estos datos darn la informacin de cmo se estructura el defecto en sus diferentes elementos terminales. Se da por tanto la suma de las masas de cada una de las ocho diferentes clases de elementos terminales que componen el defecto. Un estudio cuidadoso del vector de las caractersticas fue realizado mediante tcnicas de Anlisis multivariante. Hay dos tendencias tradicionales, la eliminacin de las componentes que menos contribuyan a la explicacin de la varianza y el segundo mtodo tratar de estimar nuevas caractersticas, menores en nmero, que siendo factores comunes a las anteriores, recojan la discriminacin intrnseca de las clases[Escud77]. Esta ltima tcnica ser desarrollada en el prximo captulo. En un primer bosquejo del estudio del vector, se aplican las tcnicas de Anlisis discriminante desde una concepcin global, es decir, observar el carcter discriminante en el espacio de entrada del problema. Las componentes principales permitirn conocer el grado de explicacin acumulativa de cada componente. De otro lado, para que las componentes representen adecuadamente tamao y forma, deben cumplirse las condiciones de Rao[Rao71], esto es, todos los coeficientes de la primera componente principal deben ser positivos, identificando tamaos, mientras los coeficientes de las siguientes componentes deben ser positivos y negativos, discriminando formas. Esta prueba fue superada por el vector construido. Adems se pueden utilizar mtodos de anlisis de la varianza, como manova, que permiten dar un ranking de las componentes del vector de entrada, bajo suposiciones de dependencia entre caractersticas y distribuciones multinormales. Llegado a este punto, donde se tiene construido el vector de caractersticas, se puede pasar al anlisis exploratorio de los datos.
186
DISAM-UPMT-98-015
Carlos Platero
5.4.2
Anlisis de los datos Para el primer anlisis se parte de los valores numricos de cada caracterstica estandarizada, con la idea de dar inicialmente la misma importancia a todas [Spieg88]. xij = xij x j
( 5.74 )
siendo x j y j la media y varianza de la componente j del conjunto de muestras, mientras xij e xij es el valor de la muestra i de la componente j y su reducida. El entrenamiento se hizo con enrejado hexagonal y funcin de vecindad gaussiana, al favorece la estabilizacin del proceso de aprendizaje [Som92]. Por otro lado, como los vectores de referencia Mi tienen que aproximarse a p(X), es deseable encontrar aquella forma de los lados del array cuyas dimensiones correspondan con las magnitudes principales de la distribucin del espacio de entrada, de lo que se desprende hacer una primera observacin visual de p(X), por ejemplo con mapas de Sammon, y determinar la relacin nx/ny3. Se definieron procesos de aprendizaje, partiendo con diferentes valores iniciales de los vectores de referencia, aplicando sucesiones de entrenamientos distintas y modificando parmetros de aprendizaje. Al final, la seleccin del mapa ms oportuno fue de aquel con menor error de cuantificacin. Posteriormente, se procedi a la fase de etiquetamientos de las neuronas del mapa. Kohonen propone un mtodo de votacin, por cada vector dato etiquetado se busca la correspondiente neurona activa. Las neuronas del mapa se etiquetan de acuerdo con la mayora de las etiquetas que golpean ( hitting ) una neurona particular del mapa. Las que no son golpeadas se dejan sin etiquetar (XX). El mtodo propuesto en la actuacin es ms restrictivo, al etiquetarse aquellas neuronas que en el conjunto total de muestras ( testeo + aprendizaje ) han sido validadas sin ninguna votacin en contra. Su origen reside en localizar la funcin de densidad del cluster (ver apartado 5.2). El resto se marcar con YY o XX si no hay suficientes patrones capaces de inferir el tipo de clase a la que pertenecen. Las neuronas YY muestran que ha habido votaciones confusas o lo que es lo mismo, existe influencia de varias clases en el conjunto de Voronoi de estas neuronas. La razn de etiquetarlas como confusas es evidente, como ha sido comentado, stas son remansos de funciones de distribucin de grupos vecinos. Los vectores de referencia son distribuidos estadsticamente segn el
Al utilizar los mapas de Sammon [SAMM69] para determinar la relacin nx/ny del caso que ocupa, resulto ser de 28/23 y se probaron las combinaciones 7x5, 7x6, 8x6 y 8x7. Finalmente se escogi la dimensin 8x6 por el menor error de cuantizacin
DISAM-UPMT-98-015
187
Carlos Platero
espacio de medidas, y si se parte de vectores bien definidos en sus componentes, el entrenamiento provocar una discretizacin del espacio de entrada en regiones de influencia. Cada regin estar dominada por un grupo homogneo de vectores. Y suceder que existen neuronas, cuyos conjuntos de Voronoi confluyan grupos distintos. El objetivo de marcarlas como defectuosas est claro, son justo estas neuronas a las que se debe prestar mayor atencin e intentar solventar el problema de discriminacin introduciendo mayor conocimiento a priori.
Tr Tr Lo Lo La La La La Tr La Lo Lo La La La St Tr Lo Lo Lo XX La La La Tr Tr Lo Lo La La La St Tr Tr XX Cr XX Cr XX St Tr Tr Lo Cr St Cr St St
Tr Tr YY Lo La La La La Tr YY Lo Lo La La La St Tr Lo Lo Lo XX La La La Tr YY Lo Lo La La La YY Tr Tr XX Cr XX Cr XX St Tr Tr Lo Cr YY Cr St St
Figura 5.21 Etiquetamiento segn Kohonen a cinco tipos
Figura 5.20 Etiquetamiento propuesto
Hay que destacar cmo la eleccin de variables discretas influye en el mapa, as se observa que de izquierdas a derechas hay una tendencia de defectos oscuros a claros. Y de arriba abajo, de defectos de menor a menor tamao. Posteriormente este efecto podr ser observado al terminar la fase de clustering. Si los vectores de referencia son etiquetados con la muestra a ocho tipos de defectos, los resultados son anlogos, obsrvese que la nica modificacin est en el etiquetado y no en el aprendizaje (no supervisado ). Lo nico que aporta, es que la clasificacin a ocho defectos es coherente con la muestra etiquetada a cinco. Las diferencias son observables en el cambio de alguna etiqueta perteneciente al mismo macrogrupo (las bandas longitudinales se dividen en araazos y bandas, ..., etc).
188
DISAM-UPMT-98-015
Carlos Platero
Tr Tr Tr Ar Ar La La La Tr La Lo Ar La La La Br Tr Ar Lo Lo XX La La La Tr Tr Ar Ar Lg Lg Lg St Tr Tr XX Cr XX Cr XX St Tr Tr Lo Cr St Cr St St
Tr Tr YY Ar Ar La La La Tr YY Lo Ar La La La Br Tr XX Lo Lo XX La La La Tr YY Ar Ar Lg Lg Lg YY Tr Tr XX Cr XX Cr XX St Tr Tr XX Cr YY Cr St St
Figura 5.22 Etiquetamiento segn Kohonen a ocho tipos
Figura 5.23 Etiquetamiento propuesto a ocho
Estos mapas de rasgos han servido para detectar diferentes zonas de influencias correspondientes a topologas de defectos similares. Desde el punto de vista del Reconocimiento de patrones, los mapas de Kohonen han permitido empezar a conocer la estructura inherente de los patrones. La cuestin siguiente a abordar es la delimitacin de las regiones o dominios en el espacio de entrada, que se correspondan con patrones similares, los cuales constituyan un grupo homogneo. Esta informacin no est de manera explcita en los mapas, se propone un proceso de decantacin de cluster basados en las U-Matriz de Utls et al combinadas con descripciones de los patrones y pruebas de normalidad.
dz11
dy12
dz13
dy11
dy12
dx21
du
dx23
dx21
du
dx22
dz31
dy32
dz33
dy31
dy32
Figura 5.25 U-Matriz entrenamiento rectangular
con
Figura 5.24 U-Matriz con entrenamiento hexagonal
5.4.3
Aplicacin de las U-Matriz al anlisis de los defectos del aluminio La primera dificultad planteada fue adaptar la filosofa de las U-Matriz a un enrejado de tipo hexagonal, utilizado en la exploracin de los datos. En las vecindades
DISAM-UPMT-98-015
189
Carlos Platero
rectangulares, los autores proponen un valor medio de las distancias eucldeas entre neuronas situadas en posiciones diagonales en forma de aspa (ver Figura 5.25), siendo sta la interpretacin geomtrica de dz, correspondiente a la influencia colateral del aprendizaje rectangular. Pero en el proceso de entrenamiento hexagonal, tales influencias no existen, las neuronas presentan una agrupacin ms homognea, sus relaciones con las vecinas son indistintas (ver prrafo sobre el estudio de la vecindad 5.1.1.7), no teniendo necesidad de considerar evaluaciones distintas en la distribucin espacial; justificando la modificacin en la obtencin de la U-Matriz, en cuanto que los elementos de la matriz estarn formadas por las distancias de la neurona aij a sus vecinas, sin consideraciones de valores promediados en las vecindades diagonales (Figura 5.24,Figura 5.25 ). El resultado de aplicar los conceptos de la U-Matriz modificada sobre el mapa auto organizado es mostrado en Figura 5.26. Una primera observacin muestra que los bordes de separacin no son ntidos, pero s empieza a sugerir una versin preliminar de mapa de rasgos. Es interesante apreciar cmo las neuronas etiquetadas como confusas, aparecen rodeadas de grupos, confirmando las suposiciones anteriores de servir estas neuronas, como remansos de las funciones de densidad de grupos prximos.
Figura 5.26 U-Matriz del mapa auto organizado de los defectos
Se distingue cmo en los defectos de mayor dimensin, en cuanto a la magnitud fsica del defecto, sus distancias entre neuronas vecinas aumenta, reflejando que los espacios de influencias de estas neuronas son ms grandes, indicando una mayor variabilidad de los patrones visuales que tienden a ser representados por estas neuronas. Pudiera pensarse en por qu no hay ms representantes de estas zonas, y si se ha de suponer que los mapas tienden a ser imgenes de la funcin de densidad del espacio de medida, tambin recibe el impacto de la probabilidad del tipo de defecto en aparecer en la plancha. Tal constatacin queda medianamente clara en las tablas, de las que puede
190
DISAM-UPMT-98-015
Carlos Platero
apreciarse las probabilidades del defecto y el tanto por ciento de vectores de referencia etiquetados como tal tipo ( efecto factor magnificacin ).
Denominacin del defecto Denominaci n del defecto Probabilida d del defecto Vect.Ref.Eti q/Vect.Total es Probabilidad del defecto Vect.Ref.Etiq/V ect.Totales
Tr
24
23
Tr
24
23
Lo
12
15
Lo
28
26
Ar
14
11
La
26
31
La
24
26
Cr
12
10
Lg
St
11
10
Cr
12
10
Tabla 5.3 Probabilidad aparicin a 5 defectos
de
Br
St
Tabla 5.4 Probabilidades de aparicin a 8 defectos
Otra observacin interesante es contemplar cmo los vectores de referencia etiquetos son distribuidos de izquierdas a derechas y de arriba a abajo, con defectos de oscuros a claros y de menor tamao a mayor, coincidiendo con las dos primeras componentes principales de tamao y forma del vector de caractersticas, que garantizaba las suposiciones de Rao. Vase que todas las variables del problema se distribuyen esencialmente siguiendo uno de los ejes del mapa, bien el OX, bien el OY, de modo que la categorizacin cuenta con dos dimensiones principales, referencindose tamao y forma. Es sta una clara manifestacin de la seleccin automtica de los rasgos que, como se ha explicado en este captulo, presentan las SOM. La dimensin relacionada con el eje OY es fundamentalmente de tamao, mientras que la relacionada con el eje OX es de forma (Figura 5.27).
DISAM-UPMT-98-015
191
Carlos Platero
Forma
Tamao
De Oscuro a Claro
Figura 5.27 Componentes principales del mapa La versin preliminar de los cluster es decantada por un lado de la U-Matriz, y al no haber un umbral que defina con absoluta objetividad los grupos, el asesoramiento para la definicin de stos, vendr dado por la descripcin de los patrones que cae en cada una de las neuronas. Luego el planteamiento es el siguiente: 1. Mapa SOM +U-Matriz 2. Descripcin de las formas de los patrones para cada neurona 3. Formacin del cluster como asociacin de espacios de Voronoi que estn prximos entre s (U-Matriz) y con descripciones de patrones similares. La Tabla 5.5 recoge como se ha definido la agrupacin; la observacin de las caractersticas de los patrones que caen en la influencia de las neuronas asociadas, puede ser contemplado en la tercera columna, mientras la cuarta muestra la menor y mayor distancia eucldea entre neuronas dentro del cluster y la quinta indica las distancias con las neuronas vecinas de otros grupos; evidenciando que el mtodo ayuda pero no es concluyente. Los resultados quedan reflejados en la figura 5.28.
192
DISAM-UPMT-98-015
Carlos Platero
Nmero del cluster
Nmero de neuronas
Descripcin
U-Min/U-Max
U-Min/U-Max
0,1,8
Conjunto de finas bandas transversales que ocupan entre 1/3 y 2/3 de la banda de una ROI
0.24/ 0.67
0.4/0.9
16,24,32,33,40
Bandas transversales oscuras de tamao medio y superior. Ocupa casi o totalmente una ROI
0.44/0.67
0.78/1.62
41
Machas oscuras grandes de decenas de miles de pxeles oscuros
-/-
0.95/2.18
4a,b
3,4,10,11,18,19
Pocos pixeles defectuosos en forma de bandas longitudinales, apariencia de araazos
0.25/0.84
0.62/1
26,27
Bandas longitudinales oscuras alrededor de unos centenares de pixeles oscuros
0.48/0.48
0.78/1.96
5,6,7,12,13,14,21 ,22,23
Falta de material pequea, centenares de pixeles defectuosos, claros y oscuros
0.39/1
0.68/1.9
28,29,30
Faltas de material de gran tamao
1.19/1.37
0.92/4.06
35,43
Bandas longitudinales oscuras de 2 a 4 ROIS, con alrededor de mil a diez mil pixeles oscuros defectuosos
1.32/1.32
0.85/1.53
37,45
Bandas con una ancha cabeza que disminuye longitudinalmente, de 3 a 5 ROIS, decenas de miles de pxeles oscuros
2.37/2.37
2.38/3.36
10
39,46,47
Pegados de rodillo, no menos de 4 ROIS y ms de 10.000 pxeles de error tanto oscuro como claros
1.65/3.19
2.33/3.36
11
15
Bandas transversales claras y grandes, cubren casi toda la banda ROI y con un grosor entre 1/5 y 1/3
-/-
0.83/0.96
Tabla 5.5 Descripcin de los defectos
En los tratados de anlisis de datos se busca la formacin de los cluster como adiciones de espacios de Voronoi correspondientes a neuronas prximas entre s y catalogadas como similares. Este mtodo de actuacin puede ser utilizado cuando se trabaja con mapas donde no hay conflictividades, es decir, mapas caracterizados por tener ms neuronas que patrones, como es el caso de Serrano et al [Serran93] que estudia la crisis bancaria espaola mediante SOM. Pero al utilizar un nmero mayor de patrones que neuronas, como es el caso aqu planteado, y al existir neuronas confusas, no se trata de definir si una neurona forma parte de un presunto cluster cuando sta ha tenido votaciones contradictorias, slo constituirn un grupo aquellas neuronas sin votaciones en contra, dejando sin agrupara las neuronas confusas.
DISAM-UPMT-98-015
193
Carlos Platero
Las neuronas ya han hecho su trabajo, dividir el espacio de caractersticas y agruparse razonablemente bien formando cluster, es el momento de introducir metodologa estadstica para refinar el cluster y realizar la seleccin de las caractersticas.
En el proceso de formacin de los mapas auto organizados, algunas de las variables utilizadas son ms cualitativas que cuantitativas, con el objetivo de favorecer la organizacin del mapa en regiones. As al introducir estas variables, los tipos de patrones que ocupan posiciones muy diferentes en el espacio de medida, tambin en sus proyecciones sobre el mapa de Kohonen observan ubicaciones alejadas (vase figura 5.28 y Tabla 5.5 sobre los defectos en el aluminio). En el caso de clasificacin de defectos visuales en el aluminio, al introducir caractersticas segn la tonalidad del defecto en el vector, implica que parte de las componentes de ste quedarn canceladas. Por ejemplo, existen algunos tipos de defectos con una nica tonalidad, bandas longitudinales, bandas transversales y manchas, todas ellas con apariencia oscura, mientras otras aparecen bandas brillantes con apariencia exclusivamente clara. Las proyecciones en el SOM de estos dos tipos se encuentran alejadas. Pero los clusters de la misma tonalidad estn prximos entre s y mantienen la misma informacin de las caractersticas asociadas a la otra tonalidad. Por consiguiente parte del vector de medidas quedar cancelado al no haber informacin, reducindose el espacio sensiblemente. Estas componentes desde el punto de vista de inferencia de funciones de densidad no aportan nada, al contrario tienden anular a la matriz de covarianza. No obstante, pudieran ser atrayentes, en algunos casos, bajo el prisma de obtencin de clasificadores hbridos de variables discretas y continuas. La eliminacin no puede conseguirse mediante medidas de dispersin basadas en desviaciones tpicas, al ser stas muy sensibles a observaciones atpicas. El uso de medidas de dispersin asociadas a la mediana, tienen la propiedad de ser robustas frente al ruido de las muestras. Para la valoracin de las componentes se toman las muestras que caen dentro del presunto cluster y se aplica la meda, al que se ha modificado ligeramente para una observacin rpida:
Figura 5.28 Grupos obtenidos despus de aplicar el mtodo Cluster: 1- Bandas transversales oscuras pequeas, 2Bandas transversales oscuras medianas, 3- Manchas oscuras, 4a,b- Araazos, 5bandas longitudinales oscuras, 6- Faltas de material grande, 7 - Faltas de material grande, 8- Cristalizacin anormal I 9Cristalizacin anormal II 10- Pegado de rodillos, 11- Bandas brillantes
5.4.4 Eliminacin de componentes sin informacin estadstica
194
DISAM-UPMT-98-015
Carlos Platero
u(mediana (| xij mediana ( xij )|)

i i
i = 1,2,... nk
( 5.75 )
siendo xij la muestra i del cluster k de la componente j y u( ) una funcin de tipo escaln. Cuando el resultado es uno, hace referencia a una componente no binaria, en caso contrario sta s lo ser. Los resultados coinciden con la geometra y tonalidad de los defectos, es decir, se anulan aquellas componentes que no tengan la tonalidad del defecto y las que difieran en su fisionoma. Obsrvese la tabla de abajo que muestra lo mencionado en este prrafo. Adems, se ha comprobado que los vectores de referencia corroboran las componentes discretas, al tener similares coeficientes en estas componentes.
Cluster 1 2 3 4a.b Nombre Tr1 Tr2 Tr3 Ln1 Componentes 1,2,3,4,5 y 13 1,2,3,4,5 y 13 1,2,3,4,5 y 15 1,2,3,4,5,11 y 17 Observaciones Banda transversal oscura de pequeo tamao Banda transversal oscura de mayor tamao Manchas oscuras Bandas longitudinales oscuras de pequeo tamao Bandas longitudinales oscuras de mayor tamao Defectos oscuros y claros en forma de mancha Defectos oscuros y claros en forma de mancha de mayor tamao Bandas de cristalizacin con tonalidad oscura Bandas de cristalizacin con faltas de material
Ln2
1,2,3,4,5,11 y 17
6 7
Lk1 Lk2
1,2,3,4,5,6,7,8,9,10,15 y 16 1,2,3,4,5,6,7,8,9,10,11, 14,15,16,17 1,2,3,4,5,11 y 17 1,2,3,4,5,6,7,8,9,10,11, 12,13,16,17,18 Todas las componentes 6,7,8,9,10 y 14
8 9
Cr1 Cr2
10 11
St2 St1
Bandas transversales claras y oscuras Bandas transversales claras
Tabla 5.6 Componentes seleccionadas tras la etapa de eliminacin de variables discretas
5.4.5
Bsqueda de espacio normales Una vez eliminadas las componentes, se buscan los subespacios normales haciendo uso del test de Shapiro y el algoritmo de exploracin, segn se vio en 5.3.1.3. Las pruebas realizadas sobre los grupos de defectos de aluminio se reflejan en la tabla de abajo
DISAM-UPMT-98-015
195
Carlos Platero
Cluster
= 0.2 3
= 0.15 3
= 0.1 3
12
4a,b
15
10
16
11
18
Tabla 5.7 Dimensin subespacios normales
de
los
En la tabla queda constancia de los distintos subespacios normales atendiendo al nivel de significacin, . Se observa que el cluster 4 tiene una nica componente que sigue normalidad, por lo que se procedi a subdividir el cluster tal que pudiera aumentar el subespacio, pasando al definitivo mapa de grupos (ver figura 5.29). No obstante, el diseo de los clasificadores paramtricos permitir localizar una seleccin de las caractersticas en funcin de las transformaciones normalizantes propuestas, esto es, Box Cox. Al requerir informacin sobre los clasificadores paramtricos, los resultados experimentales se posponen para el siguiente Figura 5.29 Mapa de grupos definitivo captulo.
196
DISAM-UPMT-98-015
Carlos Platero
5.5
Conclusiones
Se ha presentado una nueva metodologa de clustering paramtrico que empieza en este captulo con el anlisis de los datos y finaliza en el siguiente con la seleccin de las caractersticas y su parametrizacin. Su fundamento est en los mapas auto organizados, en la parametrizacin del espacio mediante funciones normales y en las transformaciones Box Cox. Se ha utilizado la clasificacin de los defectos locales en planchas de aluminio para el desarrollo experimental. Partiendo de una coleccin de muestras etiquetadas de defectos locales en planchas de aluminio, se procedi a segmentacin de los defectos y a una extraccin de caractersticas mediante tcnicas de anlisis sintctico. Posteriormente se pas a la conversin de la informacin desde primitivas a un vector de L-dimensin, habindose hecho la eleccin de las oportunas componentes. El etiquetamiento de los defectos fue realizado mediante la percepcin visual de stos y bajo las consideraciones oportunas de clasificacin dadas por el fabricante del aluminio. As pues, se parte de una base de conocimiento etiquetada a cinco y ocho defectos. Ahora bien, los defectos en una misma clase mantienen topologas bien diferenciadas, lo que supone que los vectores de medidas no mantienen la misma situacin en el espacio de caractersticas, efecto que ha podido ser estudiado mediante los mapas auto organizados. Estos mapas de rasgos han servido para detectar diferentes zonas de influencias correspondientes a topologas de defectos similares. Desde el punto de vista del Reconocimiento de formas, los mapas de Kohonen han permitido conocer la estructura inherente de los patrones, de lo que se ha comentado en esta tesis medianamente. No obstante, la formacin de cluster no es inmediata a partir de la informacin otorgada por dichas neuronas, ms bien es el principio; Ults et al proponen las U-Matriz como elemento de apoyo en la formacin de los clusters en los patrones. La experiencia ha mostrado que si bien es una buena herramienta, en este caso no decide de forma evidente las fronteras entre los grupos; se podra decir que las fronteras obtenidas son difusas y no tan evidente como exponen en sus artculos. Adems, sus propuestas van orientadas a matrices rectangulares y es recomendable hacer uso de aprendizajes con vecindades hexagonales, pues la literatura recomienda este entorno de vecindad para la formacin de mapas de rasgos; as que se ha utilizado una nueva versin de las U-Matriz aplicada para vecindades hexagonales. De otro lado, Kohonen propone para el etiquetamiento de las neuronas un proceso de votacin de las muestras de aprendizaje y que de forma $democrtica las neuronas se etiqueten con aquellas clases que ms votos hayan conseguido. La propuesta aqu hecha es diferente, slo sern etiquetadas aquellas neuronas que hubieran conseguido unanimidad. La razn es evidente, como es conocido, sus vectores de referencia son distribuidos estadsticamente segn el espacio de medidas. Luego, si se parte de vectores de referencia bien definidos, el entrenamiento habr generado regiones del espacio de entrada dependiente de algn grupo inherente, por lo que los entornos de Voronoi pertenecientes a neuronas etiquetadas con varias clases, correspondern con zonas de conflicto, en definitiva que dentro de su regin de influencia, hay concurrencia de varias clases. La experiencia ha corroborado con las suposiciones.
DISAM-UPMT-98-015
197
Carlos Platero
Llegado a este punto se tendrn grupos de neuronas, en cuyos entornos de Voronoi no hay duda de la validez de pertenencia de un vector cado en su entorno a la etiqueta dada. No obstante, es menester indicar que la inferencia es extrada del conjunto de muestras. Si a estos juicios se aade la informacin dada por las U-Matriz permitir generar posibles clusters candidatos. Hay que decir candidatos, ya que las barreras obtenidas por las U-Matiz son ms bien borrosas y orientativas, que definitivas, tal como se ha comentado en 5.3. En esta coyuntura, se plantea reforzar la decisin de agrupamiento mediante la bsqueda de subespacios normales. Tal como se recoge en la formacin de un sistema de reconocimiento de patrones, es necesario introducir tanto componentes continuas como discretas, si estas ltimas cumplen con el requisito de tener comportamientos absolutamente dispares en regiones diferentes. Estas componentes ayudan mucho en el mapa auto organizado a la hora de separar regiones de influencia. Pero tambin es evidente que estas componentes dentro del propio cluster mantienen valores muy similares. Desde el punto de vista de anlisis estadstico, stas no van a dar informacin sobre la funcin de distribucin. Lo que supone, no considerarlas explcitamente en el ndice de homogeneidad. El criterio utilizado es primero verificar que las muestras pertenecientes al cluster, excluidas las componentes discretas, siguen una distribucin multinormal; con tal fin se pasa el test de normalidad y en caso de ser rechazada la hiptesis se plantean transformaciones no lineales siguiendo el algoritmo numrico de Andrews et al. Las transformaciones normalizantes de Box Cox permitirn obtener los subespacios normales de los clusters, tal que dicha transformacin sea comn con otros grupos cercanos, motivando una bsqueda que maximice la distancia entre grupos disjuntos y cercanos. Con tal propsito, en el siguiente captulo se va a exponer la teora de clasificadores paramtricos y sus medidas, pudiendo de esta forma acabar la tcnica de clustering parametrizado.
198
DISAM-UPMT-98-015
Carlos Platero
Captulo 6: Clasificadores estticos
Clasificadores estticos
En general, en un sistema de inspeccin visual se trata de clasificar las formas visuales de los defectos locales, ofrecindose stos como patrones de tipo esttico. Esta definicin del problema acota el marco de trabajo, es decir, se est planteando el diseo de un sistema que sea capaz de devolver una etiqueta asignada, ante un vector de caractersticas extrado del defecto. El clasificador esttico no depende de las conclusiones de un instante anteriores, sino slo del vector de entrada. Otra de las peculiaridades de estos sistemas es la falta de muestras para el diseo de los clasificadores. El coste de obtener las muestras o la escasez de frecuencias de algunos tipos de defectos, hace muchas veces que el universo del problema sea escaso. Por otro lado, si se mantiene en todas las componentes del vector de caractersticas igual relacin seal ruido, el error de clasificacin aumenta con el incremento de la dimensin del espacio. A este efecto se le llama fenmeno Hughes [Hughe68]. Por lo que sugiere buscar una seleccin de las caractersticas determinadas por el numero de muestras y por la capacidad de discriminacin del clasificador resultante. Por todo ello, se ha trabajado en el diseo de clasificadores tanto paramtricos como no paramtricos. Los primeros ofrecen la posibilidad de obtener expresiones analticas tanto del error como del sesgo, as como facilitan la introduccin de conocimiento a priori. Gran parte de este captulo se orienta a estos clasificadores (6.1). Se empieza por un planteamiento general de los clasificadores paramtricos, de los que se
DISAM-UPMT-98-015
199
Carlos Platero
tratan de obtener las ecuaciones tanto de los parmetros para su diseo como de los resultados obtenidos, expresndose stos en trminos de error de clasificacin. Seguidamente se presenta un novedoso mtodo de parametrizacin - seleccin de las caractersticas basada en las transformaciones Box Cox y en las distancias de Bhattacharyya (6.3). El algoritmo considera el nmero de muestras que se tiene de las poblaciones enfrentadas. Dentro de los clasificadores no paramtricos y enmarcado en el contexto de clasificadores lineales y cuadrticos, se estudia y se propone una modificacin de los algoritmos de aprendizaje LVQ, pasando de la distancia eucldea a la Mahalanobis (6.4). Por ltimo, la plausibilidad de lo propuesto ha sido demostrada en el trabajo experimental para la deteccin de defectos locales en el aluminio colado (6.5), donde se comparan los resultados obtenidos con otras tcnicas tradicionales de clasificacin.
6.1
Clasificadores paramtricos
Los clasificadores paramtricos se muestran como los clasificadores ptimos, al minimizar la probabilidad de error [Fukun90]. Sin embargo, requieren del conocimiento de la funcin de densidad de la seal de entrada, p(X), y en la mayora de las aplicaciones, las funciones son estimadas por un nmero finito de observaciones, que en general resultan insuficientes. An en el caso de conocer la funcin de densidad, la implementacin suele ser difcil por falta de metodologa. No obstante, el objetivo de parametrizar el espacio encamina tanto a facilitar la introduccin de conocimiento a priori como a la seleccin de las caractersticas. La primera por tener la intencin de buscar las transformaciones Box Cox que permitan modelar las funciones de distribucin condicionales como funciones normales, y la segunda por conocer el error de clasificacin mediante expresiones analticas. Desde el punto de vista de Bayes, el mejor clasificador que minimice el error ser aquel que cumpla p k p X k = max( p i p X i
i
X k
( 6.1 )
donde p(k) es la probabilidad de cluster k y p(X|k) es la probabilidad condicionada de que X pertenezca a k. Si la distribucin condicional de X para las L clases son normales y todos los cluster tienen igual probabilidad, ( 6.1 ) ser reemplazado por:
200
DISAM-UPMT-98-015
Carlos Platero
1 min h(X ) = 2 (X M )
i i
i1 (X M i )
( 6.2 )
siendo Mi y i el vector de medias y la matriz de covarianzas respectivamente del cluster i. Ntese que se clasificar segn la menor distancia de Mahalanobis de X a cada una de las clases. La ecuacin ( 6.2 ) constituye un clasificador a tramos con fronteras cuadrticas. En el caso de tener todas las matrices de covarianza idnticas, X T i1 X de ( 6.2 ) seran comunes entre todas las clases, y la expresin se reducira a 1 min h(X ) = M iT 1 X M iT 1 M i i 2
( 6.3 )
donde es la matriz de covarianza comn. X es clasificada a la clase de mayor correlacin entre X y M i 1 . En general, las matrices de convarianza no son iguales, pero los clasificadores lineales son ms robustos que los cuadrticos, como se expondr en este captulo. Para estos casos, es reemplazado por la media de las covarianzas. Sea como fuere, habrn h(X), cuadrticos o lineales, capaces de separar entre s las mltiples clases que existieran. Asumiendo que la regin en cada clase sea convexa, como muestra la Figura 6.1, la regin de la clase i puede ser especificada por hi1 ( X ) < 0,..., hiL < 0 X i
[hii es excluida ]
( 6.4 )
como se evidencia de la Figura 6.1, las L regiones dadas por ( 6.4 ) no necesariamente cubren todo el espacio. Cuando una muestra cae en esta regin, el clasificador no podr decidir. A esta zona se le llama regin de rechazo.
h12 0 = x
2 h13 0 =
La implementacin ( 6.4 ) consistir en (L-1) x funciones discriminantes y una puerta AND con L-1 3 h =0 x entradas de signo hij, como muestra la Figura 6.2. Cuando la suposicin de convexidad no se cumple, 4 h =0 habr de reemplazar la puerta AND por una estructura lgica ms complicada. Consecuentemente, el Figura 6.1 Clasificadores a tramos clasificador llega a ser demasiado complicado para poder ser prctico. Por lo tanto, slo se limitar el
14 34
regin de rechazo
h23 0 =
DISAM-UPMT-98-015
201
Carlos Platero
diseo en las siguiente discusiones a regiones convexas. De otro lado, la probabilidad de error de cada clase, i, puede ser expresada en trminos de probabilidad de rechazo, pr, quedando
i = 1 pr hi1 X > 0
1
hi1 X > 0 X i = hi1 X i dhi1 dhiL
ph
0 0
i1
[h
ii
( 6.5 )
el error total es
p
i =1
( 6.6 )
Conociendo la estructura del clasificador a tramos, el problema consiste en disear hij(X) para cada una de las L clases. Debido a la complejidad del problema la solucin no es clara. Tres filosofas distintas pueden clasificador 1 ser apuntadas :
hi1
X hiL
AND
clasificador
1. Encontrar el ptimo de hij(X) mediante la minimizacin del error cuadrtico medio entre la salida deseada y el valor obtenido. Desafortunadamente, incluso para clasificadores lineales a tramos, no hay demostracin de convergencia. Mtodo muy utilizado en mtodos no paramtricos. 2. Ajustar los parmetros de hij(X)
Figura 6.2 Implementacin del clasificador
202
DISAM-UPMT-98-015
Carlos Platero
tal que minimice de ( 6.6 ). La dificultad de obtener una solucin explcita del error sobre los parmetros de h(X), hace necesario recurrir al clculo numrico. Incluso para distribuciones normales la solucin no es fcil. Este proceder ser utilizado para el diseo de h(X), lineales o cuadrticos, con enfrentamiento entre dos grupos. 3.Diseo de clasificadores tomados a pares, utilizando las tcnicas tradicionales que L sern expuestas a continuacin en el apartado 6.1.1. funciones discriminantes sern 2 calculadas para cada regin y posteriormente se determinar la clasificacin mediante ( 6.4 ). Las regiones vendrn definidas por la etapa de clustering paramtrico, basadas en las exposiciones del anterior captulo y en las que se va a ver seguidamente para la decantacin definitiva del cluster. A continuacin se expone la teora del diseo de clasificadores paramtricos tomados en grupos de dos. Se desarrollan los conceptos bsicos para determinar en primer lugar, la expresin de error para clasificadores cuadrticos y lineales cuando las funciones de distribucin son normales, prrafo 6.1.2, en segundo lugar, se estudian los criterios para el diseo de los clasificadores cuadrticos y lineales (6.1.3). Para continuar seguidamente con la influencia del nmero de muestras en el diseo de los clasificadores. 6.1.1 Clasificacin a dos grupos Una vez modelizado el espacio entre dos grupos, se asumen conocidas las funciones de densidad condicionadas, p(X|1) y p(X|2), as como las probabilidades de los clusters, p(1) y p(2). Una regla de decisin basada en la distribucin de la variable ser :
p 1 p X 1
> p <
2 1
p X 2
p X 1 "X = p X 2
> p < p
2
2 1
( 6.7 )
el trmino l(X) es llamado ratio de verosimilitud, donde p 2 / p 1 es el valor umbral para la decisin. Algunas veces es ms conveniente escribirlo a modo de regla de decisin: h( X ) = ln "( X ) = ln p( X | 1 ) + ln p( X | 2 ) > ln
1
<
2
p( 1 ) p( 2 )
( 6.8 )
DISAM-UPMT-98-015
203
Carlos Platero
a h(X) se le llama funcin discriminante. En general, la regla de decisin de ( 6.8 ), o cualquier otra forma de clasificacin, no es perfecta. Con esta finalidad, las prestaciones de la norma de decisin son calculadas a partir del error de clasificacin, esto es, la probabilidad de que una muestra sea asignada a una clase errnea. El error condicional, r(X), debido a la regla de ( 6.7 ), har corresponder el error al valor ms pequeo de p(1) p(X|1) o p(2) p(X|2), esto es : r ( X ) = min[ p ( 1 ) p ( X | 1 ), p ( 2 ) p ( X | 2 )] el error total o error de Bayes ser: ( 6.9 )
= E{r( X )} = r( X ) p( X )dX = min[ p(1 ) p( X | 1 ), p(2 ) p( X | 2 )]dX

X X
= p(1 ) p( X | 1 )dX +p(2 ) p( X | 2 )dX

L2 L1
( 6.10 )
L1 y L2 son las regiones donde X es clasificado a 1 o a 2, respectivamente. En L1, p(1) p(X|1) es mayor a p(2) p(X|2), y por tanto r(X) = p(2) p(X|2). En caso contrario, r(X) = p(1) p(X|1) en L2 donde p(1) p(X|1) < p(2) p(X|2). Distinguindose dos tipos de error, uno resultado de la mala clasificacin desde 1 y el otro desde 2. El error total es la suma de los dos anteriores. El clculo del error de Bayes es complicado de determinar. La mayor dificultad viene dada por la integracin en elevadas dimensiones, al no ser fcil la limitacin de las regiones, incluso aun cuando las observaciones sigan una distribucin normal. Por lo tanto, suele ser ms conveniente integrar la funcin de densidad de h(X) de ( 6.8 ), la cual es unidimensional:
1 = 2 =
h ln( p (1 ) / p ( 2 ))
(h | 1 )dh (h | 2 )dh
ln( p (1 ) / p ( 2 ))
( 6.11 )
donde ph(h|i) es la densidad condicional de h para i. Sin embargo, en general, la funcin de densidad de h no suele estar disponible, y tiene dificultades de computacin. 6.1.2 Expresin general del error para la clasificacin de dos grupos Desde un punto de vista general, si el clasificador tiene una funcin discriminante para dos grupos, y modificando ( 6.8 ) para colocarla de la forma :
204
DISAM-UPMT-98-015
Carlos Platero
hX
>0 <
2
( 6.12 )
el error del grupo 1 salvo una constante, ser :
1 =
h ( X ) >0
p( X | )dX = u(h( X )) p( X | )dX

1 1 X
( 6.13 )
siendo u(.) la funcin escaln. Utilizando la transformada de Fourier para una funcin escaln : F u = + 1 j
( 6.14 )
e insertando la antitransformada del escaln
1 =
1 2
1 j
j h e
p X 1 d dX ( 6.15 )
1 1 = + 2 2
e j h X p X 1 d dX j
De la misma forma para el grupo 2, quedando :
2 =
= =
h ( X )< 0
p( X |
,X
)dX = F ( h( X )) p ( X | 2 )dX
X
1 2
( )
1 j h ( X ) e p( X | 2 )ddX j ( 6.16 )
1 1 2 2
e j h ( X ) j p( X | 1 )ddX ,X
el error total ser :
= p 1 1 + p 2 2
= 1 1 + 2 2 e jh X j p X ddX X ( 6.17 )
donde :
DISAM-UPMT-98-015
205
Carlos Platero
p X = p 1 p X 1
p 2 p X 2
( 6.18 )
expresin ( 6.17 ) deducida al ser p(1) + p(2) la unidad. Se observa que el error es una funcin de h(X) y de p X , especificando el tipo de clasificador y la distribucin de las variables, respectivamente. Otra interpretacin del error puede ser dada desde la funcin caracterstica, Fi(). sta se define como : Fi = E {e jh X i } = e jh X p X i dX = e jh p h i dh
X h
( 6.19 )
esto es, Fi() puede ser obtenida o bien mediante la integracin n-dimensional de X, o a travs de la integral unidimensional de h. Obsrvese que Fi() representa la transformada de Fourier, excepto por el signo de j. Si se aplica el concepto de antitransformada, p h i = 1 2
F e
i
jh
( 6.20 )
o p h i = 1 2
F e
i
jh
( 6.21 )
esta ltima expresin indica que Fi() es la transformada de Fourier de p(-h|i). Volviendo al error y partiendo de ( 6.15 ), la multiplicacin de la funcin caracterstica por 1 + j en el dominio de Fourier, corresponder con el error de tipo 1, esto es con el valor de 1:
1 =
1 2
0
1 1 F1 d = 2 j
1 F e j h d h = 0 = j 1 ( 6.22 )
p h
dh =
ph
0
dh
de la misma manera para 2, la multiplicacin de la funcin caracterstica por 1 j en el dominio de Fourier, corresponde:
206
DISAM-UPMT-98-015
Carlos Platero
2 =
p h
0
dh =
ph
dh
( 6.23 )
Estas dos ltimas ecuaciones son ilustradas en la figura 6.3, donde se muestra como los errores corresponden con las reas ocupadas desde el umbral hasta el segn sea p(h|i).
Figura 6.3 Error de clasificacin
El procedimiento para calcular el error de un clasificador ser : 1. Calcular la funcin caracterstica, Fi(), mediante la integracin n-dimensional. Para clasificadores lineales y cuadrticos con distribuciones normales, una expresin explcita puede ser obtenida, estas expresiones van a ser a continuacin estudiadas. 2. Aplicar ( 6.15 ) y ( 6.16 ) introduciendo Fi(). Al ser las partes reales e imaginarias de Fi() pares e impares, el error queda
+ + + 1 1 Fi 1 1 IM Fi 1 1 Fi i = d = 2 d = 2 sin Fi d 2 2 j 0 0
( 6.24 )
donde + y - corresponde para la clase i = 1 o 2. 6.1.2.1 Error de clasificacin para distribuciones normales Como ha sido mencionado, existen expresiones explcitas para el error de clasificadores lineales y cuadrticos cuando las poblaciones de enfrentamiento siguen distribuciones normales. Por ser stas las que van a ser decantadas del proceso de clustering paramtrico, se estudia a continuacin las funciones caractersticas, Fi(), tanto para clasificadores cuadrticos como lineales.
DISAM-UPMT-98-015
207
Carlos Platero
6.1.2.1.1
Funcin caracterstica Fi() para clasificador cuadrtico
En el caso de utilizar un clasificador cuadrtico, h(X) ser del tipo : hX = 1 1 X M1 T 1 1 X M1 X M2 T 2 1 X M2 + 2 2 1 2 y pT X T = 1 1 T 1 2 X M T X M 1 2
( ) p( )
p 1
2
( 6.25 )
( 2 )
n 2
1 2
( 6.26 )
siendo T uno o dos. Si en ( 6.25 ) es aplicado simultneamente una diagonalizacin y un desplazamiento , esto es, una transformacin blanqueante [Fukun90], Y=AT(X-MT), AT T A = I luego, Mi y i son convertidas a : AT Mi M T = Di AT i A = Ki i = 12 ( 6.28 )
A T 1 1 1 A = 2
( 6.27 )
por lo tanto, en el Y-espacio transformado quedar : hY = 1 T 1 Y Y V TY + c 2 1 ( 2 ) n 1 T 2 Y Y
( 6.29 )
pT Y T = donde V = K11D1 K21D2
( 6.30 )
( 6.31 )
208
DISAM-UPMT-98-015
Carlos Platero
c=
1 T 1 1 (D1 K1 D1 D2T K21D2 ) + 2 2
K1 K2
p(2 )
p(1 )
( 6.32 )
La funcin caracterstica FT() es entonces calculada como : FT ( ) = e jh (Y ) p (Y | T )dY = 1 1 exp Y T I j 1 Y jV T Y exp[ jc ]dY n/2 (2 ) 2
n
1 = (2 )n / 2
2 1 j v i exp 2 (1 j / i ) yi + 1 j / i =1 i 2 2 n vi exp exp[ jc ]dY 2(1 j / i ) i =1 n 2 vi2 1 = exp exp[ jc] 2(1 j / i ) 1 j / i i =1
( 6.33 )
donde yi, vi, i son las componentes de Y, V y respectivamente. Obsrvese que en jvi 1 la tercera tautologa se tienen n distribuciones normales N Y . 1 j i 1 j i Dependiendo de si el error es generado por h(X)>0 o h(X)<0, el error de clasificacin ser computado como: p(h | T )dh = T = 1 + 2 = 0 0 p (h | )dh = T 1 1 + 2 2 1 1 2 2
F1 ( ) d j F2 ( ) j d
( 6.34 )
La integracin de ( 6.34 ) debe realizarse de manera numrica. La integracin no es simple pero es factible. Esta expresin ha sido utilizada en el clculo del error de los clasificadores cuadrticos implementados. Evaluando los resultados para MT = M1 y T = 1, luego la transformacin de diagonalizacin y desplazamiento quedar : AT 1 A = I
1
AT 2 A =
A T ( M 2 M1 ) = L
( 6.35 )
donde (1 1 2 1 ) es tambin transformado a matriz diagonal
DISAM-UPMT-98-015
209
Carlos Platero
= AT ( 1 1 2 1 ) A = AT A( I 1 ) AT 1 1
A = ( I 1 )
( 6.36 )
al ser MT = M1 implica D1 = 0, D2 = L, K1 = I y K2 = desde ( 6.28 ). Insertando stos en ( 6.31 ) y ( 6.32 ), V y c son : V = 1 L p( 1 ) 1 1 c = LT 1 L ln ln p( 2 ) 2 2 para estos casos los valores de i y vi de ( 6.33 ) correspondern con 1 1 = 1 i i vi = li i ( 6.37 )
( 6.38 )
( 6.39 )
Que introduciendo estos valores en ( 6.34 ) es posible calcular 1. Para el caso de MT = M2 y T = 2, despus de la primera transformacin de ( 6.35 ), otra vez es aplicada una segunda : Y = AT ( X M 2 ) quedando ( 6.40 ) 1/ 2 I1/ 2 = I 1/ 2 1/ 2 = I 1/ 2 AT ( M1 M 2 ) = 1/ 2 L
1
Z = 1/2Y
( 6.40 )
( 6.41 )
dicha transformacin garantiza la diagonalizacin de (1 1 2 1 )
= 1/ 2 ( I 1 ) 1/ 2 = ( I )
1
( 6.42 )
al ser MT = M2 implica D1 = --1/2L, D2 = 0, K1 = -1 y K2 = desde ( 6.28 ). Insertando stos en ( 6.31 ) y ( 6.32 ), V y c son : V = 1/ 2 L = 1/ 2 L c= p ( 1 ) 1 T p(1 ) 1 T 1 / 2 1 / 2 1 1 L L ln ln = L L ln ln p ( 2 ) 2 p( 2 ) 2 2 2 ( 6.43 )
( 6.44 )
210
DISAM-UPMT-98-015
Carlos Platero
Esto es, despus de calcular y L, son obtenido los valores de i, vi y c de ( 6.34 ) a partir de ( 6.42 ), ( 6.43 ) y ( 6.44 ). Este mtodo de calcular el error ha sido empleado en los clasificadores paramtricos utilizados para la catalogacin de las faltas visuales del aluminio. Las pruebas realizadas sern comentadas en el apartado 6.5
6.1.2.1.2 Funcin caracterstica Fi() para clasificador lineal
Para el caso de clasificador lineal, y eligiendo el criterio de Fisher, h(X) ser : 1 h( X ) = ( M2 M1 ) T 1 X + ( M1T 1 M1 M2T 1 M2 ) 2
( 6.45 )
+ 2 , adems los dos grupos siguen distribuciones normales. donde = 1 2 Utilizando similar procedimiento que en los clasificadores cuadrticos, es aplicado diagonalizacin y desplazamiento, Y=AT(X-MT), AT T A = I definiendo Di como: AT ( Mi M T ) = Di i = 1,2 ( 6.47 ) AT ( 1 + 2 ) A = ( 6.46 )
por lo tanto, en el Y-espacio quedar : h(Y ) = V T Y + c pT Y T = donde V = 1( D2 D1 ) ( 6.50 ) 1 ( 2 ) n 1 T 2 Y Y ( 6.48 )
( 6.49 )
DISAM-UPMT-98-015
211
Carlos Platero
c=
1 T 1 (D1 D1 D2T 1 D2 ) 2
( 6.51 )
La funcin caracterstica FT() ser calculada como : FT ( ) = e jh (Y ) p (Y | T )dY = = 1 1 exp Y T Y + jV T Y exp[ jc ]dY n/2 (2 ) 2 1 (2 )n / 2
n
exp 2 ( y
i =1
2 j v i )
2 vi2 exp exp[ jc ]dY 2 i =1 2 T = exp V V + j c 2 ( 6.52 )
Evaluando los resultados para MT = M1 y T = , luego la transformacin de diagonalizacin y desplazamiento quedar : AT 1 A = I AT 2 A = ( 6.53 )
adems es tambin transformado a matriz diagonal
1 T 1 A ( 1 + 2 ) A = ( I + ) 2 2
( 6.54 )
junto con D1 = 0, D2 = AT(M2 - M1) al que se asignar a L, introducindolo en las expresiones ( 6.50 ) y ( 6.51 ), V y c son : I + L V = 2 1 I + L c = LT 2 2
1 1
( 6.55 )
( 6.56 )
Si se hace MT = M2 y T = 2, despus de la primera transformacin de ( 6.53 ) , otra vez es aplicada una segunda :
212
DISAM-UPMT-98-015
Carlos Platero
Y = AT ( X M 2 ) resultando 1/ 2 I1/ 2 = 1/ 2 1/ 2 = I
Z = 1/2Y
( 6.57 )
1/ 2 AT ( M1 M 2 ) = 1/ 2 L
( 6.58 )
dicha transformacin garantiza la diagonalizacin de (1 + 2 )

1 I + 1/ 2 + I = 1/ 2 = 2 2
( 6.59 )
al ser MT = M2 implica D1 = --1/2L, D2 = 0. Insertando stos, V y c son : 1 + I 1/ 2 V = L 2 1 + I 1/ 2 1 c = LT 1/ 2 L 2 2

1 1
( 6.60 )
( 6.61 )
Al igual que en los clasificadores cuadrticos, tambin se a empleado este mtodo para determinar el error de los clasificadores lineales diseados para los defectos visuales del aluminio (ver 6.5). 6.1.2.2 Lmites del error de Bayes Es evidente tal como se est planteando, que el clculo de la probabilidad de error, en general, es una tarea difcil. Incluso cuando la observacin de las muestras siga una distribucin normal, hay que recurrir a mtodos numricos. Sin embargo, existen varias propuestas de expresiones que se acercan al valor del error. No slo se reduce el gran esfuerzo de carga computacional, sino ms importante todava, el uso de estas aproximaciones permite conocer los mecanismos que causan el error. Como se ver en prrafos siguientes, estas expresiones sern utilizadas en el problema de la seleccin de las ptimas caractersticas y en el tipo de clasificador paramtrico a utilizar. Las aproximaciones al error pueden ser realizadas por el lmite superior o por el lmite inferior. En la bibliografa especializada existen mltiples propuestas tanto hacia la arriba como hacia abajo. Seguidamente, se exponen algunas de ellas.
6.1.2.2.1 Lmite superior de Chernoff y Bhattacharyya
El error de Bayes fue dado en ( 6.10 ) y puede ponerse de la forma :
DISAM-UPMT-98-015
213
Carlos Platero
= min[ p( 1 ) p( X | 1 ), p( 2 ) p( X | 2 )]dX
X
( 6.62 )
un lmite superior de la integracin podra ser obtenido considerando que : min[a b] a sb1 s ab0 0s1 ( 6.63 )
dicha ecuacin muestra que la media geomtrica de dos valores positivos es mayor que la menor de stas. Si a < b, la expresin de la izquierda de ( 6.63 ) es a, mientras el lado derecho puede ser escrito como a(b/a)1-s. Al ser b/a > 1 y 1-s 0, el margen derecho ser mayor que el izquierdo. Viceversa, si a > b y reescribiendo b(a/b)s, est claro que el lado derecho es mayor que el izquierdo al ser (a/b)s 1. Aplicando ( 6.63 ) en ( 6.62 ) el lmite superior del error ser :
u = p 1 s p 2
1 s
pX
X
p X 2
1 s
dX
0s1
( 6.64 )
este lmite superior del error, u, es llamado lmite de Chernoff [Chern52]. El ptimo de s se encontrar minimizando u. Cuando dos funciones de densidad son normales, NX(M1,1) y NX(M2,2), la integral de ( 6.64 ) puede ser expresada como :
pX
X
p X 2
1 s
dX = e s
( 6.65 )
donde
s =
1 s1 s ( M 2 M1 )T [ s1 + 1 s 2 ] ( M 2 M1 ) 2 1 s 1 + 1 s 2 + 1 s s 2 1 2
( 6.66 )
Esta expresin de (s) es llamada distancia de Chernoff. El ptimo de s puede ser obtenido mediante la representacin de (s), para cada par de grupos enfrentados. El valor buscado ser el mximo de (s). En el caso de no localizar el ptimo de s, se simplifica la localizacin del lmite superior. Una de las posibilidades es seleccionar s = . Luego, el limite superior es :
214
DISAM-UPMT-98-015
Carlos Platero
T + 2 1 1 = M 2 M1 1 2 8 2
1 + 2 1 2 M 2 M1 + 2 1 2
( 6.67 )
el trmino (1/2) es llamado la distancia de Bhattacharyya [Bhatt43]. sta corresponde con el ptimo de la distancia de Chernoff cuando 1 = 2. Aplicndolo en la expresin ( 6.66 )
s =
s1 s ( M2 M1 )T 1( M2 M1 ) 2
( 6.68 )
siendo 1 = 2 = . El ptimo de s resultar ser :

T d s 1 2s M 2 M1 1 M 2 M1 = 0 = ds 2
( 6.69 )
la solucin es s = . De la expresin de ( 6.67 ) se desprende que la distancia de Bhattacharyya contiene dos trminos, 1 y 2. El primer valor mide la separacin de las clases debido a la diferencia entre las medias, mientras el segundo muestra la diferencia debido a las matrices de covarianza.
6.1.2.2.2 Otros lmites
Si bien hay otros lmites que resultan ser mejores que los de Bhattacharyya y Chernoff, como por ejemplo el de Hadar et at[Hadar96], pues stos se aproximan ms al verdadero error, tienen el gran inconveniente de no tener una expresin analtica para distribuciones normales, lo que posteriormente dificultar el tratamiento de estimacin del sesgo y la varianza al considerar un nmero limitado de muestras. 6.1.3 Diseo de clasificadores lineales ptimos Los clasificadores lineales son los ms fciles de implementar y estn directamente relacionados con muchas tcnicas conocidas, tales como correlacin o la distancia eucldea. Sin embargo, desde el punto de vista de Bayes, los clasificadores lineales son ptimos slo para distribuciones normales con matrices de covarianza iguales. En algunas aplicaciones como la deteccin de seales en sistemas de comunicacin, la suposicin de matrices iguales son razonables, ya que el ruido no afecta de manera considerable de una seal a otra. Sin embargo, en la mayora de las aplicaciones de Reconocimiento de Formas, no es posible aceptar la igualdad de matrices de covarianza.
DISAM-UPMT-98-015
215
Carlos Platero
Ha habido mucho esfuerzo en el diseo del mejor clasificador lineal para distribuciones normales con desiguales covarianzas y distribuciones no normales. Naturalmente, stas no son ptimas, pero en muchos casos la simplicidad y robustez de los clasificadores lineales compensan las prdidas de prestaciones. La regla de clasificacin de stos seguirn la expresin :
h X = V T X + v0
>0 <
2
( 6.70 )
el trmino h(X) es una funcin lineal de X, llamada funcin discriminante lineal. El diseo del clasificador tratar de buscar los ptimos coeficientes de V y el umbral v0 para la distribucin dada. Es de observar que estos clasificadores funcionan bien, si la separabilidad entre clases viene dada por la diferencia entre las medias de los clusters. Mientras que los clasificadores no lineales mantienen buenos resultados cuando la separacin es debida a la diferencia entre las covarianzas. As, en los trminos 1 y 2 de Bhattacharyya indican la naturaleza de separacin entre las dos clases. Cuando 1 es predominante en la distancia, indica la necesidad de construir clasificadores lineales. En caso contrario, se tender al diseo de clasificadores no lineales, especialmente cuadrticos. 6.1.3.1 Procedimiento de diseo ptimo La expresin ( 6.70 ) muestra la proyeccin del vector X sobre el espacio unidimensional h(X). Si X sigue una distribucin normal, h(X) tambin la seguir. En la figura 6.4 se muestra la proyeccin de las poblaciones sobre los vectores V y V, donde v0
Figura 6.4 Representacin de clasificadores lineales sobre dos proyecciones distintas
y v0 son los umbrales de separacin entre 1 y 2. Como se puede ver, el error es ms
216
DISAM-UPMT-98-015
Carlos Platero
pequeo en V que en V. El diseo ptimo vendr en la relacin de V y v0 que minimice el error en el h-espacio. Con este objetivo ser necesario modelar la distribucin de 1 y 2 proyectado en h-espacio, teniendo que definir i=E{h(X)|i} y i=Var{h(X)| i }, las cuales son funcin de V y v0. Incluso, si X no se distribuye normalmente, h(X) pudiera acercarse a normal cuando la dimensin del espacio de X, n, tienda a ser elevada. En este caso, h(X) es la suma de n trminos aleatorios y por el consiguiente teorema central del lmite, h(X) tender a seguir una distribucin normal. Los valores esperados y la varianza de h(X) son :
i = E {h X i } = V T E {X i } + v0 = V T Mi + v0 i2 = Var {h X i } = V T E ( X Mi )( X Mi ) i V = V T iV
T
( 6.71 )
( 6.72 )
considerando la funcin f(1,2,12,22), la cual maximiza o minimiza algn criterio (por ejemplo, la distancia entre clases), esta medida permitir determinar el ptimo de V y v0. Luego, las derivadas de f respecto a V y v0 son :
f f 1 f 2 f 12 f 22 = + + + V 1 V 2 V 12 V 22 V f f 1 f 2 f 12 f 22 = + + + v0 1 v0 2 v0 12 v0 22 v0
( 6.73 )
( 6.74 )
tomando las expresiones ( 6.71 ) y ( 6.72 ), se deduce las siguientes derivadas parciales :
i = Mi V i =1 v 0
i2 = 2 iV V i2 =0 v 0
( 6.75 )
( 6.76 )
introduciendo los resultados de ( 6.75 ) y ( 6.76 ), adems de igualar a cero las expresiones ( 6.73 ) y ( 6.74 ), quedar : f f f f M1 + M2 2 2 1 + 2 2 V = 2 2 1 1
( 6.77 )
DISAM-UPMT-98-015
217
Carlos Platero
f f + =0 1 2
( 6.78 )
al aplicar ( 6.78 ) sobre ( 6.77 ), el ptimo de V puede ser calculado. Atendiendo a la reflexin utilizada, el error no depende del tamao de V sino de su direccin, por tanto, eliminando las constantes quedar :
V = s 1 + (1 s) 2 donde
] (M
1
M1
( 6.79 )
s = f f 2 + 1 22
f 12
( 6.80 )
el valor ptimo de V depender de la seleccin de f. Adems, una vez elegida la funcin, el valor ptimo de v0 se calcular con la solucin de ( 6.78 ). El cuadro de abajo muestra los resultados ptimos de V y v0, para dos criterios clsicos.
Nombre criterio Expresin del criterio V
1 1 + 2 2 M 2 M1
v0
Fisher
( ) =
1 2 1 2
+ 22
El criterio de Fisher no depende de v0, ya que la sustraccin de 2 menos 1 elimina a v0 de ( 6.71 )
Medida entre clases
f =
( ) p( )
1
p 1 + p 2 2 1
2 1 2
( ) + p( ) [ p( ) + p( ) ] ( M M )
2 2 1 1 1 2 2 2 1
V T p(1) M1 + p(2 ) M2
6.1.3.2 Diseo ptimo para distribuciones normales Cuando la distribucin de h(X) es normal, se puede disear la funcin criterio, f, tal que minimice el error de Bayes en el h-espacio. El error ser funcin de i y i2 segn se vio en 6.1.3.1. La definicin ser :
218
DISAM-UPMT-98-015
Carlos Platero
f = = p(1 )
1 1
1 2 e d + p(2 ) 2
2
2 2
1 2 e d 2
2
( 6.81 )
para este criterio, las derivadas del error respecto a los parmetros son : p(1 ) (1 = e 12 2 p(2 ) (2 = e 22 2
2
1 )
2
p(1 ) (1 1 ) 1 1 2 = e 13 12 21
2
( 6.82 )
2 )
p(2 ) (2 2 = e 23 22
)2
2 )
2
2 22
( 6.83 )
/ p ( 1 ) 1 2 1 = e 1 2 1
( 6.84 )
( / ) p ( 2 ) 2 2 2 = e 2 2 2
( 6.85 )
Por lo tanto desde ( 6.78 ) p(1 ) (1 1 ) p(2 ) (2 e 2 = e 21 2 2

2
2 )
2
( 6.86 )
esto es, v0 debe ser seleccionado tal que las distribuciones de h(X) sean ambas iguales a cero. Considerando la igualdad de ( 6.86 ) e introduciendo ( 6.82 ) y ( 6.83 ) en ( 6.80 )
s= 2 1 2 + 1 22 y V = s 1 + (1 s) 2
1 12
( 6.87 )
] (M
1
M1
( 6.88 )
la localizacin ptima de V y v0 depender de ( 6.86 ) y ( 6.88 ), tal que minimice el error de ( 6.81 ). Desafortunadamente, tanto i como i2 estn intrnsecamente ligadas a V y v0, la solucin explcita no es posible. Por lo tanto, debe ser utilizado un proceso iterativo capaz de encontrarlas. Antes de entrar en la discusin del proceso iterativo, es menester obtener la expresin de v0. Sustituyendo 1 y 2 de ( 6.87 ) por las expresiones de ( 6.71 ) quedar :
DISAM-UPMT-98-015
219
Carlos Platero
s12V T M 2 + (1 s)22V T M 2 v0 = s12 + (1 s)22 el proceso iterativo para determinar V y v0 es el siguiente : 1. Calcular V para un determinado valor de s, V = s 1 + (1 s) 2
( 6.89 )
] (M
1
M1 .
2.Obtener i2 de ( 6.72 ), v0 de ( 6.89 ) y i de ( 6.71 ), siguiendo este secuencia. 3.Calcular el error, segn se vio en 6.1.2.1. 4.Variar s de 0 a 1 Encontrando el mnimo valor de respecto de s, el algoritmo buscar el ptimo de V y v0. Obsrvese la validez del mtodo para cualquier tipo de distribucin, siempre y cuando la dimensin del vector sea elevada. En efecto, al ser h(X) distribucin normal por aplicacin del teorema central del lmite permitir ser aplicada a distribuciones de la variable que no cumpla normalidad. De otro lado, al tratarse de distribuciones normales, es posible calcular el error del punto 3 mediante la distancia de Bhattacharyya. 6.1.4 Diseo de clasificadores cuadrtico Cuando la distribucin de X es normal tanto para 1 como 2, la funcin discriminante bayesiana llega a ser de tipo cuadrtico 1 2
1 1 1 X M1 T 1 1 X M1 X M2 T 2 1 X M2 + 2 2 2
> p( ) < p( )
1 2
( 6.90 )
incluso para distribuciones no normales, el clasificador trabaja bien en muchas aplicaciones. Conceptualmente, es fcil aceptar que la clasificacin se debe a la comparacin entre distancias de Mahalanobis a cada uno de los clusters con un apropiado umbral. Sin embargo, es poco conocido el diseo de clasificadores cuadrticos, excepto la estimacin de Mi y i e insertarlas en ( 6.90 ). Adems, estos clasificadores tiene diversas desventajas cuando son diseados desde un nmero finito de muestras. Los sesgos de los clasificadores cuadrticos son mayores que los lineales cuando se utilizan pocas muestras en su confeccin. Este problema ser tratado ms adelante.
220
DISAM-UPMT-98-015
Carlos Platero
6.1.4.1 Procedimientos de diseo El clasificador cuadrtico puede expresarse como : h X = X T QX + V T X + v0 ( 6.91 )
donde Q, V y v0 son la matriz, el vector y el escalar, respectivamente de la funcin discriminante. Por lo tanto, se optimizara mediante la funcin f(1,2,12,22) con respecto a Q, V y v0, tal como fue efectuado con el clasificador lineal. No obstante, el nmero de parmetros, [n(n+1)/2]+n+1, es demasiado grande, y i2 es funcin de momentos de tercer y cuarto orden, no siendo practicable la optimizacin de f(1,2,12,22). 6.1.4.2 Linealizacin Una posible interpretacin a ( 6.90 ) es transformar el problema a lineal
n n +1 2 i =1
hX =
qij xi x j + vi xi + v0 =
i =1 j =1 i =1
i yi + vi xi + v0
i =1
( 6.92 )
donde qij y vi son las componentes de Q y V. Cada una de las nuevas variables, yi, representa el producto a dos de x, y su correspondiente valor de q. La ecuacin ( 6.92 ) corresponde a una funcin discriminante lineal, de la que puede aplicarse el procedimiento ptimo de diseo:
n n + 1
v1
vn
= sK1 + 1 s K2
D2 D1
( 6.93 )
donde Di y Ki son los vectores esperados y las matrices de covarianza de Z=[YTXT]T con [n(n+1)/n]+n variables. Sin embargo resulta prohibitivo por la cantidad de variables. 6.1.4.3 Visualizacin Una solucin prctica es la representacin en un sistema de coordenadas, donde se utilizara la distancia normalizada a cada grupo. Teniendo d12 = X M1 T 1 1 X M1 y 2 d 2 = X M 2 T 2 1 X M 2 en cada eje de coordenadas, la mejor lnea recta que los separase podra ser utilizado como elemento de diseo. En la figura se observa dicha tcnica
DISAM-UPMT-98-015
221
Carlos Platero
Distancia a la clase 2
x x x x
x x
x x
x o o o x x x x x xo o o o x x o o x o o o o x o o x o o o Distancia a la clase 1
Figura 6.5 Tcnica de diseo de clasificador cuadrtico
El clasificador quedar como d22 = d12 + o bien mediante otro tipo de curva, en general, d 22 = f d12 ( 6.95 ) ( 6.94 )
sin embargo, la estructura de la funcin discriminante debera ser lo ms simple posible, ya que si bien es cierto que se adecuara mejor con las muestras utilizadas, las venideras sern mal clasificadas por falta de generalidad en la solucin del problema.
222
DISAM-UPMT-98-015
Carlos Platero
6.2
Estimacin de los parmetros mediante un conjunto finito de muestras

La parametrizacin del espacio ha sido realizada mediante los vectores de medias y las matrices de covarianzas. Hasta ahora se ha asumido que los parmetros eran fijos y dados. Desafortunadamente, en la prctica sus valores no son conocidos, y deben ser estimados desde un conjunto de muestras finitas. En Reconocimiento de Formas, suele trabajarse con funciones usando estimaciones de los vectores de medias y matrices de covarianzas, como sucede con las funciones discriminantes, las funciones de densidad o el error de clasificacin. Por lo tanto, es menester saber como las salidas de estas funciones son afectadas por las variable aleatorias de los parmetros, ms concretamente, sobre el sesgo y la varianza de estas funciones. 6.2.1.1 Efecto del tamao de la muestra en la estimacin yq , donde f Considerando el problema de estimar f(y1, y2 ,..., yq) por f y1 y2 es la funcin, yi sus verdaderos valores, mientras yi son sus estimaciones. Asumiendo que la desviacin entre yi e y son pequeas, f Y puede ser desarrollada por las series de
i
Taylor hasta trminos de segundo orden

q q q 2 = f Y f Y + f y + 1 f y y = f i 2 i = 1 j = 1 yiy j i j i = 1 yi
= f Y +
f T 1 2 f Y + tr 2 YY T Y 2 Y
( 6.96 )
donde yi = yi yi e Y = Y Y . Si el estimador carece de sesgo entonces E { Y} = 0 y consecuentemente el vector esperado de f Y ser :

2 } f Y + 1 tr f E {YY T } E{ f Y 2 Y 2
( 6.97 )
( 6.98 )
DISAM-UPMT-98-015
223
Carlos Platero
Similarmente, la varianza de f Y ser :

2 2 2 T E f Y + 1 tr f E {YY T } 1 tr f E {YY T } Var f Y 2 2 2 Y 2 Y Y 2 2 f f f T E {YY T } E 2 Y = Y Y Y ( 6.99 )
la ecuacin ( 6.98 ) muestra como la estimacin del sesgo de la funcin, E f Y , 2 f depende de y de E {YY T } , siendo el primer trmino dependiente de la funcin, Y 2 mientras el segundo est supeditado a la distribucin de Y junto con el nmero de f muestras utilizado para el clculo de Y . Igualmente, la varianza depende de y Y E {YY T } , y de la misma manera est vinculada al tipo de funcin junto al tipo de distribucin de Y . En la modelizacin paramtrica, la mayora de las funciones a considerar utilizan estimaciones del vector de medias y la matriz de covarianzas. Asumiendo que el origen de los datos corresponde a dos distribuciones normales n-dimensionales, y dadas sus medias y matrices de covarianzas, M1, M2, 1 y 2.. Los parmetros Mi y i son estimados sin sesgo mediante verosimilitud : 1 Mr = Nr r =
{ ( )}
X
j =1
Nr
r j
( 6.100 )
1 Nr X jr M r X jr Mr N r 1 j =1
)(
( 6.101 )
donde Xj(r) es la muestra j de la clase r y Nr es el nmero de muestras de la clase r. Llegndose a que el vector Y contiene 2[n+n(n+1)/2] componentes Y = m11
mn1 m12
1 mn2 c11
1 2 cnn c11
2 cnn
( 6.102 )
224
DISAM-UPMT-98-015
Carlos Platero
definiendo mi r = mi r mi r e cijr = cijr cijr , las variables aleatorias de la expresin( 6.102 ) satisfacen las siguientes propiedades estadstica 1. La media y la matriz de covarianzas son insesgada, E {mi r } = 0 E cijr
{ }=0
{ }
( 6.103 )
2. Las muestras entre diferentes clases son independientes,
{ E {c
{
E mi 1 m j2 = E {mi 1 } E m j2 = 0
1 ij 2 ckl
} }=0
}
E mi r ckls = 0 r s 3. La matriz de covarianzas del vector esperado es diagonal 1 T E ( M r M r )( M r M r ) = Nr r i r r r E mi mj = N r ij
( 6.104 )
{ {
( 6.105 )
donde i(r) es la componente i diagonal de la matriz r, mientras ij es uno cuando i es igual a j, y en caso contrario ser nulo . 4. Los momentos de tercer orden para una distribucin normal son nulos E mi r cklr
}= 0
( 6.106 )
5. Los momentos de orden cuarto para una distribucin normal son i r jr i ji=k j=l r N r 2i i=k = j=l r N 1 0
E cijr ckls
( 6.107 )
DISAM-UPMT-98-015
225
Carlos Platero
Partiendo de la formulacin general y aplicndolo sobre N1(M1,1) y N2(M2,2), se obtiene el sesgo de la funcin introduciendo de ( 6.100 ) a ( 6.107 ) en ( 6.98 ) :
q q 2 2 f 1 tr f E {YY T } = 1 f E y y E {f } = E f i j 2 2 Y 2 i = 1 j = 1 yi y j
{}
} }
n n i 1 2 f 2 f 1 2 n 2 f r 2 r 2 = E {mi } + r E {cii } + r E cijr 2 2 r = 1 i = 1 mi r i = 1 j = 1 cij i = 1 cii r r n n i 1 2 f 2 i r 2 f i j 1 2 n 2 f i r = + r + r 2 r = 1 i = 1 mi r N r i = 1 cii N r 1 i = 1 j = 1 cij N r ( 6.108 )
De la misma forma, la varianza de la funcin estimada se consigue introduciendo de ( 6.100 ) a ( 6.107 ) en ( 6.99 ) Var f
{}
2 n i 1 n n f 2 r f 2i r 2 f i r + r + r =1 m N r =1 c N r 1 =1 =1 c r =1 i i j i ij ii i 2
2 i r jr r N ( 6.109 )
incluso cuando la distribucin no sea normal, ( 6.103 )( 6.104 ) y ( 6.105 ) son vlidas. Sin embargo, el tercer y cuarto orden de momentos, ( 6.106 ) y ( 6.107 ), deben ser modificados por E mi r cklr
}
}
1 Nr
{x
{ { {
xkr xl r
}
i j, i = k , j = l i= j=k =l
( 6.110 )
E c c
(r ) ij
(r ) kl
Var x i( r ) x (j r ) / N ( r ) Var x i( r ) 2 / N ( r ) Cov x ( r ) x ( r ) , x ( r ) x ( r ) / N ( r ) i j k l
Para cualquier otro caso 6.111 ) (
6.2.1.2 Sesgo y la varianza de la distancia de Bhattacharyya Si las dos distribuciones son normales, la distancia de Bhattacharyya da el lmite superior del error de Bayes, , tal como se discuti en 6.1.2.2.1. Retomando la expresin
226
DISAM-UPMT-98-015
Carlos Platero
1 1 + 2 M 2 M1 T 8 2
1 2
1 + 2 2 1 2
( 6.112 )
si Mi y i son estimadas a partir de un nmero de muestras finitas con ( 6.100 ) y ( 6.101 ), el resultado de difiere del verdadero valor. Haciendo uso de las expresiones vistas ( 6.108 ) y ( 6.109 ), es posible calcular el sesgo y la varianza de . Las derivadas de 1 respecto de Mr son :
1 1 = ( 1)r 1 ( M 2 M1 ) M r 4
( 6.113 )
2 1 1 1 = M r2 4
( 6.114 )
donde = ( 1 + 2 ) 2 . Las derivadas de 1 respecto de cij(r), utilizando M = M2M1 queda : mi m j 1 cij 1 = 1 r = 2 ij cijr cij cij i j 16
( 6.115 )
2 (r ) mi2 m 2 2 1 2 1 cij 1 (2 ij ) + j = (r )2 (r ) = (r )2 i j 32i j cij cij cij
( 6.116 ) 6.113 ) a (
siendo cij = cij1 + cij2
6.116 ) en ( 6.108 ) y ( 6.109 ), y realizando una transformacin blanqueante I-, i(1) =1 y i(2) =i quedar: E {1 } = 1 i 2 mi2 1 1 n 1 + i + + + 2 i =1 2( 1 + i ) N 1 N 2 ( 1 + i )3 N 1 1 N 2 1 ( 6.117 )
2 i = (i 1 + i 2 ) 2 . Introduciendo de (
2 2 i 1 n i 1 mi ( 1 + j ) + m j ( 1 + i ) 1 2( 1 + )2(1 + )2 N + N j 2 i =1 j =1 1 i j 2
DISAM-UPMT-98-015
227
Carlos Platero
mi2m2 1 j i n n mi2 1 1 n j i Var 1 = + + + 2 2 2 4 i =1 (1 + i ) N1 N2 i =1 j =1 2(1 + i ) (1 + j ) N1 N2

^
{}
( 6.118 ) De igual proceder es seguido para 2
2 =0 M r 2 2 =0 M r 2 ij 1 2 1 r r = cij 4 i i 2 2 2 ij = cijr 2 4
1 1 r r 2 i j i j
( 6.119 )
( 6.120 )
( 6.121 )
( 6.122 )
El sesgo y la varianza de 2 se consigue insertando de ( 6.119 ) a ( 6.122 ) en las expresiones ( 6.108 ) y ( 6.109 ) queda:
2 1 1 n 2 1 2 i 2 E{ 2 } = 1 + + ( 1 + i )2 N 2 1 4 i =1 ( 1 + i ) 2 N 1 1 i
1 n i 1 2 1 ( 1 + )( 1 + 4 i =1 j =1 i j
1 1 2 + ) N1 i j ( 1 + i )( 1 + j
i j ) N 2
( 6.123 )
Var 2
{ }
^
2 2 1 i 2 1 n 1 1 1 1 = + 2 i =1 ( 1 + i ) 2 N 1 1 ( 1 + i ) 2 i N 2 1
( 6.124 )
Las expresiones ( 6.117 ), ( 6.118 ), ( 6.123 ) y ( 6.124 ) fueron presentadas en el VII Simposium Nacional de Reconocimiento de Formas y Anlisis de Imgenes [Plate97].
228
DISAM-UPMT-98-015
Carlos Platero
6.2.2
Efecto del nmero de muestras en el diseo de clasificadores paramtricos El estudio sobre la influencia de las muestras en el diseo de clasificadores es complicado, y aunque se trata de mantener una expresin de tipo general, las conclusiones definitivas obtenidas harn referencia a clasificadores lineales y cuadrticos. Considerando que las funciones discriminantes dependen de las medias de los grupos, M1 y M2, as como de las matrices de covarianzas, 1 y 2, y que se dispone de un nmero finito de muestras, habindose estimado Mi y i a partir de ellas, el sesgo de h(X) ser : h( X ) = h ( X ) h( X ) = 0( k )
k =1
( 6.125 )
donde h ( X ) = h( X , M1 , M 2 , 1 , 2 ) , h(X) = h(X,M1,M2,1,2) y 0(k) es el k-simo orden del desarrollo de Taylor en trminos de variaciones de Mi y i . Si las muestras siguen distribucin normal y los estimadores son insesgados, Ed {0(1) } = 0 Ed {0( 2 ) } 1 / N Ed {0( 3) } = 0 Ed {0( 4 ) } 1 / N 2 ( 6.126 )
donde E indica la esperanza con respecto a las muestras de diseo, y siendo N1=N2=N el nmero de muestras de diseo, se concluye desde ( 6.125 ) y ( 6.126 ) que: Ed {h( X )} 1 / N Ed {h2 ( X )} 1 / N Ed {h3( X )} = 1 / N 2 Ed {h4 ( X )} 1 / N 26.127 ) (
si N es razonablemente grande, slo interesa E{hm(X)} menor o igual 2. Por otro lado, haciendo uso de la expresin genrica del error :
1 1 + 2 2
e j h ( X ) ~ j p ( X )ddX
( 6.128 )
cuando h sea pequeo, es posible aproximarlo por trminos de hasta segundo orden: ( j )2 h2 X 1 + jh( X ) + ( ) 2
j h ( X )
=e
jh ( X )
jh ( X )
jh ( X )
( 6.129 )
luego, = puede ser aproximada por
DISAM-UPMT-98-015
229
Carlos Platero
1 2
h( X ) +
j 2 h ( X ) e jh ( X ) ~( X ) ddX p 2
( 6.130 )
la esperanza del error respecto al nmero de muestras de diseo ser :
E{} =
1 1 + 2 2
E d e j h ( X ) ~ j p ( X )ddX = +
( 6.131 )
donde se deduce que el sesgo puede ser aproximado a : 1 2
j 2 h ( X ) e jh ( X ) ~ ( X )ddX p h( X ) + 2
( 6.132 )
cuando h es funcin de q parmetros, y1 ,..., yq, h es h
h 1 q q 2h yi + y y y 2 i =1 j =1 yiy j i j i =1 i
q
( 6.133 )
considerando que los estimadores son insesgados, E{yi} = 0, y descartando trminos superiores al segundo orden E {h} E {h
2
1 q q 2h E yi y j 2 i =1 j = 1 yi y j d
{ {
} }
( 6.134 )
} y
i =1 j =1
h h E d yi y j i y j
e introduciendo ( 6.134 ) en ( 6.132 ) 1 2
h h 1 q q 2h y y + j y y Ed yi y j e jh X p X ddX 2 i =1 j =1 i j i j
( 6.135 )
si los parmetros son M1, M2, 1 y 2 de dos distribuciones normales, al aplicar las esperanza de los sesgo de los parmetros queda
230
DISAM-UPMT-98-015
Carlos Platero
1 4
2 2 n n 2h h i r h 2 i r 2h 1 mi r 2 + j mi r N r + ciir 2 + j ciir N r 1 r = i =1 i =1 2 n i 1 h i r jr jh X 2h e + r 2 + j r p X ddX r c cij N ij i =1 j =1 ( 6.136 ) 2
expresin que va a depender de como h este constituida por Mi y i. Obsrvese que el sesgo va a depender del nmero de muestras. Por lo tanto, para estos clasificadores =+ v N
( 6.137 )
donde v vendr definida por la arquitectura del clasificador. Los siguientes prrafos tratan de localizar v para clasificadores cuadrticos y lineales. 6.2.2.1 Sesgo de Clasificadores cuadrticos En el caso de utilizar un clasificador cuadrtico, h(X) ser del tipo 1 1 1 ( X M1 )T 11( X M1 ) 2 ( X M2 )T 21( X M2 ) + 2 2 1 2
hX =
t ( 6.138 )
donde t es el umbral fijado por las probabilidad de los clusters. Para el clculo del sesgo del error se utilizar ( 6.136 ), del que es necesario introducir las derivadas parciales de h respecto a sus parmetros. Haciendo uso de Fukunaga et al [Fukun89] para obtenerlas, se tiene:
h = ( 1)r r X M r M r 2h = ( 1)r +1 r M r2 h 1 = ( 1)r 2 ij cijr 2
( 6.139 )
( 6.140 )
(x
mi r
i r jr
)(x
mjr

ij r i
( 6.141 )
DISAM-UPMT-98-015
231
Carlos Platero
2 ij ( xi mi r 2h r +1 = ( 1) i r 2 jr cijr 2 2
) + (x
2
m jr
r r j
)
2
1 i jr
r
( 6.142 )
donde r = 1,2. Considerando que los datos son transformados sin prdida de generalidad a I-, tal que i(1) = 1, i(2) = junto mi(1) = 0 y mi(2) = mi, e introduciendo de ( 6.139 ) a ( 6.142 ) en ( 6.136 ), el valor de v de ( 6.137 ) para el clasificador llega a ser : vq = donde
2 n 1 2 (xi mi ) f q ( X , ) = ( n + 1) xi i 2 i =1 2 1 n n 2 2 (xi mi ) x j mj + j n + xi x j + i j 2 i =1 j = 1
1 2
X e jh X p X ddX
( 6.143 )
)
2
( 6.144 )
integral extendida en X n-dimensional y en el barrido de la frecuencia. El procedimiento para su determinacin es similar al empleado en el clculo del error visto en 6.1.2.1.1. La integracin de ( 6.143 ) ser llevada a cabo mediante la descomposicin polinmica de momentos no centrados respecto de X. stos son funcin de la frecuencia, habindose transformado la integracin en n+1 dimensional a unidimensional.
6.2.2.1.1 Caso I-I
1
Para el caso de datos I-I es posible obtener una expresin explcita de la integracin de ( 6.143 ). Considerando dos poblaciones normales NX( 0, I ) y NX( 0, M ), se puede escribir e jh ( X ) p( X |i ) como e jh ( X ) p( X |1 ) = 2 M M
T
e M
M /8
1 j N , T N X ( j M , I ) 2 M M
( 6.145 )
Dos grupos normales con matrices idnticas y transformadas a unitaria
232
DISAM-UPMT-98-015
Carlos Platero
e jh ( X ) p( X | 2 ) =
2 MT M
e M
M /8
1 j N , T N X ((1 + j ) M , I ) 2 M M
( 6.146 )
donde N(a,b) y NX(D,K) son funciones de densidad de y X, con un vector de medias a y varianza b para N y con vector de medias D y matriz de covarianza K para NX. Desde la observacin de tener fq(X,) como una combinacin de xik x lj ( k , l 4) , vase con mayor detenimiento para el caso general I-,
( X , ) N X ( D, K ) dX es una
conjuncin de momentos no centrados de NX(D,K). El resultado de la integracin se convierte en un polinomio en
(M ( ) =
i
(M #
+
2 1 (n + 1) M T M n(n + 7) + (5n + 9) M T M + ( M T M ) ( j ) # 4 2
M) n + 5 + 2( M T M ) ( j ) 2 2
2
M) ( M T M ) n + 5 + 3( M T M ) ( j ) 3 2 ( j ) 5 # ( M T M ) ( j ) 4 + 2 2
2 2
( 6.147 )
( ) N
i
donde - y + de # son para i = 1 y 2 respectivamente. De nuevo, la integral
( a , b) d es una combinacin de momentos de N(a,b). Para el caso de p(1) =
p(2) = 0.5, el valor de vq tiene la siguiente expresin analtica vq = 1 4 2M T M e M

T
M /8
2 ( M T M )2 ( M T M ) MT M n + 1 + 1 n + 2 16 2 ( 6.148 )
6.2.2.1.2
Caso I-
Para el caso general ser necesario recurrir al clculo numrico, no habindose determinado ninguna solucin explcita. De la misma manera que en el caso anterior y aplicando el procedimiento visto para el clculo de la funcin caracterstica (6.1.2.1.1) , se pasa simultneamente una diagonalizacin y desplazamiento en los datos, Y = AT ( X M T ) , tal que quedar N1(0,I) y N2(M,), donde
Dos grupos normales con transformacin blanqueante
DISAM-UPMT-98-015
233
Carlos Platero
v qr =
( 1)r +1 p ( r )
2
(Y , ) e j h (Y ) p (Y | r ) dYd
r = 1,2
( 6.149 )
Para su resolucin se considera exclusivamente el caso unidimensional, siendo esta solucin una de las aportaciones de la tesis. Si se analiza las expresiones e jh (Y ) p (Y | r ) para ambos grupos quedar: e j h ( y ) p ( y | 1 ) = 1 1 jy 2 ( 1) jvy + jc = exp y 2 2 2 2 j v (v ) 1 1 exp = Ny , + j c 1 1 1 1 1 - j 1 - j 21 - j 1 - j ( 6.150 ) y para el segundo grupo: e j h ( y ) p ( y | 2 ) = 1 ( y m )2 jy 2 ( 1) jvy + jc = exp 2 2 1 / 2 2 m j v m j v 1 1 m2 exp , + j c Ny 1 2 1 1 - j 1 1 - j 1 1 1/ 2 1 2 j - j ( 6.151 ) 1
donde m m2 1 v= ;c = ln t 2 2
( 6.152 )
observndose que la diferencia respecto a la funcin caracterstica de (6.1.2.1.1) es la insercin de fq(Y,). Pero fq(y,) es un polinomio de yk, con k desde cero a cuatro. ste junto con e jh (Y ) p (Y | r ) representarn el desarrollo en momentos no centrados de j v 1 Ny(,2), que para el caso del grupo 1 ser N Y 1 j ( 1) / , 1 j (1 )/ , m / j v 1 mientras para el grupo 2 se tendr N Y 1 / j ( 1) / , 1 / j ( 1)/ . Todo ello permitir la conversin de ( 6.143 ) en integral unidimensional extendida en la
234
DISAM-UPMT-98-015
Carlos Platero
frecuencia. Para ello habr de tener los momentos no centrados correspondientes a una normal unidimensional Ny(,2), que son E{y} =
3
{ } E {y }= ( + 3 ) E {y }= + 3 + 6
E y2 = 2 + 2
2 4 4 2 4 2
( 6.153 )
insertando dichas expresiones en ( 6.144 ), los polinomios correspondientes sern: j 1 3 ( j v ) 4 6( jv) 2 1 ( ) = + + + 1 + 2 2 4 3 4 j ( 1) j ( 1) j ( 1) 1 1 1 3 ( jv) 2 2 ( j ) mv + 2 j ( 1) j ( 1) 1 1 + + j ( 1) 2 1 1 3 jm 2 1 ( jv ) 2 + 1 + + 2 2 j ( 1) 2 j ( 1) 1 1 2 m jm 3 2 jv 1 m4 m2 + j 1 + 2 j ( 1) 2 2 1 ( 6.154 )
y para el grupo 2 ser:
DISAM-UPMT-98-015
235
Carlos Platero
m m ( j v ) 4 6( jv ) 2 j 1 3 2 ( ) = + + + 1 + 2 2 4 3 4 1 j ( 1) 1 j ( 1) 1 j ( 1) + m 2 ( j v ) 2 m 3 + jv jm 2 1 j ( 1) 1 j ( 1) + + 1 j ( 1) 2 + m ( j v ) 2 1 3 jm 2 1 + 1 + 2 2 1 j ( 1) + 2 1 j ( 1) + 2m jm 3 m 2 jv m4 m2 1 + j 1 + 2 + 2 2 1 j ( 1) + ( 6.155 )
Obteniendo una integral unidimensional definida en el rango de la frecuencia. sta deber ser calculada numricamente. Las expresiones ( 6.154 ) y ( 6.155 ) son aportaciones de esta tesis y son las expresiones genricas para el caso unidimensional. Si se aplica dos poblaciones normales unidimensionales de igual varianza, N1(0,I) y N1(M,I), en estas ecuaciones se obtendrn las conclusiones vistas en ( 6.147 ). Las evaluaciones de estas expresiones sern realizadas en el apartado 6.5
6.2.2.2 Sesgo de clasificadores lineales Al utilizar un clasificador lineal de Fisher con h(X) igual a : h X = ( M 2 M1 ) 1 X +
T
1 ( M T 1 M1 M2T 1 M2 ) 2 1
( 6.156 )
donde = ( 1 + 2 ) 2 y considerando las derivadas parciales de h(X) respecto a sus estimadores, Mi y i , [Fukun89] :
236
DISAM-UPMT-98-015
Carlos Platero
h = ( 1)r 1 X M r M r 2h = ( 1)r + 1 1 M r2 h h cij 1 + ji ijij r = r = cij cij cij 2i j ij
( 6.157 )
( 6.158 )
( 6.159 )
2h 2 h cij = cijr 2 cij2 cijr

donde
2 = 4i j
ij ji ij + ij j i i
( 6.160 )
ij = (mi 2 mi 1 )x j +
y cij = cij1 + cij2
1 1 1 m m mi 2 mj2 2 i j
)
mi 2 = mi , las
i = (i 1 + i 2 ) 2 . En particular, cuando se hace una
transformacin y desplazamiento a I-, i 1 = 1 i 2 = i mi 1 = 0 expresiones ( 6.159 ) y ( 6.160 ) quedan como :
h 2 + r = cij (1 + i ) 1 + j ij ji ij ij
)(
) )
( 6.161 )
2h 4 r 2 = cij (1 + i ) 1 + j
ji ij ij + ij (1 + ) 1 + (1 + i ) i j
( 6.162 )
donde
ij = mi x j
1 m mi m j = i 2 x j m j 2 2
( 6.163 )
Introduciendo de ( 6.157 ) a ( 6.162 ) :
DISAM-UPMT-98-015
237
Carlos Platero
vl = donde:
1 2
f ( X , )e
l
j h ( X )
~ ( X )ddX p
( 6.164 )
n n 1 1 2 mi 1 i mi i j i + + (2 y i mi ) + f l (Y , ) = 3 2 (1 + ) 1 + i 1+ j (1 + i ) j =1 i =1 i n n m (2 y m )( + ) j n yi2 + ( y i mi ) 2 i i j j 1 i j 4 (mi (2 y j m j ) + m j (2 yi mi )) + + 2 i =1 (1 + i )2 (1 + i )2 (1 + j )2 i =1 j =1 ( 6.165 )
siendo fl(Y,) una combinacin lineal de yik (k 2), vl tiene solucin explcita para el caso I-I, resultado: vl = 1 2 2M T M e M
T
M /8
M T M 1 + 4
n 1
( 6.166 )
6.2.2.2.1
Caso I-
Con igual procedimiento que para el clasificador cuadrtico habr de recurrir al clculo numrico y slo se ha efectuado para el caso unidimensional. El planteamiento es similar al clculo de la funcin caracterstica lineal (6.1.2.1.2). Se pasa simultneamente una diagonalizacin y desplazamiento en los datos, Y = AT ( X M T ) , tal que quedar N1(0,I) y N2(M,), donde v lr =
( 1)r +1 p ( r )
2
(Y , ) e j h (Y ) p (Y | r ) dYd
r = 1,2
( 6.167 )
Analizando las expresiones e jh (Y ) p (Y | r ) para ambos grupos quedar: e jh ( y ) p ( y | 1 ) = (v )2 1 1 exp y 2 + jvy + jc = N y ( jv,1)exp + j c 2 2 ( 6.168 ) 2
238
DISAM-UPMT-98-015
Carlos Platero
y para el segundo grupo:

j h ( y )
1 ( y m )2 1 + jvy + jc p( y | 2 ) = exp 2 21 / 2 ( jv )2 = N y ( jv + m, )exp + j (c + vm) 2
( 6.169 )
donde v= m2 2m ;c = +1 1+
( 6.170 )
quedando que fl(y,) es un polinomio de yk, con k desde cero a dos. ste junto con e jh (Y ) p (Y | r ) representar el desarrollo en momentos no centrados de Ny(,2), que para el caso del grupo 1 ser N Y ( j v ,1) , mientras para el grupo 2 se tendr N Y ( j v + m , ) . Todo ello permitir la conversin de ( 6.167 ) en integral unidimensional extendida en la frecuencia. Slo resta obtener los polinomios para los dos grupos: 2 m 2 ( + 2 ) 2 1 m 2 ( + 2 ) 1 4vm( j )2 v ( j )3 1 ( ) = +4 + 4 4 1+ (1 + )2 (1 + ) (1 + ) 4m 2 ( + 2 ) + m 4 ( + 2 ) 4mv( + 2 ) 2m 2 1 1 1 2 ( j ) + + + + 4 3 2 (1 + ) (1 + ) (1 + ) (1 + ) 2 2 1 m ( + ) 1 + 2 1+ (1 + )3 m 2 ( + 2 ) 1 3 ( j )2 + 2 ( ) = ( )(v 2 2 )( j ) + 2 ( )mv 2vm + 4 (1 + )2 (1 + ) m 4 ( + 2 ) 1 mv ( + 2 ) 2m 2 1 + 3 +4 + 2 ( )(m 2 + 2 )( j ) 4 3 2 (1 + ) (1 + ) (1 + ) 1 m 2 ( + 2 ) 1 + +2 1+ (1 + )3 ( 6.172 )
( 6.171 )
1 m 2 ( + 2 ) 1 ( ) = 2 +2 1+ (1 + )4
DISAM-UPMT-98-015
239
Carlos Platero
Obteniendo una integral unidimensional definida en el rango de la frecuencia. sta deber ser calculada numricamente. Estas expresiones ( 6.171 ) y ( 6.172 ) tambin son aportaciones de la tesis. Al igual que el sesgo cuadrtico, el sesgo lineal ser analizado experimentalmente en el apartado 6.5
6.3
Mtodo de parametrizacin de los cluster dos a dos

A continuacin se presenta un novedoso mtodo de parametrizacin de los clusters basados en transformaciones Box Cox, medidas de Bhattacharyya y valoracin a partir del nmero de muestras que se tiene. En el captulo anterior se habl de las transformaciones normalizantes, adems en el anterior punto, se ha estudiado los efectos de estimacin de parmetros con un conjunto de muestras y se ha evaluado el error de Bayes. Slo resta por mencionar consideraciones sobre la seleccin de las caractersticas, para proceder a explicar el mtodo propuesto. Por lo que se presenta a continuacin criterios de diseo sobre la seleccin de las caractersticas para culminar con el clustering paramtrico.
6.3.1
Reduccin de la dimensin: Seleccin de las caractersticas Uno de los problemas clsicos en Reconocimiento de formas es la reduccin de la dimensin del vector de entrada X desde la dimensin L a M, siendo M < L. Tanto en el Anlisis discriminante como en el Reconocimiento de formas, ambos tienen como objetivo buscar filtros que permitan reducir la dimensin del espacio. Una de las ventajas ms notables de la reduccin del vector, consiste en el diseo de clasificadores ms rpidos y menos complejos. La reduccin de la dimensin debe ir acompaada del tipo del problema a resolver y del conocimiento a priori que se tenga del modelo. Sea por ejemplo conocida la relacin entre dos caractersticas del problema concreto, ser solo necesario estimar la funcin de distribucin de una de las dimensin, ya que la otra ser obtenida a partir de la estimada, permitiendo eliminar una de las dimensiones. De otro lado, a menor dimensin menor nmero de muestras es requerido para la generalizacin. En los trabajos experimentales suele suceder que el nmero de muestras del universo sea escaso, lo que obligar a buscar subespacios de dimensiones reducidas. La pregunta de partida es si se puede reducir la dimensin del vector utilizando una muestra del espacio de entrada. La respuesta es $si#, pero siempre y cuando se utilice conocimiento del problema especfico. 6.3.1.1 Extraccin Versus Seleccin La extraccin de las caractersticas es la reduccin del conjunto de medidas que se pueden realizar en la modelizacin de un estado del problema, y a cada una de ellas se las llamar caractersticas. Para obtener esta disminucin de la dimensin suele utilizarse estructuras de datos ms o menos estndar; por ejemplo en Visin artificial suele utilizarse las medidas de Hu, momentos de inercia, centros de gravedad, reas, permetros,.... Algo
240
DISAM-UPMT-98-015
Carlos Platero
ms especfico es dado por Han et al[Han93] que proponen un catlogo de caractersticas para la modelizacin de inspeccin superficial mediante Visin artificial. Intuitivamente se puede decir que a medida de que se tenga ms conocimiento del problema decrecer el tamao del espacio del vector. As si se desea modelar los defectos superficiales, es seguro que el vector de caractersticas a extraer disminuye, si existen direcciones privilegiadas en la formacin de las faltas visuales. En definitiva, en la medida de que se parte de mayor grado de informacin sobre el problema, menor ser el vector y el nmero de muestras necesarias para la representacin del universo. Aun ms, si no hay lugar para la insercin de conocimiento por parte del experto, no habr programa de computador. Por lo tanto, el hombre es, hoy por hoy, la mejor fuente de modelos, el cual podr inferir las relaciones existentes entre las medidas x1, x2, ..., xL y conseguir caractersticas y1, y2, ..., yM , M < L. Desde el punto de vista estadstico, la reduccin de la dimensin deber ser tal que la seleccin, sea, la mejor familia de funciones bases que permitan proyectar desde el espacio L-dimension al M-dimensional, consiguiendo que el subespacio tomado sea "el mejor" en el sentido de reducir la dimensin y mantener una alta prestacin de discriminacin. Usualmente, dos o mas clases sern consideradas a la vez, aunque en esta tesis slo se aborda el enfrentamiento de dos a dos clases, siguiendo con el planteamiento inicial de este captulo. El nivel de discriminacin permitir caracterizar diferencias entre las clases as como dentro de cada propia clase. 6.3.1.2 Seis principios de reduccin de la dimensionalidad En esta seccin se presenta seis principios de reduccin de la dimensionalidad, que van a suponer el soporte para el mtodo de parametrizacin propuesto: 1. Los vectores del espacio de medidas, X, sern utilizados para estimar los vectores y matrices que caractericen la funcin de densidad del grupo, p( X|i ). 2. Si existe la proyeccin desde X SL a YSM, con M < L, no es necesario conocer p(X|i) sino p(Y|i); facilitando la estimacin de los parmetros que caracterizan la funcin de densidad. La eleccin del subespacio ser tal que maximice la separabilidad de las funciones de densidad condicionadas. 3. Como alternativa a los dos primeros principios, referentes a la caracterzacin de las funciones de densidad, este punto hace referencia a que es posible estimar directamente las fronteras de las clases, si se conoce a priori cual es el tipo de frontera entre clases colindantes. Y en el caso de que sea desconocida, en teora podra ser aproximada por la adecuacin de un nmero finito de hiperplanos. 4. La estimacin de las funciones de densidad a partir de un nmero de muestras es extremadamente difcil. Por lo que se sugiere buscar transformaciones que ayuden a parametrizar el espacio de medida.
DISAM-UPMT-98-015
241
Carlos Platero
5. Las medidas debern ser de carcter continuo y discreto. Las medidas discretas servirn para generar regiones de estudio; mientras las caractersticas continuas sern usadas para la caracterizacin de las funciones de densidad en estas regiones. Las componentes discretas debern tener la caracterstica de variar significativamente en el sentido de pasar de una regin a otra alejada; en caso contrario, no estara justificada la componente. 6. Un sexto principio es que las caractersticas deben ser obtenidas como relaciones no lineales entre las medidas y aplicables en toda la regin de estudio. Estas relaciones actan estableciendo regiones equivalentes en el espacio de medida. 6.3.1.3 Reduccin de la dimensin Existen multitud de tcnicas de reduccin de la dimensin tal como se discuten, por ejemplo en [Patri72][Raube95]. El origen se encuentra en buscar la transformacin de SL a SM, tal que teniendo Ni muestras de cada clase, formadas por vectores XSL al ser mapeados a vectores YSM, sean clasificados con mayor rapidez y menor complejidad. En definitiva, el objetivo ltimo de la reduccin es mejorar la calidad del clasificador en un compromiso entre la velocidad, generalizacin y capacidad de discriminacin. Bajo estas pautas, las lneas generales en el desarrollo de sistemas de seleccin de caractersticas sern las siguientes: 1. En general, la reduccin de la dimensin debe ser local; las transformaciones sern aplicadas a regiones del espacio de observacin, raramente se aplicar de forma global. Una regin para estos propsitos, se define como el conjunto de puntos de XSF al que se le aplica la misma transformacin de reduccin de la dimensin. 2. Las medidas tomadas sobre el espacio de observacin al proyectarse desde SF a SL deben de aumentar las distancias entre las clases. Si las transformaciones de las componente utilizan conocimiento a priori, existe la posibilidad de buscar el marco de transformaciones que aumenta la distancia entre ellas. 3. Para algunas regiones, la reduccin de la dimensin puede venir por una simple transformacin lineal; por ejemplo, uso de las primeras componentes principales ms discriminantes. No obstante, desde el puntos de vista general no sern tan afortunados estos tipos de cambio, recurdese, por ejemplo, que la distancia de Mahalanobis es invariante ante transformaciones lineales. 4. Las relaciones entre las medidas ( componentes del vector X ) varan de una clase a otra; esta generalidad puede ser usada para discriminar clases. Apoyando el criterio de bsqueda de filtros no lineales para cada clase. 5. La dimensin de la clase i transformada ser menor al rango de la matriz de covarianza estimada, i , dentro del entorno local concerniente. Esta disminucin local de
242
DISAM-UPMT-98-015
Carlos Platero
la dimensin puede ser usada por la clase i sin perdida de informacin. Hay excepciones a esta definicin. 6. Las relaciones no lineales entre las componentes de X pueden proporcionar la eliminacin de algunas regiones, permitiendo generar marcos interregionales de discriminacin. En definitiva, ciertas regiones obtenidas por el anlisis de clustering, pueden ser unidas a tenor de las reducciones planteadas y buscar funciones discriminantes con otras regiones colindantes desde una plataforma conjunta. 7. Cuando la dimensin del vector es grande, se puede utilizar un mtodo de reduccin basado en subconjutos de medidas, tal que se destile la correlacin entre stos y genere una jerarqua de disminucin de la dimensin. 8. La etapa final estar formada por una cierta distancia, di(X), sintctica, estadstica, borrosa,..., y un comparador. Bajo estas reflexiones se propone una metodologa de clustering paramtrico con seleccin de las caractersticas, mediante transformaciones Box Cox y distancia de Bhattacharyya, esto es, la propuesta busca transformaciones no lineales de subespacios de regiones, tal que sean normales, lo que permitir su parametrizacin, y que adems tengan el menor error de clasificacin a partir del nmero de muestras. 6.3.2 Clustering paramtrico La modelizacin de cada uno de los cluster mediante algn tipo de funcin de densidad conocida puede ser planteada desde las transformaciones Box Cox (ver prrafo 5.3.2). Dichas transformaciones tratan de convertir la distribucin de la poblacin en normal. La expresin es : x jk + m k 1 = k x jk + m
x k jk
k 0
k = 0
( 6.173 )
siendo xjk la muestra j de la componente k y m se elige de forma que para cualquier x + m sea siempre positivo. Para la determinacin del vector hay que maximizar el estadstico L, siendo L() :n Lmax = N 2 + k 1
k =1 j =1 n N
x jk
( 6.174 )
donde N es el nmero de muestras, n la dimensin del espacio y () la matriz de covarianza estimada de las variables transformadas. El procedimiento de localizacin de ptimo ha sido estudiado por Velilla et al[Velilla94]. No obstante, implican transformaciones diferentes en cada cluster y por lo tanto con niveles de medida distintos
DISAM-UPMT-98-015
243
Carlos Platero
entre ellos. Ante esta tesitura, el planteamiento alternativo consiste en la transformacin conjunta dentro de una regin determinada, con el objetivo de preservar una medida del espacio acotado que sea comn. El fundamento se basa en las localizaciones de las ptimas transformaciones Box Cox marginales. El sesgo del estimador de las transformaciones, L(), sigue una 2 con n grados de libertad (ver prrafo 5.3.6). Este hecho permite buscar cual es la transformacin, si existe, capaz de convertir la distribucin en los diferentes grupos como normal. La solucin ser ms difcil en la medida de que participe ms grupos. Por este motivo, el estudio se ha centrado en la parametrizacin dos a dos de los cluster. Considerando que slo hay dos clases, c = 1,2, se trata de comprobar la posibilidad de transformacin Box Cox comn marginal. Sea la caracterstica i, i = 1,2, ...,n, y llamando i1* y i2* las soluciones ptimas marginales para cada grupo. Es posible definir un i* comn, si cumple que: 1 2 1 ( 1 ) L(* ) i 2 1 Lmax (*2 ) 12 ( 2 ) L(* ) i i 2 i > c Lmax (*1 ) i
( 6.175 )
siendo i el ndice de confianza, capaz de construir un intervalo para el valor de la funcin de verosimilitud en el verdadero valor de , mientras c implicar el nivel crtico. De otro lado, al tratar con distribuciones marginales 2 ser de un grado de libertad. La localizacin del ptimo entre las dos distribuciones, es impuesto por la condicin de igualdad en los niveles de confianza. No tendra sentido que fuesen distintas ya que significara aproximarla ms a una que a otra en la distribucin normal marginal. Sin prdida de generalidad, sean etiquetados los grupos como 2 y 1 tal que cumplan i2* > i1*. Obsrvese que la solucin estar en el intervalo [ i1* i2* ], y al ser L(i) una funcin convexa, continua y su derivada tambin continua, Lmax(i2* ) L(i2) es montona decreciente y Lmax(i1* ) - L(i1) es montona creciente, ambas mayor o igual a cero en el intervalo. Implicando una nica solucin,
L()
* i1
* i2
Figura 6.6 Localizacin ptima de
correspondiente a:
244
DISAM-UPMT-98-015
Carlos Platero
L max ( i 2 ) L max ( i1 ) =
^ ^ N2 N * * ln( 2 ( i ) 2 ) + 1 ln( 1 ( i ) 2 ) 2 2 N2 N1 * * *1 *2 + ( i 1) ln x ji ln x ji i i i j =1 j =1
( 6.176 )
siendo N1 y N2 el nmero de muestras de cada cluster 6.3.2.1 Seleccin de las caractersticas transformadas Despus de haber localizado las posibles transformaciones marginales en la regin, definida por los dos cluster de enfrentamiento, se sugiere realizar una primera criba. No todas las componentes tendrn transformacin al no cumplir ( 6.175 ). Seguidamente es buscado el espacio que cumpla normalidad en los dos cluster, maximice la distancia de Bhattacharyya, y la medida tenga mnimo sesgo y varianza, pues dicha medida ha sido determinada por un conjunto de muestras finito. n Aunque la bsqueda del ptimo espacio pudiera parecer explosiva, por ser m combinaciones con m = 1 ,..., n, al aplicar la condicin necesaria, de que cualquier subconjunto debe ser tambin normal, limitar las posibilidades de exploracin. Para el examen de los 0 posibles espacios, ha sido utilizado el algoritmo visto en 3 4 5 1 2 5.3.1.3. El procedimiento genera un rbol de los posibles espacios normales. La figura 6.7 muestra un grfico de 3 5 5 como queda la exploracin con una dimensin n = 5, las aspas indican que no ha pasado el test de normalidad. Los posibles recorridos del rbol desde la raz hasta cada nivel determinarn las posibles soluciones del espacio. Figura 6.7 Arbol de Una buena medida para ahorrar tiempo computacional es exploracin de espacios ordenar las caractersticas de menor a mayor ndice de normales normalidad, llamando 1 a la caracterstica de menor normalidad y n la de mayor ndice marginal de normalidad.
2 3 5 3 5 5
6.3.2.2 Distancia de Bhattacharyya, sesgo y varianza Una vez generado el rbol de los posibles espacios normales de caractersticas transformadas, se puede utilizar la distancia de Bhattacharyya como lmite superior del error de Bayes:
DISAM-UPMT-98-015
245
Carlos Platero
1 1 + 2 M 2 M1 T 8 2
1 2
1 + 2 2 1 2
( 6.177 )
El primer y segundo trmino, 1 y 2, miden la distancia entre dos distribuciones debido a las medias y a las covarianzas. Cuando Mi y i son determinados mediante un conjunto finito de muestras, el resultado de difiere de su verdadero valor. Por lo que habr de calcular el sesgo y la varianza. Haciendo uso de la metodologa expuesta, sobre la influencia del tamao de las muestras en la distancia de Bhattacharyya, se obtuvo expresiones del sesgo y la varianza para cualquier poblacin normal N1(1 1), N2(2 2) inferida con N1 y N2 tamaos de muestras. Aunque paso previo, y sin perdida de generalizacin, las poblaciones deben ser desplazadas y transformadas, tal que las matrices de covarianza sean diagonalizadas a I- (whitening transformation), quedando stas en N1(0,I) y N2(M, ). Con esta distancia, junto al sesgo y la varianza se determinar cual es el ptimo espacio transformado.
6.4
Clasificadores no paramtricos: mtodo de aprendizaje supervisado LVQ

De entre los mtodos no paramtricos se ha estudiado el algoritmo LVQ. La motivacin viene dada por la tendencia de colocar hiperplanos de separacin en los bordes de Bayes, adems de ser un algoritmo basado en aprendizaje mediante muestras. Por lo explicado hasta este punto, este mtodo cognitivo resulta ser interesante pues aun siendo no paramtrico, en su convergencia utilizada hiperplanos tal que tienden a minimizar el error de Bayes. Todo ello conduce a explorar este algoritmo por las motivaciones que lleva esta tesis. De hecho, por los estudios realizados sobre clasificadores paramtricos, se va a llevar a realizar una propuesta de modificacin en este algoritmo, perfectamente encuadrado y comprensible por el trabajo realizado. En este apartado se explica los fundamentos del algoritmo as como su convergencia, para pasar a continuacin a mostrar las motivaciones y el desarrollo de las modificaciones propuestas sobre el algoritmo LVQ.
6.4.1
Introduccin Learning Vector Quantization (LVQ) es una clase de algoritmos de aprendizaje prximos al VQ y al SOM. Mientras VQ y SOM son mtodos de aprendizaje no supervisados, LVQ responde al entrenamiento supervisado. Adems, a diferencia del
246
DISAM-UPMT-98-015
Carlos Platero
SOM, el algoritmo LVQ en el entrenamiento de los codebook vectors3, no se definen entornos de vecindad alrededor del ganador. LVQ genera regiones clases dentro del espacio de los datos de entrada, utilizando un subconjunto de codebooks etiquetados para cada clase. Las regiones de cuantizacin, similar a los conjunto de Voronoi en VQ, son definidas por hiperplanos entre codebooks vecinos. En definitiva, los bordes de las clases estn constituidos por segmentos lineales 6.4.1.1 Teora de decisin ptima Como se ha comentado repetidas veces, el problema de la decisin ptima est encuadrada dentro de la teora bayesiana. Partiendo de un conjunto finito de muestras para cada clase y definiendo las funciones discriminantes como : hk ( X ) = p ( X | k ) p ( k ) ( 6.178 )
de manera que ante una nueva muestra, sta quedar clasificada en la case c utilizando la condicin de : hc X =
max h
k
( 6.179 )
Los mtodos paramtricos en Reconocimiento de formas, primero intentan modelar el espacio y luego utilizar ( 6.179 ). La filosofa de LVQ es distinta, en una etapa inicial se asignan un subconjunto de vectores a cada clase k, y la clasificacin se otorga por la mnima distancia eucldea entre una muestra y un codebook. Aqu no es importante la aproximacin a la funcin de densidad condicional, p(X|k), sino que el lugar del codebook, Mi, dentro del espacio de los datos minimice el error esperado de clasificacin. 6.4.2 Algoritmo LVQ Suponiendo que estn etiquetados los codebooks, la regla de clasificacin est basado en la vecindad, pudiendo ser expresado como : c = indice min X M i
( 6.180 )
donde c es la etiqueta patrn de la neurona ganadora, y slo depende de X y Mi. Considerando X(t) una variable aleatoria y Mi(t) una secuencia de valores Mi en el dominio discreto del tiempo, t = 0,1,2,.., los valores de Mi en ( 6.180 ) que minimice el error de
Nombre utilizado para los vectores de LVQ
DISAM-UPMT-98-015
247
Carlos Platero
clasificacin, se encuentra en los valores asintticos del proceso de aprendizaje del LVQ. Las ecuaciones que definen la evolucin del algoritmo son: M c (t + 1) = M c (t ) + (t ) X (t ) M c (t )
Si X t M c t k Si X t k y M c t r
( 6.181 ) ( 6.182 )
M c (t + 1) = M c (t ) (t ) X (t ) M c (t )
Mi (t + 1) = Mi (t ) Si i c
( 6.183 )
recibiendo el nombre de LVQ1. Aqu (t) es un factor de aprendizaje, comprendido entre 0 y 1. Su funcin es montonamente decreciente con el tiempo, siendo recomendado que (t) empiece con un valor bastante pequeo, por ejemplo 0.01. No obstante, (t) no es crtico, pudindose elegir una funcin decreciente lineal que tienda a cero. 6.4.2.1 Convergencia del algoritmo La demostracin de que el algoritmo tienda a minimizar el error de clasificacin es extremadamente difcil. La siguiente exposicin se basa en la propiedad del VQ como algoritmo que tiende aproximarse a p(X). Si VQ en vez de acercarse a la funcin de densidad de la variable de entrada, p(X), lo hiciera sobre los bordes de Bayes, y las expresiones obtenidas resultaran ser similares a [( 6.181 )-( 6.183 )], mostrara la capacidad el algoritmo LVQ de ser un clasificador no paramtrico con mnimo error de clasificacin. Primero habr que localizar una nueva funcin de densidad, f(X), que sea definida con la condicin de tener todos los bordes bayesianos nulos. Por ejemplo, la expresin de abajo cumple con el requisito impuesto : f (X ) = p (X | k ) p ( k ) max h [ p( X | h ) p ( h )] k h ( 6.184 )
248
DISAM-UPMT-98-015
Carlos Platero
Donde k es la clase ganadora segn ( 6.178 ). La Figura 6.8 indica la forma de f(X) en el caso unidimensional para tres clases. En la parte superior aparecen los P(X) bordes bayesianos con lneas a trazos. La funcin f(X) es cero en las posiciones frontera, de acuerdo con ( 6.184 ) y en caso contrario cumple f(X) > 0.
f(X)
Al utilizar VQ para aproximar el punto de densidad de Mi a f(X), implica que esta densidad tender a cero en todos los bordes de Bayes. Con ( 6.184 ) y VQ se definen los bordes bayesianos con un buen nivel de acierto, dependiendo del nmero de Figura 6.8 (a) Distribucin de las muestras en vectores usados.
tres clases. (b) Representacin de f(X)
Los valores ptimos de Mi, en el mtodo clsico VQ, se determinarn minimizando el error de cuantizacin esperado, E. El gradiente de E, tal como se vio en 5.1.1.4 es:
Mi E = 2 ci ( X Mi )p( X )dX
( 6.185 )
en esta ecuacin ci es el delta de Kronecker, y c es el ndice de Mi que est ms cercano a la muestra de entrada X. En cada entrenamiento, el codebook ser modificado de la siguiente manera : Mi (t + 1) = Mi (t ) mi (t ) E ( 6.186 )
ser M i (t ) E = 2ci [ X (t ) Mi (t )] . Un resultado es obvio de la ecuacin ( 6.185 ): slo el
en donde define el tamao del paso, y el valor de la funcin muestro, M i E en t,
ganador Mc(t), debe ser actualizado mientras el resto mantendrn el mismo valor durante el paso. Si p(X) en E, es reemplazada por f(X), el gradiente debe ser calculado en dos pasos separados, cuando la muestra X(t) pertenezca a k y en el caso de X(t) pertenezca a h, por la definicin de la nueva funcin de densidad. El gradiente de E, cambiando p(X) por f(X) quedar como:
DISAM-UPMT-98-015
249
Carlos Platero
M i E = 2 ci (X M i ) f (X )dX =
= 2 ci (X M i ) p(X | k ) p( k ) max[ p(X | h ) p( h )] dX

h
( 6.187 )
Cuando X(t)k, la funcin de muestreo de M i E M i (t ) E = 2ci [ X (t ) Mi (t )] ( 6.188 )
Si la clase con max h [ p (X | h ) p ( h )], es nombrada con el ndice r, y en el caso que X(t) r, la funcin M(t)E se obtiene con la probabilidad a priori p( r ) y queda una expresin como la que sigue : M i (t ) E = +2ci [ X (t ) Mi (t )] Reescribiendo la funcin ( t ) = 2 , se obtienen los siguientes resultados : M c (t + 1) = M c (t ) + (t ) X (t ) M c (t ) Si X t Bk y X t k M c (t + 1) = M c (t ) (t ) X (t ) M c (t ) Si X t Bk y X t r M c (t + 1) = M c (t ) Si X t Bk y X t h h r Mi (t + 1) = Mi (t ) Si i c ( 6.189 )
( 6.190 ) ( 6.191 ) ( 6.192 ) ( 6.193 )
donde Bk define la regin del espacio de k con mnimo error. Si el codebook Mi de la clase k estaba ya en la regin Bk , y se tiene en cuenta la forma de la funcin f(X) en la Figura 6.8.b), el codebook Mi k debe aproximarse por el mtodo VQ a ser representativo en Bk, al menos si los pasos de aprendizaje son pequeos. Cerca del equilibrio, las expresiones ( 6.181 ) a ( 6.183 ) y ( 6.190 ) a ( 6.193 ) tienden a ser similares. No obstante, en LVQ la clasificacin se aproxima mediante reglas de cercana en vecindad, y stas mejorarn sus prestaciones de clasificacin con el aprendizaje. Sin embargo, cuando las muestras estn cerca de los bordes de Bayes, el mtodo VQ es diferente a LVQ1. En VQ, existe modificacin del codebook si Mi es el segundo ms cercano. Pero en LVQ, este efecto es indiferente, los vectores son actualizados en cualquier caso de incorrecta clasificacin. Estas diferencias pueden causar pequeos sesgos en los valores asintticos de Mi dentro del LVQ1. A razn de este fenmeno, los algoritmos LVQ2 y LVQ3, que sern presentados seguidamente, tienden a parecerse ms a VQ en este sentido.
250
DISAM-UPMT-98-015
Carlos Platero
6.4.2.2 Optimizacin del factor de aprendizaje en LVQ1 (OLVQ1) El algoritmo bsico de LVQ1 puede ser modificado en el factor de aprendizaje. La mejora viene al dar diferentes factores de aprendizaje para cada codebook, a diferencia del anterior que era comn. Las expresiones de ( 6.181 ) a ( 6.183 ) quedan : M c (t + 1) = M c (t ) + c (t ) X (t ) M c (t ) M c (t + 1) = M c (t ) c (t ) X (t ) M c (t )
[ [
Si X t M c t k Si X t k y M c t r
( 6.194 ) ( 6.195 )
Mi (t + 1) = Mi (t ) Si i c
( 6.196 )
Para determinar el valor de i(t), capaz de acelerar el proceso de convergencia, se empezar con redefinir el algoritmo de aprendizaje de la forma : M c (t + 1) = 1 s t c t M c (t ) + s t c (t ) X (t )
( 6.197 )
donde s(t)= +1 si la clasificacin es correcta, y s(t) = -1 en caso contrario. Es evidente que la exactitud estadstica del aprendizaje de los codebook, vendr dado por la igualdad de peso en la presentacin de todas las muestras. En consecuencia, si las muestras son enseadas en tiempos diferentes, la correccin debe ir en el sentido de mantener la misma importancia. Obsrvese que Mc(t) contiene toda la trama de muestras desde t igual a 1 hasta t-1. Adems, Mc(t) contiene el vector X(t-1) escalado, y tambin tendr la trama de los valores anteriores debido al termino Mc(t-1). En cada uno de los aprendizajes que se llevan a cabo durante el entrenamiento, la magnitud de aprendizaje del vector X(t) se debe disminuir progresivamente a travs del factor c(t). As en el mismo momento de actualizar Mc(t) tambin habr decrecido el termino de X(t-1) por el factor 1 s( t ) c (t ) c ( t 1) . Por lo que se puede concluir que estos dos factores que disminuyen progresivamente los valores de X, deben ser idnticos:
c t = 1 s t c t c t 1
( 6.198 )
Si en estas condiciones se hacen para todo t, por induccin se puede ver que las trazas de los primeros valores han sido escalados de una manera similar que las ltimas. El factor de aprendizaje quedar como :
c t =
c (t 1) 1 + s(t )c (t 1)
( 6.199 )
Es necesario tener cuidado con el valor de c(t), porque puede incrementarse, y es importante que no sobrepase en ningn momento el valor de 1. Esta condicin es impuesta
DISAM-UPMT-98-015
251
Carlos Platero
por el algoritmo. Para valores iniciales de i , se puede tomar 0.5, pero en muchos casos es mejor tomar un valor prximo a 0.3. Estas modificaciones que se han llevado a cabo en el algoritmo LVQ1, no pueden ser llevadas en el algoritmo LVQ2, porque este algoritmo no es ms que una aproximacin parcial de las ecuaciones de VQ, y en caso de aplicar al algoritmo LVQ3, ste debera ser llamado OLVQ3. 6.4.2.3 LVQ2 El anterior algoritmo puede ser fcilmente modificado para mejorar la filosofa de decisin bayesiana. La forma de clasificar es idntica que en LVQ1, pero en el aprendizaje, este algoritmo es diferente. Se toman dos codebooks Mi y Mj, que estn prximos entre s y pertenecientes a clases distintas. Inicialmente, parte del espacio de los datos estarn etiquetados incorrectamente. La superficie de separacin es siempre definido como un hiperplano entre Mi y Mj. Definiendo una ventana simtrica no cero alrededor del este borde, y X M M generando correcciones en Mi y Mj, cuando al caer una muestra X lo haga justamente en el lado incorrecto de la ventana. Estas modificaciones Figura 6.9 Ilustracin de la ventana movern a los codebooks y por tanto desplazarn al utilizado en LVQ2 y LVQ3 hiperplano de separacin.
i j
En principio, uno de los dos codebooks debe pertenecer a la clase correcta, mientras que el otro pertenecer a una clase diferente. La muestra debe caer dentro de la ventana, que vendr definida por un ancho w. Si se denominan di y dj a las distancia entre Mi y Mj con X respectivamente, se define la anchura de la ventana, w, segn la siguiente expresin: d dj 1 w min i , > s en donde s = d d 1+ w j i
( 6.200 )
normalmente es recomendable utilizar una ventana con una anchura de 0.2 o 0.3. Cuando una muestra cae dentro de la ventana se aplicar : M i t + 1 = M i t t X t Mi t
]
]
( 6.201 ) ( 6.202 )
M j (t + 1) = M j (t ) + (t ) X (t ) M j (t )
donde Mi, Mj son los codebooks ms prximos a X, de forma que X y Mj tengan la misma etiqueta, y X y Mi pertenezcan a clases distintas. La aplicacin de las expresiones
252
DISAM-UPMT-98-015
Carlos Platero
( 6.201 ) y ( 6.202 ) har tender asintticamente el hiperplano de separacin al borde bayesiano 6.4.2.4 LVQ3 El algoritmo LVQ2 est basado en la idea de un desplazamiento de los bordes de decisin hasta el ptimo de Bayes, mientras que no se prest atencin alguna a la posicin del codebook Mi a lo largo del proceso. Por lo que parece necesario introducir algunas correcciones que aseguren que Mi se contine aproximando fielmente a la funcin f(X). Combinando algunas ideas, se puede obtener una algoritmo mejorado al que se ha llamado LVQ3 : M i t + 1 = M i t t X t Mi t Mj t + 1 = Mj t + t X t Mj t
( 6.203 )
( 6.204 )
donde Mi y Mj son los dos codebooks ms prximos a la muestra de entrada X, y Mj pertenece a la misma clase que X, mientras que Mi pertenece a una clase diferente, adems X debe estar contenida dentro de la ventana anteriormente definida. Aadindose la ecuacin de acercamiento a f(X) : M k (t + 1) = M k (t ) + (t )[X (t ) M k (t )] ( 6.205 )
para k {i , j} , si X, Mi , y Mj pertenecen al la misma clase. El valor de debe estar comprendido entre 0.1 y 0.5, y parece que depende del tamao de la ventana. Este algoritmo parece que se estabiliza por si mismo, puesto que la localizacin ptima de Mi no cambia en un aprendizaje continuado. 6.4.3 Modificaciones realizadas en el algoritmo LVQ1 Los distintos algoritmos LVQ vistos utilizan la distancia eucldea para determinar cul es el codebook ms cercano. Como consecuencia de este proceder, se obtendr un clasificador lineal, de manera que la separacin entre las diferentes clases vendrn determinadas por un conjunto de hiperplanos. En la figura adjunta se muestra dos poblaciones binormales las cuales son separadas por los vectores del LVQ, que tratan de alinearse alrededor del borde de Bayes.
DISAM-UPMT-98-015
253
Carlos Platero
Figura 6.10 Separacin de dos poblaciones normales mediante LVQ
Si en vez de utilizar la distancia eucldea se utilizase la distancia de Mahalanobis, un nico vector de referencia sera necesario. Se ha pasado del clasificador lineal al cuadrtico. Recurdese el planteamiento anterior de transformaciones normalizantes, por lo que es vlido suponer tener regiones de grupos con distribuciones normales. La modificacin propuesta es utilizar la distancia de Mahalanobis en vez de la distancia eucldea. Partiendo de la definicin de esta medida: d i = (X M i ) i1 (X M i )
2 T
( 6.206 )
donde X es la muestra de entrada, Mi el vector de media del codebook, as como i es la matriz de covarianzas asociada al codebook. Tanto el vector de medias como la matriz de covarianzas vendrn definidas por las muestras de entrenamiento. El algoritmo propuesto tiene la siguiente mecnica, una vez calculada la distancia de Mahalanobis entre la nueva muestra y cada uno de los vectores existentes, habr de determinar si la muestra de entrada pertenece a la misma clase que el vector ganador, siendo ste aquel de menor distancia de Mahalanobis entre la muestra y el codebook. A continuacin se pasar a modificar tanto el vector de medias como la matriz de covarianzas asociados al coodebook ganador. Y de forma similar al OLVQ1, la variacin vendr dada por el parmetro (t) que ir decreciendo monotnicamente en el tiempo. Para la obtencin de los algoritmos de modificacin del vector de medias y de la matriz de covarianzas, se ha definido el error de cuantizacin a partir de la distancia de Mahalanobis, E:
E = (X M c ) c 1 (X M c ) p ( X )dX T
( 6.207 )
254
DISAM-UPMT-98-015
Carlos Platero
de esta manera se podr definir: M c (t + 1) = M c (t ) + s (t ) (t ) M c E (t ) ( 6.208 )
c (t + 1) = c (t ) + s (t ) (t ) c E (t )
donde s(t) es +1 cuando coinciden las etiquetas entre la muestra y el vector y 1 en caso contrario. Haciendo uso del anexo de derivadas parciales sobre funciones potenciales [Fukun90], y considerando que la mejor aproximacin del gradiente en la muestra t es la distancia de Mahalanobis, quedar como: E (t ) = c 1T (t ) + c 1 (t ) M M c
M = X (t ) M c (t )
E (t ) = c 1 (t ) MM T + MM T c
) ) (t ) diag ( (t )(MM ) (t )))

T 1 c 1 c T 1 c
( 6.209 )
El valor del parmetro (t), as como su ley de decrecimiento es muy importante y crtico en la convergencia de este algoritmo. Como ley de decrecimiento de (t) se ha tomado la siguiente: (t ) 1 + (t ) si la muestra est clasificada correctamente (t + 1) = (t ) si la muestra est clasificada incorrectamente 1 (t )
( 6.210 )
DISAM-UPMT-98-015
255
Carlos Platero
6.5
Aplicacin a la clasificacin de defectos locales en planchas de aluminio colado

Las tcnicas comentadas han sido implementadas en la clasificacin de defectos locales en planchas de aluminio colado. Partiendo de los resultados experimentales del captulo 5, se ha procedido de la siguiente forma: 1. Parametrizacin dos a dos de los clusters segn mtodo presentado en 6.3. 2. Diseo de los clasificadores paramtricos a partir de los resultados obtenidos en el anterior punto y segn se vio en 6.1 y 6.2. 3. Experimentos de convergencia del algoritmo modificado OLVQ y diseo de los clasificadores no paramtricos segn este algoritmo. 4. Comparacin de los mtodos presentados con otras tcnicas tradicionales de clasificacin. A continuacin se presentan los resultados del trabajo experimental.
6.5.1
Parametrizacin dos a dos de los cluster segn mtodo presentado en 6.3 Tras la obtencin de los clusters mediante las tcnicas de anlisis exploratorio de los datos visto en el anterior captulo y basado en los mapa de Kohonen, las U-Matriz, la descripcin de los patrones, y los subespacios normales, se paso a la parametrizacin y seleccin de las caractersticas. Los resultado del anlisis de los datos queda reflejado en la figura 6.11. En el mapa aparecen 12 grupos distintos; las neuronas etiquetadas con XX son aquellas en las que no ha sido posible inferir informacin estadstica, por el bajo nmero de muestras activadas en la neurona. Mientras, las etiquetas YY corresponden con neuronas confusas, coexistiendo muestras de diferentes clases. De este anlisis de los datos se da un enfrentamiento de dos a dos de los clusters, tal que son vecinos pero les corresponden etiquetas distintas de tipos de defectos (ver figura 6.11.b). Seguidamente se pas al mtodo propuesto como sigue: Eliminacin de la componentes discretas, esta operacin se hizo mediante la meda, tal como se vio en 5.4.2. Posteriormente se paso a una preseleccin de las variables continuas con el mtodo univar [Guine91] y manova [Coole71]. Los test de normalidad fueron realizados con el contraste de Shapiro, con niveles de significacin mayores a 0.25. Aceptndose la normalidad con la condicin de distribuciones marginales proyectadas sobre componentes principales y cumpliendo la desigualdad de Bonferroni.
256
DISAM-UPMT-98-015
Carlos Platero
Figura 6.11 a) Grupos obtenidos despus de aplicar el mtodo Cluster: 1- Bandas transversales oscuras pequeas, 2- Bandas transversales oscuras medianas, 3- Manchas oscuras, 4- Araazos, 5- Bandas longitudinales oscuras medianas 6- bandas longitudinales oscuras grandes, 7- Faltas de material, 8 - Faltas de material grande, 9- Cristalizacin anormal I 10- Cristalizacin anormal II 11- Pegado de rodillos, 12- Bandas brillantes. b) Enfrentamiento entre clusters adyacentes
El cuadro 6.1 muestra un ejemplo del mtodo, aplicado a la regin comprendida entre los cluster 6-9. Despus de haber eliminado las componentes sin informacin estadsticas y haber hecho la preseleccin de las variables restantes, se localizan las transformaciones Box Cox marginales tanto del cluster A como B.
Clases consideradas 6 9 Variables a considerar (meda) 4 11 1 3 5 2 17 Valor del criterio (Univar) 0.76 0.32 0.13 0.27 2.16 22 -28 marginales para A: 10 -4.33 6.96 9.99 8.97 9.99 9.99 Variables Eliminadas (por bajo c): 3 17 marginales para B: -4.48 0.44 2.2 4.24 9.99 Variables Eliminadas (por bajo c): * "optima" 1.96 0.89 0 6.21 5 Cuadro 6.1
Del cuadro se desprende que las componentes 4, 11, 1, 5 y 2 tienen transformaciones marginales Box Cox comunes, cuyas ptimas son 1.96, -0.89, 0, 6.21 y 5 respectivamente. A continuacin se pasa a la bsqueda de subespacios comunes de normalidad para ambos grupos, segn el rbol exploratorio de subespacios normales visto en 5.3.1.3. Al final quedar un conjunto de subespacios transformados y normales, de los cuales sern seleccionados aquellos que tengan mayor distancia de Bhattacharyya, con menor sesgo y varianza a partir del nmero de muestras que se
DISAM-UPMT-98-015
257
Carlos Platero
tenga para la regin, tal como se vio en 6.3. Los resultados pueden ser contemplados en la tabla 6.1:
Tabla 6.1 i ndice de confianza, error superior de Bayes, distancia de Bhattacharyya, y Var() sesgo y varianza de la distancia 1 0.44 0.65 0.78 0.46 0.54 2 0.96 0.58 0.58 0.37 0.95 (%) 2.68 1.55 19.3 2.98 0 2.84 3.39 0.87 2.74 10.7 1 0.38 0.61 0.09 0.34 1.41 2 Var(1) Var(2) Compo nentes 0.03 1.22 0 4 0.31 1.44 0.02 4 11 0.03 0.08 0.02 11 0.04 1.04 0.007 1 0.03 13.3 0 5
Para el resto de los clusters es aplicado igual mtodo, resultando la siguiente tabla 6.2 :
Tabla 6.2 Resultados del mtodo de clustering paramtrico Clases consideradas 1-4 1-5 2-5 2-6 3-9 4-7 5-7 5-8 6-8 6-9 7-12 8-10 8-11 9-10 10-11 -0.87 -1.69 -0.50 0.63 2.52 1.45 1.08 -6.10 2.06 1.96 -0.92 5.38 6.09 3.73 -6.18 1 0.32 0.33 0.32 0.67 0.67 0.34 0.41 0.55 0.45 0.44 0.88 0.56 0.31 0.97 0.94 2 0.46 0.46 0.48 0.43 0.96 0.67 0.62 0.40 0.43 0.96 0.42 0.87 0.40 0.48 0.54 (%) 0.17 0.15 0.13 8.98 3.51 0.77 0.34 11.7 0 2.68 11.6 3.61 22.4 0.53 9.77 5.57 5.77 5.83 1.53 2.44 4.15 4.88 1.38 8.95 2.84 1.25 3.61 0.78 4.37 1.59 1 0.44 0.85 0.55 0.11 0.89 0.21 0.33 0.30 3.91 0.38 0.15 1.2 0.14 1.02 0.78 2 Var(1) Var(2) Compo nentes 0.01 2.43 0.01 5 0.01 4.79 0 5 0.02 3.28 0 5 0.04 0.18 0.02 4 0.01 2.05 0 5 0.01 0.95 0 5 0.02 1.64 0.01 4 0.04 0.52 0 4 0 28.11 0.04 2 0.03 1.22 0 4 0.02 0.26 0 9 0.06 3.98 0.02 9 0.02 0.08 0.04 4 0.04 4.09 0 5 0 0.97 0.04 12
6.5.2
Diseo de los clasificadores paramtricos Una vez parametrizado el espacio para cada uno de los dos grupos enfrentado, se pasa al diseado tanto de los clasificadores cuadrticos como lineales, cuyas expresiones paramtricas corresponden a:
258
DISAM-UPMT-98-015
Carlos Platero
hX =
1 1 X M1 T 1 1 X M1 X M2 T 2 1 X M2 + 2 2 1 2 1 2
( ) p( )
p 1
2
( 6.211 )
1 h( X ) = ( M2 M1 ) T 1 X + ( M1T 1 M1 M2T 1 M2 ) 2
( 6.212 )
La primera referente al cuadrtico y la segunda a un clasificador lineal de Fisher. Para cada clasificador local, tanto cuadrtico como lineal, se calcular su error utilizando el mtodo visto en 6.1.2.1. De la misma manera y haciendo uso del mtodo presentado en 6.2.2 se calcula para ambos el sesgo producido, como consecuencia de las estimaciones realizadas a partir de un conjunto finito de muestras. Pero antes de entrar en los resultados para el diseo de los clasificadores paramtricos del aluminio, se debe verificar las conclusiones obtenidas en los apartados 6.1.2.1, 6.2.2.1 junto a 6.2.2.2 sobre los clculos del error y de los sesgos para dos poblaciones normales I-. Con tal fin se va a realizar un conjunto de experimentos relacionados con los procedimientos esgrimidos para el clculo del error y del sesgo. El primer experimento consiste en calcular el error y el sesgo de dos poblaciones normales en donde se va incrementando el nmero de muestras de ambas. Se inicia con dos grupos de dimensin unidimensional y de varianza unitaria, separadas sus medias en dos unidades, esto es, N1(0,1) y N(2,1), colocndose la condicin de igualdad de probabilidad para ambos grupos, p( 1 ) = p( 2 ) = 1 . Desde el punto de vista terico, 2 los errores de Bayes coinciden tanto en el clasificador lineal como en el cuadrtico, adems de corresponder para estas condiciones con igual error en cada grupo, 1 = 2 = 7,935% , luego el error total ser de 15,87% . Las muestras en ambos grupos van creciendo por igual y son valores aleatorios tomados de las dos normales. Los resultados de aplicar los procedimientos vistos de clculo del error y del sesgo son mostrados en la figura 6.12.
Figura 6.12 Error y sesgo para poblaciones normales de igual varianza DISAM-UPMT-98-015 259
Carlos Platero
Mostrando la validez del clculo del error y la tendencia del sesgo a disminuir con el nmero de muestras. El segundo experimento es similar al primero, pero esta vez se utiliza dos poblaciones de covarianzas distintas. Se trata de dos poblaciones normales con N1(0,1) y N2(3,2), manteniendo el mismo nmero de muestras para cada grupo. El error de Bayes para el clasificador cuadrtico ser de 5.375% tanto para el primer grupo como para el segundo. Mientras en el clasificador lineal el error de primer grupo es de 3.345% y el del segundo es de 7.23%. La figura 6.13 muestra los resultados de la evolucin del error y el sesgo con el nmero de muestras.
Figura 6.13 Error y sesgo para poblaciones normales de distinta varianza
La tercera prueba ha consistido en comparar los resultados de aplicar el mtodo para la determinacin del sesgo segn las propuestas recogidas en esta tesis, con las expresiones analticas (6.148) y (6.166) referentes al sesgo de clasificadores cuadrticos y lineales para poblaciones normales I-I. La validacin vienen dada entre los resultados dados por el clculo numrico para el caso especfico de I-I con las expresiones analticas. A continuacin se muestran las pruebas realizadas respecto a la distancia entre grupos de covarianza unidad y separado sus medias en M:
Tabla 6.3 Sesgo cuadrtico, comparacin entre la expresin analtica (6.148) y el mtodo de 6.2.2.1 M (6.148) 6.2.2.1 1 0.0935 0.0935 2 0.0605 0.0605 3 0.0654 0.0654 4 0.0574 0.0574 5 0.0351 0.0351 6 0.0151 0.0151 7 0.0047 0.0047 8 0.0011 0.0011 9 0.0002 0.0002 10 0.0001 0.0000
260
DISAM-UPMT-98-015
Carlos Platero
Tabla 6.4 Sesgo lineal, , comparacin entre la expresin analtica (6.166) y el mtodo de 6.2.2.2
M
A B
1
0.0440 0.0440
2
0.0605 0.0605
3
0.0486 0.0486
4
0.0270 0.0270
5
0.0110 0.0110
6
0.0033 0.0033
7
0.0008 0.0008
8
0.0001 0.0001
9
0.0000 0.0000
10
0.0000 0.0000
Por ltimo, la tabla 6.5 muestra los resultados obtenidos tanto de error como de sesgo para clasificadores paramtricos cuadrticos como lineales.
Tabla 6.5 Resultados de los clasificadores paramtricos tanto cuadrticos como lineales: Box Cox (), error de Bhattacharyya, error cuadrtico estimado, sesgo cuadrtico estimado, error cuadrtico, error lineal estimado, sesgo lineal estimado, error lineal Clases consideradas 1-4 1-5 2-5 2-6 3-9 4-7 5-7 5-8 6-8 6-9 7-12 8-10 8-11 9-10 10-11 -0.87 -1.69 -0.50 0.63 2.52 1.45 1.08 -6.10 2.06 1.96 -0.92 5.38 6.09 3.73 -6.18 s(%) q(%) 0.17 0.15 0.13 8.98 3.51 0.77 0.34 11.7 0 2.68 11.6 3.61 22.4 0.53 9.77 1.79 4.86 0.70 11.76 4.17 35.10 10.06 26.85 3.34 1.96 12.67 32.64 12.73 23.29 12.95 q(%) qt(%) 0.03 5.26 0.86 0.40 0.41 0.56 0.16 0.73 40.37 27.72 2.37 13.09 33.21 23.45 l(%) 3.34 0.47 0.34 28.48 18.21 29.86 0.16 30.52 7.16 0.75 17.08 31.14 0.47 40.22 41.14 l(%) 2.20 0.25 0 0.18 0.07 0.08 2.37 0.64 1.89 0.26 0.28 0.27 52.28 0.04 0.21 lt(%) 5.55 0.72 0.34 28.66 18.28 29.95 2.53 31.16 9.06 1.02 17.37 31.42 52.76 40.26 41.35
Las rayas indican que el sesgo calculado para el clasificador cuadrtico era muy elevado, por lo que no se hace factible su construccin. Obsrvese la viabilidad de los clasificadores lineales de Fisher ante los cuadrticos, stos se muestran ms robustos con el nmero de muestras utilizados, conclusin tambin esbozada con las componentes de la distancia de Bhattacharyya, ya que predominaba el efecto de 1 respecto a 2. Las discrepancias entre el error superior de Bhattacharyya y los calculados numricamente son debido a que la distancia de Bhattacharyya considera que las probabilidades de los grupos enfrentados son iguales, p(1) = p(2), y que el mximo se da a s = 0.5, ver 6.1.2.2.
DISAM-UPMT-98-015
261
Carlos Platero
6.5.3
Modificacin del algoritmo no paramtrico OLVQ Con el objeto de comprobar el correcto funcionamiento de las modificaciones realizadas sobre el algoritmo LVQ, se realizaron una serie de pruebas para confirmar el correcto funcionamiento del mismo. Con este propsito se particularizo el estudio para el caso unidimensional, ya que sus expresiones resultan fciles de analizar. De esta manera, las expresiones de aprendizaje quedan como: mc (t + 1) = mc (t ) + s (t ) (t ) x mc (t ) c2 (t )
2
( 6.213 )
x mc (t ) (t + 1) = (t ) + s (t ) (t ) 2 (t ) c
2 c 2 c
( 6.214 )
donde s(t) es +1 si coinciden las etiquetas de las muestras con los vectores de aprendizaje y s(t) es 1 en caso contrario. Para el anlisis del algoritmo propuesto se estudia el efecto de la convergencia considerando una sola neurona y un slo grupo. Para el caso de mantener constante la varianza, la regla de actualizacin correspondera al OLVQ1. Mayor atencin se precisa sobre la evolucin de la covarianza. Si se estudia la convergencia de la expresin ( 6.213 ) para el caso de un nico grupo, se desprende que la variacin de c2 con el tiempo es montonamente creciente con independencia del tipo de distribucin del cluster. Efecto que muestra la falta de convergencia del algoritmo. Ante esta evidencia se propone efectuar la siguiente modificacin:
c2 (t + 1) =
1 2 c2 (t )( N (t ) 1) + r (t )(x mc (t ) ) N (t )
( 6.215 )
siendo r(t) +1 en el caso de pertenecer la muestra al grupo y 0 en caso contrario. Esta nueva expresin viene avalada por la propia definicin de varianza, donde se ha tomado la media segn ( 6.213 ) como la mejor estimacin de sta en el instante t. Otro aspecto estudiado son los valores iniciales de las medias y las covarianzas. Segn las pruebas realizadas a partir de poblaciones normales y uniformes, el algoritmo converge partiendo de valores aleatorio. Sin embargo, se ha observado que si los valores iniciales son tomados segn las medias y covarianzas de la poblacin de aprendizaje de cada grupo, el nmero de iteraciones requeridos para la convergencia disminuye.
262
DISAM-UPMT-98-015
Carlos Platero
A continuacin se presenta algunos de los experimentos realizados. El primero consiste en observar como ante una poblacin normal de media cero y covarianza uno, la neurona converge partiendo de valores aleatorios.
Figura 6.14 Convergencia del algoritmo propuesto para una poblacin normal N(0,1).
Otros de los experimentos realizados es la comparacin de los resultados de clasificacin entre los paramtricos y los no paramtricos. Con tal propsito se va a ver el error de clasificacin para dos poblaciones con distribucin normal y con distribucin uniforme. Para los clasificadores paramtricos se ha utilizado el cuadrtico de ( 6.211 ) y el lineal de ( 6.212 ), cuyos parmetros han sido estimados con una poblacin de 1000 muestras para cada grupo. Estas poblaciones tambin sirvieron para el entrenamiento de los algoritmos OLVQ y el propuesto. Para la fase de test se dispuso de 3000 muestras para cada grupo y cada tipo de funcin de distribucin. En la tabla 6.6 muestra el nmero de muestras mal clasificadas respecto a las 6000 totales para cada uno de los clasificadores.
Tabla 6.6 Comparacin de los diferentes clasificadores para dos grupos con distribuciones normales y uniformes Clasificador Cuadrtico Lineal OLVQ Propuesto N1(0,1)-N2(1,1) 1824 1824 1848 1869 N1(0,1)-N2(1,1) U1(0-1)U2(1-2) U1(0,1)-N2(0,3) 1 13 12 1 13 7 13 48 1536 1001 1222 1194
DISAM-UPMT-98-015
263
Carlos Platero
6.5.4
Comparacin con otras tcnicas tradicionales de clasificacin En la evolucin temporal del proyecto para la deteccin y clasificacin de los defectos locales en el aluminio colado, se trabaj en la confeccin de un sistema hbrido, esto es, la conjuncin de diferente tcnicas de Inteligencia artificial para la clasificacin de patrones[Kanal92]. Las razones venan avaladas por varios motivos, necesidad de exactitud en la clasificacin y el tiempo para la clasificacin no era crtico, por lo que se pudo intervenir con distintos caminos para el reconocimiento, en este caso se utiliz uso de redes neuronales MLP y LVQ, adems de sistemas basados en reglas. Esta actitud permiti con posterioridad facilitar el proceso de comparacin entre las diferentes tcnicas de clasificacin, tanto las tradicionales como las aqu propuestas. La bsqueda de subsistemas de clasificacin con caractersticas complementaras hizo elegir las tcnicas a emplear. La estructura de informacin basadas en primitivas (ver 5.4) aconsejaba el uso de gramticas de libre contexto, por tanto se dise un bloque basado en reglas de produccin y adems se abri una lnea de trabajo de diseo de reglas con antecedentes borrosos[Plate94][Ruiz92]. Artculos con caractersticas parecidas a la solucin de este problema abogaban por el uso de redes neuronales de retropropagacin[Sikka92]. Adems se utilizo el algoritmo LVQ por ser un clasificador prximo a Bayes. De esta etapa de anlisis sali como resultado el primer nivel de clasificacin, formado por: 1. Sistemas basados en reglas. Uso de gramticas de libre contexto para cada tipo de defecto. MLPs con algoritmos de aprendizaje de retropropagacin por su capacidad de generalizacin. Red LVQ por ser un clasificador basado en el vecino ms cercano.
2.
3.
En un estadio superior de clasificacin se encontraba un supervisor neuronal que elaborara la conclusin definitiva, implementado por un MLP con algoritmo de retroalimentacin. Esta red supervisora se alimentaba de las salidas de los tres anteriores clasificadores. Los resultados que se obtuvieron fueron muy buenos, tal como se expresa en las tablas 6.7 y 6.8, por lo que tambin servirn para ser comparados con los algoritmos propuestos. No obstante, no existe una expresin del sesgo tal como se ha utilizado en los clasificadores paramtricos
264
DISAM-UPMT-98-015
Carlos Platero
Tabla 6.7 Resultados a cinco defectos Tipo defecto Pegado de rodillos Faltas de material Bandas longitudinales Bandas transversales Cristalizacin anormal MLP 88 86 100 97 89 LVQ 87.5 95.5 95 100 66.7 Sintctico 100 100 100 94 68 Supervisor 100 100 100 94 68 Paramtrico 80.8 82.5 86.6 88.6 77.5
Tabla 6.8 Resultados a ocho tipos de defectos Tipo defecto Pegado de rodillos Bandas brillante Falta de material pequeo Falta de material grande Bandas longitudinales Araazos Bandas transversales Cristalizacin anormal MLP 88 100 86 LVQ 75 100 94.7 Sintctico 88 100 100 Supervisor 88 100 100 Paramtrico 80 82.6 82.5
83
66
66
83
84
88.9
68
68
90.8
72 97 89
54.5 100 66.7
100 94 68
100 94 68
82.5 88.6 77.5
6.6
Conclusiones
Se ha presentado el desarrollo de un nuevo modelo de parametrizacin, seleccin de las caractersticas y clasificacin, en las que se considera tanto el nmero de muestras cmo el error de clasificacin, y en la que se favorece la insercin de conocimiento a priori. El modelo se apoya sobre un anlisis exploratorio de los datos, el cual fue recogido en el captulo 5.
DISAM-UPMT-98-015
265
Carlos Platero
El nuevo mtodo se basa en la parametrizacin de dos clusters enfrentados entre s con etiquetas distintas. La regin definida por ambos grupos es transformada a un subespacio, con las caractersticas de normalidad para cada grupo y en menor error de Bayes posible, atendiendo al nmero de muestras. Para ello, se busca la transformacin Box Cox ptima marginal, de la que se aprovecha la utilizacin del intervalo de confianza para la caracterstica transformada en los dos clusters, localizando el ptimo comn. A ello le acompaa la distancia de Bhattacharyya, que determinar un lmite superior del error de Bayes. Esta informacin ser utilizada para determinar el subespacio comn ms discriminante. Pero no slo se utiliza la distancia, sino que adems se calcula el sesgo y la varianza de la medida, con el objeto de conocer la validez de la medida considerando el nmero de muestras. Adems, orientar el diseo hacia clasificadores lineales o cuadrticos, segn el valor de 1 o 2. Una vez que han sido determinadas las parametrizaciones de los grupos, se pasa al diseo de los clasificadores, de los que tambin se ha trabajado en la localizacin del error y de su sesgo. Se han obtenido expresiones analticas tanto de los parmetros del clasificador como del error y del sesgo, todo ello para grupos que tienen distribuciones normales I-, siendo stas algunas de las aportaciones de esta tesis. A tenor del trabajo realizado se plantea la modificacin del algoritmo no paramtrico LVQ. Un estudio sobre este mtodo cognitivo concluye que los codebooks tienden a situarse en la frontera de Bayes, mediante uso de hiperplanos, los cuales se presentan como clasificadores lineales. Si en vez de utilizar la distancia eucldea se utiliza la de Mahalanobis, es posible el paso de clasificadores lineales a cuadrticos. Esta modificacin ha sido estudiada. Por ltimo, el trabajo experimental ha estado basado en la clasificacin de defectos locales en el aluminio colado. Este problema ha servido como bancada de trabajo para el diseo de los clasificadores, tanto de tcnicas tradicionales como las propuestas aqu recogidas. Las conclusiones obtenidas muestran que el mtodo propuesto ayuda a introducir conocimiento a priori, haciendo los clasificadores ms exactos y generalistas que aquellos basados tanto en reglas como en ejemplos. La explicacin viene dada por el hecho de tener expresiones analticas que muestran con objetividad las caractersticas de cada subespacio en funcin del error y del nmero de nuestras del universo. Obviamente este proceder no puede ser dado por los mtodos tradicionales. Aunque los mtodos leave-one-out o holdout son lmites superiores de error, stos no opinan sobre el sesgo del error, esto es, no consideran el nmero de muestras. Tampoco buscan por si mismos la seleccin de las caractersticas.
266
DISAM-UPMT-98-015
Carlos Platero
Captulo 7: Aplicaciones industriales de la tesis

7.1
Aplicaciones industriales de la tesis
En el devenir de esta tesis se han implementado dos SIVA industriales. El primero por orden cronolgico y en el periodo comprendido del 92 al 96, se trabaj en el diseo de un SIVA aplicado al aluminio colado. Y el segundo, elaborado en el plazo transcurrido del 97 al 98, se ha centrado en la determinacin de defectos locales en la pasta de papel. Ambos proyectos han servido de bancada para el trabajo experimental y en el fragor de estos desarrollos nacieron las motivaciones que han sido presentadas a lo largo de esta tesis. Por eso, este captulo tiene como objetivo mostrar los resultados a modo de aplicaciones industriales. Presentndose en primer lugar el SIVA diseado para el aluminio colado y luego el SIVA realizado para la pasta de papel
Inspeccin visual del aluminio colado

El SIVA que se muestra a continuacin ha sido desarrollado dentro del proyecto BRITE Euram 4336, On line Quality Control of Cast Aluminum Alloys, y ste se encuentra instalado en la factora de COMSAL del grupo ALUMIX, en Portovesme, Cerdea, Italia.
DISAM-UPMT-98-015
267
Carlos Platero
7.1.1
Proceso de obtencin del aluminio colado El proceso de obtencin de planchas de aluminio comienza a partir del aluminio fundido, con algunas de las siguientes aleaciones: Al 1050A (Al, 0.25% Si, 0.40% Fe) Al 8079 Al 3030 (Al, 0.25% a 0.30 Si, 0.70 a 0.90% Fe) (Al, 0.25% Si, 0.40% Fe)
La aleacin, se mantiene en el horno a una temperatura entre 690C y 710C, y se hace descender del mismo, por gravedad, hasta los cilindro del moldeo ( caster ) en donde, por contacto, solidifica a una temperatura entre 200C y 270C, adoptando la forma de una plancha de 7 mm de grosor y un ancho entre 1500 y 1670 mm que se bobina en unidades de hasta 40 toneladas. La plancha as obtenida es laminada posteriormente, en etapas sucesivas, para obtener lminas de aluminio de diferentes grosores, hasta un espesor mnimo de 5 micras. El proceso de moldeo (casting) se ha optimizado hasta el punto de llevarse a cabo en una lnea totalmente automatizada, que incluye mezcladores de aleacin, tolvas de llenado, horno, desgasificador, rodillos de moldeo, y seccin de enrollado. El moldeo es controlado desde una estacin de trabajo, denominada supervisor, en la cual se ajustan los parmetros del proceso, que incluyen, como los ms significativos, la temperatura del horno, el flujo del aluminio fundido hacia la boquilla de alimentacin de los cilindros, la velocidad de los cilindros de moldeo, la presin relativa entre los cilindros de moldeo, la temperatura de entrada y salida del agua que refrigera los cilindros de moldeo, el par de traccin que ejerce la bobinadora y los niveles de gas en el aluminio fundido. Desde el supervisor se monitoriza el estado de los parmetros y es posible establecer valores de consignas para los mismos, que son transferidos al proceso de moldeo mediante un controlador programable multitarea, capaz de conducir el proceso en funcin del modelo asignado. Sin embargo, la nica tarea realizada por operadores humanos es la de inspeccin del producto, constituida por las siguientes operaciones: 1. Espesor de la plancha. A este efecto, se toman medidas peridicas con micrmetros y se lleva un registro por bobina producida. Se toman aproximadamente 100 medidas en las secciones laterales y central de la plancha. 2. Acabado superficial. Se necesitan conocer las variaciones de rugosidad de la superficie. Se clasifica en acabado fino, esto es, rugosidad media superficial de 50 micras, acabado normal (75 micras) y acabado basto, superior a 75 micras. El acabado fino, consigna deseable, se produce con los rodillos de moldeo recin reparados y en condiciones ptimas de lubrificacin. En situaciones de acabado basto es necesario advertir a los operarios del moldeo que verifiquen
268
DISAM-UPMT-98-015
Carlos Platero
las causas y, o bien cambien los cilindros, o bien se ajuste el sistema de lubrificacin. El acabado superficial se evala analizando muestras obtenidas peridicamente, seccionando la plancha y haciendo un estudio de rugosidad de la superficie fuera de lnea. 3. Presencia de defectos en la superficie de la pancha por ambas caras. Es necesario detectar los defectos de la superficie, pues condicionan el destino de la bobina en cuanto al nivel de laminacin a que puede someterse (a mayor calidad, mayor nivel es posible de laminacin) o, en su caso, la baja calidad de la bobina har que se la destine de nuevo al fundido. Estos defectos se detectan por inspeccin visual de la pancha de aluminio y su temprana deteccin permitir actuar adecuadamente sobre los parmetros de la lnea, indicados en el epgrafe anterior. 4. Temperatura con la cual la superficie de aluminio abandona los cilindros de moldeo. La temperatura con la que la plancha abandona los rodillos de moldeo, junto con su uniformidad en la seccin transversal, condicionan las propiedades mecnicas de la misma, fundamentales stas para el posterior proceso de laminado. La temperatura se verifica peridicamente por contacto de doce puntos a lo largo del perfil transversal de la plancha. De esta realidad nace el mencionado proyecto europeo, con vocacin de automatizar la inspeccin del proceso. A tal fin, se propone el sistema de control llamado Qualicast, y que se muestra en la figura 7.1. ste consta de dos grandes bloques funcionales: 1. Sistema de inspeccin no destructivo. Compuesto por un sistema de inspeccin visual automatizado, para la deteccin y anlisis de defectos visuales y determinacin del acabado superficial; un sistema de infrarrojos, para la obtencin del mapa de distribucin de temperatura de la superficie y un sistema de corrientes inducidas, para la determinacin del espesor de la plancha de aluminio. 2. Sistema supervisor, formando por un sistema experto, el cual decide tanto la calidad de la plancha de aluminio producida, como las acciones correctoras que son necesarias de efectuar ante anomalas detectadas. De estos dos bloque funcionales, slo se ha participado en la construccin y diseo del SIVA. Por lo que se presenta a continuacin los resultados del SIVA implementado.
DISAM-UPMT-98-015
269
Carlos Platero
Figura 7.1 Sistema de control Qualicast
7.1.2
SIVA aplicado a las planchas de aluminio colado Las tareas de inspeccin visual se efectan para verificar el acabado superficial y para detectar las faltas locales en las planchas, como ha sido comentado anteriormente. Se muestra a continuacin el catlogo de defectos crticos en la aplicacin, junto con una fotografa de la apariencia tpica.
Figura 7.3 Plancha sin defecto.
Figura 7.2 Inclusin de gas. Lneas finas brillantes de 0.5 mm de grosor tpico.
270
DISAM-UPMT-98-015
Carlos Platero
Figura 7.7 Cristalizacin anormal. Bandas opacas longitudinales con espesores desde 1 mm hasta varios cm.
Figura 7.6 Faltas de material. Desconchones en la plancha desde 1 2 2 mm hasta varios cm .
Figura 7.5 Pegado. Manchas claras debido a la alteracin de la superficie, junto con zonas ms oscuras originadas por alabeo de sta.
Figura 7.4 Grafito. Puntos oscuros de 0.5 a 3 mm de radio.
Las especificaciones para el diseo del sistema de inspeccin visual automatizada, incluyen: 1. Funcionamiento en lnea. Inspeccin de la plancha de dimensin transversal entre 1500 y 1670 mm, por ambas caras, producida a una velocidad de 2m/min. 2. Mnima dimensin de defecto a detectar: 1 mm2, lo cual exige una resolucin mnima de 2 pxeles por milmetro en ambos sentidos, longitudinal y transversal.
DISAM-UPMT-98-015
271
Carlos Platero
3. Deteccin del acabado superficial y de los defectos locales con inspeccin del 100%. 4. Clasificacin de las faltas en lnea Si bien el SIVA adems de la deteccin de los defectos debe determinar el acabado superficial, este ltimo objetivo no ha sido tratado en esta tesis. Para una mayor informacin sobre este asunto ver [Fernn97]. A parte de este aspecto, la implementacin del SIVA para el aluminio colado est constituido por los tres grandes bloques: formacin de imgenes, deteccin de los defectos y clasificacin de los defectos. 7.1.2.1 Formacin de imgenes Los defectos en superficies metlicas se caracterizan por alteraciones en la estructura superficial. Puesto que los defectos que aparecen en las superficies metlicas suponen una deformacin material de las misma, la observacin de la componente especular de la luz reflejada da como resultado la deteccin de defectos locales. Debido al alto coeficiente de reflexin de la luz superficial del aluminio se convierte en necesidad disear un sistema de iluminacin adecuado. Atendiendo a los criterios vistos en el captulo 3, se opt por bateras de cmaras CCD matriciales entrelazadas como las ms apropiadas para la aplicacin, principalmente por dos razones: la velocidad mxima no supera los 2 m/min, lo que permite tener tiempos de integracin hasta 50 ms, junto con una escena de iluminacin cuasi uniforme en bandas transversales, debido a la iluminacin planar transversal. La resolucin utilizada fue de 2 pixel/mm, y el tamao de buffer procesado era de 478 x 501, cubriendo una superficie de 291 mm en la direccin del tren laminado por un ancho de 376 mm. La figura 7.8 muestra la disposicin de Figura 7.8 Formacin de imgenes en la inspeccin del aluminio cmara - iluminacin - superficie. 7.1.2.2 Deteccin de los defectos Una vez obtenida la imagen del aluminio, sta se procesa para encontrar los defectos. Para la localizacin de defectos se realiza un anlisis local, pues debido a la textura y al tipo de iluminacin utilizada no es posible un enfoque global, aunque esta lnea de trabajo fue intentada, realizando operaciones morfolgicas acompaadas de umbralizaciones globales, obteniendo resultados similares pero con mayores tiempos de computacin[Plate92].
272
DISAM-UPMT-98-015
Carlos Platero
La alta rugosidad del aluminio origina en la imagen que pxeles con niveles altos aparecen entremezclados con otro ms bajos. Algunos defectos no producen una variacin significativa en los valores absolutos de nivel de gris, sino que producen una alteracin en la distribucin espacial de los mismos, por lo que se dio el siguiente procesado a la seal. Previo al procesado se adquiere la imagen con la mnima apertura del diafragma y con el mximo nivel de contraste en la digitalizadora, manteniendo el mximo rango dinmico de medida y sin saturaciones. Algoritmos basados en el anlisis textural fueron desarrollados para la deteccin de los defectos[Fernn94], aunque el exceso de tiempo computacional los han descartado en la implementacin final. Segn las conclusiones sobre procesado de imgenes en tiempo real [Lee90], se admite que los mtodos de deteccin basados en parmetros estadsticos de primer y segundo orden son los ptimos para las aplicaciones de Visin artificial. El algoritmo usado se basa en considerar que la distribucin de niveles de grises en una franja transversal depende slo de la materia del producto, esto es, se considera cuasi uniforme la iluminacin por filas; por lo que se aplica un filtro binomial 3x3 y un umbral local. Se considera un pixel procesado, gm,n, no defectuoso aquel que cumpla: mm ,n u i g m,n mm, n + u s ( 7.1 )
siendo mm,n la media del entorno 3 x 3 colocado en m,n, y ui y us las cuantas de niveles de grises alrededor de la media sin considerarlo defetuoso. Las etapas de procesamiento y segmentacin son mnimas, filtrado binomial y comparacin de umbrales locales, segn la expresin ( 7.1 ). El resultado definir tres tipos de categoras: pxeles no defectuosos, pxeles defectuosos con apariencia oscura y pxeles defectuosos con tonalidad clara. La ausencia de defectos en las imgenes segmentadas propiciar la renovacin de los estadsticos, mm,n, con el fin de eliminar errores producidos por las variaciones de luz en la escena con el transcurso del tiempo. En la tabla 7.1 se muestras los resultados de la deteccin segn las conclusiones de Fernndez [Fernn97]. La presencia de pxeles defectuosos originar una etapa posterior de etiquetamiento de objetos, en claros y oscuros. En el caso de que el nmero de objetos etiquetados fuera excesivo, se pasar a aumentar el rango alrededor de la media, es decir, se modificar ui y us. La experiencia ha demostrado que la identificacin de los objetos no requiere de un nmero abultado de objetos, pues la representacin de stos mantiene caractersticas espaciales bien diferenciadas. Por tanto, la umbralizacin es local y de carcter dinmico.
DISAM-UPMT-98-015
273
Carlos Platero
Tabla 7.1 Resultados de la deteccin de defectos en el aluminio Tipo de defecto Inclusin de grafito (Bandas oscuras) Faltas de material Pegado de los rodillos Cristalizacin anormal Inclusin de gas (Bandas brillantes) %deteccin 100% 100% 100% 100% 98.7%
El sistema fsico de procesamiento de imgenes ha sido desarrollado especficamente para esta aplicacin. Se trata de un sistema autnomo diseado por la empresa SECAD, uno de los socios del proyecto BRITE. El hardware se basa en uno o dos DSP IGOR para el tratamiento de imgenes y un procesador principal RISC AMD29240 a 50 MHz. Para la implementacin de los algoritmos se utiliza el compilador cruzado HighC o Cygnus C. Como caractersticas a destacar se dira que tiene tres canales CCIR o RS170, procesamiento a 16 Mpxeles por segundo, 4 entradas y 4 salidas TTL, lneas serie RS232 y RS423, y por supuesto, su bajo precio en comparacin con arquitecturas basadas en PC o en estaciones de trabajo. 7.1.2.3 Clasificacin de los defectos La clasificacin de los defectos locales en el aluminio ha servido de bancada para los trabajos experimentales abordados en los captulos 5 y 6, referindose al anlisis exploratorio de los datos y a la clasificacin de patrones estticos. En ambos captulos queda constancia de las tcnicas implementadas. A modo de resumen se dira que una vez segmentada la imagen y etiquetados los objetos, se hace una representacin de los defectos mediante la aplicacin de mtodos sintcticos (ver 5.4.1), stos sirven para la utilizacin de clasificadores basados en reglas as como para la obtencin del vector de caractersticas. A partir de este vector se pasa a un anlisis de los datos mediante los mapas auto
Figura 7.9 Grupos de los defectos del aluminio: : 1- Bandas transversales oscuras pequeas, 2- Bandas transversales oscuras medianas, 3- Manchas oscuras, 4- Araazos, 5- bandas longitudinales oscuras medianas 6- bandas longitudinales oscuras grandes, 7- Faltas de material grande, 8 - Faltas de material grande, 9- Cristalizacin anormal I 10- Cristalizacin anormal II 11- Pegado de rodillos, 12- Bandas brillantes
274
DISAM-UPMT-98-015
Carlos Platero
organizados, las U-Matriz, la descripcin de los patrones y la bsqueda de espacios normales, cuyos resultados puede verse en la figura 7.9. Uno de los mayores inconvenientes en la clasificacin de los defectos del aluminio era la falta de muestras sobre el universo del problema, en total se contaba con slo 157 faltas registradas, lo que supone un handicap importante. Por eso se ha hecho tanto hincapi en la seleccin de las caractersticas y en la capacidad de generalizacin de los clasificadores, midindose el error de clasificacin y su sesgo a partir del nmero de muestras obtenidas. Para la clasificacin de los defectos se ha utilizado un sistema hbrido, constituido por una red neuronal MLP y otra LVQ ms un clasificador sintctico. Los resultados de estos tres sistemas eran entregados a una MLP supervisora que daba la decisin definitiva. Por ltimo, la tabla 7.2 muestra los resultados de la clasificacin del sistema hbrido que a su vez es comparada con las prestaciones dadas por los clasificadores paramtricos. Las conclusiones de estas tablas pueden ser vistas en 6.5.
Tabla 7.2 Resultados de la clasificacin de defectos Tipo defecto Pegado de rodillos Faltas de material Bandas longitudinales Bandas transversales Cristalizacin anormal MLP 88 86 100 97 89 LVQ 87.5 95.5 95 100 66.7 Sintctico 100 100 100 94 68 Supervisor 100 100 100 94 68 Paramtrico 80.8 82.5 86.6 88.6 77.5
Tipo defecto Pegado de rodillos Falta de material pequeo Falta de material grande Bandas longitudinales Araazos Bandas transversales Bandas brillante Cristalizacin anormal
MLP 88 86 83 84 72 97 100 89
LVQ 75 94.7 0 88.9 54.5 100 100 77.8
Sintctico Supervisor 88 100 66 68 100 94 100 68 88 100 66 68 100 94 100 68
Paramtrico 80 82.5 83 90.8 82.5 88.6 82.6 77.5
DISAM-UPMT-98-015
275
Carlos Platero
7.2
Inspeccin visual de la pasta de papel

Este SIVA ha sido implementado para la cadena de produccin de pasta de papel de la empresa ENCE, ubicada en la provincia de Pontevedra.
7.2.1
Proceso de obtencin de la pasta de papel El proceso de fabricacin consta bsicamente de las etapas siguientes: almacenamiento de madera, descortezado, digestin, tamizado, lavado, deslignificacin con oxgeno, lavado, blanqueo, secado, embalaje y almacenamiento. La materia prima utilizada para la fabricacin de la celulosa es madera de eucalipto. Al llegar es descortezada por va seca, en tambores descortezadores, y se astillan los troncos. Las astillas son tamizadas para mejorar su calidad y su utilizacin en el proceso de coccin y reducir prdidas de fibras. Antes de la digestin, las astillas son tratadas con vapor e impregnadas con leja blanca. La digestin tiene lugar a unos 170C y a una presin de 8 kg/cm2, y en ella se produce la separacin de las fibras por disolucin de la lignina en el licor de coccin. La digestin no es suficiente para eliminar toda la lignina sin destruir la fibra, esto se consigue en las etapas posteriores de blanqueo. Despus de la digestin, la pasta es tamizada y lavada. Para conservar las propiedades de rendimiento y resistencia de la pasta, se termina la coccin cuando se alcanza un contenido de lignina alrededor de un 3%. Antes del blanqueo, se procede a la deslignificacin con oxgeno extrayndose casi el 50% de la lignina restante. Las materias orgnicas e inorgnicas disueltas en la etapa de oxgeno son enviadas a la recuperacin de productos qumicos y utilizadas para producir energa. La deslignificacin con oxgeno reduce as la carga del efluente final del blanqueo. La pasta procedente del lavado se blanquea segn el tipo de producto a producir, habiendo tres formas distintas. stas son: OXY con cloro gas, dixido de cloro y sosa custica, representa el proceso convencional, aunque con un menor consumo de reactivos debido a la deslignificacin con oxgeno; ECF con dixido de cloro, oxgeno y agua oxigenada; y TCF utilizando productos sin cloro, como oxgeno, agua oxigenada, ozono y peroxicidos. Antes de proceder a su secado, la pasta blanqueada se somete a una depuracin final, para eliminar los materiales extraos y mejorar su limpieza y calidad.
7.2.2
Inspeccin de la pasta de papel La calidad de la pasta de papel depende de su blancura, su limpieza y otras caractersticas de produccin y almacenamiento. Adems este control se efecta mediante tcnicas de muestreo, hacindose necesario por el volumen de pasta producido que puede alcanzar hasta las 280.000 toneladas/ao. La calidad es determinada en lnea por seleccin de planchas del lote, aunque es contrastada en laboratorio con un menor nmero de muestras. La aplicacin desarrollada se centra en determinar la limpieza en pasta segn la norma 404 de ENCE. Esta norma tiene como objeto definir la limpieza de pasta como mm 2 de superficie de impurezas por kilogramo de pasta seca. A tal fin se deposita la muestra de
276
DISAM-UPMT-98-015
Carlos Platero
papel ante una exposicin de luz transmitida y se cuenta manualmente las impurezas visibles. La composicin qumica de las impurezas no es un factor determinante a la hora de clasificar la limpieza de la pasta de papel. La mota de suciedad se cuantifica nicamente por su tamao, y se da el valor en mm2 de rea de impurezas por kilogramo de pasta de papel. Sin embargo, que en la pasta de papel no se tome en cuenta de que sustancia se compone las impurezas, no quiere decir que no sea importante distinguir los distintos tipos. Fundamentalmente hay dos formas bsicas de impurezas: impurezas de tipo pitch, procedentes de suciedad en general, esto es, de la que cae en la pasta de papel durante el proceso de produccin ( por ejemplo, la grasa de las mquinas que estn en contacto durante el tamizado, secado, etc.); e impurezas de tipo shive, su composicin es bsicamente celulosa ( cuando las astillas no se disuelven totalmente durante los diferentes procesos de transformacin quedan atrapadas en el interior de la pasta en forma de pequeas motas ). Si bien hay otros tipos de impurezas sus frecuencias son muy reducidas y stos no han sido consideradas. De otro lado, los defectos tipo pitch son ms comunes que los shives, los primero representan casi el 96 % de las impurezas totales. Estos dos tipos de defectos son fciles de diferenciar a simple vista por su color: los defectos tipo pitch tienen un color negro intenso, mientras que los shives son anaranjados, aunque en algunos casos se traten de un naranja muy oscuro. La razn de que tomen este color vienen de que estos ltimos en realidad son pequeas astillas de madera incrustadas dentro de la pasta. Por otra parte, los defectos tipo shive suelen ser de un gran tamao. La presencia de los pitch es mucho ms perjudicial para la calidad final de la pasta que los shives, dado que la pasta de papel se usa como materia prima en procesos siguientes, en los que los shives son fciles de disolver y los pitch no. Y como en la determinacin de la limpieza de la pasta se mete a todos en el mismo grupo, es importante tener control del nmero de defectos de cada tipo que se encuentran. Sin embargo, dado que la presencia de defectos tipo shive es relativamente baja, no se hace imprescindible la determinacin de la clase a la que pertenece. El procedimiento a seguir versa de la siguiente manera, el inspector humano coge una plancha de pasta de papel de 740 x 820 mm, y lo expone a trasluz con una potencia de iluminacin de 756 W, teniendo una intensidad lumnica alrededor de unos 31.000 luxes. El rea iluminada y por tanto de inspeccin es de 500 x 500 mm2, lo que Figura 7.10 Inspeccin visual humana viene a significar que no se inspecciona la totalidad del pliego. Esta operacin se efecta por ambas caras de la hoja. El inspector visual marca las impurezas y en funcin de su tamao le asigna una categora, que puede
DISAM-UPMT-98-015
277
Carlos Platero
ser de tipo P, C, B y A. Estas categoras son reflejadas en la tabla 7.3. Debida a las limitaciones visuales humanas en cuanto a la mtrica, el inspector humano asigna una de estas etiquetas en funcin del tamao que cree tener el defecto, lo que evidencia un cierto nivel de subjetividad. El operario, a su buen juicio, determinar una etiqueta segn estime en que rango de dimensin de rea es la impureza (ver tabla 7.3). Una vez etiquetadas todas las impurezas localizadas en ambas caras, cuenta el nmero de defectos tipo P, C, B y A, ponderando cada clase por el valor de rea asignada, segn se indica en la tabla. De este proceder se saca la superficie total defectuosa que junto con el gramaje de la hoja determinar el nivel de limpieza en pasta .
Tabla 7.3 Clasificacin de los defectos en la pasta de papel Tipo de defecto rea de las impurezas(mm2) Menores a 0.04 (no se encuentran) Entre 0.04 y 0.1 Entre 0.1 y 0.3 Entre 0.3 y 0.8 Mayores a 0.8 rea asignada al defecto(mm2) -
P C B A
0.04 0.1 0.3 1
7.2.3
SIVA implementando para la limpieza de la pasta de papel Atendiendo a la norma 404 de ENCE, relativa a la determinacin de la limpieza en los pliegos de papel, se ha efectuado el diseo de un SIVA para esta tarea. Dicha labor consiste en determinar la limpieza de pasta de papel en mm2 de superficie defectuosa por kilogramo de pasta. Con tal propsito se inspecciona un pliego y se busca visualmente las faltas locales. Para su automatizacin se ha construido la mquina que se ilustra en la figura 7.11. El usuario alimenta al sistema con pliegos de pasta de papel que pueden ir de 740 a 750 mm longitudinales, y de 820 a 840 mm transversales, dimensiones dadas segn las dos cortadoras utilizadas en la fbrica. No obstante, el rango en la mquina puede ser mayor. Una
Figura 7.11 SIVA para la pasta de papel
278
DISAM-UPMT-98-015
Carlos Platero
vez introducido el pliego, la mquina determinar el nivel de limpieza del pliego efectuando una inspeccin sobre una superficie de 280320 mm2. Esta operacin se efecta por cada cara de manera independiente. La arquitectura de la mquina est constituida por una mesa X-Y que desplaza el papel ante el sistema de adquisicin de imgenes. Este modelo fue optado al ofrecer ms garantas que mover solidariamente el binomio cmaras luces. Por dos motivos, primero, el pliego de papel junto con su soporte cristalino, ofrece menor par mecnico que el desplazamiento de cmaras y luces, y en segundo lugar, resulta ms difcil el diseo mecnico que garantice en el movimiento una traslacin mimtica entre las cmaras y las luces, cuestin vital para obtener una escena SIVA de iluminacin uniforme. Por contra, este modo de actuar implica una mayor dimensin del bastidor de la mquina, al producirse un desplazamiento del papel, pero ste es razonablemente pequeo, de 192 mm en direccin X y 219 mm en direccin Y. La mesa X-Y sigue una trayectoria ptima de inspeccin, minimizando el tiempo que tarda en la determinacin de la limpieza en la pasta. La figura 7.12 muestra el recorrido efectuado en filas y columnas de 73 y 48 mm respectivamente. La mesa es manipulada por dos motores de continua de 80 W, uno por cada eje. Cada motor lleva asociado una reductora, calculada segn el par mecnico y la trayectoria de desplazamiento, y de relacin 1:98 para el eje X y 1:68,2 para el eje Y. El control de los motores es efectuado por una tarjeta de potencia de configuracin en puente y control por Figura 7.12 Trayectoria de inspeccin modulacin del ancho del pulso (PWM), junto con una tarjeta de control insertada en una ranura ISA del PC. El modelo de esta tarjeta es SMCC-01 de KELVIN. Como lazo de realimentacin utilizan un encoder de 2000 pulsos por vuelta. Y por cada eje se ha implementado un regulador PD digital. Las trayectorias de desplazamientos se caracterizan por perfiles trapezoidales de velocidad y parablicos de posicionamiento. Adems a la mesa se le ha aadido un circuito elctrico de seguridad, capaz de desconectar la fuente de alimentacin de los motores en caso de prdida de control por parte del programa informtico de inspeccin. Se ha optado por cuatro escenarios paralelos por las siguientes razones: al usar una batera de cmaras entrelazadas supone que los movimientos de la mesa van a ser paso a paso, por las razones esgrimidas en el captulo 3 y que luego sern comentadas en 7.2.3.1. Esto significa que se adquieren las imgenes y mientras se procesan stas, se desplaza la mesa a la siguiente posicin. Se observ que los mayores tiempos de la inspeccin se dedicaban al movimiento de la mesa. Al ser actividades asncronas y en paralelo, se pretenda que el programa informtico tuviera ms informacin entre cada desplazamiento, lo que adems supona reducir el nmero de desplazamientos para cada inspeccin. De otro lado, el nmero de cuatro cmaras viene dado por el nmero de canales multiplexados que
DISAM-UPMT-98-015
279
Carlos Platero
tiene la digitalizadora utilizada, junto con una disposicin geomtrica adecuada para las trayectorias seguidas por la mesa. Este proceder a supuesto una reduccin drstica del tiempo dedicado a la inspeccin de un pliego, prximo a los 42s. Aun as, el mayor cuello de botella sigue siendo la mecnica. El algoritmo de inspeccin sin desplazamientos mecnicos tarda tan slo 11.7 s. La aplicacin informtica corre sobre Windows95, con cdigo a 32 bits y con operaciones MMX para el procesamiento de imgenes. La aplicacin est disponible para migrar a NT4.0. La eleccin de Windows95 fue debida a que en un principio las libreras suministradas por el fabricante de las tarjetas de control sobre motores eran de 16 bits, lo que oblig a un diseo de 32 bits en toda la aplicacin, excepto para el control de los motores que se realizaba bajo cdigo de 16 bits. No obstante, el conocimiento sobre diseo de dispositivos de control (drivers) tanto en NT como en Windows95, hizo posible posteriormente que toda la aplicacin se ejecutase en cdigo a 32 bits. El SIVA implementado sigue la filosofa de esta tesis en cuanto a sus bloques funcionales. Existe un diseo propio tanto para la formacin de imgenes como para la deteccin de los defectos. En cambio, no aparece un bloque especfico de clasificacin de los defectos por las razones esgrimidas en 7.2.2, esto es, al ser mayoritarios los defectos de tipo pitch respecto a los shives, no hay necesidad de distinguirlos. Adems slo interesa la superficie total defectuosa, independientemente del tipo de defecto o de tamao. Aunque est afirmacin lleva matizaciones tal como se ha comentado anteriormente. En todo caso, la mquina al detectar las impurezas, y en funcin de su tamao le asigna una etiqueta tipo P, C, B o A. Sin embargo esta catalogacin es de carcter informativo, pues lo importante es la suma total de rea defectuosa para luego convertirlo en limpieza en pasta. Seguidamente se expone la formacin de la imgenes en el SIVA y cmo se detectan los defectos. 7.2.3.1 Formacin de imgenes La iluminacin de la escena es de luz transmitida, adems para poder aplicar una umbralizacin global se precisa que sea uniforme en el campo de inspeccin de cada cmara, esto es, la luz debe ser cuasi uniforme en una superficie de 73 x 48 mm. Otro inconveniente aadido, es el hecho de tener no slo una escena sino cuatro a la vez, lo que supone acoplamientos lumnicos entre ellas. A tal fin, se han diseado pantallas de separacin lumnica evitando las interferencias entre los diferentes focos. Su diseo fue tratado en el captulo 3, donde se aborda la colocacin de los focos respecto a la superficie as como la disposicin de las pantallas. Por otro lado, las caractersticas de los focos son tambin especiales. Se requera un foco de tipo direccional, uniforme y potente.
Figura 7.13 Sistema de iluminacin
280
DISAM-UPMT-98-015
Carlos Platero
Direccional porque la direccin de la escena es invariante, uniforme para poder aplicar algoritmos de umbralizacin global y potente porque se necesitaba mucha energa lumnica para atravesar la pasta de papel. Recurdese que el operario utiliza una iluminacin de 31.000 luxes. En las pruebas experimentales y para los sensores elegidos, la iluminacin necesaria oscila por encima de los 12.000 luxes. Por todas estas caractersticas se eligi una novedosa clase de lmparas de halogenuros metlicos de PHILIPS, modelo MASTERCOLOR PAR30L. Este foco da una intensidad luminosa de 2400 lmenes, con una potencia de 35 W. Tiene un ngulo mximo de dispersin de 30. En este tipo de lmparas, la temperatura del color permanece estable a lo largo de toda su vida, con un valor de 3000K y una variacin mxima de un 5%. Adems, la vida de las lmparas superan las 5000 horas, volvindolas ideales para la aplicacin realizada. Por otro lado, estas lmparas de descargas pueden ser alimentadas con unas reactancias electrnicas de 90 Hz, permitiendo tener tiempos de integracin en las cmaras de hasta 5 ms. En cuanto a las cmaras, se han elegido de tipo matriciales y entrelazadas, por utilizar inspeccin visual paso a paso, lo que abarata los costes y permite usar mltiples cmaras. El modelo de cmara empleado es una WATEC902A. Respecto a la digitalizadora, es una tarjeta PCI con transferencia en DMA de las imgenes en tiempo real. Su nombre comercial es PULSAR-LC de MATROX, la cual lleva incorporado un multiplexor de cuatro canales. 7.2.3.2 Deteccin de los defectos Por cada desplazamiento se adquieren cuatro imgenes, una por cada cmara. stas son captadas a motor parado, con la mnima apertura de iris, con el AGC de las cmaras activado y con un tiempo de integracin de 20 ms. Los parmetros del digitalizador son contraste e intensidad. El valor de contraste es constante y corresponde con el mximo, mientras la intensidad se autoajusta con la primera imagen adquirida. Su razn viene motivada por las variaciones de gramaje de la pasta, lo que significa que el flujo luminoso refractado vara en funcin de los gramos por mm2 de pasta. A medida de un aumento de gramaje, la cantidad Figura 7.14 Sistema de formacin de de luz transmitida disminuye. Por lo que se imgenes necesita variar el nivel de intensidad de la tarjeta digitalizadora en funcin del gramaje. Esta operacin es automtica y no precisa de intervencin por parte del usuario. Una vez que las cuatro imgenes son almacenadas, se ordena al planificador de trayectorias que se mueva a la siguiente posicin. Simultneamente, el algoritmo de deteccin de defectos locales es pasado sobre las cuatro imgenes adquiridas, cuyo proceder fue explicado en el punto 4.6. Una vez detectada una impureza, se pasa a medir su rea y asignarle una etiqueta en funcin de lo indicado en la tabla 7.3. El rea
DISAM-UPMT-98-015
281
Carlos Platero
defectuosa es sumada a otras reas ya detectadas, y al finalizar la ltima posicin de inspeccin se calcula la limpieza en pasta. 7.2.4 Resultados La mquina fue entregada a ENCE el da 24 de abril de 1998. En los momentos de escribir estas pginas la citada empresa est calibrando los resultados del SIVA, procediendo a comparar la limpieza en pasta del inspector humano con los dados por la mquina. Los resultados preliminares dados por ENCE son mostrados en la figura 7.15
Figura 7.15 Resultados preliminares del SIVA
El ndice de correlacin de los datos con el modelo lineal da un valor de R de 0.7. Las causas de las discrepancias entre el inspector y la mquina vienen dadas por las siguientes motivaciones. En primer lugar, la superficie de inspeccin utilizada por el operario y la mquina son distintas. En segundo lugar, el contraste entre la mquina y el inspector est basada en 186 pliegos, de las que la mquina detect 673 defectos y el inspector 649, pero la discrepancia viene dada por la catalogacin de los defectos. Mientras el SIVA clasific 38 tipos A y 132 tipo B, el inspector slo encontr 6 A y 67 B. Esta discrepancia viene dada por el efecto lupa, que el inspector elimina raspando la pasta de papel, accin que no realiza la mquina. De otro lado, se ha constatado la muy buena precisin de las medidas por parte de la mquina. Mientras el inspector humano utiliza una plantilla para determinar el tamao del defecto y adems redondea, la precisin de la mquina en sus medidas es una de sus mejores virtudes. Tambin se ha observado que el bajo tiempo dedicado para cada pliego, 42 s., cumple con las exigencias de la fbrica. No obstante, el algoritmo de inspeccin slo necesita 11.7 s., por lo que se puede plantear mejorar la mecnica de desplazamiento.
282
DISAM-UPMT-98-015
Carlos Platero
7.3
Conclusiones
Se han presentado dos SIVA industriales, uno dedicado a la inspeccin del aluminio colado y otro a la pasta de papel. Ambos han servido como marco de referencia para el trabajo experimental realizado en el transcurso de esta tesis. Se observa que la inspeccin visual de superficies planas y homogneas, simple para un inspector humano, resulta compleja de automatizar. La riqueza de matices que efecta el operario en un proceso de inspeccin visual, hace que los SIVA sean especficos de tarea, problemticos y con limitaciones. As por ejemplo, el SIVA implementado para la pasta de papel, no es capaz de detectar la mayora de los shives, pues debido a su tonalidad anaranjada, queda diluida la informacin de luminancia respecto al fondo. Esta ancdota muestra como aun en el diseo especfico las limitaciones se hacen evidentes. De todo ello se puede pronosticar que es un campo que hoy en da tiene mucha efervescencia ingenieril, pero no cabe duda que en el futuro lo seguir teniendo, habida cuenta de la demanda creciente de estos sistemas efectuada por la industria actual.
DISAM-UPMT-98-015
283
Carlos Platero
Captulo 8: Conclusiones
Conclusiones
Al inicio de esta tesis se ha abordado la problemtica de la Inspeccin industrial, del que se evidenci una necesidad creciente de insertar las operaciones de inspeccin dentro del proceso productivo. De las muchas tcnicas empleadas, la inspeccin visual automatizada es una rama fundamental para esta nueva filosofa, sobre todo en las industrias de materias primas o en sectores que requieren el 100% de la inspeccin. No obstante, las dificultades de esta tecnologa hacen lenta su evolucin, convirtindose en tema de estudio para muchos investigadores. De partida existen tres hitos importantes en los SIVA: la formacin de imgenes, la deteccin de los defectos y la clasificacin de stos. En formacin de imgenes hay que abordar tanto el tipo de iluminacin que sea capaz de aumentar todo lo posible el realce de la escena, as como la seleccin de los sensores a emplear. Respecto a la deteccin de los defectos, se trata de analizar las imgenes recibidas con el propsito de separar la componente de defecto respecto al fondo. En esta fase habr de considerar tanto el procesamiento de las imgenes como su segmentacin. Una vez fijada la posicin de los defectos, stos son pasados para su catalogacin en etiquetas. Se puede decir que estas tres problemticas han servido de lnea argumental en el desarrollo de esta tesis. El xito de un SIVA empieza con la eleccin oportuna del sistema de formacin de imgenes, el cual debe determinar el tipo de iluminacin, la localizacin de las fuentes luminosas y las cmaras, y las tecnologas de adquisicin a emplear. Esta tarea se inicia con un estudio sobre los elementos que definen la calidad de imagen, del que se destaca
DISAM-UPMT-98-015
285
Carlos Platero
que dependiendo del nivel de exactitud de la mtrica habr de considerar ms elementos a modelar. Para el caso de los SIVA tratados, slo ha sido necesario modelar las superficies a inspeccionar y las fuentes luminosas. Por lo que se pasa al estudio de los modelos de reflexin en superficies planas y de fuentes luminosas. Este desarrollo permite presentar una metodologa basada en la modelizacin de la escena SIVA, utilizando el comportamiento de reflexin de la luz en superficies planas, as como de las fuentes luminosas. Con el modelo obtenido se puede localizar la ptima posicin del foco y la cmara mediante la simulacin de stos en diferentes puntos del espacio. En este modelo, la cmara ha sido reducida a un punto en el espacio, sin considerar la informacin luminosa en cada pixel. Esta metodologa es aplicada tanto al SIVA dedicado a la inspeccin del aluminio como el diseado para la pasta de papel. Para acabar con este apartado, se presenta un rbol dicotmico que sirva de gua en la eleccin del tipo de tecnologa CCD a emplear, dependiendo de las condiciones de la inspeccin visual. Luego se pasa a presentar un esquema metodolgico para la deteccin de defectos locales en superficies planas y homogneas. El sistema de deteccin de defectos se basa en tres etapas: realzado, segmentacin y post procesado. Respecto al realzado, se han estudiado filtros lineales discretos, proponindose un procedimiento novedoso para el diseo de las mscaras. Esta tcnica se basa en el uso de la correlacin lineal con variables cualitativas. Adems tambin se han explorado tcnicas de realce soportadas en procesamiento morfolgico. En cuanto a la etapa de segmentacin, fue abordada desde las funciones de densidad en niveles de grises del defecto y del fondo, introducindose el concepto de pxeles de alto y medio contrastes. Convirtiendo el problema de segmentacin, en la localizacin ptima del umbral mediante una funcin de coste, donde se tiene en cuenta los dos errores tpicos, defectos sin detectar y falsas alarmas. Las tcnicas de post procesado han sido aplicadas con una doble intencionalidad, eliminacin de falsas alarmas y reconstruccin de defectos a partir de los pxeles de alto contraste. A continuacin, se ha pasado a definir un conjunto de medidas con el objeto de calibrar cul es el mejor mtodo de deteccin de defectos. Estas medidas se basan en las funciones de distribucin en niveles de grises del fondo y de los defectos. Y por ltimo, se ha implementado esta metodologa para la deteccin de faltas locales en la pasta de papel, donde se han desarrollado experimentalmente las tcnicas propuestas, ofreciendo los resultados del diseo para cada una de las etapas y cmo stas han sido evaluadas. Seguidamente, se presenta una nueva metodologa de clustering paramtrico que empieza en el captulo 5 y finaliza en el captulo 6. Su fundamento est en los mapas auto organizados, en la parametrizacin del espacio mediante funciones normales y en las transformaciones Box Cox. Si bien los mapas de Kohonen permiten conocer la estructura inherente de los patrones, sin embargo, la formacin de cluster no es inmediata a partir de la informacin otorgada por dichas neuronas, ms bien es el principio. Ults et al proponen las U-Matriz como elemento de apoyo en la formacin los clusters. La experiencia ha mostrado que si bien es una buena herramienta, en los casos estudiados no deciden de forma evidente las fronteras entre los grupos. En esta coyuntura, se plantea reforzar la decisin de agrupamiento mediante la bsqueda de subespacios normales. Una vez extrados los grupos inherentes de los datos se pasa a su parametrizacin. Para ello se ha utilizado las transformaciones normalizantes de Box Cox, las cuales
286
DISAM-UPMT-98-015
Carlos Platero
permiten obtener los subespacios normales de los clusters, tal que dicha transformacin sea comn con otros grupos cercanos, motivando una bsqueda que maximice la distancia entre grupos disjuntos y a la vez cercanos. Con tal propsito, en el siguiente captulo se expone la teora de clasificadores paramtricos y sus medidas, pudiendo de esta forma acabar la tcnica de clustering parametrizado, propuesta original de esta tesis. Se ha presentado el desarrollo de un nuevo modelo de parametrizacin, seleccin de las caractersticas y clasificacin, en el que se considera tanto el nmero de muestras as como el error de clasificacin de Bayes, y en el que se favorece la insercin de conocimiento a priori. El modelo se apoya sobre un anlisis exploratorio de los datos, el cual fue recogido en el captulo 5. El nuevo mtodo de parametrizacin se basa en la modelizacin del espacio de dos clusters enfrentados entre s con etiquetas distintas. La regin definida por ambos grupos es transformada a un subespacio, con las caractersticas de normalidad para cada grupo y el menor error de Bayes posible, atendiendo al nmero de muestras utilizadas para la estimacin. Para ello, se busca la transformacin Box Cox ptima marginal, de la que se aprovecha la utilizacin del intervalo de confianza para la caracterstica transformada en los dos clusters, localizando el ptimo comn. A ello le acompaa la distancia de Bhattacharyya, que determina un lmite superior del error de Bayes. Esta informacin ser utilizada para determinar el subespacio comn ms discriminante. Pero no slo se utiliza la distancia, sino que adems se calcula el sesgo y la varianza de la medida, con el objeto de conocer la validez de la mtrica considerando el nmero de muestras utilizado. Una vez que han sido parametrizados los grupos, se pasa al diseo de los clasificadores tanto lineales como cuadrticos, de los que tambin se ha trabajado en la localizacin de su error y de su sesgo. Se han obtenido expresiones analticas tanto de los parmetros del clasificador como del error y del sesgo, todo ello para grupos que tienen distribuciones normales. A tenor del trabajo realizado se plantea la modificacin del algoritmo no paramtrico LVQ. Un estudio sobre este mtodo cognitivo concluye que los codebooks tienden a situarse en la frontera de Bayes, mediante uso de hiperplanos, los cuales se presentan como clasificadores lineales. Si en vez de utilizar la distancia eucldea se utiliza la de Mahalanobis, es posible el paso de clasificadores lineales a cuadrticos. Esta modificacin ha sido estudiada y se han comparado los resultados. Con el objeto de verificar el anlisis propuesto, se ha trabajado experimentalmente en la clasificacin de defectos locales en el aluminio colado. Este problema ha servido como bancada de trabajo para el diseo de los clasificadores, tanto de tcnicas tradicionales como las propuestas aqu recogidas. Las conclusiones obtenidas es que el mtodo propuesto ayuda a introducir conocimiento a priori, haciendo de los clasificadores ms exactos y generalistas, que aquellos basados tanto en reglas como en aprendizaje con ejemplos. La explicacin viene dada por el hecho de tener expresiones analticas que muestran con objetividad las caractersticas de cada subespacio en funcin del error y del nmero de muestras del universo. Obviamente este proceder no puede ser dado por los mtodos tradicionales. Aunque los mtodos de testeo como leave-one-out o holdout son
DISAM-UPMT-98-015
287
Carlos Platero
lmites superiores de error, stos no opinan sobre el sesgo del error, esto es, no consideran el nmero de muestras, y tampoco buscan por si mismos la seleccin de las caractersticas. Para acabar, se han presentado dos SIVA industriales, uno dedicado a la inspeccin del aluminio colado y otro a la pasta de papel. Ambos han servido como marco de referencia para el trabajo experimental realizado en el transcurso de esta tesis. Se observa que la inspeccin visual de superficies planas y homogneas, simples para un inspector humano, resultan complejas de automatizar. La riqueza de matices y las actividades inteligentes que efecta el operario en un proceso de inspeccin visual hace que los SIVA sean especficos de tarea, problemticos y con limitaciones. De todo ello se puede pronosticar que es un campo que hoy en da tiene mucha efervescencia ingenieril, pero no cabe duda que en el futuro lo seguir teniendo, habida cuenta de la demanda creciente efectuada por la industrial actual.
8.1
Aportaciones de la tesis
A modo de resumen las aportaciones realizadas podran ser expuestas atendiendo a los tres hitos ya mencionados. En la formacin de imgenes se ha presentado un diseo del sistema de iluminacin basado en el las propiedades de reflexin de la luz sobre superficies planas y en los modelos de las fuentes luminosas. Primero se estudia si existe alguna zona del espectro luminoso que pueda incrementar el realce entre defecto y fondo. En segundo lugar, se pasa a ver qu modelo de superficie rugosa puede ser empleado, definiendo el tipo de modelo de reflexin que puede aplicarse. En tercer lugar, se estudia el prototipo de fuentes luminosas, centrndose en diseo de sistemas de iluminacin uniforme. Una vez modelizado el problema, se pasa a su simulacin con el propsito de localizar la ptima disposicin geomtrica de la superficie, los focos luminosos y las cmara. Si bien el mtodo presentado no es una aportacin, pues ya ha sido propuesto por otros autores, existen algunas contribuciones singulares, como la modelizacin de las fuentes mediante funciones de ponderacin y el uso de la simulacin para la determinacin geomtrica de las fuentes luminosas capaces de dar una iluminacin uniforme sobre el escenario SIVA. En cuanto a la deteccin de los defectos, dos aportaciones originales se han hecho. Respecto a la primera, se ha propuesto un mtodo de diseo de las mscaras de convolucin lineal, basndose esta tcnica en regresin lineal con variable cualitativa. Y en segundo lugar, se ha presentado un mtodo de calibracin de las tcnicas empleadas para la deteccin de los defectos. Estas medidas se fundamentan en la funcin de distribucin del fondo y de los pxeles de alto contraste. Sobre la extraccin de las caractersticas tambin se ha trabajado. proponiendo la conversin de los objetos etiquetados en primitivas de gramticas libres. Este proceder tiene como ventaja la posibilidad de disear tanto clasificadores basados en reglas como en vectores de caractersticas. Del que tambin se aporta cmo han sido transformadas las primitivas en partes del vector de caractersticas. Otra de las aportaciones de esta tesis, es la tcnica presentada de clustering paramtrico, basada en los mapas auto organizados, en las U-Matriz, en la descripcin
288
DISAM-UPMT-98-015
Carlos Platero
textual de los patrones y en las tranformaciones normalizantes Box Cox. Adems, esta nueva tcnica tambin realiza la seleccin de las caractersticas. Una de las propiedades de los diseos de clasificadores para SIVA, es el bajo nmero de muestras de que se parte para cada tipo de defecto. Por lo que se han estudiado el clculo del sesgos para clasificadores paramtricos tanto cuadrticos como lineales. Presentndose de forma novedosa el clculo del sesgo para clasificadores lineales y cuadrticos de dos grupos enfrentados y en el espacio unidimensional. Adems se ha iniciado el desarrollo de algoritmos LVQ con mtrica de Mahalanobis, en la motivacin de utilizar cudricas en vez de hiperplanos de separacin entre los clusters. Todo ello ha sido implementado y comprabado en los dos SIVA industriales realizados.
8.2
Futuros trabajos
Como posibles lneas de trabajo a continuar podran citarse las siguientes: En formacin de imgenes habra de seguir trabajando en incorporar ms elementos al modelaje de la escena SIVA. Empezando por los sensores, si bien se ha iniciado un breve estudio sobre los modelos de las cmaras CCD, hay que continuar en la lnea de integrar las ecuaciones de comportamiento de las superficies, focos y cmaras, con el objetivo de poder predecir la informacin luminosa en cada uno de los pixel del sensor. Respecto a la deteccin de los defectos, se debera continuar la lnea de diseo de los filtros, primero en cuanto a la determinacin de las mascaras lineales y empezar tambin con la aplicacin de filtros recursivos para el realce de los defectos. En esta lnea ya se puede encontrar algunas referencias bibliogrficas. Habra de continuar en el estudio y generalizacin del clculo del sesgo para clasificadores lineales y cuadrticos. De otro lado, parece que la lnea natural empleada en el diseo de los clasificadores paramtricos se debera intentar para los clasificadores no paramtricos, sobre todo en algoritmos LVQ, investigando en la capacidad de determinar el error y el sesgo teniendo en cuenta el nmero de muestras. Adems de seguir estudiando los comportamiento de LVQ en mtrica de Mahalanobis. En cuanto a las aplicaciones SIVA implementadas, los meses venideros seguirn en el esfuerzo de mejorar el SIVA dedicado a la pasta de papel, sobre todo en tres direcciones principalmente: un primer camino en la bsqueda de la regin espectral de la luz capaz de aumentar el realce de tipo shive, ya sea por la interposicin de un filtro de transmitancia
DISAM-UPMT-98-015
289
Carlos Platero
entre la escena y el sensor, ya sea con el cambio de la fuente luminosa. Otra de las direcciones que pueden ser muy fructfera es el cambio de tecnologa de adquisicin, conducentes a introducir cmaras TDI para la determinacin de la limpieza en pasta en la misma lnea de produccin. Y por ltimo, mejorar los resultados de deteccin mediante el diseo de nuevos filtros para el realce de los defecto, objetivo ligado con las anteriores pretensiones.
290
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
Bibliografa
[Abbas93] Abbaszadeh, S., The Automated Inspection Of Garments Using Machine Vision, tesis doctoral de la Universidad de Montfort, 1993. Aeoryne Products, WI-3000:Automatic surface inspection system, catlogo comercial, 1930 Zaventem, Belgium, 1993 Amorese, P., Bloomfield, J., A slew of Standards for Camera Systems, Datacube World Review, 1990. American National Standards Institute, Surface Texture, ANSI / AMSE B46.11978, ANSI, New York, 1978 Andrews, D.F., Gnanadesikan, R., Warner, J.L., Transformation of multivariante data, Biometrics, 27, pp. 825-840, 1971. Atkinson, A.C., Lawrance, A.J., A Comparison of Asymptotically Equivalent Test Statistics for Regression Transformation, Biometrika, 76, 223 229, 1989. Avi-Itzhak, H., Diep, T., Arbitrarily Tight Upper and Lower Bounds on the Bayesian Probability of Error, PAMI, V18, N 1, January, 1996. Awcock, G.J., Thomas, R., Applied Image Processing, Macmillan, 1995
[Aero93]
[Amore90]
[ANSI78]
[Andre71]
[Atkin89]
[Avi-I96]
[Awcoc95]
DISAM-UPMT-98-015
291
Carlos Platero
[Balst92]
Baltsavias, E.P., Beyer, H.A., Fritsch, D., Lenz, R.K., Fundamentals of RealTime Photogrammetry. Tutorial notes for XVIIth ISPRS Congress, Washington, DC, 1992 Banks, S, Signal Processing Image and Pattern Recognition, McGraw Hill, 1990. Barrie, G., Sampling Inspection and Quality Control, Methuen and Company, Ltd., London, 1969. Batchelor,B.G., Braggins,D.W., Commercial vision systems, Computer Vision: Theory and Industrial Applications, Springer-Verlag, New York, pp 405-452, 1992. Beckmann, P., Spizzichino, A. The Scattering of Electromagnetic Waves from Rough Sources, Pergamon, London, 1963. Beyer, H.A., Performance Analysis of CCD-Cameras for industrial inspection, SPIE, V 1989 Computer Vision for Industry, 1993. Beyer, H.,A., Determination of Radiometric and Geometric Characteristics of Frame Grabbers, SPIE, V 2067, Videometrics II, 1993 Bezdek, J.C., Pal, S.K. Fuzzy models for pattern recognition. Methods that search for srtuctures a data, IEEE, Inc,. New York, 1992. Bhattacharyya, A., On a measure of divergence between two statistical populations defined by their probability distributions, Bull. Calcutta Math. Soc., 35, pp 99-110, 1943. Blouke, M.M., Janesick, J.R., Elliot, T., Hall, J.E., Current Status of the 800 x 800 Charge-Couple-Device Image Sensor. Optical Engineering, V 26 N 9, pp 864-874, September 1987. Box, G.E.P., Cox, D.R., An analysis of transformation, Journal of the Royal Statistical Society 26, pp 211-252, 1964 Bradshaw, M., The automated inspection of web fabrics using machine vision, tesis doctoral Universidad de Montfort, 1994. BRITE 4336, System definition, Technical Manager, BREU-CT91_0393, Novara, May 1992.
[Bank90]
[Barri69]
[Batch92]
[Beckm63]
[Beyer93]
[Beyer93a]
[Bezde92]
[Bhatt43]
[Blouk87]
[Box64]
[Brads94]
[Brite92]
292
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Cancel86]
Cancela, R., Estudio de problemas notales en el anlisis cluster. Universidad de Santiago de Compostela, 1986 Carpenter G., Grosberg S. The ART of Adaptive Pattern Recognition by a self-organizing neural network, IEEE Computer, 77-88, March,1988 Chamberlain, S.G., Kamasz, S.R. A 26.3 Million Pixel CCD Image Sensor, IEEE Proceedings of the International Conference on Electron Devices, pp 151155, Washington DC, December 10, 1995. Cases, F., Anlisis textural de la pasta de papel, Asignatura de doctorado: Tcnicas avanzadas de procesamiento de imgenes, DISAM-UPM, 1997. Chin, R.T., Harlow, C.A., Automated Visual Inspection: A survey. IEEE Trans. Pattern Analysis and Machine Intelligent, 6, pp 557-573, 1982 Chin, R.T., Automated Visual Inspection: 1981 to 1987. Computer Vision Graphics Image Process, 41, pp 346-381, 1988 Chin, R.T., Automated visual inspection algorithms. En Computer Vision: Theory and Industrial Applications, ed. Torras, pp 377-404, 1992. Chernoff, H., A measure of asymptotic efficiency for test of a hypothesis based on the sum of observation, Ann.Math.Stat., 23, pp 493-507, 1952. Cooley, W.W. Lohnes, P.R., Multivariate Data Analysis, New York, Wiley, 1971. Cottrell, M., Fort, J.C. Etude dun algoritme dauto-organisation. Annales de IInstitute Henri Poincar, 23, 1, pp1-20, 1987. Cuadras,C.M., Mtodos de Anlisis multivariante, pp 269-294. PPU, Barcelona 1991. Dahle, O., Sommerfelt, A., On line inspection of extruded profile geometry, Proc. SME Vision 90 Conference, pp 61 69, 1990. Devijver, P.A., and Kittler, J. Pattern Recognition. A Statistical Approach. Prentice-Hall International, London, 1982. Dominguez,S., Campoy, P., Aracil, R., A Neural Network Based Quality Control for Steel Strip Manufacturing, Proceedings of the IFACAIRTC94.
[Carpen88]
[Chamb95]
[Cases97]
[Chin82]
[Chin88]
[Chin92]
[Chern52]
[Coole71]
[Cottr87]
[Cuadr91]
[Dahle90]
[Devij82]
[Domin94]
DISAM-UPMT-98-015
293
Carlos Platero
[Dough92]
Dougherty, E.R., An Introduction to Morphological Image Processing, SPIE Tutorial Texts Series, 1992 Dougherty, E.R., Astola, J., An Introduction to Nonlinear Image Processing, SPIE Tutorial Texts Series, 1994 Europan Electronic Systems, CCD5020. High speed surface inspection with classification, System Manual, BH235AG, England, 1992 ENCE, Control proceso final: limpieza en pastas, Norma 404 ENCE, Enero 1994. Erwin, E., Obermayer, K., Schulten, K. Self-Organizing maps: Ordernig, convergence properties and energy functions. Biological Cybernetics, 67, pp 47-55, 1992. Escudero, L. Reconocimiento de patrones, Paraninfo, 1977 Feng, O., Computerized image quality inspection system, Machine Vision Applications in Industrial Inspection, SPIE Vol. 1907, pp 133-138, 1993 Fernndez, C., Platero, C., Campoy, P., Aracil, R., Surface inspection of flat products by means of texture analysis. On-line implementation using neural networks, European Symposium on Optics for Productivity in Manufacturing, Frankurt, 1994. Fernndez, J.C., Inspeccin de superficies mediante Visin Artificial. Integracin en tiempo real en procesos productivos, tesis doctoral de la UPM, 1997 Fernndez, J., Fernndez, C., Aracil, R., On line integral quality control of ceramic tiles by artifical vision, Proc. International Conference on Quality Control by Artificial Vision QCAV97, 1997 Freeman, H. Machine vision for inspection and measurement. Academic Press 1989 Fu, K. Robotics: Control, Sensing, Vision and Intelligence. McGraw Hill, 1988 Fu, K.S. Syntactic pattern recognition with applications, Prentice Hall, 1982. Fukunaga, K., Hayes, R., Effect of sample size in classifier design, PAMI, V 11, N 8, pp 873-885, august 1989
[Dough94]
[EES92]
[Ence94]
[Erwin92]
[Escud77] [Feng93]
[Fernn94]
[Fernn97]
[Fernn97a]
[Freem89]
[Fu88] [Fu82] [Fukun89]
294
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Fukun90]
Fukunaga, K., Introduction to Statistical Pattern Recognition, Academic Press,1990 Gallardo, C., Estudio para la deteccin de defectos en pasta de papel mediante tcnicas de Visin Artificial. Proyecto fin de Carrera de DISAM-UPM, 1997 Garca, C., Clasificadores paramtricos lineales y cuadrticos, aplicados a la catalogacin de defectos locales del aluminio colado. Proyecto fin de Carrera de DISAM-UPM, 1997 Garca, L., Estudio sobre distribuciones de campos luminosos sobre superficies planas, Documento interno de DISAM, 1998. Gennert, M.A., Wittles, N, Leatherman, G.L., Uniform Frontal Illumination of Planar Surfaces: Where to Place the Lamps, Optical Eng.,32, pp 1261-1270, 1993 Gennert, M.A., Wittles, N, Leatherman, G.L., Uniform Frontal Illumination of Planar Surfaces: Criteria for Optimal Lighting Design, SPIE vol. 2065, pp 62-69, 1994 Giles, C.L. Second-order recurrent neuronal networks for grammatical inference. Proc. Int. Joint Conference on Neural Networks,1992. Glasbey, C.A., An analysis of Histogram-Based Thresholding Algorithms, CVGIP, Vol. 55, N 66, pp 532-537, 1993. Gonzlez, A. Adquisicin y modelado tridimensional en Visin artificial mediante tcnicas de luz estructurada, tesis doctoral de la UPM, 1998. Guinea, D., Ruiz, A., Barrios, L.J., Multi-sensor integration: An automatic feature selection and state identification methodology for tool wear estimation, Computer in Industry, V 17, N 2&3, L. Monostori, pp. 121-130, Elsevier, Nov, 1991. Hall, D.J., Ball, G.B., ISODATA: A novel method of data analysis and pattern classification, Technical report, Stanfort Research Institute, Menlo Park, CA, 1965. Han, J.H.,Yoon, D.M., Kang M.K., Feature for automatic surface inspection, SPIE V 1907 Machine Vision Applications in Industrial Inspection,1993. Hecht, Zajac, ptica, Addision Wesley, 1984
[Gallar97]
[Garc97]
[Garc98]
[Genne93]
[Genne94]
[Gile92]
[Glasb93]
[Gonz98]
[Guine91]
[Hall65]
[Han93]
[Hect84]
DISAM-UPMT-98-015
295
Carlos Platero
[Hertz91]
Hertz, J., Krough, A., Palmer, R., Introduction to the theory of Neural Computation. Addison-Wesley, 1991. Holst, G.C., CCD arrays, cameras and displays, SPIE Press, 1996. Hughes, G.F, On the mean accuracy of statistical pattern recognizers, Trans. IEEE Inform. Theory, IT-14, pp. 55-63, 1968. Ikeuchi, K., Surface Reflection Mechanism, Handbook of Pattern Recognition and Image processing: Computer Vision, V 2, Academic Press, pp 131-156, 1994 Intec, System 3000: Automatic Inspection System for Continuous Web Products, Catlogo comercial, North Billerica, MA 01862, 1993 Intec, On-Line Pulp Inspection System, Catlogo comercial, North Billerica, MA 01862, 1993 Jhne, B., Digital Image Processing. Concepts, algorithms and applications, Springer-Verlag,1993. Jhne, B., Digital Image Processing: Concepts, Algorithms and Scientific Applications, Springer, 1997 Jain, A.K., Fundamentals of Digital Image Processing, Prentice Hall, 1989 Kanal, L., Raghavan, R., Hybrid systems a key to intelligent pattern recognition. Proceedings of the International Joint Conference on Neural Networks, pp IV 177-182, Baltimore, June 1992. King, K., Just, J., Osheroff, Berke, G., Spidaliere, P., Ngoc, T., Robotic technology: An assessment and forecast, Robotics and Flexible Manufacturing Technologies, Noyes, Park Ridge, NJ, 1985. Kohonen, T., Self-organized formation of topologically correct features maps. Biological Cybernetics, 43, pp 59-69, 1982 Kohonen, T. Analysis of a simple self-organizing process. Biological Cybernetics, 44, pp 135-140, 1982. Kohonen, T. The self Organizing Map. Proceedings of the IEEE, V 78, N , pp1464-1480,1988
[Holst96] [Hughe68]
[Ikeuc94]
[Intec93a]
[Intec93b]
[Jhne93]
[Jhne97]
[Jain89] [Kanal92]
[King85]
[Kohon82]
[Kohon82a]
[Kohon88]
296
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Kohon92]
Kohonen,T. Kangas,J., Laaksonen, J. LVQ_PAK: A Program Package for the Correct Application of Learning Vector Quantization Algorithms. Proceedings of the International Joint Conference on Neural Networks, pp I 725-730, Baltimore, june 1992, IEEE. Kohonen, T. Self-Organizing Maps. Springer-Verlag, Heidelberg, 1995 Kung, S.K., Digital neural networks. Prentice Hall, 1993. Lambert, J.H., Photometria sive de mensura de gratibus luminis colorum et umbrac, Eberhard Klett, Augsburg, 1760 LeBeau , C.J., Machine vision platform requirements for successful implementation and support in the semiconductor assembly manufacturing environment, Proceeding of SPIE Machine Vision System Integration in Industry Conference, Boston, SPIE V 1368, pp 228-231, 1990 Lee,S.U., Chung, S.Y., Park,R.H., A Comparative Performance Study of Several Global Thresholding Techniques for Segmentation, Computer Vision, Graphics, and Image Processing 52, pp 177-190, 1990 Macaire, L., Postaire, J.G., Flaw detection on galvanized metallic strips in real time by adaptive thresholding, Computer Vision for Industry, V 189, pp 1425,SPIE 1993. von der Malsburg, Ch. Self-organization of orientated sensitive cells in the striate cortex. Kybernetik, N14, pp 85-100, 1973. Maravall, D., Reconocimiento de Formas y Visin artificial, Ra-ma, 1993. Marshall, A.D., Automatically inspection gross features of machined objects using three-dimensional depth data, Proceedings of the SPIE Conference on Machine System Integration in Industry, Boston, 1990, pp 243 - 254. Martinez J.A., Contribucin al anlisis y estimacin en imgenes digitales mediante la teora de la informacin, tesis doctoral de la Universidad de Granada, 1990. Martn del Brio, B., Procesamiento Neuronal con Mapas Autoorganizados: Arquitecturas Digitales, pp 49-114, tesis doctoral de la Universidad de Zaragoza, 1995. Matheron, G., Random Set and Integral Geometry, John Wiley, New York, 1975.
[Kohon95] [Kung93] [Lambe60]
[LeBea90]
[Lee90]
[Macai93]
[Malsb73]
[Marav93] [Marsh90]
[Marti90]
[Mart95]
[Mathe75]
DISAM-UPMT-98-015
297
Carlos Platero
[Matro97] [McLac92]
Matrox, User Guide, Manual N 10513-MN-0500, pp 135-158, 1997 McLachlan, G.J., Discriminant Analysis and Statistical Pattern Recognition, New York, John Wiley, 1992. Newman,T.S., Jain, A.K., A Survey of Automated Visual Inspection, Computer Vision and Image Understanding, V 61, March, pp 231-262,1995. Miettinen, J., Hrkonen, A., Procedure for image acquisition design, SPIE Vol.1989 Computer Vision for Industry, pp 70-80, 1993. Mulier, V., Cherkaassky, V. : Proc. 12 ICPR, Int. Conf. On Pattern Recognition (IEEE Services Center, Piscataway, NJ 1994), p.II-224, 1994 Nayar, S.K., Ikeuchi, K., Kanade, T. Surface reflection: Physical and geometrical perspectives, PAMI 13 (7), 661-634, 1991. Ninomiya, T., Yoshimura, K., Nomoto, M., Automatic screen-printed circuit pattern inspection using connectivity preserving image reduction and connectivity comparison, Proc. 11th ICPR, V A, pp 53-56, 1992. Norton-Wayne, The detection of defects in automated visual inspection, British thesis, 1982. Norton-Wayne, L., Finkelstein L. Signal Processing for automatic surface inspection of steel strip, Trans Inst M C, V. 5, N 3, 1983. Ohta, K., Sakue, K., Tanura, H., Pattern Recognition Of Fabric Surfaces, Journal Of The Textile Machinery Of Japon, V32,N1, pp 7-10, 1986. Oulu University, Information Processing and Computer Engineering Laboratory, Electrical Engineering Department, Oulu Univeaity, http://www.ee.oulu.fi, 1997. Parsytec Co., http://www. Parsytec.de, 1997. Parthasarathy, S., Wolf, D., Hu, E., Hackwood, S., Beni, G., A color vision system for film thickness determination, Proceedings of the IEEE International Conference on Robotics and Automation, Raleigh, NC, pp 515-519, 1987 Patrick E.A. Fundamentals of Pattern Recognition, pp 411-418. Prentice Hall, 1972.
[Newma95]
[Miett93]
[Mulie92]
[Nayar91]
[Ninom92]
[Norto82]
[Norton83]
[Ohta86]
[Oulu97]
[Parsy97] [Parth87]
[Patri72]
298
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Pea87] [Phong75]
Pea, D., Estadstica, modelos y mtodos, Alianza Editorial, 1987. Phong, B.T., Illumination for computer generated pictures, Commun. ACM 18 (6), pp 311-317, 1975. Piironen, T., Silven, O., Pietikinen, M., Laitinen, T. Automated Visual Inspection of Rolled Metal Surface, Machine Vision and Applications, V 3, pp 247-254, Springer-Verlag, New York, 1990. Poole, H., Fundamentals of Robotics Engineering, Van Nostrand Reinhold, New York, 1989. Platero, C., Deteccin y clasificacin de defectos en las planchas de aluminio mediante Visin artificial, Proyecto fin de Carrera, DISAM-UPM, TFC 92/185,1992. Platero, C., Fernndez, C., Campoy, P., Aracil, R., Surface analysis of cast alumnium by means of artificial vision and AI-based techniques, Symposium on: Electronic Imaginig: Science & Technology, 1994 Platero, C., Fernndez, C., Campoy, Aracil, R., Hybrid system : Aplication to defect clasification in cast aluminum, International Conference on Quality Control by Artificial Vision, pp 48-58, 1995 Platero, C., Fernndez, C. , Campoy, P., Aracil, R., Surface analysis of cast aluminum by means of artificial vision and A.I. based techniques, International conference on Quality Control by Artificial Vision, Le Creusot, France, 1995. Platero,C., Crespo,C., Garcia,J., Campoy, P.,Aracil, R., Feature space parametrization by means Self organizing maps and Box Cox transformations, VII SNRFAI, Barcelona, 25 April, 1997. Platero, C., Inspeccin de etiquetas en productos farmacuticos, Documentacin interna de FAIS-UPM. Platero, C., Inspeccin visual automatizada de superficies homogneas mediante Visin Artificial con aportaciones al Reconocimiento de Formas, tesis doctoral de la UPM, 1998. Pratt, W.,K., Digital Image Processing, A Wiley-Interscience Publication, Second Edition, 1991. Rao, C.R. Taxonomy in anthropology. Mathematics in the Archeological and Historical Sciences, Edinburg University Press, 1971
[Piiro90]
[Poole89]
[Plate92]
[Plate94]
[Plate95]
[Plate95a]
[Plate97]
[Plate97a]
[Plate98]
[Pratt91]
[Rao71]
DISAM-UPMT-98-015
299
Carlos Platero
[Raube95]
Rauber,T.W., Barata, M.M., Steiger-Garcao, A.S., A toolbox for analysis and visualization of sensor data in supervision. Universidade Nova de Lisboa,1995. Real Academia Espaola, Diccionario de la Lengua espaola, Espasa Calpe, 1996. Ritter H., Schulten K.,Convergence properties of Kohonen's topology conserving maps: Fluctuations, stability, and dimension selection, Biological Cibernetics, 60, 59-71, 1988. Reinoso, O., Anlisis y generalizacin de algoritmos de Visin Artificial con precisin subpixel, tesis Doctoral UPM, 1996 Rober,J.W., Rose, S.D., Jullien, G., A PC-based Real Time Defect Imaging System for High Speed Web Inspection, SPIE, V 1907 Machine Vision Applications in Industrial Inspection, pp164-176, 1993 Roland, T.C. Automated visual inspection: 1981 to 1987. CVGIP 41, pp 346381,1987 Ruz,R.,Barro,S.,Presedo.J, Clasificacin borrosa basada en conocimiento. Estudios de lgica borrosa y sus aplicaciones. Universidad de Santiago de Compostela,1992. Snchez, F., Tcnicas fotogramtricas para el control dimensional, Documento registrado DISAM-UPM, R98-017v1.0, 1998. Sears, F.S., Zemansky, M.W., Fsica General, Aguilar, 1981, pp 837-842 Sebastian, J.M., Campoy, P., Reinoso, L. Jimnez, L.M., Introduccin a la Visin Artificial, Documento interno de DISAM-UPM. Sebastian, J.M., Parallel processing and scheduling techniques applied to the quality control of bill sheets. Proc. IAPR, pp 399 403, 1995 Serrano, C., Martin del Brio, B. Gallizo, J.L. Mapas Neuronales Autoorganizados: una nueva herramienta de anlisis contable. Reunin de la Asociacin Espaola de Contabilidad y Administracin de Empresas, AECA93, Vitoria , sept.1993 Serrano, J., Procesado morfolgico de imgenes. Aplicacin para control industrial, Eurofach Electrnica, marzo 1995.
[RealA96]
[Ritte88]
[Reino96]
[Rober93]
[Rolan87]
[Ruz92]
[Snch98]
[Sears81] [Sebas90]
[Sebas95]
[Serran93]
[Serran95]
300
DISAM-UPMT-98-015
Carlos Platero
Bibliografa
[Sikka92]
Sikka,D.,Two dimensional curve shape primitives for detecting line defects in silicon wafers, Proceedings of the International Joint Conference on Neural Networks, pp III 591-596, Baltimore, June 1992, IEEE. SOM PACK. The Self-organizing Map Program Package, University of Technology, Helsinki (Finland) Nov, 1992. Sahoo, P.K., Soltani, S., Wong, K.,C., A Survey of Thresholding Techniques, GVCIP, N 41, pp 233-260, 1988. Serra, J., Image analysis and mathematical morphology, Academic Press, London, 1982. Silva, J., Pais, C.P., Freitas, J.C., Carvalho, F.D., Rodrigues, F.C., Detection And Automatic Classification Of Defect in Ceramic Products, SPIE V 1713, International Conference On Manufacturing Automation, pp 22-28, 1992. Smith, B., Making war on defects : Six-sigma design, IEEE Spectrum 30 (9), pp 43-47, September, 1993 Spiegel, M.R. Statistical . McGraw Hill, New York, 1988. Takatoo, M., Takagi, Y., Mori, T., Automated Fabric Inspection System Using Image Processing Rechnique, SPIE V 1004, Automated Inspection and High Speed Vision Architectures II, pp 151-158, 1988. Torrance. K.,Sparrow, E., Theory off-specular reflection from roughness surfaces, J.Opt.Soc.Amer. N 57,pp 1105-1114, 1967 Ultsch, A., Siemon, H.P. Kohonens self-organizing feature maps for exploratory data analysis. Proc Int. Neural Networks Conf. INNC 90, Paris, Ed. Kluwer, pp 305-208, 1990. Vandommelen, C.H., Fundamentals of Camera Selection for Machine Vision, Applied Intelligent Systems, Inc., 1990. Van Gool, L. Wambacq, P., Oosterlinck, Intelligent robotic visions systems, Intelligent Robotic Systems, pp 457 - 507, Dekker, New York, 1991 Varfis, A., Versino, C., Clustering of socio-economic data with Kohonen maps, Neural Networks World, 2, 6, pp 813-833, 1992.
[SOM92]
[Sahoo88]
[Serra82]
[Silva92]
[Smith93]
[Spieg88] [Takat88]
[Torre67]
[Ultsc90]
[Vando90]
[VanGo91]
[Varfi92]
DISAM-UPMT-98-015
301
Carlos Platero
[Velil92]
Velilla, S., A note on the multivariate Box-Cox transformation to normality, Working Paper 92-08, Universidad Carlos III de Madrid, Febrero de 1992. Velilla, S., Barrio, J.A., A discriminant rule under transformation, Technometrics, V 36, N 4, november 1994. Venon, D., An overview of techniques for shape description, Machine Vision, Prentice Hall, 1991. Vitri i Marca, J. Estudi sobre lautomatizacio de lnalisi visual de circuits integrats mitjanant morfologia matemtica, tesis doctoral de la Universitat Autnoma de Barcelona, 1992. Widrow, B. Self-Organizing Systems , Spartan Books, Washington, D.C., 435, 1962. Winchell, W., Inspection and Measurement in Manufacturing, Society of Manufacturing Engineers, 1996. Wright, P.K., Bourne, Manufacturing Intelligence, Addison-Wesley, New York, 1988. Xie, X., Beni, G., A vality measure for fuzzy clustering, IEEE PAMI, col. 13, pp 841-847, 1991 Zador, P : IEEE Trans. Inform. Theory IT-28, 139, 1987 Zeuch, N., Applying Machine Vision, Wiley, New York, 1988
[Velil94]
[Venon91]
[Vitri92]
[Widro62]
[Winch96]
[Wrigh88]
[Xie91]
[Zador87] [Zeuch88]
302
DISAM-UPMT-98-015

Sistemas Vision

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Sistemas Vision

Diunggah oleh

Hak Cipta:

Format Tersedia

ndice

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

 ANLISIS DE LOS DATOS....................................................................................................147

 CLASIFICADORES ESTTICOS .........................................................................................199

Inspeccin automatizada de superficies homogneas mediante Visin Artificial

 APLICACIONES INDUSTRIALES DE LA TESIS ..............................................................267

BIBLIOGRAFA ........................................................................................................................... 291

NDICE DE FIGIRAS .................................................................................................................. 303

NDICE DE TABLAS ................................................................................................................... 309

DATOS BIOGRFICOS .............................................................................................................311

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Captulo 2: Problemtica de la Inspeccin visual automatizada

Problemtica de la Inspeccin visual automatizada

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Captulo 2: Problemtica de la Inspeccin visual automatizada

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Inspeccin Visual Automatizada

Captulo 2: Problemtica de la Inspeccin visual automatizada

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Captulo 2: Problemtica de la Inspeccin visual automatizada

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Captulo 2: Problemtica de la Inspeccin visual automatizada

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Captulo 2: Problemtica de la Inspeccin visual automatizada

color niveles de grises niveles de grises niveles de grises

caractersticas caractersticas casamiento caractersticas

plana plana plana plana

Oulu97 Plate98 Sebas95 Serran95

Inspeccin automatizada se superficies homogneas mediante Visin artificial

Captulo 3: Formacin de imgenes en SIVA

Formacin de imgenes en Sistemas de inspeccin visual automatizada (SIVA)

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Captulo 3: Formacin de imgenes en SIVA

Caracterizacin de imgenes digitales

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Cmaras Transmisin y digitalizacin de imgenes Entorno

Captulo 3: Formacin de imgenes en SIVA

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Captulo 3: Formacin de imgenes en SIVA

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Captulo 3: Formacin de imgenes en SIVA

Realce visual de superficies planas

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Captulo 3: Formacin de imgenes en SIVA

Figura 3.5 Sistema de coordenadas locales

Inspeccin automatizada de superficies homogneas mediante Visin artificial

En la tabla 3.1 aparecen las magnitudes radiomtricas en el Sistema Internacional

Magnitud fsica Flujo luminoso Intensidad luminosa Iluminacin Radiacin

Unidad en S.I. W W sr-1 W m-2 W m-2 sr-1

Tabla 3.1 Unidades del S.I. de las magnitudes de Radiometra

Captulo 3: Formacin de imgenes en SIVA

Modelos basados en funciones de distribucin de ngulos de inclinacin

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Rugosidad de la superficie h(x,y)

Figura 3.7 Niveles de altura en la superficie

Captulo 3: Formacin de imgenes en SIVA

Inspeccin automatizada de superficies homogneas mediante Visin artificial

z n' i d r Luz reflejada

Captulo 3: Formacin de imgenes en SIVA

Inspeccin automatizada de superficies homogneas mediante Visin artificial

Captulo 3: Formacin de imgenes en SIVA

dA cos dAS = im cos r

ANLISIS DE LOS DATOS....................................................................................................147

CLASIFICADORES ESTTICOS .........................................................................................199

APLICACIONES INDUSTRIALES DE LA TESIS ..............................................................267