100%(1)100% menganggap dokumen ini bermanfaat (1 suara)
104 tayangan59 halaman
Este documento describe diferentes métodos para la caracterización de imágenes, incluyendo transformadas de Fourier, wavelet y SMQT. La transformada wavelet es especialmente útil para imágenes porque descompone la señal en bandas de frecuencia, permitiendo una alta compactación de la energía y ajustando el nivel de distorsión por compresión. La transformada discreta wavelet calcula los coeficientes de descomposición en diferentes escalas usando wavelets madre. Estos coeficientes pueden usarse para caracterizar regiones en la imagen.
Este documento describe diferentes métodos para la caracterización de imágenes, incluyendo transformadas de Fourier, wavelet y SMQT. La transformada wavelet es especialmente útil para imágenes porque descompone la señal en bandas de frecuencia, permitiendo una alta compactación de la energía y ajustando el nivel de distorsión por compresión. La transformada discreta wavelet calcula los coeficientes de descomposición en diferentes escalas usando wavelets madre. Estos coeficientes pueden usarse para caracterizar regiones en la imagen.
Este documento describe diferentes métodos para la caracterización de imágenes, incluyendo transformadas de Fourier, wavelet y SMQT. La transformada wavelet es especialmente útil para imágenes porque descompone la señal en bandas de frecuencia, permitiendo una alta compactación de la energía y ajustando el nivel de distorsión por compresión. La transformada discreta wavelet calcula los coeficientes de descomposición en diferentes escalas usando wavelets madre. Estos coeficientes pueden usarse para caracterizar regiones en la imagen.
El reconocimiento de patrones u objetos dentro de una imagen es una parte fundamental en el procesamiento de imgenes, para dicha tarea de clasificacin, es de vital importancia realizar una correcta extraccin de caractersticas que discriminen de la mejor manera cada objeto y conlleven as al uso de clasificadores menos robustos y costosos computacionalmente. Hay infinidad de formas de realizar una caracterizacin de objetos o regiones dentro de una imagen, diversos enfoques, usando caractersticas globales o locales del objeto, o la combinacin de ambas. A continuacin se presentan algunos tipos de caracterizacin de objetos en imgenes. La transformacin de una seal ofrece una representacin alternativa, que revela caractersticas que en el dominio original son muy difciles o sencillamente imposibles de detectar. Aunque la transformada de Fourier ha sido el soporte principal en el procesamiento de imgenes basado en transformada desde finales de 1950, otro tipo de transformada llamada wavelet hace mucho ms fcil analizar, transmitir y comprimir muchas imgenes. En los aos 88 y 89, los trabajos de Daubechies, que construy wavelets de soporte compacto, y Mallat, que estableci la conexin con el procesado discreto de la seal, determinaron la gran difusin de la transformada wavelet en el mbito del procesado de imgenes. Ms adelante a comienzo de los 90 Coifman introduce la transformada de paquete wavelets. Desde el punto de vista del procesamiento de imgenes se definen a los wavelets como funciones que forman una clase general de filtros que cumplen una serie de propiedades. Esto nos aproxima la codificacin de wavelets a un tipo de codificacin por sub-bandas, en la que una seal al aplicarle distintos filtros, puede descomponerse en mltiples bandas. De forma general los wavelets son funciones generadas a partir de una funcin base, mediante dilataciones y traslaciones de esta funcin que satisface ciertos requisitos. Anlogamente a la transformacin de Fourier, tambin para las transformadas wavelet existen tres tipos posibles: transformada continua wavelet (CWT), expansin en serie wavelet y transformada discreta wavelet (DWT). Las funciones base de la transformada wavelet puede o no ser ortonormales, a diferencia de las otras transformadas normalmente tratadas. Esto conduce a que la situacin posea un tratamiento ligeramente ms complicado, ya que es posible que una funcin de ancho de banda limitado sea representada por una expansin en serie de wavelet de infinitos trminos. Puede adems presentarse el caso que una transformada discreta wavelet necesite un nmero de coeficientes superior al nmero de muestras de la funcin de entrada. Algunas propiedades son las siguientes: 1. Los wavelets son bloques constructores de funciones. 2. Los Wavelets tienen localizacin espacial y frecuencial. 3. Los algoritmos basados en wavelets son rpidos. La naturaleza del anlisis wavelet, al descomponer seales en distintas bandas de frecuencia, es especialmente adecuado cuando tratamos con imgenes porque: 1. Las imgenes naturales tienden a tener un espectro de frecuencia ms uniforme, con la mayor parte de la energa concentrada en las frecuencias ms bajas. De manera que se consigue una alta compactacin de la energa. 2. De acuerdo con el sistema de visibilidad humano, la visibilidad del ruido tiende a disminuir a altas frecuencias, lo que permite ajustar el nivel de distorsin introducido por la compresin. Transformada Continua Wavelet Si (x) es una funcin real cuyo espectro de Fourier (f) satisface el siguiente criterio de admisibilidad. entonces (x) se denomina wavelet madre. Ntese que dado que la variable f est presente en el denominador del integrando, se hace necesario que: Adems, como ()=0, puede observarse que el espectro de una funcin que satisface el criterio de admisibilidad se asemeja a la funcin de transferencia de un filtro pasabanda. De hecho, cualquier filtro pasabanda con respuesta impulsiva media nula, que tienda a cero con suficiente rapidez para frecuencias crecientes, puede emplearse como funcin wavelet madre. Un conjunto de bases wavelet {ya,b(x)}, se genera mediante translaciones y cambios de escala de la wavelet madre y(x) de acuerdo a la expresin donde a>0 y b son nmero reales. La variable a determina la escala de la funcin base, mientras que b especifica su posicin sobre el eje de las x. La transformada wavelet continua de u(x) respecto de la wavelet madre y(x) se expresa mediante: Los coeficientes de la transformada son, una vez ms, el resultado de un producto interno entre la funcin a transformar y la funcin base considerada. La expresin de la transformada wavelet continua inversa es: Por medio del ejemplo siguiente puede observarse el comportamiento de la CWT. Considrese la seal no estacionaria de la Figura: est compuesta por cuatro componentes de frecuencias 30 Hz, 20 Hz, 10 Hz y 5 Hz. Ntese que los ejes del grfico de la transformada wavelet continua son la translacin y la escala, y no el tiempo y la frecuencia. De todas maneras es fcil convencerse que la translacin est estrechamente ligada al tiempo, por cuanto indica dnde se encuentra localizada la wavelet madre. La escala por su parte puede ser reconducida a la recproca de la frecuencia, por lo que las escalas ms pequeas corresponden a las frecuencias mayores y la frecuencia disminuye con el aumento de escala. La transformada continua wavelet W(a,b) de una funcin u(x) de una dimensin, es una funcin de dos variables, una ms que la propia u(x). Para cada incremento de una variable, la transformada aumenta su dimensin en una unidad. Entonces, si u(x1,x2) es una funcin de dos dimensiones, su transformada continua wavelet se expresar como: Donde bx1 y bx2 indican las translaciones en las dos dimensiones. DWT El trmino Transformada Wavelet Discreta se refiere a una clase de transformacin que difiere no solo en las funciones de transformacin empleadas, sino en la naturaleza fundamental de esas funciones. La DWT abarca una variedad de transformaciones nicas pero relacionadas. En MATLAB podemos trabajar con la aplicacin de wavelets al dominio 2D correspondiente a imgenes utilizando diferentes tipos de wavelets madre mediante la funcin wavedec2 que calcula los coeficientes de descomposicin en las diferentes escalas de la imagen utilizando las diferentes wavelets madre wfilters Las caractersticas que podemos utilizar a partir de las wavelets son los coeficientes de descomposicin que se obtienen de la imagen en cada una de las direcciones en todas las escalas. estos coeficientes pueden ser extrados utilizando la funcin detcoef2 a partir de los cuales podemos caracterizar regiones de la imagen mediante mtricas que se apliquen a dichos coeficientes. Problemas asociados con el uso de diferentes sensores y de conversores anlogo/digital (A/D), tienen un impacto en el desempeo del sistema. Las discrepancias en ganancia y en polarizacin de seales captadas por varios sensores y conversores A/D es uno de los problemas que surgen y que a menudo conllevan a consumir mucho tiempo en la calibracin, adems de la posibilidad que existe que la estructura o la forma de la seal captada cambie. Los objetivos de la transformada SMQT son eliminar la disparidad entres sensores debido a la ganancia y a la polarizacin; adicionalmente, la SMQT busca extraer eficientemente la estructura de los datos, lo cual permite, que la SMQT sea una forma rpida y robusta para extraer caractersticas para su procesamiento posterior o clasificacin El Problema de la extraccin de la estructura puede ser visto como el problema de compresin de rango dinmico. La extraccin de estructuras de los datos ha sido realizada antes, por ejemplo en el contexto de la Transformada Census, la cual extrae una estructura binaria de una imagen; mas recientemente la Transformada Census Modificada ha sido aplicada en diversos sistemas de extraccin de caractersticas, esta transformada es similar a una SMQT de primer nivel. De cualquier forma, estas tcnicas revelan solo estructuras de un bit, o ncleos de estructuras, mientras que la SMQT puede ser utilizada para extender la representacin de la estructura a un nmero arbitrario predefinido de bits en informacin arbitraria dimensional. Sea x un punto de dato y D(x) un conjunto de puntos de datos. El valor de un punto ser denotado como v(x) . La forma de los puntos de datos es arbitraria, esto quiere decir que D(x) podr ser un vector, una matriz o alguna otra forma arbitraria. La SMQT tiene solo un parmetro de entrada directo, el nivel L; indirectamente tambin tendr como entrada importante el nmero de puntos de datos de D. El conjunto de salida de la transformada es denotado por M(x), la cual tiene la misma forma del conjunto de entrada. Si D(x) es una matriz, entonces M(x) ser tambin una matriz del mismo tamao. La transformada SMQT de nivel L de D(x) a M(x) ser denotada como La SMQT L puede ser descrita en forma de un rbol binario en el cual los vrtices son Unidades de Cuantizacin Media (MQUs). Una MQU se realiza en tres pasos: Calculo del promedio, una Cuantizacin y una divisin del conjunto de entrada. El primer paso de la MQU encuentra el promedio de la informacin, denotado como , como se observa a continuacin Esto significa que V(x) ser el promedio del conjunto original para todos los puntos de datos x. El segundo paso usa el promedio para cuantizar los valores de los puntos de datos entre [0 1]. Sea la funcin de comparacin definida como Y denotando cuantizacin, entonces: Donde se denota el conjunto del promedio cuantizado. Esto quiere decir que U(x) ser un conjunto construido por la funcin de comparacin entre todos los datos y resultando en 1 o en 0 para cada uno de los datos. El conjunto U(x) es la principal salida de una MQU.
El tercer paso divide el conjunto de entrada en
dos subconjuntos Donde D0 se propaga a la izquierda y D1 se propaga a la derecha en el rbol binario La MQU constituye la principal unidad computacional para la SMQT; el primer nivel de transformada, SMQT 1 , est basado en la salida de una simple MQU, donde U es el conjunto de salida en el nodo raz. Las salidas en el rbol binario. Sea el conjunto de salida de una MQU en el rbol, denotado por U(l,n) donde l es el nivel actual y n es el nmero de salida para la MQU al nivel l. Calculando los valores de los puntos de datos en los conjuntos , la final SMQT L es encontrada aadiendo los resultados, la ponderacin es realizada por 2 L-1 a cada nivel ; por lo tanto el resultado para la SMQT puede ser encontrado como se muestra: . Ejemplo de la SQMT sobre una imagen. (A) Imagen Original. (B-I) SQMT1 a SQMT8 La transformada de caractersticas invariante en escala (SIFT) es probablemente el descriptor ms comnmente utilizado en los ltimos aos y ha probado ser robusto ante condiciones problemticas en las escenas de adquisicin (rotacin, distorsin, cambio de pose, cambio de iluminacin y cambios del punto de vista). El principio fundamental de los descriptores SIFT es la extraccin de caractersticas de la imagen que son invariantes en diferentes escalas para establecer el emparejamiento entre diferentes vistas de un objeto en particular. Las etapas fundamentales del procesamiento SIFT para una imagen podemos enumerarlas como: 1. Scale-Space Extrema Detection 2. Keypoint Localization 3. OrientationAssignement El primer paso del algoritmo SIFT es detectar ubicaciones y escalas que pueden ser asignadas repetitivamente bajo diferentes vistas del mismo objeto. Detectar ubicaciones que son invariantes a los cambios de escala de la imagen puede llevarse a cabo buscando caractersticas estables a travs de todas las escalas posibles usando una funcin de escala continua llamada espacio de escala El espacio de escala de una imagen es definido como una funcin que es producida por la convolucin de una Gaussiana variable en escala con una imagen de entrada Para establecer eficientemente las ubicaciones de puntos clave en el espacio de escala se seleccionan las ubicaciones en los mnimos y mximos de una funcin de diferencias de dos Gaussianas de escalas cercanas separadas por un factor k, aplicada en el espacio de escala. ( , , ) L x y ( , , ) G x y ( , ) I x y
( , , ) ( , , ) ( , , ) ( , ) D x y G x y k G x y I x y Una aproximacin eficiente para la construccin de se muestra en la Figura de la diapositiva siguiente donde la imagen original es incrementalmente convolucionada con Gaussianas para producir imgenes separadas por un factor constante k en el espacio de escala. ( , , ) D x y Para detectar los puntos mximos de la funcin D, cada punto de muestra se compara con sus ocho vecinos de la imagen actual y con los 9 vecinos de la imagen una escala superior y una escala inferior. El punto es seleccionado solo si es menor o mayor que todos los otros 26 pxeles. Los resultados experimentales obtenidos por Lowe, para la escogencia del nmero de escalas por cada octavo se muestran en la figura. Una vez que un punto candidato ha sido encontrado mediante la comparacin con sus vecinos, el siguiente paso es hacer un ajuste detallado de la informacin cercana para la ubicacin, escala y radio de las curvaturas principales. Esto se lleva a cabo evaluando la funcin de diferencias de Gaussianas D en cada uno de los puntos de muestreo, desplazando el origen hasta el punto que se esta evaluando. Para garantizar la estabilidad de los puntos, no basta simplemente con rechazar aquellos puntos con bajo contraste con la funcin D. las curvaturas principales pueden ser calculadas de una matriz Hessiana 2x2 en la ubicacin y escala de cada punto. Mediante la asignacin de parmetros de orientacin a los puntos clave, basado en las propiedades de la imagen, se consigue que dichos puntos sean invariantes a la rotacin. Se calculan entonces la magnitud del gradiente y su orientacin para cada punto, teniendo en cuenta la escala en que el punto fue muestreado. Un histograma de orientaciones se forma de las orientaciones del gradiente de los puntos de muestreo con la regin a su alrededor. Los picos en el histograma de orientaciones corresponden a las direcciones dominantes del gradiente local y cualquier otro pico que tengan un 80% del valor del pico ms grande, se utiliza para crear un nuevo punto clave con esta direccin aunque solo al 15% de los puntos se le asignan mltiples orientaciones pero estos contribuyen a la estabilidad final del emparejamiento. Las operaciones previas le han asignado a los puntos clave de la imagen ubicacin, escala y orientacin. Estos parmetros imponen un sistema de coordenadas 2D en el cual se pueden describir regiones locales de la imagen. Primero las orientaciones y las magnitudes del gradiente son muestreadas alrededor del punto clave y para conseguir la invariancia a las rotaciones, las coordenadas del descriptor y de las orientaciones de los gradientes son ponderadas con la orientacin del punto clave. Una funcin de peso Gaussiana con un igual a del ancho de la ventana del descriptor es aplicada para asignar un peso a la magnitud de cada punto muestreado alrededor del punto clave. El propsito de esta ventana Gaussiana es evitar cambios en el descriptor causados por variaciones en la posicin de la ventana y para darle menos peso a aquellas magnitudes del gradiente que estn ms alejadas del punto clave. Se debe tener en cuenta cada gradiente de orientacin usando una interpolacin para ponderar la contribucin del punto muestreado y distribuirla en los histrogramas adyacentes. Es decir cada entrada es multiplicada por un factor de peso (1-d). Para construir el descriptor se forma un vector conteniendo todos los valores de las entradas del histograma de orientaciones, correspondientes a los tamaos de los vectores con sus orientaciones ponderadas. Finalmente el vector caracterstico es modificado para reducir los efectos de la iluminacin mediante una normalizacin del mismo y una posterior umbralizacin. Teniendo en cuenta que el emparejamiento se realizar debido a la forma de la distribucin del histograma y no en cuanto a los tamaos de los gradientes del histograma Se ha realizado deteccin de objetos en imgenes utilizando descriptores locales SIFT, donde se compara la ocurrencia de ciertas caractersticas en una imagen mediante el uso de agrupamientos de las mismas para realizar una deteccin de un determinado objeto. Se propone una cascada de clasificadores que comparen estas caractersticas para mejorar la eficiencia del tiempo de deteccin del objeto. En otra de las aplicaciones, se utiliza una reduccin de las caractersticas SIFT que se extraen para ser aplicadas al reconocimiento de objetos en sistemas de vigilancia. esta reduccin de caractersticas se lleva a cabo mediante la interseccin de los histogramas de estas y mediante un umbral se toma la decisin de descartar una de las caractersticas. SIFT tambin ha sido aplicado al reconocimiento de expresiones faciales, donde se utiliza una variacin llamada D-SIFT, donde se genera una funcin de densidad para los vectores caractersticos y se seleccionan las caractersticas mas discriminativas mediante la divergencia de Kullback Liebler de cada regin del rostro. Posteriormente se realiza la tarea de clasificacin de las caractersticas usando un clasificador WMV. El emparejamiento de escenas ha sido tratado mediante el uso de descriptores SIFT, aplicado al registro de imgenes mediante sensores remotos (imgenes satelitales). Primero se realiza una reduccin de las bandas de la imagen aplicando PCA y una segmentacin posterior mediante el umbralizado de OTSU. Se aplican despus los descriptores a cada regin segmentada y se compara con una imagen de referencia de la escena que se desea registrar. Estas caractersticas aplican para el alineamiento de escenas, mediante el reconocimiento de objetos en diferentes imgenes. Lo que se desea conseguir es el emparejamiento de las mismas instancias de un objeto (edificios, carros, nubes, etc). Se introduce un concepto llamado flujo-SIFT, que permite emparejar las caractersticas a travs de los vectores de flujo, donde se tienen en cuenta la vecindad de una imagen con respecto a las imgenes en la base de datos que comparten una estructura local similar. El seguimiento de objetos en secuencias de video tambin ha sido abordado mediante el uso de SIFT, se propone una metodologa similar a la del filtro de partculas, que incluye dos modelos, el dinmico y el de observacin. Se aplican los descriptores SIFT en la regin donde se encuentra el objeto en el frame anterior para despus buscar los puntos clave en el frame actual.