Anda di halaman 1dari 12

Clasificacin de imgenes La clasificacin de imagen hace referencia a la tarea de extraer clases de informacin de una imagen rster multibanda.

El rster resultante de la clasificacin de imagen se puede utilizar para crear mapas temticos. Dependiendo de la interaccin entre el analista y el equipo durante la clasificacin, existen dos tipos de clasificacin: supervisada y no supervisada. Con la extensin ArcGIS Spatial Analyst, hay un conjunto completo de herramientas Multivariante para realizar clasificaciones supervisadas y sin supervisin. El proceso de clasificacin es un flujo de trabajo de varios pasos; por consiguiente, se ha desarrollado la barra de herramientas Clasificacin de imagen para proporcionar un entorno integrado para realizar clasificaciones con las herramientas. La barra de herramientas no solo facilita el flujo de trabajo para realizar clasificaciones supervisadas y sin supervisin, sino que tambin contiene funciones adicionales para analizar los datos de entrada, crear muestras de capacitacin y archivos de firma, y determinar la calidad de las muestras de capacitacin y los archivos de firma. La manera recomendada de realizar la clasificacin y el anlisis multivariante es mediante la barra de herramientas Clasificacin de imagen. El objetivo de la clasificacin es asignarle una clase o categora a cada celda de un rea de estudio. Algunos ejemplos de una clase o categora incluyen tipo de uso del suelo, ubicaciones preferidas por los osos y posible avalancha. Hay dos tipos de clasificacin: supervisada y no supervisada. En una clasificacin supervisada, tiene una muestra de las entidades. Por ejemplo, sabe que hay un bosque de conferas en la regin noroeste del rea de estudio, entonces la identifica adjuntndola en el mapa con un polgono (o con varios polgonos). Se crea otro polgono que abarca un campo de trigo, otro para edificios urbanos y otro para agua. Sigue este proceso hasta que tenga las entidades suficientes para representar una clase, y se identifican todas las clases en los datos. Cada agrupacin de entidades se considera una clase y el polgono que abarca la clase es una muestra de capacitacin. Una vez que identific las muestras de capacitacin, las estadsticas multivariantes se calculan sobre ellas para establecer las relaciones dentro y entre las clases. Las estadsticas se almacenan en un archivo de firma. En una clasificacin no supervisada, no conoce cules entidades estn realmente en una ubicacin especfica, pero desear agregar cada una de las ubicaciones en un nmero especfico de grupos o clusters. Lo que determina a cul clase o cluster se asignar cada ubicacin depende de las estadsticas multivariantes que se calculan en las bandas de entrada. Cada cluster se separa estadsticamente de los otros clusters basndose en los valores para cada banda de cada celda dentro de los clusters. Las estadsticas que establecen la definicin del cluster se almacenan en un archivo de firma.

Existen cuatro pasos para realizar una clasificacin: Crear y analizar los datos de entrada. Producir firmas para el anlisis de clase y cluster. Evaluar y, de ser necesario, editar las clases y los clusters. Realizar la clasificacin.

Existen dos tipos de entrada para la clasificacin: las bandas del rster de entrada que se van a analizar y las clases o los clusters en donde ajustar las ubicaciones. Las bandas del rster de entrada que se utilizan en el anlisis multivariante necesitan influir o ser una causa subyacente en la categorizacin de la clasificacin. Es decir, pendiente, profundidad de la nieve y radiacin solar pueden ser factores que influyan en una potencial avalancha, mientras que el tipo de suelo puede no tener efecto alguno. Una clase corresponde a una agrupacin significativa de ubicaciones. Algunos ejemplos de clases incluyen bosques, cuerpos hdricos, campos y reas residenciales. Las clases derivadas de clusters incluyen la preferencia de venados o el potencial de erosin. Cada ubicacin se caracteriza por un conjunto o vector de valores, un valor para cada variable o banda introducida en el anlisis. Cada ubicacin se puede visualizar como un punto en un espacio de atributos multidimensionales cuyos ejes corresponden a las variables representadas en cada banda de entrada. Una clase o un cluster es una agrupacin de puntos en este espacio de atributos multidimensional. Dos ubicaciones pertenecen al mismo cluster o clase si sus atributos (vector de valores de banda) son similares. Un rster multibanda y los rsteres individuales de banda nica se pueden utilizar como entrada en un anlisis estadstico multivariante. Las ubicaciones que corresponden a clases conocidas pueden formar clusters en el espacio de atributos si las clases se pueden separar, o distinguir, por los valores de atributo. Las ubicaciones que corresponden a clusters naturales en el espacio de atributos se pueden interpretar como clases de estratos de ocurrencia natural. La barra de herramientas de clasificacin de imagen de Spatial Analyst ayuda con el flujo de trabajo de varios pasos que se requiere para realizar una clasificacin. Con la barra de herramientas puede crear y analizar clases y clusters, crear y validar firmas, y realizar una clasificacin en un entorno integrado. Clasificacin supervisada La clasificacin supervisada utiliza firmas espectrales obtenidas de las muestras de capacitacin para clasificar una imagen. Con la ayuda de la barra de herramientas Clasificacin de imagen, puede crear fcilmente muestras de

capacitacin para representar las clases que desea extraer. Tambin puede crear con facilidad un archivo de firma a partir de las muestras de capacitacin que, a continuacin, las herramientas de clasificacin multivariante utilizarn para clasificar la imagen. Ejemplo En el siguiente ejemplo, se utiliz la barra de herramientas Clasificacin de imagen para clasificar una imagen de satlite Landsat TM. La siguiente imagen de satlite sin procesar es una imagen de Landsat TM de cuatro bandas de la zona del norte de Cincinnati, Ohio.

Las cinco clases de uso del suelo se definieron usando la barra de herramientas de la imagen de satlite: Comercial/Industrial, Residencial, Tierra para cultivos, Bosque y Pastizal.

La calidad de las muestras de capacitacin se analiz utilizando las herramientas de evaluacin de muestras de capacitacin.

Utilizando la barra de herramientas Clasificacin de imagen y el Administrador de muestras de capacitacin, se determin que las muestras de capacitacin eran representativas de la zona y estadsticamente separadas. Por consiguiente, se realiz una clasificacin de probabilidad mxima desde la barra de herramientas. A continuacin, la imagen clasificada se limpi para crear un mapa final del suelo, como se muestra a continuacin.

Qu es una clase? Una clase corresponde a una agrupacin significativa de ubicaciones. Por ejemplo, bosque, agua y cosecha alta de trigo son todas clases. Cada ubicacin se caracteriza por un conjunto o vector de valores, un valor para cada variable o banda de entrada. Cada ubicacin se puede visualizar como un punto en un espacio de atributos multidimensionales cuyos ejes corresponden a las variables en las bandas de entrada. Un agrupamiento de puntos en este espacio de atributos multidimensionales se denomina cluster, y en este caso, como el cluster hace referencia a algo significativo, tambin se lo puede considerar una clase. Dos ubicaciones pertenecen al mismo cluster si sus atributos (vector de valores de banda) son similares. Las clases conocidas pueden formar clusters en el espacio de atributos si las clases se pueden separar, o distinguir, por los valores de atributo. Las ubicaciones que corresponden a clusters naturales en el espacio de atributos se pueden interpretar como clases de estratos de ocurrencia natural. Identificar clases para una clasificacin supervisada En una clasificacin supervisada, conoce en qu clases desea dividir el sitio de estudio, y tiene ubicaciones de muestra en el sitio de estudio que son representativas de cada clase. Por ejemplo, si est creando un mapa de uso del suelo desde una imagen satelital, las clases pueden ser urbana, agua, bosque, campos y carreteras. El objetivo es asignar cada ubicacin en el rea de estudio a una clase conocida. Cuantas ms ubicaciones de muestra se pueden identificar como pertenecientes a una clase, ms homogneos sern los valores de celda en una clase, y mejor la clasificacin subsiguiente. Las

ubicaciones reales que identifican las ubicaciones de clases conocidas se denominan muestras de capacitacin. Las muestras de capacitacin se pueden identificar en una capa de polgono o en un rster. Cuando se definen las muestras de capacitacin, puede identificar un rster existente como referencia. En general, aparece una composicin de color de las tres primeras capas en el rster como fondo y se utiliza como referencia para identificar las reas que se agrupan al producir muestras de capacitacin. Crear clusters en una clasificacin no supervisada El primer paso en una clasificacin no supervisada es crear clusters. Estadsticamente, los clusters son agrupaciones que ocurren naturalmente en los datos. La herramienta Cluster ISO requiere bandas del rster de entrada, el nmero de clases, el nombre del archivo de firma de salida, el nmero de iteraciones, el tamao mnimo de clase, y el intervalo en el cual se pueden tomar puntos de muestra desde donde calcular los clusters (los ltimos tres parmetros se analizan a continuacin). La herramienta devuelve un archivo de firma que contiene estadsticas multivariantes para un subconjunto de las celdas para los clusters identificados. Los clculos resultantes identifican qu ubicacin de celda pertenece a qu cluster, el valor medio para el cluster y la matriz de varianza-covarianza. Esta informacin se almacena en un archivo de firma de ASCII. El archivo de firma es esencial en el clustering y la clasificacin de las celdas restantes sin muestras. Almacenar estadsticas de cluster o clase: el archivo de firma El archivo de firma es un archivo ASCII que almacena las estadsticas multivariantes para cada clase o cluster de inters. El archivo incluye el medio para cada clase o cluster, el nmero de celdas en la clase o cluster, y la matriz de varianza-covarianza para la clase o el cluster. El archivo de firma se puede visualizar con cualquier editor de texto. Para cualquier clase o cluster, los valores de diagonal que se mueven desde la parte superior izquierda hacia la parte inferior derecha en la matriz de varianzacovarianza, son los valores de varianza para las variables que corresponden a las bandas del rster de entrada identificadas por la interseccin de fila/columna en la matriz para las bandas. Todos los otros valores en la matriz son valores de covarianza. Cmo se determinan los clusters para una clasificacin no supervisada

El nombre del algoritmo utilizado para crear clusters en una clasificacin no supervisada es Cluster ISO. El prefijo ISO del algoritmo de clustering de isodatos significa Organizacin automtica iterativa, como mtodo de realizar el clustering. Los clusters se calculan utilizando un subconjunto de celdas en el rea de estudio. Todos los clculos de cluster se llevan a cabo en los valores de celda en el espacio de atributos multivariantes y no se basan en caractersticas espaciales. Es decir, el valor medio se deriva de los valores de atributos para las distintas bandas de entrada. Los valores de varianza y covarianza se calculan a partir de la variacin dentro y entre bandas. El siguiente ejemplo utiliza un enfoque de clustering ISO o valor medio K. Un rster de dos bandas se utilizar para explicar la metodologa tericamente. Esta misma metodologa trabaja por el total de bandas que se introducen, o en un espacio dimensional n. La siguiente discusin es conceptual para permitir una mejor comprensin del enfoque de clustering ISO. Se realiza un grfico vaco con el rango de valores en la primera banda que se grafic en el eje x y el rango de valores en la segunda banda que se grafic en el eje y. Se dibuja una lnea de 45 grados y se divide en el nmero de clases que especifica. El punto central de cada uno de estos segmentos de lnea es el valor medio inicial para las clases.

Cada celda de muestra se dibuja en el grfico y la distancia desde el punto a cada punto central medio se determina en la lnea de 45 grados. La distancia se calcula en el espacio de atributos utilizando el teorema de Pitgoras. Se asigna el punto de muestra al cluster representado por el punto central medio ms cercano.

Se grafica el siguiente punto de muestra y se repite el procedimiento anterior para todos los puntos de muestra.

El procedimiento anterior itera. Antes de la prxima iteracin, se calcula un nuevo punto central medio para cada cluster basado en los valores de las ubicaciones de celda asignados al cluster en la iteracin anterior. Con el nuevo punto central medio para cada cluster, se repiten los dos pasos anteriores.

Se actualizan los valores medios, y se repite el paso anterior. El proceso de iteracin para actualizar los valores medios sigue hasta alcanzar el nmero de iteraciones definido por el usuario o hasta que menos del 2 por ciento de las celdas cambian de un cluster a otro en relacin a los valores medios nuevos en una iteracin.

El clustering es sensible al rango de valores en cada banda. Este rango de valores determina los valores en el eje x e y desde donde se calculan las distancias euclidianas entre los puntos medio y de muestra. Para que los atributos de cada banda se consideren iguales, el rango de valor para cada banda debe ser similar, ya sea al realizar una clasificacin supervisada o un clustering no supervisado. Cuando el rango de valor de una banda es pequeo en relacin a las otras bandas, la distancia euclidiana en un espacio multivariante puede ser tan pequeo que varios clusters resultarn en un valor medio de cero. Si uno de los clusters tiene un valor medio de cero, la clasificacin final y cualquier otra herramienta multivariante que

depende de un archivo de firma fallar. Sera ideal que todas las bandas se normalicen al mismo rango de valor. Las estadsticas que se incluyen en el archivo de firma ayudan a determinar si las clases o los clsteres son buenos en trminos de divisibilidad en el espacio de atributos multidimensionales de las bandas de entrada. Un buen cluster debe superponerse poco con los otros clsteres en el espacio multivariante. Para determinar si los clsteres se superponen, puede utilizar la herramienta Dendrograma y explorar el archivo de firma. Dendrograma Un dendrograma ordena las clases o los clsteres en un archivo de firma relacionados unos con otros, utilizando una distancia multidimensional que separa las clases en un espacio de atributos. La herramienta Dendrograma crea un archivo ASCII que muestra grficamente las relaciones de distancia entre las clases en el archivo de firma. La herramienta necesita un archivo de firma de entrada, una especificacin de las estadsticas que se deben incluir, algunas caractersticas de formateo y el nombre del dendrograma de salida. Puede utilizar cualquier editor de texto para visualizar los resultados. El objetivo de la clasificacin es asignar cada celda en el rea de estudio a una clase conocida (clasificacin supervisada) o a un clster (clasificacin no supervisada). En ambos casos, la clasificacin se realiza a travs de un archivo de firma que contiene las estadsticas multivariantes de cada clase o clster. El resultado de cada clasificacin es un mapa que divide el rea de estudio en clases conocidas, que corresponden a muestras de capacitacin, o a clases de ocurrencia natural, que corresponden a clsteres definidos por el clustering. La clasificacin de ubicaciones en clases de ocurrencia natural que correspondan a clsteres tambin se conoce como estratificacin. La barra de herramientas Clasificacin de imagen proporciona un entorno integrado de ayuda con el flujo de trabajo de varios pasos que se necesita para realizar una clasificacin. Para obtener ms informacin sobre la barra de herramientas, consulte Qu es la clasificacin de imagen?. Mxima verosimilitud Las celdas en una clase muy pocas veces son homogneas. Esto es especialmente cierto con las muestras de capacitacin que se toman para una clasificacin supervisada. Si las maderas duras en la sombra, por ejemplo, tienen una caracterstica de reflectancia similar a la de las conferas a pleno sol, ambos tipos de rboles entrarn en la misma clasificacin. Una ubicacin en una muestra de capacitacin de un

ecosistema en donde se espera encontrar osos, mostrar algunas ubicaciones que los osos evitan. En el siguiente diagrama, la clase A representa maderas duras y la clase B representa maderas blandas. Cmo clasifica una celda que se encuentra en la superposicin de las dos clases? Se debe clasificar como clase A o B?

El clasificador de mxima verosimilitud calcula para cada clase la probabilidad de la celda que pertenece a esa clase segn los valores de atributos. La celda se asigna a la clase con la probabilidad ms alta, y resulta en el trmino "verosimilitud mxima". Se necesitan algunas presuposiciones para que el clasificador de verosimilitud mxima funcione de forma exacta: Los datos para cada banda se deben distribuir normalmente. Cada clase debe tener una distribucin normal en un espacio de atributos multivariante. Las probabilidades previas de las clases deben ser iguales, es decir, ante la falta de ponderacin de los valores de atributos, todas las clases sern iguales.

Si la probabilidad previa no es igual para cada clase del rea de estudio, puede ponderar las clases. Por ejemplo, si clasifica una imagen satelital de Alaska, el bosque y otros tipos de vegetacin recibirn una probabilidad previa mayor que las viviendas. Es decir, la probabilidad de que una ubicacin de celda incluya una vivienda es mucho menor de que la celda incluya algn tipo de vegetacin. Si un valor de celda cae en la parte superpuesta de las clases del tipo vivienda y vegetacin, hay ms posibilidades de que la ubicacin incluya vegetacin en vez de una vivienda, por ello, la ubicacin deber clasificarse segn corresponda. Esta lgica de probabilidad y ponderacin se basa en las reglas de decisin bayesiana. Los valores de probabilidad reales para cada celda y clase se

determinan desde los medios y la matriz de covarianza de cada clase (almacenados en el archivo de firma). Para realizar una clasificacin, utilice la herramienta Clasificacin de mxima verosimilitud. Esta herramienta requiere bandas de entrada de rsteres multibanda y rsteres individuales de banda nica y el archivo de firma correspondiente. Se debe identificar la manera en que se ponderan las clases o los clsteres. Existen tres maneras de ponderar las clases o los clsteres: igual, celdas en muestras, o archivo. Cuando se elige igual, todas las clases se ponderarn con la misma probabilidad previa. Cuando se elige una celda en muestras, las probabilidades previas sern proporcionales al nmero de celdas en cada clase o clster en el archivo de firma. Cuando se elige archivo, se activa el control de entrada del archivo a priori y las probabilidades previas se leen desde un archivo especfico. Se debe identificar una fraccin de rechazo. La fraccin de rechazo identifica la porcin de celdas que permanece sin clasificar por la menor posibilidad de asignacin correcta. El valor predeterminado es 0,0; por lo tanto, se clasificarn todas las celdas. Se puede crear una confianza opcional. Finalmente, se debe especificar el nombre del rster de salida. Capas de probabilidad para cada clase En vez de tener una celda asignada a una clase basada en la probabilidad ms alta en un rster de salida, la herramienta Capas de probabilidad para cada clase da como resultado capas de probabilidad, una banda para cada clster o clase de entrada. Los valores en cada ubicacin para cada banda almacenan la probabilidad de esa celda que pertenece a la clase o clster basada en los atributos de las bandas de entrada originales. Esta capacidad puede ser til en la siguiente situacin. Imagine que clasifica una imagen, en la que una clase es bosque y otra es humedal. Despus de ejecutar la herramienta, ver que hay una celda en el rster de salida de la clase bosque que recibe una probabilidad del 60 por ciento de pertenecer a la clase bosque, en el rster de salida humedal, y una probabilidad del 30 por ciento de pertenecer a la clase humedal. En vez de clasificar la ubicacin de la celda como bosque, la puede clasificar como un bosque hmedo. Revisin de la clasificacin multivariante Clasificacin supervisada Los siguientes son los pasos para realizar una clasificacin supervisada: Identificar las bandas de entrada. Producir muestras de capacitacin desde ubicaciones conocidas de las clases deseadas.

Desarrollar un archivo de firma. Ver y editar el archivo de firma de ser necesario. Llevar a cabo la clasificacin.

Clasificacin no supervisada Los siguientes son los pasos para realizar una clasificacin no supervisada: Identificar las bandas de entrada. Definir el nmero de clsteres que se deben crear. Desarrollar un archivo de firma. Ver y editar el archivo de firma de ser necesario. Llevar a cabo la clasificacin.

Anda mungkin juga menyukai