Cuando se trabaja con una elevada cantidad de datos y variables, una de las principales
decisiones que el analista debe hacer es la seleccin de las variables que optimizan la solucin a
un determinado problema. En ocasiones, un planteamiento terico inicial y un estudio
exhaustivo de las variables puede conducir a la seleccin adecuada de los datos. Sin embargo,
cuando se trabaja con numerosas variables, como es el caso de los datos suministrados por los
sensores multiespectrales e hiperespectrales (estos ltimos con informacin de hasta cientos de
longitudes de onda diferentes), la correlacin existente entre ellas puede ser muy elevada y el
estudio, anlisis y comprensin de todas las correlaciones posibles resultara inviable.
En este tema se describe y analiza el procedimiento estadstico de anlisis multivariante
conocido como anlisis de componentes principales, concebido fundamentalmente como un
mtodo de reduccin de datos. Se tratarn, inicialmente, los aspectos tericos del mtodo,
particularizndolo a nuestro tipo de datos, las imgenes, y de variables, la respuesta espectral en
las distintas longitudes de onda del espectro electromagntico. Finalmente, se repasarn las
principales aplicaciones en el campo de la teledeteccin. El esquema segn el cual se va a
desarrollar el tema es el siguiente:
Objeto
Datos
Procedimiento
Interpretacin geomtrica
Ejemplo
Aplicaciones
Objeto
Este mtodo consiste en la transformacin de un conjunto original de variables en otro
conjunto de variables o componentes, obtenidas mediante combinacin lineal de las anteriores,
de forma que los primeros nuevos componentes generados expliquen el mximo de la
variabilidad total, mientras que el resto vaya explicando menor cantidad de varianza de forma
sucesiva. Adems, las sucesivas combinaciones lineales se extraen de forma que no exista
correlacin entre ellas.
x
...
) = x
...
x
11
X = ( x ,..., x
(nxp)
,..., x p
i1
n1
... x1 j
... ...
... xij
... ...
... x nj
... x1 p
... ...
... xip
... ...
... x np
2 ... 2
1p
11
=
...
...
...
C
( pxp )
2 ... 2
p1
pp
el trmino general de la matriz de covarianzas para dos variables genricas j y j' vendr dado
por la expresin
2
jj '
1 n
= ( xij j )( xij ' j ' )
n i =1
1 n
j = xij
n i =1
Procedimiento
Dadas las variables iniciales x1, ..., xj, ..., xp, las nuevas variables o componentes
principales se obtienen combinando linealmente las variables originales de forma que satisfagan
dos condiciones:
1) que maximicen la varianza, (de forma que cada componente sucesivo explique el
mximo de variabilidad posible).
2) que sean ortogonales entre s. (condicin para que no exista correlacin entre
componentes).
Llamando zf a las nuevas variables (f = 1, ...,p),
y
f
( nx1)
Xu
f
( nxp ) ( px1)
donde:
u1 f
= ...
u pf
z1 f
= ...
z nf
u
j =1
u ' Cu
2
j
= 1) de tal forma
con la restriccin
u 'u = 1
() (vector unitario)
h
= 2Cu1 2 u1 = 0
u1
1
Cu
por lo que
= 1u1
(1)
Premultiplicando por
u ' , se obtiene
1
u ' Cu
1
= 1u1 ' u1 = 1
Xu
u 'u
=0,
u 'u
2
=1 y
u 'u
1
maximizando la expresin
u ' Cu
2
, con las
= 0.
u , ) ,
mencionadas:
h
= 2Cu 2 2 u 2 u 1 = 0
u 2
(2)
se obtiene
Cu
u ' Cu
2
= 0 (), de lo
Cu
por lo que
2u2 = 0 ,
El mismo planteamiento puede aplicarse para la obtencin de los valores y vectores propios
restantes.
u ' Cu = u ' Cu )
1
Generalizando:
Cu
= f u f
Dado que todos los vectores propios son ortogonales, las varianzas son aditivas y la expresin
f
1 + ... + p
representa la proporcin de la varianza total explicada por el componente f.
Nota: En el anexo-I se describe el clculo de valores y vectores propios.
Interpretacin geomtrica
La transformacin de componentes principales puede entenderse fcilmente
considerando nicamente dos variables. Si representamos grficamente los valores de los puntos
de la imagen en el espacio bidimensional definido por las dos variables como ejes de abscisas y
de ordenadas, obtendremos el diagrama de dispersin de la figura 1. En l, la nube de puntos
presenta una forma tpicamente alargada, poniendo en evidencia cierta correlacin o
dependencia entre ambas bandas. Si estas fueran totalmente independientes, su covarianza y su
correlacin seran nulas y la mencionada nube tendra una forma circular. Cuanto mayor sea la
correlacin entre dos bandas, ms alargada ser la nube de puntos y mayor ser la covarianza
entre las bandas (en valor absoluto).
Al realizar el clculo de los componentes principales, los vectores propios de la matriz
de covarianzas nos indican la direccin de los ejes principales o ejes de mnima inercia del
conjunto de datos (PC1 y PC2 en la figura 1) y los valores propios son proporcionales a la
variabilidad de los datos segn los respectivos ejes. Por ello el primer componente, cuyo valor
propio 1 es mximo, explica la mayor variabilidad de la informacin contenida en la imagen,
mientras que el segundo componente explicar el resto.
V ariable 2
PC2
PC1
. .
.
.. ... .
. . . . . . . .. .. ..
. . . ... . . . . .
. ... ..................... ...... . ..
. . ........ ... ....... ..... . . .. .. .. . .. ...
.
. . . .. .. ...... . . .
.
. . . . .... ........ ......................................... . . . .
.. ...................................................................................... .. .. .
. .... ............ ... ................................................ .. .
. . . . .. . .. .. ...... . .
. . .. . ... . .... . . . .
.
.. .. .
.. .. .. .. . .
.. . .
ortogon alidad
V ariable 1
positiva muy superior para la banda 4 (infrarrojo prximo) que para el resto por lo que, teniendo
en cuenta que esta banda est directamente relacionada con un incremento acusado de la
reflectancia de la hoja vegetal debido a su estructura morfolgica interna, parece lgico asociar
el segundo componente al vigor vegetativo y a la presencia de vegetacin, lo cual se corrobora
examinando la imagen de este componente en la figura 2, en el que las zonas de regado
aparecen con ms brillo que el resto.
Figura 2.- Combinacin en falso color infrarrojo (bandas 432-RGB) de la imagen Landsat-TM de los regados
del ro Jcar (izquierda). Imgenes de los componentes principales 1 y 2 (centro y derecha) de la imagen de
las 7 bandas espectrales original.
COMPONENTES PRINCIPALES
CP1
CP2
CP3
CP4
CP5
-0.01300927
-0.02295034
-0.01212206
-0.39838987
0.46653323
-0.74449061
-0.26176915
CP6
CP7
0.35035711 0.31939215
-0.04469158 -0.91823372
-0.49385048 0.22305427
-0.00325463 0.04533381
0.44582854 -0.02061078
0.45230894 -0.03203895
-0.47750101 0.03969677
La tabla 2 muestra los valores propios asociados a cada nuevo componente. Dividiendo
el valor propio de cada componente entre la suma de todos ellos se obtiene la proporcin de
varianza total contenida en los datos originales expresada por el componente en cuestin, lo cual
proporciona un criterio de seleccin del nmero de componentes para utilizar en cualquier
procedimiento de anlisis posterior, como es el caso de una clasificacin espectral.
1
2
3
4
5
6
7
% VARIANZA
% VARIANZA
ACUMULADA
90.44
6.41
1.67
0.69
0.45
0.32
0.02
90.44
96.85
98.52
99.21
99.66
99.98
100
6917.2
490.1
127.7
53.2
34.3
24.4
1.6
Aplicaciones
A) Reduccin del volumen de datos
La principal utilidad del mtodo consiste, como ya se ha visto, en la reduccin de la
dimensionalidad de los datos, eliminando as la informacin redundante debida a la correlacin
entre bandas. Una vez seleccionados los componentes que conlleven la mayora de la
informacin (suma de varianzas relativas prxima a la unidad) pueden realizarse las mismas
operaciones de anlisis de los datos (realce, clasificacin,...) que utilizando la totalidad de las
bandas, consiguiendo resultados similares. Esta aplicacin tiene un enorme potencial cuando se
trabaja con un nmero elevado de bandas espectrales tomadas a intervalos de longitud de onda
muy cortos, lo que ocasiona una gran correlacin entre bandas, hacindose necesario un proceso
estadstico de seleccin.
B) Reduccin del ruido
Los valores digitales de las imgenes
obtenidas mediante sensores a bordo de satliteds
se ven especialmente alterados debido tanto a la
influencia
de
los
fenmenos
de
dispersin
ruido.
El resultado puede limitarse al realce de las reas que hayan sufrido algn cambio,
como mtodo de apoyo a la interpretacin, o bien pueden aplicarse tcnicas posteriores de
anlisis que permitan la deteccin automtica de las mismas.
10
Figura 4.- Ejemplo de aplicacin del mtodo de ampliacin del realce espectral por
decorrelacin. La imagen de la izquierda representa una combinacin en color real con elevado
contraste pero con una gran correlacin entre las bandas espectrales, como puede apreciarse en
sus dos diagramas de dispersin (relacionan las bandas rojo/verde y rojo/azul). El resultado de la
decorrelacin puede verse en la imagen de la derecha, en la que el espacio de color queda mucho
ms aprovechado.
Cuando las bandas espectrales de una imagen estn altamente correlacionadas entre s,
al visualizarla en el espacio de color RGB (utilizado por los monitores estndar) con frecuencia
presenta un elevado componente de gris, lo que supone una carencia de color global en la
imagen. Geomtricamente, esto se debe a que los valores de los pxeles correlacionados se
sitan, lgicamente, en la zona prxima a la diagonal R=G=B del cubo de color RGB formando,
en este espacio de representacin, una concentracin de puntos similar a un elipsoide. Las
11
tcnicas estndar de realce, tales como la ecualizacin del histograma o las basadas en
transformaciones lineales de las bandas individuales, tienden a alargar dicho elipsoide o bien a
orientarlo en otra direccin, pero no consiguen expandirlo de forma que ocupe el espacio de
color disponible.
Entre los diversos mtodos propuestos para superar esta limitacin, uno de los ms
eficientes se basa en la eliminacin de la correlacin de los datos en el espacio de coordenadas
original mediante el clculo de los componentes principales. El mtodo consta de tres fases:
1. Clculo de los componentes principales de la distribucin de valores en el espacio
3D original y transformacin de los datos a este nuevo espacio.
2. Aplicacin de tcnicas de ampliacin del contraste sobre cada uno de los 3 nuevos
ejes, no correlacionados entre s. Esto se realiza mediante la ecualizacin o
escalado de los nuevos histogramas , consiguindose una expansin de los datos en
el espacio tridimensional.
3. Transformacin inversa de los datos al espacio de coordenadas original (RGB).
Estas operaciones pueden realizarse por medio de una sola transformacin lineal para cada
banda. Expresndola en forma matricial:
X D = X U S U 1
donde X es la matriz de datos inicial n x 3 (tres componentes, RGB, para cada uno de los n
pxeles en la imagen); U es la matriz de la transformacin de los componentes principales, cuyas
columnas son los vectores propios de la matriz de covarianzas de X ; S es una matriz diagonal de
escalado, que produce un cambio de escala de los valores (ecualizacin) en el espacio de los
componentes principales; y XD es la matriz de datos resultante, tambin de dimensiones n x 3.
Cada columna de X y XD representa una banda completa de la imagen.
Como se aprecia en el ejemplo de la figura 4, la imagen resultante adquiere unos colores
un tanto exagerados, poco reales, sin embargo, stos no se reasignan al azar, sino que mantienen
su tonalidad inicial (la vegetacin sigue siendo verde, el agua azul, etc.), lo cual permite la
asociacin de cada uno de ellos a las mismas caractersticas fsicas de la escena inicial. Este
mtodo constituye una interesante herramienta de apoyo a la interpretacin, especialmente en
ciertos tipos de aplicaciones en las que se pretende localizar e identificar objetos poco evidentes
(materiales geolgicos, etc.).
12
E) Fusin de imgenes
A pesar de su gran desarrollo en los ltimos aos, los sistemas sensores se disean
adoptando soluciones de compromiso entre los distintos tipos de resolucin, en especial entre la
resolucin espacial y la relacin seal/ruido. Debido a que los sensores multiespectrales
presentan bandas con intervalos de longitud de onda ms estrechos en comparacin con los
sensores pancromticos, generalmente poseen campos de visin instantneos (IFOV:
Instantaneous Field Of View) ms amplios (menor resolucin espacial) para recibir ms fotones
de energa y poder mantener as la relacin seal/ruido.
Los sensores modernos, como los que llevan a bordo las plataformas SPOT y Landsat-7,
adquieren imgenes multiespectrales y pancromticas simultneamente. Mediante la utilizacin
de algoritmos de fusin adecuados se pueden combinar ambos tipos de imgenes para crear una
tercera que preserve la resolucin espectral de la imagen multiespectral e introduzca la
resolucin espacial de la imagen pancromtica.
Uno de los mtodos empleados en la fusin de estas imgenes se basa, precisamente, en
la aplicacin del mtodo de anlisis de componentes principales. El proceso consiste, de forma
global, en los siguientes pasos:
1. Ajuste geomtrico entre ambas imgenes. La imagen pancromtica de alta
resolucin se utiliza como referencia, sobre la cual se registra la imagen
multiespectral de menor resolucin espacial.
2. Remuestreo radiomtrico de la imagen de baja resolucin para conseguir el
mismo tamao de pixel que la imagen de alta resolucin. Esta operacin se lleva a
cabo en el mismo proceso de rectificacin o registro entre ambas imgenes.
3. Aplicacin del anlisis de componentes principales sobre la imagen
multiespectral.
4. Ajuste radiomtrico de la imagen pancromtica con respecto al primer
componente principal.
5. Sustitucin del primer componente principal por la imagen pancromtica.
6. Aplicacin de la transformacin inversa del anlisis de componentes principales,
convirtiendo la imagen al espacio de representacin original.
13
Los supuestos de los que se parte para la aplicacin del procedimiento son los
siguientes:
La luminancia en las bandas del infrarrojo es la misma que en las bandas del visible.
Factores propios del sensor: La imagen de alta resolucin deber tener la mayor
similitud espectral posible con el componente que se sustituya.
Figura 5.- Ejemplo de fusin de imgenes IRS: Imagen pancromtica de 5.8 m/pixel (izquierda); imagen
sinttica en color real obtenida a partir de la multiespectral LISS-III de 23 m/pixel (centro); e imagen
resultante del proceso de fusin (derecha).
14
u . A la ecuacin anterior
...............................
................................................
2
2
2
p1u1 +...+ pp u p = u p p21u1 + p22 u2 +...+ ( pp
) u p = 0
112u1 +...+12p u p = u1
(A-1)
112
122
...
212
222 ...
...
...
p21
p22
12p
22p
...
...
=0
2
... pp
dando lugar a un polinomio de grado p en , cuyas races constituyen los valores propios de C.
Sustituyendo cada uno de los valores propios obtenidos en el sistema de ecuaciones (A1) se obtienen los vectores propios correspondientes.
15