Conceitos Iniciais
1
07/10/2014
Conceitos Iniciais
2
07/10/2014
3
07/10/2014
Sendo:
A a matriz de covarincia
I a matriz identidade
os autovalores
K os autovetores
4
07/10/2014
5
07/10/2014
Tabela 1: temperatura
mnima (oC) para dois
postos vizinhos Matriz de covarincia
s11 s12
Dias Posto-1 Posto-2 S=
1 10 10.7
s21 s22
2 10.4 9.8
3 9.7 10 s12 e s21 so iguais
4 9.7 10.1
5 11.7 11.5
6 11 10.8
7 8.7 8.8
0,7986 0,6793
8 9.5 9.3
9 10.1 9.4
S=
0,6793 0,7343
10 9.6 9.6
11 10.5 10.4
12 9.2 9
13 11.3 11.6
14 10.1 9.8
15 8.5 9.2
n = 15
6
07/10/2014
0,7986 0,6793 1 0 0
S = I= I =
0,6793 0,7343 0 1 0
Subtraindo S de I, tem-se:
0,7986 0,6793
S 2 x 2 I 2 x 2 =
0,6793 0,7343 Com a resoluo do
polinmio,
Resolvendo o determinante e igualando a zero, tem-se:
os valores de que
(0,7986- )(0,7343- )-(0,6793)(0,6793) = 0 satisfazem a equao so:
1=1,4465 e 2=0,0864
0.124963 1.5329 + 2 = 0
[S I ]vij = 0
Essa expresso pode ser reescrita como:
= um vetor coluna
que ter o nmero
de linhas igual ao
de autovalores
Matriz de covarincia autovalores
7
07/10/2014
=
Para 1=1,4465
1
0,7986 0,6793
0,9538
Mas ainda no o autovetor
0,6793 0,7343 = 1,4465 de 1=1,4465.
Autovetores:
V 'S V =
0,7236 0,6902
v1 = v2 =
0,6902 0,7236 Isto , se determinarmos a matriz
transposta dos autovetores (V),
multiplicarmos pela matriz de
Os autovetores originam a matriz: covarincia (S) e pela matriz dos auto-
vetores (V) o resultado obtido uma
matriz diagonal com os autovalores ().
0,7236 0,6902
[
V = v1 v2 = ] 0,7236
0,6902 OBS: V deve ser uma matriz
ortonormal, isto , a matriz transposta
de V coincide com a inversa de V.
Os autovetores vo originar as
componentes principais.
O nmero de autovetores igual ao 1,4465 0
nmero de variveis utilizadas (no caso, 0 0,0864
o nmero de postos).
8
07/10/2014
y
0,7236 0,6902
v1 = v2 = 0.8
0,6902 0,7236
0.6
0.4
0.2
0
x
-0.2
-0.4
-0.6
-0.8
-0.5 0 0.5
! "#
= =
$%& '
No nosso exemplo:
9
07/10/2014
z1 = 0,7236(xi ,k ) + 0,6902(x j ,k )
6 11 10.8 15.414 15.407
7 8.7 8.8 12.369 12.373
8 9.5 9.3 13.293 13.287
Tabela 1: temperatura
Praticando no Matlab mnima (oC) para dois
postos vizinhos
X1 X2
Agora que j sabemos os clculos envolvidos na Posto-1 Posto-2
anlise de componentes principais, vamos refazer 10 10.7
10.4 9.8
o exemplo usando as funes do Matlab.
9.7 10
9.7 10.1
%crie a matriz de dados mostrada ao lado 11.7 11.5
mat =[ digite os valores aqui ]; 11 10.8
8.7 8.8
%matriz de covarincia
9.5 9.3
S=cov(mat)
10.1 9.4
10
07/10/2014
%Escores
z1=(E(1,1)*mat(:,1))+(E(2,1)*mat(:,2))
z2=(E(2,1)*mat(:,1))+(E(2,2)*mat(:,2))
11
07/10/2014
>> S=cov(mat)
S=
9.5506e+06 7.0612e+05 1.4978e+07
7.0612e+05 76270 9.3392e+05
1.4978e+07 9.3392e+05 3.4408e+07
12
07/10/2014
>> [E,lamb]=eigs(S,min(size(S)));
>> lamb
lamb =
4.1474e+07 0 0
0 2.5395e+06 0
0 0 21093
>> round(lamb)
ans =
41474391 0 0
0 2539507 0
0 0 21093
>> E
E=
13
07/10/2014
V=diag(lamb);
s=sum(V);
var_exp=(V/s)*100
var_exp =
94.185
5.767
0.047899
3 Componente: mostra que a varivel patrimnio, por seu menor valor (em
mdulo), no tem importncia na prtica
14
07/10/2014
z1=(E(1,1)*mat(:,1))+(E(2,1)*mat(:,2))+(E(3,1)*mat(:,3))
z1 =
20225
19447
22625
10676
15211
5451.8
5862.2
7570.8
3638
7519
7378
10802
Empresa Escores 1 CP
Pelos valores calculados, pode-se
E1 20225
perceber que as 3 empresas com
melhores desempenhos so: E3, E2 19447
E1 e E2. E3 22625
15
07/10/2014
Exemplo 2
X1 X2 X3 X4
Os dados observados Marca Sabor Aroma Massa Recheio
esto na tabela ao lado, M1 2.75 4.03 2.8 2.62
sendo que os valores M2 3.9 4.12 3.4 3.52
M3 3.12 3.97 3.62 3.05
de entrada na tabela
M4 4.58 4.86 4.34 4.82
para cada marca e cada
M5 3.97 4.34 4.28 4.98
atributo referem-se
M6 3.01 3.98 2.9 2.82
mdia das notas dos 5
M7 4.19 4.65 4.42 4.77
juzes. M8 3.82 4.12 3.62 3.71
Mdia 3.67 4.26 3.68 3.79
Desvio- 0.638 0.332 0.651 0.954
Padro
>> S=cov(mat)
S=
16
07/10/2014
>> [E,lamb]=eigs(S,min(size(S)));
>> lamb
lamb =
1.7368 0 0 0
0 0.064885 0 0
0 0 0.027914 0
0 0 0 0.022476
>> E
E=
17
07/10/2014
V=diag(lamb);
s=sum(V);
var_exp=(V/s)*100
var_exp =
93.776
3.5033
1.5071
1.2135
18
07/10/2014
>> z1=(E(1,1)*mat(:,1))+(E(2,1)*mat(:,2))+(E(3,1)*mat(:,3))+(E(4,1)*mat(:,4))
z1 =
5.3694
6.8456
6.2243
8.702
8.394
5.6679
8.5273
7.0504
19
07/10/2014
Observao:
20
07/10/2014
A SVD baseada no teorema da lgebra linear que diz que uma matriz
retangular A pode ser quebrada (decomposta) no produto de 3 matrizes: uma
matriz ortogonal U, uma matriz diagonal S e na transposta de uma matriz
ortogonal V:
Amn = U mm S mnVnnT
Matriz ortonormal:
O produto da matriz U por sua transposta tem que ser igual a matriz identidade
U * U = I
[U,S,V]=svd(A,0)
21
07/10/2014
Exemplo no Matlab
OBS: svd e svds so funes similares, mas svds uma forma reduzida
A= A=
3 1 1 3 1 1
-1 3 1 -1 3 1
>> [U,S,V]=svd(A) >> [U,S,V]=svds(A)
U= U=
-0.70711 -0.70711 -0.70711 0.70711
-0.70711 0.70711 -0.70711 -0.70711
S= S=
3.4641 0 0 3.4641 0
0 3.1623 0 0 3.1623
V= V=
-0.40825 -0.89443 -0.18257 -0.40825 0.89443
-0.8165 0.44721 -0.36515 -0.8165 -0.44721
-0.40825 5.2736e-016 0.91287 -0.40825 -3.1402e-016
22
07/10/2014
Autovalores
lamb=diag(S).^2
lamb =
12
10
Define os autovetores
E=V
E=
Definio do Nmero
de Componentes Principais
a ser Utilizado nos Estudos
23
07/10/2014
Tabela 1: temperatura
mnima (oC) para dois Nos exemplos apresentados, o nmero de CP foi
postos vizinhos sempre igual ao nmero de variveis. Mas o
objetivo da PCA no reduzir o nmero de
Dias Posto-1 Posto-2 variveis?
1 10 10.7
2 10.4 9.8
3 9.7 10
Reduzir um conjunto de dados contendo um
4 9.7 10.1
grande nmero de variveis para um
5 11.7 11.5
conjunto contendo um nmero bem menor de
6 11 10.8
novas variveis. Estas, por sua vez, devem
7 8.7 8.8
representar uma grande frao da
8 9.5 9.3
variabilidade contida nos dados originais.
9 10.1 9.4
10 9.6 9.6
11 10.5 10.4
12 9.2 9
Como fazer isso?
13 11.3 11.6
14 10.1 9.8 Atravs do critrio das razes latentes
15 8.5 9.2 (autovalores) ou do teste Scree.
CP1 = 0,7236( Posto1) + 0,6902( Posto 2)
CP 2 = 0,6902( Posto1) + 0,7236( Posto 2)
24
07/10/2014
xx
Pad =
onde x o dado original, ) a mdia e o desvio-padro da srie de dados.
25
07/10/2014
Tendncia linear e
xx
Pad =
2. Remover a tendncia linear dos dados e tambm o ciclo sazonal
3. Gerar a matriz de covarincia (ou correlao)
4. Obter os autovalores e autovetores (autovetores originam as CPs)
5. Obter a quantidade de varincia explicada por cada autovalor
6. Definir o nmero de CPs utilizadas no estudo
7. Calcular os z-escores das CPs de interesse.
26
07/10/2014
27
07/10/2014
Valor positivo
Mo (2000)
Valor negativo
Calculou a EOF para dados de
Modo Anular Sul altura geopotencial em 500 hPa.
Obteve 3 padres de
variabilidade, ou seja, trs
comportamentos frequentes
da altura geopotencial.
Essa a primeira
componente principal, ou
tambm chamada de
primeira EOF.
28
07/10/2014
P N P
N
- dados de TSM
29
07/10/2014
lat
lat
os pontos de
observaes
lon lon lon
Pontos de Grade
Tempo
Portanto, a nova matriz :
Exemplo 1
Usar a EOF no campo de SST mensal (dado OISST V2) entre dezembro de 1981
a agosto de 2014.
Parte 1 Vamos refazer a anlise, mas sem remover o ciclo sazonal para ver o
que acontece com as componentes principais.
Usar o script eof_sst_mes_2.m
Variveis importantes que
saem no programa:
V1 = autovalores
EOFs1 = autovetores
EC1 = coeficientes temporais
30
07/10/2014
20 oN 0
-0.005
10 oN
-0.01
-0.015
0o
-0.02
10 oS -0.025
-0.03
20 oS
-0.035
o
20 N 0.01
10 oN 0
-0.01
o
0
-0.02
10 oS
-0.03
20 oS -0.04
150 oE 165oE 180 oW 165 oW 150oW 135 oW 120 oW 105oW 90oW 75oW
A diferena nas nossas EOFs que no fomos tanto a oeste quanto Ashok et al. (2007)
Para o caso da SST, as variveis sabor, aroma etc., passam a ser os pontos de
grade.
O grfico espacial obtido apenas com o plote dos elementos contidos no autovetor.
31
07/10/2014
-0.0085
-0.0095
-0.0105
associado ao ENOS s o
10 S
-0.011
-0.0115
0.015
o
10 N 0.01
0.005
o
0 0
-0.005
o
10 S -0.01
o -0.02
20 S
-0.025
o o o o o o o o o o
150 E 165 E 180 W 165 W 150 W 135 W 120 W 105 W 90 W 75 W
EOF3
Var explicada = 0,03%
0.03
o
20 N 0.02
o
10 N 0.01
o 0
0
-0.01
o
10 S
-0.02
o
20 S
-0.03
o o o o o o o o o o
150 E 165 E 180 W 165 W 150 W 135 W 120 W 105 W 90 W 75 W
Exemplo 2
http://www.cpc.ncep.noaa.gov/products/precip/CWlink/daily_ao_index/history/met
hod.shtml
32
07/10/2014
1 EOF 0.02
0.015
0.01
0.005
44,1% 0
-0.005
Figuras obtidas com os autovetores (EOFs1)
-0.01
-0.015
-0.02
-0.025
-0.03
-0.035
-0.04
0.02
0.015
2 EOF 0.01
0.005
0
15,8% -0.005
-0.01
-0.015
-0.02
-0.025
-0.03
S
72 o -0.035
S -0.04
54 o
-0.045
S
36 o
-0.05
-0.055
-0.06
S
18 o
-0.065
-0.07
-0.075
-0.08
0.02
3 EOF 0.015
0.01
0.005
14,7% 0
-0.005
-0.01
-0.015
-0.02
-0.025
-0.03
S
72 o -0.035
-0.04
-0.045
S
54 o
-0.05
Varincia
S
36 o
-0.055
S
18 o -0.06
Explicada -0.065
-0.07
-0.075
Mo (2000)
-0.08
Com a SVD
0.02
0.015
1
0.01
-1
-0.03
-0.035
-0.04
Existem pequenas
-1 -0.5 0 0.5 1
diferenas em
relao aos valores
obtidos e em alguns COM a ACP A diferena do
0.04
casos, o sinal obtido 0.035 sinal positivo e
0.03
nas duas tcnicas 0.025 negativo em
0.02
oposto. 0.015
funo da
0.01
0.005
metodologia da
Isso no altera a 0 CP e da SVD.
-0.005
interpretao dos -0.01
-0.015
resultados. -0.02
Isso no altera a
-0.025
-0.03
interpretao dos
-0.035 resultados.
-0.04
33
07/10/2014
O ndice nos diz qual o padro (cara) da EOF num determinado ms.
Amn = U mm S mnVnnT
Coef = U*S
1
O ndice que calculamos (azul)
0
no reproduz perfeitamente o do
CPC/NOAA (vermelho) porque
-1
estamos considerando 6 CP e
-2
no sabemos quantas eles
EOF1-MI
-3
EOF1-CPC consideram.
-4
0 50 100 150 200 250 300 350 400 450
Alm disso, usamos a R2
34
07/10/2014
ndice Positivo
ndice Negativo
No ms de maio de 1989
No ms de julho de 1995
(tempo 125)
(tempo 199)
CPC/NOAA = 2,7
CPC/NOAA = -3,0
Michelle = 2,4
Michelle = -3,0
Mdia de 05/89 mdia da srie total Mdia de 07/95 mdia da srie total
155
155
130
18oS
130
105 18oS
105
36oS 80
36oS 80
55
54oS
54oS
55
30
72oS 30
72oS
5
5
-20
-20
-45
-45
-70
-70
-95
-95
-120
-120
-145
-145
-170
-170
Referncias
Jackson, J. E. 1991: A Users guide to Principal Components. John Willey & Sons, NY.
Lorenz, E.N., 1956. Empirical orthogonal functions and statistical weather prediction. Science Report
1, Statistical Forecasting Project, Department of Meteorology, MIT (NTIS AD 110268), 49 pp.
Reboita, M. S., PINTO, S. S., Krusche, N., 2004: INTER-RELAO ENTRE SRIES
METEOROLGICAS E OCEANOGRFICAS MEDIDAS NA BIA DE FUNDEIO ARGOS 32056, NO
PERODO DE 2001 A 2002. CBMET.
35
07/10/2014
http://web.mit.edu/be.400/www/SVD/Singular_Value_Decomposition.htm
http://people.revoledu.com/kardi/tutorial/LinearAlgebra/SVD.html
http://www.ling.ohio-
state.edu/~kbaker/pubs/Singular_Value_Decomposition_Tutorial.pdf
36