MULTIVARIADA
1
Muito do conhecimento
que a
humanidade acumulou ao longo dos
sculos foi adquirido atravs da
experimentao.
A
ideia
de
experimentar no apenas antiga,
mas est presente ainda nos dias
atuais.
A experimentao, no entanto, s se
difundiu como tcnica sistemtica de
pesquisa quando foi formalizada
atravs da estatstica.
2
EXPAM54 - Experimentao e Anlise
Multivariada
a
origem
agrcola
da
experimentao que explica o uso de
3
- Experimentao e Anlise
vrios termos EXPAM54
tcnicos.
Multivariada
Experimentos
cegos:
so
os
experimentos em que o pesquisador
desconhece
a
que
tipo
de
tratamento cada uma das unidades
experimentais foi submetido.
10
11
d)
Tratamentos
em
comparao:
Rao da marca e rao da marca
B.
Forma de designar os tratamentos
s unidades: sorteio.
12
OS DELINEAMENTOS EXPERIMENTAIS
Introduo:
Quando do planejamento de um
experimento essencial definir a forma,
o procedimento, como os tratamentos
so
designados
as
unidades
experimentais. Tais procedimentos so
chamados
de
delineamentos
experimentais.
13
OS DELINEAMENTOS EXPERIMENTAIS
1 Experimentos Inteiramente ao Acaso
Um
delineamento
em
que
os
tratamentos
so
designados
s
unidades experimentais sem qualquer
restrio chamado de experimento
inteiramente ao acaso.
Este
delineamento
s
podem
empregados quando as unidades
experimentais so similares.
comum nesse tipo de experimento
que todos os tratamentos tenham um
14
- Experimentao e Anlise
nmero igualEXPAM54
de
repeties.
Multivariada
OS DELINEAMENTOS EXPERIMENTAIS
1 Experimentos Inteiramente ao Acaso
15
OS DELINEAMENTOS EXPERIMENTAIS
2 Experimentos Inteiramente ao Acaso
com nmero diferente de repeties
O pesquisador nem sempre dispe de
um
nmero
de
unidades
experimentais que mltiplo
do
nmero de tratamentos que pretende
estudar. Em situaes assim temos um
experimento
inteiramente
ao
acaso com nmero diferente de
repeties.
So indicados para o estudo de drogas
16
EXPAM54 - Experimentao e Anlise
teraputicas.Multivariada
OS DELINEAMENTOS EXPERIMENTAIS
2 Experimentos Inteiramente ao Acaso
com nmero diferente de repeties
17
OS DELINEAMENTOS EXPERIMENTAIS
3 Experimentos em Blocos ao Acaso
Em
situaes
prticas
dificilmente
dispe-se de unidades experimentais
similares.
Em tais situaes, emprega-se subgrupos
de unidades experimentais que so
similares (semelhantes) entre si. Tais
grupos so chamados de blocos.
18
OS DELINEAMENTOS EXPERIMENTAIS
3 Experimentos em Blocos ao Acaso
Nessas
situaes,
realizamos
um
delineamento chamado de experimento
em blocos ao acaso.
Pelo fato das unidades experimentais
serem
similares,
o
sorteio
dos
tratamentos feito dentro de cada bloco.
19
OS DELINEAMENTOS EXPERIMENTAIS
3 Experimentos em Blocos ao Acaso
20
OS DELINEAMENTOS EXPERIMENTAIS
3 Experimentos em Blocos ao Acaso
Nota:
(a)Em um experimento em blocos ao acaso,
um bloco pode ser uma faixa de terra,
uma ala da estufa, um perodo de
tempo, uma ninhada, um lote de
produtos industriais, uma faixa de idade,
etc.
(b)O essencial que os blocos renam
unidades similares que se distingam
apenas pelos tratamento que recebem
21
e que haja variabilidade
entre
EXPAM54 - Experimentao
e Anlise blocos.
Multivariada
OS DELINEAMENTOS EXPERIMENTAIS
4 Experimentos em Blocos ao Acaso com
repetio
Em situaes prticas, algumas vezes o
nmero de unidades experimentais que
caem dentro de um bloco pode ser maior
do que o nmero de tratamentos que o
pesquisador pretende comparar.
Em tais situaes, emprega-se um
delineamento chamado experimento
em blocos ao acaso com repeties.
EXPAM54 - Experimentao e Anlise
Multivariada
22
OS DELINEAMENTOS EXPERIMENTAIS
4 Experimentos em Blocos ao Acaso com
repetio
Nota:
(a)O nmero de repeties dos tratamentos
em cada bloco deve ser o mesmo.
(b)A anlise estatstica dos experimentos
em blocos ao acaso com repeties
relativamente simples, desde que o
nmero de unidades dentro de cada
bloco seja um mltiplo do nmero de
tratamentos que se pretende comparar.
EXPAM54 - Experimentao e Anlise
Multivariada
23
OS DELINEAMENTOS EXPERIMENTAIS
4 Experimentos em Blocos ao Acaso com
repetio
24
OS DELINEAMENTOS EXPERIMENTAIS
5 Experimentos em Quadrados Latinos
Os experimentos em quadrados
latinos controlam duas causas de
variao, ou seja, temos dois tipos de
blocos (um duplo bloqueamento).
Esse tipo de delineamento no comum,
na prtica, devido algumas restries. A
principal a de que o nmero de
unidades experimentais igual ao
quadrado do nmero de tratamentos
(tamanho de
amostra maior = custo
25
EXPAM54 - Experimentao e Anlise
Multivariada
maior)
OS DELINEAMENTOS EXPERIMENTAIS
5 Experimentos em Quadrados Latinos
26
medido
o
tempo
de
sobrevivncia de duas amostras de
camundongos, sendo que um desses
grupos recebeu um soro contra
leucemia e o outro, no.
Nesse caso, dizemos que h um fator
chamado de tratamento, e o fator tem
dois nveis (i.e.,
presena
ausncia
28
EXPAM54
- Experimentaoe
e Anlise
Multivariada
29
30
31
595
639
417
563
457
580
615
449
631
450
508
511
517
522
731
583
573
438
613
499
633
648
415
656
632
517
677
555
679
Total
3320
3416
3663
2791
3664
Mdia
553,3
3
16854
32
vrios
no
Em
qualquer
taxa,
devemos
considerar a variao dentro da
amostra uma variao aleatrio ou ao
acaso, e parte do objetivo da anlise
de varincia determinar se as
35
EXPAM54
- Experimentao
e Anlise
diferenas
so
aquelas
que
Multivariada
36
iii.
Independentes;
Normalmente distribudas (ou seja,
seguem uma distribuio normal de
probabilidades) uma com mdias
i, i=1, 2, ..., k.
Homocedsticas, ou seja, possuem
uma varincia comum 2.
EXPAM54 - Experimentao e Anlise
Multivariada
37
...
...
y..
yY22.g ... Y
yii.g ... Yyk.k g Y
Yy1.
gg
1g
EXPAM54 - Experimentao e Anlise
Multivariada
38
Multivariada
Onde:
Y.. : denota o total de todas as nk
observaes.
ygg : denota a mdia de todas as
nk observaes.
40
Desejamos derivar
o mtodo
apropriado para testar a hiptese
H0: 1 = 2 = 3 = ...= k
H1: pelo menos duas mdias no so
iguais.
41
43
y ni yi y yij yi
1i 1 4j 14 2 4 4 3 1i 1 4 4 2 4 4 3 1i 1 4j 14 2 4 4 3
i
ij
Soma de Quadrados do
erros ( ou dos resduos )
44
SQE
k 1
k n 1
QMA
QME
45
Graus de
Liberdade
Soma de
Quadrados
Tratament
o
k 1
SQA
Erro
(resduo)
Total
k n 1
SQE
kn 1
SQT
Quadrados
Mdios
SQA
SQE
k 1
k n 1
F calculado
SQA
f
SQE
k 1
k n 1
46
Exemplo:
Teste
a
hiptese
1=2=3=4=5
ao
nvel
de
significncia de 0,05 ( = 5%), para os
dados da absoro das misturas por
vrios tipos de agregados de cimento.
Soluo:
k = n de tratamentos = 5
n = n de repeties de cada
tratamento = 6
EXPAM54 - Experimentao e Anlise
Multivariada
47
MQE
dms q
n
onde
q = valor tabelado, onde se considera (i) o nvel
de significncia , (ii) o nmero de tratamentos e
(iii) os graus de liberdade do resduo.
MQE =quadrado mdio dos resduos obtido da
ANOVA.
50
EXPAM54 - Experimentao e Anlise
n= nmero de Multivariada
repeties em cada um dos
51
eij ~ N 0;
53
55
57
58
59
ANLISE MULTIVARIADA
60
62
X ( nxp )
x11 x12
x
x
21
22
M M
xn1 xn 2
L
L
O
K
x1 p
x2 p
M
xnp
n
p63
X nxp X 6 x 2
Notas do
5 aluno
80
23
75
55
70
89
75
14
80
75
58
87
Notas de
Clculo I
Notas de
Fsica I
65
X nxp X 4 x 3
Valores
do 2.
Ponto
amostrad
7
6,8
6,9
7,1
10
12
15
12
1
0
Concentra
o de Pb
Colora
o
pH da
amostra
67
x
2
x
M
x p
ou
x ' x1
x2 L
x p
68
forma:
x2 y2
2
2
q x y
x p
M
M
x p y p
y p
69
x x ' x x x ... x
2
1
2
2
2
p
70
71
B( nxp )
b11 b12
b
b
21
22
M M
bn1 bn 2
L
L
O
L
b1 p
b2 p
M
bnp
72
73
3 2
A
4
1
75
0
0 23 0
B
0 5
0
0
0
0 0 2
76
77
1
2
1
1
2
1
2
78
1 , e1 , 2 , e2 ,...., k , ek
79
80
1 , e1 , 2 , e2 ,...., k , ek
EXPAM54 - Experimentao e Anlise
Multivariada
81
1
a) A
1
0
3
2 1
B b)
1 2
3
C c)
1
1
3
82
Q x x Ax
a xx
i 1 j 1
ij i
83
84
polinmio.
a forma quadrtica
1 x1
como um
3 x
2
85
e
e
iii
como:
i 1
P( k x k ) e1 e 2 L
ek
Matriz
ortogonal, ou
seja, P=P-1
(k x k )
1 0 L
0 L
2
M M O
0
0
0
k
86
2 1
a) B
1 2
3 1
Cb)
1 3
87
i 1
1
chamada de matriz raiz
2
quadrada e representada por
88
2 1
a) B
1 2
3 1
Cb)
1 3
89
90
ou
1 2 L
91
11
21
12
1p
22
2 p
E X X
M M O
M
p1
p2
pp
M M O
p1 p 2 L
2 p
M
ij
ij
ii jj
0
M
22 L
M O
0
M
pp
94
V
2
2
V V
95
4 1 2
1 9 3
2 3 25
96
X ( nxp )
x11 x12
x
x
21
22
M M
xn1 xn 2
L
L
O
K
x1 p
x2 p
M
xnp
1.
Observao
(multivariada
)
n-sima
observao
(multivariada)
n
p97
Estatsticas descritivas
multivariadas
Vetor
de mdias amostrais
( ):
X
Dada a matriz X(n x p)= xij (i = 1, 2, ..., n
observaes) e (j = 1, 2, ..., p variveis), a
Xj
mdia amostral
da j-sima varivel
p
dada por:
X ij
Xj
i 1
O vetor de
dado por:
X mdias
X 1 X 2 amostrais
L X p
EXPAM54 - Experimentao e Anlise
Multivariada
98
Estatsticas descritivas
multivariadas
Matriz
de
varincia-covarincia
amostral (S):
Dada a matriz X(n x p)= xij (i = 1, 2, ..., n
X i e (jX k= 1, 2, ..., p variveis), a
observaes)
covarincia amostral
entre as variveis
1 n
sik
X ji X i X jk X k
e
dada por:
n 1 j 1
Estatsticas descritivas
multivariadas
Matriz
de varincia-covarincia amostral
(S):
A matriz de varincia-covarincia
amostral S
s11 s12 L s1 p
dada por:
s
s
L s
S
21
22
M M O
s p1 s p 2 L
s pp
2p
100
Estatsticas descritivas
multivariadas
Matriz
de correlao amostral (R):
Dada a matriz X(n x p)= xij (i = 1, 2, ..., n
observaes) e (j = 1, 2, ..., p variveis), a
X k rik entre as variveis
Xi
correo amostral
sik
e
dada por:
rik
sii skk
Observao: quando i=k, a correlao
igual a 1.
EXPAM54 - Experimentao e Anlise
Multivariada
101
Estatsticas descritivas
multivariadas
Matriz
de varincia-covarincia amostral
(R):
A matriz de correlao
R dada por:
L r
1 r amostral
12
r
1 L
21
R
M M O
rp1 rp 2 L
1p
r2 p
M
102
Exemplo: (continuao)
A matriz de dados :
80 75
23 14
75 58
104
Anlise Multivariada
DISTRIBUIO NORMAL
MULTIVARIADA
105
106
107
x por:
1 x
densidade de X
for
dada
1
2
fX x
108
d X X S X X , j 1, 2,..., n ~
onde
109
110
111
j 1
Grfico qui-quadrado
2
d2 ;2
Passo 2: Faa o grfico de pares
j p
n
, j 1
p2
onde
j 1
2
ordem
100
representa o percentil de
112
Quando
a normalidade coerente com os
113
114
115
Anlise Multivariada
n
X
S
X
0
0
univariado dada por:
X X 1 X 2 L
onde
X p
0 10
20 L
p 0
117
2
T ~
Fp ,n p
n p
onde Fp, np representa um varivel aleatria F
com p e (n p) graus de liberdade.
118
n 1 p
1
P n X 0 S X 0
Fp ,n p
Ento:
n p
em favor
de H1, se
a
2
1 estatstica
T n X 0 S X 0
Fp ,n p
n p
120
8 3
Multivariada
Anlise Multivariada
123
Vetor de
mdia
amostrais
(Populao 1)
x11, x12,...,
x1n1
x1
x2
Matriz de
covarincia
amostral
S1
(Populao
2)
OBS: Nessa
notao,
o primeiro ndice (1 ou 2),
x21a, populao
x22,...,
representa
de origem da observao.
S2
x2n2
124
2)
3)
adicinais
quando
n1
n2
so
Ambas
populaes
soda normais
S1 = matrizas
de covarincia
amostral
multivariadas.
populao 1.
S2 = matrizde
covarincia amostral da
2) Tambm,
1 = 2 = (mesma matriz de
populao 2.
covarincia,
o que chamado de
n1 = tamanho da amostra retirada da
homocedasticidade)
n1 1 S1 1. n2 1 S 2
populao
SP
Quando
1 = 2 = , podemos estimar como:
n2 = tamanho
n1 n2 da
2 amostra retirada da
1)
populao 2.
126
0
1
1
2
T x1 x 2 0
S p
x1 x 2 0 c2
n1 n2
1 1
ento,
2
T x 1 x 2 1 2
S p
n1 n2
x 2 1 2
n1 n2 2 p F
distribuda como uma
p , n n p 1
n1 n2 p 1
1
128
Consequentemente,
P x 1 x 2 1 2
Onde,
1 1
S p
n1 n2
x 2 1 2
n1 n2 2 p
Fp ,n n p 1
n1 n2 p 1
1
129
130
Variedade de milho B
X1
X2
X1
X2
5,7
2,10
4,4
1,80
8,9
1,90
7,5
1,75
6,2
1,98
5,4
1,78
5,8
1,92
4,6
1,89
6,8
2,00
5,9
1,90
6,2
2,01
131
132
Objetivos:
Investigar se as populaes tm o mesmo
vetor mdio.
Suposies:
(i) Independncia: as amostras aleatrias
so independentes
(ii) Homocedasticidade: todas as populaes
tm a mesma matriz de covarincia , ou
seja,
1 = 2 = ..... = EXPAM54
g = -Experimentao
(homocedasticidade)
133
e Anlise
Multivariada
Populao
2:
X2 ~ N(2, )
Populao
g:
Xg ~ N(g, )
Tamanho: n1
Mdia: X1
Amostra 2:
Tamanho: n2
Mdia: X2
S2
Amostra g:
Tamanho: ng
Mdia: Xg
Sg
Covarincia: S1
Covarincia:
Covarincia:
134
H0: 1 = 2 = ... = g
H1: pelo menos uma das mdias i (i = 1, 2.., g) diferente
das demais
Estatstica do teste:
W
B W
(Lambda de
Wilks)
135
Tabela da MANOVA:
Fontes de
Variao g
n x
i
Tratamentos
i 1
g
Resduos
Total
Graus de
liberdade
g 1
B ni x i x x i x
i 1
ni g
ni i1
i 1
g
ni 1
i 1
W ni 1 S i
i 1
B W
136
Tabela da MANOVA:
onde
x
x
i
populao.
vetor
mdio
amostral
da
populao.
i-sima
137
1 : 6 2
9 7
0 4
2 :
2
0
1
9
3 :
2 0
2 3
139
140
Anlise Multivariada
COMPONENTES PRINCIPAIS
141
COMPONENTES PRINCIPAIS
Objetivos
Explicar
Interpretao
COMPONENTES PRINCIPAIS
Objetivos
Nota:
A
suposio
de
(gaussianidade) NO um
necessrio para que a
componentes
principais
utilizada.
normalidade
pressuposto
tcnica de
possa
ser
143
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
X
2
e jp e j1 X 1 ... e jp X p
M
X p
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
145
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
Ainda,
Cov(Yj, Yk) = 0, j k
ou seja, as componentes principais so no
correlacionadas, ou ortogonais.
Nota: os autovalores so ordenados em
ordem decrescente, ou seja, 1 2 3 ...
p
EXPAM54 - Experimentao e Anlise
Multivariada
146
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
p
Varincia Total de X tr ()
j 1
onde j o j-simo
autovalor
de
(p x p)
EXPAM54
- Experimentao
e Anlise
Multivariada
147
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
j 1
j 1
j 1
p
Varincia Total de X tr ()
j
j 1
onde j o j-simo
autovalor
de
(p x p)
EXPAM54
- Experimentao
e Anlise
Multivariada
148
COMPONENTES PRINCIPAIS
Componentes Principais Extradas da
Matriz de Covarincia ()
Definio 4: Se Y1=e1X, Y2=e2X, ..., Yp=epX
so as componentes principais da matriz de
covarincia (pxp), ento:
e
Yi , X k
ik
kk
i, k 1, 2,..., p
eik
= corresponde a k-
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
Nota:
Se as k primeiras componentes principais
explicam
uma
grande
parte
da
variabilidade total do vetor X, pode-se
restringir o foco da ateno apenas ao
vetor aleatrio [Y1, Y2, ..., Yk]
150
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
1 e1 e1 ... k e k e k k 1 e k 1 e k 1 p e p e p
Mas, se os autovalores k+1, k+2, ..., p so
muito pequenos, ento
k
1 e1 e1 ... k e k e k i ei ei
i 1
151
COMPONENTES PRINCIPAIS
Componentes Principais
Matriz de Covarincia ()
Extradas
da
2 2
a)
b)
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
153
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
Sejam
os autovalores da
1 , 2 ,..., p
, e 2e,...,
e p
matrize1S
sejam
os
autovalores correspondentes normalizados.
Ento, a j-sima componente principal
amostral estimada definida como:
Yj e j X e j1 X 1 ... e jp X p
j 1, 2,..., p
154
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
A varincia estimadaYde
i
igual
i a
Yi Yk
Propriedade 2:
A covarincia entre as componentes
principais
e
155
- Experimentao
e Anlise
nula, para EXPAM54
todo
i
k,
ou
seja,
as
Multivariada
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
Propriedade 3:
A varincia total explicada pela j-sima
componente principal
amostral
dada
Yj
por:
V [Yj ]
j
j
p
Varincia Total de X tr (S )
j 1
156
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
Propriedade 4:
A correlao entre a j-sima componente
principalYamostral
e
a
k-sima
varivel
j
Xk dada por:
rY , X
j
e jk j
skk
j , k 1, 2,..., p
157
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
Exemplo 1:
158
COMPONENTES PRINCIPAIS
Estimao das Componentes Principais:
Matriz de Covarincia Amostral (S)
Exemplo 2:
159
Anlise Multivariada
ANLISE FATORIAL
160
ANLISE FATORIAL
Definio:
161
ANLISE FATORIAL
O Modelo Fatorial Ortogonal:
X 1 1
X 2 2
M
X p p
l 11 F1 l 22 F2 ... l 1m Fm 1
l 21 F1 l 22 F2 ... l 1m Fm 2
M
M
l p1 F1 l p 2 F2 ... l pm Fm p
ou em notao matricial
X p x 1 p x 1 L p x m F m x 1 p x 1
162
ANLISE FATORIAL
O Modelo Fatorial Ortogonal
(Pressupostos):
163
ANLISE FATORIAL
Estimao do nmero m de fatores
comuns:
O primeiro passo para conduzir a anlise
fatorial estimar a matriz de correlao
terica , atravs da matriz de correlao
amostral R.
Para a estimao de m, bastar extrair-se
os autovalores da matriz R e orden-los em
ordem decrescente. Observa-se, ento, quais
autovalores so os mais importantes em
termos de grandezas numricas, utilizando
164
EXPAM54 - Experimentao e Anlise
os seguintes critrios:
Multivariada
ANLISE FATORIAL
Estimao do nmero m de fatores
comuns:
Kaiser (1958).m
quantidade i 1
Teste Scree.
165
ANLISE FATORIAL
Estimao do nmero m de fatores
comuns:
Teste Scree.
166
ANLISE FATORIAL
Comunalidade e Varincia Especfica:
167
ANLISE FATORIAL
Exemplo:
Numa pesquisa de mercado feita para avaliar
a aceitao pelo consumidor de um novo
produto
comestvel,
observou-se
uma
amostra de 200 consumidores. Cada
consumidor foi convidado a dar uma nota de
1 a 5 aos seguintes atributos do produto:
(X1) sabor, (X2) aroma, (X3) cor, (X4)
textura, (X5) utilidade, (X6) facilidade de
encontr-lo para compra (locais de compra) e
(X7) embalagem. Com base na respostas dos
questionrios, obteve-se
a seguinte matriz168
de
EXPAM54 - Experimentao e Anlise
Multivariada
ANLISE FATORIAL
Exemplo:
0,103
0, 090
0,163
R
0, 087
0, 050 0, 037 0,138 0, 029
1
0,833 0, 693
1
0,530
0, 056 0, 046 0, 096 0, 045 0,833
0,103 0, 090 0,163 0, 087 0, 693 0,530
1
0,969 0,801 0,960 0, 050
0,969
1
0, 711 0,991 0, 037
0,801 0, 711
1
0, 696 0,138
0,960 0,991 0, 696
1
0, 029
0, 056
0, 046
0, 096
0, 045
169
ANLISE FATORIAL
Exemplo:
Pede-se:
a) Calcule os autovalores e autovetores da
matriz R, utilizando o software estatstico
R.
b) Defina o nmero m de fatores a serem
extrados utilizando o critrio de Kaiser.
c) Estime a matriz dos carregamentos L,
para o nmero de fatores m definido em
(b), usando o mtodo das componentes
principais.
d) Utilizando a matriz
L, obtida em (c) calcule
170
EXPAM54 - Experimentao e Anlise
Multivariada
ANLISE FATORIAL
Exemplo:
Pede-se:
e) Utilizando a matriz L, obtida em (c) calcule
as varincias especficas.
f) Calcule a proporo da variabilidade total
dos dados que explicada por cada um
dos m fatores extrados, onde m o valor
obtido em (b).
g) Construa uma tabela onde conste: (i) os
carregamentos fatoriais estimados, (ii) as
comunalidades,
(iii)
as
varincias
especficas (iv)
proporo da variabilidade
171
EXPAM54 - Experimentao e Anlise
Multivariada
ANLISE FATORIAL
Exemplo:
Pede-se:
R LZ LZ
h) Calcule a matriz residual
Z
i) Desenhe um scree-plot.
j) Se possvel, interprete cada
fatores extrados no item (c).
um
dos
172
ANLISE FATORIAL
Adequabilidade do modelo Fatorial:
A anlise fatorial no adequada para ser
usada em qualquer conjunto de dados. Para
verificar a adequabilidade do modelo fatorial,
utiliza-se alguns testes e medidas, sendo os
mais difundidos na literatura:
Teste de Esfericidade de Bartlett
Critrio de Kaiser-Meyer-Olkin (KMO)
Teste Scree.
EXPAM54 - Experimentao e Anlise
Multivariada
173
ANLISE FATORIAL
Algumas aplicaes de Anlise Fatorial
Ranqueamento
Validao instrumento (questionrio) de
pesquisa (dimensionalidade)
- Exemplo: SERVQUAL
174
Anlise Multivariada
ANLISE DISCRIMINANTE
175
ANLISE DISCRIMINANTE
Objetivos:
(i) Dados dois ou mais grupos (pessoas, objetos,
itens,
etc)
discriminam
(diferenciam,
separam)
esses
grupos
atravs
da
ANOVA/MANOVA. Por exemplo, a varivel
altura uma varivel importante para
discriminar entre homens e mulheres.
(ii) Determinadas as variveis que melhor
discriminam os grupos, utiliz-los para criar
funes discriminantes que sero utilizadas
para colocar novos indivduos, objetos ou
observaes no grupo mais adequado (a
funo discriminante
otimiza a ealocao)
. 176
EXPAM54 - Experimentao
Anlise
Multivariada
1 Aprovao ou
- Nota no vestibular, nota em clculo
reprovao na disciplina I, nmero de disciplinas cursadas sem
de Clculo IV.
reprovao, etc.
2 Gnero de uma
pessoa (masculino ou
feminino)
3 Comprador de um
novo produto e no
comprador.
das
178
1
m 1 2 1 2
2
mdio)
(ponto
Aloca-se X0 em 1 se Y0 m
Aloca-se X0 em 2 se Y0 < m
EXPAM54 - Experimentao e Anlise
Multivariada
181
182
X 1 X i1 S1
X
X
X
X
i1 1 i1 1
n1 i 1
n1 1 i 1
1
X2
n2
n2
X i2
i 1
1 n2
S2
X i2 X 2
n2 1 i 1
i2
X2
183
m y1 y2 X 1 X 2 S p1 X 1 X 2
2
2
184
m
Aloca-se X0 em 1 se Ym
0
Aloca-se X0 em 2 se Y0 <
185
0, 2483
1
S
x1
0,
039
x2
0,
0262
187
188
separar
populaes. No entanto, ela pode ser usada
tambm para classificao.
189
x
x
i
i
a Ba
i 1
g ni
a W a a
xij x i xij x i a
i 1 j 1
190
a1 e1
dado por
. A combinao linear
a1 x
linear
a 2 e 2 de primeira discriminante
chamada
x e x
amostral.a 2 Ax escolha
produz
k
k a
segunda discriminante amostral,
e,
continuando, obtemos
, a ksima discriminante amostral (k s).
191
Aloca-se x0 a k se
y
j 1
a x x
j
k
j
kj
j 1
2
a j
para todo i k, onde
y kj 190
a j x ke
slide
a x x
j 1 j
i
como definido no
e r s.
192
1 (n1 3)
2 (n2 3)
3 (n3 3)
2 5
0 3
1 1
0 6
2 4
1 2
1
0
2
0
1 4
193
ei Sautovalores
h) Encontre os
p e i 1, i 1, 2de W B
194 a
EXPAM54 - Experimentao
e 1
Anlise
i) Calcule os autovetores
de
W
B
usando
Multivariada
195
Anlise Multivariada
ANLISE DE AGRUPAMENTO
(CLUSTER)
196
Medidas de parecena
Distncia
Distncia
Distncia
Distncia
Distncia
Outros
Euclidiana
de Mahalanobis (Estatstica)
de Manhattan (City-block)
de Chebchev
de Minkowski
Medidas de parecena
Jaccard
Coincidncia simples
Gower
Outras
Distncia Euclidiana
Exemplo: Renda e Idade de seis indivduos
Indivduo
Renda
Idade
9,60
28
8,40
31
2,40
42
18,20
38
3,90
25
6,40
41
Por
exemplo:
d B, E
8, 40 3,90
D6 x 6
C
D
E
F
31 25 7,5
2
3, 23
0
15, 74 12,53
0
MATRIZ
DE
DISTNCIA
S
Agrupamentos
Hierrquico
No-Hierrquico (Particional)
Agrupamentos Hierrquicos
Caractersticas:
Subdivididos em:
Aglomerativos
Divisivos (no ser abordado neste curso!)
Agrupamentos Hierrquicos
Funes de ligao
Agrupamentos Hierrquicos
Dendrograma
ANLISE DE CONGLOMERADOS
(CLUSTER)
Indivduo
Renda
Idade
9,60
28
8,40
31
2,40
42
18,20
38
3,90
25
6,40
41
Novo grupo
formado (A, B)
D6 x 6
C
D
E
F
3, 23
0
15, 74 12,53
0
Menor valor da
matriz de
distncias
(desconsiderand
o a diagonal)
MATRIZ DE
DISTNCIA
S
(passo 1)
ANLISE DE CONGLOMERADOS
(CLUSTER)
d A, B , C min d A, C , d B, C
d A, B , D min d A, D , d B, D
D5 x 5
d A, B , E min d A, E , d B, E
A, B
C
D
E
A, B
12,53
0
12, 04 16,30
0
6, 44 17, 07 19,33
0
min 6, 44;7,50 6, 44
d A, B , F min d A, F , d B, F
Menor valor da
min 13,39;10,19 10,19 matriz de
MATRIZ
distncias
DE
Novo grupo
(desconsiderand DISTNCI
formado (C, F)
AS
o a diagonal)
ANLISE DE CONGLOMERADOS
(CLUSTER)
d A, B , C , F min d A, B , C , d A, B , F
d E , C , F min d E , C , d E , F
A, B C , F
0
10,19
12, 04
6, 44
0
12,18
16,19
19,33 0
D
Menor valor da
matriz de
MATRIZ DE
distncias
DISTNCIA
Novo grupo
S
formado {(A,B), E}(desconsiderand
o a diagonal) (passo 3)
ANLISE DE CONGLOMERADOS
(CLUSTER)
A, B , E , C , F
min d A, B , C , F , d E , C , F
d
A, B , E , D
A, B , E
D3 x 3
A, B , E C , F
0
C, F
10,19
12, 04
12,18
min d A, B , D , d E , D
min 12, 04;19,33 12, 04
Menor valor da
matriz de
distncias
MATRIZ DE
(desconsiderand
DISTNCIA
o a diagonal)
S
(passo 4)
ANLISE DE CONGLOMERADOS
(CLUSTER)
d { A, B , E , C , F }, D
D2 X 2 A, B , E , C , F
A, B , E
, C, F
0
12, 04
A, B , E , D , d C, F , D
min d
Menor valor da
matriz de
distncias
MATRIZ
(desconsiderand DE
o a diagonal)DISTNCI
AS
ANLISE DE CONGLOMERADOS
(CLUSTER)
Indivduo
Renda
Idade
9,60
28
8,40
31
2,40
42
18,20
38
3,90
25
6,40
41
Novo grupo
formado (A, B)
D6 x 6
C
D
E
F
3, 23
0
15, 74 12,53
0
Menor valor da
matriz de
distncias
(desconsiderand
o a diagonal)
MATRIZ
DE
DISTNCI
AS
ANLISE DE CONGLOMERADOS
(CLUSTER)
d A, B , C max d A, C , d B, C
d A, B , D max d A, D , d B, D
D5 x 5
d A, B , E max d A, E , d B, E
A, B
C
D
E
A, B
15, 74
0
13,19 16,30
0
d A, B , F max d A, F , d B, F
Menor valor da
max 13,39;10,19 13,39 matriz de
MATRIZ DE
distncias
DISTNCIA
Novo grupo
S
(desconsiderand
formado (C, F)
o a diagonal) (passo 2)
ANLISE DE CONGLOMERADOS
(CLUSTER)
d A, B , C , F max d A, B , C , d A, B , F
d E , C , F max d E , C , d E , F
A, B C , F
0
15, 74
13,19
7,50
0
16, 29
17, 06
19,33 0
D
Menor valor da
matriz de
MATRIZ
distncias
DE
Novo grupo
formado {(A,B), E}(desconsiderand DISTNCI
AS
o a diagonal)
ANLISE DE CONGLOMERADOS
(CLUSTER)
A, B , E , C , F
max d A, B , C , F , d E , C , F
d
A, B , E
D3 x 3
max 15, 74;17, 06 17, 06
A, B , E , D
A, B , E C , F
0
C, F
17, 06
19,33
16, 29
max d A, B , D , d E , D
max 13,19;19,33 19,33
Menor valor da
matriz de
distncias
MATRIZ DE
(desconsiderand
DISTNCIA
o a diagonal)
S
(passo 4)
ANLISE DE CONGLOMERADOS
(CLUSTER)
D2 X 2
A, B , E
C , F , D
d { A, B , E}, C , F , D
A, B , E C , F , D
0
19,33
Menor valor da
matriz de
distncias
MATRIZ
(desconsiderand DE
o a diagonal)DISTNCI
AS
Agrupamentos No-Hierrquicos
Caractersticas:
Agrupamentos No-Hierrquicos
Alguns algoritmos
K-mdias
PAM
outros
Agrupamentos No-Hierrquicos
K-mdia
ANLISE DE CONGLOMERADOS
(CLUSTER)
Renda
Idade
9,60
28
8,40
31
2,40
42
12,00
30
ANLISE DE CONGLOMERADOS
(CLUSTER)
d B, D
d C , A
8, 4 9, 6 31 28 3, 231099
2
2
8, 4 12 31 30 3, 736308
2, 4 9, 6 42 28 15, 74293
2
2
d C , D 2, 4 12 42 30 15,3675
2
ANLISE DE CONGLOMERADOS
(CLUSTER)
X A, B
9 29,5
2
2
seja,
2, 4 12
2
X C , D
42 30
7, 2 36
ANLISE DE CONGLOMERADOS
(CLUSTER)
ANLISE DE CONGLOMERADOS
(CLUSTER)
d B, X 1, 62
d B, X 5,14
d A, X A, B 1, 62
d A, X C , D 8,35
A, B
C,D
d D, X 3, 04
d C , X A, B 14,14
A, B
d D, X 7, 68
d C , X C , D 7, 68
C ,D
Troca de
grupo!!!
ANLISE DE CONGLOMERADOS
(CLUSTER)
8,
4
12
28
31
30
X A, B , D
10 29, 67
3
3
2, 4
X C
1
42
1 2, 4 42
ANLISE DE CONGLOMERADOS
(CLUSTER)
d D, X
2, 03
d B, X A, B , D 2, 08
A, B , D
d C , X A, B , D 14, 49
d D, X 15,37
d B, X C 12,53
C
d C , X C 0