Anda di halaman 1dari 3

Anlise de componentes principais

Tcnica estatstica multivariada explica a estrutura de varincia/covarincia pela combinao linear das
variveis originais.
Objetivos:
1- Reduo de dimensionalidade.

Geralmente, p componentes so necessrios para reproduo da variabilidade total de um
sistema, no entanto, a maior parte da variabilidade pode ser representada por um pequeno
nmero k de componentes principais. Logo, esses k componentes principais podem substituir,
sem perda considervel, as p variveis originais. Reduo para n medies de k componentes
principais.

2- Interpretao de dados
Funciona como passo intermedirio na anlise de dados. Revela relacionamentos que no seriam
previamente identificados com o conjunto original.
Retidos n componentes principais com percentual acumulado de explicao da matriz de varincia-
covarincia entre 70 % e 95%.
Interpretao componentes principais
Algebricamente ACP combinao linear particular das p variveis aleatria X
1
, X
2
,....,X
p
.
Geometricamente Seleo de um novo sistema de coordenadas obtido a partir da rotao do sistema
original, ordenadas as variveis X
1
, X
2
,....,X
p
. Os novos eixos representam as direes com mxima
variabilidade e fornecem uma maneira mais simples e parcimoniosa de descrever a estrutura de
covarincia.
ACP corresponde a um ajuste por mnimos quadrados de uma linha reta (N=1) ou um plano/hiperplano
N-dimensional para os dados em um espao K-dimensional de componentes principais. Dados so
centrados na mdia, e trs variveis originais so descritas por apenas dois componentes principais. O
objeto projetado no plano matemtico descrito pelos componentes, e o valor do escore em cada
componente obtido atravs da determinao das distncias entre a origem e o objeto projetado. Os auto
vetores, tambm chamados de Carregamentos, representamos coeficientes da direo do plano ajustado.
A distncia perpendicular entre o objeto e o plano a distncia para o modelo.





Adaptao geomtrica









Os componentes principais dependem somente ou da matriz de correlao das variveis X ,..., ,
2 1
e seu desenvolvimento no requer o
ressupostode normalidade multivariada.
erivados deuma populao normal multivariadaconduzem a interpretaes teis em termos
ps stante. Adicionalmente, inferncias podem ser feitas a partir de
omponentes amostrais q
Seja o vetor aleatrio
te da matriz de varincia-covarincia
X p X
p Por outrolado, os componentes principais
d
de eli ides de densidade con
c uando a populao multivariada normal.

Anda mungkin juga menyukai