Anda di halaman 1dari 65

Prof.

Jos Francisco Moreira Pessanha


professorjfmp@hotmail.com
Anlise Fatorial
An R and S-Plus companion to multivariate analysis
Brian Everitt, Srpinger, 2004
An R and S-Plus companion to multivariate analysis
Brian Everitt, Srpinger, 2004
Uma empresa que atua no mercado varejista
identificou nove atributos, considerados pelos consumidores
como determinantes no critrio de escolha entre diversas lojas:

Uma forma alternativa de abordar o problema consiste em
trabalhar com um pequeno nmero de dimenses mais gerais ou
fatores, ao invs de itens especficos representados por cada um
dos atributos.
A administrao da empresa quer
compreender como os
consumidores tomam a deciso,
mas percebe que analisar e
estabelecer estratgias de
marketing para cada atributo uma
tarefa muito complicada.
Motivao (HAIR et al, 2005)
Matriz de correlaes
Matriz de correlaes aps a troca das posies das linhas e colunas
A variveis em cada bloco compartilham um mesmo fator comum, por
isso as correlaes elevadas entre elas.
Identificamos trs construtos que emergiram a partir dos grupos de
variveis altamente correlacionadas,
Neste exemplo : servios, oferta e valor. Estes resultados do a
equipe da administrao da empresa um pequeno conjunto de
conceitos que devem ser considerados na elaborao de
estratgias de marketing.

A cada grupo de variveis
encontrado pela anlise da
matriz de correlao
associado um fator no
observvel (latente), com
um significado que deve ser
interpretado com base nas
variveis envolvidas.
A anlise da matriz de correlao revela a existncia de grupos de
variveis altamente correlacionadas entre si, mas que tem relativamente
uma baixa correlao com outras variveis da matriz.

Cada grupo de variveis correlacionadas representa um construto bsico
(no observvel) responsvel pelas elevadas correlaes entre as
respostas.

Os construtos so conceitos mais amplos, cujas facetas so as
observaes das variveis em cada grupo.

Ao invs de usar um grande nmero de caractersticas especficas
(variveis) para sumarizar um conjunto de dados, pode-se utilizar um
pequeno nmero de construtos que condensem a maior parte da
informao contida nas variveis.

Assim, eliminamos a informao que possa ser considerada como
redundante garantindo perda mnima de informao.
Anlise fatorial (Conceitos)
Anlise fatorial (Conceitos)
Tcnica de dependncia
Tcnica de interdependncia
Anlise fatorial
Dois enfoques
Anlise fatorial exploratria: busca dimenses
latentes, para saber o que mais importante ou
mais significativo de um conjunto de variveis.
Analise fatorial confirmatria: se desenha uma
estrutura dos fatores e em seguida, busca-se a
confirmao desta, estudando as variveis
observadas. (uso em modelagem de
comportamento).
Exemplo 1 Anlise Fatorial
da regies administrativas do
municpio do Rio de Janeiro
Matriz de dados (24 regies e 8 variveis)
Matriz de correlaes
Matriz de correlaes
Anlise fatorial
Os bairros, originalmente
descritos em um espao
de oito dimenses,
podem ser projetados em
um mapa (representao
bidimensional) formado
pelas duas primeiras
componentes que juntas
concentram 91% da
varincia total
Matriz de correlaes (dados originais)
Matriz de correlaes aproximada pela
representao bidimensional das 8 variveis
Matriz de resduos
Matriz de
correlaes
(dados
originais)
Matriz de
correlaes
aproximada pela
representao
bidimensional das
8 variveis
Matriz de
resduos
= -
Valores reduzidos para os resduos indicam que a representao
bidimensional preserva boa parte da estrutura de correlao entre as
varivies. A representao bidimensional fornece uma boa representao
dos dados.
A comunalidade quantifica a parcela da varincia de
uma varivel que concentrada pelas componentes
selecionadas

As elevadas comunalidades indicam que a
representao bidimensional concentra a maior parte da
varincia em cada varivel, o mapa gerado pelas duas
primeiras componentes fornece uma boa representao
da estrutura de cvoarincia entre as variveis
Representao das variveis no mapa bidimensional
Escores das regies nos eixos fatoriais
Representao das regies nos eixos fatoriais
Exemplo 2 Anlise Fatorial das
taxas de retorno de uma carteira de
aes Johnson & Wichern 2002.
Este exemplo refere-se ao conjunto das sries de retorno semanais
no perodo de janeiro de 1975 at dezembro de 1976 (n=100
semanas) de 5 empresas norte americanas (p=5) listadas na New
York Stock Exchange. A srie de retorno semanal definida como
Matriz de correlao
A
u
t
o
v
a
l
o
r
e
s

e

a
u
t
o
v
e
t
o
r
e
s

Os dois primeiros fatores
concentram cerca de 73% da
varincia total dos dados:

(2,8570 + 0,8090)/5 = 0,7332
Exemplo 3 Anlise Fatorial
com o SPSS Fvero et al, 2009.
Um analista de mercado quer estudar as
relaes estruturais entre quatro indicadores
financeiros provenientes de 45 empresas:
Prazo mdio de recebimento das vendas
Endividamento
Vendas
Margem lquida das vendas
Dados
Selecione Analysis/Data Reduction/Factor
Selecione as variveis
Clique aqui
para
selecionar
as variveis
marcadas
Preencha as opes da caixa de dilogo
Matriz de correlaes
Teste KMO e Bartlett
Neste caso a estatstica KMO indica a
adequao dos dados para proceder uma
anlise fatorial.
Um KMO menor que 0,5 um indicativo
de que os resultados da anlise fatorial
so de pouca utilidade.
Matriz Anti-imagem
Na diagonal so dispostos os valores da estatstica MSA (medida de
adequao da amostra de cada varivel), valores menores que 0,5
sugerem que a varivel pode no se ajustar estrutura definida pelas
outras variveis e eventualmente poderia ser eliminada
Comunalidades
Comunalidades elevadas,
ou seja todas as
variveis tm forte
relao com os fatores
retidos.

Nenhuma varivel
precisa ser eliminada
Varincia explicada pelos fatores
Cerca de 83% da
varincia total est
concentrada em
apenas dois fatores
Critrio de Kaiser:
autovalores maiores que 1
Scree-Plot
O Scree-plot corrobora a reteno de apenas dois fatores
Matriz de componente (matriz L)
Peso das variveis nos fatores
(loadings)

Permite verificar qual fator
explica melhor cada varivel

Fator 1: variveis prazo mdio
de recebimento das vendas,
vendas e margem lquida das
vendas

Fator 2: endividamento

Ajuda na interpretao e na atribuio de um significado aos fatores:
Fator 1: volume de negcios (faturamento)
Fator 2: estrutura de capital
Matriz de componente (matriz L)
PMRV = 0,876 F
1
+ 0,0442F
2

Endividamento = 0,269 F
1
+ 0,94F
2

Vendas = 0,868 F
1
+ 0,0608F
2

Margem = 0,806 F
1
- 0,437F
2

Variveis
representadas
como combinaes
lineares dos
fatores
Matriz de correlao reproduzida
A matriz de correlaes
aproximada pelos dois
fatores
diferena entre a matriz de
correlaes original e a matriz
de correlaes aproximada
As pequenas magnitudes dos resduos confirmam a boa
aproximao gerada pelos 2 fatores.
Variveis no plano fatorial
Fator 1
Fator 2
Imagem das correlaes
entre as variveis e
destas com os fatores
Matriz de escores fatoriais
Com base nestes coeficientes podemos calcular os fatores para cada
observao da amostra, levando-se em conta as variveis padronizadas
Fator 1 = 0,391 ZPMRV + 0,120 ZEndividamento + 0,387 ZVendas + 0,359 ZMargem
Fator 2 = 0,041 ZPMRV + 0,878 ZEndividamento + 0,057 ZVendas - 0,398 ZMargem
Coordenadas das empresas no plano fatorial
Duas novas variveis inseridas pelo SPSS
na base de dados, cujos valores so os
fatores 1 e 2 para cada empresa
Fator 1 = 0,391 ZPMRV + 0,120 ZEndividamento + 0,387 ZVendas + 0,359 ZMargem
Fator 2 = 0,041 ZPMRV + 0,878 ZEndividamento + 0,057 ZVendas - 0,398 ZMargem
Fazendo o grfico das empresas no plano fatorial
Selecionando as coordenadas para o grfico
Empresas no plano fatorial
Faturamento (56%)
Estrutura
de capital
(27%)
Exemplo 3 Anlise Fatorial de
indicadores do mercado segurador
brasileiro (Corrar et al, 2007)
Matriz de dados formada por 15 indicadores financeiros de 107
empresas seguradoras no ano de 2001

ndices de estrutura de capital
ndice de captaes ICAP = PTL/ATT
ndice de endividamento IEND = (PCD+ELP)/PTL
ndice de recursos prprios de giro IRPG = (PTL-IMO-IVD-RLP)/ACL
ndice de imobilizao de recursos IIMR = (IMO+IVD)/PTL

ndices de rentabilidade
ndice de sinistralidade ISIN = SRT/PGN
ndice de colocao do seguro ICOL = DCM/PGN
ndice de despesas administrativas IDAD = DAD/PRT
ndice de lucratividade sobre pmio ganho ILPG = LLQ/PGN
ndice de retorno sobre o PL IRPL = LLQ/PTL

ndices de alavancagem
ndice de solvncia prmios PRPL = PRT/PTL
ndice de alavancagem lquida IALI = (PRT + PCC + PCD)/PTL
ndices de liquidez
ndice de liquidez corrente ILCO = ACL / (PCC + PCD)
ndice de liquidez geral ILGE = (ACL+RLP)/(PCC + PCD + ELP)

ndices operacionais
ndice combinado ICOM = (SRT + DCM + DAD)/PGN
ndice combinado ampliado ICOA = (SRT + DCM + DAD) / (PGN + RPC)

ACL = ativo circulante ATT = ativo total
DAD = despesa administrativa DCM = despesa comercial
ELP = exigvel a longo prazo IMO = imobilizado
IVD = investimento diferido LLQ = lucro lquido
PCC = previso comprometida circulante
PCD = passivo circulante demais
PCP = proviso comprometida PGN = prmio ganho
PRT = prmio retido PTL = patrimnio lquido
RFC = resultado financeiro RLP = realizvel a longo prazo
SRT = sinistro retido

Teste KMO
O KMO obtido sugere a retirada de uma ou mais variveis
Matriz Anti-imagem
Foram retiradas as variveis com MSA (na diagonal da matriz
de correlao anti-iamgem) menores que 0,5: ICOA, IIMR1,
ISIN2 e IRPL2
Comunalidades

ICOA, IRPL, ISIN, IIMR, IRPG no so
bem explicadas na estrutura de dois
fatores
Parcela da varincia concentrada
nos dois fatores, apenas 45%
KMO aps a retirada das variveis
Matriz de Anti-imagem
Foram retiradas as variveis com MSA (na diagonal da matriz
de correlao anti-iamgem) menores que 0,5: ICOL
Comunalidades

ICOL e IRPG no so bem
explicadas na estrutura de dois
fatores
Parcela da varincia concentrada
nos dois fatores, subiu para 60%
aps retirada de ICOL
KMO aps a retirada da
varivel ICOL
Matriz de Anti-imagem
Comunalidades

IRPG no bem explicada na
estrutura de dois fatores e ser
retirada
Resultados com 9 indicadores
Matriz de Anti-imagem
Soluo com 9 indicadores e 3 fatores
Soluo com 9 indicadores e 3 fatores
Sem rotao
Soluo com 9 indicadores e 3 fatores
Com rotao VARIMAX
Fator 1: controle de despesas
operacionais
Formado pelas variveis ICOM,
IDAD e ILPG

Fator 2: Alavancagem
Formado pelas variveis ICAP,
IEND, PRPL e IALI

Fator 3: Liquidez
Formado pelas variaveis ILCO
e ILGE

Consideraes finais
Referncias bibliogrficas
CORRAR, L.J.; PAULO, E.; DIAS FILHO, J.M. (coordenadores) Anlise
Multivariada para os cursos de administrao, cincias contbeis e
esconomia, Editora Atlas, So Paulo, 2007.

EVERITT, B. An R and S-Plus companion to multivariate analysis,
Springer-Verlag, London, 2007.

FVERO, L.P.; BELFIORE, P.; SILVA, F.L.; CHAN, B.L. Anlise de dados:
modelagem multivariada para tomada de decises, Campus, Rio de
Janeiro, 2009.

HAIR, J.F.; ANDERSON, R.E.; TATHAM R.L.; BLACK W.O. Anlise
Multivariada de Dados, Bookman, 2005.

JOHNSON, R.A. & WICHERN, D.W. Applied Multivariate Statistical
Analysis, 5th edition, Prentice Hall, New Jersey, 2002.

Anda mungkin juga menyukai