professorjfmp@hotmail.com Anlise Fatorial An R and S-Plus companion to multivariate analysis Brian Everitt, Srpinger, 2004 An R and S-Plus companion to multivariate analysis Brian Everitt, Srpinger, 2004 Uma empresa que atua no mercado varejista identificou nove atributos, considerados pelos consumidores como determinantes no critrio de escolha entre diversas lojas:
Uma forma alternativa de abordar o problema consiste em trabalhar com um pequeno nmero de dimenses mais gerais ou fatores, ao invs de itens especficos representados por cada um dos atributos. A administrao da empresa quer compreender como os consumidores tomam a deciso, mas percebe que analisar e estabelecer estratgias de marketing para cada atributo uma tarefa muito complicada. Motivao (HAIR et al, 2005) Matriz de correlaes Matriz de correlaes aps a troca das posies das linhas e colunas A variveis em cada bloco compartilham um mesmo fator comum, por isso as correlaes elevadas entre elas. Identificamos trs construtos que emergiram a partir dos grupos de variveis altamente correlacionadas, Neste exemplo : servios, oferta e valor. Estes resultados do a equipe da administrao da empresa um pequeno conjunto de conceitos que devem ser considerados na elaborao de estratgias de marketing.
A cada grupo de variveis encontrado pela anlise da matriz de correlao associado um fator no observvel (latente), com um significado que deve ser interpretado com base nas variveis envolvidas. A anlise da matriz de correlao revela a existncia de grupos de variveis altamente correlacionadas entre si, mas que tem relativamente uma baixa correlao com outras variveis da matriz.
Cada grupo de variveis correlacionadas representa um construto bsico (no observvel) responsvel pelas elevadas correlaes entre as respostas.
Os construtos so conceitos mais amplos, cujas facetas so as observaes das variveis em cada grupo.
Ao invs de usar um grande nmero de caractersticas especficas (variveis) para sumarizar um conjunto de dados, pode-se utilizar um pequeno nmero de construtos que condensem a maior parte da informao contida nas variveis.
Assim, eliminamos a informao que possa ser considerada como redundante garantindo perda mnima de informao. Anlise fatorial (Conceitos) Anlise fatorial (Conceitos) Tcnica de dependncia Tcnica de interdependncia Anlise fatorial Dois enfoques Anlise fatorial exploratria: busca dimenses latentes, para saber o que mais importante ou mais significativo de um conjunto de variveis. Analise fatorial confirmatria: se desenha uma estrutura dos fatores e em seguida, busca-se a confirmao desta, estudando as variveis observadas. (uso em modelagem de comportamento). Exemplo 1 Anlise Fatorial da regies administrativas do municpio do Rio de Janeiro Matriz de dados (24 regies e 8 variveis) Matriz de correlaes Matriz de correlaes Anlise fatorial Os bairros, originalmente descritos em um espao de oito dimenses, podem ser projetados em um mapa (representao bidimensional) formado pelas duas primeiras componentes que juntas concentram 91% da varincia total Matriz de correlaes (dados originais) Matriz de correlaes aproximada pela representao bidimensional das 8 variveis Matriz de resduos Matriz de correlaes (dados originais) Matriz de correlaes aproximada pela representao bidimensional das 8 variveis Matriz de resduos = - Valores reduzidos para os resduos indicam que a representao bidimensional preserva boa parte da estrutura de correlao entre as varivies. A representao bidimensional fornece uma boa representao dos dados. A comunalidade quantifica a parcela da varincia de uma varivel que concentrada pelas componentes selecionadas
As elevadas comunalidades indicam que a representao bidimensional concentra a maior parte da varincia em cada varivel, o mapa gerado pelas duas primeiras componentes fornece uma boa representao da estrutura de cvoarincia entre as variveis Representao das variveis no mapa bidimensional Escores das regies nos eixos fatoriais Representao das regies nos eixos fatoriais Exemplo 2 Anlise Fatorial das taxas de retorno de uma carteira de aes Johnson & Wichern 2002. Este exemplo refere-se ao conjunto das sries de retorno semanais no perodo de janeiro de 1975 at dezembro de 1976 (n=100 semanas) de 5 empresas norte americanas (p=5) listadas na New York Stock Exchange. A srie de retorno semanal definida como Matriz de correlao A u t o v a l o r e s
e
a u t o v e t o r e s
Os dois primeiros fatores concentram cerca de 73% da varincia total dos dados:
(2,8570 + 0,8090)/5 = 0,7332 Exemplo 3 Anlise Fatorial com o SPSS Fvero et al, 2009. Um analista de mercado quer estudar as relaes estruturais entre quatro indicadores financeiros provenientes de 45 empresas: Prazo mdio de recebimento das vendas Endividamento Vendas Margem lquida das vendas Dados Selecione Analysis/Data Reduction/Factor Selecione as variveis Clique aqui para selecionar as variveis marcadas Preencha as opes da caixa de dilogo Matriz de correlaes Teste KMO e Bartlett Neste caso a estatstica KMO indica a adequao dos dados para proceder uma anlise fatorial. Um KMO menor que 0,5 um indicativo de que os resultados da anlise fatorial so de pouca utilidade. Matriz Anti-imagem Na diagonal so dispostos os valores da estatstica MSA (medida de adequao da amostra de cada varivel), valores menores que 0,5 sugerem que a varivel pode no se ajustar estrutura definida pelas outras variveis e eventualmente poderia ser eliminada Comunalidades Comunalidades elevadas, ou seja todas as variveis tm forte relao com os fatores retidos.
Nenhuma varivel precisa ser eliminada Varincia explicada pelos fatores Cerca de 83% da varincia total est concentrada em apenas dois fatores Critrio de Kaiser: autovalores maiores que 1 Scree-Plot O Scree-plot corrobora a reteno de apenas dois fatores Matriz de componente (matriz L) Peso das variveis nos fatores (loadings)
Permite verificar qual fator explica melhor cada varivel
Fator 1: variveis prazo mdio de recebimento das vendas, vendas e margem lquida das vendas
Fator 2: endividamento
Ajuda na interpretao e na atribuio de um significado aos fatores: Fator 1: volume de negcios (faturamento) Fator 2: estrutura de capital Matriz de componente (matriz L) PMRV = 0,876 F 1 + 0,0442F 2
Endividamento = 0,269 F 1 + 0,94F 2
Vendas = 0,868 F 1 + 0,0608F 2
Margem = 0,806 F 1 - 0,437F 2
Variveis representadas como combinaes lineares dos fatores Matriz de correlao reproduzida A matriz de correlaes aproximada pelos dois fatores diferena entre a matriz de correlaes original e a matriz de correlaes aproximada As pequenas magnitudes dos resduos confirmam a boa aproximao gerada pelos 2 fatores. Variveis no plano fatorial Fator 1 Fator 2 Imagem das correlaes entre as variveis e destas com os fatores Matriz de escores fatoriais Com base nestes coeficientes podemos calcular os fatores para cada observao da amostra, levando-se em conta as variveis padronizadas Fator 1 = 0,391 ZPMRV + 0,120 ZEndividamento + 0,387 ZVendas + 0,359 ZMargem Fator 2 = 0,041 ZPMRV + 0,878 ZEndividamento + 0,057 ZVendas - 0,398 ZMargem Coordenadas das empresas no plano fatorial Duas novas variveis inseridas pelo SPSS na base de dados, cujos valores so os fatores 1 e 2 para cada empresa Fator 1 = 0,391 ZPMRV + 0,120 ZEndividamento + 0,387 ZVendas + 0,359 ZMargem Fator 2 = 0,041 ZPMRV + 0,878 ZEndividamento + 0,057 ZVendas - 0,398 ZMargem Fazendo o grfico das empresas no plano fatorial Selecionando as coordenadas para o grfico Empresas no plano fatorial Faturamento (56%) Estrutura de capital (27%) Exemplo 3 Anlise Fatorial de indicadores do mercado segurador brasileiro (Corrar et al, 2007) Matriz de dados formada por 15 indicadores financeiros de 107 empresas seguradoras no ano de 2001
ndices de estrutura de capital ndice de captaes ICAP = PTL/ATT ndice de endividamento IEND = (PCD+ELP)/PTL ndice de recursos prprios de giro IRPG = (PTL-IMO-IVD-RLP)/ACL ndice de imobilizao de recursos IIMR = (IMO+IVD)/PTL
ndices de rentabilidade ndice de sinistralidade ISIN = SRT/PGN ndice de colocao do seguro ICOL = DCM/PGN ndice de despesas administrativas IDAD = DAD/PRT ndice de lucratividade sobre pmio ganho ILPG = LLQ/PGN ndice de retorno sobre o PL IRPL = LLQ/PTL
ndices de alavancagem ndice de solvncia prmios PRPL = PRT/PTL ndice de alavancagem lquida IALI = (PRT + PCC + PCD)/PTL ndices de liquidez ndice de liquidez corrente ILCO = ACL / (PCC + PCD) ndice de liquidez geral ILGE = (ACL+RLP)/(PCC + PCD + ELP)
ACL = ativo circulante ATT = ativo total DAD = despesa administrativa DCM = despesa comercial ELP = exigvel a longo prazo IMO = imobilizado IVD = investimento diferido LLQ = lucro lquido PCC = previso comprometida circulante PCD = passivo circulante demais PCP = proviso comprometida PGN = prmio ganho PRT = prmio retido PTL = patrimnio lquido RFC = resultado financeiro RLP = realizvel a longo prazo SRT = sinistro retido
Teste KMO O KMO obtido sugere a retirada de uma ou mais variveis Matriz Anti-imagem Foram retiradas as variveis com MSA (na diagonal da matriz de correlao anti-iamgem) menores que 0,5: ICOA, IIMR1, ISIN2 e IRPL2 Comunalidades
ICOA, IRPL, ISIN, IIMR, IRPG no so bem explicadas na estrutura de dois fatores Parcela da varincia concentrada nos dois fatores, apenas 45% KMO aps a retirada das variveis Matriz de Anti-imagem Foram retiradas as variveis com MSA (na diagonal da matriz de correlao anti-iamgem) menores que 0,5: ICOL Comunalidades
ICOL e IRPG no so bem explicadas na estrutura de dois fatores Parcela da varincia concentrada nos dois fatores, subiu para 60% aps retirada de ICOL KMO aps a retirada da varivel ICOL Matriz de Anti-imagem Comunalidades
IRPG no bem explicada na estrutura de dois fatores e ser retirada Resultados com 9 indicadores Matriz de Anti-imagem Soluo com 9 indicadores e 3 fatores Soluo com 9 indicadores e 3 fatores Sem rotao Soluo com 9 indicadores e 3 fatores Com rotao VARIMAX Fator 1: controle de despesas operacionais Formado pelas variveis ICOM, IDAD e ILPG
Fator 2: Alavancagem Formado pelas variveis ICAP, IEND, PRPL e IALI
Fator 3: Liquidez Formado pelas variaveis ILCO e ILGE
Consideraes finais Referncias bibliogrficas CORRAR, L.J.; PAULO, E.; DIAS FILHO, J.M. (coordenadores) Anlise Multivariada para os cursos de administrao, cincias contbeis e esconomia, Editora Atlas, So Paulo, 2007.
EVERITT, B. An R and S-Plus companion to multivariate analysis, Springer-Verlag, London, 2007.
FVERO, L.P.; BELFIORE, P.; SILVA, F.L.; CHAN, B.L. Anlise de dados: modelagem multivariada para tomada de decises, Campus, Rio de Janeiro, 2009.
HAIR, J.F.; ANDERSON, R.E.; TATHAM R.L.; BLACK W.O. Anlise Multivariada de Dados, Bookman, 2005.