Anda di halaman 1dari 5

REGRESSO LINEAR MLTIPLA

1. INTRODUO A regresso mltipla envolve trs ou mais variveis, portanto, estimadores. Ou seja, ainda uma nica varivel dependente, porm duas ou mais variveis independentes (explanatrias). A finalidade das variveis independentes adicionais melhorar a capacidade de predio em confronto com a regresso linear simples. Isto , reduzir o coeficiente do intercepto, o qual, em regresso, significa a parte da varivel dependente explicada por outras variveis, que no a considerada no modelo. Mesmo quando estamos interessados no efeito de apenas uma das variveis, aconselhvel incluir as outras capazes de afetar Y, efetuando uma anlise de regresso mltipla, por 2 razes: a) Para reduzir os resduos estocsticos. Reduzindo-se a varincia residual (ERRO PADRO DA ESTIMATIVA), aumenta a fora dos testes de significncia; b) Para eliminar a tendenciosidade que poderia resultar se simplesmente ignorssemos uma varivel que afeta Y substancialmente. Uma estimativa tendenciosa quando, por exemplo, numa pesquisa em que se deseja investigar a relao entre a aplicao de fertilizante e o volume de safra, atribumos erroneamente ao fertilizante os efeitos do fertilizante mais a precipitao pluviomtrica. O ideal obter o mais alto relacionamento explanatrio com o mnimo de variveis independentes, sobretudo em virtude do custo na obteno de dados para muitas variveis e tambm pela necessidade de observaes adicionais para compensar a perda de graus de liberdade decorrente da introduo de mais variveis independentes. 2. O MODELO MATEMTICO A equao da regresso mltipla tem a forma seguinte:

Yc = a + b1x1 + b2x2 + ... + bkxk, onde:


y y y a = intercepto do eixo y; bi = coeficiente angular da i-sima varivel; k = nmero de variveis independentes. ou, como define WONNACOTT (1981, p. 326): Yi = E + Fxi + Kzi + ei F interpretado geometricamente como o coeficiente angular do plano, na medida em que nos deslocamos na direo do eixo dos Xs, mantendo Z constante: F , assim, o efeito marginal da varivel X sobre Y. K o coeficiente do plano na medida em que nos movemos na direo do eixo dos Zs, mantendo X constante: K , assim, o efeito marginal da varivel Z sobre Y. Enquanto uma regresso simples de duas variveis resulta na equao de uma reta, um problema de trs variveis implica num plano, e um problema de k variveis implica em um hiperplano.
1

Tambm na regresso mltipla, as estimativas dos mnimos quadrados so obtidas pela escolha dos estimadores que minimizam a soma dos quadrados dos desvios entre os valores observados Yi e os valores ajustados Yc.
3. INTREPRETAO DA REGRESSO OUTROS FATORES SENDO IGUAIS

Na regresso simples:
b = aumento em Y, decorrente de um aumento unitrio em X.

Na regresso mltipla:
bi = aumento em Y se Xi for aumentado de 1 unidade, mantendo-se constantes todas as demais variveis Xi.

4. COMPARAO ENTRE REGRESSO SIMPLES E REGRESSO MLTIPLA

Suponha uma investigao sobre os benefcios de um sistema de irrigao em determinada regio. Ao considerar-se uma regresso simples para se estimar o volume da safra (Y) em funo dos ndices pluviomtricos (r) de vrios anos, encontrou-se a seguinte equao: Y = 60 1,67r Erro padro do coeficiente b = 4,0 O coeficiente negativo estaria indicando que a chuva (ndice pluviomtrico) reduz a safra, sugerindo que h algo errado. Ao acrescentar-se a varivel temperatura (t), efetuou-se uma regresso mltipla representada pela equao: Y = 60 + 5,71r + 2,95t Erro padro dos coeficientes: b1 = 2,68 e b2 = 0,69 A precipitao pluviomtrica tem, de fato, o efeito esperado de aumentar a safra, os outros fatores permanecendo iguais (isto , quando a temperatura constante). Enquanto a regresso mltipla enfatiza e isola a relao direta e a regresso simples no o faz; ao invs disso, o coeficiente de regresso simples reflete os efeitos tanto diretos como indiretos (em nosso exemplo, o efeito direto positivo da precipitao pluviomtrica sobre a safra, e seu efeito negativo indireto o aumento do ndice pluviomtrico leva reduo da temperatura, que provoca uma reduo na safra). 5. VARIVEIS BINRIAS (0-1) 5.1. Incluso de Variveis Binrias Imagine uma investigao sobre a relao entre a aquisio de ttulos do governo (B) e a renda nacional (Y). Observaes anuais realizadas mostram que a relao dos ttulos em funo da renda acusa dois padres distintos um para o tempo de guerra e outro para o tempo de paz. A relao normal de B para Y (reta inferior) est sujeita a uma mudana para cima (reta superior) durante o perodo de guerra (ver figura abaixo). Dessa forma, B deve ser relacionado com Y e com outra varivel a guerra (W).
2

Yc = a + b1.X + b2.D Se D = 0: Yc = a + b1.X Se D = 1: Yc = (a+b2) + b1.X

Y
W no representa uma srie completa de valores, mas apenas dois: fixamos em 1 o seu valor para todo o perodo de guerra e em 0 para os anos de paz (W uma varivel do tipo 0-1 ou varivel muda ou ainda varivel DUMMY ou binria). E(B) = E0 + FY + KW Onde: W = 0, para os anos de paz W = 1, para os anos de guerra E(B) = E0 + FY E(B) = E0 + FY + K

5.2. Tendenciosidade Causada pela Excluso da Varivel Muda Pela anlise da figura, pode-se observar que o fato de ignorarmos uma varivel favorece a tendenciosidade e aumenta a varincia residual. Se deixarmos de calcular a regresso mltipla, incluindo a varivel muda guerra, e calcularmos erroneamente a regresso simples de B sobre Y, ela acusar coeficiente angular demasiadamente grande, provocando uma tendenciosidade para cima, causada pelo fato de os anos de guerra acusarem ligeira tendncia para serem anos de renda elevada. Assim, as vendas mais altas de ttulos, que deveriam ser atribudas em parte poca de guerra, seriam erroneamente atribudas renda somente. 6. MULTICOLINEARIDADE 6.1. Na Regresso Simples Quando os valores de X acusam pequena (ou nenhuma) variao, o efeito de X sobre Y j no pode ser sensivelmente investigado. Mas se o problema predizer Y ao invs de investigar a dependncia de Y em relao a X a concentrao dos valores de X a que no ter mesmo influncia, desde que limitemos nossa predio a este mesmo pequeno intervalo de valores de X.
3

Na regresso simples, nestes casos, nosso melhor ajustamento para Y no ser uma reta, mas antes um ponto (X, Y). 6.2. Na Regresso Linear Mltipla Na regresso mltipla, nosso melhor ajustamento para Y, neste mesmo contexto, no um plano, mas sim uma reta. Quando duas variveis independentes X e Z so colineares, ou quase colineares (isto , altamente correlacionadas), temos o problema da multicolinearidade (no caso de 2 variveis, apenas colinearidade). De forma anloga regresso simples, isso no gera problemas na predio de Y, desde que no procuremos predizer a partir de valores de X e Z afastados de nossa reta de colinearidade. Entretanto no possvel investigar a influncia de X somente (ou Z somente) sobre Y. O problema da multicolinearidade surge, num exemplo simples, quando um pesquisador considera X como a quantidade de fertilizante em libras por are e comete o erro de medir a quantidade de fertilizante em onas por are, usando-a como outro regressor, Z. Como qualquer peso avaliado em onas deve ser 16 vezes seu valor em libras (Z = 16X), todas as combinaes de X e Z devem recair sobre esta reta, num exemplo de colinearidade perfeita. Mais sutilmente, a colinearidade pode surgir, por exemplo, quando so usados dois regressores medidos em termos de preos, exigindo cuidado especial para que tal fato no ocorra. 7. INTERVALOS DE CONFIANA E TESTES ESTATSTICOS So realizados de forma semelhante ao j estudado em regresso simples, motivo por que no sero repetidos aqui. Ateno especial deve ser dada definio dos graus de liberdade (gl) para o teste t, que dado por: gl = n k 1, ou seja, os k estimadores angulares e o estimador linear. 8. QUANTOS REGRESSORES DEVEM SER REPETIDOS? Somente a teoria estatstica clssica no nos proporciona orientao absolutamente firme para aceitar H0: a aceitao deve basear-se tambm em julgamento extra-estatstico. Assim, se existe uma crena a priori de que a varivel ndice pluviomtrico, por exemplo, afeta o nvel de colheita, esta varivel deve ser mantida, mesmo que o teste confirmasse fracamente a hiptese H0 de que no haveria influncia. S se K for igual a zero ou negativo que os resultados estatsticos contradizem nossa crena a priori, A crena a priori desempenha papel chave, no s na especificao inicial de quais regressores devem permanecer na equao, mas tambm na deciso sobre que regressores devem ser abandonados luz da evidncia estatstica, assim como na deciso sobre como o modelo eventualmente ser utilizado. Isso levou alguns estatsticos a sugerirem o nvel de 1% para variveis duvidosas, mantendo o nvel de 5% para as outras variveis que j se esperava afetarem Y. 9. REGRESSO E ANLISE DA VARINCIA (ANOVA)
4

H 3 casos principais de aplicao da regresso mltipla: a) Regresso padro: a regresso somente sobre valores numricos. b) Anlise da varincia (ANOVA): equivale somente regresso sobre variveis mudas. c) Anlise da covarincia (ANOCOVA): a regresso sobre variveis mudas e variveis numricas. Em resumo, a regresso padro o instrumento mais poderoso quando a varivel independente, X, numrica. J a anlise da varincia adequada quando a varivel independente um conjunto de categorias no-ordenadas.

Anda mungkin juga menyukai