Anda di halaman 1dari 32

Anlise de Regresso Mltipla: inferncia

Aula 28/04/2014

Prof. Moiss A. Resende Filho


Introduo Econometria (ECO 132497)

28 de abril de 2014

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

1 / 32

Suposies ou hipteses
At agora assumimos:
RLM.1: y = 0 + 1 x1 + 2 x2 + . . . + k xk + u (o modelo ou
processo gerador dos dados linear nos parmetros).
RLM.2: temos uma amostra f(xi 1 , xi 2 , ..., xik , yi ) : i = 1, ..., n g
aleatria retirada da populao, tal que
E (ui jxl 1 , xl 2 , ..., xlk ) = 0, i 6= l.
RLM.3: colinearidade no perfeita ou: n (k + 1), cada varivel
explicativa apresenta variabilidade na amostra e nenhuma varivel
uma combinao linear das demais variveis explicativas.
RLM.4: E (ui jxi 1 , xi 2 , ..., xik ) = E (u ) = 0 (a mdia condicional do
erro zero).
RLM.5: a varincia do erro u, seja l quais forem os valores de
x1 , x2 , ..., xk
Var (u jx1 , x2 , ..., xk ) = Var (u ) = 2 (homocedasticidade).
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

2 / 32

Consequncias
Sob RLM.1 a RLM.3, possvel calcular as estimativas MQO

brij yi
b
j = i =n 1 2 , j = 1, ..., k
i =1 brij
n

a partir da amostra aleatria f(xi 1 , xi 2 , ..., xik , yi ) : i = 1, ..., n g, onde b


rij
o resduo da regresso de xj sobre as demais variveis explicativas.
Sob RLM1 a RLM.4, os estimadores MQO so no viesados
(Teorema 3.1) ou E (b
j ) = j , j = 0, 1, ..., k, mas se xk foi omitido,
ento, pode ser que E (ui jxi 1 , xi 2 , ..., xik ) = E (u ) = 0 tenha sido violada,
tal que
e
j = b
j + b
k e
j
e

E (e
j ) = j + k e
j

onde e
j o coeciente de xj , j = 1, ..., k 1 na regresso auxiliar de xk
sobre as demais variveis explicativas do modelo.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

3 / 32

Consequncias
A suposio RLM.5 fundamental para se obter frmulas simples para
os estimadores da varincia dos estimadores de MQO e para a discusso de
ecincia de MQO, tal que, sob RLM.1 a RLM.5 (hipteses de
Gauss-Markov) e conditional nos valores das variveis explicativas nas
amostras
2
Var (b
j ) =
, j = 1, ..., k
SQTj (1 Rj2 )
r2
b

i ij
onde SQTj = ni=1 (xij xj )2 e Rj2 = 1 SQT
o R2 da regresso de xj
j
em x1 , x2 , ..., xj 1 , xj +1 , ..., xk , ou seja, uma regresso auxiliar de xj sobre
as demais variveis explicativas do modelo.
Ainda, sob RLM.1 a RLM.5 (hipteses de Gauss-Markov), os
estimadores MQO so BLUE.

A suposio RLM.3 elimina a possibilidade de Rj2 = 1, o que ocorreria


s se xj fosse determinado exatamente por uma funo linear das
outras variveis explicativas.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

4 / 32

Consequncias
Conhecemos os dois primeiro momentos da distribuio amostral de
b
j . pois sob RLM.1 a RLM.4,
E (b
j ) = j , j = 0, 1, ..., k

(1)

e sob RLM1 a RLM.5 (hipteses de Gauss-Markov),


Var (b
j ) =

e 2 = SQR/(n

2
, j = 1, ..., k.
STQj (1 Rj2 )

(2)

1) um estimador no viesado de 2 .

Para sermos capazes de testar hipteses sob j , usando procedimentos


exatos de teste (ou amostras nitas), precisamos conhecer a mdia e
a varincia dos estimadores MQO e tambm a distribuio amostral
de cada um deles.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

5 / 32

Consequncias

= br y , j = 1, ..., k como
= br
n

Escreva b
j =

i 1
n

ij i

2
i 1 ij

j = j + wij ui ,
i =1

onde wij so funes de f(xi 1 , ..., xik ) : i = 1, ..., n g, ou simplemente,


b
rij
wij
onde b
rij o resduo da regresso de xj sobre as demais
n
2

b
r
i 1 ij

variveis explicativas.
Conditional em f(xi 1 , ..., xik ) : i = 1, ..., n g, j herda a distribuio de
fui : i = 1, .., ng, que uma amostra aleatria da distribuio
populacional de u.
Sendo assim, devemos assumir alguma distribuio de probabilidade
para ui (Hiptese RLM.6 a seguir).

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

6 / 32

Normalidade do erro
Hiptese RLM.6 (Normalidade)
O erro populacional u independente de (x1 , ..., xk ) e normalmente
distribudo com mdia zero (RLM.2: E (ui jxl 1 , xl 2 , ..., xlk ) = 0, i 6= l e
RLM.4: E (u jx1 , ..., xk ) = 0, ou exogeneidade estrita) e varincia 2
constante (RLM.5: Var (u jx1 , ..., xk ) = Var (u ) = 2 ), tal que:
u

Normal (0, 2 )

ou
ui

iidNormal (0, 2 ), i = 1, ..., n.

RLM.2 + RLM.3 + RLM.6 impem independncia completa entre u e


(x1 , x2 , ..., xk ) (no somente independncia da mdia e varincia de u e
(x1 , x2 , ..., xk )), o que justica chamar xj , j = 1, ..., k de variveis
independentes.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

7 / 32

Normalidade do erro

.1

.2

.3

f(u)

.4

O importante sob MRL.6 que zemos uma suposio bem especca


sobre a distribuio populacional de u, u Normal (0, 2 ), que uma
funo densidade de probabilidade (fdp) em forma de sino:

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

8 / 32

Normalidade do erro
comum assumir-se nomarlidade dos erros, mas a razo para isso nem
sempre se sustenta.
Usualmente, o argumento pr normalidade baseia-se no fato de que u
a soma de vrios fatores no-observveis independentes, por
exemplo, u = a1 + a2 + ... + am para um m grande tal que se possa
aplicar o teorema central do limite.
Saber se a normalidade de u pode ser assumida uma questo emprica
(p.ex., teste Jarque-Bera dos resduos).
Em ltima anlise, como no caso de RLM.5, a hiptese RLM.6
mantida por convenincia, pois muito difcil fazer inferncia em amostras
nitas sem a hiptese de normalidade.
As suposies, pressupostos ou hipteses RLM.1 a RLM.6 so chamadas
de pressupostos do modelo clssico de regresso linear (MCRL) para
regresses de dados de seo cruzada.
Em termos prticos: pressupostos do MCRL = pressupostos de
Gauss-Markov (RLM.1 a RLM.5) + normalidade dos erros (RLM.6).
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

9 / 32

Distribuies amostrais dos estimadores MQO


Um fato importante sobre variveis aleatrias normalmente e
independentemente distribudas que qualquer combinao linear
delas tambm normalmente distribuda (vide propriedade Normal.4, p.49
do Apndice B em pdf do Wooldridge).
Assim, como ui
iidNormal (0, 2 ), i = 1, ..., n, ento
n

j = j + wij ui

Normal [ j , Var ( j )]

i =1

onde wij

b
rij

=
n

b
r2
i 1 ij

eb
rij o resduo da regresso de xj sobre as demais

variveis explicativas e

Var ( j ) =

Moiss Resende Filho (ECO/UnB)

2
.
SQTj (1 Rj2 )

(Wooldridge, captulo 4)

28/04/2014

10 / 32

Distribuies amostrais dos estimadores MQO


TEOREMA 4.1. (Distribuies Amostrais Normais)
Sob as hipteses do MCRL (RLM1 a RLM.6) e conditional nos valor
amostral das variveis independentes (f(xi 1 , ..., xik ) : i = 1, ..., n g),
j
com Var ( j ) =

Normal [ j , Var ( j )]

2
.
SST j (1 R j2 )

Portanto, subtraindo a mdia e dividindo pelo desvio padro, obtm-se a


varivel aleatria normal padronizada
j

dp ( j )

Normal (0, 1).

Mas no conhecemos 2 , o que nos fora a utilizar


= SQR/(n k 1), o estimador no viesado de 2 .
2

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

11 / 32

Distribuies amostrais dos estimadores MQO


TEOREMA 4.2. (A distribuio t para os Estimadores
Padronizados)
Sob as hipteses do MCRL (RLM.1 a RLM.6),
j

ep ( j )
onde ep ( j ) = p

,
SST j (1 R j2 )

tn

(3)

(k +1 )

ni=1 ubi2
,
n (k +1 )

(k + 1) o nmero de

parmetros estimados por MQO no modelo


y = 0 + 1 x1 + 2 x2 + . . . + k xk + u e (n k 1) o nmero de
graus de liberdade da distribuio t de student.
A distribuio t surge da diviso da varivel aleatria normal padro

ep ( )

( dpj ( j) ) pela varivel aleatria qui-quadrado ( dp ( j ) ), sendo as duas


j

variveis independentes- vide apndice B do Wooldridge, p.50.


Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

12 / 32

A distribuio t
De fato, porque substitumos (uma constante de valor desconhecido)
por (um estimador que varia de amostra para amostra) que trocamos a
distribuio nomal padro pela distribuio t.
Assim, j se distribui segundo uma distribuio t, mas o erro-padro
da distribuio amostra de j deve ser estimado em cada amostra.
Apesar de a distribuio t apresenta uma forma de sino, ela mais
espalhada que a normal padro, Normal (0, 1).

E (tgl ) = 0, se gl > 1
gl
Var (tgl ) =
> 1, se gl > 2
gl 2

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

13 / 32

A distribuio t

Nunca teremos um nmero muito pequeno de graus de liberdade (gl), tal


que:
Quando gl = 10, Var (tgl ) = 1.25, que 25% maior que a varincia de
Normal (0, 1).
Quando gl = 120, Var (tgl ) 1.017, que apenas 1,7% maior que a da
normal padro.
A medida que gl ! ,
tgl ! Normal (0, 1).

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

14 / 32

A distribuio t

.1

.2

.3

.4

A diferena entre a normal padro e a distribuio t praticamente


nenhuma para gl > 120.
O grco abaixo apresenta a funo densidade de probabilidade (fdp)
normal padro e t6gl .

-4

-2

0
standard normal

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

t with 6 df

28/04/2014

15 / 32

Testes de hiptese sobre um nico parmetro do modelo


Utilizamos o resultado da distribuio t para testar a hiptese nula (H0 )
de que xj no tem qualquer efeito sobre y :
H0 : j = 0
A hiptese nula sempre sobre um parmetro populacional.
Uma hiptese alternativa bilateral:
H1 : j 6= 0
Hipteses alternativas unilaterais:
H1 : j > 0
H1 : j < 0

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

16 / 32

Testes de hiptese sobre um nico parmetro do modelo

Por exemplo, no modelo


log(salarioh ) = 0 + 1 educ + 2 exper + 3 perm + u
H0 : 2 0 ou 2 = 0 - uma vez controlado para escolaridade (educ) e
permanncia no emprego corrente (perm), o nmero de anos no mercado
de trabalho (exper ) no afeta o log do salrio hora (log(salarioh )).
H1 : 2 > 0.
Portanto, o primeiro passo para implementar um teste de hiptese
denir a hiptese nula e hiptes alternativa.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

17 / 32

Testes de hiptese sobre um nico parmetro do modelo


O segundo passo, estabelecer a estatstica do teste e a sua
distribuio amostral.
Para H0 : j = 0, utilizamos a estatstica t ou a razo t
t =
j

onde ep ( j ) = p

,
SQT j (1 R j2 )

j
ep ( j )

ni=1 ubi2
.
n (k +1 )

Como ep ( j ) uma estimativa de dp ( j ), t mede o quantos


j
desvios-padro estimados ou erros-padro, j se afasta de zero.
O Teorema 4.2., diz que a distribuio amostral, tal que
t =
j

j
ep ( j )

tn

(k +1 ) .

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

18 / 32

Testes contra uma alternativa unilateral

Primeiro, consideremos a hiptese alternativa


H1 : j > 0
que efetivamente implica a hiptese nula
H0 : j

Em termos prticos, se rejeitamos j = 0 ento rejeitamos tambm


j < 0, de modo que, basta estabelecer H0 : j = 0 e agir como se
no nos importssemos sobre valores negativos do parmetro j .

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

19 / 32

Testes contra uma alternativa unilateral


Sumrio dos passos de um teste de hiptese para um alternativa
unilateral:
1. Dena a hiptese nula, por exemplo, H0 : j
0 ou, simplesmente,
H0 : j = 0.
2. Dena a hiptese alternativa, por exemplo, H1 : j > 0.
3. Estabelea a estatstica do teste e a sua distribuio amostral, por
exemplo, t =
j

j
ep ( j )

tn

(k +1 ) .

4. Dena, o nvel de signicncia (ou, simplesmente, o nvel (level) ou


tamanho (size)) do teste, que probabilidade de rejeitar a hiptese nula
quando esta verdadeira (Erro Tipo I).
5. Obtenha o valor crtico, c > 0, tal que seja possvel, ao nvel de
signicncia pr-estabelecido, aplicar a regra de rejeio
t > c
j

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

20 / 32

Testes contra uma alternativa unilateral


Suponha que gl = 28 e utilizemos um teste ao nvel de 5%.
O valor crtico da distribuio t com 28 graus de liberdade a 5%, tal
que, Pr (t c ) = 0, 05, t5%;28gl . = c5%;28gl . = 1, 701 para um teste
monocaudal, pode ser obtido na Tabela G.2 (p. 652 do Wooldridge) ou
com o computador (Scientic Workplace) TInv(0.95; 28) = 1.7011.

Area = .05

0
1.701

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

rejection
region

28/04/2014

21 / 32

Testes contra uma alternativa unilateral

Com 28 g.l., a regra de rejeio de H0 : j = 0 em favor de H1 : j > 0,


ao nvel de 5%,
t =
j

j
> 1, 701
ep ( j )

Precisamos de uma estatstica t maior que 1, 701 para concluirmos que


h suciente evidncia contra H0 .
Se t
1.701, no rejeitamos H0 em favor de H1 ao nvel de
j
signicncia de 5% e 28 graus de liberdade.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

22 / 32

Testes contra uma alternativa unilateral

Mantendo gl = 28, mas para outros nveis de signicncia, normalmete,


10% e 1%, temos:

c10%;28gl
c5%;28gl
c1%;28gl

= 1, 313
= 1, 701
= 2, 467

Quanto menor o nvel de signicncia, maior o valor crtico.


Se rejeitamos H0 a 1%, tambm rejeitaramos a 5% e 10%.
Se no rejeitamos H0 a 10%, tambm no rejeitaramos a 5% e 1%.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

23 / 32

Testes contra uma alternativa unilateral

Para amostras de tamanho grande, tal que gl > 120, podemos utilizar
os valores crticas da distribuio normal padro, correspondentes a linha
gl = na Tabela G.2 do livro texto.
c10% = 1, 282
c5% = 1, 645
c1% = 2, 362
os quais podem ser arredondados para 1, 28, 1, 65 e 2, 36. O valor crtico
1.65 especiamente comum em testes unilaterais.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

24 / 32

Testes contra uma alternativa unilateral

EXAMPLO 4.1: Equao do salrio-hora (WAGE1.DTA)


til em aplicaes rotular os parmetros com os nomes das variveis
ao se estabeler as hitptese, por exemplo, educ , exper , perm . Ento
H0 : exper = 0
que o nmero de anos de experincia de trabalho no afeta o salrio,
uma vez tenham sido controlados edu, exper, perm.

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

25 / 32

Testes contra uma alternativa unilateral


[ =
lwage

0, 284 + 0, 092educ + 0, 0041 exper + 0, 022perm


(0,104 )

(0,012 )

(0,00172 )

(0,003 )

n = 526, R = 0, 316
Os nmeros em parnteses so os erros-padro, tal que:
texper =

0, 0041
0, 0017

2, 38

que maior que o valor crtico para amostras grandes (gl > 120)
c1% = 2, 362.
Portanto, rejeita-se H0 : exper = 0 em favor de H1 : exper > 0 ao
nvel de signicncia de 1%.
Um ano a mais de experincia, mantidos educ e perm no tem uma
grande signicncia econmica, apenas 0, 41%. de aumento no salrio
previsto.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

26 / 32

Testes contra uma alternativa unilateral


. reg

lwage educ exper tenure


Source

SS

df

MS

Model
Residual

46.8741776
101.455574

3
522

15.6247259
.194359337

Total

148.329751

525

.28253286

lwage

Coef.

educ
exper
tenure
_cons

.092029
.0041211
.0220672
.2843595

Std. Err.
.0073299
.0017233
.0030936
.1041904

t
12.56
2.39
7.13
2.73

Number of obs
F( 3,
522)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

526
80.39
0.0000
0.3160
0.3121
.44086

P>|t|

[95% Conf. Interval]

0.000
0.017
0.000
0.007

.0776292
.0007357
.0159897
.0796756

.1064288
.0075065
.0281448
.4890435

texper = 2, 39
p
Moiss Resende Filho (ECO/UnB)

valor =

0.017
= 0.0085 ou 0.85%
2
(Wooldridge, captulo 4)

28/04/2014

27 / 32

Testes contra uma alternativa unilateral

Pelo fato da distribuio t ser simtrica, testar H0 : j = 0 contra.


H1 : j < 0
direto, pois o valor crtico passa a ser
Assim, rejeita-se H0 se a estatstica
t =
j

c.

j
<
ep ( j )

; caso contrrio, no se rejeita H0 .

Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

28 / 32

Testes contra uma alternativa unilateral


Para gl = 18 e = 5%, o valor crtico c = 1, 734, para um teste
monocaudal, segundo a Tabela G.2 (p. 652 do Wooldridge) ou com o
computador (Scientic Workplace) c = TInv(0.05; 18) = 1.7341, tal
que a regra de rejeio
t <
j

1.734 ou t > 1.734


j

Area = .05

0
rejection
region

Moiss Resende Filho (ECO/UnB)

-1.734

(Wooldridge, captulo 4)

28/04/2014

29 / 32

Testes contra uma alternativa unilateral


EXEMPLO: Nota no exame nal e faltas s aulas
Amostra de 680 alunos em "introductory microeconomics"na
Michigan State University em vrios anos.
A frequncia dos estudantes foi registrada eletronicamente e
monitorada por monitores da disciplina.
nal a nota na prova nal na distiplina em um total de 40 pontos.
missed o nmero de aulas que o estudante faltou em um total de 32
aulas.
priGPA o IRA acumulado at o incio da disciplina "introductory
microeconomics".
ACT a nota do teste de avaliao para em curso superior.(min 13,
max 32).
Baixe os dados (disponveis no formato Stata em
https://sites.google.com/site/rese0013/attend.dta) para o seu
computador e clique sobre o arquivo para abrir o Stata.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

30 / 32

Testes contra uma alternativa unilateral


O nmero de faltas afeta "negativamente"o desempenho dos
alunos no exame nal?
Ou no modelo economtrico
nal = 0 + 1 missed + 2 priGPA + 3 ACT + u
testar
H0 : missed = 0 contra H1 : missed < 0
Obtemos 1 = 0, 079 e t = 2.25.
1
Como gl = (680 4) = 676 > 120, o valor crtico para amostras
grandes (gl > 120) -c5% = 1, 65 e -c1% 2.36.
Tal que rejeita-se H0 ao nvel de 5%, mas no ao nvel de 1%.
Em termos prticos o efeito no grande, faltar 10 aulas a menso em
um total de 32 aulas, diminui a nota no exame nal em apenas 0, 8
pontos, ou seja, em menos que um ponto.
Moiss Resende Filho (ECO/UnB)

(Wooldridge, captulo 4)

28/04/2014

31 / 32

Testes contra uma alternativa unilateral

. reg

final missed priGPA ACT


Source

SS

df

MS

Model
Residual

3032.09408
12029.853

3
676

1010.69803
17.7956405

Total

15061.9471

679

22.1825435

final

Coef.

missed
priGPA
ACT
_cons

-.0793386
1.915294
.4010639
12.37304

Moiss Resende Filho (ECO/UnB)

Std. Err.
.0352349
.372614
.0532268
1.171961

valor =

t
-2.25
5.14
7.54
10.56

Number of obs
F( 3,
676)
Prob > F
R-squared
Adj R-squared
Root MSE
P>|t|
0.025
0.000
0.000
0.000

=
=
=
=
=
=

680
56.79
0.0000
0.2013
0.1978
4.2185

[95% Conf. Interval]


-.1485216
1.183674
.2965542
10.07192

-.0101556
2.646914
.5055736
14.67416

0.025
= 0.0125 ou 1.25%
2

(Wooldridge, captulo 4)

28/04/2014

32 / 32

Anda mungkin juga menyukai