Anda di halaman 1dari 30

1

Dados Experimentais
Para medir a produo de certa variedade de milho, faremos um
experimento no qual a variedade de milho (semente) plantada em
vrias parcelas homogneas com o mesmo fertilizante, pesticida
etc. Depois mede-se a produo por m
2
ou, nmero de gros,
nmero de espigas por p, etc.
Isto chamado de experimento controlado. Uma das vantagens
deste experimento que ele possvel de ser reproduzido e pode
ser repetido por diferentes pesquisadores e assim os procedimentos
podem ser checados.
Outra vantagem que ele pode ser repetido para diferentes nveis
de variveis de controle. Por exemplo, diferentes doses de adubo.
Assim cada resultado especfico para cada efeito da varivel pode
ser isolado.
Em economia, um exemplo de experimento controlado observar
o efeito de uma campanha promocional nas vendas em um
supermercado.
Ex. y representa a quantidade vendida, por semana, de uma certa
marca de lata de atum.
x
1
o preo da lata de atum na promoo
x
2
o preo da lata de atum de outra marca.
( ) + =
2 1
, x x f y
f(.) significa que y uma funo de x
1
e x
2
o componente no controlado e no previsto, ie, o erro aleatrio.
Apesar de o experimento ser controlado, a relao no exata.
Neste exemplo, podemos querer saber o que acontece com as vendas
se o preo da lata de atum diminuir 10 centavos.
2
Dados no experimentais
A maioria dos dados econmicos no-experimental. A fonte
principal de dados econmicos provm de observaes de
resultados do dia a dia:
- Quantidade consumida
- PIB
- Taxa de juros
- Inflao
- Desemprego
No podemos controlar o resultado destas variveis nem
reproduzir. Entretanto, um modelo econmico fornece a estrutura
necessria para termos um experimento hipottico controlado, pelo
qual, os dados que observamos poderiam ter sido gerados.
Se a maioria dos dados econmicos no gerada por experimentos
controlados feitos pelos pesquisadores, mas por experimentos
conduzidos pela sociedade, como observar as variveis
econmicas?
O governo coleta os dados (IBGE, DIEESE)
Variveis
- discretas assume um nmero finito de valores.
Ex.: nmero de crianas no domiclio.
nmero de vezes que o indivduo vai ao shopping por semana.
Variveis discretas so comumente utilizadas para classificar
dados qualitativos ou no numricos.
d = 1 se o chefe do domiclio homem
d = 0 se o chefe do domiclio mulher
Uma varivel contnua pode assumir qualquer valor real em um
intervalo no eixo dos nmeros reais.
Ex.: PIB
Em 1987 o PIB dos Estados Unidos era de 3853,7 bilhes dlares
Preo
Renda
3
Dada uma amostra de dados, o que fazer?
- queremos us-la para estimar constantes econmicas
desconhecidas ou parmetros.
Antes de utilizar inferncia queremos examinar a amostra e
fazer um resumo ou descrev-la, i.e., identificar suas
caractersticas primrias.
Estatstica Descritiva
- coeficiente de variao
100 =
x
s
CV
x
(para diminuir o problema de
magnitude na comparao de
duas varincias)
n
x
x

=
( ) 1 /
2 2
=

n x x s
x - disperso dos dados
- mdia dos dados
Varivel aleatria aquela que seu valor conhecido somente depois
de realizado o experimento.
Distribuio de Probabilidade
Podemos fazer afirmaes probabilsticas sobre certos valores da
varivel aleatria especificando uma distribuio de probabilidade.
Imagine que temos uma tabela de dados, p.e., observaes de um
conjunto de variveis aleatrias no tempo. Podemos descrever os
valores utilizando estatsticas descritivas, histogramas, grficos de
disperso, etc. Entretanto, estes procedimentos no so adequados
para se fazer inferncia. Inferncia estatstica baseada na habilidade
de se fazer afirmaes probabilsticas sobre as variveis aleatrias.
Para fazer tais afirmaes precisamos de informaes sobre a
distribuio de probabilidade da varivel aleatria.
4
Quando os valores de uma varivel aleatria so listados com suas
probabilidades de ocorrncia, a tabela resultante de valores
chamada funo densidade de probabilidade.
Considere uma varivel aleatria discreta x igual ao nmero de
caras obtidas em uma nica jogada de uma moeda. A funo
densidade de probabilidade, f(x) :
Isto significa que a probabilidade de x ser 1 0,5. Isto implica no
fato de os 2 valores 0 e 1 terem uma chance igual de ocorrncia e,
se jogarmos a moeda um grande nmero de vezes, o valor x = 1
ocorreria 50% das vezes. Denotamos isto por:
P(x = 1) = f(1) = 0,5
x f(x)
0 0.5
1 0.5
x f(x)
0 0.5
1 0.5
xx f(x) f(x)
00 0.5 0.5
11 0.5 0.5
x x f(x)
0 1 p
1 p
x x f(x)
0 1 p
1 p
xx x f(x) x f(x)
00 1 p 1 p
11 pp
Usando formula para x =0, 1 ( )
x x
p p x f

=
1
1 ) (
A f.d.p. para uma varivel aleatria contnua Y uma funo f(y), a
qual a equao de uma curva. A rea total abaixo da funo 1 e a
probabilidade de Y tomar valores no intervalo [a, b] ou P(a Y b)
a rea sob a f.d.p. entre os valores y = a e y = b.
Em contraste, a f.d.p. de uma varivel discreta uma frmula para
calcular a probabilidade de um valor especfico ocorrer.

F(x)
0,5
0 1 x
f(x)
5
Funo de densidade de probabilidade conjunta
Freqentemente precisamos responder perguntas sobre mais de uma
varivel aleatria. Por ex.:
Qual a probabilidade de a inflao ser menor que 5% e a taxa de
desemprego menor do que 6% no prximo ano?

=
b
a
dy y f b Y a P ) ( ) (
P (P 5, U 6) = f(u, p)
Para responder estas perguntas envolvendo 2 ou mais variveis
aleatrias, devemos conhecer a funo de densidade de probabilidade
conjunta.
Conhecida a funo pode-se calcular o valor por integral
6
Exemplo que envolve variveis aleatrias discretas:
Suponha que temos uma populao (no amostra) de 1000
indivduos que desejamos classificar por sexo (masculino e
feminino) e religio (catlica, protestante, outro)

feminino 1
masculino 0
S

religio outra 2
e protestant se 1
catlica se 0
R
S
0 1
0 200 270
R 1 300 100
2 60 70
S
0 1
0 200 270
R 1 300 100
2 60 70
SS
00 11
00 200 200 270 270
RR 11 300 300 100 100
22 60 60 70 70
S
0 1 h(r)
0 0,2 0,27 0,47
R 1 0,3 0,10 0,40
2 0,066 0,07 0,13
f(s) 0,56 0,44 1
S
0 1 h(r)
0 0,2 0,27 0,47
R 1 0,3 0,10 0,40
2 0,066 0,07 0,13
f(s) 0,56 0,44 1
SS
0 0 1 1 h(r) h(r)
0 0 0,2 0,2 0,27 0,27 0,47 0,47
RR 1 1 0,3 0,3 0,10 0,10 0,40 0,40
2 2 0,066 0,066 0,07 0,07 0,13 0,13
f(s) f(s) 0,56 0,56 0,44 0,44 1 1
A tabela mostra a funo de probabilidade conjunta f(s, r) de S e R.
H 200 homens catlicos em 1000. Portanto, a probabilidade de se
escolher um homem catlico 200/1000 = 0,2 = f(0,0)
Funes Densidade de probabilidade marginal
Dada uma funo de probabilidade conjunta, podemos obter a
distribuio de probabilidade de variveis aleatrias individuais
Se X e Y so variveis aleatrias discretas, ento

=
y
y x f x f ) , ( ) (

=
x
y x f y f ) , ( ) (
7
Exemplo:
A probabilidade de selecionar aleatoriamente um homem 0,56 e
uma mulher 0,44
f(s) = distribuio marginal de S.
Funes Densidade de Probabilidade Condicional
Freqentemente, a chance de ocorrncia de um evento est condicionada
ocorrncia de outro evento.
Ex.: se a frente fria chegar hoje, a chance de chuva de 80%.
) (
) (
) , (
] [ y x f
y f
y x f
y Y x X P = = = =
Ex.: Qual a probabilidade de uma mulher selecionada
aleatoriamente ser protestante?
227 , 0
) 1 (
) 1 , 1 (
44 , 0
1 , 0
440
100
] 1 1 [ = = = = = =
f
f
S R P
Variveis Aleatrias Independentes
A anlise de mais de uma varivel aleatria simplificada se as
variveis envolvidas no so relacionadas, ou so estatisticamente
independentes.
Duas variveis so estatisticamente independentes ou
independentemente distribudas se o conhecimento do valor de
uma delas no nos d qualquer indicao sobre o valor que a outra
pode tomar.
Ex.: sair cara na jogada de 2 moedas.
Se sair cara em uma moeda, no sei o que ocorrer na outra.
X
1
= nmero de caras na moeda 1.
X
2
= nmero de caras na moeda 2.
Portanto, X
1
e X
2
so independentes
8
Em economia, exemplo de varivel aleatria independente
gasto com carne por 2 indivduos escolhidos aleatoriamente.
Inflao e desemprego seriam dependentes
Se X
1
e X
2
so independentes ento
) ( ) ( ) (
2 1 2 1
X f X f X X f =
No exemplo da moeda
2 2 1 1
1 1
2 1
) 1 ( ) 1 ( ) , (
x x x x
p p p p X X f

=
2 2 1 1
1 1
) 5 , 0 1 ( 5 , 0 ) 5 , 0 1 ( 5 , 0
x x x x
=
Ento a probabilidade de obter uma cara na 1
a
. moeda e coroa na
2
a
.
P(X
1
= 1, X
2
=0) = f(1, 0) = f(1). f(0) = (0,5).(1).(1).(0,5) = 0,25
O valor esperado de uma varivel aleatria
Uma importante caracterstica da varivel aleatria o seu valor
esperado ou mdia. o valor mdio da varivel aleatria em um
nmero infinito de repeties do experimento (amostras) e denota-
se E(X).
Se X o nmero de caras ao se lanar uma moeda, e X pode
tomar os valores 0,1 ento
E(X) = 0,5, que o valor mdio de X.
Para a varivel discreta
) ( ... ) ( ) ( ) (
2 2 1 1 T T
X f X X f X X f X X E + + =

=
=
T
i
i i
X f X
1
) (
uma soma ponderada, onde os pesos so as probabilidades.
9
Para a varivel contnua


= dY Y Yf Y E ) ( ) (

= = =
x
y Y x P x y Y X E ) ( . ) (
545 , 0 159 , 0 . 2 227 , 0 . 1 614 , 0 . 0 ) 1 ( = + + = = S r E
159 , 0
44 , 0
07 , 0
) 1 2 ( = = = = S R f
Propriedades da Esperana
(1) E(c) = c c constante
(2) E (cX) = c E(X)
(3) E (a + cX) = a + c E(X) a e c constantes
(4) E (X + Y) = E (X) + E (Y)
(5) E (X Y) = E(X) E (Y) se X e Y forem independentes
Esperana na condicional.
227 , 0
44 , 0
10 , 0
) 1 1 ( = = = = S R f 614 , 0
44 , 0
27 , 0
) 1 0 ( = = = = S R f
Varincia de uma varivel aleatria
[ ]
2 2
) ( ) ( X E X E X Var = =
) ( } )] ( [ ) ( 2 { ) ( )) ( (
2 2 2
X f X E X XE X X f X E X + = =
Lembre-se que E(X) uma constante
) ( )] ( [ ) ( ) ( 2 ) (
2 2
X f X E X Xf X E X f X + =
2 2
)] ( [ ) ( ) ( 2 ) ( X E X E X E X E + =
2 2
)] ( [ ) ( X E X E =
1
Quanto maior a varincia, mais espalhados os valores da populao
com relao a mdia.
Propriedades:
0 ) ( ) 1 = c V
) ( ) ( ) 2
2
X V c cX V =
10
Covarincia
Para analisar a relao entre variveis econmicas e responder
perguntas do tipo, o quo prximas caminham duas variveis
preos? utilizamos a covarincia (ou correlao) entre 2 variveis.
Se X
1
e X
2
so variveis aleatrias discretas, ento
( ) ( ) ( ) ( ) [ ] ( ) [ ] ( ) [ ] ) ( ) , cov(
2 1 2 2 1 1 2 2 1 1 2 1
1 2
X X f X E X X E X X E X X E X E X X
X X

= =
O sinal da covarincia indica se a associao positiva (direta)
ou negativa (inversa). Covarincia 0 significa que no h
associao entre as variveis.
A magnitude da covarincia difcil de interpretar porque
depende da unidade de medida das variveis aleatrias. Por isso
utiliza-se a correlao.
11
( )
) ( ) (
cov
2 1
2 1
X Var X Var
X X
=
Mede o grau de associao linear entre as variveis. A correlao
est sempre entre 1 e 1 .
Suponha que X
1
uma funo perfeitamente linear de X
2
, ou X
1
=
a +cX
2
onde a e c so constantes diferentes de 0.
Ento
( ) ( ) [ ] ( ) [ ]
2 2 1 1 2 1
, cov X E X X E X E X X =
( ) ( ) [ ] ( ) [ ]
2 2 2 2
X E X cX a E cX a E + + =
( ) [ ] ( ) [ ]
2 2 2 2
X E X X cE cX a a E + =
( ) [ ]
2
2 2
X E X cE =
( )
2
X cVar =
Como a Var (X
1
) = c
2
Var(X
2
)/ , ento
( )
( )
2 1 2
2 1 2
cov( )

cVar X X X
c Var X VarX VarX
= =

<
>
=
0 se 1
0 se 1
c
c
A covarincia entre variveis aleatrias independentes X
1
e X
2

zero, indicando que no h uma associao linear entre elas.


( )( )
1
cov


=

T
Y Y X X
XY
( )( )
( ) ( )



=
2 2
Y Y X X
Y Y X X
r
XY
( ) ( ) ( ) XY Y Var X Var Y X Var cov 2 ) ( + + = +
Para a amostra:
12
Funes Densidade de Probabilidade
A Distribuio Normal
Se X uma varivel aleatria com distribuio normal, com mdia
e varincia
2
, simbolizamos por:
( )
2
, ~ N X
A funo densidade de probabilidade :
A mdia e a varincia
2
so os parmetros desta distribuio
e determinam a localizao e a disperso.
( )
+ < <
(
(
(
(


= X
X
X f
2
2
2
2
1
exp
2
1
) (

As probabilidades so obtidas integrando a funo para obter a rea.


Entretanto, para facilitar utilizam-se tabelas da distribuio normal
padronizada, a qual tem mdia 0 e varincia 1.
Se X ~ N ( ,
2
) ento
13
( )
) 1 , 0 ( ~ N
X
Z


=
A relao entre X e Z muito til, pois qualquer informao a
respeito de X pode ser reformulada para Z e consultada a tabela.
( ) |

\
|
= |

\
|

a
Z P
a X
P a X P
( ) |

\
|

= |

\
|

b
Z
a
P
b X a
P b X a P
Ex: Se X ~ N(3,9) ento
( ) ( ) 212 , 0 1293 , 0 3413 , 0 1 33 , 0
3
3 6
3
3 4
6 4 = = = |

\
|

= Z P Z P X P
Um fato til da distribuio normal que a soma ponderada de variveis
aleatrias com distribuio normal tambm tem distribuio normal.
) , ( ~ , ), , ( ~ ), , ( ~ Se
2 2
2 2 2
2
1 1 1 n n n
N X N X N X
ento , constantes so , , , se e
2 1 n
c c c
[ ] ) var( ), ( ~
2 2 1 1
Z Z E N X c X c X c Z
n n
+ + =
14
Distribuio de Qui-Quadrado
Estas distribuies surgem quando elevamos ao quadrado variveis
aleatrias que so normal padronizada.
Se Z
1
, Z
2
, ..., Z
m
so m variveis aleatrias N(0,1) independentes,
ento
2 2 2
2
2
1
~ ...
m m
Z Z Z v + + + =
m v E = ) (
m v V 2 ) ( =
Distribuio t
Surge dividindo-se uma varivel aleatria normal padronizada Z
pela raiz quadrada de uma varivel aleatria qui-quadrado
independente v , que foi dividida pelo seu nmero de graus de
liberdade, m.
Se Z ~ N(0,1) e v ~
2
m
e se Z e v so independentes
15
Tem a cauda mais grossa do que a distribuio normal, mas na medida
em que o nmero de graus de liberdade aumenta, ela tende a
distribuio normal padronizada.
Distribuio F
Forma-se uma varivel aleatria F pela razo de duas variveis qui-
quadrado independentes, divididas pelos respectivos graus de
liberdade.
( )
2 1
2 2
1 1
, ~
/
/
m m F
m v
m v
F =
m
t
m v
Z
t ~
/
=
A distribuio t simtrica com mdia 0 e varincia m/(m2).
tes independen so e se e ~ e ~ Se
2 1
2
2
2
1
2 1
v v v v
m m

Regras de Somatrio
1) Se a uma constante ento

= =
=
n
i
i
n
i
i
X a aX
1 1
16
( ) ( ) ) ( ... ) (
2 2 1 1
1
n n
n
i
i i
Y X Y X Y X Y X + + + + + + = +

=
2) Se X e Y so duas variveis, ento
( )

= = =
+ = +
n
i
n
i
i i
n
i
i i
Y X Y X
1 1 1
Prova:

+ + + =
i
n i
aX aX aX aX ...
2 1
( )
n
X X X a + + + = ...
2 1

=
=
n
i
i
X a
1
) ... ( ) ... (
2 1 2 1 n n
Y Y Y X X X + + + + + + + =

+ =
i i
Y X
Prova:
ento
( ) 0
1
=

=
n
i
i
X X
Prova:
( ) ( ) ( ) ( ) X X X X X X X X
n i
+ + + =

...
2 1
( ) ( ) X X X X X X
n
+ + + + + + = ... ...
2 1

= X n X
i
mas
n
X X X
n
X
X
n
i
+ + +
= =

...
2 1
3) Se X e Y so duas variveis, e a e b so constantes, ento
( )

= = =
+ = +
n
i
n
i
i i
n
i
i i
Y b X a bY aX
1 1 1
X n X varivel da valores de aritmtica mdia a 4)Se
17
5) ( )

=
=
2 2
2
1
X n X X X
i
n
i
i
Prova
( ) ( )

+ =
=
2 2
2
1
2 X X X X X X
i i
n
i
i

+ =
2 2
2 X n X X X
i i
2 2
2 X n X n X X
i
+ =

=
2 2
X n X
i
Portanto,
( )

= = 0
i i i
X X X X
i
i
X
n
X
n X n =

=
( ) ( ) ( )
n
Y X Y X Y X + + + + + + +
2 2 2 1 2
...

( ) ( ) ( )
n m m m
Y X Y X Y X + + + + + + + ...
2 1
Somatrio Mltiplo
( ) ( ) ( ) ( )

= =
+ + + + + + = +
m
i
n
j
n j i
Y X Y X Y X Y X
1 1
1 2 1 1 1
...
18
O modelo de regresso linear simples
A teoria econmica sugere muitas relaes entre variveis:
- quantidades demandadas e ofertadas dependem do preo
- quantidade de um bem produzido em funo de um insumo
utilizado (trabalho)
- quantidade de investimento agregado na economia depende da
taxa de juros
- consumo agregado em funo do nvel de renda disponvel
Como economistas, estamos interessados em questes do tipo: se
uma varivel (p.e. preo de um bem) varia de uma certa maneira,
de quanto variar outra varivel (quantidade demandada)?
Conhecido o valor de uma varivel, podemos prever o valor de
outra? Essas questes sero respondidas com o auxlio de um
modelo de regresso.
Exemplo:
Suponha que estamos interessados em estudar a relao entre
renda familiar e despesas com alimentao.
Selecionaremos residncias aleatoriamente com renda familiar
de 480 dlares por ms, e entrevistaremos os moradores,
perguntando o quanto foi gasto com alimento no ms passado.
Gasto com alimento = y = varivel aleatria.
Mesmo selecionando residncias com a mesma renda, a quantia
gasta com alimentao varia de uma residncia para outra por
inmeras razes.
-algumas famlias so do gnero gourmet
- algumas tm adolescentes
- algumas so vegetarianas
19
Obs.:
Curva de Engel - Ernest Angel (1857 Blgica)
Gastos = f(renda)
Engel estabeleceu as primeiras leis empricas que governam a
relao entre renda e despesas.
(1) Alimento o item mais importante no oramento familiar
(2) a proporo do gasto total alocado com alimento diminui
quando a renda aumenta
luxo de bens 1 >
y
e
e necessidad de bens 1 0 < <
y
e
inferiores bens 1 <
y
e
A varivel aletoria y tem uma funo densidade de probabilidade
f(y) que descreve as probabilidades dos diversos valores das
despesas com alimentao na populao, e na realidade uma
funo condicional, pois est condicionada renda da famlia.
x = renda mensal da famlia
2
) 480 ( = = x y Var
) 480 ( = x y f
x y
x y E = = ) 480 ( despesa mensal mdia da populao com alimentao
funo densidade de probabilidade condicional
varincia condicional de y
20
Uma anlise economtrica do efeito da despesa pode dar resposta a
algumas questes importantes, como:
- se a renda mensal aumentar de $20, de quanto, em mdia,
aumentaro as despesas com alimentao?
- possvel a despesa mensal com alimentao cair quando a renda
aumenta?
- Qual a previso de despesa mensal com alimentao de uma
famlia com renda mensal de $800,00?
Planejamentos a longo prazo em supermercados seriam
auxiliados tendo estas respostas. Qual deve ser o tamanho do
supermercado em bairro pobre e rico, etc.
Para pesquisar a relao entre despesa e renda, devemos construir
um modelo econmico e a seguir um modelo economtrico que
constituam a base de uma anlise econmica quantitativa.
No nosso exemplo, a teoria econmica sugere que a despesa
mensal mdia com alimentao de uma famlia, representada por
E(yx), depende da renda da famlia.
A despesa mdia para as casas com maior renda maior do que a
despesa mdia para as casas com menor renda.
Faremos a suposio de que a relao entre consumo e renda
linear. Ento, o modelo econmico da despesa de uma famlia
com alimentao :
x x y E
x y 2 1
) ( + = =
21
a funo de regresso simples (porque tem 1 varivel do lado
direito da equao) tm 2 parmetros
1
e
2
desconhecidos

1
= despesa mensal mdia com alimentao em uma famlia
com renda zero (intercepto)

2
= variao em E(yx) para uma variao de $1 na renda
mensal ou propenso marginal a gastar com alimentao
(coeficiente angular)
Para usarmos os dados, devemos especificar um modelo
economtrico que descreva como as variveis renda e despesa
de uma famlia so geradas.
Se tomarmos uma amostra aleatria de famlias com renda mensal
de $480, sabemos que os valores efetivos das despesas se
distribuiro em torno do valor mdio E(yx). Se fssemos tomar
amostras de despesas domsticas para outros nveis de renda, os
valores amostrais tambm se distribuiriam em torno da mdia.
x x y E
2 1
) ( + =
A figura mostra que, em cada nvel de renda, o valor mdio da
despesa domstica dado pela funo de regresso.
22
2
) ( = x y Var para todos os valores de x.
ver figura as funes densidades tm mdias diferentes,
porm varincias iguais.
Dados com varincia constante so homoscedsticos
- amostra aleatria, o que significa que, quando se coletam os
dados, eles so estatisticamente independentes. O conhecimento
de uma despesa nada nos diz quanto ao valor que a outra pode
tomar.
Nos modelos economtricos, costuma-se propor uma hiptese
mais fraca do que a independncia estatstica, que a da
covarincia entre y
i
e y
j
ser zero.
Algumas suposies:
- A distribuio dos valores y em torno de sua mdia deve ser a
mesma para todos os nveis de renda x, isto ,
Independncia covarincia = 0
Mas a recproca no verdadeira
Implica que no h associao linear sistemtica entre y
i
e y
j.
A anlise de regresso mede o efeito de variaes em uma
varivel x sobre outra varivel y.
- A distribuio de y normal ou f(yx) normal.
Daqui em diante usaremos y e no yx
23
Pressupostos do modelo de regresso linear simples
Erro Aleatrio
A essncia da anlise de regresso que qualquer observao
sobre a varivel dependente y pode decompor-se em dois
componentes, um sistemtico e um aleatrio. O componente
sistemtico de y sua mdia, e o componente aleatrio de y a
diferena entre y e seu valor mdio E(y).
x y E
2 1
) ( ) 1 + =
2
) var( ) 2 = y
0 ) , cov( ) 3 =
j i
y y
c x ) 4
( )
2
2 1
, ~ ) 5 X N y +
x y y E y e
2 1
) ( = =
ou
e x y + + =
2 1

as funes densidade de y e e so idnticas, exceto pelo fato da
E(e) = 0
Em econometria, costuma-se formular as hipteses do modelo de
regresso em termos do erro aleatrio e.
Pressuposies:
e x y + + =
2 1
) 1
x y E e E
2 1
) ( pois 0 ) ( ) 2 + = =
) var( ) ( 3)
2
y e Var = =
24
Uma diferena entre y e e que y observvel, enquanto e no .
Se
1
e
2
fossem conhecidos, poderamos calcul-los.
( ) x y e
2 1
+ =
0 ) cov( ) 4 =
j i
e e
c x 5)
) , 0 ( ~ ) 6
2
N e
Ex.: erro de aproximao devido a forma funcional
Gosto do indivduo (componente comportamental)
Estimao dos parmetros
Considere os dados da tabela. So
valores observados da varivel
aleatria y que satisfazem as
pressuposies 1 a 6.
1 52,25 258,30
2 58,32 343,1
40 269,03 1154,60
Despesa Renda
1 52,25 258,30
2 58,32 343,1
40 269,03 1154,60
Despesa Despesa Renda Renda

Como
1
e
2
nunca so conhecidos, impossvel calcular e.
interessante encarar e de maneira ligeiramente diferente. Ele
representa todos os fatores no observveis que afetam y. Esses
fatores fazem com que observaes individuais y difiram do
valor mdio
1
+
2
x.
25
Colocando os dados em um diagrama de disperso tem-se
Nosso problema estimar a posio da reta de despesa mdia.
Seria de esperar que essa reta estivesse no meio de todos os pontos
j que representa um comportamento mdio. Precisamos ento de
um critrio formal para traar a reta, e de preferncia, que
utilizasse todas as informaes.
Como utilizar y e x amostrais para estimar os parmetros
desconhecidos
1
e
2
?
O princpio dos mnimos quadrados
Vamos empregar uma regra para estimar
1
e
2
baseado no
princpio dos mnimos quadrados.
Este princpio afirma que, para ajustar uma reta aos valores dos
dados, devemos procurar a reta tal que a soma dos quadrados das
distncias verticais de cada ponto reta seja a menor possvel.
Tomam-se os quadrados das distncias para evitar que grandes
distncias positivas sejam canceladas pelas negativas.
As estimativas de mnimos quadrados de
1
e
2
so b
1
e b
2
. A
reta ajustada
t t
x b b y
2 1
+ =
26
As distncias verticais de cada ponto reta ajustada so os
resduos de mnimos quadrados, que so dados por:
t t t t t
x b b y y y e
2 1
= =
Suponha agora que queiramos ajustar aos dados outra reta
arbitrria, digamos
t t
x b b y
*
2
*
1
*
+ =
as estimativas de mnimos quadrados b
1
e b
2
tm a seguinte
propriedade:
a soma dos quadrados dos seus resduos menor do que a soma
dos quadrados dos resduos de qualquer outra reta, no importando
o modo como tal linha possa ter sido traada por entre os pontos
representativos dos dados.
( ) ( )

= =
2
* 2 *
2
2

t t t t t t
y y e y y e
27
O problema agora encontrar uma forma conveniente para
determinar b
1
e b
2
. Dadas as observaes amostrais sobre x e y,
devemos achar valores dos parmetros desconhecidos
1
e
2
que
minimizem a funo soma de quadrados dos erros:
( ) ( )
2
1
2 1 2 1
,

=
=
T
i
t t
x y S
( ) ( ) 0 1 2
2 1
1
= =

t t
x y
S


= + + 0 2 2 2
2 1 t t
x T y
( )( ) 0 2
2 1
2
= =

t t t
x x y
S

0 2 2 2
2
2 1
= + +
t t t t
x x x y
28
( )

= +
t t t t
x y x b x Tb
2
2 1

= +
t t t t
y x T x Tb x Tb
2
2 1

= +
t t
y x b Tb
2 1
( )

t
x

= +
t t t t
y x x b x b
2
2 1
( ) T
( ) [ ]
t t t t t t
y x T x y x T x b + = +
2 2
2
( )
2 2
2
t t
t t t t
x x T
y x y x T
b


=
x b y
T
x
b
T
y
b
t t
2 2 1
=

=
(1)
(2)
Fazendo (2) menos (1) obtm-se:
Observe que se x
t
= c, b
2
no existiria, pois o denominador seria 0.
- os estimadores de MQ so frmulas gerais e so variveis
aleatrias
- as estimativas de MQ so os valores observados de variveis
aleatrias
A Reta de Regresso estimada ou ajustada :
t t
x y 1283 , 0 7676 , 40 + =
A reta ajustada de MQ passa pelo meio dos dados de forma muito
precisa, pois uma das caractersticas da reta ajustada, baseada nas
estimativas de mnimos quadrados dos parmetros, que ela
passa pelo ponto definido pelas mdias amostrais.
29
b
2
= 0,13 o aumento na despensa mensal com alimento quando
a renda mensal aumenta de $1.
Assim, se a renda aumenta de $100, estima-se em $13 o
aumento da despesa mensal.
como
x
y

=
2

, ento
y
x
2
=
y
x
x
y

=
y
x
x
y

OU
Elasticidades
A elasticidade renda da demanda uma forma conveniente de
caracterizar o nvel da resposta da despesa do consumidor a
variaes na renda.
b
1
= 40,77 uma estimativa da despesa mensal com alimentao
de uma famlia com renda zero.
30
137 $ ) 750 ( 13 , 0 77 , 40 = + =
t
y
prevemos que uma casa com renda mensal de $750 gaste $137 com
alimentao.
69 , 0
31 , 130
698
13 , 0
2
= = =
y
x
b
uma variao de 1% na renda mensal de uma famlia acarreta, em
mdia, um aumento de aproximadamente 0,7% na despesa com
alimentao. Como < 1 necessidade e no luxo.
Previso
Suponha que queiramos prever a despesa mensal com alimentao
de uma famlia com renda mensal de $750,00, ento
no ponto de mdia tem-se
uma caracterstica interessante desse modelo que
2
a
elasticidade de y em relao a x.
x
y
y x
y

1 ln ( )
x x
x 1 ln
2
2 1

+
=
portanto
=

=
y
x
x
y
2
Outros modelos econmicos
O modelo de regresso linear simples muito mais flexvel do
que parece a primeira vista, porque as variveis x e y podem ser
transformaes que envolvem logaritmo, quadrados, cubos ou
inversos das variveis econmicas bsicas.
Na verdade, o modelo linear nos parmetros, no se permitindo
expresses como ln()
x y ln ln
2 1
+ = So comuns modelos econmicos como: