PARTE 1
ANLISE DE REGRESSO COM DADOS DE CORTE TRANSVERSAL 19
xv
xvi Introduo Econometria Editora Thomson
PARTE 2
ANLISE DE REGRESSO COM DADOS DE SRIES TEMPORAIS 305
PARTE 3
TPICOS AVANADOS 401
Sobreidentificadoras 475
15.6 O MQ2E com Heteroscedasticidade 478
15.7 A Aplicao do MQ2E a Equaes de Sries Temporais 479
15.8 A Aplicao do MQ2E em Cortes Transversais Agrupados
e em Dados de Painel 481
Glossrio 645
Captulo 1 examina o escopo da econometria e prope questes gerais que resultam da aplica-
O o dos mtodos economtricos. A Seo 1.3 examina os tipos de dados usados em negcios,
economia e outras cincias sociais. A Seo 1.4 faz uma discusso intuitiva das dificuldades
associadas com a inferncia da causalidade nas cincias sociais.
1
2 Introduo Econometria Editora Thomson
EXEMPLO 1.1
(Modelo Econmico do Crime)
Em um artigo inspirador, o prmio Nobel Gary Becker postulou um arcabouo da maximizao da utilidade
para descrever a participao de um indivduo no crime. Certos crimes tm recompensas econmicas evi-
dentes, mas muitos comportamentos criminosos tm custos. O custo de oportunidade do crime impede o
criminoso de participar de outras atividades, como um emprego legal. Alm disso, h custos associados com
a possibilidade de ser capturado, e, se condenado, h os custos associados com o cumprimento de pena.
Da perspectiva de Becker, a deciso de empreender a atividade ilegal uma deciso de alocao de recur-
sos com os benefcios e custos das atividades concorrentes sendo considerados.
Sob hipteses gerais podemos derivar uma equao que descreve a quantidade de tempo gasto na ati-
vidade criminosa como uma funo de vrios fatores. Podemos representar tal funo como
em que
Outros fatores geralmente afetam a deciso de uma pessoa de participar de atividades criminosas, mas a
lista acima representa o que poderia resultar de uma anlise econmica formal. Como comum na teoria
econmica, no fomos especficos sobre a funo f () em (1.1). Essa funo depende de uma funo utili-
dade subjacente, raramente conhecida. Entretanto, podemos usar a teoria econmica ou a introspeco
para prever o efeito que cada varivel teria sobre as atividades criminosas. Essa a base para uma anlise
economtrica das atividades criminosas individuais.
A modelagem econmica formal , s vezes, o ponto de partida da anlise emprica, porm mais
comum usar a teoria econmica de modo menos formal, ou mesmo contar inteiramente com a intui-
o. Voc pode concordar quanto aos determinantes do comportamento criminoso que aparecem na
equao (1.1) serem razoavelmente baseados no senso comum; poderamos chegar a tal equao dire-
tamente, sem partir da maximizao da utilidade. Essa viso tem algum mrito, embora haja casos em
que derivaes formais geram idias que a intuio pode ignorar.
Vejamos o exemplo de uma equao que foi derivada por meio de um raciocnio um tanto
informal.
4 Introduo Econometria Editora Thomson
EXEMPLO 1.2
(Treinamento e Produtividade do Trabalhador)
Considere o problema proposto no incio da Seo 1.1. Um economista especializado em trabalho gostaria
de examinar os efeitos do treinamento sobre a produtividade do trabalhador. Nesse caso, h pouca necessi-
dade de teoria econmica formal. Um entendimento econmico bsico suficiente para perceber que fato-
res tais como educao, experincia e treinamento influenciam a produtividade do trabalhador. Os econo-
mistas tambm esto bem cientes de que os trabalhadores so pagos de acordo com sua produtividade. Esse
raciocnio simples leva a um modelo tal que
em que salrioh o salrio-hora, educ representa os anos de educao formal, exper refere-se aos anos de
experincia no mercado de trabalho e treina corresponde a semanas ocupadas em treinamento. Novamente,
outros fatores geralmente influenciam a taxa de salrio, mas (1.2) captura a essncia do problema.
Aps especificarmos um modelo econmico, precisamos voltar ao que chamamos de modelo eco-
nomtrico. Visto que trabalharemos com modelos economtricos ao longo deste texto, importante
saber como eles se relacionam com os modelos econmicos. Considere a equao (1.1) como exem-
plo. A forma da funo f() deve ser especificada antes de podermos empreender uma anlise econo-
mtrica. Uma segunda questo concernente a (1.1) como lidar com variveis que no podem ser
razoavelmente observadas. Por exemplo, considere o salrio que uma pessoa pode receber na ativi-
dade criminosa. Em princpio, tal quantidade bem-definida, mas poderia ser difcil, se no imposs-
vel, observar o salrio para um determinado indivduo. Mesmo variveis como a probabilidade de
ser preso no podem ser obtidas de modo realista para um determinado indivduo, mas pelo menos
podemos observar estatsticas de deteno relevantes e derivar uma varivel que se aproxime da pro-
babilidade de priso. Muitos outros fatores que no podemos listar, nem mesmo observar, afetam o
comportamento criminoso, mas devemos de algum modo consider-los.
As ambigidades inerentes ao modelo econmico do crime so resolvidas ao se especificar um
modelo economtrico particular, tal como:
em que crime alguma medida de freqncia da atividade criminosa, salriom o salrio que poderia
ser ganho em um emprego legal, outrenda a renda de outras fontes (ativos, herana etc.), freqpris
a freqncia de prises por infraes anteriores (para aproximar a probabilidade de deteno), freqcond
a freqncia de condenaes e sentmed a durao mdia da sentena aps as condenaes. A esco-
lha dessas variveis determinada pela teoria econmica e por consideraes sobre os dados. O termo
u contm fatores no observados, tais como o salrio da atividade criminosa, o carter moral, a for-
mao da famlia e erros na mensurao de coisas como a atividade criminosa e a probabilidade de
de teno. Podemos adicionar variveis de formao da famlia ao modelo, tais como o nmero de
irmos, a educao dos pais, e assim por diante, mas nunca poderemos eliminar u inteiramente. De fato,
lidar com esse termo de erro ou termo de disturbncia , talvez, o componente mais importante de qual-
quer anlise economtrica.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 5
em que o termo u contm fatores tais como aptido inata, qualidade da educao, formao da famlia
e uma mirade de outros fatores que podem influenciar o salrio de uma pessoa. Se estivermos especial-
mente interessados nos efeitos do treinamento de trabalho, ento 3 o parmetro de interesse.
Na maioria dos casos, a anlise economtrica comea pela especificao de um modelo econom-
trico, sem considerao de detalhes da criao do modelo. Geralmente seguimos essa abordagem, pois,
em grande parte, a derivao cuidadosa de algo como o modelo econmico do crime toma muito tempo
e pode nos levar para algumas reas especializadas e freqentemente difceis da teoria econmica. O
raciocnio econmico desempenhar um papel importante em nossos exemplos, e incorporaremos toda
teoria econmica subjacente na especificao do modelo economtrico. No modelo econmico do
exemplo do crime, comearamos com um modelo economtrico tal como (1.3) e usaramos o racioc-
nio econmico e o senso comum como guias para escolher as variveis. Embora essa abordagem perca
algumas das profuses da anlise econmica, ela comum e efetivamente aplicada por pesquisadores
cautelosos.
Visto que um modelo economtrico tal como (1.3) ou (1.4) tenha sido especificado, vrias hip-
teses de interesse podem ser formuladas em termos dos parmetros desconhecidos. Por exemplo, na
equao (1.3), poderamos levantar a hiptese de que salriom, o salrio que poderia ser ganho no
emprego legal, no tem efeito sobre o comportamento criminoso. No contexto desse modelo
economtrico especfico, a hiptese equivalente a 1 = 0.
Uma anlise emprica, por definio, requer dados. Aps os dados sobre as variveis relevantes
terem sido coletados, os mtodos economtricos so usados para estimar os parmetros do modelo eco-
nomtrico e para, formalmente, testar as hipteses de interesse. Em alguns casos, o modelo economtri-
co usado para fazer previses com a finalidade de testar de uma teoria a estudo do impacto de uma
poltica.
Como a coleta de dados muito importante em trabalhos empricos, a Seo 1.3 descrever os
tipos de dados com os quais, provavelmente, nos defrontaremos.
lise pura de dados de corte transversal, ignoraramos, na coleta de dados, quaisquer diferenas de tempo
no importantes. Se o conjunto de famlias fosse pesquisado durante diferentes semanas do mesmo ano,
ainda veramos isso como um conjunto de dados de corte transversal.
Uma importante caracterstica dos dados de corte transversal que no podemos, freqentemente,
assumir que eles foram obtidos por amostragem aleatria da populao subjacente. Por exemplo, se
obtemos informaes sobre salrios, educao, experincia e outras caractersticas ao extrair aleatoria-
mente 500 pessoas de uma populao de trabalhadores, teremos uma amostra aleatria da populao
de todas as pessoas que trabalham. A amostragem aleatria, matria aprendida nos cursos introdutrios
de estatstica, simplifica a anlise de dados de corte transversal. Uma reviso sobre amostragem alea-
tria aparece no Apndice C disponvel em www.thomsonlearning.com.br, na pgina deste livro.
Algumas vezes, a amostragem aleatria no apropriada como uma hiptese para analisar dados
de corte transversal. Por exemplo, suponha que estejamos interessados em estudar fatores que influen-
ciam na acumulao de riqueza das famlias. Podemos estudar uma amostra aleatria de famlias, mas
algumas talvez se recusem a relatar suas riquezas. Se, por exemplo, for menos provvel que famlias
mais ricas revelem sua riqueza, a amostra resultante sobre a riqueza no uma amostra aleatria extrada
da populao de todas as famlias. Este um exemplo de um problema de seleo amostral, um tpico
avanado que discutiremos no Captulo 17.
Outra violao da amostragem aleatria ocorre quando construmos uma amostra a partir de uni-
dades grandes relacionadas populao, em especial a unidades geogrficas. O problema provvel em
tais casos que a populao no suficientemente grande para se supor, de maneira razovel, que as
observaes so extraes independentes. Por exemplo, se queremos explicar novas atividades de
negcios entre estados, como funo de taxas de salrios, preos de energia, alquotas de impostos, ser-
vios prestados, qualidade da fora de trabalho e outras caractersticas estaduais, improvvel que as
atividades de negcios em um Estado prximo a outro sejam independentes. Isso revela que os mto-
dos economtricos que discutimos funcionam, de fato, em tais situaes, mas algumas vezes necessi-
tam ser refinados. Na maioria dos casos, ignoraremos as complexidades que surgem ao analisar tais
situaes e trataremos esses problemas dentro do arcabouo da amostragem aleatria, mesmo quando
no for tecnicamente correto faz-lo.
Os dados de corte transversal so amplamente usados em economia e em outras cincias sociais.
Em economia, a anlise de dados de corte transversal est intimamente alinhada com campos da
microeconomia aplicada, tais como economia do trabalho, finanas pblicas estaduais e locais, orga-
nizao industrial, economia urbana, demografia e economia da sade. Dados sobre indivduos, fam-
lias, empresas e cidades em um determinado ponto do tempo so importantes para testar hipteses
microeconmicas e avaliar polticas governamentais.
Para a anlise economtrica, os dados de corte transversal usados podem ser representados e
armazenados em computadores. A Tabela 1.1 contm, de forma abreviada, um conjunto de dados de
corte transversal para o ano de 1976, de 526 trabalhadores. (Esse um subconjunto dos dados do arqui-
vo WAGE1.RAW*.) As variveis incluem salrioh (salrio por hora), educ (anos de educao formal),
exper (anos de experincia no mercado de trabalho), feminino (indicador de gnero) e casado (estado
civil). Estas duas ltimas variveis so binrias (zero-um) por natureza, e servem para indicar caracte-
rsticas qualitativas dos indivduos. (A pessoa do sexo feminino ou no; a pessoa casada ou no.)
Falaremos mais sobre variveis binrias no Captulo 7 e seguintes.
* NRT: Todos os arquivos mencionados no texto tm a designao *.RAW, mas no banco de dados os arqui-
vos so planilhas em Excel (.XLS), e os arquivos de trabalho de programas economtricos (como
*.WF1, do Eviews). Portanto, a designao *.RAW genrica e d um significado de *.matria-
prima para aplicaes e exerccios.
Wooldridge Captulo 1 A Natureza da Econometria e dos Dados Econmicos 7
Tabela 1.1
Conjunto de Dados de Corte Transversal sobre Salrios e outras Caractersticas Individuais
1 3,10 11 2 1 0
2 3,24 12 22 1 1
3 3,00 11 2 0 0
4 6,00 8 44 0 1
5 5,30 12 7 0 1
. . . . . .
. . . . . .
. . . . . .
525 11,56 16 5 0 1
526 3,50 14 5 1 0
A varivel nobsi na Tabela 1.1 o nmero da observao atribudo a cada indivduo na amostra.
Diferentemente das outras variveis, ela no uma caracterstica do indivduo. Todos os programas
economtricos e estatsticos atribuem a cada unidade um nmero de observao. A intuio deveria
dizer-lhe que, para dados como os da Tabela 1.1, no importa qual pessoa classificada como obser-
vao um, qual pessoa designada pela observao dois, e assim por diante. O fato de que a ordena-
o dos dados no importa para a anlise economtrica uma caracterstica fundamental dos conjun-
tos de dados de corte transversal obtidos a partir da amostragem aleatria.
s vezes, variveis diferentes correspondem a diferentes perodos nos conjuntos de dados de corte
transversal. Por exemplo, a fim de determinar os efeitos de polticas governamentais sobre o cresci-
mento econmico de longo prazo, os economistas tm estudado a relao entre crescimento do PIB per
capita real ao longo de certo perodo (digamos, 1960 a 1985) e variveis determinadas, em parte, pela
poltica governamental em 1960 (consumo do governo como percentagem do PIB e taxas de ensino
mdio de adultos). Tais conjuntos de dados poderiam ser representados como na Tabela 1.2, a qual
constitui parte do conjunto de dados usados no estudo de De Long e Summers (1991) sobre as taxas
de crescimento entre pases.
A varivel cpibpcr representa o crescimento mdio do PIB per capita real ao longo do perodo
1960 a 1985. O fato de que consgov60 (consumo do governo como percentagem do PIB) e second60
(percentagem da populao adulta com ensino mdio) correspondem ao ano de 1960, enquanto
cpibpcr o crescimento mdio ao longo do perodo 1960 a 1985, no leva a quaisquer problemas
especiais ao tratar essas informaes como um conjunto de dados de corte transversal. As observa-
es esto ordenadas alfabeticamente por pas, mas essa ordenao no afeta em nada qualquer an-
lise subseqente.
8 Introduo Econometria Editora Thomson
Tabela 1.2
Conjunto de Dados sobre Taxas de Crescimento Econmico e Caractersticas de Pases
1 Argentina 0,89 9 32
2 ustria 3,32 16 50
3 Blgica 2,56 13 69
4 Bolvia 1,24 18 12
. . . . .
. . . . .
. . . . .
61 Zimbbue 2,30 17 6
Muitas sries de tempo econmicas, sejam semanais, mensais ou trimestrais, exibem um forte
padro sazonal, o qual pode ser um importante fator na anlise de sries de tempo. Por exemplo, dados
mensais sobre o incio da construo de moradias se diferenciam entre os meses simplesmente devido a
mudanas das condies climticas. Aprenderemos como trabalhar com sries de tempo no Captulo 10.
A Tabela 1.3 contm um conjunto de dados de sries de tempo, obtido de um artigo de Castillo-
Freeman e Freeman (1992), sobre os efeitos do salrio mnimo em Porto Rico. O ano mais antigo no
conjunto de dados a primeira observao, e o ano mais recente disponvel a ltima observao.
Quando os mtodos economtricos so utilizados para analisar dados de sries de tempo, os dados
devem ser armazenados em ordem cronolgica.
Tabela 1.3
Salrio Mnimo, Desemprego e Dados Relacionados para Porto Rico
. . . . . .
. . . . . .
. . . . . .
A varivel minmed se refere ao salrio mnimo mdio no ano, cobmed a taxa de cobertura mdia
(o percentual de trabalhadores cobertos pela lei de salrio mnimo), desemp a taxa de desemprego e
pnb o produto nacional bruto. Usaremos esses dados mais adiante em uma anlise de sries de tempo
do efeito do salrio mnimo sobre o emprego.
Tabela 1.4
Cortes-Transversais Agrupados: Dois Anos de Preos de Moradias
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
A caracterstica essencial dos dados de painel que os distingue dos dados de corte transversal
agrupado o fato de que as mesmas unidades do corte transversal (indivduos, empresas ou municpios
nos exemplos anteriores) so acompanhadas ao longo de um determinado perodo. Os dados na Tabela
1.4 no so considerados um conjunto de dados de painel porque as residncias vendidas so provavel-
mente diferentes em 1993 e 1995; se houver quaisquer repeties, o nmero provavelmente bem
pequeno para ser significante. Em contraste, a Tabela 1.5 contm um conjunto de dados de painel de
dois anos sobre o crime e as estatsticas relacionadas para 150 cidades nos Estados Unidos.
H vrias caractersticas interessantes na Tabela 1.5. Primeiro, a cada cidade foi dado um nme-
ro de 1 a 150. Qual cidade decidimos chamar de cidade 1, cidade 2, e assim por diante, irrelevante.
Assim como em um corte transversal puro, a ordenao no corte transversal de um conjunto de dados
de painel no importante. Poderamos usar o nome da cidade em lugar de um nmero, mas freqen-
temente til ter ambos.
Tabela 1.5
Conjunto de Dados de Painel sobre Estatsticas de Crime nas Cidades para Dois Anos
. . . . . . .
. . . . . . .
. . . . . . .
Um segundo ponto que os dois anos dos dados para a cidade 1 preenchem as duas primeiras
linhas ou observaes. As observaes 3 e 4 correspondem cidade 2, e assim por diante. Como cada
uma das 150 cidades tem duas linhas de dados, qualquer pacote economtrico ver isso como 300
observaes. Esse conjunto de dados pode ser tratado como um corte transversal agrupado, em que as
mesmas cidades aparecem em cada ano. Porm, como veremos nos Captulos 13 e 14, podemos tam-
bm usar a estrutura de painel para responder a questes que no podem ser respondidas simplesmen-
te vendo isso como um corte transversal agrupado.
Ao organizar as observaes na Tabela 1.5, colocamos os dois anos dos dados de cada cidade um
ao lado do outro, com o primeiro ano antecedendo o segundo em todos os casos. Apenas por questes
prticas, esse o modo preferido de se ordenar conjuntos de dados de painel. Essa organizao con-
trasta com o modo pelo qual os cortes transversais agrupados so armazenados na Tabela 1.4. Em resu-
12 Introduo Econometria Editora Thomson
mo, a razo para ordenar os dados de painel como na Tabela 1.5 que precisaremos fazer transforma-
es dos dados para cada cidade nos dois anos.
Como os dados de painel requerem a repetio das mesmas unidades ao longo do tempo, os con-
juntos de dados de painel, especialmente aqueles sobre indivduos, famlias e empresas, so mais dif-
ceis de se obter que os cortes transversais agrupados. No surpreendentemente, observar as mesmas
unidades ao longo do tempo traz vrias vantagens sobre os dados de corte transversal ou mesmo sobre
os de dados de cortes transversais agrupados. O benefcio que salientaremos neste livro que ter ml-
tiplas observaes sobre as mesmas unidades nos permite controlar certas caractersticas no obser-
vveis dos indivduos, firmas etc. Como veremos, o uso de mais de uma observao pode facilitar a
inferncia causal em situaes em que inferir causalidade seria muito difcil se somente um nico
corte transversal estivesse disponvel. Uma segunda vantagem dos dados de painel que eles, fre-
qentemente, nos permitem estudar a importncia das defasagens do comportamento ou o resultado
de tomar decises. Essa informao pode ser importante, visto que se pode esperar o impacto em mui-
tas polticas pblicas somente aps algum tempo.
A maior parte dos livros para cursos de nvel superior no contm uma discusso de mtodos eco-
nomtricos para dados de painel. Entretanto, os economistas agora reconhecem que algumas questes
so difceis, se no impossveis, de serem respondidas satisfatoriamente sem dados de painel. Como
voc ver, podemos fazer considerveis progressos com anlises simples de dados de painel, um mto-
do que no muito mais difcil do que trabalhar com um conjunto de dados de corte transversal padro.