Anda di halaman 1dari 47

Regress

ao com Descontinuidade - RDD

Rafael Terra
Universidade de Braslia-Unb

08 de Novembro, 2015

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 1 / 47
Introducao: Desenhos Sharp e Fuzzy

Considere Yi (0) e Yi (1) os resultados potenciais de uma unidade i: Yi (0) e


o resultado potencial se o indivduo nao tivesse sido exposto ao tratamento,
Yi (1) e o resultado potencial se o indivduo tivesse sido exposto.
Nos interessa a diferenca ETi = Yi (1) Yi (0), mas nao e possvel observar
Yi (1) e Yi (0) ao mesmo tempo.
Para lidar com esse problema de nao observar o contrafactual, podemos
randomizar a designacao do tratamento e focar na estimacao do Efeito
Medio do Tratamento (ATE).
Seja Wi [0, 1] a variavel de tratamento, com Wi = 0 representando a
ausencia do tratamento, e Wi = 1 a presenca de tratamento.
O resultado observado sera igual ao seu potencial de acordo com a seguinte
regra:

Yi = (1 Wi ) Yi (0) + Wi Yi (1) (1)

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 2 / 47
Introducao: Desenhos Sharp e Fuzzy

Podemos observar tambem um vetor de covariadas pre-tratamento (Xi , Zi ),


em que Xi e um escalar e Zi e um vetor de dimensao 1 M.
Xi desempenha um papel especial no desenho RDD.
Para cada indivduo i observamos a quadrupla (Yi , Wi , Xi , Zi ).
A designacao do tratamento e determinada pelo valor de Xi , denominada
forcing variable.
Sao tratados os indivduos com valores de Xi situados em um dos lados de
um threshold fixo. Para simplificar, vamos supor que um indduo e tratado
se Xi c, em que c e o threshold.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 3 / 47
Introducao: Desenhos Sharp e Fuzzy

Xi pode ou nao ser correlacionado com os resultados potenciais Yi (Wi ), mas


essa associacao e suave (contnua).
Qualquer descontinuidade na distribuicao do resultado Yi ao redor desse
threshold e interpretada como evidencia de um efeito causal do tratamento.
Essa descontinuidade costuma surgir de decis
oes administrativas (e.g. leis,
normas, etc).

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 4 / 47
Sharp RDD

No desenho do tipo Sharp (SRD), a designacao do tratamento determinada


por Xi (forcing variable) segue a seguinte regra:

Wi = 1{Xi c} (2)

Isto e, todas as unidades com um valor de Xi maior ou igual a c sao


designados para o grupo de tratamento, e aqueles com valor menor ou igual
a c sao designados para o grupo de controle.
O valor medio do tratamento e dado por:

lim E [Yi |Xi = x] lim E [Yi |Xi = x] (3)


xc xc

Esse efeito pode ser interpretado como o efeito causal medio no ponto de
descontinuidade
SRD = E [Yi (1) Yi (0)|Xi = c] (4)

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 5 / 47
Sharp RDD

As figuras 1 e 2 plotam a probabilidade condicional de receber o tratamento


Pr (W = 1|X = x) contra a covariada x.
Na figura 1, em x = 6 a probabilidade salta de 0 para 1.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 6 / 47
Designacao de probabilidades e resultados potenciais no
caso Sharp Regression Discontinuity Design

Designacao de probabilidades e resultados potenciais

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 7 / 47
Designacao de probabilidades e resultados potenciais no
caso Sharp Regression Discontinuity Design

Na figura 2, as linhas contnuas sao as esperancas condicionais dos


resultados potenciais dada a covariada w (x) = E [Y (w )|X = x] para
w = 0, 1.
o podemos estimar 0 para x < c e 1 para x c.
S
A esperanca condicional dos resultados observados e representada pela linha
s
olida e e dada por

E [Y |X = x] =E [Y |W = 0, X = x] Pr (W = 0|X = x)
(5)
+ E [Y |W = 1, X = x] Pr (W = 1|X = x)

Na figura 2, a linha s
olida (esperanca condicional do resultado observado)
apresenta um salto em x = c = 6.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 8 / 47
Unconfoundedness no caso Sharp Regression Discontinuity
Design

No desenho SRD, a hip


otese de unconfoundedness ainda vale

Yi (0), Yi (1)Wi |Xi (6)

No entanto, essa hipotese nao pode ser explorada diretamente, por falta de
sobreposicao, i.e.

0 < Pr (Wi = 1|X = x) < 1 (7)

para todos os valores de x a probabilidade de tratamento e 0 ou 1 (ao inves


de entre 0 e 1).
Para evitar uma extrapolacao nao trivial focamos no caso do efeito medio do
tratamento em X = c dado por (4).

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 9 / 47
Hipoteses no caso Sharp Regression Discontinuity Design

Por definicao nao ha unidades com Xi = c para as quais observamos Yi (0).


Mas observamos unidades com valores arbitrariamente proximos de c.
Para justificar o calculo do efeito medio ao redor de x = c precisamos da
hip
otese :
1

E [Y (0)|X = c] e E [Y (1)|X = x] sao contnuas em x. (8)

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 10 / 47
Hipoteses no caso Sharp Regression Discontinuity Design

Podemos generalizar ainda mais essa hip


otese
2

FY (0)|X (y |x) e FY (1)|X (y |x) sao contnuas em x para todo y. (9)

S
o precisamos requerer continuidade em x = c.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 11 / 47
Hipoteses no caso Sharp Regression Discontinuity Design

Sob quaisquer hip


oteses, o valor do contrafactual esperado se nao houvesse
tratamento no ponto c e igual ao limite pela esquerda do valor esperado de
y observado condicional em x, i.e.

E [Y (0)|X = c] = lim E [Y (0)|X = x] = lim E [Y (0)|W = 0, X = x] =


xc xc
(10)
lim E [Y |X = x]
xc

De forma similar
E [Y (1)|X = c] = lim E [Y (1)|X = x] = lim E [Y (1)|W = 1, X = x] =
xc xc
(11)
lim E [Y |X = x]
xc

Portanto, o efeito medio do tratamento em c satisfaz

SRD = lim E [Yi |Xi = x] lim E [Yi |Xi = x] (12)


xc xc

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 12 / 47
Fuzzy RDD

A probabilidade de receber o tratamento nao precisa mudar de 0 para 1 no


threshold c.
O desenho do tipo Fuzzy permite um salto menor na probabilidade de
designacao de tratamento no threshold:

lim Pr [Wi = 1|Xi = x] 6= lim Pr [Wi = 1|Xi = x] (13)


xc xc

Essa situacao pode ocorrer quando em determinado threshold ha uma


mudanca descontnua nos incentivos para participar de um programa, sem
que esses incentivos sejam fortes o suficiente para mover todas as unidades
da situacao de nao-participantes para participantes.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 13 / 47
Fuzzy RDD

A razao entre o salto observado nos resultados em torno do threshold e o


salto observado na probabilidade de participacao no programa consiste no
Efeito Causal Medio.
limxc E [Yi |Xi = x] limxc E [Yi |Xi = x]
FRD = (14)
limxc E [Wi |Xi = x] limxc E [Wi |Xi = x]

Note a similaridade com o estimador de variaveis instrumentais.


Se a regra de tratamento determina que sejam tratados indivduos com
xi c e nao tratados indivduos com xi < c, no caso do desenho FRD, deve
ser possvel desrespeitar o threshold em alguma medida.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 14 / 47
Hipoteses adicionais no caso Fuzzy Regression
Discontinuity Design

Wi (c) e nao-crescente em x em x =c (15)

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 15 / 47
Hipoteses adicionais no caso Fuzzy Regression
Discontinuity Design

Vamos definir o status de compliance.


Um complier e uma unidade tal que

lim Wi (x) = 0 e lim Wi (x) = 1 (16)


xXi xXi

Compliers sao unidades que seriam tratadas se o cut-off estivesse em Xi ou


abaixo, mas nao seriam tratadas se o cut-off estivesse acima de Xi .
Compliers sao aqueles que participariam do programa se encorajados, mas
nao participariam se nao fossem encorajados.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 16 / 47
Hipoteses adicionais no caso Fuzzy Regression
Discontinuity Design

Nevertakers sao unidades que satisfazem

lim Wi (x) = 0 e lim Wi (x) = 0 (17)


xXi xXi

Isto e, sao aqueles que nao seriam tratados se o cut-off estivesse em Xi ou


acima, e tambem nao seriam tratados se estivesse em Xi ou abaixo.
Always-takers sao unidades que recebem o tratamento se o cut-off estivesse
em Xi ou acima, e tambem seriam tratados se estivesse em Xi ou abaixo.

lim Wi (x) = 1 e lim Wi (x) = 1 (18)


xXi xXi

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 17 / 47
Hipoteses adicionais no caso Fuzzy Regression
Discontinuity Design

limxc E [Y |X = x] limxc E [Y |X = x]
FRD =
limxc E [W |X = x] limxc E [W |X = x] (19)
= E [Yi (1) Yi (0)|complier, Xi = c]

O efeito estimado e uma media do efeito do tratamento entre compliers com


Xi = c.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 18 / 47
Designacao de probabilidades e resultados potenciais no
caso Fuzzy Regression Discontinuity Design

Na figura 3 podemos ver que a probabilidade de receber o tratamento nao e


0 ou 1, i.e. o cut-off e manipulavel. A probabilidade ainda pula no ponto
x = 6, mas para um valor entre 0 e 1.
Na figura 4 vemos a esperanca dos resultados potenciais dada a covariada X
e o tratamento, E [Y (w )|W = w , X = x], representadas pelas linhas
tracejadas, e a esperanca condicional do resultado observado dada a
covariada, representada pela linha s
olida.

limxc E [Y |X = x] limxc E [Y |X = x]
FRD =
limxc E [W |X = x] limxc E [W |X = x] (20)
= E [Yi (1) Yi (0)|complier, Xi = c]

A linha tracejada nao precisa coincidir com a linha cheia, pois a


probabilidade nao e 0 ou 1, mas um valor intermediario, que determina
resultados esperados diferentes dos resultados potenciais.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 19 / 47
Designacao de probabilidades e resultados potenciais no
caso Fuzzy Regression Discontinuity Design

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 20 / 47
Unconfoundedness no caso Fuzzy Regression Discontinuity
Design

A hip
otese de unconfoundedness assume que as diferencas em Y entre
tratados e controles com X = c podem ser interpretadas como efeitos
causais medios.
Portanto, dado

Y (0), Y (1)W |X (21)

poderamos estimar

E [Y (1) Y (0)|X = x] = E [Y |W = 1, X = c] E [Y |W = 0, X = c] (22)

Essa hip
otese nao permite explorar o salto na probabilidade de designacao
do tratamento no ponto de descontinuidade.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 21 / 47
Unconfoundedness no caso Fuzzy Regression Discontinuity
Design

Para o Fuzzy Regression Discontinuity Design, se X = c e W = 1, temos


um grupo de compliers e always-takers, e se X = c e W = 0 temos um
grupo de never-takers.
Portanto, o FRD implica que comparar tratados e controles em Xi = c e a
abordagem incorreta.
A hipotese de unconfoundedness se baseia na comparabilidade das unidades
com valores similares das covariadas... Essa hip
otese nao e atrativa no
cenario com descontinudade na probabilidade de receber o tratamento.
Unidades com valores similares da forcing variable, mas com status
diferentes de tratamento devem ser diferentes em algum aspecto importante
relacionado `a disposicao `a receber o tratamento.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 22 / 47
Validade Externa

Os desenhos SRD e FRD, na melhor das hip oteses, proveem uma estimativa
do efeito medio para uma subpopulacao, marcadamente aquela com
covariada igual a Xi = c.
O desenho FRD restringe ainda mais a analise, pois s
o e valido para a
subpopulacao de compliers.
Sem fortes hip
oteses para justificar a extrapolacao para outras
subpopulac
oes (e.g. homogeneidade do efeito do tratamento), os desenhos
nunca permitirao ao pesquisador estimar o efeito medio total do tratamento.
A vantagem dos desenhos do tipo RDD comparativamente `a outros metodos
nao experimentais e que aqueles tem maior validade interna. Por outro lado,
tem menor validade externa.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 23 / 47
Analise Grafica

A analise grafica e uma parte integral da analise por RDD.


De acordo com o RDD, o efeito do tratamento pode ser recuperado pelo
valor da descontinuidade do valor esperado do resultado (Yb ) em um
threshold especfico.
Para avaliar a validade dessa estrategia e importante analisar dois graficos
adicionais para as covariadas e a densidade da forcing variable.
Para visualizar essa descontinuidade no valor de Yb podemos adicionar uma
linha de regressao (linear, polinomial,etc) de cada lado do threshold.
O primeiro grafico de interesse se baseia no valor medio do resultado para
diferentes valores da forcing variable.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 24 / 47
Analise Grafica

Para algum binwidth (largura do bin) h, e para um n umero especfico de


bins K0 e K1 para a esquerada e para a direita do cutoff, respectivamente,
construa bins [bk , bk+1 ] para k = 1, ..., K = K0 + K1 , em que

bk = c (K0 k + 1) h (23)

i.e., o valor bk e dado pela diferenca entre o cut-off e a distancia mais `a


esquerda (K0 h) mais a amplitude ate o bin especfico k, dada por
(k + 1) h.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 25 / 47
Analise Grafica

O n
umero de observac
oes em cada bin e dado por:
N
X
Nk = 1{bk < Xi bk+1 } (24)
i=1

e o resultado medio no bin e dado por


N
1 X
Yk = Yi 1{bk < Xi bk+1 } (25)
Nk
i=1

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 26 / 47
Analise Grafica

O primeiro grafico de interesse e aquele que plota Y k para k = 1, ..., K


contra os pontos medios de cada bin bk +b 2
k+1
.
Queremos ver se em volta do threshold c ha evidencia de descontinuidade
(e.g. um salto). A metodologia de estimacao descrita abaixo e apenas uma
versao sofisticada desse metodo. Se nao observarmos descontinuidade nesse
grafico, muito provavelmente nao acharemos descontinuidade usando os
demais metodos.
importante nao calcular medias suavizadas no ponto c. Portanto, o
E
tamanho do bin e fundamental aqui.
Bins muito estreitos atrapalham a vizualizacao da relacao entre a forcing
variable e a variavel de resultado Y , i.e. o rudo dificulta a identificacao
do sinal. Bins mais largos permitem visualizacao do salto em torno do
cut-off. Mas se forem muito largos, nao poderemos visualizar o salto.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 27 / 47
Analise Grafica: Graficos suavizados usando varias larguras
de bins

Graficos suavizados por bins

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 28 / 47
Analise Grafica: Graficos suavizados para covariadas

No segundo grafico devemos calcular medias para outras covariadas Zim do


modelo para os k bins. Seja entao a m-esima covariada em Z :
N
1 X
Z km = Zim 1{bk < Xi bk+1 } (26)
Nk
i=1

Plotamos Z km para k = 1, ..., K contra os pontos medios de cada bin.


No caso do FRD tambem vale a pena plotar o valor medio de W em cada
bin, para verificar se de fato ha um salto em torno de c.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 29 / 47
Analise Grafica: A densidade da forcing variable

Para verificar se nao ha uma descontinuidade na pr


opria forcing variable X ,
podemos plotar o n umero de observacoes em cada bin.
Se houver um salto nessa variavel e sinal de que o valor de X e
manipulavel, o que invalida o desenho.
Um exemplo nesse sentido e a manipulacao do ndice de pobreza usado
como criterio de elegibilidade para programas sociais na Colombia (ver
Camacho e Conover, 2010).
O algoritmo para criar o ndice de pobreza se tornou p
ublico no segundo
semestre de 1997.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 30 / 47
Analise Grafica: A densidade da forcing variable

Densidade do Indice de Pobreza na Col


ombia
Rafael Terra (Unb) Econometria do Setor P
ublico 08 de Novembro, 2015 31 / 47
Analise Grafica: A densidade da forcing variable

Existe um teste, proposto por Justin McCrary (2008) que compara as


densidades da forcing variable limxc f (X |X = x) limxc f (X |X = x)
`a direita e a esquerda do cutoff. Se essa diferenca for estatisticamente
significante, entao temos evidencia de manipulacao do cutoff.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 32 / 47
Regressao Linear Local

Ao inves de fazer a analise grafica identificando saltos nos valores medios


dos bins em torno do cut-off c, ajustamos retas de regressoes `as observacoes
`a esquerda e `a direita do cut-off c, dentro de uma distancia maxima igual a
h (nesse caso h e a largura da banda e nao a largura do bin).

X
min (Yi l l (Xi c))2
l ,l
i:ch<Xi <c

e (27)
X
min (Yi r r (Xi c))2
r ,r
i:cXi <c+h

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 33 / 47
Regressao Linear Local: SRD

O valor de interesse no ponto c do lado esquerdo


bl (c) sera dado por:

bl + bl (c c) =
bl (c) = bl (28)

O valor do lado direito


br (c) e dado por

br + br (c c) =
br (c) = br (29)

O efeito medio do tratamento em um desenho do tipo SRD sera dado por

br
SRD = bl (30)

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 34 / 47
Regressao Linear Local: SRD

Pode-se estimar o efeito medio do tratamento diretamente em uma u


nica
regressao estimando:
N
X
min 1{c h Xi c + h}
,,,
i=1
(31)
2
(Yi (Xi c) Wi (Xi c) Wi )

em que o efeito do tratamento e dado por = SRD .


Poderamos impor uma restricao de que as inclinac
oes fossem as mesmas de
um lado e outro do cut-off. Mas isso faria com que as observacoes do lado
direito do cut-off afetassem o valor estimado E [Y (0)|X = c] e as
observac
oes do lado direito afetassem E [Y (1)|X = c].

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 35 / 47
Regressao Linear Local: SRD

Poderamos ponderar as observac oes nessa regressao por funcoes kernel


decrescentes quanto mais distantes as observac oes estao de c (ver slides da
i c)
aula PS Matching ) PNKh (X
K (X c)
.
i=1 h i

Mas a unica vantagem em usar esses pesos mais sofisticados que o peso
retangular constante (Kh = 12 u) e quando nao sabemos qual e a melhor
largura de banda e os resultados sao muito sensveis `a escolha da largura h
da banda .

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 36 / 47
Regressao Linear Local: SRD - Introduzindo covariadas

Podemos introduzir covariadas Zi na Regressao Linear Local. Essas


covariadas podem eliminar o vies de pequenas amostras presente na
especificacao basica e melhorar a precisao das estimativas.
N
X
min 1{c h Xi c + h} (Yi (Xi c) Wi
,,,,
i=1 (32)
0
2
(Xi c) Wi Zi,m )

Elas podem ser u


teis tambem para verificar a plausibilidade das estimativas,
por exemplo, estimando
N
X
min 1{c h Xi c + h} (Zim 0 1 (Xi c) 2 Wi
0 ,1 ,2 ,3
i=1
3 (Xi c) Wi )2
(33)

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 37 / 47
Regressao Linear Local: FRD

Precisamos estimar a razao entre duas diferencas.


Vamos usar Regressao Linear Local em ambos os lados do cut-off
X
(b
yl , byl ) = arg min (Yi yl yl (Xi c))2
yl ,yl
i:chXi <c

e (34)
X
2
(b
yr , byr ) = arg min (Yi yr yr (Xi c))
yr ,yr
i:cXi c+h

byr
com isso obtemos by = byl .

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 38 / 47
Regressao Linear Local: FRD

Em seguida estimamos:
X
(b
wl , bwl ) = arg min (Wi wl wl (Xi c))2
wl ,wl
i:chXi <c

e (35)
X
2
(b
wr , bwr ) = arg min (Wi wr wr (Xi c))
wr ,wr
i:cXi c+h

bwr
com isso obtemos bw = bwl .
O efeito do tratamento e dado por

by byr
byl
bFRD = = (36)
bw bwr
bwl

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 39 / 47
Regressao Linear Local: FRD

Podemos usar diferentes tamanhos de h para (34) e (36), mas vamos supor
que h e igual em ambos os casos. Esse problema pode ser escrito como um
problema de Mnimos Quadrados em Dois Estagios (Variaveis
Instrumentais). Defina:

1 yl
Vi = 1{Xi < c} (Xi c) e = yl
1{Xi c} (Xi c) yr
Podemos entao escrever

0
Yi = Vi + Wi + i (37)

ogena Wi por 1{Xi c} e Vi e o conjunto


Instrumentalizamos a variavel end
de variaveis ex
ogenas (que servem como seus pr
oprios instrumentos). Com
isso estimamos b = bFRD .

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 40 / 47
Escolha da amplitude da banda (bandwith): SRD

Para escolher o tamanho


otimo h da banda em torno do cut-off usaremos
um procedimento chamado cross-validation.
Podemos escolher a bandwidth que minimiza conjuntamente o erro
quadratico medio em ambos os lados da regressao.
O procedimento para escolha de hj consiste nos seguintes passos:
1 Secione uma banda de amplitude h1 .
2 Comece com uma observacao A `a esquerda do cut-off, com valor de
XA e um resultado YA .
3 Para ver quao bem a reta ajusta os dados observados dentro da banda
de tamanho h1 , estime uma regressao usando todas as observacoes
localizadas `a esquerda de A ate um ponto com distancia no maximo
h1 . Obtenha o valor predito YbA .
4 Mova a banda para o pr oximo ponto `a esquerda de A, o ponto B, e
ajuste uma reta que minimize os erros. Obtenha o valor predito YbB .
Faca isso para todas as observacoes `a esquerda do ponto de corte que
se encontram dentro da banda de tamanho h1 .

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 41 / 47
Escolha da amplitude da banda (bandwith): SRD

5 Repita esse processo e obtenha os valores preditos de Y `a direita do


cut-off.
6 Calcule o criterio de cross-validation- nesse caso, o erro quadratico
medio- para a banda h1 em torno do cut-off seguindo a seguinte
f
ormula
N N
1 1 X 2 1 1 X 2+
CV (c, hj ) = (Yi Ybi ) + (Yi Ybi ) (38)
2 N 2 N
i=1 i=1

7 Repita os passos anteriores para bandwidth h2 , h3 , ....


8 Escolha h(j) que minimiza o criterio de cross-validation, i.e. escolha o
bin que produz o menor erro quadratico medio.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 42 / 47
Analise Grafica: Cross-Validation

Procedimento de Cross-validation
Rafael Terra (Unb) Econometria do Setor P
ublico 08 de Novembro, 2015 43 / 47
Escolha da amplitude da banda (bandwith): FRD

Podemos usar o mesmo bandwidth para o numerador e para o denominador.


Mas como para cada uma das regress oes (para Y e W ) podemos ter uma
banda diferente, uma alternativa e escolher a menor dentre elas.

CV (c, hj ) = min(arg min CVY (h), arg min CVW (h)) (39)
h h

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 44 / 47
Variancia

A variancia assint
otica e dada por

1 y2 y
Avar(b
) = 2
V y
+ 4
Vw 2 3 CY ,W (40)
w w w

em que Vk = fX 4(c) (kr


2 2
+ kl ) , e k = {Y , W }. CY ,W e a covariancia
entre Y e W .
Se usarmos o estimador de Mnimos Quadrados em Dois Estagios, o
estimador da variancia sera dado pelo estimador robusto da variancia.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 45 / 47
Checklist da implantacao de RD - ver Lee e Lemieux

1 Para checar se houve manipulacao, mostre a distribuicao da variavel X.


2 Apresente os principais graficos de RD usando medias locais.
3 Caso use uma especificacao polinomial, faca o grafico.
4 Mostre sensibilidade dos resultados a diversas escolhas de h (bandwidth) on
ordem do polinomio escolhido.
5 Conduza um RD em paralelo para as covariadas.
6 Mostre a sensibilidade dos resultados em relacao a introducao de variaveis
controle.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 46 / 47
Referencias

Jacob; R.,Zhu, P.; Somers, M.A.; Bloom, H. (2008). A Practical Guide to


Regression Discontinuity. MDRC.
Imbens, G.W., Lemieux, T., (2007). Regression discontinuity designs: A
guide to practice, Journal of Econometrics, in press,
doi:10.1016/j.jeconom.2007.05.001.

Rafael Terra (Unb) Econometria do Setor P


ublico 08 de Novembro, 2015 47 / 47

Anda mungkin juga menyukai