Anda di halaman 1dari 25

Generalized Propensity Score- Tratamentos

Contnuos e M
ultiplos Tratamentos

Rafael Terra
Universidade de Braslia-Unb

14 de Outubro, 2015

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 1 / 25
Multiplos Tratamentos

Usamos o arcabouco do modelo de resultados potenciais de Neyman-Rubin e


consideramos m
ultiplos tratamentos.
Suponha que tenhamos m tratamentos = 1, 2, ..., m, e seja Yi (t) o
resultado potencial do indivduo i se o indivduo recebeu o tratamento t.
Seja I (t) o indicador que informa se o indivduo recebeu o tratamento t.
(
1 se T=t
It = (1)
0 caso contrario

Cada indivduo tem m resultados potenciais (um para cada tratamento).

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 2 / 25
O Caso de multiplos tratamentos: o Efeito Medio do
Tratamento

Seja Ti o tratamento que o indivduo i realmente recebe. Para o indivduo i,


o resultado observado Yit sera dado por

m
X
Yit = Yi (t)I (Ti = t) (2)
t=1

Resultados potenciais nao observados constituem contrafactuais.


O efeito do tratamento j versus o tratamento k (j 6= k) para o indivduo i e
definido por

ET = Yi (j) Yi (k) (3)

Yi (j) e Yi (k) nao podem ser observados, logo, o Efeito do Tratamento para
i nao pode ser identificado.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 3 / 25
O Caso de multiplos tratamentos: o Efeito Medio do
Tratamento
Consideremos entao a possibilidade de estimar o ATE do tratamento j
6 k) dado por
versus o tramento k (j =

ATE = E [Yi (j)] E [Yi (k)] (4)

Se pudessemos observar todos os resultados potenciais teramos

n n
d = 1 1 X
X
ATE Yi (j) Yi (k) (5)
N N
i=1 i=1

Como ja vimos em varios momentos do curso, para calcular o ATE, so


podemos usar dados observados. Para a estimativa ser consistente, temos
que encontrar estimadores nao enviesados para os contrafactuais
E (Yi (j)|Ti = k) e E (Yi (k)|Ti = j).
Rafael Terra (Unb) Econometria do Setor P
ublico 14 de Outubro, 2015 4 / 25
O Caso de multiplos tratamentos: o Efeito Medio do
Tratamento

Um experimento randomizado garante que E (Yi (j)|Ti = k)


j k
= Eb(Yi (j)|Ti = j) = Y i e E (Yi (k)|Ti = j) = Eb(Yi (k)|Ti = k) = Y i . Para
j 6= k, o ATE em relacao aos dois tratamentos pode ser obtido por

d = Yj Yk
ATE (6)
i i

Em estudos nao randomizados, o status de tratamento provavelmente


dependera dos resultados potenciais.
Isto e, as variaveis baseline entre tratados e controles provavelmente terao
grandes diferencas.
j
Nesse caso, o estimador ingenuo em (6) sera enviesado Y i 6= E [Yi (j)|Ti = k]
k
e Y i 6= E [Yi (k)|Ti = j].

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 5 / 25
O Caso de multiplos tratamentos: Condicionando em
observaveis pelo propensity score p(x)

Variaveis baseline podem ser u


teis se pudermos supor que contem todos os
fatores relevantes para a auto-selecao ao tratamento.
Ja vimos que condicionalmente `as observaveis relevantes contidas na
pesquisa de linha de base, podemos estimar o ATTX .
Rosenbaum e Rubin (1983) demonstram que a hip otese de ignorabilidade
forte do tratamento (unconfoundedness) se aplica tambem quando
condicionamos a um vetor unidimensional que sintetiza informacoes
observaveis p(x), o propensity score.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 6 / 25
O Caso de multiplos tratamentos: Condicionando em
observaveis pelo propensity score p(x)

Mas esse caso se referia somente a um tratamento, e o propensity score era


dado por p(x) = Pr (Ti (j)|X ). A condicao de ignorabilidade forte no caso do
tratamento binario j = 1 e k = 0 decorre de

Yi (j)Ti |Pr (Ti (j)|X ) e


(7)
Yi (k)Ti |Pr (Ti (k)|X ) = 1 Pr (Ti (j)|X )

logo podemos reescrever tal condicao somente como

Yi (j), Yi (k)Ti |Pr (Ti (j)|X ) (8)

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 7 / 25
O Caso de multiplos tratamentos: Condicionando em
observaveis pelo propensity score generalizado r (t, X )
No caso de m ultiplos tratamentos Imbens (2000) define o que se
convencionou chamar de propensity score generalizado, dado por r (t, X ),
que consiste na probabilidade condicional de receber o tratamento t dadas
variaveis pre-tratamento x X ,

r (t, X ) = Pr (Ti = t|X = x) = E [I (t)|X = x] (9)

em que T denota o tramento que pode ser igual a algum tratamento


especfico t tal que T = t , e I (t) e o indicador de recebimento do
tratamento t (binario).
A hip
otese principal para a identificacao do efeito do tratamento e que a
designacao do tratamento satisfaca a hipotese de ignorabilidade fraca dadas
as covariadas pre-tratamento X , i.e.
I (t)Y (t)|X (10)

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 8 / 25
O Caso de multiplos tratamentos: A hipotese de
ignorabilidade fraca

Para tratamentos binarios, como Pr (Ti (k)|X ) = 1 Pr (Ti (j)|X )- i.e.


Pr (Ti (k)|X ) e complementar a Pr (Ti (j)|X ) -, basta condicionar em
Pr (Ti (j)|X ), que conseguimos satisfazer a hip otese de ignorabilidade forte.
A hip
otese de ignorabilidade fraca requer somente que o indicador de
tratamento em t, I (t), seja independente do resultado potencial em t, Y (t),
dado X .
Imbens mostra que se a designacao do tratamento I (t) segue a
ignorabilidade fraca dadas as covariadas pre-tratamento, entao o tratamento
e fracamente ignoravel dado o propensity score generalizado r (t, X ):

I (t)Y (t)|r (t, X ) (11)

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 9 / 25
O Caso de multiplos tratamentos: A hipotese de
ignorabilidade fraca

A hip
otese de ignorabilidade fraca e diferente da hipotese forte para
tratamentos binarios. A razao para tanto e que nao ha uma funcao r (t, X )
que, uma vez condicionada, garanta que Y (1), ..., Y (m) sejam
independentes do status de tratamento.
A razao para impor tal condicao, mais fraca, e que quando ha tres ou mais
tratamentos, nao ha func
oes que refletem ao mesmo tempo a probabilidade
de que um dado tratamento seja selecionado e que tambem seja
independente de todos os resultados potenciais.
Funcoes como aquelas propostas pelos metodos Multinomial Probit ou
Probit Ordenado se baseiam na hip otese de independencia de alternativas
adicionais.
Nesse tipo de problema, r (j, X ) 6= (1 r (k, X )).

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 10 / 25
O Caso de multiplos tratamentos: procedimentos para o
calculo do Efeito do Tratamento

Seja (t, r ) o resultado esperado de um indivduo sob tratamento t dado o


propensity score generalizado r (t, X ) = r . Se o tratamento designado e
fracamente ignoravel dadas as covariadas X para todo t T , temos que:

(t, r ) = E [Y (t)|r (t, X ) = r ] = E [Y |T = t, r (T , X ) = r ] (12)

Esse resultado pode ser obtido na amostra usando o valor predito da


regressao de Y sobre r (T , X ).
O valor esperado dos resultados potenciais de indivduos sob um tratamento
t e

E [Y (t)] = E [(t, r (t, X ))] (13)

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 11 / 25
O Caso de multiplos tratamentos: procedimentos para o
calculo do Efeito do Tratamento

A esperanca no lado direito e tomada com relacao a distribuicao de r (t, X ).


Isto e, para cada valor de t, calcula-se a media de (t, r (t, X )) para toda a
distribuicao de r (t, X ).
O propensity score, r (t, X ) pode ser estimado por um modelo Logit
Multinomial, Logit Aninhado (Nested) ou Logit Ordenado, de acordo com as
caractersticas dos valores do tratamento.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 12 / 25
O Caso de multiplos tratamentos: procedimentos para o
calculo do Efeito do Tratamento

Sejam, entao, Ti o tratamento recebido pelo indivduo i, Yit o resultado


observado para o indivduo i recebendo tratamento Ti = t, e r (t, Xi ) o
propensity score generalizado estimado para o indivduo i com covariadas Xi
e tratamento Ti = t. Seja n o tamanho da amostra para todos os grupos, e
nt o tamanho do grupo de tratamento t.
Para calcular o efeito do tratamento seguimos os seguintes passos:
1 Estimamos r (t, X ) por um modelo logit multinomial. A categoria de
0
comparacao sera t = 1. Fazendo o Logit como funcao linear de t1 X
temos

0
logit(r (t, X )) = t0 + t1 X
em que
  (14)
P(T = t|X )
logit(r (t, X )) = ln
P(T = 1|X )

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 13 / 25
O Caso de multiplos tratamentos: procedimentos para o
calculo do Efeito do Tratamento

2 Para m tratamentos, havera m propensity scores generalizados para


cada indivduo i:
r (1, Xi ) = Pr (T = 1|Xi )
r (2, Xi ) = Pr (T = 2|Xi )
..
. (15)
r (m, Xi ) = Pr (T = m|Xi )
em que
r (1, Xi ) + r (2, Xi ) + + r (m, Xi ) = 1

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 14 / 25
O Caso de multiplos tratamentos: procedimentos para o
calculo do Efeito do Tratamento

3 Com um conjunto de m propensity scores estimados para cada


indivduo i, podemos proceder com o calculo de (t,
b r (t, X )). Para
isso, estimamos m equacoes, uma para cada tratamento.

E (Yi |Ti = t, r (t, Xi )) =


bt +
bt g (r (t, Xi ))
em que
  (16)
P(T = t|X )
g (r (t, Xi )) = ln
P(T = 1|X )

4 b r (t, X )) = Eb(Yi |Ti = t, r (t, Xi )) para


Com isso, estimamos um (t,
cada tratamento t.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 15 / 25
O Caso de multiplos tratamentos: procedimentos para o
calculo do Efeito do Tratamento

4 Em seguida, estimamos o resultado esperado para cada tratamento

n
1Xb
EbY (t) = (t, r (t, Xi )) (17)
n
i=1

5 Finalmente, estimamos o ATE para dois tratamentos j e k (em que


j 6= k) pela seguinte expressao

d jk = Eb[Y (j)] Eb[Y (k)]


ATE (18)

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 16 / 25
O Caso de tratamentos contnuos

Para estimar o efeito do tratamento para tratamentos contnuos o


procedimento e bastante parecido com o descrito anteriormente.
Primeiro, consideremos um tratamento contnuo Ti .
Deve valer a hip
otese de ignorabilidade fraca

Y (t)1{T = t}|r (t, X ) t (19)

O tratamento contnuo Ti e tal que


0
Ti |Xi N (0 + 1 Xi , 2 ) (20)

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 17 / 25
O Caso de tratamentos contnuos

Podemos estimar (20) por maxima verossimilhanca, assumindo uma


distribuicao normal e usando o logaritmo da variavel de tratamento T ,

lnTi = Xi + i (21)

Ap
os estimar b obtemos

h(,
b Xi ) = lnT
di = Xi b (22)

Com a estimativa de h(,


b Xi )
 2 
1 1 
rbi = exp 2 lnTi h(, Xi )
b (23)
2
2b 2

b2 sao obtidos em (22).


em que b e

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 18 / 25
O Caso de tratamentos contnuos

Com a estimativa de rbi , estimamos por OLS a seguinte especificacao

E [Yi |Ti , rbi ] = 0 + 1 lnTi + 2 lnTi2 + 3 rbi + 4 rbi2 + 5 lnTi rbi (24)

A estimacao de (24) nos da


b1 , ...,
b5 .
Para chegar `a funcao dose-resposta, precisamos antes avaliar (24) em
Ti = t, i.e. Eb[Y |Ti = t, rbi (Ti = t)].
Note que para chegar a essa estimativa basta substituir os valores de Ti para
os quais se deseja avaliar o efeito do tratamento em (23). Por exemplo, no
exemplo de Hirano e Imbens (2004), em que o tratamento e o premio na
loteria, que varia entre 1.139 e 484.79, podemos avaliar os tratamentos nos
pontos 10, 20, 30, ..., 100.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 19 / 25
O Caso de tratamentos contnuos

Com isso, chegamos a novos valores de rbi (Ti = t) avaliados em Ti = t.


Substituindo esses novos propensity scores em (24) e tambem os valores de
lnt no lugar de lnTi , podemos obter Eb[Y |Ti = t, rbi (Ti = t)].
Com esses valores identificamos um ponto da funcao dose-resposta em
que o nvel de tratamento e Ti = t

N
1 X
Eb[Y (t)] =
b0 + b2 lnt 2 +
b1 lnt + b4 rbi (t)2 +
b3 rbi (t) + b5 lntb
ri (t)
N
i=1
(25)

A funcao funcao dose-resposta e descrita por (t) = Eb[Y (t)] t .

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 20 / 25
Verificando o Balanceamento das covariadas

Para verificar o balanceamento dividimos a variavel de tratamento t em


K intervalos.
Sejam G1 , ..., GK os K intervalos de tratamento.
Para cada intervalo de tratamento Gk , avalie o propensity score r (tG50th
k
, Xi )
em um ponto representativo (mediano ou medio, ou outro percentil).

1  
rbiGk (tG50th
k
, Xi ) = exp lntG50th
k
h( ,
b Xi ) (26)
2
2b

Para cada intervalo de tratamento k agrupe os scores rbiGk (tG50th


k
, Xi ) em m
intervalos.
(1) (m)
Denote por Bk , ..., Bk os intervalos de propensity scores dentro de cada
um dos K intervalos.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 21 / 25
Verificando o Balanceamento das covariadas

(j)
Dentro de cada intervalo Bk j = 1, ..., m, calcule a media de cada
caracterstica x l (j) , e tire a diferenca em relacao a media da mesma
i(Bk )
covariada nos outros intervalos x l (j)
i(Bk )

Combine as m diferencas de medias entre os intervalos, e tire uma media


ponderada dessas diferencas usando o n
umero de observacoes como peso.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 22 / 25
Verificando o Balanceamento das covariadas

m
1 X
NB (j) {x li(B (j) ) x li(B (j) ) } (27)
N k k k
j=1

em que NB (j) e o n
umero de observac
oes no percentil j de GPS do intervalo
k
de tratamento k, N e o n oes, x l
umero total de observac (j) e a media da
i(Bk
variavel l, no intervalo de tratamento k, no percentil de GPS j, e x l (j) e a
i(Bk )
media da variavel l, nos demais intervalos de tratamento (j) no percentil
de GPS j.
A estatstica de teste t para testar o balanceamento se baseia na media
ponderada dessas diferencas.
Para cada intervalo de tratamento e cada variavel obtemos estatsticas t de
Student.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 23 / 25
Funcao Dose-resposta

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 24 / 25
Referencias

Imbens, G.W. (2000) The Role of the Propensity Score in Estimating


Dose-Response Functions. Biometrika, Vol. 87, No. 3., pp. 706-710.
Hirano, K.; Imbens, G.W. (2004) The Propensity Score with Continuous
Treatments. in Missing Data and Bayesian Methods in Practice:
Contributions by Donald Rubins Statistical Family.
Bia, M., Mattei, A. (2008) A Stata package for the estimation of the
dose-response function through adjustment for the generalized propensity
score. The Stata Journal 8, Number 3, pp. 354-373.

Rafael Terra (Unb) Econometria do Setor P


ublico 14 de Outubro, 2015 25 / 25

Anda mungkin juga menyukai