Anda di halaman 1dari 21

Regresion, correlacion y causalidad

Walter Sosa Escudero

Walter Sosa Escudero

Regresion, correlacion y causalidad

Motivacion

Yi = + Di + ui
En que sentido mide el efecto que D tiene sobre Y ?
En que sentido en base a (Di , Yi ), i = 1, . . . , n estima el
efecto que D tiene sobre Y ?
Droga sobre temperatura corporal, dieta sobre peso corporal,
AUH sobre asistencia al secundario.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Causa y efecto en base a observables

D = 0, 1, causa, tratamiento. Notacion


D1 (D = 1), D0 (D = 0).
Y es un resultado.
Y |D1 = resultado observable si hubo tratamiento. Y |D0 si no
hubo tratamiento.
Resulta tentador pensar que el efecto causal es la diferencia entre
tratados y no tradados:
Y |D1 Y |D0
Ej: comparar personas que hicieron / no hicieron dieta, recibieron
o no la AUH.
Problema?

Walter Sosa Escudero

Regresion, correlacion y causalidad

Antes y despues

Por las mismar razones, tampoco funciona comparar antes y


despues
Y |D1 Y |D0
Peso antes y despues de hacer dieta.
Nuevamente, comparacion de peras y manzanas.
Ceteris paribus?

Walter Sosa Escudero

Regresion, correlacion y causalidad

Causa y efecto en base a contrafactuales

Cuestion filosofica muy delicada. Aproximacion simple.


Resultados potenciales.
Y0 si D = 0
Y1 si D = 1
independientemente de si hubo o no tratamiento.
Ej: Y1 temperatura si tomases un analgesico. Son promesas.
Y0 salario si no recibieses la AUH
Efecto causal: = Y1 Y0 (caida en la fiebre si tomases una
aspirina con respecto a que no la tomes).
Se define en terminos de diferencias entre resultados
potenciales.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Inobservabilidad de contrafactuales

Problema: en la realidad se observa Y1 o Y0 pero nunca


ambos.
D implica haber eliminado una ruta observable. Ambas rutas
potenciales existen.
El tiempo se bifurca perpetuamente hacia innumerables
futuros. En uno de ellos soy su enemigo. (J.L. Borges, en El
jardin de senderos que se bifurcan)

Walter Sosa Escudero

Regresion, correlacion y causalidad

Observables

En la practica se observa Y

Y =

Y1
Y0

si D = 1
si D = 0

O, alternativamente:
Y = Y0 + (Y1 Y0 ) D
Inobservancia de contrfactuales: Si a una persona le di una droga,
observo la temperatura de la persona habiendole dado la droga,
pero no veo a la misma persona en la circunstancia de no haberle
dado la droga. Y viceversa!

Walter Sosa Escudero

Regresion, correlacion y causalidad

Sesgo de seleccion

El problema de medir el efecto causal parece no tener solucion


(inobservabilidad de contrafactuales)
Notacion D1 (D = 1), D0 (D = 0)
Comparacion personas tratadas y no tratadas
Y | D1 Y | D0
Verbalizacion: peso de gente que hizo dieta con gente que no
hizo dieta.
Problema? (peras con manzanas)

Walter Sosa Escudero

Regresion, correlacion y causalidad


 
Y |D1 Y0 |D1 + Y0 |D1 Y |D0

 

= Y1 |D1 Y0 |D1 + Y0 |D1 Y0 |D0

Y |D1 Y |D0 =

Y |D1 Y |D0 = + S
con S Y0 |D1 Y0 |D0

S es el sesgo por seleccion.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Y |D1 Y |D0 =
Dif Observables
=

Efecto causal

+
+

S
Sesgo

Sesgo:
S Y0 |D1 Y0 |D0
Diferencia en peso potencial sin tratamiento, entre tratados y
no tratados.
En la practica? Quien hace dieta / toma analgesicos?
Con datos observacionales S 6= 0.
Sesgo: la comparacion entre tratados y no tratados estima el
efecto causal MAS el sesgo.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Aleatorizacion al rescate

Tratamiento aleatorio: D es indepediente de Y1 y Y0




Y |D1 Y |D0 = + Y0 |D1 Y0 |D0






E Y |D1 Y |D0 = + E Y0 |D1 E Y0 |D0




= + E Y0 |D1 E Y0 |D1
=




El paso clave es que bajo tratamiento aleatorio E Y0 |D1 = E Y0 |D0

Resultado: el tratamiento aletorio elimina el sesgo.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Tratamiento aleatorio?
Tratamiento aleatorio: eleccion de tratamiento sin mirar
resultados.
Experimento o cuasi experimento.
D se mueve en forma exogena (causa).
No funciona: la gente no hace dieta porque si, ni toma
aspirinas al azar sino porque inicialmente tenia fiebre.
Auge de la aproximacion experimental en medicina.
Economia?
Experimento: control de la variabilidad exogena.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Todos los que toman este remedio se recuperan rapidamente.


Excepto aquellos para los cuales el remedio no funciono, y que se.
Galeno, Siglo II.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Regresion?

Que informacion contiene Yi = + Di + ui en esta historia?

= Y0 + (Y1 Y0 )D


= E(Y0 ) + D + Y0 E(Y0 )

= + D + u

con E(Y0 ) y u Y0 E(Y0 )


Supongamos que tenemos una muestra (Yi , Di ), i = 1, . . . , n
Para que sea insesgado necesitamos E(ui |Di ) = 0.

Walter Sosa Escudero

Regresion, correlacion y causalidad



E(ui |Di ) = E Y0 E(Y0 ) | Di
= E(Y0 |Di ) E(Y0 )
= E(Y0 ) E(Y0 )
= 0,
ya que bajo aleaotorizacon E(Y0 ) = E(Y0 |Di ), de modo que en
base a datos observables es insesgado para el efecto causal.
Conclusion: Bajo aleatorizacion de tratamiento, Y = + D + u
tiene una interpretacion causal. es insesgado para los datos
observacionales (no hace falta ver los potenciales).

Walter Sosa Escudero

Regresion, correlacion y causalidad

Resumiendo

Causalidad: relacion entre contrafacuales. Uno no es


observable.
Bajo aleatorizacion de tratamiento, Y = + D + u tiene
una interpretacion causal. es insesgado.
Rol de E(u|D) = 0: D varia en forma exogena.
Relevancia del razonamiento experimental.
Cuestion muy importante en las ciencias sociales en los
ultimos tiempos.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Referencias

Angrist, J. y Pischke, J., 2014, Mastering Metrics: the Path


from Cause to Effect, Cap. 2, Princeton University Press,
Princeton.
Sosa Escudero, W., 2014, Que es (y que no es) la Estadistica,
Siglo XXI Editores, Buenos Aires. Capitulo 3: El huevo y la
gallina: causalidades y casualidades.
Borges, J.L., 1944, El jardin de senderos que se bifurcan, en
Ficciones, Sudamericana, Buenos Aires.

Walter Sosa Escudero

Regresion, correlacion y causalidad

A diferencia de Newton y de Schopenhauer, su antepasado no


creia en un tiempo uniforme, absoluto. Creia en infinitas series
de tiempos, en una red creciente y vertiginosa de tiempos
divergentes, convergentes y paralelos. Esa trama de tiempos
que se aproximan, se bifurcan, se cortan o que secularmente se
ignoran, abarca todas la posibilidades. No existimos en la
mayoria de esos tiempos; en algunos existe usted y no yo; en
otros, yo, no usted; en otros, los dos. En este, que un favorable
azar me depara, usted ha llegado a mi casa; en otro, usted, al
atravezar el jardn, me ha encontrado muerto; en otro, yo digo
estas mismas palabras, pero soy un error, un fantasma.
J.L. Borges, 1944, El jardin de senderos que se bifurcan

Walter Sosa Escudero

Regresion, correlacion y causalidad

Apendice: como diferencia de medias

Yi = + Di + ui ,

i = i, . . . , N

Notacion
T = tratados, N T = no tratados.
YT , YN T , promedios tratados y no tratados.
P
P
P
P
Di Yi ,
(1 D)Yi
T Yi
N T
Resultado: = YT YN T

Walter Sosa Escudero

Regresion, correlacion y causalidad

Prueba
Recordar
P
di Yi
= P 2 ,
di

di Di D

Denominador:
X

d2i =

2
(Di D)

2
Di2 N D

Di N T 2 /N 2

= T T 2 /N
= T (1 T /N )

Walter Sosa Escudero

Regresion, correlacion y causalidad

Numerador:
X
X
i
di Yi =
(Di D)Y
X
X

=
Di Yi D
Yi
!
=

Yi T /N

X
T

Yi +

Yi

N T

= T YT T /N T YT + (N T ) YN T

= YT T (1 T /N ) YN T T (1 T /N )


= T (1 T /N ) YT YN T
Reemplazando y simplificando se obtiene el resultado.
Ejercicio: derivar
para este caso.

Walter Sosa Escudero

Regresion, correlacion y causalidad

Anda mungkin juga menyukai