Anda di halaman 1dari 16

Escuela de Posgrado

Maestra en Economa

Seminario de Investigacin Econmica

Taller de STATA 2017-2


Csar Mora

Sesin 4: Pruebas de hiptesis y regresin lineal


Sesin 4 con dofile:
Se abordarn los siguientes temas:

1. Pruebas de hiptesis
2. Clculo de tamao de muestra (sample size)
3. Regresin lineal (MCO)
Pruebas de hiptesis
Correlaciones
Comandos corr y pwcorr: el primero no considera missing values, mientras que el segundo s

corr gasto_anual_hogar miembros_hogar

pwcorr hogar_pobre gasto_anual_hogar miembros_hogar, star(.05)

Aade indicadores de significancia (*)

Significancia 5%
Pruebas de hiptesis variables continuas
Con estadstico t-student: comando ttest
Tener en cuenta:
ttest gasto_anual_hogar=1000
- Hiptesis nula (H0): la media de la variable es igual a cero
ttest gasto_anual_hogar=23644
- Hiptesis alternativa (Ha): la media de la variable es diferente de cero

Rechaza H0 de que gasto=1000

No se rechaza la H0
(gasto=23644)
Pruebas de hiptesis variables continuas
Comparacin de medias entre dos grupos:

ttest ingreso_anual_hogar, by(urbano)

Variable que identifica los grupos a comparar

Claramente las medias de ingreso entre


mbitos urbanos y rurales son distintas

Rechaza H0
Pruebas de hiptesis variables continuas
Poder de prueba: mientras ms cercano a 1, hay mayor poder
sampsi 15703.68 38066.27, sd1(16484.88) sd2(36615.23) alpha(0.01) n1(12592) n2(19596)

Medias de los grupos Sd de los grupos Significancia Tamao de cada grupo

Poder de la prueba de medias


Pruebas de hiptesis variables discretas
Prueba de medias con estadstico Z: comando prtest
Prueba con chi cuadrado de Pearson
prtest hogar_pobre, by(urbano)
tab hogar_pobre urbano, chi2

Rechaza H0 Rechaza H0

Tambin se pueden aplicar pruebas de potencia, como en el caso anterior


Clculo de tamao de muestra
Este procedimiento se lleva a cabo para calcular el tamao de muestra de dos grupos de comparacin para poder detectar
diferencias en sus medias, por ejemplo cuando queremos implementar una evaluacin.

Es necesario conocer previamente las medias de la variable de inters en cada uno de los grupos, as como (al menos) la
proporcin de las observaciones entre los grupos (ratio n2/n1)

sampsi 0.344 0.109, alpha(0.05) power (0.85) ratio (1)

Medias Significancia
Poder mnimo Ratio de observaciones (n1/n2)
requerido

Detalles requeridos

Clculo del tamao de muestra mnimo


Anlisis de regresin lineal
Regresin lineal
Comando regress (reg): Se presentar ejemplos de implementacin de regresiones lineales (MCO)

Prueba de hiptesis con coeficientes: ttest


regress ling edad edad2 hombre school tam2 tam3 tam4 tam5
test hombre=0
test hombre edad edad2
test edad=0.06
Var. dependiente Vars. Explicativas (X) test tam2=tam3
(Y)

Betas P-values

No rechaza H0
Regresin lineal
Anlisis de presencia de multicolinealidad: estat vif
Clculo del factor de inflacin de varianza:
Regla prctica para interpretacin:
- Si el VIF ms grande es mayor que 10 hay inflacin y hay que remover de la regresin la variable con mayor VIF.
- Si la media de los VIF es mucho mayor a 1, hay que remover de la regresin la variable con mayor VIF.

regress ling edad edad2 hombre school tam2 tam3 tam4 tam5
estat vif

Quitamos edad2, y aplicamos de nuevo la prueba

VIF elevados para edad y edad2


VIF promedio elevado.

Debemos corregir
Regresin lineal
Prediccin de variable dependiente y residuos:

reg ling edad edad2 hombre school tam2 tam3 tam4 tam5, robust

predict ling_predict Predice Y en una variable


predict residuo, resid Predice los residuos en una variable

Prueba de normalidad de los residuos

Grficamente: kdensity residuo, normal Skewness y kurtosis Test: sktest residuo

Kernel density estimate


.6
.4
Density

.2

Se rechaza la H0 de normalidad de
0

-6 -4 -2
Residuals
0 2 4 los errores
Kernel density estimate
Normal density
kernel = epanechnikov, bandwidth = 0.1243
Regresin lineal
Guardado de los coeficientes en excel: comando outreg2
reg ling edad hombre school tam2 tam3 tam4 tam5
outreg2 using "regresiones.xls", ctitle(Modelo corregido) excel dec(3)

Nombre del Nombre de la columna


archivo de excel Indica nmero de
decimales deseados

Presentacin en pantalla de tabla de coeficientes de diferentes modelos


reg ling edad edad2 hombre school tam2 tam3 tam4 tam5
estimates store mod1
reg ling edad hombre school tam2 tam3 tam4 tam5
Aplicamos cada regresin, seguida del comando:
estimates store mod2
estimates store, nombre_modelo
reg ling edad hombre school tam2 tam3 tam4 tam5,robust
estimates store mod3
reg ling edad hombre school tam2 tam3 tam4 tam5 [pw=pesoper],robust
estimates store mod4
estimates table mod1 mod2 mod3 mod4 Finalmente colocamos estimates table seguido
de los nombres de los modelos guardados
Regresin lineal
Uso del comando sw (stepwise):
La estimacin step wise realiza una anlisis previo de las variables y no considera en la regresin a aquellas cuyo coeficiente
tienen un pvalue que las hace no significativas, de acuerdo a la indicacin que consideremos.

sw reg ling edad hombre school tam2-tam5 rama2-rama11 sindic, pr(0.05) Elimina coefs con p>0.05
sw reg ling edad hombre school tam2-tam5 rama2-rama11 sindic, pe(0.01)
Conserva coefs con p<0.01

En este caso, se indic en la regresin una lista de


explicativas, pero stepwise elimin aquellos
coeficientes que tenan un pvalue mayor a 0.05
Escuela de Posgrado
Maestra en Economa

Seminario de Investigacin Econmica

Taller de STATA 2017-2


Csar Mora

Sesin 4: Pruebas de hiptesis y regresin lineal

Anda mungkin juga menyukai