Anda di halaman 1dari 12

COMANDOS DE STATA PARA MODELOS DE REGRESIN LINEAL (junio 2012)

Arstides Torche
Supngase que se desea calcular las elasticidades precio, ingreso y poblacin de una curva de
demanda. En primer lugar es necesario preguntarse que informacin se requiere. Las variables que
habitualmente se han considerado son las siguientes: cantidad consumida (demandada), precio
del bien, precio de sustitutos y complementos, ingreso per cpita, poblacin y otras variables de
acuerdo al bien cuya demanda se desee calcular.
Un segundo punto se refiere a la ecuacin con que se relacionaran las variables. Las ms conocidas
son la lineal y la doble logartmica. En este caso se harn ambas regresiones
Para calcular el modelo lineal se emplearn las cifras que se presentan en el cuadro adjunto:
Obs aos
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Q
1264
1329
1394
1459
1527
1591
1654
1719
1788
1848
1915
1982
2044
2110
2174
2241
2303
2371
2436
2500
2565
2630
2696
2759

Pb
2201,0
2359,4
2401,2
2450,4
2506,8
2570,3
2641,0
2718,9
3436,5
3550,0
3672,9
3805,6
4265,3
5241,2
5378,0
5887,7
6054,5
7756,7
7991,8
8874,3
9673,5
10241,0
11012,9
11513,6

PSUS
2,5
2,5
2,5
2,5
2,5
2,5
2,5
2,5
3,5
3,5
3,5
3,5
3,5
3,9
3,9
3,9
3,9
4,2
4,2
5,1
5,9
6,3
7
7,2

POB
120
122
124
127
129
131
134
136
141
143
146
149
154
163
165
171
175
187
191
194
198
202
205
209

YCAP
3560
3850
4005
4165
4331
4505
4685
4872
5270
5480
5700
5928
6411
7074
7286
7730
7962
8961
9230
9507
9792
10086
10388
10700

Para calcular el modelo doble logartmico se construir la base de datos con los logaritmos de las
variables tal como se presenta en el cuadro siguiente.

LQ
3,10184853
3,12362393
3,14430034
3,1640935
3,18382668
3,20156252
3,21864385
3,23535596
3,25232182
3,26671132
3,28222941
3,29719802
3,31052861
3,32426986
3,33721506
3,35035185
3,36236028
3,37501433
3,38663789
3,39792107
3,40902207
3,41991196
3,43079904
3,44073011

LPb
3,3426209
3,37279758
3,38042577
3,38923386
3,39911902
3,40999132
3,42177162
3,43438996
3,53611355
3,55022806
3,56501315
3,58042403
3,62995167
3,71943403
3,73061985
3,76994758
3,78207578
3,88967561
3,90264418
3,94813241
3,98558573
4,0103403
4,04190242
4,06120929

LPSUS
0,39794001
0,39794001
0,39794001
0,39794001
0,39794001
0,39794001
0,39794001
0,39794001
0,54406804
0,54406804
0,54406804
0,54406804
0,54406804
0,59106461
0,59106461
0,59106461
0,59106461
0,62324929
0,62324929
0,70757018
0,77085201
0,79934055
0,84509804
0,8573325

LPOB
2,07918125
2,08692902
2,0946768
2,10242458
2,11017236
2,11792014
2,12566791
2,13341569
2,14891125
2,15665903
2,1644068
2,17215458
2,18765014
2,21089347
2,21864125
2,23413681
2,24188458
2,2728757
2,28062347
2,28878115
2,29652892
2,3042767
2,31202448
2,31977226

LYCAP
3,55145
3,58551668
3,60255002
3,61958336
3,63661669
3,65365003
3,67068337
3,68771671
3,72178339
3,73881673
3,75585007
3,77288341
3,80695009
3,84965788
3,8624951
3,88816955
3,90100677
3,95235567
3,9651929
3,97803012
3,99086735
4,00370457
4,0165418
4,02937902

Luego es conveniente familiarizarse con las caractersticas de las variables. Para ello existen varios
comandos:
list para verlas todas en conjunto.
Summarize para ver sus caractersticas estadsticas
graph para ver su comportamiento en el tiempo o en relacin con otras variables.
correlate para determina las relaciones lineales entre ellas.
El comando list entrega los valores de las variables consideradas
Nota estos comandos se aplicaran a las variables de la primera base de datos.
. list q pb psus pob ycap

1.
2.
3.

q
1264.295
1329.303
1394.121

pb
2201.004
2359.378
2401.186

psus
2.5
2.5
2.5

pob_mile
120
122.16
124.3589

ycap
3560
3850.496
4004.516

4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.

1459.128
1526.957
1590.606
1654.413
1719.317
1787.812
1848.04
1915.267
1982.431
2044.225
2109.939
2173.777
2240.536
2303.352
2371.452
2435.779
2499.891
2564.614
2629.735
2696.491
2758.863

2450.382
2506.796
2570.344
2641.02
2718.879
3436.478
3549.998
3672.934
3805.608
4265.32
5241.24
5377.988
5887.726
6054.465
7756.675
7991.792
8874.266
9673.547
10240.95
11012.92
11513.55

2.5
2.5
2.5
2.5
2.5
3.5
3.5
3.5
3.5
3.5
3.9
3.9
3.9
3.9
4.2
4.2
5.1
5.9
6.3
7
7.2

126.5973
128.8761
131.1959
133.5574
135.9614
140.9001
143.4363
146.0181
148.6465
154.0459
162.515
165.4403
171.4497
174.5358
187.4458
190.8198
194.438
197.9379
201.5008
205.1278
208.8201

4164.696
4331.284
4504.536
4684.717
4872.106
5269.669
5480.457
5699.675
5927.662
6411.359
7073.883
7286.1
7729.823
7961.718
8960.983
9229.813
9506.707
9791.908
10085.67
10388.24
10699.88

Para computar las medidas de posicin y dispersin ms usadas se emplea:


summarize q pb psus pob ycap lq lpb lpsus lpob lycap

Variable |
Obs
Mean
Std. Dev.
Min
Max
-------------+-------------------------------------------------------q |
24
2012.458
459.7719
1264
2759
pb |
24
5341.854
3078.482
2201
11513.6
psus |
24
3.875
1.449813
2.5
7.2
pob |
24
159
29.72482
120
209
ycap |
24
6728.25
2357.715
3560
10700
-------------+-------------------------------------------------------lq |
24
3.292353
.102952
3.101849
3.44073
lpb |
24
3.660569
.2451508
3.342621
4.061209
lpsus |
24
.5622838
.1498288
.39794
.8573325
lpob |
24
2.194192
.0804336
2.079181
2.319772
lycap |
24
3.801727
.1550955
3.55145
4.029379
Cuando se desea obtener mas informacin de una sola variable por ejemplo
precio (pb) se emplea el comando summmarize con el agregado detail
Summarize pb, detail
Pb
------------------------------------------------------------Percentiles
Smallest
1%
2201
2201
5%
2359.4
2359.4
10%
2401.2
2401.2
Obs
24
25%
2605.65
2450.4
Sum of Wgt.
24

50%

4035.45

75%
90%
95%
99%

Largest
9673.5
10241
11012.9
11513.6

7874.25
10241
11012.9
11513.6

Mean
Std. Dev.

5341.854
3078.482

Variance
Skewness
Kurtosis

9477051
.7345044
2.139824

Los grficos permiten ver el comportamiento intertemporal de una, dos o


tres variables a la vez. Por ejemplo, cantidad e ingreso per cpita.
Para construir el grfico es necesario en primer lugar crear una variable
tiempo.
gener tiempo = [_n]
Luego se escribe:

2000

4000

6000

8000

10000

graph twoway line q ycap tiempo

10

15

20

25

tiempo
Q

YCAP

Las correlaciones permiten determinar el grado de asociacin entre las


variables. As por ejemplo:

correlate pb psus pob ycap


(obs=24)
|
pb
psus
pob
ycap
-------------+-----------------------------------pb |
1.0000
psus |
0.9679
1.0000
pob |
0.9821
0.9304
1.0000
ycap |
0.9814
0.9301
0.9998
1.0000
Se presenta en primer trmino una regresin con las variables originales
y sus resultados son los siguientes:
regress

q pb psus pob ycap

Source |
SS
df
MS
-------------+-----------------------------Model | 4848536.55
4 1212134.14
Residual | 13437.4087
19 707.232037
-------------+-----------------------------Total | 4861973.96
23 211390.172

Number of obs =
F( 4,
19)
Prob > F
R-squared
Adj R-squared
Root MSE

24
= 1713.91
= 0.0000
= 0.9972
= 0.9967
= 26.594

-----------------------------------------------------------------------------q |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pb | -.1908073
.0159062
-12.00
0.000
-.2240993
-.1575154
psus |
152.6666
17.11665
8.92
0.000
116.841
188.4921
pob |
22.00833
10.96962
2.01
0.059
-.9513557
44.96801
ycap |
.0723776
.1345184
0.54
0.597
-.2091726
.3539279
_cons | -1546.159
832.4968
-1.86
0.079
-3288.594
196.2772

Ahora presentaremos el modelo en logaritmos

regress lq lpb lpsus lpob lycap


Source |
SS
df
MS
---------+-----------------------------Model | .243777785
4 .060944446
Residual | 1.9009e-06
19 1.0004e-07
---------+-----------------------------Total | .243779686
23 .010599117

Number of obs
F( 4,
19)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

24
.
0.0000
1.0000
1.0000
.00032

-----------------------------------------------------------------------------lq |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
---------+-------------------------------------------------------------------lpb | -.8032228
.0059815
-134.284
0.000
-.8157422
-.7907033
lpsus |
.3012374
.0022254
135.362
0.000
.2965795
.3058952
lpob |
1.004204
.0261102
38.460
0.000
.9495549
1.058853
lycap |
1.121931
.0072423
154.915
0.000
1.106773
1.137089
_cons | -.4054682
.0154435
-26.255
0.000
-.4377919
-.3731446

Para el clculo de las caracteristicas de las variables asociadas a una


regresin se usar el modelo inicial

regress

q pb psus pob ycap

Source |
SS
df
MS
-------------+-----------------------------Model | 4848536.55
4 1212134.14
Residual | 13437.4087
19 707.232037
-------------+-----------------------------Total | 4861973.96
23 211390.172

Number of obs
F( 4,
19)
Prob > F
R-squared
Adj R-squared
Root MSE

=
24
= 1713.91
= 0.0000
= 0.9972
= 0.9967
= 26.594

-----------------------------------------------------------------------------q |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------pb | -.1908073
.0159062
-12.00
0.000
-.2240993
-.1575154
psus |
152.6666
17.11665
8.92
0.000
116.841
188.4921
pob |
22.00833
10.96962
2.01
0.059
-.9513557
44.96801
ycap |
.0723776
.1345184
0.54
0.597
-.2091726
.3539279
_cons | -1546.159
832.4968
-1.86
0.079
-3288.594
196.2772
------------------------------------------------------------------------------

predict e, resid
*Medidas resumenes de las variables y de los indicadores
estat sum
Estimation sample regress

Number of obs =

24

------------------------------------------------------------Variable |
Mean
Std. Dev.
Min
Max
-------------+----------------------------------------------q |
2012.458
459.7719
1264
2759
pb |
5341.854
3078.482
2201
11513.6
psus |
3.875
1.449813
2.5
7.2
pob |
159
29.72482
120
209
ycap |
6728.25
2357.715
3560
10700
------------------------------------------------------------estat vce
Covariance matrix of coefficients of regress model
e(V) |
pb
psus
pob
ycap
_cons
-------------+----------------------------------------------------------pb | .00025301
psus | -.21581374
292.97955
pob | -.05662578
41.862678
120.33261
ycap | .00051301
-.4187138 -1.4682237
.0180952

_cons |
estat ic

5.0365854

-3821.4049

-9114.0396

110.58063

693050.9

/*entrega criterios de akaike AIC y de Schwartz BIC */

----------------------------------------------------------------------------Model |
Obs
ll(null)
ll(model)
df
AIC
BIC
-------------+--------------------------------------------------------------. |
24
-180.6813
-109.9875
5
229.9749
235.8652
-----------------------------------------------------------------------------

*Tests para ver si se cumplen los supuestos del modelo MICO


*Multicolinealidad
vif
Variable |
VIF
1/VIF
-------------+---------------------pob |
3457.70
0.000289
ycap |
3271.24
0.000306
pb |
77.98
0.012824
psus |
20.03
0.049931
-------------+---------------------Mean VIF |
1706.74
*Normalidad de errores
sktest e
swilk e
Skewness/Kurtosis tests for Normality
------- joint -----Variable |
Obs
Pr(Skewness)
Pr(Kurtosis) adj chi2(2)
Prob>chi2
-------------+--------------------------------------------------------------e |
24
0.5481
0.4423
1.02
0.5999

Shapiro-Wilk W test for normal data


Variable |
Obs
W
V
z
Prob>z
-------------+-------------------------------------------------e |
24
0.97129
0.774
-0.521
0.69896
*Test de Ramsey de variables omitidas
Ovtest
Ramsey RESET test using powers of the fitted values of q
Ho: model has no omitted variables
F(3, 16) =
24.34
Prob > F =
0.0000

*Test de Heteroscedasticidad bajo el supuesto que ycap produce la


heteroscedasticidad
estat hettest ycap /* Breusch-Pagan / Cook-Weisberg test for
heteroskedasticity */
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: ycap
chi2(1)
Prob > chi2

=
=

3.71
0.0542

estat hettest, rhs /* Breusch-Pagan / Cook-Weisberg test for


heteroskedasticity. Testea todas las variables del lado derecho */

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: pb psus pob ycap
chi2(4) = 7.47
Prob > chi2 = 0.1129
estat imtest
/* permite testear asimetra kurtosis y
heteroscedasticidad pero no acepta ponderaciones */
Cameron & Trivedi's decomposition of IM-test
--------------------------------------------------Source |
chi2
df
p
---------------------+----------------------------Heteroskedasticity |
15.90
14
0.3197
Skewness |
2.98
4
0.5614
Kurtosis |
0.08
1
0.7796
---------------------+----------------------------Total |
18.95
19
0.4598
---------------------------------------------------

estat imtest, white


ponderaciones */

/* permite usar el test de White pero no acepta

White's test for Ho: homoskedasticity


against Ha: unrestricted heteroskedasticity
chi2(14)
Prob > chi2

=
=

15.90
0.3197

Cameron & Trivedi's decomposition of IM-test

--------------------------------------------------Source |
chi2
df
p
---------------------+----------------------------Heteroskedasticity |
15.90
14
0.3197
Skewness |
2.98
4
0.5614
Kurtosis |
0.08
1
0.7796
---------------------+----------------------------Total |
18.95
19
0.4598
--------------------------------------------------*Tests de autocorrelacin para series de tiempo. En primer trmino es
necesario generar una variable de paso del tiempo (t) y referir todas las
otras variables a ella (tsset t)
gener t=_n
tsset t
estat dwatson
Durbin-Watson d-statistic(
estat durbinalt

5,

24) =

1.173594

/* se emplea en modelos autorregresivos */

Durbin's alternative test for autocorrelation


--------------------------------------------------------------------------lags(p) |
chi2
df
Prob > chi2
-------------+------------------------------------------------------------1
|
2.951
1
0.0858
---------------------------------------------------------------------------

H0: no serial correlation


estat bgodfrey

/* test de Breusch-Godfrey para autocorrelacin

*/

Breusch-Godfrey LM test for autocorrelation


--------------------------------------------------------------------------lags(p) |
chi2
df
Prob > chi2
-------------+------------------------------------------------------------1
|
3.380
1
0.0660
---------------------------------------------------------------------------

H0: no serial correlation


* Test para identificar cambio estructural en series de tiempo. Test cusum
y cusum cuadrado
cusum6 q pb psus pob ycap

CUSUM

CUSUM

24
t
CUSUM squared

CUSUM squared

24
t

*TEST DE HIPOTESIS

Se puede calcular nuevamente la regresin para estar seguro cual es el modelo del que se calculan
los tests
regress

q pb psus pob ycap

Test de significancia conjunta de las variables psus y pob


test (psus=0) (pob=0) /* test conjunto */

( 1) psus = 0
( 2) pob = 0
F( 2, 19) = 39.78
Prob > F = 0.0000
test (psus=0) (pob=0), mtest /* test separado y conjunto */
( 1) psus = 0
( 2) pob = 0

| F(df,19) df
p
-------+------------------------------(1) |
79.55 1 0.0000 #
(2) |
4.03 1 0.0593 #
-------+------------------------------all |
39.78 2 0.0000
--------------------------------------# unadjusted p-values
.
Test de igualdad de parmetros
test pob=ycap
( 1) pob - ycap = 0
F( 1, 19) = 3.90
Prob > F = 0.0629

Test de combinaciones lineales de parmetros


lincom pob+psu
( 1) psus + pob = 0
-----------------------------------------------------------------------------q | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+---------------------------------------------------------------(1) | 174.6749 22.29434 7.83 0.000 128.0123 221.3375
-----------------------------------------------------------------------------*Test no lineales
nlcom _b[sexo]/8*_b[esc]-1

/* test no lineales */

_nl_1: _b[pob]/8*_b[ycap]-1
-----------------------------------------------------------------------------q | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+---------------------------------------------------------------_nl_1 | -.8008861 .2714997 -2.95 0.008 -1.369142 -.2326307
------------------------------------------------------------------------------

Anda mungkin juga menyukai