Anda di halaman 1dari 14

Pelatihan Software Ekonometrika

Rumah Ekonometrika
Organized by KANOPI FEUI

Modul

Pengolahan Panel Data dengan Stata


Pengajar: Ahmad Fajar, S.E.

Laboratorium Komputasi Departemen Ilmu Ekonomi, FEUI


Depok
rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013

1. Jenis Model Untuk Data Panel


Terdapat tiga metode yang dapat digunakan untuk melakukan estimasi data panel, yaitu dengan
menggunakan metode Pooled Least Squares (PLS), Fixed-Effect Model (FEM) atau Least-Squares Dummy
Variables Model (LSDV), dan Random Effect Model (REM).

1.1. Pooled Least Squares


Metode ini merupakan metode paling sederhana yang dapat digunakan untuk mengolah data
panel.Dalam metode ini, perhitungan dilakukan dengan melakukan regresi sederhana seperti yang biasa
diterapkan pada metode OLS pada setiap periode observasi. Persamaan yang digunakan pada PLS
adalah:

Yit X it it ;

i 1, 2,..., N ; t 1, 2,..., T

1.2. Fixed Effect Model


Model ini memungkinkan adanya nilai intercept yang berbeda dari masing-masing observasi crosssectional, namun mengasumsikan koefisien slope-nya tetap untuk setiap observasi. Metode
penghitungan dilakukan dengan memasukkan sejumlah dummy variable sebagai intercept. Persamaan
yang digunakan dalam metode ini adalah sebagai berikut:
n

Yit 1 X itj ij 1 D1 it
i 2

dimana:
: variabel dependen di waktu t untuk unit cross-sectioni

Yit

: intercept yang berubah-ubah antar cross-section unit

j
it

:variabel independen j diwaktu t untuk unit cross-sectioni

ij

:parameter untuk variabel ke-j

it

:error term pada periode ke-t, dan cross-section ke-i

Kelemahan metode ini terletak pada banyaknya variabel dummy yang digunakan sehingga mengurangi
derajat kebebasan (degree of freedom) dan mempengaruhi efisiensi parameter yang diuji.

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
1.3. Random Effect Model
Berbeda dengan metode fixed effect, metode random effect justru melihat adanya perbedaan nilai baik
pada variabel waktu, maupun pada variabel cross-section. Dengan asumsi kedua variabel tersebut
terdistribusi secara normal, maka penggunaan derajat kebebasan dapat dihemat karena yang perlu
diperhatikan dalam perhitungan hanya nilai rata-rata dan varians dari masing-masing komponen error.
Persamaan yang digunakan adalah sebagai berikut:

Yit X itj j it ;

it ui vt wit

dimana:

uit

: komponencross-section error

vit

: komponentime series error

wit

: komponencombination error

Penghitungan Random Effect Model dilakukan menggunakan metode Generalized Least Squares (GLS),
yang memasukkan faktor heteroscedasticity dan autocorrelation ke dalam perhitungan sehingga tidak
perlu lagi dikhawatirkan munculnya masalah tersebut dalam hasil perhitungan.

2. Analisa Data Panel Menggunakan Stata


2.1. DataYang Digunakan
Data yang akan digunakan berasal dari Baltagi dan Khanti-Akom (1990), yaitu data yang diambil dari
Panel Study of Income Dynamics (PSID). Data dalam format .dta dapat di-download di
http://cameron.econ.ucdavis.edu/musbook/mus08psidextract.dta
Menggunakan data tersebut, asumsikan model yang akan diuji adalah:

lwage f (exp, exp 2, wks, ed )


dimana:

lwage
exp
exp2
wks
ed

: bentuk logaritma dari upah dalam sen


: pengalaman bekerja full-time (tahun)
: kuadrat dari exp
: lama bekerja dalam minggu
: lama pendidikan

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
2.2. Input Data Dan Persiapan Awal
Langkah pertama yang dilakukan untuk analisa data panel menggunakan Stata adalah dengan dengan
membuka file/data set yang telah disimpan dalam format Stata dengan ekstensi dta. Pada contoh kali
ini, data yang digunakan adalah mus08psidextract.dta. Terdapat dua cara untuk membuka file dta pada
Stata, yaitu:

Asumsi data disimpan di direktori C:\Stata


useC:\Stata\mus08psidextract.dta

Asumsi data terdapat di internet (http://cameron.econ.ucdavis.edu/musbook/)


use http://www.stata-press.com/data/mus/mus08psidextract.dta

Setelah membuka data, yang dilakukan kemudian adalah deklarasi data untuk mendefinisikan variabel
yang menunjukkan keterangan individu dan variabel yang menunjukkan keterangan waktu, dengan
perintah:
xtsetpanelvar timevar, [toptions]

Pada contoh kali ini, variabel waktu ditunjukkan oleh t, variabel individu oleh id, dan dengan periode
waktu tahunan sehingga perintah yang dimasukkan adalah:
xtset id t, year

Jika perintah yang dimasukkan benar, akan didapatkan tampilan seperti berikut:
panel variable: id (strongly balanced)
time variable: t, 1 to 7
delta: 1 year

Note:
Jika setelah memasukkan perintah xtset muncul tampilan error seperti berikut:
varlist: id: string variable not allowed

maka variable tersebut harus dirubah terlebih dahulu menggunakan perintah:


destring id, replace

untuk merubah observasi dalam variabel id menjadi numerik, atau:


encode id, gen (id2)

untuk membuat variabel baru (id2) untuk digunakan pada perintah xtset.

strongly balanced berarti tiap-tiap individu ada datanya untuk setiap periode observasi.
Jika ada satu individu saja yang tidak ada datanya di satu periode, data tersebut menjadi
unbalanced. Meskipun tidak balance, perhitungan model tetap bisa dijalankan.

Format waktu pada Stata


daily: Harian

quarterly: Kuartal

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
weekly: Mingguan
monthly: Bulanan

halfyearly: Semester
yearly:Tahunan

2.3. Panel-data Summary


Statistik deskriptif dari data set yang digunakan bisa diperoleh menggunakan beberapa perintah seperti
summarize atau describe.Setelah perintah xtset dijalankan, perintah xtdescribe dapat
memberikan informasi sejauh mana panel tidak seimbang.

. xtdes
id: 61251, 1.125e+08, ..., 8.125e+08
n =
tahun: 2002, 2003, ..., 2006
T =
Delta(tahun) = 1 unit
Span(tahun) = 5 periods
(id*tahun uniquely identifies each observation)
Distribution of T_i:

min
1

5%
1

25%
1

50%
3

75%
5

251
5

95%
5

max
5

Freq. Percent
Cum. | Pattern
---------------------------+--------84
33.47
33.47 | 11111
39
15.54
49.00 | ....1
19
7.57
56.57 | 1....
12
4.78
61.35 | ..11.
11
4.38
65.74 | .1111
10
3.98
69.72 | ...1.
9
3.59
73.31 | .1...
9
3.59
76.89 | 1111.
8
3.19
80.08 | 1...1
50
19.92 100.00 | (other patterns)
---------------------------+--------251
100.00
| XXXXX

Perintah lainnya yang mungkin berguna untuk kesimpulan statistika deskriptif data panel adalah:
xtdescribe; xtsum; xtdata; xtline; xttab; xttrans.

Note: untuk beberapa perintah seperti sum dan xtsum, jika variabel yang ingin ditampilkan tidak
didefinisikan, maka summary yang akan muncul adalah summary dari semua variabel.

4
Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
2.4. Menentukan PLS, FEM, atau REM
Keputusan mengenai model mana yang akan digunakan (PLS, FEM, atau REM) ditentukan setelah
dilakukan sejumlah pengujian.

2.4.1

PLS vs FEM: Chow Test

Pemilihan antara PLS atau FEM ditentukan oleh uji Chow, dengan hipotesa:
H0: PLS
Ha: FEM
Kriteria penolakan: tolak H0 jika Pvalue<
Perintah yang dimasukkan adalah:
xtreglwage exp exp2 wks ed, fe

dengan output:

Fixed-effects (within) regression


Group variable: id

Number of obs
Number of groups

R-sq: within = 0.6566


between = 0.0276
overall = 0.0476

Obs per group: min =


avg =
7.0
max =
7

F(3,3567)
corr(u_i, Xb)

Prob > F

=
2273.74
= -0.9107

=
=

4165
595
7

0.0000

-----------------------------------------------------------------------------lwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------exp |
.1137879
.0024689
46.09
0.000
.1089473
.1186284
exp2 | -.0004244
.0000546
-7.77
0.000
-.0005315
-.0003173
wks |
.0008359
.0005997
1.39
0.163
-.0003399
.0020116
ed | (omitted)
_cons |
4.596396
.0389061
118.14
0.000
4.520116
4.672677
-------------+---------------------------------------------------------------sigma_u | 1.0362039
sigma_e | .15220316
rho | .97888036
(fraction of variance due to u_i)
-----------------------------------------------------------------------------F test that all u_i=0:
F(594, 3567) =
40.17
Prob > F = 0.0000

Pada output diatas, hasil uji Chow ditunjukkan oleh nilai Prob F yang berada pada sisi kanan bawah.
Pada output tersebut, Pvalue< sehingga H0 ditolak. Artinya, berdasarkan output diatas model yang
dipilih adalah FEM.
Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013

Note: pada perintah xtreg, jika opsi fe tidak dimasukkan maka secara otomatis output yang
dihasilkan adalah Random-effects.
2.4.2

PLS vs REM: Breusch and Pagan LM Test

Pemilihan PLS atau REM ditentukan oleh uji LM Test dengan hipotesa:
H0: PLS
Ha: REM
Kriteria penolakan: tolak H0 jika Pvalue<
Pengujian LM Test pada Stata harus didahului oleh perintah xtreg, re. Dengan spesifikasi model yang
telah ditentukan, maka perintah yang dimasukkan adalah:
xtreg lwage exp exp2 wks ed, re

dengan output:

Random-effects GLS regression


Group variable: id

Number of obs
Number of groups

=
=

R-sq: within = 0.6340


between = 0.1716
overall = 0.1830

Obs per group: min =


avg =
7.0
max =
7

Random effects u_i ~ Gaussian


corr(u_i, X)
= 0 (assumed)

Wald chi2(4)
Prob > chi2

=
=

4165
595
7

3012.45
0.0000

-----------------------------------------------------------------------------lwage |
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------exp |
.0888609
.0028178
31.54
0.000
.0833382
.0943837
exp2 | -.0007726
.0000623
-12.41
0.000
-.0008946
-.0006505
wks |
.0009658
.0007433
1.30
0.194
-.000491
.0024226
ed |
.1117099
.0060572
18.44
0.000
.0998381
.1235818
_cons |
3.829366
.0936336
40.90
0.000
3.645848
4.012885
-------------+---------------------------------------------------------------sigma_u | .31951859
sigma_e | .15220316
rho | .81505521
(fraction of variance due to u_i)

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
------------------------------------------------------------------------------

Berikutnya dilakukan LM Test dengan perintah:


xttest0

dengan output:
Breusch and Pagan Lagrangian multiplier test for random effects
lwage[id,t] = Xb + u[id] + e[id,t]
Estimated results:
|
Var
sd = sqrt(Var)
---------+----------------------------lwage |
.2129935
.4615122
e |
.0231658
.1522032
u |
.1020921
.3195186
Test:
Var(u) = 0
chi2(1) = 5192.13
Prob > chi2 =

0.0000

Berdasarkan output diatas, diketahui bahwa Pvalue<. Kesimpulannya tolak H0. Berarti model yang
dipilih adalah REM.

Note: perintah xttest0hanya bisa dijalankan setelah perintah xtreg, re

2.4.3

FEM vs REM: Hausman Test

Pemilihan PLS atau REM ditentukan oleh uji LM Test dengan hipotesa:
H0: REM
Ha: FEM
Kriteria penolakan: tolak H0 jika Pvalue<
Sebelum melakukan uji Hausman, Stata membutuhkan hasil estimasi FEM dan REM yang telah terlebih
dahulu disimpan menggunakan perintah.
estimatesstore name

Untuk contoh kali ini, asumsikan estimasi FEM disimpan dengan namafixed dan estimasi REM dengan
nama random sehingga perintah yang dimasukkan adalah sebagai berikut:

xtreg lwage exp exp2 wks ed, fe


est sto fixed
xtreg lwage exp exp2 wks ed, re
est sto random

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013

Setelah hasil estimasi FEM dan REM tersimpan, uji Hausman bisa dilakukan dengan perintah:
hausman fixed random

dengan output sebagai berikut:


---- Coefficients ---|
(b)
(B)
(b-B)
sqrt(diag(V_b-V_B))
|
fixed
random
Difference
S.E.
-------------+---------------------------------------------------------------exp |
.1137879
.0888609
.0249269
.
exp2 |
-.0004244
-.0007726
.0003482
.
wks |
.0008359
.0009658
-.0001299
.
-----------------------------------------------------------------------------b = consistent under Ho and Ha; obtained from xtreg
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
Test:

Ho:

difference in coefficients not systematic

chi2(3) = (b-B)'[(V_b-V_B)^(-1)](b-B)
=
6191.43
Prob>chi2 =
0.0000
(V_b-V_B is not positive definite)

Berdasarkan output diatas, diketahui bahwa jika Pvalue<.Kesimpulannyatolak H0. Berarti model yang
dipilih adalah FEM.

Note:
Hasil estimasi bisa disimpan dengan nama apa saja yang diinginkan oleh user.
Penggunaan namafixed untuk FEM dan random untuk REM hanya ilustrasi.
Ketika menulis baris perintah uji Hausman, estimasi fixed-effect harus disebutkan lebih
dulu sebelum estimasi random-effect. Untuk contoh diatas, perintah yang benar adalah
hausman fixed random bukan hausman random fixed.

2.5. Uji Pelanggaran Asumsi Dasar Statistik


2.5.1
2.5.1.1

Multikolinearitas
PLS

Untuk model PLS, terdapat dua cara untuk melihat multikolinearitas, yaitu menggunakan partial
collinearity atau variance inflation factor (VIF). Untuk partial collinearity, perintah yang digunakan
adalah:

corrvarlist

sehingga perintah yang dimasukkan adalah:


Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
correxp exp2 wks ed
|
exp
exp2
wks
ed
-------------+-----------------------------------exp |
1.0000
exp2 |
0.9729
1.0000
wks | -0.0337 -0.0424
1.0000
ed | -0.2182 -0.2162 -0.0067
1.0000

Rule of thumb dari multikolinearity adalah 0.8, artinya jika korelasi antara dua variabel bernilai 0.8
maka kedua variabel tersebut memiliki hubungan linier.Pada contoh diatas, terdapat hubungan linier
antara variabel exp dengan variabel exp2.
Sedangkan untuk VIF, perintah vif dimasukkan setelah perintah regress, sehingga perintahnya adalah:
reg lwage exp exp2 wks ed
vif
Variable |
VIF
1/VIF
-------------+---------------------exp |
18.77
0.053271
exp2 |
18.77
0.053282
ed |
1.05
0.951887
wks |
1.00
0.996914
-------------+---------------------Mean VIF |
9.90

Rule of thumb dari VIF adalah VIF 10 atau1

0.1.Dari output diatas, diketahui bahwa variabel exp

dan exp2 memiliki masalah multikolinearitas.

2.5.1.2

FEM dan REM

Untuk model FEM dan REM, pendeteksian masalah multikolinearitas dilakukan menggunakan metode
VIF.Sama seperti pada penggunaan VIF untuk PLS, perintah vifdimasukkan setelah perintah
xtreg.Bedanya, untuk FEM dan REM perintahnya ditambah dengan opsi uncentered.
xtreg lwage exp exp2 wks ed, fe
vif, uncentered

atau
xtreg lwage exp exp2 wks ed, re
vif, uncentered

Variable |
VIF
1/VIF
-------------+---------------------exp |
72.99
0.013700
exp2 |
36.63
0.027297
wks |
27.30
0.036630
ed |
18.23
0.054869
-------------+----------------------

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
Mean VIF |

38.79

Output diatas merupakan output VIF untuk model REM. Berdasarkan output tersebut, diketahui bahwa
model REM yang digunakan memiliki masalah multikolinearitas.

Note:Pada contoh Hausman Test, estimasi FEM dan REM disimpan dengan namafixed dan random. Hasil
estimasi tersebut dapat dipanggil kembali menggunakan perintah estimates restore sehingga
untuk contoh VIF dimana perintah vif baru bisa digunakan setelah xtreg, perintah tersebut dapat
diganti menjadi:
estres fixed
vif, uncentered

dan
est res random
vif, uncentered

2.5.2

Heteroskedastisitas

Hipotesa: H0 : homoscedastic
Ha : heteroscedastic
Kriteria penolakan: tolak H0 jika Pvalue<

2.5.2.1

PLS

Perintah untuk heteroscedastic test(hettest) dimasukkan setelah reg. Perintah yang dimasukkan
adalah sebagai berikut:
reg lwage exp exp2 wks ed
hettest
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of lwage
chi2(1)

10

=
0.00
Prob >chi2 =

0.9728

Berdasarkan output diatas, Pvalue>. Kesimpulannya tidak menolak H0. Berarti tidak terdapat
permasalahan heteroskedastisitas dalam model (homoscedastic).

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013
2.5.2.2

FEM

Seperti pengujian heteroskedastis pada model PLS, pengujian pada model FEM dilakukan setelah
perintah xtregsehingga perintah yang dimasukkan adalah:
xtreg lwage exp exp2 wks ed, fe
xttest3
Modified Wald test for groupwise heteroskedasticity
in fixed effect regression model
H0: sigma(i)^2 = sigma^2 for all i
chi2 (595) =
Prob>chi2 =

1.6e+06
0.0000

Berdasarkan output diatas, Pvalue<. Kesimpulannya tolak H0. Berarti terdapat permasalahan
heteroskedastisitas dalam model.

2.5.2.3

REM

Untuk model REM, tidak perlu dilakukan uji heteroskedastis karena sudah menggunakan metode GLS
dalam estimasinya.

2.5.3

Autokorelasi

Hipotesa: H0 : no autocorrelation
Ha : autocorrelation
Kriteria penolakan: tolak H0 jika Pvalue<

2.5.3.1

PLS dan FEM

Pengujian autokorelasi pada model PLS dan FEM menggunakan perintah xtserial diikuti oleh variabel
dependen, dan kemudian variabel independen:
xtserialdepvar indepvars

sehingga
xtserial lwage exp exp2 wks ed

11

Wooldridge test for autocorrelation in panel data


H0: no first order autocorrelation
F( 1,
594) =
25.829
Prob > F =
0.0000

Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013

Berdasarkan output diatas diketahui bahwa Pvalue<. Kesimpulannya tolak H0. Berarti dalam model
tersebut terdapat permasalahan autokorelasi.

2.5.3.2

REM

Untuk model REM, tidak perlu dilakukan uji autokorelasi karena sudah menggunakan metode GLS
dalam estimasinya.

2.6. Interpretasi Hasil Persamaan Regresi


Setelah mendapatkan model panel yang terbaik berdasarkan pemilihan antara PLS, FEM, dan REM, dan
setelah memastikan bahwa model yang dipilih memenuhi asumsi BLUE, maka model tersebut sudah
dapat diinterpretasikan. Adapun informasi yang dapat diinterpretasikan adalah sebagai berikut:

2.6.1

Kriteria Ekonomi

Pada kriteria ekonomi, yang biasanya dilihat adalah kesesuaian logika arah hubungan antara variabel
dependen dengan variabel independen.

2.6.2

Koefisien Regresi

Sama seperti interpretasi koefisien pada OLS, koefisien regresi pada model panel juga menggambarkan
seberapa besar pengaruh perubahan sebesar satu unit pada variabel independen terhadap variabel
dependen, dengan asumsi variabel lainnya tetap. Khusus untuk model REM, besar pengaruh perubahan
variabel independen terhadap variabel dependen dibaca sebagai rata-rata.

2.6.3

Uji Signifikansi Parsial (tstat)

Uji signifikansi parsial digunakan untuk melihat apakah masing-masing variabel independen signifikan
secara statistik mempengaruhi variabel dependen, dengan hipotesa:

12

H0: =0 (variabel independen tidak mempengaruhi variabel dependen)


Ha: 0 (variabel independen mempengaruhi variabel dependen)

Selain menggunakan tstat, uji signifikansi parsial juga dapat dilakukan dengan membandingkan Pvalue
masing-masing variabel. Jika Pvalue<, maka tolak H0 (variabel independen signifikan mempengaruhi
variabel dependen)
Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com

2013

2.6.4

Uji Signifikansi Global (Fstat)

Uji signifikansi global digunakan untuk melihat apakah seluruh variabel independen dalam model secara
bersama-sama signifikan secara statistik mempengaruhi variabel dependen, dengan hipotesa:

2.6.5

H0: 1=2=...=n=0
Ha: 11... n0

Goodness of Fit

Digunakan untuk melihat seberapa besar model yang dibangun mampu menjelaskan kondisi
sebenarnya. Ukuran goodness of fit yang umum digunakan adalah R2. Untuk PLS, R2 yang digunakan
adalah R2 yang biasa atau Adj R2, untuk FEM R2-within, sedangkan untuk REM R2-overall.

13
Rumah Ekonometrika | rumahekonometrika.blogspot.com| rumahekonometrika@gmail.com