Anda di halaman 1dari 15

Regresi Data Panel dengan STATA

Regresi data panel dapat dilakukan dengan aplikasi STATA dan caranya mudah
sekali. Dalam artikel ini kita akan coba mempelajari tutorialnya. Tentunya agar anda
dapat dengan mudah memahaminya, maka pelajari dulu artikel kami tentang
Regresi Data Panel.

Dalam tutorial ini kita asumsikan akan melakukan uji regresi data panel dengan 3
variabel bebas, yaitu x1, x2 dan x3 serta 1 variabel terikat yaitu y. Di mana
melibatkan 50 subject atau yang disebut dengan panel dan masing-masing subject
mempunyai data runtut waktu selama 10 tahun (per tahun). Jadi bila kita hitung
maka 50 x 10 = 500 observasi.

Silahkan buka aplikasi STATA anda dan kemudian isi data editor sesuai contoh di
bawah ini atau anda bisa langsung download file kerja tutorial ini DI SINI.

Dataset Data Panel


Langkah pertama adalah ketikkan perintah sebagai berikut di kotak command
kemudian tekan enter:
. tsset id thn, yearly
Perhatikan command di atas:
tsset: perintah declare panel data
id: Subject
thn: Time Series

Perintah (command) di atas bertujuan untuk membentuk atau declare dataset panel
data time series agar pengujian data panel dapat dilakukan. Hasilnya adalah
sebagai berikut:

panel variable: id (strongly balanced)


time variable: thn, 2000 to 2009
delta: 1 year

Arti di atas adalah:


Terbentuk panel data dengan subject "id" dan time series variabel "thn" berupa
interval tahun (tearly) yang dimulai dari tahun 2000 sd 2009 (10 tahun). Strongly
balanced artinya secara seragam, masing-masing subject ("id") mempunyai jumlah
pengulangan/time series yang sama yaitu 10 tahun.

Langkah selanjutnya ketikkan command:


. xtsum y x1 x2 x3
Perhatikan command di atas:
xtsum: perintah deskriptive pada panel data
y: Variabel terikat
x1: Variabel bebas x1
x2: Variabel bebas x3
x3: Variabel bebas x3
Artinya kita akan menghitung dan menampilkan hasil uji deskriptive per variabel,
baik pada subject secara keseluruhan (overall), per subject (between) dan per tahun
(within).
Tampilannya sebagai berikut:

Xtsum Data Panel


Sesuai tahapan seperti yang dijelaskan dalam artikel sebelumnya, maka kita akan
melakukan pemilihan metode estimasi.
Langkah pertama adalah melakukan uji Pooled Least Square (PLS), caranya:
. reg y x1 x2 x3
Perhatikan command di atas:
reg: perintah PLS
y: Variabel terikat
x1: Variabel bebas x1
x2: Variabel bebas x3
x3: Variabel bebas x3
Lihat outputnya!

Pooled Least Square


Selanjutnya lakukan uji regresi data panel Fixed Effect Model (FE), yaitu:
. xtreg y x1 x2 x3, fe
Perhatikan command di atas:
xtreg: perintah fixed atau random effect
fe adalah options memilih fixed effect
y: Variabel terikat
3

x1: Variabel bebas x1


x2: Variabel bebas x3
x3: Variabel bebas x3
Lihat outputnya!

Fixed Effect
Selanjutnya lakukan uji regresi data panel Random Effect Model (RE), yaitu:
. xtreg y x1 x2 x3
Perhatikan command di atas:
xtreg: perintah fixed atau random effect
Tanpa adanya options memilih fixed effect, maka secara default pilihan uji adalah
random effect
y: Variabel terikat
x1: Variabel bebas x1
x2: Variabel bebas x3
x3: Variabel bebas x3
Lihat outputnya!

Random Effect
Untuk membandingkan ketiga hasil di atas, terlebih dulu menyimpan hasil regresi
masing-masing metode dengan command : . estimates store (nama)
Caranya pada kotak command ketikkan lalu enter:
. estimates store fe
. estimates store re
. estimates store ols
. estimates table fe re ols, star stats(N r2 r2_a)
Perhatikan command di atas:
estimates: perintah melakukan estimasi
store: menyimpan data
fe: fixed effect
re: random effects
ols: ordinary least square
estimates table fe re ols, star stats(N r2 r2_a): memunculkan table yang berisi data
hasil uji t parsial fixed effects, random effects dan PLS.
Star berarti memberi tanda bintang bagi yang menerima H1
stats(N r2 r2_a) berarti memunculkan jumlah sampel, nilai r square dan adjusted r
square

Estimate Output

Maka akan muncul variabel baru pada data editor, yaitu secara berurutan
variabel: _est_ols, _est_fe dan _est_re.

Estimate Dataset
Kemudian interprestasikan dan ambil kesimpulan sesuai Diagram Pilihan Metode
Estimasi pada artikel sebelumnya. Caranya adalah sebagai berikut:
Chow Test
Chow Test, untuk menentukan pilihan antara PLS dan FE. Maka lihat output FE!

Chow Test
(Lihat pada tanda panah merah!) Karena P Value (Prob>F) < Alpha 0,05 maka
H1 diterima yang artinya pilihan yang terbaik adalah FE.
Hausman Test
Karena pilihan jatuh pada FE, maka selanjutnya kita tentukan apakah lebih baik FE
atau RE. Caranya adalah melalui Hausman Test, yaitu ketikkan command dan enter:
. quietly xtreg y x1 x2 x3, fe
. estimates store fe
. quietly xtreg y x1 x2 x3, re
. estimates store re
. hausman fe re
Perhatikan command di atas:
6

y: Variabel terikat
x1: Variabel bebas x1
x2: Variabel bebas x3
x3: Variabel bebas x3

Maka akan muncul output sebagai berikut:

Hausman Test
(Lihat pada tanda panah merah!) Karena P Value (Prob>Chi2)<Alpha 0,05 maka
H1 diterima atau yang berarti pilihan terbaik adalah FE dari pada RE.
Lagrange Multiplier Test
Bagaimana seandainya pada Chow Test pilihan terbaik adalah PLS atau pada
Hausman Test ternyata pilihan terbaik adalah RE? Maka kita harus melanjutkan ke
tahap berikutnya untuk menentukan pilihan terbaik apakah PLS atau RE, yaitu
dengan uji Lagrange Multiplier Test. Caranya ketikkan command dan enter:
. xtreg y x1 x2 x3, re
. xttest0
Perhatikan command di atas:
xtreg dengan options re: perintah random effects
y: Variabel terikat
x1: Variabel bebas x1
x2: Variabel bebas x3
x3: Variabel bebas x3
xttest0: perintah Lagrange Multiplier Test

Maka output muncul sebagai berikut:

Lagrange Multiplier Test


(Lihat pada tanda panah merah!) Karena p value (Prob>Chibar2)<Alpha 0,05
maka H1 diterima atau yang berarti pilihan terbaik adalah RE dibandingkan PLS.
Sementara cukup sampai di sini artikel mengenai Regresi Data Panel dengan STATA.
Di mana kita sudah bisa menentukan pilihan metode estimasi yang tepat, apakah
PLS, FE atau RE.
Selanjutnya kita akan mempelajari post estimasi setelah regresi data panel atau
yang disebut dengan asumsi regresi data panel yang bertujuan untuk mengevaluasi
hasil model persamaan regresi data panel. Baca penjelasannya secara detail di
Asumsi Regresi Data Panel dengan STATA.

Asumsi Regresi Data Panel dengan STATA


Sebelum masuk ke tahap interprestasi hasil analisis dengan regresi data
panel, maka setelah mempelajari cara memilih metode estimasi yang tepat
untuk regresi data panel dengan stata pada artikel sebelumnya, saatnya kita
mempelajari asumsi regresi data panel. Asumsi yang berlaku untuk regresi
data panel metode Pooled Least Square (PLS) dan Fixed Effects (FE) sama
dengan Ordinary Least Square (OLS) karena kedua uji tersebut didasarkan
pada metode least square. Uji Asumsi yang dimaksud antara lain: Linearitas,
Normalitas, Outlier, Multikolinearitas, Heteroskedastisitas dan Autokorelasi.
Sedangkan Metode Random Effects (RE) karena menggunakan pendekatan
General
Least
Square
(GLS)
maka
tidak
diperlukan
pengujian
heteroskedastisitas dan Autokorelasi.

Asumsi Multikolinearitas Regresi Data Panel


Caranya:
ketikkan Command sebagai berikut:
Corr y x1 x2 x3
8

Maksud command di atas:


Corr artinya uji korelasi pearson product moment
y: variabel terikat
x1: variabel bebas x1
x2: variabel bebas x2
x3: variabel bebas x3
Output yang dihasilkan:

Multikolinearitas Data Panel dengan STATA


Nilai-nilai di atas menunjukkan korelasi antar variabel, misal antara x1
dengan x2 nilai korelasinya 0,3838. Dinyatakan menerima H0 atau tidak ada
masalah multikolinearitas apabila nilai korelasi antar variabel tidak lebih dari
0,75.
Cara yang lain:
Pada Uji Pooled Least Square dengan melihat nilai VIF setelah regresi dengan
PLS:
. reg y x1 x2 x3
. vif
Maksud command di atas:
Reg artinya uji Regresi
y: variabel terikat
x1: variabel bebas x1
x2: variabel bebas x2
x3: variabel bebas x3
vif: nilai variance inflating factor
Outputnya:

VIF Data Panel dengan STATA


Menerima H1 atau ada indikasi multikolinearitas tinggi apabila nilai Mean VIF
> 10.
Setelah FE dan RE dengan cara:
. xtreg y x1 x2 x3, fe
. vif, uncentered
Maksud command di atas:
xtreg artinya uji Regresi Data Panel
FE artinya Fixed Effects
y: variabel terikat
x1: variabel bebas x1
x2: variabel bebas x2
x3: variabel bebas x3
vif: nilai variance inflating factor.
Outputnya:

VIF Data Panel Setelah FE dengan STATA


Menerima H1 atau ada indikasi multikolinearitas tinggi apabila nilai Mean VIF
> 10.

Asumsi Heteroskedastisitas Regresi Data Panel


Perlu diingat kembali bahwa Uji heterokedastisitas hanya dilakukan ketika
menggunakan estimasi FE dan PLS.
Caranya Setelah PLS:
. quietly reg y x1 x2 x3
. hettest
Outputnya:

10

Heteroskedastisitas Data Panel PLS dengan STATA


Menerima H1 atau Terjadi
(Prob>Chi2) < Alpha (0,05).

masalah

heteroskedastisitas

apabila

nilai

apabila

nilai

Caranya Setelah FE:


. xtreg y x1 x2 x3, fe
. xttest3
Outputnya:

Heteroskedastisitas Data Panel FE dengan STATA


Menerima H1 atau Terjadi
(Prob>Chi2) < Alpha (0,05).

masalah

heteroskedastisitas

Asumsi Autokorelasi Regresi Data Panel


Caranya:
. xtserial y x1 x2 x3
Outputnya:

Autokorelasi Data Panel dengan STATA


Terjadi masalah Autokorelasi apabila nilai (Prob>Chi2) < Alpha (0,05).

11

Interprestasi Asumsi Klasik Regresi Linear


dengan STATA
Sebelumnya kita telah membahas cara melakukan uji regresi linear dengan
menggunakan aplikasi STATA dalam artikel yang berjudul:

Regresi Linear dengan STATA

Interprestasi Regresi Linear dengan STATA

Pada pembahasan kali ini adalah melanjutkan kedua artikel di atas, yaitu
bagaimana menginterprestasikan asumsi klasik pada regresi linear dengan
menggunakan aplikasi STATA.
Sedikit review: Asumsi klasik yang akan kita uji antara lain uji normalitas,
heteroskedastisitas dan multikolinearitas.

Normalitas
Ingat bahwa asumsi normalitas pada regresi linear adalah pada residualnya.
Residual adalah beda antara Y dan Y Prediksi. Sedangkan Y Prediksi adalah
Nilai Y atau variabel dependen yang diperkirakan berdasarkan persamaan
regresi yang didapat.

Lihat nilai Prob>chi2 pada skewness/kurtosis test for Normality. Apabila


nilainya lebih dari 0,05 maka residual berdistribusi normal. Di atas
12

nilainya 0,7028 maka residual berdistribusi normal. Sehingga


berdasarkan uji Skewness Kurtosis, residual dinyatakan berdistribusi
normal.

Lihat nilai Prob>Z pada shapiro-wilk w test for Normal data. Apabila
nilainya lebih dari 0,05 maka residual berdistribusi normal. Di atas
nilainya 0,65937 maka residual berdistribusi normal. Sehingga
berdasarkan uji Shapiro Wilk, residual dinyatakan berdistribusi normal.

Lihat nilai Prob>Z pada shapiro-Francia w test for Normal data. Apabila
nilainya lebih dari 0,05 maka residual berdistribusi normal. Di atas
nilainya 0,88523 maka residual berdistribusi normal. Sehingga
berdasarkan uji Shapiro Wilk, residual dinyatakan berdistribusi normal.

Mengapa ada 3 jenis uji? seharusnya 1 uji saja sudah cukup. Pilihannya
adalah bila jumlah sample atau observasi kecil < 50 sebaiknya
menggunakan Shapiro-Wilk atau Shapiro-Francia. Sedangkan untuk
sampel besar > 5.000, lebih baik menggunakan skewness kurtosis.
Shapiro Wilk valid hanya sampai 1000 observasi sedangkan Shapiro
Francia hingga 5000.

Berikut di bawah ini juga dilampirkan hasil uji dengan metode grafik
Histogram.
Dinyatakan berdistribusi normal apabila diagram menyerupai "Bel/Lonceng"
menghadap ke atas.

13

Di atas diagram menyerupai bel menghadap ke atas, maka dinyatakan


berdistribusi normal.
Sebaiknya untuk menambah wawasan, anda baca artikel kami yang berjudul
Normalitas pada STATA.

Heteroskedastisitas
Uji regresi linear harus mempunyai sifat homoskedastisitas. Untuk uji
heteroskedastisitas banyak metode, tetapi dalam hal ini kita menggunakan
metode Breusch-Pagan. Dikatakan tidak terjadi gejala heteroskedastisitas
apabila nilai P value yang ditunjukkan dengan "Prob > chi2" nilainya > 0,05.

Di atas nilai p value sebesar 0,7451 di mana > 0,05 maka model regresi
bebas dari gejala heteroskedastisitas atau disebut juga bersifat
homoskedastisitas.
Berikut juga dilampirkan hasil uji dengan metode grafik scatter antara fitted
value dan residual. Apabila plot menyebar merata di atas dan di bawah
sumbu 0 dan tidak membentuk sebuah pola tertentu, maka dinyatakan tidak
ada gejala heteroskedastisitas.

14

Pada Diagram di atas, plot menyebar merata di atas dan di bawah sumbu 0
dan tidak membentuk sebuah pola tertentu, maka dinyatakan tidak ada
gejala heteroskedastisitas. Untuk menambah wawasan sebaiknya anda baca
artikel kami yang berjudul Uji Heteroskedastisitas.

Multikolinearitas
Multikolinearitas bisa diartikan dengan mudah yaitu terdapat korelasi kuat
antar variabel independen. Model regresi yang bagus harus bebas dari gejala
multikolinearitas. Karena multikolinearitas adalah korelasi antar variabel
independen, maka asumsi ini hanya berlaku pada uji regresi linear berganda
di mana terdapat lebih dari satu variabel independen.

Lihat nilai VIF dan 1/VIF di atas, apabila VIF < 10 dan 1/VIF > 0,1 maka dapat
dikatakan
bahwa
model
regresi
linear
berganda
bebas
gejala
multikolinearitas. Nilai 1/VIF bisa disebut juga dengan istilah "Tolerance".
Apabila anda menggunakan aplikasi SPSS maka istilah Tolerance yang
digunakan.
Demikianlah serangkaian tutorial dan penjelasan tentang uji regresi linear
dengan menggunakan aplikasi STATA.

15