Anda di halaman 1dari 14

PANEL DATA REGRESSION MODEL

Panel Data adalah data yang memiliki dimensi waktu dan ruang.
Other names : Pooled data, combination of time series and cross
section data, micropanel data, longitudinal data, event history
analysis, cohort analysis.
Dalam panel data, data cross-section yang sama diobservasi
menurut waktu. Data panel merupakan gabungan antara data
cross section, yang ditandai dengan subscript i, dan data time
series, yang ditandai dengan subscript t.
Menurut Greene (2003), “keuntungan dasar penggunaan data
panel adalah adanya fleksibilitas yang lebih besar bagi peneliti
untuk memodelkan perbedaan perilaku antar individu”(hal 284).
Selain itu, keuntungan lain yang dapat diperoleh menurut
Gujarati (2005) dan Hsiao (2003) dalam Baltagi (2005) antara
lain
1. dengan menggabungkan antara data cross section dan time
series, data panel mampu menyediakan data yang lebih
banyak, informasi yang lebih lengkap, mengurangi kolinieritas
antar variabel, dan menghasilkan degree of freedom (df) yang
lebih besar serta lebih efisien;
2. data panel dapat mengatasi masalah yang timbul akibat
penghilangan variabel (omitted variabel);
3. pengontrolan heterogenitas individu;
4. data panel lebih cocok mempelajari perubahan dinamik;
5. Meskipun data tidak lengkap analisis data panel masih bisa
tetap dilakukan
6. dapat mendeteksi dan mengukur efek yang secara
sederhana tidak dapat diperoleh dari cross section atau time
series murni;
meminimalkan bias yang dihasilkan oleh agregat individu
karena unit data lebih banyak.
Satu set data panel memiliki jumlah periode waktu T >1 dan
jumlah unit cross sectional n > 1. Jika setiap cross-section unit
memiliki jumlah observasi time-series yang sama maka disebut
sebagai balanced panel. Sebaliknya jika jumlah observasi
berbeda untuk setiap cross-section unit maka disebut
unbalanced panel.
Secara umum persamaan regresi data panel adalah sebagai
berikut: Yit =α + β1 X 1it + β2 X 2it +.... + βk X kit +uit …..

(3.1)
i : 1,2,…,n
t : 1,2,…,T
Dimana
n : jumlah unit cross sectional
T : Jumlah periode waktu
Dalam analisis data panel, penggunaan estimator yang baik
disesuaikan kondisi matriks varians-covarians residual (Ekananda
dalan Aji, 2005)
Model Regresi Data Panel
A. Model Common Effect
Model common effect merupakan model regresi data
panel yang paling sederhana karena hanya menggabungkan
data time series dan cross section dalam bentuk pooled. Model
ini tidak memperhatikan dimensi individu maupun waktu.
Sehingga diasumsikan bahwa perilaku antar individu sama dalam
berbagai kurun waktu. Dengan kata lain setiap unit amatan
memiliki slope dan koefisien yang sama. Persamaan model
regresi common effect dapat ditulis sebagai berikut:
Yit = α + β1 X 1it + β2 X 2it +.... + βk X kit +uit ………….(3.2)
Untuk i = 1,2,…n dan t = 1,2,…T
Berdasarkan asumsi struktur matriks varians-kovarians residual,
terdapat empat metode estimasi yang dapat digunakan
(Ekananda, 2005) yaitu:
1. Ordinary Least Square (OLS), jika matriks varians-kovarians
residualnya diasumsikan bersifat homoskedastik dan tidak
ada cross sectional correlation.
2. Generalized Least Square (GLS) / Weighted Least Square
(WLS): Cross Sectional Weight, jika struktur matriks
varians-covarians residualnya diasumsikan bersifat
heteroskedastik dan tidak ada cross sectional correlation.
3. Feasible Generalized Least Square (FGLS) / Seemingly
Uncorrelated Regression (SUR) atau Maximum Likelihood
Estimator (MLE), jika struktur matriks varians-covarians
residualnya diasumsikan bersifat heteroskedastik dan ada
cross sectional correlation.
4. Feasible Generalized Least Square (FGLS) dengan proses
autoregressive (AR) pada error term-nya, jika struktur
matriks varians-covarians residualnya diasumsikan bersifat
heteroskedastik dan ada korelasi antar waktu pada
residualnya.
Bila kita punya asumsi bahwa α dan β akan sama (konstan)
untuk setiap time series dan cross section. Pertanyaannya,
apakah asumsi bahwa α dan β konstan realistik? Missal kita ingin
mengamati pengaruh iklan terhadap omset pada 10 perusahaan.
Apakah realistic jika dibuat suatu model, dimana perusahaan
yang bergerak di industri makanan mempunyai intersep yang
sama dengan perusahaan yang bergerak di sector jasa? Atau
apakah realistic jika kita menggunakan perusahaan kecil, sedang
dan menengah?
Untuk mengatasi permasalahan tersebut, ada dua buah
teknik lain yang biasanya digunakan untuk membuat model dari
data panel, yaitu Metode Effect Tetap (The Fixed Effect) dan
Metode Efek Random (The Random Effek)
B. Model Fixed Effects
Model ini mengasumsikan bahwa perbedaan antar
individu dapat diakomodasi melalui perbedaan intersepnya.
Setiap αi diperlakukan sebagai parameter yang tidak
diketahui dan akan diestimasi. Pengertian fixed effect
didasarkan adanya perbedaan intersep antar individu tetapi
intersepnya sama antar waktu (time invariant) (Widarjono,
2005). Secara umum persamaan modelnya adalah sebagai
berikut :
Yit = αi + β1 X 1it + β2 X 2it +.... + βk X kit + uit …………..(3.3)

Untuk i = 1,2,…n dan t = 1,2,…T


Untuk membedakan intersep antar individu dapat dilakukan
dengan memasukkan variable dummy untuk masing-masing
individu. Sehingga persamaannya menjadi seperti berikut:
Yit =α1 +α2 D1i +... +α( n−1) D( n−1) i + β1 X 1it + β2 X 2it +... + βk X kit +uit

…………(3.4)
Untuk i = 1,2,…,n dan t = 1,2,…,T
D1i =1 untuk individu pertama dan 0 untuk individu 2,3,…n
D1i =1 untuk individu kedua dan 0 untuk individu 1,3,…n
D( n −1) i =1 untuk individu ke (n-1) dan 0 untuk individu 1,2,…n =
2, n
Dari persamaan (3.4), efek untuk individu pertama adalah α1 +
α2 . Nilai ini akan sama dengan nilai α1 pada persamaan
(3.3). Begitu juga efek untuk individu kedua adalah α1 + α3
sama dengan nilai α2 pada persamaan (3.4). Nilai αn pada
persamaan (3.3) akan sama dengan nilai α1 pada persamaan
(3.4). Karena digunakan dummy variable untuk mengestimasi
fixed effect maka model tersebut disebut juga dengan Least
square Dummy Variable (LSDV). Intersep untuk masng-masing
cross sectional unit berbeda.
Berdasarkan asumsi struktur matriks varians-covarians
residual, maka pada model fixed effects, terdapat tiga
metode estimasi yang dapat digunakan, yaitu:
1. Ordinary Least Square (OLS/LSDV), jika struktur matriks
varians-covarians residualnya diasumsikan bersifat
homoskedastik dan tidak ada cross sectional correlation.
2. Weighted Least Square (WLS), jika struktur matriks
varians-covarians residualnya diasumsikan bersifat
heteroskedastik dan tidak ada cross sectional correlation.
3. Seemingly Uncorrelated Regression (SUR), jika struktur
matriks varians-covarians residualnya diasumsikan bersifat
heteroskedastik dan ada cross sectional correlation.
C. Model Random Effect
Model fixed effects memperbolehkan adanya korelasi
antara efek individual yang tidak terobservasi dengan
regressors , sedangkan pada model random effect efek
individu dengan regressors tidak berkorelasi (Green, 2003).
Dalam model random effect, perbedaan karakteristik individu
dan waktu diakomodasikan pada error dalam model. Model ini
mengasumsikan bahwa setiap individu mempunyai perbedaan
intersep yang merupakan variabel random atau stokastik
sehingga dengan model ini terdapat dua komponen error,
yaitu error
secara menyeluruh Ɛ dan error secara individu u . Secara
umum persamaan
model random effect adalah
Ide dasar:
Yit = β1i + β2 X 2it + ..... + u it

intercept value untuk tiap cross-sectional units dapat ditunjukkan


sebagai
β1i = β1 + ei dimana, i = 1, 2,…,N

ei adalah random error term dengan rata-rata nol dan varian σ e2


β1 adalah common mean value untuk intersep
Perbedaan intersep antar individu atau cross-sectional units
direfleksikan dalam ei
Yit = β1 + β2 X 2it + .... + ei + u it

= β1 + β2 X 2it + .... + wit

ei menunjukkan deviasi intersep individu dari nilai rata-rata dan


unobservable atau laten variable.
Metode Estimasi adalah Generalized Least Square (GLS) “most
appropriate than OLS method”.

Pada kasus diatas dimana ada 80 data disusun seperti biasa


(stacking).
Ada dua pendekatan yang digunakan :
1. Fixed Effect
2. Random Effect

FIXED EFFECT APPROACH


Ada beberapa kemungkinan:
1. Semua koefisien berbeda menurut waktu dan individual
Dengan metode OLS, susun data secara stacking yaitu
untuk kasus diatas stack 20 observasi untuk setiap
perusahaan diatas perusahaan yang lain (Example, See:
Gujarati, 2003:p.641) dengan menggunakan program E-
views.
Dependent Variable: Y
Method: Least Squares
Date: 06/04/05 Time: 19:17
Sample: 1 80
Included observations: 80
Variable Coefficien Std. Error t-Statistic Prob.
t
C - 29.60893 -2.141278 0.0354
63.40095
X2 0.110083 0.013727 8.019579 0.0000
X3 0.303552 0.049295 6.157869 0.0000
R-squared 0.756615 Mean dependent 290.915
var 4
Adjusted R-squared 0.750293 S.D. dependent var 284.852
8
S.E. of regression 142.3429 Akaike info criterion 12.7911
3
Sum squared resid 1560135. Schwarz criterion 12.8804
6
Log likelihood - F-statistic 119.685
508.6453 4
Durbin-Watson stat 0.310957 Prob(F-statistic) 0.00000
0

2. Slope koefisien tetap namun intersep berbeda antar


individu (Fixed Effect atau Least Square Dummy
Variable/LSDV)
Fixed Effect Model (FEM): Yit = β1 + β2 X 2it + β3 X 3it + uit

Walaupun intersep setiap perusahaan berbeda, namun tidak


berbeda menurut waktu (time invariant). Membedakan intersep
setiap perusahaan dapat dilakukan dengan memasukkan
variable dummy untuk masing-masing perusahaan (differential
intercept dummies) (Example, see: Gujarati, 2003:p.643).

Yit = α1 + α2 D2i + α3 D3i + α4 D4i + β2 X 2it + β3 X 3it + uit


dimana, D2i = 1 untuk observasi GM, dan 0 untuk lainnya; D3i = 1
untuk observasi US dan 0 untuk lainnya; D4i = 0 untuk WEST dan
0 untuk lainnya. Karena ada 4 perusahaan maka dummy variable
yang digunakan hanya 3 untuk menghindari dummy variable
trap (kondisi perfect collinearity). Dalam hal ini observasi GE
menjadi basis sehingga tidak dimasukkan dalam model.
Pemilihan ini dapat berbeda-beda untuk setiap peneliti. α1 adalah
intersep GE dan α2, α3, α4 adalah differential intercept yang
menunjukkan seberapa besar intersep GM, US dan WEST
berbeda dengan GE. Karena digunakan dummy variable untuk
mengestimasi fixed effect maka model tersebut disebut juga
dengan Least Square Dummy Variable (LSDV). Intersep untuk
masing-masing cross-sectional unit berbeda, contoh: GM
memiliki intersep (α1 + α 2 )
Dependent Variable: Y
Method: Least Squares
Date: 06/04/05 Time: 20:06
Sample: 1 80
Included observations: 80
Variable Coefficien Std. Error t-Statistic Prob.
t
C - 35.87026 -6.854615 0.0000
245.8768
D2 161.4154 46.53241 3.468882 0.0009
D3 339.2972 24.02329 14.12368 0.0000
D4 186.6105 31.55910 5.913048 0.0000
X2 0.108036 0.017537 6.160379 0.0000
X3 0.345946 0.026712 12.95116 0.0000
R-squared 0.934345 Mean dependent 290.915
var 4
Adjusted R-squared 0.929909 S.D. dependent var 284.852
8
S.E. of regression 75.41383 Akaike info criterion 11.5559
0
Sum squared resid 420856.2 Schwarz criterion 11.7345
5
Log likelihood - F-statistic 210.621
456.2359 8
Durbin-Watson stat 1.108195 Prob(F-statistic) 0.00000
0
Intersep untuk setiap perusahaan adalah sebagai berikut:
GE = -245.8768
GM = (-245.8768) + 161.4154 = -84,4614
US = (-245.8768) + 339.2972 = 93,4204
WEST = (-245.8768) + 186.6105 = -59,2663
Untuk pemilihan model yang baik, dapat diketahui dengan
menggunakan restricted F-test. Persamaan yang diestimasi
dengan OLS adalah persamaan restricted sedangkan yang
diestimasi dengan LSDV adalah unrestricted (Gujarati,
2003:p.643)

F=
(R
− R R2 / m
2
UR )
(
1 − RUR
2
)
/n− k
dimana,
RU2R = koefisien determinasi untuk unrestricted model (LSDV
model)
R R2 = koefisien determinasi untuk restricted model (OLS
model)
m = jumlah “restrictions”
n = jumlah sample
k = total jumlah koefisien regresi (termasuk konstanta)
jika F-hitung > F-tabel (m, n-k) maka OLS model invalid sehingga
LSDV atau FEM adalah valid.
Berikut hasil estimasi Fixed effect menggunakan program E-
views dengan metode pooled least square. Kita tidak perlu
memasukkan variabel dummy dan menghitung kembali nilai intersep
masing-masing perusahaan, karena fasilitas e-views telah secara
otomatis menghitung nilai intersep masing-masing perusahaan.
Dependent Variable: Y?
Method: Pooled Least Squares
Date: 05/16/06 Time: 16:12
Sample: 1935 1954
Included observations: 20
Number of cross-sections used: 4
Total panel (balanced) observations: 80
Variable Coefficien Std. Error t-Statistic Prob.
t
X2? 0.107948 0.017509 6.165319 0.0000
X3? 0.346162 0.026664 12.98212 0.0000
Fixed Effects
GE--C -
245.7924
GM--C -
84.22017
US--C 93.84046
WEST--C -
59.22581
R-squared 0.934563 Mean dependent 290.915
var 4
Adjusted R-squared 0.930141 S.D. dependent var 284.852
8
S.E. of regression 75.28890 Sum squared resid 419462.
9
Log likelihood - F-statistic 211.370
456.1032 6
Durbin-Watson stat 0.807158 Prob(F-statistic) 0.00000
0

3. Slope koefisien konstan namun intersep berbeda antar


individu dan waktu
Yit = α1 + α2 DGMi + α3 DUSi + α4 DWESTi + λ0 + λ1 Dum 35 + ...... + λ19 Dum 53 + β2 X 2i + β3 X 3i + u it

dimana, perbedaan waktu dummy35 dengan nilai 1 untuk


observasi tahun 1935 dan 0 untuk tahun lainnya, etc. Dalam hal
ini tahun 1954 digunakan base year dengan intersep λ0
Jika persamaan tersebut di estimasi, maka dummy perusahaan
sebagaimana koefisien X secara individual signifikan tapi tidak
untuk dummy waktu. Jadi, tidak ada time effect.
4. Semua koefisen berbeda antar individu
Asumsi : intersep dan slope koefisien berbeda untuk semua
individu atau cross-section unit.
Yit = α1 + α2 D2 i + α3 D3i + α4 D4 i + β2 X 2it + β3 X 3it + γ 1 ( D2 i X 2 it ) + γ 2 ( D2i X 3it ) + γ 3 ( D3i X 2 it )

+ γ 4 ( D3i X 3it ) + γ 5 ( D4 i X 2 it ) + γ 6 ( D4i X 3it ) + u it


γ menunjukkan differential slope coefficient; α menunjukkan
differential intercept.
Jika γ signifikan, hal ini menunjukkan slope coefficient berbeda
dari base group.
Contoh, misal β2 dan γ1 signifikan secara statistic, maka nilai
( β 2 + γ 1 ) adalah slope koefisien X2 untuk General Motor (GM) yang

berbeda dengan General Electric sebagai perusahaan


pembanding.
Jika semua intersep dan slope koefisien berbeda adalah
signifikan secara statistic, maka dapat disimpulkan bahwa fungsi
investasi untuk GM, US dan WEST berbeda dari GE.
RANDOM EFFECTS APPROACH/ERROR COMPONENTS
MODEL (ECM)
Berikut hasil estimasi ECM dengan program E-views (See:
Gujarati, 2003:p.645)
Dependent Variable: Y?
Method: GLS (Variance Components)
Date: 05/16/06 Time: 16:14
Sample: 1935 1954
Included observations: 20
Number of cross-sections used: 4
Total panel (balanced) observations: 80
Variable Coefficien Std. Error t-Statistic Prob.
t
C - 83.94957 -0.869990 0.3870
73.03531
X2? 0.107655 0.016817 6.401618 0.0000
X3? 0.345710 0.026545 13.02351 0.0000
Random Effects
GE--C -
169.9282
GM--C -
9.507820
US--C 165.5613
WEST--C 13.87475
GLS Transformed
Regression
R-squared 0.932375 Mean dependent 290.915
var 4
Adjusted R-squared 0.930618 S.D. dependent var 284.852
8
S.E. of regression 75.03139 Sum squared resid 433487.
6
Durbin-Watson stat 0.780384
Unweighted
Statistics including
Random Effects
R-squared 0.934535 Mean dependent 290.915
var 4
Adjusted R-squared 0.932835 S.D. dependent var 284.852
8
S.E. of regression 73.82302 Sum squared resid 419637.
6
Durbin-Watson stat 0.806140
Beberapa hal yang perlu diperhatikan dalam estimasi ECM :
1. Jumlah random effect untuk semua perusahaan (contoh:4
perusahaan) adalah nol
2. Nilai rata-rata dari random error component yaitu ei adalah
common intercept value. Random effect dari masing-
masing individu menunjukkan seberapa random error
component suatu individu berbeda dari nilai common
intercept.
3. Nilai R2 didapatkan dari transformasi regresi dengan GLS.
Uji :
Breusch-Pagan test (Kmenta, 1971:p.629)
H 0 : σ e2 = 0
H 0 : σ e2 ≠ 0

 ∑ (∑ wˆ it ) 2
2

NT  i t
LM =  − 1 ~ χ2
2(T − 1) ∑∑ wˆ it 2
 i t 

untuk α (level of significance) = 0,05 dengan Z=1,96 maka jika


nilai LM-hitung > 1,96 maka reject/tolak H0 yang berarti random
effect model valid.
Bila dengan menggunakan test ini sudah valid, tidak perlu
melakukan Hausman test.
Pemilihan Fixed Effects Model dan Random Effects Model
Which model is better, FEM or ECM?
1. Diasumsikan ei dan X uncorrelated, maka ECM may be
appropriate dan sebaliknya ei dan X berkorelasi maka FEM
may be appropriate.
2. Beberapa metode pemilihan lainnya:
- Hausman test (See: Hausman,1978; Griffiths,
1995:p.463-465)
- Test untuk setiap model F-test untuk FEM dan
Breusch-Pagan untuk ECM
- Thumb’s rule (See:Gujarati, 2003:p.650-651)
Dimana, jika T (number of time series data) besar
dan N (number cross-sectional unit) kecil maka FEM
dan ECM similar
Jika T kecil dan N besar, maka FEM may be more
significant
Contoh:
Peneliti ingin mengetahui bagaimana pengaruh real value of firm
(X2), real capital stock (X3) terhadap real gross investment (Y)
untuk 4 perusahaan yaitu General Electric (GE), General Motor
(GM), US Steel (US) dan Westinghouse (West). Data untuk setiap
perusahaan adalah data time-series dengan periode 1935-1954,
untuk ketiga variabel. Sehingga ada 4 cross-sectional unit dan 20
periode waktu, sehingga secara keseluruhan ada 80 observasi.
Apriori, X2 dan X3 berpengaruh positif terhadap Y.
Dapat dituliskan dalam persamaan:
Yit = β1 + β2 X 2it + β3 X 3it + uit

dimana, i = 1,2,3,4 dan t = 1,2, ….,20


Asumsi variable X adalah nonstochastic dan error term mengikuti

asumsi klasik E (uit ) ~ N (0,σ 2 )


Sumber:
Materi kuliah Ekonometrika di STIS oleh Bpk Edi
Riza, 2010. Skripsi.Jakarta: Sekolah Tinggi Ilmu Statistik.
Nachrowi, D. Nachrowi & Hardius Usman.2006. Pendekatan
Populer dan Praktis Ekonometrika untuk Analisis Ekonomi
dan Keuangan. Jakarta: Lembaga Penerbitan FEUI
Winarno, Wing Wahyu. 2009. Analisis Ekonometrika dan
Statistika dengan Eviews.UPP STIM YKPN