Anda di halaman 1dari 51

DEFINISI

 Panel Data adalah data yang memiliki dimensi


waktu dan ruang.
 Dalam panel data, data cross section yang sama
diobservasi menurut waktu.
 Jika setiap cross section unit memiliki jumlah
time series yang sama maka disebut dengan
balance panel.
 Jika jumlah observasi berbeda untuk setiap
cross section unit, disebut unbalanced panel
KENAPA PANEL DATA?
 Dalam penelitian, terkadang
dihadapkan pada kendala data.
 Kebutuhan akan suatu model
behavioral yang tidak bisa hanya
menggunakan data cross section saja
atau time series saja.
KEUNTUNGAN REGRESI DATA PANEL
(Baltagi,1995;Gujarati,2003;Hsiao,1995):
 Estimasi data panel dapat menunjukkan
adanya heterogenitas dalam tiap unit.
 Dengan data panel, data lebih
informatif, mengurangi kolinearitas
antara variabel, meningkatkan derajat
kebebasan dan lebih efisien
 Data panel cocok digunakan untuk
menggambarkan adanya dinamika
perubahan
 Data panel dapat lebih mampu mendeteksi dan
mengukur dampak yang tidak dapat diobservasi
pada data cross section atau time series murni.
 Data panel bisa digunakan untuk studi dengan
model yang lebih lengkap
 Data panel dapat meminimumkan bias yang
mungkin dihasilkan dalam agregasi
Model Dasar

Yt  ˆ  ˆ1 X 1t  ˆ 2 X 2t
time series
Yi  ˆ  ˆ1 X 1i  ˆ 2 X 2i
cross sec tion
         
Y  α̂  β̂ X  β̂ X  RSSR (common intersept & common slope )
it 1 1it 2 2it
Y  α̂ i  β̂ X  β̂ X  USSR (different intersept & common slope )
it 1 1it 2 2it
Bagaimana Mengestimasinya?

Kesulitan utama estimasi model data


panel adalah adanya faktor pengganggu
yang berpotensi mengandung gangguan
dari penggunaan observasi runtun waktu
dan lintas sektoral dan gabungan
keduanya.
Ada 3 prosedur estimasi data panel
(Pindyck&Rubinfeld, 1998:251) :
1. Menggabungkan data CS dan TS diestimasi
dg Regresi OLS
2. Model Fixed Effect atau model kovarian atau
disebut juga LSDV (Least Squares Dummy
Variable), menggunakan var dummy untuk
mengetahui variabel yang menyebabkan
perbedaan intersep antar individu (cross sect)
3. Model Random Effect atau Error component
model. Model ini menghitung faktor kesalahan
(error term) yang menimbulkan korelasi antar
unit waktu dan unit ruang.
Beberapa kemungkinan model
estimasi
(Gujarati,2003:640,Hsiao,1995:9-10):
 Intersep dan koefisien slope konstan setiap waktu dan
unit dan error menampung perbedaan tiap waktu dan
unit.
Yit   1   2 X 2it   3 X 3it  
 Koefisien slope konstan tetapi intersep bervariasi tiap
unit

Yit   1i   2 X 2it   3 X 3it  


 Koefisien slope konstan tetapi intersep
bervariasi tiap unit dan waktu
Yit   1it   2 X 2 it   3 X 3it   it
 Semua koefisien (intersep dan slope)
bervariasi tiap unit

Yit   1i   2 i X 2 it   3i X 3it   it
 Semua slope bervariasi tiap unit dan waktu

Yit  lit   2tX 2it   3tX 3it  it


Grafik Estimasi dengan PLS
Pendekatan LSDV
Fixed Effects Model (FEM)
Random Effect Model
Pengujian Pemilihan Model dalam Panel Data
Memilih antara PLS dan RE
Model Regresi Penggabungan Data
 Pada model ini diasumsikan semua
koefisien (slope & intersep) konstan.
 Estimasi dilakukan dg OLS
CONTOH ILUSTRASI

 Penelitian Y. Grunfeld tentang Teori


Investasi. Tujuannya untuk mengetahui
bagaimana real gross investment (Y)
dipengaruhi oleh real value of the firm (X2)
dan real stock capital (X3), dari 4
perusahaan selama 20 tahun (balanced
panel).
Model estimasi:

Yit   1   2 X 2it   3 X 3it   it

Xit diasumsikan nonstochastic dan

E (  it ) ~ N (0,  )
2
Hasil Estimasi Data Panel dg PooledOLS:
Hasil Estimasi Data Panel dg PooledGLS:
Fixed Effect Model
 Memasukkan variabel boneka (dummy) dalam
model agar intersep dimugkinkan berubah
bersama berjalannya waktu serta bersama unit
lintas sektoral yang berbeda. Model FEM atau
LSDV dpt dirumuskan sbb:

Yit   1   2 D2i   3 D3i   4 D4i   2 X 2it   3 X 3it   it


Hasil Estimasi Data Panel dg Fixed Effect
Yang perlu diperhatikan dg penggunaan
fixed effect model
 Penggunaan variabel dami akan
menimbulkan masalah degree of freedom
 kemungkinan terjadi multikolineritas
 fixed effect model tidak bisa digunakan
untuk mengetahui dampak variabel time
invariant
 hati-hati dengan error term. Asumsi klasik
error term harus dimodifikasi
Memilih Model DP dg OLS atau LSDV

 Dengan membandingkan hasil estimasi kedua


model
 Pilihan model dilakukan dengan Restricted F Test.

F
 R  R /m
2
UR
2
R

1  R  / n  k
2
UR
Hasil Restricted F Test:

F 
R  R  / m
2
UR
2
R

1  R  / n  k
2
UR

(0.9345  0.7565) / 3
F  67.110
(1  0.9345) / 74

 Hasil diatas dibandingkan dengan tabel F (3


numerator dan 74 denumerator) maka dapat
disimpulkan bahwa model LSDV lebih baik.
Variasi model lain dg perbedaan antar
waktu
Error Component Model

 Model data panel yang di dalamnya


melibatkan korelasi antar error term
karena berubahnya waktu maupun karena
berbedanya unit observasi dapat diatasi
dengan pendekatan Error Component
Model atau Random Effect Model.
Model dasar REM

Yit   1t   2 X 2it   3 X 3it   it


Dengan asumsi it adalah variabel random dengan
rata 1. sehingga intersep tiap unit adalah
it = 1 + εi
i = 1,2,…,N
εi adalah random error term dengan rata-rata nol
dan variance
 2
 Sehingga modelnya menjadi:

Yit   1   2 X 2it   3 X 3it   i   it


Yit   1   2 X 2it   3 X 3it   it
 it   i   it
 Error ωit terdiri dari dua komponen error, yaitu εi yang
merupakan error dari variasi unit, dan μit adalah error
dari kombinasi runtun waktu dan lintas sektor.
 Asumsi:
 i ~ N (0,  2 )
 it ~ N (0,  2 )
E ( i  it )  0
E ( i  j )  0, (i  j )
E (  it  is )  E (  it  jt )  E it  js )  0, (i  j  s )

Error component tiap unit tidak berkorelasi satu


sama lain dan tidak berkorelasi baik secara
runtun waktu maupun lintas sektoral.
Asumsi:
E ( it )  0 (ωit zero mean)

var( it )    
2

2

(homoskedastik)

cov( it ,  is )   (t  s)
2

(error dari unit yang sama pada
waktu yang beda berkorelasi)
Koefisien korelasinya adalah:

 2
corr ( it ,  is ) 
cov( it ,  js )  0(i  j )  2   2
(error dari unit yang beda tidak
berkorelasi)
 Jika tidak memperhitungkan korelasi
tadi dan diestimasi dengan OLS maka
estimatornya akan tidak efisien dan
tidak optimal.
 Metode yang biasa dipakai adalah
Generalized Least square (GLS).
 Estimasi dg GLS lbh efisien dari
estimasi dg model covariance, krn
estimasi GLS dilakukan dg membobot
observasi dg variance masing-masing.
Hasil Estimasi Data Panel dg Random Effect
Fixed Effect vs Random Effect
Menurut Judge (1985), ada beberapa hal yang
harus diperhatikan untuk menentukan
pendekatan mana yang dipilih (FEM atau
ECM):
1. Jika εi dan X berkorelasi lebih baik digunakan
FEM, dan jika εi dan X tidak berkorelasi lebih
baik digunakan ECM.
2. Jika T besar dan N kecil, perbedaan antara
keduanya relatif kecil. Tapi FEM lebih disukai.
Lanjutan FEM vs ECM …
3. Jika N besar dan T kecil, digunakan FEM jika
unit tidak random dari sampel yang besar dan
digunakan ECM jika unit diambil secara random.
4. Jika N besar dan T kecil dan jika asumsi ECM
terpenuhi, estimator ECM lebih efisien dibanding
FEM.

Uji untuk memilih ECM atau FEM dikemukakan


oleh Hausman.
Hausman Test
 Jika model yang akan diestimasi:
 Yit = o + 1Xit + ωit I = 1, …,n; t =1,…T
 Ωit = μi + εit
 Ho : Cov (X,μ) = 0
 H1 : Cov (X,μ) ≠ 0

ˆ fe  ˆ re ) 2
W  ~  2 (1)

V ( ˆ fe )  V ( ˆ re ) 
untuk multivaria te :
W  (βˆ fe  ˆ re )[V ( ˆ fe )  V ( ˆ re )] 1 ( ˆ fe  ˆ re ) ~  2 (k )
Beberapa Hal Yang Belum Didiskusikan:

1. Heteroskedastisitas dan autokorelasi


dalam ECM
2. Unbalanced panel data
3. Dynamic panel data models
4. Persamaan simultan dengan panel data
5. Variabel dependen kualitatif dan panel
data

Anda mungkin juga menyukai