Anda di halaman 1dari 36

MODEL REGRESI DATA

PANEL
Pengertian Data Panel
• Data panel merupakan kombinasi data runtut waktu (time
series) dan cross-section.
• Contoh data panel adalah data nilai investasi dan stok
kapital lima perusahaan selama periode 2000 – 2015.
• Dengan demikian ada 16 observasi time series untuk
setiap perusahaan. Karena ada lima perusahaan, berarti
observasi totalnya adalah 80 observasi.
Mengapa Data Panel?
• Karena data panel berhubungan dengan data mengenai
individual, perusahaan, wilayah, negara dan sebagainya
sepanjang waktu, maka terikat dengan adanya heterogenitas
dalam unit-unit data tersebut. Teknik estimasi data panel
memasukkan adanya heterogenitas tersebut.
• Dengan mengkombinasikan observasi time series dan cross
section, data panel memberikan data yang lebih informatif dan
variabilitasnya lebih besar, namun kolinearitasnya rendah antar
variabel, memiliki derajat kebebasan (degree of freedom) yang
lebih besar dan lebih efisien.
• Dengan mempelajari cross section yang berulang dari
observasinya, data panel lebih cocok untuk mempelajari
perubahan dinamik, misalnya pengangguran dan mobilitas
pekerja.
• Data panel bisa lebih baik dalam mendeteksi dan
mengukur efek yang tidak bisa diobservasi dalam data
cross-section atau time series murni, misalnya pengaruh
upah minimum terhadap kesempatan kerja.
• Data panel lebih memungkinkan untuk mempelajari model
perilaku yang rumit, misalnya mengenai skala ekonomi
dan kemajuan teknologi.
• Data panel dapat meminimumkan bias yang mungkin
dihasilkan jika data-data individual diagregatkan.
Panel Data: Sebuah Contoh
• Model biaya produksi enam perusahaan penerbangan
selama periode 1970 – 1984, sehingga data panelnya
menjadi 90 observasi.
• Variabel-variabelnya didefinisikan, Q = output, dalam
indeks, TC = biaya total, dalam $ 1000, PF = fuel price,
dan LF = load factor, rata-rata kapasitas digunakan, i =
perusahaan penerbangan, t = tahun,
• Terdapat empat kemungkinan dalam mengestimasi model
biaya produksi dari enam perusahaan penerbangan:
1. Pooled OLS model, yaitu menggunakan 90 observasi dan
mengestimasi regresi besar, yang mengabaikan sifat dari data
cross section dan time series.
2. Fixed effects least squares dummy variable (LSDV) model,
yaitu menggunakan gabungan observasi sebanyak 90 observasi,
namun dengan variabel dummy perusahaan penerbangan.
3. Fixed effects within-group model, yaitu menggunakan
gabungan 90 observasi, namun untuk setiap perusahaan
penerbangan dinyatakan tiap variabel sebagai deviasi dari nilai
rata-ratanya dan mengestimasi regresi OLS terhadap mean-
corrrected value.
4. Random effects model (REM), yaitu memperlakukan setiap
perusahaan penerbangan memiliki nilai intersep sendiri-sendiri,
tidak seperti pada LSDV model.
Model Regresi Pooled atau Koefisien
Konstan
• Pertimbangkan model berikut:
= + + + + (1)
= 1,2, … , 6
= 1,2, … , 15
• Dalam estimasi model terhadap gabungan 90 observasi,
diasumsikan bahwa koefisien regresi adalah sama untuk
seluruh perusahaan penerbangan, jadi tidak
membedakan antar perusahaan penerbangan.
• Diasumsikan pula bahwa variabel-variabel penjelas
adalah non stokastik. Jika stokastik, maka variabel-
variabel penjelas berkorelasi dengan error term.
Terkadang diasumsikan pula bahwa variabel-variabel
penjelas adalah eksogen sempurna (strictly exogenous).
• Variabel dikatakan strictly exogenous jika variabel
tersebut tidak tergantung pada nilai-nilai sekarang
(current), masa lalu (past) dan yang akan datang (future)
dari error termnya, (Gujarati dan Porter, 2009: 594).
• Diasumsikan pula bahwa error term, 0, ,
secara independen dan identik terdistribusi dengan rata-
rata nol (zero mean) dan varians konstan (constant
variance).
• Untuk tujuan uji hipotesis, diasumsikan bahwa error term
terdistribusi normal.
Contoh Data Estimasi
Model Regresi Data Panel
• Hasil regresi pooled OLS menunjukkan bahwa koefisien
regresi sangat signifikan secara statistik dan sesuai
dengan yang diharapkan dan nya juga sangat tinggi.
• Namun hati-hati dengan hasil ini, mengingat bahwa
Durbin-Watson statistic yang diperoleh rendah yang
mengindikasikan adanya autokorelasi.
• Rendahnya Durbin-Watson dapat juga akibat kesalahan
spesifikasi.
• Masalah utama pada hasil pooled OLS adalah tidak
membedakannya antar perusahaan penerbangan,
apakah respon biaya total terhadap variabel-variabel
penjelas sepanjang waktu sama untuk semua
perusahaan.
• Konsekuensinya error term mungkin berkorelasi dengan
beberapa regressor (variabel penjelas) yang dimasukkan
dalam model. Hal ini menyimpang dari asumsi penting
dalam model regresi linear klasik, yaitu tidak ada korelasi
antara regressor dan error term.
Model Fixed Effect Least-Squares
Dummy Variable (LSDV)
• Model LSDV memperkenankan adanya heterogenitas
diantara subjek-subyek dengan memperbolehkan tiap-tiap
entitas (dalam contoh ini perusahaan penerbangan) untuk
memiliki nilai intersep sendiri.
= + + + + (2)
= 1,2, … , 6
= 1,2, … , 15
• Model dengan persamaan (2) disebut dengan model fixed
effects.
• Walaupun intersep mungkin berbeda antar subyek,
namun intersep tiap-tiap entitas, , tidak bervariasi
sepanjang waktu (time-invariant).
Hasil Regresi Model LSDV
• Kelemahan dari penggunaan model LSDV Fixed Effect adalah:
1. Menggunakan terlalu banyak variabel dummy, yang akan
mengurangi derajat kebebasan (degrees of freedom).
2. Terlalu banyaknya variabel dummy bisa menimbulkan
problem multikolinearitas.
3. Dalam beberapa keadaan model LSDV mungkin tidak
mampu mengindentifikasi dampak dari time-invariant
variable.
4. Diperlukan asumsi-asumsi tambahan mengenai
0, : (1) asumsi bahwa error variance sama untuk
semua unit cross-section, (2) tiap-tiap entitas diasumsikan
tidak ada autokorelasi sepanjang waktu, dan (3) diasumsikan
tidak ada korelasi antara error term entitas satu dengan
entitas lainnya.
Fixed-Effect Within-Group (WG) Estimator
• Salah satu cara untuk mengestimasi pooled regression adalah
untuk menghilangkan fixed-effect, , dengan menyatakan
nilai-nilai variabel dependen dan variabel-variabel penjelasnya
untuk setiap perusahaan penerbangan sebagai deviasi atau
simpangan dari masing-masing nilai rata-ratanya.
• Nilai rata-rata sampel dari TC, Q, PF dan LF dinyatakan dalam
, , , dan dan kurangkan nilai-nilai tersebut dari nilai-
nilai individu variabel-variabel tersebut, − , − ,
− , − .
• Lakukan regresi terhadap regresi berikut:
• = + ! + "! +
• , , ! $% "! menyatakan nilai-nilai mean corrected.
Uji Restricted F: Model Pooled OLS vs
Fixed Effect
• Untuk memilih model yang tepat antara pooled OLS
(common effect) dan fixed effect model (FEM) dapat
didasarkan pada uji restricted F berikut:
&'
− '
/)
=
1− &'
/ %−*

&'
$% '
, masing-masing dari regresi
unrestricted (fixed effect) dan restricted (pooled), m =
jumlah retriksi linear, k = jumlah parameter dalam regresi
unrestricted, n = jumlah observasi.
• Ho : semua perbedaan intersep sama dengan nol
• Ha : semua perbedaan intersep tidak sama dengan nol
• Dari hasil estimasi regresi pooled OLS dan fixed effect
perhitungan restricted F adalah sebagai berikut:
,+, -. / ,+.- +0 /0
• = = 14,99
/ ,+, -. / + /+
• Dalam kasus ini model regresi restricted adalah model pooled
OLS karena memaksakan intersep sama untuk semua
perusahaan penerbangan. Jumlah restriksi linear adalah 5 (m
= 5). Mengapa 5?
• Jumlah parameter dalam regresi unrestricted (fixed effect)
adalah 9 (k = 9) dan jumlah observasi adalah 90 (n = 90).
• Karena F statistik signifikan (F stat > F kritis) atau prob. < 0,05
maka Ho ditolak, yang artinya semua perbedaan intersep antar
perusahaan penerbangan tidak sama dengan nol. Dengan kata
lain ada perbedaan intersep antar perusahaan penerbangan.
Karena itu dari uji F ini model fixed effect lebih tepat
dibandingkan model pooled OLS (common effect).
Hasil Regresi Fixed-Effect Within-Group
Hasil Regresi Fixed-Effect Model
Random Effects Model (REM)
• Dalam model Random Effects (REM), dalam persamaan
regresi
= + + + +
= 1,2, … , 6
= 1,2, … , 15
• diasumsikan bahwa adalah variabel random dengan
nilai rata-rata . Nilai intersep untuk setiap individu
perusahaan dapat dinyatakan sebagai:
= +
adalah random error term dengan nilai rata-rata nol (zero
mean) dan variance .
• Persamaan dalam estimasi model REM adalah
= + + + + +
= + + + +3
3 = +
• Composite error term 3 terdiri dari dua komponen: ,
yang merupakan komponen error dari cross-section, atau
individual-specific, dan , yang merupakan komponen
error kombinasi time series dan cross-section dan kadang
disebut idiosyncratic term karena bervariasi pada cross-
section (subyek) maupun waktu.
• Dinamakan Error Components Model (ECM) karena
composite error term terdiri dari dua (atau lebih)
komponen error.
• Asumsi umum yang dibuat oleh ECM adalah bahwa:

4(0, )
4(0, )
6( ) = 0; 6( 9 ) = 0 :
6( ; ) = 6( 9 ) = 6( 9; ) =0
( :; <)
• individual error components tidak berkorelasi satu sama
lain dan tidak berkorelasi lintas unit-unit cross-section
maupun time series.
• Catatan penting bahwa 3 , tidak berkorelasi dengan
setiap variabel penjelas yang dimasukkan ke dalam
model.
• Uji Hausman (Hausman test), merupakan uji yang
diterapkan jika 3 berkorelasi dengan variabel-variabel
penjelas, yaitu, apakah ECM merupakan model yang
tepat.
Hasil Regresi Random-Effect Model
Uji Hausman
• Hipotesis nol dalam uji Hausman adalah bahwa estimator
FEM dan ECM (REM) tidak berbeda.
• Statistik uji yang dikembangkan oleh Hausman memiliki
distribusi (Chi-Square) asymptotic.
• Jika hipotesis nol ditolak, kesimpulannya bahwa ECM
(REM) tidak tepat karena random effects kemungkinan
berkorelasi dengan satu atau lebih regressor (variabel
penjelas).
• Dalam kasus ini, FEM lebih dipilih daripada ECM (REM).
Hasil Uji Hausman
• Hasil uji Hausman secara jelas menolak hipotesis nol,
untuk nilai estimated Chi-Square dengan derajat
kebebasan (df) 3 sangat signifikan.
• Jika hipotesis nol benar, probabilitas mendapatkan nilai
chi-square sebesar 49.62 atau lebih adalah nol.
• Sebagai hasilnya, kita dapat menolak ECM (REM) untuk
memilih FEM.
Model Fixed Effects versus Random
Effects
Beberapa petunjuk mengenai pemilihan antara FEM dan
REM/ECM:
1. Jika T (jumlah data time series) besar dan N (jumlah unit
cross-section) kecil, perbedaan nilai parameter estimasinya
antara FEM dan ECM adalah kecil. Selanjutnya penentuan
pilihan didasarkan pada perhitungan-perhitungan yang
mudah dilakukan seperti contoh sebelumnya (misal uji
Hausman).
2. Jika N besar dan T kecil (yaitu panel pendek), estimasi yang
diperoleh kedua metode dapat berbeda signifikan. Jika kita
percaya bahwa unit-unit individu atau cross-sectional dalam
sampel tidak random dari sampel besar, maka FEM lebih
tepat. Jika unit-unit cross-sectional dalam sampel adalah
random, maka ECM lebih tepat.
3. Jika error component individu, , dan satu atau lebih
regressor berkorelasi, maka estimator-estimator ECM bias,
sementara yang diperoleh dari FEM tidak bias.
4. Jika N besar dan T kecil, dan jika asumsi-asumsi dalam ECM
terpenuhi, estimator-estimator ECM lebih efisien daripada FEM.
5. Tidak seperti FEM, ECM dapat mengestimasi koefisien-
koefisien variabel time-invariant seperti gender dan etnis. FEM
mengontrol variabel-variabel time-invariant, namun tidak
mengestimasi langsung, seperti dalam LSDV atau within-group
estimator models. Di lain pihak, FEM mengontrol seluruh
variabel-variabel time-invariant, sementara ECM dapat
mengestimasi hanya variabel-variabel time-invariant yang
secara eksplisit dimunculkan dalam model.
Referensi
Gujarati, D.N., Porter, D.C. (2009), Basic Econometrics,
Fifth Edition, McGraw-Hill/Irwin, New York.
• Variance-Inflating Factor (VIF):

• => = di mana A adalah koefisien determinasi dari


/? @
regresi antar variabel penjelas.
• Rule of thumb: Jika terdapat nilai VIF yang lebih dari 10
maka ada indikasi multikolinearitas

Anda mungkin juga menyukai