Anda di halaman 1dari 19

REGRESI DATA PANEL

November 2022
§ Data panel merupakan data yang mengamati individu yang sama dari
waktu ke waktu. Individu bisa berupa: orang, rumah tangga, perusahaan,
negara, dan lainnya. Sementara waktu bisa berupa: hari, minggu, bulan,
tahun.
§ Bentuk data panel: data panel umumnya disusun dengan mengelompokkan
observasi cross section secara berurutan berdasarkan id time series
Keterangan:
id_cs: id cross section / kabupaten
tahun: id tahun
Desen, pdrb, penduduk: variabel

2
§ Data panel dapat dituliskan dalam persamaan:
𝑌!" = α + β 𝑋!" + 𝑢!"
Dimana:
𝑌 = Variabel dependen; 𝑋 = Variabel independen; α = konstanta; β = koefisien ;
𝑢 = error; Subskrip i = unit cross section; Subskrip t = unit watu
§ Persamaan data panel memiliki dua komponen error, yaitu:
§ unobserved heterogeneity: error yang konstan antar waktu (individual
heterogeneity) atau disebut juga dengan unobserved effects. Contoh:
motivasi dan kapasitas kognitif
§ idiosyncratic error: error yang bervariasi antar waktu
§ Sehingga bisa dituliskan menjadi: 𝑌!" = α + β 𝑋!" + 𝑎! + 𝜀!" , dimana 𝑢!" = 𝑎! +
𝜀!"
§ Persamaan data panel juga dapat memasukkan variabel waktu, sehingga
persamaan menjadi (kasus 2 periode): 𝑌!" = α + 𝛿 𝑑𝑦𝑒𝑎𝑟" + β 𝑋!" + 𝑎! + 𝜀!"
3
§ Dapat mengontrol heterogenitas individu
§ Menyajikan data yang lebih informatif, lebih bervariasi, sedikit kolinearitas
antar variabel, dan lebih banyak degree of freedom dan lebih efisien
§ Unggul dalam analisis dinamika perubahan (dynamic adjustment)
§ Data panel lebih baik dalam mengidentifikasi dan mengukur pengaruh yang
tidak terdeteksi dengan hanya menggunakan data time series atau cross section.
§ Data panel unggul untuk membentuk dan menguji model perilaku yang
kompleks daripada hanya menggunakan cross section atau time series.
§ Data panel mikro mengumpulkan data individu, perusahaan, dan rumah tangga
yang pengukurannya lebih akurat dibanding dengan variabel yang sama di
level makro.
§ Data panel makro memiliki durasi waktu yang panjang dan tidak seperti data
time series yang mengalami permasalahan distribusi non-standar dalam uji akar
unit.
4
Sumber: Baltagi (2005)
§ Masalah dalam desain dan pengumpulan data
§ Distorsi dari kesalahan pengukuran
§ Masalah selectivity
§ Dimensi time series yang singkat
§ Cross-country dependence

5
Sumber: Baltagi (2005)
§ Data panel mikro merupakan data dengan dimensi waktu T yang
lebih sedikit dibandingkan dengan dimensi individu N (T<N).
Contoh: Indonesia Family Life Survey (IFLS) yang disurvei sejak
1993, 1997, 2000, 2007, 2014 dengan jumlah responden individu
sekitar 50.000 (tahun 2014)

§ Data panel makro merupakan data panel dengan dimensi waktu T


yang sebanding atau lebih banyak dibanding dimensi individu N
(T >= N). Contoh: data indikator makro (misal: pertumbuhan
ekonomi) 10 negara di ASEAN selama periode 1950 – 2019.

6
§ Analisis panel statis: tidak terdapat lag variabel dependen dalam
variabel independen, yang dimodelkan dengan persamaan:
𝑌!" = β 𝑋!" + 𝑢!"

§ Analisis panel dinamis: lag dari variabel dependen masuk sebagai


variabel independen
𝑌!" = δ 𝑌!,"$% + β 𝑋!" + 𝑢!"

7
§ Analisis panel linear: Teknik estimasi panel data yang digunakan saat
hubungan antar variabel bersifat linear. Metode estimasi
menggunakan Ordinary Least Square (OLS)

§ Analisis panel non-linear: teknik estimasi panel data yang digunakan


saat hubungan antar variabel bersifat non-linear. Metode estimasi
menggunakan Maximum Likelihood Estimation (MLE)

8
Dalam analisis panel data mikro, terdapat tiga jenis model yang umum digunakan:
1. Pooled OLS. Digunakan apabila diasumsikan unit cross section tidak memiliki
individual heterogeneity dan tidak ada korelasi antara unobserved effects dengan
variabel penjelas
2. Fixed Effects/First Difference. Digunakan jika unobserved effects berkorelasi
dengan variabel penjelas.
3. Random Effects. Digunakan jika unobserved effects tidak berkorelasi dengan
variabel penjelas

9
§ Saat kita melakukan analisis data panel dengan Pooled OLS, permasalahan yang
berpotensi muncul adalah serial correlation antar composite error pada t1 dengan t2,
serta potensi korelasi antara unobserved effects dengan variabel penjelas.
§ Permasalahan pertama mengakibatkan standard error menjadi bias, sehingga
pengambilan kesimpulan mengenai tingkat signifikansi tidak bisa dilakukan dengan
tepat. Permasalahan kedua mengakibatkan bias pada koefisien regresi.
§ Solusinya menggunakan model fixed effects/first difference

10
Fixed effects digunakan jika diduga terdapat korelasi
antara unobserved effects dengan variabel penjelas di
dalam persamaan regresi. Misal persamaan data panel:
𝑌!" = α + β 𝑋!" + 𝑎! + 𝜀!"
Fixed effects digunakan apabila: Cov (𝑋!" , 𝑎! ) ≠ 0

11
§ Misalkan terdapat model panel dengan satu variabel penjelas
berikut:
𝑌!" = β 𝑋!" + 𝑎! + 𝜀!" , 𝑡 = 1, 2, … , 𝑇 …..(1)
§ Untuk setiap cross section (𝑖), hitung nilai rata-rata setiap variabel
untuk seluruh periode waktu, sehingga diperoleh persamaan:
𝑦1! = 𝛽% 𝑥̅! + 𝑎! + 𝜀!̅ …..(2)

§ Kemudian persamaan 1 dan 2 di atas diselisihkan, maka diperoleh:


𝑌!" − 𝑦1! = β (𝑋!" − 𝑥̅! ) + (𝑎! − 𝑎! ) + (𝜀!" − 𝜀)̅ 𝑡 = 1, 2, … , 𝑇
atau dituliskan: 𝑦̈ !" = 𝛽% 𝑥̈ !" + 𝜀!"
̈ 𝑡 = 1, 2, … , 𝑇
§ Selanjutnya, model dapat diestimasi dengan model OLS, sebab 𝑎! 12
telah dihilangkan dari model regresi.
§ Tidak terdapat korelasi antara idiosyncratic error (𝜀!" ) dengan
setiap variabel penjelas
§ Setiap variabel penjelas yang konstan antar waktu akan ikut
dihilangkan dari model, seperti jenis kelamin, suku, dan lainnya.
§ Untuk variabel yang konstan antar waktu, bisa diinteraksikan
dengan setiap variabel dummy waktu untuk memperoleh
informasi apakah pengaruh dari variabel tersebut berubah antar
waktu.
§ Idiosyncratic error (𝜀!" ) bersifat homoskedastis dan tidak terdapat
korelasi serial antar waktu.
13
§ Model dummy variable regression mengasumsikan bahwa unobserved
effects (𝑎! ) merupakan parameter yang bisa diestimasi. Dengan
demikian 𝑎! merupakan nilai intersep untuk masing-masing unit cross
section.
§ Model dummy variable tidak cocok digunakan untuk unit cross section
yang jumlahnya banyak.
§ Hasil regresi model dummy variable (koefisien β) sama dengan model
fixed effects

14
• Selain model fixed effects, cara menghilangkan unobserved effects
dalam data panel melalui first difference. Metode first difference
menghitung selisih nilai setiap variabel antar waktu.
• Proses diferensi akan menghilangkan unobserved effects yang
konstan antar waktu.
• Variabel lain yang nilainya konstan antar waktu juga akan
dihilangkan dari model, seperti variabel jawa
• Perintah: reg D.(apm_smp desen rabfp tk lpenduduk lpdrb jawa)

15
§ Misalkan terdapat model panel dua periode dengan satu variabel
penjelas berikut:
𝑌!" = 𝛽& + β 𝑋!" + 𝑎! + 𝜀!" , 𝑡 = 1, 2 …..(1)
§ Untuk setiap cross section (𝑖), buat persamaan regresi pada setiap 𝑡 :
untuk 𝑡 = 1, è 𝑌!% = 𝛽& + β 𝑋!% + 𝑎! + 𝜀!%
untuk 𝑡 = 2, è 𝑌!' = (𝛽& + 𝛿( ) + β 𝑋!' + 𝑎! + 𝜀!'
§ Kemudian persamaan 𝑡 = 2 dikurangi dengan 𝑡 = 1, maka diperoleh:
𝑌!' − 𝑌!% = 𝛿( + β (𝑋!' − 𝑋!% ) + (𝑎! − 𝑎! ) + (𝜀!' − 𝜀!% )
atau dituliskan: ∆𝑦! = 𝛿( + 𝛽% ∆𝑥! + ∆𝜀!
§ Selanjutnya, model dapat diestimasi dengan model OLS, sebab 𝑎!
16
telah dihilangkan dari model regresi.
§ Random Effects digunakan jika diduga tidak terdapat korelasi
antara unobserved effects dengan variabel penjelas di dalam
persamaan regresi. Misal persamaan data panel:
𝑌!" = α + β 𝑋!" + 𝑎! + 𝜀!"
§ Karena Cov (𝑋!" , 𝑎! ) = 0, sehingga 𝑎! bisa masuk dalam error, yang
disebut composite error term. Persamaannya dapat ditulis menjadi:
𝑌!" = α + β 𝑋!" + 𝑢!" , dimana 𝑢!" = 𝑎! + 𝜀!"
§ Kelebihan random effects: Tidak ada variabel yang konstan antar
waktu yang hilang dari model. Model random effects juga lebih
efisien dibandingkan fixed effects.
§ Namun kelemahan model random effects adalah tidak konsisten jika
terdapat korelasi antara unobserved effects dengan variabel
penjelas. 17
§ Permasalahan yang muncul bila 𝑎! masuk dalam composite error
adalah adanya korelasi composite error antar waktu. Ini menjadi
alasan mengapa pooled OLS tidak bisa digunakan meskipun
unobserved effects tidak berkorelasi dengan variabel penjelas.
Untuk mengatasi hal tersebut, digunakan transformasi sebagai
berikut:
𝜎)' %/'
𝜃 =1 −[ ' ]
𝜎) + 𝑇𝜎*'
§ Dimana nilai 𝜃 antara 0 sampai 1.
𝑌!" − 𝜃 𝑦1! = 𝛽( 1 − 𝜃 + β% (𝑋!" − 𝜃 𝑥̅! ) + (𝑢!" − 𝜃 𝜀)̅
§ Jika nilai 𝜃 = 0, maka estimasi menggunakan Pooled OLS.
Sebaliknya, jika nilai 𝜃 = 1, maka estimasi menggunakan Fixed
Effects. Namun dalam praktiknya, nilai 𝜃 tidak bernilai 1 atau 0.
18
• Penentuan model fixed effects atau random effects dapat menggunakan
Hausman Test.
• Hausman menguji perbedaan koefisien antara fixed effects dengan
random effects.
• Namun, uji ini tidak menjawab apakah terjadi korelasi antara
unobserved effects dengan variabel penjelas.
• Uji hipotesis:
Ho = tidak ada perbedaan sistematis antara fixed effects dengan
random effects
Ha = terdapat perbedaan sistematis antara fixed effects dengan random
effects

19

Anda mungkin juga menyukai