Anda di halaman 1dari 40

05 Regresi Data Panel

Jenis data, fokus, dan penggunaannya


Data runtun waktu Data potong lintang Data panel
(time series) (cross section) (data longitudinal)
Tipe data yang terdiri Tipe data yang Data observasi
dari observasi mengobservasi runtun waktu dari
Definisi terhadap satu subyek banyak subyek pada sejumlah subyek
individu pada titik waktu yang individu pada
berbagai titik waktu sama setiap waktunya
Menganalisis Menganalisis Menganalisis proses
perubahan subyek informasi mengenai perubahan setiap
Penggunaan individu selama suatu suatu isu spesifik subyek individu
interval waktu pada suatu waktu selama rentang
tertentu tertentu waktu tertentu
Kaakteristik data longitudinal
• Intersep (α) dan kemiringan (β) sama di setiap waktu
• Kemiringan (β) sama namun intersep (α) berbeda di setiap individu,
atau di setiap waktu, atau disetiap individu dan waktu
• Kemiringan (β) maupun intersep (α) berbeda di setiap individu dan
waktu
Data panel (data longitudinal)

Data multi dimensi dari observasi yang diukur berulangkali selama


rentang data tertentu

1. Obyek individu yang sama diobservasi berulang-ulang


2. Setiap individu diukur menggunakan berbagai variabel
3. Observasi dilakukan pada berbagai titik waktu
Regresi Data Panel
• gabungan antara data cross section dan data time series,
• Unit cross section yang sama diukur pada waktu yang berbeda  data
panel merupakan data dari beberapa individu sama yang diamati
dalam kurun waktu tertentu. Jika terdapat T periode waktu (t =
1,2,…,T) dan N jumlah individu (i = 1,2,…,N), maka dengan data panel
kita akan memiliki total unit observasi sebanyak NT.
Jenis Data Panel
• Balanced panel: setiap cross-section unit memiliki jumlah observasi
time-series yang sama.
• Unbalanced panel: jumlah observasi berbeda untuk setiap cross-
section unit
Keuntungan menggunakan data panel

Mengandung lebih banyak informasi, lebih banyak variabilitas, dan


lebih efisien daripada hanya data runtun waktu atau data potong
lintang  dapat mendeteksi dan mengukur efek statistik yang tidak
dapat diukur menggunakan data runtun waktu atau data potong
lintang
• Memungkinkan pengukuran besarnya perubahan berbagai individu selama
rentang waktu tertentu
• Memungkinkan pengukuran durasi dari kejadian
• Mencatat waktu terjadinya berbagai kejadian
Keuntungan menggunakan data panel (Hsiao,
2003 dalam Baltagi, 2021)
• Estimasi data panel dapat mencakup masalah heterogenitas
• Data panel memberikan informasi lebih banyak, lebih bervariasi,
mempersedikit kolinieritas antar variabel, dan lebih efisien
• Data panel lebih baik digunakan untuk melihat perubahan yang
bersifat dinamik.
• Data panel dapat mendeteksi dan mengukur efek lebih baik.
• Data panel memungkinkan kita untuk meneliti model yang lebih
kompleks  behavioral models
• Data panel dapat meminimalkan bias
• Menghindari masalah multikolinieritas
Keuntungan menggunakan data panel –
kesimpulan
dapat menjelaskan dua macam informasi:
• informasi cross-section: perbedaan antar subjek,
• informasi time series: merefleksikan perubahan pada subjek waktu.

Ketika kedua informasi tersebut tersedia, maka analisis data


panel dapat digunakan.
Kesulitan dalam menggunakan data panel –
kesimpulan
Faktor pengganggu akan berpotensi mengandung gangguan yang
disebabkan penggunaan observasi runtun waktu, observasi lintas
sektoral, serta gabungan keduanya
• Penggunaan observasi lintas sektoral mempunyai potensi tidak
konsistennya parameter regresi.
• Penggunaan observasi runtun waktu mempunyai potensi autokorelasi
antar observasi.
Contoh klasifikasi cara pengambilan data:
Pada data time series, satu atau lebih Pada data cross-section merupakan
variabel akan diamati pada satu unit amatan dari beberapa unit observasi
observasi dalam kurun waktu tertentu dalam satu titik waktu
Tingkat Inflasi di Indonesia 2013 - 2017 Tingkat Inflasi 5 Negara ASEAN Tahun 2018
Tahun Inflasi Negara Inflasi 2018 (%)
2013 8,4 Indonesia 3,1
2014 8,4 Malaysia 0,3
2015 4,9 Filipina 5,9
2016 3 Singapura 0,5
2017 3,6 Thailand 0,8
Sumber : https://www.bi.go.id Sumber : https://www.bi.go.id
Data Panel adalah gabungan antara data cross section dan data time
series, dimana unit cross section yang sama diukur pada waktu yang
berbeda.

Tingkat Inflasi 5 Negara ASEAN Periode 2013 - 2017


Tahun Indonesia Malaysia Filipina Singapura Thailand

2013 8,4 3,0 3,4 2,0 1,7


2014 8,4 2,8 2,9 -0,1 1,1
2015 4,9 2,6 0,3 -0,7 -0,9
2016 3,0 1,6 2,0 0,0 0,7
2017 3,6 3,5 3,0 0,5 0,9
Sumber : https://www.bi.go.id
Estimasi Data Panel
• Terdapat 3 cara estimasi (Pindyck dan Rubinfeld, 1998)
• Regresi Penggabungan semua data (Pooled OLS)
• Covariance Model (Fixed Effects  Least Squares Dummy Variable (LSDV)
Model
• Error Component Model (Random Effects)
Estimasi Data Panel
Menganggap data sebagai data Menerima bahwa selain variabel X terdapat hal-hal lain
cross sectional sehingga variabel Y seperti perbedaan dalam individu sampel dan variasi dalam
hanya dipengaruhi oleh variabel X waktu mempengaruhi besarnya Y
dan mengabaikan bahwa data
memiliki dimensi waktu dan
individual  asumsi sama dengan Selain dipengaruhi oleh variabel Selain dipengaruhi oleh variabel
regresi OLS X, variabel Y juga dipengaruhi X dan perbedaan dalam individu
oleh perbedaan dalam individu unit analisis (sampel), variabel Y
a unit analisis (sampel) juga dipengaruhi oleh variasi
dalam waktu
Pooled Least Square
(PLS)
Fixed Effect Random Effect
y = a + bx y = bx + fixed effect sampel y = bx + fixed effect sampel
+ efek waktu
Estimasi Data Panel – Pooled Least Square

• Analisis regresi least squares yang mengabaikan kemungkinan data


memiliki kelompok-kelompok yang berbeda
• Hanya mengkombinasikan data time series dan cross section
• Mengasumsikan bahwa koefisien regresi adalah sama untuk setiap
unit cross sectional dan pada semua periode waktu  model regresi
memiliki intersep dan kemiringan yang konstan dan sama
• Data dapat digabungkan dan analisis dilakukan menggunakan regresi
linier biasa
Estimasi Data Panel – Fixed Effects
• Hanya tertarik untuk menganalisis dampak variabel yang bervariasi
dengan berjalannya waktu
• Perbedaan dalam unit cross sectional ditunjukkan dengan perbedaan
dalam intersep (konstanta regresi) yang bervasiasi dalam unit-unit
cross sectional namun kemiringannya sama antar unit yang dianalisis
• Asumsi:
• Terdapat kondisi di sampel individu yang mungkin mangganggu variable
bebas dan karena itu harus dikontrol
• Karakteristik yang tidak berubah bersifat unik untuk setiap sampel dan tidak
berkorelasi dengan karakteristik individual
Estimasi Data Panel – Fixed Effects

Persamaan: 𝑌𝑖𝑡 = 𝛼𝑖 + 𝛽𝑘 𝑋𝑘,𝑖𝑡 + 𝜀𝑖𝑡

i = unit yang dianalisis, t = waktu


𝛼𝑖 = intersep untuk setiap unit yang dianalisis
𝑌𝑖𝑡 = variabel terikat
𝑋𝑘,𝑖𝑡 = vaiabel bebas ke i
𝛽𝑘 = koefisien untuk masing-masing variabel bebas
𝜀𝑖𝑡 = kesalahan regresi
Estimasi Data Panel – Random Effects
• Variasi diantara unit yang analisis (misal: perusahaan) adalah acak dan
tidak berkorelasi dengan variabel bebas
• setiap kelompok memiliki perbedaan intersep yang diakomodasi oleh
residual masing-masing unit yang dianalisis yang tidak berkorelasi
dengan variabel bebas
• Efek individual terdistribusi secara acak diseluruh unit cross section.
Untuk dapat mengangkap efek individual, model regresi hanya
memiliki satu intersep mewakili seluruh konstanta
• Keuntungan: melibatkan variabel yang tidak berubah
Estimasi Data Panel – Random Effects

Persamaan: 𝑌𝑖𝑡 = 𝛼 + 𝛽𝑘 𝑋𝑘,𝑖𝑡 + 𝑢𝑖𝑡 + 𝜀𝑖𝑡

i = unit yang dianalisis, t = waktu


𝛼 = intersep
𝑌𝑖𝑡 = variabel terikat
𝑋𝑘,𝑖𝑡 = vaiabel bebas ke i
𝛽𝑘 = koefisien untuk masing-masing variabel bebas
𝑢𝑖 = dampak individu dari unit analisis ke i, bukan variable yang dapat diukur
𝜀𝑖𝑡 = kesalahan regresi
Persamaan Regresi Data Panel
Persamaan Regresi data panel ada 2 macam , yaitu One Way
Model dan Two Way Model.
One Way Model adalah model satu arah, karena hanya
mempertimbangkan efek individu (αi) dalam model. Berikut
Persamaannya:

Dimana:
α = Konstanta
β = Vektor berukuran P x 1 merupakan parameter hasil estimasi
Xit = Observasi ke-it dari P variabel bebas
αi = efek individu yang berbeda-beda untuk setiap individu ke-i
Eit = error regresi seperti halnya pada model regresi klasik.
Model Data Panel
Two Way Model adalah model yang mempertimbangkan
efek dari waktu atau memasukkan variabel waktu. Berikut
Persamaannya:

Persamaan di atas menunjukkan dimana terdapat


tambahan efek waktu yang dilambangkan
dengan delta yang dapat bersifat tetap ataupun bersifat
acak antar tahunnya.
Asumsi Regresi Data Panel
• Metode Regresi Data Panel akan memberikan hasil pendugaan yang
bersifat Best Linear Unbiased Estimation (BLUE) jika semua
asumsi Gauss Markov terpenuhi diantaranya adalah non-
autcorrelation.
• Non-autocorrelation: sulit terpenuhi pada saat kita melakukan analisis
pada data panel sehingga pendugaan parameter tidak lagi bersifat
BLUE. Jika data panel dianalisis dengan pendekatan model-
model time series seperti fungsi transfer, maka ada informasi
keragaman dari unit cross section yang diabaikan dalam pemodelan.
Salah satu keuntungan dari analisis regresi data panel adalah
mempertimbangkan keragamaan yang terjadi dalam unit cross
section.
Keuntungan Regresi Data Panel
Keuntungan melakukan regresi data panel, antara lain:
• Pertama, dapat memberikan peneliti jumlah pengamatan yang besar,
meningkatkan degree of freedom (derajat kebebasan), data memiliki
variabilitas yang besar dan mengurangi kolinieritas antara variabel
penjelas, di mana dapat menghasilkan estimasi ekonometri yang
efisien.
• Kedua, panel data dapat memberikan informasi lebih banyak yang
tidak dapat diberikan hanya oleh data cross section atau time series
saja.
• Ketiga, panel data dapat memberikan penyelesaian yang lebih baik
dalam inferensi perubahan dinamis dibandingkan data cross section.
Tahapan Regresi Data Panel
Tidak seperti regresi biasanya, regresi data panel harus melalui tahapan penentuan model estimasi yang tepat.
Berikut diagram tahapan dari regresi data panel:
Penentuan Metode Estimasi Regresi Data
Panel
• Uji Chow
• Uji Hausman
• Uji Lagrange Multiplier
Penentuan Metode Estimasi Regresi Data
Panel – Uji Chow
• dilakukan dengan penambahan variabel dummy sehingga dapat
diketahui bahwa intersepnya berbeda dapat diuji dengan uji Statistik F
• digunakan untuk mengetahui apakah teknik regresi data panel
dengan metode Fixed Effect lebih baik dari regresi model data panel
tanpa variabel dummy atau metode Common Effect.
Penentuan Metode Estimasi Regresi Data
Panel – Uji Chow
• Menguji apakah parameter-parameter dari satu kelompok data sama
dengan parameter-parameter dari kelompok data yang lain  jika ya,
maka data dapat digabungkan (di ‘pool’)
• Jika intersep antar kelompok berbeda maka hal ini berarti model Fixed
Effect
Penentuan Metode Estimasi Regresi Data
Panel – Uji Chow
• pengujian untuk menentukan model apakah Pooled Least Square (CE)
ataukah Fixed Effect (FE) yang paling tepat digunakan dalam
mengestimasi data panel.
• Apabila Hasil:
• Menerima H0: Pilih Pooled Least Square (CE)  data dapat digabungkan,
intersep antar kelompok sama
• Menolak H0 : Pilih Fixed Effect (FE)  intersep antar kelompok berbeda
Penentuan Metode Estimasi Regresi Data
Panel – Uji Hausman
• didasarkan pada ide bahwa Least Squares Dummy Variables (LSDV)
dalam metode metode Fixed Effect dan Generalized Least Squares
(GLS) dalam metode Random Effect adalah efisien sedangkan
Ordinary Least Squares (OLS) dalam metode Common Effect tidak
efisien.
Penentuan Metode Estimasi Regresi Data
Panel – Uji Hausman
• Menguji apakah error untuk masing-masing unit berkorelasi dengan
variabel bebas
• H0: error masing-masing unit tidak berkorelasi dengan variabel bebas
• H1: error masing-masing unit berkorelasi dengan variabel bebas
Penentuan Metode Estimasi Regresi Data
Panel – Uji Hausman
• adalah pengujian statistik untuk memilih apakah model Fixed Effect
atau Random Effect yang paling tepat digunakan.
• Apabila Hasil:
• Menerima H0: Pilih Random Effect (CE)
• Menolak H0 : Pilih Fixed Effect (FE)
Penentuan Metode Estimasi Regresi Data
Panel – Uji Lagrange Multiplier
Didasarkan pada nilai residual dari metode Common Effect.
Penentuan Metode Estimasi Regresi Data
Panel – Uji Lagrange Multiplier
Menguji apakah terdapat efek cross section (dalam setiap unit yang
dianalisis) dan waktu dalam data
Penentuan Metode Estimasi Regresi Data
Panel – Uji Lagrange Multiplier
• uji untuk mengetahui apakah model Random Effect lebih baik
daripada metode Common Effect (PLS) digunakan.
• Apabila Hasil:
• Menerima H0: Pilih Pooled Least Square (CE)
• Menolak H0 : Pilih Random Effect (FE)
Dari ketiga uji untuk menentukan Metode Estimasi di atas,
digambarkan dalam grafik di bawah ini:
Contoh hasil regresi
Fixed Effect

Jika menggunakan Eviews akan dapat


ditampilkan hasil dampak perbedaan Cross
Section untuk masing-masing unit yang
dianalisis (untuk mengerjakannya dapat
dilihat melalui link youtube di bawah)

Catatan: jika pengerjaan menggunakan


random effect, dampak perbedaan Cross
Section untuk masing-masing unit juga
dapat dibuat

Cara pengerjaannya adalah dengan


melakukan Unstack, dapat dilihat pada
link berikut (mulai detik ke 26)
https://www.youtube.com/watch?v=Z5
_WIUVqW8E
Contoh regresi data panel – fixed effect
8
Data upah untuk 15 perusahaan (N =
15) selama 7 tahun (T = 7) sehingga
jumlah data = 15 x 7 = 105
7.5
Jika data dianggap sama (mengikuti
Pooled OLS) maka hasil regresi adalah
garis berwarna biru 7

6.5

5.5

5
0 5 10 15 20 25 30 35 40
Contoh regresi data panel – fixed effect
• Jika data diplot untuk setiap
perusahaan maka akan terlihat 8

bahwa masing-masing perusahaan


akan memiliki kelompoknya sendiri
7.5
(terlihat dari warna yang berbeda
untuk masing-masing kelompoknya)
• Dengan demikian pooled least 7

square tidak dapat digunakan di sini


• Hasil plot data juga menunjukkan 6.5
bahwa kemiringan data untuk
masing-masing kelompok adalah
sama sedangkan intersep adalah 6

berbeda
5.5

5
0 5 10 15 20 25 30 35 40
Hasil regresi
dengan Fixed Estimate Std. Error t value Pr(>|t|)
effect X 0.099915 0.005263 18.98<2e-16***
Koefisien regresi
Perusahaan1 5.365268 0.051571 104.04<2e-16***
fixed effect
Perusahaan2 3.201247 0.178413 17.94<2e-16***
Perusahaan3 5.611434 0.062499 89.78<2e-16***
Perusahaan4 2.989852 0.183541 16.29<2e-16***
Perusahaan5 5.605458 0.079650 70.38<2e-16***
Perusahaan6 4.195386 0.157990 26.55<2e-16***
Perusahaan7 4.512411 0.103141 43.75<2e-16***
Konstanta untuk
masing-masing Perusahaan8 3.994000 0.142792 27.97<2e-16***
perusahaan Perusahaan9 6.297705 0.051571 122.12<2e-16***
Perusahaan10 5.912651 0.051571 114.65<2e-16***
Perusahaan11 4.231716 0.147844 28.62<2e-16***
Perusahaan12 4.368264 0.132738 32.91<2e-16***
Perusahaan13 4.267610 0.157990 27.01<2e-16***
Perusahaan14 5.188914 0.103141 50.31<2e-16***
Perusahaan15 4.977247 0.075176 66.21<2e-16***
Contoh regresi data panel – fixed effect
8
Untuk regresi linier biasa, persamaan regresinya adalah:
y = 6.3570963 + 0.014959 * x

Y hasil regresi (Ŷ) untuk perusahan pertama di tahun pertama = 7.5 13


14 6
y = 6.3570963 + 0.014959 * 3 = 6.40173 9 5

Untuk fixed effect, perhitungannya adalah untuk masing-masing 7

perusahaan
Perusahaani: besaran b0 untuk perusahaan ke i + 0.099915xit 6.5
11
12
contoh: untuk perusahaan 1 tahun ke 1, maka besaran Ŷ fixed: 3 8
10 2 4
5.365268 + 0.099915*3 = 5.665013, dst
6
Dapat dilihat bahwa hasil dalam menggunakan fixed effect adalah 7
15
lebih mendekati nilai aktual dari Y (upah)  error menggunakan
1
data panel < error regresi linier biasa
5.5

Hasil regresi dapat dilihat pada grafik berikut. Nomor 1 s/d 15


menunjukkan masing-masing perusahaan
5
Untuk hasil regresi berganda linier biasa dapat dilihat berbentuk 0 5 10 15 20 25 30 35 40
garis lurus panjang (warna biru)

Anda mungkin juga menyukai