Anda di halaman 1dari 32

MAKALAH EKONOMETRIKA

REGRESI LOGISTIK, MODEL PERSAMAAN SIMULTAN DAN


REGRESI DATA PANEL

DOSEN PENGAMPU:
Dr. Makkulau, S.Si., MSi.

OLEH :
NAMA : FATURRAHMAN
NIM : F1A220078
KELAS :B

PROGRAM STUDI S1 STATISTIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS HALUOLEO
KENDARI
2022

i
KATA PENGANTAR

Puji syukur kita panjatkan kehadirat Tuhan Yang Maha Esa karena dengan
rahmat, karunia, serta taufik dan hidayah-Nya kami dapat menyelesaikan makalah
tentang “Regresi Logistik, Model Persamaan Simultan dan Regresi Data Panel”
ini dengan baik meskipun banyak kekurangan didalamnya. Dan juga kami
berterima kasih pada Bapak Dosen mata kuliah Ekonometrika yang telah
memberikan tugas ini kepada kami.

Kami sangat berharap makalah ini dapat berguna dalam rangka menambah
wawasan serta pengetahuan kita mengenai “Regresi Logistik, Model Persamaan
Simultan dan Regresi Data Panel”. Kami juga menyadari sepenuhnya bahwa di
dalam makalah ini terdapat kekurangan dan jauh dari kata sempurna. Oleh sebab
itu, kami berharap adanya kritik, saran dan usulan demi perbaikan makalah yang
telah dibuat, mengingat tidak ada sesuatu yang sempurna tanpa saran yang
membangun.

Kendari
, 1 Januari 2023

Penulis

i
DAFTAR ISI

KATA PENGANTAR
DAFTAR ISI
BAB I
PENDAHULUAN
1.1 Latar Belakang
1.2 Rumusan Masalah
1.3 Tujuan
1.4 Manfaat
BAB II
PEMBAHASAN
2.1 Konsep Regresi Logistik
2.2 Konsep Model Persamaan Simultan
2.3 Konsep Regresi Data Panel
BAB III
PENUTUP
3.1 Kesimpulan
3.2 Saran
DAFTAR PUSTAKA

ii
BAB I
PENDAHULUAN
1.1. Latar Belakang
Statistika relatif berperan penting dan luas bagi kehidupan masyarakat
sehari-harinya. Berbagai informasi yang berasal dari berbagai bidang
(pendidikan, ekonomi, perkebunan, peternakan, teknik, pertanian,
komunikasi, sains dan bidang-bidang lainnya) dapat dinikmati oleh
masyarakat sebagai konsumsi wawasan, pertimbangan pengambilan
keputusan, peramalan di masa yang akan datang maupun evaluasi dalam
penilaian suatu kegiatan, dikarenakan oleh kebaikan yang dihasilkan
statistika. Suharyadi (2007:7) mengatakan: “Statistika adalah ilmu
mengumpulkan, menyajikan, menganalisis, dan menginterpretasikan data
menjadi informasi untuk membantu pengambilan keputusan yang efektif.”
Informasi statistik yang telah disajikan tentu membutuhkan orang-orang
yang paham dalam membaca informasi tersebut.
Oleh karena itu, disumsikan bahwa seluruh lapisan masyarakat wajib
mengenal statistika, tidak harus mahir mengolah data, namun minimal
masyarakat paham bagaimana membaca informasi statistik yang disajikan
bagi publik. Penggunaan statistika dalam segala bidang akan mempengaruhi
tingkat analisis dari hasil penelitian yang sedang dilakukan. Untuk
mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung
dan memprediksi variabel tergantung dengan menggunakan variabel bebas.
Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi
linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas
akan dikenakan kepada variabel tergantung.
Terdapat berbagai macam analisis yang dapat digunakan untuk
mengukur besarnya pengaruh variabel terhadap variabel lainnya, seperti
regresi logistik, struktural equation model dan regresi data panel. Regresi
Logistik di dalam statistik seringkali disebut model logistik atau model logit,
digunakan untuk memprediksi kemungkinan (probabilitas) dari suatu
kejadian dengan data fungsi logit dari kurva logistik. Regresi logistik juga

1
dapat diartikan sebuah pendekatan untuk membuat model prediksi. Dalam
beberapa model sering terdapat interdependensi atau saling ketergantungan
antar variabel, dimana bukan hanya variabel X yang bisa mempengaruhi
variabel Y, tetapi juga variabel Y bisa mempengaruhi variabel X sehingga
dalam model tersebut terjadi hubungan dua arah. Model yang seperti itu
disebut dengan model persamaan simultan atau sistem persamaan simultan,
Sedangkan Data panel adalah kombinasi dari data time series dan cross
section. Dengan mengakomodasi informasi yang terkait dengan variabel-
variabel cross-section maupun time series, data panel secara substansial
mampu mengatasi masalah yang ditimbulkan akibat mengabaikan variabel
yang relevan (Ommited-Variables).
1.2. Rumusan Masalah
1. Bagaimana konsep regresi logistik?
2. Bagaimana konsep model persamaan simultan?
3. Bagaimana konsep regresi data panel?
1.3. Tujuan
1. Untuk mengetahui konsep regresi logistik
2. Untuk mengetahui konsep model persamaan simultan
3. Untuk mengetahui konsep regresi data panel
1.4. Manfaat
Manfaat dari makalah ini adalah untuk menghasilkan informasi
terbaru (ilmu) terkait tiga metode yaitu regresi logistik, struktural equation
model dan regresi data panel dalam melakukan analisis hipotesis terhadap
suatu masalah yang berkaitan dengan ketiga metode tersebut.

2
BAB II
PEMBAHASAN
2.1 Konsep Regresi Logistik
2.1.1 Pengertian Regresi Logistik
Regresi logistik merupakan metode statistik yang diterapkan untuk,
memodelkan variabel respon yang bersifat kategori (skala nominal/ordinal)
berdasarkan satu atau lebih pengubah prediktor yang dapat berupa
variabelkategori maupun kontinu (skala interval atau rasio). Apabila
pengubah respon hanya terdiri dua kategori maka metode regresi logistk
yang dapat digunakan adalah regresi logistik biner. Regresi logistik adalah
bagian dari analisis regresi yang dapat digunakan jika variabel dependent
(respon) merupakan variabel dikotomi. Variabel dikotomi biasanya hanya
terdiri atas dua nilai, yang mewakili kemunculan atau tidak adanya suatu
kejadian yang biasanya diberi angka 0 atau 1 (Nirwana, 2015).
Regresi logistik bertujuan untuk menanggulangi kelemahan dari LPM
(Linier Probability Model) yang dapat memberi hasil kurang memuaskan,
karena menghasilkan probabilitas taksiran yang kurang dari nol atau lebih
dari satu. Dalam hal ini, yang mampu menjamin nilai variabel dependent
terletak antara 0 dan 1 sesuai dengan teori probabilitas adalah dengan model
CDF (Cumulative Distribution Function).
2.1.2 Asumsi Regresi Logistik
1) Regresi logistik tidak membutuhkan hubungan linier antara variabel
independen dengan variabel dependen.
2) Variabel independen tidak memerlukan asumsi multivariate normality.
3) Asumsi homokedastisitas tidak diperlukan.
4) Variabel bebas tidak perlu diubah ke dalam bentuk skala interval atau
ratio.
5) Variabel dependen harus bersifat dikotomi (2 kategori).
6) Variabel independen tidak harus memiliki varian yang sama antar
kelompok variabel.

3
7) Kategori dalam variabel independen harus terpisah satu sama lain atau
bersifat eksklusif.
8) Sampel yang diperlukan dalam jumlah relatif besar, minimum
dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor
(independen).
9) Regresi logistik dapat menyeleksi hubungan karena menggunakan
pendekatan non linier log transformasi untuk memprediksi odds ratio.
Odd dalam regresi logistik sering dinyatakan sebagai probabilitas.
2.1.3 Model Persamaan Regresi Logistik
Model persamaan aljabar layaknya OLS yang biasa kita gunakan adalah

berikut: . Dimana e adalah error varians atau residual.


Dengan regresi logistik, tidak menggunakan interpretasi yang sama seperti
halnya persamaan regresi OLS. Model Persamaan yang terbentuk berbeda
dengan persamaan OLS. Regresi logistik dapat dikelompokkan menjadi 2
maca, yaitu:
1) Regresi logistik biner (Binary Logistic Regression)
Regresi Logistik biner digunakan ketika hanya ada 2 kemungkinan
variabel terikat (Y) contoh misalkan untung dan rugi.
2) Regresi logistik multionomial (Multionomial Logistic Regression)
Regresi Logistik Multinomial digunakan ketika pada variabel terikat
(Y) terdapat lebih dari 2 kategorisasi. Berikut ini persamaan regresi
logistik yaitu:

Keterangan:
ln: Logaritma Natural

: Probabilitas logistik

: Persamaan dalam OLS.

adalah Probabilitas logistik yang dapat dirumuskan sebagai berikut:

4
Keterangan:
Exp (e): fungsi eksponensial
Perlu diingat bahwa exponen merupakan kebalikan dari logaritma
natural. Sedangkan logaritma natural adalah bentuk logaritma namun
dengan nilai konstanta 2,71828182845904 atau biasa dibulatkan menjadi
2,72.'
Dengan model persamaan di atas, tentunya akan sangat sulit
untukmenginterprestasikan koefisien regresinya. Oleh karena itu maka
diperkenalkanlah istilah Odds Ratio atau yang biasa disingkat Exp(B) atau
OR.Exp(B) merupakan exponen dari koefisien regresi. Jadi misalkan nilai
slope dariregresi adalah sebesar 0,80, maka Exp(B) dapat diperkirakan

sebagai berikut: . Besarnya nilai Exp (B) dapat diartikan


sebagai berikut:
Misalnya nilai Exp (B) pengaruh rokok terhadap terhadap kanker paru
adalah sebesar 2,23 maka disimpulkan bahwa orang yang merokok lebih
beresiko untuk mengalami kanker paru dibandingkan dengan orang yang
tidak merokok. Interprestasi ini diartikan apabila pengkodean kategori pada
tiap variabel sebagai berikut:
1) Variabel bebas adalah rokok maka kode 0 untuk tidak merokok dan kode
1 untuk merokok.
2) Variabel terikat adalah kanker paru-paru maka kode 0 untuk tidak
mengalami kanker paru-paru dan kode 1 untuk mengalami kanker paru-
paru.
Perbedaan lainnya yaitu pada regresi ini tidak ada nilai “R Square” untuk
mengukur besarnya pengaruh simultan beberapa variabel bebas terhadap
variabel terikat. Dalam regresi logistik dikenal istilah Pseudo R Square,
yaitu nilai R Square Semu yang maksudnya sama atau identik dengan R
Square pada OLS. Jika pada OLS menggunakan uji F Anova untuk

5
mengukur tingkat signifikansi dan seberapa baik model persamaan yang
terbentuk, maka pada regresi ini menggunakan Nilai Chi-Square.
Perhitungan nilai Chi-Square ini berdasarkan perhitungan Maximum
Likelihood.

2.1.4 Contoh kasus


Seorang peneliti ingin mengetahui bagaimana pengaruh kualitas
pelayanan publik terhadap kepuasan pengguna (masyarakat). Kualitas
pelayanan publik diteliti melaluji variabel Daya Tanggap (X1) dan Empati
(X2). Kepuasan penggunana layanan (Y) sebagai variabel dependent adalah
variabel dummy dimana dimana jika responden menjawab puas maka kita
beri skor 1 dan jika menjawab tidak puas kita beri skor 0.

1) Menguji keseluruhan parameter dengan menggunakan uji G


Tabel 2.1.4.1 Omnibus Test Of Model Coefficients (X1, X2)
Step 1 Chi-Square Df Sig
Step 23.181 2 0,000
Block 23.181 2 0,000

6
Model 23.181 2 0,000

Berdasarkan hasil output pada tabel dia atas dapat dilihat bahwa nilai
chi-square yang diperoleh adalah 23.181 dengan derajat kebebasan = 2,
nilai p = 0,000. Karena nilai p = 0,05 maka dapat disimpulkan minimal
ada satu variabel independent (daya tanggap dan empati) yang
berpengaruh signifikan terhadap variabel dependent yaitu kepuasan
pengguna layanan.
Tabel 2.1.4.2 Model Summary (X1, X2)
Step -2 Log Likelihood Cox & Snell R Nagelkerke R
Square Square
1 45,412 0,371 0,497

Berdasarkan hasil output pada tabel di atas dapat dilihat bahwa nilai
G adalah 45,412. Kemudian diperoleh nilai Nagelkerke R Square sebesar
0,497 yang berarti bahwa variabel bebas mampu menjelaskan 49,7%
variabel dependent dan sisanya yaitu 50,3% dijelaskan oleh faktor lain.
2) Klasifikasi model
Tabel 2.1.4.3 Classification Table (X1, X2)
Predicted

Kepuasan
Observed
Pengguna Percentage
Correct
Tidak Puas
Puas

Step Kepuasan Tidak 23 5 82.1


1 pengguna Puas

Puas 4 18 81.8

Overall Percentage 82.0

Berdasarkan hasil output pada tabel di atas diperoleh kemampuan


ramalan model ini dengan tingkat sukses total 82%.

7
3) Mengubah yang terdapat dalam model regresi logistik tentang pengaruh
kualitas pelayanan publik terhadap kepuasan pengguna (masyarakat)
Tabel 2.1.4.4 Variables In The Equation (X1, X2)
Variabel B S. E Wald Df Sig. Exp(B)

X1 0,187 0,307 0,370 1 0,543 1,205

X2 0,625 0,264 5,614 1 0,018 1,868

a. Dari tabel diatas, diperoleh persamaan-persamaan dibawah ini:

b. Kolom Exp (B) merupakan odds ratio yang diprediksi oleh model:
Untuk koefisien variabel X1:

Untuk koefisien variabel X2:

c. Uji Wald untuk menguji koefisien regresi logistic


1) Untuk koefisien variabel X1:

2) Untuk koefisien variabel X2:

8
Dari hasil pengujian terhadap signifikansi model terlihat bahwa
Pengujian secara sendiri-sendiri ternyata hanya X2 yang signifikan
karena nilai Sig 0.018 < 0.05. Sedangkan X2 Sig 0.543 > 0.05 artinya
secara sendirian X1 tidak punya pengaruh yang signifikan terhadap Y.

2.2 Konsep Model Persamaan Simultan


2.2.1 Pengertian Persamaan Simultan
Suatu himpunan persamaan dimana variabel dependen dalam satu atau
lebih persamaan juga merupakan variabel independen dalam beberapa
persamaan yang lain. Dapat diartikan juga sebagai suatu model yang
mempunyai hubungan sebab akibat antara variabel dependen dan variabel
independen, sehingga suatu variabel dapat dinyatakan sebagai variabel
dependen maupun independen dalam persamaan yang lain.
2.2.2 Variabel Dalam Model Persamaan Simultan
1) Variabel endogen/ endogenous variabel: variabel dependen (tidak bebas)
pada persamaan simultan (jumlahnya sama dengan jumlah persamaan
dalam model simultan) atau dengan kata lain merupakan variabel tak
bebas bersama atau variabel variabel yang ditetapkan dalam model.
Variabel endogen bersifat stokastik
2) Variabel yang sudah diketahui nilainya/ predetermined variabel: variabel
ini diperlakukan sebagai variabel yang non stokastik yang nilai-nilainya
sudah tertentu atau sudah ditentukan.
Predetermined variable dibedakan menjadi dua, yaitu:
a. Variabel eksogen : Variabel eksogen sekarang : Xt , Pt
b. Variabel eksogen waktu lampau : Xt-1, Pt-1

9
c. Variabel endogen waktu lampau (lagged endogenous variabel) : Yt-1,
Qt-1.
2.2.3 Identifikasi Model Persamaan Simultan
Pengidentifikasian adalah menaksir angka dari parameter persamaan
structural apakah dapat diperoleh dari koefisien bentuk yang direduksi
dapat ditaksir. Jika ini dapat dilakukan, kita mengatakan bahwa persamaan
tertentu diidentifikasikan (identified). Suatu persamaan yang
diidentifikasikan bisa berupa tepat (sepenuhnya) diidentifikasikan (exactly
atau fully atau just identified) atau terlalu diidentifikasikan (overidentified).
Order and Rank Condition merupakan aturan yang menjadi acuan apakah
suatu sistem persamaan dapat diselesaikan sehingga nilai koefisien
persamaan struktural dapat diperoleh. Menurut Order and Rank Condition,
agar sebuah sistem persamaan simultan dengan M persamaan struktural
dapat diidentifikasi maka setidaknya harus memiliki M-1 variabel endogen.
Jika jumlah variabel endogen tepat M-1 maka persamaan tersebut dikatakan
exactly identified dan jika jumlah variabel endogen lebih dari M-1 maka
persamaan tersebut dikatakan over identified atau agar sebuah sistem
persamaan simultan dengan M persamaan struktural dapat diselesaikan,
jumlah variabel predetermine yang ada dalam persamaan tersebut harus
tidak kurang dari jumlah variabel endogen yang ada dalam persamaan
dikurangi satu. Maka:
M: Jumlah variabel endogen dalam model
m: Jumlah variabel endogen pada setiap persamaan struktural
K: Jumlah variabel predermine dalam model
k: Jumlah variabel predermine pada setiap persamaan struktural dalam
model.
1) Order Conditions
Syarat identifikasi suatu persamaan struktural:
a. Pada persamaan simultan sejumlah M persamaan (yang tidak
mempuyai predetermined variable)

10
Jika M – 1 = 1, maka persamaan tersebut identified
Jika M – 1 > 1, maka persamaan tersebut overidentified
Jika M – 1 < 1, maka persamaan tersebut unidentified.
Contoh:

Fungsi demand

Fungsi supply
b. Pada model ini Pt dan Qt merupakan variabel endogen tanpa
predetermined variable, agar identified maka M – 1 = 1, jika tidak
maka tidak indetified. Pada kasus ini, (M = 2) dan 2 – 1 = 1 dimana
identified. Pada persamaan yang memiliki predetermined variable
berlaku aturan sebagai berikut

Jika k – k = m – 1, maka persamaan tersebut identified


Jika K – k > m – 1, maka persamaan tersebut overidentified
Jika K – k < m – 1, maka persamaan tersebut unidentified
Contoh:

Fungsi demand

Fungsi supply
Pada model ini Pt dan Qt merupakan variabel endogen dan It
adalah predetermined variable.
Persamaan (4.1): K – k < m – 1 atau 1 – 1 < 2 – 1 (Unidentified)
Persamaan (4.2): M – 1 = 1 atau 2 – 1 = 1 (Inidentified)
Persamaan yang dapat diselesaikan dengan system persamaan
simultan adalah persamaan yang identified dan over identified.
2) Rank Conditions
Identifikasi melalui order condition hanya merupakan prasyarat
dasar tetapi belum merupakan prasyarat cukup (sufficient condition).
Melalui metode rank condition bisa memenuhi kedua prasyarat
identifikasi persamaan simultan. Istilah rank berasal dari

11
terminology di dalam matrik. Rank dari matrik merujuk kepada square
submatrix order paling besar yang mempunyai determinan tidak sama
dengan nol. Square matrix adalah matrik yang mempunyai jumlah kolom
dan baris yang sama. Sebagai ilustrasi identifikasi melalui rank
condition, misal ada persamaan simultan sebagai berikut:

Dimana Y adalah variabel eksogen dan X adalah variabel endogen. Jika


persamaan (1.9) – (1.12) dimanipulasi dengan cara memindahkan semua
variabel di sisi kanan persamaan kecuali variabel gangguan e ke sebelah
kiri maka akan menghasilkan sebuah sistem yang terlihat pada tabel
dibawah ini. Inilah kemudian biasa menentukan apakah sebuah
persamaan teridentifkasi atau tidak melalui rank condition.
Tabel 1. Sistem Persamaan Simultan
Persamaa Koefisien
n 1 Y1 Y2 Y3 Y4 X1 X2 X3
1.9 1 0 0 0
1.10 0 1 0 0
1.11 0 1 0 0
1.12 0 1 0 0

Dari tabel diatas, bisa didentifikasi melalui rank condition untuk


setiap persamaan. Misalnya untuk persamaan (1.9). Persamaan (1.9)
tidak memasukan variabel Y4, X2 dan X3 yang ditunjukan dengan angka 0
didalam baris pertama persamaan 1 untuk mengetahu i apakah persamaan
persamaan tersebut teridentifikasi atau tidak maka harus mencari matrks
order 3x3 dari koefisien yang tidak ada dalam persamaan 1 tetapi ada di
persamaan yang lain dan kemudian dicari determinannya matriks tersebut
adalah sebagai berikut:

12
Determinan matriks A ini mempunyai determinan 0 yang artinya tidak
memenuhi rank condition sehingga persamaan ini tidak teridentifikasi.
Suatu persamaan yang mempunyai M persamaan dikatakan identified,
sekurang-kurangnya mempunyai satu determinan berdimensi (M – 1)
yang tidak sama dengan nol.

2.2.4 Estimasi Model Persamaan Simultan


1) Indirect Least Square (ILS)
Metode ILS dilakukan dengan cara menerapkan metode OLS pada
persamaan reduced form. Asumsi yang harus dipenuhi dalam
penggunaan prosedur ILS adalah sebagai berikut:
a. Persamaan structural harus exactly identified.
b. Variabel residual dari persamaan reduced from nya harus memenuhi
semua asumsi stokastik dari dari Teknik OLS. Jika asumsi ini tidak
terpenuhi, maka akan menyebabkan bias pada penaksiran koefisien.
2) Two Stage Least Square (TSLS)
Two Stage Least Squares (TSLS) digunakan untuk mengestimasi
model regresi persamaan simultan yang teridentifikasikan secara
berlebihan (over identified), namun juga dapat digunakan untuk yang
teridentifikasi secara tepat. Metode TSLS dilakukan dengan
menggunakan Ordinary Least Square sebanyak dua kali. TSLS
digunakan untuk memperoleh nilai parameter struktural pada persamaan
yang teridentifikasi berlebih. Metode ini dapat diterapkan pada suatu
sistem persamaan individu dalam sistem tanpa memperhitungkan
persamaan lain secara langsung dalam sistem.

13
Misalkan terdapat tiga persamaan simultan:

Membentuk model reduced form yaitu persamaan setiap variabel


endogeneous dengan exogeneous.

Estimasi persamaan y1, y2 dan y3 pada model reduced form

2.2.5 Contoh Kasus


Jika diketahui bahwa:

Hitunglah nilai dugaan koefisien persamaan structural (a, b, c)!


Penyelesaian:
Diketahui:

Maka:

14
1) Mencari nilai a 2) Mencari nilai c

3) Mencari nilai b 4) Mencari nilai d

Sehingga diperoleh persamaan strukturnya:

2.3 Konsep Regresi Data Panel


2.3.1 Pengertian Data Panel
Data panel adalah kombinasi dari data time series dan cross section.
Dengan mengakomodasi informasi yang terkait dengan variabel-variabel
cross-section maupun time series, data panel secara substansial mampu
mengatasi masalah yang ditimbulkan akibat mengabaikan variabel yang
relevan (Ommited-Variables). Untuk mengatasi interkorelasi di antara
variabel-variabel bebas yang pada akhirnya dapat mengakibatkan tidak
tepatnya penaksiran regresi maka digunakan metode regresi data panel.
Data cross section merupakan data yang dikumpulkan pada satu waktu
terhadap banyak individu sedangkan data time series adalah data yang
dikumpulkan dari waktu ke waktu terhadap suatu individu. Data cross
section yang dikumpulkan atau diobservasi pada periode waktu tertentu
dikenal dengan nama data panel. Keuntungan menggunakan data panel yaitu
dapat meningkatkan jumlah sampel populasi dan memperbesar degree of
freedom, serta pengabungan informasi yang berkaitan dengan variabel cross
section dan time series. Analisis data panel dapat diterapkan pada beberapa
bidang keilmuan dan terapan misalnya, pada ilmu ekonomi kita dapat

15
mempelajari perilaku perusahaan dan sistem penggajian karyawan pada
beberapa periode waktu tertentu dan dalam bidang pendidikan, peneliti
dapat mempelajari kelas-kelas siswa dan lulusan pada beberapa waktu.
Dengan pengamatan berulang terhadap data cross section yang cukup,
analisis data panel memungkinkan seseorang dalam mempelajari dinamika
perubahan dengan dengan data time series. Kombinasi data time series dan
cross section dapat meningkatkan kualitas dan kuantitas data dengan
pendekatan yang tidak mungkin dilakukan dengan menggunakan hanya
salah satu dari data tersebut (Gujarati, 2003). Analisis data panel dapat
mempelajari sekelompok subjek jika kita ingin mempertimbangkan baik
dimensi data maupun dimensi waktu.

.
2.3.2 Model Regresi Data Panel
Model ini memfokuskan pada analisis regresi dengan kombinasi data
time series dan cross section yang populer disebut dengan pooled time
series. Pooled time series merupakan kombinasi antara time series yang
memiliki observasi temporal biasa pada suatu unit analisis dengan data
cross section yang miliki obserevasi-observasi pada unit analisis pada titik
tertentu (Syarat dalam Mudrajat Kuncoro, 2001). Ciri khusus pada data time
series adalah berupa urutan numerik di mana interval antar observasi atas
sejumlah variabel bersifat konstan dan tetap sedang data cross section
adalah suatu unit analisis pada suatu titik tertentu dengan observasi atas
sejumlah variabel. Unit analisis dalam hal ini dapat individu, kota,
kabupaten, provinsi, negara, bisnis, rumah tangga, atau industri. Jadi bila
sejumlah variabel untuk sejumlah cross section yang berbeda obsevasi
selama kurun waktu tertentu, maka akan diperoleh data pooling. Alasan
penggunaan data pooling:
1) Penggunaan data pooling meningkatkan jumlah observasi (sampel).
Dengan kata lain, cara ini mengatasi masalah keterbatasan jumlah data
runtun waktu.

16
2) Dengan data pooling akan diperoleh variasi antar unit yang berbeda
Menurut ruang dan variasi yang muncul menurut waktu. Dengan
demikian, analisis dengan data ini memungkinkan untuk menguraikan,
menganalisis dan menguji hipotesis baik hasil maupun proses bagaimana
memperoleh hasil.
Analisis regresi data panel adalah analisis regresi dengan struktur data
yang merupakan data panel. Umumnya pendugaan parameter dalam analisis
regresi dengan data cross section dilakukan menggunakan pendugaan
metode kuadrat terkecil atau disebut Ordinary Least Square (OLS).
Sebagaimana telah diketahui data panel adalah gabungan antara data cross
section dan data time series, dimana unit cross section yang sama diukur
pada waktu yang berbeda. Maka dengan kata lain, data panel merupakan
data dari beberapa individu sama yang diamati dalam kurun waktu tertentu.
Jika kita memiliki T periode waktu (t = 1, 2, ..., T) dan N jumlah individu (i
= 1, 2, ..., N), maka dengan data panel kita akan memiliki total unit
observasi sebanyak NT. Jika jumlah unit waktu sama untuk setiap individu,
maka data disebut balanced panel. Jika sebaliknya, yakni jumlah unit waktu
berbeda untuk setiap individu, maka disebut unbalanced panel.
Sedangkan jenis data yang lain, yaitu: data time-series dan data cross-
section. Pada data time series, satu atau lebih variabel akan diamati pada
satu unit observasi dalam kurun waktu tertentu. Sedangkan data cross-
section merupakan amatan dari beberapa unit observasi dalam satu titik
waktu. Persamaan Regresi data panel ada 2 macam, yaitu One Way Model
dan Two Way Model. One Way Model adalah model satu arah, karena hanya
mempertimbangkan efek individu (αi) dalam model. Berikut Persamaannya:

Dimana:
Konstanta

Vektor berukuran P x 1 merupakan parameter hasil estimasi

Observasi ke-it dari P variabel bebas

17
Efek individu yang berbeda-beda untuk setiap individu ke-i

Error regresi seperti halnya pada model regresi klasik.


Sedangkan Two Way Model adalah model yang mempertimbangkan efek
dari waktu atau memasukkan variabel waktu. Berikut Persamaannya:

Persamaan di atas menunjukkan dimana terdapat tambahan efek waktu


yang dilambangkan dengan deltha yang dapat bersifat tetap ataupun bersifat
acak antar tahunnya.Metode Regresi Data Panel akan memberikan hasil
pendugaan yang bersifat Best Linear Unbiased Estimation (BLUE) jika
semua asumsi Gauss Markov terpenuhi diantaranya adalah non-
autcorrelation. Non-autcorrelation inilah yang sulit terpenuhi pada saat kita
melakukan analisis pada data panel. Sehingga pendugaan parameter tidak
lagi bersifat BLUE. Jika data panel dianalisis dengan pendekatan model-
model time series seperti fungsi transfer, maka ada informasi keragaman
dari unit cross section yang diabaikan dalam pemodelan. Salah satu
keuntungan dari analisis regresi data panel adalah mempertimbangkan
keragamaan yang terjadi dalam unit cross section. Tidak seperti regresi
biasanya, regresi data panel harus melalui tahapan penentuan model estimasi
yang tepat. Berikut diagram tahapan dari regresi ata panel:
Penentuan Model Estimasi
Common Efect Fixed Effect Model Random Effect Model
Model

Penentuan Metode Estimasi

Chow Test Lagrange Multipler Hausman Test

18
Pengujian Asumsi dan Kesesuaian Model

Normalitas Multiokolinearitas Heteroskedastisitas Autokorelasi

Interpretasi

Adjusted R Uji F Uji T Goodness Of Fit Persamaan


Square Regresi

2.3.3 Pendekatan Model Regresi Data Panel


1) Fixed Effect Model (FEM)
Model fixed effect pada data panel mengasumsikan bahwa koefisien
slope konstan tetapi intersep bervariasi sepanjang unit individu. Istilah
fixed effect berasal dari kenyataan bahwa meskipun intersep berbeda
antar individu namun intersep antar waktu sama (time invarian),
sedangkan slope tetap sama antar individu dan antar waktu. Bentuk
umum model fixed effect adalah sebagai berikut.

Menurut Greene (2007), secara umum pendugaan parameter model


efek tetap dilakukan dengan LSDV (Least Square Dummy Variable), di
mana LSDV merupakan suatu metode yang dipakai dalam pendugaan
parameter regresi linier dengan menggunakan MKT pada model yang
melibatkan variable boneka sebagai salah satu variabel prediktornya.
MKT merupakan teknik pengepasan garis lurus terbaik untuk
menghubungkan variable prediktor (X) dan variabel respon (Y). Berikut
adalah prinsip dasar MKT:

Sehingga didaptkan jumlah kuadrat galat sebagai berikut:

19
Dimana, jika matriks transpose , maka skalar =

. Untuk mendapatkan penduga parameter yang


menyebabkan jumlah kuadrat galat minimum yaitu dengan cara

menurunkan persamaan (1) terhadap yang kemudian hasil turunan

tersebut disamakan dengan nol atau sehingga diperoleh:

2) Random Effect Model (REM)


Pada model random effect digunakan untuk mengatasi permasalahan
yang ditimbulkan oleh model fixed. Pendekatan model fixed effect
dengan peubah semu (dummy) pada data panel menimbulkan
permasalahan hilangnya derajat bebas dari model.

Model efek acak atau disebut juga dengan error component model
memiliki asumsi pengaruh unit cross-sectional dan unit waktu
merupakan peubah acak yang dimasukkan dalam model sebagai bentuk
galat (Judge, et al., 1980). Model efek acak yang hanya
mempertimbangkan unit cross-sectional atau unit waktu saja disebut
dengan model efek acak satu arah. Sedangkan model efek acak yang

20
mempertimbangkan unit cross-sectional dan unit waktu disebut model
efek acak dua arah
3) Common Effect Model atau Pooled Least Square (PLS)
Model ini merupakan pendekatan model data panel yang paling
sederhana karena hanya mengkombinasikan data time series dan cross
section. Pada model ini tidak diperhatikan dimensi waktu maupun
individu, sehingga diasumsikan bahwa perilaku data perusahaan sama
dalam berbagai kurun waktu. Metode ini bisa menggunakan pendekatan
Ordinary Least Square (OLS) atau teknik kuadrat terkecil untuk
mengestimasi model data panel.
2.3.4 Pemilihan Model Regresi Data Panel
Untuk memilih model yang paling tepat digunakan dalam mengelola data
panel, terdapat beberapa pengujian yang dapat dilakukan yakni:
1) Uji Chow
Chow test yakni pengujian untuk menentukan model Fixed Effet atau
Random Effect yang paling tepat digunakan dalam mengestimasi data
panel. Chow test yakni pengujian untuk menentukan model Fixed Effet
atau Random Effect yang paling tepat digunakan dalam mengestimasi
data panel.
Hipotesis dalam uji chow yaitu:
H0: Common Effect Model atau Pooled OLS
H1: Fixed Effect Model
Dasar penolakan terhadap hipotesis diatas adalah dengan
membandingkan perhitungan Fhitung dengan Ftabel. Perbandingan dipakai
apabila hasil Fhitung > dari Ftabel maka H0 ditolak yang berarti model yang
paling tepat digunakan adalah Fixed Effect Model. Begitupun sebaliknya,
jika Fhitung < Ftabel maka H0 diterima dan model yang digunakan adalah
Common Effect Model (Widarjono, 2009).
Perhitungan Fhitung didapat dari Uji Chow dengan rumus (Baltagi, 2005):

21
Sedangkan Ftabel didapat dari

2) Uji Hausman
Setelah selesai melakukan uji Chow dan didapatkan model yang tepat
adalah Fixed Effct, maka selanjutnya kita akan menguji model manakah
antara model Fixed Effect atau Random Effect yang paling tepat,
pengujian ini disebut sebagai uji hausman. Uji Hausman dapat
didefinisikan sebagai pengujian statistik untuk memilih apakah model
Fixed Effect atau Random Effect yang paling tepat digunakan. Pengujian
uji hausman dilakukan dengan hipotesis berikut:
H0: Random Effect Model
H1: Fixed Effect Model
Uji hausman akan mengikuti distribusi chi-square sebagai berikut:

Statistik uji hausman ini mengikuti distribusi statistik Chi Square dengan
degree of freedom sebanyak k, dimana k adalah jumlah variabel
independen. Jika nilai statistik hausman lebih besar dari nilai kritisnya
maka H0 ditolak dan model yang tepat adalah model Fixed Effect
sedangkan sebaliknya bila nilai statistik hausman lebih kecil dari nilai
kritisnya maka model yang tepat adalah model Random Effect.
3) Uji Lagrange Multiplier
Lagrange Multiplier (LM) adalah uji untuk mengetahui apakah model
Random Effect atau model Common Effect (OLS) yang paling tepat
digunakan. Uji signifikasi Random Effect ini dikembangkan oleh Breusch
Pagan. Metode Breusch Pagan untuk uji signifikasi Random Effect

22
didasarkan pada nilai residual dari metode OLS. Adapun nilai statistik
LM dihitung berdasarkan formula sebagai berikut:

Hipotesis yang digunakan yaitu:


H0: Common Effect Model
H1: Random Effect Model
Uji LM ini didasarkan pada distribusi chi-square dengan degree of
freedom sebesar jumlah variabel independen. Jika nilai LM statistik
lebih besar dari nilai kritis statistik chi-square maka kita menolak H0,
yang artinya estimasi yang tepat untuk model regresi data panel adalah
metode Random Effect dari pada metode Common Effect. Sebaliknya
jika nilai LM statistik lebih kecil dari nilai statistik chi-square sebagai
nilai kritis, maka kita menerima H0 yang artinya estimasi yang
digunakan dalam regresi data panel adalah metode Common Effect
bukan metode Random Effect (Widarjono, 2009).

4) Uji Asumsi Model Regresi Data Panel


Menurut Yudiatmaja (2013), model regresi data panel dapat disebut
sebagai model yang baik jika model tersebut memenuhi kriteria Best,
Linier, Unbiased, dan Estimator (BLUE). BLUE dapat dicapai bila
memenuhi asumsi klasik. Apabila persamaan yang terbentuk tidak
memenuhi kaidah BLUE, maka persamaan tersebut diragukan
kemampuannya dalam menghasilkan nilai-nilai prediksi yang akurat.
Tetapi bukan berarti persamaan tersebut tidak bisa digunakan untuk
memprediksi. Agar suatu persamaan tersebut dapat dikategorikan
memenuhi kaidah BLUE, maka data yang digunakan harus memenuhi
beberapa asumsi yang sering dikenal dengan istilah uji asumsi klasik.

23
Metode uji asumsi yang lain biasa digunakan seperti Metode
Ordinary Least Squares pertama kali diperkenalkan oleh Carl Friedrich
Gauss, seorang ahli matematika berkebangsaan Jerman (Mulyono,
2000:59). Dalam OLS, terdapat sepuluh asumsi yang harus dipenuhi,
yang dikenal dengan asumsi klasik. Asumsi-asumsi ini meliputi:
1) Linier Regression Model yang berarti model harus linier dalam
parameter.
2) Nilai X (independent) adalah tetap (nonstochastic)
3) Nilai rata-rata ei (error term) adalah nol (0)
4) Homoskedastisitas yaitu varians masing-masing ei (error term) adalah
sama (konstan) untuk setiap X.
5) Tidak ada autokorelasi antara ei (error term)
6) Tidak ada varians antara ei (error term) dan X (variabel bebas)
7) Jumlah observasi (n) harus lebih besar dari pada jumlah pada jumlah
parameter untuk di estimasi
8) Variabilitas dalam nilai X (variabel bebas)
9) Model regresi tidak bias atau error
10) Tidak terdapat multikolinearitas yang sempurna.

2.3.5 Contoh Kasus


Analisis persentase penduduk miskin di 9 kabupaten/kota di Provinsi
Bali. Menggunakan data sekunder yang diperoleh dari BPS, persentase
penduduk miskin dari kabupaten/kota ke-i pada tahun ke-t (Yit)
dimodelkan sebagai variabel yang diduga dipengaruhi oleh 5 variabel
prediktor – laju pertumbuhan ekonomi masing-masing kabupaten/kota,
dinyatakan sebagai laju PDRB (X1), tingkat pengangguran terbuka atau
TPT (X2), tingkat partisipasi angkatan kerja atau TPAK (X3), jumlah
penduduk masing-masing kabupaten atau kota/POP (X4), dan indeks
pembangunan manusia/IPM (X5).
1. Estimasi Model-model Data Panel

24
Membuat dua model data panel CEM dan FEM dibangun. Tabel 1,
Tabel 2.a, memperlihatkan hasil analisis CEM dan FEM dengan fixed
individual

2. Pemilihan Model Terbaik


Pemilihan model terbaik dari 2 model yang terbangun dilakukan dengan
menggunakan Uji Chow dan Uji Hausman. Uji Chow digunakan
untuk me- meriksa pasangan hipotesis berikut:
H0: Tidak ada perbedaan intercept pada FEM dari masing-masing
kabupaten/kota
H1: Paling sedikit ada sepasang αi ≠ αj untuk I ≠ j.
Pasangan hipotesis di atas diperiksa dengan statistik uji F.

25
Pada persamaan diatas, notasi I, P, dan T masing- masing
menyatakan jumlah unit individu (cross sectional), jumlah prediktor,
dan jumlah unit waktu (time series). Mempertimbangkan H 0 menguji
keberadaan fixed individual effects, maka nilai Residual Sum
Squares (RSS) FEM yang digunakan adalah RSS yang diperoleh pada
Tabel 2.a.

Memperhatikan nilai Fhitung > F(0.05;8,67) = 2.08; maka H 0


ditolak. Penolakan H0 menjustifikasi setidak-tidaknya terdapat 2
kabupaten/kota yang memiliki nilai intercept berbeda pada model data
panel persentase penduduk miskin, sehingga CEM tidak layak
diaplikasikan.
3. Pemeriksaan Signifikasi Parameter
Berdasarkan Tabel 2a diatas untuk nilai
b1: -0,6418
b2: 0,2004
b3: -0,0363
b4: -0,0007
b5: 0,0304

Intersep untuk setiap indivdu adalah sebagai berikut:

26
Sehingga persamaan untuk masing-masing individu adalah

Maka model fixed effect di atas adalah

BAB III
PENUTUP

27
3.1 Kesimpulan
Regresi Logistik di dalam statistik seringkali disebut model logistik
atau model logit, digunakan untuk memprediksi kemungkinan (probabilitas)
dari suatu kejadian dengan data fungsi logit dari kurva logistik. Regresi
logistik juga dapat diartikan sebuah pendekatan untuk membuat model
prediksi. Regresi logistik tidak membutuhkan asumsi bahwa error varians
(residual) terdistribusi secara normal sebab pada regresi jenis logistik ini
mengikuti distribusi logistik.
Dalam beberapa model sering terdapat interdependensi atau saling
ketergantungan antar variabel, dimana bukan hanya variabel X yang bisa
mempengaruhi variabel Y, tetapi juga variabel Y bisa mempengaruhi
variabel X sehingga dalam model tersebut terjadi hubungan dua arah. Model
yang seperti itu disebut dengan model persamaan simultan atau sistem
persamaan simultan, Sedangkan Data panel adalah kombinasi dari data time
series dan cross section. Dengan mengakomodasi informasi yang terkait
dengan variabel-variabel cross-section maupun time series, data panel secara
substansial mampu mengatasi masalah yang ditimbulkan akibat
mengabaikan variabel yang relevan (Ommited-Variables).

3.2 Saran
Demikianlah makalah yang saya buat, apabila ada kesalahan baik
dalam penulisan ataupun pembahasan serta penjelasan kurang jelas,
mohon dimaafkan. Semoga makalah ini bermanfaat bagi kita semua. Saya
ucapkan terima kasih atas perhatian dan pastisipasinya

28
DAFTAR PUSTAKA

Bekti, R. D., David, D., Gita, N., Priscillia, P., & Serlyana, S. (2014). Model
Persamaan Simultan pada Analisis Hubungan Kemiskian dan PDRB.
ComTech: Computer, Mathematics and Engineering Applications, 5(2),
810-817.
Iqbal, M. (2015). Regresi Data Panel (2): Tahap Analisis. Retrived From
https://dosen. perbanas. id/regresi-data-panel-2-tahap-analisis.
Jaya, I. G. N. M., & Sunengsih, N. (2009). Kajian analisis regresi dengan data
panel. In Prosiding Seminar Nasional Penelitian. Universitas Negeri
Yogyakarta, Yogyakarta.
Kusumawardhani, N. M. S., Srinadi, I. G. A. M., & Susilawati, M. (2012).
Faktorfaktor yang Memengaruhi PDB Indonesia dengan Persamaan
Simultan 2SLS. E-Jurnal Matematika, 1(1), 99-102.
Muflihah, I. Z. (2017). Analisis financial distress perusahaan manufaktur di
Indonesia dengan regresi logistik. Majalah Ekonomi, 22(2), 254-269.
Prasanti, T. A., Wuryandari, T., & Rusgiyono, A. (2015). Aplikasi regresi data
panel untuk pemodelan tingkat pengangguran terbuka kabupaten/kota di
Provinsi Jawa Tengah. Jurnal Gaussian, 4(3), 687-696.
Rahmadeni, R., & Feronika, R. (2020). Model Persamaan Simultan Pada Analisis
Hubungan Nilai Tukar Rupiah dan Inflasi. Jurnal Sains Matematika dan
Statistika, 6(2), 73-79.
Ruslie, R. H., & Darmadi, D. (2012). Analisis Regresi Logistik Untuk Faktor-
Faktor Yang Mempengaruhi Status Gizi Remaja. Majalah Kedokteran
Andalas, 36(1), 62-72.
Tampil, Y., Komaliq, H., & Langi, Y. (2017). Analisis Regresi Logistik Untuk
Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif
(IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado.
d'CARTESIAN: Jurnal Matematika dan Aplikasi, 6(2), 56-62.
Yuliadi, I. (2008). Analisis Impor Indonesia: Pendekatan Persamaan Simultan.
Jurnal Ekonomi & Studi Pembangunan, 9(1), 89-104.

29

Anda mungkin juga menyukai