Kuliah ke 4 (online)
Senin 29 Maret 2021, jam 7.30-10.00
1
terjadi. Regresi logistic menghitung perubahan yang terjadi pada nilai log odds variable tak bebas
secara langsung seperti yang diterapkan dalam metode ordinary least squares (OLS).
Nilai variable tak bebas (Y) adalah 1 (“sukses”) dan 0 (“gagal”), Nilai π (x) adalah probabilita
kejadian P(Y=1).
Fungsi π (x) merupakan fungsi non linier sehingga perlu dilakukan tarnsformasi logit untuk
memperoleh fungsi linier.
2
Misalkan diteliti hubungan antar skor Graduate Record Examination (GRE) dan status kelulusan
seseorang dalam ujian masuk suatu perguruan tinggi (PT). Model regresi klasik untuk kasus di atas
dapat dituliskan sebagai berikut ;
Yi = β0 + β1 Xi + εi 4.4
Xi = skor GRE dari observasi ke- i
Yi = 1 ; bila seseorang lulus ujian masuk PT
0 ; bila seseorang tidak lulus masuk PT (gagal)
Secara matematis dengan mengasumsikan E ( εi ) = 0, diperoleh
E(Yi/Xi) = β0 + β1 Xi 4.5
Nilai harapan bersyarat dari Y, jika diberikan Xi adalah
E(Yi/Xi) = ( Yi = 1)P(Yi = 1/Xi) + (Yi = 0) P(Yi = 0/Xi) = P (Yi = 1/Xi)
Jika P (Yi = 1/Xi) = πi menunjukan probabilita bahwa orang ke-i lulus ujian,
maka 1 - πi merupakan probabilita bahwa orang ke-i tidak lulus ujian, yaitu bila Yi = 0 sehingga
E(Yi/Xi) = πi
Akibatnya persamaan (4.5) menghasilkan
E(Yi/Xi) = β0 + β1 Xi = πi 4.6
Karena 0 ≤ πi ≤ 1, maka 0 ≤ β0 + β1 Xi ≤ 1
Pada kasus variable tak bebas yang berbentuk kategori, apakah estimator hasil OLS dapat
menjamin bahwa besaran β0 + β1 Xi terletak antara 0 dan 1? Inilah alasan mengapa pada kasus
variable tak bebas kategorik, regresi OLS tidak dapat digunakan.
Salah satu solusi untuk kasus variable tak bebas kategorik adalah menggunakan fungsi logit
(regresi logistic) sebagaimana telah dijelaskan sebelumnya.
Didefenisikan ;
πi = E(Yi = 1/Xi) = 1 8 = 1 8 4.7
- (β0 + β1 Xi) - Zi
1+e 1+e
Dimana ;
Zi = β0 + β1 Xi
Pada persamaan 4.7 probabilitas sukses (πi) memiliki hubungan non linier dengan Zi Persamaan
tersebut juga menjamin bahwa πi akan bernilai 0 dan 1, apabila Zi bernilai mendekati tak hingga
( ∞ ), maka πi akan bernilai mendekati 1 dan apabila Zi bernilai mendekati minus tak hingga
3
(- ∞ ) maka πi akan bernilai mendekati 0
Dari defenisi sebelumnya ;
πi =
sehingga
Persamaan diatas disebut model logit. Dalam bentuk probabilita, model regresi logistic dapat
ditulis sebagai berikut;
4
Asumsi apa yang diperlukan oleh regresi logistic?
Tidak seperti pada regresi klasik, regresi logistic tidak mengasumsikan kelinieran
hubungan antara variable tak bebas dan variable bebas tidak memerlukan variable yang
terdistribusikan secara normal, atau secara umum dapat dikatakan bahwa regresi logistic tidak
memiliki persyaratan yang ketat. Namun demikian adanya kolineritas
(collinearity/multicollinearity) menjadi masalah serius. Jika terjadi kolinearitas sempurna antar
variable bebas, maka tidak dapat diperoleh estimasi koefisien regresi yang unik. Meskipun jarang
ditemukan adanya kolineritas sempurna, namun korelasi yang tinggi antar variable dapat berakibat
estimator koefisien regresi menjadi tidak lagi efisien (kesalahan baku dari estimator koefisien
regresi menjadi besar) (Menard, 2002).
Bagaimana menilai estimasi model regresi logistic yang dibuat?
Kebaikan model regresi logistic dapat dinilai dengan melihat pada table klasifikasi (clasifiation
table) (nilai Hit Ratio atau di output SPSS disebutkan sebagai overall percentage atau percentage
correct) yang menunjukan pengklasifikasi yang benar dan yang salah dari suatu variable tak bebas
dikotomus, ordinal, maupun polikotomus. Uji kebaikan model (goodness of fit test) juga dapat
dilakukan sebagai indicator ketepatan model. Sementara untuk menguji keberartian (secara
statistic) secara keseluruhan dapat dilakukan dengan uji likelihood ratio dengan statistic uji G,
sedangkan uji keberartian secara statistic dari tiap variable bebas dapat dilakukan dengan
menggunakan statistic uji Wald. Secara lebih rinci untuk prosedur pengujian hipotesis dalam
regresi logistic dapat dilakukan dengan cara sebagai berikut;
Pengujian Parameter
Uji Keseluruhan (Overall test)
Untuk mengetahui apakah minimal ada satu variable bebas yang signifikan di dalam model
digunakan hipotesis statistic uji likelihood ratio dengan rumusan hipotesis berikut (Hosmer dan
Lemeshow,2000)
H0 ; β1 = β2 = … = βp = 0
(Tidak ada pengaruh dari variable bebas terhadap variable tak bebas)
H1 ; Minimal ada satu β1 ≠ 0 dimana j = 1,2 ….p
(Minimal ada satu variable bebas berpengaruh pada variable tak bebas)
Statistik uji yang digunakan adalah ;
5
G = - 2ln( ) (4.11)
Uji Parsial
Selanjutnya untuk menguji koefisien βj secara parsial dapat digunakan uji Wald dengan
menggunakan hipotesis sebagai berikut ;
Ho ; βj = 0, (tidak ada pengaruh variable bebas ke-j terhadap variable tak bebas)
H1 ; βj≠ 0 ( ada pengaruh variable bebas ke-j terhadap variable tak bebas)
j = 1,2 …,p
Formula dari statistic uji Wald adalah ;
= ( )
(4.12)
dengan merupakan estimasi parameter βj dan merupakan estimasi standard error dari
Dijelaskan oleh Azen dan Walker (2011) bahwa statistic uji Wald tersebut mengikuti
distribusi chi-square dengan derajat bebas 1, sehingga H0 akan ditolak jika nilai >χ .
Jika H0
ditolak pada tingkat signifikansi α berarti dapat disimpulkan bahwa variable bebas Xj berpengaruh
secara signifikan terhadap variable tak bebas Y. Nilai statistic uji G (pada 4.11) maupun nilai
statistic uji W (pada 4.12) ini dapat secara langsung didapatkan dari hasil pengolahan dengan
menggunakan bantuan software statitiska seperti SPSS for windows.
6
Pada saat probabilita = 0,5 (midpoint), maka odds = 1, dan ln (oods) = 0
Nilai ln (odds) berkisar antara - ∞ sampai ∞, simetris di sekitar midpoint
Contoh 4.1.
Pada contoh hubungan antar skor Graduate Record Examination (GRE) dan status
kelulusan seseorang dalam ujian masuk suatu perguruan tinggi (PT), jika diketahui data yang
diperoleh adalah sebagai pada Tabel 4.2 di bawah, maka dapat diperoleh persamaan regeresi
logistic sbb:
#$
!" #$
= −15,705 + 0,025- 4.13
Pada contoh hubungan antar skor Graduate Record Examination (GRE) dan status
kelulusan seseorang dalam ujian masuk suatu perguruan tinggi (PT), jika diketahui data yang
diperoleh adalah sebagai:
7
Tabel. 4.2 Skor Kelulusan dan GRE
Status Skor
No. Status Kelulusan Skor GRE No.
Kelulusan GRE
1 0 550 21 0 540
2 0 460 22 1 760
3 0 640 23 1 800
4 0 640 24 1 645
5 1 520 25 1 660
6 0 560 26 0 560
7 0 420 27 1 780
8 0 620 28 1 600
9 0 560 29 1 650
10 0 580 30 1 660
11 1 800 31 1 800
12 0 460 32 0 660
13 1 580 33 0 640
14 1 700 34 0 620
15 0 600 35 1 750
16 1 685 36 1 620
17 1 760 37 0 540
18 1 800 38 1 725
19 1 640 39 1 780
20 0 605 40 1 760
Berdasarkan persamaan di atas, maka nilai probabilita Yi = 1 disajikan pada tabel 4.3 di bawah
ini.
8
Tabel. 4.3 Probabilita Yi = 1 berdasarkan persamaan 4.14
Status Skor Status Skor
No. P(Y=1) No. P(Y=1)
Kelulusan GRE Kelulusan GRE
1 0 550 0,1308 21 1 580 0,2422
9
Dari nilai-nilai probabilita yang diperoleh di atas dapat dibuat grafik (Gambar 4.1) sebagai
berikut :
Interpretasi
Interpretasi pada persamaan regresi logistik dilakukan melalui nilai rasio kecenderungan
(odds rasio) atau probabilita (predicted probability) pada persamaan regresi logistik dengan satu
variabel bebas kuantitatif :
4
ln #
=b0+b1Xi
67
5 =
1+ 67
10
Perkiraan nilai odds (kecenderunga) bahwa Yi = 1, jika Xi = 0 adalah e-15,705 = 1,5.10-7 .
Dengan kata lain, kecenderungan orang dengan skor GRE = 0 untuk LULUS sangat kecil.
b1 menyatakan perubahan nilai log odds bahwa Yi=1 jika Xi berubah satu unit.
eb1 menyatakan perkiraan perubahan nilai odds (kecenderungan) bahwa Yi=1, jika Xi
bertambah satu unit.
Perkiraan perubahan nilai odds bahwa Yi=1 jika Xi bertambah satu unit adalah e0,025 =1,03.
Seseorang dengan skor GRE 1 point lebih tinggi memiliki kecenderungan 1,03 kali untuk
LULUS.
Kemiringan (slope) paling ekstrim terjadi pada saat p = 0,5 ketika
,1
ln( ,1
) = ln(1) = 0 = ᵦ0+ ᵦ1X terjadi saat x = -ᵦ0 /ᵦ1
11
X2 = pengalaman pelatihan kewirausahaan (1 = pernah, 0 = tidak pernah)
( )
logit (π(x)) = ln = β0 +β1 + Xi1 + β2 + Xi2
( )
Misal berdasarkan output SPSS diperoleh hasil sbb (hanya output penting yg ditampilkan)
12
13
14
Berdasarkan output di atas maka analisis sederhana yang dapat dilakukan adalah sebagai berikut :
Estimasi Model Logit(Persamaan logit):
#
ln( #
) = -5,412 + 1,427Xi1 + 2,809Xi2
H0: ᵦ1 = ᵦ2 = 0
H0: ᵦ1 = 0
H1: ᵦ1 ≠ 0 j = 1,2
15
Statistik uji yang kritis digunakan adalah statistic uji Wald. Hipotesis nol ditolak ,
1. Jika nilai statistic Wald lebih besar dari nilai χ2 dengan derajat bebas 1 pada tingkat
signifikansi tertentu (misal 5%) atau
2. Bila nilai p-value lebih kecil dari tingkat signifikansi yang telah ditentukan sebelumnya
(yaitu 5%)
Hasil pengujian menunjukan bahwa pada α =0,05, kedua variable bebas yang digunakan
mempengaruhi status keberlanjutan usaha secara signifikan.
Interpretasi
Interpretasi terhadap persamaan di atas adalah sebagai berikut;
(Melalui tanda dari koefisien regresi dan nilai odds ratio)
1. Tanda”+” pada koefisien Xi1, berarti semakin besar modal awal suatu usaha informal
maka semakin besar probabilita usaha tersebut untuk dapat berlanjut, atau usaha sector
informal dengan modal sepuluh juta rupiah lebih tinggi memiliki kecenderungan
sebesar exp(1,427) = 4,167 kali untuk dapat terus berlanjut (dengan anggapan variable
pengalaman keikutsertaan dalam pelatihan kewirausahaan sama/tetap)
2. Tanda “+” pada koefisien Xi2 , berarti usaha dengan pemilik usaha pernah mengikuti
pelatihan kewirausahaan memiliki kecenderungan/peluang yang lebih besar untuk
dapat berlanjut (dengan anggapan variable modal awal tetap), atau usaha dengan
pemilik usaha pernah mengikuti pelatihan kewirausahaan memiliki kecenderungan
sebesar 16,589 kali untuk dapat berlanjut (dengan anggapan variable modal awal
tetap/sama)
Pengujian Kecocokan Model
Pengujian ini bertujuan untuk mengetahui apakah persamaan yang diperoleh cocok untuk
menjelaskan hubungan antara status keberlanjutan usaha informasi dan variable model awal dan
pengalaman dalam pelatihan kewirausahaan. Hasil pengujian kecocokan model (goodness of fit
test) dengan hipotesis sebagai berikut ;
H0 : model cocok
H1 : model tidak cocok
Menyatakan bahwa model cocok (fit)
16
Hasil ini dapat dilihat pada table Hosmer & Lemeshow goodness of fit Test dengan nilai 13,153
dan p-value 0,107 (H0 tidak ditolak pada tingkat signifikansi 0,05).
Baik tidaknya suatu model dapat pula dinilai melalui besaran Hit Ratio (Percentage
correct) (overall percentage) pada classification table. Pada contoh di atas diperoleh nilai hit ratio
sebesar 92,5% artinya model dapat mengklasifikasikan obyek secara benar sebesar 92,5%,
Contoh 4.3. Penerapan Analisis Regresi Logistik : Peluang Pekerja Wanita dalam Memilih
Lapangan Pekerjaan Pertanian dan Non Pertanian di Kota Batam
Penilitian ini bertujuan untuk mengidentifikasi factor-faktor social demografi yang
berpengaruh dalam pemilihan lapangan pekerjaan yang dimasuki pekerja wanita di kota Batam,
serta mengetahui peluang dan kecenderungan pekerja wanita dalam memilih lapangan pekerjaan
yang dimasuki melalui aspek-aspek social demografi apa saja yang mempengaruhi kecenderungan
pekerja wanita dalam memilih lapangan pekerjaan.
Variabel tak bebas digunakan dalam analisis adalah lap
angan pekerjaan yang dimasuki oleh pekerja wanita yang telah digolongkan menjadi 2 (dua)
kelompok, yaitu lapangan pekerjaan pertanian (kode 0) dan non pertanian (kode 1).
Selanjutnya lapangan pekerjaan yang dimasuki pekerja wanita diregresikan terhadap beberapa
variable bebas yaitu ;
X = umur pekerja wanita
D1 = daerah tempat tinggal (0 = perkotaan, 1 = pedesaan)
D2 = status perkawinan (0 = kawin, 1 = tidak kawin)
D3 = kelompok pendidikan yang ditamatkan (0 = SLTA keatas, 1 = SLTP ke bawah)
D4 = status migrant (0 = migrant, 1 = non migran)
Berdasarkan sampel sebanyak 117.190 pekerja wanita, diperoleh hasil estimasi koefisien
regresi sebagai berikut (pengolahan menggunakan SPSS):
17
Tabel di atas menunjukan bahwa semua variable bebas berpengaruh signifikan terhadap
lapangan kerja yang dimasuki pekerja wanita di Kota Batam. Persamaan logit (regresi logistic)
yang diperoleh sebagai berikut ;
8
ln 9:8
= 5,843 – 0,014X – 2,353D1 + 0,283D2 - 1,476D3 - 0,634D4
19