regresi logistik adalah bagian dari analisis regresi yang digunakan ketika variable
dependen (respon) merupakan variabel dikotomi. Variabel dikotomi biasanya hanya terdiri
atas dua nilai, yang mewakili kemunculan atau tidak adanya suatu kejadian yang biasanya
diberi angka 0 atau 1.
Tidak seperti regresi linier biasa, regresi logistik tidak mengasumsikan hubungan
antara variabel independen dan dependen secara linier. Regresi logistik merupakan regresi
non linier di mana model yang ditentukan akan mengikuti pola kurva seperti gambar di
bawah ini.
Secaraa umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang
dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relatif
dimana peluang hasl meningkat (rasio peluang > 1) atau (rasio peluang < 1) ketika niali
variabel prediktor meningkat sebesar satu unit.
➢ Uji Parsial
➢ R dan R2
➢ Tuliskan Model
e. Uji Asumsi
➢ UJI Noramlitas
➢ Uji Kecocokan Model
➢ Peramalan
2. Model regresi logistik
a. Model Probit
𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑝 𝑋𝑝 1 2
1 𝑥
𝜋= ∫ e2 𝑑𝑥
2 ∞
b. Model Logit
e𝛽0+𝛽1𝑋1+⋯+𝛽𝑝 𝑋𝑝
𝜋=
1 + e𝛽0+𝛽1𝑋1+⋯+𝛽𝑝 𝑋𝑝
atau
𝑝 𝑝
𝑙o𝑔𝑡(𝑝) = log( ) = 𝑛( )
1−𝑝 1−𝑝
Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan niali
setiap prediktor. Peluang dari suatu kejadian sebagai probabilitas hasil yang muncul
yang dibagi dengan probabilitas suatu kejadian tidak terjadi.
𝜋
= 𝜋∗
1−𝜋
c. Sampel yang diperlukan dalam jumlah relatif besar. Minimum dibutuhkan hingga
50 sampel data untuk sebuah variabel prediktor (bebas).
B. Studi Kasus
Suatu penelitian dilakukan untuk mengetahui seberapa besar peluang seseorang dapat
diterima bekerja di PT Makmur Jaya. Penelitian dilakukan dengan mengambil sampel
sebesar 40 orang dan menggunakan analisis regresi logistik. Adapun variabel yang diteliti
adalah sebagai berikut.
1. Carilah model logit dan model regresi logistik dari kasus tersbut.
2. Interpretasikan nilai estimasi β (dengan menggunakan nilai odd dari masing-masing
variabel).
3. Berapa peluang diterimanya seorang wanita yang ingin melamar pekerjaan di PT
Makmur Jaya, jika diketahui memiliki lama pendidikan 4 tahun dan pengalaman
bekerja 1 tahun ?
Berikut adalah data 40 orang yang melamar pekerjaan :
Pelamar Education (X1) Experience (X2) SEX (X3) HIRED (Y)
1 6 6 1 1
ANALISIS REGRESI LOGISTIK
2 6 3 1 1
3 8 3 0 1
4 8 10 0 1
5 4 5 1 1
6 6 1 1 1
7 8 5 1 1
8 4 10 1 1
9 6 12 0 1
10 6 2 0 1
11 4 0 1 0
12 4 1 0 0
13 4 2 1 0
14 4 4 0 0
15 6 1 0 0
16 4 2 1 0
17 8 5 1 0
18 4 2 0 0
19 6 7 0 0
20 6 4 0 0
21 8 0 1 0
22 4 0 0 0
23 4 1 1 0
24 4 5 1 0
25 6 0 1 0
26 4 9 0 0
27 8 1 0 0
28 6 1 1 0
29 6 6 1 1
30 6 3 1 1
31 8 3 0 1
32 8 10 0 1
33 4 5 1 1
ANALISIS REGRESI LOGISTIK
34 6 1 1 1
35 8 5 1 1
36 4 10 1 1
37 6 12 0 1
38 6 2 0 1
39 4 0 1 0
40 4 10 1 0
C. Deskripsi Kerja
Dalam melakukan analisis regresi logistik pada SPSS diperlukan langkah-langkah
sebagai berikut :
1. Membuka lembar kerja SPSS
Langkah-langkah yang diperlukan dalam menggunakan SPSS adalah sebagai berikut:
a. Klik star
b. Kemudian klik SPSS pada menu start
c. Setelah itu, maka muncul lembar kerja SPSS yang siap untuk digunakan
d. Kemudian klik variable view kemudian ketikkan nama variiabel dengan nama
Education, Experience, Sex, dan Hired
Berdasarkan tabel 2.1 dapat diketahui jumlah data yang dianalisis sebanyak 40 data
(included in Analysis), sedangkan missing cases bernilai nol (0) menunjukan tidak ada data
yang hilang ketika proses analisis data dilakukan. Dilihat dari tabel 2.2 didapt informasi
bahwa tebel tersebut mengkategorikan variabel dependen menjadi 1 untuk yang diterima
dan 0 untuk yang tidak diterima. Sedangkan tabel 2.2 memberikan informasi bahwa variabel
sex dikategorikan menjadi dua, yaitu 1 untuk jenis kelamin laki-laki dan 0 untuk jenis
kelamin perempuan. Selain itu juga dapai diketahui untuk jumlah pelamar yang berjenis
kelamin laki-laki itu sebanyak 23 dan sisanya 17 untuk jumlah pelamar dengan jenis
kelamin perempuan.
Tabel 2.4 Classification Tablea,b
ANALISIS REGRESI LOGISTIK
2. Uji Overall
Tabel 2.6 Omnibus Tests of Model Coefficients
d. Daerah Kritis
H0 ditolak jika P-value < α → P-value (0.857) > α (0.05)
e. Keputusan
Gagal tolak H0
f. Kesimpulan
Dengan 𝛼 = 5% dapat disimpulkan bahwa model regresi logistik yang digunakan
telah cukup mampu menjelaskan data (sesuai)
Berdasarkan tabel 3.8 hasil output pada Cox-Snell R2 dan Nagelkerke R memiliki
analogi sama dengan nilai R-square pada regresi linier, menyakatan bahwa sebanyak
40,5% keragaman dapat dijelaskan oleh model, sedangkan sisanya (59,5%) dijelaskan
oleh faktor (variabel) lain diluar model penelitian.
Tabel 2.9 Classification Tablea
Cut value yang terdapat dalam output di atas mengindikasikan batas peluang setiap
kejadian sukses dan gagal. Jika nilai prediksi dalam data (PRE_1) lebih dari 0,5 maka
kejadian ini sukses atau diterima (ditunjukkan dalam variabel PGR_1 dengan nilai 1)
dalam data SPSS. Sebaliknya, jika nilainya kurang dari 0,5 maka hasilnya tidak sukses
atau gagal (ditunjukkan dalam variabel PGR_1 dengan nilai 0). Dari data tersebut dapat
diketahui juga bahwa nilai-nilai prediksi dapat memprediksi variabel-variabel dengan
tingkat kebenaran 75% (lebih besar daripada ketika mengikutsertakan konstanta).
ANALISIS REGRESI LOGISTIK
3. Uji Partial
Tabel 2.10 Variables in The Equation Block 1
Untuk β2
a. Hipotesis
H0 : β2 = 0 (Variabel Experience tidak signifikan mempengaruhi Y)
H1 : β2 ≠ 0 (Variabel Experience signifikan mempengaruhi Y)
b. Tingkat Signifikasi
α = 5%
c. Statistik Uji
P-value = 0,011
ANALISIS REGRESI LOGISTIK
d. Daerah Kritis
H0 ditolak jika P-value < α → P-value (0.011) < α (0.05)
e. Keputusan
Tolak H0
f. Kesimpulan
Dengan 𝛼 = 5% dapat disimpulkan bahwa variabel experience signifikan
mempengaruhi Y.
Untuk β3
a. Hipotesis
H0 : β2 = 0 (Variabel Sex tidak signifikan mempengaruhi Y)
H1 : β2 ≠ 0 (Variabel Sex signifikan mempengaruhi Y)
b. Tingkat Signifikasi
α = 5%
c. Statistik Uji
P-value = 0,220
d. Daerah Kritis
H0 ditolak jika P-value < α → P-value (0.220) > α (0.05)
e. Keputusan
Gagal tolak H0
f. Kesimpulan
Dengan 𝛼 = 5% dapat disimpulkan bahwa variabel sex tidak signifikan
mempengaruhi Y.
Karena variabel sex tidak signifikan, maka dilakukan pengujian kembali dengan
output sebagai berikut:
1. Uji Overall Setelah Variabel Sex Dikeluarkan
Tabel 2.11 Omnibus Tests of Model Coefficients Tanpa variabel sex
Selain menggunakan nilai pada tabel 3.6, uji overall juga dapat dilakukan dengan
menggunakan nilai Hosmer Lemeshow seperti berikut:
Tabel 2.12 Hosmer and Lemeshow Test Tanpa Variabel Sex
Berdasarkan tabel 2.13 hasil output pada Cox-Snell R2 dan Nagelkerke R memiliki
analogi sama dengan nilai R-square pada regresi linier, menyakatan bahwa sebanyak
36,7% keragaman dapat dijelaskan oleh model, sedangkan sisanya (63,3%) dijelaskan
oleh faktor (variabel) lain diluar model penelitian.
Cut value yang terdapat dalam output di atas mengindikasikan batas peluang setiap
kejadian sukses dan gagal. Jika nilai prediksi dalam data (PRE_1) lebih dari 0,5 maka
kejadian ini sukses atau diterima (ditunjukkan dalam variabel PGR_1 dengan nilai 1)
dalam data SPSS. Sebaliknya, jika nilainya kurang dari 0,5 maka hasilnya tidak sukses
atau gagal (ditunjukkan dalam variabel PGR_1 dengan nilai 0). Dari data tersebut dapat
diketahui juga bahwa nilai-nilai prediksi dapat memprediksi variabel-variabel dengan
tingkat kebenaran 62,5% (lebih besar daripada ketika mengikutsertakan konstanta).
2. Uji Partial
Tabel 2.15 Variables in The Equation Block 1 Tanpa Variabel Sex
a. Hipotesis
H0 : β0 = 0 (konstanta tidak signifikan mempengaruhi Y)
H1 : β0 ≠ 0 (konstanta signifikan mempengaruhi Y)
b. Tingkat Signifikasi
α = 5%
c. Statistik Uji
P-value = 0,009
d. Daerah Kritis
H0 ditolak jika P-value < α → P-value (0.009) < α (0.05)
e. Keputusan
Tolak H0
f. Kesimpulan
Dengan 𝛼 = 5% dapat disimpulkan bahwa konstanta signifikan mempengaruhi Y.
Untuk β1
a. Hipotesis
H0 : β1 = 0 (Variabel Education tidak signifikan mempengaruhi Y)
H1 : β1 ≠ 0 (Variabel Education signifikan mempengaruhi Y)
b. Tingkat Signifikasi
α = 5%
c. Statistik Uji
P-value = 0,029
d. Daerah Kritis
H0 ditolak jika P-value < α → P-value (0.029) < α (0.05)
e. Keputusan
Tolak H0
f. Kesimpulan
Dengan 𝛼 = 5% dapat disimpulkan bahwa variabel education signifikan
mempengaruhi Y.
Untuk β2
a. Hipotesis
H0 : β2 = 0 (Variabel Experience tidak signifikan mempengaruhi Y)
H1 : β2 ≠ 0 (Variabel Experience signifikan mempengaruhi Y)
b. Tingkat Signifikasi
ANALISIS REGRESI LOGISTIK
α = 5%
c. Statistik Uji
P-value = 0,015
d. Daerah Kritis
H0 ditolak jika P-value < α → P-value (0.015) < α (0.05)
e. Keputusan
Tolak H0
f. Kesimpulan
Dengan 𝛼 = 5% dapat disimpulkan bahwa variabel experience signifikan
mempengaruhi Y.
Setelah dilakukan uji overall dan partial didaptkan model logit sebagai berikut:
Logit (p) = Ln 𝑝
= −4,467 + 0,58 Education + 0,293 Experience
−𝑝
F. Kesimpulan
Berdasarkan pengujian yang telah dilakukan pada bab tiga diperoleh
kesimpulan bahwa variabel yang mempengaruhi diterima atau tidaknya seorang
pelamar oleh PT Makmur Jaya dipengaruhi oleh varibel education dan experience.
Variabel-variabel yang berpengaruh tersebut hanya mempengaruhi variabel Y sebesar
36,7% dan sisanya dipengaruhi variabel lain diluar model. Peluang seseorang diterima
bekerja di PT Makmur Jaya yaitu sebesar 0,7639 dan peluang tidak tidak diterima
seseorang di PT Makmur Jaya yaitu sebesar 0,2361.