Anda di halaman 1dari 21

REGRESI LOGISTIK

Untuk Memenuhi Tugas Mata Kuliah Ekonometrika (ABKC1508)

Dosen Pengampu:

Dr. Karim, M.Si.

Rizki Amalia, M.Pd.

Taufiq Hidayanto, M.Pd.

Anggota Kelompok 12 :
Fenny Nor Azatil Khasanah 1710118320008
Elva Soraya Putri Salsabella 1810118120009
Agus Basrianor 1810118210026
Rizki Cica Ananda 1810118320006

PROGRAM STUDI PENDIDIKAN MATEMATIKA


FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMBUNG MANGKURAT
BANJARMASIN
2020
REGRESI LOGISTIK

A. MATERI REGRESI LOGISTIK


1. Pengertian Regresi Logistik

Regresi logistik adalah sebuah pendekatan untuk membuat model prediksi seperti
halnya regresi linear atau yang biasa disebut dengan istilah Ordinary Least Squares
(OLS) regression. Perbedaannya adalah pada regresi logistik, peneliti memprediksi
variabel terikat yang berskala dikotomi. Skala dikotomi yang dimaksud adalah skala data
nominal dengan dua kategori, misalnya: Ya dan Tidak, Baik dan Buruk atau Tinggi dan
Rendah. Apabila pada OLS mewajibkan syarat atau asumsi bahwa error varians (residual)
terdistribusi secara normal. Sebaliknya, pada regresi ini tidak dibutuhkan asumsi tersebut
sebab pada regresi jenis logistik ini mengikuti distribusi logistik.

2. Asumsi Regresi Logistik

Asumsi Regresi Logistik antara lain:

1) Regresi logistik tidak membutuhkan hubungan linier antara variabel independen dengan
variabel dependen.
2) Variabel independen tidak memerlukan asumsi multivariate normality.
3) Asumsi homokedastisitas tidak diperlukan
4) Variabel bebas tidak perlu diubah ke dalam bentuk metrik (interval atau skala ratio).
5) Variabel dependen harus bersifat dikotomi (2 kategori, misal: tinggi dan rendah atau baik
dan buruk)
6) Variabel independen tidak harus memiliki keragaman yang sama antar kelompok variabel
7) Kategori dalam variabel independen harus terpisah satu sama lain atau bersifat eksklusif
8) Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50
sampel data untuk sebuah variabel prediktor (independen).
9) Dapat menyeleksi hubungan karena menggunakan pendekatan non linier log transformasi
untuk memprediksi odds ratio. Odd dalam regresi logistik sering dinyatakan sebagai
probabilitas.
3. Model Persamaan Regresi Logistik
Model persamaan aljabar layaknya OLS yang biasa kita gunakan adalah berikut:
Y =B0 + B1 X +e
Dimana e adalah error varians atau residual.
Dengan model regresi ini, tidak menggunakan interpretasi yang sama seperti halnya
persamaan regresi OLS. Model Persamaan yang terbentuk berbeda dengan persamaan
OLS.

Berikut persamaannya:


ln [ ¿ ]=B0 + B1 X ¿
1− p̌

Ln: Logaritma Natural.

Di mana:

B0 +B 1 X : Persamaan yang biasa dikenal dalam OLS.

p̌ :adalah probabilitas logistik yang didapat rumus sebagai berikut:

exp(B0 +B 1 X ) eB + B X
0 1

p̌= =
1+exp( B0 + B1 X ) 1+e B +B X 0 1

Di mana:

exp atau ditulis “e” adalah fungsi exponen.


B. Kasus

Suatu perusahaan mengadakan open recruitment untuk posisi karyawan baru yang
ditujukan untuk fresh graduate. Penelitian dilakukan untuk melihat pengaruh nilai IPK,
skor TOEFL, dan keikutsertaan mengikuti training leadership terhadap hasil kelulusan
recruitment. Dimiliki variabel-variabel berikut :

Hasil Recruitment : 1 jika LULUS, 0 jika TIDAK LULUS

Skor TOEFL : nilai TOEFL terakhir

Keikutsertaan Training: 1 untuk mengikuti training, 0 untuk tidak mengikuti training

IPK : Indeks Prestasi Kumulatif

Data :

Hasil IPK Skor Keikutsertaan


Recruitment TOEFL Training
0 2,76 410 1
0 2,87 530 1
0 3,03 560 1
1 3,92 607 1
0 2,63 520 1
0 3,32 520 1
0 3,57 563 1
1 3,26 600 1
0 3,53 365 1
0 2,74 550 1
0 2,75 467 1
0 2,83 467 1
0 3,12 550 0
1 3,16 611 0
0 2,06 563 0
1 3,62 650 0
0 2,89 389 0
0 3,51 620 0
1 3,54 600 0
1 2,83 635 0
1 3,39 467 0
0 2,67 600 0
1 3,65 550 0
1 4 580 0
0 3,1 550 0
1 2,39 490 0
Pertanyaan :

a. Lakukan analisis pengaruh nilai IPK, skor TOEFL, dan keikutsertaan mengikuti training
leadership terhadap hasil kelulusan recruitment, bentuk model logit!
b. Interpretasikan nilai odds ratio masing-masing variabel!
c. Apabila seseorang dengan skor TOEFL=550, UPK=3,70, dan mengikuti training
leadership, hitung peluang lulus recruitment!
d. Apabila seseorang mahasiswa dengan skor TOEFL=320, IPK=2,65, dan tidak mengikuti
training leadership, hitung peluang lulus recruitment!

Langkah-langkah dalam SPSS :

1. Buka aplikasi SPSS. Masukkan data yang akan dianalisis, sebelumnya pada variable view
masukkan nama jenis data yang akan dianalisis.

2. Analisis dari data yang telah dimasukkan dalam data view. Langkahnya adalah Analyze >
Regression > Binary Logistic
3. Masukkan Hasil Recruitment ke dalam kolom Dependent. IPK, Toefl, dan Training
dimasukkan ke dalam kolom Covariates. Dan menggunakan method Enter
4. Klik Save > centang pada menu Predicted Values kolom Probabilities, Group
membership. Dan pada menu Residuals centang kolom Unstandartdized > klik continue
5. Menu Option pada tampilan Logistic Regression. Pada menu Statitics and Plots cenang
Classification plots, Hosmerlemeshow, Casewise listing of residuals. Correlations of
estimate, iteration history, dan ci for exp (B) 95%.
Pada menu Display pilih At each step > klik Continue
6. Klik OK maka akan muncul Outputnya pada aplikasi SPSS
Uji Overall dipakai untuk melihat apakah variabel independent berpengaruh terhadap
variabel dependent. Berikut adalah pembahasan uji overall pada tabel omnimus test of model
coefficient :
Berdasarkan hasil output diatas, dapat dilakukan uji overall. Berikut adalah uji overall :

 Hipotesis
H0 :
= 0 ; i = 1, 2, 3 (variabel independen tidak berpengaruh terhadap variabel dependen)
H1 : Minimal ada salah satu
≠ 0 ; i = 1, 2, 3 (minimal ada salah satu variabel independen berpengaruh terhadap
variabel dependen)
 Tingkat signifikansi
α =5 %
 Daerah kritis
Terima H0 jika Sig > α
 Statistik uji
Sig ( 0,008 ) < α (0,05)
 Keputusan
Maka tolak H0
 Kesimpulan
Dengan α =5 % berdasarkan pada data bahwa minimal ada salah satu variabel
independen berpengaruh terhdap variabel dependen.

Uji yang selanjutnya adalah uji overall yang kedua pada tabel Model Summary di bawah
ini :
Dari hasil output di atas, dapat dilakukan uji hipotesis dan nilaip-value dapat dilihat pada
kolom Sig dalam masing-masing variabel. Berikut adalah uji overall kedua :

 Hipotesis
H0 :
= 0 ; i = 1, 2, 3 (variabel independen tidak berpengaruh terhadap variabel dependen)
H1 : Minimal ada salah satu
≠ 0 ; i = 1, 2, 3 (minimal ada salah satu variabel independen berpengaruh terhadap
variabel dependen)
 Tingkat signifikansi
α =5 %
 Daerah kritis
Tolak H0 jika -2 log likelihood > chi-square tabel
 Statistik uji
-2 log likelihood (22, 818) > chi-square tabel (11,828)
 Keputusan
Maka tolak H0
 Kesimpulan
Dengan α =5 % berdasarkan pada data bahwa minimal ada salah satu variabel
independen berpengaruh terhadap variabel dependen.

Selanjutnya adalah uji parsial, dengan SPSS yaitu output Block 1. Untuk uji ini pada
tabel Variabel in thr Equation. Hasil tersebut berisi tentang variabel yang signifikansi
terhadap variabel dependen, dengan cara mengeluarkan variabel yang tidak signifikan
terhadap variabel dependen, variabel yang tidak signifikan yaitu variabel TOEFL.

Berikut adalah hasil dari SPSS :


Berdasarkan output dapat dilakukan uji hipotesis, nilai P-value didapatkan pada
kolom Sig pada masing-masing variabel :

 Hipotesis
H0 :
= 0 ; i = 1, 2, 3 (variabel independen tidak berpengaruh terhadap variabel dependen)
H1 :
≠ 0 (variabel independen berpengaruh terhadap variabel dependen)
 Tingkat signifikansi
α =5 %
 Daerah kritis
Tolak H0 jika Sig < α
 Statistik uji dan kesimpulan

Variabel Sig. α Keputusan


Constant 0,244 > 0,05 Gagal Tolak
H0
IPK 0,026 < 0,05 Tolak H0
Keikutsertaan 0,034 < 0,05 Tolak H0

 Kesimpulan
Dengan α =5 % berdasarkan pada data bahwa minimal ada salah satu variabel
independen berpengaruh terhadap variabel dependen.

Penentuan model
Setelah melakukan uji overall dan uji parsial diatas selanjutnya melakukan penentuan
model yang di dapatkan pada output tabel variable in the equation kolom yang B,
berikut adalah outputnya :

Dari hasil diatas dapat disusun bahwa model regresi logistic sebagai berikut, dengan
X1 sebagai variabel IPK dan X2 sebagai variabel training sebagai variabel yang
signifikan :
exp (−0,470+ 4,932 X 1+4,474 X 2 )
π (x )=
1+exp (−0,470+ 4,932 X 1+ 4,474 X 2 )

Pada kasus yang kedua yaitu menginterpretasikan nilai odds ratio untuk masing-
masing variabel yang didapatkan hasil pada tabel variable in the equation pada kolom
Exp(B).
didapatkan bahwa interpretasi kemungkinan hasil recruitmen karyawan diperusahaan
akan memberikan keputusan untuk lulus diperusahaan dengan nilai IPK sebesar 8,738
kali dari karyawan yang tidak lulus. Dapat disimpulkan bahwa setiap penambahan 1
satuan nilai IPK akan menambah sebesar 8,738 pada variabel keputusan hasil
recruitmen. Kemungkinan bahwa keikutsertaan training karyawan akan memberikan
keputusan karyawan untuk lulus diperusahaan berdasarkan mengikuti training sebesar
0,153 kali dari karyawan yang tidak mengikuti training. Maka dapat disimpulkan
bahwa setiap penambahan 1 satuan keikutsertaan training akan menambah sebesar
0,153 pada variabel keputusan hasil recruitmen.

Uji kecocokan model

Uji tersebut didapatkan pada hasil tabel hosmer and lomeshow test. Berikut adalah
tabelnya :

Dari hasil output diatas dapat di analisis menggunakan uji hipotesis dengan nilai
p-valuenya yaitu pada kolom Sig pada masing - masing variabel.

· Hipotesis

H0 : model sesuai dengan data

H1 : model tidak sesuai dengan data

Tingkat signifikansi α = 5%

Daerah kritis

Tolak H0 jika Sig < α

· Statistika uji

p-value = 0,635 > α = 0,05

· Keputusan : gagal tolak H0


· Dengan α = 0,05 maka dapat disimpulkan bahwa model yang telah didapatkan sesuai
dengan data.

Interpretasi odds ratio

Berdasarkan tabel variable in the equations kolom (B). Pada persentase variabel yang di
prediksi model dikatakan mampu menebak dengan benar sebesar 76,9% atau semua
data pada variabel independen yang di analisis sebesar 80,8% berpengaruh terhadap
nilai variabel dependen mengikutsertakan parameter konstanta. Dengan jumlah total
data yang di observasi sebesar 26 data dan ada 20 orang yang lulus itu memperkuat
keputusan. Untuk hasil yang tidak lulus didapatkan percentage correct sebsar 81,3% dan
untuk yang lulus didapatkan percentage correct sebsar 80,0% yang berpengaruh
terhadapat variabel dependen yang mengikuti parameter konstanta. Berikut adalah hasil
outputnya :

Interpretasi model adalah menginterpretasikan model yang didapatkan oleh pada output
tabel Model Summary. Berikut adalah tampilan outputnya:

Berdasarkan pada hasil output dapat dijelaskan bahwa kemampuan variabel independen
(variabel Toefl, variabel IPK, dan variabel keikutsertaan training) dapat menjelaskan
variabel dependen (variabel hasil recruitment ) sebesar 4,496% kedalam model dan
sisanya sebesar 95,504 % dipengaruhi oleh faktor lain diluar model.

Selanjutnya pada kasus yang c yaitu apabila seseorang dengan skor Toefl yang
didapatkan 550, IPK = 3,70, dan mengikuti training, menghitung peluang lulus
recruitmen maka didapatkan rumus berikut :

Peluang lulus recruitmen untuk karyawan diperusahaan adalah sebesar 9,99% dengan
skor TOEFL = 550, IPK = 3.70, dan mengikuti training leadership.

Selanjutnya menyelesaikan studi kasus pada point d yaitu apabila seseorang mahasiswa
dengan skor TOEFL = 320, IPK = 2.65, dan tidak mengikuti training leadership, hitung
peluang lulus recruitment.

Maka peluang lulus recruitmen untuk karyawan diperusahaan adalah sebesar 9,98%
dengan skor TOEFL = 320, IPK = 2.65, dan tidak mengikuti training leadership.

Dari kasus yang sudah dianalisis oleh maka dapat disimpulkan bahwa :

1. Dengan menggunakan uji overall didapatkan kesimpulan bahwa IPK, Toefl, dan
keikutsertaan training berpengaruh terhadap hasil kelulusan.

2. Dengan menggunakan uji parsial didapatkan kesimpulan bahwa IPK, dan


keikutsertaan training berpengaruh terhadap hasil kelulusan.

Anda mungkin juga menyukai