Anda di halaman 1dari 7

KONSEP REGRESI LOGISTIK + CONTOH DENGAN SPSS 16 (Kasus Binary Reglog)

Malam ni sobat semua,, Wah wah wah.. Pada gimana nih kabarnya? Moga baik dan sehat-sehat
saja ya hehehe.. Yap, sekarang kita belajar lagi yuk materi yang baru.. Nah, kali ini saya mau
ngebahas dan ngasi contoh untuk metode statistik Regresi Logistik.

Kalau sobat pernah baca postingan saya tentang multiple regression, maka bedanya ada pada
skala data variabel terikatnya sob.. Untuk regresi logistik, skala data variabel terikat (Y) adalah
kategorik (non metrik). Ya bisa dua kategori, lebih dari dua (banyak kategori) dan bisa juga skala
datanya ordinal kategorik. Terkait konsep, sebenarnya sama saja dengan regresi biasa (sederhana
maupun berganda) yaitu melihat pengaruh dari variabel-variabel bebas terhadap variabel terikat.

Regresi logistik ini juga dipakai sebagai alternatif dari analisis multivariat yaitu analisis
diskriminan (pembeda). Nah, sebagai pengantar pengetahuan saja, dalam analisis diskriminan
kan dibutuhkan asumsi kenormalan multivariat.

Nah, bedanya dengan uji asumsi kenormalan biasa seperti ini; kalau uji asumsi kenormalan
biasa, yang diuji kenormalannya adalah residual dari variabel terikat/dependennya sedangkan
untuk multivariate normal, yang diuj kenormalannya adalah seluruh variabel bebasnya.

Asumsi multivariat normal ini terkadang sulit dipenuhi dalam analisis diskriminan karena
variabel bebas yang digunakan merupakan gabungan antara skala data kategorik/non metrik dan
kontinyu/metrik.

Dalam regresi logistik dikenal konsep Odds Ratio yang sama artinya dengan probabilitas atau
kecenderungan.
By the way, terkait analisis diskriminan ini akan dibahas secara khusus pada postingan
berikutnya. Sabar aja ya hehe..

Kalau seandainya,dalam penelitian sobat, pakainya ada dua kategori pada variabel terikatnya
misalnya lulus dan tidak lulus, maka dinamakan binary logistic regression. Kalau semisalnya
lebih dari dua kategori alias banyak dinamakan multinomial logistic regression. Nah, satu lagi,
kalau skala data variabel terikatnya ordinal (peringkat), dinamakan ordinal logistic regression.
Oke deh kali ini saya berikan contoh pengerjaannya. Monggo, datanya download disini

Kalo sobat sudah ambil dan lihat datanya, ada tiga buah variabel yakni hasil tes tertulis, jenis
kelas dan nilai tes praktikum. Disini saya mengambil sampel secara acak yakni 30 mahasiswa
jurusan tehnik sipil suatu kampus. Hasil tes tertulis yang adalah variabel terikat merupakan
kategorik (dua kategori yaitu 1=lulus dan 0=tidak lulus), jenis kelas juga kategorik (1=reguler
dan 0=non reguler) dan nilai tes praktikum adalah non kategorik (kontinyu).

Berikut cuplikan tampilan data view dan variabel viewnya:

Langkah pertama, klik Analyze, Regression, lalu pilih Binary Logistics.


Masukkan variabel hasil tes tertulis ke dalam bagian Independent sedangkan variabel jenis kelas
dan nilai tes praktikum masukkan ke bagian Covariates.. Berikut gambarannya:

Lalu, klik pada bagian Options dan centang seperti terlihat pada gambar di bawah ini:

Lalu klik Continue dan OK, maka akan dihasilkan output seperti berikut (langsung dengan
penjelasannya).
Apakah model sudah fit? Perhatikan saja nilai statistik-2 Log Likelihood. Untuk bagian
Beginning, yaitu nilai -2 Log likelihood yang masih hanya menggunakan konstanta (c) adalah
41,455 sedangkan saat kita sudah melibatkan dua variabel bebasnya (jenis kelas dan nilai tes
praktikum), nilai -2 Log Likelihood adalah 8,809 (iterasi maksimum/20).

Nah, hal ini sudah nunjukin ada penurunan nilai dong saat variabel bebas sudah ikut bermain
yakni sebesar 41,455-8,809= 32,646 (Lebih jelasnya, lihat pada bagian Omnibus Tests of
Coefficients)

Untuk Beginning, ternyata dihasilkan koefisien dari -2 Log Likelihood 0,134 yang lebih besar
dibanding alpha 5% sehingga dengan demikian kita menerima hipotesis nol yakni model sudah
fit. Atau bisa juga dengan membandingkan nilai 41,455 dengan nilai statistik Chi Square (0,05;
df=30-1) yaitu 42,5569678. Hasilnya tetap kita menerima hipotesis nol dan disimpulkan model
sudah fit.

Selanjutnya, untuk block 1


Nilai -2LogL kedua adalah sebesar 8,809. Lalu, kita bandingkan nilai ini dengan Chi Square
(0,05,df=30-3), ternyata hasilnya 8,809 < 40,1132721 (terima hipotesis nol >> tidak signifikan)
sehingga model sudah fit dengan data.

Kalau dalam regresi biasa, kita pakai nilai R square untuk menunjukkan pengaruh bersama. Nah,
pada regresi logistik kita pakai Cox & Snell dan Nagelkerke R Square. Secara bersama, variabel
jenis kelas dan nilai tes praktikum yang kita pakai dalam penelitian sudah mampu menjelaskan
keragaman data pada variabel hasil tes tertulis sebesar 88,6% (misal dengan Nagelkerke)
sedangkan sisanya sebesar 11,4% dijelaskan oleh variabel lain di luar model penelitian

Saatnya kita uji hipotesis dengan Hosmer and Lemeshow Test. Hasilnya, nilai Sig 0,999 lebih
besar daripada Alpha 5% sehingga kita menerima hipotesis nol (secara statistik tidak terdapat
perbedaan yang signifikan antara model dengan nilai observasi) sehingga model sudah fit dengan
data. Bisa juga dengan membandingkan nilai Chi Square hitung Hosmer dan Lemeshow Test
dengan chi square tabel seperti berikut; 0,583 < 14,0671404 (hasilnya tetap terima hipotesis nol)
Sekarang, sampai di bagian akhir untuk interpretasi model regresi logistik.. Yes yes yes hehehe..
Oiya berikut model penelitiannya yaaa..
Ln P/1-P=-19,856+2,552 Nilai_Tes_Praktikum+19,683 Jenis_Kelas

Karena variabel jenis kelas secara statistik tidak berpengaruh secara signifikan, maka yang kita
modelkan dan interpretasikan hanya variabel nilai tes praktikum saja. Tapi, camkan satu hal
bahwa variabel jenis kelas ini dikatakan tidak signifikan secara statistik, bukan berarti
pengaruhnya tidak ada (nol rasio), melainkan ada pengaruhnya, hanya saja sangat kecil.
Mungkin untuk penelitian lain (beda waktu, beda mahasiswa, beda universitas) bisa saja hasilnya
akan signifikan. Naaah, ini model penelitian yang akan kita ajukan hehehe..

Ln P/1-P=-19,856+2,552 Nilai_Tes_Praktikum

Tidak seperti regresi berganda, karena kita memakai Odds Ratio, maka untuk interpretasi
variabel kualitatif tentu cukup sulit dilakukan. Memang terkesan cukup memaksa kita
menginterpretasikan seperti ini:

"Kecenderungan mahasiswa jurusan teknik sipil untuk lulus tes tertulis berhubungan positif
dengan nilai tes praktikum. Setiap peningkatan nilai tes praktikum sebesar satu poin, membuat
tendensi/kecenderungan lulus tes tertulis 12,833 kali".

Naaaah, interpretasi sedemikian kurang rasional dan terkesan sedikit absurd, makanya untuk
variabel kuantitatif pada reglog cukup kita interpretasikan seperti ini:
"Semakin tinggi nilai tes praktikum mahasiswa jurusan teknik sipil, maka kecenderungannya
untuk lulus pada tes tertulis akan meningkat"

Andaikata, variabel jenis kelas kita anggap signifikan (ini sekedar belajar cara membaca output
variabel kualitatif yaaa hehehe) maka interpretasinya sebagai berikut:
Nilai odds ratio sebesar 3,533 yang artinya Kecenderungan mahasiswa jurusan teknik sipil kelas
reguler untuk lulus dalam ujian tertulis 3,533 kali mahasiswa jurusan teknik sipil kelas non
reguler.

Dalam interpretasi variabel kualitatif ini, kita gunakan mahasiswa non reguler (kode nol) sebagai
reference category. Kita pilih saja "first" pada Change Contrast. Naaah, untuk penelitian yang
menggunakan lebih dari dua kategori pada variabel bebas kualitatif, misalkan besar, sedang dan
kecil, maka penentuan reference category (variabel bebas rujukan untuk interpretasi) ini sangat
penting. Gunanya untuk kepentingan interpretasi..

Kalau dalam penelitian ini, saya hanya pakai dua kategori pada variabel kualitatif yaitu kelas non
reguler dan reguler sehingga pengaturan reference categorinya sudah langsung pada category
first (kelas non reguler).

Oke deh sobat semua, ini dulu yang bisa saya bagikan tentang binary logistic regression.. Kurang
lebihnya saya minta maaf.. Doakan aja ya agar reglog multinomial dan ordinal bisa saya berikan
postingannya juga hehehe.. Oke deh.. Semoga bermanfaat.. Salam sukses :-)

Anda mungkin juga menyukai