Regresi Logistik adalah suatu metode analisis statistika untuk mendeskripsikan hubungan antara
peubah respon (dependent variable) yang memiliki dua kategori atau lebih dengan satu atau lebih
peubah penjelas (independent variable) berskala kategori atau interval (Hosmer dan Lemeshow,
2000).
Regresi Logistik merupakan regresi non linear, digunakan untuk menjelaskan hubungan antara X dan
Y yang bersifat tidak linear, ketidak normalan sebaran Y, keragaman respon tidak konstan yang tidak
dapat dijelaskan dengan model regresi linear biasa (Agresti, 1996).
Regresi logistik adalah suatu model matematik yang digunakan untuk mempelajari hubungan satu
atau beberapa variabelindependendengan satu variabeldependen yang bersifat dikotomi (binary)
Kemudian pada jendela utama, klik OK dan segera lihat Output anda.
Demikian cara melakukan Uji Regresi Logistik dengan SPSS menggunakan metode
simultan atau metode enter. Untuk interprestasi hasil pengujian atau outputnya, bisa
anda baca pada artikel selanjutnya yaitu Interprestasi Regresi Logistik dengan
SPSS. Untuk mempelajari regresi logistik dalam pemilihan faktor paling dominan,
anda bisa pelajari di artikel kami yang berjudul Regresi Logistik Ganda dalam SPSS.
Share0
Tweet
Share0
Share0
Share0
Nilai -2 Log Likelihood (276,939) > X2 tabel (232,912) sehingga menolak H0, maka
menunjukkan bahwa model sebelum memasukkan variabel independen adalah
TIDAK FIT dengan data.
Perlu diingat bahwa nilai B identik dengan koefisien beta pada Ordinary Least
Square (OLS) atau regresi linear. Sedangkan Uji Wald identik dengan t parsial pada
OLS. Sedangkan Exp(B) adalah nilai eksponen dari B, maka Exp(0,080) = 1,083.
Nilai -2 Log Likelihood (207,575) < X2 tabel (230,746) sehingga menerima H0, maka
menunjukkan bahwa model dengan memasukkan variabel independen adalah FIT
dengan data. Hal ini berbeda dengan Block Beginning di atas, di mana saat sebelum
variabel independen dimasukkan ke dalam model, model TIDAK FIT dengan data.
Pseudo R Square
Nilai Nagelkerke R Square sebesar 0,391 dan Cox & Snell R Square 0,293, yang
menunjukkan bahwa kemampuan variabel independen dalam menjelaskan
variabel dependen adalah sebesar 0,391 atau 39,1% dan terdapat 100% – 39,1% =
60,9% faktor lain di luar model yang menjelaskan variabel dependen.
Oleh karena dalam tutorial Interprestasi regresi logistik dengan SPSS ini, nilai
Hosmer and Lemeshow Test menolak H0, sebaiknya anda mencoba untuk membuat
agar nilai Hosmer and Lemeshow Test menerima H0.
Cara Mengatasi Hosmer Lemeshow
Caranya adalah dengan mengubah model persamaan regresi logistik dengan
menambahkan variabel interaksi antar variabel independen. Misal pada kasus di
sini, dengan menambahkan variabel interaksi antara X1 dan X2.
Lebih jelasnya akan saya bahas pada bagian akhir dalam artikel ini yaitu pada
bagian VARIABEL INTERAKSI. Sehingga anda untuk sementara bisa melanjutkan
pembelajaran ini, seolah-olah hasil uji Hosmer and Lemeshow Test menerima H0.
Classification Result
Pendugaan Parameter
Pendugaan Parameter
Odds Ratio
Besarnya pengaruh ditunjukkan dengan nilai EXP (B) atau disebut juga ODDS
RATIO (OR). Variabel Merokok dengan OR 6,277 maka orang yang merokok (kode
1 variabel independen), lebih beresiko mengalami kanker paru (kode 1 variabel
dependen) sebanyak 6,277 kali lipat di bandingkan orang yang tidak merokok (kode
0 variabel independen). Nilai B = Logaritma Natural dari 6,277 = 1,837. Oleh karena
nilai B bernilai positif, maka merokok mempunyai hubungan positif dengan kejadian
kanker.
Variabel Riwayat Keluarga dengan OR 2,645 maka orang yang ada riwayat keluarga
(kode 1 variabel independen), lebih beresiko mengalami kanker paru (kode 1
variabel dependen) sebanyak 2,645 kali lipat di bandingkan orang yang tidak ada
riwayat keluarga (kode 0 variabel independen). Nilai B = Logaritma Natural
dari 2,645 = 0,973. Oleh karena nilai B bernilai positif, maka riwayat keluarga
mempunyai hubungan positif dengan kejadian kanker.
Misalkan sampel yang merokok dan ada riwayat keluarga, maka merokok=1 dan
riwayat keluarga=1. Jika dimasukkan ke dalam model persamaan di atas, maka
sebagai berikut:
Outlier
Nilai Outlier
Share0
Tweet
Share0
Share0
Share0
Tentunya semua variabel independen haruslah berskala data dikotom juga, tetapi
apabila skalanya kategorik nominal lebih dari 2 kategori, masih dapat dilakukan uji
regresi logistik ganda dengan cara melakukan dummy.
Bahasan tentang dummy akan kita bahas pada artikel berikutnya. Pada bahasan kali
ini khusus akan membahas tutorial melakukan uji regresi logistik ganda dengan
menggunakan software SPSS For Windows.
CATATAN:
Tutorial ini untuk Regresi Logistik dalam upaya menentukan variabel bebas paling
dominan terhadap variabel terikat. Untuk pembahasan Regresi Logistik secara
umum, baca: Regresi Logistik. Untuk tutorial regresi logistik dengan SPSS,
baca Regresi Logistik dengan SPSS.
Variabel Independen:
Ubah Value pada tab Variable View di SPSS sebagai berikut: Ya/Aktif = 1,
Tidak/Pasif = 2. Ubah Measure menjadi “Nominal”. Ubah Decimals menjadi
“0”. Ubah Type menjadi “Numeric”
Langkah berikutnya adalah isi data dengan nilai 1 atau 2. 1 apabila jawaban “Ya”
atau “Aktif” dan 2 apabila “Tidak” atau “Pasif”. Sebagai contoh gunakanlah 30
responden.
Setelah data terisi, maka kita mulai melakukan tahapan uji regresi logistik ganda
yang sesungguhnya.
Ada beberapa metode atau teknik dalam melakukannya, yaitu antara lain: “Enter”,
“Stepwise”, “Forward”, “Backward” di mana masing-masing punya maksud yang
berbeda. Dalam bahasan ini akan kita lakukan secara “stepwise” dengan proses
manual, agar mudah memahami maksudnya.
Seleksi Kandidat
Dalam langkah ini kita akan menyeleksi, variabel independen manakah yang layak
masuk model uji multivariat. Di mana yang layak adalah yang memiliki tingkat
signifikansi (sig.) atau p value < 0,025 dengan metode “Enter” dalam regresi logistik
sederhana. Yaitu dengan melakukan satu persatu regresi sederhana antara masing-
masing variabel independen terhadap variabel dependen.
Klik OK
Lihat hasilnya!
Dari hasil di atas, lihat tabel “variables in the equation” dan lihat nilai “sig.” . Didapat
nilai signifikan <0,25, yang berarti variabel “tekanan kandung kemih” layak masuk
model multivariat.
Lakukan dengan cara di atas pada empat variabel independen lainnya. Apabila
signifikansi > 0,25 maka variabel independen yang bersangkutan tidak layak masuk
model multivariat.
Setelah dilakukan seleksi kandidat, inventarisir variabel mana yang layak masuk
model dan urutkan dalam tabel dimulai dari yang nilai signifikansinya terbesar.
Hasil analisis menunjukkan nilai p value subvariabel tekanan kandung kemih (0,377)
dan heart burn (0,244) sehingga tidak masuk ke uji multivariat karena p valuenya >
0,25. Sedangkan pruritus (0,041), kram kaki (0,045), gerak janin (0,088) masuk ke
uji multivariate karena p valuenya < 0,25.
Berarti ada 3 variabel yang akan diuji, yaitu: gerak janin, kram kaki dan pruritus.
Langkah berikutnya adalah masukkan ketiga variabel di atas dalam regresi logistik
ganda dengan cara:
Analisis Multivariat
klik analyze, regression, binary logistic.
Klik OK.
Lihat Hasilnya!
Subvariabel kram kaki dan gerak janin memiliki p value < 0,05 yaitu kram kaki (0,035) dan gerak
janin (0,012). Sedangkan subvariabel pruritus memiliki p value > 0,05 yaitu 0,061. Langkah
berikutnya, subvariabel yang memiliki p value terbesar yaitu pruritus (0,061) dikeluarkan dari model.
Cek Apakah setelah satu variabel pruritus dikeluarkan, ada perubahan ODDS Ratio (Exp (B))
> 10%?
Apabila ada, kembalikan variabel yang dikeluarkan kembali pada model dan ulangi dengan
mengeluarkan yang terbesar selain yang dimasukkan kembali. Ulangi Terus hingga hanya tertinggal
satu variabel atau tidak ada yang bisa dikeluarkan lagi karena perubahan ODDS Ratio > 10%.
Setelah subvariabel pruritus dikeluarkan, perubahan OR dapat dilihat pada tabel berikut:
Hasil analisis multivariat menunjukkan bahwa setelah subvariabel pruritus dikeluarkan diperoleh
perubahan OR > 10% yaitu pada subvariabel kram kaki (54%) dan subvariabel gerak janin (34%)
sehingga subvariabel pruritus dimasukkan kembali ke dalam pemodelan, seperti pada tabel berikut:
Langkah selanjutnya adalah pengeluaran subvariabel kram kaki (0,035) karena memiliki p value
terbesar kedua setelah pruritus (0,061).
Setelah subvariabel pruritus dikeluarkan, perubahan OR dapat dilihat pada tabel berikut:
Hasil analisis multivariate menunjukkan bahwa setelah subvariabel kram kaki dikeluarkan diperoleh
perubahan OR > 10% yaitu pada subvariabel pruritus (57,4%) dan subvariabel gerak janin (65,3%)
sehingga subvariabel kram kaki dimasukkan kembali ke dalam pemodelan, seperti pada tabel berikut:
Hasil analisis: dapat disimpulkan bahwa dari keseluruhan variabel independen yang diduga
mempengaruhi gangguan tidur (insomnia) pada ibu hamil trimester ketiga terdapat satu subvariabel
(gerak janin) yang paling berpengaruh terhadap gangguan tidur dengan p value 0,012 < 0,05. Nilai
OR terbesar yang diperoleh yaitu 26,252 artinya gerak janin aktif yang dirasakan responden
mempunyai peluang 26,252 kali menyebabkan adanya gangguan tidur (insomnia).
Kesimpulan Akhir:
1. Semua variabel yang masuk model atau yang lolos seleksi kandidat, berarti memiliki
pengaruh terhadap variabel dependen.
2. Apabila setelah diuji dalam model akhir multivariat, yang tersisa dalam model berarti
terbukti sebagai variabel independen yang secara bermakna atau signifikan
mempengaruhi variabel dependen. Sedangkan yang tidak masuk model akhir, berarti
sebagai variabel perancu atau counfounding yang artinya menjadi variabel yang
mempengaruhi hubungan variabel independen dan dependen.
3. Variabel dengan Odds Ratio terbesar dalam model akhir multivariat, menjadi variabel
yang paling dominan mempengaruhi variabel dependen.