Kemampuan setiap variabel prediktor dalam menjelaskan respon ( 2 Pearson , rasio likelihood, regresi logit sederhana)
Konstruksi model regresi logit ganda
Variabel dengan p-value < 0,25 dapat dipertimbangkan untuk menjadi prediktor dalam model regresi logit ganda (suatu variabel tunggal mungkin tidak memiliki efek signifikan terhadap suatu respon namun setelah dikombinasikan dengan variabel lain dalam satu model, efek variabel tersebut menjadi signifikan) Evaluasi prediktor pada model regresi logit ganda Setelah model regresi logit ganda terbentuk, dilakukan evaluasi atas tiap prediktor dalam model, meliputi (1) Uji signifikansi untuk tiap parameter/ variabel (Wald Test) (2) Membandingkan tiap estimasi koefisien (model regresi logit ganda) dengan estimasi koefisien model yg hanya memuat variabel itu.
Variabel2 yang tidak memberikan kontribusi pada model berdasarkan
kriteria tersebut, dieliminasi dari model sehingga didapatkan model baru.
Model baru kemudian dibandingkan dengan model lama melalui uji
Likelihood Ratio Sebagai ilustrasi strategi pemodelan dalam regresi logistik digunakan sebagian variabel dari data studi tentang low birth weight (berat badan lahir rendah). Tujuan dari studi ini adalah untuk mengidentifikasi faktor resiko yang berhubungan dengan kelahiran bayi yang low birth weight (berat < 2500 gram). Seratus delapan puluh sembilan ibu yang ikut penelitian, 130 melahirkan bayi normal, sedangkan 59 melahirkan bayi dengan low birth weight.
Empat faktor resiko yang diduga berpengaruh terhadap kelahiran
bayi dengan low birth weight adalah: AGE: Age of the Mother in Years. LWT: Weight in Pounds at the Last Mentrual Period. RACE: Race (1 = White, 2 = Black, 3 = Other). FTV: Number of Physician Visits During the First Trimester. Output Regresi Logistik Ganda: BBLR vs AGE, LWT, RACE & FTV Output Regresi Logistik Ganda: BBLR vs AGE, LWT, RACE & FTV Output Regresi Logistik Ganda: BBLR vs LWT & RACE Output Regresi Logistik Ganda: BBLR vs LWT & RACE G dengan 5 variabel = 12,099 G dengan 3 variabel = 11,413 Selisihnya = 0,686 yg lebih kecil dari chi_square tabel dengan db 2 (perbandingan tidak signifikan artinya model dengan 5 variabel sama baiknya dengan model dengan 3 variabel).
LL model dengan 5 variabel = 222,573
LL model dengan 3 variabel = 223,259 Selisihnya = 0,686 yg lebih kecil dari chi_square tabel dengan db 2 (perbandingan tidak signifikan artinya model dengan 5 variabel sama baiknya dengan model dengan 3 variabel).