REGRESI LOGISTIK
Pada regresi linier kita ingin mengestimasi nilai mean variabel dependen
berdasarkan setiap nilai variabel independennya. Nilai tersebut disebut sebagai mean
kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai dependen dan x sebagai
independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x. Misalnya Y
variabel tekanan darah dan x variabel umur. Maka untuk mengetahui estimasi tekanan
darah berdasarkan umur, dihitung rata-rata (mean) tekanan darah pada masing-masing
nilai umur. Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s.d ∞ [0 ≤ E (Y/x)
≤∞].
Pada regresi logistik dapat pula diperlakukan hal tersebut namun ada sedikit
perbedaan dalam menghitung rata-rata variabel dependennya (Y). Oleh karena itu pada
regresi logistik dependennya adalah dikotom, maka variabel dependen dihitung bukan
dengan mean namun menggunakan proporsi. Seperti pada data diatas variabel Y kejadian
BBLR dan x variabel umur, maka untuk mengetahui estimasi kejadian BBLR
berdasarkan umur, dihitung proporsi kejadian BBLR pada tiap kelompok umur. Pada
regresi logistik, nilai E(Y/x) akan selalu berada dalam 0 dan 1 [0 ≤ E (Y/x) ≤ 1].
Regresi logistik terbagi menjadi dua, yaitu: (1) Regresi Logistik Sederhana,
digunakan bila ingin mempelajari hubungan antara satu variabel independen dengan satu
variabel dependen yang bersifat dikotomi. (2) Regresi logistik ganda, digunakan bila
2
ingin mempelajari hubungan antara beberapa variabel independen dengan satu variabel
dependen yang bersifat dikotomi. Fungsi dari regresi logistic ganda ini adalah: (a)
Menetapkan model matematik yang paling baik untuk menggambarkan hubungan
variabel independen dengan variabel dependen, (b) Menggambarkan hubungan
kuantitatif antara variabel independen (x) dengan variabel dependen (y) setelah dikontrol
variabel lain, (c) Mengetahui variabel independen (x) mana yang penting (dominan)
dalam memprediksi variabel dependen, (d) Mengetahui adanya interaksi pada dua atau
lebih variabel independen terhadap variabel dependen.
Tujuan dari analisis regresi logistik adalah untuk mendapatkan model yang paling
baik (fit) dan sederhana (parsinomy) yang dapat menggambarkan hubungan variabel
independen dengan variabel dependen.
1
f (−∞ ) = −∞
=0
1+ e
1
f (+∞ ) = +∞
=1
1+e
3
Pada saat nilai Z = ¿, maka f (Z) =0 dan pada saat nilai Z = ¿ maka f (Z) =1 .
Sifat ini yang membuat fungsi logistik populer pada analisa data epidemiologi :
b) Bentuk kurva logistik dianggap dapat digunakan secara luas pada analisa
multivariabel pada penelitian epidemiologi.
Seperti terlihat pada gambar kurva diatas, nilai f (Z) meningkat secara perlahan
pada saat Z berubah dari -∞ kearah 0, kemudian f (Z) meningkat secara cepat dan
kemudian peningkatannya kembali perlahan pada saat f (Z) mendekati 1. Hasilnya
adalah kurva berbentuk S.
Kelebihan
a) Cocok digunakan pada bidang kesehatan khususnya bidang epidemiologi.
b) Dapat memprediksi resiko terhadap suatu penyakit akibat dari suatu paparan
pada desain kohort.
c) Menentukan asumsi-asumsi yang lebih sedikit daripada regresi linier.
d) Dapat digunakan sebagai model prediksi dan faktor resiko terhadap suatu
penyakit.
e) Dapat mengetahui pengaruh dari beberapa variabel independen terhadap variabel
dependen.
Kekurangan
a) Ciri data awal (numerik) hilang karena dijadikan kategori.
b) Prediksi yang didapat tidak seakurat bila dibandingkan dengan regresi linier.
5
c) Pada desain cross sectional dan case control tidak dapat memprediksi faktor
resiko yang