Anda di halaman 1dari 5

1

REGRESI LOGISTIK

1. KONSEP REGRESI LOGISTIK


Analisis regresi logistik adalah salah satu pendekatan model matematis yang
digunakan untuk menganalisis hubungan satu atau beberapa variabel independen dengan
sebuah variabel dependen kategori yang bersifat dikotom/binary, yaitu variabel yang
mempunyai dua nilai variasi, misalnya sehat dan sakit, puas dan tidak puas, baik dan
buruk, merokok dan tidak merokok, dan lainnya (Sabri, 2010). Perbedaan antara regresi
linier dan regresi logistik terletak pada jenis variabel dependennya. Regresi linier
digunakan apabila variabel dependennya numerik, sedangkan regresi logistik digunakan
pada data yang dependennya berbentuk kategori yang dikotom. Pada penelitian dengan
analisis regresi logistik umumnya mempunyai pertanyaan, apa hubungan/pengaruh dari
satu atau lebih variabel exposure (E) terhadap disease atau outcome (D).

Pada regresi linier kita ingin mengestimasi nilai mean variabel dependen
berdasarkan setiap nilai variabel independennya. Nilai tersebut disebut sebagai mean
kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai dependen dan x sebagai
independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x. Misalnya Y
variabel tekanan darah dan x variabel umur. Maka untuk mengetahui estimasi tekanan
darah berdasarkan umur, dihitung rata-rata (mean) tekanan darah pada masing-masing
nilai umur. Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s.d ∞ [0 ≤ E (Y/x)
≤∞].

Pada regresi logistik dapat pula diperlakukan hal tersebut namun ada sedikit
perbedaan dalam menghitung rata-rata variabel dependennya (Y). Oleh karena itu pada
regresi logistik dependennya adalah dikotom, maka variabel dependen dihitung bukan
dengan mean namun menggunakan proporsi. Seperti pada data diatas variabel Y kejadian
BBLR dan x variabel umur, maka untuk mengetahui estimasi kejadian BBLR
berdasarkan umur, dihitung proporsi kejadian BBLR pada tiap kelompok umur. Pada
regresi logistik, nilai E(Y/x) akan selalu berada dalam 0 dan 1 [0 ≤ E (Y/x) ≤ 1].

Regresi logistik terbagi menjadi dua, yaitu: (1) Regresi Logistik Sederhana,
digunakan bila ingin mempelajari hubungan antara satu variabel independen dengan satu
variabel dependen yang bersifat dikotomi. (2) Regresi logistik ganda, digunakan bila
2

ingin mempelajari hubungan antara beberapa variabel independen dengan satu variabel
dependen yang bersifat dikotomi. Fungsi dari regresi logistic ganda ini adalah: (a)
Menetapkan model matematik yang paling baik untuk menggambarkan hubungan
variabel independen dengan variabel dependen, (b) Menggambarkan hubungan
kuantitatif antara variabel independen (x) dengan variabel dependen (y) setelah dikontrol
variabel lain, (c) Mengetahui variabel independen (x) mana yang penting (dominan)
dalam memprediksi variabel dependen, (d) Mengetahui adanya interaksi pada dua atau
lebih variabel independen terhadap variabel dependen.

Tujuan dari analisis regresi logistik adalah untuk mendapatkan model yang paling
baik (fit) dan sederhana (parsinomy) yang dapat menggambarkan hubungan variabel
independen dengan variabel dependen.

2. FUNGSI REGRESI LOGISTIK


1. Fungsi Regresi Logistik:
1
f ( z) = −z
1+ e

 F(Z) : probabilitas kejadian suatu penyakit berdasarkan faktor resiko tertentu.


(Misalnya probabilitas kejadian BBLR pada umur ibu tertentu)
 Nilai Z : nilai indeks variabel independen.
Nilai Z bervariasi antara ¿ sampai dengan (+∞)

Bila nilai Z mendekati ¿ maka:

1
f (−∞ ) = −∞
=0
1+ e

Bila nilai Z mendekati ¿ maka:

1
f (+∞ ) = +∞
=1
1+e
3

2. Fungsi Logistik dapat digambarkan sebagai berikut:

Pada saat nilai Z = ¿, maka f (Z) =0 dan pada saat nilai Z = ¿ maka f (Z) =1 .

Jadi nilai f (Z) akan berkisar 0 dan 1 berapapun nilai Z.

Sifat ini yang membuat fungsi logistik populer pada analisa data epidemiologi :

a) Model logistik dapat digunakan untuk menggambarkan probabilitas yang dikenal


sebagai resiko untuk terjadinya penyakit.
Probabilitas yang selalu memiliki nilai 0 dan 1. Jadi dengan menggunakan fungsi
logistik, kita pasti akan memperoleh perkiraan resiko antara 0 dan 1. Kita tidak
mungkin memperoleh perkiraan resiko lebih besar dari 0 atau lebih besar dari 1.

b) Bentuk kurva logistik dianggap dapat digunakan secara luas pada analisa
multivariabel pada penelitian epidemiologi.
Seperti terlihat pada gambar kurva diatas, nilai f (Z) meningkat secara perlahan
pada saat Z berubah dari -∞ kearah 0, kemudian f (Z) meningkat secara cepat dan
kemudian peningkatannya kembali perlahan pada saat f (Z) mendekati 1. Hasilnya
adalah kurva berbentuk S.

Kurva berbentuk S ini cocok untuk menggambarkan peningkatan resiko terjadinya


keluaran pada penelitian epidemiologi. Jika Z dianggap sebagai indeks yang
menggabungkan efek dari berbagai faktor resiko dan f (Z) merupakan resiko pada
4

nilai Z tertentu. Bentuk kurva S menunjukkan efek Z pada resiko individu


minimal pada nilai z kecil sampai satu batas ambang tercapai. Kemudian resiko
meningkat pada jangkauan Z tertentu dan tetap tinggi saat resiko mendekati 1 dan
nilai Z sudah cukup besar.

3. MODEL REGRESI LOGISTIK


a) Model logistik dikembangkan dari fungsi logistik dengan nilai Z merupakan
penjumlahan linier konstanta (α) ditambah dengan β1 dan X1, ditambah β2 dan X2 dan
seterusnya sampai βi dan Xi. Variabel X adalah variabel independen.
b) Regresi logistik sederhana:
Z=α + β1 X 1

c) Regresi logistik berganda


Z=α + β1 X 1 + β 2 X 2+ … . β i X i

d) Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah:


1
f ( z) = −(α + β1 X1 +β 2 X 2+… . β i Xi )
1+ e

KELEBIHAN DAN KEKURANGAN ANALISIS REGRESI LOGISTIK

 Kelebihan
a) Cocok digunakan pada bidang kesehatan khususnya bidang epidemiologi.
b) Dapat memprediksi resiko terhadap suatu penyakit akibat dari suatu paparan
pada desain kohort.
c) Menentukan asumsi-asumsi yang lebih sedikit daripada regresi linier.
d) Dapat digunakan sebagai model prediksi dan faktor resiko terhadap suatu
penyakit.
e) Dapat mengetahui pengaruh dari beberapa variabel independen terhadap variabel
dependen.
 Kekurangan
a) Ciri data awal (numerik) hilang karena dijadikan kategori.
b) Prediksi yang didapat tidak seakurat bila dibandingkan dengan regresi linier.
5

c) Pada desain cross sectional dan case control tidak dapat memprediksi faktor
resiko yang

Anda mungkin juga menyukai