Anda di halaman 1dari 11

BAB II

ANALISIS REGRESI LOGISTIK

Regresi logistik (multiple regresi logistik) merupakan jenis


regresi yang mempunyai ciri khusus, yaitu variabel dependennya
berbentuk variabel kategorik (terutama yang dikotomus, artinya
yang terdiri dari dua kelompok, misalnya sehat/sakit, baik/kurang
baik, dll)
Analisis regresi logistik adalah salah satu pendekatan model
matematis

yang

digunakan

untuk

menganalisis

hubungan

satuatau beberapa variabel independen dengan sebuah variabel


dependen

kategorik

yang

bersifat

dikotom/binary.

Variabel

kategorik yang dikotom adalah variabel yang mempunyai dua


nilai variasi, misalnya puas tidak puas, bayi BBLR dan Normal,
merokok dan tidak merokok dan lain-lain.
Perbedaan antara regresi linier dengan regresi logistik
terletak

pada

jenis

variabel

dependennya.

Regresi

linier

digunakan pada data yang dependennya berbentuk kategorik


yang dikotom.
Untuk memahami lebih jelas tentang regresi logistik coba
kita lihat contoh analisis penelitian yang mempelajari hubungan
variabel umur dengan kejadian berat badan lahir rendah (BBLR).

Pengamatan dillakukan pada 198 orang sampel, didapatkan


hasil:

No.

10

11

...

18
9

28

29

34

25

25

27

23

24

24

21

32

...

45

...

Umu
r
BBL
R
Nomor

merupakan

nomor

urut

responden

dan

BBLR

merupakan variab kejadian BBLR. Variabel BBLR diberi kode 1


bila responden mengalami BBLR dan diberi 0 bila responden
tidak menderita BBLR.
Bila data tersebut kita perlukan analisisnya menggunakan
regresi linier, misalnya dibuat penyajian dalam bentuk diagram
tebar (Scetter Plot), maka hubungannya tidak jelas terlihat
tebaran data pada Scetter Plot membentuk dua garis yang
sejajar. Diagram tebar menunjukkan adanya kecenderungan
kejadian BBLR yang lebih sedikit pada responden yang berusia
kurang dari 20 tahun dan lebih dari 35 tahun. Walaupun grafik
tersebut

telah

dapat

menggambarkan/menjelaskan

variabel

dependen (kejadian BBLR) yang cukup jelas, namun grafik


tersebut tidak mampu menggambarkan dengan lebih tajam/jelas
hubungan antara umur ibu dengan kejadian bayi BBLR.

1
0,
8
0,
6
0,
4
0,
2

Untuk mempertajam analisis kita sekarang dicoba untuk


0

mengelompokkan variabel independen (variabel umur) dan


40
menghitung10nilai tengah2 (dalam
UMUR hal30ini menghitung proporsi)
0

IBU

variabel dependen (kejadian BBLR) untuk setiap kelompok


variabel dan kejadian BBLR dapat dilihat pada tabel berikut:
Umur

Jumlah

10-20
21-30
31-40
41-50
Total

69
100
19
1
189

BBLR
Tidak
Ya
46
23
67
33
16
3
1
0
130
59

Proporsi
Kejadian
0,33
0,33
0,15
0,00
0,31

Pada tabel terlihat penurunan proporsi kejadian BBLR pada


kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan
data tersebut dengan grafik dan hasilnya dapat dilihat pada
grafik berikut:
Title

30

20

10

Pada grafik terlihat jelas adanya peningkatan yang tidak

2,0
1,0
3,0
linier antara 0proporsi kejadian BBLR
0 dengan peningkatan0 umur.
usia

Diawali peningkatan yang landai, kemudian menurun tajam, garis


tersebut menyerupai ^.
Kalau kita cermati, pembuatan diagram tebar tersebut
merupakan cara untuk mendeteksi/mengetahui hubungan pada
analisis regresi linier, namun ada sedikit perbedaan dalam hal
meringkas variabel dependennya. Seperti kita ketahui bahwa
pada regresi linier kita ingin mengestimasi nilai mean variabel
dependen berdasarkan setiap nilai variabel independen. Nilai
tersebut disebut sebagai mean kondisional yang dinyatakan
dengan E(Y/x), dengan Y sebagai dependen dan x sebagai
independen. E (Y/x) adalah nilai Y yang diharapkan berdasarkan
nilai x. Misal Y variabel tekanan darah dan x variabel umur, maka
untuk mengetahui estimasi tekanan darah berdasarkan umur,
dihitung rata-rata (mean) tekanan darah pada masing-masing

nilai umur. Pada regresi linier nilai E (Y/x) akan berkisar antara 0
s.d

[0

E (Y/x)

Pada regresi logistik dapat juga diperlakukan hal tersebut


namun ada sedikit perbedaan dalam menghitung rata-rata
variabel dependennya (Y). Oleh karena pada regresi logistik
dependennya adalah dikotom, maka variabel dependen dihitung
bukan dengan mean namun menggunakan proporsi. Seperti pada
diatas variabel Y kejadian BBLR dan x variabel umur, maka untuk
mengetahui estimasi kejadian BBLR berdasarkan umur, dihitung
proporsi kejadian BBLR pada tiap kelompok umur. Pada regresi
logistik, nilai E (Y/x) akan selalu berada antara nol dan satu [0

E (Y/x)

1].

Regresi logistik terbagi menjadi dua yaitu:


1. Regresi Logistik Sederhana
Digunakan bila ingin mempelajari hubungan antara satu
variabel independen dengan satu variabel yang bersifat
dikotomus.
2. Regresi Logistik Ganda
Digunakan bila ingin mempelajari hubuungan antara
beberapa variabel independen dengan satu variabel
dependen yang bersifat dikotomus.
Tujuan

dari

analisis

regresi

logistik

adalah

untuk

mendapatkan model yang paling baik (fit) dan sederhana

(parsinomy) yang dapat menggambarkan hubungan variabel


independen dengan variabel dependen.
A. Fungsi Logistik
1
f ( z )=
1+ez
F(Z)

merupakan

probabilitas

kejadian

suatu

penyakit

berdasarkan faktor resiko tertentu. Misalnya probabilitas kejadian


BBLR pada umur ibu tertentu.
Nilai Z merupakan nilai indeks variabel independen. Nilai Z
bervariasi antara sampai +.
Bila nilai Z mendekati maka

Bila nila Z mendekati + maka

f ( )=

1
=0
1+e

f ( + )=

1
=1
1+e +

Fungsi Logistik dapat digambarkan sebagai berikut:

Terlihat bahwa fungsi f (Z) nilai berkisar 0 dan 1 berapapun


nilai Z. Kisaran pada regresi logistik ini berarti cocok/sesuai
digunakan untuk model hubungan yang variabel dependennya

+
0
dokotom. Grafik f(Z) membentuk garis yang berbentuk huruf S,
ini berarti sesuai dengan contoh plot hubungan antara BBLR
dengan umur kasus yang telah kita bahas diatas. Bentuk S ini
mencerminkan tentang pengaruh nilai Z pada risiko individu

minimal

pada

nilai

rendah

kemudian

seiring

dengan

menignkatnya nilai Z risiko juga semakin meningkat, dan pada


ketinggian tertentu garisnya akan mendatar mendekati nilai 1.
Berdasarkan uraian tersebut maka bila ingin mengestimasi
suatu probabilitas kejadian pada dependen yang dikotom maka
model regresi logistik adalah pilihan yang tepat.
B. Model Logistik
Model logistik dikembangkan dari fungsi logistik dengan nilai
Z merupakan penjumlahan linier konstanta () ditambah dengan
1X1, ditambah 2X2 dan seterusnya sampai iXi. Variabel X adalah
variabel independen.
Z = + 1X1 (Regresi logistik sederhana)
Z = + 1X1 + 2X2 + ... + iXi (Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z
adalah
f (Z)

1
( + 1 X 1+ 2 X 2+ ...+ i X i)

1+ e

C. Contoh Kasus
Contoh studi follow up selama 9 tahun. Dalam studi ini
dipelajari mengenai hubungan antara kejadian penyakit jantung
koroner (dengan nama variabel PJK) dengan tinggi rendahnya
kadar katekolamin dalam darah (nama variabel KAT)
Pemberian kode nilai variabel adalah sbb:
Untuk variabel PJK --> 1 = timbul penyakit jantung koroner
2 = tidak ada penyakit jantung koroner

Untuk variabel KAT -->1 = kadar katekolamin darah tinggi


2 = kadar katekolamin darah rendah
Pertanyaan :
a. Berapa peluang mereka yang kadar katekolaminnya
tinggi mempunyai risiko terjadi PJK?
b. Berapa peluang mereka yang kadar katekolaminnya
rendah mempunyai risiko untuk terjadi PJK?
c. Bandingkan risiko terjadinya PJK antara mereka yang
kadar

katekolaminnya

tinggi

dengan

yang

kadar

katekolaminnya rendah!

Jawab :
Dengan model regresi logistik maka pada soal tersebut
modelnya adalah
f ( Z )=

1
1+ eZ

Nilai f(Z) dapat diganti dengan P(X), maka rumusnya:


f ( Z )=

1
1+ eZ

Bila Z = + 1KAT, maka modelnya:


f ( Z )=

1
+ 1 KAT

1+ e

Misalkan didapatkan hasil analisis dengan paket program


statistik sbb
= -3,911 dan 1 = 0,652, maka:

f ( Z )=

1
(3,911+0,652 KAT )

1+ e

Dari model tersebut coba kita jawab pertanyaan diatas:


1. Besar risiko terjadinya PJK pada mereka yang kadar
katelominnya tinggi.
Oleh karena kadar katelomin tinggi diberi kode 1,
maka masukkan nilai KAT-1 pada model diatas, hasilnya:
1
f ( Z )=
=0,037
(3,911+0,652+1)
atau sekitar 4%
1+ e
Jadi mereka/individu yang kadar katelominnya tinggi
dalam darah mempunyai risiko untuk terjadinya PJK
sebesar 4% selama periodel follow up.
2. Besar risiko terjadinya PJK pada mereka yang kadar
katelominnya rendah.
Oleh karena kadar katelomin rendah diberi angka 0,
maka masukkan nilai KAT+0 pada model diatas, hasilnya:
1
f ( Z )=
=0,019
(3,911+0,652+0 )
atau sekitas 2%
1+ e
Jadi,

mereka/individu

yang

kadar

katekolaminnya

rendah dalam darah mempunyai risiko untuk terjadinya PJK


sebesar 2% selama periode follow up.
3. Besar risiko kedua kelompok tersebut
P1 ( X) 0 , 037
=
=2 , 0
P0 ( X ) 0 , 019
Angka tersebut diatas sebelumnya adalah risiko relatif
(RR) yang diperoleh secara direk. Arti dari angka diatas
adalah

mereka

yang

kada

ketekolaminnya

tinggi

mempunyai risiko terjadinya PJK dua (2) kali lebih tinggi


dibandingkan mereka yang kadar katekolaminnya rendah.
Model regresi logistik dapat digunakan pada data yang
dikumpulkan

melalui

rancangan

kohort,

case

control

maupun cross sectional.


Pada rancangan kohort prospektif dapat digunakan
untuk memperkirakan risiko individual. Sedangkan pada
rancangan case control dan cross sectional tidak dapat
digunakan untuk menghitung risiko individual kaena 0
pada

rancangan

ini

tidak

sahih.

Nilai

dapat

dihitung/diestimasi bila samping fraction populasi disampel


diketahui, kondisi ini hanya terjadi pada rancangan kohort
(ket: samping fraction adalah proporsi terpapar yang
menjadi sakit atau tidak sakit).
Namun

dengan

memperlakukan

rancangan

case

control dan cross sectional sebagai follow up, maka dapat


dihitung OR (Oods Ratio), yang merupakan perhitungan RR
yang indirek. Nilai OR yang merupakan perhotungan
eksponensial dari persamaan garis regreri logistik.
Oods Ratio (OR) = exp

()

atau dapat

()

ditulis OR = e

Dengan demikian dapat disimpulkan bahwa individual


Risk (risiko individu) hanya dapat diperoleh dari rancangan
kohort prospektif. Sedangkan pada rancangan case control,

cross sectional tidak dapat melakukan prediksi risiko


individual. Pada rancangan case control dan cross sectional
dan kohort dapat dihitung nilai Oods Ratio (OR), yang
merupakan perhitungan RR indirek.
Pada rancangan kohort prospektif regresi logistik
dapat digunakan untuk memprediski/menaksir probabilitas
individu untuk sakit (atau meninggal) berdasarkan nilainilai sejumlah variabel yang diulas padanya. Prediksi dapat
digunakan dengan model:
P(X)

1
1+e

( + 1 X 1 + 2 X 2+...+ i X i)

Anda mungkin juga menyukai