mempelajari hubungan satu atau beberapa variabel independen dengan satu variabel
dependen yang bersifat dikotomi (binary). Variabel binary adalah variabel yang hanya
memiliki dua nilai, misalnya sakit/sehat, merokok/tidak merokok, BBLR/normal, dll.
Adapun regresi logistik (kadang disebut model logistic atau model logit) merupakan
salah satu bagian dari analisis regresi, yang digunakan untuk memprediksi probabilitas
kejadian suatu peristiwa, dengan mencocokkan data pada fungsi logit kurva logistik. Metode
ini merupakan model linear umum yang digunakan untuk regresi binomial. Seperti analisis
regresi pada umumnya, metode ini menggunakan beberapa variable bebas, baik numeric
maupun kategori. Misalnya, probabilitas bahwa orang yang menderita serangan jantung pada
waktu tertentu dapat diprediksi dari informasi usia, jenis kelamin, dan indeks massa tubuh.
Regresi logistik juga digunakan secara luas pada bidang kedokteran, ilmu sosial, dan bahkan
pada bidang pemasaran, seperti prediksi kecenderungan pelanggan untuk membeli suatu
produk atau berhenti berlangganan.
Regresi logistik tidak memerlukan asumsi normalitas, heteroskedastisitas, dan
autokorelasi, dikarenakan variabel terikat yang terdapat pada regresi logistik merupakan
variabel dikotomi (0 dan 1), sehingga residualnya tidak memerlukan ketiga pengujian
tersebut. Untuk asumsi multikolinearitas, karena hanya melibatkan variabel-variabel bebas,
maka masih perlu untuk dilakukan pengujian. Untuk pengujian multikolinearitas ini dapat
digunakan uji kebaikan sesuai (goodness of fit test), yang kemudian dilanjutkan dengan
pengujian hipotesis (uji 2), guna melihat variabel-variabel bebas mana saja yang signifikan,
sehingga dapat tetap digunakan dalam penelitian. Selanjutnya, di antara variabel-variabel
bebas yang signifikan, dapat dibentuk suatu matriks korelasi, dan apabila tidak terdapat
variabel-variabel bebas yang saling memiliki korelasi yang tinggi, maka dapat disimpulkan
bahwa tidak terdapat gangguan multikolinearitas pada model penelitian (David W. Hosmer,
2011).
Contoh 1. Gambaran Sebaran kemampuan Melakukan Treadmill dihubungkan dengan
Kejadian Serangan Jantung
B. Fungsi Logistik
Fungsi logistik merupakan fungsi matematik dengan rumus:
Pada saat nilai z=-4 maka f(z)=0 dan pada saat nilai z=+4 maka f(z)=1. Jadi nilai f(z)
akan berkisar antara 0 dan 1. Sifat ini yang membuat fungsi logistik populer, model logistik
dapat digunakan untuk menggambarkan probabilitas yang selalu memliki nilai antara 0 dan 1.
Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya penyakit.
Jadi, dengan menggunakan fungsi logistik, kita pasti akan memperoleh perkiraan risiko
antara 0 dan 1. Kita tidak mungkin memperoleh perkiraan risiko lebih kecil dari 0 atau lebih
besar dari 1.
Alasan lain mengapa fungsi logistik ini populer untuk analisis data epidemiologi adalah
bentuk kurva logistik. Seperti terlihat pada gambar 6.1, nilai f(z) meningkat secara perlahan
pada saat z berubah dari -4 ke arah 0, kemudian f(z) meningkat secara cepatdan kemudian
peningkatannya kembali perlahan pada saat f(z) mendekati 1. Hasilnya adalah kurva yang
berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan peningkatan risiko
terjadinya keluaran pada penelitian epidemiologi, jika z dianggap sebagai indeks yang
menggabungkan efek dari berbagai faktor risiko dan f(z) merupakan risiko pada nilai z
tertentu. Bentuk kurva S menunjukkan efek z pada risiko individu minimal pada nilai z kecil
sampai satu batas ambang tercapai. Kemudian risiko meningkat pada jangkauan z tertentu
dan tetap tinggi saat risiko mendekati 1 dan nilai z sudah cukup besar.
Menurut ahli epidemiologi, konsep batas ambang ini dapat digunakan pada berbagai
kadaan penyakit. Jadi bentuk kurva logistik dianggap dapat digunakan secara luas pada
analisis multivariabel pada penelitian epidemiologi.
Logit (Y ) a b1 x1 .... bk x k
P(Y )
1
1
(logitY )
( a b1 x1 ..... bk xk )
1 Exp
1 Exp
OR Exp( b ) Exponensial ( b ) e (b )
Keterangan :
-
OR (Odds Ratio) : Risiko kelompok X=1 untuk mengalami Y=1 dibandingkan dengan
kelompok X=0
P(Y )
RR
1
1 Exp( a b1 x1 .... bk xk )
model. Lalu satu persatu variabel hasil pengkorelasian dimasukkan ke dalam model
dan dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama masuk
sama dengan metode forward yakni variabel yang mempunyai korelasi parsial
terbesar. Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus
dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward.
e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah,
tanpa melewati kriteria kemaknaan statistik tertentu.
Low (0 (non-bblr), 1
(bblr))
Langkah Pemodelan
a. Seleksi bivariat; menggunakan uji-statistik bivariat seperti biasa
1. Uji t, untuk variabel age-low, lwt-low, ptl-low, ftv-low
Langkah-langkah dengan SPSS
- Analyze Compare Means Independent-Samples T Test
- Kotak dialog Independent-Samples T Test
Test variable(s): masukkan variabel independen jenis data kontinu
Grouping variable: masukkan variabel dependen
Output SPSS
Output SPSS
Variabel Race
Variabel Ht
Variabel Ui
Variabel Smoke
3. Uji regresi logistik sederhana, untuk variabel smoke-low, ht-low, ui-low, race-low
Langkah-langkah dengan SPSS
- Analyze Regression Binary Logistic
- Kotak dialog Logistic Regression
Covariates : masukkan semua variabel independen
Dependent : masukkan variabel dependen
Output SPSS
Variabel Race
Variabel Smoke
Variabel Ui
Variabel Ht
Untuk seleksi bivariat jenis data kategorik, disarankan menggunakan uji analisis regresi
logistik. Nilai p-value yang dihasilkan oleh regresi logistik lebih stabil untuk data dengan
sampel besar atau kecil, nilai p-value ini didapatkan dari nilai perhitungan chi square
goodness of fit. Jika menggunakan uji analisis proporsi chi square, maka nilai yang
digunakan adalah p-value likelihood ratio.
Model dan Block Chi-Square menilai apakah model secara keseluruhan cocok (fit) dengan
data yang ada. Pada model ini p = 0.0001, maka model tersebut cocok dengan data.
Hasil output pada cox-snell R2 memiliki analogi yang sama dengan nilai R 2 pada
regresi linear, menyatakan bahwa 13,5% keragaman dapat dijelaskan oleh model, sedangkan
sisanya diluar model.
Pada tabel klasifikasi dapat dilihat kecocokan model dengan data yang ada. Dari 390
subjek yang berat bayi lahirnya > 2500 gram, sebanyak 352 (90,3%) dapat diprediksi oleh
model. Dari 177 subjek berat bayi lahirnya < 2500 gram, ada 48 (27,1%) yang dapat
diprediksi oleh model. Secara keseluruhan akurasi model adalah 70,5%.
Uji Konfounding
Konfounding adalah bias dalam estimasi efek pajanan terhadap kejadian penyakit yang
terjadi akibat perbandingan yang tidak seimbang antara kelompok terpajan dengan kelompok
tidak terpajan. Masalah ini terjadi karena pada dasarnya sudah ada perbedaan risiko
terjadinya penyakit pada kelompok terpajan dengan kelompok yang tidak terpajan, yang
berarti risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun pajanan
dihilangkan pada kedua kelompok tersebut.
Secara umum, satu variabel digolongkan sebagai konfounder jika variabel tersebut
merupakan faktor risiko terjadinya penyakit dan memiliki asosiasi dengan pajanan. Jadi
penilaian apakah satu variabel merupakan konfounder dilakukan dengan:
a. Pengetahuan yang sudah ada tentang hubungan variabel tersebut dengan
penyakit dan pajanan pada populasi asal (base population).
b. Pertimbangan statistik atas adanya hubungan variabel tersebut dengan
penyakit dan pajanan pada data penelitian.
Dalam uji konfounding, variabel yang nilai p-value > 0.05 dikeluarkan dari model
multivariat. Variable yang p-valuenya < 0,05 tetap dalam model. Variabel yang p valuenya >
0,05 dikeluarkan dari model satu persatu dimulai dari variabel dengan nilai terbesar. Bila
variabel yang dikeluarkan tersebut mengakibatkan perubahan OR variabel-variabel yang
masih ada (berubah > 10 %), maka variabel tersebut adalah konfounding dan harus
dimasukkan kembali ke dalam pemodelan multivariat.
Untuk contoh berikut, ternyata variabel age memiliki nilai p-value 0.053 sehingga akan
diuji konfounding. Ketika variabel age dikeluarkan dari pemodelan multivariat, hasilnya sbb.
Hasil output pada cox-snell R2 menyatakan bahwa nilainya tetap pada 13,5%, artinya tidak
ada perubahan berarti yang terjadi setelah variabel ftv dikeluarkan dari pemodelan.
Variabel
Age
Lwt
Race2
Smoke
Ptl
Ht
Ui
OR crude
.962
.987
.633
1.963
1.775
6.308
2.071
OR adjusted
.985
.613
1.997
1.679
6.552
2.140
Perubahan OR
0.10
3.11
-1.77
5.37
-3.87
-3.35
Karena tidak ada nilai OR yang berubah > 10 %, maka variabel age adalah bukan
konfounding dan dikeluarkan dari pemodelan multivariat. Hasil akhir persamaan
pemodelan multivariat ini adalah sbb.
Uji interaksi
Interaksi atau modifikasi efek (effect modifier) adalah heterogenitas efek dari satu
pajanan pada tingkat pajanan lain di populasi asal (base population). Jadi efek satu pajanan
pada kejadian penyakit berbeda pada kelompok pajanan lainnya. Tidak adanya modifikasi
efek berarti efek pajanan homogen. Modifikasi efek merupakan konsep yang penting dalam
analisis karena pada saat analisis kita harus menentukan apakah akan melaporkan efek
bersama (yang terkontrol konfounder) atau efek yang terpisah untuk masing-masing strata.
Untuk uji ini, tambahkan interaksi antar variabel independen. Interaksi exist jika nilai sig
< 0,05. Misalkan : interaksi antara smoke dengan race2
Nilai p-value interaksi antara smoke dan race menghasilkan nilai 0,107; artinya tidak ada
interaksi antara perilaku merokok dengan jenis ras ibu.
Oleh karena tidak ada interaksi, maka hasil akhir dari pemodelan multivariat ini adalah sbb.
Interpretasi
Misal (penelitian kohort) :
-
Besar risiko terjadinya BBLR pada ibu yang memiliki riwayat hipertensi.
1
P(BBLR|white) = 1+ e(0,582+ 0,6921 ) = 0,782
Jadi ibu yang memiliki riwayat hipertensi mempunyai risiko untuk terjadinya BBLR
sebesar 78,2% selama periode follow up.
Besar risiko terjadinya BBLR pada ibu yang tidak memiliki riwayat hipertensi.
1
(
0,582+
0,6920)
P(BBLR|non-white) = 1+ e
= 0,642
Jadi ibu yang tidak memiliki riwayat hipertensi mempunyai risiko untuk terjadinya
BBLR sebesar 64,2% selama periode follow up.
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat Kohort.
Sedangkan untuk penelitian yang bersifat cross sectional atau case control, interpretasi yang
dapat dilakukan hanya menjelaskan nilai OR (Exp B) pada masing-masing variabel. Oleh
karena analisisnya multivariat/ganda maka nilai OR-nya sudah terkontrol (adjusted) oleh
variabel lain yang ada pada model.
Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan
kejadian BBLR adalah variabel lwt, race2, smoke, ptl, ht, dan ui. Hasil analisis didapatkan
Odds Ratio (OR) dari variabel hipertensi adalah 6,552; artinya Ibu yang menderita hipertensi
akan melahirkan bayi BBLR sebesar 6,5 kali lebih tinggi dibandingkan ibu yang tidak
menderita hipertensi setelah dikontrol variabel lwt, race2, smoke, ptl, dan ui. Secara sama
dapat diinterpretasikan untuk variabel yang lain.
Untuk melihat variabel mana yang paling besar pengaruhnya terhadap variabel
dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin besar nilai exp (B)
berarti semakin besar pengaruhnya terhadap variabel dependen yang dianalisis. Dalam data
ini berarti hipertensi yang paling besar pengaruhnya terhadap kejadian bayi BBLR.
Smoke
(0 (nonsmoking)
1 (smoking))
BBLR (low)
Age (years)
Lwt (pounds)
Race
(0 (nonwhite), 1 (white))
Ptl
(times)
Ht
(0 (no),1 (yes))
Ui
(0 (no),1 (yes))
Ftv (times)
Langkah Pemodelan
1. Seleksi bivariat: bila sig < 0,25 maka variabel tersebut kandidat multivariat.
Walaupun sig > 0,25 boleh masuk multivariat kalau secara substansi merupakan
variabel penting.
2. Pembuatan model Backward
1. Full Model: masukkan semua variabel mencakup: variabel dependen, variabel
independen utama, variabel konfounding.
2. Uji Interaksi: tambahkan interaksi variabel utama dengan variabel lainnya
dan lakukan penilaian interaksi dengan cara melihat nilai sig. Bila sig > 0,05
variabel interaksi dikeluarkan dari model. (lakukan penilaian interaksi satu
per satu).
3. Uji konfounding: dengan cara melihat perubahan OR ketika dikeluarkan
variabel konfounding satu per satu dimulai dari p value terbesar. Bila setelah
dikeluarkan diperoleh selisih OR variabel utama lebih besar dari 10 %, maka
variabel tersebut adalah konfounding dan dimasukkan kembali ke dalam
model.
DAFTAR PUSTAKA
low
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
age
28
29
34
25
25
27
23
24
24
21
32
19
25
16
25
20
21
24
21
20
25
19
19
26
24
17
20
22
27
20
17
25
20
18
18
20
21
26
31
15
23
20
24
15
23
lwt
120
130
187
105
85
150
97
128
132
165
105
91
115
130
92
150
200
155
103
125
89
102
112
117
138
130
120
130
130
80
110
105
109
148
110
121
100
96
102
110
187
122
105
115
120
race
2
0
1
0
0
0
0
0
0
0
1
1
1
0
0
1
1
0
1
0
0
0
1
1
1
1
0
0
1
0
0
1
0
0
0
0
1
0
0
1
1
0
0
0
0
0
smo
ke
1
0
1
0
0
0
0
0
0
1
1
1
0
0
1
1
0
1
0
0
0
0
1
1
0
1
1
1
0
1
1
0
0
0
1
1
0
0
1
0
1
1
1
0
0
ptl
1
0
0
1
0
0
0
1
0
0
0
2
0
0
0
0
0
1
0
0
2
0
0
1
0
1
0
1
0
0
0
1
0
0
1
1
1
0
1
0
0
0
0
0
0
ht
ui
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
1
0
1
0
0
0
0
1
0
0
0
0
1
0
0
1
0
0
1
0
0
1
0
1
1
1
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
ftv
0
2
0
0
0
0
1
1
0
1
0
0
0
1
0
2
2
0
0
0
1
2
0
0
0
0
3
1
0
0
0
1
0
0
0
0
4
0
1
0
1
0
0
0
0
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
30
22
17
23
17
26
20
26
14
28
14
23
17
21
19
33
20
21
18
21
22
17
29
26
19
19
22
30
18
18
15
25
20
28
32
31
36
28
25
28
17
29
26
17
17
24
35
25
142
130
120
110
120
154
105
190
101
95
100
94
142
130
182
155
105
108
107
124
118
103
123
113
95
150
95
107
100
100
98
118
120
120
121
100
202
120
120
167
122
150
168
113
113
90
121
155
1
1
1
1
0
0
0
1
0
1
0
0
0
1
0
0
1
1
1
0
1
0
1
1
0
0
0
0
1
1
0
1
0
1
0
1
1
0
0
1
1
1
0
0
0
1
0
1
1
1
1
1
0
0
0
1
1
1
0
1
0
1
0
0
1
1
1
0
0
0
1
1
0
0
0
0
1
1
0
1
0
1
0
0
0
0
0
0
1
0
1
0
0
1
1
0
1
0
0
1
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
1
3
0
2
1
3
0
0
2
2
0
0
3
0
3
1
2
0
0
1
1
1
0
0
1
0
2
0
0
0
3
0
1
2
3
1
0
2
0
0
2
0
1
1
1
1
1
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
25
29
19
27
31
33
21
19
23
21
18
18
32
19
24
22
22
23
22
30
19
16
21
30
20
17
17
23
24
28
26
20
24
28
20
22
22
31
23
16
16
18
25
32
20
23
22
32
125
140
138
124
215
109
185
189
130
160
90
90
132
132
115
85
120
128
130
95
115
110
110
153
103
119
119
119
110
140
133
169
115
250
141
158
112
150
115
112
135
229
140
134
121
190
131
170
0
1
1
1
1
1
0
1
0
1
1
1
1
0
1
0
1
0
1
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
1
0
0
0
1
0
1
1
0
1
1
1
0
1
1
1
1
1
1
0
0
0
1
1
0
0
0
1
0
0
1
1
0
0
1
0
0
0
0
0
0
0
1
0
0
1
0
0
1
1
1
0
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2
1
0
0
2
1
2
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
2
2
0
2
1
2
2
1
0
0
0
4
0
2
0
1
0
0
2
0
0
0
0
0
0
0
2
0
0
0
1
2
6
1
2
0
2
1
0
0
0
1
4
0
0
1
0
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
30
20
23
17
19
23
36
22
24
21
19
25
16
29
29
19
19
30
24
19
24
23
20
25
30
22
18
16
32
18
29
33
20
28
14
28
25
16
20
26
21
110
127
123
120
105
130
175
125
133
134
235
95
135
135
154
147
147
137
110
184
110
110
120
241
112
169
120
170
186
120
130
117
170
134
135
130
120
95
158
160
115
0
0
0
0
0
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
0
1
0
0
1
1
1
0
1
0
1
1
1
0
1
0
1
0
1
0
1
0
0
0
1
0
0
0
0
0
0
1
1
1
0
0
1
1
0
0
1
0
0
0
0
0
0
1
0
0
0
1
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
3
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
2
0
0
0
1
1
0
0
1
1
0
0
1
0
0
1
0
2
4
2
1
2
1
0
1
0
0
2
1
1
0
1