Regresi Logistik Multivariat
Regresi Logistik Multivariat
Pada saat nilai z=-4 maka f(z)=0 dan pada saat nilai z=+4 maka f(z)=1. Jadi nilai f(z)
akan berkisar antara 0 dan 1. Sifat ini yang membuat fungsi logistik populer, model logistik
dapat digunakan untuk menggambarkan probabilitas yang selalu memliki nilai antara 0 dan 1.
Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya penyakit.
Jadi, dengan menggunakan fungsi logistik, kita pasti akan memperoleh perkiraan risiko
antara 0 dan 1. Kita tidak mungkin memperoleh perkiraan risiko lebih kecil dari 0 atau lebih
besar dari 1.
Alasan lain mengapa fungsi logistik ini populer untuk analisis data epidemiologi adalah
bentuk kurva logistik. Seperti terlihat pada gambar 6.1, nilai f(z) meningkat secara perlahan
pada saat z berubah dari -4 ke arah 0, kemudian f(z) meningkat secara cepatdan kemudian
peningkatannya kembali perlahan pada saat f(z) mendekati 1. Hasilnya adalah kurva yang
berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan peningkatan risiko
terjadinya keluaran pada penelitian epidemiologi, jika z dianggap sebagai indeks yang
menggabungkan efek dari berbagai faktor risiko dan f(z) merupakan risiko pada nilai z
tertentu. Bentuk kurva S menunjukkan efek z pada risiko individu minimal pada nilai z kecil
sampai satu batas ambang tercapai. Kemudian risiko meningkat pada jangkauan z tertentu
dan tetap tinggi saat risiko mendekati 1 dan nilai z sudah cukup besar.
Menurut ahli epidemiologi, konsep batas ambang ini dapat digunakan pada berbagai
kadaan penyakit. Jadi bentuk kurva logistik dianggap dapat digunakan secara luas pada
analisis multivariabel pada penelitian epidemiologi.
1 1
P( Y )= −( log itY )
= −( a+b1 x1 +.. . . .+b k x k )
1+ Exp 1+Exp
(b ) (b ) ( b)
OR=Exp =Exponensial =e
Keterangan :
- P(Y) : Probabilitas seorang individu untuk mengalami Y=1
- OR (Odds Ratio) : Risiko kelompok X=1 untuk mengalami Y=1 dibandingkan dengan
kelompok X=0
1
P(Y ) ( a b1 x1 .... bk x k )
1 Exp
(b )
OR=Exp
Age (years)
Lwt (pounds)
Race (0 (non-white), 1 (white)) Low (0 (non-bblr), 1 (bblr))
Smoke (0 (non-smoking), 1 (smoking))
Ptl (times)
Ht (0 (no),1 (yes))
Ui (0 (no),1 (yes))
Ftv (times)
Langkah Pemodelan
a. Seleksi bivariat; menggunakan uji-statistik bivariat seperti biasa
Output SPSS
Variabel Race
Variabel Ht
Variabel Ui
Variabel Smoke
3. Uji regresi logistik sederhana, untuk variabel smoke-low, ht-low, ui-low, race-low
Langkah-langkah dengan SPSS
- Analyze Regression Binary Logistic
- Kotak dialog Logistic Regression
Covariates : masukkan semua variabel independen
Dependent : masukkan variabel dependen
Output SPSS
Variabel Race
Variabel Smoke
Variabel Ui
Variabel Ht
Untuk seleksi bivariat jenis data kategorik, disarankan menggunakan uji analisis regresi
logistik. Nilai p-value yang dihasilkan oleh regresi logistik lebih stabil untuk data dengan
sampel besar atau kecil, nilai p-value ini didapatkan dari nilai perhitungan chi square
goodness of fit. Jika menggunakan uji analisis proporsi chi square, maka nilai yang
digunakan adalah p-value likelihood ratio.
b. Pembuatan model Backward
Full model: Masukkan secara bersamaan seluruh variabel independen ke model
multivariat.
Model dan Block Chi-Square menilai apakah model secara keseluruhan cocok (fit) dengan
data yang ada. Pada model ini p = 0.0001, maka model tersebut cocok dengan data.
Hasil output pada cox-snell R2 memiliki analogi yang sama dengan nilai R 2 pada
regresi linear, menyatakan bahwa 13,5% keragaman dapat dijelaskan oleh model, sedangkan
sisanya diluar model.
Pada tabel klasifikasi dapat dilihat kecocokan model dengan data yang ada. Dari 390
subjek yang berat bayi lahirnya > 2500 gram, sebanyak 352 (90,3%) dapat diprediksi oleh
model. Dari 177 subjek berat bayi lahirnya < 2500 gram, ada 48 (27,1%) yang dapat
diprediksi oleh model. Secara keseluruhan akurasi model adalah 70,5%.
Uji Konfounding
Konfounding adalah bias dalam estimasi efek pajanan terhadap kejadian penyakit yang
terjadi akibat perbandingan yang tidak seimbang antara kelompok terpajan dengan kelompok
tidak terpajan. Masalah ini terjadi karena pada dasarnya sudah ada perbedaan risiko
terjadinya penyakit pada kelompok terpajan dengan kelompok yang tidak terpajan, yang
berarti risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun pajanan
dihilangkan pada kedua kelompok tersebut.
Secara umum, satu variabel digolongkan sebagai konfounder jika variabel tersebut
merupakan faktor risiko terjadinya penyakit dan memiliki asosiasi dengan pajanan. Jadi
penilaian apakah satu variabel merupakan konfounder dilakukan dengan:
a. Pengetahuan yang sudah ada tentang hubungan variabel tersebut dengan
penyakit dan pajanan pada populasi asal (base population).
b. Pertimbangan statistik atas adanya hubungan variabel tersebut dengan
penyakit dan pajanan pada data penelitian.
Dalam uji konfounding, variabel yang nilai p-value > 0.05 dikeluarkan dari model
multivariat. Variable yang p-valuenya < 0,05 tetap dalam model. Variabel yang p valuenya >
0,05 dikeluarkan dari model satu persatu dimulai dari variabel dengan nilai terbesar. Bila
variabel yang dikeluarkan tersebut mengakibatkan perubahan OR variabel-variabel yang
masih ada (berubah > 10 %), maka variabel tersebut adalah konfounding dan harus
dimasukkan kembali ke dalam pemodelan multivariat.
Untuk contoh berikut, ternyata variabel age memiliki nilai p-value 0.053 sehingga akan
diuji konfounding. Ketika variabel age dikeluarkan dari pemodelan multivariat, hasilnya sbb.
Hasil output pada cox-snell R2 menyatakan bahwa nilainya tetap pada 13,5%, artinya tidak
ada perubahan berarti yang terjadi setelah variabel ftv dikeluarkan dari pemodelan.
Tabel 1.1. Perubahan Nilai OR
Variabe OR crude OR adjusted Perubahan OR
l
Age .962 - -
Lwt .987 .985 0.10
Race2 .633 .613 3.11
Smoke 1.963 1.997 -1.77
Ptl 1.775 1.679 5.37
Ht 6.308 6.552 -3.87
Ui 2.071 2.140 -3.35
Karena tidak ada nilai OR yang berubah > 10 %, maka variabel age adalah bukan
konfounding dan dikeluarkan dari pemodelan multivariat. Hasil akhir persamaan
pemodelan multivariat ini adalah sbb.
Uji interaksi
Interaksi atau modifikasi efek (effect modifier) adalah heterogenitas efek dari satu
pajanan pada tingkat pajanan lain di populasi asal (base population). Jadi efek satu pajanan
pada kejadian penyakit berbeda pada kelompok pajanan lainnya. Tidak adanya modifikasi
efek berarti efek pajanan homogen. Modifikasi efek merupakan konsep yang penting dalam
analisis karena pada saat analisis kita harus menentukan apakah akan melaporkan efek
bersama (yang terkontrol konfounder) atau efek yang terpisah untuk masing-masing strata.
Untuk uji ini, tambahkan interaksi antar variabel independen. Interaksi exist jika nilai sig
< 0,05. Misalkan : interaksi antara smoke dengan race2
Nilai p-value interaksi antara smoke dan race menghasilkan nilai 0,107; artinya tidak ada
interaksi antara perilaku merokok dengan jenis ras ibu.
Oleh karena tidak ada interaksi, maka hasil akhir dari pemodelan multivariat ini adalah sbb.
Interpretasi
Misal (penelitian kohort) :
- Besar risiko terjadinya BBLR pada ibu yang memiliki riwayat hipertensi.
1
P(BBLR|white) = − (0,582+0,692∗1) = 0,782
1+ e
Jadi ibu yang memiliki riwayat hipertensi mempunyai risiko untuk terjadinya BBLR
sebesar 78,2% selama periode follow up.
- Besar risiko terjadinya BBLR pada ibu yang tidak memiliki riwayat hipertensi.
1
P(BBLR|non-white) = − ( 0,582+0,692∗0 ) = 0,642
1+ e
Jadi ibu yang tidak memiliki riwayat hipertensi mempunyai risiko untuk terjadinya
BBLR sebesar 64,2% selama periode follow up.
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat Kohort.
Sedangkan untuk penelitian yang bersifat cross sectional atau case control, interpretasi yang
dapat dilakukan hanya menjelaskan nilai OR (Exp B) pada masing-masing variabel. Oleh
karena analisisnya multivariat/ganda maka nilai OR-nya sudah terkontrol (adjusted) oleh
variabel lain yang ada pada model.
Untuk melihat variabel mana yang paling besar pengaruhnya terhadap variabel
dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin besar nilai exp (B)
berarti semakin besar pengaruhnya terhadap variabel dependen yang dianalisis. Dalam data
ini berarti hipertensi yang paling besar pengaruhnya terhadap kejadian bayi BBLR.
2. Regresi Logistik Model Faktor Risiko
Model dengan tujuan mengetahui hubungan satu/beberapa variabel independen dengan
kejadian variabel dependen dengan mengontrol beberapa variabel konfounding.
Analisis Hubungan Berat Badan dengan Tekanan Darah di Kabupaten X tahun 2013
Age (years)
Lwt (pounds)
Race (0 (non-white), 1 (white))
Ptl (times)
Ht (0 (no),1 (yes))
Ui (0 (no),1 (yes))
Ftv (times)
Langkah Pemodelan
1. Seleksi bivariat: bila sig < 0,25 maka variabel tersebut kandidat multivariat.
Walaupun sig > 0,25 boleh masuk multivariat kalau secara substansi merupakan
variabel penting.
2. Pembuatan model Backward
1. Full Model: masukkan semua variabel mencakup: variabel dependen, variabel
independen utama, variabel konfounding.
2. Uji Interaksi: tambahkan interaksi variabel utama dengan variabel lainnya
dan lakukan penilaian interaksi dengan cara melihat nilai sig. Bila sig > 0,05
variabel interaksi dikeluarkan dari model. (lakukan penilaian interaksi satu
per satu).
3. Uji konfounding: dengan cara melihat perubahan OR ketika dikeluarkan
variabel konfounding satu per satu dimulai dari p value terbesar. Bila setelah
dikeluarkan diperoleh selisih OR variabel utama lebih besar dari 10 %, maka
variabel tersebut adalah konfounding dan dimasukkan kembali ke dalam
model.
DAFTAR PUSTAKA