Analisis Regresi Logistik

Analisis Regresi Logistik
2009
ANALISIS REGRESI LOGISTIK
Metoda regresi adalah komponen penting dalam data analisa untuk menggambarkan
hubungan antara suatu dependent variable dengan satu atau beberapa independent variable.
Adalah penting untuk mengetahui tujuan dari analisa dengan menggunakan metoda ini, yaitu
memperoleh model yang paling baik (fit) dan sederhana yang dapat menggambarkan
hubungan antara variabel outcome (dependent) dengan satu set variabel independen. Variabel
independen ini sering disebut covariate.
Terdapat dua macam metoda regresi, yaitu:
1. Regresi linier, yaitu apabila variabel outcomenya adalah bilangan kontinyu.
2. Regresi logistik, yaitu apabila variabel outcome-nya adalah binary atau dikotomus.
Illustrasi dari variabel dikotomus adalah sebagai berikut:
0 : bila outcome tak terjadi, misalnya tidak sakit
1 : bila outcome terjadi, misalnya menjadi sakit
Untuk memudahkan, maka variabel outcome atau dependen akan diberi notasi Y sedangkan
independen notasinya adalah X.
1. Fungsi Logistik
Fungsi logistik merupakan fungsi matematik dengan rumus:
Pada variasi nilai z dari -∞ sampai dengan +∞ dapat digambarkan:

1
0,5
-∞ 0 +∞
Gambar 1
Pada saat nilai z=-∞ maka f(z)=0 dan pada saat nilai z=+∞ maka f(z)=1. Jadi nilai f(z)
akan berkisar antara 0 dan 1. Sifat ini yang membuat fungsi logistik populer, model logistik
dapat digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0 dan
1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya penyakit.
Jadi, dengan menggunakan fungsi logistik, kita akan memperoleh perkiraan risiko antara
0 dan 1. Kita tidak mungkin memperoleh perkiraan risiko lebih kecil dari 0 atau lebih besar
dari 1. Alasan lain mengapa fungsi logistik ini populer untuk analisis data epidemiologi
adalah bentuk kurva logistik. Seperti terlihat pada gambar 1, nilai f(z) meningkat secara cepat
dan kemudian peningkatannya kembali perlahan pada saat f(z) mendekati 1. Hasilnya adalah
kurva yang berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan peningkatan risiko
terjadinya keluaran pada penelitian epidemiologi. Jika z dianggap indeks yang
menggabungkan efek dari berbagai faktor risiko dan f(z) merupakan risiko pada nilai z
tertentu. Bentuk kurva S menunjukkan efek z pada risiko individu minimal pada nilai z kecil
sampai satu batas ambang tercapai, kemudian risiko meningkat pada jangkauan z tertentu dan
tetap tinggi saat risiko mendekati 1 dan z sudah cukup besar.
2. Model Regresi Logistik

Untuk mengestimasi parameter β0 dan β1 pada regresi linier, dipakai cara least square.
Garis least square adalah garis yang mempunyai SSE (sum of square errors) paling kecil.
Tetapi, cara least square ini tidak dapat diterapkan pada model dengan outcome yang
dikotomus. Nilai estimasi parameternya akan berbeda dengan nilai estimasi yang didapat dari
regresi linier. Oleh karena itu, untuk mengestimasi parameter dari regrsi logistik dipakai cara
lain, yaitu maximum likelihood dengan asumsi bahwa error term mempunyai distribusi
normal. Cara ini menghasilkan nilai-nilai estimasi parameter yang akan memaksimumkan
probabilitas (fitted value).
Model regresi logistik dituliskan dalam bentuk penjumlahan linier:
Dimana x1, x2, x3 merupakan variabel independen. Jadi z merupakan indeks yang
menggabungkan x. Kemudian ganti nilai z pada fungsi logistik dengan penjumlahan linier di
atas, sehingga fungsi logistik dapat dituliskan:
atau
Dimana f(z) meruapakan probabilitas untuk terjadinya satu keluaran. Pada penelitian
kesehatan, probabilitas ini merupakan probabilitas untuk terjadinya penyakit atau kematian
pada kombinasi nilai x tertentu. Jadi, fungsi logistik dapat dituliskan:
Contoh:
Penelitian mengenai hubungan antara kejadian PJK dengan kadar katekolamin:
status = Status pasien (1=penyakit timbul, 0 peny.tidak timbul)
kat = Kadar katekolamin (1 bila tinggi, 0 bila rendah)
age = Umur pasien (kontinyu)
ecg = Electro cardio graph (1 bila normal, 0 bila abnormal)
Maka fungsi logistik sebagai fungsi probabilitas pasien untuk meninggal:
Interpretasi suatu model persamaan yang fit sebenarnya adalah inferensi dan
pengambilan kesimpulan berdasarkan koefisien estimasi (estimated coeffisient). Koefisien
menggambarkan slope atau perubahan pada variabel dependen per unit perubahan variabel
independen.
Pada logistik untuk mengetahui perubahan tiap unit variabel independen, diperlukan
tranformasi logit = g(x). Transformasi logit yaitu dengan cara transformasi logaritma nilai e
sehingga persamaannya disebut sebagai regresi logit atau regresi logistik. Mengikuti fungsi
eksponensial [f(x)], maka:
Probabilitas sehat dapat dihitung sebagai komplemen dari probabilitas sakit, yaitu:
Sehingga,
Pada penelitian epidemiologi terdapat pengertian perbandingan antara probabilitas sakit dan
sehat sebagai p/(1-p) untuk kondisi variabel tertentu (misalnya terpajan) yang disebut sebagai
ODD. Untuk hal diatas maka ODD dapat dihitung:
Kemudian dilakukan transformasi logaritma nilai e, sehingga persamaannya disebut sebagai

regresi logit atau logistik.
Bentuk persamaan ini lebih sederhana dan dapat digunakan untuk membandingkan dua ODD
yang disebut sebagai ODDS ratio atau disingkat OR.
3. Variabel Dummy
Pada contoh penelitian PJK di atas, variabel independen hanya bersifat dikotomus (kadar
ketekolamin tinggi atau rendah). Dalam penelitian sering dijumpai variabel independen
memiliki lebih dari dua kelompok. Misalkan pada penelitian hubungan kadar gula darah
sewaktu dengan kematian pasien cedera kepala berat. Kadar gula darah dibagi menjadi 3
kelompok, yaitu ≤180mg/dL, 181-220mg/dL, dan >220mg/dL.
Jika variabel independen memiliki kelompok lebih dari 2, maka variabel tersebut harus
diubah menjadi variabel dummy yang berjumlah k-1 (k=jumlah kelompok). Jadi, kadar gula
darah harus diubah menjadi 2 variabel dummy. Mengapa perlu dibuat variabel dummy?
Karena pada variabel independen kita memberi kode tertentu, misal: 0=gds ≤180mg/dL,
1=gds 181-220mg/dL, 2=gds >220mg/dL. Angka 0, 1, 2 hanya merupakan kode yang boleh
diganti dengan angka lain.
Pembuatan variabel dummy dilakukan dengan cara mengambil satu kelompok sebagai
pembanding. Misalkan pada contoh diatas, kelompok pasien dengan kadar gula darah
sewaktu ≤180mg/dL diambil sebagai kelompok pembanding. Pembentukan 2 variabel dummy
dilakukan dengan cara:
gds gds_1 gds_2
≤180 mg/dL 0 0
181-220 mg/dL 1 0
>220 mg/dL 0 1
4. Interaksi dan Confounding

Bila suatu kovariat (z) mempunyai hubungan asosiasi dengan outcome dan faktor risiko,
maka kovariat ini adalah merupakan confounder.
Suatu confounder dapat dikontrol, tetapi hal ini hanya berlaku bila tidak didapatkan adanya
interaksi. Bila hubungan asosiasi antara kovariat dengan outcome sama pada tiap
level/tingkat faktor risiko, maka tidak didapatkan interaksi antara kovariat dengan faktor
risiko.
Untuk menentukan apakah z adalah suatu confounder, maka:
1. Bandingkan koefisien atau OR dari variabel faktor risiko utama pada model yang
mengandung dan tidak mengandung kovariat.
2. Setiap pengaruh biologis (berdasarkan teori dan pengetahuan) yang penting dan
mungkin dapat menjadi confounder harus diperhitungkan dalam model (ini tidak
tergantung dari kemaknaan statistik dari koefisien kovariat).
Untuk menentukan apakah z adalah suatu interaksi, maka:
1. Lakukan fitting pada suatu model dengan mengikutsertakan interaksi di dalam model
tersebut.
2. Suatu kovariat terjadi interaksi bila interaksi tersebut bermakna secara statistik dan
mempunyai arti dan dasar secara biologi.
 Bila nilai tersebut > 10-20% maka dipertimbangkan adanya confounding

 Bila nilai tersebut < 10% tidak merupakan masalah
5. Strategi Pemodelan
Analisis regresi logistik dapat digunakan untuk keperluan:
 Model Prediksi
Pemodelan prediksi bertujuan untuk memperoleh kumpulan variabel prediktor
(independen), dari kumpulan besar variabel yang dianggap terbaik untuk memprediksi
kejadian variabel dependen (outcome).
 Model Faktor Risiko
Pemodelan faktor risiko bertujuan mengestimasi secara valid asosiasi antara suatu
determinan (misal faktor risiko) dengan suatu outcome.
Pada pemodelan prediksi semua variabel dianggap penting, sehingga dapat dilakukan
estimasi beberapa koefisien regresi logistik sekaligus. Sedangkan pada pemodelan faktor
risiko, diutamakan adalah nilai koefisien regresi suatu determinan yang memang ingin
dipelajari. Variabel lain dipertimbangkan sebagai variabel kontrol, karena variabel tersebut
juga ikut berpengaruh (confounding) atau sebagai faktor modifikasi (interaksi) yang dinilai
pengaruhnya tidak homogen dalam hubungan antara determinan utama dan outcome.
Metoda Pemilihan Model

Problem utama dalam membangun model adalah memilih kumpulan kovariat yang harus
dimasukkan ke dalam model. Adanya variabel didalam model dapat berdasarkan suatu
substansi keilmuan atau berdasarkan pemilihan statistik, berarti beberapa variabel dipaksa
masuk. Sedangkan variabel-variabel lain yang masuk ke dalam model jika terdapat bukti
bahwa koefisien regresi β dinilai significant. Misalnya variabel umur, jenis kelamin atau
golongan etnik dapat dipaksa masuk dalam model. Variabel tersebut dipaksa masuk, terutama
dalam pemodelan faktor risiko, karena variabel mempengaruhi asosiasi yang dipelajari,
walaupun barangkali koefisien β tidak signifikan.
Kecenderungan peneliti adalah memilih langkah pemodelan yang bersifat pemilihan
bertujuan, karena cara tradisional yang bersifat makanis (stepwise) dianggap menyimpang
dalam pengertian bahwa sering didadaptkan model yang tidak bisa diterangkan secara
substantif keilmuan. Pada langkah pemodelan bertujuan, peneliti dapat menkontrol setiap
langkah dalam pemilihan variabel. Pemilihan variabel dilakukan secara bertahap tetapi
dilakukan dengan kendali penuh peneliti. Pemilihan variabel dilakukan satu per satu secara
bertahap sampai tercapai model yang lengkap. Atau memulai dari model yang lengkap
dengan masukan semua variabel kemudian secara bertahap dihilangkan satu per satu.
Seringkali variabel-variabel tersebut terlalu banyak, dan ada keterbatasan pada komputer
maka dianjurkan pemilihan bertahap mulai dari satu variabel kemudian penambahan variabel
lain sampai tercapai model yang diinginkan.
Langkah-langkah pemilihan variabel
1) Lakukan analisis pada model regresi univariat pada tiap variabel. Pada langkah ini
peneliti bertujuan mengestimasi peranan masing-masing variabel. Lihat hasil uji
statistik pada masing-masing variabel.
2) Lakukan pemilihan variabel yang potensial akan dimasukkan ke dalam model,
variabel yang dianggap signifikan (kriteria p<0,25) dengan variabel lain yang perlu
dipertimbangkan khusus.
3) Identifikasi variabel yang dianggap penting dalam persamaan multivariabel dengan
menggunakan uji statistik wald.
4) Lakukan uji likelihood untuk penilaian signifikansi variabel yang dihilangkan dengan
membandingkan -2ln pada model yang ringkas dengan -2ln pada model yang lengkap.
5) Ulangi langkah ke-3 dan ke-4 sampai tercapai model yang terdiri hanya variabel-
variabel yang dianggap penting.
6) Identifikasi bentuk parametrik yang sesuai untuk variabel yang bersifat kontinyu,
yaitu dengan mengganti variabel yang kontinyu dengan variabel yang bersifat
kategorikal berdasarkan pembagian kuartil dan lakukan plotting koefisien estimasi
dengan titik tengah kuartil. Kalau tidak dianggap linier, maka dianjurkan untuk diubah
menjadi variabel dikotom atau tetap sebagai bentuk kontinyu (jika hanya bertindak
sebagai variabel kontrol).
Dengan menyelesaikan langkah enam langkah tersebut, maka diperoleh model efek
utama (main effects model). Langkah selanjutnya adalah melakukan penilaian apakah
ada variabel interaksi.
7) Susun daftar variabel interaksi antara variabel pada model efek utama yang
didasarkan logika substantif. Variabel interaksi disusun merupakan hasil perkalian
antara dua variabel atau lebih.
8) Lakukan pemilihan variabel interaksi dengan mengikuti proses seperti pada langkah 1
sampai 5.
Penilaian efek utama (variabel tanpa interaksi) dapat didasarkan pada informasi uji
statistik yang signifikan pada variabel tersebut dan pengaruhnya pada koefisien
variabel yang lain.
Misal:
Peneliti dapat memasukkan variabel efek utama ke dalam model, walaupun nilai P-
value=0,12. Sebab bila variabel tersebut dihilangkan akan diikuti perubahan nilai
slope (misalnya sampai >20%) pada koefisien variabel lain tanpa menghilangkan
presisi, peningkatan standar error.
Tujuan untuk menilai interaksi dengan mendasari uji statistik. Bila secara statistik
dianggap significant (P≤0,1), maka variabel interaksi akan masuk ke dalam model.
Pemasukkan variabel interaksi yang tidak signifikan akan meningkatkan nilai SE
(estimasi interval semakin melebar alias presisi semakin merosot) serta akan
menambah kerumitan melakukan interpretasinya.
Setelah menyelesaikan langkah ke-8 maka dapat dikatakan bahwa telah terpilih suatu
model regresi. Beberapa pakar menganjurkan untuk dilanjutkan dengan penilaian
ketepatannya (assessing the fit of the model).
6. Aplikasi Regresi Logistik

Suatu penelitian ingin mengetahui hubungan antara umur ibu (age), ras (race), menderita
hipertensi (ht), ada kelainan uterus (ui), dan petiksa hamil (ftv) dengan BBLR (low).
Langkah-langkah pemodelan:
1) Seleksi Bivariat
Masing-masing variabel independen dilakukan analisis bivariat dengan variabel
dependen. Bila hasil bivariat menghasilkan P value<0,25, maka variabel tersebut
langsung masuk tahap multivariat. Untuk variabel independen yang hasil bivariatnya
menghasilkan P value>0,25 namun secara substansi penting, maka variabel tersebut dapat
dimasukan ke dalam model multivariat. Seleksi bivariat menggunakan uji regresi logistik
sederhana.
a) Umur dengan bblr
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 2,760 1 ,097
Block 2,760 1 ,097
Model 2,760 1 ,097
Variables in the Equation
95,0% C.I.for EXP(B)

B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
AGE -,051 ,032 2,635 1 ,105 ,950 ,893 1,011
1 Constant ,385 ,732 ,276 1 ,599 1,469
a. Variable(s) entered on step 1: AGE.
Dari hasil ouput, pada tampilan Block 1 didapatkan hasil omnibus test pada bagian
block dengan p value 0,097 berarti variabel umur p value-nya < 0,25 sehingga
variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan SPSS nilai OR
dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI: 0,89-1,01).
b) Race dengan Bblr

Pada variabel race perlu dilakukan dummy leh karena variabel ras berjenis kategorik
dengan isi lebih dari 2 nilai, tepatnya 3 kelompok yaitu ras putih, hitam, dan lainnya.
Categorical Variables Codings
Parameter coding
Frequency (1) (2)
Race White 96 ,000 ,000
Black 26 1,000 ,000
Other 67 ,000 1,000
Chi-square df Sig.
Step 1 Step 5,010 2 ,082
Block 5,010 2 ,082
Model 5,010 2 ,082

Step
a
RACE 4,922 2 ,085
1 RACE(1) ,845 ,463 3,323 1 ,068 2,328 ,939 5,772
RACE(2) ,636 ,348 3,345 1 ,067 1,889 ,955 3,736
Constant -1,155 ,239 23,330 1 ,000 ,315
a. Variable(s) entered on step 1: RACE.
Hasil uji didapatkan p value 0,082 berarti p value < 0,25, sehingga variabel ras dapat
lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy, terlihat ada
dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kulit hitam akan berisiko
bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit putih. OR untuk race
(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai risiko bayinya bblr
sebesar 1,89 kali lebih tinggi dibandingkan ras kulit putih.
c) Hipertensi dengn Bblr
Chi-square df Sig.
Step 1 Step 4,022 1 ,045
Block 4,022 1 ,045
Model 4,022 1 ,045

Step
a
HT 1,214 ,608 3,979 1 ,046 3,365 1,021 11,088
1 Constant -,877 ,165 28,249 1 ,000 ,416
a. Variable(s) entered on step 1: HT.
Hasil uji didapatkan p value=0,045 (pvalue<0,25) bearti masuk dalam multivariat.
d) Ui dengan Bblr
Chi-square df Sig.
Step 1 Step 5,076 1 ,024
Block 5,076 1 ,024
Model 5,076 1 ,024

Step
a
UI ,947 ,417 5,162 1 ,023 2,578 1,139 5,834
1 Constant -,947 ,176 29,072 1 ,000 ,388
a. Variable(s) entered on step 1: UI.
Hasil uji didapatkan p value=0,024 (pvalue<0,25) bearti masuk dalam multivariat.
e) Periksa hamil dengan Bblr
Chi-square df Sig.
Step 1 Step ,773 1 ,379
Block ,773 1 ,379
Model ,773 1 ,379

Step
a
FTV -,135 ,157 ,744 1 ,389 ,874 ,643 1,188
1 Constant -,687 ,195 12,427 1 ,000 ,503
a. Variable(s) entered on step 1: FTV.
Hasil uji didapatkan p value=0,379 (pvalue>0,25) sehingga secara statistik tidak dapat
lanjut ke multivariat, namun karena secara substansi variabel periksa hamil sangat
penting, maka variabel ini dapat dianalisis multivariat.
f) Merokok dengan Bblr
Chi-square df Sig.
Step 1 Step 4,867 1 ,027
Block 4,867 1 ,027
Model 4,867 1 ,027

Step
a
SMOKE ,704 ,320 4,852 1 ,028 2,022 1,081 3,783
1 Constant -1,087 ,215 25,627 1 ,000 ,337
a. Variable(s) entered on step 1: SMOKE.
Hasil uji p value = 0,027 (p value < 0,25) dengan demikian variabel merokok dapat
masuk ke mulivariat.
g) Prematur dengan Bblr
Chi-square df Sig.
Step 1 Step 6,779 1 ,009
Block 6,779 1 ,009
Model 6,779 1 ,009

Step
a
PTL ,802 ,317 6,391 1 ,011 2,230 1,197 4,151
1 Constant -,964 ,175 30,370 1 ,000 ,381
a. Variable(s) entered on step 1: PTL.
Hasil analisis didapatkan p value sebesar 0,009 berarti <0,25 sehingga variabel
riwayat adanya prematur dapat masuk ke multivariat.
Tabel 1. Hasil Seleksi Bivariat
Variabel P Value
Umur 0,097
Ras 0,082
Hipertensi 0,045
UI 0,024
Periksa hamil 0,379
Merokok 0,027
Prematur 0,009
Hasil seleski bivariat semua variabel menghasilkan p value < 0,25 hanya periksa
hamil yang p valuenya > 0,25. Namun variabel periksa hamil tetap dianalisis
multivariat oleh karena secara substansi periksa hamil merupakan variabel yang
sangat penting berhubungan dengan kejadian bblr.
2) Pemodelan Multivariat

Step
a
AGE -,041 ,036 1,249 1 ,264 ,960 ,894 1,031
1 RACE 6,783 2 ,034
RACE(1) 1,009 ,502 4,034 1 ,045 2,743 1,025 7,345
RACE(2) 1,003 ,426 5,560 1 ,018 2,727 1,185 6,280
SMOKE ,964 ,391 6,090 1 ,014 2,622 1,219 5,639
PTL ,630 ,340 3,429 1 ,064 1,877 ,964 3,654
HT 1,361 ,631 4,648 1 ,031 3,902 1,132 13,451
UI ,802 ,458 3,066 1 ,080 2,229 ,909 5,468
FTV ,009 ,161 ,003 1 ,954 1,009 ,736 1,384
Constant -1,183 ,919 1,659 1 ,198 ,306
a. Variable(s) entered on step 1: AGE, RACE, SMOKE, PTL, HT, UI, FTV.
Dari hasil analisis terlihat ada 4 variabel yang p value-nya >0,05 yaitu age, ptl, ui, dan ftv,
sehingga pemodelan selanjutnya variabel ftv dikeluarkan dari model.
Dengan langkah yang sama akhirnya diperoleh hasil sbb.:

Step
a
AGE -,040 ,036 1,275 1 ,259 ,960 ,896 1,030
1 RACE 6,781 2 ,034
RACE(1) 1,009 ,503 4,035 1 ,045 2,744 1,025 7,347
RACE(2) 1,002 ,425 5,562 1 ,018 2,723 1,184 6,262
SMOKE ,963 ,390 6,086 1 ,014 2,620 1,219 5,632
PTL ,629 ,340 3,423 1 ,064 1,875 ,963 3,651
HT 1,358 ,629 4,663 1 ,031 3,889 1,134 13,341
UI ,800 ,457 3,063 1 ,080 2,226 ,908 5,454
Constant -1,184 ,919 1,661 1 ,197 ,306
a. Variable(s) entered on step 1: AGE, RACE, SMOKE, PTL, HT, UI.
Setelah ftv dilekuarkan kita lihat perubahan nilai OR untuk variabel age, race, smoke, ptl,
ht, dan ui.
Variabel OR ftv ada OR ftv tdk ada OR
Age 0,96 0,96 0%
Race(1) 2,743 2,744 0%
Race(2) 2,727 2,723 0%
Smoke 2,622 2,620 0%
Ptl 1,877 1,875 0,1%
Ht 3,902 3,889 0,3%
Variabel OR ftv ada OR ftv tdk ada OR
Ui 2,229 2,226 0,1%
Ftv 1,009 - -
Dengan perbandingan OR terlihat tidak ada yang >10% dengan demikian ftv dikeluarkan
dari model. Selanjutnya variabel yang terbesar p value-nya adalah umur, dengan demikian
umur dicoba dikeluarkan dari model, dan hasilnya sebagai berikut:

Step
a
RACE 7,968 2 ,019
1 RACE(1) 1,088 ,501 4,723 1 ,030 2,968 1,113 7,916
RACE(2) 1,059 ,418 6,422 1 ,011 2,883 1,271 6,538
SMOKE ,991 ,387 6,569 1 ,010 2,694 1,263 5,747
HT 1,364 ,633 4,640 1 ,031 3,912 1,131 13,537
PTL ,576 ,334 2,975 1 ,085 1,779 ,925 3,422
UI ,855 ,451 3,585 1 ,058 2,350 ,970 5,692
Constant -2,146 ,386 30,917 1 ,000 ,117
a. Variable(s) entered on step 1: RACE, SMOKE, HT, PTL, UI.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel yang masih
aktif di model.
Variabel OR age ada OR age tdk OR
ada
Age 0,96 - -
Race(1) 2,743 2,968 8,2%
Race(2) 2,727 2,883 5,7%
Smoke 2,622 2,694 2,7%
Ptl 1,877 1,779 5,2%
Ht 3,902 3,912 0,3%
Ui 2,229 2,350 5,4%
Ftv 1,009 - -
Dari analisis perbandingan OR ternyata perubahannya <10% dengan demikian variabel

umur dikeluarkan dari model. Langkah selanjutnya mengeluarkan variabel yang p
valuenya >0,05, variabel ptl dikeluarkan dari model, hasilnya:

Step
a
RACE 8,245 2 ,016
1 RACE(1) 1,064 ,499 4,545 1 ,033 2,897 1,090 7,704
RACE(2) 1,083 ,413 6,877 1 ,009 2,955 1,315 6,640
SMOKE 1,094 ,380 8,299 1 ,004 2,986 1,419 6,286
HT 1,359 ,630 4,660 1 ,031 3,894 1,133 13,379
UI 1,006 ,438 5,262 1 ,022 2,734 1,158 6,458
Constant -2,092 ,380 30,307 1 ,000 ,123
a. Variable(s) entered on step 1: RACE, SMOKE, HT, UI.
Setelah ptl dikeluarkan, kita lihat perubahan OR-nya:
Variabel OR ptl ada OR ptl tdk ada OR

Age 0,96 - -
Race(1) 2,743 2,897 5,6%
Race(2) 2,727 2,955 8,3%
Smoke 2,622 2,986 13,8%
Ptl 1,877 - -
Ht 3,902 3,894 0,2%
Ui 2,229 2,734 22,6%
Ftv 1,009 - -
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah
>10% dengan demikian variabel ptl dimasukkan kembali dalam model.
Kemudian variabel ui dikeluarkan dari model karena p valuenya >0,05 dan hasilnya, sbb:

Step
a
RACE 8,286 2 ,016
1 RACE(1) 1,062 ,500 4,513 1 ,034 2,894 1,086 7,712
RACE(2) 1,085 ,411 6,949 1 ,008 2,958 1,321 6,626
SMOKE ,996 ,382 6,794 1 ,009 2,707 1,280 5,726
HT 1,221 ,629 3,764 1 ,052 3,390 ,988 11,640
PTL ,696 ,325 4,596 1 ,032 2,007 1,062 3,793
Constant -2,025 ,372 29,586 1 ,000 ,132
a. Variable(s) entered on step 1: RACE, SMOKE, HT, PTL.
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan:

Age 0,96 - -
Race(1) 2,743 2,894 5,5%
Race(2) 2,727 2,958 8,4%
Smoke 2,622 2,707 3,2%
Ptl 1,877 2,007 6,9%
Ht 3,902 3,390 13,1%
Ui 2,229 - -
Ftv 1,009 - -
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah >10%, dengan

demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan
adalah sebagai berikut:

Step
a
RACE 7,968 2 ,019
1 RACE(1) 1,088 ,501 4,723 1 ,030 2,968 1,113 7,916
RACE(2) 1,059 ,418 6,422 1 ,011 2,883 1,271 6,538
SMOKE ,991 ,387 6,569 1 ,010 2,694 1,263 5,747
HT 1,364 ,633 4,640 1 ,031 3,912 1,131 13,537
PTL ,576 ,334 2,975 1 ,085 1,779 ,925 3,422
UI ,855 ,451 3,585 1 ,058 2,350 ,970 5,692
Constant -2,146 ,386 30,917 1 ,000 ,117
3) Uji Interaksi
Uji interaski dilakukan pada variabel yang diduga secara substansi ada interaksi , jika
memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus sekarang, misalkan kita
duga, merokok berinteraksi dengan hipertensi.
Merokok berinteraksi dengan Ht
Chi-square df Sig.
Step 1 Step ,000 1 ,994
Block ,000 1 ,994
Model 26,560 7 ,000

Step
a
RACE 7,900 2 ,019
1 RACE(1) 1,088 ,502 4,692 1 ,030 2,969 1,109 7,946
RACE(2) 1,059 ,419 6,387 1 ,011 2,883 1,268 6,555
SMOKE ,990 ,397 6,211 1 ,013 2,692 1,236 5,865
HT 1,360 ,831 2,680 1 ,102 3,896 ,765 19,852
PTL ,576 ,336 2,937 1 ,087 1,779 ,921 3,438
UI ,854 ,451 3,584 1 ,058 2,350 ,970 5,693
HT by SMOKE ,010 1,283 ,000 1 ,994 1,010 ,082 12,491
Constant -2,146 ,386 30,875 1 ,000 ,117
a. Variable(s) entered on step 1: HT * SMOKE .
Pada output bagian Block 2:Method=Enter, terlihat hasil uji omnibusnya memperlihatkan p
value=0,994 (lihat bagian step) berarti >0,05, artinya tidak ada interaksi antara merokok
dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa ada
interaksi:
Model Akhir:

Step
a
RACE 7,968 2 ,019
1 RACE(1) 1,088 ,501 4,723 1 ,030 2,968 1,113 7,916
RACE(2) 1,059 ,418 6,422 1 ,011 2,883 1,271 6,538
SMOKE ,991 ,387 6,569 1 ,010 2,694 1,263 5,747
HT 1,364 ,633 4,640 1 ,031 3,912 1,131 13,537
PTL ,576 ,334 2,975 1 ,085 1,779 ,925 3,422
UI ,855 ,451 3,585 1 ,058 2,350 ,970 5,692
Constant -2,146 ,386 30,917 1 ,000 ,117
Interpretasi:
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat kohort.
Sedangkan yang bersifat cross sectional atau case control, interpretasi yang dapat dilakukan
hanya menjelaskan nilai OR (exp B) pada masing-masing variabel. Oleh karena analisisnya
multivariat maka nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada
model. Dari analisis multvariat ternyata variabel yang berhubungan bermakna dengan
kejadian BBLR adalah variabel ras, merokok, dan hipertensi. Sedangkan variabel riwayat
prematur dan kelainan uterus sebagai variabel confounding. Hasil analisis didapatkan odds
ratio (OR) dari variabel hipertensi adalah 3,9 artinya ibu yang menderita hipertensi akan
melahirkan bayi BBLR sebesar 4 kali lebih tinggi dibandingkan ibu yang tidak menderita
hipertensi setelah dikontrol variabel race, merokok, prematur, dan uterus. Dengan cara yang
sama dapat diinterpretasikan untuk variabel lain.
Untuk melihat variabel mana yang paling besar pengaruhnya terhadap variabel dependen,
dilihat dari exp (B) untuk variabel yang signifikan. Semakin besar nilai exp (B) berarti
semakin besar pengaruhnya terhadap variabel dependen yang dianalisis. Dalam data ini
berarti hipertensi yang paling besar pengaruhnya terhadap kejadian bayi BBLR.
7. Goodness Of Fit
Model statistik regresi logistik ganda selanjutnya dapat dikaji apakah memang sudah
cocok atau fit. Beberapa cara untuk melihat GOF dapat dilakukan, misalnya tabel klasifikasi
(yang melihat kecocokan antara nilai variabel dependen hasil observasi dengan hasil terapan
model), uji chi-square model (uji rasio likelihood). Walaupun beberapa perangkat lunak
menyajikan pseudo R-square, namun Hosmer & Lemeshow (1989) mengingatkan bahwa
nilai tersebut tidak dapat dianggap sebagai pengukuran GOF.
Setelah ditemukan model akhir, langkah selanjutnya yaitu menentukan apakah model
akhir tersebut fit atau tidak.
Chi-square df Sig.
Step 1 Step 26,560 6 ,000
Block 26,560 6 ,000
Model 26,560 6 ,000
Hosmer and Lemeshow Test
Step Chi-square df Sig. Model dengan 5 variabel ini tidak fit, dengan
1 1,776 6 ,939
uji hosmer & lemeshow test.
Classification Tablea
Predicted
Low birth weight Percentage

Observed >= 2500 g < 2500 g Correct
Step 1 Low birth weight >= 2500 g 120 10 92,3
< 2500 g 43 16 27,1
Overall Percentage 72,0
a. The cut value is ,500
Klasifikasi benar untuk model dengan

variabel ini cukup tinggi sekitar 72%.
Dengan melihat hasil GOF yang tidak significant, perlu dilakukan uji GOF untuk setiap
variabel yang akan masuk ke dalam model.
DAFTAR PUSTAKA
Kleinbum, Kupper, Muller. 1998. Apllied Regression Analysis and Other Multivariable.
Boston: PWS-Kent Pub.Co
Hosmer H., Lemeshoe. 1989. Applied Logistic Regression. John Wiley & Sons.
Leech et al. 2005. SPSS for Intermediate Statistics: Use and Interpretation. New Jersey:
Lawrance Erlbum Ass.Pub.
Ariawan, Iwan. 2007. Analisis Data Kategori. Jurusan Biostatistik dan Kependudukan,
FKMUI.

Analisis Regresi Logistik

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Analisis Regresi Logistik

Diunggah oleh

Hak Cipta:

Format Tersedia

Analisis Regresi Logistik

Pada variasi nilai z dari -∞ sampai dengan +∞ dapat digambarkan:

2. Model Regresi Logistik

Kemudian dilakukan transformasi logaritma nilai e, sehingga persamaannya disebut sebagai

4. Interaksi dan Confounding

 Bila nilai tersebut > 10-20% maka dipertimbangkan adanya confounding

Metoda Pemilihan Model

6. Aplikasi Regresi Logistik

95,0% C.I.for EXP(B)

b) Race dengan Bblr

Omnibus Tests of Model Coefficients

Variables in the Equation

95,0% C.I.for EXP(B)

Omnibus Tests of Model Coefficients

Variables in the Equation

95,0% C.I.for EXP(B)

Hasil uji didapatkan p value=0,045 (pvalue<0,25) bearti masuk dalam multivariat.

Omnibus Tests of Model Coefficients

Variables in the Equation

95,0% C.I.for EXP(B)

Hasil uji didapatkan p value=0,024 (pvalue<0,25) bearti masuk dalam multivariat.

e) Periksa hamil dengan Bblr

Omnibus Tests of Model Coefficients

Variables in the Equation

95,0% C.I.for EXP(B)

f) Merokok dengan Bblr

Omnibus Tests of Model Coefficients

Variables in the Equation

95,0% C.I.for EXP(B)

g) Prematur dengan Bblr

Omnibus Tests of Model Coefficients

Variables in the Equation

95,0% C.I.for EXP(B)

95,0% C.I.for EXP(B)

95,0% C.I.for EXP(B)

95,0% C.I.for EXP(B)

Dari analisis perbandingan OR ternyata perubahannya <10% dengan demikian variabel

95,0% C.I.for EXP(B)

Setelah ptl dikeluarkan, kita lihat perubahan OR-nya:

Variabel OR ptl ada OR ptl tdk ada OR

95,0% C.I.for EXP(B)

Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan:

Variabel OR ptl ada OR ptl tdk ada OR

Setelah dilakukan perbandingan OR, ternyata variabel ht berubah >10%, dengan

95,0% C.I.for EXP(B)

Variables in the Equation

95,0% C.I.for EXP(B)

Variables in the Equation

95,0% C.I.for EXP(B)

Low birth weight Percentage

Klasifikasi benar untuk model dengan

Anda mungkin juga menyukai