Anda di halaman 1dari 28

ANALISIS

REGRESI LOGISTIK GANDA


Multiple Regression Logistic
Pengertian Regresi Logistik:
• Suatu model matematik yang digunakan untuk
mempelajari hubungan satu atau beberapa variabel
independen dengan satu variabel dependen yang bersifat
dikotomi (binary). Variabel bianry : adalah variabel yang
hanya memiliki dua nilai, misalnya (sakit / sehat),
(merokok/ tdk merokok), (BBLR/ normal) dll
• Variabel Independen (prediktor) sebaiknya kategorik, agar
mudah untuk menginterpretasikan hasil analisisnya.
• Bila variabel prediktor 3 kategori atau lebih, maka dibuat
dua kategori. Caranya ; dummy variabel, kategori ulang
sesuai logika biologik.
• Analisis regresi ganda logistik adalah alat statistik yang
sangat kuat untuk menganalisis hubungan antara
paparan dan penyakit dengan serentak mengontrol
pengaruh sejumlah faktor perancu potensial.
• Tujuan analisis regresi ganda logistik yaitu menemukan
model regresi yang paling sesuai, paling irit, sekaligus
masuk akal secara biologik, untuk menggambarkan
hubungan antara variabel dependen dan satu set
variabel prediktor dalam populasi.
• Manfaat analisis regresi ganda : (a) Meramalkan
terjadinya variabel dependen pada individu
berdasarkan nilai-nilai sejumlah variabel prediktor
yang ada pada individu tersebut.
• Manfaat : (b) Mengukur hubungan antara
veriabel respon dan prediktor, setelah
mengontrol pengaruh prediktor (kovariat)
lainnya.
Keistimewaan
Regresi Logistik Ganda

(a) Kemampuan kengkonversi koefisien regresi (bi) menjadi


rasio odds (OR).  OR = exp [bi]
(b) Kemampuan menaksir probabilitas individu untuk sakit
(mengalami event) berdasarkan nilai-nilai sejumlah
variabel prediktor, dengan rumus sebagai berikut :
Macam Regresi logistik :

1. Regresi logistik sederhana


Untuk mempelajari hubungan antara satu variabel
prediktor dengan satu variabel dependen
dikotomus.
2. Regresi logistik ganda (Multiple Regression Logistic)
Untuk mempelajari hubungan antara beberapa
variabel prediktor dengan satu varibel dependen
dikotomus.
Model Regresi Ganda Logistik

Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds.


Odds : rasio probabilitas suatu peristiwa untuk
terjadi dan probabilitas suatu peristiwa untuk
tidak terjadi
a = Konstanta ( intersep)
b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope)
X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan
diteliti.
p = probabilitas untuk terjadinya “peristiwa”
dari variabel dependen yg dikotomus.
Membangun Model
Regresi Logistik Ganda

• Pembangunan model regresi ganda logistik hendaknya


tidak terjebak oleh penggunaan veriabel prediktor yang
terlalu banyak.
• Pemilihan variabel sebaiknya dilakukan dengan cara-cara
yang lebih purposif, dan tidak terpaku pada pendekatan
yang sifatnya deterministik menurut kamaknaan statistik.
• Makin banyak variabel yang dimasukkan dalam model
hanya akan meningfkatkan kesesuaian garis regresi
dengan hubungan antara variabel dependen dan
sejumpan variabel prediktor pada data sampel, tetapi
belum tentu menggambarkan hubungan tersebut pada
tingkat populasi.
• Hal itu disebabkan karena, bertambahnya variabel
prediktor (baik yang relevan maupun tidak relevan)
hanya akan menaikkan nilai taksiran kesalahan baku,
sehingga membuat model tersebut sangat tegantung
kepada data pengamatan sampel.
• Kesimpulannya, model tersebut tidak merefleksikan /
meggambarkan hubungan variabel respon dan variabel-
variabel prediktor dalam populasi yang sesungguhnya.
PROSEDUR PEMILIHAN VARIABEL

Agar diperoleh model regresi yang baik adalah


sebagai berikut :

1. Melakukan analisis univariate untuk


menyaring variabel-variabel yang penting.
2. Memasukkan dan/ atau mengeluarkan
variabel- variabel dalam model multivariate
3. Memasukkan dan memeriksa kemungkinan
ada interaksi variabel dalam model.
Melakukan analisis bivariate untuk
penyaringan awal :
 Uji statistik yang dipakai adalah : chi-quadrat
 Jika ada variabel prediktor lebih dari dua kategori, maka dibuat
menjadi dua kategori terlebih dahulu. Perlu diingat bahwa
dalam melakukan recode harus mempunyai alasan biologik.
 Mickey dan Greenland : variabel variabel yang mempunyai
nilai p= 0,25 dan memiliki kemaknaan biologik hendaknya
dipertimbangkan untuk dimasukkan ke dalam model
multivariate.
• Batasan P= 0,25, untuk mengantisipasi
kemungkinan variabel yang secara terselubung
sesungguhnya penting untuk dimasukkan
dalam model. “Terselubung” kemungkinan
variabel variabel secara kolektif dapat menjadi
prediktor penting, walaupun secara sendiri
sendiri merupakan prediktor lemah.
Memasukkan / mengeluarkan variabel dalam
model regresi :

Beberapa Metode :
1. Enter
2. Stepwise
3. Forward
4. Backward
5. Conditional, LR (likelihood ratio),
Wald
Memeriksa Kemungkinan Interaksi
• Jika dengan uji interaksi menunjukkan
kemaknaan statistik, maka kita katakan
interaksi memberikan kontribusi penting
kepada model. Jika suatu interaksi hanya
memperbesar taksiran kesalahan baku
(S.E.) dan tidak mengubah taksiran
koefisiens regresi (b1), maka interaksi
tersebut mungkin tidak penting.
Latihan

Sebuah studi Kohor prospektif, meneliti pengaruh


aktifitas fisik (AF) terhadap kejadian infark otot
jantung (MI). Variabel lain yang diukur adalah umur
dalam kategori (AGRP) dan kebiasaan merokok.
Kategorisasi nilai variabel
MI = 1 : sakit 0 : tidak sakit
AF = 1 : aktifitas fisik >= 2500 kcal/ hari
0 : aktifitas fisik < 2500 kcal/hari

AGRP = 1 : umur >= 55 tahun


0 : umur < 55 tahun

Kebiasaan merokok = 2 : merokok >= 15 btg / hari


1 : merokok < 15 btg /hari
0 : tidak merokok
Varabel rancangan
Kebiasaan merokok
- Jumlah variabel yang dibutuhkan ( k-1)  3-1 : 2
- Sebagai contoh MRK menjadi D1 dan D2
- Sebagai salah satu rancangan pengkodean variabel
tersebut, maka variabel bukan perokok sebagai variabel
acuan (refference)  dengan kode D1=0 D2=0
- Selanjutnya merokok <15 btg / hari D1=1 D2=0
- Dan merokok >= 15 btg/hari D1=0 D2=1
Sehingga menjadi :

Variabel asli Variabel rancangan

MRK D1 D2

Tidak merokok 0 0
Merokok < 15 btg / hari 1 0
Merokok >= 15 btg / hari 0 1
Cek kelayakan variabel untuk dimasukkan dalam model :

Menggunakan chi-square

Kriteria variabel yang masuk p=0,25


Hasil analisis bivariate... ?

AF p=0,000
AGRP p=0,000
D1 p=0,000
D2 p=0,052
Hasil Regresi Logistik

95,0% C.I.for
EXP(B)

B S.E. Wald df Sig. Exp(B) Lower Upper


Step AF
-2,243 1,019 4,846 1 ,028 ,106 ,014 ,782
1(a)
AGRP
2,013 ,977 4,242 1 ,039 7,487 1,102 50,848
D1
2,478 1,084 5,225 1 ,022 11,920 1,424 99,793
D2
2,673 1,316 4,130 1 ,042 14,490 1,100 190,922
Constant
-1,915 ,995 3,699 1 ,054 ,147
Persamaan yg di dapat :

1
P= _________________________________________
- [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2)
1 +e

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
AF -2,243 1,019 4,846 1 ,028 ,106
1 AGRP 2,013 ,977 4,242 1 ,039 7,487
D1 2,478 1,084 5,225 1 ,022 11,920
D2 2,673 1,316 4,130 1 ,042 14,490
Constant -1,915 ,995 3,699 1 ,054 ,147
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.
Meramalkan Probabilitas Individu untuk mengalami sakit

Berdasarkan persamaan tersebut diatas, berapa


probabilitas untuk mengalami sakit pada individu
dengan kriteria sebagai berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari
Perhitungan :
Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
AF -2,243 1,019 4,846 1 ,028 ,106
1 AGRP 2,013 ,977 4,242 1 ,039 7,487
D1 2,478 1,084 5,225 1 ,022 11,920
D2 2,673 1,316 4,130 1 ,042 14,490
Constant -1,915 ,995 3,699 1 ,054 ,147
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.

1
P= _________________________________________
- [-1,9146 – 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) + 2,6734(D2)]
1 +e
Berdasarkan persamaan tersebut diatas, berapa
probabilitas untuk mengalami sakit pada individu
dengan kriteria sebagai berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari

AF = 0 tidak berisiko
Umur = 0 tidak berisikok
Merokok < 15 batang  D1 = 1 D2=0

1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e
Perhitungan :
1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e

= 0,64  64%

In mathematics, the exponential function is the function ex, where e is the


number (approximately 2.718281828)
Interpretasi :
Individu yang berumur 35 tahun dan hanya
melakukan aktifitas fisik sebesar 2.000 kcal /
hari, serta membunyai kebiasaan merokok 5
batang per hari, maka memiliki probabilitas
untuk terkena MI sebesar 64%.
Terimakasih

Anda mungkin juga menyukai