Anda di halaman 1dari 30

Multiple Regression Logistic

ANALISIS
REGRESI GANDA LOGISTIK
Pengertian Regresi Logistik:
Suatu model matematik yang digunakan untuk
mempelajari hubungan satu atau beberapa
variabel independen dengan satu variabel
dependen yang bersifat dikotomi (binary).
Variabel bianry : adalah variabel yang hanya
memiliki dua nilai, misalnya (sakit / sehat),
(merokok/ tdk merokok), (BBLR/ normal) dll
Variabel Independen (prediktor) sebaiknya
kategorik, agar mudah untuk menginterpretasikan
hasil analisisnya.
Bila variabel prediktor 3 kategori atau lebih, maka
dibuat dua kategori. Caranya ; dummy variabel,
kategori ulang sesuai logika biologik.
Analisis regresi ganda logistik adalah alat statistik
yang sangat kuat untuk menganalisis hubungan
antara paparan dan penyakit dengan serentak
mengontrol pengaruh sejumlah faktor perancu
potensial.
Tujuan analisis regresi ganda logistik yaitu
menemukan model regresi yang paling sesuai,
paling irit, sekaligus masuk akal secara biologik,
untuk menggambarkan hubungan antara variabel
dependen dan satu set variabel prediktor dalam
populasi.
Manfaat analisis regresi ganda : (a) Meramalkan
terjadinya variabel dependen pada individu
berdasarkan nilai-nilai sejumlah variabel prediktor
yang ada pada individu tersebut.

Pengertian Regresi Logistik ............................
Manfaat : (b) Mengukur hubungan antara veriabel
respon dan prediktor, setelah mengontrol
pengaruh prediktor (kovariat) lainnya.

Pengertian Regresi Logistik ............................
Keistimewaan
Regresi Logistik Ganda
(a) Kemampuan kengkonversi koefisien regresi (bi)
menjadi rasio odds (OR). OR = exp [bi]
(b) Kemampuan menaksir probabilitas individu
untuk sakit (mengalami event) berdasarkan
nilai-nilai sejumlah variabel prediktor, dengan
rumus sebagai berikut :
Macam Regresi logistik :
1. Regresi logistik sederhana
Untuk mempelajari hubungan antara satu
variabel prediktor dengan satu variabel
dependen dikotomus.
2. Regresi logistik ganda (Multiple Regression
Logistic)
Untuk mempelajari hubungan antara beberapa
variabel prediktor dengan satu varibel
dependen dikotomus.
Model Regresi Ganda Logistik
Ln (p/(1-p) = logodd (logit). Logaritme natural dari
odds.
Odds : rasio probabilitas suatu
peristiwa untuk terjadi dan
probabilitas suatu peristiwa untuk
tidak terjadi
a = Konstanta ( intersep)
b
1
, b
2
, .... b
k
= koefisien regresi variabel
prediktor (slope)
X
1
, X
2
....X
k
= variabel prediktor yg pengaruhnya
akan diteliti.
p = probabilitas untuk terjadinya
peristiwa dari variabel dependen yg
dikotomus.
Pembangunan model regresi ganda logistik
hendaknya tidak terjebak oleh penggunaan
veriabel prediktor yang terlalu banyak.
Pemilihan variabel sebaiknya dilakukan dengan
cara-cara yang lebih purposif, dan tidak terpaku
pada pendekatan yang sifatnya deterministik
menurut kamaknaan statistik.

Makin banyak variabel yang dimasukkan dalam
model hanya akan meningfkatkan kesesuaian
garis regresi dengan hubungan antara variabel
dependen dan sejumpan variabel prediktor pada
data sampel, tetapi belum tentu menggambarkan
hubungan tersebut pada tingkat populasi.
Hal itu disebabkan karena, bertambahnya
variabel prediktor (baik yang relevan maupun
tidak relevan) hanya akan menaikkan nilai
taksiran kesalahan baku, sehingga membuat
model tersebut sangat tegantung kepada data
pengamatan sampel.
Kesimpulannya, model tersebut tidak
merefleksikan / meggambarkan hubungan
variabel respon dan variabel-variabel prediktor
dalam populasi yang sesungguhnya.

PROSEDUR PEMILIHAN VARIABEL
Agar diperoleh model regresi yang baik adalah
sebagai berikut :

1. Melakukan analisis univariate untuk menyaring
variabel-variabel yang penting.
2. Memasukkan dan/ atau mengeluarkan variabel-
variabel dalam model multivariate
3. Memasukkan dan memeriksa kemungkinan ada
interaksi variabel dalam model.
Melakukan analisis univariate
untuk penyaringan awal :
Uji statistik yang dipakai adalah : chi-quadrat
Jika ada variabel prediktor lebih dari dua kategori,
maka dibuat menjadi dua kategori terlebih dahulu.
Perlu diingat bahwa dalam melakukan recode harus
mempunyai alasan biologik.
Mickey dan Greenland : variabel variabel yang
mempunyai nilai p= 0,25 dan memiliki kemaknaan
biologik hendaknya dipertimbangkan untuk
dimasukkan ke dalam model multivariate.
Univariate ........
Batasan P= 0,25, untuk mengantisipasi
kemungkinan variabel yang secara terselubung
sesungguhnya penting untuk dimasukkan dalam
model. Terselubung kemungkinan variabel
variabel secara kolektif dapat menjadi prediktor
penting, walaupun secara sendiri sendiri
merupakan prediktor lemah.
Beberapa Metode :
1. Enter
2. Stepwise
3. Forward
4. Backward

Conditional, LR (likelihood ratio),
Wald
Memasukkan / mengeluarkan variabel
dalam model regresi :
Memeriksa Kemungkinan
Interaksi
Jika dengan uji interaksi menunjukkan
kemaknaan statistik, maka kita katakan interaksi
memberikan kontribusi penting kepada model.
Jika suatu interaksi hanya memperbesar taksiran
kesalahan baku (S.E.) dan tidak mengubah
taksiran koefisiens regresi (b
1
), maka interaksi
tersebut mungkin tidak penting.

Latihan
Sebuah studi Kohor prospektif, meneliti pengaruh
aktifitas fisik (AF) terhadap kejadian infark otot
jantung (MI). Variabel lain yang diukur adalah
umur dalam kategori (AGRP) dan kebiasaan
merokok.
Kategorisasi nilai variabel
MI = 1 : sakit 0 : tidak sakit
AF = 1 : aktifitas fisik >= 2500 kcal/ hari
0 : aktifitas fisik < 2500 kcal/hari

AGRP = 1 : umur >= 55 tahun
0 : umur < 55 tahun

Kebiasaan merokok = 2 : merokok >= 15 btg /
hari
1 : merokok < 15 btg /hari
0 : tidak merokok
Varabel rancangan
Kebiasaan merokok
- Jumlah variabel yang dibutuhkan ( k-1) 3-1 : 2
- Sebagai contoh MRK menjadi D1 dan D2
- Sebagai salah satu rancangan pengkodean
variabel tersebut, maka variabel bukan perokok
sebagai variabel acuan (refference) dengan
kode D1=0 D2=0
- Selanjutnya merokok <15 btg / hari D1=1
D2=0
- Dan merokok >= 15 btg/hari D1=0
D2=1
Sehingga menjadi :
Variabel asli Variabel
rancangan

MRK D1 D2

Tidak merokok 0 0
Merokok < 15 btg / hari 1 0
Merokok >= 15 btg / hari 0 1


http://www.ziddu.com/download/8461706/RegresiLogistik.rar
.html
File download :
Cek kelayakan variabel untuk dimasukkan dalam model
:
Menggunakan chi-square

Kriteria variabel yang masuk p=0,25
Hasil analisis univariate... ?
AF p=0,000
AGRP p=0,000
D1 p=0,000
D2 p=0,052
Hasil Regresi Logistik
B S.E. Wald df Sig. Exp(B)
95,0% C.I.for
EXP(B)
Lower Upper
Step
1(a)
AF
-2,243 1,019 4,846 1 ,028 ,106 ,014 ,782
AGRP
2,013 ,977 4,242 1 ,039 7,487 1,102 50,848
D1
2,478 1,084 5,225 1 ,022 11,920 1,424 99,793
D2
2,673 1,316 4,130 1 ,042 14,490 1,100 190,922
Constant
-1,915 ,995 3,699 1 ,054 ,147
Persamaan yg di dapat :
Variables in the Equation
-2,243 1,019 4,846 1 ,028 ,106
2,013 ,977 4,242 1 ,039 7,487
2,478 1,084 5,225 1 ,022 11,920
2,673 1,316 4,130 1 ,042 14,490
-1,915 ,995 3,699 1 ,054 ,147
AF
AGRP
D1
D2
Constant
Step
1
a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AF, AGRP, D1, D2.
a.
1
P= _________________________________________
- [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2)
1 + e

Meramalkan Probabilitas Individu untuk mengalami
sakit
Berdasarkan persamaan tersebut diatas, berapa
probabilitas untuk mengalami sakit pada individu
dengan kriteria sebagai berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari
Perhitungan :
1
P= _________________________________________
- [-1,9146 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) +
2,6734(D2)]
1 + e

Variables in the Equation
-2,243 1,019 4,846 1 ,028 ,106
2,013 ,977 4,242 1 ,039 7,487
2,478 1,084 5,225 1 ,022 11,920
2,673 1,316 4,130 1 ,042 14,490
-1,915 ,995 3,699 1 ,054 ,147
AF
AGRP
D1
D2
Constant
Step
1
a
B S.E. Wald df Sig. Exp(B)
Variable(s) entered on step 1: AF, AGRP, D1, D2.
a.
1
P= _________________________________________
- [-1,9146 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 + e

Berdasarkan persamaan tersebut diatas, berapa
probabilitas untuk mengalami sakit pada individu
dengan kriteria sebagai berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari
AF = 0 tidak berisiko
Umur = 0 tidak berisikok
Merokok < 15 batang D1 = 1 D2=0

Perhitungan :
1
P= _________________________________________
- [-1,9146 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 + e

= 0,64 64%
In mathematics, the exponential function is the function e
x
, where e is
the number (approximately 2.718281828)
Interpretasi :
Individu yang berumur 35 tahun dan hanya
melakukan aktifitas fisik sebesar 2.000 kcal / hari,
serta membunyai kebiasaan merokok 5 batang per
hari, maka memiliki probabilitas untuk terkena MI
sebesar 64%.
Interaksi

Asumsi adanya Interaksi
1. Logika substantif / biologik
2. Interaksi antara variabel a dan b, terjadi bila
efek a terhadap Y tergantung nilai b, atau efek b
terhadap Y tergantung nilai a.

Anda mungkin juga menyukai