Anda di halaman 1dari 7

ANALISIS

REGRESI GANDA LOGISTIK

Pengertian Regresi Logistik

 Suatu model matematik yang digunakan untuk mempelajari hubungan satu atau beberapa
variabel independen dengan satu variabel dependen yang bersifat dikotomi (binary). Variabel
bianry : adalah variabel yang hanya memiliki dua nilai, misalnya (sakit / sehat), (merokok/ tdk
merokok), (BBLR/ normal) dll

 Variabel Independen (prediktor) sebaiknya kategorik, agar mudah untuk menginterpretasikan


hasil analisisnya.

 Bila variabel prediktor 3 kategori atau lebih, maka dibuat dua kategori. Caranya ; dummy
variabel, kategori ulang sesuai logika biologik.

 Analisis regresi ganda logistik adalah alat statistik yang sangat kuat untuk menganalisis hubungan
antara paparan dan penyakit dengan serentak mengontrol pengaruh sejumlah faktor perancu
potensial.

 Tujuan analisis regresi ganda logistik yaitu menemukan model regresi yang paling sesuai, paling
irit, sekaligus masuk akal secara biologik, untuk menggambarkan hubungan antara variabel
dependen dan satu set variabel prediktor dalam populasi.

 Manfaat analisis regresi ganda : (a) Meramalkan terjadinya variabel dependen pada individu
berdasarkan nilai-nilai sejumlah variabel prediktor yang ada pada individu tersebut.

 Manfaat : (b) Mengukur hubungan antara veriabel respon dan prediktor, setelah mengontrol
pengaruh prediktor (kovariat) lainnya.

Keistimewaan
Regresi Logistik Ganda

(a) Kemampuan kengkonversi koefisien regresi (bi) menjadi rasio odds (OR). à OR = exp [bi]

(b) Kemampuan menaksir probabilitas individu untuk sakit (mengalami event) berdasarkan nilai-nilai
sejumlah variabel prediktor, dengan rumus sebagai berikut :
Macam Regresi logistik :

1. Regresi logistik sederhana

Untuk mempelajari hubungan antara satu variabel prediktor dengan satu variabel dependen
dikotomus.

2. Regresi logistik ganda (Multiple Regression Logistic)

Untuk mempelajari hubungan antara beberapa variabel prediktor dengan satu varibel
dependen dikotomus.

Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds.

Odds : rasio probabilitas suatu peristiwa untuk terjadi dan probabilitas suatu peristiwa untuk tidak
terjadi

a = Konstanta ( intersep)

b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope)

X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan diteliti.

p = probabilitas untuk terjadinya “peristiwa” dari variabel dependen yg dikotomus

Membangun Model Regresi Ganda Logistik

 Pembangunan model regresi ganda logistik hendaknya tidak terjebak oleh penggunaan veriabel
prediktor yang terlalu banyak.

 Pemilihan variabel sebaiknya dilakukan dengan cara-cara yang lebih purposif, dan tidak terpaku
pada pendekatan yang sifatnya deterministik menurut kamaknaan statistik.

 Makin banyak variabel yang dimasukkan dalam model hanya akan meningfkatkan kesesuaian
garis regresi dengan hubungan antara variabel dependen dan sejumpan variabel prediktor pada
data sampel, tetapi belum tentu menggambarkan hubungan tersebut pada tingkat populasi.

 Hal itu disebabkan karena, bertambahnya variabel prediktor (baik yang relevan maupun tidak
relevan) hanya akan menaikkan nilai taksiran kesalahan baku, sehingga membuat model tersebut
sangat tegantung kepada data pengamatan sampel.
 Kesimpulannya, model tersebut tidak merefleksikan / meggambarkan hubungan variabel respon
dan variabel-variabel prediktor dalam populasi yang sesungguhnya.

PROSEDUR PEMILIHAN VARIABEL

Agar diperoleh model regresi yang baik adalah sebagai berikut :

1. Melakukan analisis univariate untuk menyaring variabel-variabel yang penting.

2. Memasukkan dan/ atau mengeluarkan variabel- variabel dalam model multivariate

3. Memasukkan dan memeriksa kemungkinan ada interaksi variabel dalam model.

Melakukan analisis univariate untuk penyaringan awal :

Uji statistik yang dipakai adalah : chi-quadrat

Jika ada variabel prediktor lebih dari dua kategori, maka dibuat menjadi dua kategori terlebih
dahulu. Perlu diingat bahwa dalam melakukan recode harus mempunyai alasan biologik.

Mickey dan Greenland : variabel variabel yang mempunyai nilai p= 0,25 dan memiliki kemaknaan
biologik hendaknya dipertimbangkan untuk dimasukkan ke dalam model multivariate.

 Batasan P= 0,25, untuk mengantisipasi kemungkinan variabel yang secara terselubung


sesungguhnya penting untuk dimasukkan dalam model. “Terselubung” kemungkinan variabel
variabel secara kolektif dapat menjadi prediktor penting, walaupun secara sendiri sendiri
merupakan prediktor lemah.

Memasukkan / mengeluarkan variabel dalam model regresi :

Beberapa Metode :

1. Enter

2. Stepwise

3. Forward

4. Backward

Conditional, LR (likelihood ratio), Wald

Memeriksa Kemungkinan Interaksi


 Jika dengan uji interaksi menunjukkan kemaknaan statistik, maka kita katakan interaksi
memberikan kontribusi penting kepada model. Jika suatu interaksi hanya memperbesar taksiran
kesalahan baku (S.E.) dan tidak mengubah taksiran koefisiens regresi (b 1), maka interaksi
tersebut mungkin tidak penting.

 Sebuah studi Kohor prospektif, meneliti pengaruh aktifitas fisik (AF) terhadap kejadian infark otot
jantung (MI). Variabel lain yang diukur adalah umur dalam kategori (AGRP) dan kebiasaan
merokok

Kategorisasi nilai variabel

MI = 1 : sakit 0 : tidak sakit

AF = 1 : aktifitas fisik >= 2500 kcal/ hari

0 : aktifitas fisik < 2500 kcal/hari

AGRP = 1 : umur >= 55 tahun

0 : umur < 55 tahun

Kebiasaan merokok = 2 : merokok >= 15 btg / hari

1 : merokok < 15 btg /hari

0 : tidak merokok

Varabel rancangan

Kebiasaan merokok

- Jumlah variabel yang dibutuhkan ( k-1) à 3-1 : 2

- Sebagai contoh MRK menjadi D1 dan D2

- Sebagai salah satu rancangan pengkodean variabel tersebut, maka variabel bukan perokok
sebagai variabel acuan (refference) à dengan kode D1=0 D2=0

- Selanjutnya merokok <15 btg / hari D1=1 D2=0

- Dan merokok >= 15 btg/hari D1=0 D2=1

Sehingga menjadi
- Variabel asli Variabel rancangan

- MRK D1 D2

- Tidak merokok 0 0

- Merokok < 15 btg / hari 1 0

- Merokok >= 15 btg / hari 0 1

Cek kelayakan variabel untuk dimasukkan dalam model

Menggunakan chi-square

Kriteria variabel yang masuk p=0,25

Hasil analisis univariate... ?

AF p=0,000

AGRP p=0,000

D1 p=0,000

D2 p=0,052

Hasil Regresi Logistik

95,0% C.I.for EXP(B)

B S.E. Wald df Sig. Exp(B) Lower Upper


Step 1(a) AF -2,243 1,019 4,846 1 ,028 ,106 ,014 ,782
AGRP 2,013 ,977 4,242 1 ,039 7,487 1,102 50,848
D1 2,478 1,084 5,225 1 ,022 11,920 1,424 99,793
D2 2,673 1,316 4,130 1 ,042 14,490 1,100 190,922

-1,915 ,995 3,699 1 ,054 ,147


Constant

Persamaan yg di dapat
1
P= _________________________________________
- [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2)
1 +e

Berdasarkan persamaan tersebut diatas, berapa probabilitas untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari

2) Berumur 35 tahun

3) Merokok rata-rata 5 btg / hari

Perhitungan

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
AF -2,243 1,019 4,846 1 ,028 ,106
1 AGRP 2,013 ,977 4,242 1 ,039 7,487
D1 2,478 1,084 5,225 1 ,022 11,920
D2 2,673 1,316 4,130 1 ,042 14,490
Constant -1,915 ,995 3,699 1 ,054 ,147
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.

1
P = _________________________________________
- [-1,9146 – 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) + 2,6734(D2)]
1 +e

Berdasarkan persamaan tersebut diatas, berapa probabilitas untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?

1) Melakukan aktifitas fisik 2.000 kcal / hari

Berumur 35 tahun

Merokok rata-rata 5 btg / hari

AF = 0 tidak berisiko

Umur = 0 tidak berisikok

Merokok < 15 batang à D1 = 1 D2=0

1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e

1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e

= 0,64 à 64%

Interpretasi hasil uji regresi logistic

Individu yang berumur 35 tahun dan hanya melakukan aktifitas fisik sebesar 2.000 kcal / hari, serta
membunyai kebiasaan merokok 5 batang per hari, maka memiliki probabilitas untuk terkena MI sebesar
64%.

Anda mungkin juga menyukai