Anda di halaman 1dari 16

21/12/2021

ANALISIS
REGRESI LOGISTIK BERGANDA
Multiple Regression Logistic

KAPAN DIGUNAKAN
 TUJUAN PENELITIAN
 UNTUK MELIHAT PENGARUH SEJUMLAH VARIABEL
BEBAS TERHADAP VARIABEL TERIKAT
 UNTUK MEMPREDIKSI PELUANG TERJADINYA
SUATUA KEJADIAN BERDASARKAN MODEL
PERSAMAAN YANG SESUAI,

DATA VARIABEL Y HARUS BERUPA KATEGORIK, JIKA


KATEGORIK TERDIRI DARI DUA KATEGORI
DINAMAKAN BINER, LEBIH DUA KATEGORI
NAMANYA MULTINOMIAL

1
21/12/2021

Pengertian Regresi Logistik:


 Suatu model matematik yang digunakan untuk mempelajari
hubungan satu atau beberapa variabel independen dengan
satu variabel dependen yang bersifat dikotomi (binary).
Variabel bianry : adalah variabel yang hanya memiliki dua
nilai, misalnya (sakit / sehat), (merokok/ tdk merokok),
(BBLR/ normal) dll
 Variabel Independen (prediktor) sebaiknya kategorik, agar
mudah untuk menginterpretasikan hasil analisisnya.
 Bila variabel prediktor 3 kategori atau lebih, maka dibuat dua
kategori. Caranya ; dummy variabel, kategori ulang sesuai
logika biologik.

Pengertian Regresi Logistik ............................

 Analisis regresi ganda logistik adalah alat statistik yang sangat


kuat untuk menganalisis hubungan antara paparan dan
penyakit dengan serentak mengontrol pengaruh sejumlah
faktor perancu potensial.
 Tujuan analisis regresi ganda logistik yaitu menemukan model
regresi yang paling sesuai, paling irit, sekaligus masuk akal
secara biologik, untuk menggambarkan hubungan antara
variabel dependen dan satu set variabel prediktor dalam
populasi.
 Manfaat analisis regresi ganda : (a) Meramalkan terjadinya
variabel dependen pada individu berdasarkan nilai-nilai
sejumlah variabel prediktor yang ada pada individu tersebut.

2
21/12/2021

Pengertian Regresi Logistik ............................

 Manfaat : (b) Mengukur hubungan antara veriabel respon dan


prediktor, setelah mengontrol pengaruh prediktor (kovariat)
lainnya.

Keistimewaan
Regresi Logistik Ganda

(a) Kemampuan kengkonversi koefisien regresi (bi) menjadi


rasio odds (OR).  OR = exp [bi]
(b) Kemampuan menaksir probabilitas individu untuk sakit
(mengalami event) berdasarkan nilai-nilai sejumlah variabel
prediktor, dengan rumus sebagai berikut :

3
21/12/2021

Macam Regresi logistik :

1. Regresi logistik sederhana


Untuk mempelajari hubungan antara satu variabel
prediktor dengan satu variabel dependen dikotomus.
2. Regresi logistik ganda (Multiple Regression Logistic)
Untuk mempelajari hubungan antara beberapa variabel
prediktor dengan satu varibel dependen dikotomus.

Model Regresi Ganda Logistik

Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds.


Odds : rasio probabilitas suatu peristiwa
untuk terjadi dan probabilitas suatu peristiwa
untuk tidak terjadi
a = Konstanta ( intersep)
b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope)
X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan
diteliti.
p = probabilitas untuk terjadinya “peristiwa” dari
variabel dependen yg dikotomus.

4
21/12/2021

 Pembangunan model regresi ganda logistik hendaknya tidak


terjebak oleh penggunaan veriabel prediktor yang terlalu
banyak.
 Pemilihan variabel sebaiknya dilakukan dengan cara-cara yang
lebih purposif, dan tidak terpaku pada pendekatan yang
sifatnya deterministik menurut kamaknaan statistik.

 Makin banyak variabel yang dimasukkan dalam model hanya


akan meningfkatkan kesesuaian garis regresi dengan
hubungan antara variabel dependen dan sejumpan variabel
prediktor pada data sampel, tetapi belum tentu
menggambarkan hubungan tersebut pada tingkat populasi.
 Hal itu disebabkan karena, bertambahnya variabel prediktor
(baik yang relevan maupun tidak relevan) hanya akan
menaikkan nilai taksiran kesalahan baku, sehingga membuat
model tersebut sangat tegantung kepada data pengamatan
sampel.
 Kesimpulannya, model tersebut tidak merefleksikan /
meggambarkan hubungan variabel respon dan variabel-
variabel prediktor dalam populasi yang sesungguhnya.

5
21/12/2021

PROSEDUR PEMILIHAN VARIABEL

Agar diperoleh model regresi yang baik adalah


sebagai berikut :

1. Melakukan analisis univariate untuk menyaring


variabel-variabel yang penting.
2. Memasukkan dan/ atau mengeluarkan variabel-
variabel dalam model multivariate
3. Memasukkan dan memeriksa kemungkinan ada
interaksi variabel dalam model.

Melakukan analisis univariate


untuk penyaringan awal :
 Uji statistik yang dipakai adalah : chi-quadrat
 Jika ada variabel prediktor lebih dari dua kategori,

maka dibuat menjadi dua kategori terlebih dahulu.


Perlu diingat bahwa dalam melakukan recode harus
mempunyai alasan biologik.
 Mickey dan Greenland : variabel variabel yang

mempunyai nilai p= 0,25 dan memiliki kemaknaan


biologik hendaknya dipertimbangkan untuk
dimasukkan ke dalam model multivariate.

6
21/12/2021

Univariate ........

 Batasan P= 0,25, untuk mengantisipasi kemungkinan variabel


yang secara terselubung sesungguhnya penting untuk
dimasukkan dalam model. “Terselubung
“Terselubung”” kemungkinan
variabel variabel secara kolektif dapat menjadi prediktor
penting, walaupun secara sendiri sendiri merupakan
prediktor lemah.

Memasukkan / mengeluarkan variabel


dalam model regresi :

Beberapa Metode :
1. Enter
2. Stepwise
3. Forward
4. Backward

Conditional, LR (likelihood ratio), Wald

7
21/12/2021

Memeriksa Kemungkinan Interaksi


 Jika dengan uji interaksi menunjukkan kemaknaan statistik,
maka kita katakan interaksi memberikan kontribusi penting
kepada model. Jika suatu interaksi hanya memperbesar
taksiran kesalahan baku (S.E.) dan tidak mengubah taksiran
koefisiens regresi (b1), maka interaksi tersebut mungkin tidak
penting.

Latihan

Sebuah studi Kohor prospektif, meneliti pengaruh aktifitas fisik


(AF) terhadap kejadian infark otot jantung (MI). Variabel lain
yang diukur adalah umur dalam kategori (AGRP) dan
kebiasaan merokok.

8
21/12/2021

Kategorisasi nilai variabel


MI = 1 : sakit 0 : tidak sakit
AF = 1 : aktifitas fisik >= 2500 kcal/ hari
0 : aktifitas fisik < 2500 kcal/hari

AGRP = 1 : umur >= 55 tahun


0 : umur < 55 tahun

Kebiasaan merokok = 2 : merokok >= 15 btg / hari


1 : merokok < 15 btg /hari
0 : tidak merokok

Varabel rancangan
Kebiasaan merokok
- Jumlah variabel yang dibutuhkan ( k-1)  3-1 : 2
- Sebagai contoh MRK menjadi D1 dan D2
- Sebagai salah satu rancangan pengkodean variabel tersebut,
maka variabel bukan perokok sebagai variabel acuan
(refference)  dengan kode D1=0 D2=0
- Selanjutnya merokok <15 btg / hari D1=1 D2=0
- Dan merokok >= 15 btg/hari D1=0 D2=1

9
21/12/2021

Sehingga menjadi :

Variabel asli Variabel rancangan

MRK D1 D2

Tidak merokok 0 0
Merokok < 15 btg / hari 1 0
Merokok >= 15 btg / hari 0 1

File download :
http://www.ziddu.com/download/8461706/RegresiLogistik.rar.html

Cek kelayakan variabel untuk dimasukkan dalam model :

Menggunakan chi-square

Kriteria variabel yang masuk p=0,25

10
21/12/2021

Hasil analisis univariate... ?


AF p=0,000
AGRP p=0,000
D1 p=0,000
D2 p=0,052

Hasil Regresi Logistik

95,0% C.I.for
EXP(B)

B S.E. Wald df Sig. Exp(B) Lower Upper


Step AF
-2,243 1,019 4,846 1 ,028 ,106 ,014 ,782
1(a)
AGRP
2,013 ,977 4,242 1 ,039 7,487 1,102 50,848
D1
2,478 1,084 5,225 1 ,022 11,920 1,424 99,793
D2
2,673 1,316 4,130 1 ,042 14,490 1,100 190,922
Constant
-1,915 ,995 3,699 1 ,054 ,147

11
21/12/2021

Persamaan yg di dapat :
1
P= _________________________________________
- [a + b1 (AF)+b2(AGRP)+b3(D1)+b4(D2)
1 +e

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
AF -2,243 1,019 4,846 1 ,028 ,106
1 AGRP 2,013 ,977 4,242 1 ,039 7,487
D1 2,478 1,084 5,225 1 ,022 11,920
D2 2,673 1,316 4,130 1 ,042 14,490
Constant -1,915 ,995 3,699 1 ,054 ,147
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.

Meramalkan Probabilitas Individu untuk mengalami sakit

Berdasarkan persamaan tersebut diatas, berapa probabilitas


untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari

12
21/12/2021

Perhitungan :
Variables in the Equation

B S.E. Wald df Sig. Exp(B)


Step
a
AF -2,243 1,019 4,846 1 ,028 ,106
1 AGRP 2,013 ,977 4,242 1 ,039 7,487
D1 2,478 1,084 5,225 1 ,022 11,920
D2 2,673 1,316 4,130 1 ,042 14,490
Constant -1,915 ,995 3,699 1 ,054 ,147
a. Variable(s) entered on step 1: AF, AGRP, D1, D2.

1
P= _________________________________________
- [-1,9146 – 2,2431(AF) + 2,0131 (AGRP) + 2,4782(D1) + 2,6734(D2)]
1 +e

Berdasarkan persamaan tersebut diatas, berapa probabilitas


untuk mengalami sakit pada individu dengan kriteria sebagai
berikut ?
1) Melakukan aktifitas fisik 2.000 kcal / hari
2) Berumur 35 tahun
3) Merokok rata-rata 5 btg / hari

AF = 0 tidak berisiko
Umur = 0 tidak berisikok
Merokok < 15 batang  D1 = 1 D2=0

1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e

13
21/12/2021

Perhitungan :
1
P= _________________________________________
- [-1,9146 – 2,2431(0) + 2,0131 (0) + 2,4782(1) + 2,6734(0)]
1 +e

= 0,64  64%

In mathematics, the exponential function is the function ex, where e is the number
(approximately 2.718281828)

Interpretasi :
Individu yang berumur 35 tahun dan hanya melakukan aktifitas
fisik sebesar 2.000 kcal / hari, serta membunyai kebiasaan
merokok 5 batang per hari, maka memiliki probabilitas untuk
terkena MI sebesar 64%.

14
21/12/2021

Interaksi

Asumsi adanya Interaksi


1. Logika substantif / biologik
2. Interaksi antara variabel a dan b, terjadi bila efek a terhadap
Y tergantung nilai b, atau efek b terhadap Y tergantung nilai
a.

15
21/12/2021

16

Anda mungkin juga menyukai