Anda di halaman 1dari 28

UJI REGRESI LOGISTIK

Oleh :
Mohammad Abdullah

Batasan Regresi Logistik


Merupakan uji statistik yg digunakan
untuk prediksi probabilitas kejadian
suatu peristiwa dg mencocokkan
data pd fungsi logit kurva logistik
Digunakan pd variabel yg hanya
memiliki 2 kategori (variabel
dikhotom)

Batasan Uji Regresi Logistik


Digunakan bila variabel terikat (dependen)
merupakan variabel dikhotom (berskala
nominal), sedangkan variabel independen
bisa nominal, ordinal, interval atau ratio.
Uji ini tidak mengasumsikan adanya
hubungan linear antara variabel-variabel
independen dan variabel dependen
Regresi logistik merupakan regresi non
linear dengan model sebagai berikut :

Batasan (lanjutan)
Regresi logistik menghasilkan rasio peluang (odds
ratio) antara keberhasilan atau kegagalan dari sesuatu
dalam analisis.
Contoh: seberapa besar peluang seseorang menang
dalam sebuah pemilu Kepala Daerah.
Asumsi-asumsi dalam Regresi Logistik:
1. tdk mengasumsikan hubungan linear antara variabel dependen dan
independen
2. Variabel dependen harus bersifat dikotomi (2 atribut)
3. Variabel independent tidak harus memiliki keragaman yang sama antar
kelompok variabel
4. Kategori dalam variabel independent harus terpisah satu sama lain atau
bersifat eksklusif
5. Sampel yang diperlukan dalam jumlah relatif besar, minimum
dibutuhkan
hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

Batasan (lanjutan)
Model Regresi Logistik :
Log (P / 1 p) = 0 + 1X1 + 2X2 +
. + kXk
Keterangan :
Dimana p adalah kemungkinan bahwa Y = 1, dan
X1, X2, X3 adalah variabel independen, dan b
adalah koefisien regresi.
ATAU

Metode Enter
Bila seluruh variabel bebas yang bermakna
maupun yg tidak bermakna dimasukkan ke
dalam model persamaan regresi

Metode Eliminasi Backward


Memasukkan seluruh variabel bebas ke
dalam model persamaan dan
mengeliminasi variabel bebas yg tdk
bermakna dari model persamaan secara
bertahap satu per satu

Metoda Addisi Forward


Memasukkan satu variabel bebas yang bermakna yg
mempunyai kontribusi dalam prediksi, kemudian
secara bertahap satu per satu variabel bebas yang
bermakna masuk dalam model persamaan.
Metoda Estimasi Stepwise
Metoda ini mirip dengan addisi forward.
Seleksi dari memasukkan variabel ke dalam model
persamaan regresi dimulai dari variabel bebas
(prediktor) terbaik (yang paling bermakna).
Variabel prediktor yg telah masuk bila dikeluarkan
kembali bila dalam model selanjutnya menjadi tdk
bermakna lagi.

Analisa Regresi Logistik


dengan Software Statistik

Contoh kasus
Akan dilakukan analisa pengaruh dari paritas, status
anemia dan status KEK serta frekuensi ANC pada
ibu hamil terhadap terjadinya BBLR pada bayi
yang dilahirkan.
Status BBLR (var. dependen) : 1 = tdk BBLR 0
=BBLR
Status anemia : 2 = tidak anemia; 1 = anemia
Status KEK : 2 = tidak KEK; 1 = KEK
Paritas : 2 =Paritas rendah 1 = paritas
tinggi
Frekuensi ANC : sesuai berapa kali berkunjung
(ratio)

Langkah-langkah
1. Klik : anlyze, -- regression -- binary logistic
2. Masukkan variabel-variabelnya

3. Klik categorical : untuk memilih variabel independen yg


berskala nominal (kategorikal)

3. Klik : continue
4. Pilih menu option, kemudian centang iteration history

5. Kemudian klik continue


6. Klik Ok, maka akan keluar output
hasil analisa regresi logistik

Interpretasi Hasil
1.

Identifikasi data yang hilang (missing data)


Case Processing Summary
a

Unweighted Cases
Selected Cases

Unselected Cases
Total

N
Included in Analysis
Missing Cases
Total

31
0
31
0
31

Percent
100.0
.0
100.0
.0
100.0

a. If weight is in effect, see classification table for the total


number of cases.

Hasil ini hanya untuk menjelaskan tentang ringkasan


proses. Pada hasil tampak tidak ada data yang hilang
(missing cases = 0) dengan total sampel sebesar 31.

2. Pemberian kode variabel dependen oleh SPSS


De pe nde nt Varia ble Encoding
Original Value
BBLR
tidak BBLR

Internal Value
0
1

Pada variabel dependen (status BLR), BBLR diberikan kode 0, dan


tidak BBLR diberi kode 1. Yang dianggap sebagai output adalah
tidak BBLR (kode 1)

3. Pemberian kode pada variabel independen


Categorical Variables Codings
(covariate) yang kategorikal
Paramete
status anemia
status kurang
energi kronis
kategori
paritas

anemia
tidak anemia
KEK
tidak KEK
paritas tinggi
paritas rendah

Frequency
10
21
9
22
8
23

r coding
(1)
1.000
.000
1.000
.000
1.000
.000

Pada penelitian ini digunakan 3 covariate yang berskala


kategorikal, yaitu status anemia, status kurang energi kronis
dan kategori paritas. Status anemia, KEK dan paritas tinggi
masing-masing dikode 1 sebagai pembanding

4. Uji signifikansi model


Omnibus Tests of Model Coefficients
Step 1 Step
Block
Model

Chi-square
21.447
21.447
21.447

df
4
4
4

Sig.
.000
.000
.000

Untuk ini dipakai tabel Omnibus tests of model


coefficients untuk menguji signifikansi model
pengaruh dari seluruh variabel independen secara
bersama-sama terhadap variabel dependen.
Karena nilai sig. model sebesar 0,000 ( < 0,05) maka
berarti H0 ditolak, sehingga model adalah signifikans.
Disimpulkan: bahwa variabel-variabel independen
(bebas) yang digunakan bersama-sama berpengaruh
terhadap kejadian BBLR atau minimal ada 1 variabel
yang berpengaruh

5. Persentase ketepatan klasifikasi


Classification Tablea
Predicted

Observed
Step 1 status BBLR
Overall Percentage

BBLR
tidak BBLR

status BBLR
BBLR
tidak BBLR
8
3
1
19

Percentage
Correct
72.7
95.0
87.1

a. The cut value is .500

Pada tabel tampak : ketepatan model dalam


mengklasifikasi observasi adalah sebesar 87,1%.
Diantara 31 observasi, terdapat 27 observasi
yang tepat pengklasifikasiannya oleh model
regresi logistik

6. Kontribusi Variabel Independen


terhadap variasi
pada variabel Dependen
Model Summary
Step
1

-2 Log
Cox & Snell
likelihood
R Square
a
18.877
.499

Nagelkerke
R Square
.686

a. Estimation terminated at iteration number 6 because


parameter estimates changed by less than .001.

Negelkerke R square sebesar 0,686 maka sebanyak


68,6% variasi pada variabel BBLR dapat dijelaskan
oleh variabel-variabel independen yang digunakan,
yaitu paritas, status anemia, status KEK dan
frekuensi ANC sedangkan yang 31,4% dipengaruhi
oleh faktor lain.

7. Uji Parsial dan Pembentukan Model


Variables in the Equation
Step
a
1

paritas_2(1)
kek(1)
anemia(1)
ANC
Constant

B
.728
-3.609
-1.496
-.850
5.690

S.E.
1.576
1.668
1.353
.758
3.139

Wald
.213
4.684
1.223
1.258
3.287

df
1
1
1
1
1

Sig.
.644
.030
.269
.262
.070

Exp(B)
2.071
.027
.224
.427
295.911

a. Variable(s) entered on step 1: paritas_2, kek, anemia, ANC.

Pada kolom sig, hanya variabel KEK yang


signifikans mempengaruhi BBLR karena
memiliki nilai sig 0,03 (<0,05).
Dengan demikian, model regresi yang dapat
dibentuk adalah
-3,609
3,609
-3,609
3,609

8. Interpretasi Odds ratio


Jika paritas tinggi bertambah 1, maka kemungkinan
untuk menghasilkan anak tidak BBLR adalah sebesar 2
kali lipat (2,071)
jika KEK bertambah 1, maka kemungkinan untuk
menghasilkan anak tidak BBLR adalah sebesar 2,7/100
kali (sekitar 1/37 kali lipat) atau dengan kata lain, bila
KEK bertambah 1, maka kemungkingan anak BBLR
adalah 37 kali lipatnya.
Jika anemia bertambah 1, maka kemungkinan untuk
menghasilkan anak tidak BBLR adalah sebesar
22,7/100 kali lipat (sekitar kali), atau dengan kata
lain, jika anemia bertambah 1, maka kemungkinan
anak BBLR adalah 4 kali lipat
Bila ANC bertambah 1, maka kemungkinan untuk
menghasilkan anak tidak BBLR adalah sebesar 2,3 kali
lipat (42,7/100)

Terima Kasih

Beberapa Uji Asumsi


1. i berdistribusi normal dan merupakan
variabel random dengan (i) = 0
merupakan error term (residu), yg merupakan
metode efektif dan sederhana utk mendeteksi
defisiensi model pada analisis regresi.

Nilai i = Yi -

Nilai standardized residual :


Bila model ini benar, maka standardized
residual diantara 2 dan -2 yang tersebar secara
acak. Atau merupakan variabel random dg
(i) = 0

2. Homoskedasitas
2 adalah konstan. Variasi y adalah sama
untuk sembarang kombinasi yang tetap
dari X1, X2, .... Xp.
Cara melakukan uji ini adalah melakukan
analisis korelasi Spearman antara nilai
residu dengan masing-masing variabel
independen. Jika tidak didapatkan
korelasi yang signifikan, maka dikatakan
tidak terjadi heterokedastisitas (telah
tercapai Homoskedastisitas)

3. Tidak ada Otokorelasi


Salah satu asumsi baku dari model regresi adalah
error term atau galat i dan j yang berkaitan dg
pengamatan ke i dan ke j adalah tidak berhubungan
(uncorrelated). Apabila ada hubungan artinya ada
otokorelasi berarti:
a. Taksiran kuadrat terkecil tidak sesat (unbiased)
akan tetapi tidak efisien dlm arti taksiran ini tidak
mempunyai varians minimum lagi.
b. Taksiran dari 2 dan SE (b0) serta SE (b1) bisa
lebih rendah dari kenyataannya sehingga memberi
kesan bahwa ketelitian (accuracy) adalah palsu
c. Interval kepercayaan dan uji kemaknaan akan
menjadi tidak sahih (valid) lagi.

Ada tidaknya otokorelasi dapat diuji


dengan statistik Durbin Watson (d).

Nilai d dibandingkan dengan titik kritis


bawah (dL) dan titik kritis atas (du) sesuai
dengan N (besar sampel) dan k (banyaknya
parameter termasuk 0.
Jika hipotesis H0 : tidak ada otokorelasi
(+), maka:
d<dL : menolak H0: artinya ada otokorelasi (+)
d>dL : menerima H0 : artinya tidak ada

Jika hipotesis H0 : tidak ada otokorelasi


(-), maka:
d>4-dL : menolak H0: artinya ada otokorelasi (-)
d<4-du : menerima H0 : artinya tidak ada otokorelasi
(-)
du d dL : tidak dapat disimpulkan

Jika hipotesis H0 dua ekor: tidak ada


otokorelasi (+) atau (-), maka:
d<dL : menolak H0: artinya ada otokorelasi
d>4-dL : menolak H0 : artinya ada otokorelasi
du d 4-du : menerima H0: artinya tidak ada
otokorelasi
du d dL atau 4-du d 4-dL tidak dapat disimpulkan

4. Tidak ada multikolinearitas


Artinya tidak ada hubungan linear yang eksak
antar variabel bebas.
Cara melihat multikoliearitas adalah dengan
melihat korelasi antar variabel bebas. Bila
terdapat korelasi antar beberapa variabel
bebas berarti ada multikolinearitas.
Cara lain utk melihat multikoliearitas adalah dg
melihat Collinarity diagnostics. Dikatakan
ada multikolinearitas bila nilai Eigenvalue
mendekati 0 dan Condition Index > 15 (bisa
dilihat dengan software SPSS).

5. Linearitas
Untuk mendeteksi linearitas, dapat
dibuat scatter plot (diagram titik)
masing-masing variabel bebas dg
variabel tergantung. Bila scatter plot
berpencar (tidak mengikuti garis
lurus) maka berarti tdk ada
hubungan linear.
Cara lain untuk mendeteksi adalah
dg melihat plot nilai residu dengan
variabel prediktor. Bila titik-titik plot
tersebar di sekitar nilai 0 dikatakan

6. Y berdistribusi normal utk setiap nilai X.

Metoda Seleksi Variabel pada


Persamaan Regresi:
1. Metode Enter
2. Metode Eliminasi Backward
3. Addisi Forward
4. Estimasi Stepwise

Anda mungkin juga menyukai