0% menganggap dokumen ini bermanfaat (0 suara)
592 tayangan35 halaman

Regresi Logistik Modul

Modul ini membahas regresi logistik dan aplikasinya. Terdapat penjelasan singkat tentang model regresi logistik, isu desain studi, dan strategi pemodelan regresi logistik untuk prediksi dan estimasi.

Diunggah oleh

Febri Ani
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd
0% menganggap dokumen ini bermanfaat (0 suara)
592 tayangan35 halaman

Regresi Logistik Modul

Modul ini membahas regresi logistik dan aplikasinya. Terdapat penjelasan singkat tentang model regresi logistik, isu desain studi, dan strategi pemodelan regresi logistik untuk prediksi dan estimasi.

Diunggah oleh

Febri Ani
Hak Cipta
© © All Rights Reserved
Kami menangani hak cipta konten dengan serius. Jika Anda merasa konten ini milik Anda, ajukan klaim di sini.
Format Tersedia
Unduh sebagai DOCX, PDF, TXT atau baca online di Scribd

MODUL MATA KULIAH

ANALISIS MULTIVARIAT
APLIKASI REGRESI LOGISTIK

Oleh

Prof. Dr. dr. RIZANDA MACHMUD, M.Kes

PROGRAM STUDI S3 KEDOKTERAN


PROGRAM PASCASARJANA UNIVERSITAS ANDALAS
KERJASAMA UNIVERSITAS RIAU

DAFTAR ISI
DAFTAR ISI.............................................................................................................2
I.

PENGANTAR REGRESI LOGISTIK...............................................................3

II.

MODEL REGRESI LOGISTIK.........................................................................4

III.

STUDY DESIGN ISSUE..............................................................................5

IV.

STRATEGI PEMODELAN REGRESI LOGISTIK........................................6

1.

MODEL PREDIKSI...................................................................................7

2.

MODEL ESTIMASI.................................................................................23

DAFTAR PUSTAKA..............................................................................................35

I.

PENGANTAR REGRESI LOGISTIK

Analisis regresi logistik adalah suatu pendekatan model matematis yang


dapat digunakan untuk menggambarkan hubungan antara banyak variabel
independen dengan variabel dependen yang bersifat dikotomus.

Variabel

independen dapat bertipe apa saja, dan asumsi distribusi variabel adalah bebas
(Kleinbaum, 1996).
Fungsi logistik merupakan fungsi matematik dengan rumus:
1
z
(z) = 1 e

Saat ini modelling prosedur dengan menggunakan regressi logistik paling


populer dibandingkan modelling prosedur lainnya yang digunakan untuk anlisa
epidemioligik

bila

ukuran

penyakit

yang

digunakan

adalah

dikotomus.

Penjelasannya adalah sebagai berikut:


Terlihat pada gambar fungsi logistik terletak pada nilai z antara - dan +.
Pada saat nilai z= - maka (z) =0 dan pada saat z= + maka (z) =1
Jadi nilai (z) akan berkisar antara 0 dan1. Sehingga model logistik dapat
digunakan untuk menggambarkan probabilitas yang selalu memiliki nilai antara 0
dan 1. Pada epidemiologi, probabilitas ini dikenal sebagai risiko untuk terjadinya
penyakit.
Alasan lainnya mengapa fungsi logistik ini populer untuk analisis data
epidemiologik adalah bentuk dari kurva logistik. Seperti terlihat pada gambar,
nilai (z) meningkat secara perlahan pada saat z berubah dari - ke arah 0,
kemudian (z) meningkat secara cepat dan kemudian peningkatannya kembali
perlahan pada saat (z) mendekati 1 ketika z meningkat menjadi +. Hasilnya
adalah kurva yang berbentuk S.
Kurva yang berbentuk S ini dianggap cocok untuk menggambarkan
peningkatan risiko terjadinya outcome pada penelitia epidemiologi, jikaz
dianggap sebagai indeks yang menggabungkan efek dari berbagai faktor risiko
dan (z) merupakan risiko pada nilai z tertentu. Bentuk kurva S menunjukkan

efek z pada risiko individu minimal pada nilai z kecil sampai pada satu batas
ambang tertentu dan tetap tinggi saat risiko mendekati 1 dan nilai z cukup besar.
Menurut ahli epidemiologi, konsep ambang batas (threshold) ini dapat
digunakan pada berbagai keadaan penyakit. Jadi bentuk kurva logistik dapat
digunakan secara luas pada analisis multivariabel pada penelitian epidemiologi.

1
z
(z) = 1 e =0

1
z
(z) = 1 e =1

Z
threshold
Range

:0

Individual risk

: 0 probability 1

II.

(z)

MODEL REGRESI LOGISTIK


Model regresi logistik dituliskan dalam bentuk penjumlahan linier yaitu:
Z = +1X1 + 2X2 + +kXk
dimana X1,X2 dan Xk merupakan variabel independen. Jadi z merupakan

indeks yang menggabungkan x. Kemudian nilai z pada fungsi logistik diganti


penjumlahan linier sehingga fungsi logistik dapat dituliskan:

1
( 11 2 2 .... k k )
(z) = 1 e

Dimana f(z) merupakan probabilitas untuk terjadinya suatu keluaran. Pada


penelitian kesehatan, probabilitas ini untuk terjadinya penyakit (1) atau tidak
terjadinya penyakit (0) pada kombinasi variabel independen. Jadi fungsi logistik
dapat dituliskan sebagai berikut:

1
1 e ( 1 1 2 2 ..... k k )

P(D) =

Pada model logistik, dan i merupakan parameter yang tidak diketahui


yang perlu di estimasi dengan menggunakan data yang ada. Estimasi parameter
dilakukan dengan menggunakan metode maximum likelihood dengan fungsi
likelihood:
k

exp

i il

i 1
l 1

n
k

1 exp i il
i 1


L = l 1
n

Estimasi parameter terlalu kompleks untuk dilakukan dengan perhitungan


manual, sehingga perhitungan dilakukan dengan perangkat lunak statistik.
Hasil turunan matematik pada fungsi logistik menunjukkan bahwa ekponen i
adalah OR.
III.

STUDY DESIGN ISSUE

Analisis regresi logistik digunakan pada disain cohort, dan dapat juga pada
disain case control maupun pada cross sectional. Meskipun logistik modelling
dapat digunakan untuk disain case control dan cross sectional, tapi terdapat
keterbatasan analisa untuk disain ini. Pada disain kohort, model logistik dapat
digunakan untuk memprediksi risiko individual, tapi pada disain case control dan
cross sectional kita tidak memprediksi individual risk, hanya bisa memakai hasil
estimasi OR saja.

Tabel penggunaan interpretasi


Interpretasi
P (D)
OR

IV.

cohort
ya
ya

Case control
tidak
ya

Cross sectional
tidak
ya

STRATEGI PEMODELAN REGRESI LOGISTIK

Ada secara tipikal 2 tujuan (goals) dalam mathematical modeling pada regresi
logistik:
1. untuk mendapatkan valid estimasi dari hubungan suatu exposurepenyakit, disebut model Estimasi
2. untuk mendapatkan model prediksi yang dianggap terbaik untuk
memprediksi kejadian variabel dependen (outcome), disebut model
Prediksi
Tergantung dari tujuan peneliti, maka strategi yang digunakan juga berbeda
untuk masing-masing tujuan (different strategies for different goals).
Pada tabel akan dijelaskan lebih lanjut perbedaan kedua model tersebut.
Tabel Perbedaan model prediksi dan model estimasi

Perbedaan

Model Prediksi

Model Estimasi

Kedudukan variabel
pada model

semua variabel dianggap


sama penting, sehingga
dapat dilakukan estimasi
beberapa koefisien sekaligus

diutamakan adalah nilai koefisien


regresi suatu determinan yang ingin
dipelajari, sedangkan variabel lain
dipertimbangkan sebagai kontrol.

Bentuk model

Model yang paling tepat dan


paling
sederhana
(parsimoni)

Modelnya
relatif
lebih
dibandingkan model prediksi

kaya

Hal penting yang harus diperhatikan pada waktu kita melakukan strategi
pemodelan adalah sebagai berikut:

Kita

harus

melakukan

check

untuk

kemungkinan

terjadinya

multicollinearity.

Juga harus diperhatikan Influential observation. Individual data dapat


mempengaruhi koefisien regresi, seperti contoh outlier. Koefisien dapat
berubah bila outlier dikeluarkan dari analisis.

Bila variabel independen memiliki kategori lebih dari 2 kategori, maka


variabel tersebut disebut variabel dummy, pada analisa harus dilakukan
kategorisasi. Akibat bila tidak dilakukan pengkategorian, hubungan antara
variabel dependen dan independen (OR) dianalisakan sebagai numerik
bukan kelompok, ini dapat menimbulkan salah interpretasi. Cara
pengkategorian akan dijelaskan pada contoh latihan.

Identifikasi untuk variabel independen yang kontinu, adalah mengganti


variabel kontinyu dengan variabel yang bersifat kategorikal. Pembagian ini
berdasarkan pembagian kuartil dan kemudian dilakukan plotting koefisien
estimasi dengan titik tengah kuartil. Kalau dianggap tidak linier, maka
dianjurkan untuk dirubah menjadi dikotom atau tetap sebagai variabel
kontinyu kalau hanya bertindak sebagai variabel kontrol.

Untuk variabel yang bersifat kontinyu, diusahakan agar data/nilai variabel


tidak dalam bentuk desimal. Karena OR yang terbentuk, akan
diperhitungkan sesuai kenaikan per desimal tersebut. Dampaknya nilai
OR akan menjadi besar dalam bentuk ratusan atau ribuan.

1.

MODEL PREDIKSI

Ketika tujuannya adalah untuk prediksi, maka bisa menggunakan computer


algorithms, seperti backward elimination atau semua kemungkinan regression,
sesuai dengan paket yang ada dalam komputer.
Langkah-langkah yang dilakukan dalam memprediksi model adalah :

Mencari covariat potensial yang akan dimasukkan kedalam model dengan


cara melakukan screening untuk menseleksi variabel

a. Variabel kategori menggunakan uji crosstab


b. Variabel kontinyu menggunakan uji t
analisis bivariat masing-masing variabel independen dengan variabel
dependen, bila nilai p yang didapat < 0.25 dimasukkan sebagai covariat
potensial. Kriteria ini ditetapkan berdasarkan pengalaman empirik,
penggunaan

nilai

yang

lazim

0.05

seringkali

tidak

berhasil

mengidentifikasikan variabel yang dianggap penting.

Maka terbentuk variabel yang akan masuk kedalam candidat model.


Model ini disebut juga sebagai main effects model.

Melakukan pemilihan variabel dengan memasukkan semua variabel yang


telah terpilih sebagai candidat model.
Pemilihan variabel yang dilakukan dalam memilih variabel dapat dilakukan
dengan 2 cara (tersedia dalam paket komputer), seperti:
a. Pemilihan dengan manual; Enter
b. Pemilihan variabel oleh komputer; Forward, Backward dan
Stepwise
Kesemua cara ini memiliki tujuan yang sama yaitu mendapatkan model
yang parsimoni. Kecenderungan peneliti adalah memilih dengan metode
enter, karena peneliti dapat memilih variabel yang masuk atau
mengeluarkan variabel yang bisa diterangkan secara substantif keilmuan.
Untuk pemilihan variabel dengan komputer, setelah kita masukkan seluruh
candidat

model

maka

akan

keluar

langsung

hasil

model

yang

parsimonimenurut komputer. Untuk selanjutnya akan dibicarakan dengan


cara enter.

Dari model yang lengkap kemudian secara bertahap dihilangkan satu


persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan
nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing
variabel memiliki nilai p yang < 0.05

Dilakukan test interaksi berdasarkan substansi. Dari model yang telah


ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan
pemilihan variabel interaksi seperti langkah diatas.
8

Terbentuk model regresi logistik yang diinginkan

CONTOH PEMODELAN PREDIKSI


Model untuk mengetahui faktor risiko terjadinya penyakit jantung koroner, data
yang digunakan adalah data CHD.
Tujuan penelitian
ingin mengetahui faktor risiko terjadinya penyakit jantung koroner .
Kerangka konsep :

Age
Race
Smoke
High Cholesterol
Hypertension
Diabetes Mellitus
Number of exercise
Weight

Diperiksa

dahulu

apakah

Coronary Heart Disease

terdapat

multikolinieritas

antar

variabel

dependen, dengan melihat nilai r


Correlations

Age

Number of
exercises/week
WEIGHT1

Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N

Number of
exercises/
Age
week
WEIGHT1
1
.236**
.181*
.
.001
.010
200
200
200
.236**
1
.142*
.001
.
.044
200
200
200
.181*
.142*
1
.010
.044
.
200
200
200

**. Correlation is significant at the 0.01 level (2-tailed).


*. Correlation is significant at the 0.05 level (2-tailed).

Nilai r seluruhnya < 0.8 Tidak ada korelasi yang lebih dari 0.8, sehingga
koliniearitas bukan masalah serius
Mencari covariat potensial yang akan dimasukkan kedalam model dengan
cara melakukan screening untuk menseleksi variabel
a. Variabel kategori menggunakan uji crosstab yaitu : race, smoke
high cholesterol

SCREENING CANDIDAT MODEL

race

Variabel kategori
Chi-Square Tests

Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear
Association
N of Valid Cases

Value
5.593a
5.529

2
2

Asymp. Sig.
(2-sided)
.061
.063

.095

df

2.790
200

a. 0 cells (.0%) have expected count less than 5. The


minimum expected count is 9.75.

smoking
Chi-Square Tests

Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

Value
6.569b
5.806
6.520
6.536

df
1
1
1
1

Asymp. Sig.
(2-sided)
.010
.016
.011

Exact Sig.
(2-sided)

Exact Sig.
(1-sided)

.014

.008

.011

200

a. Computed only for a 2x2 table


b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
26.65.

10

high cholesterol
Chi-Square Tests

Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

Value
15.629b
14.043
14.637

Asymp. Sig.
(2-sided)
.000
.000
.000

df
1
1
1

15.551

Exact Sig.
(2-sided)

Exact Sig.
(1-sided)

.000

.000

.000

200

a. Computed only for a 2x2 table


b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
10.40.

hypertension
Chi-Square Tests

Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

Value
3.884b
2.732
3.600

df
1
1
1

3.864

Asymp. Sig.
(2-sided)
.049
.098
.058

Exact Sig.
(2-sided)

Exact Sig.
(1-sided)

.060

.053

.049

200

a. Computed only for a 2x2 table


b. 1 cells (25.0%) have expected count less than 5. The minimum expected count is
3.90.

diabetes melitus
Chi-Square Tests

Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

Value
2.681b
2.041
2.570
2.667

df
1
1
1
1

Asymp. Sig.
(2-sided)
.102
.153
.109

Exact Sig.
(2-sided)

Exact Sig.
(1-sided)

.143

.078

.102

200

a. Computed only for a 2x2 table


b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
10.07.

11

Tabel hasil uji bivariat variabel independen kategori dengan


CHD
Variabel Independen Kategorik
1.
2.
3.
4.
5.

Hasil screening nilai P

Race
Smoke
Cholesterol
Hipertension
Diabetes melitus

0.061
0.08
0.00
0.053
0.078

Semua terpilih sebagai variabel kandidat dalam model karena nilai p<0.25
b. Variabel kontinyu menggunakan uji t yaitu; age, number dan weight

variabel kontinyu
Independent Samples Test
Levene's Test for
Equality of Variances

F
Age

WEIGHT1

Number of
exercises/week

Equal variances
assumed
Equal variances
not assumed
Equal variances
assumed
Equal variances
not assumed
Equal variances
assumed
Equal variances
not assumed

Sig.

3.824

2.409

.037

.052

.122

.848

t-test for Equality of Means

df

Sig. (2-tailed)

Mean
Difference

Std. Error
Difference

95% Confidence
Interval of the
Difference
Lower
Upper

1.575

198

.117

1.25

.796

-.316

2.823

1.692

152.544

.093

1.25

.741

-.210

2.717

2.655

198

.009

59.92

22.564

15.420

104.415

2.858

153.223

.005

59.92

20.963

18.504

101.331

1.197

198

.233

.19

.159

-.123

.504

1.226

134.605

.222

.19

.155

-.117

.497

Tabel hasil uji bivariat variabel independen kontinyu dengan


CHD
Variabel Independen Kontinyu
1. Age
2. number of exercise
3. weight

Hasil screening nilai P


0.117
0.233
0.09

Semua variabel kontinyu terpilih dalam model karena memiliki nilai p>0.25

12

Maka terbentuk variabel yang akan masuk kedalam candidat model.


Model ini disebut juga sebagai main effects model.

Melakukan pemilihan variabel dengan memasukkan semua variabel yang


telah terpilih sebagai candidat model.

Jangan lupa bahwa variabel race memiliki kategori lebih dari 2 (variabel
dummy), sehingga harus dilakukan kategori, reference group adalah first.

Dari model yang lengkap kemudian secara bertahap dihilangkan satu


persatu variabel yang memiliki nilai p > 0.05, dimulai dari variabel dengan
nilai p tertinggi. Model di run kembali sehingga didapatkan masing-masing
variabel memiliki nilai p yang < 0.05

PEMILIHAN MODEL DENGAN METODE ENTER


Number of exercise dikeluarkan
Variables in the Equation
Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
Constant

B
-.037

S.E.
.038

1.371
.749
.849
1.377
1.805
.408
-.008
-.003
.962

.498
.442
.398
.453
.712
.445
.174
.001
1.202

Wald
.984
8.078
7.576
2.875
4.558
9.243
6.433
.842
.002
5.987
.641

df
1
2
1
1
1
1
1
1
1
1
1

Sig.
.321
.018
.006
.090
.033
.002
.011
.359
.962
.014
.423

Exp(B)
.963
3.940
2.115
2.337
3.964
6.083
1.504
.992
.997
2.618

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.

Diabetes melitus dikeluarkan

13

Variables in the Equation


Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
WEIGHT1
Constant

B
-.038

S.E.
.037

1.372
.752
.851
1.377
1.808
.409
-.003
.963

.497
.439
.395
.453
.709
.444
.001
1.201

Wald
1.031
8.148
7.610
2.936
4.640
9.242
6.504
.850
6.034
.644

df

Sig.
.310
.017
.006
.087
.031
.002
.011
.357
.014
.422

1
2
1
1
1
1
1
1
1
1

Exp(B)
.963
3.945
2.120
2.342
3.963
6.101
1.506
.997
2.621

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, WEIGHT1.

Age dikeluarkan
Variables in the Equation
Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant

B
-.041

S.E.
.037

1.346
.756
.860
1.434
1.745
-.003
1.139

.498
.436
.394
.450
.707
.001
1.178

Wald
1.276
7.939
7.315
3.007
4.776
10.165
6.097
6.137
.935

df
1
2
1
1
1
1
1
1
1

Sig.
.259
.019
.007
.083
.029
.001
.014
.013
.334

Exp(B)
.959
3.842
2.129
2.364
4.197
5.725
.997
3.125

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, WEIGHT1.

Tabel hasil pemilihan variabel yang dikeluarkan


Variabel yang dikeluarkan
1. Exercise
2. Diabetes Mellitus
3. Age

P value
0.960
0.357
0.259

Dilakukan test interaksi berdasarkan substansi. Dari model yang telah


ada, dilakukan satu persatu kemungkinan adanya interaksi. Lakukan
pemilihan variabel interaksi seperti langkah diatas.

PEMILIHAN VARIABEL INTERAKSI

14

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
Constant

S.E.

1.157
1.032
.990
1.384
1.752
-.004

.752
.579
.579
.443
.728
.001

.696
-.904
.223

1.039
.903
1.036

Wald
3.663
2.367
3.178
2.922
9.755
5.794
6.681
2.185
.449
1.002
.046

df

Sig.
.160
.124
.075
.087
.002
.016
.010
.335
.503
.317
.829

2
1
1
1
1
1
1
2
1
1
1

Exp(B)
3.180
2.807
2.690
3.993
5.764
.996
2.007
.405
1.250

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, RACE * SMOKE .

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
CHOL * RACE
CHOL by RACE(1)
CHOL by RACE(2)
Constant

S.E.

1.694
.889
.829
1.765
1.788
-.004

.533
.470
.392
.622
.720
.001

-1.760
-.550
.315

1.302
.944
.955

Wald
10.666
10.099
3.575
4.469
8.040
6.158
7.425
1.860
1.829
.340
.108

df

Sig.
.005
.001
.059
.035
.005
.013
.006
.395
.176
.560
.742

2
1
1
1
1
1
1
2
1
1
1

Exp(B)
5.440
2.433
2.292
5.842
5.975
.996
.172
.577
1.370

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * RACE .

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
HT * RACE
HT by RACE(1)
HT by RACE(2)
Constant

S.E.

1.372
.787
.873
1.327
1.596
-.004

.515
.435
.393
.440
1.033
.001

.727
.050
.403

1.735
1.612
.968

Wald
7.915
7.096
3.278
4.935
9.080
2.387
7.133
.190
.175
.001
.174

df
2
1
1
1
1
1
1
2
1
1
1

Sig.
.019
.008
.070
.026
.003
.122
.008
.910
.675
.975
.677

Exp(B)
3.942
2.197
2.395
3.769
4.932
.996
2.068
1.052
1.497

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * RACE .

15

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
RACE * WEIGHT1
RACE(1) by WEIGHT1
RACE(2) by WEIGHT1
Constant

S.E.

1.613
2.717
.882
1.350
1.684
-.003

2.009
2.153
.392
.439
.708
.002

.000
-.003
-.200

.003
.004
1.302

Wald
1.751
.645
1.592
5.048
9.461
5.661
2.109
.872
.014
.832
.024

df
2
1
1
1
1
1
1
2
1
1
1

Sig.
.417
.422
.207
.025
.002
.017
.146
.646
.904
.362
.878

Exp(B)
5.019
15.131
2.415
3.856
5.385
.997
1.000
.997
.819

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, RACE * WEIGHT1 .

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
HT by SMOKE
Constant

S.E.

1.469
.799
.793
1.366
1.344
-.004
1.068
.511

.501
.429
.404
.440
.887
.001
1.403
.981

Wald
9.333
8.617
3.464
3.857
9.643
2.292
7.596
.579
.271

df

Sig.
.009
.003
.063
.050
.002
.130
.006
.447
.603

2
1
1
1
1
1
1
1
1

Exp(B)
4.346
2.223
2.211
3.921
3.833
.996
2.908
1.666

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * SMOKE .

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
SMOKE by WEIGHT1
Constant

1.438
.715
-.959
1.371
1.677
-.005
.003
1.412

S.E.
.497
.432
1.716
.441
.716
.002
.003
1.397

Wald
8.830
8.383
2.733
.312
9.682
5.480
6.275
1.190
1.021

df
2
1
1
1
1
1
1
1
1

Sig.
.012
.004
.098
.576
.002
.019
.012
.275
.312

Exp(B)
4.213
2.044
.383
3.941
5.350
.995
1.003
4.104

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, SMOKE * WEIGHT1 .

16

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
CHOL by HT
Constant

S.E.

1.429
.772
.886
1.266
1.611
-.004
4.654
.335

.494
.429
.390
.445
.747
.001
15.507
.945

Wald
9.032
8.367
3.237
5.173
8.087
4.649
7.080
.090
.125

df
2
1
1
1
1
1
1
1
1

Sig.
.011
.004
.072
.023
.004
.031
.008
.764
.723

Exp(B)
4.174
2.163
2.426
3.546
5.009
.996
104.990
1.398

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * HT .


Variables in the Equation
B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
CHOL by WEIGHT1
Constant

S.E.

1.425
.793
.861
2.087
1.750
-.004
-.001
.247

.494
.429
.391
2.358
.710
.001
.004
.985

Wald
9.052
8.309
3.423
4.855
.783
6.081
5.925
.108
.063

df
2
1
1
1
1
1
1
1
1

Sig.
.011
.004
.064
.028
.376
.014
.015
.743
.802

Exp(B)
4.159
2.211
2.366
8.059
5.757
.996
.999
1.280

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, CHOL * WEIGHT1 .

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
HT by WEIGHT1
Constant

1.430
.794
.872
1.326
1.877
-.004
.000
.328

S.E.
.495
.429
.394
.437
2.670
.002
.003
1.035

Wald
9.079
8.331
3.427
4.912
9.195
.494
5.863
.002
.100

df
2
1
1
1
1
1
1
1
1

Sig.
.011
.004
.064
.027
.002
.482
.015
.967
.751

Exp(B)
4.178
2.213
2.392
3.765
6.532
.996
1.000
1.388

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1, HT * WEIGHT1 .

17

Variables in the Equation

Step
a
1

SMOKE
CHOL
WEIGHT
RACE
RACE(1)
RACE(2)
HT
Constant

B
.870
1.326
-.037

S.E.
.390
.437
.014

1.429
.794
1.769
.346

.495
.429
.712
.946

Wald
4.974
9.219
7.248
9.077
8.328
3.425
6.177
.134

df
1
1
1
2
1
1
1
1

Sig.
.026
.002
.007
.011
.004
.064
.013
.715

Exp(B)
2.387
3.768
.964
4.176
2.212
5.867
1.413

95.0% C.I.for
EXP(B)
Lower
Upper
1.111
5.128
1.600
8.870
.938
.990
1.582
.954
1.454

11.025
5.126
23.682

a. Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT, RACE, HT.

Hasil pengujian interaksi dapat dirangkumkan dalam tabel dibawah ini;


Tabel hasil uji variabel interaksi
Variabel interaksi
Race1 by smoke
Race2 by smoke
Race1 by cholesterol
Race2 by cholesterol
Race1 by hipertension
Race2 by hipertension
Race1 by weight
Race2 by weight
Smoke by hipertension
Smoke by weight
Cholesterol by Hipertension
Cholesterol by wight
Hipertension by weight

P value
0.503
0.317
0.176
0.560
0.675
0.975
0.904
0.362
0.447
0.275
0.764
0.743
0.967

Dari hasil penelitian didapatkan tidak terdapat interaksi didalam model.

Terbentuk model regresi logistik yang diinginkan

a. omnibust test,
model harus significant p<0.05 yang menunjukkan bahwa model
appropriate

18

Omnibus Tests of Model Coefficients


Step 1

Chi-square
39.823
39.823
39.823

Step
Block
Model

df

Sig.
.000
.000
.000

6
6
6

b. Dilihat overall percentage pada classification table


Dengan ketepatan dari model ini adalah 76.5%
Classification Tablea

Step 1

Observed
Coronary heart
disease

Predicted
Coronary heart
disease
No
Yes
123
12
35
30

No
Yes

Overall Percentage

Percentage
Correct
91.1
46.2
76.5

a. The cut value is .500

c. Model pada penelitian ini adalah :


Z = 0.346 + 1.429 race1 + 0.794 race2 + 0.870 smoke +1.326 cholesterol +
1.769 hipertension 0.037 weight1
Variables in the Equation

Step
a
1

SMOKE
CHOL
WEIGHT
RACE
RACE(1)
RACE(2)
HT
Constant

B
.870
1.326
-.037

S.E.
.390
.437
.014

1.429
.794
1.769
.346

.495
.429
.712
.946

Wald
4.974
9.219
7.248
9.077
8.328
3.425
6.177
.134

df
1
1
1
2
1
1
1
1

Sig.
.026
.002
.007
.011
.004
.064
.013
.715

Exp(B)
2.387
3.768
.964
4.176
2.212
5.867
1.413

95.0% C.I.for
EXP(B)
Lower
Upper
1.111
5.128
1.600
8.870
.938
.990
1.582
.954
1.454

11.025
5.126
23.682

a. Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT, RACE, HT.

19

PEMILIHAN MODEL DENGAN METODE FORWARD


Omnibus Tests of Model Coefficients
Step 1

Step 2

Step 3

Step 4

Step 5

Chi-square
14.637
14.637
14.637
5.639
20.276
20.276
7.157
27.433
27.433
7.274
34.708
34.708
5.116
39.823
39.823

Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model
Step
Block
Model

df
1
1
1
1
2
2
1
3
3
2
5
5
1
6
6

Sig.
.000
.000
.000
.018
.000
.000
.007
.000
.000
.026
.000
.000
.024
.000
.000

Classification Tablea
Predicted
Coronary heart
disease
No
Yes
123
12
45
20

Step 1

Observed
Coronary heart
disease

No
Yes

Step 2

Overall Percentage
Coronary heart
disease

No
Yes

125
45

10
20

Step 3

Overall Percentage
Coronary heart
disease

No
Yes

124
42

11
23

Step 4

Overall Percentage
Coronary heart
disease

No
Yes

121
41

14
24

Step 5

Overall Percentage
Coronary heart
disease

No
Yes

123
35

12
30

Overall Percentage

Percentage
Correct
91.1
30.8
71.5
92.6
30.8
72.5
91.9
35.4
73.5
89.6
36.9
72.5
91.1
46.2
76.5

a. The cut value is .500

20

Variables in the Equation


Step
a
1
Step
b
2

Step
c
3

Step
d
4

Step
e
5

CHOL
Constant
CHOL
WEIGHT1
Constant
CHOL
HT
WEIGHT1
Constant
RACE
RACE(1)
RACE(2)
CHOL
HT
WEIGHT1
Constant
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant

B
1.516
-1.006
1.431
-.003

S.E.
.405
.174
.410
.001

Wald
14.047
33.311
12.195
4.925

.781

.805

1.450
1.874
-.004
1.221

.418
.724
.001
.836

1.287
.367
1.510
1.848
-.004
1.174

.481
.371
.428
.735
.001
.888

1.429
.794
.870
1.326
1.769
-.004
.346

.495
.429
.390
.437
.712
.001
.946

df
1
1
1
1

Sig.
.000
.000
.000
.026

Exp(B)
4.556
.366
4.184
.997

.939

.332

2.183

12.025
6.693
7.629
2.133
7.184
7.157
.981
12.417
6.318
9.036
1.748
9.077
8.328
3.425
4.974
9.219
6.177
7.248
.134

1
1
1
1
2
1
1
1
1
1
1
2
1
1
1
1
1
1
1

.001
.010
.006
.144
.028
.007
.322
.000
.012
.003
.186
.011
.004
.064
.026
.002
.013
.007
.715

4.263
6.514
.996
3.390
3.623
1.444
4.526
6.345
.996
3.236
4.176
2.212
2.387
3.768
5.867
.996
1.413

a. Variable(s) entered on step 1: CHOL.


b. Variable(s) entered on step 2: WEIGHT1.
c. Variable(s) entered on step 3: HT.
d. Variable(s) entered on step 4: RACE.
e. Variable(s) entered on step 5: SMOKE.

PEMILIHAN MODEL DENGAN METODE BACKWARD


Omnibus Tests of Model Coefficients
Step 1

Step
Block
Model

Chi-square
39.823
39.823
39.823

df
6
6
6

Sig.
.000
.000
.000

Classification Tablea

Step 1

Observed
Coronary heart
disease
Overall Percentage

No
Yes

Predicted
Coronary heart
disease
No
Yes
123
12
35
30

Percentage
Correct
91.1
46.2
76.5

a. The cut value is .500

21

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant

1.429
.794
.870
1.326
1.769
-.004
.346

S.E.
.495
.429
.390
.437
.712
.001
.946

Wald
9.077
8.328
3.425
4.974
9.219
6.177
7.248
.134

df
2
1
1
1
1
1
1
1

Sig.
.011
.004
.064
.026
.002
.013
.007
.715

Exp(B)
4.176
2.212
2.387
3.768
5.867
.996
1.413

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1.

Interpretasi model
Ternyata hasil yang diperoleh pada ke-3 metode pemilihan variabel, baik
pada metode enter, backward, forward pada penelitian ini menunjukkan
kesamaan hasil.
Interpretasi dari model yang terbentuk adalah bahwa faktor-faktor yang
mempengaruhi penyakit jantung koroner adalah Ras, Merokok, Cholesterol,
hipertensi dan berat badan. Yang paling besar pengaruhnya dalam kejadian
penyakit jantung koroner adalah Hipertensi. Dimana risiko penyakit jantung
koroner pada orang yang Hipertensi adalah 6 kali dibandingkan dengan yang
tidak hipertensi dengan 95% CI (1.454 23.682) setelah dikontrol oleh variabel
ras, merokok, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang kulit hitam adalah 4 kali
dibandingkan dengan orangkulit putih dengan 95% CI (1.454 23.682) setelah
dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.
Sedangkan untuk kulit lainnya Odds Penyakit jantung koroner

adalah 2 kali

dibandingkan dengan yang tidak hipertensi dengan 95% CI (0.954 5.126)


setelah dikontrol oleh variabel hipertensi, merokok, kolesterol, dan berat badan.
Risiko Penyakit jantung koroner pada orang yang merokok adalah 2 kali
dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.111 - 5.128)
setelah dikontrol oleh variabel ras, hipertensi, kolesterol, dan berat badan.

22

Risiko Penyakit jantung koroner pada orang dengan kolesterol tinggi


adalah 4 kali dibandingkan dengan yang tidak hipertensi dengan 95% CI (1.600
8.870) setelah dikontrol oleh variabel ras, merokok, hipertensi, dan berat
badan.
Kenaikan berat badan setiap 100 gram (0.1 kg) merupakan faktor
pencegah untuk terjadinya Penyakit jantung koroner yaitu 0.964 dengan 95% CI
(0.938 0.990) setelah dikontrol oleh variabel ras, merokok, kolesterol, dan
hipertensi.
2.

MODEL ESTIMASI

Selanjutnya akan dibahas langkah dalam strategi pemodelan regresi logistik


dengan tujuan untuk mengestimasi hubungan paparan dan penyakit.
Langkah untuk melakukan strategi pemodelan dibutuhkan 3 tahap:
1. Variabel specification
peneliti melakukan penelusuran literature unttuk membatasi pada variabel
independen yang memang bermakna secara klinik maupun biologik.
Variabel ini dapat didefinsikan pada model sebagai langkah awal yang
paling mungkin masuk dalam model.
2. Interaction assesment
Bila terdapat interaksi maka OR dilaporkan terpisah
3. Confounding assesment followed by consideration of precision
Model terakhir adalah model dengan variabel interaksi dan konfounding
yang terpilih.
LANGKAH PEMBUATAN MODEL
Langkah untuk

melakukan spesifikasi variabel secara jelas, dilakukan

pemodelan secara lengkap, mencakup semua variabel utama, kandidat


konfounding dan kandidat interaksi, yaitu:

23

1. Hierarchically Well-Formulated Models


Merupakan initial model. Model memiliki seluruh lower order component
of any term in the model.
2. The Hierarichal Backward Elimination Approach
Setelah didapatkan initial model strategi selanjutnya adalah prosedur
Hierarichal Backward Elimination Approach untuk mengeluarkan variabel.
Uji statistik digunakan untuk menguji interaksi. Tapi untuk mengeliminasi
confounders tidak menggunakan uji statistik. Strategi ini prisip kerjanya
adalah dari large starting model

smaller final model.

Initial model
Eliminate EViEj

interaction

Eliminate EVi

Eliminate Vi dan ViVj

confounder

3. The Hierarchy Principles for retaining variables


Jika suatu variabel terdapat dalam model , maka semua lower-order
components juga harus ada dalam model.
CONTOH PEMODELAN ESTIMASI
Model untuk mengetahui hubungan merokok dengan terjadinya penyakit jantung
koroner, data yang digunakan adalah data CHD.

24

Tujuan penelitian:
Ingin mengetahui hubungan antara merokok dan kejadian penyakit jantung
koroner, dengan dikontrol oleh variabel independen lainnya.
Kerangka konsep:

Smoke

Coronary Heart Diseases

Age
Race
High Cholesterol
Hypertension
Diabetes Mellitus
Number of exercise
Weight

Langkah pemodelan yang dilakukan adalah :

1. Variable spesification.
Melakukan pemodelan lengkap (Hierarchically Well Formulated Model)
dengan mencakup semua variabel utama, variabel confounding dan
kandidat interaksi
Variabel dependen adalah : Coronary Heart Diseases
Variabel Independen yaitu :
Variabel Resiko adalah
Smoke,

25

Variabel Confounder adalah


Age,
Race,
High cholelesterol,
Hypertension ,
Diabetes mellitus,
Number of exercise,
Weight (pada variabel weight dilakukan compute dengan mengalikan dengan 10,
agar desimal pada variabel weight menjadi satuan. Hal ini dilakukan untuk
memperhitungkan kenaikan dalam 1 unit untuk perhitungan OR agar tidak
berlipat banyak)
Variabel Interaksi adalah :
Smoke*Age
Smoke*Race
Smoke*Hypertension
Smoke*weight

VARIABEL SPESIFICATION: MODEL HWF


Variables in the Equation
Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
HT by SMOKE
SMOKE by WEIGHT1
Constant

B
-.086

S.E.
.056

.777
.760
-2.326
1.447
1.571
.664
-.031
-.004
.089

.801
.608
2.555
.462
.928
.469
.182
.002
.078

1.150
-.684
.515
.002
2.670

1.094
.939
1.517
.003
1.844

Wald
2.353
1.698
.942
1.562
.829
9.792
2.865
2.005
.030
3.773
1.280
2.406
1.106
.531
.115
.311
2.096

df
1
2
1
1
1
1
1
1
1
1
1
2
1
1
1
1
1

Sig.
.125
.428
.332
.211
.363
.002
.091
.157
.863
.052
.258
.300
.293
.466
.734
.577
.148

Exp(B)
.918
2.176
2.137
.098
4.251
4.813
1.942
.969
.996
1.093
3.159
.504
1.674
1.002
14.445

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE ,
RACE * SMOKE , HT * SMOKE , SMOKE * WEIGHT1 .

2. Melakukan Interaction assesment,


yang dilakukan dengan menghilangkan Interaksi yang memiliki p value
yang tertinggi dan di run kembali satu persatu sampai ditemukan Interaksi

26

yang signifikan. Didapatkan hasil nilai p dari masing-masing interaksi


sebagai berikut :
INTERACTION SPESIFICATION
Seluruh kemungkinan interaksi yang ada dimasukkan dalam model
Variables in the Equation
Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
SMOKE by WEIGHT1
Constant

B
-.086

S.E.
.056

.772
.756
-2.470
1.432
1.770
.673
-.028
-.004
.088

.804
.609
2.505
.460
.735
.468
.181
.002
.078

1.122
-.696
.002
2.706

1.088
.938
.003
1.844

Wald
2.365
1.671
.923
1.539
.973
9.676
5.792
2.072
.025
3.892
1.263
2.377
1.063
.551
.505
2.153

df
1
2
1
1
1
1
1
1
1
1
1
2
1
1
1
1

Sig.
.124
.434
.337
.215
.324
.002
.016
.150
.875
.049
.261
.305
.302
.458
.477
.142

Exp(B)
.917
2.164
2.130
.085
4.188
5.868
1.961
.972
.996
1.092
3.070
.499
1.002
14.967

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE ,
RACE * SMOKE , SMOKE * WEIGHT1 .

Variables in the Equation


Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
RACE * SMOKE
RACE(1) by SMOKE
RACE(2) by SMOKE
Constant

B
-.091

S.E.
.055

.687
.824
-1.312
1.420
1.841
.629
-.016
-.003
.093

.791
.601
1.889
.461
.730
.462
.180
.001
.078

1.270
-.781
2.066

1.072
.930
1.572

Wald
2.695
1.896
.754
1.880
.482
9.510
6.360
1.850
.008
5.042
1.447
3.233
1.404
.705
1.727

df
1
2
1
1
1
1
1
1
1
1
1
2
1
1
1

Sig.
.101
.387
.385
.170
.487
.002
.012
.174
.930
.025
.229
.199
.236
.401
.189

Exp(B)
.913
1.987
2.279
.269
4.138
6.302
1.875
.984
.997
1.098
3.561
.458
7.892

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE * SMOKE
, RACE * SMOKE .

27

Variables in the Equation


Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
AGE by SMOKE
Constant

B
-.077

S.E.
.053

1.279
.718
-1.070
1.328
1.836
.506
-.019
-.003
.085
1.844

.506
.444
1.730
.451
.716
.454
.175
.001
.075
1.449

Wald
2.115
6.884
6.403
2.617
.383
8.676
6.574
1.244
.011
5.854
1.286
1.621

df
1
2
1
1
1
1
1
1
1
1
1
1

Sig.
.146
.032
.011
.106
.536
.003
.010
.265
.915
.016
.257
.203

Exp(B)
.925
3.595
2.050
.343
3.774
6.271
1.659
.981
.997
1.089
6.325

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1, AGE *
SMOKE .

Variables in the Equation


Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
Constant

B
-.037

S.E.
.038

1.371
.749
.849
1.377
1.805
.408
-.008
-.003
.962

.498
.442
.398
.453
.712
.445
.174
.001
1.202

Wald
.984
8.078
7.576
2.875
4.558
9.243
6.433
.842
.002
5.987
.641

df
1
2
1
1
1
1
1
1
1
1
1

Sig.
.321
.018
.006
.090
.033
.002
.011
.359
.962
.014
.423

Exp(B)
.963
3.940
2.115
2.337
3.964
6.083
1.504
.992
.997
2.618

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.

Tabel hasil uji variabel interaksi


Jenis Interaksi yang dihilangkan
Hipertensi by smoke
Smoke by weight
Race by smoke
Age by smoke

P value
0.734
0.477
0.401
0.257

28

Variables in the Equation


Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
EXER
WEIGHT1
Constant

B
-.037

S.E.
.038

1.371
.749
.849
1.377
1.805
.408
-.008
-.003
.962

.498
.442
.398
.453
.712
.445
.174
.001
1.202

Wald
.984
8.078
7.576
2.875
4.558
9.243
6.433
.842
.002
5.987
.641

df
1
2
1
1
1
1
1
1
1
1
1

Sig.
.321
.018
.006
.090
.033
.002
.011
.359
.962
.014
.423

Exp(B)
.963
3.940
2.115
2.337
3.964
6.083
1.504
.992
.997
2.618

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, EXER, WEIGHT1.

Dari hasil diatas ternyata tidak terdapat interaksi yang significan didalam
model.
Maka full model pada penelitian ini adalah :
Z = 0.962 - 0.037 age +1.371 race1 + 0.749 race2 + 0.849 smoke +1.377
chol + 1.805 ht +0.408 DM 0.008 exer 0.003 weight1
Dengan OR smoke full model adalah 2.337, yaitu OR smoke yang telah
terkontrol oleh variabel lainnya.

3. Confounder assesment
Dilakukan dengan cara Hierarchical Backward Elimination yaitu ;
membandingkan OR full model dengan OR Reduced Model. Bila besar
perubahan OR yang terjadi kurang dari 10 % maka model yang digunakan
adalah Reduced Model Tujuannya adalah untuk mendapatkan validitas.
Langkah yang dilakukan adalah dengan menghilangkan variabel yang
memiliki nilai p value yang tertinggi, kemudian di run kembali dan
dibandingkan ; Delta antara OR Reduced model dengan OR full model
dibagi dengan OR full model .
29

Bila besarnya perubahan < 10 % maka digunakan Reduced model.

Bila besar perubahan OR > 10 % maka variabel tersebut


dimasukkan kembali, Selanjutnya dilihat variabel lainnya untuk
dikeluarkan dan diperbandingkan kembali, satu persatu.

CONFOUNDING ASSESMENT
Variables in the Equation
Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
DM
WEIGHT1
Constant

B
-.038

S.E.
.037

1.372
.752
.851
1.377
1.808
.409
-.003
.963

.497
.439
.395
.453
.709
.444
.001
1.201

Wald
1.031
8.148
7.610
2.936
4.640
9.242
6.504
.850
6.034
.644

df
1
2
1
1
1
1
1
1
1
1

Sig.
.310
.017
.006
.087
.031
.002
.011
.357
.014
.422

Exp(B)
.963
3.945
2.120
2.342
3.963
6.101
1.506
.997
2.621

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, DM, WEIGHT1.

Variables in the Equation


Step
a
1

AGE
RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant

B
-.041

S.E.
.037

1.346
.756
.860
1.434
1.745
-.003
1.139

.498
.436
.394
.450
.707
.001
1.178

Wald
1.276
7.939
7.315
3.007
4.776
10.165
6.097
6.137
.935

df
1
2
1
1
1
1
1
1
1

Sig.
.259
.019
.007
.083
.029
.001
.014
.013
.334

Exp(B)
.959
3.842
2.129
2.364
4.197
5.725
.997
3.125

a. Variable(s) entered on step 1: AGE, RACE, SMOKE, CHOL, HT, WEIGHT1.

30

Variables in the Equation


B
Step
a
1

RACE
RACE(1)
RACE(2)
SMOKE
CHOL
HT
WEIGHT1
Constant

1.429
.794
.870
1.326
1.769
-.004
.346

S.E.
.495
.429
.390
.437
.712
.001
.946

Wald
9.077
8.328
3.425
4.974
9.219
6.177
7.248
.134

df
2
1
1
1
1
1
1
1

Sig.
.011
.004
.064
.026
.002
.013
.007
.715

Exp(B)

Sig.
.092
.002
.010
.008
.302

Exp(B)
1.751
3.758
6.120
.997
2.405

4.176
2.212
2.387
3.768
5.867
.996
1.413

a. Variable(s) entered on step 1: RACE, SMOKE, CHOL, HT, WEIGHT1.

Variables in the Equation


Step
a
1

SMOKE
CHOL
HT
WEIGHT1
Constant

B
.560
1.324
1.812
-.004
.877

S.E.
.332
.426
.703
.001
.851

Wald
2.845
9.665
6.637
6.991
1.064

df
1
1
1
1
1

a. Variable(s) entered on step 1: SMOKE, CHOL, HT, WEIGHT1.

Variables in the Equation


Step
a
1

SMOKE
CHOL
HT
WEIGHT1
RACE
RACE(1)
RACE(2)
Constant

B
.870
1.326
1.769
-.004

S.E.
.390
.437
.712
.001

1.429
.794
.346

.495
.429
.946

Wald
4.974
9.219
6.177
7.248
9.077
8.328
3.425
.134

df

Sig.
.026
.002
.013
.007
.011
.004
.064
.715

1
1
1
1
2
1
1
1

Exp(B)
2.387
3.768
5.867
.996
4.176
2.212
1.413

a. Variable(s) entered on step 1: SMOKE, CHOL, HT, WEIGHT1, RACE.

Variables in the Equation


Step
a
1

SMOKE
CHOL
WEIGHT1
RACE
RACE(1)
RACE(2)
Constant

B
.872
1.319
-.003

S.E.
.383
.429
.001

1.428
.831
-.123

.488
.418
.907

Wald
5.193
9.472
4.693
9.551
8.554
3.949
.018

df
1
1
1
2
1
1
1

Sig.
.023
.002
.030
.008
.003
.047
.893

Exp(B)
2.391
3.740
.997
4.172
2.296
.885

a. Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT1, RACE.

31

Variables in the Equation


Step
a
1

SMOKE
CHOL
RACE
RACE(1)
RACE(2)
Constant

B
.976
1.377

S.E.
.371
.422

1.230
.980
-1.965

.467
.407
.360

Wald
6.915
10.675
9.109
6.939
5.804
29.863

df

Sig.
.009
.001
.011
.008
.016
.000

1
1
2
1
1
1

Exp(B)
2.654
3.964
3.420
2.665
.140

a. Variable(s) entered on step 1: SMOKE, CHOL, RACE.


Variables in the Equation
Step
a
1

SMOKE
RACE
RACE(1)
RACE(2)
WEIGHT1
Constant

B
1.063

S.E.
.368

1.382
.895
-.003
.155

.480
.405
.001
.871

Wald
8.345
9.854
8.273
4.886
5.752
.031

df

Sig.
.004
.007
.004
.027
.016
.859

1
2
1
1
1
1

Exp(B)
2.896
3.983
2.447
.997
1.167

a. Variable(s) entered on step 1: SMOKE, RACE, WEIGHT1.

Dari hasil out put penelitian dapat diringkaskan dalam tabel dibawah ini :
Tabel hasil uji confounder

Confounder
dikeluarkan
Exercise
Diabetes mellitus
Age
Race
Hypertension
Weight1
Cholesterol

yang

P value

OR Smoke
Reduced
Model

Delta OR
Red dg OR
full model

Besar
perubahan OR
(%)

0.962
0.357
0.259
0.064
0.013
0.030
0.02

2.342
2.364
2.387
1.751
2.391
2.654
2.896

0.005
0.027
0.05
0.586
0.054
0.317
0.559

0.214
1.155
2.139
25.07
2.31
13.56
23.92

Dari hasil diatas didapatkan bahwa variabel confounder yang masuk


kedalam model adalah variabel Race(Cat), Weight1, Cholesterol dengan
OR Smoke pada Reduced Model adalah 2.391
4. Final Model , yaitu model yang paling parsimonious dalam penelitian ini
adalah :
32

Smoke

Coronary Heart Disease

High cholesterol
Weight
Race

Omnibus Tests of Model Coefficients


Step 1

Step
Block
Model

Chi-square
33.309
33.309
33.309

df
5
5
5

Sig.
.000
.000
.000

Classification Tablea

Step 1

Observed
Coronary heart
disease
Overall Percentage

No
Yes

Predicted
Coronary heart
disease
No
Yes
123
12
39
26

Percentage
Correct
91.1
40.0
74.5

a. The cut value is .500

33

Variables in the Equation

Step
a
1

SMOKE
CHOL
WEIGHT1
RACE
RACE(1)
RACE(2)
Constant

B
.872
1.319
-.003

S.E.
.383
.429
.001

1.428
.831
-.123

.488
.418
.907

Wald
5.193
9.472
4.693
9.551
8.554
3.949
.018

df
1
1
1
2
1
1
1

Sig.
.023
.002
.030
.008
.003
.047
.893

Exp(B)
2.391
3.740
.997
4.172
2.296
.885

95.0% C.I.for EXP(B)


Lower
Upper
1.130
5.062
1.615
8.665
.995
1.000
1.602
1.012

10.867
5.210

a. Variable(s) entered on step 1: SMOKE, CHOL, WEIGHT1, RACE.

Interpretasi model
Merokok memiliki hubungan dengan Penyakit Jantung Koroner setelah
dikontrol oleh Ras, Berat Badan dan Kadar Kholesterol. Dimana risiko untuk
menderita Penyakit jantung koroner pada orang yang merokok adalah 2 kali
dibanding orang yang tidak merokok setelah dikontrol variabel ras, berat badan
dan kadar kolesterol. 95% CI OR adalah (1.13-5.062)

34

DAFTAR PUSTAKA

Bland M, 1996
An Introduction to Medical Statistics. Second edition. Oxford University
Press. USA
Hosmer D, Lemeshow, 2000
Applied Logistic Regression . second edition. Jhon Willey & son, inc. USA
Kleinbaum D, 1996
Statistic in the health science. Logistic Regression A Self-learning text.
Springer-Verlag , New York
Kleinbaum D, Kupper L, Morgenstern H, 1996
Epidemiologic Research. Principles and Quantitative Methods. Van
Nostrand Reinhold Company. New York
Pagano M, Gauvreu K, 1997
Principles of Biostatistic Duxburry Press, California.
Riono P, 1992
Aplikasi regresi Logistik. Fakultas Kesehatan Masyarakat Universitas
Indonesia

35

Anda mungkin juga menyukai