Anda di halaman 1dari 148

ANALISIS

DATA EPIDEMIOLOGI

Johan Harlan
Analisis Data Epidemiologi
Penulis : Johan Harlan
Cetakan Pertama, September 2019

Disain cover : Joko Slameto

Diterbitkan pertama kali oleh Gunadarma


Jl. Margonda Raya No. 100, Pondokcina, Depok 16424
Telp. +62-21-78881112, 7863819 Faks. +62-21-7872829
e-mail : sektor@gunadarma.ac.id

Hak Cipta dilindungi undang-undang. Dilarang mengutip atau


memperbanyak dalam bentuk apapun sebagian atau seluruh isi
buku tanpa ijin tertulis dari penerbit.
KATA PENGANTAR

Buku ini memuat pembahasan tentang analisis data epidemiologi


analitik, yaitu analisis yang ditujukan untuk mengkaji kaitan antara
pajanan dengan penyakit. Kekhususan utama data epidemiologi
analitik antara lain yaitu baik pajanan, penyakit, ataupun kovariat
dan/atau konfaunder seringkali dinyatakan sebagai variabel biner, yaitu
ada atau tidak ada. Rancangan studi epidemiologi tidak dibahas dalam
teks utama, dengan asumsi pembaca telah cukup mengenalinya.
Pengulangan secara singkat mengenai ketiga rancangan dasar studi
epidemilogi terdapat pada lampiran buku ini.

Perangkat komputer statistik yang digunakan untuk analisis dan


pengolahan data dalam buku ini adalah Stata 16, yang cukup lazim
dikenal dan digunakan dalam analisis dan pengolahan data
epidemiologi. Pembaca juga diharapkan telah memiliki pemahaman
cukup mengenai Statistika Inferensi, uji hipotesis, dan metode regresi.
Beberapa buku penulis yang dapat digunakan sebagai sumber referensi
untuk prasyarat mempelajari analisis data epidemiologi ini antara lain
yaitu Biostatistika Dasar, Metode Statistika I dan II, Epidemiologi
Kebidanan, dan Pengenalan Stata.

Penulis menyampaikan terima kasih kepada semua pihak yang


telah membantu penerbitan buku ini. Saran dan kritik dari pembaca
diharapkan demi perbaikan selanjutnya.

Jakarta, September 2019

Seluruh dataset yang dipergunakan dalam buku ini dapat diunduh dari
http://harlan_johan@staff.gunadarma.ac.id.

v
DAFTAR ISI

Kata Pengantar v

Daftar Isi vi
Bab 1 Risk dan Rate 1
Incidence Risk 1
Incidence Rate 5
Prevalensi 8
Odds 9
Latihan 1 11

Bab 2 Ukuran Rasio 15


Risk Ratio 15
Odds Ratio 20
Rate Ratio 25
Latihan 2 30

Bab 3 Bias dan Konfaunding 33


Bias 33
Konfaunding 35
Latihan 3 48

Bab 4 Sensitivitas dan Spesifisitas 51


Pengertian Sensitivitas dan Spesifisitas 51
Kurva ROC 54
Nilai Prediktif 55
Rasio Likelihood 57

vi
Latihan 4 62

Bab 5 Analisis Sederhana dan Analisis Stratifikasi 65


Analisis Sederhana 65
Analisis Stratifikasi 72
Latihan 5 81

Bab 6 Studi Matching 85


Rancangan Studi Matched 85
Analisis Data Matching 86
Triplet-Matching 91
Latihan 6 95

Bab 7 Mediasi, Interaksi, dan Moderasi 99


Mediasi 99
Interaksi & Moderasi 106
Latihan 7 110

Bab 8 Analisis Regresi Logistik 113


Regresi Logistik Sederhana 113
Regresi Logistik Ganda 117
Latihan 8 121

Kepustakaan 125

Lampiran Rancangan Studi Epidemiologi 127

vii
BAB 1
RISK DAN RATE

 Incidence Risk
Incidence risk (cumulative incidence; CI) atau secara singkat diacu
sebagai risk (risiko) saja, adalah jumlah subjek yang terkena suatu penyakit
tertentu X (= kasus baru) dalam suatu periode tertentu ∆t dibagi jumlah
anggota populasi yang pada awal periode pengamatan dalam keadaan sehat
(= N). Populasi yang pada awal pengamatan seluruhnya dalam keadaan sehat
tersebut dinamakan populasi berisiko (population at risk).

Dalam acuan probabilitas, risk adalah peluang salah seorang subjek


yang tidak sakit untuk mendapatkan suatu penyakit tertentu X dalam periode
pengamatan ∆t, dengan syarat ia tidak meninggal karena penyakit lain
selama periode tersebut.

Jumlah subjek yang mendapatkan penyakit tersebut dalam periode


tertentu ∆t adalah kasus baru yang disebut sebagai kasus insidens.

Estimasi risk adalah:

I
ˆ
Risk = ˆ = ∆t
CI (1.1)
∆t ∆t N 0

dengan 0 < Risk < 1.

CIˆ∆t : Risk (incidence risk; cumulative incidence) selama periode ∆t


I ∆t : Jumlah kasus insidens (kasus baru) X dalam periode ∆t
∆t : Periode pengamatan
N 0 : Jumlah anggota populasi yang sehat pada awal periode ∆t; populasi
berisiko (population at risk)

1
Jika periode pengamatan cukup lama, umumnya akan didapatkan
kasus withdrawal (drop-out) di antara populasi berisiko yang diikuti. Jika
ada withdrawal, perhitungan estimasi risk dilakukan dengan metode aktuaria
dengan asumsi seluruh peristiwa withdrawal terjadi pada pertengahan ∆t.
Estimasinya adalah:

ˆ = I ∆t
ˆ
Risk = CI (1.1.a)
∆t ∆t N 0 − ( w 2 )

CIˆ∆t : Risk (incidence risk) selama periode ∆t


I ∆t : Jumlah kasus insidens (kasus baru) dalam periode ∆t
N 0 : Jumlah anggota populasi yang sehat pada awal periode ∆t;
populasi berisiko (population at risk)
w : Jumlah kasus withdrawal

Jika periode pengamatan relatif panjang, umumnya estimasi nilai risk


akan berubah dari waktu ke waktu. Misalkan periode pengamatan ∆t dibagi
menjadi J interval pengamatan, ∆ t 1 , ∆ t 2 , . . . , ∆ t J ; sedemikian hingga ∆t =
J

j =1
t j ; risk pada masing-masing interval adalah CIˆ1 , CIˆ2 , . . . , CIˆJ , maka:

J
ˆ
Risk ˆ ˆ
∆t = CI ∆t = 1 − ∏ 1 − CI j
j =1
( ) (1.1.b)

Secara statistik, risk merupakan data proporsi, sehingga interval


konfidensi 100 (1 − α ) % untuk estimasi risk dengan asumsi tanpa
withdrawal pada periode pengamatan ∆t yang relatif pendek yaitu:

CIˆ∆t + Zα
(
CIˆ∆t 1 − CIˆ∆t )
2
N 0

Contoh 1.1
Misalnya hendak diestimasi risk PJK (penyakit jantung koroner) pada
populasi pria lansia 60 tahun ke atas. Perhitungan dilakukan untuk periode 1

2
Januari 2017 s.d. 31 Desember 2017 di kota hipotetis M. Jumlah penduduk
pria lansia 60 tahun ke atas kota M pada 1 Januari 2017 adalah 50,000 orang,
200 orang di antaranya adalah penderita PJK. Selama tahun 2017 didapatkan
80 kasus baru PJK pada pria lansia 60 tahun ke atas.
Dengan asumsi jumlah penduduk pria lansia kota M stasioner dan
tidak ada atrisi, estimasi risk adalah:

I ∆t
ˆ
Risk =
∆t N 0
I ∆t = 80 N 0 = 50,000 ‒ 200 = 49,800

ˆ 80
Risk ∆t = 49,800
= 0.0016064. . . ≈ 0.0016

Jika selama tahun 2017 terdapat 2,000 kasus withdrawal, estimasi


risk adalah:

I ∆t
ˆ
Risk ∆t = N 0 − ( w 2 )
w = 2,000
ˆ 80
Risk ∆t = 49,800 − ( 2, 000 2 )
= 0.0016393. . . ≈ 0.0016

Contoh 1.2
Dimiliki data follow up selama 5 tahun berikut tentang jumlah
kematian pada sekelompok pasien kanker (Kuzma, 1984):

∆t N0 I ∆t w∆t
t0 → t1 356 60 0
t1 → t2 296 47 1
t 2 → t3 248 29 5
t3 → t 4 214 24 45
t 4 → t5 145 11 63

3
Misalnya, pada awal tahun pertama didapatkan 356 pasien kanker.
Selama tahun pertama didapatkan 60 kematian dan tidak ada withdrawal,
sehingga sisa pasien pada awal tahun kedua menjadi (356 ‒ 60) = 296 orang.
Selama tahun kedua didapatkan 47 kematian dan 1 kasus withdrawal,
sehingga sisa pasien pada awal tahun ketiga menjadi (296 ‒ 47 ‒ 1) = 248
orang, dan seterusnya.

Maka risk per tahun dan risk kumulatif menjadi:

∆t N0 I ∆t w∆t ˆ (t )
Risk i Risk(
ˆ t →t
0 i )
t0 → t1 356 60 0 0.1685 0.1685
t1 → t2 296 47 1 0.1591 0.3008
t 2 → t3 248 29 5 0.1181 0.3834
t3 → t 4 214 24 45 0.1253 0.4607
t 4 → t5 145 11 63 0.0969 0.5129

Tampak bahwa:

ˆ ( t ) = 60 = 0.1685
Risk 1 356
ˆ (t ) = 47
Risk 2 = 0.1591
286 − 0.5 (1)
29
ˆ t =
Risk 3( ) 248 − 0.5 ( 5 )
= 0.1181

dst.
Selanjutnya:
Risk (
0 1 )
ˆ t → t = 1 ‒ (1 ‒ 0.1685) = 0.1685

Risk (
0 2 )
ˆ t → t = 1 ‒ (1 ‒ 0.1685)(1 ‒ 0.1591) = 0.3008

ˆ ( t → t ) = 1 ‒ (1 ‒ 0.1685)(1 ‒ 0.1591)(1 ‒ 0.1181)


Risk 0 3
= 0.3834
dst.
Sehingga risk kumulatif selama 5 tahun adalah:
Risk 0(
ˆ t → t = 0.5129
5 )

4
 Incidence Rate
Incidence rate (incidence density; ID) atau secara singkat diacu
sebagai rate saja, adalah kelajuan sesaat perubahan status kesehatan anggota
populasi tertentu (dari sehat menjadi sakit / menderita penyakit tertentu X).
Dalam Epidemiologi diasumsikan, jika diamati cukup lama, seluruh anggota
suatu populasi yang sehat (= N ) akan mengalami perubahan status
kesehatan menjadi penderita penyakit tertentu X, dengan syarat ia tidak
terlebih dahulu meninggal karena penyebab lain (competing risk).

Rate (incidence rate) adalah:

∆N dN
IDt = lim = (1.2)
∆t →0 ∆t dt

IDt : Rate (incidence rate; incidence density) sesaat pada titik waktu t
∆N : Jumlah anggota populasi yang mengalami perubahan status
kesehatan menjadi penderita penyakit X dalam periode pengamatan
sesaat ∆t
∆t : Periode pengamatan sesaat

Dengan pendekatan, estimasi rate adalah:

I ∆t
ˆ
ID = (1.3)
∆t PT

ˆ
ID∆t : Estimasi rate (incidence rate) pada periode waktu ∆t
I ∆t : Jumlah subjek yang mengalami perubahan status kesehatan (=
jumlah kasus insidens) dalam periode ∆t
PT : Person-time

Person-time adalah jumlah waktu pengamatan terhadap seluruh


anggota sampel. Jika ukuran sampel n kecil dan lama (durasi) pengamatan
terhadap masing-masing anggota adalah t 1 , t 2 , . . . , t n , maka:

PT = t 1 + t 2 + . . . + t n

5
n
PT = ∑
i =1
ti (1.4.a)

Jika jumlah subjek yang diamati berukuran besar, pendekatan person-


time adalah:

PT = N t 2 .∆t (1.4.b)

Nt 2 : Jumlah subjek yang diamati pada pertengahan periode pengamatan


∆t. Jika data ini tak dimiliki, digunakan estimasinya

Nˆ t 2 = ( N0 + Nt ) 2 (1.5)

N 0 dan Nt masing-masing menyatakan jumlah subjek yang


diamati pada awal dan akhir periode pengamatan.

Maka untuk sampel kecil diperoleh:

ˆ = I
ID n (1.6)

i =1
ti

sedangkan untuk kelompok berukuran besar:

ˆ = I
ID (1.7)
Nt 2 . ∆t

ataupun pendekatannya:

ˆ = I
ID (1.8)
( N 0 + Nt ) 2  .∆t

Contoh 1.3
Misalkan dimiliki sampel 10 orang wanita penderita Ca Cervix di
sebuah rumah sakit. Hasil akhir yang akan diamati adalah peristiwa kematian
penderita karena Ca Cervix. Penelitian dilakukan selama 7 tahun, tetapi tidak

6
semua penderita mulai diamati sejak awal penelitian, karena sebagian
anggota sampel baru mulai diamati sejak tahun kedua, atau bahkan tahun
ketiga. Diperoleh hasil sebagai berikut:

1 †
2 †
3 ††
4 ?
5 †
6 ?
7
8 †
9 ††
10

† : Kematian karena Ca Cervix (kasus insidens)


†† : Kematian karena sebab lain (bukan kasus insidens)
? : Penderita mengundurkan diri dari penelitian atau hilang dari
pengamatan (drop-out atau withdrawal)

Penderita no. 7 dan 10 masih hidup sampai penelitian berakhir (akhir


tahun ketujuh).

Person-time (jumlah tahun pengamatan) adalah:


10
PT = ∑
i =1
ti = t1 + t2 + . . . t10

= 1 + 3 + 3 + . . . + 5 = 33

Jumlah kematian karena Ca Cervix adalah:


I = 4 (kasus no. 1, 2, 5, dan 8)

Estimasi rate kematian Ca Cervix adalah:


ˆ = I = 4 tahun‒1 ≈ 0.121 tahun‒1
ID
PT 33

7
Contoh 1.4
Lihat kembali data pada Contoh 1.1. Jika diketahui jumlah penduduk
pria lansia 60 tahun ke atas kota M pada 31 Desember 2017 adalah 52,000
orang, maka estimasi incidence rate PJK pada populasi pria lansia 60 tahun
ke atas adalah:
ˆ = I
ID
( N 0 + Nt ) 2  .∆t
80 ‒1 ‒1
= tahun = 0.00157 tahun
( 50, 000 + 52, 000 ) 2  .1

 Prevalensi
Prevalensi adalah jumlah anggota suatu populasi tertentu yang
sedang menderita penyakit tertentu X (= kasus prevalen; kasus lama) pada
suatu titik waktu tertentu t dibagi jumlah seluruh anggota populasi tertentu
tersebut (sehat maupun sakit) pada titik waktu yang sama.

Dalam acuan probabilitas, prevalensi adalah proporsi anggota suatu


populasi tertentu pada titik waktu tertentu t, yang sedang menderita penyakit
tertentu X.

Estimasi prevalensi adalah:

ˆ = Ct
Pr (1.9)
t
Nt

ˆ
Prt : Prevalensi penyakit X pada titik waktu t
Ct : Jumlah kasus lama (kasus prevalen) pada titik waktu t
Nt : Jumlah anggota populasi pada titik waktu t

Prevalensi secara statistik juga merupakan data proporsi, sehingga


interval konfidensi 100 (1 − α ) % untuk estimasi prevalensi adalah:

8
ˆ + Z
Pr
t (
ˆ 1 − Pr
Pr ˆ
t ) (1.10)
t α 2
Nt

Contoh 1.5
Lihat kembali data pada Contoh 1.1. Pada 1 Januari 2017 jumlah
penduduk pria lansia 60 tahun ke atas di kota M adalah 50,000 orang, 200
orang di antaranya menderita PJK.

Estimasi prevalensi kejadian PJK pada 1 Januari 2017 adalah:


ˆ = Ct
Pr t
Nt
200
= = 0.4% = 4‰
50, 000

 Odds
Odds adalah peluang bersyarat seorang subjek untuk mendapatkan
suatu penyakit tertentu X dibagi peluang bersyarat ia tidak mendapatkan
penyakit tertentu X tersebut.

P( X )
Oˆ X = (1.11)
1− P ( X )

dengan 0 < Odds < ∞ .

Oˆ X : Odds penyakit X
P (X) : Probabilitas subjek untuk mendapatkan penyakit X

Untuk penyakit yang jarang ditemukan dengan P (X) << [1 ‒ P (X)],


odds merupakan aproksimasi yang baik untuk risk:

Oˆ X ≈ Risk
ˆ
X (1.11)

9
Untuk penyakit yang banyak ditemukan, nilai odds sangat berbeda
dengan risk, walaupun demikian odds tetap merupakan salah satu ukuran
penyakit yang penting dalam Epidemiologi.

Contoh 1.6
Lihat kembali data pada Contoh 1.1 dan 1.5. Pada 1 Januari 2017
jumlah penduduk pria lansia 60 tahun ke atas di kota M adalah 50,000 orang,
200 orang di antaranya menderita PJK.

Dengan asumsi P (X) ≈ 200 50, 000 = 0.004, maka estimasi odds
kejadian PJK pada 1 Januari 2017 adalah:

P( X )
Oˆ X =
1− P ( X )
0.004
= ≈ 4.016‰
1 − 0.004
Tampak bahwa untuk penyakit jarang (rare disease), odds merupakan
aproksimasi yang baik untuk probabilitas.

10
LATIHAN 1

Pilihlah jawaban yang paling benar!

1. Risk adalah:
A. Proporsi anggota populasi yang sakit pada akhir suatu periode.
B. Peluang subjek untuk mendapatkan penyakit selama suatu
periode.
C. Peluang bersyarat subjek untuk mendapatkan penyakit selama
suatu periode, dengan syarat subjek tidak lebih dahulu meninggal
karena penyakit lain.
D. Semuanya salah.

2. Incidence risk adalah:


A. Jumlah subjek yang terkena penyakit dalam suatu periode dibagi
jumlah subjek pada awal periode.
B. Jumlah subjek yang terkena penyakit dalam suatu periode dibagi
jumlah subjek sehat pada awal periode.
C. Jumlah subjek yang terkena penyakit dalam suatu periode dibagi
jumlah subjek pada pertengahan periode.
D. Semuanya salah.

3. Pilihlah yang benar:


A. Kasus prevalens adalah jumlah kasus baru pada periode tertentu.
B. Kasus insidens adalah jumlah kasus lama pada titik waktu
tertentu.
C. (A) dan (B) benar.
D. (A) dan (B) salah.

4. Asumsi metode aktuaria pada estimasi risk ialah:


A. Seluruh kasus drop-out terjadi pada pertengahan periode
pengamatan.
B. Seluruh kasus baru terjadi pada pertengahan periode pengamatan.
C. Seluruh kasus lama dihitung pada pertengahan periode
pengamatan.
D. Semuanya salah.

11
5. Incidence rate adalah:
A. Kecepatan rata-rata perubahan status kesehatan suatu populasi.
B. Kecepatan sesaat perubahan status kesehatan suatu populasi.
C. Kelajuan rata-rata perubahan status kesehatan suatu populasi.
D. Kelajuan sesaat perubahan status kesehatan suatu populasi.

6. Person-time adalah:
A. Jumlah subjek diamati pada awal periode pengamatan dikali lama
pengamatan.
B. Jumlah subjek diamati pada pertengahan periode pengamatan
dikali lama pengamatan.
C. Jumlah subjek diamati pada akhir periode pengamatan dikali lama
pengamatan.
D. Semuanya salah.

7. Prevalensi adalah:
A. Jumlah penderita penyakit pada satu titik waktu.
B. Jumlah penderita penyakit pada satu titik waktu dibagi jumlah
anggota populasi pada titik waktu yang sama.
C. Jumlah penderita penyakit pada satu titik waktu dibagi jumlah
anggota populasi sehat pada titik waktu yang sama.
D. Semuanya salah.

Untuk soal No. 8 s.d. 12:


Dari Dinas Kesehatan kota B diperoleh data berikut:

Tanggal Jumlah penduduk Kasus lama penyakit X


(N) ( Cx )
1-1-2018 20,000 374
1-1-2019 20,500 328
Selama tahun 2018 tercatat 72 kasus baru penyakit X.

8. Estimasi prevalensi penyakit X pada 1 Januari 2018 adalah:


A. 0.0160 C. 0.0035
B. 0.0187 D. 0.0036

12
9. Interval konfidensi 95% prevalensi penyakit X pada 1 Januari 2018
adalah:
A. [0.0135 ; 0.0185] C. [0.0152 ; 0.0222]
B. [0.0141 ; 0.0179] D. [0.0168 ; 0.0206]

10. Estimasi risk penyakit X tahun 2018 adalah:


A. 0.0037 C. 0.0035
B. 0.0036 D. 0.0034

11. Interval konfidensi 95% risk penyakit X tahun 2018 adalah:


A. [0.0026 ; 0.0048] C. [0.0028 ; 0.0045]
B. [0.0025 ; 0.0047] D. [0.0027 ; 0.0043]

12. Estimasi rate penyakit X tahun 2018 adalah:


-1 -1
A. 0.0034 tahun C. 0.0036 tahun
-1 -1
B. 0.0035 tahun D. 0.0037 tahun

Untuk soal No. 13 s.d. 15:


Dimiliki sampel 78 orang manula. Pada awal 2017, 33 orang di
antaranya telah menderita arthritis. Selama tahun 2017 didapatkan 9 orang
penderita baru arthritis. Jika selama tahun 2017 tidak ada subjek yang
meninggal dan tidak ada drop-out, maka:

13. Estimasi risk arthritis selama tahun 2017 adalah:


A. 0.200 C. 0.487
B. 0.222 D. 0.538

14. Estimasi rate arthritis pada tahun 2017 adalah:


-1 -1
A. 0.200 tahun C. 0.487 tahun
-1 -1
B. 0.222 tahun D. 0.538 tahun

15. Estimasi prevalensi arthritis pada akhir tahun 2017 adalah:


A. 0.200 C. 0.487
B. 0.222 D. 0.538

13
BAB 2
UKURAN RASIO

Rasio dalam Epidemologi adalah perbandingan (pembagian) antara


dua ukuran Epidemiologi dengan satuan pengukuran yang sama. Dalam
konteks studi Epidemiologi, perbandingan tersebut adalah antara ukuran
Epidemiologi pada kelompok studi (kelompok yang dipelajari) dengan
ukuran Epidemiologi serupa pada kelompok kontrol.

 Risk Ratio
Risk ratio untuk populasi umumnya didapatkan dari studi
observasional kohort, sedangkan risk ratio untuk kelompok kecil biasanya
diperoleh sebagai hasil studi eksperimental uji klinik (randomized
controlled trial). Untuk studi kohort, lay-out data adalah sebagai berikut:

Penyakit
Pajanan Jumlah
D D
E a b n1
E c d n2
Jumlah m1 m2 n

E : Kelompok terpajan ( E = exposed)


E : Kelompok tak-terpajan ( E = non-exposed)
D : Kelompok sakit ( D = diseased)
D : Kelompok tidak sakit ( D = non-diseased)
Untuk kelompok terpajan (exposed), estimasi risk adalah:

a
CIˆ1 = (2.1.a)
n1

15
CIˆ1 : Estimasi risk (cumulative incidence) pada kelompok terpajan
a : Jumlah kasus baru di antara kelompok terpajan selama periode
pengamatan
n1 : Jumlah subjek sehat pada awal pengamatan (population-at-risk)
untuk kelompok terpajan
Untuk kelompok tak-terpajan (non-exposed), estimasi risk adalah:

c
CIˆ 2 = (2.1.b)
n2

CIˆ 2 : Estimasi risk (cumulative incidence) pada kelompok tak-terpajan


c : Jumlah kasus baru di antara kelompok tak-terpajan selama
periode pengamatan
n2 : Jumlah subjek sehat pada awal pengamatan (population-at-risk)
untuk kelompok tak-terpajan
Estimasi risk ratio adalah:

ˆ
ˆ = CI 1 = a n1
CIR (2.2)
CIˆ 2 c n2

ˆ :
CIR Estimasi risk ratio (cumulative incidence ratio)

ˆ diasumsikan berdistribusi log-normal dengan estimasi variansi


CIR
ln-nya adalah:

( ˆ = 1 − 1 + 1 − 1
ˆ ln CIR
Var ) (2.3)
a n1 c n2
ˆ adalah:
sehingga interval konfidensi 100 (1 − α ) % untuk estimasi ln CIR

ˆ + Z 1 1 1 1
ln CIR α 2 − + − (2.3.a)
a n1 c n2

ˆ (interval
dan interval konfidensi 100(1 – α)% untuk estimasi CIR
konfidensi berbasiskan deret Taylor) adalah:

16
ˆ exp  ± Z
CIR
1

1
+
1

1 
 (2.4)
 α 2
a n1 c n 2 

Contoh 2.1
Misalkan dimiliki data fiktif untuk 10,000 akseptor KB dengan
kontrasepsi oral sebagai kelompok terpajan dan 10,000 wanita usia-subur
yang tidak menggunakan kontrasepsi oral sebagai kelompok tak-terpajan.
Pengamatan selama 4 tahun menunjukkan terjadinya 28 kasus thrombo-
embolisme di antara anggota kelompok terpajan, sedangkan pada kelompok
tak-terpajan, hanya didapatkan 15 kasus thrombo-embolisme. Paparan data
adalah sebagai berikut:

Penyakit
Pajanan Jumlah
TE Normal
Pengguna OC 28 9,972 10,000
Non-pengguna
15 9,985 10,000
OC
Jumlah 43 19,957 20,000
OC : Oral contraceptive
TE : Thrombo-embolism
Estimasi risk pada pengguna OC adalah:

a 28
CIˆ1 = = = 0.0028
n1 10, 000

Estimasi risk pada non-pengguna OC adalah:

c 15
CIˆ 2 = = = 0.0015
n2 10, 000

Estimasi risk ratio adalah:

ˆ
ˆ = CI 1 = 0.0028 = 1.8666 . . . ≈ 1.867
CIR
CIˆ 2 0.0015

17
ˆ ]= 1 − 1 + 1 − 1
ˆ [ln CIR
Var
a n1 c n2
1 1 1 1
= − + − = 0.102
28 10000 15 10000
ˆ (berbasiskan deret Taylor) adalah:
Interval konfidensi 95% untuk CIR

ˆ exp  ± Z
CIR
1

1
+
1

1 

 α 2
a n1 c n 2 

1 1 1 1
atau: 1.867 * exp [+ 1.96 * − + −
28 10000 15 10000
yaitu: [0.998 ; 3.493]

Contoh 2.2

Digunakan file data Stata csxmpl.dta, yang memuat data tabel


2×2 hasil studi kohort untuk 30 subjek.

. use “D:\Epidemiologi\Data\csxmpl.dta”, clear


. list
+------------------+
| case exp pop |
|------------------|
1. | 1 1 7 |
2. | 1 0 12 |
3. | 0 1 9 |
4. | 0 0 2 |
+------------------+

. cs case exp [fw=pop]

18
| exp |
| Exposed Unexposed | Total
------------+------------------------+------------
Cases | 7 12 | 19
Noncases | 9 2 | 11
------------+------------------------+------------
Total | 16 14 | 30
| |
Risk | .4375 .8571429 | .6333333
| Point estimate | [95% Conf. Interval]
|-----------------+------------------------
Risk difference | -.4196429 | -.7240828 -.1152029
Risk ratio | .5104167 | .2814332 .9257086
Prev. frac. ex. | .4895833 | .0742914 .7185668
Prev. frac. pop | .2611111 |
+------------------------------------------
chi2(1) = 5.66 Pr>chi2 = 0.0173

Estimasi risk ratio adalah 0.510 dengan interval konfidensi 95%


[0.281 ; 0.926]. Perhitungan estimasi interval risk ratio pada Stata
dilakukan dengan metode berbasiskan deret Taylor.

Contoh 2.3
Lihat kembali data pada Contoh 2.1:

Penyakit
Pajanan Jumlah
TE Normal
Pengguna OC 28 9,972 10,000
Non-pengguna OC 15 9,985 10,000
Jumlah 43 19,957 20,000

Dengan Stata diperoleh:

. csi 28 15 9972 9985

19
| Exposed Unexposed | Total
-----------+------------------------+--------
Cases | 28 15 | 43
Noncases | 9972 9985 | 19957
-----------+------------------------+--------
Total | 10000 10000 | 20000
Risk | .0028 .0015 | .00215
| Point estimate | [95% Conf. Interval]
|-----------------+---------------------
Risk difference | .0013 | .0000163 .0025837
Risk ratio | 1.866667 | .9976398 3.492688
Attr. frac. ex. | .4642857 | -.0023658 .7136876
Attr. frac. pop | .3023256 |
+---------------------------------------
chi2(1) = 3.94 Pr>chi2 = 0.0472

 Odds Ratio
Odds ratio biasanya digunakan untuk data studi kasus-kontrol,
tetapi adakalanya karena penggunaan analisis statistik tertentu, dipakai juga
untuk data studi kohort ataupun data uji klinik. Untuk penyakit yang jarang
ditemukan (rare disease), odds ratio merupakan aproksimasi yang baik
untuk risk ratio. Lay-out data untuk studi kasus-kontrol dalam sampel
adalah sebagai berikut:

Penyakit
Pajanan
C C
E a b
E c d
Jumlah m1 m2

E : Kelompok terpajan ( E = exposed)


E : Kelompok tak-terpajan ( E = non-exposed)
C : Kelompok kasus ( C = cases)
C : Kelompok kontrol ( C = controls)

20
sedangkan dalam populasi didapatkan:

Penyakit
Pajanan
C C
E A B
E C D
Jumlah M1 M2

Odds sakit dalam populasi untuk kelompok terpajan (exposed)


adalah:

A
O1 = (2.5.a)
B

O1 : Odds sakit (odds disease) pada kelompok terpajan


A : Jumlah kasus (lama) yang terpajan
B : Jumlah kontrol (subjek sehat) yang terpajan

Odds sakit dalam populasi untuk kelompok tak-terpajan (non-


exposed) adalah:

C
O2 = (2.5.b)
D

O2 : Odds sakit (odds disease) pada kelompok tak-terpajan


C : Jumlah kasus (lama) yang tak-terpajan
D : Jumlah kontrol (subjek sehat) yang tak-terpajan
Odds ratio populasi adalah:

O1 AB AD
OR = = = (2.6)
O2 C D BC

Estimasinya pada sampel adalah:

Oˆ 1 ad
ÔR = = (2.6.a)
ˆ
O2 bc

ÔR : Estimasi odds ratio

21
ÔR juga diasumsikan berdistribusi log-normal dengan estimasi
variansi ln-nya adalah:

1 1 1 1

ˆ ln OR
Var =
a
)
+
b
+
c
+
d
(2.7)

ˆ adalah:
sehingga interval konfidensi 100 (1 − α ) % untuk estimasi ln OR

ˆ + Z 1 1 1 1
ln OR α 2 + + + (2.7a)
a b c d

dan interval konfidensi 100(1 – α)% untuk estimasi ÔR (interval


konfidensi berbasiskan deret Taylor) adalah:

 1 1 1 1
ÔR exp  ± Zα 2 + + +  (2.8)
 a b c d

Contoh 2.4
Lihat kembali data pada Contoh 2.1. Thrombo-embolisme
merupakan kasus yang jarang, sehingga untuk data Contoh 2.1, odds ratio
merupakan aproksimasi yang baik untuk risk ratio.

Estimasi odds ratio adalah:

ÔR =
ad
=
( 28 )( 9, 985 ) = 1.86910 . . . ≈ 1.869
bc ( 9,972 )(15)
Tampak bahwa nilai odds ratio di sini hampir sama dengan nilai
risk ratio yang diperoleh pada Contoh 2.1 (berlaku untuk penyakit jarang).

1 1 1 1
ˆ [ln ÔR ] =
Var + + +
a b c d
1 1 1 1
= + + + = 0.103
28 9972 15 9985

22
Interval konfidensi 95% untuk ÔR (berbasiskan deret Taylor) adalah:

 1 1 1 1
ÔR exp  ± Zα 2 + + + 
 a b c d

1 1 1 1
atau: 1.869 * exp [+ 1.96 + + +
28 9972 15 9985

yaitu: [0.998 ; 3.502]

Contoh 2.5
Dimiliki file data ccxmpl.dta hasil uji kasus-kontrol dalam bentuk
tabel 2×2.

. use "D:\Epidemiologi\ccxmpl.dta"
. list
+-----------------------+
| case exposed pop |
|-----------------------|
1. | 1 1 4 |
2. | 1 0 386 |
3. | 0 1 4 |
4. | 0 0 1250 |
+-----------------------+

. cc case exposed [fw=pop]


Proportion
| Exposed Unexposed | Total Exposed
--------------+------------------------+-------------------
Cases | 4 386 | 390 0.0103
Controls | 4 1250 | 1254 0.0032
--------------+------------------------+-------------------
Total | 8 1636 | 1644 0.0049

23
| Point estimate | [95% Conf. Interval]
|----------------+---------------------
Odds ratio | 3.238342 | .5997233 17.45614 (exact)
Attr. frac. ex. | .6912 | -.6674356 .9427136 (exact)
Attr. frac. pop | .0070892 |
+--------------------------------------
chi2(1) = 3.07 Pr>chi2 = 0.0799

Estimasi odds ratio adalah 3.238 dengan interval konfidensi 95%


[0.600 ; 17.456]. Estimasi interval odds ratio pada Stata dilakukan dengan
metode eksak.

Contoh 2.6
Lihat kembali data pada Contoh 2.1 dan 2.4:

Penyakit
Pajanan Jumlah
TE Normal
Pengguna OC 28 9,972 10,000
Non-pengguna OC 15 9,985 10,000
Jumlah 43 19,957 20,000

Analisis data dengan Stata menghasilkan:

. cci 28 15 9972 9985


Proportion
| Exposed Unexposed | Total Exposed
---------+----------------------+-------------------
Cases | 28 15 | 43 0.6512
Controls | 9972 9985 | 19957 0.4997
---------+----------------------+-------------------
Total | 10000 10000 | 20000 0.5000

24
| Point estimate | [95% Conf. Interval]
|------------------+---------------------
Odds ratio | 1.8691 | .9638846 3.767324 (exact)
Attr. frac. ex. | .4649832 | -.0374686 .7345596 (exact)
Attr. frac. pop | .3027798 |
+----------------------------------------
chi2(1) = 3.94 Pr>chi2 = 0.0472

 Rate Ratio
Rate ratio diperoleh pada studi densitas, yaitu studi follow-up
dengan person-time.

Lay-out data untuk perhitungan rate ratio adalah sebagai berikut:

Pajanan I PT
E a L1
E b L2
Jumlah m1 L

E : Kelompok terpajan ( E = exposed)


E : Kelompok tak-terpajan ( E = non-exposed)
I : Jumlah kasus insidens dalam periode pengamatan
PT : Person-time

Estimasi rate pada kelompok terpajan adalah:

ˆ = a
ID (2.9.a)
1
L1

ˆ
ID 1 : Estimasi rate (incidence density) pada kelompok terpajan
a : Jumlah kasus insidens dalam periode pengamatan pada kelompok
terpajan
L1 : Person-time untuk kelompok terpajan

25
Estimasi rate pada kelompok tak-terpajan adalah:

ˆ = b
ID (2.9.b)
2
L2

ˆ
ID 2 : Estimasi rate (incidence density) pada kelompok tak-terpajan
b : Jumlah kasus insidens dalam periode pengamatan pada kelompok
tak-terpajan
L2 : Person-time untuk kelompok tak-terpajan

Estimasi rate ratio adalah:

ˆ
ˆ = ID1 = a L1
IDR (2.10)
ˆ
ID b L2
2

ˆ
IDR : Estimasi rate ratio (incidence density ratio)

ˆ
IDR diasumsikan berdistribusi log-normal dengan estimasi variansi
ln-nya adalah:
1 1
Var (ˆ
ˆ ln IDR =
a
)+
b
(2.11)

ˆ
sehingga interval konfidensi 100 (1 − α ) % untuk estimasi ln IDR adalah:

ˆ 1 1
ln IDR + Zα 2 + (2.11.a)
a b
ˆ
dan interval konfidensi 100(1 – α)% untuk estimasi IDR (interval
konfidensi berbasiskan deret Taylor) adalah:
 1 1 
ˆ
IDR exp  ± Zα +  (2.12)
b 
2
 a

Contoh 2.7
Dimiliki data densitas hasil uji klinik berikut. Tiga puluh subjek
diikutsertakan dalam penelitian 15 subjek dalam kelompok perlakuan

26
(treatment), yaitu asupan vitamin C harian, dan 15 subjek lainnya diberikan
plasebo. Pengamatan dilakukan selama 6 bulan.

Penyakit
Perlakuan Common
PT
cold
Vit C 5 79
Plasebo 7 69
Jumlah 148

Estimasi rate pada kelompok perlakuan adalah:

ˆ = a = 5 ≈ 0.063
ID 1
L1 79

Estimasi rate pada kelompok kontrol adalah:

ˆ = b = 7 ≈ 0.101
ID 2
L2 69
Estimasi rasio risiko adalah:
ˆ
ˆ = ID1 = 0.063 ≈ 0.624
IDR
ˆ
ID 0.101
2

ˆ ]= 1 +
ˆ [ln IDR
Var
1
a b
1 1
= + = 0.343
5 7
ˆ
Interval konfidensi 95% untuk IDR (berbasiskan deret Taylor) adalah:
 1 1 
ˆ
IDR exp  ± Zα + 
b 
2
 a

1 1
atau: 0.624*exp [+1.96* +
5 7
yaitu: [0.198 ; 1.966]

27
Contoh 2.8
File data irxmpl.dta berikut memuat data hasil studi kohort dengan
data densitas.

. use "D:\Epidemiologi\Data\irxmpl.dta"
. list
+-------------------------+
| cases exposed time |
|-------------------------|
1. | 41 0 28010 |
2. | 15 1 19017 |
+-------------------------+

. ir cases exposed time


| exposed |
| Exposed Unexposed | Total
---------------+----------------------+---------
cases | 15 41 | 56
time | 19017 28010 | 47027
---------------+----------------------+---------
| |
Incidence rate | .0007888 .0014638 | .0011908

| Point estimate | [95% Conf. Interval]


|----------------+---------------------
Inc. rate diff. | -.000675 | -.0012751 -.0000749
Inc. rate ratio | .5388632 | .277062 .9943481 (exact)
Prev. frac. ex. | .4611368 | .0056519 .722938 (exact)
Prev. frac. pop | .1864767 |
+--------------------------------------
(midp) Pr(k<=15) = 0.0177 (exact)
(midp) 2*Pr(k<=15) = 0.0355 (exact)

Estimasi rate ratio adalah 0.539 dengan interval konfidensi 95%


[0.277 ; 0.994].

28
Contoh 2.9
Lihat kembali data pada Contoh 2.7:

Penyakit
Perlakuan Common
PT
cold
Vit C 5 79
Plasebo 7 69
Jumlah 148

Analisis data dengan Stata adalah sebagai berikut:

. iri 5 7 79 69
| Exposed Unexposed | Total
---------------+----------------------+---------
Cases | 5 7 | 12
Person-time | 79 69 | 148
---------------+----------------------+---------
| |
Incidence rate | .0632911 .1014493 | .0810811

| Point estimate | [95% Conf. Interval]


|----------------+---------------------
Inc. rate diff. | -.0381581 | -.1315691 .0552529
Inc. rate ratio | .6238698 | .1561338 2.283479 (exact)
Prev. frac. ex. | .3761302 | -1.283479 .8438662 (exact)
Prev. frac. pop | .2007722 |
+--------------------------------------
(midp) Pr(k<=5) = 0.2173 (exact)
(midp) 2*Pr(k<=5) = 0.4347 (exact)

Estimasi rate ratio adalah 0.624. Dengan metode eksak, diperoleh


interval konfidensi 95% untuk rate ratio yaitu [0.156 ; 2.283].

29
LATIHAN 2

Pilihlah jawaban yang paling benar!

1. Untuk mempelajari pengaruh faktor usia terhadap tekanan darah


sistolik, rancangan studi yang terbaik adalah:
A. Studi kohort.
B. Studi kasus-kontrol.
C. Studi potong-lintang
D. Studi eksperimental

Untuk soal No. 2 dan 3:


Dimiliki paparan hasil studi kohort dalam bentuk tabel 2×2 berikut:

D D
E a b n1
E c d n2
m1 m2 n

2. Fraksi c n2 menyatakan:
A. Proporsi subjek yang sakit pada kelompok terpajan.
B. Proporsi subjek yang sakit pada kelompok tak-terpajan.
C. Proporsi subjek yang tidak sakit pada kelompok tak-terpajan.
D. Proporsi subjek terpajan pada kelompok yang sakit.

3. Pernyataan yang menunjang kemungkinan asosiasi positif antara faktor


risiko E dengan penyakit D jika n merupakan 1 sampel adalah:
A. a n1 > c n2 C. a b > c d
B. a m1 > b m 2 D. Semuanya salah.

30
4. Pilihlah yang benar:
A. Kasus prevalens adalah jumlah kasus baru pada periode tertentu.
B. Kasus insidens adalah jumlah kasus lama pada titik waktu
tertentu.
C. (A) dan (B) benar.
D. (A) dan (B) salah.

Untuk soal No. 5 s.d. 7:


Dilakukan studi kasus-kontrol dengan pemeriksaan post-mortem 50
pengemudi yang meninggal pada kecelakaan lalu-lintas dan sebagai kontrol,
50 pengemudi yang mengalami kecelakaan tetapi tidak meninggal. Dari 50
pengemudi yang tidak meninggal, 12 orang memakai sabuk pengaman,
sedang dari kelompok yang meninggal, hanya 6 orang yang memakainya.

5. Estimasi rasio odds adalah:


A. 0.432 C. 0.579
B. 0.500 D. 0.621

6. Dengan asumsi rasio odds berdistribusi log-normal, interval konfidensi


95% rasio odds adalah:
A. [0.074 ; 0.744] C. [0.295 ; 1.408]
B. [0.195 ; 0.865] D. [0.148 ; 1.261]

7. Dengan tingkat signifikansi 0.05, kesimpulan yang diperoleh yaitu:


A. Ditemukan hubungan antara penggunaan sabuk pengaman dengan
kematian pengemudi.
B. Tidak ditemukan hubungan antara penggunaan sabuk pengaman
dengan kematian pengemudi.
C. Belum diperoleh kesimpulan tentang hubungan antara
penggunaan sabuk pengaman dengan kematian pengemudi.
D. Semuanya salah.

31
Untuk soal No. 8 dan 9:
Selain data untuk soal No. 5 s.d. 7 di atas, diperoleh pula hasil survei
tambahan bahwa estimasi proporsi pengguna sabuk pengaman pada populasi
pengemudi yang mengalami kecelakaan lalu lintas adalah 0.2.

8. Estimasi risk pada kelompok pengguna sabuk pengaman adalah:


A. 0.120 C. 0.333
B. 0.200 D. 0.367

9. Estimasi rasio risk antar kedua kelompok adalah:


A. 0.433 C. 0.644
B. 0.456 D. 0.725

Untuk soal No. 10 s.d. 12:


Dilakukan studi densitas tentang stadium penyakit X saat diagnosis
dibuat dengan durasi survivalnya. Hasilnya yaitu:

Kematian dan durasi survivalnya


Stadium III Stadium II Stadium I
Kematian 12 7 5
PT (dalam bulan) 107 95 103

10. Estimasi rate penderita stadium I adalah:


A. 0.016 C. 0.049
B. 0.039 D. 0.112

11. Estimasi rasio rate penderita stadium II terhadap penderita stadium I


adalah:
A. 0.533 C. 1.522
B. 1.518 D. 2.310

12. Estimasi rasio rate penderita stadium III terhadap penderita stadium I
adalah:
A. 0.533 C. 1.522
B. 1.518 D. 2.310

32
BAB 3
BIAS DAN KONFAUNDING

 Bias
Bias adalah deviasi sistematik hasil estimasi suatu parameter dengan
nilai parameter sebenarnya (gambar 3.1). Bias dapat menyebabkan estimasi
hubungan antara pajanan dengan respons menjadi lebih besar daripada
sesungguhnya (overestimated association), atau sebaliknya menjadi lebih
kecil daripada hubungan sesungguhnya (underestimated association), atau
bahkan sampai pembalikan hubungan (faktor risiko menjadi preventif, atau
sebaliknya). Tiga tipe bias yang lazim ditemukan adalah bias seleksi, bias
informasi, dan konfaunding.

Gambar 3.1 Bias dan galat sistematik

 Bias Seleksi

Bias seleksi adalah deviasi hasil estimasi suatu parameter yang


disebabkan cara seleksi subjek penelitian untuk menjadi anggota sampel.
Cara seleksi yang dipilih mengakibatkan distorsi hubungan antara pajanan
dan respons pada kelompok anggota sampel terpilih, dibandingkan dengan
hubungan antara pajanan dan respons pada kelompok anggota sampel yang
“seharusnya” terpilih.

33
Contoh 3.1
Pada studi hubungan antara radiasi nuklir dengan kejadian leukemia
(Caldwell, 1980), dilakukan pelacakan terhadap mantan petugas percobaan
nuklir di gurun Nevada, Amerika Serikat untuk mendapatkan anggota sampel
penelitian. Dari anggota sampel yang diperoleh, 82% adalah hasil pelacakan
petugas penelitian, sedangkan 18% sisanya terdiri atas mantan petugas
percobaan nuklir yang menghubungi peneliti atas inisiatif mereka sendiri
(self selection).
Di antara 82% anggota sampel hasil pelacakan petugas penelitian,
ditemukan 4 kasus leukemia, tetapi di antara 18% anggota sampel yang
menghubungi peneliti atas inisiatif sendiri juga didapatkan 4 kasus leukemia.
Prevalensi leukemia yang jauh lebih tinggi di antara anggota sampel yang
datang sendiri menghubungi peneliti adalah fenomena self selection bias,
yang merupakan salah satu bentuk bias seleksi.

 Bias Informasi

Bias informasi adalah deviasi hasil estimasi suatu parameter yang


disebabkan ketidaktepatan pengukuran tingkat pajanan ataupun responsnya
secara sistematik. Bias informasi terjadi karena alat ukur atau prosedur
pengukuran yang digunakan tidak valid, atau informasi yang diperoleh tidak
lengkap (data kosong; missing data).

Contoh 3.2
Salah satu bentuk bias informasi ialah recall bias, yang banyak
ditemukan pada studi kasus-kontrol. Pada studi efek teratogenik obat tertentu
pada ibu hamil terhadap kejadian cacat lahir bayi, data riwayat penggunaan
obat selama kehamilan seringkali harus diperoleh melalui anamnesis, yang
sangat tergantung pada daya ingatan ibu.
Seringkali pula ditemukan, bahwa ibu yang melahirkan bayi cacat
lebih mudah mengingat obat-obat yang dikonsumsi selama kehamilan (recall

34
bias), dibandingkan dengan ibu yang melahirkan bayi normal. Recall bias
adalah salah satu bentuk bias informasi.
Bias seleksi dan bias informasi umumnya hanya dapat dikendalikan
pada tahap perancangan, yang tidak akan dibahas secara rinci dalam buku
ini. Bias seleksi diharapkan dapat dikendalikan dengan pengambilan sampel
secara acak (random sampling), sedangkan bias informasi diatasi dengan
menggunakan devais medik ataupun kuesioner penelitian yang teruji valid
dan reliabel.

 Konfaunding
Konfaunding adalah distorsi estimasi efek suatu pajanan terhadap
respons karena asosiasi pajanan dengan faktor lain (konfaunder) yang juga
berpengaruh terhadap respons tersebut. Konfaunding terjadi jika
pengestimasian efek pajanan terhadap respons dilakukan tanpa
memperhitungkan keberadaan konfaunder. Karena keberadaan konfaunder
umumnya tak diketahui, konfaunding praktis hanya dapat dikendalikan
dalam tahap perancangan pada studi eksperimental, yaitu dengan
randomisasi perlakuan. Dalam studi observasional, konfaunder umumnya
harus dikendalikan dalam tahap analisis data.

Hasil estimasi efek pajanan terhadap respons tanpa


memperhitungkan keberadaan konfaunder dinamakan estimasi kasar (crude
estimate), sedangkan hasil estimasi pajanan terhadap respons dengan
memperhitungkan keberadaan konfaunder dinamakan estimasi suaian
(adjusted estimate). Untuk konfaunder kategorik, penyesuaian dilakukan
dengan melakukan estimasi secara terpisah pada tiap kategori konfaunder,
lalu dihitung nilai summary-nya. Keberadaan konfaunder tidak ditentukan
oleh hasil uji statistik, namun semata-mata ditentukan oleh nilai estimasi
suaian yang jelas berbeda dengan nilai estimasi kasar.

Fenomena lain yang mungkin didapatkan menyertai konfaunding


adalah interaksi. Interaksi tidak selalu ada menyertai konfaunding, dan
interaksi bukan merupakan salah satu bentuk bias. Interaksi dinyatakan ada
jika pada penyesuaian dengan konfaunder K seperti pada contoh di atas,

35
didapatkan nilai rasio odds stratum-spesifik yang jelas berbeda antar stratum.
Keberadaan interaksi harus dibuktikan dengan uji statistik dan akan dibahas
lebih lanjut kemudian.

Uji statistik terhadap interaksi harus dilakukan terlebih dahulu


sebelum penilaian konfaunding. Seandainya didapatkan interaksi yang kuat,
estimasi efek harus dilaporkan secara spesifik untuk tiap stratum konfaunder
dan tidak boleh dilakukan perhitungan nilai summary-nya. Dalam hal ini,
konfaunding dianggap tidak mungkin dinilai keberadaannya dan dianggap
tidak ada.

 Studi Kasus-Kontrol

Misalkan pada studi efek pajanan E terhadap penyakit C dalam


rancangan studi kasus-kontrol, diperoleh rasio odds kasar (crude odds ratio)
ˆ . Selanjutnya pada penyesuaian dengan konfaunder F yang memiliki 2
cOR
kategori, pada stratum 1 F didapatkan rasio odds spesifik-stratum ÔR1 dan
pada stratum 2 F didapatkan rasio odds spesifik-stratum ÔR 2 . Maka dapat
diimplikasikan bahwa nilai summary keduanya, yaitu nilai rasio odds suaian
ˆ berkisar antara ÔR dan ÔR dengan:
(adjusted odds ratio) aOR 1 2

ˆ < ÔR
ÔR1 < aOR 2

Konfaunding dinyatakan ada jika:


ˆ ≠ cOR
aOR ˆ

36
Lay-out data untuk contoh di atas adalah sebagai berikut:
Gabungan

Penyakit
Pajanan Jumlah
C C
E a b
E c d
Jumlah n

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
C C C C
E a1 b1 E a2 b2
E c1 d1 E c2 d2
Jumlah n1 Jumlah n2

dengan:
ˆ = ad
cOR (3.1)
bc
a 1d1
dan: ÔR1 = (3.2.a)
b1c1
a 2 d2
ÔR 2 = (3.2.b)
b 2c2

Jika tidak ditemukan interaksi, estimasi rasio odds suaian dapat


dihitung dengan estimator Mantel-Haenszel:
2 a i di

i =1n
ˆ
aOR = 2 i (3.3)
MH
bi ci

i =1 ni

37
Contoh 3.3
Misalkan dimiliki data hipotetis studi kasus-kontrol pada tabel 2×2
berikut dan stratifikasinya menurut taraf biner konfaunder F.

Gabungan
Penyakit
Pajanan Jumlah
C C
E 550 400
E 450 600
Jumlah 2000

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
C C C C
E 520 180 E 30 220
E 300 100 E 150 500
Jumlah 1100 Jumlah 900

Estimasi rasio odds kasar adalah:


ˆ = ad
cOR
bc

=
( 550 )( 600 ) ≈ 1.83
( 400 )( 450 )
Dengan stratifikasi diperoleh:
a 1d1
ÔR1 =
b1c1

=
( 520 )(100 ) ≈ 0.96
(180 )( 300 )
a 2 d2
ÔR 2 =
b 2c2

=
( 30 )( 500 ) ≈ 0.45
( 220 )(150 )

38
Dengan metode Mantel-Haenszel diperoleh estimator suaian:
2a i di
∑ n
i =1
ˆ
aOR = 2 i
MH
bi ci

i =1 ni

( 520 )(100 ) + ( 30 )( 500 )


= 1100 900 ≈ 0.75
(180 )( 300 ) + ( 220 )(150 )
1100 900
ˆ < ÔR
Tampak bahwa ÔR 2 < aOR 1

atau: ˆ < 0.96 dan


0.45 < aOR ˆ ≠ cOR
aOR ˆ

Contoh 3.4
File data downs.dta memuat variabel pajanan exposed, penyakit
case, dan konfaunder age.

. use "D:\Epidemiologi\downs.dta"
. list
+-----------------------------+
| case exposed pop age |
|-----------------------------|
1. | 1 1 3 <35 |
2. | 1 0 9 <35 |
3. | 0 1 104 <35 |
4. | 0 0 1059 <35 |
5. | 1 1 1 35+ |
|-----------------------------|
6. | 1 0 3 35+ |
7. | 0 1 5 35+ |
8. | 0 0 86 35+ |
+-----------------------------+

39
. cc case exposed [fw=pop], by(age)
Maternal age | OR [95% Conf. Interval] M-H Weight
-------------+-------------------------------------------
<35 | 3.394231 .5812415 13.87412 .7965957 (exact)
35+ | 5.733333 .0911619 85.89602 .1578947 (exact)
-------------+-------------------------------------------
Crude | 3.501529 .8080857 11.78958 (exact)
M-H combined | 3.781172 1.18734 12.04142
----------------------------------------------------------
Test of homogeneity (M-H) chi2(1) = 0.14 Pr>chi2 = 0.7105
Test that combined OR = 1:
Mantel-Haenszel chi2(1) = 5.81
Pr>chi2 = 0.0159
ˆ = 3.502
cOR
ÔR1 = 3.394 ÔR 2 = 5.733
ˆ
aORMH = 3.781

 Studi Kohort
Untuk studi kohort, lay-out data adalah sebagai berikut:

Gabungan
Penyakit
Pajanan Jumlah
D D
E a b n1
E c d n2
Jumlah n

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
D D D D
E a1 b1 n 11 E a2 b2 n 21
E c1 d1 n 12 E c2 d2 n 22
Jumlah n1 Jumlah n2

40
dengan:
ˆ = a n1
cCIR (3.4)
c n2

dan: ˆ = a 1 n 11
CIR (3.5.a)
1
c1 n 12

ˆ = a 2 n 21
CIR (3.5.b)
2
c2 n 22

Jika tidak ditemukan interaksi, estimasi rasio risiko suaian dapat


dihitung dengan estimator Mantel-Haenszel:
2 a i n 2i

i =1 ni
ˆ
aCIR = 2 (3.6)
MH
c i n 1i

i =1 ni

Contoh 3.5
Misalkan dimiliki data hipotetis studi kohort pada tabel 2×2 berikut
dan stratifikasinya menurut taraf biner konfaunder F.
Gabungan
Penyakit
Pajanan Jumlah
D D
E 200 800 1000
E 50 950 1000
Jumlah 2000

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
D D D D
E 194 706 900 E 6 94 100
E 21 79 100 E 29 871 900
Jumlah 1000 Jumlah 1000

41
Estimasi rasio risiko kasar adalah:

ˆ = a n1
cCIR
c n2
200 1000
= = 4.0
50 1000
Estimasi rasio risiko spesifik stratum masing-masing adalah:

ˆ = a 1 n 11
CIR 1
c1 n 12
194 900
= ≈ 1.03
21 100

ˆ = a 2 n 21
CIR 2
c2 n 22
6 100
= ≈ 1.86
29 900

Dengan asumsi tidak ada interaksi, estimasi rasio risiko suaian


Mantel-Haenszel adalah:
2 a n
i 2i

i =1 ni
aCIRˆ
MH = 2
c i n 1i

i =1 ni

(194 )(100 ) + ( 6 )( 900 )


= 1000 1000 ≈ 1.14
( )( ) + ( )(100 )
21 900 29
1000 1000

Contoh 3.6
File ugdp.dta berikut, memuat data hasil studi kohort dengan
variabel exposed sebagai pajanan, case sebagai penyakit, dan age sebagai
konfaunder.

42
. use "D:\Epidemiologi\Data\ugdp.dta"
. list
+----------------------------+
| age case exposed pop |
|----------------------------|
1. | <55 0 0 115 |
2. | <55 0 1 98 |
3. | <55 1 0 5 |
4. | <55 1 1 8 |
5. | 55+ 0 0 69 |
|----------------------------|
6. | 55+ 0 1 76 |
7. | 55+ 1 0 16 |
8. | 55+ 1 1 22 |
+----------------------------+

. cs case exposed [fw=pop], by(age)


Age category | RR [95% Conf. Interval] M-H Weight
-------------+---------------------------------------------
<55 | 1.811321 .6112044 5.367898 2.345133
55+ | 1.192602 .6712664 2.11883 8.568306
-------------+---------------------------------------------
Crude | 1.435574 .8510221 2.421645
M-H combined | 1.325555 .797907 2.202132
-----------------------------------------------------------
Test of homogeneity (M-H) chi2(1) = 0.447 Pr>chi2 = 0.5037

ˆ = 1.436
cCIR
ˆ = 1.811
CIR ˆ = 1.193
CIR
1 2
ˆ
aCIRMH = 1.326

43
 Studi Densitas
Untuk studi densitas, lay-out data adalah sebagai berikut:
Gabungan
Penyakit
Pajanan
I PT
E a L1
E b L2
Jumlah L

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Pajanan
I PT I PT
E a1 L 11 E a2 L 21
E b1 L 12 E b2 L 22
Jumlah L1 Jumlah L2

dengan:
ˆ a L1
cIDR = (3.7)
b L2

ˆ a 1 L11
dan: IDR 1 = (3.8.a)
b1 L 12

ˆ a 2 L 21
IDR 2 = (3.8.b)
b2 L 22

Jika tidak ditemukan interaksi, estimasi rasio risiko suaian dapat


dihitung dengan estimator Mantel-Haenszel:
2 a i Li 2

i =1 Li
ˆ
aIDR = 2 (3.9)
MH
bi L i 1

i =1 Li

44
Contoh 3.7
Dimiliki data hipotetis studi densitas pada tabel 2×2 berikut dan
stratifikasinya menurut taraf biner konfaunder F.

Gabungan
Penyakit
Pajanan
I PT
E 30 699
E 36 1,399
Jumlah 2,098

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Pajanan
I PT I PT
E 18 499 E 12 200
E 20 989 E 16 410
Jumlah 1,488 Jumlah 610

Estimasi rasio rate kasar adalah:

ˆ a L1 30 699
cIDR = = ≈ 1,67
b L2 36 1,399
Estimasi rasio rate spesifik-stratum masing-masing adalah:

ˆ a 1 L11
IDR 1 =
b1 L 12
18 499
= ≈ 1,78
20 989

ˆ a 2 L 21
IDR 2 =
b2 L 22
12 200
= ≈ 1.54
16 410

ˆ
Tampak bahwa IDR ˆ ˆ
2 < cIDR < IDR1 , sehingga penyesuaian
estimasi rasio rate dengan F tidak diperlukan. Walaupun demikian, sebagai
latihan akan tetap dihitung estimator rasio rate suaian Mantel-Haenszel,

45
sekaligus untuk memperlihatkan bahwa nilainya tidak berbeda jauh dengan
estimator rasio rate kasar.
2a i Li 2

i =1 Li
ˆ
aIDR = 2
MH
bi L i 1

i =1 Li

(18)( 989 ) + (12 )( 410 )


1, 488 610
= ≈ 1.68
( 20 )( 499 ) + (16 )( 200 )
1, 488 610

Tampak bahwa nilai estimator rasio rate suaian Mantel-Haenszel


ˆ
aIDRMH ≈ 1.68 praktis hampir sama dengan nilai estimator rasio rate kasar
ˆ
cIDR ≈ 1.67.

Contoh 3.8
File berikut memperlihatkan jumlah kematian deaths (penyakit)
menurut jenis kelamin male (pajanan) dengan konfaunder usia age.

. use "D:\Epidemiologi\rm.dta"
(Rothman and Monson 1973 data)

. list
+------------------------------+
| age male deaths pyears |
|------------------------------|
1. | <65 1 14 1516 |
2. | <65 0 10 1701 |
3. | 65+ 1 76 949 |
4. | 65+ 0 121 2245 |
+------------------------------+

46
. ir deaths male pyears, by(age)
Age category | IRR [95% Conf. Interval] M-H Weight
-------------+-------------------------------------------
<65 | 1.570844 .6489373 3.952809 4.712465 (exact)
65+ | 1.485862 1.100305 1.99584 35.95147 (exact)
-------------+-------------------------------------------
Crude | 1.099794 .831437 1.449306 (exact)
M-H combined | 1.49571 1.141183 1.960377
----------------------------------------------------------
Test of homogeneity (M-H) chi2(1) = 0.02 Pr>chi2 = 0.8992

ˆ
cIDR = 1.100
ˆ
IDR 1 = 1.571

ˆ
IDR 2 = 1.486

ˆ
aIDRMH = 1.496

47
LATIHAN 3

Pilihlah jawaban yang paling benar!

1. Bias adalah:
A. Deviasi acak nilai estimasi parameter terhadap nilai sebenarnya.
B. Deviasi sistematik nilai estimasi parameter terhadap nilai
sebenarnya.
C. A) dan B) benar.
D. A) dan B) salah.

2. Efek bias yaitu:


A. Selalu mengakibatkan nilai estimasi parameter lebih besar
daripada nilai sebenarnya.
B. Kadang-kadang mengakibatkan nilai estimasi parameter lebih
besar daripada nilai sebenarnya.
C. Tidak pernah mengakibatkan nilai estimasi parameter lebih besar
daripada nilai sebenarnya.
D. Semuanya salah.

3. Tipe bias yang lazim ditemukan pada studi observasional:


A. Performance bias, recall bias, dan susceptibility bias.
B. Bias deteksi, bias transfer, dan distorsi penghimpunan
C. Bias seleksi, bias informasi, dan konfaunding.
D. Semuanya salah.

4. Recall bias merupakan salah satu bentuk:


A. Bias seleksi. C. Konfaunding.
B. Bias informasi. D. Semuanya salah.

5. Stratifikasi merupakan salah satu metode pengendalian:


A. Bias seleksi. C. Konfaunding.
B. Bias informasi. D. Semuanya benar.

48
6. Pilihlah yang benar:
A. Konfaunding tidak perlu dikendalikan.
B. Interaksi selalu harus dikendalikan.
C. A) dan B) benar.
D. A) dan B) salah.

7. Konfaunding dapat dikendalikan pada:


A. Tahap pengumpulan data.
B. Tahap analisis data.
C. A) dan B) benar.
D. A) dan B) salah.

Untuk soal No. 8 s.d. 12:


Dimiliki data hipotetis hasil studi kasus-kontrol sebagai berikut:

F F
C C C C
E 280 120 320 280
E 70 30 230 670

8. Estimasi rasio odds kasar adalah adalah:


A. 1.00 C. 3.50
B. 3.33 D. 4.33

9. Pernyataan yang benar mengenai estimasi rasio odds suaian yaitu:


A. aOR ˆ < 1.00 C. aOR ˆ > 3.33
B. ˆ < 3.33
1.00 < aOR D. Tidak dapat dihitung.

10. Estimasi rasio odds kovariabel F terhadap penyakit C pada kelompok


tak terpajan adalah:
A. 2.04 C. 6.80
B. 4.93 D. 8.84

49
11. Estimasi rasio odds kovariabel F terhadap pajanan E pada kelompok
kontrol adalah:
A. 2.88 C. 9.57
B. 4.50 D. 12.45

12. Pada hasil studi kasus-kontrol di atas didapatlan:


A. Interaksi.
B. Konfaunding.
C. A) dan B) benar.
D. A) dan B) salah.

50
BAB 4
SENSITIVITAS DAN SPESIFISITAS

 Pengertian Sensitivitas dan Spesifisitas


Sensitivitas dan spesifisitas adalah ukuran akurasi suatu uji
diagnostik, yaitu pemeriksaan yang dilakukan terhadap anggota populasi
yang dianggap bebas-penyakit ataupun tersangka penderita penyakit tertentu
untuk menilai status kesehatan mereka. Tidak ada uji diagnostik yang
sempurna akurasinya.

Secara sederhana, hasil suatu pemeriksaan dapat dinyatakan positif


(tak normal) ataupun negatif (normal). Jika hasilnya positif dan penyakit
benar ada, keadaan ini dinamakan positif benar (true positive) dan jika
hasilnya positif tetapi penyakit tidak ada, keadaan ini dinamakan positif
palsu (false positive).

Jika hasil pemeriksaan negatif dan penyakit benar tidak ada, keadaan
ini dinamakan negatif benar (true negative) dan jika hasilnya negatif tetapi
penyakit ada, keadaan ini dinamakan negatif palsu (false negative). Secara
skematis keempat keadaan ini dapat digambarkan pada tabel 4.1 di bawah
ini.

Tabel 4.1 Hasil uji diagnostik dan status penyakit

Hasil uji Status penyakit


diagnostik Ada Tidak ada
Positif True positive False positive
Negatif False negative True negative

Status penyakit sebenarnya diperoleh melalui pemeriksaan yang


memastikan diagnosis, yang disebut sebagai gold standard. Dalam praktik
pemeriksaan gold standard tidak rutin dilaksanakan, karena mungkin

51
membutuhkan biaya besar, waktu yang lama untuk mendapatkan hasil, tidak
tersedia di kebanyakan laboratorium, dan sebagainya.

Untuk perhitungan sensitivitas dan spesifisitas, jumlah hasil


pemeriksaan true positive, false positive, false negative, dan true negative
masing-masing dinyatakan dengan lambang a, b, c, dan d seperti terlihat
pada Tabel 4.2 berikut:

Tabel 4.2 Sensitivitas dan spesifisitas

Hasil uji Status penyakit


diagnostik Ada Tidak ada
True positive False positive
Positif
a b
c d
Negatif
False negative True negative

Sensitivitas adalah proporsi true positive di antara yang sakit:

a
Se = (4.1)
a+c

Jumlah hasil true positive


atau: Se =
Jumlah subjek sakit

Spesifisitas adalah proporsi true negative di antara yang tidak sakit:

d
Sp = (4.2)
b+d

Jumlah hasil true negative


atau: Sp =
Jumlah subjek tidak sakit

Jika hasil uji diagnostik berskala kontinu, untuk menentukan hasil


positif atau negatif harus ditetapkan satu titik-pemisah (cut-off point). Pilihan
cut-off point ini akan sangat menentukan sensitivitas dan spesifisitas uji
diagnostik, seperti terlihat pada contoh berikut.

52
Contoh 4.1
Kadar PSA (Prostatic Specific Antigen) dalam serum digunakan
sebagai marka tumor (tumor marker) untuk mengases peluang adanya Ca
prostat pada seorang subjek. Tabel 4.3 memperlihatkan sensitivitas dan
spesifisitas PSA serum sebagai uji diagnostik untuk Ca prostat.

Tampak bahwa semakin rendah cut-off point, sensitivitas akan


menjadi lebih tinggi, sebaliknya spesifisitas menjadi lebih rendah.
Sebaliknya, semakin tinggi cut-off point, spesifisitas akan menjadi lebih
tinggi, tetapi sensitivitas akan menjadi lebih rendah.

Tabel 4.3
Sensitivitas dan spesifisitas kadar PSA serum dalam pendeteksian
Ca prostat pada pria kulit hitam usia 70-79 tahun

Kadar PSA Kadar PSA


Se Sp Se Sp
(ng/ml) (ng/ml)
1.0 100 21 9.0 68 90
2.0 100 48 10.0 54 93
3.0 100 60 11.0 47 94
4.0 99 73 12.0 30 95
5.0 96 76 13.0 23 96
6.0 94 79 14.0 17 97
7.0 90 83 15.0 11 97
8.0 90 88
Sumber: Morgan et al, 1996

Cut-off point yang dipilih, yaitu 5.5 ng/ml, menghasilkan sensitivitas


95% dan spesifisitas 78%. Akurasi (accuracy) adalah persentase ketepatan
hasil uji diagnostik (true positive maupun true negative) terhadap
sekelompok subjek.

53
Contoh 4.2
Dilakukan pemeriksaan kadar PSA serum pada 4000 orang pria lansia
hipotetis dengan hasil sebagai berikut:

Status kesehatan
Hasil uji Jumlah
Ca prostat Normal
Positif 95 858 953
Negatif 5 3042 3047
Jumlah 100 3900 4000

Diperoleh:

95 3042
Se = = 95% Sp = = 78%
100 3900

100
Prevalensi = = 2.5%
4000

95 + 3042
Akurasi = ≈ 78.4%
4000

 Kurva ROC
Kurva ROC (Receiver Operating Characteristic) adalah kurva yang
memplot nilai-nilai sensitivitas terhadap (1 ‒ spesifisitas) dalam rentang
tertentu nilai-nilai cut-off point.

Contoh 4.3

Pada Gambar 4.1 diperlihatkan kurva ROC untuk kadar PSA serum
sebagai uji diagnostik untuk Ca Prostat (data Tabel 4.1).

54
Gambar 4.1 Kurve ROC kadar PSA serum sebagai uji diagnostik
untuk Ca Prostat (Morgan et al, 1996)

Besar utilitas uji diagnostik ditentukan oleh luas area di bawah kurve
ROC. Semakin besar luas area tersebut, semakin baik uji diagnostik. Jika
kurve ROC berupa garis lurus dari (0 ; 0) ke (100 ; 100) yang membentuk
o
sudut 45 dengan sumbu horizontal, uji tidak bermanfaat dan hasilnya
sepenuhnya diperoleh secara kebetulan (by chance).

 Nilai Prediktif
Lihat kembali Tabel 4.2. Nilai sensitivitas dan spesifisitas bermanfaat
dalam memutuskan apakah suatu uji diagnostik layak digunakan atau tidak.

55
Dalam praktik, yang lebih ingin diketahui klinisi adalah peluang ada atau
tidak adanya penyakit setelah memperoleh hasil tes positif atau negatif.

Nilai prediktif positif (positive predictive value) adalah proporsi true


positive di antara yang hasil pemeriksaannya positif:

a
PV+ = (4.3)
a+b

Jumlah subjek sakit


atau: PV+ =
Jumlah hasil positif

Nilai prediktif negatif (negative predictive value) adalah proporsi true


negative di antara yang hasil pemeriksaannya negatif:

d
PV‒ = (4.4)
c+d

Jumlah subjek tidak sakit


atau: PV‒ =
Jumlah hasil negatif

Sensitivitas dan spesifisitas relatif stabil, kecuali jika gold standard


diganti atau karakteristik populasinya sangat berbeda. Nilai prediktif positif
dan negatif dapat berbeda di berbagai tempat, tergantung pada prevalensi
penyakit. Penyebabnya yaitu sensitivitas dan spesifisitas masing-masing
diperoleh dari 1 populasi (sensitivitas dari populasi sakit dan spesifisitas dari
populasi tidak sakit), sedangkan nilai prediktif positif maupun negatif
dihitung dari 2 populasi (sakit dan tidak sakit).

Contoh 4.4

Dilakukan pemeriksaan kadar PSA serum di beberapa lokasi


hipotetis, yang prevalensi Ca prostatnya bervariasi, dengan jumlah
pemeriksaan 50,000 di setiap lokasi. Sensitivitas adalah 95% dan spesifisitas
78%, tetapi nilai prediktif positif dan negatif berlainan di tiap lokasi.

56
Prev a b c d PV+ PV‒
1% 95 2178 5 7722 4.2% 99.9%
5% 475 2090 25 7410 18.5% 99.7%
10% 950 1980 50 7020 32.4% 99.3%
25% 2375 1650 125 5850 59.0% 97.9%
50% 4750 1100 250 3900 81.2% 94.0%

Walaupun nilai sensitivitas sama 95% dan spesifisitas juga sama


78%, nilai prediktif positif dapat berkisar antara 4.2 s.d. 81.2%, tergantung
pada prevalensi, sedangkan nilai prediktif negatif tidak terlalu banyak
mengalami perubahan.

 Rasio Likelihood
Rasio likelihood positif adalah:

a b
LR+ = (4.5.a)
a+c b+d

Se
LR+ = (4.5.b)
1 − Sp

Rasio likelihood negatif adalah:

c d
LR‒ = (4.6.a)
c+d c+d

1 − Se
LR‒ = (4.6.b)
Sp

Rasio likelihood digunakan bersama odds. Dengan teorema Bayes


diperoleh:
Odds pre-tes × rasio likelihood = Odds post-tes (4.7)

57
Contoh 4.5

Lihat kembali data pada Tabel 4.3. Nilai-nilai LR+ dan LR‒ untuk
kadar PSA serum 4.0 s.d. 8.0 diperlihatkan pada Tabel 4.4 berikut.

Tabel 4.4
Rasio likelihood uji diagnostik Ca prostat untuk
kadar PSA serum 4.0 s.d. 8.0 ng/ml

Kadar PSA
Se Sp LR+ LR‒
(ng/ml)
4.0 99 73 3.67 0.01
5.0 96 76 4.00 0.05
6.0 94 79 4.48 0.08
7.0 90 83 5.29 0.12
8.0 90 88 7.50 0.11

Misalkan di Klinik Onkologi RS D diketahui prevalensi Ca prostat di


antara pengunjung dengan keluhan b.a.k. adalah 20%. Diperoleh:
P [Ca prostat] = 0.20

P [ Ca prostat ]
Odds pre-tes =
1 − P [ Ca prostat ]

0.20
= = 0.25
1 − 0.20

Hasil pemeriksaan marka tumor PSA positif dengan kadar PSA


serum 8 ng/ml. Dari Tabel 4.4 diperoleh LR+ untuk kadar PSA serum 8
ng/ml adalah 7.50.

Odds post-tes = Odds pre-tes × rasio likelihood


= 0.25 × 7.50 = 1.875
(peluang ada Ca prostat berbanding peluang tidak ada Ca prostat adalah 15
berbanding 8)

58
Odds 1.875
atau: P [Ca prostat] = = ≈ 65%
1 + Odds 1 + 1.875

Tampak bahwa hasil tes positif meningkatkan odds Ca prostat dari


0.25 menjadi 1.875 atau peluangnya dari 20% menjadi 65%.

Contoh 4.6
Analisis sensitivitas, spesifisitas, dan kurve ROC dengan Stata
dilakukan sebagai pemeriksaan lanjutan dengan perintah estat
classification terhadap hasil pemodelan regresi logistik. Karena regresi
logistik baru akan dibahas pada Bab 8, hasil pemodelan tidak akan dibahas di
sini. Yang akan dibahas hanya pemeriksaan lanjutan yang terkait dengan
sensitivitas, spesifisitas, dan kurve ROC.

File data yang digunakan adalah lbw.dta, yang memuat data biner
keberadaan hipertensi ht pada ibu sebagai pajanan dengan kejadian BBLR
(berat badan lahir rendah) low pada persalinan189 orang ibu. Klasifikasi ada
tidaknya BBLR berdasarkan model menjadi hasil uji diagnostik, sedangkan
pemeriksaan standar adalah hasil pengukuran berat badan lahir bayi, BBLR
ada jika berat badan lahir bayi kurang daripada 2500 g.

. use "D:\Epidemiologi\Data\lbw.dta"
(Hosmer & Lemeshow data)

. quitely logit low lwt race smoke ht


. estat classification

Logistic model for low


-------- True --------
Classified | D ~D | Total
-----------+--------------------------+-----------
+ | 14 8 | 22
- | 45 122 | 167
-----------+--------------------------+-----------
Total | 59 130 | 189

59
Classified + if predicted Pr(D) >= .5
True D defined as low != 0
--------------------------------------------------
Sensitivity Pr( +| D) 23.73%
Specificity Pr( -|~D) 93.85%
Positive predictive value Pr( D| +) 63.64%
Negative predictive value Pr(~D| -) 73.05%
--------------------------------------------------
False + rate for true ~D Pr( +|~D) 6.15%
False - rate for true D Pr( -| D) 76.27%
False + rate for classified + Pr(~D| +) 36.36%
False - rate for classified - Pr( D| -) 26.95%
--------------------------------------------------
Correctly classified 71.96%
--------------------------------------------------

Tampak bahwa sensitivitas adalah 23.7%, spesifisitas 93.9%, nilai


prediksi positif 63.6%, nilai prediksi negatif 73.1%, dan akurasi adalah
72.0%.

. lsens

60
Grafik ini menunjukkan nilai sensitivitas dan spesifisitas untuk
berbagai titik potong (cutoff point) P [Y = 1]. Hasil pemodelan regresi
logistik adalah probabilitas P [Y = 1], yaitu peluang adanya BBLR. Untuk
nilai default, BBLR dinyatakan ada jika P [Y = 1] > 0.5, tetapi setiap nilai P
[Y = 1] dapat digunakan sebagai cutoff point sebagaimana terlihat pada grafik
di atas.

. lroc
Logistic model for low

number of observations = 189


area under ROC curve = 0.7118

Tampak bahwa luas area di bawah kurve ROC adalah 71.2%.

61
LATIHAN 4

Pilihlah jawaban yang paling benar!


Untuk soal No. 1 s.d. 4:
Untuk mendeteksi Diabetes Mellitus, pemeriksaan kadar gula darah
puasa dianggap sebagai pemeriksaan standar, sedang untuk uji diagnostik
harian digunakan pemeriksaan reduksi urine. Lima puluh tersangka penderita
DM dari sebuah desa dikirimkan ke laboratorium untuk pemeriksaan gula
darah puasa dan reduksi urine. Tiga puluh enam orang pemeriksaan gula
darahnya positif, dengan 28 di antaranya reduksi urinenya juga positif. Dua
puluh orang hasil reduksi urine negatif.

1. Sensitivitas pemeriksaan reduksi urine adalah:


A. 0.600 C, 0.857
B. 0.778 D. 0.933

2. Spesifisitas pemeriksaan reduksi urine adalah:


A. 0.600 C, 0.857
B. 0.778 D. 0.933

3. Nilai prediksi positif adalah:


A. 0.600 C, 0.857
B. 0.778 D. 0.933

4. Nilai prediksi negatif adalah:


A. 0.600 C, 0.857
B. 0.778 D. 0.933

5. Akurasi uji diagnostik adalah:


A. 0.533 C, 0.800
B. 0.635 D. 0.818

62
Untuk soal No. 6 s.d. 10:
Dengan asumsi sensitivitas dan spesifisitas konstan, pemeriksaan
reduksi urine di atas digunakan sebagai uji diagnostik pada skrining terhadap
256 orang penduduk desa tersebut. Hasilnya yaitu 45 orang pemeriksaan
reduksi urinenya positif.

6. Dari 45 orang yang reduksi urinenya positif, yang sesungguhnya


menderita DM adalah:
A. 3 orang C. 35 orang
B. 10 orang D. 208 orang

7. Jumlah orang yang reduksi utinya negatif dan benar tidak menderita
DM adalah:
A, 3 orang C. 35 orang
B. 10 orang D. 208 orang

8. Nilai prediksi positif pada pemeriksaan di desa itu adalah:


A. 0.22 C. 0.93
B. 0.60 D. 0.99

9. Nilai prediksi negatif adalah:


A. 0.22 C. 0.93
B. 0.60 D. 0.99

10. Seandainya 256 orang tersebut merupakan sampel representatif bagi


penduduk desa tersebut, maka estimasi prevalensi DM pada penduduk
desa tersebut adalah:
A. 3.9% C. 10.5%
B. 5.1% D. 17.6%

63
BAB 5
ANALISIS SEDERHANA DAN
ANALISIS STRATIFIKASI

 Analisis Sederhana
Analisis sederhana adalah analisis hubungan antara 1 pajanan dengan
penyakit tanpa memperhitungkan keberadaan konfaunder.

 Studi Kohort dan Studi Kasus-kontrol


ˆ = a n1 , hipotesis
Pada studi kohort (tabel kiri bawah), dengan CIR
c n2
ˆ = 1, sedangkan pada studi kasus kontrol (tabel kanan
nol adalah H 0 : CIR
ad
bawah), dengan ÔR = , hipotesis nol adalah H 0 : ÔR = 1.
bc

Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
D D C C
E a b n1 E a b n1
E c d n2 E c d n2
Jumlah m1 m2 n Jumlah m1 m2 n

Atas dasar asumsi hipergeometrik, diperoleh statistik penguji Mantel-


Haenszel (terkoreksi) untuk keduanya, yaitu:
2
2
χ MH =
( n − 1)( ad − bc ) (5.1)
n1 n2 m1 m2
yang berdistribusi khi-kuadrat dengan derajat bebas 1. Untuk α = 0.05,
daerah kritisnya (daerah penolakan hipotesis nol) adalah χ 2 > 3.84.

65
Jika terdapat sel dengan nilai harapan kurang daripada 5, digunakan
uji eksak Fisher.

Contoh 5.1

Misalkan dimiliki data hipotetis hubungan antara pajanan E


(Exposure) dengan penyakit D (Disease) dalam bentuk tabel 2×2 berikut:

Penyakit
Pajanan Jumlah
D D
E 205 102 307
E 97 196 293
Jumlah 302 298 600

Estimasi rasio risiko adalah:


CIRˆ = a n1
c n2
205 307
= ≈ 2.02
97 293

Selanjutnya akan diuji ada tidaknya hubungan antara pajanan dengan


penyakit. Hipotesis nol adalah H : CIR ˆ = 1, dengan statistik penguji
0
Mantel-Haenszel (terkoreksi) sebagai berikut:
2
2
χ MH =
( n − 1)( ad − bc )
n1 n2 m1 m2
2
( 600 − 1) ( 205 )(196 ) − (102 )( 97 ) 
= ≈ 67.87
( 307 )( 293)( 302 )( 298)
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
ˆ = 1 ditolak atau ditemukan hubungan bermakna
0.05 hipotesis nol H : CIR
0
antara pajanan E dengan penyakit D (p < 0.05).

66
Contoh 5.2
(Sampel kecil)

Misalkan dimiliki data hipotetis hubungan antara pajanan E


(Exposure) dengan penyakit D (Disease) berikut:

Penyakit
Pajanan Jumlah
D D
E 5 6 11
E 1 8 9
Jumlah 6 14 20

Dengan mengasumsikan nilai-nilai a = 5, b = 6, c = 1, dan d = 8 pada


tabel 2×2 di atas sebagai salah satu nilai-nilai representasi variabel random
A, B, C, dan D, maka nilai-nilai himpunan variabel random tersebut pada
tabel di atas beserta nilai-nilai yang lebih ekstrim diperlihatkan pada tabel
berikut.

A B C D Probabilitas
5 6 1 8 6!14!11!9! / 20!5!6!1!8! = 0.1073
6 5 0 9 6!14!11!9! / 20!6!5!0!9! = 0.0119
0.1192

Tampak bahwa nilai p satu-sisi, yaitu probabilitas P [C < 1] =


P [C = 1] + P [C = 0] = 0.1073 + 0.0119 = 0.1192 ≈ 0.12, sehingga hipotesis
ˆ = 1 tidak ditolak atau tidak ditemukan hubungan bermakna
nol H 0 : CIR
antara pajanan E dengan penyakit D (p > 0.05).

Dengan menggunakan nilai khi-kuadrat Mantel-Haenszel ini, dapat


dilakukan estimasi interval ukuran rasio berbasiskan uji (test-based
confidence interval), yaitu:
  
1±  Z χMH  
ˆ   α 2  
CIR (5.2)

67
  
1±  Z χMH  
ˆ   α 2  
OR (5.3)

Contoh 5.3

Lihat kembali data pada Contoh 5.1. Dari Contoh 5.1 tersebut
diperoleh:
ˆ = 2.02
CIR
2
χ MH = 67.87 χMH = 8.24

Interval konfidensi 95% untuk rasio risiko berbasiskan uji adalah:


  
1±  Z χMH  
ˆ   α 2  
CIR
 
atau: ˆ 1±(1.96 8.24) 
CIR

yaitu [1.71 ; 2.38]

Dengan metode berbasiskan deret Taylor interval konfidensi 95%


rasio risiko adalah:

ˆ = ln 205 307 = 2.017


ln CIR
97 293

ˆ = 1− 1 +1− 1
ˆ ln CIR
Var
a n1 c n2

1 1 1 1
= − + −
205 307 97 293
ˆ + 1.96 . SE ln CIR
ln CIR ˆ

adalah 2.017 + 1.96 0.0085


atau 2.017 + 0.181

68
yaitu [1.836 ; 2.198]

Diperoleh estimasi interval yang tidak jauh berbeda dengan metode


berbasiskan-uji.

Contoh 5.4
Pada sebuah studi kasus-kontrol hubungan antara konsumsi alkohol
oleh ibu hamil dengan kejadian berat badan lahir rendah, diperoleh data
sebagai berikut:

Konsumsi Kelahiran
Jumlah
alkohol BBLR BBLN
Ya 74 48 122
Tidak 26 52 78
Jumlah 100 100 200

ÔR =
ad
=
( 74 )( 52 ) ≈ 3.083
bc ( 48)( 26 )

Dengan H 0 : ÔR = 1 dan tingkat signifikansi α = 0.05 akan diuji ada


tidaknya hubungan antara konsumsi alkohol oleh ibu dengan kejadian berat
badan lahir rendah. Statistik penguji adalah:
2
2
χ MH =
( n − 1)( ad − bc )
n1 n2 m1 m2
2
( 200 − 1) ( 74 )( 52 ) − ( 48)( 26 ) 
= ≈ 14.14
(122 )( 78 )(100 )(100 )
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
0.05 hipotesis nol H 0 : ÔR = 1 ditolak atau ditemukan hubungan bermakna

69
antara konsumsi alkohol pada ibu hamil dengan kejadian berat badan lahir
rendah (p < 0.05).

Dengan metode berbasis-uji, interval konfidensi 95% untuk rasio


odds adalah:
  
1±  Z χMH  
ˆ   α 2  
OR
 
1± 1.96 14.14  
 
atau 3.083

yaitu [1.714 ; 5.546]

 Studi Densitas
ˆ a L1
Pada studi densitas (lihat tabel di bawah), dengan IDR = ,
c L2
ˆ
hipotesis nol adalah H 0 : IDR = 1.

Penyakit
Pajanan
I PT
E a L1
E b L2
Jumlah m1 L

Atas dasar asumsi distribusi binomial untuk variabel random A,


statistik penguji adalah:
2
 m 1 L1 
 a − L 
2
χ MHD = (5.4)
 m 1 L1 L 2 
 L2 

yang berdistribusi khi-kuadrat dengan derajat bebas 1.

70
Estimasi interval rasio rate berbasiskan uji (test-based confidence
interval) adalah:
  
1± Z χMHD  
ˆ   α 2  
IDR (5.5)

Contoh 5.5

Misalkan dimiliki data hipotetis pajanan E (Exposure) beserta


insidens penyakit I dan person-time-nya:

Penyakit
Pajanan
I PT
E 94 2500
E 146 3900
Jumlah 240 6400

Estimasi rasio rate adalah:

ˆ a L1
IDR =
b L2

94 2500
= ≈ 1.004
146 3900

Akan diuji apakah ada perbedaan incidence rate antara kedua


ˆ
kelompok perbandingan. Hipotesis nol adalah H 0 : IDR = 1, dengan statistik
penguji Mantel-Haenszel sebagai berikut:
2
 m 1 L1 
 a − L 
2
χ MHD =
 m 1 L1 L 2 
 L2 

71
2
 ( 240 )( 2500 ) 
94 − 
 6400  ≈ 0.001
=
 ( 240 )( 2500 )( 3900 ) 
 
 64002 
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
ˆ
0.05 hipotesis nol H 0 : IDR = 1 tidak ditolak atau tidak ditemukan
perbedaan incidence rate antara kelompok terpajan dengan kelompok kontrol
(p > 0.05).

Dengan menggunakan nilai khi-kuadrat densitas Mantel-Haenszel,


estimasi interval rasio rate berbasiskan uji (test-based confidence interval)
adalah:
  
1± Z χMHD  
ˆ   α 2  
IDR
 
1±1.96 0.001  
 
atau 1.004
yaitu [0.775 ; 1.302]

 Analisis Stratifikasi

Analisis stratifikasi yang dibahas di sini adalah untuk mengendalikan


konfaunder kategorik.

 Studi Kohort dan Studi Kasus-kontrol

Pada studi kohort, untuk menguji pengaruh konfaunder F terhadap


hubungan antara pajanan E dengan penyakit D, hipotesis nol adalah H 0 :
ˆ = 1, sedangkan pada studi kohort, untuk menguji pengaruh konfaunder
aCIR

72
F terhadap hubungan antara pajanan E dengan penyakit C, hipotesis nol
ˆ = 1.
adalah H : aOR
0

Tabel data gabungan dan stratifikasinya masing-masing adalah


sebagai berikut:

Studi kohort:
Gabungan
Penyakit
Pajanan Jumlah
D D
E a b n1
E c d n2
Jumlah m1 m2 n

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
D D D D
E a1 b1 n 11 E a2 b2 n 21
E c1 d1 n 12 E c2 d2 n 22
Jumlah m 11 m 12 n1 Jumlah m 21 m 22 n2

Studi kasus-kontrol:

Gabungan
Penyakit
Pajanan Jumlah
C C
E a b n1
E c d n2
Jumlah m1 m2 n

73
Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
C C C C
E a1 b1 n 11 E a2 b2 n 21
E c1 d1 n 12 E c2 d2 n 22
Jumlah m 11 m 12 n1 Jumlah m 21 m 22 n2

Statistik penguji untuk keduanya adalah:


2
 k ai di − bi ci 
∑ 
2  i =1 ni 
χ MHS = k (5.6)
n 1i n2i m 1i m2i

i =1 ( n i − 1) n i
2

Contoh 5.6

Lihat kembali data pada Contoh 5.1. Jika didapatkan variabel F yang
berskala biner sebagai konfaunder, maka dilakukan stratifikasi sebagai
berikut:

Gabungan
Penyakit
Pajanan Jumlah
D D
E 205 102 307
E 97 196 293
Jumlah 302 298 600

Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
D D D D
E 195 32 227 E 10 70 80
E 80 24 104 E 17 172 189
Jumlah 275 56 331 Jumlah 27 242 269

74
Untuk menguji pengaruh konfaunder F terhadap hubungan antara
ˆ = 1, statistik
pajanan E dengan penyakit D dengan hipotesis nol H : a CIR 0
penguji Mantel-Haenszel (terkoreksi) adalah sebagai berikut:
2
 k ai di − bi ci 
∑ 
2  i =1 ni 
χ MHS = k
n 1i n2i m 1i m2i

i =1 ( n i − 1) n i
2

2
 (195 )( 24 ) − ( 32 )( 80 ) (10 )(172 ) − ( 70 )(17 ) 
 + 
 331 269 
=
( 227 )(104 )( 275 )( 56 ) + ( 80 )(189 )( 27 )( 242 )
(
( 330 ) 3312 ) (
( 268 ) 2692 )
≈ 4.63
yang berdistribusi khi-kuadrat dengan derajat bebas 1, sehingga dengan α =
0.05 hipotesis nol H : a CIR ˆ = 1 ditolak atau ditemukan pengaruh
0
konfaunder F yang bermakna terhadap hubungan antara pajanan E dengan
penyakit D (p < 0.05).

 Studi Densitas
Pada studi densitas, untuk menguji pengaruh konfaunder F terhadap
ˆ
rasio rate penyakit, hipotesis nol adalah H 0 : aIDR = 1. Lay-out data
gabungan dan stratifikasinya adalah sebagai berikut:
Gabungan
Penyakit
Pajanan
I PT
E a L1
E b L2
Jumlah m1 L

75
Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Pajanan
I PT I PT
E a1 L 11 E a2 L 21
E b1 L 12 E b2 L 22
Jumlah m 11 L1 Jumlah m 21 L2

Statistik penguji adalah:


2
k k m L 
 ∑ ai − ∑
1i 1i

2  i =1 i =1 Li 
χ MHD = k m L L 
(5.7)
∑ 
i =1 
1i 1i 2i
L2i


yang berdistribusi khi-kuadrat dengan derajat bebas 1.

Contoh 5.7
Lihat kembali data pada Contoh 5.4. Misalnya terdapat variabel F
yang diperkirakan berfungsi sebagai konfounder, maka dilakukan stratifikasi
sebagai berikut:

Gabungan
Penyakit
Pajanan
I PT
E 94 2500
E 146 3900
Jumlah 240 6400

76
Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Pajanan
I PT I PT
E 21 1600 E 77 900
E 14 1700 E 128 2200
Jumlah 35 3300 Jumlah 205 3100

Untuk menguji pengaruh konfaunder F terhadap perbandingan


incidence rate antara kelompok terpajan dengan yang tidak terpajan
ˆ
(kelompok kontrol) dengan hipotesis nol H : a IDR = 1, statistik penguji
0
Mantel-Haenszel (terkoreksi) adalah sebagai berikut:
2
k k m L 
 ∑ ai − ∑
1i 1i

2  i =1 i =1 Li 
χ MHD = k m L L 
∑ 
i =1 
1i 1i 2i
L2i


2
  ( 35 )(1600 ) ( 205 )( 900 )  
( 21 + 77 ) −  + 
  3300 3100  
=
( 35 )(1600 )(1700 ) + ( 205 )( 900 )( 2200 )
33002 31002
≈ 9.079

ˆ
Disimpulkan bahwa hipotesis nol H 0 : a IDR = 1 ditolak pada α =
0.05 atau ditemukan pengaruh konfaunder F yang bermakna terhadap
hubungan antara pajanan E dengan penyakit D (p < 0.05).

Pada bab 3 telah dibahas perhitungan estimator titik untuk ukuran


rasio dengan metode Mantel-Haenszel pada data stratifikasi, yaitu:

77
2a i n 2i

i =1 ni
ˆ
aCIR = 2 ; (5.8)
MHS
c i n 1i

i =1 ni

2 a i di

i =1n
ˆ
aOR = 2 i ; (5.9)
MHS
bi ci

i =1 ni

2
a i Li 2

i =1 Li
dan: ˆ
aIDR = 2 ; (5.10)
MHD
bi L i 1

i =1 Li

Estimasi intervalnya dengan metode berbasiskan-uji (test-based


confidence interval), adalah:
  
1±  Z χMHS  
ˆ   α 2  
aCIRMHS ; (5.11)
  
1±  Z χMHS  
ˆ   α 2  
aORMHS ; (5.12)
  
1±  Z χMHD  
ˆ   α 2  
aIDRMHD ; (5.13)

Contoh 5.8
Lihat kembali data pada Contoh 5.6.
Gabungan
Penyakit
Pajanan Jumlah
D D
E 205 102 307
E 97 196 293
Jumlah 302 298 600

78
Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Jumlah Pajanan Jumlah
D D D D
E 195 32 227 E 10 70 80
E 80 24 104 E 17 172 189
Jumlah 275 56 331 Jumlah 27 242 269

Estimator rasio risk dengan metode Mantel-Haenszel adalah:


2 a i n 2i
∑ (195)(104 ) + (10 )(189 )
ˆ i =1 ni 331 269
aCIRMHS = 2 = ≈ 1.140
c i n 1i ( 80 )( 227 ) + (17 )(80 )

i =1 ni 331 269

Interval konfidensi 95% untuk estimasi rasio risk dengan metode


berbasiskan-uji adalah:
  
1±  Z χMHS    
1± 1.96 4.63  
ˆ   α 2    
aCIRMHS = 1.140

yaitu [1.012 ; 1.284]

Contoh 5.9
Lihat kembali data pada Contoh 5.7.

Gabungan
Penyakit
Pajanan
I PT
E 94 2500
E 146 3900
Jumlah 240 6400

79
Stratum 1 Stratum 2
Penyakit Penyakit
Pajanan Pajanan
I PT I PT
E 21 1600 E 77 900
E 14 1700 E 128 2200
Jumlah 35 3300 Jumlah 205 3100

Estimator rasio rate dengan metode Mantel-Haenszel adalah:


2
a i Li 2

i =1Li
ˆ
aIDR = 2
MHD
bi L i 1

i =1 Li

( 21)(1700 ) + ( 77 )( 2200 )
= 3300 3100 ≈ 1.490
( )(
14 1600 ) + ( )( 900 )
128
3300 3100
Interval konfidensi 95% untuk estimasi rasio rate dengan metode
berbasiskan-uji adalah:
  
1±  Z χMHD    
1± 1.96 9.079  
ˆ   α 2   
aIDRMHD = 1.490 

yaitu: [1.149 ; 1.930]

80
LATIHAN 5

Pilihlah jawaban yang paling benar!

Dimiliki paparan umum hasil studi kohort dalam bentuk tabel 2×2
berikut:

D D
E a b n1
E c d n2
m1 m2 n

1. Dari studi dengan paparan data seperti tabel 2×2 di atas, dengan uji khi-
kuadrat diperoleh nilai p = 0.0001. Kesimpulannya yaitu:
A. Ada asosiasi antara pajanan E dengan penyakit D.
B. Ada asosiasi positif antara pajanan E dengan penyakit D.
C. Ada hubungan kausal antara pajanan E dengan penyakit D.
D. Pajanan E merupakan faktor risiko bagi penyakit D.

2. Pernyataan yang menunjang kemungkinan asosiasi positif antara faktor


risiko E dengan penyakit D jika n merupakan 1 sampel adalah:
A. a n1 > c n2 C. a b > c d
B. a m1 > b m 2 D. Semuanya salah.

3. Pilihlah yang benar:


A. Kasus prevalens adalah jumlah kasus baru pada periode tertentu.
B. Kasus insidens adalah jumlah kasus lama pada titik waktu
tertentu.
C. (A) dan (B) benar.
D. (A) dan (B) salah.

Untuk soal No. 4 dan 5:


Dari sebuah studi kohort diketahui kelompok studi dan kelompok
pembanding masing-masing beranggotakan 100 orang, selama periode
pengamatan tidak ada kasus drop-out. Selama periode pengamatan pada
81
kelompok studi didapatkan 18 kasus baru, sedangkan pada kelompok
pembanding hanya ada 9 kasus baru.

4. Dengan asumsi distribusi hipergeometrik, maka diperoleh statistik khi-


kuadrat Mantel Haenszel yang besarnya:
A. 3.451 C. 7.892
B. 3.967 D. 11.236

5. Kesimpulan hasil uji hipotesis H 0 : CI1 = CI 2 yaitu:


A. H 0 ditolak pada tingkat signifikansi α = 0.05.
B. H 0 tidak ditolak pada tingkat signifikansi α = 0.05.
C. H 0 ditolak pada tingkat signifikansi α = 0.01.
D. H 0 tidak ditolak pada tingkat signifikansi α = 0.10.

Untuk soal No. 6 s.d. 9:


Dimiliki data hipotetis berikut dari suatu studi kohort:

D D
E 17 9
E 33 51

6. Estimasi rasio risk adalah:


A. 1.222 C. 1.889
B. 1.664 D. 2.919

7. Estimasi rasio odds adalah:


A. 1.222 C. 1.889
B. 1.664 D. 2.919

8. Dengan metode pendekatan berbasiskan deret Taylor, interval


konfidensi 95% rasio risk adalah:
A. [0.932 ; 3.829] C. [1.130 ; 3.157]
B. [0.957 ; 5.434] D. [1.847 ; 7.286]

82
9. Dengan metode pendekatan berbasiskan deret Taylor, interval
konfidensi 95% rasio odds adalah:
A. [0.863 ; 2.600] C. [1.229 ; 6.934]
B. [0.827 ; 3.646] D. [1.165 ; 7.318]

Untuk soal No. 10 s.d. 14:


Dimiliki data stratifikasi hipotetis berikut:
Stratum 1 ( F ) Stratum 2 ( F )
D D D D
E 5 24 E 25 75
E 25 300 E 20 135

10. Estimasi rasio odds kasar adalah:


A. 2.25 C. 2.50
B. 2.37 D. 2.93

11. Tanpa stratifikasi, statistik khi-kuadrat Mantel-Haenszel adalah:


A. 3.146 C. 9.895
B. 4.496 D. 20.218

12. Pada uji hipotesis H 0 : OR = 1 dengan jawaban soal No. 11 sebagai


statistik penguji, kesimpulannya adalah:
A. H 0 ditolak pada tingkat signifikansi α = 0.01.
B. H 0 tidak ditolak pada tingkat signifikansi α = 0.05.
C. A) dan B) benar.
D. A) dan B) salah.

13. Statistik khi-kuadrat stratifikasi Mantel-Haenszel adalah:


A. 3.146 C. 9.895
B. 4.496 D. 20.218

83
14. Pada uji hipotesis H 0 : OR = 1 dengan jawaban soal No. 13 sebagai
statistik penguji, kesimpulannya adalah:
A. H 0 tidak ditolak pada tingkat signifikansi α = 0.01.
B. H 0 ditolak pada tingkat signifikansi α = 0.05.
C. A) dan B) benar.
D. A) dan B) salah.

84
BAB 6
STUDI MATCHING

 Rancangan Studi Matched

Pada rancangan studi matched, tiap satu subjek dipadankan (di-


matched) dengan satu subjek lainnya, sedemikian hingga dalam sampel
didapatkan n pasangan subjek. Ukuran sampel seluruhnya adalah 2n.
Matching dapat dilakukan pada rancangan studi:
- Studi kasus-kontrol: Tiap 1 kasus dipadankan dengan 1 kontrol.
- Studi kohort: Tiap 1 subjek terpajan dipadankan dengan 1 subjek tak-
terpajan.
- Uji klinik dengan RCT (Randomized Controlled Trial): Tiap 1 subjek
dengan perlakuan dipadankan dengan 1 subjek tanpa perlakuan / subjek
dengan plasebo.

Variabel yang tersering di-matched adalah usia / kelompok usia dan


jenis kelamin. Selain dapat juga digunakan tingkat pendidikan, status sosial
ekonomi, dan sebagainya. Syarat utama pemilihan variabel yang di-matched
yaitu berkaitan dengan variabel respons. Sebaliknya, jumlah variabel yang
di-matched tidak boleh berlebihan, karena akan menyulitkan perolehan
pasangan matching dan meningkatkan biaya penelitian.

Pada bahasan di atas, tiap 1 subjek dipadankan dengan 1 subjek lain


(kontrol) dalam pasangan yang dinamakan sebagai pair-matching. Dapat
pula tiap 1 subjek dipadankan dengan 2 kontrol (triplet-matching), atau
dengan 3 kontrol (quadriplet-matching), dan seterusnya,

Selanjutnya, pembahasan akan dibatasi untuk rancangan studi kasus-


kontrol dengan matching.

85
 Analisis Data Matching

Lay-out data studi kasus-kontrol dengan pair-matching dapat


diperlihatkan sebagai berikut:

Kasus Kontrol ( C ) Jumlah


(C ) pasangan
E E
E e f a
E g h b
Jumlah
c d n
pasangan

e : Jumlah pasangan dengan kasus dan kontrol terpajan


f : Jumlah pasangan dengan kasus terpajan dan kontrol tidak terpajan
g : Jumlah pasangan dengan kasus tidak terpajan dan kontrol terpajan
h : Jumlah pasangan dengan kasus dan kontrol tidak terpajan
n : Jumlah pasangan anggota sampel
a : Jumlah pasangan dengan kasus terpajan
b : Jumlah pasangan dengan kasus tidak terpajan
c : Jumlah pasangan dengan kontrol terpajan
d : Jumlah pasangan dengan kontrol tidak terpajan

Estimasi rasio odds adalah:

ˆ f
ORmatch = g (6.1)

Pada uji hipotesis H 0 : ORmatch = 1, statistik penguji adalah:

86
2
2
χuji =
(f − g)
(6.2)
f +g

yang berdistribusi khi-kuadrat dengan derajat bebas satu.

Untuk estimasi interval dengan pendekatan berbasiskan deret Taylor,


ˆ diasumsikan berdistribusi log-normal. Interval konfidensi (100 – α)%
ln OR
untuk rasio odds adalah:

 1 1
ÔR exp  ± Zα 2 +  (6.3)
 f g

Dengan metode berbasiskan uji hipotesis, interval konfidensi (100 –


α)% untuk rasio odds adalah:


1± Zα 2 χuji 
ˆ 
OR 
(6.4)

Contoh 6.1

Misalkan dimiliki data hipotetis studi kasus-kontrol dengan data


matched sebagai berikut:

Kasus Kontrol ( C ) Jumlah


(C ) pasangan
E E
E 18 17 35
E 12 9 21
Jumlah
30 26 56
pasangan

87
Estimasi rasio odds adalah:

ˆ f
ORmatch = g

17
= ≈ 1.417
12

Dengan hipotesis H 0 : ORmatch = 1, statistik penguji adalah:


2
2
χuji =
(f − g)
f +g
2
=
(17 − 12 ) ≈ 0.862
17 + 12
Untuk α = 0.05, daerah kritis adalah χ 2 > 3.84, sehingga hipotesis H 0 :
ORmatch = 1 tidak ditolak; atau tidak ditemukan hubungan statistik
bermakna antara pajanan E dengan penyakit C (p > 0.05).

Dengan metode berbasiskan deret Taylor, interval konfidensi 95%


rasio odds adalah:

 1 1
ÔR exp  ± Zα 2 + 
 f g

 1 1 
atau: 1.417 exp  ±1.96 + 
 17 12 

yaitu [0.175 ; 2.966]

Dengan metode berbasis uji hipotesis, interval konfidensi 95% rasio


odds adalah:

1± Zα 2 χuji 
ˆ 
OR 

1±1.96 0.862 

atau: 1.417  

yaitu: [0.679 ; 2.955]

88
Contoh 6.2

. use “D:\Epidemiologi\Data\mccxmpl.dta”, clear

. list

+----------------------+
| case control pop |
|----------------------|
1. | 1 1 8 |
2. | 1 0 8 |
3. | 0 1 3 |
4. | 0 0 8 |
+----------------------+

. mcc case control [fw=pop]

| Controls |
Cases | Exposed Unexposed | Total
--------------+------------------------+---------
Exposed | 8 8 | 16
Unexposed | 3 8 | 11
--------------+------------------------+---------
Total | 11 16 | 27

McNemar's chi2(1) = 2.27 Prob > chi2 = 0.1317


Exact McNemar significance probability = 0.2266
Proportion with factor
Cases .5925926
Controls .4074074 [95% Conf. Interval]
--------- --------------------
difference .1851852 -.0822542 .4526246
ratio 1.454545 .891101 2.374257
rel. diff. .3125 -.0243688 .6493688

odds ratio 2.666667 .6400364 15.6064 (exact)

89
Dengan uji McNemar diperoleh statistik penguji χ 2 = 2.27 dengan
derajat bebas 1 (p = 0.1317), sehingga hipotesis H 0 : ORmatch = 1 tidak
ditolak. Karena ada sel dengan nilai harapan kurang daripada 5, uji hipotesis
sebaiknya dilakukan uji eksak yang menghasilkan nilai p = 0.2266 dengan
kesimpulan sama, yaitu hipotesis H 0 : ORmatch = 1 tidak ditolak.

Estimasi rasio odds matching adalah 2.667 dengan interval


konfidensi 95% [0.640 ; 15.606] berdasarkan metode eksak.

Contoh 6.3
Lihat kembali data pada Contoh 6.1:

Kasus Kontrol ( C ) Jumlah


(C ) E E pasangan
E 18 17 35
E 12 9 21
Jumlah
30 26 56
pasangan

Dengan Stata diperoleh:


. mcci 18 17 12 9

| Controls |
Cases | Exposed Unexposed | Total
--------------+-----------------------+---------
Exposed | 18 17 | 35
Unexposed | 12 9 | 21
--------------+-----------------------+---------
Total | 30 26 | 56
McNemar's chi2(1) = 0.86 Prob > chi2 = 0.3532
Exact McNemar significance probability = 0.4583

90
Proportion with factor
Cases .625
Controls .5357143 [95% Conf. Interval]
--------- --------------------
difference .0892857 -.1155924 .2941638
ratio 1.166667 .8423368 1.615875
rel. diff. .1923077 -.1725275 .5571429

odds ratio 1.416667 .6376336 3.250974 (exact)

Uji McNemar menghasilkan statistik penguji χ 2 = 0.86 dengan


derajat bebas 1 (p = 0.3532), sehingga hipotesis H 0 : ORmatch = 1 tidak
ditolak. Tidak ada sel dengan nilai harapan kurang daripada 5, sehingga uji
hipotesis tidak perlu dilakukan dengan uji eksak.

Estimasi rasio odds matching adalah 2.667 dengan interval


konfidensi 95% [0.640 ; 15.606] berdasarkan metode eksak.

 Triplet-Matching
Lay-out data untuk studi kasus-kontrol dengan triplet-matching (1
kasus dipadankan dengan 2 kontrol adalah sebagai berikut:

Kasus Kontrol ( C )
Jumlah
(C ) E2 E1 E0
triplet

E f2 f1 f0 a

E g2 g1 g0 b
Jumlah
c2 c1 c0 n
triplet

91
f2 : Jumlah triplet dengan kasus dan 2 kontrol terpajan

f1 : Jumlah triplet dengan kasus dan 1 kontrol terpajan

f0 : Jumlah triplet dengan kasus dan 0 kontrol terpajan

g2 : Jumlah triplet dengan kasus tidak terpajan dan 2 kontrol terpajan

g1 : Jumlah triplet dengan kasus tidak terpajan dan 1 kontrol terpajan

g0 : Jumlah triplet dengan kasus tidak terpajan dan 0 kontrol terpajan

n : Jumlah triplet anggota sampel


a : Jumlah triplet dengan kasus terpajan
b : Jumlah triplet dengan kasus tidak terpajan
c2 : Jumlah triplet dengan 2 kontrol terpajan

c1 : Jumlah triplet dengan 1 kontrol terpajan

c0 : Jumlah triplet dengan 0 kontrol terpajan

Estimasi rasio odds adalah:

ˆ 2 f 0 + f1
ORmatch = 2 g + g (6.5)
2 1

Pada uji hipotesis H 0 : ORmatch = 1, statistik penguji adalah:


2
 2 ( f 0 − g 2 ) + ( f1 − g1 ) 
2
χuji =  (6.6)
2 ( f 0 + g 2 ) + 2 ( f1 + g1 )

yang berdistribusi khi-kuadrat dengan derajat bebas satu.

92
Untuk estimasi interval dengan metode berbasiskan uji hipotesis,
interval konfidensi (100 – α)% untuk rasio odds adalah:


1± Zα 2 χuji 
ˆ 
OR 
(6.7)

Penggunaan lebih daripada 2 kontrol untuk 1 kasus akan


meningkatkan biaya penelitian, tetapi hanya sedikit meningkatkan efisiensi,
sehingga tidak dianjurkan untuk menggunakan lebih daripada 2 kontrol
untuk 1 kasus.

Contoh 6.4

Misalkan dimiliki data studi kasus-kontrol dengan triplet-matching


sebagai berikut:

Kasus Kontrol ( C )
Jumlah
(C ) E2 E1 E0
triplet

E 2 7 16 25
E 5 12 12 29
Jumlah
7 19 28 54
triplet

Estimasi rasio odds adalah:

ˆ 2 f 0 + f1
ORmatch =
2 g 2 + g1

2 (16 ) + 7
= ≈ 1.773
2 ( 5 ) + 12

93
Statistik penguji untuk uji hipotesis H 0 : ORmatch = 1 adalah:
2
 2 ( f 0 − g 2 ) + ( f1 − g1 ) 
2
χuji = 
2 ( f 0 + g 2 ) + 2 ( f1 + g1 )
2
 2 (16 − 5 ) + (7 − 12) 
= ≈ 3.6125
2 (16 + 5 ) + 2 ( 7 + 12 )

yang berdistribusi khi-kuadrat dengan derajat bebas satu. Daerah kritis untuk
distribusi khi-kuadrat dengan derajat bebas 1 dan α = 0.05 adalah 3.84,
sehingga hipotesis H 0 : ORmatch = 1 tidak ditolak pada α = 0.05, berarti
tidak ditemukan hubungan yang bermakna secara statistik antara pajanan E
dengan penyakit C (p > 0.05).

Untuk estimasi interval dengan metode berbasiskan uji hipotesis,


interval konfidensi (100 – α)% untuk rasio odds adalah:

1± Zα 2 χuji 
ˆ 
OR 


1±1.96 3.6125 
atau: 1.773 

yaitu: [0.9823 ; 3.1992]

94
LATIHAN 6

Pilihlah jawaban yang paling benar!

1. Yang dimaksud dengan kelompok kontrol pada studi matching antara


lain adalah:
A. Kelompok tidak sakit pada studi kohort.
B. Kelompok tidak sakit pada studi kasus-kontrol.
C. Kelompok tidak sakit pada studi potong-lintang.
D. Semuanya salah.

Untuk soal No. 2 s.d. 7:


Dimiliki data hipotetis berikut untuk studi kasus-kontrol matched:

Kasus Kontrol ( C )
(C )
E E
E 18 17
E 12 9

2. Estimasi rasio odds adalah:


A. 0.70 C. 1.42
B. 0.79 D. 1.45

3. Jika data tersebut dianalisis secara unmatched, estimasi rasio odds


adalah:
A. 0.70 C. 1.42
B. 0.79 D. 1.45

4. Pada uji hipotesis H 0 : OR = 1, besar statistik penguji adalah:


A. 0.169 C. 0.862
B. 0.411 D. 0.928

95
5. Berdasarkan hasil perhitungan soal No. 4, kesimpulannya adalah:
A. H 0 ditolak pada tingkat signifikansi α = 0.05.
B. H 0 tidak ditolak pada tingkat signifikansi α = 0.10.
C. A) dan B) benar.
D. A) dan B) salah.

6. Dengan metode pendekatan berbasiskan deret Taylor, standard error


ÔR adalah:
A. 0.141 C. 0.375
B. 0.142 D. 0.377

7. Dengan metode pendekatan berbasiskan deret Taylor, interval


konfidensi 95% rasio odds adalah:
A. [0.391 ; 1.087] C. [1.028 ; 3.257]
B. [0.677 ; 2.966] D. [1.065 ; 4.537]

8. Dengan metode pendekatan berbasiskan deret Taylor, interval


konfidensi 95% rasio risk adalah:
A. [0.932 ; 3.829] C. [1.130 ; 3.157]
B. [0.957 ; 5.434] D. [1.847 ; 7.286]

9. Dengan metode pendekatan berbasiskan deret Taylor, interval


konfidensi 95% rasio odds adalah:
A. [0.863 ; 2.600] C. [1.229 ; 6.934]
B. [0.827 ; 3.646] D. [1.165 ; 7.318]

Untuk soal No. 10 s.d. 12:


Dimiliki data hipotetis berikut untuk studi kasus-kontrol matched:

Kasus Kontrol ( C )
(C ) E2 E1 E0

E 3 6 8
E 1 4 38

96
10. Jumlah subjek kontrol yang terpajan adalah:
A. 4 C. 18
B. 14 D. 43

11. Estimasi rasio odds adalah:


A. 2.240 C. 7.125
B. 3.667 D. 15.250

12. Pada uji hipotesis H 0 : OR = 1, besar statistik penguji adalah:


A. 2.595 C. 6.737
B. 3.425 D. 11.731

97
BAB 7
MEDIASI, INTERAKSI, DAN
MODERASI

 Mediasi
Mediasi adalah keadaan jika efek kausal variabel independen X
terhadap variabel dependen Y “dijelaskan” mediator Me, dengan mediator
Me disebabkan oleh variabel independen X dan mediator Me menyebabkan
variabel dependen Y (gambar 7.1). Mediasi dapat berupa mediasi parsial
(partial mediation) dan mediasi penuh (complete mediation). Pada mediasi
parsial masih terdapat efek langsung variabel independen X terhadap variabel
dependen Y, sedangkan pada mediasi penuh efek variabel independen X
terhadap variabel dependen Y sepenuhnya terjadi melalui mediator Me.

Gambar 7.1 Mediasi


Kiri: Mediasi Parsial; kanan: Mediasi Penuh

Pengujian mediasi dapat dilakukan dengan menggunakan Model 1


dan Model 2 pada Gambar 7.2 berikut:

99
Gambar 7.2 Efek Mediasi
Kiri: Model 1; kanan: Model 2

1. Efek τ pada relasi X → Y (Model 1) bermakna secara statistik.


2. Efek α pada relasi X → Me (Model 2) bermakna secara statistik.
3. Efek β pada relasi Me → Y (Model 2) bermakna secara statistik.
4. Efek τ’ pada Model 2 lebih kecil daripada efek τ pada Model 1.

Selain cara di atas, pengujian mediasi juga dapat dilakukan dengan


uji Sobel terhadap hipotesis H 0 : α * β = 0, dengan statistik penguji:

α *β
Z uji = (7.1)
α 2σ β2 + β 2σ α2

yang berdistribusi normal standar.

Contoh 7.1:
Dimiliki data 200 orang siswa dengan nilai-nilai ujian science, read,
dan math.

. use “D:\Stata\Data\hsbdemo”, clear


(highschool and beyond (200 cases)

100
Dalam contoh ini science adalah variabel dependen, math adalah
variabel independen, dan read adalah variabel moderator.

. list science read math in 1/10


+-----------------------+
| science read math |
|-----------------------|
1. | 29 34 41 |
2. | 36 34 41 |
3. | 26 39 44 |
4. | 33 37 42 |
5. | 39 39 40 |
|-----------------------|
6. | 31 42 42 |
7. | 39 31 46 |
8. | 34 50 40 |
9. | 42 39 33 |
10. | 39 34 46 |
+-----------------------+

. regress science math

Source | SS df MS Number of obs = 200


---------+-------------------------- F(1, 198) = 130.81
Model | 7760.55791 1 7760.55791 Prob > F = 0.0000
Residual | 11746.9421 198 59.3279904 R-squared = 0.3978
---------+-------------------------- Adj R-squared = 0.3948
Total | 19507.5 199 98.0276382 Root MSE = 7.7025

--------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+-----------------------------------------------------
math | .66658 .0582822 11.44 0.000 .5516466 .7815135
_cons | 16.75789 3.116229 5.38 0.000 10.61264 22.90315
--------------------------------------------------------------

101
. regress read math

Source | SS df MS Number of obs = 200


---------+-------------------------- F(1, 198) = 154.70
Model | 9175.57065 1 9175.57065 Prob > F = 0.0000
Residual | 11743.8493 198 59.3123704 R-squared = 0.4386
---------+-------------------------- Adj R-squared = 0.4358
Total | 20919.42 199 105.122714 Root MSE = 7.7015

------------------------------------------------------------
read | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+-----------------------------------------------------
math | .724807 .0582745 12.44 0.000 .6098887 .8397253
_cons | 14.07254 3.115819 4.52 0.000 7.928087 20.21699
------------------------------------------------------------

. regress science read

Source | SS df MS Number of obs = 200


---------+-------------------------- F(1, 198) = 130.41
Model | 7746.4076 1 7746.4076 Prob > F = 0.0000
Residual | 11761.0924 198 59.3994566 R-squared = 0.3971
---------+-------------------------- Adj R-squared = 0.3941
Total | 19507.5 199 98.0276382 Root MSE = 7.7071

------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+---------------------------------------------------
read | .6085207 .0532864 11.42 0.000 .503439 .7136024
_cons | 20.06696 2.836003 7.08 0.000 14.47432 25.65961
------------------------------------------------------------

. regress science read math

Source | SS df MS Number of obs = 200


---------+-------------------------- F(2, 197) = 90.27
Model | 9328.73944 2 4664.36972 Prob > F = 0.0000
Residual | 10178.7606 197 51.6688353 R-squared = 0.4782
---------+-------------------------- Adj R-squared = 0.4729
Total | 19507.5 199 98.0276382 Root MSE = 7.1881

102
------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+---------------------------------------------------
read | .3654205 .0663299 5.51 0.000 .2346128 .4962283
math | .4017207 .0725922 5.53 0.000 .2585632 .5448782
_cons | 11.6155 3.054262 3.80 0.000 5.592255 17.63875
------------------------------------------------------------

Diperoleh hasil:

Tampak bahwa:
1. Ada hubungan bermakna antara math → science (variabel
independen → variabel dependen; p = 0.000).
2. Ada hubungan bermakna antara math → read (variabel independen
→.moderator; p = 0.000).
3. Ada hubungan bermakna antara read → science (moderator →
variabel dependen; p = 0.000).
4. Nilai t = 11.44 (p = 0.000) pada relasi math → science tanpa
moderator menjadi t = 5.53 (p = 0.000) pada relasi dengan moderator.

Dengan kesimpulan mediator bermakna secara statistik.

Pada uji Sobel diperoleh:


α *β
Z uji =
α σ β + β 2σ α2
2 2

α̂ = 0.725 βˆ = 0.365

σˆα2 = 0.058 σˆ β2 = 0.066

0.725 *0.365
Z uji = = 5.037
( )( ) ( )(
0.7252 .0662 + 0.3652 0.0582 )

103
Dengan kesimpulan yang sama, bahwa mediator bermakna secara statistik.

Contoh 7.2:
Uji Sobel-Goodman dapat dilakukan pada Stata sebagai berikut:

. use “D:\Stata\Data\hsbdemo”, clear


(highschool and beyond (200 cases)

. sgmediation science, mv(read) iv(math)

Model with dv regressed on iv (path c)

Source | SS df MS Number of obs = 200


---------+-------------------------- F(1, 198) = 130.81
Model | 7760.55791 1 7760.55791 Prob > F = 0.0000
Residual | 11746.9421 198 59.3279904 R-squared = 0.3978
---------+-------------------------- Adj R-squared = 0.3948
Total | 19507.5 199 98.0276382 Root MSE = 7.7025

--------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+-----------------------------------------------------
math | .66658 .0582822 11.44 0.000 .5516466 .7815135
_cons | 16.75789 3.116229 5.38 0.000 10.61264 22.90315
--------------------------------------------------------------

Model with mediator regressed on iv (path a)

Source | SS df MS Number of obs = 200


---------+-------------------------- F(1, 198) = 154.70
Model | 9175.57065 1 9175.57065 Prob > F = 0.0000
Residual | 11743.8493 198 59.3123704 R-squared = 0.4386
---------+-------------------------- Adj R-squared = 0.4358
Total | 20919.42 199 105.122714 Root MSE = 7.7015

104
------------------------------------------------------------
read | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+-----------------------------------------------------
math | .724807 .0582745 12.44 0.000 .6098887 .8397253
_cons | 14.07254 3.115819 4.52 0.000 7.928087 20.21699
------------------------------------------------------------

Model with dv regressed on mediator and iv (paths b and c')

Source | SS df MS Number of obs = 200


---------+-------------------------- F(2, 197) = 90.27
Model | 9328.73944 2 4664.36972 Prob > F = 0.0000
Residual | 10178.7606 197 51.6688353 R-squared = 0.4782
---------+-------------------------- Adj R-squared = 0.4729
Total | 19507.5 199 98.0276382 Root MSE = 7.1881

------------------------------------------------------------
science | Coef. Std. Err. t P>|t| [95% Conf. Interval]
--------+---------------------------------------------------
read | .3654205 .0663299 5.51 0.000 .2346128 .4962283
math | .4017207 .0725922 5.53 0.000 .2585632 .5448782
_cons | 11.6155 3.054262 3.80 0.000 5.592255 17.63875
------------------------------------------------------------

Sobel-Goodman Mediation Tests


Coef Std Err Z P>|Z|
Sobel .26485934 .05258136 5.037 4.726e-07
Goodman-1 (Aroian) .26485934 .05272324 5.024 5.072e-07
Goodman-2 .26485934 .05243909 5.051 4.400e-07

Coef Std Err Z P>|Z|


a coefficient = .724807 .058274 12.4378 0
b coefficient = .365421 .06633 5.50914 3.6e-08
Indirect effect = .264859 .052581 5.03713 4.7e-07
Direct effect = .401721 .072592 5.53394 3.1e-08
Total effect = .66658 .058282 11.4371 0

Proportion of total effect that is mediated: .39734065

105
Ratio of indirect to direct effect: .65931219
Ratio of total to direct effect: 1.6593122

Koefisien Sobel, yaitu efek tak-langsung math terhadap science


(melalui mediator read) adalah 0.725 × 0.365 = 0.265. Pada uji hipotesis
H 0 : Koef Sobel = 0 diperoleh statistik penguji Z = 5.037 yang berdistribusi
normal standar dengan p < 0.05 (tepatnya adalah p = 4.726e‒7).

 Interaksi & Moderasi


Baron dan Kenny (1986) membedakan interaksi menjadi:
A. Interaksi statistik (interaksi non-efek; interaksi non-kausal; Gambar
7.2)
- “Ada efek bersama (combined effect) X dan Z terhadap Y”
- X dan Z adalah efek utama (main effect) dalam model
- Pembuktian dengan uji statistik
- Suku interaksi ditambahkan karena model aditif Y = X + Z tak
mencukupi

Gambar 7.2 Interaksi Statistik

B. Moderasi (interaksi efek; interaksi kausal; Gambar 7.3)


- “Hubungan antara X dan Y bervariasi menurut W”
- X adalah efek utama, W adalah moderator (bukan efek utama)

106
- Pengujian dengan uji statistik dan pembahasan substantif
- Moderator ditambahkan jika terbukti memodifikasi hubungan X-Y

Gambar 7.3 Moderasi

Contoh 7.3:
Misalkan dimiliki data hipotetis dalam bentuk dataset berikut.

. use “D:\Stata\Data\c10interaction”, clear

. desc

Contains data from D:\Epidemiologi\c10interaction.dta


obs: 120
vars: 4 7 Jul 2019 17:18
size: 600
-----------------------------------------------------------
storage display value
variable name type format label variable label
-----------------------------------------------------------
inc int %8.0g Income in 1000s
educ byte %8.0g Years of education
male byte %8.0g females are 1 and
males are 0
alienation byte %8.0g Alienation 0 to 10
-----------------------------------------------------------
Sorted by: male

107
. list in 1/10
+------------------------------+
| inc educ male aliena~n |
|------------------------------|
1. | 65 17 0 9 |
2. | 75 14 0 3 |
3. | 50 16 0 4 |
4. | 125 12 0 6 |
5. | 10 8 0 2 |
|------------------------------|
6. | 75 14 0 3 |
7. | 50 16 0 4 |
8. | 50 16 0 4 |
9. | 65 17 0 9 |
10. | 75 14 0 3 |
+------------------------------+

. regress inc educ male

Source | SS df MS Number of obs = 120


---------+--------------------------- F(2, 117) = 37.19
Model | 100464.105 2 50232.0527 Prob > F = 0.0000
Residual | 158015.895 117 1350.5632 R-squared = 0.3887
---------+--------------------------- Adj R-squared = 0.3782
Total | 258480 119 2172.10084 Root MSE = 36.75

-------------------------------------------------------------
inc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
educ | 8.045694 1.008586 7.98 0.000 6.048243 10.04315
male | 19.04991 6.719787 2.83 0.005 5.741726 32.3581
_cons | -42.54411 14.2919 -2.98 0.004 -70.84847 -14.23975
-------------------------------------------------------------

Prediktor educ dan male keduanya bermakna (p masing-masing


0.000 dan 0.005), tetapi koefisien determinasi R-squared (proporsi variansi

108
yang “dijelaskan” oleh prediktor hanya 38.87%). Selanjutnya dicoba
memasukkan suku interaksi antara educ dengan male.

. regress inc educ male c.educ#male

Source | SS df MS Number of obs = 120


---------+--------------------------- F(3, 116) = 34.89
Model | 122604.719 3 40868.2397 Prob > F = 0.0000
Residual | 135875.281 116 1171.33863 R-squared = 0.4743
---------+--------------------------- Adj R-squared = 0.4607
Total | 258480 119 2172.10084 Root MSE = 34.225

-------------------------------------------------------------
inc | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------+-----------------------------------------------------
educ | 3.602369 1.388076 2.60 0.011 .8531092 6.351628
male | -91.88539 26.27242 -3.50 0.001 -143.9212 -39.84954
|
male# |
c.educ|
1 | 8.196446 1.885263 4.35 0.000 4.462445 11.93045
|
_cons | 16.84834 19.07279 0.88 0.379 -20.92773 54.6244
-------------------------------------------------------------

Tampak bahwa suku interaksi male*educ bermakna secara statistik


(p = 0.000), sedangkan koefisien determinasi R-squared meningkat
menjadi 47.43%.

Model estimasi adalah:


ˆ = 16.85 + 3.60 educ ‒ 91.89 male + 8.20 male*educ
inc

Untuk wanita, male = 1. Model estimasinya adalah:


ˆ = -75.04 + 11.80 educ
inc

Untuk pria, male = 0. Model estimasinya adalah:


ˆ = 16.85 + 3.60 educ
inc

109
LATIHAN 7

Pilihlah jawaban yang paling benar!

1. Syarat efek mediasi antara lain yaitu:


A. Tidak ada efek langsung variabel independen X terhadap variabel
dependen Y.
B. Tidak ada efek variabel independen X terhadap mediator Me.
C. Ada efek mediator me terhadap variabel dependen Y.
D. Semuanya benar.

2. Uji Sobel menguji keberadaan:


A. Mediasi.
B. Moderasi.
C. A) dan B) benar.
D. A) dan B) salah.

Untuk soal No.3 s.d. 7:


Dimiliki cuplikan hasil keluaran Stata berikut berupa 3 tabel (x =
variabel independen, y = variabel dependen, dan med = variabel mediator):
-------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
x | .1927391 .0305102 6.32 0.000 .1328676 .2526106
_cons | .4960159 .0215308 23.04 0.000 .4537651 .5382667
-------------------------------------------------------------
-------------------------------------------------------------
med | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
x | .3647129 .0642544 5.68 0.000 .2386238 .4908021
_cons | .1654007 .0453437 3.65 0.000 .0764207 .2543807
-------------------------------------------------------------

110
-------------------------------------------------------------
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------+------------------------------------------------------
med | .2307162 .0131437 17.55 0.000 .2049238 .2565087
x | .1085939 .0271072 4.01 0.000 .0554002 .1617876
_cons | .4578553 .0189529 24.16 0.000 .4206632 .4950475
-------------------------------------------------------------

3. Efek langsung variabel independen X terhadap variabel dependen Y


adalah:
A. 0.109 C. 0.365 * 0.231
B. 0.193 D. Semuanya salah.

4. Efek tak langsung variabel independen X terhadap variabel dependen Y


adalah:
A. 0.109 C. 0.365 * 0.231
B. 0.193 D. Semuanya salah.

5. Efek total variabel independen X terhadap variabel dependen Y adalah:


A. [Efek langsung + efek tak langsung] variabel independen X
terhadap variabel dependen Y.
B. [Efek langsung * efek tak langsung] variabel independen X
terhadap variabel dependen Y.
C. [Efek langsung / efek tak langsung] variabel independen X
terhadap variabel dependen Y.
D. Semuanya salah.

6. Proporsi efek total yang termediasi adalah:


A. [Efek tak langsung / efek langsung] * 100%
B. [Efek langsung / efek total] * 100%
C. [Efek tak langsung / efek total] * 100%
D. Semuanya salah.

111
7. Kesimpulan dari ketiga tabel di atas yaitu:
A. Ada efek mediasi yang bermakna secara statistik.
B. Tidak ada efek mediasi yang bermakna secara statistik.
C. Belum dapat disimpulkan adanya efek mediasi yang bermakna
secara statistik.
D. Semuanya salah.

8. Pada hubungan antara X dan Y dengan moderator W:


A. Interaksi antara X dan W adalah interaksi kausal.
B. X, Y, dan W seluruhnya adalah efek utama.
C. Pengujian adanya interaksi cukup dengan uji statistik.
D. Semuanya salah.

9. Pada uji statistik terhadap efek interaksi, batas kemaknaan yang


dianjurkan adalah
A. 0.05 C. 0.25
B. 0.10 D. Semuanya salah.

10. Aturan hierarki untuk interaksi menyatakan, bahwa jika suku interaksi
X*Z bermakna secara statistik, maka:
A. Suku X dan Z selalu harus dipertahankan dalam model.
B. Suku X dan Z dipertahankan dalam model hanya jika keduanya
bermakna secara statistik.
C. Suku X dan Z harus dikeluarkan dari model.
D. Semuanya salah.

112
BAB 8
ANALISIS REGRESI LOGISTIK

Model regresi logistik dianjurkan pada analisis data epidemiologi


jika:
- Respons berskala biner.
- Konfaunder kategorik lebih daripada satu.
- Ada pajanan dan/atau konfaunder berskala kontinu tanpa rencana untuk
mengkategorisasikannya.

 Regresi Logistik Sederhana


Model regresi logistik sederhana (simple logistic regression) adalah
model regresi dengan satu variabel independen yang berskala kontinu atau
kategorik biner, dinyatakan sebagai:

logit Y = β 0 + β 1 X (8.1)

Logit Yi adalah:

logit ( Y ) = ln odds ( Y ) (8.1.a)

P (Y = 1)
= ln
1 − P ( Y = 1)

P (Yi = 1)
logit ( Y ) = ln (8.1.b)
P (Yi = 0 )

113
Jika X biner, maka X = {0, 1}, sehingga didapatkan:

untuk X = 1 → logit ( Y X = 1 ) = ln odds ( Y X = 1 )

= β 0 + β 1 . (1)

= β 0 + β1

untuk X = 0 → logit ( Y X = 0 ) = ln odds ( Y X = 0 )

= β 0 + β 1 . (0)

= β0

Diperoleh: Odds ( Y X = 1 ) = exp ( β 0 + β 1 )

dan Odds ( Y X = 0 ) = exp ( β 0 )

sehingga rasio odds adalah:

Odds (Y X = 1)
OR =
Odds (Y X = 0 )

exp ( β 0 + β 1 )
=
exp ( β 0 )

OR = exp ( β 1 ) (8.2)

atau: β 1 = ln OR (8.2.a)

Contoh 8.1

File lbw.dta memuat data tentang 189 kejadian berat badan lahir
rendah berikut data tentang ibu yang melahirkan. Contoh 8.1 ini memuat
analisis tentang hubungan hipertensi ibu pada ht dengan kejadian berat
badan lahir rendah lbw.

. use “D:\Epidemiologi\Data\lbw.dta”, clear

114
. tab low ht
| has history of
birthweigh | hypertension
t<2500g | 0 1 | Total
-----------+----------------------+----------
0 | 125 5 | 130
1 | 52 7 | 59
-----------+----------------------+----------
Total | 177 12 | 189

Dalam bentuk paparan yang biasa ditampilkan data di atas dapat


diperlihatkan sebagai:

Hipertensi BBLR BBL normal Jumlah


Ya 7 5 12
Tidak 52 125 177
Jumlah 59 130 189

. logit low ht

Iteration 0: log likelihood = -117.336


Iteration 1: log likelihood = -115.35188
Iteration 2: log likelihood = -115.32494
Iteration 3: log likelihood = -115.32493

Logistic regression Number of obs = 189


LR chi2(1) = 4.02
Prob > chi2 = 0.0449
Log likelihood = -115.32493 Pseudo R2 = 0.0171

115
------------------------------------------------------------
low | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+-----------------------------------------------------
ht | 1.213542 .6083485 1.99 0.046 .0212008 2.405883
_cons | -.87707 .1650175 -5.32 0.000 -1.200498 -.5536417
------------------------------------------------------------

Model estimasi yang diperoleh adalah:

logit low = ‒0.877 +1.214 ht

dengan: b1 = ‒0.877

dan ÔR = exp β 1

= exp (1.214) ≈ 3.365

Contoh 8.2

Lihat kembali data pada Contoh 8.1. Dengan Stata, estimasi OR dapat
diperoleh secara langsung sebagai berikut:

. logistic low ht

Logistic regression Number of obs = 189


LR chi2(1) = 4.02
Prob > chi2 = 0.0449
Log likelihood = -115.32493 Pseudo R2 = 0.0171

---------------------------------------------------------------
low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
ht | 3.365384 2.047326 1.99 0.046 1.021427 11.08822
_cons | .416 .0686473 -5.32 0.000 .3010442 .5748526
---------------------------------------------------------------

116
Note: _cons estimates baseline odds.

. Tampak ÔR = 3.365 dengan interval konfidensi 95% [1.021 ;


11.088]. Dari tabel 2×2 di atas juga diperoleh hasil yang sama:
ad
ÔR =
bc
( 7 )(125)
= ≈ 3.365
( 5)( 52 )

Dari contoh di atas, tidak jelas ada kelebihan penggunaan analisis


regresi logistik sederhana daripada analisis konvensional tabel 2×2. Manfaat
analisis regresi logistik ganda akan terlihat lebih jelas dengan adanya 1 atau
lebih kovariat atau variabel konfaunder, seperti pada pembahasan berkut.

 Regresi Logistik Ganda


Model regresi logistik ganda (multiple logistic regression) adalah:
logit Y = β 0 + β 1 X 1 + β 2 X 2 + . . . + β p X p ((8.3)

Di sini berlaku:
β i = ln ORi (8.4.a)

atau: ORi = exp ( β i ) : untuk i = 1, 2, . . . , p (8.4.b)

Untuk tiap pasangan { X i ; Y}, ORi adalah rasio odds suaian yang
telah disesuaikan dengan (adjusted with) keberadaan X i lain, yaitu seluruh
kovariat dan konfaunder yang ada dalam model.

117
Contoh 8.3

Lihat kembali file lbw.dta pada Contoh 8.1.

. use “D:\Epidemiologi\Data\lbw.dta”, clear


. list low ht smoke ptl ui in 1/10

+---------------------------------+
| low ht smoke ptl ui |
|---------------------------------|
1. | 0 0 nonsmoker 0 1 |
2. | 0 0 nonsmoker 0 0 |
3. | 0 0 smoker 0 0 |
4. | 0 0 smoker 0 1 |
5. | 0 0 smoker 0 1 |
|---------------------------------|
6. | 0 0 nonsmoker 0 0 |
7. | 0 0 nonsmoker 0 0 |
8. | 0 0 nonsmoker 0 0 |
9. | 0 0 smoker 0 0 |
10. | 0 0 smoker 0 0 |
+---------------------------------+

. logit low ht smoke ptl ui

Iteration 0: log likelihood = -117.336


Iteration 1: log likelihood = -108.39533
Iteration 2: log likelihood = -108.315
Iteration 3: log likelihood = -108.31499
Iteration 4: log likelihood = -108.31499

Logistic regression Number of obs = 189


LR chi2(4) = 18.04
Prob > chi2 = 0.0012
Log likelihood = -108.31499 Pseudo R2 = 0.0769

118
--------------------------------------------------------------
low | Coef. Std. Err. z P>|z| [95% Conf. Interval]
------+-------------------------------------------------------
ht | 1.416685 .6221121 2.28 0.023 .1973683 2.636003
smoke | .582175 .3365041 1.73 0.084 -.0773609 1.241711
ptl | .6069344 .3356105 1.81 0.071 -.0508502 1.264719
ui | .8838349 .4428932 2.00 0.046 .0157802 1.75189
_cons | -1.417498 .2463856 -5.75 0.000 -1.900405 -.9345911
--------------------------------------------------------------

Diperoleh model estimasi:


logit low = ‒1.417 + 1.417 ht + 0.582 smoke + 0.607 ptl + 0.884 ui

Contoh 8.4
Lihat kembali data pada Contoh 8.3.

. logistic low ht smoke ptl ui

Logistic regression Number of obs = 189


LR chi2(4) = 18.04
Prob > chi2 = 0.0012
Log likelihood = -108.31499 Pseudo R2 = 0.0769

119
---------------------------------------------------------------
low | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
------+--------------------------------------------------------
ht | 4.123431 2.565236 2.28 0.023 1.218193 13.9573
smoke | 1.789927 .6023179 1.73 0.084 .9255558 3.461531
ptl | 1.834798 .6157775 1.81 0.071 .9504211 3.542097
ui | 2.420163 1.071874 2.00 0.046 1.015905 5.765486
_cons | .2423196 .059704 -5.75 0.000 .1495081 .3927464
---------------------------------------------------------------
Note: _cons estimates baseline odds.

Diperoleh:
- Rasio odds suaian low-ht:
OR1 = 4.123

- Rasio odds suaian low-smoke:


OR 2 = 1.790

- Rasio odds suaian low-ptl:


OR 3 = 1.835

- Rasio odds suaian low-ui:


OR 4 = 2.420

120
LATIHAN 8

Pilihlah jawaban yang paling benar!

Dimiliki paparan hasil studi kohort dalam bentuk tabel 2×2 berikut:

D D
E a b n1
E c d n2
m1 m2 n

1. Pemanfaatan perangkat lunak komputer statistik sangat dibutuhkan


pada:
A. Pengolahan data dengan skala besar.
B. Analisis regresi ganda dengan jumlah regresor yang banyak.
C. Perhitungan estimasi parameter dengan prosedur iteratif.
D. Semuanya benar.

2. Pernyataan yang menunjang kemungkinan asosiasi positif antara faktor


risiko E dengan penyakit D jika n merupakan 1 sampel adalah:
A. a n1 > c n2 .
B. a m1 > b m 2 .
C. a b > c d.
D. Semuanya salah.

3. Pada analisis regresi logistik sederhana diperoleh hasil berupa:


A. Estimasi rasio risk C. A) dan B) benar
B. Estimasi rasio odds D. A) dan B) salah

Untuk soal No. 4 dan 5:


Dimiliki file data glm-reg.dta yang memuat data tentang
penghasilan tahunan (incbinary) 500 orang karyawan (1 untuk penghasilan
tahunan 26 ribu dollar dan 0 untuk penghasilan tahunan sama atau kurang

121
daripada itu), serta lama pendidikannya (educ) dalam tahun. Pada regresi
logistik sederhana incbinary terhadap educ diperoleh hasil berikut:

Logistic regression Number of obs = 500


LR chi2(1) = 48.17
Prob > chi2 = 0.0000
Log likelihood = -322.48937 Pseudo R2 = 0.0695

---------------------------------------------------------------
incbinary | Coef. Std. Err. z P>|z| [95% Conf. Interval]
----------+----------------------------------------------------
educ | .1702216 .0266265 6.39 0.000 .1180347 .2224086
_cons | -2.245047 .3645915 -6.16 0.000 -2.959633 -1.53046
---------------------------------------------------------------

4. Estimasi rasio odds smoke adalah:


0.170
A. ln 0.170 C. e
0.170
B. 0.170 D. 10

5. Kesimpulan analisis regresi logistik di atas yaitu:


A. Ada hubungan bermakna secara statistik antara pajanan educ
dengan respons incbinary.
B. Tidak ada hubungan bermakna secara statistik antara pajanan
educ dengan respons incbinary.
C. Belum dapat disimpulkan ada tidaknya hubungan bermakna
antara pajanan educ dengan respons incbinary.
D. Semuanya salah.

Untuk soal No. 6 s.d. 8:


Lihat kembali data yang digunakan untuk soal No. 4 dan 5 di atas.
Sekarang di sini ditampilkan hasil analisis regresi logistik ganda dengan
menambahkan variabel independen jobexp (lama tahun pengalaman kerja)
dan black (ras; 1 = black, 2 = white).

122
Logistic regression Number of obs = 500
LR chi2(4) = 208.21
Prob > chi2 = 0.0000
Log likelihood = -242.4705 Pseudo R2 = 0.3004
---------------------------------------------------------------
incbinary | Coef. Std. Err. z P>|z| [95% Conf. Interval]
----------+----------------------------------------------------
educ | .2453949 .0404171 6.07 0.000 .1661789 .3246109
jobexp | .2329718 .0262065 8.89 0.000 .1816079 .2843356
black | -1.905818 .400966 -4.75 0.000 -2.691697 -1.119939
_cons | -6.159688 .7790823 -7.91 0.000 -7.686661 -4.632714
---------------------------------------------------------------

5. Tanpa menilai kemaknaan masing-masing pajanan, model logit


incbinary = bo + b1educ + b2 jbexp + b3 black di atas:
A. Bermakna secara statistik.
B. Tak bermakna secara statistik.
C. Belum jelas kemaknaannya.
D. Semuanya salah.

6. Pajanan yang terutama berpengaruh terhadap kejadian berat badan lahir


rendah adalah:
A. Lama pendidikan.
B. Lama pengalaman kerja.
C. Ras.
D. Tak dapat ditentukan.

7. Ras Black menurunkan nilai logit incbinary sebesar:


A. ‒1.91 C. exp ‒1.91
B. ‒4.75 D. exp ‒4.75

8. Rasio odds suaian incbinary-black adalah:


A. ln ‒1.91 C. exp ‒1.91
B. ln ‒4.75 D. exp ‒4.75

123
DAFTAR PUSTAKA

Bouter LM, Zielhuis GA, & Zeegers MPA. 2018. Textbook of


Epidemiology. Houten: Bohn Stafleu van Loghum.
Fleiss JL, Levin B, & Paik MC. 2013. Statistical Methods for Rates and
Proportions, 3rd Ed. Hoboken, New Jersey: John Wiley & Sons.
Fletcher RW & Fletcher SW. 2005. Clinical Epidemiology: The Essentials,
4th Ed. Philadelphia: Lippincott William & Wilkins.
Harlan J. 2018. Analisis Regresi Logistik. Depok, Jawa Barat: Penerbit
Gunadarma.
Harlan J. 2008. Epidemiologi Kebidanan. Depok, Jawa Barat: Penerbit
Gunadarma.
Hosmer DW & Lemeshow. 2000. Applied Logistic Regression, 2nd Ed.
New York: Wiley.
Keogh RH & Cox DR. 2014. Case-Control Studies. Cambridge: Cambridge
University Press.
Kleinbaum DG, Kupper LL, & Morgenstern H. 1982. Epidemiologic
Research: Principles and Quantitative Methods. New York: Van
Nostrand Reinhold Company.
Lachin JM. 2000. Biostatistical Methods: The Assessment of Relative
Risk. New York: John Wiley & Sons, Inc.
Long JS & Freese J. 2014. Regression Models for Categorical Dependent
Variables Using Stata, 3rd Ed. College Station, Texas: Stata Press.
Rothman KJ, Greenland S, & Lash TL. 2008. Modern Epidemiology, 3rd
Ed. Philadelphia: Lippincott William & Wilkins.
StataCorp. 2019. Stata Base Reference Manual: Release 16. College
Station, Texas: Stata Press.
Szklo M & Nieto FJ. 2007. Epidemiology: Beyond the Basics, 2nd Ed.
Sudbury, MA: Jones and Bartlett Publishers.
Wang JD. 2002. Basic Principles and Practical Applications in
Epidemiological Research. New Jersey: World Scientific.

125
Lampiran

RANCANGAN STUDI EPIDEMIOLOGI1

Dikenal berbagai rancangan studi pada penelitian Epidemiologi yang


dimaksudkan untuk mempelajari hubungan antara pajanan dengan kejadian
penyakit, sesuai dengan cara pengumpulan data yang akan dan dapat dijalani
serta jenis data yang akan dikumpulkan. Di sini hanya akan diperlihatkan
tiga rancangan studi dasar yang lazim digunakan pada penelitian
observasional dalam Epidemiologi Lapangan, yaitu rancangan studi
potong-lintang (cross-sectional), rancangan studi kohort, dan rancangan
studi kasus-kontrol.

Rancangan Studi Cross-Sectional


Pada rancangan studi cross-sectional (potong-lintang), subjek yang
dipelajari berasal dari satu kelompok. Dengan pengamatan pada satu titik
waktu, subjek yang diamati dipisahkan menjadi empat subkelompok; sakit
dan terpajan, sakit dan tidak terpajan, tidak sakit dan terpajan, serta tidak
sakit dan tidak terpajan (gambar II.1). Paparan hasil studi cross-sectional
secara skematis diperlihatkan pada tabel II.1.

Tabel II.1 Paparan umum hasil studi cross-sectional

C C
E a b a+b
E c d c+d
a+c b+d n

1
Epidemilogi Kebidanan, Harlan J, Penerbit Gunadarma, 2008

127
Gambar II.1 Rancangan studi cross
cross-sectional

N : populasi target
C : kasus prevalen
C : non-kasus atau survivor
E : subjek terpajan
E : subjek tak-terpajan

Populasi ((N) diklasifikasikan menjadi dua


kelompok, terpajan ( E ) dan tak-terpajan ( E )

Sampling (acak) probabilitas

Rancangan Studi Kohort


Subjek yang dipelajari berasal dari dua kelompok, yaitu kelompok
terpajan dan tidak terpajan.. Kedua kelompok diamati selama periode
pengamatan yang telah ditentukan, dan pada akhir periode pengamatan
dihitung jumlah kejadian penyakit pada masing
masing-masing kelompok (diagram
II.2).
.2). Paparan hasil studi kohort secara skematis diperlihatkan pada tabel II.2.

128
Tabel II.2 Paparan umum hasil studi kohort

D D
E a b a+b
E c d c+d
a+c b+d n

Gambar II.2 Rancangan studi cross


cross-sectional

D : kasus insidens atau kematian


D : non-kasus atau survivor

Non-kasus
kasus diikuti untuk pendeteksian penyakit
atau kematian ( D )

Rancangan Studi Kasus-Kontrol


Kontrol
Subjek yang dipelajari juga berasal dari dua kelompok, yaitu
kasus) dan kelompok yang tidak menderita
kelompok penderita penyakit (kasus
kontrol). Pada kedua kelompok dilakukan
penyakit yang dipelajari (kontrol
penggalian data pajanan yang ada di masa lalu, baik dengan teknik
wawancara maupun pemeriksaan rekamrekam-medis, sehingga dapat dihitung
frekuensi pajanan pada masing-masing
masing kelompok ((gambar II.3).

129
Tabel II.3.. Paparan umum hasil studi kasus
kasus-kontrol
Kasus Non-kasus
E a b a+b
E c d c+d
a+c b+d n

Gambar II.3 Rancangan studi kasus kontrol

Na : populasi kasus
Nb : populasi kontrol

Contoh IV.1 (studi kohort):


Misalkan hendak dipelajari pengaruh kegiatan fisik dalam mencegah
terjadinya penyakit influenza. Diambil sampel 100 orang dengan kegiatan
fisik aktif dan 100 orang dengan kegiatan fisik tidak aktif, lalu seluruhnya
diamati selama periode wabah influenza. Empat orang dari kelompok
kegiatan
giatan fisik aktif dan 2 orang dari kelompok kegiatan fisik tidak aktif
mengundurkan diri selama proses pengamatan. Dari sisa anggota sampel
diperoleh hasil sebagai berikut:

130
Tabel II.4 Hasil studi kohort hubungan kegiatan fisik dengan kejadian
penyakit influenza

Kegiatan Penyakit influenza


Jumlah
fisik Sakit Tidak sakit
Aktif 42 54 96
Tidak aktif 72 26 98
Jumlah 114 80 194

Incidence risk penyakit influenza pada kelompok dengan kegiatan


fisik aktif (kelompok terpajan) adalah:

42
CIˆ1 = ≈ 0.44
96

Incidence risk penyakit influenza pada kelompok dengan kegiatan


fisik tidak aktif (kelompok tidak terpajan) adalah:

72
CIˆ2 = ≈ 0.73
98

Rasio antara keduanya dinamakan incidence risk ratio (cumulative


incidence ratio), dinyatakan dengan lambang CIR:
ˆ
ˆ = CI1 = 0.44 ≈ 0.60
CIR
CIˆ2 0.73

Pajanan merupakan faktor risiko jika CIR secara bermakna lebih


besar daripada satu dan merupakan faktor preventif jika CIR secara
bermakna lebih kecil daripada satu.

Contoh II.2 (studi kasus-kontrol):


Untuk mempelajari kemungkinan hubungan antara kadar kolesterol
serum dengan kejadian penyakit jantung koroner (PJK), diambil sampel 100
orang penderita PJK dan 100 orang kontrolnya yang tidak menderita PJK,
lalu dicari data kolesterol serum terdahulunya.

131
Tabel II.5 Hasil studi kasus-kontrol hubungan kadar kolesterol serum
dengan kejadian penyakit jantung koroner

Kadar kolesterol Status morbiditas


Jumlah
serum Kasus PJK Kontrol
Tinggi 53 34 87
Normal 147 166 313
Jumlah 200 200 400

Di sini ukuran incidence risk untuk masing-masing kelompok


terpajan dan kelompok tidak terpajan tak dapat dihitung, karena kelompok-
kelompok tersebut tidak ada. Yang dapat dihitung di sini adalah ukuran odds
ratio (rasio imbangan), yang dinyatakan dengan lambang OR:

ÔR =
( 53)(166 ) ≈ 1.76
(147 )( 34 )

Untuk penyakit yang jarang (rare disease), yaitu penyakit dengan


prevalensi sangat rendah, odds ratio merupakan ukuran aproksimasi
(pendekatan) bagi incidence risk ratio.

Contoh II.3 (studi cross-sectional):


Data hipotetis berikut merupakan contoh data potong-lintang cross-
sectional) yang memperlihatkan pengkajian hubungan antara kebiasaan
merokok dengan kasus bronkitis kronis, yaitu data yang dikumpulkan pada
500 orang pria berusia 60 tahun atau lebih.

Tabel II.6 Hasil studi cross-sectional hubungan kebiasaan merokok


dengan kasus bronkitis kronis

Bronkhitis kronis
Kebiasaan merokok Jumlah
Ada Tidak ada
Ya 40 80 120
Tidak 60 320 380
Jumlah 100 400 500

132
Ukuran yang dapat dihitung dari rancangan studi cross-sectional ini
antara lain adalah prevalensi penyakit bronkitis kronis:

100
ˆ =
Prev = 0.20
500

Prevalensi pada kelompok terpajan, prevalensi pada kelompok tidak


terpajan, demikian pula rasio prevalensi dapat dihitung, walaupun demikian
ukuran-ukuran ini tidak lazim ditampilkan. Ukuran asosiasi yang dihitung
umumnya, seperti halnya pada rancangan studi kasus-kontrol, adalah rasio
imbangan (odds ratio):

ÔR =
( 40 )( 320 ) ≈ 2.67
( 60 )(80 )

133
Dari penulis yang sama:

- Ilmu Penyakit Umum


- Biopsikologi
- Psikologi Faal
- Epidemiologi Kebidanan
- Biostatistika Dasar
- Metode Penelitian Kesehatan
- Informatika Kesehatan
- Akupunktur Kebidanan
- Metode Statistika 1
- Metode Statistika 2
- Pengenalan Stata
- Data Kosong dan Imputasi Ganda
- Perhitungan Ukuran Sampel, Power dan Ukuran Efek
- Analisis Variansi
- Analisis Regresi Linear
- Analisis Regresi Logistik
- Structural Equation Modeling I: Analisis Jalur
- Structural Equation Modeling II: Analisis Faktor Konfirmatorik
- Structural Equation Modeling III: Model Regresi Struktural &
Generalized Structural Equation Modeling
- Analisis Data Survei
- Analisis Data Longitudinal
- Analisis Multilevel
- Analisis Survival

Anda mungkin juga menyukai