Anda di halaman 1dari 45

MODUL

ANALISIS DATA UNTUK VARIABEL OUTCOME


BERSKALA NOMINAL DUA KATEGORI
(BINARY OUTCOME)

Oleh:
dr. Tangking Widarsa, MPH
dr. I Wayan Gede Artawan Eka Putra, M.Epid.
dr. Putu Ayu Swandewi Astuti, MPH.

Program Studi Kesehatan Masyarakat


Fakultas Kedokteran Universitas Udayana
Denpasar, 2016

  i
Daftar Isi
Daftar Isi ......................................................................................................................... i  
Bagian 1 Konsep Analisis Binary Outcome .................................................................. 1  
1.1 Pendahuluan ........................................................................................................ 1  
6.2 Binary Outcome................................................................................................... 4  
6.3 Ukuran Risk dan Asosiasi ................................................................................... 5  
1. Insiden Risk ....................................................................................................... 5  
2. Insiden Risk Ratio ............................................................................................. 6  
3. Insiden Rate ....................................................................................................... 7  
4. Insiden Rate Ratio ............................................................................................. 8  
5. Perbedaan insiden risk dengan insiden rate ....................................................... 8  
6. Prevalen ............................................................................................................. 9  
7. Prevalen Ratio ................................................................................................... 9  
8. Odd Ratio......................................................................................................... 10  
9. Prevalen Odd Ratio.......................................................................................... 10  
Bagian 2. Analisis Bivariabel ...................................................................................... 12  
Bagian 3 Analisis Stratifikasi ...................................................................................... 16  
(Mantel-Haenszel Analysis) .................................................................................... 16  
3.1 Penerapan analisis stratifikasi............................................................................ 16  
3.2 Konsep analisis stratifikasi ................................................................................ 16  
3.3 Analisis Mantel-Haenszel dengan STATA ....................................................... 18  
Bagian 4. Analisis Multivariabel ................................................................................. 21  
4.1 Pendahuluan ...................................................................................................... 21  
4.2 Analisis Multivariate Binary Outcome .............................................................. 22  
4.3 Regresi Logistik................................................................................................. 23  
1. Seleksi Variabel Prediktor ............................................................................... 23  
2. Odd Ratio (OR) ............................................................................................... 25  
3. Uji Hipotesis OR ............................................................................................. 26  
4.4 Prosedur Regresi Logistik Menggunakan Stata ................................................ 27  
4.5 Regresi Poisson ................................................................................................. 34  
Pengitungan Rate Ratio ....................................................................................... 35  
4.6 Prosedur Regresi Poisson Menggunakan Stata ................................................. 36  
Daftar Pustaka ............................................................................................................. 43  

  ii
Bagian 1 Konsep Analisis Binary Outcome

1.1 Pendahuluan
Penelitian di bidang kesehatan dan kedokteran dibedakan menjadi penelitian
kualitatif dan kuantitatif. Penelitian kualitatif seperti misalnya case-series, case study,
study etnographi dan lainnya. Penelitian kualitatif menggunakan pendekatan
postpositivisme, holistik, dan pengumpulan data umumnya dengan cara wawancara
mendalam, wawancara partisipasi, fokus grup pada sampel atau narasumber (key
person) yang jumlahnya tidak banyak. Berbeda dengan penelitian kuantitatif yang
menggunakan pendekatan positivisme, data dikumpulkan dengan pengukuran/
pemeriksaan, observasi, wawancara yang dilakukan pada sampel yang jumlahnya
cukup banyak.
Penelitian kuantitatif di bidang kesehatan/kedokteran dibedakan menjadi
penelitian eksperimen dan penelitian observasional. Pada penelitian eksperimen,
peneliti melakukan intervensi atau memberikan perlakuan yang akan diteliti terhadap
subjek penelitian. Misalnya peneliti akan mempelajari peranan protein soya terhadap
absorbsi calsium pada mencit. Pada penelitian ini, peneliti akan memberikan
perlakuan berupa protein soya kepada binatang percobaan dengan dosis tertentu
untuk jangka waktu tertentu. Sebaliknya, pada penelitian observasional, peneliti
hanya mengamati penomena yang ada dan tidak melakukan intervensi apapun
terhadap subjek dan lingkungan penelitian. Misalnya peneliti akan mempelajari
hubungan merokok dengan penyakit jantung koroner (PJK). Pada penelitian ini,
peneliti mengikuti perkembangan kejadian PJK pada orang yang memilki kebisaan
merokok dan yang tidak merokok sampai waktu tertentu.
Penelitian observasional di bidang kesehatan/kedokteran dibedakan lagi
berdasarkan ada tidaknya pembanding, menjadi penelitian observasional deskriptif
dan penelitian observasional analitik. Bila tidak ada kelompok pembanding, maka
penelitian tersebut termasuk penelitian observasional deskriptif. Sebaliknya, bila ada
kelompok pembanding (kontrol), maka penelitian tersebut termasuk ke dalam
kelompok penelitian observasional analitik. Penelitian observasional analitik
dibedakan lagi berdasarkan waktu variabel sebab dan akibat dikumpulkan menjadi
penelitian Kohort, Case-Control, dan Cross-Sectional,
Kalau pengukuran variabel sebab dilakukan duluan dan berdasarkan hasil
pengukuran variabel sebab tersebut kemudian subjek dikelompokkan menurut ada

  1
tidaknya sebab menjadi kelompok terpapar dan kelompok tidak terpapar (kontrol),
maka model penelitian ini disebut penelitian observasional kohort. Misalnya yang
menjadi variabel sebab adalah merokok dan subjek yang merokok dikemlompokan
menjadi kelompok perokok atau disebut sebagai kohort terpapar dan yang tidak
dikelompokan menjadi non perokok yag selanjutnya disebut sebagai kohort kontrol.
Kemudian setelah itu baru diamati atau diukur secara prospektif ada/tidaknya akibat
misalnya PJK, sebagai variabel tergantung, pada orang tersebut. Jenis penelitian
seperti ini dikelompokkan menjadi penelitian Observasional Kohort. Rancangan
penelitian kohort dapat digambarkan sebagai bagan berikut.
 
                         Penelitian  dimuai    
         di  sini  
 
             SEBAB                                  AKIBAT  
 
                                       Ada  
Terpapar
 
      Subjek
                               Tidak  
Tidak
              Prospektif                        Ada  
            terpapar
                         Tidak    
       
Gambar 1. Bagan Penelitian Kohort Prospektif

Apabila pengumpulan data berawal dari variabel akibat kemudian subjek


penelitian dikelompokkan menjadi kelompok subjek dengan akibat positif, misalnya
subjek menderita PJK yang juga disebut sebagai kasus dan kelompok yang tidak ada
akibat atau yang tidak menderita PJK dikelompokkan menjadi Kontrol. Selanjutnya,
setelah subjek dikelompokan menurut ada/tidaknya akibat menjadi kasus dan kontrol,
baru kemudian peneliti mengumpulkan data sebab misalnya “merokok” dengan cara
retrospektif dengan menanyakan riwayat yang sudah terjadi sepert misalnya riwayat
merokok mereka. Jenis penelitian ini digolongkan sebagai penelitian observasional
analitik dengan rancangan Case-Control dengan gambar rancangan sebagai bagan
berikut.

  2
                       Penelitian  dimulai  
 Di  sini  
 
 
               SEBAB                                            AKIBAT  
                       Ada  
Kasus
               Tidak  
                       Ada   SUBJEK
                        Kontrol
               Tidak  
Gambar 2. Bagan Penelitian Case-Control
 
Bila variabel sebab dan akibat dikumpulkan pada waktu yang bersamaan,
maka penelitian ini disebutkan sebagai penelitian observasional dengan rancangan
poton lintang (Cross-sectional). Misalnya akan diteliti hubungan merokok dengan
PJK dimana merokok sebagai variabel sebab dan PJK sebagai variabel akibat.
Sebanyak 100 orang dewasa dipilih sebagai sampel. Sampel yang dipilih didatangi di
rumahnya dan diperiksa jantungnya apakah dia menderita PJK atau tidak dan
sekaligus ditanyakan kebiasaan merokoknya pada saat itu juga. Waktu sampel dipilih,
peneliti belum mempunyai data atau belum mengetahui apakah sampel tersebut
merokok atau tidak dan juga belum diketahui apakah dia PJK atau tidak. Model
rancangan penelitian Cross-sectional dapat digambarkan menggunakan bagan sebagai
berikut:
 
 
POINT IN TIME
   
  Variabel Sebab (merokok)
  Variabel Akibat (PJK)
 
 
Rancangan cross-sectional dipakai apa bila:
1. Prevalensi kejadian outcome yang akan diteliti cukup sering.
Rancangan penelitian cross-sectional dapat dipilih bila akan mempelajari
hubungan sebab-akibat atau perbedaan risk atau perbedaan rerata apabila prevalensi

  3
outcome yang akan diteliti cukup sering (> 20%). Sebagai contoh, misalnya akan
meneliti hubungan antara paparan asap rokok dengan ISPA, dimana kejadian ISPA
cukup tinggi. Bila prevalensi outcome yang diteliti jarang (< 20%) sebaiknya
menggunakan rancangan case-control. Misalnya akan meneliti hubungan antara
circumsisi dengan kejadian ca penis, dimana kejadian ca penis sangat jarang.
2. Memiliki banyak tujuan atau hipotesis.
Rancangan cross-sectional dapat dipakai pada penelitian yang mempunyai
banyak variabel bebas dan tergantung atau memiliki banyak tujuan dan hipotesis yang
akan diteliti hubungannya. Misalnya akan diteliti korelasi antara berat badan dengan
kadar gula darah, perbedaan gula darah antara orang hipertensi dengan tidak,
perbedaan risk hipertensi antara perokok dan non perokok, dan lain-lainnya.
Kelebihan & Kekurangan Rancangan Cross-sectional
Penelitian observasional dengan rancangan Cross-Sectional mempunyai
kemampuan generalisasi hubungan sebab akibat atau causal relationship yang paling
lemah dibandingkan dengan rancangan case-control maupun rancangan kohort. Hal
ini disebabkan karena tidak dapat dipastikan apakah sebab terjadi duluan dari
terjadinya akibat. Misalnya pada hasil pemeriksaan seorang subjek menderita PJK dan
dia merokok. Yang menjadi pertanyaan apakah dia merokok sebelum menderita PJK
atau sebaliknya, karena pengukuran merokok dan PJK dilakukan pada waktu yang
sama. Kelebihan dari rancangan ini adalah jumlah variabel bebas dan tergantung yang
diteliti bisa banyak, yang tidak dapat dilakukan dengan rancangan case-control atau
kohort. Selain itu, rancangan cross-sectional membutuhkan waktu yang relatif lebih
pendek dan biaya yang lebih sedikit.

6.2 Binary Outcome


Berdasarkan skala pengukuran, variabel dibedakan menjadi variabel nominal,
ordinal, interval dan ratio. Variabel nominal adalah variabel yang hasil
pengukurannya atau unit nilai pengukurannya tidak memiliki rentang ukuran yang
tetap dan hasil pengukurannya tidak dapat diurut. Misalnya jenis kelamin, pekerjaan,
dan lainnya. Variabel nominal dibedakan menjadi variabel nominal binary dengan
hanya dua kategori dan multinomial dengan lebih dari dua kategori. Variabel skala
ordinal juga tidak memilki interval yang tetap, akan tetapi hasil pengkurannya dapat
diurut. Misalnya status gizi baliti dengan kategori hasil pengkurannya terdiri dari gizi
lebih, gizi baik, gizi kurang, dan gizi bukur. Variabel interval memiliki unit ukuran

  4
yanh memilki ienterval tetap dan juga dapat diurut, akan tetapi tidak mempunyai nilai
nol absolut. Misalnya suhu udara dalam derajat Celcius dimana nilainya bisa –10o C.
Variabel ratio sama dengan variabel interval, tetapi dia memiliki nilai nol absolut
artinga hasil pengukuran dari variabel tersebut tidak ada kemungkinan nilainya < nol.
Misalnya tinggi badan, berat badan, gula darah dan sebabagainya.
Dalam penelitian kesehatan atau kedokteran, outcome variabel yang sering
diteliti merupakan variabel dengan dua kategori atau disebut binary outcome.
Misalnya pada penelitian faktor risiko penyakit jantung koroner (PJK), yang menjadi
variabel outcome (tergantung) adalah PJK dengan dua kategori, yaitu menderita PJK
dan bukan PJK. Pada contoh penelitian lain, diteliti pemberian ASI ekslusif terhadap
risiko diare, dimana variabel outcome-nya adalah diare dengan dua kategori yaitu:
diare dan tidak diare.
Contoh Kasus
Penelitian faktor risiko CHD dilakukan di Rumah Sakit X. Populasi dari
penelitian ini adalah orang dewasa umur 20 tahun ke atas yang berobat di klinik
penyakit dalam RS X. Sebanyak 200 sampel diambil secara acak dari 7525 pasien
baru yang berobat di klinik penyakit dalam RS X dalam 1 tahun terakhir. Data yang
dikumpulkan meliputi umur, jenis kelamin, diagnose penyakit, kadar kolesterol, berat
badan dan tinggi badan yang tercatat di dalam catatan medis pasien bersangkutan.
Pertanyaan riset:
Apakah obesitas (IMT > 25) meningkatkan risiko CHD?
Variabel penelitian:
Variabel tergantung : CHD (1=CHD dan 2/0 = non CHD)
Variabel bebas : Obase (1=obase dan 2/0 = non obase)
Variabel perancu : Sex ( 1=laki dan 2/0 = perempuan)
Umur (1= - 34, 2 = 35 – 54, 3 = 55 -)
Hipercholesterolemia (1=hypercholesterol dan 2/0=normal)

6.3 Ukuran Risk dan Asosiasi


1. Insiden Risk
Insiden risk atau disebut insiden kumulatif adalah jumlah kasus baru yang
terjadi dalam periode waktu tertentu (minggu, bulan, tahun) terhadap jumlah
penduduk yang berisiko. Misalnya dari 10 penduduk bersiko CHD (belum menderita
CHD) diamati sampai 5 tahun dan pada tahun pertama tidak ada yang menderita,

  5
tahun kedua ada 1 yang menderita, pada tahun ke 3 ada 2 penderita baru, tahun ke 4
tidak ada tetapi sda 1 sampel yang lost of follow up (DO) dan pada tahun ke lima ada
1 penderita baru. Jadi dari 10 sampel tersebut terdapat 4 kasus CHD baru secara
kumulatif dalam 5 tahun pengamatan. Jadi insiden kumulatif atau insiden risk = 4/10
atau 40%.
2. Insiden Risk Ratio
Insiden risk ratio atau disebut risk ratio (RR) adalah ratio insiden risk antara
kelompok terpapar dengan kelompok tidak terpapar. Bila insiden risk pada kelompok
terpapar adalah P1 dan insiden risk pada kelompok tidak terpapar adalah P0, maka
insiden risk ratio = P1/P0. Misalnya dari 10 kelompok terpapar (Obase), dalam
periode pengamatan terdapat 4 kasus CHD baru dan dari 10 kelompok tidak terpapar
(non obase) terdapat 2 kasus CHD baru, maka insiden risk ratio CHD antara
kelompok terpapar dengan tidak terpapar menjadi:
Tabel 2. Distribusi kejadian PJK menurut tingkat obesitas subjek
Obsitas PJK Total
PJK ( + ) PJK ( - )
Obase 4 6 10
Non obase 2 8 10
Total 6 14 20

Dari tabel distribusi di atas dapat dihitung:


Insiden risk kelompok obase : P1 = 4/10
Insiden risk kelompok non-obase: P0 = 2/10
Maka:
P1 4/10
Insiden Risk Ratio: RR = ------ = --------- = 2,0
P0 2/10
RR menunjukan risiko relatif antara kelompok terpapar dengan tidak terpapar.
RR = 2,0 berarti orang yang menderita obase sampai 5 tahun memiliki risiko
CHD 2 kali lebih tinggi dari orang tidak obase.

  6
3. Insiden Rate
Insiden rate hampir sama dengan insiden risk, akan tetapi pada insiden rate
menyatakan jumlah kasus baru menurut orang-waktu pengamatan (person time),
sebaliknya pada insiden risk adalah jumlah kasus baru menurut jumlah orang yang
diamati (person). Kita pakai kasus insiden risk di atas sebagai contoh yang disajikan
dalam matrik di bawah ini.
Kelompok obase (terpapar)
Waktu pengamatan (bulan) CHD TIME(BL)
1 2 3 4 5
TDK=0 60
D YA=1 22
D YA=1 30
D YA=1 34
TDK=0 60
TDK=0 60
TDK=0 60
TDK=0 60
D YA=1 54
DO DO=0 42
Total 4 482

Insiden Rate pada kelompok terpapar: P1 = 4/482 orang bulan.

Kelompok nonobase (tidak terpapar)


Waktu pengamatan (bulan) CHD TIME(BL)
1 2 3 4 5
TDK=0 60
TDK=0 60
DO DO=0 30
D YA=1 34
TDK=0 60
TDK=0 60
TDK=0 60

  7
TDK=0 60
TDK=0 60
D YA=1 54
DO DO=0 42
Total 2 580

Insiden Rate pada kelompok tidak terpapar: P0 = 2/580 orang bulan


 
4. Insiden Rate Ratio
Tabel 3. Distribusi kejadian PJK menurut tingkat obesitas subjek

Obase Non-obase Total


PJK (kasus) 4 2 6
Time (orang bulan) 482 580 1062
Insiden Rate 0,0083 0,0034 0,0056

P1 (Insiden rate kelompok terpapar) = 4/482 kasus/orang bulan pengamatan


Po (Insiden rate kelompok tidak terpapar) = 2/580 kasus/orang bulan pengamatan

P1 4/482 0,0083
Insiden Rate Ratio = ------ = ---------- = -------------- = 2,4
P0 2/580 0,0034
 
5. Perbedaan insiden risk dengan insiden rate
Nilai Insiden risk berbading lurus dengan lamanya waktu pengamatan.
Misalnya kita ambil contoh pada kelompok terpapar di atas. Bila pengamatan sampai
tahun ke dua, maka didapatkan insiden risknya = 1/10 = 0,10. Bila pengamatan
sampai 3 tahun menjadi 3/10 atau 0,30 dan bila sampai lima tahun menjadi 4/10 atau
0,40. Jadi makin lama pengamatan, makin besar pula nilai insiden risknya.
Sedangkan nilai insiden rate tidak tergantung dari lama pengamatan karena
pembaginya adalah orang-waktu. Dengan menggunakan contoh di atas, insiden rate
sampai tahun ke dua = 1/238 = 0,0042, sampai tahun ke 3 = 3/338 = 0,0088, dan

  8
sampai tahun ke 5 = 4/482 = 0,0082. Pada contoh ini tampak insiden rate tidak
berbading lurus dengan lama pengamatan.
6. Prevalen
Prevalen adalah kejadian kasus baru dan lama pada waktu tertentu (point in
time) dari sampel yang diamati. Bila dari 200 sampel ditemukan terdapat 15 kasus
CHD, maka prevalen CHD = 15/200 = 7,5%. Pada penelitian cross-sectional
pengukuran variabel akibat misalnya kejadian PJK dilakukan pada satu titik waktu,
sehingga kasus PJK yang ditemukan bisa kasus lama dan juga kasus baru. Jadi data
PJK yang didapat dari penelitian cross-sectonal adalah data prevalen (baru dan lama).
7. Prevalen Ratio
Prevalen ratio (PR) adalah ratio antara prevalen pada kelompok terpapar
dengan kelompok tidak terpapar. Bila p1 adalah prevalen pada kelompok terpapar dan
p0 adalah prevalen pada kelompok tidak terpapar, maka PR = P1/P0. Misalnya, dari
200 sampel ditemkan sebanyak 75 obase (kelompok terpapar) dan 125 non obase
(kelompok tidak terpapar), dan dari 75 sampel yang obase ditemukan sebanyak 10
PJK dan dari 125 non obase didapatkan 5 kasus PJK. Apabila hasil pengukuran
tersebut disajikan dalam sebuat tabel distribusi silang akan didapatkan hasil
pengukuran tersebut sebagai berikut.
Tabel 1. Distribusi kejadian PJK menurut tingkat obesitas subjek
Obsitas PJK Total
PJK ( + ) PJK ( - )
Obase 10 65 75
Non obase 5 120 125
Total 15 185 200

Dari tabel distribusi tersebut, maka dapat dihitung:


Prevalen PJK pada kelompok obase : P1 = 10/75
Prevalen PJK pada kelompok non-obase : P0 = 5/125
maka
P1 10/75
Prevalen Rasio: PR = ----- = ----------- = 3,3
P0 5/125

  9
PR menunjukan risiko relatif kejadian PJK antara kelompok terpapar terhadap
yang tidak terpapar. PR = 3,3 berarti orang obase memiliki probabilitas (risiko)
CHD 3,3 kali lebih tinggi dari yang tidak obase.
 
8. Odd Ratio
Odd adalah perbadingan antara probabilitas terjadinya event dengan
probabilitas tidak terjadinya event tertentu. Bila kemungkinan sakit adalah P dan
kemungkinan tidak sakit adalah (1-P), maka nilai Odd = P/(1 - P)
Odd Ratio (OR) adalah ratio dari Odd kelompok terpapar dengan Odd kelompok tidak
terpapar.
Bila dari n1 kelompok terpapar terdapat a sakit dan b tidak sakit, maka nilai Odd
kelompok terpapar = (a/n1)/(b/n1) = a/b
Bila dari n0 kelompok tidak terpapar terdapat c sakit dan d tidak sakit, maka nilai Odd
kelompok tidak terpapar = (c/n0)/(d/n0) = c/d
Bila kedua data tadi disajikan dalam sebuah tabel silang 2 x 2, maka akan didapatkan
tabel silang sebagai berikut.
Ekspose Event (kesakitan) Total
Sakit Tidak
Eksp + a b n1
Eksp - c d n0

Odd Eksp a/b ad


Odd Ratio = ------------- = ------ = --------
Odd noneksp c/d bc
 
9. Prevalen Odd Ratio
Prevalen Odd Ratio (POR) adalah perbandingan prevalen rate antara
kelompok terpapar dengan kelompok tidak terpapar. Prevalen rate adalah jumlah
kasus dibagi dengan jumlah orang-waktu pengamatan. Bila pada kelompok terpapar
terdapat a kasus dari n1 orang-waktu pengamatan dan dari kelompok tidak terpapar
terdapat b kasus dari n0 orang-waktu pengamatan, maka:
Prevalen Odd ekspose = a/n1
Prevalen Odd nonekspose = b/no

  10
a/n1 a x n0
POR = --------- = ------------
b/n0 b x n1

seperti dalam tabel di bawah ini.

Ekspose Kasus Orang bulan Prevalen Odd POR


pengamatan
Eksp + a n1 a/n1 a x n0
Eksp - b n0 b/n0 b x n1

  11
Bagian 2. Analisis Bivariabel

Untuk memberikan contoh analisis bivariabel, pada modul ini akan dilakukan
praktek menggunakan perangkat lunak statistik Stata SE 12.1. Untuk itu ikutilah
langkah-langkah sebagai berikut:

1. Bukalah data dengan nama faktor risiko CHD.dta

2. Untuk melakukan analisis bivariate pada data binary outcome perlu dibuat cross
tabulasi antara variabel eksposure sebagai variabel row dan outcome sebagai
variabel column. Pada penelitian kohort dibuat cross tabulasi dengan row
peresented sedangkan pada case control column persented.

Prosedur cross tabulasi sama dengan two-way table. Misalnya dalam kasus ini
ingin mengetahui pengaruh obase terhadap CHD maka untuk membuat two-way
tables dimulai dengan mengklik Statistic pada toolbar menu kemudian pilih
”summaries, tables and test” selanjutnya pilih Tables kemudian klik “Two-way
tables with measures of association”. Setelah muncul box dialog masukkan
variabel bebas (obase) pada kotak Row variable dan variable tergantung (CHD)
pada Column variable. Bila ingin menampilkan hasil uji Chi Square bisa
dicentang Pearson’s chi-squared. Untuk menjalankan klik OK.
Untuk melakukan prosedur yang sama menggunakan perintah, pada commands
window bisa diketik: tabulate obase CHD, chi2 col row maka akan muncul
hasil analisis pada results window sebagai berikut:

  12
3. Menghitung ukuran asosiasi pada penelitian kohort, pada penelitian dengan
desain kohort maka ukuran asosiasi yang dihitung adalah Risk Ratio. Untuk
menghitung risk ratio pilih menu Statistic kemudian “Epidemiologi and related”
kemudian pilih “Tables for epidemiologist” setelah itu klik “Cohort study risk-
ratio” maka akan muncul box dialog sebagai berikut:

  13
Masukkan variabel outcome (CHD) pada Case variable dan eksposure (obase) ke
Exposed variable. Setelah itu klik OK maka muncul hasil sebagai berikut:

Hasil yang sama akan didapat bila mengetik perintah: cs CHD obase
Interpretasi:

a. Risk difference = 0,237 (23,7%); CI 95%: 0,116 – 0,358 yang berarti risiko
terjadinya CHD pada kelompok obase 23,7% lebih besar
dibandingkankelompok yang tidak obase.
b. Risk ratio sebesar = 2,348; CI 95%: 1,427 – 3,864 yang berarti risiko
terjadinya CHD pada kelompok obase 2,3 kali dibandingkankelompok yang
tidak obase.
c. Attributable risk % (AR%) = 0,574 (57,4%); 95% CI: 0,299 – 0,741 berarti
57,4% kejadian CHD pada kelompok obase disebabkan oleh obesitas.
d. Population attributable risk % (PAR%) = 0,426 (42,6%) berarti 42,6%
kejadian CHD pada populasi disebabkan oleh obesitas.

4. Menghitung ukuran asosiasi pada penelitian case control, pada penelitian dengan
desain case control maka ukuran asosiasi yang dihitung adalah Odds Ratio.
Untuk menghitung Odds ratio pilih menu Statistic kemudian “Epidemiologi and
related” kemudian pilih “Tables for epidemiologist” setelah itu klik “Case-control
study odds ratio” maka akan muncul box dialog sebagai berikut:

  14
Masukkan variabel outcome (CHD) pada Case variable dan eksposure (obase) ke
Exposed variable. Setelah itu klik OK maka muncul hasil sebagai berikut:

Hasil yang sama akan didapat bila mengetik perintah: cc CHD obase
Interpretasi:
a. Odds ratio = 3,3; CI 95%: 1,633 – 6,834 yang berarti obase (obesitas)
merupakan faktor risiko terjadinya CHD atau odds terjadinya CHD pada
kelompok obase 3,3 kali dibandingkan kelompok yang tidak obase.
b. Attributable risk % (AR%) = 0,697 (69,7%); 95% CI: 0,387 – 0,854 berarti
69,7% kejadian CHD pada kelompok obase disebabkan oleh obesitas.
c. Population attributable risk % (PAR%) = 0,514 (51,4%) berarti 51,4%
kejadian CHD pada populasi disebabkan oleh obesitas.

  15
Bagian 3 Analisis Stratifikasi

(Mantel-Haenszel Analysis)

3.1 Penerapan analisis stratifikasi


Metode analisis stratifikasi Mantel-Haenzel merupakan salah satu metode
analisis multivariate yang digunakan untuk mengendalikan efek dari variabel perancu
dengan cara mengelompokan sampel menjadi kelompok yang memilki kategori
variabel perancu yang sama. Jumlah kelompok sampel (strata) yang dibuat adalah
sebanyak hasil kali kategori dari variabel perancu yang akan dikendalikan. Bila
misalnya terdapat 2 variabel perancu yang akan dikendalikan dimana variabel perancu
X1 memiliki 2 kategori dan variabel perancu X2 dengan 3 kategori, maka sampel
akan dikelompokan mejadi 6 kelompok (starata). Metode Mantel-Haenszel juga
digunakan untuk menilai apakah variabel ke tiga X2, memberi pengaruh perancu,
interaksi, atau independence terhadap hubungan variabel pertama X1 dengan variabel
kedua Y.

3.2 Konsep analisis stratifikasi


Pada contoh kasus di atas akan dibuktikan apakah obesitas berpengaruh terhadap
kejadian CHD, dimana jenis kelamin dianggap sebagai variabel perancu.
Pada kasus di atas, CHD sebagai variabel outcome, obase sebagai variabel bebas dan
sex sebagai perancu.
Metode Mantel-Haenzel adalah metode analisis untuk mengendalikan efek variabel
perancu dengan cara mengelompokan subjek menjadi kelompok yang homogen.
Misalnya pada kasus di atas, subjek akan dikelompokan menjadi 6 kelompok subjek
atau 6 strata karena terdapat 2 variabel perancu, yaitu sek dengan 2 kategori dan
kelompok umur dengan 3 kategori, menjadi:
Strata 1: sujkek kelompok sex = 1
Strata 2: subjek kelompok sex = 2
Dari semua strata yang ada akan dihitung Common Prevalen Rationya (PRMH) yang
merupakan Prevalen Ratio yang telah terkoreksi dari efek variabel perancu.
PRMH dihitung dengan rumus:
∑D1iY0i/Yi
PRMH = ------------------
∑D0iY1i/Yi

  16
Keterangan :
PRMH = Common Prevalen ratio
D1i = jumlah kasus pada kelompok terpapar di strata ke i
D0i = jumlah kasus pada kelompok kontrol di strata ke i
Y1i = jumlah sampel pada kelompok terpapar di strata ke i
Y0i = jumlah sampel pada kelompok kontrol di strata ke i
Y1 = jumlah sampel pada strata ke i

Sebagai contoh misalnya variabel tergantung CHD (1=ya dan 2=tidak),


Variabel bebas Obase (1=obase dan 0=tidak), dan
Variabel perancu adalah Sex (1=laki dan 0=perempuan), maka dalam analisis
mantel_Haenzel, sampel akan dikelompokkan menjadi 2 strata, yaitu kelompok
laki dan kelompok perempuan sebagai berikut:

Variabel Variabel CHD Non-CHD Total


Perancu bebas
Laki-laki Obase A1 B1 A1+B1
Non-Obase C1 D1 C1+D1
Total A1+C1 B1+D1 N1

Perempuan Obase A2 B2 A2+B2


Non-Obase C2 D2 C2+D2
Total A2+C2 B2+D2 N2

A1x(C1+D1)/N1 + A2x(C2+D2)/N2
PRMH = ------------------------------------------------
C1x(A1+B1)/N1 + C2x(A2+B2)/N2

  17
3.3 Analisis Mantel-Haenszel dengan STATA
Prosedur analisis hubungan antara obase dengan CHD dengan mengendalikan efek
perancu Sex dengan Matel-Haenzel menggunakan STATA, adalah:
1. Pada penelitian dengan desain kohort, pilih menu Statistic kemudian
“Epidemiologi and related” kemudian pilih “Tables for epidemiologist” setelah
itu klik “Cohort study risk-ratio” maka akan muncul box dialog yang sama
seperti pada analisis bivariate, masukkan variabel outcome (CHD) pada Case
variable dan eksposure (obase) ke Exposed variable. Kemudian klik menu
Options maka akan tampil:

Kemudian centang “Stratify on variables” dan masukkan variabel sex selanjutnya


pilih metode analisis stratifikasi yang digunakan yaitu Mantel-Haenszel,
selanjutnya klik OK maka akan muncul hasil sebagai berikut:

  18
Hasil yang sama akan didapat bila mengetik perintah: cs CHD obase, by (sex)
Interpretasi:

a. Crude RR (CRR) = 2,348 dengan CI 95%: 1,427 – 3,864, berarti risiko


terjadinya CHD pada kelompok obase 2,3 kali dibandingkankelompok yang
tidak obase (sebelum memperhitungkan pengaruh sex).
b. Adjusted (M-H combined) RR (ARR) = 2,37 dengan CI 95%: 1,441 – 3,926,
berarti risiko terjadinya CHD pada kelompok obase 2,4 kali
dibandingkankelompok yang tidak obase (setelah memperhitungkan pengaruh
sex).
c. Penilaian apakah sex merupakan perancu, dinilai berdasarkan berubahan CRR
dengan ARR bila > 10% maka dinyatakan sebagai confounder. Contoh pada
kasus diatas perubahan (CRR-ARR) = │((CRR – ARR)/CRR) x 100%│ =
1,3% maka sex bukan sebagai perancu pada hubungan antara obase dengan
CHD.
d. Selain menilai perancu, analisis stratifikasi juga berguna untuk menilai
adanya interaksi (efek modifikasi), interaksi adalah bila dua variabel bebas
pada variasi tertentu ada secara bersama sama maka akan menimbulkan
pengaruh yang jauh lebih besar terhadap terjadinya outcome dibandingkan
bila variabel bebas itu hanya berdiri sendiri. Adanya interaksi dapat dinilai
dari nilai p (Pr>chi2) hasil Test of homogenity, bila ≤ 0,05 maka ada
perbedaan yang bermakna nilai RR antar strata yang artinya ada efek
modifikasi (interaksi). Sebaliknya bila > 0,05 maka tidak ada perbedaan nilai
RR antar strata atau dinyatakan tidak ada interaksi.
Pada hasil analisis diatas didapatkan nilai p dari test homogenity sebesar
0,0053 (< 0,0,05) maka dinyatakan ada interaksi dimana pada perempuan
resiko terjadinya CHD pada kelompok obase 5,7 kali dibandingkan yang
tidak obase sedangkan pada laki-laki resiko terjadinya CHD pada kelompok
obase 1,2 kali dibandingkan yang tidak obase.
2. Pada penelitian dengan desain case control, prosedurnya hampir sama hanya
berbeda pada saat mengklik “Case-control study odds-ratio” atau menggunakan
perintah:
cc CHD obase, by (sex), maka akan muncul hasil sebagai berikut:

  19
Interpretasi:

a. Crude OR (COR) = 3,296 dengan CI 95%: 1,633 – 6,834, odds terjadinya


CHD pada kelompok obase 3,3 kali dibandingkan kelompok yang tidak obase
(sebelum memperhitungkan pengaruh sex).
b. Adjusted (M-H combined) RR (AOR) = 3,378 dengan CI 95%: 1,723 –
6,621, odds terjadinya CHD pada kelompok obase 3,4 kali dibandingkan
kelompok yang tidak obase (setelah memperhitungkan pengaruh sex).
c. Penilaian apakah sex merupakan perancu, dinilai berdasarkan berubahan CRR
dengan ARR bila > 10% maka dinyatakan sebagai confounder. Contoh pada
kasus diatas perubahan (COR-AOR) = │((COR – AOR)/COR) x 100%│ =
2%, maka sex bukan sebagai perancu pada hubungan antara obase dengan
CHD.
d. Adanya interaksi dapat dinilai dari nilai p (Pr>chi2) hasil Test of homogenity,
bila ≤ 0,05 maka ada perbedaan yang bermakna nilai RR masing-masing
strata yang artinya ada efek modifikasi (interaksi). Sebaliknya bila > 0,05
maka tidak ada perbedaan nilai RR pada masing-masing strata atau
dinyatakan tidak ada interaksi. Pada hasil analisis diatas didapatkan nilai p
dari test homogenity sebesar 0,0002 (< 0,05) maka dinyatakan ada interaksi
dimana pada perempuan resiko terjadinya CHD pada kelompok obase
dibandingkan yang tidak obase jauh lebih besar dibandingkan pada laki-laki.

  20
Bagian 4. Analisis Multivariabel

4.1 Pendahuluan
Pada umumnya masalah di bidang kesehatan/kedokteran sifatnya komplek dan
jarang terjadinya satu kejadian yang disebabkan oleh satu faktor tunggal. Sebagai
contoh, misalnya penyakit jantung koroner (PJK) disebabkan oleh banyak faktor
seperti faktor fisik, perilaku, lingkungan, dan akses terhadap pelayaan. Untuk
mempelajari hubungan satu masalah dengan berbagai faktor yang terkait tidak bisa
lagi dianalisis secara bivariate saja. Metode analisis mulivariate atau multivariabel
merupakan metode analisis yang memungkinkan kita mempelajari hubungan
beberapa variabel bebas dengan satu variabel tergantung. Misalnya pada penelitian
faktor risiko PJK, faktor determinan kematian bayi, dan lainnya. Metode analisis
multivariate dibedakan menurut jenis variabel outcomenya seperti pada matrik di
bawah ini.
Tabel Matrik jenis analisis Multivariate menurut jenis variabel tergatung

Variabel Outcome Contoh Jenis Analisis Bivariate Jenis Analisis Multivariate

Interval Kadar gula darah, Uji t, Anova, Korelasi, ANOVA, ANCOVA,


kolesterol darah, serum regresi linear Multiple Regression
feritin, dll

Ordinal Stadium penyakit, Chi-square for trend, Proportional Odd


severitas penyakit, Mann-Whitney, Regression
status gizi Spearman Rank

Binary Kesembuhan, kematian, Chi-square, Fisher Binary Logistic Regression,


kesakitan Exact, Mann-Whitney Poisson Regression

Nominal Penyebab kematian, Chi-square Multinomial Logistic


lokasi kanker Regression

Time to outcome Waktu sampai mati, Log-rank Cox-Regression


waktu sampai kambuh

Count Jml bakteri perlap. Poisson regression Poisson Regression


pandang, jml kasus
bunuh diri per bulan

Incedence Rate Insiden penyakit baru, Z-test Poisson Regression


insiden kecelakaan
Cox Regression

  21
4.2 Analisis Multivariate Binary Outcome
Kasus
Penelitian faktor risiko coronary heart desease (CHD) dilakukan di Rumah Sakit X.
Populasi dari penelitian ini adalah orang dewasa umur 20 tahun ke atas yang berobat
di klinik penyakit dalam RS X. Sebanyak 200 sampel diambil secara acak dari 7525
pasien baru yang berobat di klinik penyakit dalam RS X dalam 1 tahun terakhir. Data
yang dikumpulkan meliputi umur, jenis kelamin, diagnose penyakit, kadar kolesterol,
berat badan dan tinggi badan yang tercatat di dalam catatan medis pasien
bersangkutan.
Pertanyaan riset:
Apakah obesitas (IMT > 25), Gender, umur, hiperkolesterolemia meningkatkan risiko
CHD?
Variabel penelitian:
Variabel tergantung : CHD (1=CHD dan 0 = non CHD)
Variabel bebas : Obase (1=obase dan 0 = non obase)
Sex ( 1=laki dan 0 = perempuan)
Umur (1= - 34, 2 = 35 – 54, 3 = 55 -)
Hipercholesterolemia (1=hypercholesterol dan 0=normal)
Metode analisis multivariate untuk binary outcome ditentukan oleh parameter
yang dipakai menilai hubungan atau pengaruh dari variabel bebas terhadap variabel
tergatungnya. Pada penelitian dengan binary outcome, umumnya parameter yang
dipakai menilai pengaruh atau hubungan adalah Odd Ratio atau Inciden Rate Ratio.
Pada rancangan yang memungkinkan mendapatkan inciden rate seperti pada
penelitian kohort atau eksperimental, maka inciden rate ratio dipakai sebagai
parameter yang dipakai mempelajari hubungan beberapa faktor penyebab
(kategorikal) dengan satu variabel tergantung (binary). Sebaliknya, bila tidak
dimungkinkan mendapatkan angka inciden seperti pada penelitian case-control atau
cross-sectional, maka OR dipakai sebagai parameter yang dipakai untuk mempelajari
hubungan beberapa faktor penyebab (kategorikal) dengan satu variabel tergantung
(binary). Pemilihan metode analisis multivariate untuk binary outcome ditentukan
oleh parameter yang akan dipakai menilai pengaruh variabel bebas terhadap variabel
tergantung binary. Metode Binary Logistic Regression dipakai bila parameter yang
dipakai adalah Odd Ratio (OR) dan Poisson Regression dipakai bila parameter yang
dipakai adalah Insidence Rate Ratio (IRR).

  22
4.3 Regresi Logistik
Regresi logistik adalah salah satu metode analisis multivariate untuk
menganalisis hubungan satu variabel binary outcome dengan satu atau lebih variabel
bebas dengan skala pengukuran nominal, ordinal atau interval dimana parameter yang
dipakai menilai hubungan tersebut adalah Odd Ratio (OR). Metode ini banyak dipakai
menganalisis faktor risiko suatu penyakit, misalnya faktor risiko penyakit jantung
koroner, faktor risiko penyakit diabetes militus type 2, dll. Metode ini banyak dipakai
pada penelitian faktor risiko dengan rancangan case-control dimana pada rancangan
ini angka insiden tidak memungkinkan untuk didapatkan. Metode ini juga dipakai
untuk menganalisis faktor risiko pada penelitian dengan rancangan cross-sectional
dimana pada rancangan ini juga tidak dimungkinkan untuk mendapatkan angka
insiden.
Pada regresi logistik, binary outcome variabel ditranformasi dengan
menggunakan logit, sehingga hubungan antara variabel outcome (Y) dengan variabel
tergantung (Xi) dapat dinyatakan dalam model persamaan regresi sbb:
Logit (Py=1) = a + biXi
Diketahui bahwa:

Logit (Py=1) = log(P/(1-P)) dan


P/(1-P) = Odd
Maka persamaan model regresi logistik di atas dapat ditulis menjadi:
Log Odd = a + biXi
atau dapat juga ditulis sbb:
Odd = exp (a + biXi)

1. Seleksi Variabel Prediktor


Metode seleksi variabel prediktor pada regresi logistik terdiri dati metode
Enter, Forward, dan Backward.
Metode Enter
Bila metode seleksi yang dipakai adalah metode Enter, maka akan terdapat
satu model saja yang berisikan semua variabel prediktor. Bila variabel prediktornya
adalah X1, X2, dan X3, maka model regresi logistik dari variabel tersebut adalah:

Odd(x1) = exp (a + b1X1 + b2X2 + b3X3)

  23
Pada metode enter hanya dterdapat satu nilai koefsiien determinanasi (R2)
yang menyatakan besar pengaruh semua variabel prediktor yang ada di dalam model
terhadap variabel outcome. Misalnya dari analisis didapatkan nilai R2 = 0,30, berarti
semua variabel prediktor mempunyai pengaruh sebesar 30% terhadap nilai variabel
outcome. Apabila terdapat lebih dari satu variabel prediktor, maka kita tidak bisa
menentukan berapa pengaruh dari masing-masing variebel prediktor terhadap variabel
outcomenya.
Metode Forward
Pada metode Forward, variabel prediktor akan dipilih satu persatu secara
berjenjang (stepwise) mulai dari variabel prediktor yang nilai p dari hubungannya
terhadap outcome variabel paling kuat dan selanjutnya disusul oleh variabel yang nilai
pnya di bawah variabel yang terpilih sebelumnya, sampai semua variabel yang
memenuhi ktiteria terpilih masuk ke model. Kriteria terpilih disebut nilai p enter yang
umumnya besarnya 0,1 yang artinya variabel yang bisa dipilih adalah variabel
prediktor yang mempunyai hubungan dengan variabel outcome dengan nilai p ≤ 0,1
saja yang akan dianalisis, sedangkan variabel prediktor yang lain tidak. Banyak
peneliti menggunakan nilai P(enter) sebesar 0,2. Bila menggunakan nilai p enter 0,2,
maka hanya variabel prediktor yang mempunyai hubungan dengan variabel outcome
dengan nilai p ≤ 0,2 saja yang akan dianalisis, sedangkan variabel prediktor yang lain
tidak.
Misalnya dari analisis bivarite hubungan ketiga variabe tersebut dengan
variabel outcome memiliki nilai p untuk X1 adalah 0,01, X2 adalah 0,001 dan X3
adalah 0,25 dan nilai p(enter) = 0,2, maka proses seleksinya adalah sbb:
Step 1: Odd = exp (a + b2X2)
Step 2: Odd = exp (a + b2X2 + b1X1)
Model terakhir menjadi: Odd = exp (a + b2X2 + b1X1), dimana X3 tidak dipilih
karena nilai p > 0,2.
Pada metode seleksi Forward, nilai R2 dari setiap step dihitung, sehingga dari nilai R2
tersebut dapat dihitung R2 dari masing-masing variabel.
Metode Backward
Metode Backward adalah kebalikan dari metode forward, dimana pada tahap
pertama, semua variabel prediktor dimasukkan ke model, kemudian akan dipilih satu
persatu secara bertingkat untuk dikeluarkan dari model bila variabel tersebut

  24
mempunyai hubungan dengan nilai p yang lebih besar dari kriteria dikeluarkan.
Variabel prediktor yang pertama dipilih untuk dikeluarkan dari model adalah variabel
prediktor yang memiliki nilai p pada analisis bivariate paling besar dan disusul oleh
variabel dengan nilai p yang lebih kecil sampai semua variabel yang mempunyai nilai
p lebih besar dari kriteria removed dikeluarkan dari model. Kriteria dikeluarkan
biasanya ditentukan besarnya 0,1 atau 0,2.
Misalnya dari analisis bivariate dengan variabel outcome, ketiga variabe
tersebut memiliki nilai p untuk X1 adalah 0,01, X2 adalah 0,001 dan X3 adalah 0,25
dan nilai p(enter) = 0,2, maka proses seleksinya adalah sbb:
Step 1: Odd = exp(a + b1X1 + b2X2 + b3X3)
Step 2: Odd = exp(a + b1X1 + b2X2)
Model terakhir menjadi: Odd = exp (a + b1X1 + b2X2), dimana X3 keluar dari model
karena nilai p > 0,2.
Metode seleksi backward tidak dapat memberikan nilai R2 dari masing-masing
variabel yang ada di dalam model.

2. Odd Ratio (OR)


Penghitungan OR dari salah satu variabel prediktor dilakukan dengan
menggunakan model regresi logistik seperti yang dijelaskan di atas, yaitu:
Odd = exp a + biXi
Misalnya ada tiga variabel prediktor, yaitu X1, X2, dan X3 dan yang akan dihitung
ORnya adalah variabel X1 dimana kelompok terpapar nilai X1=1 dan kontrol X1 = 0.
Dalam perhitungan OR dari variabel X1, variabel bebas lainnya seperti X2 dan X3
diberikan nilai 0 (tidak ada efek), maka OR dihitung sbb:
Odd(X=1) Exp(a + bX1 + b2X2 + b3X3) Exp(a + b1)
OR = ------------- = ----------------------------------------- = ----------------- = Exp b1
Odd(X=0) Exp(a + bX1 + b2X2 + b3X3) Exp(a)
Jadi penentuan besarnya nilai OR dari variabel prediktor Xi adalah sama dengan
Exponentian dari bi. Nilai OR tersebut disebut adjusted OR.
Nilai OR dari satu variabel prediktor yang dihitung dengan model regresi
logistik adalah nilai OR dimana efek variabel lainnya dikendalikan. Oleh karena itu,
nilai OR tersebut merupakan Adjusted OR. Berbeda dengan nilai OR yang dihitung
dengan metode bivariate, dimana efek dari variabel lainnya tidak dikendalaikan. Oleh
karena itu, nilai OR yang dihitung secara bivariate disebut unadjusted OR.

  25
Cara penghitungan Confidence Interval OR
Confidence Interval OR dihitung dengan rumus sbb:
Batas bawah = OR x exp(-1,96 x SE)
Batas atas = OR x exp(1,96 x SE)

3. Uji Hipotesis OR
OR adalah rasio antara Odd kelompok terpapar dengan kelompok tidak
terpapar. Suatu vaiabel dinyatakan meningkatkan risiko bila nilai OR > 1, menurangi
risiko bila nilai OR < 1, dan tidak ada hubungan bila nilai OR = 1. Oleh karena itu
hipotesis statistik dari OR adalah:
Ho: OR =1 (tidak terdapat perbedaan risk)
Ha: OR # 1 (terdapat perbedaan risk)
Uji Statistik
Untuk menguji apakah Ho diterima atau ditolak, maka Ho tersebut harus diuji
kebenarannya dengan menggunakan data emperis yang dikumpulkan dari sampel.
Parameter yang diuji adalah koefisien regresi “b” dengan uji Wald.
Kesimpulan:
a. Menggunakan nilai p
Nilai signifikansi dari uji Wald akan dipakai dasar pengambilan keputusan dalam
uji hipotesis tentang OR. Ho diterima atau tidak terdapat perbedaan risk antara
kelompok terpapar dengan kelompok tidak terpapar bila nilai p dari statistik Wald > α
(tingkat kemaknaan). Sebaiknya Ho ditolak atau terdapat perbedaan risk antara
kelompok terpapar dengan kelompok tidak terpapar apabila nilai p ≤ α. Apabila Ho
ditolak, perlu dilihat apakah nilai OR > 1 atau nilai OR < 1. Bila nilai OR > 1 dan
nilai p ≤ α, berarti faktor tersebut meningkatkan risiko. Sebaliknya, bila nilai OR < 1
dan nilai p ≤ α, berarti faktor tersebut menurunkan risiko atau faktor tersebut
memberikan efek pencegahan.
b. Menggunakan nilai CI
Kesimpulan hasil uji hipotesis juga dapat dibuat dengan menggunakan CI dari
OR. Ho diterima bila angka “1” berada di dalam rentangan nilai CI, mialnya CI 95%
OR adalah 0,15 - 10,5. Sebaliknya, Ho ditolak bila angka “1” berada di luar rentang
nilai CI, misalnya CI 95% OR adalah 2,5 – 7,5.

  26
4.4 Prosedur Regresi Logistik Menggunakan Stata
Analisis menggunakan Menu
Prosedur Logistic Regression sbb:
1. Aktifkan Stata
Double click Ikon Stata sbb:

Maka akan tampak sbb:

2. Open file CHD.dta


Click menu: File dan Open, seperti gambar di bawah ini.

Cari file: “CHD DATA.dta di folder “d:\Pelatihan Analisis\Multivariate\”


Click “CHD DATA.dta maka akan tampak seperti gambar berikut:

  27
Click “Open”, maka file data dibuka sehingga di layar akan tampak variabel
yang terdapat pada file seperti gambar berikut.

3. Procedure Logistic regression


Click menu: Statistics > Binary outcomes > Logistic regression (reporting
odds ratio), seperti gambar berikut.

  28
Maka akan tampak sbb:

4. Memilih variabel dependent


Click “ dari kotak Dependent variable:” dan selanjutnya pilih CHD, maka
variabel CHD akan berada di kotak “Dependent variabel” seperti contoh di
atas ini.

5. Memilih variabel Independent


Click “ dari kotak Independent variables:” dan selanjutnya pilih CHD,
maka variabel CHD akan berada di kotak “Dependent variabel” seperti
contoh di bawah ini.

  29
Click “OK” untuk menjalankan prosedur, maka akan tampak output sbb:

. logistic CHD obase klp_umur sex

Logistic regression Number of obs = 200


LR chi2(3) = 22.49
Prob > chi2 = 0.0001
Log likelihood = -111.7622 Pseudo R2 = 0.0914

CHD Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]

obase 3.288366 1.136157 3.45 0.001 1.67064 6.472577


klp_umur 1.746819 .4622327 2.11 0.035 1.039939 2.934186
sex 1.922431 .6364992 1.97 0.048 1.004676 3.678543
_cons .0506574 .033052 -4.57 0.000 .0141015 .1819783

6. Goodness of Fit
Click Menu: Statistics > Binary outcome > Postestimation > Goodness of Fit,
seperti gambar beruikut.

  30
Slanjutnya akan tampak sbb:

Click: Pearson or Hosmer-Lemeshow goodness of Fit


Click: Pearson goodness of fit
Click: Use all observations in the data
Click: OK, maka akan keluar hasil sbb:

  31
. estat gof, all

Logistic model for CHD, goodness-of-fit test

number of observations = 200


number of covariate patterns = 12
Pearson chi2(7) = 10.32
Prob > chi2 = 0.1714

Analisis menggunakan Command


Command: logistic
Syntax : logistic <outcome> <exposure> <confounding>

Untuk kasus di atas:


Outcome variabe: CHD
Variabel bebas : obase
Confounding : sex dan klp_umur

Cara:

Ketik: logistic CHD obase sex klp_umur, pada kotak Command, maka hasilnya
adalah sbb:

. use "D:\ANALISIS BINARY OUTCOME\CHD DATA.dta", clear

. logistic CHD obase sex klp_umur

Logistic regression Number of obs = 200


LR chi2(3) = 22.49
Prob > chi2 = 0.0001
Log likelihood = -111.7622 Pseudo R2 = 0.0914

CHD Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]

obase 3.288366 1.136157 3.45 0.001 1.67064 6.472577


sex 1.922431 .6364992 1.97 0.048 1.004676 3.678543
klp_umur 1.746819 .4622327 2.11 0.035 1.039939 2.934186

  32
Hasil:
OR(adjusted odd ratio) obase adalah 3,288 (CI 95%: 1,670 – 6,472)

Catatan:
1. Pada Logistic Regresi risk ratio ditetukan dengan OR
2. Nilai OR akan selalu lebih besar dari PR bila PR > 1 dan akan lebih kecil bila
PR < 1.
3. Nilai OR sulit diiterpretasi dibandingan PR untuk penelitian cross-sectional
4. Hasil SPSS dan Stata tidak berbeda.

LATIHAN 3
1. Analisis data CHD menggunakan Metode Regresi Logistik dengan metode
enter
2. Analisis data CHD menggunakan Metode Regresi Logistik dengan metode
backward
3. Analisis data CHD menggunakan Metode Regresi Logistik dengan metode
forward
4. Jelaskan perbedakan hasil dari ketiga metode tersebut

  33
4.5 Regresi Poisson
Regresi Poisson dipakai menganalisis rate ratio yaitu untuk mempekirakan
rate ratio antara kelompok terpapar dengan kelompok tidak terpapar. Kegunaan
regresi Poisson sama dengan regresi Cox yaitu dipakai untuk menganalis hubungan
atau efek beberapa variabel bebas kontinyus (interval) atau kategorikal terhadap rate
suatu kejadian. Akan tetapi berbeda halnya dengan Regresi Logistik yang dipakai
untuk memperkirakan Odd Ratio antara kelompok terpapar dengan kelompok kontrol.
Metode regresi poisson banyak dipakai menganalisis data penelitian longitudinal,
dimana pada penelitian tersebut dimungkinkan peneliti mengukur waktu terjadinya
kejadian yang diteliti, sehingga rate dapat dihitung.
Pola umum dari model Regresi Poisson adalah mirip dengan model regresi
logistik dan model regresi linear berganda. Pada model regresi linear
memformulasikan hubungan antara satu variabel tergatung kontinyu Y dengan
beberapa variabel bebas/prediktor Xi yang berskala interval. Model regresi Poisson
memformulasikan hubungan antara beberapa variabel bebas kategorikal atau
konyinyu dengan Log (rate) terjadinya kejadian Y (binary). Sehingga model umum
dari regresi Poisson adalah:

Log (rate) = β0 + β1X1 + β2X2 + β3X3 + .....+ βkXk

Model tersebut juga dapat ditulis sbb:

Rate = exp(β0 + β1X1 + β2X2 + β3X3 + .....+ βkXk)

Keterangan:
β0 = log (rate) kelompok kontrol (unexposed) atau baseline group
βi = log (rate ratio) adalah rate rasio antara kelompok exposed dengan
nonexposed dari varaiabel prediktor ke i.
Xi = variabel prediktor ke i.

  34
Pengitungan Rate Ratio
Seperti telah diraikan di atas, bahwa regresi Poisson dapat dipakai menghitung
perbedaan rate antau rate ratio antara kelompok terpapar dengan kelompok kontrol.
Seperti pada regersi Cox, rate ratio pada regersi Poisson dihitung dari antilog
koefisien regresi b, dengan formula sbb:
Rate kelompok terpapar (X1=1) = exp(b0 + b1X1) = Exp(b0 + b1), dan
Rate kelompok kontrol (X1=0) = exp(b0 + b1X1) = Exp(b0), maka:

exp(b0 + b1)
Rate Ratio = ----------------------- = exp(b1)
exp(b0)

Jadi Rate Ratio variabel prediktor Xi = exp(bi)


Penghitungan Rate Ratio variabel kontinyu
Penghitungan rate ratio variabel kontinyu seperti misalnya umur dalam tahun
dilakukan dengan asumsi risk setiap penambahan satu unit umur konstan. Misalnya
rate ratio umur sebesar 1,117, berarti setiap umur bertambah 1 tahun, risk akan
bertambah 1,117 kali dibandingkan dengan baseline rate.
Pengitungan Rate Ratio variabel kategori yang memiliki kategori lebih dari dua
Bagaiamana menentukan rate ratio variabel merokok terhadap kejadian CHD
dimana variabel prediktor merokok mempuntai 3 kategori, yaitu: 1 = merokok berat, 2
= merokok ringan, dan 3 = tidak merokok (baseline). Penghitungan rate ratio dari
setiap kategori paparan dilakukan dengan membuat rate ratio setiap kategori dengan
baseline. Yang dijadikan baseline adalah rate kelompok kontrol, maka untuk
menentukan rate ratio merokok berat dilakukan dengan membandingkan rate merokok
berat dengan rate tanpa merokok. Penghitungan rate ratio merokok sedang dilakukan
dengan membandingkan rate merokok sedang dengan rate tanpa merokok. Pada
semua paket statistik terdapat prosedur untuk penentuan rate-ratio variabel karegori
yang memiliki lebih dari 2 kategori dan akan diminta kategori yang akan dijadikan
refrence atau baseline.

  35
4.6 Prosedur Regresi Poisson Menggunakan Stata
Prosedure Regresi Poisson dengan menu
Prosedur Poisson regression dengan menu, adalah sebagai berikut:
1. Aktifkan prosedur poisson rgerssion dengan cara:
Click MENU: Statistics > Count outcomes > Poisson regression

2. Menentukan variabel independent


Clik tanda pada bagian belakang kotak “Dependent variabel”, lalu click
CHD, maka variabel CHD akan berada pada kotak “Dependent variable”
sepeti gambar di bawah ini.

  36
3. Memilih variabel independent
Clik tanda pada bagian belakang kotak “Independent variabel”, lalu click
obase, sex, klp_umur, maka ketiga variabel tersebut akan berada pada kotak
“Independent variable” sepeti gambar di bawah ini.

4. Menentukan Exposure variable


Clik tanda pada bagian belakang kotak “Exposure variabel”, lalu click
time, maka variabel time akan berada pada kotak “Exposure variable” sepeti
gambar di bawah ini.

  37
5. Report incidence rate ratio (irr)
Click Menu: Report > Report incidene rate ratio, seperti gambar di bawah ini.

6. Jalankan prosedur
Clik “OK”, maka akan tampak output sbb:

. poisson CHD cholesterolemia obase sex klp_umur, exposure(time) irr

Iteration 0: log likelihood = -119.25843


Iteration 1: log likelihood = -119.25777
Iteration 2: log likelihood = -119.25777

Poisson regression Number of obs = 200


LR chi2(4) = 28.35
Prob > chi2 = 0.0000
Log likelihood = -119.25777 Pseudo R2 = 0.1062

CHD IRR Std. Err. z P>|z| [95% Conf. Interval]

cholesterolemia 2.845994 .8945852 3.33 0.001 1.537003 5.26979


obase 2.000232 .5863675 2.36 0.018 1.126032 3.55312
sex 1.466572 .3761517 1.49 0.135 .8871233 2.424502
klp_umur 1.444524 .2983358 1.78 0.075 .963667 2.165321
_cons .0371981 .0213232 -5.74 0.000 .0120944 .1144085
ln(time) 1 (exposure)

7. Goodness of fit test


Caranya adalah:
Click menu: Statistics > count outcome > Goodnes-of- fit test after Poisson

  38
Pilih Pearson goodness-of-fit test (Gof) seperti di bawah ini.

Click “OK” maka akan tampak output sbb:


. estat gof

Deviance goodness-of-fit = 116.5155


Prob > chi2(195) = 1.0000

Pearson goodness-of-fit = 118.2397


Prob > chi2(195) = 1.0000

  39
Prosedure Poisson regression dengan Command
Prosedur regresi poisson pada program Stata dapat dijalankan dengan mengetik
command untuk regresi poisson dan dapat dijalankan dengan menggunakan menu.

Menjalankan prosedur regresi poisson dengan command

poisson depvar [indepvars] [if] [in] [weight] [, options]

command “poisson” diketik paling depan, diikuti dengan mengetik nama


variabel tergantung, dikuiti dengan semua nama variabel bebas kemudian ketik
tanda koma “,” dan ketik option.

option
exposure (time) à time variabel waktu pengamatan
level (99) à tingkat kepercayaan 99% atau 95%
irr à Incidence Rate Ratio

Contoh Kasus:
Variabel tergantung : chd
Exposure : time
Prediktor : obase (1=obse, 0=non obase)
hiperkolesterolemi (1=hyperkolesterol, 0=normal)
sex (1=laki. 0=perempuan)
age (interval)

Command Stata :

Poisson chd obase hiperkolesterolemi sex age, exposure (time) level (95) irr
Hasil analisisnya adalah sbb:

  40
Poisson regression Number of obs = 200
LR chi2(4) = 27.61
Prob > chi2 = 0.0000
Log likelihood = -119.62794 Pseudo R2 = 0.1035

chd IRR Std. Err. z P>|z| [95% Conf. Interval]

obase 1.991227 .5849533 2.34 0.019 1.119611 3.541393


cholesterolemia 2.871875 .9037786 3.35 0.001 1.549861 5.321555
sex 1.467313 .376329 1.50 0.135 .8875865 2.425686
age 1.020545 .0133648 1.55 0.120 .994684 1.047079
_cons .0311334 .022501 -4.80 0.000 .0075516 .1283556
ln(time) 1 (exposure)

Interpretasi hasil

LR chi-square = 27.61 dengan nilai p < 0,001


Hasil ini menunjukan bahwa terdapat pengaruh variabel prediktor terhadap
kejadian CHD

Pseudo R2 = 0,1035
R2 dari ke lima prediktor terhadap CHD sebesar 10,35%, berarti variasi rate
CHD hanya 10,35% ditentukan oleh kelima prediktor tersebut. Berarti 89%
rate CHD ditentukan oleh faktor lain selain ke lima prediktor yang dianalisis.

Incidene Rate Ratio


Incidence Rate Ratio setiap variabel prediktor menentukan hubungan antara
variabel prediktor dengan kejadian CHD. Dari hasil analisis terdapat dua dari
lima prediktor yang mempunyai pengaruh bermakna, yaitu obesitas dan
hiperkolesterolemia. IRR obase adalah 1,99 (CI 95%: 1,12 – 3,54) dengan
nilai p = 0,019. IRR pada orang obase 1,99 kali lebih tinggi dari nonobase.
IRR hiperkolesterolemi sebesar 2,87 (CI 95%: 1,55 – 5,32) dengan nilai p =
0,001. Berarti orang hiperkolesterol memilki risiko CHD 2,87 kali lebih tinggi
dari yang tidak hiperkolesterol. Sedangkan gender dan umur tidak
berpengaruh.

  41
Goodness of Fit Test
Goodness of Fit test dipakai menguji apakah data fit dengan model regresi
poisson. Goodness of Fit Test menguji perbedaan hasil observasi dengan nilai
perkiraan menurut model. Apabila nilai hasil observasi sama dengan nilai hasil
perkiraan model maka data dinyatakan fit dengan model. Sebaliknya, bila data
observasi berbeda secara bermakna dengan hasil estimasi model, maka data
dinyatakan tidak fit dengan model.

Commad Stata untuk Goodness of Fit Test:

Syntak
poisgof

Catatan:
Command “poisgof” dapat dieksekusi bila command regresi poisson
(“poisson”) sudah dijalankan.

Contoh:

. poisgof

Deviance goodness-of-fit = 117.2559


Prob > chi2(195) = 1.0000

Pearson goodness-of-fit = 117.7075


Prob > chi2(195) = 1.0000

Interpretasi Hasil

Goodness of Fit Chi-square = 117,707 dengan nilai p = 1,0. Hasil ini menjunjukan
bahwa data fit dengan model regresi poisson karena p > 0,05.

  42
Daftar Pustaka
1. Daniel WW, 1999. Biostatistics: A Foundation for Analysis in Th Health
Sciences (Seventh ed). New York: John Wiley & Sons.
2. Kirkwood B R. & Stern JAC, 2003. Medical Statistics (Second ed). Oxford:
Blackwell Science.
3. Greenberg RS, Daniel SR, Flander WD, 2001. Medical Epidemiology (Third
ed). Yew York: McGraw-Hill.
4. Triton PB, 2006. STATA 13.0 Terapan: Riset Statistik Parametrik.
Yogyakarta: Penerbit Andi.
5. Sudigdo Sastroasmoro & Sofyan Ismael 2011, Dasar-dasar Metodologi
Penelitian Klinis, Edisi ke-4, Jakarta: Sagung Seto

  43

Anda mungkin juga menyukai