Anda di halaman 1dari 26

Analisis dengan luaran

data biner
Prof Dr dr I Gde Raka Widiana SpPD, KGH,
FINASIM
LitBang FK UNUD
/RSUP Sanglah Denpasar

Dasar-Dasar dan Aplikasi Biostatistika Klinik

Biostatistik bertujuan
1) meng-estimasi kuatnya hubungan atau
besarnya perbedaan (besarnya efek);
2) melakukan uji kemaknaan statistik
(inferensi), menarik kesimpulan mengenai
populasi dari mana sampel itu diambil,
dengan memperhitungkan pengaruh peluang
akibat variasi sampel (probabilitas), dan
3) mengontrol pengaruh variabel penggangu
terhadap besar efek (estimasi) dan inferensi.

Prinsip dasar
1) sampel adalah individu yang diobservasi
dan dilakukan pengukuran mengenai
karakteristiknya (variabel);
2) populasi adalah kelompok individu yang
lebih besar, dari mana sampel itu diambil, dan
dimana fenomena yang terjadi ingin diketahui;
3) distribusi frekuensi (dalam bentuk grafik),
menggambarkan distribusi sampel yang
dipakai penduga distribusi populasidari mana
sampel itu diambil.

Distribusi frekuensi sampel dapat dipakai


memperkirakan tingkat representasi sampel
terhadap populasi.
Beberapa uji statistik secara kuantitatif dapat
memperkirakan kualitas representasi sampel.
Pada variabel kontinyu, kualitas data ini
ditentukan dengan mengukur parameter
gravitasi sentral (rerata atau median) dan
penyebaran atau dispersi data (simpang baku
atau kuartil), yakni seberapa jauh data
individual berada dari posisi gravitasi sentral.

Pertimbangan memilih uji statistik


yang spesifik
1) fungsi variabel yakni, apakah
independen dan dependen atau
variabel pengganggu potensial Hal
ini dapat dilihat pada struktur
hipotesis. Kebanyakan hipotesis
mengandung satu variabel dependen
dan satu atau beberapa variabel
independen,
2) dan tipe atau sekala variabel.

Alur pemilihan uji statistik


1)tentukan variabel dependen (umumnya satu
variabel dependen);
2) tentukan jumlah variabel independen:
a) bila tidak ada variabel independen, statistik
yang dipakai adalah analisis univariat
(deskriptif); b) bila ada satu variabel
independen, statistik yang dipakai adalah
analisis bivariat, dan
c) bila ada lebih dari satu variabel independen,
statistik yang dipakai adalah analisis
multivariat.

Untuk rancang penelitian tidak berpasangan (alur 3.a.2), pertama harus


ditentukan apakah variabel dependen tidak dipengaruhi waktu (alur
3.a.1.1), atau dipengaruhi waktu (alur 3.a.1.2) dimana bertambahnya
waktu observasi akan meningkatkan probabilitas munculnya outcome.
Kuatnya hubungan antara variabel independen dan dependen untuk alur
3.a.1.1 dinyatakan dengan beda proporsi atau rasio proporsi (rasio
prevalensi).
Demikian juga kuatnya hubungan antara variabel independen dan
dependen untuk alur 3.a.1.2 dinyatakan dengan beda proporsi atau rasio
proporsi (risiko relatif).
Uji statistik untuk beda proporsi dan rasio proporsi adalah sama, namun
penafsiran hasil kemaknaan statistik untuk beda proporsi = 0 yang
dinyatakan dengan hipotesis nol, namun rasio proporsi =1 yang
dinyatakan dengan hipotesis nol, artinya bila A sama dengan B, maka
selisih (beda) A-B =0 dan rasio A/B =1.
Uji statistik untuk beda atau rasio proporsi adalah Khai kuadrat, Mantel
Haenszel, atau normal approximation.

Tujuan analisis multivariat :


1) mengetahui hubungan antara variabel dependen dan variabel
independen dengan mengontrol atau melakukan adjustment efek
variabel lainnya (variabel kontrol). Dengan cara ini pengaruh variabel
kontrol atau variabel pengganggu potensial dapat dekendalikan;
2) melakukan uji kemaknaan statistik sekaligus pada beberapa
variabel dengan mempertahankan tingkat kemaknaan () sebagai
kesalahan tipe 1. Caranya adalah melakukan uji hipotesis nol
omnibus, yaitu melakukan analisis hubungan antara veriabel
dependen dan semua variabel independen sekaligus sebagai suatu
kesatuan variabel independen. Namun dengan cara ini tidak
diketahui hubungan antara variabel dependen dengan masingmasing variabel independen, dan
3) membandingkan kemampuan dua atau lebih variabel independen
secara tersendiri untuk mengestimasi nilai variabel independen.

Skenario
Kita ingin membandingkan prevalensi penyakit ginjal kronik
antara pasien dengan riwayat hipertensi dan tanpa riwayat
hipertensi. Pada kasus ini, riwayat hipertensi adalah variabel
independen dan penyakit ginjal kronik adalah variabel
dependen. Selanjutnya kita ingin mengontrol efek variabel
pengganggu potensial dari proteinuria.
Untuk tujuan tersebut, kita akan memasukkan variabel
independen nominal lainnya: proteinuria dan non-proteinuria.
Bila ada dua atau lebih variabel independen dalam set data,
semuanya nominal atau data yang dikonversi menjadi
nominal, maka pendekatan umum yang dapat dilakukan
untuk meng-adjust variabel independen pengganggu adalah
dengan cara melakukan analisis stratifikasi.

Caranya
membagi kelompok hipertensi-non hipertensi menjadi subkelompok proteinuria-non proteinuria dalam masing-masing
kelompok.
Dalam masing-masing sub-kelompok (proteinuria dan non
proteinuria), dihitung estimasi stratum (misalnya odds ratio
stratum), kemudian dikombinasi dengan uji statistik
tertentu, menjadi estimasi gabungan (misalnya combined
odds ratio).
Dengan cara ini dapat diketahui seberapa besar pengaruh
odds ratio stratum terhadap combined odds ratio. Hasil
akhir estimasi gabungan adalah hasil pengendalian
(adjustment atau strandarisasi) dari estimasi (effect size)
gabungan semua strata terhadap efek variabel
pengganggu yang telah dikontrol.

Dalam kaitan waktu, uji multivariat


ini dapat dibagi menjadi
apakah variabel dependen:
1) dipengaruhi oleh waktu (misalnya
kohort, ada follow-up) dan
2) tidak dipengaruhi oleh waktu
(misalnya uji kasus-kontrol, tidak ada
follow-up).

Bila variabel dependen dipengaruhi


oleh waktu
apakah besar kelompok yang dibandingkan dari satu waktu ke
waktu lainnya (insiden) selama periode pengamatan berbeda-beda.
pengaruh waktu terhadap outcome ini, dikenal istilah kasus per
person-year, risiko (proporsi subyek yang mengalami penyakit
selama periode follow-up spesifik , yakni probabilitas kumulatif
terjadinya penyakit).
risiko penyakit selama periode follow-up adalah metode life-table
analysis dengan periode follow-up tertentu misalnya interval 1
tahun. Setiap observasi interval 1 tahun, data dapat distratifikasi
berdasar katagori variabel pengganggu (misalnya kelompok umur).
Kesintasan kumulatif (cumulative survival) adalah 1 minus
cummulative probability luaran (kematian atau penyakit)
merupakan cara lain untuk memahami aspek klinik dari life-table
analysis ini, dihitung dengan menggabungkan adjusted probability
dari subyek yang masih hidup selama periode follow-up.

Bila variabel independen adalah


berskala kontinyu dan nominal
variabel dependen nominal,
dipengaruhi waktu. analisis
multivariat regresi Cox, dimana
gabungan variabel independen dan
interaksinya dipakai mengestimasi
angka insiden penyakit.

Model Regresi Logistik


koefisien regresi dapat dikonversi menjadi
odds ratio.
Persamaan regresi, koefisien regresi (b atau
beta, merupakan konversi logaritmik berbasis e
(bilangan natural) dari koefisien regresi linier.
Definisi odds adalah jumlah pasien yang
berpenyakit dibandingkan pasien tanpa
penyakit, sedangkan odds ratio adalah rasio dari
jumlah pasien yang berpenyakit dibandingkan
pasien tanpa penyakit antara kelompok dengan
faktor risiko dan kelopok tanpa faktor risiko.

Untuk mengubah koefisien regresi ini menjadi odds


ratio perlu meng-eksponensial-kan b yakni pangkat
dari bilangan e tersebut, dimana odds ratio (OR) =
eb
Untuk memahami prinsip ini harus diketahui dulu
makna OR ini terhadap perubahan outcome oleh
faktor risiko yang bersangkutan. Misalnya koefisien
regresi 0,4 untuk risiko strok oleh hipertensi, berarti
OR (pasien hipertensi dibandingkan tanpa
hipertensi)= e0,4 =1,5
odds strok adalah 1,5 kali lebih tinggi pada
pasien hipertensi dibandingkan tanpa hipertensi.

Untuk variabel prediktor katagorikal


Contoh: status sosial ekonomi (SSE) dengan
skor skala 1 (kaya) sampai dengan 5 (miskin),
dalam hal ini koefisien regresi menunjukkan
hubungan dari peningkatan satu unit faktor
prediktor (skor SSE) terhadap luaran (strok).
Misalnya koefisien regresi SSE terhadap strok
= 0,2, hal ini menunjukkan OR per unit
peningkatan skor SSE = =1,25, artinya setiap
unit peningkatan skor SSE berkaitan dengan
meningkatnya 25% odds strok, atau (1,25-1=+
0,25, atau +25%).

Untuk variabel kontinyu


misalnya hubungan antar tekanan darah diastolik (TDD) dan strok dengan
koefisien regresi 0,01, menunjukkan bahwa odds ratio per 1 mm Hg
penigkatan TDD = e0,01 = 1,01.
Dengan demikian setiap 1 mm Hg peningkatan TDD berkaitan dengan
meningkatnya 1% odds strok.
Secara klinis peningkatan 1 mm Hg tekanan TDD kurang memiliki arti
penting, namun, bila dikonversi menjadi 20 mm Hg efek TDD ini menjadi
lebih nyata.
Dengan demikian OR per 20 mm Hg peningkatan TDD = e 20X0,01= e0,2=1,22.
Maka, setiap peningkatan 20 mm Hg TDD berkaitan dengan 22%
meningkatnya odds strok. Nilai negatif dari OR menunjukkan menurunnya
risiko atau faktor protektif.
Misalnya koefisien regresi pengguna aspirin terhadap risiko strok =-0,4 ,
dengan demikian OR pengguna aspirin = e-0,4=0,7. Artinya penggunaan
aspirin berkaitan dengan menurunnya odds strok sebesar 30% atau (0,71=-0,3 atau -30%).

Effect size
Pada studi kohort, risiko luaran pada kelompok yang memiliki
faktor risiko positif jumlah dengan luaran posif/ jumlah seluruh
sampel, adalah r1/n1. Demikian, juga risiko luaran pada kelompok
yang memiliki faktor risiko negatif adalah r2/n2. Dengan demikian,
risiko relatif = Beda risiko atau absolute risk reduction (ARR)=
r1/n1 - r2/n2; NNT (number needed to treat) = 1/ARR = 1/ r1/n1 - r2/n2.
Nilai ini sama dengan rasio prevalensi pada studi potong lintang,
dimana, rasio prevalensi= , dimana prevalensi total=. Beda
prevalensi= r1/n1 - r2/n2;
Odds luaran pada kelompok yang memiliki faktor risiko positif
jumlah dengan luaran posif/ jumlah luaran negatif, adalah r 1/ n1-r1.
Dengan demikian, juga odds luaran pada kelompok yang memiliki
faktor risiko negatif adalah r2/ n2-r2 . Dengan demikian,odds ratio
adalah :

Interval kepercayaan (OR)


IK = estimate z X SE (standard error), atau
batas bawah IK 95% untuk OR = eb-1,96XSE
batas atas IK 95% untuk OR = eb+1,96XSE
Contoh, bila b = 0,4, dan SE = 0,15. Maka
OR = =1,5 dengan
batas bawah IK 95% untuk OR = e0,4-1,96X0,15
dan
batas atas IK 95% untuk OR = e0,4+1,96X0,15
, maka
batas bawah IK 95% untuk OR = 1,1 dan
batas atas IK 95% untuk OR =2,0
Untuk meyakinkan kebenaran perhitungan IK 95% ini, maka hasil
perkalian antara batas bawah IK 95% untuk OR dan batas atas IK 95%
untuk OR sama dengan OR kwadrat. Dengan contoh di atas,OR 2 =
batas bawah IK 95% untuk OR X batas atas IK 95% untuk OR, maka:
1,52 = 1,1 X 2,0.

Analisis regresi logistik


multivariat
dinyatakan dengan persamaan linier
sebagai berikut
ln(px/qx)=0+ 1x1+ 2x2+. pxp,
(model logit atau model logistik)
px/qx adalah odds untuk sejumlah p
covariat
qx=1-px

Konversi odds menjadi risk


(probabiliti)
Koefisien terstandarisasi menyatakan pengaruh variabel
independen terhadap dependen dimana variansi sampel
diperhitungkan. Bila nilai exponenberbasis bilangan natural (e)
atau exp adalah kebalikan dari nilai logaritmik berbasis
bilangan natural (e) atau ln,maka persamaan di atasdapat
dikonversi menjadi
px/qx=exp(0+ 1x1+ 2x2+. pxp)
persamaan diatas juga dapat dikonversi menjadi risiko
(probabilitas) penyakit (px), dengan demikian:
px= 1/[1+exp(0+ 1x1+ 2x2+. pxp)
px adalah probabilitas penyakit pada sejumlah x variabel (x1, x2,
. xp), dimana variabel x1 , .xp adalah faktor risiko potensial
atau atau variabel pengganggu (confounder), dimana variabel
dependen (penyakit =1; tanpa penyakit=0)

Terima Kasih

Anda mungkin juga menyukai