Anda di halaman 1dari 34

CARA MELAPORKAN HASIL

ANALISIS STATISTIK:

GENERALISASI DARI SAMPEL


KE POPULASI
PENDAHULUAN
 Kebanyakan penelitian biomedik
bergantung pada kepastian bahwa apa
yang benar terjadi pada sampel juga
benar terjadi pada populasi dimana
sampel tsb diambil,
 Karena itu, karakteristik dari sampel
digunakan untuk estimasi karakteristik
yang sama pada populasinya
PENDAHULUAN
 Akurasi data estimasi2 tsb bergantung
pada variasi berkaitan dengan:
 Teknik pengukuran (measurement error)
 Jumlah dan teknik sampling (sampling
error)
 Variasi biologik pada karakteristik tsb
(random error)
 Dinyatakan sebagai confidence interval
PENDAHULUAN
 confidence interval, adalah nilai range
yang melalui nilai aktual yang terjadi
pada populasi
 confidence interval yang lebar
menunjukkan presisi yang kurang baik,
demikian sebaliknya
CONTOH
 Perbandingan rerata suhu tubuh antara
kelompok perlakuan (n=15) dan
kelompok kontrol (n=15) menunjukkan
bahwa kelompok perlakuan secara
statistik mempunyai mean (SD) yang
lebih tinggi dibandingkan kelompok
kontrol: 56 oC (3 oC) versus 33 C (5 oC).
Beda rerata kedua kelompok adalah 23
o
C (95% CI = 19,9 sampai 26,1 oC)
Laporkan confidence interval untuk semua
perbandingan primer baik yang bermakna
maupun tidak
 Laporan ilmiah yang baik bergantung lebih
pada jawaban yang akurat terhadap
pertanyaan penelitian dan bukan pada
kemaknaan statistik.
 Hasil yang diperoleh dari sampel masih
merupakan estimasi: belum yang sebenarnya
dalam artian absolut, sehingga masih
mungkin bervariasi antar sampel, yang dapat
diperlihatkan melalui nilai confidence
interval
Laporkan confidence interval untuk semua
perbandingan primer baik yang bermakna
maupun tidak
 confidence interval yang sering digunakan
dalam kedokteran adalah 95%, artinya
interval tsb dapat digunakan untuk
menunjukkan apakah estimasi perubahan tsb
secara statistik bermakna pada tingkat 0,05
 Nilai lain dapat digunakan, misal 90% untuk
jumlah sampel kecil
 Secara umum, bila 95% CI estimasi beda
antara 2 kelompok tidak melibatkan angka 0
(angka 1 untuk OR), maka hasilnya bermakna
pada tingkat 0,05
CONTOH

 Beda rerata ukuran fungsi paru antar 2


kelompok adalah 0,51 L/menit (95% CI
= 0,23 sampai 0,79)
 Beda rerata ukuran fungsi paru antar 2
kelompok adalah 0,12 L/menit (95% CI
= -0,16 sampai 0,40)
CONTOH

 OR insidens terjadinya kanker pada


perokok dan non-perokok adalah
4,2 (95% CI = 1,32 sampai 13,33)
 OR insidens terjadinya kanker pada
perokok dan non-perokok adalah
4,2 (95% CI = 0,92 sampai 18,63)
CONTOH
 Sekelompok pasien mempunyai tekanan
diastolik yang rendah setelah menerima obat
selama 6 minggu, yang dapat dilaporkan sbb:
 Efek obat bermakna secara statistik.
 Efek obat untuk menurunkan tekanan diastolik
secara statistik bermakna (P < 0,05)
 Rerata tekanan diastolik dari kelompok perlakuan
turun dari 100 menjadi 92 mm Hg (P = 0,02)
 Obat menurunkan tekanan diastolik dengan rerata
sebesar 8 mm Hg, dari 100 menjadi 92 mm Hg
(96% CI = 2 sampai 14 mm Hg).
Laporkan confidence interval untuk
statistik deskriptif

 Estimasi untuk keluaran data yang


utama (mean, median, proporsi),
harus disertakan dengan CI untuk
menunjukkan presisinya
CONTOH

 Rerata kadar serum IGF-1 dari 138


pasien osteoporosis adalah 300 ng/
mL (95% CI = 272 sampai 327 ng/
mL)
CATATAN

 Jangan menggunakan SEM sebagai


CI
 CI yang lebar dapat membuat
penggunaan estimasi menjadi tidak
valid
CARA MELAPORKAN HASIL
ANALISIS STATISTIK:

MASALAH PADA
MULTIPLE COMPARISON
UJI GANDA SERING
DILAKUKAN :
 Uji beberapa karakteristik data dasar ataupun
faktor prognostik antara kelompok perlakuan
dan kontrol
 Membandingkan tiga atau lebih kelompok
data melalui analisis terpisah untuk dua
kelompok setiap saat (ANOVA, regresi ganda)
 Menguji efek ganda yang dipengaruhi oleh
satu set variabel yang sama
UJI GANDA SERING
DILAKUKAN :
 Melakukan analisis tambahan setelah data
terkumpul yang tidak direncanakan
sebelumnya
 Melakukan analisis tambahan sebagai analisis
sub-kelompok yang tidak direncanakan
sebelumnya
 Melakukan analisis interim dari akumulasi
data (efek pada beberapa waktu yang
berbeda)
 Membandingkan kelompok pada beberapa
waktu pengamatan
YANG PERLU DIPERHATIKAN
PADA UJI GANDA :
 Fenomena data dredging
 Dapat bermanfaat untuk menghasilkan
pertanyaan penelitian yang baru yang
bermanfaat secara biologis, asalkan
tidak men-cari2 (fishing expedition)
 Bagaimana dengan nilai kemaknaan P
nya?
PERUBAHAN NILAI
KEMAKNAAN P:
 Nilai kemaknaan P sudah ditetapkan
oleh peneliti, apakah perlu disesuaikan
nilainya untuk uji ganda?
 Menggunakan 0,01 dan bukan 0,05
 Menggunakan koreksi Bonferroni dengan
menghitung nilai kemaknaan baru yaitu
nilai kemaknaan lama / jumlah analisis
 Lebih mengutamakan hipotesis utama
MELAPORKAN KESAMAAN ANTAR KELOMPOK
 Laporkan nilai klinis untuk menilai kesamaan
antar kelompok dan jangan bergantung pada
nilai P
 Pada uji klinis tanpa randomisasi, karakteristik
data awal dapat dan sering dilaporkan untuk
membandingkan apakah perbedaannya
bermakna secara statistik dan ada artinya
secara klinis:
 adanya beda menunjukkan adanya systematic
bias pada saat pengalokasian subyek,
 sedangkan bila secara statistik tidak ada
perbedaan bermakna maka belum tentu kedua
kelompok sudah sama bila secara statistik belum
bisa menunjukkan adanya beda secara klinis
MELAPORKAN KESAMAAN ANTAR KELOMPOK

 Pada uji klinis dengan randomisasi,


setiap perbedaan klinis atau statistik
yang ditemukan antar kelompok, secara
definisi merupakan hasil dari suatu
kebetulan:
 Ketidakseimbangan secara klinis, walaupun
merupakan suatu kebetulan adalah sesuatu
yang nyata dan perlu disatukan dalam
suatu model multivariabel.
MELAPORKAN KESAMAAN ANTAR KELOMPOK
 Beda yang bermakna secara statistik
merupakan sesuatu yang kebetulan dan
 apabila perbedaannya tidak bermakna
secara statistik, tidak menunjukkan bahwa
kedua kelompok tidak ada beda tetapi
menunjukkan kalau alokasinya efektif
 Dari 80 studi RCT yang dipublikasi, hanya
46 studi (58%) yang membandingkan
karakteristik data awal
MELAPORKAN PERBANDINGAN SECARA
BERPASANGAN DARI KELOMPOK2 PERLAKUAN
 Jelaskan prosedur perbandingan ganda yang
digunakan untuk menunjukkan pasangan dari
kelompok yang paling berpengaruh dari
semua kemaknaan statistik mengenai
perbandingan kelompok:
 Bila tiga atau lebih data dibandingkan masing2
dua dengan analisis terpisah, maka jumlah tes
akan menjadi banyak untuk masuk ke tes ganda
 Contoh, bila ada 4 kelompok yang dibandingkan 2
setiap saat dengan uji-t, maka akan ada 4(4-1)/2
atau 6 uji-tes. Bila alpha ditentukan dengan nilai
0,05 maka probabilitas untuk menemukan
perbedaan bila tidak ada beda adalah 0,05*6 =
0,3 atau 1 dari setiap 3 nilai P akan
diinterpretasikan salah
MELAPORKAN PERBANDINGAN SECARA
BERPASANGAN DARI KELOMPOK2 PERLAKUAN
 Untuk mengatasi masalah tsb maka teknik
membandingkan kelompok dengan ANOVA dapat
menganalisis data dari seluruh kelompok dan
menunjukkan adanya perbedaan antar kelompok
tsb
 Bila ada perbedaan maka prosedur selanjutnya
(prosedur perbandingan ganda) dapat dilakukan
untuk menunjukkan kelompok2 mana yang paling
mempengaruhi adanya perbedaan menyeluruh
antar kelompok
 Prosedur perbandingan ganda yang biasa
dilakukan adalah: Tukey’s, Student-Neuman-
Keuls, Duncan’s, Dunnett’s, Scheffe’s, LSD,
Bonferroni’s
MELAPORKAN ANALISIS SEKUNDER
(RETROSPEKTIF ATAU POST HOC)
 Hasil dari suatu studi dapat menemukan hubungan
yang baru yang tidak direncanakan sebelumnya.
Namun, karena studi tidak direncanakan untuk
menguji hubungan tsb, maka analisis ulang hasil
berdasarkan kriteria yang berbeda dapat
menimbulkan masalah dalam
menginterpretasikannya:
 Contoh, suatu studi dirancang untuk menguji perbedaan
dalam tajam penglihatan antara laki-laki dan perempuan.
Setelah mendapatkan hasilnya, peneliti memutuskan untuk
menganalis ulang datanya berdasarkan kelompok usia
daripada berdasarkan gender. Karena asalnya kelompok
perlakuan dan kontrol telah disepadankan dalam gender dan
bukan dalam usia, maka analisis post hoc yang dilakukan
harus dipertimbangkan penjelasan hasilnya, semenarik atau
sebermakna apapun secara statisik
MELAPORKAN ANALISIS SUBKELOMPOK
 Banyak proyek riset yang mengumpulkan sejumlah
data yang tidak ada kaitannya dengan perbandingan
primernya, misal: data demografik (umur dan jenis
kelamin), karena banyak gambaran klinis bervariasi
berdasarkan faktor tsb.
 Peneliti mempelajari efek obat antidepresan, dan
mendapatkan bahwa efek obat tidak beda dengan
plasebo
 Analisis lebih lanjut menemukan adanya penurunan depresi
secara bermakna pada perempuan post-menopause sebagai
sub kelompok dari kelompok perlakuan asal
 Hasil dari analisis sub-kelompok boleh saja dilaporkan –
mungkin saja obat tsb memang dipengaruhi oleh kadar
hormon, namun harus dilaporkan sebagai penemuan awal
karena tidak diantisipasi sejak awal
MELAPORKAN ANALISIS SUBKELOMPOK
 Alternatif untuk analisis sub-kelompok adalah
dengan menggabungkan faktor2 dalam satu
model prediksi (persamaan regresi) dibanding
dengan menganalisis masing2 sub-kelompok
secara terpisah.
 Contoh, peneliti dapat menganalisis interaksi antar
usia, gender dan perlakuan dengan perbaikan
depresinya dan menghindarkan analisis sub-
kelompok
 Sub-kelompok yang ditentukan setelah data
dikumpulkan dapat menggambarkan efek
perlakuan
 Analisis sub-kelompok berisiko melakukan
kesalahan tipe 2 (jumlah sampel kurang)
MELAPORKAN ANALISIS SUBKELOMPOK
 Analisis sub-kelompok dapat lebih diterima
apabila:
 Perbedaan antar kelompok cukup besar baik
penting secara klinis maupun bermakna secara
statistik
 Perbandingan antar sub-kelompok merupakan
bagian dari analisis prioritas dan bukan analisis
post hoc
 Perbandingan antar sub-kelompok merupakan
bagian dari hipotesis tambahan dan bukan hasil
dari “data dredging”
 Perbedaan yang ada berdasarkan perbedaan dari
studi yang sama dan bukan data dari studi lain
 Perbedaannya konsisten sepanjang studi
 Bukti2 lain mendukung adanya perbedaan tsb
MELAPORKAN ENDPOINT GANDA
 Identifikasikan efek utama sebelum
memulai studi:
 Analogi dengan masalah analisis sekunder,
dimana variabel2 ditemukan secara
bermakna merupakan masalah efek ganda;
 Untuk uji klinis dengan 5 efek, maka
kesempatan untuk membuktikan hipotesis
null bahwa sedikitnya 1 perbedaan
perlakuan mencapai nilai kemaknaan P <
0,05 adalah sekitar 20%
MELAPORKAN ENDPOINT GANDA
 Contoh:

 Bila obat tekanan darah secara tidak sengaja juga


merangsang pertumbuhan rambut, maka studi
dapat melaporkan kedua efek tsb: tekanan darah
dan pertumbuhan rambut.
 Seperti halnya pada analisis sekunder, jumlah efek
yang dapat dianalisis bisa banyak dan
menimbulkan masalah masalah uji ganda
 Perbandingan utama, yaitu efek obat pada
tekanan darah harus merupakan fokus dari
laporan, dan efeknya pada pertumbuhan rambut
harus dilaporkan sebagai hasil awal/preliminari
ANALISIS INTERIM DARI AKUMULASI
DATA
 Laporkan seluruh analisis interim dari akumulasi data
dan buat rasional untuk analisis tsb:
 Untuk studi yang memerlukan waktu bulanan atau tahunan,
seringkali diperlukan uji dari hasil secara berkala sehingga
studi tidak berisiko untuk subyek
 Bila hasil analisis menunjukkan keunggulan atau ketidak-
unggulan obat atau obat membahayakan maka studi harus
dihentikan
 Namun menimbulkan masalah uji ganda, misal analisis
dilakukan setiap subyek menyelesaikan protokol studi,
sehingga jumlah kasus yang dianalisis akan bertambah satu
pada setiap analisis:
 Uji analisis akan memberikan hasil bermakna setelah kasus ke
23, tidak bermakna setelah kasus ke 27, bermakna lagi setelah
kasus ke 34 dan seterusnya
 Analisis interim yang tidak direncanakan dapat menimbulkan
masalah interpretasi
ANALISIS INTERIM DARI AKUMULASI
DATA
 Laporkan kriteria statistik untuk
menghentikan studi dan tunjukkan
bahwa kriteria2 tsb dibuat sebelum
studi dimulai:
 Bila studi dihentikan terlalu cepat (baru
beberapa kasus yang menyelesaikan
protokol), maka power statistik bisa rendah
 Bila studi diteruskan maka akan berisiko
untuk subyek
ANALISIS INTERIM DARI AKUMULASI
DATA
 Tentukan untuk siapa hasil analisis ini
perlu dilaporkan:
 Melaporkan hasil analisis interin kepada
komunitas kedokteran dapat menimbulkan
bias:
 Bila hasilnya obat yang satu lebih superior
terhadap obat yang lain, maka dokter tidak
akan mengijinkan pasiennya untuk diuji
 Mempublikasikan melalui media:
 Bila kemudian hasilnya menjadi berbeda maka
akan hilangkan kepercayaan dari ilmuwan dan
publik
MEMBANDINGKAN KELOMPOK PADA
WAKTU2 YANG BERBEDA
 Bila kelompok dibandingkan pada waktu2
yang berbeda, jelaskan prosedur statistik
yang digunakan dan penyesuaian yang
dilakukan untuk perbandingan ganda tsb:
 Studi yang membandingkan dua atau lebih
kelompok pada waktu2 yang berbeda akan
menghasilkan nilai P ganda, sedikitnya 1 untuk
setiap waktu
 Contoh: untuk menentukan beda saat diberikan
dan lama anastesi antara dua jenis anestesi,
pengukuran dapat dilakukan setiap jam selama 12
jam
MEMBANDINGKAN KELOMPOK PADA
WAKTU2 YANG BERBEDA
 Contoh: untuk menentukan beda saat
diberikan dan lama anastesi antara dua
jenis anestesi, pengukuran dapat dilakukan
setiap jam selama 12 jam:
 Kedua kelompok dapat dibandingkan secara
statistik setiap jam untuk menentukan pada
waktu yang mana beda terjadi secara
bermakna
 Untuk itu sering dilakukan perbandingan
kelompok ganda secara individual, satu untuk
setiap waktu yang ditentukan, sehingga
menimbulkan masalah uji ganda (ada 12 nilai
P, sehingga memerlukan koreksi nilai alpha,
misal dengan Bonferroni)