Sudigdo Sastroasmoro
.rr
Sudigdo Sastroasmoro 433
Jumloh
Sebelum r3 27 40
Sesudoh 33 40
Jumloh 20 60 80
Komentar
Tabel di atas adalah tabel analisis untuk uji x2 independerL sedang
desain before and after atau the one group pretest-posttest design memberi
data berpasangan. Untuk ini, uji yang sesuai adalah uji McNemar,
dan tabel disusun dengan memperhatikan bahwa data yang ada
adalah data berpasangan (lihatlah Tabel 2l-2 dan2l-3):
r pasienyang sebelumpengobatanmenderitaAN dan setelah
terapi mengalami AN dimasukkan dalam sel a
o pasien yang sebelum pengobatan menderita AN dan setelah
terapi tidak menderita AN dimasukkan ke dalam sel b
o pasien yang sebelum pengobatan tidak menderita AN dan
setelahnya menderita AN dimasukkan ke dalam sel c
r pasien yang sebelum pengobatan tidak mengalami AN dan
setelahnya tidak mengalami AN dimasukkan ke dalam sel d
Tabel 2\-2 memperlihatkan tabulasi hasil penelitian sebelum
dan setelah dilakukan intervensi.terapi. Jadi total subyek menjadi
40, bukan 80 seperti pada Tabel2l-1. Tabel 21-3 merupakan tabel
,.
434 Kesalahan meto dolo gis dal am p enelitinn
2x2 yarrg benar untuk uji x2 untuk data berpasangan (uji McNemar);
tampak bahwa uji hipotesis menghasilkan perbedaan yang secara
statistika bermakna. Jadi penggunaan uji statistika untuk data
independen padahal datanya adalah berpasangan merupakan 'kerugran'
bagi peneliti karena lebih sulit memperoleh p yang kecil.
^ilri
TABEL 2l-2. Tobvlqsi hqsil penelition efektivitqs obqt A untuk
dsmq noklurnol, doto berposqngdn
I AN+ AN+ o
2 AN+ AN. b
3 AN- AN- d
4 AN- AN+ c
5 AN- AN- d
dst.
Seteloh teropi
AN+ r3
Sebelum
teropi
AN. 24 27
Jumloh 40
x2(McNemor),|=0,048
il
, -,i#
Sudigdo Sastroasmoro 435
Contoh
Peneliti menguji efek obat antihipertensi B kepada 30 pasien
dengan hipertensi esensial. Sebagai kontrol, untuk setiap
pasien dicari pasien lain dengan umur, jenis kelamin, serta
derajat hipertensi yang sama (matchlzg individual). Sebelum
intervensi rerata tekanan diastolik pada kedua kelompok
sebanding (108 mmHg pada kelompok terapi, L10 mmHg
pada kelompok kontrol). Setelah intervensi, pada kelompok
terapi terjadi penurunan rerata tekanan darah dari L08
menJadi 98 mmHg, sedang pada kelompok kontrol tekanan
rerata diastolik turun dari 110 menjadi 102 mmHg. Uji-t
independen memberi nilai p sebesar 0,0743, artinya secara
statistika tidak bermakna.
Komentar
Karena kelompok kontrol dipilih dengan caramatching individual,
maka untuk data numerik uji yang sesuai adalah uji-t untuk 2
kelompok berpasangan. Uji-t untuk kelompok berpasangan lebih
mudah memberikan hasil yang bermakna dibanding uji-t untuk
2 kelompok independen. Dengan uji berpasangan, diperoleh nilai
p = 0.048, jadi secara statistika bermakna.
{;
..1
436 Kesalahan meto dolo gis dalam p enelitian
Komentar
Uji-t baik yang dependen maupun yang independen, hanya sahih
untuk digunakan dalam pengujian perbedaan rerata antara dua
kelompok. Bila jumlah kelompok lebih dari dua, maka uji hipotesis
yang sesuai adalah anova (analisis varians), dengan cara sekaligus
membandingkan rerata antara semua kelompok. Bila anova tidak
menunjukkan adanya perbedaan yang bermakna, maka pengujian
selanjutnya tidak diperlukan. Sebaliknya, apabila anova memberikan
hasil yang bermakna, maka perlu dilakukan pengujian selanjutnya,
dengan maksud untuk menentukan di mana letak perbedaan
tersebut. Untuk uraian yang lebih lengkap lihatlah kembali Bab L5.
il
.a
Sudigdo Sastroasmaro 437
Contoh II
Suatu survei menunjukkan bahwa sebagian besar siswa di S
menderita askariasis. Untuk menguji efek obat D dalam
memberantas penyakit cacing ini, terhadap 20.000 murid
yang didiagnosis askariasis dilakukan randomisasi untuk
diberi obat D, atau obat standar. Pada akhir penelitian di
antara 10.000 murid yang diberi obat standar 7750 murid
(77,5o/") dinyatakan sembuh, sedang dari 10.000 murid yang
diberi obat D, 7950 (79,5"/0) sembuh. Uji x2 untuk 2 kelompok
independen memberikan nilai p = 0,0006 (sangat bermakna).
Disimpulkanbahwa obat D lebihbaik daripada obat standar
dalam memberantas askariasis.
Komentar
Pada Contoh I, jumlah subyek yang terlalu sedikit menyebabkan
uji mutlak Fischer tidak memberi kemaknaan statistika. Namury
kita tidak dapat menyimpulkan bahwa obat C tidak bermanfaat
hanya karena uji statistika tidak bermakna. Meski hasil uji statistika
tidak bermakna, namun melihat perbedaan hasil yang mencolok,
sambil menunggu hasil yang lebih definitif, tentulah lebih rasional
bagi klinikus untuk memilih obat C untuk pasien leukemia tersebut
dibanding obat standar.
Pada Contoh II, perbedaan kesembuhan antara kedua kelompok
(77,5% vs 79,5o/") secaraklinis tidak penting namun secara statistika
sangat bermakna karena jumlah subyek yang amat banyak. Jadi
berapa pun nilaip yang diperolehpada uji hipotesis tidak mengubah
penerapan pengobatan sehari-hari. Dalam hal ini keputusan untuk
memilih obat tidak didasarkan pada efektivitas melainkan pada hal-
hal lain (harga, rasa, mudahnya diperole[ keamanan, dan lain-lain).
il
t
438 Kes alahan met o dolo gis d alam p enelitian
Contoh
Suatu alat diiklankan dapat mengukur secara non-invasif
.saturasi O, dengan akurat, sehingga dapat menggantikan
pemeriksaan saturasi oksigen konvensional. Dilakukan
pemeriksaan safurasi O, terhadap 40 sampel darah, masing-
masing dengan alat baru dan alat konvensional. Hasilnya
digambarkan sebagai diagram baar (scatter diagram).
Perhitungan koefisien korelasi memberi angka r= 0.98 (kolerasi
sangat kuat) dengan p = O03 (kemungkinan bahwa hasil semata-
mata karena faktor peluang sangat kecil yakni 3%). Disimpulkan
bahwa alat baru tersebut dapat menggantikan cara konvensional
unfuk mengukur saturasi Or.
Komentar
Koefisien kolerasi (Pearson) digunakan untuk menunjukkan hubungan
antara 2 variabel berskala numerik (misalnya hubungan antara
kadar Hb dan feritin, atau antara berat dan tinggi badan), dan tidak
digunakan untuk menyatakan kesesuaian antara 2 carapengukuran
terhadap satu variabel numerik. Bahwa koefisien kolerasi tidak
layak digunakan untuk memperlihatkan kesesuaian antara dua
pengukuran terhadap variabel numerik yang sama dapat dijelaskan
dengan contoh ekstrem berikut.
Misalnya ada alat baru yang menghasilkan data numerik,
namun hasil pengukurannya memberi nilai lebih kurang s/q dari
nilai yang diperoleh dengan cara standar. Apabila pengukuran
il
t -4'
Sudigda Sastroasmoro 439
6 Up ruNrs NEGATTF
Contoh
Peneliti ingin membuktikan bahwa pemberian digoksin 0,01
mg/kglhari dosis tunggal memberi kadar digoksin serum
yang sama dengan dosis 0,01 mg/kg/hari yang diberikan 2
kali sehari. Ia merancang penelitian; jumlah subyek yang
diperlukan adalah 100 pasien per kelompok. Pada waktu
penelitian selesai dilakukan, peneliti hanya memperoleh
masing-masing 60 pasien per kelompok. Pengukuran kadar
digoksin menunjukkan bahwa pada kelompok 2 kali sehari,
kadarnya adalah 0.L6 (SD 0,5) ng/dl, sedang pada kelompok
digoksin dosis tunggal kadarnya adalah 12 (SD 0,72) ngldL.
Uji-t untuk kelompok independen menunjukkan bahwa
kadar digoksin kedua kelompok tidak berbeda bermakna
(p=0,09), dan disimpulkan bahwa kedua cara tersebut sama
baiknya, sehingga pemberian L x perhari dianjurkary karena
lebih mudah dan lebih menyenangkan pasien.
Komentar
Suatu uji klinis biasanya ingin membuktikan adanya perbedaan
variabel efek antara kelompok yang diobati dan kelompok kontrol.
.rl ;*o
440 Kes nlahan me t o dolo gis dalam p enelitian
il
i ;*o
Sudigdo Sasfuoastnoro 441
Komentar
Hipotesis, telah sering disebut, merupakan jawaban sementara atas
pertanyaan penelitian, yang harus diuji kesahihannya secara empiris.
Hipotesis tersebut harus dirumuskan sebelum penelitian dimulai.
Pada penelitian analitik retrospektif sekali pun, hipotesis harus
dirumuskan sebelum peneliti melihat data yang ada. Syarat-syarat
lain untuk hipotesis yang baik dapat dilihat kembali dalam Bab 3.
Tidak jarang peneliti melihat data retrospektif dan mencoba
mencari-cari hubungan antar-variabel. Setelah peneliti melihat data
dan melihat ada asosiasi antara 2 variabel maka ia merumuskan
hipotesis, dan mengujinya dengan data tersebut. Tindakan ini
secara metodologis salah. Dipandang dari sudut hipotesis, penelitian
dalam ilmu alamiah dapat dikelompokkan menjadi dua, yakni
hyp otesis testing res earch (penelitian untuk menguji suatu hipotesis),
dan hypotesis generating researck (penelitian untuk membangun
hipotesis). Pada jenis pertama, hipotesis harus dikemukakan sebelum
studi dimulai(apriori) atas dasar pustaka dan penalaran logis ilmiatu
dan pengumpulan data dimaksudkan untuk menguji hipotesis itu
secara empiris. Pada jenis kedua termasuk surval penelitian deskriptif,
atau data sekunder seperti rekam medi+ pengumpulan data merupakan
upaya untuk menyusun hipotesis. Hipotesis yang dirumuskan berdasar
set data tertentu tidak boleh diuji dengan data tersebut karena terjadi
rasionalisasi sirkular, yang tidak reprodusibel. Hipotesis yang dibangun
berdasar data tertentu harus diuji dengan set data yang lain.
Pada contoh di atas, untuk menguji validitas hipotesisnya maka
peneliti tidak dapat menggunakan data RSS, melainkan harus
mendesain studi baru, dengan subyek yang sama sekali lain. Uji
hipotesis yang dilakukan terhadap data RSS hanya berlaku untuk
kelompok pasien tersebut, tidak berlaku untuk pasien berikutnya.
Tindakan peneliti untuk melakukan pengujian hipotesis setelah
ia melihat data, dan mengujinya dengan data tersebut, seringkali
disebut dengan beberapa julukan, seperti fishing expedition, data
dredging, atau "ekploitasi dan bukan eksplorasi data" . Hal tersebut
mi:mbawa konsekuensi yang serius, karena dapat membawa
peneliti pada simpulan yang salah.
fi
.r
442 Kesalahan metodologis dalam penelitian
Contoh
Pada 200 pasien difteria dengan miokarditis dicari hubungan
pelbagai variabel, apakah ada hubungan dengan terjadinya
miokarditis. Faktor yang dinilai adalah umuq, jenis kelamin,
lama sakit, bullneck, status imunisasi, status gizi, dan tingkat
ekonomi. Dilakukan analisis bivariat (antar2 variabel) yakni
antara masing-masing risiko dengan kejadian miokarditis.
Dari penguiian diperoleh nilai p untuk masing-masing faktor
risiko, untuk kemudian disimpulkan ada atau tidaknya
hubungan tiap faktor tersebut dengan miokarditis.
ilt
.i
Sudigdo Sqstroasmoro 443
Komentar
Ini adalah contoh hipotesis multipel, yakni uji yang dilakukan
berulang kali pada L set data. Bila ditetapkan batas kemaknaan
untuk satu hipotesis (cx), secara matematis dapat dibuktikan bahwa
dengan bertambahnya uji hipotbsis, makin besar nilai cx (kesalahan
tipe I), atau kesalahan untuk menyatakan ada hubungan padahal
sebenarnya tidak ada. Apabila untuk satu hipotesis ditetapkan batas
kemaknaan sebesar ct, maka untuk n hipotesis nilai cr bertambah
besar, sehingga peluang untuk memperoleh hasil yang bermakna
semata-mata karena peluang makin besar.
Salah satu cara untuk me4gatasi hal ini adalah membagi odengan
jumlah uji yang dilakukan. Bila semula ditetapkanbatas kemaknaan
cr = 0,05, dan dilakukan 10 uji hipotesis, maka nilai cr diturunkan
menjadi a/10 :0,005. Koreksi ini disebut penyesuaian Bonferonni
yang dianggap berlebihan sehingga mengurangi pozuer penelitian.
Sebagai kompromi, nilai crhanya diturunkan menjadi 0,02 atau 0,01.
Kedua, pelbagai faktor risiko tersebut mungkin merupakan
perancu. Status gizi (yang berkaitan dengan tingkat sosial ekonomi)
akan menyebabkan anak tidak diimunisasi lengkap, jadi status gizi
merupakan faktor perancu dalam asosiasi antara imunisasi dan
miokarditis. Variabel lain mungkin menjadi perancu dalam asosiasi
antara 2 variabel. Makin banyak dilakukan uji hipotesis pada satu set
data, makin besar pula kemungkinan jalinan pelbagai perancu. Untuk
mengatasinya dapat dilakukan analisis multivaria| dalam hal ini regresi
logistik. Cara lain adalah membatasi uji hipotesis hanya yang utama
hingga dapat dibuat desain yang dapat mengurangi perancu.
Contoh
Untuk menyederhanakan penilaian status bayi pascalahir,
dilakukan uji diagnostik guna menilai validitas pemberian
skor dengan menggunakan 3 dari 5 komponen nilai Apg"",
il
.r|
444 Kesqlahan metodologis dalam penelitian
Komentar
Salah satu syarat yang harus dipenuhi dalam uji diagnostik adalah
pengamatan harus dilakukan secara independen (pengamatan yang
diuji tidak bergantung kepada pengamatan baku emas). Bila ini
tidak dipenuhi, maka pengertiannya menjadi sirkular. Pada contoh
di atas, akhirnya yang dibandingkan adalah 3 komponen dengan
3 komponen Apgar, bukan antara 3 dengan 5 komponen. Dapat
diduga bahwa sensitivitas dan spesifisitas nilai Apgar Modifikasi
adalah'sangat baik' (namun tidak sahih).
Contoh I
Ingin diketahui apakah bayi yang mendapat ASI eksklusif
(hanya minum ASI saja sampai 6 bulan) berbeda beratnya
dibanding dengan bayi yang tidak mendapat ASI eksklusif.
Untuk ini dilakukan studi kohort selama l tahun terhadap 300
bayi yang lahir cukup bulan. Dari 300 bayi, 100 oleh
orangtuanya diberi ASI eksklusif, sedang 200 tidak. Peneliti
menimbang bayi tiap bulan, dan menghitung rerata berat
badan bayi baik pada kelompok ASI eksklusif dan yang tidak.
Dari data yang ada ia melakukan uji't untuk kelompok tidak
berpasangan pada saat bayi berusia 't,3,6,9, dan 12 bulan.
Contoh II
Seorang dokterparu inginmeneliti apakah obatA lebih baik
daripada obat B untukpengobatanmaintenance asma kronik.
Ia melakukan alokasi random sekelompok pasien asma
.r)
Sudigdo Sastroasmoro 445
Komentar
Semangat tinggi peneliti ini tidak diimbangi dengan pemahaman
metodologi dan statistika yang cukup. Pengukuran berulang
terhadap nilai numerik subyek menurut perjalanan waktu dan
membandingkan berulang nilai reratanya di antara 2 kelompok
adalah keliru. Tindakan ini menyalahi salah satu syarat uji numerik,
yakni bahwa pengukuran harus dilakukan kepada kelompok subyek
yang independen. Istilah independen di sini bukan berarti bahwa
kedua kelompok dipilih tidak dengan matching, tetapi berarti nilai
pengukuran subyek pada satu kelompok tidak bergantung pada nilai
subyek kelompok lainnya. Dalam Contoh I, pada perbandingan rerata
berat bayi kedua kelompok pada akhir bulary kedua nilai adalah
independen. Namun pada perbandingan kedua dan seterusnya,
pengukuran pada tiap kelompok tidak lagi independery sebab berat
bayi waktu berumur 3 bulan bergantung pada beratnya waktu 1
bulan, dan waktu L bulan sudah dilakukan uji hipotesis. Untuk data
seperti ini tersedia analisis statistika yakni time-series analysis.
Hal yang sama terjadi pada Contoh II. Pengukuran FEV L minggu
setelah awal pengobatan adalah sahih, karena nilai pada kedua
kelompok adalah independen. Akan tetapi untuk minggu-minggu
berikutnya nilai-nilai rerata pengukuran tidak independen, sebab
bergantung pada nilai sebelumnya, y ang no t a b en e sudah dianalisis.
Secara statistika hal ini sama saja dengan melakukan uji hipotesis
multipel, sehingga harus dihindari.
Selain kesalahan prinsip tersebut, peneliti dapat dihadapkan
pada data yang mungkin membingungkan. Pada Contoh II tidak
tertutup kemungkinan bahwa pada akhir minggu pertama pasien
{;
..1
446 Kesalahan meto dolo gis dalam penelitian
Contoh
Dokter Z meneliti kaitan antara kadar HGH(human growth
hormon e) dengan status gizi anak, dengan desain studi cr o s s -
sectional. Awalnya ia sangat bersemangat, setiap hari mencari
pasien dengan gizi kurang atauburuk, kemudian mengukur
kadar HGH-nya. Lama kelamaan ia mulai jemu, datang 2
kali seminggu. Itupun ia memilih pasiennya, yang kira-kira
orangtuanya koperatif. Bulan berikutnya ia pergi kongres
ke Hongkong terus ke Prancis menengok anaknya. Pulang
dari luarnegeri ia kembali mengambil sampel, kali ini dengan
semangat dipaksakan karena waktu penelitian sudah hampir
selesai. Setelah jumlah subyek terpenuhi, ia menganalisis
datanya.
Komentar
Dalam Bab 5 telah ditegaskan bahwa dalam penelitiary sampel harus
dapat mewakili populasinya. Baku emas untuk cara pemilihan
dr
ll
Sudigdo Sastroasmoro 447
sampel ini adalah probability sampling, dalam hal ini simple random
sampling. Mengapa? Karena semua perhitungan matematika I
statistika didasarkan pada asumsi bahwa subyek dipilih dengan
cara random sampling. Dalam penelitian klinis sering cara tersebut
sulit dilaksanakan, karena jumlah subyek yang terbatas. Untuk
itu tersedia cara consecutiae sampling, yakni semua subyek yang
memenuhi kriteria pemilihan dalam kurun waktu tertentu dipilih
menjadi sampel. Bila waktu penelitian cukup lama, 6 bulan atau 1
tahun, maka pasien yang terpilih dapat mewakili pasien yang
berobat. Namun bila peneliti seringkali pergi dan tidak minta
sejawatnya untuk mengumpulkan data, ia kehilangan banyak
subyek yang seharusnya terpilih. Tidak ada cara untuk menjamin
bahwa karakteristik subyek terpilih yang gagal direkrut sama dengan
subyek yang direkrut. Akibatnya, sampel tidak mewakili populasi
sehingga hasil apa pun yang diperoleh pasti tidak dapat digeneralisasi
ke populasi terjangkau, apa lagi ke populasi yang lebih luas.
{t
I
448 Kesalahan meto dolo gis dalam p enelitian
Srupurex
Contoh-contoh di atas menunjukkan betapa kesalahan metodologis
dapat terjadi akibat kurangnya pemahaman metodologi dan
biostatistika. Hal tersebut juga menunjukkan bahwa kesalahan
metodologis, baik dalam desairy pemilihan subyek, pengukurary
dan analisis serta interpretasi hasil dapat membawa peneliti kepada
simpulan yang keliru. Dengan kata lain ke.salahan metodologis dapat
..f
Sudigdo Sastroasmoro 449
Dnrrnn PUsTAKA
I Afifi AA, Clark V. Computer-aided multivariate analysis. Edisi ke-2 New
York: VNB, 1986.
2 Andersen B. Methodological errors in medical research. Oxford: Blackwell,
1990.
3 Altman DG. Practical statistics for medical research. London: Chapman and
hall,1991.
4 Altman DG, Machini D, Bryant TN, Gardnet Mj. Statistics with confidence.
Edisi ke-2. London: BMI;2000.
5 Norman G& Streiner DL. PDQ statistics. Toronto:Decker, 1989.
6 Dawson B, Trapp RG. Basic and clinical biostatistics. Edisi ke-3. Boston: Lange
Medical Books/McGraw G Hill, 2001.
il
i
450 Kesalahanmetodologis dalampenelitian -
a{t . . at
Sudigdo Ssstroqsmoro 451
#r
ttl