Bab 21. Kesalahan Metodologis Dalam Penelitian Kedokteran

Bab 2L - Kesaliahan metodologis
dalam penelitian kedokteran
Sudigdo Sastroasmoro
alam publikasi kedokteran, termasuk yang diterbitkan

dalam jurnal terkemuka, masih ditemukan cukup
banyak kesalahan metodologis. Sebagian besar memang
kesalahannya bersifat 'minor', namun tidak jarang
terdapat pula kesalahan metodologis yang serius sehingga dapat
memengaruhi hasil. Berikut diajukan contoh-contoh kesalahan
metodologis dan statistika yang merupakan ilustrasi hipotetis, agar
dapat dibuat sederhana dan tidak merujuk pada artikel tertentu.
1 UI x'TINTUK DATA BERPASANGAN
Ingin diufi efektivitas obat A untuk mengurangi asma

nokfurnal (serangan asma malam hari) pada pasien asma.
Dilakukan uii klinis pada 40 pasien dengan desain the one
group pretest - posttest design (before anil after), yakni
membandingkan jumlah pasien yang mengalami asma
nokturnal sebelum dan setelah pemberian obat A selama 4
minggu. Dari 40 pasien penelitian, sebelum pemberian obat
A 1.3 pasien mengalami asma nokturnal, setelah pemberian
obat A, hanya 7 masih mengalami asna nokturnal. Peneliti
kemudian menganalisis hasil dalam tabeL2x2 (Thbel 2L-L).
.rr
Sudigdo Sastroasmoro 433
Tobel 2l-1. Jumloh posien yong mengolomi osmq nokturnol

sebelum dqn seleloh teropi dengan obql A
Asmo noklurnol
Jumloh
Sebelum r3 27 40
Sesudoh 33 40
Jumloh 20 60 80
x2 =2,4O; df=l; p=0,121
Komentar
Tabel di atas adalah tabel analisis untuk uji x2 independerL sedang
desain before and after atau the one group pretest-posttest design memberi
data berpasangan. Untuk ini, uji yang sesuai adalah uji McNemar,
dan tabel disusun dengan memperhatikan bahwa data yang ada
adalah data berpasangan (lihatlah Tabel 2l-2 dan2l-3):
r pasienyang sebelumpengobatanmenderitaAN dan setelah
terapi mengalami AN dimasukkan dalam sel a
o pasien yang sebelum pengobatan menderita AN dan setelah
terapi tidak menderita AN dimasukkan ke dalam sel b
o pasien yang sebelum pengobatan tidak menderita AN dan
setelahnya menderita AN dimasukkan ke dalam sel c
r pasien yang sebelum pengobatan tidak mengalami AN dan
setelahnya tidak mengalami AN dimasukkan ke dalam sel d
Tabel 2\-2 memperlihatkan tabulasi hasil penelitian sebelum
dan setelah dilakukan intervensi.terapi. Jadi total subyek menjadi
40, bukan 80 seperti pada Tabel2l-1. Tabel 21-3 merupakan tabel
,.
434 Kesalahan meto dolo gis dal am p enelitinn
2x2 yarrg benar untuk uji x2 untuk data berpasangan (uji McNemar);
tampak bahwa uji hipotesis menghasilkan perbedaan yang secara
statistika bermakna. Jadi penggunaan uji statistika untuk data
independen padahal datanya adalah berpasangan merupakan 'kerugran'
bagi peneliti karena lebih sulit memperoleh p yang kecil.
^ilri
TABEL 2l-2. Tobvlqsi hqsil penelition efektivitqs obqt A untuk
dsmq noklurnol, doto berposqngdn
Sebelum Setelqh lsikon

leropi teropi dolqm sel
I AN+ AN+ o
2 AN+ AN. b
3 AN- AN- d
4 AN- AN+ c
5 AN- AN- d
dst.
TABEL 2l-3. Jumloh posien ydng mengqlomi qsmd noklurnql

(AN) sebelum dqn seteloh terapi dengon obqt A
Seteloh teropi
AN+ AN. Jumloh
AN+ r3
Sebelum
teropi
AN. 24 27
Jumloh 40
x2(McNemor),|=0,048
il
, -,i#
2 Utl-T INDEPENDEN DAN I.III-T BERPASANGAN
Contoh
Peneliti menguji efek obat antihipertensi B kepada 30 pasien
dengan hipertensi esensial. Sebagai kontrol, untuk setiap
pasien dicari pasien lain dengan umur, jenis kelamin, serta
derajat hipertensi yang sama (matchlzg individual). Sebelum
intervensi rerata tekanan diastolik pada kedua kelompok
sebanding (108 mmHg pada kelompok terapi, L10 mmHg
pada kelompok kontrol). Setelah intervensi, pada kelompok
terapi terjadi penurunan rerata tekanan darah dari L08
menJadi 98 mmHg, sedang pada kelompok kontrol tekanan
rerata diastolik turun dari 110 menjadi 102 mmHg. Uji-t
independen memberi nilai p sebesar 0,0743, artinya secara
statistika tidak bermakna.
Komentar
Karena kelompok kontrol dipilih dengan caramatching individual,
maka untuk data numerik uji yang sesuai adalah uji-t untuk 2
kelompok berpasangan. Uji-t untuk kelompok berpasangan lebih
mudah memberikan hasil yang bermakna dibanding uji-t untuk
2 kelompok independen. Dengan uji berpasangan, diperoleh nilai
p = 0.048, jadi secara statistika bermakna.
3 Up-r DAN ANALrsrs vARTANS

Contoh
Suatu studi cross-sectional ingin menguji hipotesis bahwa
terdapat perbedaan tekanan darah pasien obes yang tidak
berolah raga, yang berolah raga angkat berat, dan yang
berolah raga aerobik. Diperiksa tekanan darah diastolik
ketiga kelompok subyek tersebut, jumlah tiap kelompok
adalah 30 orang. Hasil pemeriksaan ini dipaparkan dalam
Tabel20-4. Kemudian dilakukan uji antara kelompok A dan
B (p = 0,04+), antara kelompok A dan C (p = 9,946', dan antara
{;
..1
436 Kesalahan meto dolo gis dalam p enelitian
kelompok B dan C (p = 0,096). Disimpulkan oleh peneliti

bahwa terdapat perbedaan yang bermakna pada tekanan
darah antara pasien obes yang tidak berolah raga dengan
yang berolah raga angkat berat maupun aerobik, dan tidak
ada perbedaan yang bermakna antara pasien yang berolah
raga angkat berat dengan yang berolah raga aerobik.
Komentar
Uji-t baik yang dependen maupun yang independen, hanya sahih
untuk digunakan dalam pengujian perbedaan rerata antara dua
kelompok. Bila jumlah kelompok lebih dari dua, maka uji hipotesis
yang sesuai adalah anova (analisis varians), dengan cara sekaligus
membandingkan rerata antara semua kelompok. Bila anova tidak
menunjukkan adanya perbedaan yang bermakna, maka pengujian
selanjutnya tidak diperlukan. Sebaliknya, apabila anova memberikan
hasil yang bermakna, maka perlu dilakukan pengujian selanjutnya,
dengan maksud untuk menentukan di mana letak perbedaan
tersebut. Untuk uraian yang lebih lengkap lihatlah kembali Bab L5.
Tobel 214. Rerqto lekonon dqroh 3 kelompok posien obes
Reroto tekonon doroh diostolik posien obes (mmHg)
Tidok beroloh rogo Angkot beror Aerobik

(n = 30) (n = 30) (n = 30)
94,5 (SD 9,21 87,3 (SD 9,71 85,8 (SD I 1,2)
4 KnrvrarNaaN KLIMS DAN KEMAKNAAN srAnsrIKA

Contoh I
Regimen C dicoba pada 8 pasienieukemia jenis tertentu,
dengan pembanding regimen standar pada 8 pasien lainnya.
il
.a
Sudigdo Sastroasmaro 437
Karakteristik klinis dan laboratoris kedua kelompok sebelum

pengobatan sebanding. Setelah 5 bulan, hanya 1 pasien pada
. kelomBok regimen standar yang masih hidup, sedang pada
kelompok regimen C,5 orang pasien hidup. Uii Fischer
memberi nilai p = 9,119. Disimpulkan bahwa regimen C tidak
lebih baik daripada regimen standar dalam pengobatan
pasien LLA.
Contoh II
Suatu survei menunjukkan bahwa sebagian besar siswa di S
menderita askariasis. Untuk menguji efek obat D dalam
memberantas penyakit cacing ini, terhadap 20.000 murid
yang didiagnosis askariasis dilakukan randomisasi untuk
diberi obat D, atau obat standar. Pada akhir penelitian di
antara 10.000 murid yang diberi obat standar 7750 murid
(77,5o/") dinyatakan sembuh, sedang dari 10.000 murid yang
diberi obat D, 7950 (79,5"/0) sembuh. Uji x2 untuk 2 kelompok
independen memberikan nilai p = 0,0006 (sangat bermakna).
Disimpulkanbahwa obat D lebihbaik daripada obat standar
dalam memberantas askariasis.
Komentar
Pada Contoh I, jumlah subyek yang terlalu sedikit menyebabkan
uji mutlak Fischer tidak memberi kemaknaan statistika. Namury
kita tidak dapat menyimpulkan bahwa obat C tidak bermanfaat
hanya karena uji statistika tidak bermakna. Meski hasil uji statistika
tidak bermakna, namun melihat perbedaan hasil yang mencolok,
sambil menunggu hasil yang lebih definitif, tentulah lebih rasional
bagi klinikus untuk memilih obat C untuk pasien leukemia tersebut
dibanding obat standar.
Pada Contoh II, perbedaan kesembuhan antara kedua kelompok
(77,5% vs 79,5o/") secaraklinis tidak penting namun secara statistika
sangat bermakna karena jumlah subyek yang amat banyak. Jadi
berapa pun nilaip yang diperolehpada uji hipotesis tidak mengubah
penerapan pengobatan sehari-hari. Dalam hal ini keputusan untuk
memilih obat tidak didasarkan pada efektivitas melainkan pada hal-
hal lain (harga, rasa, mudahnya diperole[ keamanan, dan lain-lain).
il
t
438 Kes alahan met o dolo gis d alam p enelitian
Dua contoh tersebut menunjuk perlunya pemahaman konsep

'bermakna secara statistika' (statistically significant) dan'penting
secara klinis' (clinically imp ort ant), dan menggarisbawahi perlunya
perkiraan besar sampel pada tiap penelitian. (Ingat kembali: Too
few subjects proae nothing, too many subject prore eaerything!).
5 KorEnasr ANIAR 2 pENcurunaN vARTABEL

YANG SAMA
Contoh
Suatu alat diiklankan dapat mengukur secara non-invasif
.saturasi O, dengan akurat, sehingga dapat menggantikan
pemeriksaan saturasi oksigen konvensional. Dilakukan
pemeriksaan safurasi O, terhadap 40 sampel darah, masing-
masing dengan alat baru dan alat konvensional. Hasilnya
digambarkan sebagai diagram baar (scatter diagram).
Perhitungan koefisien korelasi memberi angka r= 0.98 (kolerasi
sangat kuat) dengan p = O03 (kemungkinan bahwa hasil semata-
mata karena faktor peluang sangat kecil yakni 3%). Disimpulkan
bahwa alat baru tersebut dapat menggantikan cara konvensional
unfuk mengukur saturasi Or.
Komentar
Koefisien kolerasi (Pearson) digunakan untuk menunjukkan hubungan
antara 2 variabel berskala numerik (misalnya hubungan antara
kadar Hb dan feritin, atau antara berat dan tinggi badan), dan tidak
digunakan untuk menyatakan kesesuaian antara 2 carapengukuran
terhadap satu variabel numerik. Bahwa koefisien kolerasi tidak
layak digunakan untuk memperlihatkan kesesuaian antara dua
pengukuran terhadap variabel numerik yang sama dapat dijelaskan
dengan contoh ekstrem berikut.
Misalnya ada alat baru yang menghasilkan data numerik,
namun hasil pengukurannya memberi nilai lebih kurang s/q dari
nilai yang diperoleh dengan cara standar. Apabila pengukuran
il
t -4'
Sudigda Sastroasmoro 439
dilakukan secara berpasangan pada banyak subyek, maka dapat

dibuat diagram baur dan dihitung koefisien korelasinya. Karena
nilai cara baru lebih-kurang 3A nllai standar, maka diagram baur
akan memberi kesan hubungan linear yang baik, dan koefisien
kolerasiny a juga sangat baik, misalnya r = 0,94. Dengan .demikian
maka jelaslah bahwa koefisien korelasi (r) bukan indikator untuk
menyatakan adanya agreement (kesesuaian) antara dua pengukuran
numerik pada variabel yang sama. Untuk menyatakan kesesuaian
sebenamya cukup dilihat apakah setiap nilai secara individual pada
kedua kelompok sama ataupun hampir sama. Kesesuaian dapat
dinyatakan dalam koefisien kesesuaiary yakni dengan menghitung
Iimits of agrsement, yang tidak dibahas di sini.
6 Up ruNrs NEGATTF
Contoh
Peneliti ingin membuktikan bahwa pemberian digoksin 0,01
mg/kglhari dosis tunggal memberi kadar digoksin serum
yang sama dengan dosis 0,01 mg/kg/hari yang diberikan 2
kali sehari. Ia merancang penelitian; jumlah subyek yang
diperlukan adalah 100 pasien per kelompok. Pada waktu
penelitian selesai dilakukan, peneliti hanya memperoleh
masing-masing 60 pasien per kelompok. Pengukuran kadar
digoksin menunjukkan bahwa pada kelompok 2 kali sehari,
kadarnya adalah 0.L6 (SD 0,5) ng/dl, sedang pada kelompok
digoksin dosis tunggal kadarnya adalah 12 (SD 0,72) ngldL.
Uji-t untuk kelompok independen menunjukkan bahwa
kadar digoksin kedua kelompok tidak berbeda bermakna
(p=0,09), dan disimpulkan bahwa kedua cara tersebut sama
baiknya, sehingga pemberian L x perhari dianjurkary karena
lebih mudah dan lebih menyenangkan pasien.
Komentar
Suatu uji klinis biasanya ingin membuktikan adanya perbedaan
variabel efek antara kelompok yang diobati dan kelompok kontrol.
.rl ;*o
440 Kes nlahan me t o dolo gis dalam p enelitian
Namun, uji klinis dapat pula dipakai untuk menyelidiki bahwa di

antara 2 cara pengobatan tidak terdapat perbedaan, sehingga
pengobatan yang lebih murah, sederhana, atau mudah, dipilih
sebagai pengganti obat yang lama. Seperti diuraikan padaBab 17,
untuk semua penelitian diperlukan perkiraan besar sampel. Pada
penelitian yang mencari perbedaan antara dua cara pengobatary besar
sampel yang kurang akan menghasilkan perbedaan yang tidak
bermakna, meski mungkin sebenarnya bermakna (kesalahan tipe
II atau B menjadi besar bila jumlah subyek sedikit). Konsekuensi
keadaan ini adalah peneliti akan gagal membuktikan bahwa obat
yang satu lebih baik daripada yang lain.
Pada studi yang bertujudn memperlihatkan tidak ada perbedaan,
(disebut uji klinis negatif atau non-inferiority study), besar sampel
yang kurang akan memberi nilap p yar.g tidak bermakna, yang
membawa peneliti untuk menyimpulkan bahwa ledua obat tidak
berbeda. Jalan pikiran seperti ini sangat berbahaya, karena makin
sedikit subyek, makin mudah untuk memperoleh hasil uji statistika
yang tidak bermakna. Dengan kata lairy pada studi yang bertujuan
untuk membuktikan tidak ada perbedaan antara 2 obat, besar
sampel yang diperlukan harus dipenuhi, sebelum dikatakan bahwa
kedua obat tidak berbeda. (Perhitungan besar sampelnya pun harus
mempergunakan nilai B yang kecil dan effect size yang kecil pula,
sehingga jumlah subyek yang diperlukan jauh lebih banyak
daripada uji klinis positif terhadap obat yang sama).
7 Hporssrs A pRroRr vs HrporEsrs posr rroc

Contoh
Rekam medis suatu ruang rawat sehari (RSS) menunjukkan
bahwa dari 80 neonatus dengan diaie akut, terdapat 48
neonatus memperoleh ASI eksklusif, dan 32 mendapat ASI
+ formula. Atas dasar data tersebut dan didukung oleh
pustaka, peneliti kemudian merumuskan hipotesis bahwa
pemberian susu formula merupakan faktor risiko untuk
terjadinya diare akut pada neonatus, dan menguji hipotesis
tersebut pada data yang ada.
il
i ;*o
Sudigdo Sasfuoastnoro 441
Komentar
Hipotesis, telah sering disebut, merupakan jawaban sementara atas
pertanyaan penelitian, yang harus diuji kesahihannya secara empiris.
Hipotesis tersebut harus dirumuskan sebelum penelitian dimulai.
Pada penelitian analitik retrospektif sekali pun, hipotesis harus
dirumuskan sebelum peneliti melihat data yang ada. Syarat-syarat
lain untuk hipotesis yang baik dapat dilihat kembali dalam Bab 3.
Tidak jarang peneliti melihat data retrospektif dan mencoba
mencari-cari hubungan antar-variabel. Setelah peneliti melihat data
dan melihat ada asosiasi antara 2 variabel maka ia merumuskan
hipotesis, dan mengujinya dengan data tersebut. Tindakan ini
secara metodologis salah. Dipandang dari sudut hipotesis, penelitian
dalam ilmu alamiah dapat dikelompokkan menjadi dua, yakni
hyp otesis testing res earch (penelitian untuk menguji suatu hipotesis),
dan hypotesis generating researck (penelitian untuk membangun
hipotesis). Pada jenis pertama, hipotesis harus dikemukakan sebelum
studi dimulai(apriori) atas dasar pustaka dan penalaran logis ilmiatu
dan pengumpulan data dimaksudkan untuk menguji hipotesis itu
secara empiris. Pada jenis kedua termasuk surval penelitian deskriptif,
atau data sekunder seperti rekam medi+ pengumpulan data merupakan
upaya untuk menyusun hipotesis. Hipotesis yang dirumuskan berdasar
set data tertentu tidak boleh diuji dengan data tersebut karena terjadi
rasionalisasi sirkular, yang tidak reprodusibel. Hipotesis yang dibangun
berdasar data tertentu harus diuji dengan set data yang lain.
Pada contoh di atas, untuk menguji validitas hipotesisnya maka
peneliti tidak dapat menggunakan data RSS, melainkan harus
mendesain studi baru, dengan subyek yang sama sekali lain. Uji
hipotesis yang dilakukan terhadap data RSS hanya berlaku untuk
kelompok pasien tersebut, tidak berlaku untuk pasien berikutnya.
Tindakan peneliti untuk melakukan pengujian hipotesis setelah
ia melihat data, dan mengujinya dengan data tersebut, seringkali
disebut dengan beberapa julukan, seperti fishing expedition, data
dredging, atau "ekploitasi dan bukan eksplorasi data" . Hal tersebut
mi:mbawa konsekuensi yang serius, karena dapat membawa
peneliti pada simpulan yang salah.
fi
.r
442 Kesalahan metodologis dalam penelitian
Contoh terkenal adalah laporan yang menunjukkan hubungan

antara kebiasaan minum kopi dengan kejadian kanker pankreas. Pada
pengumpulan data untuk tujuan lairy sekelompok peneliti melihat
adanya hubungan antara kebiasaan minum kopi dengan kanker
pankreas; penggemar kopi lebih banyak menderita kanker tersebut
ketimbang bukan penggemar kopi (misalnya dari 1000 peminum
kopi 2 orang menderita kanker pankreag sedang pada 10.000 bukan
penggemar kopi hanya 3 menderita kanker. Peneliti membangun
hipotesis, dan diuji dengan data tersebut; terbukti bermakna secara
statistika bahwa peminum kopi lebih banyak menderita kanker
pankreas daripada bukan peminum kopi. Setelah hasil diumumkan,
peneliti lain membuat studi yang sama dengan desain yang sama
maupun berbeda. Tidak satu pun penelitian memberi hasil yang
mendukung laporan tadi. Kelompok peneliti semula pun melaporkan
hasil negatif setelah melakukan studi khusus untuk hal tersebut.
Dengan tersedianya fasilitas komputer sebagai databsse saat ini,
bahaya data dredging tersebut makin mengancam. Misalnya satu
salinan rekam medis menghimpun 3000 pasien penyakit jantung
bawaary tiap pasien dengan 100 variabel. Kemudian peneliti mencari,
mengeksploitasi data melihat apakah ada asosiasi antar-variabel.
Apabila tampaknya ada, ia membuat hipotesis (hipotesis post hoc)
danmengujinya dengan data semula, yangmudah dilakukan dengan
program statistika. Uji hipotesis tersebut tidak dapat dibenarkan.
I Hpomsrsr BryARTAT MUrrrpEL
Contoh
Pada 200 pasien difteria dengan miokarditis dicari hubungan
pelbagai variabel, apakah ada hubungan dengan terjadinya
miokarditis. Faktor yang dinilai adalah umuq, jenis kelamin,
lama sakit, bullneck, status imunisasi, status gizi, dan tingkat
ekonomi. Dilakukan analisis bivariat (antar2 variabel) yakni
antara masing-masing risiko dengan kejadian miokarditis.
Dari penguiian diperoleh nilai p untuk masing-masing faktor
risiko, untuk kemudian disimpulkan ada atau tidaknya
hubungan tiap faktor tersebut dengan miokarditis.
ilt
.i
Sudigdo Sqstroasmoro 443
Komentar
Ini adalah contoh hipotesis multipel, yakni uji yang dilakukan
berulang kali pada L set data. Bila ditetapkan batas kemaknaan
untuk satu hipotesis (cx), secara matematis dapat dibuktikan bahwa
dengan bertambahnya uji hipotbsis, makin besar nilai cx (kesalahan
tipe I), atau kesalahan untuk menyatakan ada hubungan padahal
sebenarnya tidak ada. Apabila untuk satu hipotesis ditetapkan batas
kemaknaan sebesar ct, maka untuk n hipotesis nilai cr bertambah
besar, sehingga peluang untuk memperoleh hasil yang bermakna
semata-mata karena peluang makin besar.
Salah satu cara untuk me4gatasi hal ini adalah membagi odengan
jumlah uji yang dilakukan. Bila semula ditetapkanbatas kemaknaan
cr = 0,05, dan dilakukan 10 uji hipotesis, maka nilai cr diturunkan
menjadi a/10 :0,005. Koreksi ini disebut penyesuaian Bonferonni
yang dianggap berlebihan sehingga mengurangi pozuer penelitian.
Sebagai kompromi, nilai crhanya diturunkan menjadi 0,02 atau 0,01.
Kedua, pelbagai faktor risiko tersebut mungkin merupakan
perancu. Status gizi (yang berkaitan dengan tingkat sosial ekonomi)
akan menyebabkan anak tidak diimunisasi lengkap, jadi status gizi
merupakan faktor perancu dalam asosiasi antara imunisasi dan
miokarditis. Variabel lain mungkin menjadi perancu dalam asosiasi
antara 2 variabel. Makin banyak dilakukan uji hipotesis pada satu set
data, makin besar pula kemungkinan jalinan pelbagai perancu. Untuk
mengatasinya dapat dilakukan analisis multivaria| dalam hal ini regresi
logistik. Cara lain adalah membatasi uji hipotesis hanya yang utama
hingga dapat dibuat desain yang dapat mengurangi perancu.
9 UJI oIaCNOSTIK DENGAN PENGAMATAN TIDAK

-
INDEPENDEN
Contoh
Untuk menyederhanakan penilaian status bayi pascalahir,
dilakukan uji diagnostik guna menilai validitas pemberian
skor dengan menggunakan 3 dari 5 komponen nilai Apg"",
il
.r|
444 Kesqlahan metodologis dalam penelitian
yaitu denyut jantung, warna kulit, dan usaha napas. Sebagai

baku emas adalah penilaian menurut Apga1, yang terdiri atas
5 komponen. Peneliti melakukan penilaian nilai Apgar
modifikasi (3 komponen) dan nilai Apgar konvensional (5
komponen) pada tiap bayiyangbaru lahir. Hasil pengamatan
disajikan dalam tabel2 x 2 untuk uji diagnostik.
Komentar
Salah satu syarat yang harus dipenuhi dalam uji diagnostik adalah
pengamatan harus dilakukan secara independen (pengamatan yang
diuji tidak bergantung kepada pengamatan baku emas). Bila ini
tidak dipenuhi, maka pengertiannya menjadi sirkular. Pada contoh
di atas, akhirnya yang dibandingkan adalah 3 komponen dengan
3 komponen Apgar, bukan antara 3 dengan 5 komponen. Dapat
diduga bahwa sensitivitas dan spesifisitas nilai Apgar Modifikasi
adalah'sangat baik' (namun tidak sahih).
10 PENculeN VARIABEL NUMERIK BERULANG

MENURUT WAKTU
Contoh I
Ingin diketahui apakah bayi yang mendapat ASI eksklusif
(hanya minum ASI saja sampai 6 bulan) berbeda beratnya
dibanding dengan bayi yang tidak mendapat ASI eksklusif.
Untuk ini dilakukan studi kohort selama l tahun terhadap 300
bayi yang lahir cukup bulan. Dari 300 bayi, 100 oleh
orangtuanya diberi ASI eksklusif, sedang 200 tidak. Peneliti
menimbang bayi tiap bulan, dan menghitung rerata berat
badan bayi baik pada kelompok ASI eksklusif dan yang tidak.
Dari data yang ada ia melakukan uji't untuk kelompok tidak
berpasangan pada saat bayi berusia 't,3,6,9, dan 12 bulan.
Contoh II
Seorang dokterparu inginmeneliti apakah obatA lebih baik
daripada obat B untukpengobatanmaintenance asma kronik.
Ia melakukan alokasi random sekelompok pasien asma
.r)
kronik; satu kelompok diberi obat A dan kelompok lainnya

obat B. Sebagai tolok ukur dilakukan pemeriksaan faal paru,
yakni lEV (dalam ml/menit). Agar memperoleh hasil yang
meyakinkan, peneliti melakukan uji faal paru sebelum
penelitian, dan setiap minggu setelah awal terapi sampai L
bulan. Dilakukan uji-t untuk dua kelompok independen
terhadap nilai rerata FEV, pada akhir minggu I,II,III dan IV,
saat penelitian dihentikan.
Komentar
Semangat tinggi peneliti ini tidak diimbangi dengan pemahaman
metodologi dan statistika yang cukup. Pengukuran berulang
terhadap nilai numerik subyek menurut perjalanan waktu dan
membandingkan berulang nilai reratanya di antara 2 kelompok
adalah keliru. Tindakan ini menyalahi salah satu syarat uji numerik,
yakni bahwa pengukuran harus dilakukan kepada kelompok subyek
yang independen. Istilah independen di sini bukan berarti bahwa
kedua kelompok dipilih tidak dengan matching, tetapi berarti nilai
pengukuran subyek pada satu kelompok tidak bergantung pada nilai
subyek kelompok lainnya. Dalam Contoh I, pada perbandingan rerata
berat bayi kedua kelompok pada akhir bulary kedua nilai adalah
independen. Namun pada perbandingan kedua dan seterusnya,
pengukuran pada tiap kelompok tidak lagi independery sebab berat
bayi waktu berumur 3 bulan bergantung pada beratnya waktu 1
bulan, dan waktu L bulan sudah dilakukan uji hipotesis. Untuk data
seperti ini tersedia analisis statistika yakni time-series analysis.
Hal yang sama terjadi pada Contoh II. Pengukuran FEV L minggu
setelah awal pengobatan adalah sahih, karena nilai pada kedua
kelompok adalah independen. Akan tetapi untuk minggu-minggu
berikutnya nilai-nilai rerata pengukuran tidak independen, sebab
bergantung pada nilai sebelumnya, y ang no t a b en e sudah dianalisis.
Secara statistika hal ini sama saja dengan melakukan uji hipotesis
multipel, sehingga harus dihindari.
Selain kesalahan prinsip tersebut, peneliti dapat dihadapkan
pada data yang mungkin membingungkan. Pada Contoh II tidak
tertutup kemungkinan bahwa pada akhir minggu pertama pasien
{;
..1
446 Kesalahan meto dolo gis dalam penelitian
yang diberi obatAmempunyai FEV lebih baik daripada yang diberi

obat B, pada minggu kedua hal sebaliknya terjadi. Pada minggu
ketiga kembali obat A lebih baik, sedangkan pada akhir penelitian
obat B lebih unggul. Faktor peluang serta kemungkinan drop out
memungkinkan hasil tersebut. Bagaimana menyimpulkan hasil
tersebut? Sulit dimengerti bagaimana suatu obat memberi hasil
yang berubah-ubah dengan berubahnya waktu. Untuk mengatasi
masalah ini peneliti dapat memilih salah satu dari dua cara, yakni:
. melakukan analisis dengan teknik tertentu (time-series
analysis) untuk melihat perbandingan secara keseluruhary
atau
. membandingkan rerata berat bayi (pada Contoh L), atau
rerata FEV (Contoh 2) hanya pada akhir penelitian. Penentuan
saat analisis harus dilakukan oleh peneliti, tentunya
bergantung kepada substansi penelitian serta teori yang ada.
L't MesaraH pADA coNyEMENCE IAMaLTNG
Contoh
Dokter Z meneliti kaitan antara kadar HGH(human growth
hormon e) dengan status gizi anak, dengan desain studi cr o s s -
sectional. Awalnya ia sangat bersemangat, setiap hari mencari
pasien dengan gizi kurang atauburuk, kemudian mengukur
kadar HGH-nya. Lama kelamaan ia mulai jemu, datang 2
kali seminggu. Itupun ia memilih pasiennya, yang kira-kira
orangtuanya koperatif. Bulan berikutnya ia pergi kongres
ke Hongkong terus ke Prancis menengok anaknya. Pulang
dari luarnegeri ia kembali mengambil sampel, kali ini dengan
semangat dipaksakan karena waktu penelitian sudah hampir
selesai. Setelah jumlah subyek terpenuhi, ia menganalisis
datanya.
Komentar
Dalam Bab 5 telah ditegaskan bahwa dalam penelitiary sampel harus
dapat mewakili populasinya. Baku emas untuk cara pemilihan
dr
ll
sampel ini adalah probability sampling, dalam hal ini simple random
sampling. Mengapa? Karena semua perhitungan matematika I
statistika didasarkan pada asumsi bahwa subyek dipilih dengan
cara random sampling. Dalam penelitian klinis sering cara tersebut
sulit dilaksanakan, karena jumlah subyek yang terbatas. Untuk
itu tersedia cara consecutiae sampling, yakni semua subyek yang
memenuhi kriteria pemilihan dalam kurun waktu tertentu dipilih
menjadi sampel. Bila waktu penelitian cukup lama, 6 bulan atau 1
tahun, maka pasien yang terpilih dapat mewakili pasien yang
berobat. Namun bila peneliti seringkali pergi dan tidak minta
sejawatnya untuk mengumpulkan data, ia kehilangan banyak
subyek yang seharusnya terpilih. Tidak ada cara untuk menjamin
bahwa karakteristik subyek terpilih yang gagal direkrut sama dengan
subyek yang direkrut. Akibatnya, sampel tidak mewakili populasi
sehingga hasil apa pun yang diperoleh pasti tidak dapat digeneralisasi
ke populasi terjangkau, apa lagi ke populasi yang lebih luas.
12 INTSRPNTTASI YANG KELIRU TENIANG NILAI R
Nilai r (koefisien korelasi linear Pearson antar 2 variabel numerik)

berkisar antara 0 sampai 1. Nilai r ini dalam output program komputer
selalu disertai dengan rulai p yakni besamya kemungkinan bahwa
hasil yang diperoleh semata-mata disebabkan oleh peluang. Tidak
jarang penulis yang mencari hubungan antara 2 variabel numerik
(misalnya lingkar perut dengan kadar kolesterol) memperoleh hasil
r = 0,'1.6 danp = 0,002 menyimpulkannya dengan kalimat "terdapat
korelasi yang sangat bermakna antara lingkar perut dengan kadar
kolesterol". Interpretasi tersebut sangat keliru oleh karena justru
hal sebaliknya yang sebenamya terjadi, yakni: "tidak ada korelasi antara
lingkar perut dengan kadar kolesterol, dan hasil tersebut sangat kecil
kemungkinannya disebabkan semata-mata karena peluang". Jadi
yang harus dilihatlebih dahulu adalah angka klinisnya (r) bukannilai
p-nya. Kita tahu bahwa nilai r yang terbaik adalah 1, r: 0.8 sampai
L berarti sangat baik, dan seterusnya, dan r <0,2 menunjukkan
korelasi yang amat sangat lemah atau bahkan dapat dikatakan tidak
ada korelasi sama sekali.
{t
I
448 Kesalahan meto dolo gis dalam p enelitian
PEnnN AHLI STATISTIKA

Mengingat besamya peluang untuk membuat kesalahan metodologis
dalam studi klinis, adalah bijaksana bila sejak awaf saat penelitian
dirancang, kita melakukan konsultasi dengan ahli statistika yang
biasa mendampingi penelitian klinis, atau klinikus yang mendalami
prinsip-prinsip metodologi dan statistika. Konsultasi awal menjamin
rancangan yang lebih baik dan memperoleh saran ahli statistika.
Pemilihan substansi penelitian klinis memang merupakan hak
klinikus, narnun merumuskan masalah, menl.usun hipotesis, memilih
desairy menghitung besar sampel, memilih uji hipotesis, mengelola
dat4 dan banyak hal berada di luar kemampuan kebanyakan klinikus.
Saran tersebut bukan berarti para klinikus-peneliti menyerahkan
segalanya kepada ahli statistika. Sering terjadi peneliti menyerahkan
onggokan data kepada ahli statistika untuk dianalisis. Praktek tersebut
salah. Ahli statistika bukanlah teknisi yang harus menentukan apa
yang harus dilakukan terhadap onggokan data; ia juga bukan
superman yang menguasai semuahal, termasuk ranah klinis. Dua
hal dapat terjadi; di satu sisi peneliti tidak memahami prosedur
yang digunakan dalam analisis data. Di lain sisi, ahli statistika tidak
dapat dituntut untuk memahami pelbagai masalah klinis. Hasil
akhimya dapat diramal: peneliti, yang harus mempertanggungjawabkan
hasil kerjanya, tidak menjiwai hasil kerjanya. Hal ini nyata pada ujian
tesis para peserta program spesialis; banyak masalah metodologis
yang dipertanyakan tidak dijawab denganbaik. lri sangat disayangkan;
peneliti tidak menikmati proses dan hasil jerih-payahnya sendiri!
Srupurex
Contoh-contoh di atas menunjukkan betapa kesalahan metodologis
dapat terjadi akibat kurangnya pemahaman metodologi dan
biostatistika. Hal tersebut juga menunjukkan bahwa kesalahan
metodologis, baik dalam desairy pemilihan subyek, pengukurary
dan analisis serta interpretasi hasil dapat membawa peneliti kepada
simpulan yang keliru. Dengan kata lain ke.salahan metodologis dapat
..f
membuat upaya panjang penelitian menjadi tidak berarti sama

sekali. Kesalahan dalam analisis masih mungkin dapat dikoreksi,
namun kesalahan dalam desairu pemilihan subyek, dan pengukuran
adalah ireversibel. Pemeo lama GIGO yakni garbage in, garbage out,
masih tetap relevan. Bila data mempunyai keandalan dan kesahihan
yang buruk, maka simpulan penelitian pun menjadi tidak sahih.
Untuk peneliti pemula, desain dan substansi penelitian yang
sederhana, bila dirancang secara cermat dan dilaksanakan dengan
memperhatikan kaidah-kaidah metodologi akan membuahkan
hasil, yang meski sederhana, namun dapat menambah informasi
ilmiah yang akurat. Sebaliknya desain yang rumit dengan banyak
pertanyaan penelitiary meski substansi dan analisisnya canggitr,
tidakberarti sama sekali apabila dilaksanakan secara serampangan.
Penelitian sederhana tentang rerata kadar bilirubin serum neonatus
pada pelbagai masa gestasi yang dikerjakan secara benar lebih
informatif dan bermanfaat ketimbang studi biologi molekular
dengan alat canggikr" atau studi tentang faktor risiko terjadinya bayi
berat lahir rendah dengan model statistika yang rumit, bila dirancang
dan dikerjakan dengan menafikan prinsip penelitian. Menyia-
nyiakan sumber daya baikwaktu, uang keahlian,lebih-lebih subyek
penelitian dengan cara melaksanakan penelitian yang tidak dapat
dibuat kesimpulan definitif, adalah bertentangan dengan etika,
bahkan merupakan dosa.
Dnrrnn PUsTAKA
I Afifi AA, Clark V. Computer-aided multivariate analysis. Edisi ke-2 New
York: VNB, 1986.
2 Andersen B. Methodological errors in medical research. Oxford: Blackwell,
1990.
3 Altman DG. Practical statistics for medical research. London: Chapman and
hall,1991.
4 Altman DG, Machini D, Bryant TN, Gardnet Mj. Statistics with confidence.
Edisi ke-2. London: BMI;2000.
5 Norman G& Streiner DL. PDQ statistics. Toronto:Decker, 1989.
6 Dawson B, Trapp RG. Basic and clinical biostatistics. Edisi ke-3. Boston: Lange
Medical Books/McGraw G Hill, 2001.
il
i
450 Kesalahanmetodologis dalampenelitian -
T, Elwood fM. Critical appraisal of epidemioologicalstudies and clinical trials.

Edisi ke-2. Oxford: Oxford University Press, 1998.
8. Hulley SB, Cummings S& Browner WS, Grady D, Hearst N, Newman TB,
penyunting. Designing clinical research - an epidemiologic approach. Edisi
ke-2. philadelpia: wilkins, 2001.
a{t . . at
Sudigdo Ssstroqsmoro 451
Dolom jurnol ilmioh sering ditemukon kesolohon; sebogion

besor berupo kesolohon'minor', nomun sebogion loinnyc
merupokon kesolohon metodologis yong berdompok longsung
terhodop hosil penelition.
Kesolohon metodologis yong terjodi dopot dolom desoin,
dolom pelaksonoon, dolam onolisis hosil, moupun dolom
menorik simpulan.
Kesalohon metodolog is yang sering dij umpoi odoloh pami I ihon

uji hipotesis yong tidok tepot.
Fokto tersebut menghoruskon kito untuk melokukon telooh
kritis terhodop semuo mokoloh yang diferbitkon oleh jurnol
mano Pun.
Untuk menghindorkon kesqlohon tersebut peneliti horus

berkonsultosi dengon ohli metodologi / stotistika yong horus
dimulai sejak peranconoon penelition.S Dolom jurnol ilmioh
sering ditemukon kesolohon; sebogion besor berupo
kesolohon'minor', namun sebagion loinnyo merupokon
kesalohon metodologis yong berdompok longsung terhodop
hasil penelition.
Kesolahon metodologis yang terjodi dopot dolam desoin,

dolom peloksanoon, dolom onolisis hosil, moupun dolom
menorik simpulon.
Fokta fersebut menghoruskon kito untuk melokukon teloah

kritis tarhodop semuo mokoloh yong diterbitkon oleh jurnol
mono Pun.
#r
ttl

Bab 21. Kesalahan Metodologis Dalam Penelitian Kedokteran

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab 21. Kesalahan Metodologis Dalam Penelitian Kedokteran

Diunggah oleh

Hak Cipta:

Format Tersedia

Bab 2L - Kesaliahan metodologis

dalam penelitian kedokteran

alam publikasi kedokteran, termasuk yang diterbitkan

1 UI x'TINTUK DATA BERPASANGAN

Ingin diufi efektivitas obat A untuk mengurangi asma

Tobel 2l-1. Jumloh posien yong mengolomi osmq nokturnol

x2 =2,4O; df=l; p=0,121

Sebelum Setelqh lsikon

TABEL 2l-3. Jumloh posien ydng mengqlomi qsmd noklurnql

AN+ AN. Jumloh

2 Utl-T INDEPENDEN DAN I.III-T BERPASANGAN

3 Up-r DAN ANALrsrs vARTANS

kelompok B dan C (p = 0,096). Disimpulkan oleh peneliti

Tobel 214. Rerqto lekonon dqroh 3 kelompok posien obes

Reroto tekonon doroh diostolik posien obes (mmHg)

Tidok beroloh rogo Angkot beror Aerobik

94,5 (SD 9,21 87,3 (SD 9,71 85,8 (SD I 1,2)

4 KnrvrarNaaN KLIMS DAN KEMAKNAAN srAnsrIKA

Karakteristik klinis dan laboratoris kedua kelompok sebelum

Dua contoh tersebut menunjuk perlunya pemahaman konsep

5 KorEnasr ANIAR 2 pENcurunaN vARTABEL

dilakukan secara berpasangan pada banyak subyek, maka dapat

Namun, uji klinis dapat pula dipakai untuk menyelidiki bahwa di

7 Hporssrs A pRroRr vs HrporEsrs posr rroc

Contoh terkenal adalah laporan yang menunjukkan hubungan

I Hpomsrsr BryARTAT MUrrrpEL

9 UJI oIaCNOSTIK DENGAN PENGAMATAN TIDAK

yaitu denyut jantung, warna kulit, dan usaha napas. Sebagai

10 PENculeN VARIABEL NUMERIK BERULANG

kronik; satu kelompok diberi obat A dan kelompok lainnya

yang diberi obatAmempunyai FEV lebih baik daripada yang diberi

L't MesaraH pADA coNyEMENCE IAMaLTNG

12 INTSRPNTTASI YANG KELIRU TENIANG NILAI R

Nilai r (koefisien korelasi linear Pearson antar 2 variabel numerik)

PEnnN AHLI STATISTIKA

membuat upaya panjang penelitian menjadi tidak berarti sama

T, Elwood fM. Critical appraisal of epidemioologicalstudies and clinical trials.

Dolom jurnol ilmioh sering ditemukon kesolohon; sebogion

Kesalohon metodolog is yang sering dij umpoi odoloh pami I ihon

Untuk menghindorkon kesqlohon tersebut peneliti horus

Kesolahon metodologis yang terjodi dopot dolam desoin,

Fokta fersebut menghoruskon kito untuk melokukon teloah

Anda mungkin juga menyukai