PENELUSURAN ARTIKEL
PENGANTAR
Dalam langkah dibuat kerangka kerja untuk menggunakan literatur medis guna
memecahkan persoalan penderita dan memberikan pelayanan klinis yang lebih baik (4).
Langkah kedua akan membahas bagaimana cara menggunakan artikel yang berkaitan
dengan terapi atau pencegahan dan akan menggunakan istilah terapi dalam arti yang luas
(5) sehingga penuntun yang sama dapat digunakan untuk mengevaluasi intervensi
terapetik (yang ditujukan untuk mengurangi gejala dan menyembuhkan penyakit) dan
intervensi preventif atau pencegahan (ditujukan untuk mengurangi risiko penyakit atau
komplikasi penyakit).
KERANGKA KERJA
Seperti juga pada pertanyaan klinis lainnya, kita dapat menanyakan tiga pertanyaan
terhadap artikel terapi.
Apa hasilnya?
Bila hasilnya valid dan penelitian yang dinilai tampaknya menghasilkan perkiraan
efek terapi tanpa bias, maka penelitian tersebut layak diperiksa lebih jauh. Pertanyaan
kedua ini memperkirakan besar efek terapi dan presisinya. Estimasi terbaik dari efek
terapi adalah temuan penelitian tersebut; presisi akan semakin baik dengan semakin
besarnya sampel penelitian.
Pendekatan yang kami gunakan dalam menilai dan menggunakan artikel yang
membahas efektivitas terapi kami tampilkan dalam tabel 1. Baik konsultan maupun
praktisi medis memerlukan pendekatan yang efisien dan komprehensif. Kami
memberikan label primer pada beberapa kriteria validitas yang dapat digunakan oleh
pembaca dalam waktu yang terbatas; dan label sekunder pada kriteria lainya, yang
walaupun penting dapat digunakan hanya untuk artikel-artikel yang lolos dari petunjuk
awal dan ditujukan untuk digunakan para pembaca yang membutuhkan review yang
mendalam dan punya waktu cukup untuk melaksanakannya.
Tabel 1. Petunjuk penggunaan untuk artikel tentang terapi
I.
II
.
Apa hasilnya?
- Berapa besar efek terapi?
- Bagaimana presisi estimasi efek terapi?
II
prosedur memiliki luaran yang lebih baik. Setelah dilakukan uji acak terkendali dalam
skala besar dimana dilakukan randomisasi untuk perlakuan tersebut di atas ternyata
hasilnya menunjukkan bahwa pasien-pasien yang menjalani prosedur bypass
ekstrakranial-intrakranial tersebut menjadi lebih buruk keadaannya dalam periode pasca
operasi sementara luaran jangka panjang tidak berubah(6). Uji acak terkendali
menghasilkan beberapa kesimpulan mengejutkan yang berlawanan dengan hasil uji
sebelumnya. Termasuk di antaranya adalah hasil yang menunjukkan bahwa pemberian
steroid dapat meningkatkan (dan bukan menurunkan) kematian pada penderita sepsis(7),
bahwa penyuntikan steroid tidak mengurangi nyeri punggung sendi-faset (8), dan bahwa
plasmaferesis tidak memberikan hasil yang menguntungkan bagi penderita polimiositis
(9). Kejutan-kejutan seperti ini dapat terjadi bila penempatan pasien ke dalam kelompok
terapi ditentukan secara acak dan bukan berdasar keputusan dari klinisi atau pasien.
Singkatnya, luaran klinis merupakan hasil dari berbagai penyebab, dimana terapi hanya
merupakan salah satu diantaranya. Tingkat keparahan penyakit yang mendasari, adanya
kondisi komorbid dan banyak lagi faktor prognosis lainnya (baik yang diketahui maupun
tidak diketahui) sering mempengaruhi efek terapi. Karena kondisi-kondisi lain yang
disebut di atas juga mempengaruhi klinisi pada saat memutuskan terapi yang akan
diberikan, penelitian tentang efkasi tanpa randomisasi memiliki kemampuan terbatas
untuk membedakan terapi yang berguna dan tidak berguna, bahkan terapi yang
sebenarnya membahayakan. Penelitian-penelitian dimana terapi dialokasikan tanpa
randomisasi cenderung menunjukkan efek terapi yang lebih besar (dan sering positif
palsu) bila dibandingkan dengan uji acak terkendali (10) (11) (12) (13). Keindahan
randomisasi adalah karena dapat menjamin bahwa determinan luaran yang diketahui
maupun yang tidak diketahui terdistribusi secara merata antara kelompok terapi dan
kelompok kontrol, terutama bila jumlah sampel cukup besar.
Apa yang harus dilakukan klinisi bila tidak tersedia uji acak untuk menjawab
pertanyaan klinis yang diajukannya? Untuk membuat keputusan klinis sang klinisi
terpaksa tergantung kepada hasil penelitian yang lebih lemah rancangannya. Pada bagian
lain tulisan ini dimana dibahas tentang cara menentukan apakah suatu terapi atau paparan
menyebabkan harm (suatu keadaan dimana randomisasi biasanya tidak mungkin
dilakukan) kami akan menunjukkan bagaimana cara menilai rancangan penelitian yang
lebih lemah. Untuk saat ini anda hanya perlu mengingat bahwa penelitian tanpa
randomisasi menghasilkan bukti yang lebih lemah bila dibandingkan dengan uji dengan
randomisasi.
2. Apakah semua pasien yang dimasukkan ke dalam penelitian dipertimbangkan
dan disertakan dalam pembuatan kesimpulan?
a. Apakah follow-up lengkap?
Setiap pasien yang dimasukkan ke dalam penelitian harus diperhitungkan pada
kesimpulannya. Bila hal ini gagal dilakukan, atau apabila sejumlah besar pasien
dilaporkan sebagai lost to follow up, maka validitas penelitian dapat dipertanyakan.
Semakin banyak jumlah subyek yang hilang, semakin besar kemungkinan terjadinya bias
karena pasien yang drop out seringkali memiliki prognosis yang berbeda dengan pasien
yang bertahan dalam penelitian. Selain itu alasan drop out mungkin adalah terjadinya
efek samping (mungkin kematian) atau karena pasien sudah sembuh (sehingga tidak
kembali untuk diperiksa).
Pembaca dapat menentukan sendiri apakah jumlah lost to follow up terlalu banyak
dengan cara membuat asumsi sebagai berikut: dalam uji positif diasumsikan bahwa
pasien yang lost to follow up dari kelompok terapi mengalami kegagalan dan pasien lost
dari kelompok kontrol mengalami kesembuhan, kemudian luaran diperhitungkan
berdasarkan asumsi ini. Bila kesimpulan penelitian tidak berubah maka jumlah lost to
follow up tidak berlebihan. Bila kesimpulan berubah maka kekuatan inferensi akan
berkurang (artinya, kepercayaan terhadap hasil penelitian ini akan berkurang).
Berkurangnya inferensi akan tergantung kepada berapa besar kemungkinan pasien lost to
follow up dari kelompok terapi untuk mendapat hasil yang buruk dan berapa besar
kemungkinan pasien lost to follow up dari kelompok kontrol untuk sembuh.
b. Apakah pasien dianalisis pada kelompok randomisasi semula?
Seperti umumnya pasien dalam praktek sehari-hari, pasien uji acak terkendali juga
kadang-kadang lupa minum obat atau sama sekali menolak minum obat. Para
pembaca mungkin berpikir bahwa pasien yang menolak minum obat sehingga tidak
mendapatkan terapi yang seharusnya dapat disingkirkan dari analisis. Tidak
seharusnya begitu.
Alasan mengapa seseorang tidak minum obat seringkali berhubungan dengan
prognosis. Pada beberapa uji acak terkendali didapatkan bahwa pasien yang tidak minum
obat akan mendapat hasil yang lebih buruk dibandingkan subyek-subyek yang minum
obat sesuai instruksi, bahkan setelah mempertimbangkan semua faktor prognosis yang
diketahui, dan bahkan bila obat yang diberikan adalah plasebo! (14) (15) (16) (17) (18)
(19) Mengeksklusi pasien-pasien dengan kepatuhan rendah akan menyisakan pasien
dengan kemungkinan memberikan hasil yang lebih baik dan merusak perbandingan tanpa
bias yang diberikan oleh randomisasi.
Keadaan yang sama didapatkan pada penelitian terapi bedah. Beberapa pasien
yang dirandomisasi ke dalam kelompok perlakuan tidak mendapatkan tindakan karena
mereka terlalu lemah atau sudah menderita luaran yang diamati (seperti stroke atau infark
miokard) sebelum mereka sampai ke ruang operasi. Bila peneliti menyertakan pasienpasien yang pasti akan mengalami luaran buruk seperti ini ke dalam kelompok kontrol,
bahkan pembedahan yang tidak bergunapun akan tampak efektif. Efektivitas yang
tampaknya disebabkan oleh tindakan bedah sebenarnya disebabkan karena eksklusi
sistematik pasien-pasien dengan prognosis buruk dari kelompok perlakuan.
Intention to treat analysis yang artinya adalah menganalisis pasien di dalam
kelompok randomisasi semula telah ditunjukkan pada contoh di atas. Strategi ini
mempertahankan nilai randomisasi, yaitu membagi faktor prognosis yang diketahui
maupun yang tidak diketahui sama rata antara kedua kelompok sehingga efek yang
dinilai adalah benar-benar efek terapi yang diberikan.
B. PETUNJUK SEKUNDER
1. Apakah pasien, klinisi dan staf peneliti dibutakan terhadap terapi?
Pasien yang mengetahui bahwa mereka sedang menjalani terapi yang baru dan
bersifat eksperimen sangat mungkin untuk mempunyai pendapat sendiri tentang efikasi
terapi tersebut, seperti juga para klinisi dan staf peneliti yang lain yang bertugas
mengukur efek terapi. Pendapat atau opini tersebut dapat bersifat pesimistik maupun
optimistik dan dapat secara sistematik menyebabkan distorsi mengenai aspek-aspek
terapi dan pelaporan luaran terapi. Hal ini tentu saja dapat mengurangi kepercayaan kita
terhadap hasil penelitian. Selain itu, staf peneliti yang tidak dibutakan terhadap terapi dan
bertugas mengukur luaran mungkin memberikan interpretasi yang berbeda terhadap
temuan-temuan marginal, atau memberikan dorongan yang berbeda pada tiap kelompok
selama melakukan pengukuran. Kedua tindakan ini dapat mempengaruhi hasil (20).
Cara terbaik untuk menghindarkan bias ini adalah dengan menggunakan cara doubleblind (buta ganda) yang kadang-kadang disebut juga double masking. Cara ini dilakukan
dengan memberikan plasebo kepada kelompok kontrol. Plasebo tersebut serupa dengan
obat yang diberikan, baik dalam rasa, rupa dan tekstur, tetapi tidak mengandung bahan
aktif. Dalam penelitian tentang tindakan bedah dimana pasien dan klinisi tidak dapat
dibutakan terhadap tindakan maka bias dapat diperkecil dengan membutakan peneliti
yang bertugas menilai luaran.
3. Apakah kedua kelompok sama pada awal penelitian?
Untuk meyakinkan tentang validitas penelitian, pembaca tentu ingin peneliti
menunjukkan bahwa kelompok perlakuan dan kelompok kontrol sama dalam segala
faktor yang menentukan luaran kecuali satu hal: terapi. Peneliti menunjukkan hal ini
dengan menampilkan karakteristik dasar yang merupakan gambaran faktor prognosis
kedua kelompok. Meskipun kita tidak tahu apakah faktor prognosis yang tidak diketahui
juga seimbang antara kedua kelompok, kita akan merasa yakin bila faktor yang diketahui
sudah seimbang. Randomisasi tidak selalu menjanjikan terbentuknya dua kelompok yang
seimbang. Bila kelompok tersebut kecil, mungkin terjadi ketidak seimbangan dimana
pasien-pasien dengan prognosis lebih baik terkumpul dalam satu kelompok. Bersama
dengan bertambah banyaknya jumlah pasien, kemungkinan seperti ini akan semakin
jarang terjadi (seperti juga dengan lemparan koin, kita tidak akan heran bila terdapat
tujuh kepala pada sepuluh kali lemparan koin; tetapi bila terdapat tujuh puluh kali
kepala dari seratus kali lemparan, maka hasil tersebut sangat mengejutkan).
Masalahnya disini bukan apakah terdapat perbedaan yang bermakna secara statistik
antara faktor prognosis yang diketahui pada kedua kelompok (pada uji acak kita sudah
mengetahui sejak semula bahwa perbedaan yang ada terjadi karena faktor kebetulan),
tetapi lebih kepada berapa besar perbedaan tersebut. Bila perbedaan tersebut cukup besar
maka validitas penelitian dapat terganggu. Semakin besar hubungan faktor prognosis
dengan luaran, semakin kecil kelompok penelitian, lebih besar kemungkinan bahwa
perbedaan antara kedua kelompok tersebut akan mengurangi kekuatan inferensi tentang
efikasi.
Ketidak samaan kedua kelompok pada awal penelitian tidak mesti merusak segalanya.
Tersedia teknik statistik untuk adjustment terhadap perbedaan karakteristik dasar.
Bersamaan dengan itu, pembaca sebaiknya mencari gambaran persamaan karakteristik
dasar, dan bila terdapat perbedaan yang berarti maka harus dipastikan bahwa para peneliti
melakukan analisis untuk adjustment perbedaan tersebut. Bila analisis adjusted dan
unadjusted mencapai kesimpulan yang sama, pembaca boleh yakin bahwa hasil
penelitian tersebut valid.
mengurangi risiko stroke karena emboli) dapat melebihi risiko yang ditimbulkannya
(perdarahan karena antikoagulan). Pasien tersebut juga memiliki kekhawatiran yang sama
dan tidak menginginkan terapi yang lebih besar bahaya daripada manfaatnya. Anda
mengetahui bahwa ada beberapa uji acak terkendali yang meneliti manfaat warfarin pada
penderita atrial fibrilasi non-valvular dan memutuskan untuk membaca salah satu
diantaranya.
Penelusuran Artikel
Artikel ideal mengenai masalah ini haruslah menyertakan pasien dengan atrial
fibrilasi non-valvular, membandingkan warfarin dengan terapi kontrol (idealnya dengan
plasebo) untuk mengatasi risiko emboli (termasuk stroke emboli) dan juga risiko
komplikasi pemberian antikoagulan. Bukti yang kuat akan didapatkan dari uji acak
terkendali.
Melalui software program Grateful Med anda memilih Medical subject heading
(MeSH) yang mengidentifikasi populasi yang anda inginkan, atrial fibrillation, satu
lagi yang menunjukkan intervensi, warfarin, dan yang menunjukkan luaran yang
dikehendaki, stroke (yang secara otomatis diubah menjadi explode cerebrovascular
disorders oleh software, yang artinya semua artikel yang dimasukkan dibawah indeks
cerebrovascular disorders atau subheadingnya adalah target potensial penelusuran anda),
sambil membatasi penelusuran hanya pada artikel-artikel berbahasa Inggris. Untuk
memastikan bahwa anda hanya memilih artikel dengan kualitas tinggi anda menyertakan
terminologi metodologi randomized controlled trial (PT) (PT berarti Publication Type).
Penelusuran menghasilkan semnbilan artikel. Tiga merupakan editorial atau komentar,
satu membahas prognosis, dan satu lagi mengenai quality of life pemakai antikoagulan.
Anda memutuskan untuk membaca artikel uji acak terkencali yang paling baru dari empat
artikel yang anda temukan (21).
Setelah anda membaca penelitian tersebut, anda memutuskan bahwa artikel tersebut
memenuhi kriteria validitas yang telah anda pelajari melalui artikel pertama dalam tulisan
ini (22). Untuk menjawab kekhawatiran pasien anda dan dokter yang merujuknya, anda
harus menelusur lebih dalam kepada hubungan antara keuntungan dan risiko efek
samping.
1. Berapa besar efek terapi?
Sebagain besar uji acak terkendali memonitor berapa sering penderita mengalami
suatu efek samping atau luaran. Contoh dari luaran dikotomus (ya atau tidak untuk
luaran yang terjadi atau tidak) adalah rekurensi kanker, infark miokard, dan kematian.
Pasien mengalami atau tidak mengalami suatu event, dan artikel melaporkan proporsi
pasien yang mengalami event tersebut; sebagai contoh, sebuah penelitian dimana 20%
(0,20) dari kelompok kontrol meninggal, sementara hanya 15% (0,15) dari kelompok
yang menerima terapi baru yang meninggal. Bagaimana cara menampilkan hasil ini?
Tabel 2 menunjukkan cara untuk menyimpulkan hasil terapi.
Salah satunya adalah beda absolut antara proporsi yang meninggal dari kelompok
kontrol (X) dan proporsi yang meninggal dari kelompok terapi (Y), atau X-Y=0,200,15=0,05. Cara lain untuk menunjukkan dampak terapi adalah sebagai risiko relatif
(relative risk): risiko terjadinya event pada pasien yang menerima terapi baru dibanding
risiko event pada kontrol, atau Y/X=0,15/0,20=0,75.
Ukuran dikotomus efek terapi yang paling sering dipakai adalah pasangan dari
risiko relatif yang disebut sebagai relative risk reduction (RRR). Dinyatakan dalam
persen: (1-Y/X)x100%=[1-0,75]x100=25%. RRR sebesar 25% berarti bahwa terapi yang
baru mengurangi risiko kematian sebesar 25% dibandingkan kematian yang terjadi pada
kelompok kontrol. Semakin besar RRR, semakin efektif suatu terapi.
2. Bagaimana presisi estimasi efek terapi?
Pengurangan risiko yang sebenarnya tidaklah dapat diketahui, dan taksiran atau
estimasi dari efek terapi yang sesungguhnya adalah yang didapati dari uji klinik. Estimasi
ini disebut point estimate untuk mengingatkan kita bahwa meskipun nilai yang
sesungguhnya berada di sekitarnya, estimasi ini tidak mesti tepat. Para peneliti
menunjukkan rentang nilai dimana efek yang sesungguhnya berada melalui perhitungan
yang secara statistik disebut sebagai interval kepercayaan (23).
Kita biasanya menggunakan interval kepercayaan 95% yang secara sederhana dapat
didefinisikan sebagai rentang nilai dimana terdapat kemungkinan 95% didapati nilai
risiko relatif yang sesungguhnya berada di dalam rentang nilai tersebut. Anda akan sangat
jarang menemukan nilai RRR yang sesungguhnya berada di luar dari rentang nilai ini;
hanya kira-kira 5% saja kemungkinannya. Interval kepercayaan ini berkaitan dengan
ukuran konvensional kemaknaan statistik p<0,05. Kami akan memberikan contoh
penggunaan interval kepercayaan dalam contoh-contoh berikut.
Bila suatu uji klinik merandomisasi 100 pasien ke dalam masing-masing kelompok
terapi dan kontrol, kemudian terdapat 20 kematian pada kelompok kontrol dan 15
kematian pada kelompok terapi, penulisnya akan menghitung estimasi titik (point
estimate) untuk RRR 25% (X=20/100 atau 0,20, Y=1/100 atau 0,15 dan 1-Y/X = (10,75)x100=25%). Anda akan menduga bahwa RRR yang sebenarnya bisa lebih kecil atau
lebih besar dari 25%, berdasarkan selisih jumlah kematian yang hanya lima. Bahkan anda
dapat beranggapan bahwa terapi ini mungkin tidak berguna (RRR sebesar 0%) atau
malah berbahaya (RRR dengan nilai negatif). Anda mungkin benar, karena hasil dari
penelitian ini konsisten dengan RR sebesar 38% (pasien yang mendapat terapi yang baru
kemungkinan 38% lebih besar untuk meninggal dibanding kontrol) sampai RRR sebesar
59% (pasien yang mendapat terapi baru kemungkinan meninggal 60% lebih kecil
dibanding yang tidak mendapat terapi atau kontrol). Dengan kata lain, IK 95% dari RRR
pada penelitian ini adalah 38% sampai 59%, dan uji klinis ini tidak benar-benar
membantu kita untuk memutuskan untuk menyarankan terapi yang baru. Jenis penelitian
apa yang dapat lebih membantu?
Bagaimana bila penelitian ini menyertakan bukan 100 tapi 1000 pasien pada tiap
kelompok, dan mendapatkan angka event yang sama seperti sebelumnya: 200 kematian
pada kelompok kontrol (X=200/1000=0,20) dan 150 kematian pada kelompok terapi
(Y=150/1000=0,15). Sekali lagi, point estimate RRR adalah 25% (1-Y/X=1[0,15/0,20]x100=25%). Pada uji yang lebih besar ini anda mungkin menduga bahwa
reduksi yang sebenarnya akan lebih mendekati nilai 25%. Anda sekali lagi benar, karena
IK 95% dari RRR penelitian ini seluruhnya ada di sisi positif dari titik nol yaitu 9%
sampai 41%.
Yang ditunjukkan oleh contoh-contoh di atas adalah bahwa semakin besar jumlah
sampel suatu uji klinis, semakin besar jumlah event luaran, dan semakin besar keyakinan
kita bahwa nilai RRR yang sebenarnya (atau ukuran efikasi lainnya) dekat dengan yang
kita amati dari penelitian. Pada contoh kedua di atas, nilai RRR yang paling kecil adalah
9% dan paling tinggi adalah 41%. Point estimate dalam kasus ini sebesar 25%- adalah
nilai yang paling mendekati nilai RRR yang sebenarnya. Semakin jauh dari nilai tersebut,
semakin tidak konsisten dengan RRR yang diamati. Begitu kita melewati batas atas dan
bawah dari IK 95%, nilai tersebut akan semakin kecil kemungkinannya untuk
menunjukkan RRR yang sebenarnya.
10
pasien dapat berjalan dalam rentang waktu enam menit di dalam sebuah koridor tertutup
(25). Kemampuan berjalan dalam waktu 6 menit ini bertambah baik dari rata-rata 406
meter menjadi 416 meter (bertambah 10 meter) pada kelompok perlakuan yang mendapat
pelatihan otot pernapasan, dan dari 409 menjadi 429 meter (bertambah 20 meter) pada
kelompok kontrol. Point estimate untuk perbaikan kemampuan berjalan enam menit yang
disebabkan pelatihan otot pernapasan menunjukkan hasil negatif yaitu -10 meter (atau
perbedaan 10 meter lebih baik pada kelompok kontrol).
Pada kasus ini, anda harus melihat IK 95% disekitar perbedaan perubahan
kapasitas latihan dan memikirkan implikasinya. Para peneliti menyatakan bahwa batas
bawah dari IK 95% adalah 26 (angka ini berarti terdapat selisih 26 meter lebih banyak
ke arah kontrol) dan batas atasnya adalah +5 meter. Bahkan pada keadaan yang paling
baik, menambahkan 5 meter pada 400 meter yang tercatat pada awal penelitian tidaklah
penting bagi pasien, dan hasil ini secara efektif menyingkirkan hipotesis bahwa latihan
otot pernapasan akan bermanfaat secara klinis.
Setelah memutuskan besar efek terapi dan presisinya, pembaca dapat meneruskan
ke pertanyaan terakhir tentang bagaimana menerapkan hasil penelitian ini kepada pasien
dan praktek klinis.
III. APAKAH HASIL INI AKAN MEMBANTU SAYA MERAWAT PASIEN?
1. Apakah hasil ini dapat diterapkan untuk pasien saya?
Hal pertama yang perlu dipertimbangkan adalah seberapa yakinkah anda bahwa anda
dapat menerapkan hasil ini kepada seorang pasien tertentu atau kepada pasien-pasien
dalam praktek anda sehari-hari. Bila pasien tersebut mungkin masuk kedalam penelitian
tersebut seandainya ia berada di tempat penelitian dikerjakan artinya, pasien anda
memenuhi kriteria inklusi dan tidak melanggar salah satu kriteria eksklusi- maka kecil
sekali kemungkinan bahwa hasil penelitian ini tidak dapat diterapkan kepada pasien
tersebut. Bila tidak, dan pasien tersebut kemungkinan tidak akan masuk ke dalam
penelitian, maka diperlukan penilaian tertentu. Hasil penelitian tersebut mungkin dapat
diterapkan, bahkan bila pasien itu 2 tahun lebih tua dari batas usia subyek penelitian,
terkena penyakit yang lebih berat, sebelumnya pernah diobati dengan terapi pembanding,
atau memiliki kondisi premorbid. Pendekatan yang lebih baik dari menerapkan secara
kaku kriteria inklusi dan eksklusi pada pasien kita adalah dengan menanyakan apakah ada
alasan kuat mengapa hasil tersebut tidak dapat diterapkan pada pasien kita. Alasan kuat
seringkali tidak ditemukan, dan lebih sering anda dapat menerapkan hasil pada pasien
anda dengan rasa yakin.
Masalah terakhir muncul bila pasien anda memenuhi kriteria suatu subgroup dari
laporan penelitian tersebut. Pada artikel-artikel yang melaporkan hasil uji klinis
(khususnya bila terapi yang diteliti tampaknya tidak bermanfaat bagi pasien pada
umumnya) para peneliti sering memeriksa sejumlah besar subgroup pasien dalam
berbagai tingkatan penyakit, dengan berbagai kondisi premorbid, dalam berbagai usia
pada saat memasuki penelitian, dan lain sebagainya. Seringkali analisis subgroup ini
tidak direncanakan dari awal penelitian, dan data yang ada hanya digali untuk melihat
apakah ada hasil yang menarik akan keluar. Para peneliti kadang-kadang melakukan
over-interpretasi atas analisis yang berasal dari data seperti ini, dan menyatakan bahwa
11
terapi tersebut menunjukkan efek yang berbeda pada suatu subgroup pasien yang lebih
tua atau yang lebih parah, misalnya- sering dinyatakan sebagai mendapat keuntungan
yang lebih atau kurang, dibandingkan pasien lain dalam uji klinis tersebut. Anda dapat
menemukan panduan untuk menentukan apakah analisis subgroup seperti ini dapat
dipercaya hasilnya (26), dan kami akan menyimpulkannya disini: terapi mungkin benarbenar lebih atau kurang menguntungkan untuk subgroup tertentu apabila perbedaan
dalam efek terapi cukup besar, bukan terjadi karena kebetulan, dihasilkan dari analisis
yang disebutkan sejak awal dalam hipotesis penelitian, merupakan salah satu dari sedikit
sekali analisis yang dilakukan, dan direplikasi oleh penelitian lain. Bila analisis subgroup
tadi gagal memenuhi kriteria di atas, para klinisi harus lebih skeptis untuk menerapkan
hasil penelitian tadi kepada pasien.
2. Apakah semua luaran yang penting sudah dipertimbangkan?
Terapi merupakan indikasi bila menghasilkan luaran yang penting. Bila suatu
bronkodilator ditunjukkan menyebabkan kenaikan forced expired volume dalam jumlah
kecil pada penderita penyakit paru obstruktif kronis, bahwa suatu vasodilator
memperbaiki curah jantung pada penderita gagal jantung, atau suatu senyawa penurun
kadar lemak memperbaiki profil lemak, bukan berarti memberikan bukti bahwa sudah
terdapat cukup alasan untuk memberikan terapi ini kepada pasien. Yang diperlukan
adalah bukti bahwa terapi tersebut memperbaiki luaran yang penting bagi pasien, seperti
mengurangi sesak napas selama melakukan aktivitas penting sehari-hari, menghindarkan
rawat inap karena gagal jantung, atau menurunkan risiko infark miokard. Kita dapat
menggunakan forced expired volume dalam satu detik, curah jantung, dan profil lemak
sebagai substitute endpoints. Artinya, para peneliti menggunakan ukuran fisiologis ini
sebagai pengganti ukuran luaran yang penting (sesak napas, rawat inap, atau infark
miokard), biasanya karena untuk menunjukkan keuntungan seperti mengurangi sesak
napas selama melakukan aktivitas penting sehari-hari, menghindarkan rawat inap karena
gagal jantung, atau menurunkan risiko infark miokard para peneliti memerlukan banyak
pasien dan follow up harus dilakukan dalam jangka waktu yang lebih panjang.
Contoh dramatis yang lebih baru untuk menunjukkan bahaya penggunaan substitute
endpoints ditemukan pada penelitian tentang kegunaan obat anti aritmia setelah kejadian
infark miokard. Karena obat jenis ini telah dibuktikan dapat menurunkan depolarisasi
abnormal pada ventrikel (substitute endpoint) dalam jangka pendek, tampaknya masuk
akal bahwa obat tersebut dapat menurunkan kejadian aritmia yang mengancam jiwa
dalam penggunaan jangka panjang. Sekelompok peneliti melakukan uji klinis terhadap
tiga senyawa (encainide, flecainide dan moricizine) yang sebelumnya telah terbukti
efektif untuk mengurangi substitute endpoint berupa depolarisasi abnormal pada
ventrikel untuk melihat apakan ketiga senyawa tersebut bermanfaat menurunkan
kematian pada pasien-pasien dengan aritmia simtomatik atau simtomatik ringan setelah
infark miokard. Para peneliti harus menghentikan uji klinis ini ketika mereka mendapati
bahwa mortalitas lebih tinggi pada kelompok pasien yang menerima pengobatan
antiaritmia dibandingkan kelompok yang mendapat plasebo (27) (28). Klinisi yang hanya
berpegang kepada substitute endpoint mungkin akan meneruskan ketiga obat tersebut
dengan menghadapkan pasien kepada bahaya yang lebih besar.
Walaupun peneliti melaporkan efek yang menguntungkan pada satu jenis luaran yang
penting secara klinis, para klinisi harus menyikapi dengan lebih teliti untuk melihat
12
apakah tidak ada efek lain yang merugikan selain luaran tersebut. Sebagai contoh, ketika
tulisan ini sedang dalam masa persiapan terdapat kontroversi mengenai apakah
menurunkan kadar lipid secara mendadak menaikkan angka kematian yang dikarenakan
oleh penyakit non-kardiovaskular (29). Kemoterapi kanker mungkin memperpanjang
hidup tetapi menurunkan kualitasnya. Akhirnya, uji klinis mengenai tindakan bedah
sering menunjukkan perpanjangan hidup pada penderita yang selamat melewati
pembedahan (menghasilkan angka survival 3 tahun yang lebih tinggi pada pasien yang
menjalani pembedahan), tetapi terdapat risiko kematian jangka pendek selama atau
segera setelah pembedahan. Pengguna laporan uji klinis pembedahan harus mencari
informasi mengenai kematian segera setelah tindakan (yang biasanya lebih tinggi pada
kelompok yang menjalani pembedahan) selain hasil jangka panjang.
3. Apakah manfaat terapi tersebut melebihi harm dan biayanya?
Bila hasil suatu penelitian terbukti penting dan dapat digeneralisasikan kepada pasien
anda, pertanyaan berikutnya adalah apakah manfaat terapi tersebut dapat melebihi usaha
yang anda dan pasien anda lakukan untuk mendapatkannya. Suatu penurunan risiko
kematian sebesar 25% mungkin kedengaran mengesankan, tetapi dampaknya pada
praktek anda mungkin sangat minimal. Hal ini dinyatakan dengan sebuah konsep yang
disebut number needed to treat (NNT) (30).
Dampak terapi berhubungan bukan saja dengan RRR, tetapi juga risiko terjadinya
luaran yang berusaha dicegah dengan terapi tersebut. Beta blocker menurunkan risiko
kematian pasca infark miokard sebesar kira-kira 25%, dan RRR ini konsisten pada setiap
subgroup, termasuk diantaranya adalah subgroup dengan risiko baseline untuk
terjadinya rekurensi dan kematian yang lebih rendah dan lebih tinggi bila tidak diobati.
Tabel 3 membahas dua pasien pasca infark miokard
Tabel 3. Dua orang pasien dengan prognosis yang berlawanan pasca infark miokard
Bila risiko kematian dalam waktu 1 tahun 1% atau 0,01
10% atau 0,10
tanpa terapi (risiko baseline) adalah X
Dan risiko relatif kematian dengan terapi 75% atau 0,75
75% atau 0,75
(beta blocker) adalah Y/X
Dan relative risk reduction (RRR) adalah
[1-Y/X]x100 atau [(X-Y)/X]x100
25%
25%
Maka risiko kematian dengan terapi 0,01x0,75=0,0075
0,10x0,75=0,075
adalah Y
Dan Absolute Risk Reduction (ARR) 0,010,10-0,075=0,025
adalah X-Y
0,0075=0,0025
Dan NNT untuk mencegah satu kematian 1/0,0025=400
1/0,025=40
adalah: 1/(X-Y)
Selama satu setengah tahun setelah infark, hanya 4 orang dari kelompok pertama
(0,9% per tahun), tetapi 19 orang dari kelompok kedua (4,3% pertahun) menderita infark
serebri. Maka RRR adalah (0,043-0,009)/0,043=79%, dan ARR adalah 0,043-0,09=0,034,
dan jumlah yang harus diberi terapi untuk mencegah satu stroke adalah 1/0,034=29 (atau
kira-kira 30 orang). Bila kita menggunakan batas bawah interval kepercayaan dari RRR
13
untuk memperkirakan batas atas interval kepercayaan untuk NNT (0,52) maka NNT
paling tinggi adalah 45, dan paling rendah adalah sebesar 17 (dengan batas atas IK 95%
RRR sebesar 0,90). Anda mengetahui bahwa warfarin adalah obat yang secara potensial
berbahaya, dan setiap tahunnya kira-kira 10% pasien yang menerima terapi dengan obat
ini akan mengalami perdarahan yang secara klinis penting sebagai akibat terapi (31).
Karena itu akan terdapat satu kasus perdarahan pada setiap 100 pasien, dan apabila
jumlah yang harus diterapi untuk mencegah stroke pada 1 orang adalah sebanyak 30
pasien, maka setiap mencegah 3 stroke kita akan mengalami satu kasus perdarahan berat.
Bila batas bawah interval kepercayaan untuk manfaat antikoagulan oral menunjukkan
keadaan yang sebenarnya, maka NNT adalah 45 dan setiap dua stroke yang berhasil
dicegah terjadi satu kali perdarahan berat. Bila batas atas yang mewakili keadaan yang
sebenarnya maka NNT adalah 26 dan untuk setiap 4 kasus stroke yang berhasil dicegah
akan terjadi satu kasus perdarahan berat. Rasio risk-benefit yang sebenarnya mungkin
terletak di antara kedua nilai tersebut, lebih mendekati point estimate.
Bagaimana dengan wanita penderita nefritis lupus yang disebutkan pada bagian A
dari artikel ini menjadi penyebab penelusuran yang kita lakukan untuk menemukan uji
klinis yang menambahkan plasmaferesis pada terapi prednison dan siklofosfamid? Sangat
disayangkan, walaupun plasmaferesis memang menghasilkan penurunan substitute
endpoints (antibodi anti-ds DNA dan kompleks imun yang mengalami kriopresipitasi), uji
klinis ini tidak dapat menunjukkan manfaat plasmaferesis pada ukuran luaran yang secara
klinis penting, yaitu gagal ginjal dan kematian. Setelah analisis statistik dari data yang
ada menunjukkan hanya sedikit harapan untuk terjadi manfaat klinis, uji klinis ini
kemudian dihentikan.
Simpulan
Setelah membaca bagian pengantar dari seri tulisan ini dan kedua artikel
mengenai terapi, kami mengharapkan bahwa anda telah mempunyai suatu gambaran
tentang bagaimana cara menggunakan artikel medis untuk memecahkan masalah
pengambilan keputusan mengenai terapi. Pertama, definisikan masalahnya dengan jelas,
dan gunakan salah satu dari berbagai strategi penelusuran untuk mendapatkan bukti
terbaik yang tersedia. Setelah menemukan artikel yang relevan dengan isu yang dihadapi,
tentukan nilai kualitas bukti tersebut. Bila kualitas bukti tersebut tidak baik, maka
inferensi selanjutnya (dan keputusan klinis yang mengikutinya) akan menjadi lemah. Bila
kualitas artikel tersebut cukup baik, tentukan batasan dimana kemungkinan efek terapi
yang sesungguhnya berada. Kemudian tentukan sejauh mana hasil ini dapat
digeneralisasikan kepada pasien yang sedang dihadapi, dan apakah luaran yang diukur
oleh penelitian tersebut cukup penting. Bila generalisasinya meragukan, atau kepentingan
luaran penelitian tersebut juga dipertanyakan, rekomendasi yang diberikan juga tidak
akan memiliki daya dukung yang kuat. Akhirnya, dengan mempertimbangkan risiko efek
samping, nilailah kemungkinan hasil intervensi tersebut. Hal ini memerlukan suatu
lembaran pertimbangan rugi-laba dimana kita melihat kemungkinan manfaat yang
diberikan, biaya yang dikeluarkan (termasuk keuangan, isu lainnya seperti kenyamanan)
dan risiko yang mungkin dihadapi. Kesimpulan pertimbangan tersebut akan membantu
anda mengambil keputusan mengenai pemberian terapi.
Meskipun ini tampaknya merupakan cara yang menantang untuk memutuskan
pemberian terapi, sebenarnya hal ini sama saja dengan yang dilakukan klinisis sehari-hari
14
pada saat memberikan pengobatan (32). Membuat proses tersebut menjadi sebuah proses
terbuka dan memiliki kemampuan untuk memakai panduan guna menbantu menilai kuat
tidaknya suatu bukti akan membawa kita kepada cara penanganan pasien yang lebih baik.
Bacaan yang dianjurkan
1. Sackett DL et al. Series of articles on How to read clinical journals in Canadian
Medical Association Joumi (Vol 123) and 1981 (Vol 124).
2. Sackett DL, Haynes RB, Guyatt GH, lugwell P. Clinical epidemiology: a basic science
for clinical medicine. I Little, Brown & Co, 1991.
3. Greenhaigh T. How to read a paper. A series of 10 articles in British Medical Journal
1997; Vol 315.
4. Guyatt GH, Sackett DL, Cook DJ et al. Evidence Based Medicine Working Group.
Users' Guides to the medical Literature. A series of articles in JAMA 1993 1999.
5. Laupacis A et al. An assessment of clinically useful measures of the consequences of
treatment. NEJM 1988;318:1728-1733.
15