Anda di halaman 1dari 17

Jika penyakit yang ditargetkan sangat sering terjadi di komunitas tertentu,

atau jika populasi yang akan diteliti jumlahnya harus besar, melakukan uji
coba di tengah masyarakat mungkin lebih efisien daripada harus
mengeluarkan biaya untuk merekrut banyak subjek.

Pengacakan

RCT dirancang untuk menentukan apakah pengobatan atau intervensi


tertentu efektif. Pengacakan menjamin bahwa peneliti tidak dapat
mempengaruhi hasil dengan menugaskan peserta pada perlakuan yang
menurut peneliti paling menguntungkan mereka. Misalkan sebuah obat
baru dihipotesiskan akan bekerja lebih baik daripada standar perawatan
saat ini. Sangat mudah untuk percaya bahwa dokter yang memberikan
perawatan kepada pasien akan memilih untuk memberikan obat baru
tersebut kepada pasien yang lebih sakit parah untuk mencoba menolong
mereka, baik secara sadar maupun tidak. Meskipun dorongan seperti itu
dapat dimengerti, integritas penelitian akan rusak dengan cepat jika
mayoritas pasien yang paling sakit menerima pengobatan baru dan
mayoritas pasien yang lebih sehat menerima pengobatan lama. Dalam
kasus ini, efek pengobatan kemungkinan akan dianggap remeh, tetapi
ada juga banyak kasus di mana efek pengobatan dapat dianggap terlalu
tinggi.

Selain mencegah terjadinya pengaruh peneliti, pengacakan membantu


peneliti untuk mendapatkan kelompok yang dapat ditukar pada awal
penelitian (Hernán dan Robins, 2006). Dalam setiap penelitian, akan ada
banyak faktor prognostik dari tingkat partisipan, seperti usia atau status
kesehatan secara keseluruhan, yang mempengaruhi hasil yang
diinginkan. Sebagai contoh, pertimbangkan bagaimana usia dan status
kesehatan dapat mempengaruhi risiko kematian. Ketika kedua kelompok
dapat dipertukarkan, artinya kita mengharapkan hasil yang sama dari
suatu perlakuan tertentu, tidak peduli kelompok mana yang menerima
perlakuan tersebut. Sebagai contoh, pertimbangkan dua perlakuan, A
dan B, yang diberikan secara acak kepada dua kelompok, Kelompok X
dan Kelompok Y. Jika Kelompok X dan Y dapat dipertukarkan, maka kita
berharap bahwa jika Kelompok X menerima perlakuan A dan Kelompok Y
menerima perlakuan B, maka efek perlakuan akan sama seperti jika
Kelompok X menerima perlakuan B dan Kelompok Y menerima
perlakuan A.
Pada RCT yang lebih besar, pengacakan pada dasarnya menjamin
bahwa semua kelompok perlakuan dapat ditukar pada saat awal.
Pengacakan yang berhasil hanya akan menjamin pertukaran pada saat
awal, bukan pada akhir RCT.

Sudah menjadi praktik umum bagi para peneliti untuk menggambarkan


beberapa karakteristik penting dari setiap kelompok untuk meyakinkan
pembaca bahwa pengacakan memang menghasilkan kelompok dengan
karakteristik yang sama. Umumnya, karakteristik yang dijelaskan adalah
demografi dasar dan variabel yang dianggap terkait dengan hasil yang
diinginkan.

Tujuan dari pengacakan adalah untuk meminimalkan kekurangan dalam


proses seleksi yang dapat mendistorsi hasil, itulah sebabnya kami sangat
mengandalkan pengacakan untuk menjawab pertanyaan kausal. Metode
yang digunakan untuk mengimplementasikan pengacakan sangatlah
penting. Misalkan Anda memiliki daftar 90 pasien yang memenuhi syarat
dan bersedia untuk berpartisipasi dalam sebuah penelitian, dan Anda
menginginkan kelompok perlakuan dan kontrol yang masing-masing
terdiri dari 10 peserta. Pengacakan memastikan bahwa setiap pasien
dalam sampel memiliki probabilitas yang sama untuk dipilih dalam kedua
kelompok. Dengan demikian, Anda tidak dapat dengan mudah memilih
10 pasien pertama untuk kelompok perlakuan dan 10 pasien terakhir
untuk kelompok kontrol karena dengan melakukan hal tersebut berarti 70
pasien lainnya yang berada di urutan paling atas dan paling bawah dalam
daftar memiliki probabilitas yang lebih kecil (bahkan nol) untuk terpilih.
Anda juga tidak dapat memilih setiap pasien lain untuk pengobatan dan
kontrol karena hal itu akan segera membuat probabilitasnya menjadi tidak
sama-yaitu, jika pasien pertama dalam daftar dipilih untuk pengobatan,
maka pasien kedua akan ditugaskan ke kelompok kontrol dan dengan
demikian akan memiliki probabilitas nol untuk ditugaskan ke kelompok
pengobatan, dan seterusnya. Tergantung pada bagaimana daftar
tersebut diurutkan, pasien yang muncul di bagian atas daftar mungkin
adalah yang paling sehat atau terpapar secara tidak proporsional dengan
beberapa faktor yang signifikan. Untuk mendapatkan sampel acak, setiap
pasien harus memiliki kemungkinan yang sama besar untuk dipilih seperti
pasien berikutnya.

Pengacakan harus dilakukan secara ketat agar efektif. Rencana


pengacakan harus ditetapkan sebelum peserta mendaftar dalam
penelitian, dan setiap perubahan yang dilakukan pada rencana
pengacakan harus didokumentasikan dengan cermat. Di masa lalu, tabel
angka acak digunakan untuk pengacakan, tetapi saat ini metode yang
paling sederhana dan paling umum untuk proses pengacakan adalah
dengan menggunakan perangkat lunak pengacakan. Beberapa dari
program ini tersedia secara gratis secara online (misalnya,
Randomization.com). Bergantung pada desain penelitian, peserta dapat
secara acak dimasukkan ke dalam kelompok perlakuan dan kelompok
kontrol, baik secara bersamaan maupun secara individual saat masing-
masing peserta direkrut.

Sebelum proses pengacakan dapat dimulai, kita harus mendefinisikan


individu, kelompok dokter, rumah sakit, atau unit pengacakan lain yang
dihipotesiskan memiliki efek dari pengobatan atau agen. Penting untuk
mendefinisikan dengan jelas siapa yang boleh dan tidak boleh
berpartisipasi dalam penelitian karena berbagai alasan, termasuk
keamanan, melalui penetapan kriteria inklusi dan eksklusi. Kriteria ini
harus dilaporkan saat mengkomunikasikan hasil. Sebagai contoh,
misalkan seorang peneliti melakukan penelitian tentang demensia.
Sangat penting untuk mengetahui bahwa peneliti hanya menyertakan
peserta dengan setidaknya beberapa gangguan kognitif ringan dan tidak
menyertakan pasien berusia 64 tahun atau lebih muda dari penelitian
mereka, karena pilihan kriteria ini pasti akan mempengaruhi hasil
penelitian.

Mungkin terdapat kendala organisasi atau geografis yang membatasi


parameter penelitian pada negara bagian atau wilayah tertentu atau
sekumpulan rumah sakit, klinik, atau praktik kelompok. Sebagai contoh,
Abed dan rekannya (2013) merekrut pasien dari Centre for Heart Rhythm
Disorders di University of Adelaide, Australia, dan mempelajari efek
penurunan berat badan dan manajemen risiko kardiometabolik pada
pasien dengan fibrilasi atrium. Dalam hal ini, kriteria inklusi adalah pasien
harus dirawat di rumah sakit tertentu di Adelaide selama jangka waktu
tertentu (Juni 2010 hingga Desember 2011) untuk kondisi medis tertentu
(fibrilasi atrium). Selain itu, pasien dikeluarkan karena beberapa alasan,
diantaranya adalah diabetes yang membutuhkan insulin dan baru saja
berpartisipasi dalam program penurunan berat badan.

Salah satu alasan mengapa informasi ini penting adalah karena informasi
ini membantu menentukan populasi yang dapat digeneralisasikan dengan
hasil penelitian. Sebagai contoh, dalam sebuah penelitian oleh Giuliano
dan rekannya (2011), pertanyaannya adalah apakah pembedahan
kelenjar getah bening ketiak diperlukan untuk mengobati kanker
payudara stadium awal. Untuk dapat diikutsertakan dalam penelitian ini,
pasien harus menderita kanker payudara stadium awal (t1 atau t2), tidak
teraba adanya adenopati, dan satu atau dua kelenjar getah bening
sentinel yang telah menyebar. Dengan demikian, uji coba ini tidak
memberikan informasi tentang pasien dengan kanker payudara stadium
akhir. Dalam studi tentang efikasi penurunan tekanan darah pada luaran
stroke (He et al. 2014), pasien yang memenuhi syarat adalah mereka
yang mengalami stroke iskemik yang memiliki tekanan darah sistolik
tinggi. Dengan demikian, uji coba ini tidak memberikan informasi
mengenai pasien stroke akut tanpa tekanan darah sistolik tinggi.

Integritas Pengacakan

Dengan jumlah peserta yang cukup, pengacakan meningkatkan


kemungkinan bahwa karakteristik yang diketahui dan tidak diketahui
terdistribusi secara merata pada kelompok eksperimen dan kelompok
kontrol pada awal penelitian. Salah satu cara untuk meningkatkan
kemungkinan bahwa kelompok perlakuan memang dapat ditukar adalah
dengan menggunakan pengacakan bertingkat. Di sini, peneliti akan
membagi peserta ke dalam subkelompok (seperti berdasarkan kelompok
usia) dan kemudian secara acak menugaskan peserta dalam setiap
strata untuk mendapatkan perlakuan. Hal ini membantu memastikan
bahwa kelompok eksperimen dan kelompok kontrol memiliki karakteristik
(dalam hal ini usia) yang terdistribusi secara merata. Teknik lain
digunakan untuk memastikan bahwa keikutsertaan dalam studi tetap
terdistribusi secara merata di antara kelompok-kelompok perlakuan
selama periode perekrutan. Salah satu teknik tersebut, pengacakan blok,
secara acak menugaskan peserta untuk mendapatkan perlakuan dalam
subkelompok kecil yang disebut blok, masing-masing berisi sejumlah
peserta tertentu (misalnya, empat atau enam), yang membantu
mencegah ketidakseimbangan jumlah peserta yang ditugaskan untuk
setiap perlakuan selama uji coba. Pengacakan blok sangat penting dalam
uji coba yang lebih kecil.

Tidak Mengikuti Tindak Lanjut Dan Kepatuhan Terhadap Pengobatan

Kadang-kadang komposisi kelompok eksperimen dan kelompok kontrol


berubah selama pelaksanaan penelitian sedemikian rupa sehingga
integritas penelitian terancam. Peserta yang memenuhi syarat dapat
menolak untuk berpartisipasi dalam penelitian atau keluar dari penelitian
pada suatu saat, atau mereka dapat berpindah ke kelompok penelitian
lain tanpa sepengetahuan peneliti (yaitu "drop out"). Penolakan, drop out,
atau perpindahan yang tidak direncanakan ini dapat membahayakan
validitas internal penelitian.

Selain itu, peserta yang memenuhi syarat juga dapat menolak untuk
berpartisipasi dalam penelitian sebelum diacak, dalam hal ini peserta
mungkin tidak lagi mewakili populasi target. Sebagai contoh, misalkan
pasien yang sakit parah menolak untuk terlibat dalam penelitian karena
masalah transportasi. Partisipan yang diacak akan menjadi lebih sehat
daripada, dan tidak mewakili, populasi target yang sebenarnya. Dengan
demikian, penolakan semacam ini dapat mengganggu validitas eksternal
penelitian.

Beberapa peserta tidak dapat ditindaklanjuti. Sebagai contoh, mereka


mungkin mengganti alamat dan nomor telepon dan lalai memberi kabar
kepada tim peneliti. Yang lain memilih untuk berhenti, mungkin karena
mereka tidak dapat mentolerir efek samping dari obat eksperimental.
Hilangnya partisipan dalam sebuah penelitian bisa jadi tidak acak jika
peserta yang keluar dari kelompok perlakuan dan kelompok kontrol
memiliki karakteristik yang berbeda. Sebagai contoh, misalkan peserta
yang keluar dari kelompok perlakuan cenderung lebih sakit, dan mereka
keluar karena mereka tidak dapat mentoleransi pengobatan, sedangkan
peserta yang keluar dari kelompok kontrol cenderung lebih sehat, dan
mereka keluar karena mereka tidak memiliki motivasi yang cukup untuk
melanjutkan penelitian. Hasilnya adalah kelompok eksperimen dan
kelompok kontrol memiliki tingkat keparahan penyakit yang berbeda. Efek
dari pengobatan yang sedang dipelajari mungkin akan dianggap remeh
karena kelompok eksperimen sekarang mungkin terdiri dari pasien yang
mungkin tidak efektif (yaitu, jika intoleransi terkait dengan efektivitas).
Beban pembuktian ditanggung oleh peneliti untuk menunjukkan bahwa
baik pasien yang menolak maupun pasien yang putus studi tidak memiliki
perbedaan dalam hal karakteristik atau faktor yang dapat mempengaruhi
hasil penelitian.

Masalah lain terjadi ketika uji coba bukan merupakan desain crossover
tetapi pasien berpindah atau berganti dari kelompok pengobatan
eksperimental ke kelompok kontrol atau terapi konvensional, atau
sebaliknya. Crossover tersebut dapat terjadi, misalnya, jika pasien tidak
dapat mentoleransi efek samping dari pengobatan baru, atau jika pasien
yang lebih sakit parah pada kelompok kontrol memerlukan intervensi
eksperimental. Pertanyaan kritisnya bukanlah apakah mengizinkan
pasien untuk berpindah kelompok - praktik klinis terbaik harus
menggantikan kemurnian desain eksperimental - tetapi bagaimana
mengklasifikasikan pasien-pasien ini setelah mereka berganti
pengobatan.

Contoh klasik dari masalah crossover yang tidak direncanakan ini adalah
penelitian yang membandingkan perawatan medis dibandingkan dengan
perawatan bedah untuk penyakit jantung. Intervensi bedah biasanya
berupa operasi cangkok bypass arteri koroner. Pasien yang ditugaskan
untuk menjalani operasi dapat memilih untuk tidak menjalani perawatan
ini karena berbagai alasan, termasuk kesiapan bedah dan preferensi
pribadi. Mereka yang ditugaskan untuk menjalani perawatan medis
mungkin mengalami kesulitan untuk mengendalikan gejala penyakitnya
dan memilih untuk menjalani pembedahan. Pertanyaan yang relevan
adalah bagaimana mengevaluasi pasien-pasien crossover yang tidak
direncanakan ini. Setidaknya ada empat kemungkinan: (1) membatalkan
crossover, (2) menggunakan analisis "per-protokol" dan mengganti
penugasan kelompok crossover pada saat crossover, (3) menggunakan
"prinsip purpose-to-treatment", atau (4) menghentikan penelitian. Dua
kemungkinan pertama jelas akan mengubah komposisi kedua kelompok,
karena pasien kontrol yang berpindah ke kelompok intervensi bedah
biasanya memiliki penyakit yang lebih serius.

Terlepas dari apakah kelompok yang pindah ke kelompok intervensi


bedah dibuang atau dipindahkan, anggapan bahwa kelompok perlakuan
dan kelompok kontrol dapat dipertukarkan karena pengacakan akan
terganggu. Prinsip "intention-to-treat" mempertahankan klasifikasi awal
meskipun terjadi perpindahan ke perlakuan yang berbeda. Meskipun
komposisi awal dari kedua kelompok dipertahankan dengan pendekatan
ini, kemurnian perlakuan yang diterima oleh masing-masing kelompok
akan terkontaminasi. Penelitian ini kemudian dapat dikritik karena
mempelajari efek pengacakan daripada pengobatan, karena crossover
menerima jenis pengobatan yang berbeda dari pasien lain dalam
kelompok. Analisis per-protokol sering kali lebih menarik bagi pasien
daripada tujuan pengobatan (Murray dan Hernán, 2016).

Integritas pengacakan juga terganggu jika karakter pengobatan berubah.


Sebagian, ini merupakan masalah kepatuhan. Peserta dalam sebuah
penelitian mungkin tidak mematuhi pengobatan (misalnya, mereka tidak
meminum pil atau hanya meminum sebagian pil). Kurangnya kepatuhan,
atau kepatuhan sebagian, mengubah karakter pengobatan dan
mempengaruhi hasil penelitian. Sayangnya, kepatuhan pengobatan
sering kali sulit diukur.

Perlakuan juga dapat dipengaruhi oleh dilusi atau kontaminasi, yang


berarti bahwa beberapa peserta dalam kelompok kontrol dipengaruhi oleh
partisipasi mereka dalam penelitian ini meskipun mereka tidak ditugaskan
untuk menerima intervensi. Elwood (1998) membahas fenomena ini
dalam diskusinya mengenai studi klasik Multiple Risk Factor Intervention
Trial Research Group (1982), di mana partisipan diacak untuk menerima
intervensi khusus untuk mengurangi faktor risiko penyakit arteri koroner.
Kelompok kontrol juga menurunkan faktor risiko (meskipun tidak
sebanyak itu), meskipun tidak menerima intervensi khusus. Tampaknya,
peserta kontrol terpengaruh hanya dengan mengikuti penelitian ini dan
menyesuaikan faktor risiko mereka sebagai hasil dari umpan balik dari
dokter mereka. Akibatnya, pengobatan alternatif (dan hanya sedikit lebih
rendah) disesuaikan secara ad hoc oleh peserta kontrol dan dokter
mereka, yang mengakibatkan terjadinya dilusi atau kontaminasi pada
desain penelitian yang asli.

Penyamaran

Karena semua RCT bersifat prospektif, partisipan diikuti dari waktu ke


waktu untuk menentukan efek pengobatan terhadap hasil yang
diidentifikasi secara spesifik, seperti kematian. Lamanya waktu yang
diperlukan untuk membuat kesimpulan yang valid dari penelitian ini
tergantung pada hipotesis tertentu yang dipertanyakan dan ukuran efek
pengobatan yang diharapkan.

Salah satu yang menjadi perhatian adalah waktu tindak lanjut yang
diperlukan dan sejauh mana paparan yang dimaksud akan berpengaruh
pada waktu tersebut terhadap hasil yang terukur. Beberapa paparan,
terutama dalam uji coba pencegahan atau yang melibatkan modifikasi
faktor risiko, mungkin tidak akan menunjukkan efek yang menguntungkan
pada luaran hingga beberapa tahun ke depan. Meskipun desain awal
RCT mungkin harus diperpanjang (atau diperpendek) setelah dimulainya
penelitian, kendala seperti biaya dan perekrutan subjek yang memenuhi
syarat mungkin menjadi masalah.
Tujuan pengacakan adalah untuk mengalokasikan subjek ke dalam
kelompok perlakuan dan kelompok kontrol dengan cara yang
meminimalkan kemungkinan kesalahan dalam proses seleksi. Selain itu,
banyak uji klinis yang tidak mengizinkan peserta atau orang lain yang
terlibat dalam penelitian untuk mengetahui penugasan pengobatan.
Konsep pembutakan ini didasarkan pada premis bahwa peserta dan
personel penelitian (misalnya, dokter, asisten peneliti, ahli statistik) tidak
boleh mengetahui apakah seorang peserta menerima agen
eksperimental, pengobatan, atau program, karena kesadaran itu dapat
mengubah perilaku mereka dengan cara yang akan mengganggu hasil.

Pembutakan tunggal berarti tim peneliti mengetahui pemberian


perlakuan, namun partisipan tidak mengetahui. Pada obat-obatan,
misalnya, cara yang paling mudah adalah dengan memberikan pil
plasebo kepada partisipan dalam kelompok kontrol. Oleh karena itu,
peneliti harus merancang plasebo yang identik dalam hal penampilan,
sentuhan, bau, dan rasa dengan perlakuan eksperimental sehingga
partisipan tidak akan mengetahui apakah mereka menerima perlakuan
eksperimental atau kontrol. Jenis penelitian ini menjadi lebih sulit jika efek
samping obat dapat diantisipasi. Persetujuan yang dilakukan secara
penuh akan membuat peserta sadar akan potensi efek samping jika
mereka ditugaskan ke kelompok perlakuan. Timbulnya, atau kurangnya,
efek samping dapat dengan mudah mengungkap kebutaan tunggal dalam
kasus ini.

Gagasan di balik kebutaan tunggal adalah bahwa partisipan dapat


mengubah perilaku dengan cara yang dapat membahayakan penelitian
jika mereka mengetahui penugasan perlakuan yang diberikan kepada
mereka. Sebagai contoh, partisipan yang ditugaskan untuk mengontrol
pengobatan dapat mencari terapi alternatif atau memodifikasi faktor risiko
jika mereka tahu bahwa mereka tidak menerima pengobatan
eksperimental. Jika perilaku ini memiliki efek yang menguntungkan pada
hasil, efek pengobatan yang diamati dari obat atau prosedur yang sedang
dipelajari akan dipandang sebelah mata. Namun, ada beberapa kasus di
mana pembutakan tidak memungkinkan, seperti uji coba yang melibatkan
pembedahan, program pendidikan, atau rejimen latihan tertentu.

Pembutakan ganda mengacu pada pembutakan peserta dan tim peneliti


sehubungan dengan penugasan kelompok. Pembutakan ganda
diperlukan untuk mencegah peneliti mengubah struktur atau ketelitian
pengamatan dengan cara yang dapat membahayakan hasil yang diukur.
Byar dan rekannya (1990) mencontohkan hal ini dalam sebuah diskusi
tentang kegunaan blinding dalam uji coba AIDS: " Pembutakan sangat
diinginkan ketika titik akhir subjektif, seperti rasa sakit, status fungsional,
atau kualitas hidup, dipelajari, karena evaluasi semacam itu terbuka
terhadap bias yang substansial. Demikian juga, tanpa pembutakan,
evaluasi kejadian infeksi oportunistik dapat menjadi bias, karena
pengetahuan tentang pengobatan dapat mempengaruhi frekuensi atau
ketelitian pengawasan."

Dengan triple blinding, peserta, peneliti, dan analis data tidak mengetahui
penugasan kelompok. Triple blinding mengasumsikan bahwa peneliti
atau analis data dapat membuat kesalahan sistematis dalam proses
memanipulasi atau menginterpretasikan data sejauh mereka memiliki
anggapan tentang efikasi pengobatan. Triple blinding rumit dalam
praktiknya dan merupakan jenis blinding yang paling tidak populer.

Ukuran dan Kekuatan Sampel

Salah satu keputusan terpenting yang harus diambil saat merancang


RCT adalah berapa banyak peserta yang dibutuhkan untuk uji coba. RCT
biasanya cukup mahal, dan biayanya tergantung pada ukuran sampel.
Seseorang dapat mendeteksi perbedaan yang lebih kecil-atau perbedaan
yang lebih besar dengan lebih presisi-dengan sampel yang lebih besar,
tetapi semakin besar sampel, semakin mahal biaya uji coba. Untuk
menentukan ukuran sampel yang diperlukan, peneliti harus memiliki
pemahaman yang jelas tentang ukuran yang diharapkan dari efek
pengobatan. Sebaiknya peneliti memperkirakan ukuran sampel di bawah
sejumlah ukuran efek pengobatan yang diharapkan, sehingga peneliti
memahami apa yang akan terjadi pada hasil jika efek pengobatan yang
diamati lebih besar atau lebih kecil dari yang diharapkan.

RCT fase III dirancang untuk menyimpulkan bahwa suatu pengobatan


efektif atau tidak efektif dalam hal kemampuannya mencapai hasil yang
diinginkan. Misalkan hasil RCT menunjukkan bahwa pengobatan tersebut
efektif dan, pada kenyataannya, memang demikian. Ini berarti bahwa
kebenaran dan penelitian tersebut sesuai. Jika hasil penelitian
menunjukkan bahwa pengobatan tersebut tidak efektif, dan memang
tidak efektif, maka kebenaran dan penelitian tersebut juga kongruen.
Dalam kedua kasus ini, RCT memberikan bukti keefektifan sebenarnya
dari pengobatan yang sedang diuji. Sayangnya, tidak selalu demikian.
Jika penelitian menunjukkan bahwa pengobatan tersebut efektif, padahal
kenyataannya tidak, maka ini disebut sebagai kesalahan tipe I. Ini juga
disebut positif palsu, karena kita telah salah menyatakan bahwa suatu
pengobatan efektif. Jika penelitian mengarah pada kesimpulan bahwa
pengobatan tidak efektif, padahal sebenarnya pengobatan tersebut
efektif, maka ini disebut sebagai kesalahan tipe II. Disebut negatif palsu
karena kita salah menyimpulkan bahwa pengobatan tidak efektif, padahal
sebenarnya efektif. Kesalahan tipe I dan II saling berbanding terbalik.
Ketika kemungkinan pelaporan hasil positif palsu meningkat,
kemungkinan pelaporan negatif palsu menurun, dan sebaliknya (dengan
asumsi ukuran sampel tetap sama).

Setiap jenis kesalahan dapat menimbulkan konsekuensi negatif pada


komunitas medis. Negatif palsu dapat menggagalkan investigasi obat
atau prosedur yang berpotensi menjanjikan di masa depan-atau hasil
penelitian bahkan mungkin tidak dipublikasikan. Hasil positif palsu dapat
mengakibatkan penyebaran dini suatu teknologi atau agen yang tidak
efektif.

Jelas, kami ingin meminimalkan kesalahan tipe I dan tipe II sehingga


kesimpulan yang benar dapat diambil sesering mungkin. Masalahnya
adalah kita tidak pernah tahu yang sebenarnya. Tujuan menjalankan RCT
adalah untuk mencoba memperkirakan kebenaran; jika kita sudah
mengetahuinya, maka kita tidak perlu menjalankan uji coba. Dengan
demikian, kita tidak akan pernah benar-benar tahu apakah kita telah
melakukan kesalahan tipe I atau tipe II, dan inilah mengapa kita harus
menetapkan tingkat signifikansi dan tingkat kekuatan yang dapat
ditoleransi.

Umumnya, tingkat signifikansi yang digunakan adalah α = 0,05, atau 5


persen. Ini berarti bahwa probabilitas kesalahan tipe I (yaitu, salah
menyimpulkan bahwa perlakuan eksperimental tersebut efektif) adalah 5
persen, dengan asumsi dilakukan satu uji statistik. Meskipun α = 0,05
adalah yang paling populer, tingkat signifikansi yang dipilih dapat
bervariasi dari satu studi ke studi lainnya. Probabilitas kesalahan tipe II
umumnya harus 20 persen atau kurang-misalnya, β = 0,20, atau 20
persen. Kekuatan penelitian adalah 1 - β. Dengan demikian, jika
probabilitas kesalahan tipe II adalah 20 persen, maka kekuatan penelitian
adalah 80 persen, yang berarti bahwa jika memang ada perbedaan
dalam perlakuan, kita memiliki peluang 80 persen untuk mendeteksi
perbedaan tersebut dengan uji statistik.
Ada dua cara untuk mengurangi kesalahan tipe I dan II secara
bersamaan, dan dengan demikian meningkatkan validitas yang dapat
digunakan untuk membuat kesimpulan berdasarkan uji coba acak:
meningkatkan ukuran sampel atau meningkatkan ukuran efek minimum.
Ukuran sampel minimum yang diperlukan untuk penelitian tertentu dapat
diperkirakan dengan menggunakan rumus yang berbeda untuk studi
RCT, kohort, dan kasus-kontrol (Elwood 1998). Secara umum, ukurannya
tergantung pada (1) kesalahan tipe I maksimum dan kesalahan tipe II
minimum yang dapat diterima oleh peneliti dan (2) efek pengobatan
minimum yang bermakna secara klinis. Ukuran sampel yang dibutuhkan
berkurang jika seseorang bersedia untuk mentoleransi hasil positif dan
negatif palsu secara proporsional ketika menyimpulkan bahwa
pengobatan tersebut efektif. Dengan kata lain, presisi, baik dalam hal
probabilitas yang lebih rendah dari kesalahan tipe I dan II atau efek
pengobatan yang lebih kecil, membutuhkan biaya dan jumlah sampel
yang lebih besar.

Pertimbangan Etis

Hubungan antara pasien dan dokter didasarkan pada kepercayaan,


berdasarkan sejarah panjang dedikasi dokter terhadap perawatan pasien
dan dipandu oleh Sumpah Hipokrates untuk " tidak menyakiti terlebih
dahulu." Namun, dokter sering kali menghadapi dilema etis, seperti ketika
pandangan mereka tentang apa yang terbaik bagi pasien ditentang oleh
pihak lain (pembayar pihak ketiga, misalnya). RCT juga dapat membawa
mereka ke dalam dilema etika yang sangat sulit. Dokter diminta untuk
melibatkan pasien mereka dalam proses yang mungkin memberikan
pengobatan yang kurang optimal demi kepentingan sosial yang lebih
besar, yaitu kemajuan ilmu pengetahuan. Hellman dan Hellman (1991,
1586) merefleksikan dilema ini:

Uji klinis acak secara rutin meminta dokter untuk mengorbankan


kepentingan pasien mereka demi kepentingan penelitian dan informasi
yang akan tersedia untuk kepentingan masyarakat. Praktik ini secara etis
bermasalah. Jika dokter tidak memiliki preferensi terhadap salah satu
pengobatan (dalam keadaan seimbang), maka pengacakan dapat
diterima. Namun, jika ia percaya bahwa pengobatan baru tersebut
mungkin lebih atau kurang berhasil atau lebih atau kurang toksik, maka
penerapan pengacakan tidak sesuai dengan kesetiaan terhadap pasien.
Doktrin hukum tentang informed consent mengharuskan peserta untuk
mengetahui risiko dan manfaat pengobatan dan memberikan persetujuan
formal, biasanya dengan menandatangani dokumen informed consent.
Namun, prinsip-prinsip pengacakan dan penyamaran membuat
persetujuan menjadi lebih sulit. Pasien tidak diberi pilihan, atau bahkan
mungkin tidak diberi tahu, tentang strategi perawatan mana yang mereka
terima-perawatan eksperimental, perawatan konvensional, atau tanpa
perawatan. Perawatan eksperimental mungkin memiliki beberapa risiko
yang tidak diketahui dengan janji manfaat tambahan. Kalkulus yang
menimbang manfaat dan biaya membuat pasien dan dokter tidak
mungkin bersikap netral terhadap pilihan pengobatan eksperimental atau
konvensional. Baum (1993, 812) memberikan ringkasan yang kuat
tentang argumen ini:

Uji coba terkontrol secara acak secara etis tidak mungkin dilakukan. Agar
pasien dapat direkrut, dokter harus berada dalam posisi yang seimbang
tentang salah satu dari dua perawatan yang sedang dievaluasi, dan hal
ini merupakan kejadian yang jarang terjadi. Selain itu, pasien, setelah
diberikan dan memahami informasi yang sempurna tentang uji coba, juga
harus menyatakan kesamaan yang seimbang - suatu hal yang sangat
jarang terjadi. Kemungkinan terjadinya kedua hal langka ini secara
bersamaan mencapai angka probabilitas yang sangat kecil.

Terdapat ketegangan antara keinginan untuk menggunakan RCT untuk


menunjukkan manfaat terapeutik dan untuk mengetahui kapan secara
etis tidak dapat diterima untuk menempatkan beberapa pasien secara
acak pada perawatan yang lebih rendah. Tidak ada pasien yang rasional
yang akan memilih perawatan yang kurang optimal untuk kepentingan
ilmu pengetahuan, terutama ketika ada alternatif yang lebih optimal.
Penelitian terkontrol plasebo buta ganda mengenai efikasi AZT pada
pengobatan pasien dengan AIDS dan kompleks terkait AIDS adalah
contoh yang klasik (Fischl dkk. 1987). Tidak ada terapi konvensional lain
untuk AIDS yang ada pada waktu itu. Penelitian ini harus diakhiri sebelum
waktunya setelah perbedaan yang signifikan terhadap mortalitas yang
ditunjukkan.

Menghentikan penelitian lebih awal dari yang direncanakan bukanlah hal


yang jarang terjadi dalam RCT modern. Sebagian besar uji coba
sekarang menyertakan beberapa protokol untuk penghentian dini karena
efikasi atau kesia-siaan. Jika sebuah penelitian dengan tegas
menunjukkan bahwa pengobatan baru berhasil atau tidak berhasil pada
tingkat tertentu, maka uji coba dapat dihentikan lebih awal sehingga
tindakan yang tepat dapat diambil, seperti modifikasi uji coba untuk
menguji tingkat pengobatan jika pengobatan tersebut berhasil atau
dihentikan jika pengobatan tidak berhasil atau bahkan menyebabkan
kerusakan. Pengacakan blok sangat penting untuk desain seperti itu
sehingga informasi selalu tersedia dari jumlah peserta yang diinginkan
dalam setiap kelompok.

Dalam beberapa kasus, uji klinis yang tidak terkontrol dapat menjadi
desain studi yang direkomendasikan jika pasien dengan prognosis yang
buruk tidak memiliki alternatif lain dan pengobatan eksperimental
diharapkan tidak memiliki efek samping yang signifikan (Byar et al. 1990).
Selain itu, mungkin sulit untuk menjustifikasi RCT untuk mendukung
semakin banyak bukti dari penelitian lain yang kurang mutakhir ketika
sebagian besar bukti mendukung hubungan sebab akibat antara paparan
dan hasil tertentu. Sebagai contoh, beberapa pengamat mungkin masih
berpendapat bahwa kita belum membuktikan secara meyakinkan bahwa
merokok menyebabkan kanker paru-paru, namun hanya sedikit yang
bersedia mendukung RCT di mana partisipan secara acak ditugaskan ke
dalam kelompok yang merokok dan yang tidak merokok dan diikuti
seumur hidup.

Ringkasan

Pengacakan adalah alat yang ampuh yang memfasilitasi kesimpulan


sebab akibat, tetapi tujuan utama pengacakan adalah untuk mencegah
pengaruh peneliti (sadar atau tidak sadar) dalam penugasan peserta
untuk pengobatan. Jika berhasil, pengacakan menciptakan kelompok-
kelompok perlakuan yang dapat dipertukarkan pada awal penelitian,
tetapi ancaman terhadap validitas internal, seperti drop out, dapat muncul
selama penelitian berlangsung. Meskipun ada banyak desain berbeda
yang dapat digunakan untuk melaksanakan RCT, RCT sering kali tidak
mungkin dilakukan karena pertimbangan praktis atau etika. Meskipun
RCT merupakan desain penelitian yang elegan, namun bukan berarti
tidak memiliki kekurangan.

Latihan Kasus di Akhir Bab

1. Misalkan Anda berada dalam tim yang ditugaskan untuk mempelajari


obat baru bersifat hipotetik yang disebut Obestin, yang diklaim memiliki
tingkat keberhasilan yang lebih tinggi untuk menurunkan berat badan
daripada tanpa pengobatan. Dua ratus pasien obesitas dipilih secara
acak setelah setuju untuk berpartisipasi dalam uji coba Obestin. Tim
peneliti Anda tertarik untuk mengetahui apakah secara proporsional lebih
banyak subjek yang menggunakan Obestin akan mengalami penurunan
berat badan setidaknya 5 persen setelah enam bulan pengobatan
dibandingkan dengan plasebo, dan apakah secara proporsional lebih
sedikit subjek yang mengalami hipertensi pada akhir penelitian. Dari 100
subjek yang menggunakan Obestin, 30 orang mengalami penurunan
berat badan setidaknya 5 persen dan 40 orang mengalami hipertensi
pada akhir penelitian. Dari 100 subjek yang menggunakan plasebo, 15
mengalami penurunan berat badan setidaknya 5 persen dan 60
mengalami hipertensi pada akhir penelitian.

a. Berapa angka kejadian mereka yang mengalami penurunan berat


badan minimal 5 persen pada kelompok peserta yang diacak dengan
Obestin?

b. Berapa angka kejadian pada mereka yang mengalami penurunan berat


badan minimal 5 persen pada kelompok peserta yang diacak dengan
plasebo?

c. Apa efek pengobatan (atau perbedaan laju) sehubungan dengan


penurunan berat badan minimal 5 persen (Obestin dibandingkan
plasebo)?

d. Berapa jumlah total subjek hipertensi pada akhir penelitian?

e. Apa efek pengobatan yang berkaitan dengan tingkat hipertensi


(Obestin dibandingkan plasebo)?

f. Jika pasien tidak dibutakan, kesalahan sistematis seperti apa yang


mungkin terjadi dalam pemilihan?

2. Misalkan Anda telah didanai oleh National Institutes of Health untuk uji
klinis selama lima tahun guna mempelajari efikasi obat baru bersifat
hipotetik yang disebut Congist untuk mengurangi kejadian gagal jantung
kongestif (CHF). Percobaan acak ini membandingkan Congist dengan
terapi konvensional dan mengukur efek pengobatan sebagai perbedaan
tingkat kematian. Penelitian ini melibatkan pengacakan bertingkat
(berdasarkan usia dan jenis kelamin) di mana subjek ditugaskan ke
dalam kelompok perlakuan atau kontrol. Anda memiliki 10.000 pasien
berusia 65 tahun ke atas (4.000 pria dan 6.000 wanita). Dari laki-laki, 10
persen berusia 75 tahun atau lebih. Dari pasien perempuan, 15 persen
berusia 75 tahun atau lebih. Tim peneliti Anda memutuskan untuk
menggunakan desain faktorial 2 × 2 secara acak di mana mereka dapat
menguji efek Congist pada CHF dan obat baru hipotetis lainnya, Diabex,
terhadap kejadian diabetes melitus (DM). Masing-masing dari empat
strata usia dan jenis kelamin kemudian diacak ke dalam empat kelompok:
(1) Congist dan Diabex; (2) Congist saja; (3) Diabex saja; (4) tidak diberi
obat. Asumsinya adalah bahwa kedua obat ini bekerja secara
independen dengan efek yang berbeda tetapi terpisah. Para peneliti
untuk penelitian ini mendapatkan hasil sebagai berikut untuk masing-
masing dari empat kelompok, dengan 2.500 pasien di setiap kelompok:
(1) kedua obat: kejadian DM = 75 kasus, kejadian CHF = 18 kasus; (2)
Congist saja: kejadian DM = 85 kasus, kejadian CHF = 22 kasus; (3)
Diabex saja: kejadian DM = 75 kasus, kejadian CHF = 22 kasus; (4) tidak
diberi obat: kejadian DM = 125 kasus, kejadian CHF = 28 kasus.

a. Dalam penelitian ini, berapa banyak laki-laki yang akan berada dalam
kelompok Congist/Diabex?

b. Dalam penelitian ini, berapa banyak laki-laki berusia 75 tahun atau


lebih yang akan berada dalam kelompok Diabex saja?

c. Dalam penelitian ini, berapa banyak perempuan berusia 65-74 tahun


yang akan berada dalam kelompok Congist?

d. Dalam penelitian ini, berapa banyak perempuan berusia 75 tahun atau


lebih yang akan berada dalam kelompok yang tidak mendapatkan kedua
obat tersebut?

e. Berapa tingkat kejadian CHF untuk masing-masing dari empat


kelompok?

f. Berapa angka kejadian DM untuk masing-masing dari keempat


kelompok?

g. Berapa tingkat kejadian CHF untuk dua kelompok yang mendapatkan


Congist dan untuk dua kelompok yang tidak?
h. Berapa angka kejadian DM untuk kedua kelompok yang mendapatkan
Diabex dan untuk kedua kelompok yang tidak mendapatkannya?

i. Apa efek pengobatan dari Congist, yang diukur dalam perbedaan angka
kejadian?

j. Apa efek pengobatan dari Diabex, yang diukur dalam perbedaan


angka?

k. Apa efek pengobatan dari Congist, yang diukur dalam risiko relatif?

l. Apa efek pengobatan dari Diabex, yang diukur dalam risiko relatif?

m. Bagaimana Anda menghitung efek pengobatan dari Congist dengan


membandingkan kelompok Congist saja dengan kelompok yang tidak
menggunakan obat?

n. Bagaimana Anda akan menghitung efek pengobatan dari Diabex


dengan membandingkan kelompok Diabex saja dengan kelompok yang
tidak menggunakan obat?

o. Apakah terlihat bahwa Congist dan Diabex saling berinteraksi satu


sama lain?

3. Misalkan Anda melakukan RCT untuk menguji obat baru hipotetis yang
disebut Brensig untuk pengobatan depresi. Sebanyak 1.200 subjek yang
mengalami depresi diacak ke dalam kelompok yang sama, dengan satu
kelompok menerima Brensig dan kelompok lainnya menerima
pengobatan konvensional (Paxil). Setelah empat minggu, Anda menilai
perkembangan kedua kelompok dengan kuesioner. Di antara kelompok
Brensig, 400 subjek "membaik", dibandingkan dengan 300 subjek pada
kelompok Paxil.

a. Apa efek pengobatan dalam hal ukuran perbaikan (nilai Brensig untuk
menilai Paxil)?

b. Anda memutuskan bahwa desain penelitian harus menyertakan


pengacakan bertingkat berdasarkan ras dan jenis kelamin. Di antara
1.200 subjek, 60 persen adalah perempuan dan 80 persen berkulit putih.
Berapa banyak subjek perempuan berkulit putih yang akan masuk dalam
kelompok Brensig?

c. Anda juga mengevaluasi efek samping dan menemukan bahwa 90


orang pada kelompok Brensig dan 120 orang pada kelompok Paxil
melaporkan disfungsi seksual. Apa efek pengobatan dalam hal
perbedaan risiko (atau tingkat)?

d. Bagaimana seharusnya kontrol uji coba acak yang dirancang dengan


baik?

Anda mungkin juga menyukai