Anda di halaman 1dari 7

KEPALA ATAU EKOR: PERAN PELUANG

Jika hasil penelitian mengungkapkan adanya hubungan yang menarik antara beberapa
paparan dengan hasil kesehatan, maka ada kecenderungan alami untuk berasumsi bahwa
hal tersebut bersifat nyata. (Perhatikan bahwa kita sedang mempertimbangkan apakah
ada dua hal yang terkait. Hal ini tidak selalu menyiratkan hubungan kausal. Kita akan
membahas pendekatan untuk menentukan kausalitas lebih lanjut dalam Bab 10.)
Namun, sebelum kita dapat merenungkan kemungkinan ini kita harus berusaha untuk
menyingkirkan penjelasan lain yang mungkin untuk hasil. Ada tiga 'penjelasan
alternatif' utama yang harus kita pertimbangkan setiap kali kita menganalisis data
epidemiologi atau membaca laporan orang lain: yaitu, mungkinkah hasilnya disebabkan
oleh adanya

- peluang
- bias atau kesalahan atau
- perancu?

Kami akan membahas yang pertama, yaitu kesempatan, dalam bab ini dan akan
membahas bias dan perancu dalam Bab 7 dan 8.

Random sampling error

Ketika kita melakukan penelitian atau survei, mungkin jarang untuk memasukkan
seluruh populasi sehingga biasanya kita harus bergantung pada sampel populasi itu dan
percaya bahwa sampel ini akan memberi kita jawaban yang berlaku untuk populasi
umum.

Jika kita memilih sampel orang dengan bijaksana dan mereka benar-benar mewakili
populasi target (populasi yang ingin kita teliti) maka kita tidak akan memasukkan bias
seleksi apa pun ke dalam penelitian (lihat Bab 7). Namun, jika kita meneliti beberapa
sampel orang yang berbeda dari populasi yang sama, tidak mungkin kita akan
menemukan jawaban yang persis sama setiap kali dan tidak mungkin bahwa jawaban
apa pun akan persis sama dengan nilai populasi yang sebenarnya. Hal ini karena setiap
sampel yang kita ambil akan mencakup orang-orang yang sedikit berbeda dan
karakteristik mereka akan cenderung bervariasi dari orang-orang dalam sampel lain -
hanya secara kebetulan. Ini dikenal sebagai random sampling error.

Bayangkan Anda tertarik pada efek obesitas terhadap kesehatan dan ingin mengetahui
rata-rata indeks massa tubuh (IMT) dari anak-anak usia 10 tahun di komunitas Anda.
Jika Anda menimbang dan mengukur hanya satu atau dua anak, Anda tidak akan
mendapatkan perkiraan yang sangat baik dari rata-rata IMT semua anak - tetapi semakin
banyak anak yang Anda teliti, semakin baik perkiraan Anda. Hal yang sama berlaku jika
kita mencari hubungan antara 'paparan' dan 'hasil', misalnya hubungan antara IMT
dengan usia. Jika kita hanya melakukan survei pada sekelompok kecil anak usia 10
tahun dan kelompok kecil lainnya yang berusia 12 tahun, kita mungkin akan
menemukannya, hanya secara kebetulan, anak-anak berusia 10 tahun lebih besar
daripada anak-anak usia 12 tahun, tetapi semakin besar studi kami, semakin baik atau
tepat perkiraan kita tentang hubungan sejati antara usia dan ukuran tubuh. (Kita akan
membahas ketepatan lebih lanjut dalam Bab 7). Secara umum, jika kita memilih sampel
kecil dari suatu populasi maka hasil kita lebih mungkin berbeda dari nilai populasi
sebenarnya daripada jika kita telah memilih sampel yang lebih besar. Cara terbaik untuk
mengurangi kesalahan pengambilan sampel adalah dengan menambah ukuran sampel
penelitian sebanyak mungkin. (Tentu saja, selalu ada trade-off antara ukuran dan biaya
penelitian).

Ada cara-cara di mana kita dapat menghitung berapa banyak orang yang harus kita
masukkan dalam sebuah penelitian untuk mengurangi kesalahan sampling ke tingkat
yang dapat diterima. Dalam studi analitik, kalkulasi ini melibatkan beberapa
pengetahuan, pertama, tentang ukuran kemungkinan efek yang kita harapkan untuk
dilihat dan kedua, dari prevalensi faktor yang menarik dalam populasi. Mereka juga
membutuhkan keputusan tentang seberapa tepat kita ingin mengukur efeknya, yaitu
berapa banyak kesalahan pengambilan sampel yang kita siap terima dalam hasil
penelitian kita. Jika kita mencari efek besar dan paparan dan / atau penyakit cukup
umum maka kita tidak perlu studi besar untuk menunjukkan ini. Sebagai contoh, pada
tahun 1971 sebuah studi kasus-kontrol berskala kecil (n = 40) menunjukkan bahwa
wanita muda yang terpapar diethylstilboestrol (DES) in utero memiliki peningkatan
risiko untuk menderita jenis kanker vagina yang langka (adenokarsinoma sel jernih)
(Herbst dkk, 1971). (DES adalah estrogen sintetis yang digunakan antara 1940 dan 1970
untuk mencegah aborsi spontan dan persalinan prematur.) Dalam situasi ini, frekuensi
penggunaan DES di antara ibu-ibu kasus sangat tinggi (tujuh dari delapan) dan
perbedaannya adalah begitu besar (tidak ada satupun dari 32 ibu yang menggunakan
DES) bahwa para peneliti hanya perlu mempelajari 40 wanita itu untuk menunjukkan
bahwa ada hubungan yang jelas. Sayangnya, dalam epidemiologi modern kita sering
mencari efek yang jauh lebih kecil dan penelitian kita harus jauh lebih besar daripada ini
untuk mendeteksi mereka dengan pasti. Kami tidak akan membahas metode statistik
untuk melakukan apa yang disebut perhitungan 'ukuran sampel' atau 'kekuasaan' di sini;
rumus untuk ini dapat ditemukan di banyak buku teks standar tentang statistik medis.
Akan tetapi, kami akan kembali untuk mempertimbangkan konsep kekuatan di bagian
selanjutnya dalam bab ini.

Interval kepercayaan / confidence intervals (CI)

Ada dua aspek terkait yang perlu dipertimbangkan ketika mencari hubungan antara
paparan dan hasil: apakah ada hubungan dan seberapa kuat hubungan tersebut. Karena
epidemiologi pada dasarnya adalah tentang mengukur efek, kita akan membahas
masalah kedua terlebih dahulu dan kemudian kembali ke pertanyaan tentang apakah
hubungan itu ada.

Seperti yang Anda lihat di atas, akan selalu ada beberapa tingkat random sampling
error dalam sebuah penelitian dan hasil yang kita peroleh mungkin berbeda dari
kebenaran hanya karena kebetulan orang-orang yang mengikuti penelitian berbeda
dalam beberapa hal dari norma populasi. Untuk menilai kemungkinan efek dari
kesalahan acak ini kita dapat menghitung apa yang disebut interval kepercayaan di
sekitar hasil kita. Berlaku pengakuan eksplisit bahwa hasil studi (biasanya OR atau RR,
juga dikenal sebagai 'titik' atau 'efek' perkiraan) mungkin tidak tepat, tetapi jawaban
yang sebenarnya mungkin terletak di suatu tempat di dalam rentang yang diberikan -
interval kepercayaan. Oleh karena itu, interval kepercayaan yang sempit menunjukkan
presisi yang baik atau random sampling error yang sedikit dan sebaliknya, interval
kepercayaan yang luas menunjukkan presisi yang buruk.
Interval kepercayaan yang paling sering digunakan adalah interval 95% (95% CI) dan
sering digambarkan dengan tidak akurat karena artinya kita dapat '95% yakin 'bahwa
nilai sebenarnya berada dalam rentang yang dicakup oleh interval kepercayaan. Yang
dimaksud interval kepercayaan adalah bahwa jika kita mengulangi penelitian berkali-
kali dengan sampel orang yang berbeda, maka 95% dari interval kepercayaan 95% yang
kita hitung akan mencakup nilai yang sebenarnya. Perhatikan bahwa ini juga berarti
bahwa 5% dari waktu (atau 1 dari 20 kali) CI 95% tidak akan menyertakan nilai yang
sebenarnya dan kita tidak akan pernah tahu waktu-waktu ini. Persentase lain dapat
digunakan, seperti 90%, yang memberikan interval kepercayaan yang lebih sempit
tetapi kurang kepastian bahwa itu akan mengandung nilai yang sebenarnya (kita akan
salah sekitar 1 kali dalam 10); dan 99%, yang akan lebih mungkin mengandung nilai
yang sebenarnya (kita hanya akan salah kira-kira 1 kali dalam 100) tetapi akan
memberikan interval yang lebih lebar.

Jika kita mempertimbangkan ukuran risiko relatif, nilai 'tanpa efek' atau nol adalah 1,0 -
risiko relatif 1,0 menunjukkan bahwa tidak ada perbedaan antara kedua kelompok yang
dibandingkan. Jika kedua ujung CI lebih besar dari 1,0 ini menunjukkan bahwa ada
hubungan positif antara paparan dan hasil, sama jika kedua ujung CI kurang dari 1,0
maka itu menunjukkan hubungan terbalik. Namun, jika CI mencakup nilai nol, yaitu
batas bawah kurang dari 1,0 dan batas atas lebih besar dari 1,0, maka kita tidak dapat
menyingkirkan kemungkinan bahwa risiko relatif sebenarnya benar-benar 1,0 dan
dengan demikian benar-benar tidak ada hubungan antara paparan dan hasil.

Untuk mempertimbangkan contoh praktis, bayangkan dua studi yang telah


mengevaluasi hubungan antara paparan polusi udara dan asma.

Studi 1 menemukan risiko relatif 1,5 dengan interval kepercayaan 95% (CI) 1,2-1,9.

Apa ini memberitahu kita tentang hubungan antara polusi udara dan asma?

Ini perkiraan yang cukup tepat. Ini memberitahu kita bahwa orang-orang yang terpapar
polusi udara sekitar satu setengah kali lebih mungkin (atau 50% lebih mungkin) untuk
mengembangkan asma daripada mereka yang tidak terpapar. Ini memberitahu kita
bahwa risikonya mungkin setinggi 1,9 kali, tetapi itu mungkin serendah 1,2 kali (yaitu
peningkatan 20%) lebih tinggi pada mereka yang terpapar. Ini juga memberitahu kita
bahwa risiko relatif tidak mungkin lebih dari 1,9 atau kurang dari 1,2 (tetapi masih bisa
berada di luar nilai-nilai ini).

Studi 2 menemukan risiko relatif 2,5 (95% CI 0,9-6,9).

Berapa nilai yang paling mungkin untuk risiko relatif asma pada orang yang
terpapar polusi udara dalam studi kondisional ini?

Mungkinkah hasilnya dapat muncul secara kebetulan dan tidak ada hubungan sama
sekali (yaitu risiko relatif penduduk 'benar' adalah 1,0)?

Manakah dari dua penelitian yang akan memberi Anda kekhawatiran terbesar
bahwa polusi udara dikaitkan dengan asma?

Pada penelitian kedua, nilai yang paling mungkin untuk risiko relatif adalah 2,5 dan
risiko relatif sebenarnya bisa setinggi 6,9. Namun, interval kepercayaan sangat lebar,
menunjukkan ketepatan yang buruk, dan juga mencakup nilai 1.0 (mengingat bahwa RR
1.0 menunjukkan tidak ada pengaruh), jadi mungkin tidak ada hubungan sama sekali
dan hasil 2,5 muncul secara kebetulan. Kedua studi menunjukkan kemungkinan efek
polusi udara dalam menginduksi asma. Dengan asumsi tidak ada bias dalam hasil, studi
pertama menunjukkan bahwa ada hubungan nyata antara polusi udara dan asma tetapi
efeknya tidak terlalu besar. Studi kedua menunjukkan efek relatif mungkin lebih besar
dan dengan demikian lebih penting secara klinis, tetapi karena CI yang luas kita
dibiarkan dengan ketidakpastian tentang bagaimana sebenarnya nilai yang sebenarnya.
Kita tentu tidak boleh mengabaikan hasil dari studi kedua hanya karena kebetulan
adalah salah satu penjelasan yang mungkin untuk temuan kami; setelah semua nilai
yang sebenarnya mungkin mendekati 6.0 (asosiasi yang sangat kuat), karena mendekati
1.0 (tidak ada efek). Namun, kita harus berhati-hati, dan mengakui kemungkinan bahwa
itu hanya bisa mencerminkan permainan kebetulan. Dalam praktiknya, jika kita harus
membuat penilaian tentang efek polusi udara terhadap kesehatan masyarakat, kita ingin
mempertimbangkan hasil dari kedua studi bersama untuk meningkatkan ketepatan
perkiraan kita dan kita akan mencari cara untuk melakukannya secara lebih rinci di Bab
11. Untuk saat ini, penting untuk diingat bahwa interval kepercayaan yang sempit
(menunjukkan presisi yang baik) selalu lebih informatif daripada interval kepercayaan
yang luas (menunjukkan ketepatan yang buruk). Kami tidak akan membahas metode
untuk menghitung interval kepercayaan di sini tetapi telah memasukkan beberapa rumus
yang paling berguna untuk perhitungan ini dalam Lampiran 7.

Statistik dalam epidemiologi

Ketika kita melakukan penelitian untuk mengevaluasi hubungan antara paparan dengan
penyakit, kita dapat menemukan hubungan atau tidak. Kita harus menggunakan
informasi dari sampel orang dalam penelitian untuk menyimpulkan apakah paparan dan
hasil benar-benar terkait dalam populasi yang lebih luas. Dengan demikian ada empat
hasil yang mungkin untuk setiap studi, seperti yang ditunjukkan pada Tabel 6.1.

Tabel 6.1. Hasil yang mungkin dari sebuah studi epidemiologi


KENYATAAN (tidak diketahui)
HASIL PENELITIAN
Tidak ada hubungan Ada hubungan
(diketahui
Kesalahan tipe II
Tidak ada hubungan Benar
(kemungkinan = β)
Benar
Kesalahan tipe I
Ada hubungan (kemungkinan= 1-
(kemungkinan = α)
β = kekuatan

Jika benar-benar tidak ada hubungan antara hasil dan paparan maka kita berharap bahwa
penelitian kita akan menemukan hal itu. Sebaliknya, jika paparan dan hasil benar-benar
terkait dalam populasi maka kita ingin penelitian kita menunjukkan hubungan ini. Apa
yang kami ingin meminimalkan adalah situasi di mana penelitian kami menunjukkan
hubungan yang jelas antara paparan dan hasil ketika kebenarannya adalah bahwa tidak
ada (sering disebut kesalahan 'tipe I' atau kesalahan alfa), atau penelitian kita
mengatakan tidak ada hubungan ketika, sebenarnya, ada ( kesalahan 'tipe II' atau
kesalahan beta). Sayangnya, dalam prakteknya kita tidak pernah tahu pasti apakah kita
benar atau salah.

Signifikansi statistik: dapatkah sebuah asosiasi muncul secara kebetulan?

Interval kepercayaan memberikan informasi berharga tentang kemungkinan ukuran efek


dan seperti yang Anda lihat di atas, juga dapat memberi Anda beberapa gagasan tentang
apakah hasil mungkin muncul hanya secara kebetulan - jika interval kepercayaan
mencakup nilai nol atau tanpa efek (misalnya 1.0 untuk risiko relatif) maka kita tidak
dapat menyingkirkan kebetulan’ sebagai penjelasan yang mungkin. Kita juga dapat
melakukan apa yang dikenal sebagai uji hipotesis untuk menilai hal ini.

Anda mungkin juga menyukai