Anda di halaman 1dari 8

Perlukah menghitung ukuran sampel?

Is it necessary to estimate sample size?


Bhisma Murti
Department of Public Health, UNS University School of Medicine, Solo

KEYWORDS sample size, systematic error, random error, statistical aspect.

ABSTRACT Sample size is an issue worth-considering but not the most essential thing to fulfil for a good
research. A much more crucial cause of concern to any research is the validity of inference a
research is drawing, i.e. the extent to which the research is able to control systematic error that
stems from bias and confounding. Sample size refers to random error; it does not address nor
correct systematic error. The larger sample size, the less random error, the more precise estimates a
research can yield about difference/ association/ effect of a variable(s). Most of the assignment of
values in any sample size formula is arbitrary. As such, the product of estimating sample size,
regardless of the formula being used, cannot be viewed as an absolute end; the actual sample size
can be larger or smaller than the estimated one. Beyond statistical aspect, several other important
factors should be considered when estimating sample size, such as ethics, cost, and the amount of
time available for conducting the research.

Dalam diskusi tentang rencana penelitian 2002). Kesalahan sistematis, disebut juga bias (Last,
atau penyajian hasil penelitian, baik di dalam 2001; Rothman, 2002), adalah deviasi hasil-hasil atau
kampus atau di luar kampus, kerap dipersoalkan penarikan kesimpulan dari yang sesungguhnya, atau
ukuran sampel (=sample size) penelitian. Sering proses yang mengakibatkan deviasi itu. Kesalahan
dijumpai pengkaji proposal penelitian, penguji dan sistematis berasal dari dua sumber (Hennekens dan
pembimbing skripsi/tesis/disertasi menilai rendah Buring, 1986; Mercer, 1991; Rothman, 2002): (1) bias,
sebuah penelitian yang tidak mencantumkan rumus dan (2) kerancuan (=confounding). Gambar 1
ukuran sampel. Benarkah besar-kecilnya sampel menyajikan kesalahan sistematis dan kesalahan
merupakan hal penting untuk sebuah penelitian? Jika random, akibatnya terhadap validitas dan presisi
ya jawabnya, apa alasan rasional tentang ke- hasil penelitian, serta peran ukuran sampel.
pentingannya? Bagaimana seharusnya pendekatan Berikut diuraikan sebuah ilustrasi untuk
yang diambil untuk memperkirakan kebutuhan menjelaskan pengertian konsep bias. Secara metodo-
ukuran sampel suatu penelitian? Artikel ini ber- logis mudah dipahami bahwa hasil penelitian ten-
tujuan untuk mengupas sejumlah isu esensial tang hubungan atau pengaruh variabel X (=paparan,
tentang ukuran sampel dan menyajikan kiat untuk perlakuan) terhadap variabel Y (=penyakit, variabel
memperkirakan kebutuhan ukuran sampel. hasil lainnya) tidak absah jika pengukuran variabel-
variabel tersebut tidak dilakukan dengan benar dan
“THE PRIME STUFF”: akurat. Inilah contoh bias yang disebut bias peng-
KESALAHAN SISTEMATIS ukuran (measurement bias). Pengukuran variabel
dengan benar dan akurat merupakan kriteria yang
Sebelum mengupas signifikan tidaknya tidak dapat ditawar-tawar maupun ditinggalkan
menghitung ukuran sampel, perlu diketahui dulu (indispensible) untuk sebuah penelitian yang valid.
prinsip yang harus dipenuhi untuk sebuah penelitian
yang baik. Penelitian yang baik adalah penelitian
yang hasilnya dapat dipercaya, valid (= absah, sahih,
benar), dan teliti (= persis). Untuk prinsip itu, sebuah
penelitian yang baik harus mampu menghindari,
mengatasi, atau mengurangi seminimal mungkin Correspondence:
Dr. Bhisma Murti, MPH, MSc, PhD, Department of Public, UNS
dua jenis kesalahan: (1) kesalahan sistematis, dan (2) University School of Medicine, Surakarta, Jl. Ir Sutami 36A,
kesalahan random (Kleinbaum et al., 1982; Surakarta 57126, Telephone/Facsimile (0271) 664178. Email:
Hennekens dan Buring, 1987; Mercer, 1991; Rothman, murti_bhisma@yahoo.com.
Systematic error Random error
(non-random) error) (chance error)

Bias informasi Validitas Reliabilitas Probability


(bias pengukuran pengukuran sampling
pengukuran) variabel variabel

Bias seleksi Ukuran


sampel

Sampel
Confounding Standard
factor error
(faktor perancu)
Validitas Presisi
estimasi /uji estimasi
Kriteria I: hipotesis Kriteria II:
keabsahan ketelitian
Populasi

Gambar 1. Kesalahan sistematis, kesalahan random, dan akibatnya terhadap validitas


dan presisi hasil penelitian.

Selanjutnya satu hal yang perlu diketahui, terpapar (perokok) berasal dari angkatan bersenjata,
inti metodologis dari penelitian analitik apapun sedang kelompok tak terpapar (bukan perokok) bera-
adalah banding-membandingkan rata-rata (=mean) sal dari populasi umum. Dengan contoh demikian,
atau proporsi dari variabel hasil (=outcome variable) dapatkah peneliti mengharapkan bahwa perkiraan
yang menjadi perhatian penelitian di antara sejumlah yang ia buat tentang besarnya pengaruh merokok
kelompok. Tidak ada yang namanya penelitian terhadap terjadinya infark otot jantung adalah valid
analitik dilakukan tanpa perbandingan. Dalam studi alias sah? Kemungkinan besar tidak. Hampir semua
kohor, kelompok-kelompok dibandingkan berdasar- orang sangat mahfum bahwa rekrutmen tentara dila-
kan status paparannya, yakni kelompok terpapar dan kukan secara ketat antara lain melalui tes kesehatan
kelompok tak terpapar. Dalam studi kasus-kontrol, yang seksama. Implikasinya, dengan mudah dapat
kelompok-kelompok dibandingkan berdasarkan sta- dipahami bahwa rata-rata anggota angkatan bersen-
tus penyakitnya, yakni kelompok kasus dan kelom- jata memiliki status kesehatan yang lebih baik dari
pok kontrol. Dalam studi eksperimental, kelompok- pada rata-rata anggota masyarakat umumnya.
kelompok dibandingkan berdasarkan status per- Karena memiliki tingkat kesehatan yang lebih prima,
lakuannya, yakni kelompok perlakuan dan kelom- maka adalah sangat logis untuk menduga bahwa
pok kontrol. Apabila kelompok-kelompok tersebut risiko untuk terkena infark akibat merokok di kala-
menunjukkan perbedaan dalam mean atau proporsi ngan tentara lebih kecil daripada kelompok mana-
variabel hasil tadi yang cukup bermakna, antara lain pun yang status kesehatannya lebih buruk. Akibat-
dengan bantuan uji statistik, maka disimpulkan nya, dalam contoh penelitian di atas, taksiran tentang
terdapat perbedaan/hubungan/pengaruh variabel. pengaruh merokok akan lebih rendah daripada yang
Di sini terletak poin krusial, yaitu bagaimana memi- sesungguhnya. Bias yang terjadi akibat memilih sub-
lih kelompok pembanding (kelompok kontrol) yang jek-subjek penelitian dari kalangan pekerja yang rata-
benar. Secara metodologis mudah dipahami, bahwa rata memiliki status kesehatan yang lebih baik dari
pemilihan subjek-subjek penelitian dari kelompok- pada populasi umum disebut “healthy worker bias”,
kelompok studi tidak boleh dipengaruhi oleh ke- merupakan salah sebuah bias seleksi (Murti, 2006a),
mungkinan subjek untuk mendapatkan hasil tertentu Di samping bias, kesalahan sistematis lain-
dari variabel hasil. Sebagai contoh, sebuah penelitian nya yang harus diperhatikan bersumber dari faktor
berminat meneliti pengaruh merokok (paparan) ter- ketiga (third variable) yang disebut faktor perancu
hadap terjadinya infark otot jantung (penyakit). Lalu (=confounding factor). Faktor perancu adalah faktor
peneliti memilih subjek-subjek untuk kelompok ketiga yang merupakan faktor risiko terhadap ter-
jadinya penyakit atau variabel hasil yang menjadi random (acak). Berbeda dengan kesalahan sistematis
perhatian penelitian itu, berhubungan dengan papa- yang terjadi akibat kegagalan peneliti dalam memilih
ran atau perlakuan, dan bukan merupakan variabel subjek penelitian yang tepat, mengukur variabel-
antara dalam mekanisme kausal paparan-penyakit. variabel dengan betul, atau mengendalikan pengaruh
Jika peneliti gagal mengendalikan pengaruh faktor faktor perancu, kesalahan random terjadi karena
perancu, maka kesimpulan peneliti tentang perbe- peristiwa yang “unpredictable”, tidak terkait dengan
daan/hubungan/pengaruh variabel juga tidak absah karakteristik peristiwa-peristiwa itu. Jika sebuah
alias tidak valid. Contoh klasik, andaikata seorang penelitian dilakukan berulang-ulang, maka ada
peneliti berminat meneliti pengaruh kebiasaan mem- kemungkinan hasilnya bervariasi, meskipun peneliti
bawa korek api terhadap terjadinya kanker paru. tidak mengubah cara memilih subjek penelitian,
Hasil analisis data menunjukkan bahwa proporsi mengukur variabel, maupun mengendalikan keran-
(insidensi) kanker paru di antara kelompok pem- cuan. Variasi tersebut terjadi hanya karena merupa-
bawa korek api jauh lebih tinggi dan secara statistik kan konsekuensi logis dari proses “sampling”
bermakna ketimbang kelompok bukan pembawa (=mencuplik sebagian dari populasi), karena itu
korek api (sebut saja p= 0.002). Validkah jika peneliti kesalahan random disebut juga variasi random
menarik kesimpulan bahwa membawa korek api (sampling variability), dan salah satu indikator variasi
merupakan faktor risiko terjadinya kanker paru? random adalah standard error (Vogt, 1993).
Tidak. Meskipun p= 0.002 mengandung arti bahwa Intinya, dalam setiap penelitian, kesalahan
kesimpulan itu mengandung kesalahan sangat sistematis membawa akibat lebih serius daripada
rendah, yaitu 2 kesalahan di antara 1000 kesempatan, kesalahan random (Mercer, 1991; Rothman, 2002).
tetapi argumen itu hanya dilandasi premis statistik, Kesalahan sistematis menentukan validitas (=keabsa-
alias keputusan yang dibuat berdasarkan “per- han, kesahihan) penelitian; kesalahan random me-
mainan angka” semata. Secara konseptual tidak ada nentukan presisi (=ketelitian) penaksiran (=estimasi)
teori yang masuk akal yang dapat menjelaskan me- yang dilakukan sebuah penelitian. “There is no point
ngapa membawa korek api bisa meningkatkan to discuss precision when there is no validity”. Tidak ada
kejadian kanker paru. Karena epidemiologi merupa- gunanya secara prematur mendiskusikan presisi pe-
kan penelitian kesehatan, maka yang dimaksudkan nelitian jika temuan penelitian tidak valid. Ibaratnya,
dengan “teori” di sini tentu saja teori yang masuk tidak ada gunanya mempersoalkan mana yang lebih
akal secara biologis (biological plausibility). Selain itu, baik, menembak dengan persis mengenai lensa mata
hampir semua pembawa korek api adalah perokok kanan atau meleset mengenai alis mata kanan seekor
dan hampir semua bukan pembawa korek api adalah kerbau, jika sasaran yang diinginkan sesungguhnya
bukan perokok. Jadi secara metodologis membawa adalah mata kiri kerbau, bukan mata kanan. Sebalik-
korek api berhubungan kuat dengan kebiasan mero- nya, “the presence of validity does not guarantee
kok, dan karena itu sangat mungkin bahwa kebia- precision”. Artinya, keberadaan validitas tidak
saan merokok merupakan penjelasan alternatif ter- dengan sendirinya menjamin adanya ketelitian.
hadap hasil yang menemukan bahwa proporsi
(insidensi) kanker paru di antara kelompok pem- PERLUKAH MENGHITUNG UKURAN SAMPEL?
bawa korek api lebih tinggi daripada kelompok
bukan pembawa korek api. Jadi, kesimpulan yang Intinya, ukuran sampel merupakan salah
menyatakan terdapat hubungan statistik yang sangat sebuah isu yang perlu dipertimbangkan dalam
bermakna antara membawa korek api dan kejadian sebuah penelitian kuantitatif. Ukuran sampel yang
kanker paru (p= 0.002) dan karena itu membawa ideal tidak terlalu kecil, tidak pula terlalu besar.
korek api merupakan faktor risiko terjadinya kanker Sampel terlalu kecil mengakibatkan hasil penelitian
paru adalah kesimpulan yang “secara statistik” benar memiliki presisi (=ketelitian) rendah dalam membuat
tetapi “secara metodologis” salah, karena gagal me- estimasi kekuatan hubungan/pengaruh variabel.
ngendalikan pengaruh kebiasaan merokok sebagai Sampel terlalu kecil juga mengakibatkan kemampu-
faktor perancu. an penelitian rendah dalam menunjukkan hubung-
an/pengaruh variabel ketika hubungan/pengaruh
“THE SECONDARY STUFF”: memang ada. Sebaliknya, sampel terlalu besar berarti
KESALAHAN RANDOM membuang-buang waktu, sumber daya, dan uang,
yang tidak perlu. Selain itu, setiap penelitian, lebih-
Kesalahan random adalah kesalahan penari- lebih menyangkut subjek manusia, selalu berkaitan
kan kesimpulan dalam suatu penelitian yang bersifat dengan etika. Makin besar sampel, makin besar pula
sebuah penelitian bersinggungan dengan masalah satupun orang yang bisa mengatakan bahwa hasil
etika. Sebagai contoh, pada eksperimen, terlalu perhitungan ukuran sampel merupakan harga mati.
banyak subjek yang mendapatkan terapi baru berarti Hanya satu prinsip yang bisa digunakan sebagai
terlalu banyak subjek yang dirugikan oleh terapi pedoman umum, bahwa makin besar sampel makin
yang belum tentu menguntungkan (jika sudah pasti teliti (persis) hasil penaksiran yang dapat diharapkan
menguntungkan tentu tidak perlu diteliti). dari sebuah penelitian, karena penelitian tersebut
Satu prinsip yang harus diketahui, ukuran lebih mampu menyingkirkan kesalahan random,
sampel berkaitan dengan kesalahan random tetapi ceteris paribus (=lain-lain aspek sama). Implikasi lain
tidak berkaitan dengan kesalahan sistematis. Artinya, argumentasi di atas adalah bahwa tidak pada tem-
ukuran sampel yang tepat dapat mengurangi patnya pengkaji proposal penelitian, penguji dan
kesalahan random, tetapi ia tidak ada hubungannya pembimbing skripsi/tesis/disertasi mendewakan
dan tidak bisa mengoreksi kesalahan yang lebih (=mengkultus individukan) ukuran sampel maupun
serius dan merusak kredibilitas penelitian yang rumus ukuran sampel, seperti yang kerap terjadi
disebut kesalahan sistematis. Contoh, meskipun selama ini. Selain aspek statistik, ada beberapa aspek
kesalahan random secara teoretis dapat dikurangi lain yang juga perlu diperhatikan dalam menaksir
dengan cara meningkatkan ukuran sampel seratus kebutuhan ukuran sampel, yaitu aspek etika, biaya,
kali dari 30 subjek menjadi 3000 subjek penelitian, dan waktu untuk melakukan penelitian (Murti,
tetapi apabila variabel-variabel penelitian diukur 2006b)
dengan instrumen yang salah, maka tetap saja
penelitian menghasilkan kesimpulan salah alias tidak MENAKSIR UKURAN SAMPEL UNTUK
valid. Demikian juga, andaikata sebuah eksperimen MENGUJI HIPOTESIS DUA MEAN POPULASI
dengan ukuran sampel 15 subjek menunjukkan
terdapat pengaruh perlakuan yang secara statistik Berikut disajikan contoh menaksir kebutu-
bermakna, maka jangan pula terburu-buru mengata- han ukuran sampel untuk menguji hipotesis satu sisi
kan bahwa penelitian itu hebat hanya karena dengan Ho: µ1= µ2 versus Ho: µ1>µ2. Tujuannya adalah
ukuran sampel kecil saja bisa dihasilkan kesimpulan untuk memeragakan bahwa ukuran sampel sebagai-
yang secara statistik bermakna. Hasil penelitian mana yang dihitung dari rumus ukuran sampel
dengan ukuran sampel kecil atau besar yang menun- bukan harga mati yang bersifat absolut. Contoh:
jukkan kemaknaan statistik tetap saja merupakan Bulliyya (2002) meneliti pengaruh konsumsi ikan laut
limbah ilmiah jika penelitian itu gagal mengendali- terhadap distribusi fraksi lipoprotein kolesterol
kan sebagian besar dari kesalahan sistematis. serum. Dengan sampel 500 subjek konsumen ikan
Dalam literatur dikenal sejumlah rumus laut dan 500 subjek non-konsumen ikan laut, uji t
standar untuk menghitung ukuran sampel (misalnya, menemukan bahwa rata-rata nilai LDL-C serum
Cochran, 1977; Rothman dan Boyce, 1982; Kleinbaum (faktor risiko aterogenik) secara signifikan lebih
et al., 1982; Kelsey, 1986; Harris, 1985; WHO, 1986; rendah dan rata-rata nilai HDL-C serum secara
Kothari, 1990; Lemeshow et al., 1990; Lwanga dan signifikan lebih tinggi di antara konsumen ikan
Lemeshow, 1997; Tabachnick dan Fidell, 1996; Hair et ketimbang non-konsumen ikan. Bagaimana menaksir
al., 1998; Lohr, 1999; Thabane, 2005), yang jika kebutuhan ukuran sampel untuk kasus seperti
diterus-teruskan referensinya bisa sepanjang “The contoh penelitian di atas?
Long And Winding Road” The Beatles. Tetapi satu hal Contoh kasus di atas menguji beda rata-rata
perlu diketahui adalah bahwa sesungguhnya semua LDL-C dan HDL-C dua kelompok, maka rumus
produk rumus ukuran sampel tersebut bukan me- ukuran sampel untuk menguji hipotesis satu sisi
rupakan harga mati. Sebab nilai dari hampir semua beda dua mean populasi (Lemeshow et al., 1990)
faktor-faktor yang diperhitungkan dalam rumus adalah:
ukuran sampel, baik yang terletak pada pembilang 2
2σ 2  Z 1 − α + Z 1 − β 
(numerator) maupun penyebut (denominator) diten-  
n= (1)
tukan menurut kemauan peneliti. Dengan kata lain, (μ 1 − μ 2 )2
angka yang dimasukkan ke dalam rumus ukuran
sampel “suka-suka” peneliti. Istilah akademik untuk
di mana μ1 − μ 2 merupakan beda mean yang di-
bahasa gaul “suka-suka” adalah arbitrary (Rothman,
1986; Greenhalgh, 1997). Implikasinya, meskipun perkirakan. Varians σ2 merupakan varians populasi
rumus ukuran sampel yang digunakan peneliti yang tidak diketahui nilainya, tetapi dapat diper-
sudah tepat untuk masalah penelitiannya, tidak ada
kirakan dari studi awal menggunakan s 2p , dengan dengan diet tinggi sodium dan sampel dengan diet
rendah sodium. Dengan asumsi parameter lainnya
cara menggabungkan (pooling) varians dua sampel, sama (ceteris paribus), berapa besar sampel yang
s 2 dan s 2 , dengan rumus sebagai berikut
1 2 dibutuhkan?
(Lemeshow et al., 1990; Pagano dan Gauvreau, 2000): Jawab: Dengan menggunakan rumus (3)
dapat dihitung: n= 2(125.1)(1.96+ 1.28)2/52 = 105.1.

2 (n1 −1)s12 + (n 2 −1)s 22 Jadi diperlukan sampel 106 subjek untuk masing-
sp = masing kelompok.
(n1 −1)+ (n 2 −1) (2) Dari rumus (1) dan (3) dapat ditarik pelaja-
ran sebagai berikut. Pertama, jika penelitian me-
di mana n1 dan n2 adalah ukuran-ukuran sampel nyangkut data kontinu seperti contoh kasus di atas,
dalam studi awal. maka ukuran sampel tergantung perbedaan mean
Contoh: Sebuah studi ingin menguji hipo- variabel hasil pada kelompok-kelompok populasi
tesis tentang pengaruh diet rendah garam terhadap yang dibandingkan. Makin kecil perbedaan mean
tekanan darah sistolik (TDS). Dari studi awal variabel hasil antara kelompok-kelompok yang di-
diperoleh simpang baku TDS di antara komunitas badingkan terpapar, makin besar kebutuhan ukuran
dengan diet tinggi sodium 12 mmHg, di antara sampel. Demikian pula ukuran sampel tergantung
komunitas dengan rendah sodium 10.3 mmHg. Jika varians nilai masing-masing subjek terhadap mean.
α=0.10 dan β=0.10, berapa besar ukuran sampel Makin besar varians, makin besar kebutuhan sampel.
diperlukan untuk dapat mendeteksi perbedaan mean Persoalannya, tidak ada angka yang pasti tentang
TDS sebesar 5 mmHg antara kedua komunitas perbedaan mean maupun varians tersebut (sebab
tersebut? kalau ada angka pasti, tentu penelitian yang sedang
Jawab: Varians dari masing-masing kelom- direncanakan tidak perlu dilakukan!). Jadi angka-
pok digabung menggunakan rumus (2):
[ ]
angka tersebut diperkirakan oleh peneliti, berdasar-
s 2p = s12 + s 22 /2 = [144.0 + 106.1]/2 = 125.1 . Dengan kan penelitian awal (pilot study) atau penelitian
serupa di tempat/populasi lain yang serupa (Lenth,
formula (1) kemudian dihitung ukuran sampel, 2001).
sebagai berikut: n= 2(125.1)(1.64+ 1.28)2/52 = 85.3. Kedua, dalam memperkirakan ukuran
Jadi diperlukan sampel 86 subjek untuk masing- sampel untuk pengujian hipotesis, baik kesalahan
masing kelompok. tipe I (α) maupun kesalahan tipe II (β) harus diper-
Pendekatan serupa dapat digunakan untuk hitungkan. Sebaliknya jika tujuan penelitian bukan
memperkirakan ukuran sampel untuk uji hipotesis menguji hipotesis, melainkan menaksir (=estimasi)
dua sisi tentang dua mean dari dua populasi: Ho: µ1= besarnya perbedaan/hubungan/pengaruh, maka
µ2 versus Ho: µ1±µ2. Uji hipotesis dua sisi ukuran sampel cukup memperhitungkan kesalahan
merupakan pilihan konservatif, dipilih ketika arah tipe I, yaitu seberapa besar peran peluang yang dapat
pengaruh faktor penelitian terhadap variabel hasil diterima ketika menaksir besarnya perbedaan/hubu-
secara teoretis belum jelas, bisa meningkatkan, bisa ngan/pengaruh. Dalam hal ini peneliti bebas untuk
menurunkan, atau tidak berpengaruh terhadap memilih α=0.01, 0.05, dan sebagainya. Meskipun
variabel hasil. Karena terdapat dua hipotesis bebas, harus disadari implikasinya terhadap peng-
alternatif, maka nilai ambang α untuk menolak atau ambilan keputusan tentang hipotesis atau taksiran
tidak menolak Ho dibagi dua, terletak di sisi kanan parameter. Pemilihan α berkaitan dengan kesalahan
dan kiri distribusi normal teoretis Gauss. Rumus tipe I, yaitu besarnya kesalahan menyimpulkan
ukuran sampel untuk uji hipotesis dua sisi perbe- terdapat perbedaan/hubungan/pengaruh, ketika
daan dua mean dari dua populasi (Lemeshow et al., sesungguhnya tidak ada. Makin kecil α, makin kecil
1990) adalah: kesalahan tipe I yang bisa ditoleransi, makin besar

n=
[
2σ 2 Z12− α/2 + Z1 − β ]2 statistik uji Z yang dibutuhkan untuk menyimpulkan
terdapat perbedaan/hubungan/pengaruh yang ber-
makana, makin besar kebutuhan ukuran sampel.
(μ 1 − μ 2 )2 Kemudian, bedakan antara ukuran sampel untuk uji
(3) hipotesis satu sisi dan dua sisi. Jika hipotesis bersifat
Contoh: Peneliti berminat melakukan uji hipotesis satu sisi, maka gunakan Z1− α . Sebaliknya, jika
dua sisi terhadap perbedaan mean TDS antara sampel hipotesis dua sisi, maka gunakan Z1 − α/2 . Demikian
juga peneliti bebas untuk memilih β, misalnya 0.10, yang diantisipasi oleh peneliti; (6) Pertimbangkan
0.15, 0.20, dan sebagainya. Pemilihan β berkaitan aspek etika, biaya, dan waktu yang tersedia untuk
dengan kesalahan tipe II, yaitu besarnya kesalahan melakukan sebuah penelitian.
menyimpulkan tidak terdapat perbedaan/hubu- Pertama, formula ukuran sampel harus
ngan/pengaruh, ketika sesungguhnya ada. Makin menyesuaikan tujuan dan desain penelitian. Contoh,
kecil β, makin kecil kesalahan tipe II yang dapat jika tujuan penelitian adalah menguji hipotesis
ditoleransi, makin besar statistik uji Z, makin besar perbedaan pengaruh penurunan gula darah oleh
kebutuhan perkiraan ukuran sampel. Kuasa statistik suatu obat anti-diabetik oral, maka tentu saja rumus
(= statistical power) penelitian adalah 1-β, misalnya yang relevan adalah rumus ukuran sampel yang
0.80, 0.85, 0.90, dan sebagainya. Pemilihan 1-β ber- dibutuhkan untuk menguji hipotesis perbedaan mean
kaitan dengan seberapa besar peluang yang diharap- antara dua atau lebih populasi, bukan rumus untuk
kan untuk mendeteksi perbedaan/hubungan/penga- menaksir (= estimate) besarnya perbedaan itu.
ruh, ketika pengaruh itu memang ada. Makin besar Sebaliknya, jika tujuan penelitian adalah menaksir
kuasa statistik yang diinginkan, makin besar ukuran kadar nikotin dalam darah para perokok, atau
sampel yang dibutuhkan. menaksir kadar timah hitam dalam darah kelompok
Ketiga, ukuran sampel sebagaimana yang masyarakat yang bekerja di sekitar ruas-ruas jalan di
dihitung dari rumus ukuran sampel bukan merupa- Jakarta yang padat kendaraan bermotor, maka
kan harga mati. Nilai dari hampir semua faktor- rumus yang sesuai adalah rumus ukuran sampel
faktor yang diperhitungkan dalam rumus ukuran untuk menaksir mean sebuah populasi.
sampel, baik yang terletak pada pembilang (numera- Kedua, skala pengukuran variabel dependen
tor) maupun penyebut (denominator) ditentukan menentukan pemilihan rumus ukuran sampel, yakni
menurut kemauan peneliti, bersifat arbitrary apakah rumus ukuran sampel untuk membanding-
(Rothman, 1986; Greenhalgh, 1997). Implikasinya, kan perbedaan proporsi atau perbedaan mean
meskipun rumus ukuran sampel yang digunakan (Thabane, 2005). Contoh, jika variabel dependennya
peneliti sudah tepat untuk masalah penelitiannya, adalah status merokok, yang terbagi ke dalam dua
tidak ada satupun orang yang bisa mengatakan kategori: perokok kini, dan bukan perokok/mantan
bahwa hasil perhitungan ukuran sampel merupakan perokok, maka rumus yang sesuai adalah rumus
angka mutlak yang harus dipenuhi. Hasil penaksiran ukuran sampel yang digunakan untuk menaksir
ukuran sampel dengan rumus harus dipandang proporsi, bukan mean dalam suatu populasi.
sebagai “ancar-ancar” dan tidak harus diikuti dengan Ketiga, dari berbagai macam rumus ukuran
otak fanatik. Fakta ini umumnya tidak dipahami sampel, intinya dapat disimpulkan pola umum
banyak orang yang tidak mengerti hakikat statistik. sebagai berikut. Rumus untuk menaksir beda mean
Statistik bukanlah ilmu pasti maupun ilmu dewa. maupun beda proporsi selalu mengandung kom-
ponen d yang menunjukkan presisi taksiran yang
STRATEGI UNTUK MENENTUKAN diinginkan. Komponen d tersebut diletakkan pada
KEBUTUHAN UKURAN SAMPEL bagian penyebut dari rumus. Pada saat yang sama,
rumus untuk menaksir beda mean mengandung
Ditegaskan di muka bahwa dalam literatur komponen σ2 (=varians) yang diletakkan pada bagian
dikenal aneka rumus ukuran sampel. Pertanyaannya, pembilang dari rumus. Karena masalahnya adalah
bagaimana memilih rumus yang tepat? Dalam menaksir sejauh mana terdapat beda mean atau beda
banyak kasus, peneliti kerap memerlukan lebih dari proporsi, maka kesalahan pengambilan keputusan
sebuah pendekatan menghitung kebutuhan ukuran yang relevan adalah kesalahan tipe I (=α), yakni
sampel. Berikut disajikan strategi untuk menentukan menyimpulkan ada perbedaan/hubungan/pengaruh
kebutuhan ukuran sampel (Murti, 2006b): (1) variabel. padahal sesungguhnya tidak ada perbedaan
Sesuaikan rumus ukuran sampel yang dipilih dengan itu. Jadi hanya kesalahan tipe I yang perlu diper-
tujuan dan desain penelitian; (2) Sesuaikan rumus hitungkan dan dimasukkan ke dalam rumus untuk
ukuran sampel dengan skala pengukuran variabel menaksir beda mean atau beda proporsi itu, yakni
dependen; (3) Pilih tingkat kesalahan tipe I, tipe II, diletakkan pada bagian pembilang. Sedang rumus
dan presisi yang diinginkan; (4) Mulailah mem- untuk menguji hipotesis beda mean atau proporsi
perkirakan ukuran sampel dengan pendekatan yang selalu mengandung perkiraan beda mean atau beda
sederhana meskipun untuk problem yang kompleks; proporsi itu yang diletakkan pada bagian penyebut
(5) Sesuaikan hasil taksiran ukuran sampel dengan dari rumus. Karena masalahnya adalah menguji
keadaan-keadaan yang lebih kompleks sebagaimana apakah terdapat atau tidak terdapat beda mean
ataupun beda proporsi, maka kesalahan pengambi- sehingga sebagian data tidak dapat dianalisis; (3)
lan keputusan yang relevan adalah kesalahan yang berbagai sebab lainnya yang tidak terduga tetapi
mengakomodasi dua kemungkinan tersebut, yaitu mengakibatkan ukuran sampel menjadi berkurang.
kesalahan tipe I maupun II (=β). Kesalahan tipe II Jadi, seperti disebutkan di muka, pada banyak kasus,
adalah menyimpulkan tidak ada perbedaan/hu- peneliti perlu menggunakan sejumlah rumus ukuran
bungan/pengaruh variabel, padahal sesungguhnya sampel untuk menentukan kebutuhan ukuran
terdapat perbedaan itu. sampel.
Keempat, dianjurkan untuk mulai dengan Keenam, di samping aspek statistik, penak-
pendekatan perhitungan ukuran sampel yang seder- siran ukuran sampel perlu mempertimbangkan
hana sebelum dikembangkan kepada problem yang aspek etika, biaya dan waktu. Setiap penelitian yang
kompleks (Thabane, 2005). Sebagai contoh, jika tuju- menggunakan subjek manusia perlu memperhatikan
an penelitian adalah menaksir hubungan sejumlah implikasi etis dari penelitian. Jika suatu perlakuan
variabel independen seperti “social capital”, income, diperkirakan banyak memberikan manfaat tetapi
tingkat pendidikan, usia, status asuransi, dan tempat juga banyak memberikan kerugian, maka skala
tinggal, dengan keputusan orang untuk merokok, eksperimen tentu saja terbatas. Peneliti tidak dapat
maka salah satu pendekatan adalah menggunakan banyak merekrut subjek penelitian untuk diberi
taksiran kekuatan hubungan variabel-variabel dalam perlakuan. Demikian pula, karena anggaran dan
populasi di dalam rumus ukuran sampel. Tetapi sumber daya selalu terbatas, maka peneliti perlu
pendekatan seperti itu tentu menjadi tidak praktis berusaha mendapatkan sampel yang efisien, dalam
karena terdapat banyak variabel independen, yang arti mampu memberikan informasi sebanyak-
berarti terdapat sejumlah kemungkinan hubungan banyaknya. Karena untuk mendapatkan subjek sakit
variabel-variabel yang saling bersaing untuk diguna- atau subjek terpapar lebih sulit dan mahal ketimbang
kan sebagai ancar-ancar dalam rumus ukuran subjek kontrol, maka perbandingan yang efisien
sampel. Pendekatan yang lebih sederhana adalah adalah jumlah kasus atau terpapar relatif lebih kecil
menggunakan variabel dependen keputusan mero- dibandingkan dengan jumlah kontrol atau tak
kok yang terukur dalam skala dikotomi sebagai titik terpapar.
awal (starting point) dalam memperkirakan rumus
ukuran sampel. Dalam contoh ini, informasi tentang KESIMPULAN
prevalensi merokok dapat digunakan sebagai “ancar-
ancar” proporsi merokok dalam rumus ukuran Ukuran sampel merupakan salah sebuah isu
sampel untuk menaksir proporsi merokok pada yang perlu dipertimbangkan tetapi bukan yang
sebuah populasi (Murti, 2005). terpenting dari sebuah penelitian. Persoalan yang
Kelima, setelah mendapatkan taksiran ukur- jauh lebih krusial dan perlu dikaji dengan kritis dari
an sampel melalui suatu pendekatan rumus yang penelitian apapun adalah validitas (= keabsahan)
sederhana, maka ukuran sampel tersebut perlu penelitian. Validitas penelitian merujuk kepada
disesuaikan dengan keadaan yang lebih kompleks sejauh mana suatu penelitian mampu menyingkirkan
sebagaimana yang diantisipasi oleh peneliti. Sebagai atau mengatasi kesalahan sistematis, baik yang ber-
contoh, teknik pencuplikan probabilistik yang paling sumber dari bias maupun kerancuan (=confounding).
mendasar sebagai langkah awal adalah “”simple Ukuran sampel merujuk kepada kesalahan random,
random sampling” (SRS). Apabila desain pencuplikan ia tidak ada hubungannya dan tidak dapat memper-
yang dipilih peneliti adalah “stratified random baiki kesalahan sistematis. Makin besar ukuran
sampling”, maka peneliti perlu memperhitungkan sampel, makin kecil kesalahan random, makin teliti
“design effect” sebagai akibat menggunakan skema hasil penaksiran yang dilakukan penelitian tentang
yang bukan “simple random sampling” (non-SRS), agar perbedaan/hubungan/pengaruh variabel. Hasil per-
dapat diperoleh taksiran dengan presisi yang hitungan ukuran sampel dengan rumus apapun
kurang-lebih sama dengan taksiran SRS (Lohr, 1999). bukan merupakan harga mati, artinya boleh lebih
Demikian pula penyesuaian lebih lanjut perlu dan boleh kurang dari taksiran yang dihasilkan dari
dilakukan untuk memperhitungkan kemungkinan rumus. Selain aspek statistik, sejumlah aspek lainnya
berkurangnya ukuran sampel karena berbagai sebab: perlu dipertimbangkan dalam menaksir ukuran
(1) “non-response”, baik unit-non response maupun sampel, yakni etika, biaya, dan waktu yang tersedia
item-non response yang mengakibatkan “missing untuk melakukan penelitian.
values”, (2) kesalahan pengukuran dan data entry
yang mengakibatkan “extreme values” atau “outliers”
KEPUSTAKAAN Lwanga SK, Lemeshow S 1997. Sample size determination in
health studies. Geneva: World Health Organization.
Bulliyya G 2002. Influence of fish consumption on the Mercer D 1991. Intermediate epidemiology (Coursework).
distribution of serum cholesterol in lipoprotein New Orleans, LA: Tulane School of Public Health and
fractions: comparative study among fish-consuming Tropical Medicine.
and non-fish-consuming populations Asia Pacific J Clin Murti B 2005. The family as health producer in Indonesia:
Nutr 11(2): 104–111 An examination using Grossman’s model and its
Cochran WG 1977. Sampling technique. New York: John extensions (Disertasi). Centre for Clinical Epidemio-
Wiley & Sons. logy and Biostatistics, University of Newcastle,
Greenhalgh T 1997. How to read a paper: Statistics for the Australia.
non-statistician. II: "Significant" relations and their _______ 2006a. Prinsip dan metode riset epidemiologi. Edisi ke
pitfalls. BMJ, 315:422-425 (16 August) 3. Yogyakarta: Gadjah Mada University Press.
Hair JE, Jr, Anderson RE, Tatham RL, Black WC 1998. _______ 2006b. Desain dan ukuran sampel untuk penelitian
Multivariate data analysis. Upper Saddle River, NJ: kuantitatif dan kualitatif di bidang kesehatan. Yogyakarta:
Prentice Hall. Gadjah Mada University Press.
Harris RJ 1985. A primer of multivariate statistics (2nd ed). Pagano M, Gauvreau K 2000. Principles of biostatistics.
New York: Academic Press. Pacific Grove, CA: Duxbury
Hennekens CH, Buring JE 1987. Epidemiology in medicine. Rothman KJ dan Boyce JD 1982. Epidemiologic Analysis with
Boston: Little, Brown and Company. a Programmable Calculator (2nd ed.). Brookline, MA:
Kelsey JL, Thompson WD dan Evans AS 1986. Methods on Epidemiology Resources Inc.
observational epidemiology. New York: Oxford Rothman KJ 1986. Modern epidemiology. Boston: Little,
University Press. Brown, and Company.
Kleinbaum DG, Kupper LL dan Morgenstern H 1982. __________. 2002. Epidemiology: An introduction. New York:
Epidemiologic research: Principles and quantitative Oxford University Press.
methods. New York: Van Nostrand Reinhold. Tabachnick BG, Fidell LS 1996. Using multivariate statistics
Kothari CR 1990. Research methodology: methods and (3rd ed). New York: Harper-Collins.
techniques. New Delhi: Wiley Eastern Limited. Thabane L 2005. Sample size determination in clinical trials.
Last JM 2001. A dictionary of epidemiology. New York: Center for Evaluation of Medicine. Hamilton, ON.
Oxford University Press, Inc. http:// www.lehanthabane.com.
Lemeshow S, Hosmer Jr DW, Klar J, Lwanga SK 1990. WHO (World Health Organization) 1986. Sample size
Adequacy of sample size in health studies. New York: determination: A user's manual. Geneva: Epidemiological
John Wiley & Sons. and Statistical Methodology Unit, World Health
Lenth RV 2001. Some practical guidelines for effective sample- Organization.
size determination. Department of Statistics, University
of Iowa.
Lohr SL 1999. Sampling: Design and analysis. Pacific
Grove, CA: Duxbury Press.

Anda mungkin juga menyukai