Populasi Sampel Prof Bhisma Murti PDF
Populasi Sampel Prof Bhisma Murti PDF
PENDAHULUAN
Temuan riset kesehatan masyarakat ditujukan untuk memperoleh kesimpulan umum yang
valid tentang populasi manusia, bukan orang per orang atau kelompok kecil manusia.
Persoalannya, tidak mungkin peneliti mengamati semua subyek dalam populasi yang
sangat besar untuk membuat kesimpulan tentang karakteristik maupun fenomena yang
ada pada populasi itu. Peneliti hanya dapat mengamati sebagian dari populasi besar, yang
dinamakan sampel. Jika peneliti memilih sampel dengan tepat, maka penaksiran tentang
distribusi dan hubungan paparan-penyakit tidak jauh meleset.
Tutorial ini dimulai dengan pengantar tentang alasan melakukan pencuplikan, dan
menjelaskan konsep-konsep dasar populasi, sampel, dan pencuplikan. Kemudian Tutorial
ini mendeskripsikan kategorisasi desain pencuplikan, mengupas jenis-jenis teknik
pencuplikan, serta mengklarifikasi sejumlah prinsip dan konsep seputar pencuplikan yang
sering dikacaukan.
Sebelum membahas aspek-aspek di atas, satu hal perlu diketahui. Terma elemen,
subyek, anggota, individu, unit, item, akan digunakan secara silih-berganti untuk merujuk
kepada pengertian yang sama – yaitu, bagian terkecil dari populasi yang secara sendiri-
sendiri atau kelompok (klaster) merupakan materi untuk dicuplik membentuk sampel. Mari
kita mulai saja perjalanan kita.
Inferensi
Populasi
Sampel
Pencuplikan (sampling)
Populasi
Populasi Populasi
sasaran eksternal
Populasi Validitas
sumber eksternal
Validitas
internal
Inferensi
statistik
Sampel
(populasi studi)
Kelompok Kelompok
studi studi
Populasi Sasaran
Populasi sasaran (populasi target, reference population) (Last, 2001; Hennekens dan
Buring, 1987; Mercer, 1991; Kleinbaum et al., 1982) – merupakan keseluruhan subyek,
item, pengukuran, yang ingin ditarik kesimpulan oleh peneliti melalui inferensi. Tujuan
utama riset adalah untuk memperoleh gambaran distribusi (epidemiologi deskriptif) atau
penjelasan tentang fenomena hubungan paparan-penyakit (epidmiologi analitik) yang
terjadi pada populasi sasaran. Sejauh mana temuan-temuan tentang distribusi atau
hubungan paparan-penyakit seperti ditunjukkan oleh statistik sampel adalah sahih untuk
digunakan menarik inferensi tentang parameter yang sama pada populasi sasaran disebut
validitas internal.
Contoh: Dalam suatu studi kohor pengaruh kontrasepsi oral (OC) terhadap infark
otot jantung (MI), populasi sasarannya adalah semua wanita Indonesia keturunan Cina
berusia 25–49 tahun yang tinggal di perkotaan (urban). Perhatikan Gambar 7.2. tentang
populasi dalam riset epidemiologi.
Populasi Sumber
Populasi sumber (source population, actual population) (Mercer, 1991; Kleinbaum et al.,
1982) merupakan himpunan subyek dari populasi sasaran yang digunakan sebagai sumber
pencuplikan subyek penelitian. Contoh: Populasi sasaran studi OC dan MI adalah wanita
Indonesia keturunan Cina berusia 25–49 tahun yang tinggal di perkotaan. Maka peneliti
dapat menentukan populasi sumber berupa populasi yang memenuhi kriteria tersebut,
tinggal di sejumlah kota yang terpilih (dus tidak semua kota di Indonesia), dan
mengunjungi klinik keluarga berencana (KB).
Prinsipnya, populasi sumber memiliki karakteristik yang sama dengan populasi
sasaran. Jikalau terdapat karakteristik yang berbeda (misalnya, mengunjungi atau tidak
mengunjungi klinik KB) maka harus diyakinkan perbedaan itu tidak berhubungan dengan
pemakaian OC maupun kejadian MI. Jika kunjungan ke klinik KB berhubungan dengan
pemakaian OC, dan peneliti memutuskan untuk menggunakan pengunjung klinik KB saja
(dan tidak menggunakan bukan pengunjung klinik KB) sebagai populasi sumber, maka
inferensi hasil studi hanya valid untuk “subset” populasi sasaran tersebut, yakni populasi
wanita Indonesia keturunan Cina berusia 25–49 tahun yang tinggal di perkotaan dan
pengunjung klinik KB.
Dari populasi sumber dapat dibuat kerangka pencuplikan (sampling frame), yaitu
daftar semua subyek dalam populasi sumber yang digunakan sebagai basis pemilihan
subyek ke dalam sampel.
Sampel
Sampel (study population) (Last, 2001; Hennekens dan Buring, 1987; Kleinbaum et al.,
1982) merupakan sebuah subset yang dicuplik dari populasi, yang akan diamati atau
diukur peneliti. Perhatikan Tabel 7.1, pencuplikan sampel dapat dilakukan secara random
atau non-random, dengan restriksi atau tanpa restriksi pemilihan subyek.
Dalam studi epidemiologi dikenal kriteria restriksi pemilihan subyek yang disebut
eligibility criteria – pernyataan eksplisit tentang syarat-syarat subyek untuk dapat
dimasukkan ke dalam sampel. Kriteria eligibilitas terdiri dari kriteria inklusi (kriteria
dimasukkan) dan kriteria eksklusi (kriteria dikeluarkan).
Beberapa di antara anggota sampel yang memenuhi syarat mungkin tidak bersedia
untuk berpartisipasi, menarik diri dari partisipasi, atau hilang selama follow up
pengamatan. Proporsi subyek dalam sampel yang bersedia ikut serta dalam penelitian
disebut tingkat partisipasi (response rate, participation rate). Non-partisipan dapat
mengancam validitas, disebut non-response bias (withdrawal bias, loss to follow up bias)
(Gerstman, 1998).
Tingkat partisipasi dikatakan dapat diterima (acceptable) jika lebih besar dari 85%,
terlalu rendah jika kurang dari 50% (Agudo dan Gonzalez, 1999). Contoh, hingga 40 tahun
follow-up, studi kohor Doll, Hill, dan Peto di Inggris tentang hubungan merokok dan
kematian karena kanker paru dengan sangat mengesankan mampu mempertahankan 94%
dari keseluruhan 40,000 subyek penelitian yang direkrut sejak 1951 (Doll dan Peto, 1976;
Doll et al., 1994).
Populasi Eksternal
Populasi eksternal (external population) adalah populasi yang lebih luas atau di luar
populasi sasaran tetapi peneliti masih berminat membuat generalisasi (ekstrapolasi)
temuan riset (Gerstman, 1998; Kleinbaum et al, 1982). Tujuan utama riset epidemiologi
adalah memperoleh gambaran distribusi penyakit, atau penjelasan tentang hubungan
paparan-penyakit pada populasi sasaran. Kadang-kadang peneliti masih ingin
mengekstrapolasikan hasil risetnya di luar populasi sasaran – disebut populasi eksternal.
Sejauh mana temuan-temuan tentang karakteristik (epidemiologi deskriptif) atau
hubungan paparan-penyakit (epidemiologi analitik) seperti ditunjukkan oleh statistik
sampel adalah sahih untuk digunakan menarik inferensi tentang parameter yang sama
pada populasi eksternal disebut validitas eksternal (generalisasi).
Contoh: Andaikata sebuah studi menemukan bahwa pemakaian OC meningkatkan
risiko terkena MI pada wanita Indonesia perkotaan keturunan Cina berusia 25–49 tahun,
ada kemungkinan peneliti ingin memperluas kesimpulan itu bagi populasi wanita Indonesia
pribumi perkotaan berusia 25–49 tahun – maka populasi ini merupakan populasi eksternal.
Satu hal perlu diingat, generalisasi temuan penelitian kepada populasi eksternal
dilakukan berdasarkan keputusan (judgment) peneliti. Tidak ada satu perangkat
statistikpun dapat digunakan untuk menentukan validitas eksternal (Last 2001; Rothman,
1986).
Kohor
Mula-mula arti kohor (cohort) adalah sekelompok orang yang lahir dalam tahun yang sama
(cohort at birth) (Streiner et al., 1989). Kini terma kohor digunakan lebih luas, merujuk
kepada kelompok subyek penelitian yang di identifikasi pada suatu titik waktu memiliki
sejumlah atribut (baca: ciri-ciri!) yang sama, lantas diamati sepanjang suatu periode waktu
untuk dideteksi timbulnya kasus baru penyakit.
Dua jenis kohor (Rothman, 2002, Kleinbaum et al., 1986): (1) Kohor tertutup; dan
(2) Kohor terbuka. Kohor tertutup (closed cohort, fixed cohort) merupakan kohor dimana
tidak ada lagi subyek baru dapat dimasukkan ke dalam sampel setelah dimulainya
pengamatan. Sebaliknya selama follow-up pengamatan bisa saja jumlah subyek berkurang
akibat tidak lagi bersedia berpartisipasi dalam penelitian, pindah dari area penelitian,
meninggal, atau bentuk-bentuk lain kegagalan kelangsungan partisipasi. Karena diikuti
sepanjang waktu, umumnya rata-rata umur sebuah kohor akan meningkat sesuai dengan
meningkatnya durasi follow-up.
Kohor terbuka (open cohort, dynamic cohort, dynamic population) merupakan
kohor dimana anggotanya dapat saja berubah sepanjang waktu, karena sejumlah anggota
populasi datang dan pergi sepanjang periode penelitian. Sebagai contoh, fluoridasi air
minum sudah sejak setengah abad silam dianjurkan di Inggris dan AS untuk mencegah
karies gigi. Di samping bermanfaat bagi gigi, intake fluorida juga meningkatkan
mineralisasi tulang, dalam jangka panjang berpengaruh protektif bagi kerangka tubuh.
Tetapi temuan kontroversial akhir-akhir ini menunjukkan kemungkinan pengaruh negatif
jangka panjang fluoridasi yang mengakibatkan fluorosis, selanjutnya meningkatkan risiko
osteoporosis dan fraktura tulang panggul (hip fracture) (Rosen, 2000).
Jika populasi adalah penduduk bertempat tinggal di sejumlah kabupaten selama
periode waktu – katakanlah dari tahun 2003 hingga 2013, maka populasi tersebut
dikatakan dinamik, karena ada penduduk baru dan ada yang pindah. Ukuran dan distribusi
umur populasi dinamik bisa saja tetap sepanjang waktu pengamatan, maka populasi
dinamik itu dikatakan stabil. Dalam studi Rosen (2000) tentang hubungan fluoridasi
dengan osteoporosis di atas perlu memperhitungkan umur, sebab kejadian ostoporosis
dan patah tulang panggul tergantung umur, sedang umur berhubungan dengan tingkat
(akumulasi) fluoridasi, sehingga umur merupakan faktor perancu (confounding factor)
yang harus dikontrol pengaruhnya.
DESAIN PENCUPLIKAN
Desain pencuplikan (sampling design) merupakan rancangan yang dibuat peneliti untuk
memperoleh sampel dari seluruh anggota populasi. Desain pencuplikan merupakan bagian
penting dari desain penelitian (research design), karena itu keduanya harus konsisten.
Mengapa repot-repot merancang pencuplikan? Ada dua alasan untuk “repot”.
Pertama, memilih subyek penelitian secara gegabah akan mengakibatkan kesalahan
sistematis yang disebut bias seleksi (selection bias). Contoh: kelompok-kelompok studi
yang akan diperbandingkan dalam studi analitik - baik studi potong-lintang, kasus-kontrol,
kohor, maupun eksperimen – intinya harus sebanding dalam hal distribusi faktor-faktor di
luar paparan, agar penilaian hubungan antara paparan dan penyakit tersebut valid. Kedua,
ukuran sampel mempengaruhi presisi penelitian; ukuran sampel yang tidak cukup besar
akan memperbesar kesalahan random (random error).
Tabel 7.1. menyajikan kategori desain pencuplikan berdasarkan dua kriteria –
randomness dan restriksi pemilihan subyek. Berdasarkan kriteria random, cara
pencuplikan dapat dibagi dua - pencuplikan random (pencuplikan probabilitas) dan
pencuplikan non-random (pencuplikan non-probabilitas). Berdasarkan kriteria restriksi
pemilihan subyek, cara pencuplikan dibagi dua – pencuplikan tanpa kriteria retriksi, dan
pencuplikan dengan kriteria restriksi.
PENCUPLIKAN RANDOM
Berdasarkan kriteria restriksi, pencuplikan random dapat dibagi dua kategori: (1)
Pencuplikan random sederhana; dan (2) Pencuplikan random kompleks.
Pencuplikan random sederhana (simple random sampling) dari suatu populasi terbatas
(finite population) merupakan metode pemilihan sampel dimana masing-masing item
(elemen) dari keseluruhan populasi memiliki peluang yang sama dan independen (baca:
tidak bergantung!) untuk terpilih ke dalam sampel.
Prosedur
pencuplikan Sampel
Populasi
random
Pencuplikan random banyak digunakan dalam studi deskriptif untuk memberikan sampel
yang representatif terhadap populasi. Pencuplik-an itu biasanya dilakukan tanpa
pengembalian (without replacement). Artinya, sekali sebuah item terpilih ke dalam sampel,
maka item tersebut tidak dapat lagi muncul dalam proses pencuplikan item berikutnya.
Sebaliknya, dalam pencuplikan dengan pengembalian (with replacement) elemen yang
telah terpilih ke dalam sampel dikembalikan ke dalam populasi sebelum proses pencuplikan
elemen berikutnya. Jadi elemen yang sama dapat muncul dua kali dalam satu sampel
sebelum elemen berikutnya terpilih. Pencuplikan dengan pengembalian jarang dilakukan.
Satu cara untuk menjalankan prosedur random adalah memberikan nomer kepada
setiap individu, mulai dari 0, 1, 2, 3, dan seterusnya. Lalu nomer-nomer itu dipilih secara
random dengan menggunakan tabel angka random atau program komputer sampai ukuran
sampel diinginkan tercapai. Gambar 7.3. menyajikan pencuplikan random.
1. Pencuplikan sistematis
Dalam beberapa situasi, cara paling praktis adalah memilih setiap nama ke 10 dalam daftar
kerangka pencuplikan, atau setiap kasus baru bernomer genap, dan sebagainya.
Pencuplikan jenis ini dikenal sebagai pencuplikan sistematis (systematic sampling).
Unsur prosedur random dapat diterapkan ke dalam jenis pencuplikan ini untuk
memilih elemen pertama sampel. Setelah itu elemen-elemen berikut dipilih setiap interval
5, atau 10, atau 20, dan sebagainya, hingga jumlah elemen sampel yang diinginkan
tercapai. Prosedur ini sangat praktis ketika kerangka pencuplikan sudah tersedia dalam
bentuk daftar.
2. Pencuplikan klaster
Pencuplikan klaster (cluster sampling) adalah metode pencuplikan dimana unit pencuplikan
merupakan kelompok (baca: klaster) subyek (misalnya dukuh, atau anggota keluarga),
bukannya individu. Pengamatan dilakukan terhadap seluruh individu dalam klaster terpilih.
Dengan kata lain, variabel tetap diukur pada level individu (Last, 2001; Streiner et al.,
1989). Pencuplikan klaster cocok digunakan jika populasi menempati area luas (Kothari,
1990).
Klaster
Prosedur Sampel
Populasi pencuplikan
3. Pencuplikan area
Pencuplikan area (area sampling) merupakan metode pencuplikan yang dapat digunakan
ketika anggota populasi tersebar dalam area luas. Dalam metode ini, seluruh area yang
akan dicuplik dibagi dulu dalam sub-area, lalu sub-area diberi nomer dan dicuplik dengan
menggunakan tabel angka random. Selanjutnya anggota-anggota dalam area yang dicuplik
diberi nomer untuk menjalani pencuplikan tahap kedua. Pencuplikan area sebenarnya
analog dengan pencuplikan klaster yang ditentukan berdasarkan pembagian geografis.
4. Pencuplikan Berstrata
Strata 1 R
Strata 2 R
Strata k R
Prosedur
Populasi pencuplikan Sampel
(dibagi dalam strata) random
Tujuan pencuplikan berstrata adalah untuk memperoleh kasus (studi kasus kontrol)
atau subyek terpapar (studi kohor) dalam jumlah yang cukup pada masing-masing strata,
sehingga kelak dapat dianalisis secara statistik. Variabel yang dilakukan stratifikasi adalah
variabel yang berhubungan dengan penyakit atau paparan, misalnya umur, etnik, dan ras.
Contoh: Peneliti berminat meneliti penyakit jantung koroner (PJK) di semua usia.
Insidensi PJK pada usia muda lebih rendah daripada usia dewasa. Agar memperoleh
jumlah kasus PJK yang cukup dari kelompok usia muda, maka peneliti perlu membagi
populasi sasaran dalam strata umur. Kalau saja tidak dilakukan stratifikasi tetapi langsung
melakukan pencuplikan random, maka - karena peran peluang - peneliti akan memperoleh
jumlah PJK usia muda terlalu sedikit untuk bisa dianalisis secara statistik.
5. Multi-stage sampling
PENCUPLIKAN NON-RANDOM
Pencuplikan non-random dapat dibagi dalam dua kategori: (1) Pencuplikan seenaknya
(convenience sampling); dan (2) Pencuplikan purposif (purposive sampling).
PENCUPLIKAN SEENAKNYA
Streiner et al., 1989). Pencuplikan “liberal” ini mudah dilakukan, semudah mencuplik
sampel dari orang yang ditemui di jalan (“man-in-the-street”) atau pengunjung sebuah
stan bazar (Last, 2001). Karena tidak ada diskresi obyektif dari pihak peneliti dalam
mendesain sampel, maka teknik pencuplikan seenaknya cenderung mengintroduksi bias
pencuplikan (sampling bias), dengan demikian validitas penarikan kesimpulan hasil kepada
populasi sasaran lemah. Selain itu, sampel melalui pencuplikan seenaknya tidak
representatif terhadap populasi.
PENCUPLIKAN PURPOSIF
Umumnya studi epidemiologi analitik menggunakan lebih dari satu metode pencuplikan
untuk mendapatkan kelompok-kelompok penelitian (misalnya, kelompok-kelompok
terpapar dan tak terpapar dalam studi kohor, kelompok berpenyakit dan tak berpenyakit
dalam studi kasus-kontrol). Prosedur pencuplikan random biasanya dipadukan dengan
berbagai metode pencuplikan purposif.
Apakah pencuplikan purposif? Pencuplikan purposif (purposive sampling, deliberate
sampling) (Kothari, 1990) merupakan metode pencuplikan non-random dimana peneliti
melakukan pendekatan terhadap masalah pencuplikan dengan rencana spesifik tertentu
dalam benaknya sesuai dengan masalah dan hipotesis penelitian. Peneliti memiliki diskresi
untuk memilih elemen dengan sengaja, tetapi pemilihan itu tidak dilakukan sembarangan
melainkan dengan rencana tertentu sesuai dengan tujuan penelitian.
Karena unsur subyektif peneliti sangat kental dalam prosedur pencuplikan ini, dan
probabilitas masing-masing elemen dalam populasi untuk terpilih ke dalam sampel tidak
diketahui, maka prosedur ini tidak tepat untuk dipilih jika tujuan penelitian adalah
mendeskripsikan karakteristik populasi dalam studi deskriptif. Jika dilakukan dengan hati-
hati, prosedur ini sangat bermanfaat untuk mendapatkan kelompok-kelompok studi yang
memiliki karakteristik “comparable” untuk diperbandingkan dalam studi analitik.
Pencuplikan purposif sangat populer di kalangan peneliti sejati maupun peneliti
yang karena ketidaktahuannya (ignorance) tentang prinsip dan metode pencuplikan lalu
mencari mudahnya asal sebut (disingkat “asbut”, saudaranya “asbun”) pencuplikan
purposif untuk penelitiannya, tanpa pemahaman memadai tentang makna dan implikasi
“purposif”. Jika seorang peneliti memilih metode pencuplikan purposif, maka ia harus bisa
menjelaskan maksud “purposif” dan tujuan yang diharapkan dari memilih metode itu untuk
penelitiannya.
1. Fixed-exposure sampling
2. Fixed-disease sampling
3. Restriksi
subyek yang boleh dimasukkan ke dalam sampel penelitian; dan (2) Kriteria eksklusi
menentukan subyek-subyek yang harus digusur ke luar sampel.
Sampel dapat diperoleh dengan atau tanpa kriteria restriksi. Sampel yang diperoleh
dengan restriksi disebut sampel dengan pembatasan (restricted sample). Karena ada
peneliti mengintervensi pemilihan sampel, maka pencuplikan dengan restriksi dikategorikan
pencuplikan purposif. Sedang sampel yang diperoleh tanpa restriksi disebut sampel tanpa
pembatasan (unrestricted sample). Lihat Tabel 7.1.tentang desain dasar pencuplikan.
Mengapa melakukan restriksi? Ada sejumlah alasan. Pertama, mengendalikan
faktor perancu (confounding factor) potensial yang dipandang dapat merancukan
penaksiran pengaruh paparan terhadap penyakit (Rothman, 2002; Kleinbaum et al., 1982).
Kedua, memastikan akurasi pengukuran variabel-variabel dalam penelitian epidemiologi.
Contoh, dalam studi kohor, waktu yang tepat tentang kapan subyek dikatakan mulai
terpapar dan kapan pengamatan pengaruh paparan terhadap penyakit harus dihentikan
sangat menentukan akurasi pengukuran paparan. Dalam hal ini peneliti harus melakukan
restriksi tentang kapan memulai pengamatan dan berapa lama agar pengamatan mampu
meliput masa inkubasi atau masa laten penyakit yang bersangkutan (Rothman, 1986).
Ketiga, memudahkan pemilihan subyek, misalnya pembatasan berdasarkan area tempat
tinggal (area sampling) (Kleinbaum et al., 1982).
Kerugian restriksi: (1) Kesimpulan hanya berlaku untuk populasi yang telah
mengalami pembatasan tersebut, dus makin banyak restriksi makin meningkat validitas
internal, tetapi makin berkurang kemampuan generalisasi hasil penelitian; (2) Mengurangi
jumlah elemen dalam sampel, dus mengurangi efisiensi penelitian.
4. Pencocokan
Pencocokan digunakan pada studi observasional dan eksperimen kuasi. Pada studi
kohor dan eksperimen kuasi, tujuan pencocokan untuk mengontrol pengaruh faktor
perancu dalam menilai pengaruh paparan terhadap penyakit, atau pengaruh perlakuan
terhadap hasil. Pada studi kasus kontrol, tujuan pencocokan untuk meningkatkan efisiensi
penaksiran pengaruh paparan terhadap penyakit (Rothman, 2002; Mercer, 1991; Rothman,
1986).
Contoh: dalam studi kohor tentang infark otot jantung (MI) dan aktivitas fisik,
peneliti mengendalikan pengaruh perancu obesitas, dengan cara memilihkan (baca:
mencocokkan) seorang inaktif secara fisik yang non-obes (subyek pembanding) untuk
seorang aktif secara fisik yang juga non-obes (subyek indeks). Pengaruh obesitas terhadap
hubungan aktivitas fisik dan MI dikendalikan, karena kedua subyek yang dibandingkan
sudah dibuat setara dalam tingkat faktor obesitas.
Pencocokan disebut juga restriksi parsial, sebab pembatasan diterapkan hanya
kepada subyek pembanding, tidak kepada subyek indeks (Kleinbaum et al., 1982).
5. Pencuplikan kuota
diteruskan untuk memenuhi kuota laki-laki. Jika dalam proses itu peneliti memperoleh lagi
subyek perempuan, maka tentu ia tidak perlu memasukkannya ke dalam sampel sebab
“jatah” untuk perempuan sudah terpenuhi.
Pencuplikan kuota non-proporsional lebih restriktif. Dalam metode ini, peneliti
menentukan jumlah minimum unit pencuplikan sesuai yang diinginkan peneliti dalam
masing-masing kategori. Dalam hal ini tujuan pencuplikan bukan untuk memperoleh
jumlah yang sesuai dengan proporsi dalam populasi, melainkan untuk mendapatkan
jumlah subyek yang memadai untuk mewakili kategori karakteristik tertentu di dalam
sampel. Metode ini dapat dipandang merupakan analog non-random dari pencuplikan
berstrata, dimana bagi peneliti yang penting memiliki sekelompok kecil subyek yang cukup
terwakili di dalam sampel.
6. Expert sampling
Pencuplikan bola salju (snowball sampling, chain referral sampling, network sampling)
dimulai dengan mengidentifikasi seorang atau dua orang subyek yang memenuhi kriteria
inklusi untuk suatu penelitian. Subyek tersebut kemudian diminta memberikan keterangan
tentang subyek-subyek lainnya yang menurut subyek pertama tadi memenuhi kriteria
inklusi. Meskipun sulit untuk dapat memberikan sampel representatif, metode ini
bermanfaat untuk mencuplik populasi yang sulit dijangkau.
Contoh, jika peneliti ingin meneliti dampak kemiskinan terhadap status kesehatan
dengan cara mencuplik sampel para tuna wisma (baca: homeless, gelandangan!), maka
peneliti akan sulit memperoleh kerangka pencuplikan (sampling frame) yang memuat
daftar para tuna wisma yang tinggal di suatu area. Tetapi jika strategi yang diambil adalah
pergi ke area itu dan mengidentifikasi seorang atau dua orang tuna wisma, maka peneliti
akan menemukan bahwa tuna wisma tersebut mengetahui persis “tempat tinggal” dan
cara menemukan rekan-rekan lainnya di seputar area itu.
Sejumlah faktor menentukan desain pencuplikan yang baik: (1) Desain penelitian; (2)
Parameter yang diinginkan; (3) Unit pencuplikan; (4) Kerangka pencuplikan; (5) Ukuran
sampel; (6) Anggaran penelitian.
1. Desain penelitian
Parameter spesifik yang ingin ditaksir menentukan desain pencuplikan. Contoh, jika peneliti
ingin menaksir prevalensi penyakit pada masing-masing strata populasi, maka desain
pencuplikan yang sesuai adalah membagi populasi dalam strata, lalu mencuplik elemen
dari masing-masing strata – disebut pencuplikan random berstrata.
3. Unit pencuplikan
Unit pencuplikan (sampling unit) adalah item/elemen/unit dari populasi yang akan dipilih
ke dalam sampel. Peneliti harus menentukan unit pencuplikan sebelum memilih sampel.
Unit pencuplikan yang sering digunakan adalah individu, karena unit pengamatan dalam
studi epidemiologi umumnya individu. Tetapi pada studi ekologis, unit pencuplikan adalah
kelompok, berdasarkan wilayah geografi (misalnya, desa), atau unit sosial (misalnya,
keluarga dan sekolah). Contoh, jika populasi adalah semua kota di Indonesia berpenduduk
lebih dari 500,000 orang, maka 100 kota yang termasuk kategori itu merupakan unit-unit
pencuplikan.
4. Kerangka pencuplikan
Kerangka pencuplikan (sampling frame), disebut juga daftar sumber (source list) (Kothari,
1990), merupakan daftar berisikan nama-nama atau (karena alasan etis) nomer subyek
populasi sumber yang akan dicuplik ke dalam sampel. Contoh, dalam studi hubungan OC
dan MI, peneliti dapat menggunakan buku register yang dibuat bidan klinik keluarga
berencana sebagai kerangka pencuplikan. Kerangka pencuplikan perlu ekshaustif, benar,
reliabel, dan tepat. Sudah barang tentu kerangka pencuplikan harus seakurat mungkin
mewakili populasi.
5. Ukuran sampel
Ukuran sampel (sample size) adalah jumlah subyek yang dipilih dari populasi sehingga
membentuk sebuah sampel. Ukuran sampel dalam studi epidemiologi harus cukup besar
dalam arti optimal yang memungkinkan peneliti menaksir parameter dengan akurat,
reliabel, dan sekaligus efisien. Beberapa hal menentukan ukuran sampel: (1) Presisi
penaksiran yang diinginkan peneliti; (2) Tingkat keyakinan (confidence level) penaksiran;
(3) Kuasa statistik (statistical power) yang diinginkan; (4) Perkiraan prevalensi penyakit
yang akan ditaksir (epidemiologi deskriptif); (5) Perkiraan besarnya pengaruh paparan
terhadap penyakit (epidemiologi analitik); (6) Varians dan ukuran populasi.
Intinya, makin tinggi presisi diinginkan, makin besar sampel harus dicuplik. Makin
besar kemampuan yang diinginkan dari sebuah penelitian epidemiologi analitik untuk
mendeteksi adanya pengaruh paparan terhadap penyakit, makin besar sampel dibutuhkan.
Demikian pula, makin besar tingkat keyakinan, makin besar sampel harus dicuplik (contoh,
penaksiran dengan tingkat keyakinan 99% memerlukan sampel lebih besar daripada
tingkat keyakinan 95%).
Selanjutnya, makin rendah perkiraan prevalensi suatu penyakit, makin besar
sampel dibutuhkan. Makin kecil perkiraan pengaruh paparan terhadap penyakit, makin
besar kebutuhan ukuran sampel. Makin besar varians populasi, makin besar sampel
dibutuhkan. Demikian juga makin besar ukuran populasi, makin besar sampel diperlukan.
Ukuran sampel yang cukup besar sangat penting dalam studi epidemiologi. Sebab
makin besar sampel, makin persis (baca: teliti, cermat!) inferensi tentang distribusi
penyakit pada populasi (studi deskriptif), dan makin persis penaksiran pengaruh paparan
terhadap penyakit pada populasi (studi analitik). Dus makin besar sampel, makin kecil
kesalahan pencuplikan (sampling error, sampling variation).
Terma random dan acak sering digunakan bergantian untuk merujuk kepada konsep yang
sama. Meskipun demikian penulis anjurkan penggunaan kata random ketimbang acak.
Mengapa? Sebab kata acak sering disalahtafsirkan sebagai suatu mekanisme acak-acakan
(“ngawur”) alias sesuka peneliti. Padahal mekanisme random dilakukan secara sistematis,
mengikuti kaidah-kaidah probabilitas dan Hukum Regularitas Statistik. Pencuplikan elemen-
elemen dilakukan dengan menggunakan tabel angka random, perangkat komputer, atau
boleh juga secara “primitif” menggunakan “lintingan” kertas lotere yang diberi nomer.
Prosedur random yang umum tidak mengembalikan “lintingan” yang telah diambil untuk
pemilihan elemen berikutnya – disebut “without replacement” (tanpa penggantian).
Program komputer umumnya menggunakan formula yang mengasumsikan prosedur
random tanpa penggantian.
Kelompok
eksperimen
Kelompok
kontrol
Pembedaan perlu dilakukan antara pencuplikan berstrata, stratifikasi blok, dan analisis
berstrata. Pencuplikan berstrata (stratified sampling) merupakan teknik pencuplikan yang
membagi populasi sasaran dalam strata yang berbeda menurut karakteristik tertentu, lalu
melakukan pencuplikan dari masing-masing stratum. Tujuan pencuplikan berstrata untuk
memperoleh kasus (studi kasus kontrol) atau subyek terpapar (studi kohor) dalam jumlah
yang cukup pada masing-masing strata, sehingga dapat dianalisis secara statistik.
Dalam stratifikasi blok dilakukan stratifikasi sampel ke dalam sejumlah blok, lalu dari
blok itu dilakukan randomisasi (Kleinbaum et al., 1982; Streiner et al., 1989). Stratifikasi
blok digunakan pada eksperimen, untuk mendapatkan subyek yang cukup pada semua
strata, sehingga meningkatkan efisiensi pengujian hipotesis. Eksperimen yang
menggunakan stratifikasi blok disebut desain blok random (randomized block design)
(Streiner et al., 1989).
Analisis berstrata merupakan teknik analisis data yang bertujuan memperhitungkan
pengaruh faktor perancu dengan cara menganalisis hubungan antara paparan dan
penyakit secara terpisah pada tiap-tiap strata faktor perancu. Teknik itu menghasilkan
penilai-an yang valid tentang hubungan antara paparan dan penyakit. Analisis berstrata
dilakukan pada tahap analisis data, sedang pencuplikan berstrata dilakukan pada tahap
desain pencuplikan.
REFERENSI