Anda di halaman 1dari 21

SAMPEL DAN CARA PENARIKAN

Iwan Ariawan dan Besral


(Departemen Biostatistik FKM UI, 2012)

A. SAMPEL PADA RISET KUANTITATIF

A.1. KONSEP

Pengantar

Dalam suatu riset, pada umumnya kita ingin menyimpulkan keadaan di populasi. Misalkan,
kita melakukan riset untuk mengetahui cakupan imunisasi lengkap pada anak usia 12-23 bulan di
Kabupaten Bogor. Secara ideal, kita harus melakukan sensus pada semua anak usia 12-23 bulan di
Kabupaten Bogor dan menanyakan status imunisasinya. Dalam kenyataannya, hampir tidak mungkin
kita melakukan sensus karena adanya keterbatasan sumber dana, daya dan waktu. Meskipun sumber
dana dan daya tersedia, sensuspun tidak lepas dari kesalahan pengukuran. Pada sensus subyek yang
harus diukur sangat banyak sehingga diperlukan banyak pewawancara. Menjamin dan menjaga
kualitas pengukuran dari banyak pewawancara menjadi lebih sulit. Sehingga, peneliti umumnya
melakukan pengukuran pada sampel yang merupakan bagian dari populasi yang dianggap dapat
mewakili populasi tersebut.

Peran sampel dalam riset sangat penting karena ketepatan kesimpulan peneliti sangat
bergantung pada keterwakilan populasi pada sampel riset kita. Sampel yang baik harus dapat
mewakili populasi. Bab ini menjelaskan konsep tentang rancangan sampel serta langkah-langkah yang
harus dilakukan agar sampel yang ditarik dapat mewakili populasi.

Peran Sampel Dalam Riset

Baik tidaknya sampel dalam riset kita tergantung pada 2 hal pokok: cara penarikan dan besar
sampel. Cara penarikan sampel menentukan apakah sampel yang kita ambil sahih atau mengukur
populasi yang kita ingin ukur. Sedangkan besar sampel menentukan presisi/ketepatan dari hasil
pengukuran kita pada populasi.

Sebagai contoh, riset untuk mengetahui cakupan imunisasi lengkap pada anak umur 12-23
bulan. Jika 300 anak yang bertempat tinggal dekat dengan puskesmas saja diambil sebagai sampel,
maka sampel tersebut sangat mungkin tidak dapat mewakili populasi anak umur 12-23 bulan di
Kabupaten Bogor. Mengapa? Karena ada banyak anak yang bertempat tinggal jauh dari puskesmas
dan anak-anak ini tidak mungkin terpilih sebagai sampel. Artinya cara penarikan sampel yang
dilakukan tidak sahih.

Presisi hasil pengukuran kita ditentukan oleh besar sampel riset. Pada riset tentang cakupan
imunisasi lengkap pada anak 12-23 bulan, misalkan hasil pada 300 anak sebagai sampel
memperlihatkan cakupan imunisasi lengkapnya 54%. Dalam menyimpulkan hasil riset ini, kita
memahami bahwa cakupan imunisasi lengkap anak umur 12-23 bulan Kabupaten Bogor kecil sekali
kemungkinannya sama persis dengan hasil dari sampel, yaitu persis 54%. Kita paham bahwa cakupan
imunisasi lengkap di populasi berkisar sekitar 54% tersebut. Kisaran tersebut dapat dinyatakan dengan
selang kepercayaan. Selang kepercayaan diukur pada derajat kepercayaan tertentu, misalnya 95%.
Misalkan hasil riset kita menunjukkan selang kerpercayaan 95% untuk cakupan imunisasi lengkap
antara 50% sampai dengan 58%, berarti kita 95% percaya bahwa cakupan imunisasi lengkap pada

Bab 6 Page 1
anak 12-23 bulan di Kabupaten Bogor berada pada selang antara 50% sampai dengan 58%. Dengan
kata lain, di populasi mungkin saja cakupan imunisasis lengkapnya 57%. Rentang selang kepercayaan
(58-50% = 8%) disebut sebagai presisi. Semakin kecil rentangnya semakin baik presisi penelitian kita.

Sebelum kita melakukan penarikan sampel, kita harus mengetahui dahulu secara jelas batasan
populasi kita. Misalkan kita ingin mengetahui prevalensi gizi buruk pada anak di Kabupaten
Larantuka. Rancangan sampel tidak dapat dibuat sebelum kita menetapkan: (1) definisi anak dan (2)
daerah Kabupaten Larantuka yang diikutsertakan dalam riset. Kita dapat menetapkan batasan umur
anak, seperti 0-59 bulan atau anak balita.Penetapan syarat yang harus dipenuhi oleh subyek penelitian
untuk dapat diambil sebagai sampel disebut kriteria inklusi. Semua subyek yang memenuhi kriteria
inklusi dikumpulkan sebagai satu kelompok, dari mana penarikan sampel dilakukan. Kumpulan
subyek yang memenuhi kriteria inklusi ini disebut sebagai kerangka sampel (sampling frame). Setelah
seseorang memenuhi kriteria inklusi dan masuk dalam kerangka sampel, dia dapat dikeluarkan
kembali karena memenuhi kriteria ekslusi. Kriteria eklusi adalah kriteria atau syarat yang digunakan
untuk mengeluarkan subyek yang sudah masuk dalam kerangka sampel. Pada contoh riset di atas,
peneliti dapat menetapkan kriteria ekslusi telah tinggal di Kabupaten Larantuka lebih dari 6 bulan.

Unit di mana pemilihan sampel dilakukan disebut sebagai unit sampel, sedangkan unit di
mana pengukuran dilakukan disebut sebagai unit elementer. Unit sampel dan unit elementer dapat
berbeda. Misalnya riset untuk mengukur prevalensi penyakit tuberkulosis pada orang dewasa di
propinsi Jawa Barat. Unit sampel dapat berupa rumah tangga karena peneliti memilih rumah tangga
dari kerangka sampel rumah tangga, sedangkan unit elementer adalah orang dewasa yang tinggal di
rumah tangga yang terpilih. Perbedaan unit sampel dan unit elementer dapat terjadi untuk kepraktisan
penarikan sampel.

Dalam setiap riset, kita tidak dapat lepas dari kesalahan (error) ketika kita mengambil
kesimpulan. Kesalahan ini dapat berupa sampling error dan non sampling error. Sampling error adalah
kesalahan prakiraan angka di populasi (seperti cakupan imunisasi, prevalensi gizi buruk) yang terjadi
karena peneliti melakukan pengukuran pada sampel, bukan pada populasi. Besarnya sampling error
dapat dihitung sepanjang pengambilan sampel dilakukan secara acak serta dapat diminimalkan dengan
penggunaan rancangan sampel yang tepat.Non sampling error adalah kesalahan yang terjadi karena
sebab lain, bukan karena pengambilan sampel. Non sampling error dapat terjadi karena kesalahan alat
ukur, kesalahan cara ukur, dan lain-lain.

Hal-hal di atas harus kita perhatikan dalam merancang sampel karena kita menginginkan hasil
penelitian dari sampel dapat menyimpulkan populasi dengan kesalahan sekecil mungkin. Namun
dalam kenyataannya rancangan sampel yang dibuat dibatasi oleh ketersediaan sumber dana dan daya
serta kepraktisan manajemen penelitian. Jadi rancangan sampel yang dibuat peneliti akhirnya
merupakan komprosi dari sampel yang sahih dan presisi tinggi tetapi tetap efisien dalam penggunaan
sumber daya dan dana yang ada.

Dasar teori penarikan sampel

Penarikan sampel didasarkan pada teori limit sentral dalam distribusi sampel. Distribusi
sampel merupakan distribusi dari hasil pengukuran pada sampel jika pengambilan sampel dilakukan
secara berulang-ulang dari populasi yang sama. Pada tiap pengambilan sampel maka akan dihasilkan
nilai rata-rata atau proporsi yang berbeda. Misalkan kita melakukan 3 kali penarikan sampel secara
acak dari populasi untuk mengetahui rata-rata hemoglobin pada wanita hamil. Kemungkinan besar
kita akan memperoleh 3 nilai rata-rata hemoglobin yang berbeda

Jika penarikan sampel dilakukan lebih banyak lagi sampai semua kemungkinan sampel habis
maka akan diperoleh banyak nilai rata-rata. Nilai rata-rata yang diperoleh dari tiap pengambilan
sampel pada pengambilan sampel berulang dapat ditampilkan dalam bentuk histogram, dengan sumbu

Bab 6 Page 2
X berupa nilai rata-rata dan sumbu Y berupa proporsi nilai tersebut muncul.Grafik ini dinamakan
sebagai distribusi sampel, yang berbentuk seperti lonceng dan simetris.Bentuk distribusi seperti ini
dalam statistik dikenal sebagai distribusi normal.

Dari distribusi sampel, kita dapat menghitung nilai rata-rata dari rata-rata sampel (mean of the
means). Jika penarikan sampel dilakukan berulang-ulang sampai semua kemungkinan sampel sudah
ditarik, maka nilai rata-rata dari rata-rata sampel ini akan sama dengan nilai rata-rata yang sebenarnya
di populasi. Nilai rata-rata masing-masing sampel tentu berbeda dengan rata-rata dari rata-rata ini dan
variasinya dapat diukur dengan menghitung variansnya. Akar kuadrat dari varians dapat dihitung juga
untuk menghasilkan simpang baku. Tetapi simpang baku yang dihasilkan merupakan simpang baku
dari rata-rata sampel terhadap rata-rata di populasi bukan simpang baku dari nilai individual terhadap
nilai rata-ratanya. Simpang baku dari distribusi sampel ini disebut sebagai simpang galat (standard
error).

Setelah kita mengetahui sifat distribusi sampel, bukan berarti kita harus melakukan
pengambilan sampel secara berulang-ulang pada suatu riset. Teori limit sentral memungkinkan kita
untuk melakukan pengambilan kesimpulan tentang keadaan populasi tapi perlu melakukan
pengambilan sampel berulang-ulang. Teori limit sentral mengatakan: jika ada satu populasi dengan
rata-rata , atau proporsi , dengan standar deviasi , maka distribusi parameter sampel berdasarkan
pengambilan sampel n secara acak dan berulang-ulang memiliki beberapa sifat:

1. Rata-rata distribusi sampel untuk parameter akan sama dengan parameter populasi,  (rata-
rata,  atau proporsi, ).

2. Standar deviasi distribusi sampel untuk parameter akan sama dengan σ/n. Ukuran ini juga
dikenal sebagai simpang galat (standard error, SE). Simpang galat memegang peranan
penting pada estimasi parameter dan uji statistik.

3. Jika distribusi nilai pada populasi normal, maka distribusi sampel juga normal. Tetapi yang
lebih penting adalah jika distribusi nilai pada populasi tidak normal, dengan jumlah sampel
yang cukup besar maka distribusi sampel akan mendekati normal, tanpa tergantung oleh
distribusi nilai pada populasi.

Maka dengan asumsi besar sampel yang cukup, distribusi sampel x –yang mengikuti distribusi
normal– dapat digambarkan tanpa kita perlu mengambil sampel berulang-ulang. Pada keadaan
distribusi sampel mengikuti distribusi normal, maka jika kita membuat rentang nilai x + 1,96*SE,
rentang tersebut akan mencakup nilai rata-rata populasi (, rata-rata dari rata-rata sampel) jika x
terletak pada rentang + 1,96*SE. Menurut sifat distribusi normal, probabilitas nilai x terletak pada
+ 1,96*SE adalah 95%.

Sehingga dari ketiga kondisi di atas, kita dapat menyimpulkan: probabilitas x+ 1,96*SE untuk
mencakup paramater populasi adalah 95%. Pengertian ini merupakan konsep selang kepercayaan 95%
dari rata-rata/proporsi sampel. Jadi jika dari suatu riset kita memperoleh rata-rata tekanan darah
sistolik pada orang dewasa di Jakarta 120 mmHg dengan selang kepercayaan 95%: 110-130 mmHg,
maka berarti peneliti 95% percaya bahwa rata-rata tekanan darah sistolik pada orang dewasa di
Jakarta berada pada kisaran 110 sampai dengan 130 mmHg.

Bab 6 Page 3
Uji Hipotesis

1Pada diskusi di atas, tujuan utama penelitian adalah untuk estimasi parameter populasi yang
tidak diketahui. Selain estimasi parameter, suatu penelitian juga dapat bertujuan untuk menguji
hipotesis. Misalkan seorang peneliti ingin menguji perbedaan proporsi kejadian BBLR antara ibu
anemia dengan ibu tidak anemia.Karena proporsi BBLR pada ibu anemia dan juga proporsi BBLR
pada ibu tidak anemia diperoleh dari sampel, maka ada kemungkinan perbedaan yang terlihat pada
kedua proporsi ini terjadi secara kebetulan belaka akibat pengambilan sampel.Uji statistik bermanfaat
untuk memperlihatkan apakah perbedaan yang ada terlalu besar jika terjadi akibat kebetulan belaka.

Dalam melakukan uji statistik, peneliti akan menetapkan dahulu hipotesis nol (H 0) yang
menyatakan tidak ada perbedaan antara parameter kedua populasi. Sedangkan hipotesis alternatif (H a),
yang sering kali juga merupakan hipotesis penelitian menyatakan adanya perbedaan parameter kedua
populasi.Uji statistik dilakukan untuk melihat jika hipotesis nol benar di populasi, berapa probabilitas
kita untuk memperoleh hasil seperti pada penelitian yang dilakukan atau lebih ekstrim. Jika
probabilitas ini, yang sering kali ditulis sebagai nilai p, kecil nilainya, maka kita mengambil
kesimpulan bahwa hipotesis nol tidak sesuai dengan hasil penelitian. Dan jika hasil penelitian
dianggap “benar” maka hipotesis nol menjadi salah, atau kita menolak hipotesis nol. Seberapa besar
nilai p yang dianggap “cukup kecil’ untuk menolak hipotesis nol tergantung dari seberapa besar
peneliti mau menanggung risiko untuk salah mengambil kesimpulan.

Dalam pengujian hipotesis, ada 2 kesalahan yang mungkin terjadi dalam mengambil
kesimpulan dari hasil penelitian.Peneliti dapat salah menolak hipotesis nol, padahal di populasi
hipotesis nol adalah benar.Kesalahan ini disebut sebagai kesalahan tipe I (type I error) atau kesalahan
alfa (alpha error). Probabilitas untuk membuat kesalahan ini dapat diatur oleh peneliti dan
dilambangkan dengan . Di pihak lain, jika peneliti gagal menolak hipotesis nol juga mungkin terjadi
kesalahan, dimana pada populasi hipotesis nol adalah salah. Kesalahan ini disebut sebagai kesalahan
tipe II (type II error) atau kesalahan beta (beta error) dan dilambangkan dengan .

Dan akhirnya kekuatan uji (power) dari suatu uji statistik adalah probabilitas untuk menolak
hipotesis nol jika hipotesis nol pada populasi salah. Konsep tentang kesalahan tipe I dan tipe II dalam
penelitian dapat diringkas dalam tabel berikut:

Tabel 1. Ringkasan probabilitas terjadinya kesalahan pada uji statistik

Kesimpulan Keadaan sebenarnya di populasi

uji statistik H0 benar H0 salah

Gagal tolak H0 1-Selang kepercayaan Kesalahan tipe II

Tolak H0 Kesalahan tipe I 1-Kekuatan uji

Jadi pada satu uji hipotesis hanya satu kesalahan yang dapat terjadi. Jika kita menolak
hipotesis nol, maka dapat terjadi kesalahan tipe I. Sedangkan jika kita gagal menolak hipotesis nol,
maka dapat terjadi kesalahan tipe II.

Bab 6 Page 4
Cara Penarikan Sampel

1. Sampel acak sederhana

Metode pengambilan sampel secara acak sederhana merupakan metode pengambilan sampel
terbaik dan paling mudah untuk dimengerti.Namum pengambilan sampel secara acak sederhana tidak
selalu dapat dilakukan, bahkan seringkali tidak mungkin dilakukan pada penelitian survei, terutama
survei pada populasi besar.

Dasar dari metode pengambilan sampel acak sederhana adalah memberikan kesempatan yang
sama kepada unit sampel untuk terpilih sebagai sampel. Langkah pertama yang harus dilakukan dalam
memilih sampel dengan metode acak sederhana adalah memberi nomor 1 sampai dengan N untuk tiap
unit sampel/elementer pada populasi. Langkah berikutnya adalah memilih sampel sejumlah n dengan
menggunakan proses acak, seperti penggunaan tabel acak, generator angka acak dari kalkulator atau
komputer. Prosedur apapun yang digunakan, konsep acak harus tetap terjaga dan tidak ada nomor
yang lebih besar dari N.

Misalkan pada satu populasi, ada 20 orang dokter dan peneliti ingin mengetahui rata-rata kadar
kolesterol HDL pada 20 orang dokter ini. Namun peneliti tidak ingin memeriksa ke 20 orang dokter
tersebut, tetapi hanya ingin memeriksa 4 orang saja.Agar pemilihan subyek penelitian dapat
berlangsung secara adil, peneliti memilih metode acak sederhana. Jadi pertama-tama, peneliti
menyusun daftar dari ke 20 orang dokter ini dan memberinya nomor urut dari 1 sampai dengan 20,
seperi tabel berikut:

1Nama dokter Nomor 1Nama dokter Nomor


Dini 1 Toha 11
Ella 2 Lukman 12
Rita 3 Susi 13
Tris 4 Vivi 14
Budi 5 Badu 15
Rina 6 Yusrizal 16
Santi 7 Tanto 17
Alan 8 Wawan 18
Joni 9 Wita 19
Jacub 10 Dedi 20

Dengan menggunakan tabel angka acak seperti pada lampiran xx, peneliti dapat memilih 4
dokter sebagai sampel dengan metode acak sederhana.Peneliti harus menggunakan angka 2 digit dan
mulai pada baris tertentu.Misalkan peneliti mulai pada baris 5, dan mengambil 2 digit pertama pada
baris 1 kolom 1, diperoleh angka 37.Karena pada kerangka sampel hanya terdapat 20 unit sampel,
maka angka ini tidak dipergunakan.Angka berikutnya (ke sebelah kanan) adalah 57, juga tidak dapat
dipergunakan. Angka berikutnya 03, dapat digunakan.Demikian seterusnya, sampai peneliti
memperoleh 4 angka yang termasuk dalam kerangka sampel.Jika satu baris telah habis, peneliti dapat
berpindah pada baris berikutnya (pada contoh ini baris 6).Sehingga akhirnya peneliti memperoleh
sampel, yaitu dokter nomor 03, 06, 12, 19.Atau dokter Rita, Rina, Lukman dan Wita terpilih sebagai
sampel.

Pada penggunaan tabel acak, peneliti dapat mulai pada baris atau kolom mana saja dan proses
pemilihan dapat berlangsung secara horisontal ataupun vertikal. Pada contoh di atas, boleh saja
peneliti mulai pada baris 9 kolom 2 dan memilih sampel secara vertikal.Dengan cara ini maka terpilih
dokter nomor 14, 12, 20 dan 04. Pemilihan sampel acak dengan menggunakan tabel sering dilakukan
sebelum tersedianya fasilitas generator angka acak pada kalkulator dan komputer.Meskipun
pemilihan sampel acak dengan menggunakan tabel tidak salah, namun cukup merepotkan, apalagi jika

Bab 6 Page 5
populasi besar. Dengan menggunakan komputer, peneliti dapat meminta komputer untuk langsung
mengeluarkan nomor sampel terpilih pada kerangka sampel tertentu.

2. Sampel acak sistematik

Pada pemilihan sampel dengan metode sistematik, peneliti harus membagi populasi menjadi
m kelompok dengan besar kelompok k = N/m. Pada kelompok pertama, pemilihan sampel dilakukan
secara acak sederhana dengan selang angka acak antara 1 sampai dengan k. Sampel berikutnya dipilih
dengan menambahkan k pada angka sebelumnya.

Misalkan peneliti ingin mengetahui status gizi balita yang datang ke puskesmas pada tahun
2011.Pada tahun tersebut ada 5000 balita yang datang dan peneliti hanya ingin mengambil 100 balita
saja sebagai sampel.Maka peneliti membagi balita tersebut menjadi 5000/100=50 kelompok. Pada
tiap kelompok terdiri dari 100 balita. Balita pertama dipilih secara acak sederhana dengan
menggunakan selang angka 1 sampai dengan 100. Misalkan terpilih balita nomor 57. Maka balita
selanjutnya yang terpilih sebagai sampel adalah balita nomor (57+100=157), (157+100=257),
(257+100=357), dan seterusnya. Pemilihan sampel secara sistematik memiliki keuntungan
dibandingkan pemilihan sampel secara acak sederhana:

 Pemilihan sampel dapat dilakukan pada proses yang sedang berjalan, dimana jumlah populasi
dan kerangka sampel belum tersedia. Misalkan untuk melakukan audit rekam medik rumah
sakit pada tahun berjalan. Dalam keadaan ini sampel acak sederhana tidak mungkin
dipergunakan, karena kerangka sampel belum ada dan jumlah populasi belum diketahui.
Tetapi jika jumlah pasien yang berkunjung (N) dapat diperkirakan and besar sampel n telah
ditentukan, maka sampel pertama dapat ditentukan antara pasien ke 1 dan ke k (disebut
sebagai pasien ke i). Sedangkan sampel berikutnya adalah pasien ke i+2k, dan seterusnya.

 Penggunaan metode sampel sistematik menjamin sampel menjadi lebih tersebar ke seluruh
anggota populasi. Formula yang digunakan untuk estimasi parameter, varians dan uji statistik
pada sampel acak sederhana dapat pula digunakan pada metode sampel sistematik. Pada
keadaan tertentu penggunaan sampel sistematik sangat tidak dianjurkan. Misalkan untuk
memilih sampel hari dengan k=7, karena sampel akan selalu jatuh pada hari yang sama.

3. Sampel Stratifikasi

Pada penelitian, seringkali populasi terbagi menurut tingkat tertentu. Misalkan masyarakat
terbagi menurut tingkat pendidikan rendah, sedang dan tinggi, atau puskesmas terbagi menjadi
puskesmas dengan perawatan dan puskesmas tanpa perawatan. Jika sampel acak sederhana
digunakan pada populasi dapat terjadi satu bagian populasi tidak terwakili. Misalkan penelitian untuk
melihat kualitas pelayanan puskesmas, pengambilan sampel secara acak sederhana saja mungkin
menyebabkan tidak terpilihnya puskesmas dengan perawatan. Agar semua kelompok populasi dapat
terwakili, metode pengambilan sampel secara stratifikasi dapat digunakan.

Pada metode ini, populasi dibagi menjadi tingkat/stratum terlebih dahulu. Yang dimaksud
dengan stratum adalah bagian dari populasi (subpopulasi) yang memiliki karakteristik yang sama dan
karakteristik ini diduga berhubungan dengan variabel utama yang diteliti. Jadi pada contoh di atas,
puskesmas dibagi menjadi 2 kelompok, puskesmas tanpa perawatan dan puskesmas dengan
perawatan.Dengan menggunakan stratum ada/tidaknya perawatan ini karena peneliti menduga
terdapat hubungan antara ada/tidaknya perawatan dengan kualitas pelayanan puskesmas. Pada tiap
stratum peneliti akan mengambil sampel dengan metode tertentu. Jika metode yang digunakan adalah
metode acak sederhana, maka pengambilan sampel dikatakan sebagai metode acak stratifikasi

Bab 6 Page 6
(stratified random sampling). Kemudian peneliti akan menggunakan sampel dari kedua strata ini
untuk menghasilkan satu estimasi parameter populasi.

Dalam merencanakan pengambilan sampel secara stratifikasi, agar dihasilkan parameter


populasi dengan presisi tinggi maka elemen di dalam stratum harus diusahakan homogen, sedangkan
variasi antar stratum harus diusahakan setinggi mungkin.Atau di dalam stratum homogen dan antar
stratum heterogen.

Pada penggunaan metode sampel stratifikasi, peneliti juga harus menentukan besar sampel
untuk masing-masing stratum.Penetapan besar sampel untuk masing-masing stratum ini disebut juga
sebagai alokasi sampel. Sistem alokasi yang paling mudah adalah memberikan besar sampel yang
sama untuk tiap stratum. Jadi nh = n/L, di mana nh adalah besar sampel untuk tiap stratum, n besar
sampel keseluruhan dan L jumlah strata. Cara lain yang sering digunakan adalah alokasi proporsional
atau probability proportionate to size (PPS). Dengan cara ini, fraksi sampel nh/Nh untuk tiap stratum
adalah sama. Jadi besar sampel untuk tiap stratum dihitung berdasarkan:

n
nh =N h
N
dimana nh adalah besar sampel untuk stratum h, Nh jumlah elemen (populasi) pada stratum h,
n adalah besar sampel keseluruhan dan N adalah jumlah elemen keseluruhan (populasi total).

Pemilihan cara alokasi sampel mempengaruhi metode analisis hasil penelitian. Pada alokasi
proporsional, estimasi parameter populasi (rata-rata dan proporsi) menjadi self weighted, sehingga
peneliti tidak perlu menggunakan bobot dalam analisis. Sedangkan dengan alokasi sama, efek self
weighted tidak diperoleh sehingga dalam perhitungan parameter populasi, peneliti perlu
mengikutsertakan bobot. Dimana bobot untuk tiap subyek pada tiap stratum dapat dihitung:

nN h
w h=
nh N

Dimana wh adalah bobot untuk subyek pada stratum h, nh adalah besar sampel untuk stratum
h, Nh jumlah elemen (populasi) pada stratum h, n adalah besar sampel keseluruhan dan N adalah
jumlah elemen keseluruhan (populasi total). Secara umum dapat dikatakan keuntungan sampel acak
stratifikasi dibandingkan sampel acak sederhana adalah:

 Sampel acak stratifikasi menghasilkan estimasi dengan presisi yang lebih tinggi
dibandingkan dengan sampel acak sederhana pada besar sampel yang sama.

 Informasi untuk tiap stratum dapat diperoleh dengan mudah

 Namun kelemahan sampel acak stratifikasi adalah pengambilan sampel dengan metode
ini tidak lebih sulit dari sampel acak sederhana. Pada tiap stratum, kerangka sampel harus
dibuat sebelum pemilihan sampel dapat dilakukan. Karena alasan inilah, pada survei
sampel acak stratifikasi tidak umum digunakan. Metode pengambilan sampel yang paling
sering digunakan pada survei adalah metode klaster. Atau juga sering digunakan
gabungan metode stratifikasi dan klaster.

4. Sampel Klaster

1Metode pengambilan sampel secara acak sederhana dan acak stratifikasi memiliki kendala
yang sama, yaitu harus tersedianya kerangka sampel yang berupa daftar dari semua unit sampel.

Bab 6 Page 7
Daftar seperti ini umumnya tidak tersedia dan untuk membuat daftar tersebut diperlukan biaya dan
waktu yang tidak sedikit.

Pada populasi, masyarakat seringkali sudah terbagi menurut kelompok tertentu, seperti RT,
RW, desa, dan lain-lain.Pembuatan kerangka sampel untuk kelompok populasi (kelurahan/desa, RW,
RT) sangat mungkin untuk dibuat dan biaya serta waktu yang dibutuhkan relatif tidak terlalu
banyak.Kelompok masyarakat ini disebut sebagai klaster dalam metode pengambilan sampel.Berbeda
dengan metode sampel stratifikasi, dalam pengambilan sampel secara klaster, dalam satu klaster
diusahakan populasi heterogen dan variasi antar klaster homogen.

Pengambilan sampel dengan metode klaster merupakan pengambilan sampel bertingkat


dimana pemilihan unit elementer dijauhkan satu atau lebih tingkat dari pengambilan sampel secara
acak sederhana.Keuntungan dari pengambilan sampel dengan metode klaster adalah tidak
diperlukannya kerangka sampel dari unit elementer untuk seluruh populasi.Kerangka sampel dari unit
elementer hanya diperlukan pada klaster yang terpilih saja, sehingga biaya dan waktu yang diperlukan
untuk membuat kerangka sampel ini menjadi jauh berkurang dibandingkan dengan metode sampel
acak sederhana.

Sebagai contoh suatu survei dilakukan untuk mengetahui cakupan pemeriksaan kehamilan
pada kabupaten Tangerang.Pada survei ini subyek penelitian adalah ibu yang telah melahirkan bayi 1
tahun yang lalu atau kurang. Jika pengambilan sampel dilakukan secara acak sederhana maka peneliti
harus memiliki daftar nama semua ibu yang melahirkan bayinya 1 tahun yang lalu atau kurang, yang
akan digunakan sebagai kerangka sampel. Daftar seperti ini umumnya tidak tersedia dan jika peneliti
ingin membuatnya maka diperlukan biaya dan waktu yang cukup besar. Dengan menggunakan
metode klaster, peneliti hanya perlu membuat daftar klaster yang ada di kabupaten
Tangerang.Misalnya, peneliti dapat menggunakan desa sebagai klaster, sehingga peneliti perlu
membuat daftar dari semua desa yang ada di kabupaten Tangerang.Daftar seperti ini umumnya sudah
tersedia, sehingga peneliti dapat memperolehnya dengan segera. Dari kerangka sampel berupa daftar
desa peneliti memilih sejumlah desa sebagai sampel klaster. Misalkan salah satu desa yang terpilih
adalah desa Tigaraksa. Pada desa Tigaraksa peneliti membuat kerangka sampel dari semua ibu yang
pernah melahirkan bayinya 1 tahun yang lalu atau kurang. Dan dari kerangka sampel ini peneliti
memilih sejumlah subyek secara acak sederhana sebagai sampel.

Pada contoh di atas, pengambilan sampel dapat diringkas dalam langkah sebagai berikut:

 Langkah 1: Memilih sampel desa.


 Langkah 2: Memilih responden pada desa yang terpilih pada langkah 1.

Dalam terminologi sampel, langkah di atas disebut sebagai tingkat (stage) dan pengambilan
sampel diberinama sesuai dengan banyaknya tingkat. Jadi contoh di atas adalah pengambilan sampel
secara klaster 2 tingkat. Pada pengambilan sampel klaster 1 tingkat, pada tingkat pertama dilakukan
pemilihan sampel klaster dan kemudian pada klaster terpilih semua unit elementer diikutsertakan
sebagai sampel.Sedangkan pada pengambilan sampel 2 tingkat, pada tingkat pertama dilakukan
pemilihan sampel klaster secara acak dan pada tingkat kedua dilakukan pemilihan sampel unit
elementer secara acak sederhana.

Pengambilan sampel juga dapat dilakukan dengan banyak tahap (multistage). Sebagai contoh
jika suatu survei dilakukan untuk mengetahui cakupan imunisasi campak pada anak sekolah dasar di
kabupaten Cirebon, maka pengambilan sampel dapat dilakukan:

 Langkah 1: Memilih j kecamatan dari J kecamatan yang ada di kabupaten Cirebon.


 Langkah 2: Pada j kecamatan terpilih, dipilih k kelurahan/desa dari K kelurahan/desa yang
ada di kecamatan terpilih.

Bab 6 Page 8
 Langkah 3: Pada k kelurahan/desa terpilih, dipilih l sekolah dasar dari L sekolah dasar yang
ada di kelurahan/desa terpilih.
 Langkah 4: Pada l sekolah terpilih, dipilih m kelas dari M kelas yang ada.
 Langkah 5: Pada m kelas terpilih, dipilih semua murid yang ada di kelas terpilih.

Pada contoh di atas, pemilihan sampel dilakukan dengan cara banyak tingkat.Kelas berfungsi
sebagai unit sampel dan murid berfungsi sebagai unit elementer. Pada pengambilan sampel secara
banyak tahap, klaster yang digunakan pada tahap pertama disebut sebagai unit sampel primer
(primary sampling unit/PSU). Jadi pada contoh di atas, unit sampel primer adalah kecamatan.

Pada pembahasan di atas, pemilihan klaster dilakukan secara acak, m klaster dipilih secara
acak dari M klaster yang ada. Cara lain untuk memilih klaster adalah dengan metode probability
proportionate to size (PPS). Pada metode PPS, pemilihan klaster diberi bobot menurut besar klaster.
Pada umumnya digunakan jumlah populasi sebagai bobot klaster. Metode ini memiliki beberapa
keunggulan dibandingkan dengan pemilihan klaster secara acak, seperti dalam analisis data, subyek
penelitian menjadi self-weighted sehingga tidak diperlukan pembobotan.

Pada pemilihan dengan cara PPS, peneliti perlu membentuk daftar klaster berikut besar
masing-masing klaster.Misalkan untuk klaster desa, jumlah penduduk dapat digunakan untuk
menggambarkan besar/bobot klaster.Dari daftar yang terbentuk peneliti membuat jumlah penduduk
kumulatif. Contoh daftar tersebut seperti tabel berikut:

Nama desa Jumlah penduduk Jumlah penduduk kumulatif


Sukasari 1500 1500
Sukamanah 3000 4500
Sukajadi 2350 6850
Sukamakmur 4000 10850
Sukamaju 1350 12200
Gotong-royong 3200 15400
Telaga warna 1780 17180
Warna sari 1900 19080
Situ biru 2560 21640
Sari maju 3400 25040

Pemilihan klaster dilakukan dengan menggunakan metode acak dengan selang nomor 1
sampai dengan 25040. Jadi misalkan angka acak pertama adalah 1653, angka 1653 tersebut berada di
antara 1501 dan 4500, jadi desa Sukamanah terpilih. Angka acak kedua dikeluarkan/dipilih, misalkan
angka tersebut adalah 9201.Angka ini terletak pada selang 6851 sampai dengan 10850, berarti desa
Sukamakmur terpilih.Dengan cara ini klaster yang lebih besar memiliki kesempatan untuk terpilih
lebih besar pula, karena selang yang dimiliki lebih lebar.Ariawan dan Frerichs (1995) telah
mengembangkan perangkat lunak CSurvey yang dapat digunakan untuk memilih klaster dengan
metode PPS.

Pengambilan sampel dengan metode klaster akan menghasilkan estimasi parameter dengan
presisi yang lebih rendah dibandingkan sampel acak stratifikasi dan sampel acak sederhana. Tetapi
karena metode ini lebih murah dan mudah dilakukan untuk survei pada manusia, maka metode klaster
sangat sering dipergunakan untuk penelitian survei.

Pada pengambilan sampel dengan banyak tahap, perhitungan estimasi parameter dan standard
error menjadi lebih rumit karena tiap tahap pengambilan sampel harus diperhitungkan.Teknik estimasi
varians dan perhitungan uji statistik sangat berbeda dengan sampel acak sederhana. Metode linearisasi
Taylor banyak digunakan untuk estimasi varians dan uji statistik untuk sampel dengan banyak tahap.
Bab 6 Page 9
Beberapa perangkat lunak statistik SPSS, Stata dan SAS menyediakan fasilitas untuk perhitungan
estimasi varians dan uji statistik dari pengambilan sampel secara bertahap.

Secara umum dikatakan bahwa estimasi standar error yang diperoleh pada metode sampel

klaster kurang-lebih lebih besar dari standar error yang diperoleh pada metode
sampel acak sederhana dengan besar sampel yang sama, dimana m adalah besar sampel rata-rata
untuk tiap klaster dan σx adalah intraclass correlation coefficient (atau disebut juga rate of
homogeneity). Nilai koefisien σx dapat berkisar antara nilai negatif, jika populasi di dalam klaster
sangat heterogen, sampai dengan 1, jika populasi dalam klaster homogen tetapi berbeda antar satu
klaster dengan klaster yang lain. Standar error pada sampel klaster akan sama dengan standar error
pada sampel acak sederhana jika koefisien σx = 1 (klaster heterogen), tetapi dapat lebih besar jika
klaster homogen. Perbandingan antara varians pada metode sampel kompleks (termasuk klaster)
dengan varians jika sampel diambil dengan cara acak sederhana dikenal sebagai design effect.

B. LANGKAH-LANGKAH PRAKTIS

Keterkaitan cara penarikan sampel dengan besar sampel

Pada bagian sebelumnya sudah diuraikan berbagai metode penarikan sampel. Bagian berikut
akan menjelaskan perhitungan besar sampel. Besar sampel dihitung berdasarkan teori limit sentral
pada distribusi sampel dan uji statistik. Rumus baku perhitungan besar sampel mengacu pada asumsi
bahwa sampel ditarik dengan metode acak sederhana. Di lapangan, seringkali kita tidak memiliki
kerangka sampel, walaupun ada namun tidak lengkap, sehingga sampel ditarik melalui beberapa tahap
(disebut juga disain sampel kompleks). Pada disain sampel kompleks, perhitungan besar sampel harus
dikoreksi dengan efek disain, yaitu perbandingan (ratio) antara varians yang diperoleh pada
pengambilan sampel secara kompleks (seperti sampel klaster) dengan varians yang diperoleh jika
pengambilan sampel dilakukan secara acak sederhana (Levy and Lemeshow, 1999).

Semakin besar variasi atau keragaman antar klaster dibandingkan variasi atau keragaman di
dalam klaster, semakin besar pula efek desainnya. WHO menggunakan efek desain = 2.0 untuk survei
prevalensi imunisasi. Ariawan dan Frerichs (1995) menggunakan efek desain = 2.0 pada survei cepat
untuk kejadian yang sering atau prevalensi diatas 15%.

Jadi, besar sampel sangat dipengaruhi oleh cara penarikannya, terutama jika penarikannya
tidak dilakukan secara langsung satu tahap menggunakan metode acak sederhana tetapi sampel ditarik
melalui beberapa tahap (disain sampel kompleks), maka besar sampel perlu dikalikan dengan efek
disain.

Bab 6 Page 10
Prinsip penetapan besar sampel

Pertanyaan yang sering diajukan adalah ”Berapa besar sampel yang dapat mewakili populasi?”. Pada riset kuantitatif, besar sampel sangat ditentukan oleh
banyak komponen, antara lain tujuan penelitian, jenis outcome variabel yang ingin diukur dan presisinya, ukuran dampak yang ingin diukur, selang
kepercayaan, kekuatan uji, dan cara penarikan sampel serta disain efeknya, seperti terlihat pada tabel # berikut.

Tabel 2. Berbagai komponen yang menentukan besar sampel

Outcome
Tujuan penelitian Presisi/ variasi Variasi Selang Kepercayaan Kekuatan Uji Cara penarikan sampel
variabel
1. Estimasi 1. Proporsi p, presisi Sp 90, 95, 99% 1. Acak sederhana
(satu sampel) 2. Rata-rata x, presisi Sx 2. Kompleks sampel

2. Uji Hipotesis 1. Beda p1-p2 Ukuran 90, 95, 99% 80,90,95% 1. Acak sederhana
(dua sampel) Proporsi Dampak: 2. Kompleks sampel
OR,RR
2. Beda x1-x2 90, 95, 99% 80,90,95% 1. Acak sederhana
rata-rata 2. Kompleks sampel

OR=Odds Ratio, RR=Risk Ratio, p= Proporsi, x=Rata-rata,


Sp = Standar deviasi proporsi; Sx = Standar deviasi rata-rata
p1 = Perkiraan Proporsi kelompok-1, p2 = Perkiraan Proporsi kelompok-2,
x1 = Perkiraan rata-rata kelompok-1, x2 = Perkiraan rata-rata kelompok-2,

Dari Tabel 2 terlihat bahwa, pada penelitian yang bertujuan melakukan estimasi (pada satu sampel), besar sampelnya ditentukan oleh perkiraan parameter
yang akan diukur (proporsi atau rata-rata) beserta variansnya, presisi atau deviasi antara nilai populasi dengan nilai sampel yang dapat ditolerir, selang
kepercayaan, dan bagaimana cara penarikan sampelnya (acak sederhana atau kompleks).
Agar bisa menetapkan besar sampel minimum pada suatu riset, peneliti harus memiliki informasi awal tentang hal yang ingin ditelitinya, terutama
outcome variabelnya. Informasi awal ini hanya bisa didapatkan melalui kajian literatur terkait hasil riset yang pernah dilakukan sebelumnya, baik di daerah
yang sama ataupun di tempat lain. Sampel minimum untuk uji hipotesis memerlukan informasi tambahan berupa besaran perbedaan efek intervensi (yang
akan diuji) yang dianggap bermakna secara substansi, selang kepercayaan dan kekuatan ujinya, dan bagaimana cara penarikan sampelnya (acak sederhana
atau kompleks).

Bab 6 Page 11
1. Besar sampel untuk survei (estimasi satu sampel)

Sebagai contoh, suatu survei dilakuan untuk mengetahui gambaran status gizi Balita di suatu
Kabupaten, apabila sampel ditarik secara langsung dari daftar seluruh Balita di Kabupaten tersebut,
maka besar sampelnya adalah sebagai berikut (Lwanga and Lemeshow, 1991; Paul dan Lemeshow,
1999).

Rumus perhitungan besar sampel untuk estimasi proporsi, sampel acak sederhana:
Z 2 ∗P (1−P)
n= α /2 2
d
Keterangan: n = besar sampel
Zα/2 = Nilai Distribusi Normal Standar pada α/2
P = Perkiraan proporsi
d =Presisi

Contoh-1
Tujuan riset: Mengetahui prevalensi gizi kurang pada Balita di Kabupaten Bogor. Penelitian di
Jawa Barat melaporkan angka gizi kurang pada Balita 15% (P=0,15). Peneliti 95% yakin (Zα/2 =
1,96) bahwa angka gizi kurang di Bogor berkisar 10—20% (d=0,05). Dengan menarik sampel
secara acak dari daftar Balita di Kabupaten (kerangka sampel tersedia), maka diperlukan
sampel minimum 196 Balita.

Z 2α /2∗P (1−P) 1 ,96 2∗0 , 15∗(1−0 , 15)


n= 2
= 2
=196
d 0 , 05

Di lapangan, seringkali kita tidak punya daftar Balita yang akurat di tingkat Kabupaten dan kita
tidak dapat melakukakan pemilihan acak sederhana terhadap Balita. Sehingga penarikan sampel
dilakukan secara cluster 2-bertahap, tahap pertama memilih beberapa Desa secara PPS dan tahap
kedua memilih beberapa Balita di Desa terpilih secara acak sederhana. Perhitungan besar sampelnya
perlu dikoreksi dengan mengalikan besar sampel dengan efek disain = 2.0, sehingga besar sampel
minimum menjadi 196 x 2 = 392 Balita.

Rumus perhitungan besar sampel untuk estimasi proporsi rancangan klaster:


2
Z α / 2∗P (1−P)
n= ∗deff
d2

2. Besar sampel untuk uji hipotesis (dua sampel)

Pada situasi tertentu survei dapat dilakukan untuk melakukan uji hipotesis, baik uji hipotesis beda
rata-rata ataupun uji hipotesis beda proporsi. Misalnya suatu survei di Kabupaten Bogor bertujuan
untuk mengetahui apakah ada peningkatan rata-rata kadar Hb ibu hamil antara sebelum dan setelah
mengkonsumsi tablet Fe. Besar sampel dapat dihitung dengan rumus sampel uji hipotesis beda dua
rata-rata kelompok dependen:
2 2
[ Z α / 2 + Z β ] ∗S
n=
( μ1 −μ2 )2

Bab 6 Page 12
Keterangan: n = besar sampel
Zα/2 = Nilai Distribusi Normal Standar pada α/2
S = Standar deviasi selisih nilai sebelum dan sesudah
u1, u2 = nilai rata-rata sebelum dan sesudah

Contoh-2
Tujuan riset: Membuktikan apakah ibu hamil yang mengkonsumsi 90 tablet atau lebih pil Fe,
memiliki kadar Hb lebih tinggi dibandingkan dengan yang mengkonsumsi kurang dari 90
tablet. Penelitian pendahuluan dengan sampel 20 ibu hamil (n1=20) sebelum mengkonsumsi
tablet Fe didapatkan rata-rata kadar Hb 9,5 g/dl dan sesudah mengkonsumsi tablet Fe
didapatkan rata-rata kadar Hb 12,5 ada peningkatan sebesar 3 g/dl dengan Standar Deviasi
6,0 g/dl (u1 – u2 =3.0 dan S=6). Pada tingkat kepercayaan 95% (Zα/2= 1,64) dan kekuatan uji
90% (Zb= 1,28). Maka diperlukan sampel minimum 35 ibu hamil

[ Z α / 2 + Z β ]2∗S 2 [1 .64 +1. 28 ]2∗6 2


n= 2
= 2
=35
( μ1 −μ2 ) (12. 5−9 .5 )

Sampel minimum yang dibutuhkan adalah 35 ibu hamil, yang sebelum mengkonsumsi tablet Fe
diukur kadar Hb-nya, kemudian setelah mengkonsumsi tablet Fe diukur kembali kadar Hb-nya untuk
diuji secara statistik apakah peningkatannya signifikan atau tidak. Perlu diingat bahwa perbedaan rata-
rata atau peningkatan (u1 dan u2) harus didasarkan pada perbedaan/peningkatan yang dianggap
bermakna secara subtansi, bukan hanya didasarkan pada penelitian terdahulu saja.

Besar sampel untuk berbagai rancangan riset kuantitatif

Pada bab sebelumnya telah diuraikan berbagai rancangan riset kuantitatif. Pertanyaan yang sering
muncul terkait dengan besar sampel adalah “Apakah besar sampel di pengaruhi oleh rancangan
riset?”. Dari uraian di Tabel # tentang berbagai komponen yang menentukan besar sampel terlihat
tidak ada komponen rancangan riset. Rancangan riset bukanlah faktor yang menentukan besar sampel.
Rancangan riset hanya menentukan cara perhitungan nilai proporsi dari estimasi parameter, misalnya
penentuan P1 dan P2 pada rancangan kasus kontrol akan berbeda dengan survei kros-seksional atau
kohor.

1. Besar sampel pada uji klinik

Seorang peneliti ingin membandingkan efek penurunan gula darah antara obat anti diabetes “A”
dan “B”. Hasil penelitian pendahuluan pada 5 pasien tiap kelompok selama 3 minggu pengobatan,
obat “A” menurunkan kadar gula darah sebesar rata-rata 40 mg/dl dengan standar deviasi 20 mg/dl.
Sedangkan obat “B” menurunkan kadar gula darah sebesar rata-rata 30 mg/dl dengan standar deviasi
15 mg/dl. Berapa sampel minimum yang diperlukan jika peneliti ingin menguji bahwa obat “A” lebih
baik dalam menurunkan kadar gula darah dibandingkan obat “B” pada derajat kepercayaan 95% dan
kekuatan uji 90% (Ariawan, 1998).

Rumus besar sampel untuk uji hipotesis beda rata-rata, rancangan acak sederhana:
2 2 2 2
[ Z α / 2 + Z β ] ∗S p [(n1 −1) S1 +(n2 −1)S 2 ]
n= S 2p =
( μ 1−μ 2 )2 Dimana (n1 −1 )+(n2 −1)

Bab 6 Page 13
Keterangan: n = besar sampel
Zα/2 = Nilai Distribusi Normal Standar pada α/2
S1, S2 = Standar deviasi kelompok 1 dan kelompok 2
Sp = Standar deviasi gabungan kedua kelompok
u1, u2 = nilai rata-rata pada kelompok 1 dan kelompok 2

Contoh-3
Tujuan riset: Menguji apakah efek penurunan gula darah oleh obat A lebih besar dibandingkan
obat B. Studi pendahuluan (n1=n2=5), penurunan gula darah obat A (u1=40 dan S1=20) dan obat
B (u2=30 dan S2=15). Perbedaan efek yang ingin dideteksi (u1-u2=10). Pada kepercayaan 95%
(Zα/2 = 1,96) dan kekuatan uji 90% (Zβ=1,28), maka sampel minimum yang diperlukan sebanyak
66 responden (dengan rincian 33 diberi obat A dan 33 diberi obat B).
2 2
2 [( n1 −1) S1 +(n2 −1)S 2 ] [(5−1)20 +(5−1 )15 ]
2 2
S p= = =312, 5
(n1 −1 )+(n2 −1) (5−1)+(5−1 )
[ Z α /2 + Z β ]2∗S 2p [1 , 96+1 , 28 ]2∗312 ,5
n= 2
= 2
=33
(μ 1−μ 2 ) ( 40−30)

Untuk menjamin kedua kelompok sehomogen mungkin, maka dilakukanlah pemilihan secara acak
untuk menentukan apakah seorang responden masuk ke kelompok A atau kelompok B. Prosedur ini
dikenal dengan nama randomisasi atau random alokasi. Dengan menggunakan tabel acak, peneliti
memasukkan responden ke kelompok A jika muncul angka 0—4 dan kelompok B jika muncul angka
5—9. Misalnya dari tabel acak keluar angka sbb: 2, 5, 1, 3, 7, 4, 8, 3, 9 dst. Sehingga
pengelompokan responden adalah: A, B, A, A, B, A, B, A, B dst. Dengan metode ini, jumlah
kelompok A = 5 responden berbeda dengan jumlah kelompok B = yang hanya 4 responden.

Untuk menghidari alokasi yang tidak sama antara kelompok A dan B, digunakan metode
randomisasi dengan blok permutasi. Misalnya untuk 2 kelompok atau 2 blok, jika muncul angka 0 sd
4 urutan pengelompokan responden adalah A dan B, jika muncul angka 5 sd 9 urutan pengelompokan
responden adalah B dan A. Misalnya angka acak yang muncul sama dengan sebelumnya yaitu: 2, 5, 1,
3, 7, 4, 8, 3, 9 dst. Sehingga pengelompokan responden adalah: A-B, B-A, A-B, A-B, B-A, A-B, B-A,
A-B, B-A dst.

Dengan metode random blok permutasi ini, jumlah kelompok A = 9 responden sama dengan
jumlah kelompok B = 9 responden. Dengan cara ini alokasi sama untuk tiap kelompok dapat
terpenuhi.

2. Besar sampel pada eksperimen di komunitas

Kegiatan eksperimen di komunitas biasanya dilakukan secara massal pada suatu kelompok
masyarakat. Riset berikut ini bertujuan untuk mengetahui efek intervensi program gizi di komunitas.
Hipotesisnya adalah intervensi baru di bidang gizi yang diujicobakan di Kecamatan X,Y,Z
(kecamatan intervensi) berdampak pada penurunan angka kurang gizi pada Balita dibandingkan
dengan program standar yang sudah berjalan selama ini di Kecamatan A,B,C (kecamatan kontrol).
Peneliti yakin 95% bahwa program baru dapat menurunkan angka kurang gizi sebesar 10%
dibanding program standar. Selama ini prevalensi kurang gizi di Kabupaten tersebut adalah 15%.
Dengan kekuatan uji 80% maka jumlah sampel minimum yang dibutuhkan adalah 222 Balita, dengan
rincian 111 Balita yang dipilih secara acak sederhana di Kecamatan intervensi dan 111 Balita yang
dipilih secara acak sederhana di Kecamatan Kontrol, seperti contoh-4 berikut.
Bab 6 Page 14
Rumus besar sampel untuk uji hipotesis beda dua proporsi rancangan acak sederhana:

[ Z α ∗√ 2 P( 1−P )+ Z β∗√ p1 ( 1− p1 )+ p2 (1− p2 )]


2
n= 2
( p1 − p2 )

p1 + p2
P=
2
Contoh-4
Tujuan riset: Mengetahui efek program intervensi gizi di suatu Kabupaten. Prevalensi kurang
gizi pada Balita dilaporkan 15%, peneliti 95% yakin (Zα/2= 1,96) bahwa program baru intervensi
gizi dapat menurunkan prevalensi gizi menjadi 5% (perbedaan efek p1-p2=10%) dengan
kekuatan uji 80% (Zβ = 0,84) diperlukan sampel minimum 222 Balita. (111 kelompok intervensi
dan 111 Balita kelompok kontrol)
0 , 15+0 , 05
P= =0 , 10
2
[1 , 96∗√2∗0 , 10(1−0, 10 )+0 ,84∗√0 , 15(1−0,15 )+0 , 05(1−0 ,05 )]2
n= =111
(0 ,15−0 , 05 )2
Besar sampel minimum yang diperlukan adalah 222 responden bila pemilihan sampel dilakukan
secara acak sederhana, namun jika pemilihan acak sederhana tidak mungkin dilakukan (karena
kerangka sampel Balita tidak tersedia), dapat melakukan penarikan sampel dengan metode kluster 2-
tahap. Tahap pertama memilih beberapa Desa secara PPS (di Kecamatan intervensi dan di
Kecamatan kontrol), tahap kedua memilih beberapa Balita di tiap Desa secara acak sederhana. Besar
sampel perlu dikalikan dengan disain efek, misalnya disain efek=2, maka besar sampelnya adalah 444
Balita, dimana 222 Balita kelompok intervensi dan 222 Balita kelompok kontrol.

Perlu diingat bahwa perbedaan proporsi (p1 dan p2) harus didasarkan pada perbedaan yang dianggap
bermakna secara subtansi, bukan hanya didasarkan pada hasil penelitian terdahulu saja

3. Besar sampel pada rancangan riset kohort

Rancangan riset kohor biasanya digunakan untuk mengetahui pengaruh suatu pajanan terhadap
suatu dampak (kesakitan) yang muncul pada kelompok masyarakat. Ada kelompok terpajan dan tidak
terpajan, dan ada insiden penyakit pada kedua kelompok. Ratio antara insiden ini dikenal dengan
nama Relatif Risk/RR. Jika insiden penyakit lebih besar pada kelompok terpajan, maka kita katakan
ada hubungan antara pajanan dengan penyakit.

Misalnya seorang peneliti ingin membandingkan dua terapi (pembedahan dengan radiasi) untuk
suatu jenis kanker. Dari penelitian terdahulu diketahui bahwa 35% pasien kanker yang menjalani
pembedahan meninggal dalam waktu 5 tahun. Jika peneliti ingin melakukan penelitian kohort, dengan
asumsi risiko kematian pada terapi radiasi adalah separuh dari terapi pembedahan, dan peneliti
menginginkan derajat kemaknaan 5% serta kekuatan uji 90%, maka besar sampel dapat dihitung
dengan memanfaatkan rumus besar sampel untuk uji hipotesis beda 2 proporsi: (Lwanga dan
Lemeshow, 1991; Ariawan, 1998).

[ Z α ∗√ 2 P( 1−P )+ Z β∗√ p1 ( 1− p1 )+ p2 (1− p2 )]


2
n= 2
( p1 − p2 )

Bab 6 Page 15
p1 + p2 p1
P= RR=
Dimana: 2 ; dan p2 ;

p1=insiden penyakit pada kelompok terpajan;


p2=insiden penyakit pada kelompok tidak terpajan.

Contoh-5
Tujuan riset: Membuktikan apakah risiko meninggal akibat terapi radiasi lebih rendah dari terapi
pembedahan. Proporsi meninggal pada terapi pembedahan dalam waktu 5 tahun adalah 35%
(p2=35%), peneliti menduga risiko kematian pada terapi radiasi adalah separuh dari terapi
pembedahan (RR=0,5), peneliti menginginkan derajat kemaknaan 5% (Zα/2= 1,64) dan kekuatan uji
90% (Zb= 1,28), maka p1 dan P dapat dihitung sbb:

p1=RR∗p2=0,5∗0, 35=0 ,175 dan P=(0 ,35+0 ,175 )/2=0 , 2625

dan besar sampel minimum adalah 262 sampel dengan rincian 131 sampel terapi bedah dan 131
sampel terapi radiasi

[1 , 96∗√2∗0 , 2625(1−0 , 2625 )+1, 28∗√ 0 ,175(1−0 ,175 )+0 , 35(1−0, 35 )]


2
n= =131
(0 , 175−0 ,35 )2

4. Besar sampel pada rancangan riset kasus control

Pada rancangan riset kasus kontrol, ada kelompok kasus (subjek dengan penyakit) dan kontrol
(subjek tanpa penyakit), kemudian peneliti membandingkan proporsi kasus yang terpajan dan proporsi
kontrol yang terpajan. Jika Odds kasus yang terpajan lebih besar dibanding Odds kontrol yang
terpajan (dikenal dengan nama Odds Ratio/OR) maka kita katakan pajanan merupakan faktor risiko
timbulnya penyakit.

Misalnya kasus berat bayi lahir rendah (BBLR), peneliti ingin menguji suatu hipotesis bahwa
anemia pada ibu hamil merupakan faktor risiko BBLR. Hasil penelitian seblumnya memperlihatkan
rasio odds sebesar 2,5. Prevalensi anemia pada ibu hamil sebesar 60%. Jika peneliti menginginkan
tingkat kepercayaan 95% dan kekuatan uji 80% (Ariawan, 1998). Hitunglah besar sampel yang
diperlukan.

Sebagian besar bayi lahir memiliki berat badan normal dan hanya sedikit yang BBLR, maka
prevalensi anemia pada ibu hamil dapat merupakan estimasi proporsi anemia pada ibu yang
melahirkan normal (P2) atau proporsi pajanan pada kelompok kontrol, dan nilai P1 dapat dihitung dari
nilai OR dan P2. Sedangkan besar sampel dihitung dengan menggunakan rumus sampel uji hipotesis
beda 2 proporsi (Lwanga dan Lemeshow, 1991; Ariawan, 1998).

[ Z α∗√2 P( 1−P )+ Z β∗√ p1 ( 1− p1 )+ p2 (1− p2 )]


2
n= 2
( p1 − p2 )

p1 + p2 OR∗p2
P= p1 =
Dimana: 2 ; dan (OR∗p 2 )+(1− p2 )
p1=proporsi terpajan pada kelompok kasus;

Bab 6 Page 16
p2= proporsi terpajan pada kelompok control

Contoh-6
Tujuan riset: membuktikan risiko anemia terhadap BBLR dengan rancangan riset kasus
kontrol. Hasil peneliti di negara lain menunjukkan rasio odds sebesar 2,5 (OR=2,5).
Prevalensi anemia pada ibu hamil diketahui dari hasil survei sebesar 60%. Peneliti
menginginkan tingkat kepercayaan 95% (Zα/2= 1,64) dan kekuatan uji 80% (Zb= 0,84). Karena
sebagian besar bayi yang lahir memiliki berat badan normal, maka prevalensi anemia pada
ibu hamil dapat dianggap sebagai proporsi anemia pada ibu yang melahirkan bayi berat
badan normal (p2=0,6), dan nilai p1 = 0,79 dari hasil perhitungan berikut:
OR∗ p2 2,5∗0,6
p1 = = =0 , 79
(OR∗p 2 )+( 1− p2 ) ( 2,5∗0,6)+( 1−0,6 )

dan besar sampel minimum adalah 144 dengan rincian 72 kasus dan 72 kontrol.
[1 , 64∗√2∗0,7(1−0,7 )+0 , 84∗√ 0,6(1−0,6 )+0 , 79(1−0 , 79 )]
2
n= =72
( 0,6−0 , 79)2

5. Perhitungan p1 dan p2 pada rancangan kohor dan kasus control

Pada riset rancangan kohor, p 1 adalah insiden sakit pada kelompok yang terpajan dan p 2 adalah
insiden sakit pada kelompok yang tidak terpajan. Dimana p1 = a / (a+b) dan p2 = c / (c+d).

Sakit
Pajanan Total
Ya Tidak
Ya a b a+b
Tidak c d c+d

Pada riset rancangan kasus kontrol, p 1 adalah proporsi pajanan pada kelompok kasus dan p 2
adalah proporsi pajanan pada kelompok kontrol. Dimana p1 = a / (a+c) dan p2 = b / (b+d).

Pajanan Kasus Kontrol


Ya a b
Tidak c d
Total a+c b+d

6. Besar sampel untuk situasi lainnya

 Besar sampel untuk multiple outcome

Ada kalanya riset dilakukan dengan tujuan untuk menilai berbagai kejadian (multiple a
sebagai sampel minimum dalam riset yang akan dilakukan. Misalnya pada survei besar seperti Riset
Kesehatan Dasar tahun 2007, besar sampel dihitung untuk berbagai jenis outcome (kejadian sakit dan
cakupan program) untuk mendapatkan gambaran di tingkat kabupaten/kota.

Bab 6 Page 17
 Besar sampel untuk multiple factor

Seringkali riset dilakukan dengan tujuan untuk mengetahui faktor-faktor (multiple factor) yang
berhubungan dengan suatu kejadian. Maka perhitungan besar sampel harus dilakukan untuk semua
faktor yang ingin diuji, kemudian diambil jumlah sampel terbesarnya sebagai sampel minimum dalam
riset yang akan dilakukan.

Misalnya faktor yang berpengaruh terhadap kejadian BBRL, besar sampel dihitung untuk
berbagai jenis faktor yang ingin diuji (seperti anemia, merokok, hipertensi, dan status ekonomi). Maka
perlu informasi tentang: proporsi BBLR pada ibu anemia dan pada ibu non-anemia, proporsi BBLR
pada ibu perokok dan pada ibu non-perokok, proporsi BBLR pada ibu hipertensi dan pada ibu non-
hipertensi, serta proporsi BBLR pada ibu miskin dan pada ibu tidak miskin. Kemudian dihitung besar
sampel untuk tiap variabel dan diambil jumlah sampel terbesarnya sebagai sampel minimum dalam
riset yang akan dilakukan.

 Besar sampel untuk analisis multivariabel

Ada kalanya dalam menjawab tujuan penelitian dilakukan analisis multivariat, agar pengaruh
variabel perancu dan variabel interaksi dapat dikontrol. Maka perhitungan besar sampel harus
dilakukan untuk dinilai kecukupannya dalam model multivariat.

Model multivariat (regresi logistik, regresi linier, atau regresi cox, dan regresi lainnya) memiliki
batasan jumlah maksimum variabel covariat yang boleh masuk agar didapatkan perkiraan yang akurat
dari model tersebut. Aturan praktis (role of thumb) mempersyaratkan setidaknya harus ada 10
(sepuluh) responden yang mengalami kejadian (event) per variabel (Elashoff dan Lemeshow, 2005).
Jumlah kejadian atau event merujuk pada frekuensi terkecil dari outcome. Sepuluh responden yang
mengalami (event) per variabel berlaku untuk variabel kontinyu atau variabel diskrit.

Misalnya untuk mengetahui faktor-faktor yang berhubungan dengan BBLR, ada 4 faktor yang
ingin diuji dalam model multivariat yaitu anemia, merokok, hipertensi, dan status ekonomi, paling
tidak diperlukan 40 responden yang mengalami BBLR dan 40 non-BBLR, dan tanpa model interaksi.
Bila ada interaksi maka jumlah sampel perlu ditambah.

 Besar sampel untuk studi pendahuluan atau untuk ujicoba kuesioner

Ada kalanya topik riset yang akan dilakukan sama sekali masih baru dan belum pernah ada riset
sebelumnya, sehingga peneliti tidak memiliki informasi awal untuk perhitungan besar sampelnya.
Dalam situasi seperti ini peneliti dapat melakukan studi pendahuluan (pilot study) kemudian hasilnya
dapat digunakan untuk perhitungan besar sampel minimum dalam studi lengkapnya. Pertanyaan yang
sering muncul adalah ”berapa besar sampel yang diperlukan untuk studi pendahuluan tersebut?”.

Pada situasi lain, peneliti memerlukan ujicoba instrumen (kuesioner) untuk menguji apakah
instrumen tersebut sudah valid dan reliabel. Pertanyaan yang sering muncul adalah ”berapa besar
sampel yang diperlukan untuk ujicoba kuesioner tersebut?”.

Tidak ada batasan yang pasti tentang jumlah sampel minimum untuk studi pendahuluan atau
untuk ujicoba kuesioner. Beberapa ahli menyarakan untuk studi pendahuluan atau ujicoba kuesioner
dibutuhkan paling tidak 30 responden dengan asumsi 30 responden dapat membentuk distribusi
normal. Ahli lain berpendapat bahwa sampel 20 responden sudah cukup untuk studi pendahuluan atau
ujicoba kuesioner.

 Besar sampel untuk studi evaluasi sistem (populasi terbatas)

Bab 6 Page 18
Pada riset yang bertujuan untuk mengevaluasi program layanan kesehatan atau sistem layanan
kesehatan, unit sampelnya adalah pelayanan kesehatan seperti Puskesmas atau Rumah Sakit. Jumlah
puskesmas atau rumah sakit di suatu wilayah biasanya terbatas. Sehingga perhitungan besar
sampelnya perlu koreksi dengan populasi terbatas.

Sebagai contoh, suatu survei dilakukan untuk mengetahui kesiapan Puskesmas memberikan
pelayanan antenatal sesuai standar (tenaga, sarana, & pra-sarana). Di suatu Kabupaten, diperkirakan
baru 70% puskemas yang siap memberikan pelayanan antenatal, dari 50 puskesmas yang ada, jumlah
puskesmas untuk disurvei dapat dihitung sebagai berikut (Lwanga and Lemeshow, 1991).

Rumus perhitungan besar sampel untuk estimasi proporsi, populasi terbatas:

Z 2α / 2∗P(1−P )∗N
n=
d 2 ( N −1)+ Z 2α /2∗P( 1−P )

Keterangan: n = besar sampel


Zα/2 = Nilai Distribusi Normal Standar pada α/2
P = Perkiraan proporsi
N = Besar populasi
d =Presisi

Contoh-7
Tujuan riset: Mengetahui kesiapan puskesmas memberikan pelayanan antenatal. Diperkirakan
puskesmas yang siap hanya 70% (P=0,7). Peneliti 95% yakin (Zα/2 = 1,96) bahwa puskesmas yang
siap berkisar 60—80% (d=0,10). Dari 50 puskesmas yang ada (N=50), diperlukan sampel
minimum 32 Puskesmas.

Z 2α / 2∗P(1−P )∗N 1 , 962∗0,7( 1−0 ,15 )∗50


n= = =32
d 2 (N −1)+ Z 2α /2∗P(1−P ) 0 , 052 (50−1)+1 , 962∗0,7 (1−0 , 15)

 Besar sampel untuk analisis data sekunder

Ada kalanya riset dilakukan dengan melakukan analisis terhadap data sekunder yang sudah ada
seperti data Susenas (survei sosial dan ekonomi nasional), Riskesdas (riset kesehaan dasar), SDKI
(survei demografi dan kesehatan indonesia, atau data survei lainnya. Pada kondisi ini, perhitungan
besar sampel tidak perlu dilakukan, tetapi harus dilakukan perhitungan presisi atau sampling error
(untuk estimasi satu sampel) atau perhitungan kekuatan uji statistiknya (untuk uji statistik dua sampel)
dari jumlah sampel yang ada.

Misalnya pada survei Riset Kesehatan Dasar tahun 2007, di DKI Jakarta ada 750 responden ibu
bersalin (dalam periode 2002 sd 2007) dan sebanyak 100 ibu melakukan persalinan dengan metode
sesar (p = 0,13). Pada interval kepercayaan 95% dan efek disain (deff) = 2,0 maka presisi atau
sampling error angka perkiraan persalinan sesar di DKI Jakarta sebesar 3,4% (d = 0,034), yang
didapat dari rumus berikut.
2
Z α /2∗P (1−P)
n= 2
∗deff
Jika d ,

Bab 6 Page 19
√ √
2
Z α /2∗P(1−P )∗deff 1 , 96 2∗0 ,13∗(1−0 ,13 )∗2
d= = =0 ,034
maka n 750

Jika peneliti ingin mengetahui apakah pemeriksaan antenatal pada dokter spesialis kebidanan
berhubungan dengan tindakan persalinan sesar, dengan asumsi 20% persalinan sesar terjadi pada ibu
hamil yang memeriksakan kehamilannya ke dokter spesialis kebidanan, dan hanya 10 % persalinan
sesar pada ibu yang memeriksakan kehamilan ke tenaga kesehatan lain. Pada interval kepercayaan
95% didapatkan kekuatan uji sebesar 99%, artinya jumlah sampel tersebut cukup untuk mendeteksi
adanya hubungan yang signifikan secara statistik antara pemeriksaan antenatal ke dokter spesialis
kebidanan dengan tindakan persalinan sesar.

Kekuatan uji dihitung dengan menggunakan rumus berikut. Setelah didapat nilai Z, kemudian
dengan menggunakan tabel distribusi normal standar dikonversi ke nilai probabilitas untuk
mendapatkan angka kekuatan uji dalam satuan %.

[ Z α ∗√ 2 P( 1−P )+ Z β∗√ p1 ( 1− p1 )+ p2 (1− p2 )]


2
n= 2
Jika ( p 1 − p2 )

Maka
Z β=
[ √ n∗|P0−P1|]−[ Z α∗√2 P(1−P )]
√ 2 P (1−P)

Anggapan yang salah tentang sampel


 Anggapan-1: menaikkan besar sampel akan mengurangi semua bias
 Anggapan-2: peningkatan besar sampel akan menurunkan SE secara linier
 Anggapan-3: penarikan besar sampel secara proporsional (misalnya 10% dari populasi) sudah
dianggap cukup

PENUTUP

Perhitungan besar sampel yang dicontohkan di atas merupakan besar sampel minimum untuk
keperluan analisis data, sehingga dalam pengambilan sampel di lapangan perlu diperhitungkan efek
dari non-response, missing data, atau drop out. Pada kondisi normal, menaikkan sampel sebesar 10%
sudah dianggap cukup untuk mengantisipasi adanya non-response, missing data, atau drop out.
Namun pada kondisi tertentu seperti studi kohor atau penelitian di wilayah konflik mungkin
diperlukan peningkatan besar sampel sampai 20% .

Bab 6 Page 20
BAHAN RUJUKAN

Elashoff JD and Lemeshow S. Part II.1. Sample Size Determination in Epidemiologic Studies in
Ahrens W and Pigeot I, 2005. Handbook of Epidemiology. Bremen, Germany, Springer.
Lwanga SK and Lemeshow S, 1991. Sample Size Determination in Health Studies: A Practical
Manual. Geneva, WHO
Levy PS and Lemeshow S, 1999. Sample of Population . 3rd eds. Geneva, WHO
Ariawan I, 1998. Besar sampel pada penelitian kesehatan. Modul Kuliah FKM UI.
Chow SC, Shao J, Wang H. 2008. Sample Size Calculations in Clinical Research. Second edition.
Chapman & Hall/CRC.
Lachin, JM. Introduction to Sample Size Determination and Power Analysis for Clinical Trials.
Controlled Clinical Trials 2, 93-113 (1981).
ftp://ftp.biostat.wisc.edu/pub/chappell/641/papers/paper28.pdf
Machin D, Campbell M.J., Tan S.B., dan Tan S.H. 2009 Sample Size Tables for Clinical Studies.
Third edition. Willey-Blackwell.
Friede T dan Kieser M. 2006. Sample Size Recalculation in Internal Pilot Study Designs: A Review.
Biometrical Journal. Volume 48, Issue 4, pages 537–555, August 2006

Website:
http://home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/SampleSize.htm
http://www.healthknowledge.org.uk/public-health-textbook/research-methods/1a-epidemiology/
methods-of-sampling-population

Bab 6 Page 21

Anda mungkin juga menyukai