Judul Buku

BIOSTATISTIK DASAR
(Deskriptif, Indikator kesehatan dan Sampling)
ARIS SANTJAKA
BIDANG ILMU KESEHATAN

KEDOKTERAN, FARMASI, KEPERAWATAN, KEBIDANAN
KESEHATAN MASYARAKAT, KESEHATAN LINGKUNGAN,
FISIO TERAPI, RADIODIAGNOSTIK
Kata pengantar
Alhamdulillah hi robbil alamin segala puji bagi Allah SWT yang telah memberi
kekuatan penulis untuk menyelesaikan penulisan buku ini. Banyak hal yang saling
berinteraksi untuk menyusun buku ini, hal pertama yang menjadi pertimbangan kebutuhan
mahasiswa dan kebutuhan praktis ilmu statistik dikaitkan dengan kebutuhan keilmuan
kesehatan yang membutuhkan analisis sebagai penguat argumentasi akademis dari beberapa
fenomena yang dijumpai dalam penelitian kesehatan. Pertimbangan kedua dalam analisis
biostatistik yang membutuhkan rujukan tidak hanya teoritis tetapi juga data-data empirik
untuk memperkuat dasar teoritis tersebut benar, seperti teori probabilitas peluang kejadian
kelahiran yang dikaitkan dengan proporsi penduduk didasarkan pada jenis kelamin.
Pertimbangan ketiga saat melakukan uji statistik dibutuhkan nilai parameter, maka juga
disisipkan satu bab indikator kesehatan yang bisa digunakan oleh mahasiswa maupun praktisi
sebagai rujukan untuk menentukan parameter maupun keberhasilan derajat kesehatan.
Ketiga pertimbangan inilah yang dijadikan dasar pengembangan buku ini dari buku-
buku yang sudah ditulis sebelumnya. Termasuk materi sampling di dalam buku ini yang lebih
banyak ditambahkan dan lebih bervariasi dibandingkan buku sebelumnya. Sampling ini
sangat penting di dalam statistik, karena proses pengambilan keputusan berupa inferensi
statistik memerlukan representasi populasi, sehingga kesimpulan yang diambil dari sampel
akan mendekati kondisi di populasi.
Statistik secara filosofi teologis, sebenarnya sudah tersirat dalam kitab suci
sebagaimana tertulis dalam Al-Qur’an yaitu surat Luqman ayat 34 (QS:31:34) ...dan tiada
seorangpun yang dapat mengetahui (dengan pasti) apa yang akan diusahakannya besok, dan
tiada seorangpun yang dapat mengetahui dibumi mana dia akan mati, sesungguhnya Allah
maha mengetahui lagi maha mengenal. Ini menunjukkan adanya ketidak pastian (uncertinity)
di dalam hidup yang dikenal dengan gejala stochastic sebagai prinsip dasar statistik
(probabilistik), sebagai contoh efektifitas satu alat kontrasepsi 99%; tetapi ada satu orang
yang hamil setelah ikut alat kontrasepsi tersebut, maka bisa dikatakan satu orang yang hamil
itu masuk yang satu persen. Atas dasar inilah maka penulis bisa mengatakan bahwa hukum
statistik:
“satu satunya yang pasti dalam statistik adalah ketidak pastian itu sendiri”
Ayat yang lain di surat Al Furqon ayat 2 (QS. 25:2) “ ..KepunyaanNyalah yang ada di
langit dan dibumi, ......, dan Dia telah menetapkan ukuran-ukurannya dengan serapi-rapinya”.
Ayat ini justru menunjukkan suatu kepastian bahwa segala sesuatu ada ukuran yang jelas,
inilah yang disebut dengan gejala deterministik di dalam ilmu, gejala ini melahirkan hukum
alam di dalam terminologi keilmuan, sehingga dikenal hukum Newton I, II dan III, hukum
Archimedes dll yang kesemuanya menetapkan satu gejala yang sama dan berlaku universal.
Dua gejala ini yang mewarnai kaidah dalam keilmuan.
Konsep lain yang bisa ditafsir dengan pendekatan statistik seperti memaknai Al- Qur’an
Surat Al Baqoroh ayat 35 bagi seorang statistisi, ayat tersebut berbunyi “ Dan Kami
berfirman: wahai Adam diamilah oleh kamu dan istrimu surga ini dan makanlah makanan-
makanannya yang banyak lagi baik dimana saja yang kamu sukai, dan janganlah kamu
mendekati pohon ini yang menyebabkan kamu termasuk orang-orang yang zalim”.
Ayat ini menegaskan bagaimana Allah memberikan kebebasan kepada Adam untuk
berbuat apa saja, kecuali mendekati satu pohon. Konsep ini terbayang oleh penulis seperti
konsep degree of freedom (derajat bebas), dimana seseorang bebas menentukan apa saja,
tetapi hanya satu yang tidak bebas, sehingga df dirumuskan “n-1”.
Ilustrasi teologis tersebut merupakan perspektif penulis terhadap kaidah keilmuan
statistik, pada akhirnya perkenankan penulis mengucapkan terima kasih kepada:
1. Prof. Dr. H. Kuntoro dr, MPH. selaku dosen biostatistik Universitas Airlangga
Surabaya yang telah banyak memberikan bekal ilmu dengan begitu tulus.
2. Dr. Hari Basuki dr, MPH. selaku dosen biostatistik Universitas Airlangga Surabaya
yang telah banyak meluangkan waktu berdiskusi dengan penulis pada berbagai
konsep statistik.
3. Direktur Poltekkes Kemenkes Semarang yang mendorong penulis untuk selalu
berkarya, sehingga bisa menjadi pustaka di kalangan civitas akademis.
4. Keluargaku termasuk istriku Mamik SW, Hana IS dan Bahrul IS yang paling
banyak memberikan semangan, terlebih pada Bahrul IS yang banyak membantu
dalam akses informasi, sehingga buku ini selesai
5. Teman-teman semuanya yang tidak bisa disebutkan satu persatu dan seseorang
yang memberikan kekuatan untuk menyelesaikan buku ini.
6. Para user buku sebelumnya yaitu mahasiswa, temen-temen dosen maupun
pengguna di seluruh tanah air yang telah banyak memberikan masukan, untuk
perbaikan materi, penulisan di dalam buku ini.
7. Penerbit dan staf yang telah memberi kesempatan penulis, sehingga buku ini bisa
diterbitkan.
Penulis berharap buku sederhana ini menjadi start untuk penulisan buku serial
biostatistik berikutmya, sehingga menjadi salah satu alternatif bacaan untuk membantu
memberikan salah satu referensi dalam menganalisis masalah bidang kesehatan.
Mei 2021
Penulis
Aris Santjaka
DAFTAR ISI
Halaman
KATA PENGANTAR ............................................................................................... i

DAFTAR ISI . ii
...............................................................................................
.
BAB I. STATISTIK SEBAGAI SEBUAH KONSEP DAN TERAPAN

A. Konsep dan sejarah statistik ...................................................................................... 1
B. Fungsi dan peran statistik .......................................................................................... 5
C. Beberapa pengertian ................................................................................................... 7
BAB II. PENGUMPULAN DATA

A. Pendahuluan ............................................................................................................... 18
B. Sumber data ............................................................................................................... 20
C. Metode dan instrumen pengumpulan data ................................................................ 21
BAB III. PENGOLAHAN DAN PENYAJIAN DATA

A. Pendahuluan ................................................................................................................ 39
B. Pengolahan data .......................................................................................................... 39
C. Penyajian data ............................................................................................................. 44
BAB IV. PROBABILITAS

A. Pendahuluan ................................................................................................................ 58
B. Ruang sampel/Sample space ....................................................................................... 60
C. Kejadian/even .............................................................................................................. 61
D. Menghitung titik sampel ............................................................................................. 63
BAB V. STATISTIK DESKRIPTIF

A. Pendahuluan ................................................................................................................ 80
B. Notasi penjumlahan (∑) .............................................................................................. 81
C. Ukuran pemusatan (Tendency central) ....................................................................... 81
D. Ukuran penyebaran (Dispersi) .................................................................................... 87
BAB VI. INDIKATOR KESEHATAN

A. Pendahuluan ............................................................................................................... 112
B. Ukuran dasar .............................................................................................................. 112
C. Vital statistik .............................................................................................................. 115
D. Indikator lainnya ........................................................................................................ 120
BAB VII. POPULASI DAN SAMPEL

A. Pendahuluan ............................................................................................................. 128
B. Terminologi .............................................................................................................. 130
C. Kriteria sampel yang baik ........................................................................................ 133
D. Teknik sampling ...................................................................................................... 135
BAB I. STATISTIK SEBAGAI SEBUAH KONSEP
DAN TERAPAN
Konsep dan sejarah statistik.
Sejarah perkembangan ilmu pengetahuan dimulai dari

pendekatan filsafat yang digunakan sebagai dasar pijakan
penarikan kebenaran, filsafat ini mengandalkan dialektika logika
sehingga ukuran kebenaran adalah logika, jika tidak logis maka
salah, hal ini bisa difahami karena ilmu pengetahuan berasal dari
filsafat Yunani kuno yang mengedepankan pemikiran-pemikiran
filsafat yang memanjakan akal sebai instrumen mencari
kebenaran, meskipun pada masa ini juga kaya dengan mitologi,
dimana pada era ini banyak sekali dikenal dengan para filosof
jagoan yang sampai sekarang masih banyak diingat orang semisal
Plato, Socrates dan Aristoteles. Ketiganya merupakan jagoan
filsuf dizamannya, Plato mencari kebenaran dengan cara berdebat
dengan banyak orang yang ditemuinya, dari hasil perdebatan itu
dirumuskanlah sehingga menjadi suatu kesimpulan yang
kemudian dianggap sebagai kebenaran. Aristoteles terkenal
dengan dialektika yaitu logika menarik suatu kesimpulan yang
kemudian disebut preposisi yang didasarkan pada premis mayor
dan minor, kemudian dikenal dengan silogisme, sebagai metode
induktif (premis minor) dan metode deduktif (premis mayor)
untuk menyimpulkan kebenaran.
Era ini tenggelam seiring dengan tenggelamnya zaman
keemasan berfikir masa itu, diganti dengan era kekuasaan yang
dijadikan panglima, sampai akhirnya Socrates dihukum mati
dengan cara meminum racun. Era ini terjadi ketika peperangan
antara Athena dan sparta. Sparta menang, maka tergeruslah era
pemikiran kritis diganti dengan kekuasaan dengan pedang, siapa
yang kuasa itu yang menang, nilai kebenaran diukur dari siapa
yang berkuasa hal ini terjadi sampai abad pertengahan yang
dikenal dengan the dark age.
Redupnya dunia pemikiran ini sangat panjang sampai pada
akhirnya datang masa kejayaan Islam melalui dinasti Abbasyiah
di Baghdad dan dinasti Umayyah di Barat Spanyol, yang
bekasnya masih tersisa sampai sekarang, era ini dikenal dengan
jaman keemasan peradapan Islam sekitar abad ke 9 sampai abad
1
ke 12 M yang sudah memadukan filsafat yunani dengan

percobaan-percobaan ilmiah untuk membuktikan dugaan-dugaan
alamiah yang disaksikan, kejayaan Islam di bidang intelektual
dengan mendirikan universitas-universitas dan peradapan berupa
bangunan bangunan indah yang didasarkan pada ilmu
pengetahuan seperti mesjid Cordova di Spanyol, menyebabkan
arus intelektual Eropa belajar di universitas-universitas Spanyol,
budaya intelektual dan budaya lainnya masuk ke Eropa melalui
kontak budaya dan ilmu pengetahuan antara Eropa dengan
kerajaan Andalusia di Spanyol yang menjadi pusat ilmu
pengetahuan bagi Eropa.
Kontak budaya di abad pertengahan bisa disaksikan, cara
berpakaian bangsawan Eropa seperti masyarakat muslim
Andalusia. Benarlah kata sosiolog muslim Ibnu Khaldun yang
mengatakan “bangsa yang kalah akan mengikuti perilaku bangsa
yang menang”. Inilah era baru bagi Eropa untuk memeluk
madzab baru yang bernama ilmu pengetahuan, meskipun pada
awalnya hanya bersifat filosofis, tapi lambat tapi pasti Eropa
sudah terwarnai dengan cahaya ilmu pengetahuan, inilah “hutang
sejarah Eropa terhadap dunia Islam”.
Kajian Filosofis ini pada akhirnya menjemukan banyak
orang, karena tidak ada ujung pangkalnya dan dimensinya sangat
luas untuk ditafsirkan dalam kaidah ilmiah yang berlaku secara
universal, kejenuhan ini tersurat dalam kata-kata Rene Descartes
“sudah saatnya kita keluar dari logika imajinatif Aristoteles, dan
memulai manusia menjawab permasalahannya sendiri, misal
kemiskinan, kelaparan dll”.1
Lontaran Rene Descartes ini kemudian diikuti ilmuwan
lainnya yang berusaha untuk memecahkan masalah manusia
dalam tataran praktis, dimulailah uji coba ilmiah dari fenomena
alam, kita kenal Newton, Pascal, Boyle, Archimedes dan lain-
lain.
Percobaan alamiah ini menghasilkan rumusan universal,
yang berlaku secara umum dimanapun berada, sebagaimana
hukum grafitasi, hukum pascal, hukum archimedes, hukum
Newton I, II. Hal ini dapat dirumuskan karena gejala yang ada
gejala tunggal (deterministik), sehingga kesimpulannyapun
bersifat universal dimanapun berada. Era inipun mulai melambat,
2
seiring dengan telah dirumuskannya universalitas gejala alam

yang tetap, penelitian deterministik yang spektakuler adalah
pemetaan genetik manusia pada awal abad 21 yang mempunyai
kesimpulan bahwa manusia berasal dari wanita yang sama kurang
lebih 150 juta tahun yang lalu.
Era selanjutnya manusia sudah mulai bertanya tentang
kemanfaatan ilmu sebagai bentuk aplikasi dari prinsip-prinsip
dasar ilmu yang sudah dirumuskan pada abad berikutnya,
mulailah berlaku era pragmatisme, sebagai perpaduan antara
faham keilmuan dan kemanfaatan bagi manusia (konsep
aksiologis ilmu pengetahuan ataupun hasil riset).
Fenomena yang berkembang kemudian, tidak lagi
menjumpai gejala tunggal saja, tetapi juga gejala yang berubah-
ubah (stochastic) yang membutuhkan universalitas, sehingga bisa
difahami oleh semua orang. Gejala yang berubah-ubah ini
tergantung pada ruang dan waktu, satu saat dan tempat tertentu
gejala muncul, ditempat yang berbeda justru sebaliknya. Contoh
distribusi puncak kasus malaria di daerah endemis Purworejo dan
endemis di NTT berbeda, sehingga manusia berhadapan dengan
gejala yang berbeda, dengan demikian cara menyimpulkannya
juga bersifat lokal spesifik.
Dinamika problematika manusia juga bergerak tak
beraturan dan sulit diduga seperti jurus dewa mabuk (random
walk) atau dengan kata lain bergerak secara acak, gejala seperti
ini tidak dapat ditarik dalam satu rumusan tunggal dan digunakan
secara umum, tapi manusia harus dapat merumuskan fenomena
ini dalam rumusan yang dapat dikomunikasikan dan difahami
oleh orang lain, maka kemudian manusia mencari rumusan
kaidah yang bisa disepakati bersama, jawabnya kemudian orang
lari kepada kebolehjadian (probability) inilah yang kemudian
menjadi prinsip dasar statistik.
Prinsip dasar probalitas inilah yang menyebabkan
kesimpulan yang diambil dari gejala stochastic menjadi tidak
tunggal, sebagai contoh ditarik kesimpulan rata-rata tinggi badan
mahasiswa 160 cm, hal ini tidak berarti semua mahasiswa
tingginya 160 cm, tetapi tinggi 160 cm tersebut mempunyai
konsep ada yang lebih rendah dan lebih tinggi. Dengan kata yang
lebih mudah adalah tinggi badan lebih dari 160 cm memberikan
3
kelebihannya pada yang kurang dari 160 cm, sehingga

kesimpulan yang ditarik cenderung pada nilai tengahnya. Inilah
konsep moderat di dalam statistik.
Contoh lain yang lebih bersifat kualitatif supaya lebih
mudah; satu kelompok katakanlah 10 orang, ada satu orang yang
paling tinggi diantara 10 orang tersebut katakanlah bernama “A”,
tetapi ketika “A” tersebut, dipindahkan ke 20 orang kelompok
lain, ternyata si “A” bukan paling tinggi; tetapi justru “B”; tetapi
jika si “B”, digabung dengan kelompok lainnya yang lebih
banyak dan berbeda karakteristik subyeknya, belum tentu si “B”
ini paling tinggi, boleh jadi orang lain. Ilustrasi ini melahirkan
satu konsep bagaimana cara menarik kesimpulan, yang sangat
tergantung dari konsep seberapa besar sampel itu bisa mewakili
populasi, sehingga kesimpulan yang diperoleh menggambarkan
populasi. Dari sini muncul konsep dasar besar sampel dalam satu
populasi. Dengan kata lain kesimpulan dari satu populasi terbatas,
berbeda dengan populasi terbatas lainnya.
Bagaimana cara penarikan kesimpulan secara universal,
maka ilmuwan statistik merumuskan penarikan kesimpulan itu,
dengan cara membandingkan antara nilai hasil pengamatan
dengan nilai acuan, berupa tabel teoritis yang disebut dengan titik
kritis, yang didasarkan pada distribusi data tertentu.
Ilustrasi lain guna memudahkan memahami gejala
stochastic seperti pernyataan berikut “efektifitas kontrasepsi
mantap 99%” artinya dari 100 orang yang melakukan kontap 99
yang tidak hamil, sedangkan satu orang hamil. Pertanyaannya
siapa yang bisa memastikan seseorang masuk kelompok 99 orang
tidak hamil atau1yang hamil, tidak ada yang bisa menjamin hal
itu, tetapi sebagai sebuah kesimpulan hal itu dianggap benar. Dari
ilustrasi di atas dapat dibuat kesimpulan kebenaran hasil riset
statistik bukan kebenaran 100 %, tapi merupakan kebenaran
relatif yang boleh jadi berubah seiring dengan perubahan dimensi
tempat dan waktunya, dari sini muncul suatu klausul
bahwa”kebenaran ilmu relatif, tidak mutlak”. Prinsip dasar ilmu
peluang adalah analisis random dari suatu fenomena yang
didekati dengan pendekatan matematik7, sehingga penarikan
kesimpulannyapun juga bukan merupakan kepastian.
4
Kesimpulan pendekatan gejala stochastic, karena berangkat

dari gejala berubah-ubah, maka kesimpulan yang ditarik
mengandung ketidak pastian dan hasilnya cenderung bias, karena
sangat tergantung dari besaran sampel yang diambil dari satu
populasi terbatas, sedangkan penarikan kesimpulan didasarkan
pada nilai titik kritis yang tidak terhingga, dengan demikian bisa
dirumuskan, jika pendekatan statistik yang digunakan
konsekuensinya adalah bias dan ketidak pastian menjadi
kepastian, karena diambil sebagai dasar penarikan kesimpulan.
Dari sini boleh jadi hukum statistik yaitu “ satu satunya
kepastian adalah ketidak pastian “.2
Ketidak pastian menjadi madzab baru dalam penarikan
kesimpulan berbasis statistik, hal ini melahirkan kebenaran
relative yang pada akhirnya manusia tidak percaya lagi pada
kebenaran dengan ungkapannya “tidak ada kebenaran”;
pernyataan tidak ada kebenaran padan katanya “semua salah,
kalau semua salah, berarti pernyataan tidak ada kebenaran itu
juga salah”. Dilematis perputaran pemikiran manusia. Dengan
demikian pernyataan yang benar adalah “tidak ada kebenaran,
kecuali kebenaran itu sendiri”2. Terlepas apakah seseorang
menemukannya dengan cara dan butuh waktu berapa lama itu
soal lain.
Prinsip dasar statistik yang berbasis teori peluang
(probabilitas), yang pada awalnya dikenal sebagai permainan
judi, tentang peluang munculnya suatu kejadian, kemudian secara
matematik oleh Blaise Pascal dan Pierre de Fermat abad ke 17
terformulakan menjadi peluang kejadian. Inilah cikal bakal
statistika yang kita kenal sekarang ini, dengan berbagai
pengembangan. Rumusan secara matematik ini kemudian
memicu pengembangan berbagai penemuan penting di dalam
statistika untuk menarik kesimpulan hasil pengamatan atau
percobaan stochastic, yaitu melalui konsep distribusi sampling.
Sehingga penelitian yang dilakukan dapat dijadikan sebagai basis
kesimpulan.
Distribusi normal pertama kali dikemukakan oleh Abraham
de Moivre 1733 jauh sebelum Gauss dan Laplace menemukan,
meskipun pada awalnya dia tidak tahu untuk apa distribusi
tersebut, kemudian karya ini dilupakan orang, sampai tahun 1924
5
Karl Pearson menemukan di suatu perpustakaan. Sampai Gauss

1794 menyampaikan distribusi berbentuk lonceng ini untuk
sampel besar (n>30), sehingga distribusi tersebut dikenal sebagai
distribusi Gauss.
Distribusi ini menjelaskan adanya kecenderungan
pemusatan data (tendency central) dan sebaran data
(dispersi/varians) itu membentuk lonceng yang simetris, sehingga
sebuah kesimpulan apakah melampaui suatu titik kritis untuk
menentukan apakah hipotesis dapat diterima atau di tolak.
Distribusi normal yang lebih menitik beratkan pada sampel
besar, membuat peneliti yang berhubungan dengan sampel kecil
kesulitan dalam menginterpretasikan hipotesis yang dibuat,
sampai akhirnya WS Gosset 1876-1937 (seorang mahasiswanya
Karl Pearson) menemukan distribusi student kemudian dikenal
dengan distribusi student t sebagai nama samarannya. Distribusi
ini dimuat di Biometrika 1908 sampai sekarang distribusi ini
digunakan menganalisis data yang kecil8. Dua distribusi ini
kemudian menjadi dasar pengembangan distribusi statistik lain
yang dijadikan dasar penerikan kesimpulan hipotesis.
Fungsi dan Peran Statistik

Statistik mengambil peran hampir semua kehidupan
manusia, terutama pada gejala stochastic masalah kekinian
manusia di berbagai bidang kehidupan mulai dari perdagangan,
olah raga, kesehatan, biomedis. Penerapan ini merupakan
perpaduan antara statistika dan statistik, sehingga maksimalisasi
peran statistik dalam kehidupan menjadi sesuatu yang bisa
dipertanggungjawabkan.
Ruang Lingkup statistik yang dibicarakan estimasi
parameter, hypothesis testing dan pemodelan. Jadi statistik tidak
sekedar data Science.107 Berikut beberapa fungsi dan peranan
statistik antara lain:
1. Membuat estimasi data sampel terhadap populasi.
2. Memberikan gambaran kecenderungan distribusi data
melalui pola tertentu, seperti arah kecenderungan grafik
lima tahunan penyakit demam berdarah, dengan analisis
6
grafik minimal maksimal, rata-rata tahunan dan median

untuk menentukan terjadi Kejadian Luar Biasa atau tidak.
3. Penyederhanaan data kompleks menjadi data yang mudah
dimengerti. Data yang variatif dan tersebar begitu besar
dapat dirumuskan dalam indikator sederhana sesuai dengan
jenis datanya, jika data kontinyu bisa digunakan rata-rata;
jika data diskrit bisa digunakan indikator modus. Misal:
rata-rata kadar Hb ibu hamil 10,5; 75% ibu hamil
mengalami anemia.
Kesimpulan tersebut memberikan gambaran makro situasi
subyek yang sedang diamati.
4. Komparasi dapat dilihat dengan lebih mudah, seperti laki-
laki mengalami faktor risiko 2 kali lebih besar
dibandingkan dengan wanita terkena malaria di daerah
endemis.
5. Menarik kesimpulan lebih mudah, dengan menggunakan
uji statistik yang ada.
Contoh: alunan musik klasik berpengaruh terhadap tingkat
kecemasan pasien pra operasi.
6. Digunakan memprediksi sutu kejadian yang belum terjadi
berdasarkan model matematik yang dihasilkan dari uji
statistik tertentu.
Contoh:
Jumlah penduduk Indonesia di tahun 2030 sebesar 260 juta
jiwa.
7. Menentukan hubungan sebab akibat baik antara satu
variabel dengan satu variabel lainnya atau lebih dari satu
variabel ke variabel lainnya.
Contoh:
Semakin banyak konsumsi merokok, semakin besar risiko
terkena penyakit jantung.
Penyakit jantung di sebabkan karena berbagai variabel
antara lain konsumsi rokok, usia, stress, konsumsi
kholesterol dll.
8. Menarik suatu kebijakan berdasarkan hasil uji statistik,
seperti kebijakan pemberlakuan helm bagi pengendara
sepeda motor roda dua, disebabkan karena angka kematian
di jalan raya 80% karena trauma kepala.
7
Penggunaan gabungan obat anti viral dan malaria bisa

menurunkan virus covid sampai 90% selama tiga hari
pemakaian.
Peran dan fungsi statistik no 8 merupakan ujung dari hasil riset

statistik yang dilakukan, sehingga kebijakan yang diambil
berbasis riset yang bisa di pertanggung jawabkan secara
akademis.
Beberapa pengertian
Pengertian dimaksudkan untuk membatasi ruang lingkup
pembicaraan dan pemahaman bersama tentang suatu istilah yang
sedang didiskusikan, ada beberapa definisi yang disampaikan
antara lain:
1. Statistika
Beberapa definisi yang diberikan tentang statistika:
a. Ilmu yang berhubungan dengan pengumpulan dan
analisis data numerik dari sekumpulan data yang
berasal dari sampel representatif.
b. Cabang matematika yang berhubungan dengan
pengumpulan, analisis, interpretasi, dan penyajian
sekumpulan data numerik 3
c. Ilmu yang digunakan untuk menarik kesimpulan dari
fenomena tertentu secara acak dengan berdasarkan
sampel yang relatif terbatas4
d. Ilmu tentang cara mengumpulkan, menabulasi,
menggolong-golongkan, menganalisis, dan mencari
keterangan yang berarti dari data yang berupa angka
(KKBI)
e. Ilmu pengetahuan yang berhubungan dengan cara-
cara pengumpulan, pengolahan, penyajian, analisis
data, penarikan kesimpulan2
Definisi terakhir lebih menunjukkan ruang lingkup

statistik mulai dari pengumpulan data terkait dengan
sumber data dan skala data, sedangkan pengolahan data
terkait mulai entry data, koding berupa angka dari data non
8
numerik, tabulating sampai pada pilihan berupa

komputerise atau manual, penyajian data berupa tabel,
grafik, gambar atau angka-angka; analisis data bisa berupa
deskriptif berupa tendency central dan dispersinya ataupun
berupa kecenderungan grafik. ataupun inferensial sebagai
verifikasi hipotesis.
Beberapa definisi yang dikemukakan menunjukkan
sebagai suatu cabang ilmu dari matematika dengan
demikian pendekatan statistika lebih berorientasi pada
prinsip-prinsip dasar matematika yang sudah diturunkan
oleh para ahli matematika yang meliputi dalil-dalil, rumus-
rumus dan model matematika.
Sebagai contoh, kenapa rumus varian (σ 2 ¿
2
n
2 (∑
Xi)
∑ Xi − n
σ 2 = i =1
n n
Rumus tersebut diturunkan dari nilai deviasi yang
dikuadratkan, kenapa harus dikuadratkan? (dibahas
tersendiri pada bab dispersi)
2. Statistik
a. Hasil observasi yang disajikan dalam bentuk penyajian
data-data baik berupa angka, grafik atau hasil analisis
data yang diperoleh dari sampel.
b. Nilai tertentu yang diperoleh dari sampel yang
digunakan untuk membuat estimasi nilai parameter
yang ada pada populasi5
Narasi lebih lengkap dikemukakan oleh Bernard

Rosner 2011 yang membagi statistik dalam dua dimensi
yaitu matematika statistik dan statistik terapan. Matematika
statistik lebih memperhatikan pada pengembangan metode
baru kesimpulan statistik dan membutuhkan pengetahuan
rinci mathematika abstrak dan implementasinya. Sedangkan
statistik terapan adalah terapan metode matematika dalam
bidang ilmu tertentu misal ekonomi, psychologi, kesehatan
masyarakat. Biostatistik merupakan cabang statistik terapan
9
untuk medis dan masalah biologi4. Dengan demikian

statistik lebih bersifat aplikasi dari statistika, sehingga
statistik yang lebih menarik dan berfungsi dalam berbagai
bidang kehidupan seperti statistik pertandingan bidang olah
raga, pertambahan jumlah penduduk bidang demografi,
angka kematian dan kesakitan dll.
Catatan penting lainnya statistik merupakan indikator
nilai sampel yaitu mean (x́), sedangkan untuk ukuran
populasi disebut parameter (µ), hal ini juga mengisyaratkan
bahwa kesimpulan dari sampel hakekatnya merupakan
kesimpulan pada populasi. Konsekuensi cara inferensi
berbasis sampel adalah bias. Dengan kata lain, penelitian
berbasis sampel mempunyai konsekuensi bias, yang mana
besaran bias dapat dikendalikan secara statistik sebagai
batas galat kesimpulan (bound on the error).
3. Data
a. Fakta atau informasi yang digunakan untuk menghitung,
menganalisis atau merencanakan sesuatu.3
b. Fakta berupa angka 2
Data di dalam statistik harus berupa angka, bukan
berupa naratif, hal ini dikaitkan dengan metode analisis
kuantitatif dengan menggunakan uji-uji statistik yang ada.
Mungkin ada yang bertanya, kesimpulan kan tidak
selalu harus menggunakan data yang berupa angka, dengan
menggunakan feeling, wangsit atau apapun namanya itu
juga bisa tapi itu diluar bidang statistik, memang
berdasarkan fakta, kadangkala kesimpulan berdasarkan
feeling toh juga mendapatkan hasil yang lebih baik, boleh
jadi pernyataan ini benar.
Problematika yang kemudian muncul adalah bagaimana
kaidah ilmunya, sehingga kesimpulan itu bisa
dikomunikasikan dengan cara yang runtut, difahami oleh
semua orang, logis dan obyektif. Kesimpulan berdasarkan
feeling merupakan kesimpulan individu yang sangat
10
subyektif, sementara subyektifitas individual hanya dapat

dirasakan yang bersangkutan.
4. Skala data
Data yang diperoleh bisa dari dua sumber yaitu hasil
pengukuran dan perhitungan. Hasil pengukuran berupa data
kontinyu sedangkan hasil perhitungan berupa data diskrit.
Data hasil pengukuran diperoleh dari alat ukur yang
disepakati oleh kolektif pengguna seperti mengukur berat
badan digunakan timbang badan. Hasil ukurnya cenderung
tidak bulat seperti 55,3 Kg; inilah yang disebut data
kontinyu.
Data yang diperoleh dari hasil perhitungan cenderung bulat,

seperti jumlah penderita malaria di Puskesmas “X”, maka
tidak mungkin dikatakan 20,5, hal ini disebabkan tidak ada
individu yang setengah.
Berdasarkan sumber data tersebut, pengkategorian data
dibagi menjadi empat yang dikenal dengan singkatan
(NOIR), yaitu
a. Nominal
Ciri utamanya adalah ekivalen/sederajat; sesuatu
dikatakan sederajat pasti tidak ada yang lebih tinggi
atau lebih rendah; ciri lain yang biasanya menyertai
adalah dikotomi.
Contoh:
Jenis kelamin dibedakan menjadi dua yaitu laki-laki
dan perempuan; laki-laki tidak lebih tinggi
dibandingkan perempuan demikian sebaliknya
Contoh lain yang mempunyai ciri yang sama yaitu
dikotomi seperti kadar Hb, dibuat dua kategori yaitu:
Anemia dan normal
Kategori kadar Hb tersebut tidak bisa dikatakan
nominal, meskipun dikotomi, hal ini disebabkan
anemia mempunyai konteks kadar Hb kurang dari
standard, sedangkan normal berarti sama dengan atau
lebih dari standard, sehingga tidak ekivalen.
Contoh lain jenis pekerjaan:
11
Jenis pekerjaan bisa dibuat lebih dari dua kategori

misal: PNS, petani, Swasta dll.
Jenis pekerjaan sederajat, meskipun tidak dikotomi,
sehingga bisa dikategorikan skala nominal.
Kesimpulan:
Semua yang sederajat (ekivalen) nominal meskipun
tidak dikotomi, sedangkan semua yang dikotomi
bukan nominal kecuali yang sederajat.
b. Ordinal
Merupakan skala hasil pengukuran yang bisa
digunakan untuk membedakan antara hasil ukur yang
satu ke hasil ukur lainnya.
Hasil pengukuran ini bisa bersifat subyektifitas
maupun obyektifitas. Subyektifitas yang dimaksud
adalah tidak adanya batasan secara jelas antara
peringkat yang satu ke peringkat lainnya; misal
derajat persetujuan bisa dibedakan sangat setuju,
setuju, kurang setuju dan sangat tidak setuju;
batasannya dimana…tidak ada, karena didasarkan
pada kondisi psychologis subyek yang diteliti; pada
kondisi yang sama jika diukur oleh orang lai, jika
diajukan pertanyaan sikap yang sama boleh jadi
berubah derajat persetujuannya.
Obyektifitas bisa juga diperoleh dengan hasil
pengukuran kuantitatif, misal derajad hipertensi yang
dikategorikan dalam:
Kategori ini dibuat berdasarkan hasil pengukuran

terhadap tekanan darah subyek yang diteliti. Fungsi
kategori ini sebenarnya untuk kepentingan
12
komunikasi dan pemaknaan yang lebih mudah

terhadap hasil pengukuran.
Skala ordinal juga bisa untuk skala hasil
pengukuran dengan menggunakan hasil pengukuran
berupa score. Score ini diperoleh dari hasil
pengukuran kondisi subyektif tertentu, misal score
nilai soal essay pada ujian mahasiswa, maka nilainya
adalah nilai obyektif berdasarkan subyektifitas
penilai. Dengan demikian skala ordinal bisa
dibedakan menjadi dua yaitu yang kategorial dan non
kategorial.
Ciri utama skala data ini adalah adanya tingkatan
nilai, meskipun tingkatan tersebut mempunyai range
yang berbeda.
c. Interval
Ciri utama skala ini adalah tidak punya nilai nol
mutlak, sementara ciri lainnya sama dengan skala
ordinal yaitu bisa membedakan, karena tidak punya
nilai nol mutlak maka hasil pengukurannya tidak bisa
dibandingkan; misal Desa A suhu udara 10oC, Desa B
20oC, maka tidak bisa disimpulkan Desa B dua kali
lebih panas dibandingkan desa A.
Arti kata tidak mempunyai nol mutlak dapat
diilustrasikan sebagai berikut, seorang mahasiswa
dapat nilai statistik nol, bukan berarti mahasiswa
tersebut tidak tahu sama sekali tentang statistik.
Contoh lain, suhu air diukur 0oC, bukan berarti tidak
ada panas pada air tersebut, buktinya ketika diukur
dengan 0o F, suhunya 32o F.
d. Ratio
Ciri skala data ini antara lain :
1) Mempunyai nilai nol mutlak.
Pengertian nilai nol mutlak adalah jika alat ukur
yang digunakan untuk mengukur subyek yang
akan diukur, menunjukkan angka nol, maka
memang tidak ada sesuatu yang diukur.
13
Misal : kita membeli bensin, pada alat ukurnya

menunjukkan angka Nol, berarti memang tidak
ada bensin yang keluar.
b). Jarak antar skala ukur sama.

Alat ukur yang digunakan, menunjukkan skala
yang sama antar skala yang satu dengan
lainnya.
Misal :
Meteran tinggi badan, kalau satuannya cm
(centimeter), maka skala ukurnya 1 cm, 2cm dst
sampai panjangnya meteran tersebut.
Skala data ini bisa dibandingkan, karena

memiliki nilai nol mutlak; misal si A punya
tanah 100 m2, si B punya tanah seluas 200m2,
maka bisa disimpulkan luas tanah si B 2 kali
lebih luas tanah si A.
Skala data apakah ratio atau interval, pada prinsipnya tidak

mengubah jenis uji statistik yang dipilih, karena termasuk
statistik parametrik. Pada skala interval atau ratio, sangat kecil
kemungkinan subyektifitas individu, hal ini disebabkan karena
alat ukur yang dipakai oleh siapapun sepanjang alat tersebut
sudah di validasi (ditera) keterandalannya, maka siapapun yang
menggunakan akan menghasilkan hasil pengukuran yang sama.
Pemilihan jenis uji statistik sangat tergantung pada skala data,
sebagai ilustrasi bisa diperlihatkan data nilai mahasiswa sebagai
berikut:
Nilai 90 80 100 30 40 70 75 60 65
Initial A B C D E F G H I
Coba diperhatikan mahasiswa dengan initial A dan B, kalau

dihitung selisih nilainya 10 (90-80); B dengan C selisih nilainya
20, hal ini menunjukkan kemampuan akademisnya berbeda;
14
demikian juga yang lain ada selisihnya. Tetapi jika dibuat

kategori dalam nilai mutu sebagai berikut:
Nilai A A A E E B B C C
Mutu
Sekarang kita perhatikan antara mahasiswa, dengan mencari

selisih nilai mutu. Antara mahasiswa dengan initial A, B dan C
tidak ada bedanya, demikian juga lainnya. Sekarang kita buat
kategori lebih rendah dengan dua kategori yaitu Lulus (L) nilai
>55 dan nilai ≤ 55 tidak lulus (TL), maka kategorinya menjadi:
Nilai L L L TL TL L L L L
Mutu
Nilai tidak lulus (TL) yang ada nilai 40, sedangkan lainnya
nilai lebih dari 55 maka masuk kategori lulus, perhatikan
selisihnya menjadi 100-40= 60, semakin jauh.
Ilustrasi di atas dapat disimpulkan semakin sedikit
kategori yang digunakan untuk data kontinyu, semakin
tidak peka membedakan sesuatu yang berbeda, dengan
demikian hasil analisis statistik yang digunakan juga relatif
kurang baik. Dengan demikian pemahaman skala data ini
penting, jika punya skala data yang lebih tinggi jangan
buru-buru diturunkan skala datanya, upayakan tetap
menggunakan skala data yang tinggi, karena ada sangkut
pautnya dengan pemilihan jenis uji statistik yang
digunakan. Jika skala data interval atau ratio tidak
mengubah jenis uji statistik, tetapi jika ordinal yang
kategorial dan non kategorial dapat mengubah jenis uji
statistik.
5. Populasi dan sampel
15
Penjelasan sebelumnya menunjukkan bahwa inferensi suatu

penelitian diberlakukan di populasi, sedangkan subyek yang
di ukur di sampel, maka pemahaman tentang populasi dan
sampel menjadi kata kunci untuk memahami statistik,
sebagai ilustrasi untuk memahaminya sebagai berikut:
Ibu-ibu rumah tangga pada dasarnya suka memasak,
katakanlah masak Soup daging. Pertanyaannya untuk
membuat kesimpulan apakah masakan soup tersebut enak
apa tidak, maka upaya yang lazim dilakukan adalah dengan
cara mencicipi soup tersebut, maka ibu tersebut akan
menggunakan sendok atau irus (alat masak untuk
mengaduk kuah), kemudian mengambil sebagian kecil dari
soup untuk ditaruh di tangan, kemudian dicicipi.
Seandainya rasa soup tersebut kurang asin, maka soup
dalam panci akan ditambahkan garam untuk mengatasi
problem bahwa soup tersebut kurang asin.
Ilustrasi di atas ada beberapa hal yang dapat diambil

sebagai kata kunci populasi dan sampel yaitu :
a. Ketika ibu mengambil bagian kecil dari
soup di panci, hakekatnya ibu tersebut tengah
melakukan tehnis sampling yaitu mengambil sampel
dari populasi yang besar.
b. Ketika ibu tersebut mengatakan bahwa soup kurang
asin, hakekatnya ibu sudah melakukan pengukuran
pada sampel, dengan hasil kurang asin.
c. Hakekatnya pula kesimpulan kurang asin tersebut,
merupakan kesimpulan rasa soup dalam panci, artinya
kesimpulan yang diambil dari cara mengukur sampel
(soup dalam sendok) merupakan kesimpulan dari
populasi (soup dalam panci) ini yang disebut
generalisasi yaitu menyimpulkan dari data kecil yaitu
sampel untuk menggambarkan sesuatu yang besar
yaitu populasi.
d. Ketika ibu memberikan tambahan garam, sebagai
akibat kesimpulan kurang asin soup yang ada pada
sendok, hakekatnya ibu sedang mengambil kebijakan
16
dari hasil penelitian untuk diberlakukan secara umum

yaitu populasi pada umumnya, demikianlah
hakekatnya yang akan menjadi sasaran kebijakan
penelitian adalah populasi.
e. Kesimpulan pada sampel akan sama dengan yang ada
pada populasi
Dengan demikian dapat disimpulkan bahwa

” kalau kita bisa menarik kesimpulan dari data yang kecil
(sampel) hasilnya sama dengan data yang besar (populasi),
kenapa harus melakukan penelitian data yang besar
(populasi) kalau kesimpulannya sama dengan data yang
kecil, inilah filosofi sampel”. Dan statistik berperan di
dalamnya2.
Ilustrasi di atas dapat didefinisikan masing-masing

terminologinya sebagai berikut:
a. Populasi
Beberapa definisi yang dapat dikemukakan tentang
populasi antara lain:
1) Kumpulan semua elemen atau individu dan
padanya peneliti ingin membuat suatu inferensi
atau generalisasi 5
2) Keseluruhan elemen atau individu yang
mempunyai karakteristik umum yang
ditentukan teknik samplingnya oleh peneliti6
3) Keseluruhan subyek dimana generalisasi atau
kesimpulan diberlakukan2
Ada beberapa kata kunci untuk populasi yaitu
keseluruhan subyek dimana sampel diambil, tetapi
ketika hasil penelitian diambil kesimpulan,
hakekatnya yang disimpulkan bukan sampel tetapi
populasi.
b. Sampel
Sampel menjadi bagian terpenting dari suatu
penelitian, karena di sampel itulah dilakukan
17
pengukuran dan penarikan kesimpulan, adapun

definisinya sebagai berikut:
1) Elemen atau individu yang dipilih untuk
berpartisipasi dalam suatu penelitian6
2) Bagian dari populasi untuk dipelajari
karakteristik suatu populasi5
3) Sekelompok subyek tertentu yang mempunyai
ciri-ciri sama dengan populasi dimana
pengukuran dan penarikan kesimpulan
dilakukan2
Kata kunci sampel adalah bagian dari populasi dimana
pengukuran dilakukan sebagai basis analisis data dan
penarikan kesimpulan.
18
BAB. II
PENGUMPULAN DATA
Pendahuluan
Data merupakan kata kunci analisis menjadi benar, jika data
diperoleh dengan kaidah yang benar, dalam analisis statistik data
harus berupa numerik/angka, karena hanya dengan angka data
dapat dianalisis. Pendekatan lain dengan menggunakan data
narasi (penelitian kualitatif) tidak bisa di lakukan analisis
statistik. Dengan demikian narasi harus di ubah dulu menjadi
angka sebagai suatu simbul abstraksi tertentu, supaya bisa
dianalisis. (lihat skala data pada bab I)
Problem utama mendapatkan data yang valid adalah cara
pengumpulan data dan instrumen yang digunakan untuk
mendapatkan data. Upaya menghindari bias pengukuran selalu
diupayakan oleh peneliti, hal ini dimaksudkan supaya sesuatu
yang diukur tersebut, memang menggambarkan subyek yang
diukur. Problem kedua adalah apakah subyek yang diukur dengan
alat yang sama akan menghasilkan hasil ukur yang sama.
Disinilah muncul konsep validitas dan reliabilitas.
Validitas berkaitan dengan keterandalan alat ukur untuk
mengukur subyek sesuai dengan alat ukurnya atau tidak; seperti
Berat Badan diukur dengan timbangan, maka dikatakan valid;
sedangkan reliabilitas berkaitan dengan alat ukur yang digunakan
secara berulang untuk mengukur subyek yang sama
menghasilkan hasil yang sama, maka alat tersebut disebut
reliable.
Konsep ini memunculkan berbagai metode dan instrumen
alat ukur yang dikembangkan oleh para ahli, hal ini dimaksudkan
untuk membuat kuantifikasi dari fenomena yang diteliti. Awalnya
pengukuran dilakukan pada sesuatu yang dimensional, tetapi
perkembangan kebutuhan riset membutuhkan pengukuran non
dimensional, seperti pengukuran pengetahuan, sikap, perilaku,
psychologis.
Kuantifikasi non dimensional inilah, menyebabkan peneliti
mengembangkan beberapa alat ukur seperti sosiometrik,
psychometrik, ekonometrik, yang pada akhirnya mengupayakan
fenomena abstrak untuk bisa dikuantifikasikan8,9,10. Hal ini
19
dimaksudkan untuk mendimensionalkan konsep abstrak subyek

yang akan diukur, justru darisinilah munculnya banyaknya alat
ukur untuk mengukur konsep abstrak dengan berbagai instrument
yang kemudian dikembangkan dengan berbagai skala. Hal ini
disebabkan karena keterbatasan para ahli untuk membuat alat
yang bisa mengukur secara langsung terhadap fenomena sosial
dan psikologis secara langsung, belum ditemukan, sebagaimana
dalam ilmu alam.
Pengertian-pengertian
Pembatasan terminologi diperlukan untuk menentukan
kesepakatan terhadap istilah yang didiskusikan termasuk di
dalamnya ruang lingkup. Adapun beberapa pengertian
pengumpulan data sebagai berikut:
1. Teknik atau cara-cara yang dapat digunakan oleh peneliti

untuk mendapatkan suatu data11
2. Upaya-upaya untuk memperoleh informasi yang dibutuhkan
dalam rangka mencapai tujuan penelitian12
3. Upaya pengumpulan dan pengukuran variabel, dengan cara
sistematis yang memungkinkan seseorang menjawab
pertanyaan penelitian yang ada, menguji hipotesis dan
mengevaluasi hasil.13
4. Aktivitas pengumpulan informasi yang dapat digunakan
untuk mencari tahu tentang subjek tertentu.14
5. Proses pengumpulan informasi dari semua sumber yang
relevan untuk menemukan jawaban atas masalah penelitian,
menguji hipotesis dan mengevaluasi hasilnya.15
Hasil penelusuran definisi pengumpulan data (dalam

konteks statistik) dapat dirumuskan menjadi “upaya peneliti
untuk mengukur variabel yang ada secara kuantitatif untuk
menjawab tujuan penelitian, menguji hipotesis dan mengevaluasi
hasil kegiatan yang sudah dilaksanakan”.
Data merupakan konsekuensi dari variabel yang ditetapkan
terlebih dahulu oleh peneliti berdasarkan tujuan dan kerangka
konsep yang sudah dibuat; kedua data tersebut berupa
20
kuantifikasi hasil pengukuran dengan instrumen yang sudah

disepakati secara umum; seperti pengukuran BB dengan timbang
badan; apabila ada variabel baru yang belum ada instrumen
bakunya, maka harus dilakukan terlebih dahulu uji validitas dan
reliabilitas instrumen.
Sumber data
Cara memperoleh data dapat dilakukan dengan
mendapatkan dari berbagai sumber, adapun sumber data dapat
dibuat dalam berbagai kategori yaitu:
1. Data primer
Yaitu data yang diperoleh sendiri oleh peneliti baik melalui
pengukuran maupun memilah-milah data mentah yang sudah
ada pada suatu institusi9,10.
Contoh :
Data yang diukur sendiri oleh peneliti misal BB, TB, Kadar
Hb atau hasil laboratorium dll yang diukur secara langsung
oleh peneliti terhadap subyek yang diteliti.
Pengukuran secara langsung dimaksudkan peneliti dibantu
oleh tenaga teknis sesuai dengan kompetensi untuk mengukur
parameter yang dimaksud oleh peneliti, semisal tenaga
laboratorium.
Beberapa cara yang dilakukan untuk mendapatkan data
primer antara lain wawancara dengan instrumen kuesioner,
observasi dengan lembar check list, pengukuran fisik,
laboratorium dll9.
Data yang diperoleh dari data mentah pada suatu institusi

semisal Puskesmas, Rumah Sakit dan lain-lain; biasanya data
pasien sudah tersedia pada catatan medis unit pelayanan
kesehatan. Peneliti tinggal memilih variabel yang diteliti
berdasarkan rekaman medis yang sudah ada. Disini peneliti
tidak melakukan sendiri pengukuran parameter yang
dimaksud; tetapi peneliti dibantu dengan tenaga ahli yang
kompeten di bidangnya.
21
Contoh:
“Penelitian dengan judul hubungan antara usia dengan
tekanan darah”; maka peneliti mengambil catatan medis pasien
yang ada di unit pelayanan kesehatan. Dilihat pada catatan
medis pasien, kemudian dianalisis menggunakan uji statistik
dan diperoleh hubungan kausalitas tersebut.
2. Data sekunder
Yaitu data yang diperoleh oleh peneliti dari pihak lain dalam
bentuk data sudah jadi baik berupa grafik, profil, sehingga
peneliti hanya mengutip berdasarkan penyajian data yang
sudah ada.9
Misal:
a. Data dari profil institusi tertentu (rumah sakit, Puskesmas,
BPS dll)
b. Data laporan penyakit instusi kesehatan atau laporan suatu
institusi non kesehatan.
c. Data hasil investigasi kejadian penyakit baik berupa
Penyelidikan Epidemiologi atau Kejadian Luar Biasa.
d. Data kependudukan yang dikeluarkan oleh institusi paling
rendah yaitu Desa, Kecamatan, Kabupaten sampai tingkat
Nasional.
e. Data hasil penelitian orang lain.
f. Dan lain-lain.
Metode dan instrumen pengumpulan data

Data diperoleh oleh peneliti atau pengambil kebijakan
sangat tergantung pada aspek yaitu metode dan instrumen yang
digunakan (asumsi cateris paribus/ yang lain dianggap sama),
adapun penjelasannya sebagai berikut:
Metode
Lebih menitik beratkan pada aspek cara atau teknik
mendapatkan data yang digunakan oleh peneliti. Beberapa
metode yang digunakan untuk mendapatkan data antara lain:
22
1. Observasi/pengamatan
Adalah suatu upaya pengumpulan data yang
diarahkan ke suatu tujuan riset yang sudah ditetapkan
secara sistematis dengan menggunakan indrawi. Secara
statistik hasil pengamatan ini harus dapat di konversi
menjadi suatu bilangan baik kontinyu maupun diskrit8,9.
Pengamatan yang didasarkan pada indrawi ini sangat
tergantung pada kemampuan indra yang digunakan, tetapi
dengan berkembangnya ilmu pengetahuan, hal itu bisa
diatasi dengan sistem digital yang meminimalkan peran
indrawi tersebut. Sistem digital sudah harus melalui proses
uji tera dengan gold standard yang ada.
Beberapa alat yang bisa digunakan sebagai observasi
antara lain anecdotal records, catatan berkala, check list,
rating scale, mechanical devices.
2. Wawancara
Merupakan metode pengumpulan data dengan cara
tanya jawab secara langsung antara interviewer
(pewawancara) dan responden. Tanya jawab ini bisa
berhadapan langsung, via telpon, Watch Up (WA),
teleconference dll.
Tanya jawab secara langsung merupakan cara terbaik
untuk mengetahui gestur (bahasa tubuh) responden apakah
baik dalam penerimaan saat proses wawancara atau
cenderung menolak, perubahan gestur (gerak tubuh
seseorang merupakan bahasa alami seseorang sebagai
respon terhadap situasi disekitarnya) sehingga teknik ini
juga digabung dengan observasi.
Metode wawancara bisa sebagai metode primer jika
memang hanya metode itu untuk mendapatkan data, tetapi
bisa juga sebagai metode sekunder pelengkap metode yang
lain. Seperti hasil laboratorium menunjukkan kadar
cholesterol tinggi, maka peneliti menanyakan beberapa
aspek menyangkut pola makan, olah raga, gejala yang
dirasakan oleh subyek yang bersangkutan dll.
Metode ini baik untuk mengeksplorasi pendapat dan
sikap seseorang, tetapi kurang begitu baik untuk merecall
23
kejadian-kejadian yang sudah berlangsung lama. Jika

peristiwa tersebut sudah menjadi kebiasaan maka efektif
seperti kebiasaan merokok, kebiasaan makan, tetapi untuk
mengukur peristiwa yang tidak rutin sulit diandalkan untuk
digunakan sebagai data penelitian.
3. Pengukuran
Pengukuran merupakan upaya peneliti untuk menegaskan
dimensi variabel yang telah ditetapkan, ada beberapa
definisi pengukuran, antara lain:
a. Suatu kegiatan yang ditujukan untuk mengidentifikasi
besar kecilnya obyek atau gejala.16
b. Angka yang menunjukkan ukuran atau jumlah sesuatu.
Biasanya angkanya mengacu pada beberapa pengukuran
standar, seperti satu meter atau kilogram.17
c. Upaya yang dilakukan untuk mengkuantifikasi variabel
tertentu dengan menggunakan instrumen yang
terstandarisasi atau instrumen lain yang dapat
menggambarkan suatu nilai dari variabel tersebut2
Pengukuran pada dasarnya upaya peneliti/seseorang untuk

memberi nilai barupa angka tertentu yang ditunjukkan oleh
instrumen yang digunakan. Jika pengukuran menggunakan
alat yang sudah terstandarisasi maka hasil ukurnya valid,
tetapi jika instrumen yang digunakan bukan instrumen
standar, maka perlu dilakukan upaya uji coba instrumen.
Instrumen yang dimensional ada ruang, maka alat ukurnya
sudah terstandarisasi, seperti berat badan diukur degan
timbangan, tinggi diukur dengan meteran, tetapi ada yang
non dimensional, maka cara mengukurnya adalah dari
gejala-gejala ataupun panduan teoritis yang ada. Misal
skala nyeri diukur dengan ekspresi seseorang ketika sakit;
skala kecemasan juga didasarkan dari gejala-gejala
kecemasan yang bisa ditangkap secara indrawi. Namun ada
banyak gejala yang masih belum bisa diukur secara baik
semisal cantik, indah.
24
Pengukuran gejala dimensional akan jelas disepakati orang

secara umum, tetapi ada juga yang perlu dipertanyakan alat-
alat baru yang digunakan, maka perlu dilakukan komparasi
dengan standar baku yang sudah ada; seperti alat ukur
tekanan darah baru yang digital, maka standar bakunya
adalah tekanan darah air raksa, setelah dilakukan
pengukuran secara berulang maka dicarilah selisih rata-
ratanya itulah yang menjadi faktor koreksi.
Contoh lain pemeriksaan Plasmodium pada penderita
malaria yang semula menggunakan mikroskopis di
laboratorium; kemudian muncul alat baru yang bernama
Rapid Diagnostic Test (RDT); maka seberapa akurasi alat
tersebut perlu dibandingkan dengan pemeriksaan
mikroskopis.
Pengukuran dimensional saja masih perlu dipertanyakan

akurasi (ketepatan) hasil pengukuran untuk mengukur
variabel yang dimaksud, apalagi variabel yang non
dimensional akan banyak sekali pertanyaan tentang
keabsahan alat ukur tersebut untuk mengukur variabel yang
diinginkan. Apakah ini bukan berarti tidak bisa diukur
variabel yang non dimensional tersebut. Tetap bisa diukur
dengan dua cara, jika alat tersebut sudah beberapa kali
dipakai dan menunjukkan reliabilitas yang sama, maka alat
tersebut bisa dipakai peneliti untuk variabel yang sama
dengan subyek yang berbeda; tetapi jika pengukuran
dilakukan tanpa ada instrumen yang standar tersebut, maka
peneliti melakukan lebih dulu uji coba instrumen, sehingga
bisa diketahui validitas dan reliabilitas instrumen tersebut
(hal ini bisa menjadi satu penelitian tersendiri)
4. Instrumen
Alat yang digunakan untuk mengukur variabel, baik yang
dimensional maupun non dimensional.
Instrumen sangat menentukan kepekaan suatu penelitian
sesuai dengan variabel yang diukur, akurasi penelitian dan
hasil statistik yang kredible ditentukan oleh alat ukur yang
kredible juga.
25
Beberapa alat ukur yang lazim digunakan pada suatu

penelitian antara lain:
a. Kuesioner
Instrumen ini seringkali digunakan untuk
mengukur pendapat seseorang tentang “sesuatu”;
sesuatu itu bisa pengetahuan, sikap dan perilaku
seseorang tentang fenomena yang ada di sekitarnya.
Instrumen ini berupa daftar pertanyaan yang disusun
secara sistematis yang bisanya memuat komponen
yang kompleks mewakili masing-masing sub
komponen yang dinilai. Namun secara umum terdiri
dari:
1) Karakteristik responden; meliputi nama,
pekerjaan, umur, pendidikan dll
2) Data khusus tentang variabel yang akan dinilai;
hal ini sangat tergantung pada variabel yang
diukur.
b. Check list
Instrumen ini berisi tentang item-item yang akan
dinilai secara rinci. Peneliti tinggal memberi tanda
tertentu pada instrumen yang sudah disediakan.
Check list ini bisa ya/tidak atau skore tertentu berupa
angka-angka yang menunjukkan tingkatan tertentu
c. Pengukuran dimensional
Pengukuran ini dilakukan pada subyek yang
mempunyai dimensi tertentu, sehingga subyek
tersebut mempunyai massa tertentu untuk diberi
penilaian besaran massa tersebut. Seperti berat, luas,
panjang, spektrum dll.
Hal yang paling penting sebelum menggunakan alat
ukur ini, alat ini harus dikalibrasi dengan alat ukur
lainnya yang dianggap standar. Institusi resmi untuk
melakukan kalibrasi adalah badan metrologi.
5. Validitas dan reliabilitas

a. Validitas
26
Diartikan sebagai kesesuaian antara sesuatu yang

diukur dengan alat ukurnya
b. Reliabilitas
Diartikan sebagai keajekan alat yang digunakan untuk
mengukur suatu subyek yang sama menghasilkan
nilai yang sama dengan hasil pengukuran
sebelumnya.
Keduanya akan dilakukan pembahasan dengan

perhitungan pada bab tersendiri, karena pertimbangan
teknis pemahaman statistik secara bertahap, yatu bab
sesudah uji korelasi.
6. Skala pengukuran
Pengukuran non dimensional membutuhkan alat ukur
tersendiri, berbeda dengan dimensional yang alat ukurnya
sudah terstandarisasi secara rinci, tetapi untuk mengukur
pengetahuan, sikap dan tanggapan seseorang terhadap
fenomena tertentu dibutuhkan alat ukur untuk mengukur
variabel tersebut. Penskalaan yang digunakan untuk
mengukur variabel non dimensional, merupakan upaya
untuk meningkatkan skala data dari ordinal ke tingkat
interval. Beberapa alat ukur yang digunakan antara lain:
a. Skala likert
Skala ini disampaikan pertama kali oleh Rensis
Likert, sehingga skala ini dinisbahkan pada
penggagas pertama kalinya. Skala ini digunakan
untuk mengukur persepsi atau sikap seseorang atau
kelompok terhadap suatu peristiwa atau fenomena
tertentu yang ada di masyarakat atau lingkungan
sekitarnya, sehingga skala ini banyak digunakan di
ilmu sosial, psychometric bahkan di dunia
pendidikan.18,19,20
Data hasil pengukuran pada variabel non
dimensional banyak menggunakan skala ini.
Penggunaan skala ini ada dua model, model pertama
yang positif artinya semakin baik persepsi seseorang
27
terhadap fenomena yang dipersepsikannya nilainya

semakin tinggi; sedangkan model negatif sebaliknya.
Skala ini dikembangkan untuk mengkuantifikasikan
persepsi seseorang. Likert sendiri membuat penilaian
dengan lima skala yaitu 1, 2, 3, 4 dan 5 untuk
mewakili nilai tertentu, beberapa contoh kategorisasi
skore19:
Tabel 2.1. Beberapa Contoh Skala Likert
PERSETUJUAN KEPENTINGAN
1 sangat tidak setuju 1 sangat penting
2 tidak setuju 2 sedikit penting
3 ragu-ragu 3 cukup penting
4 setuju 4 penting
5 sangat setuju 5 sangat penting
FREKUENSI PELUANG BENAR

1 tidak pernah 1 tidak pernah benar
2 jarang 2 biasanya tidak benar
3 kadang-kadang 3 terkadang benar
4 sering 4 biasanya benar
5 sangat sering 5 selalu benar
Beberapa contoh yang disampaikan pada tabel 2.1,

ada lima skala untuk menentukan derajat sikap atau
persepsi seseorang, coba diperhatikan skala ke 3;
hampir bersikap netral dan inilah kecenderungan
sikap seseorang terhadap peristiwa tertentu. Dasar
inilah yang kemudian dibuat modifikasi skala likert
untuk menghilangkan pernyataan netral, sehingga
skalanya menjadi empat.
28
Hasil riset pada dua skala tersebut telah diuji

cobakan dan kemudian dibandingkan dengan
parameter yaitu riset dengan skala lebih besar. Pada
skala empat nilai lima nilai alpha cronbach 0,76
sampai 0,90 kalau diambil nilai tengahnya 0,83;
sedangkan skala lima nilainya 0,87 dan nilai
parameternya 0,88. Dengan demikian skala likert
dengan skala lima lebih baik reliabilitasnya.
Skala yang lebih netral (ditengah) terjadi, boleh jadi
seseorang tidak terlalu terikat dengan peristiwa atau
fenomena yang terjadi, sedangkan seseorang yang terlibat
cenderung memberikan sikap yang lebih jelas, dengan
demikian problemnya ada pada metodologi bukan statistik.
Langkah-langkah perhitungan skala likert sebagai
berikut:
1) Tentukan skala likert yang dipakai 5 atau 4 skala sebagai
skore maksimal (SM)
2) Berapa jumlah penilai untuk menilai sesuatu (JP)
3) Setiap penilai memberikan skore (S) terhadap items yang
dinilai
4) Jumlah skore (JS) untuk menilai setiap items dengan
rumus JS= JP x S yaitu banyaknya penilai yang menilai
skore yang sama
❑
5) Hitunglah Total skore (TS), dengan rumus TS=∑ JS i
❑
6) Interpretasikan hasil penilaian sikap tersebut, dengan dua
cara yaitu deskriptif untuk menilai secara cepat atau
dengan menggunakan indeks % (I) skala likert, dengan
TS
rumus: I = x 100 %
SM . JP
7) Kategorikan hasil interpretasi sebagai berikut:
a) 0-19,99% = sangat tidak setuju

b) 20-39,99% = tidak setuju
c) 40-59,99% = cukup/ragu-ragu/netral
d) 60-79,99% = setuju/baik/suka
e) 80-100% = sangat setuju
29
Cara penggunaan skala likert dapat dijelaskan

dengan contoh sebagai berikut:
Suatu percobaan menilai secara personal
terhadap metode baru pembelajaran mata kuliah
biostatistik di kelas yang dikembangkan oleh pendidik,
diambil sampel sebanyak 30 mahasiswa, skala likert
yang dikembangkan ada lima; metode ini ingin
menganalisis persetujuan mahasiswa untuk menerima
metode baru tersebut, hasil analisis, mahasiswa yang
menilai:
Sangat setuju dengan metode baru 8 orang

Setuju dengan metode baru 7 orang
Ragu-ragu dengan metode baru 5 orang
Tidak setuju dengan metode baru 7 orang
Sangat tidak setuju dengan metode baru 3 orang
Berdasarkan soal tersebut, dapat dihitung dengan urutan

sebagai berikut:
1) Skala likert yang digunakan 1-5, sehingga skore

maksimal (SM)=5
2) Jumlah penilai (JP) jumlah mahasiswa 30
3) Masing-masing mahasiswa sudah memberikan
penilaian
4) Jumlah skore (JS) dapat dihitung:
a) Sangat setuju : 8x5= 40
b) Setuju :7x4= 28
c) Ragu-ragu : 5x3 = 15
d) Tidak setuju: 7x2= 14
e) Sangat tidak setuju: 3x1= 3
❑
5) Total skore (TS)TS=∑ JS i= 40+28+15+14+3= 100
❑
6) Interpretasi
a) Deskriptif
30
Yang setuju dengan metode baru 50% (diambil

dari 7 mahasiswa yang setuju dan 8 mahasiswa
15
yang sangat setuju= x 100 %=50 % )
30
b) Indeks persentase (I)
TS 100 100
I= x 100 %= = x 100=66,67 %
SMxJP 5 x 30 150
Hasil interpretasi dengan kategori skala likert

termasuk kategori setuju, karena kriteria indeks 60-
79,99% termasuk setuju/baik/suka
Pada prakteknya skala likert merupakan satu set

pernyataan untuk diminta sikap terhadap pernyataan
tersebut, bagaimana cara menghitung indeks
persentasinya?
Pada prinsipnya sama, adapun langkah-langkahnya

sebagai berikut:
langkah ke satu sama, langkah kedua diganti jumlah
item (JI) pernyataan, kemudian hitunglah total skore
penilaian (TS); maka indeks persentasi digunakan
rumus:
TS
I= x 100 %
JI x SM
Sebagai contoh:
Ada 10 pernyataan dinilai dengan skala likert antara
1 sampai dengan 5; hasil penilaian total skore (TS)
40, berapa Indeks persentasenya
TS 40 40
I= x 100 %= x 100 %= x 100 %=80 %
JI x SM 10 x 5 50
Jika hasil penilaian pada 50 sampel, maka ada 50

indeks persentase, inilah yang dimasukkan ke dalam
entry data soft ware statistik untuk dianalisis lebih
lanjut.
b. Skala Thurstone29
31
Skala ini dikenalkan pertama kali oleh Louis Leon

Thurstone 1920, yang kemudian dikenal dengan bapak
skala sikap27, Thurstone sendiri mengenalkan tiga
metode pengukuran skala unidimensional yaitu metode
interval tampak sama (Method of equal appearing
intervals); metode interval suksesif (Methods of
Successive) dan metode perbandingan berpasangan25,27.
Pada buku ini hanya dijelaskan satu yaitu metode
interval tampak sama.
Skala ini dibutuhkan validitas conten ahli
(expert)111 dalam menentukan komponen pernyataan
yang sesuai dengan konstruk penelitian yang digunakan
dan skala ini upaya mengintervalkan kecenderungan
sikap seseorang terhadap fenomena yang ada.
Kelebihan skala ini dibandingkan dengan skala lainnya
mempunyai skore yang lebih lebar, sehingga mampu
memaksimalkan reliabilitas dan validitas.111
Metode yang dibahas dalam buku ini bagaimana
membuat operasional penskalaan sikap dapat
dikuantifikasi menjadi nilai tertentu. Adapun langkah-
langkahnya sebagai berikut:
1) Buat sejumlah pernyataan terhadap variabel yang
akan diukur, sesuai dengan konstruk teoritis yang
ada, katakanlah ada 50 items pernyataan.
2) 50 pernyataan tersebut dinilai oleh para ahli
katakanlah 30 orang untuk setiap item pernyataan.
3) Skala penilaian pernyataan mulai dari 1 sampai
dengan 11; skore 1 pernyataan yang paling tidak
disukai (unfavorable) dan 11 yang paling disukai
(most favorable)
4) Apabila seluruh items pernyataan sudah dilakukan
penilaian oleh 30 juri yang sudah ditunjuk; maka
analisislah setiap items pernyataan, semisal hasilnya
sebagai berikut25,27,28:
32
Tabel 2.2. Simulasi Penilaian
No Skore hasil penilaian 30 penilai

item 1 2 3 4 5 6 7 8 9 10 11
f 2 3 5 2 2 2 1 3 3 4 3
1 p 0,07 0,1 0,17 0,07 0,07 0,07 0,03 0,1 0,1 0,13 0,1
pk 0,07 0,17 0,34 0,41 0,48 0,55 0,58 0,68 0,78 0,91 1
Keterangan:
f : Frekuensi/banyaknya penilai dari skor yang ada
misal skor 1 ada 2 orang yang memilih
p : Proporsi/perbandingan f masing-masing
skor/jumlah penilai pada skor 1 nilai p=0,07
diperoleh dari f=2 dan jumlah penilai 30, sehingga
2
p= =0,066=0,07
30
pk : Proporsi kumulatif (penambahan proporsi skor

yang bersangkutan dengan proporsi skor
sebelumnya). Skor 2 nilai p=0,1; sedangkan skor
sebelumnya 1 p=0,07; sehingga pk=0,1+0,07=0,17;
demikian seterusnya; pada skor 3 nilai p skor ke tiga
ditambah dengan nilai p skor ke 1 dan ke 2
5) Perhitungan skala didasarkan pada nilai median

(Q=0,5) artinya banyaknya data dibagi 2 atau 0,5
dan simpangan Quartil (Q3-Q1) Q3=Q3 artinya ¾
atau 0,75; Q1=Q1 artinya ¼ atau 0,25. masing-
masing items pernyataan.
Item tersebut coba dihitung:
0,5−Pkb
a) Median (S) rumusnya: S=B bm+
Pm
.i
[ ]
Keterangan :
Bbm= Batas bawah skore median
Pkb= Proporsi Kumulatif sebelum skor median
Pm= Proporsi skor median
i= 1
33
Sebelum dihitung nilai mediannya, harus

diketahui skore mediannya terlebih dahulu.
Karena penilai ada 30, maka skore median
berada pada frekuensi ke 15; karena median (S)
banyaknya penilai (30)
¿ =15, maka frekuensi ke
2
15 ada pada skor ke 6, karena pada skor ke 5
frekuensinya baru 14, maka frekuensi ke 15 ada
pada skor ke 6.
Jika sudah diketahui skor mediannya, bisa
dihitung Bbm, dengan cara skor median – 0,5;
skor median=6-0,5=5,5; Pkb bisa dihitung Pkb
skor median=0,55, berarti sebelumnya 0,48;
sedangkan untuk Pm Proporsi skor median yaitu
skor ke 6=0,07; maka median (S) bisa dihitung
0,5−Pkb 0,5−0,48
S=B bm+
[ Pm ]
.1=5,5+ [ 0,07 ] .1=5,78
Nilai median ini digunakan untuk menentukan

apakah item pertanyaan tersebut mewakili
gejala yang ingin diukur, sehingga semakin
tinggi nilai median item pertanyaan tersebut
semakin tinggi relevansi item tersebut terhadap
nilai yang diukur sesuai konstruk variabel.
b) Q3 bisa dihitung dengan rumus:

0,75−P kb
Q 3=BbQ 3 +
[ PQ 3 ]
.i
Dengan cara yang sama sebagaimana

perhitungan median, maka skor Q3 berada pada
skor ke 9 (0,75x30=22,5); dengan demikian
0,75−P kb 0,75−0,68
Q 3=BbQ 3 +
[ PQ 3 ]
.i=8,5+ [ 0,1 ]
.1=9,2
c) Q1 bisa dihitung dengan rumus:

34
0,75−Pkb
Q 1=BbQ 1 +
[PQ1 ]
. i dengan menggunakan
logika yang sama ketika menghitung Q3, maka

Q1 berada pada skor ke 3 (frekuensi ke
0,25x30=7,5) bisa dihitung sebagai berikut:
0,25−0,17
Q 1=2,5+ [ 0,17 ]
.1=2,9
d) Rentang kuartil (Q)= Q3-Q1=9,2-2,9=6,3

Dengan nilai rentang kuartil menengah maka
ada kecenderungan lebih kearah setuju.
6) Pernyataan dipilih berdasarkan nilai selisih terkecil

Quartil atau semakin kecil rentang kuartil semakin
sepakat ahli tersebut terhadap item pernyataan
tersebut (artinya para ahli sepakat dengan
pernyataan tersebut) dan median masing-masing
items (upayakan secara proporsional untuk masing-
masing pernyataan)
7) Buatlah daftar pernyataan yang terpilih, kemudian
berilah dua pilihan yaitu “ya” dan “tidak”
8) Jawaban ya dipilih untuk pernyataan berikutnya dan
kembalikan nilai median untuk masing-masing
pernyataan dan hitung nilai rata-rata median yang
sudah dikembalikan
9) Konversi nilai rata-rata tersebut dalam rentang skore
1 sampai dengan 11; disitulah letak pernyataan
tersebut.
Jika skor cenderung mendekati 1 maka pernyataan
tersebut kurang disukai, sebaliknya mendekati 11
pernyataan tersebut disukai.
Skala Thurstone dalam metode penelitian digunakan untuk

menentukan dari satu set pertanyaan, mana pertanyaan yang
valid dan reliabel digunakan untuk menentukn konstruk
variabel yang sudah disusun atau dengan kata lain sebagai
35
screening untuk menentukan item-item indikator untuk

menilai konstruk variabel, sedangkan dalam konteks
statistik instrumen tersebut sudah jadi dan diaplikasikan
pada subyek penelitian yang diukur, pilihan skore antara 1
sampai 11 merupakan derajat penilaian subyek terhadap
variabel yang ingin diukur.
Hasil analisis antara skala Likert dan Thurstone nilai

reliabilitasnya lebih besar Thurstone26, hal ini berarti
keandalan skala ini dipakai secara berulang lebih baik.
Kelemahannya skala ini lebih kompleks perhitungannya,
namun dengan fasilitas soft ware statistik, kelemahan itu
bisa diatasi.
c. Skala Guttman30,31
Skala ini dikenalkan oleh Louis Guttman (1944-
1950) dan pertama kali dikenalkan pada tentara
Amerika30, disamping itu dikenal juga sebagai skala
kumulatif atau analisis skalogram. Skala ini lebih
sederhana dari skala sebelumnya, karena hanya ada dua
pilihan untuk menegaskan suatu sikap dari agregasi satu
set pernyataan, yang sudah disusun sesuai dengan
konstruk untuk menilai satu variabel. Semisal setuju
tidak setuju; menerima atau menolak, benar dan salah;
skore setuju, benar, menerima diberi nilai 1 sedangkan
sebaliknya 0.
Pengukuran skala ini ada dua model, instrumen
yang ada bisa digunakan langsung untuk mengetahui
seberapa besar persetujuan atau sikap membenarkan
terhadap subyek yang diukur dan hasil ukurnya bisa
digunakan sikap seseorang terhadap fenomena yang
harus disikapinya cut pointnya 0,5 x jumlah pernyataan;
untuk mengetahui kecenderungan responden dilihat dari
total skore jika sudah lebih 60% setuju maka itulah
sikap responden yang ada30; tetapi juga bisa digunakan
untuk menentukan validitas instrumen.
36
Cara yang digunakan untuk menentukan validitas

instrumennya dengan membentuk pernyataan secara
bertingkat artinya dari pernyataan pertama terkait
dengan pernyataan berikutnya, apabila pernyataan
pertama dijawab tidak, jika pernyataan kedua dijawab
ya, maka pernyataan tersebut salah; hal ini karena
pernyataan kedua terkait dengan jawaban ya pada
pernyataan pertama. Demikian juga, jika pernyataan
ketiga dijawab “ya”, maka pernyataan kedua harus
dijawab “ya” demikian seterusnya, sehingga jika ada
lima pernyataan maka denah ideal yang bisa
digambarkan sebagai berikut:
Seorang peneliti tentang peran edukasi pasien di
Puskesmas dibidang manfaat pengobatan dalam
kesembuhan penyakit, maka disusunlah 5 pernyataan:
1. Anda mendapatkan informasi tentang cara minum
obat..
a. Ya b. tidak
2. Anda tahu cara minum obat...
a. Ya b. tidak
3. Waktu minum obat sehari tiga kali yaitu pagi, siang
sore..
a. Ya b. tidak
4. Manfaat minum obat secara bertahap dalam satu
hari...
a. Ya b. tidak
5. Ada hubungan antara kesembuhan penyakit dengan
minum obat....
a. Ya b. tidak
Coba diperhatikan keterkaitan antara satu pernyataan

dengan pernyataan berikutnya, tidak mungkin seseorang
menjawab pernyataan ke dua, ketika pernyataan
pertama dijawab tidak. Maka berdasarkan keterkaitan
pernyataan, jika pernyataan pertama dijawab tidak,
maka pernyataan berikutnya sampai ke lima juga
dijawab tidak. Dengan demikian dapat dibuat tabel
ideal, sebagai berikut:
37
Tabel 2.3. Simulasi Model Ideal Skala Guttman
Responde Pertanyaan ke
n P1 P2 P3 P4 P5
1 0 0 0 0 0
2 1 0 0 0 0
3 1 1 0 0 0
4 1 1 1 0 0
5 1 1 1 1 1
Tabel 2.3. jika pernyataan sebelumnya angka 0 berarti

responden menjawab tidak, maka jika dibelakangnya
menjawab 1 (ya) berarti salah; gambarannya
disimulasikan sebagai berikut:
Tabel 2.4. Simulasi Identifikasi Kesalahan

Skala Guttman
Responde Pertanyaan ke
n P1 P2 P3 P4 P5
1 1 1 1 1 1
2 1 1 1 0 1
3 1 1 1 0 0
4 1 1 1 1 0
5 1 1 0 0 0
6 1 1 0 1 0
7 0 0 0 0 0
8 1 0 0 1 0
9 1 1 0 0 0
38
10 1 0 0 0 0
Tabel 2.4. yang diberi shadow menunjukkan

kesalahan pengisian. Hasil tabulasi tersebut dijadikan
dasar untuk menghitung koefisien reprodusibilitas (Kr)
dan koefisien skalabilitas (Ks); Kr dan Ks digunakan
untuk menentukan derajat ketepatan alat ukur
(validitas). Kr dengan rumus29:
e
K r =1−
n
Kr = koefisien reprodusibilitas
e = jumlah kesalahan pengisian seluruh responden
n = total jawaban responden yang benar (JI x JR),
dimana JI jumlah item pertanyaan/pernyataan dan JR
jumlah responden. Alat ukur dikatakan valid jika nilai
Kr > 0,9
Sedangkan Ks dengan rumus31:
e
K s =1−
p . (n− ji)
“p” peluang kesalahan yang diharapkan, karena
jawaban hanya dua yaitu ya dan tidak, maka peluang
salah adalah 0,5; “n” total jawaban responden; “ji”
jumlah item pertanyaan/pernyataan, instrumen
dikatakan baik jika Ks>0,6. Dengan menggunakan
rumus tersebut, rekapitulasi tabel 2.4 dapat dihitung
sebagai berikut:
e
K r =1−
n
Diketahui e=3 dan n= 5x10=50, sehingga
e 3
K r =1− =1− =99,94 ; dengan demikian instrumen
n 50
mempunyai validitas yang baik; sedangkan untuk
koefisien skalabilitas (Ks), dapat dihitung:
e
K s =1−
p . (n− ji)
Diketahui e=3; p=0,5; n= 50 (5x10); ji=5, sehingga
hasilnya sebagai berikut:
39
e 3
K s =1− =1− =0,87
p . ( n− ji ) 0,5. ( 50−5 )
Dengan demikian instrumen tersebut mempunyai
ketepatan yang baik untuk mengukur variabel yang
dimaksud.
39
BAB III.
PENGOLAHAN DAN PENYAJIAN DATA
Pendahuluan
Data yang sudah dikumpulkan secara kuantitatif,
dilanjutkan ke proses pengolahan data, sehingga menjadi
informasi sesuai yang diinginkan. Kuantifikasi ini merupakan
konsekuensi jika data diolah secara statistik. Konsekuensi inilah
yang membuat data non dimensional (subyektif) diukur dengan
cara penskalaan, meskipun batas antara satu skore dengan skore
lainnya secara pasti sulit untuk dibuat batasan secara tepat,
kelemahan lainnya apakah hasil pengukuran secara berulang
hasilnya sama (reliability) tidak ada jaminan. Dengan demikian
rumus penskalaan (penilaian) adalah subyektifitas seseorang
diantara obyektifitas penilaian.
Pengolahan data
Pengertian pengolahan data cukup beragam, tetapi bisa
dirumuskan sebagai upaya mengelola fakta-fakta kuantitatif
menjadi informasi yang dibutuhkan oleh analisator dan pengguna
data tersebut.32,33
Adapun tahap pengolahan data, secara statistik dapat
dibedakan menjadi:
Editing
Editing adalah suatu kegiatan pengecekan ulang terhadap
kemungkinan adanya kesalahan. Kemungkinan kesalahan
tersebut bisa terjadi pada :
a. Konten/isi instrumen (kuesioner atau
check list) apakah sudah sesuai dengan kerangka konsep
penelitian berupa variabel-variabel penelitian, sehingga
instrumen disusun fokus pada variable penelitian.
b. Pengisian jawaban pada instrumen
penelitian, apakah sudah sesuai dengan jawaban yang ada
ataukah tidak, atau jawaban belum lengkap dari instrumen
yang ada. jika masih belum lengkap, maka perlu dilakukan
40
pengulangan pengisian oleh surveyor yang sama sebagai

bentuk tanggung jawab2.
Koding
Koding yaitu upaya konversi (mengubah) pernyataan menjadi
angka tertentu yang mewakili sesuatu yang ingin diukur.
Koding berupa simbul tertentu atau bisa juga mewakili derajat
tertentu.
Contoh:
Koding sebagai simbul tertentu:
Kuesioner dengan option jawaban a, b, c dan d; diganti menjadi
1, 2, 3 dan 4.
Contoh:
Apakah pekerjaan bapak keseharian:
a. PNS
b. Swasta
c. Petani
d. Pengusaha
Koding disesuaikan dengan jawaban yang diberikan oleh

responden. Sedangkan yang mewakili derajat tertentu, semisal
derajat stres, misalnya:
Normal (1); stress ringan (2); stres sedang (3); stres berat (4); ada
juga koding sebagai hasil konversi kondisi tertentu yang
diperoleh dari hasil pengukuran, semisal:
Kadar Hb <11 pada ibu hamil dibilang anemia (kode 1);
sedangkan >11 normal (kode 2); untuk kepentingan praktis
menggambarkan kondisi yang mudah bagi pembaca lebih mudah
disajikan dalam bentuk kategori pada analisis deskriptif; tetapi
untuk analisis statistik sebaiknya digunakan hasil pengukuran.
Rekapitulasi
Data hasil koding, di rekap dalam satu tabulasi tertentu
yang disebut rekapitulasi. Tabulasi dibuat sedemikian rupa sesuai
dengan konstruk teoritis yang dibagi menjadi beberapa faktor,
kemudian dibagi lagi menjadi beberapa item pertanyaan.
41
Sebagai contoh seseorang ingin meneliti tentang pengetahuan

responden AIDS, maka konstruk teoritisnya dapat disusun dalam
beberapa faktor berikut:
Tabel 3.1. Contoh Cara Membuat Kuesioner
Konstruk Faktor Item pertanyaan

teori
Karakteristik 1. Umur .... tahun
penderita 2. Jenis kelamin
a. Laki-laki
b. Wanita
3. Pekerjaan
a. PNS
b. Swasta
c. Petani
d. Pengusaha
4. Pendidikan
a. SD
b. SMP
c. SMA
d. PT
e. Tidak tamat sekolah...
Gejala-gejala 1. Apakah anda
demam
AIDs 2. Apakah anda
merasa sakit
tidak
kunjung
sembuh
3. Apakah
Terjadi
penurunan
Pengetahuan BB secara
terus
42
menerus..
Mekanisme 1. Aids
munculnya menyerang
sistem
imunitas
2. dll
Faktor risiko 1. Pengguna
narkoba
2. Homoseksual
3. dll
Persepsi 1. penyakit
masyarakat yang
berujung
pada
kematian
2. penyakit
tidak bisa
disembuhkan
3. bisa
ditularkan
melalui
sentuhan
4. dll
Dll
Demikian seterusnya, masing-masing faktor diterjemahkan

dengan berbagai pertanyaan, rekapitulasi merupakan upaya
pemindahan kuesioner terhadap tabel jawaban yang sudah
ditetapkan, adapun gambarannya sebagai berikut:
Tabel 3.2. Tabulasi Rekapitulasi Kuesioner
No.ID Karakteristik responden Pengetahuan (P)

Gejala-gejala Dst Total
1 2 3 4 1 2 3 1 dst skore
P
1
2
43
3
4
5
6
Format di atas merupakan contoh dari kuesioner sesuai dengan

faktor yang ada pada kuesioner, adapun cara mengisinya,
sebagaimana contoh berikut:
Tabel 3.3. Pengisian Rekapitulasi Kuesioner
No.ID Karakteristik responden Pengetahuan (P)

Gejala-gejala Dst Total
skore
(P)
1 2 3 4 1 2 3 1 dst
1 34 1 1 3 1 1 0 1 3
2 35 2 4 4 1 0 1 1 3
3 45 1 2 3 1 1 1 1 4
4 25 1 3 4 1 1 1 1 4
5 50 2 4 5 0 0 1 1 2
6 40 1 3 4 1 0 1 1 3
Karakteristik responden diisi sesuai dengan isian pertanyaan,

apabila pertanyaan terbuka seperti umur, maka pada
rekapitulasinya diisi dengan umur yang bersangkutan; sedangkan
pertanyaan dengan option a, b, c dan d diganti dengan angka.
Total skore pengetahuan dihitung dari hasil penjumlahan seluruh
pertanyaan tentang Aids.
Jika peneliti ingin mengetahui diantara faktor pengetahuan
skore paling rendah dan paling tinggi tentang Aids, maka setiap
faktor bisa ditambahkan satu kolom penjumlahan faktor tersebut.
Memasukkan ke dalam analisis disesuaikan dengan tujuan yang
telah ditetapkan.
Rekapitulasi ini hendaknya dapat dilakukan oleh peneliti,
karena mempercepat proses memasukkan (entry) data. Proses ini
bisa dilakukan bisa juga tidak, jika tidak dilakukan, biasanya data
44
langsung di entry dari instrumen penelitian apakah berupa

kuesioner atau check list, namun saran penulis hendaknya dapat
dilakukan rekapitulasi, karena beberapa pertimbangan antara
lain :
a. Memudahkan pengecekan terhadap hasil rekapitulasi.
b. Efisiensi dokumen hasil penelitian dibandingkan yang
disimpan lembar kuesioner, lebih baik lembar rekap data saja.
c. Efisiensi sumber daya.
Pemrosesan Data.
Adalah tahapan pengolahan data dimulai dari proses entry data,
pemilihan jenis penyajian data. Upaya ini dilakukan oleh prosesor
(pengolah) data, yang seringkali tidak dilakukan oleh peneliti
sendiri.
Hasil olah data (out put).

Adalah upaya prosesor data untuk menampilkan
hasil pengolahan data dalam bentuk lembar cetak (print
out), kemudian ditafsirkan pembacaannya.
Uraian di atas bila ditulis dalam bentuk diagram alir sebagai
berikut :
Tabel 3.4. Diagram alir pengolahan data.
INPUT DATA PROSES DATA OUTPUT DATA

1. Editing 1. Entry data 1. Cetak hasil olahan
2. Coding 2. Pemilihan 2. Penafsiran hasil olah
3. Rekapitulasi jenis penyajian data
Pada buku ini tidak dibahas secara keseluruhan, akan tetapi

beberapa daripadanya yang akan disajikan, hal ini dimaksudkan
karena kelaziman pada hasil penulisan ilmiah.
Penyajian data
Upaya memvisualisasikan data hasil pengolahan disebut
dengan penyajian data. Upaya ini dimaksudkan untuk
mengkomunikasi sekumpulan data ke dalam visual/tampilan yang
45
mudah difahami oleh pengguna data tersebut. Prinsip dasar

penyajian data adalah perpaduan antara ilmu dan seni. ilmu
berkaitan dengan kaidah penyajiannya, sedangkan seni berkaitan
dengan keindahan sehingga pengguna data mudah memahami,
sederhana dan menyenangkan karena menarik.8
Data dapat dibagi dua yaitu data kontinyu (berlanjut) dan
deskrit (terpisah). Data kontinyu adalah data yang berasal dari
hasil pengukuran, sehingga hasil ukurnya cenderung tidak bulat
seperti Berat Badan, Tinggi Badan, kadar Gula Darah; sedangkan
data deskrit (terputus) data yang berasal dari hasil perhitungan,
sehingga cenderung bulat, seperti Jumlah laki-laki dan
perempuan, jumlah ibu hamil yang mengalami anemia. Data
deskrit cenderung hasil pengukurannya berupa kategorisasi data.
Dasar inilah yang menyebabkan cara penyajian datanya berbeda.
Sebagai pedoman umum cara penyajian data, jika didasarkan
pada skala data sebagai berikut:
Tabel 3.5. Skala Data dengan Jenis Penyajian Data.
SKALA DATA JENIS PENYAJIAN DATA

1. Nominal 1. Tabel
2. Ordinal 2. Pie Diagram (diagram
kategorial lingkaran).
3. Bar Diagram (diagram
batang)
4. Diagram gambar
5. Diagram peta
1. Ordinal non 1. Tabel
kategorial 2. Histogram
2. Interval 3. Poligon
3. Ratio 4. Scatter diagram
5. Steam and leaf.
Pembuatan judul penyajian data, minimal ada tiga dimensi yang

dibutuhkan yaitu : Substansi topik yang akan disampaikan,
keterangan tempat dan waktu. Adapun penjelasan masing masing
tahapan sebagai berikut:
46
Data Kontinyu
Data yang berasal dari hasil pengukuran tidak bulat, seperti
berat badan 55,1 Kg; cenderung disederhakan menjadi 55 Kg
demikian juga hasil pengukuran lainnya. Ada beberapa cara
penyajian data kontinyu antara lain:
1. Tabel
Tabel merupakan cara penyajian data berupa narasi
angka yang disajikan dalam bentuk tabulasi, jika dalam data
memuat terlalu banyak informasi, maka tabel mejadi
kurang menarik, untuk itu ada beberapa cara untuk
membuat tabel sederhana dan mudah difahami, dengan
langkah-langkah sebagai berikut:
a. Range (R)
Range adalah jarak antara nilai terendah sampai
dengan nilai tertinggi, jika dirumuskan menjadi :
R = ( Nilai tertinggi − nilai terendah ) + 1
Penambahan angka satu ini disebabkan mulai dari
nilai yang paling rendah sampai paling tinggi.
b. Jumlah Kelas (JK)
JK merupakan banyaknya kelas dari hasil kategorisasi
data mentah yang ada. Beberapa ahli menyarankan
jumlah kelas antara 5–9 kelas, hal ini disebabkan
kalau lebih kecil dari lima, boleh jadi interval kelas
semakin lebar, sehingga data cenderung bias, kalau
lebih dari sembilan data lebih teliti, tetapi terlalu
panjang, sehingga kurang komunikatif bagi pembaca.
Digunakan rumus sturgess
jml kelas = 1 + 3,3 log n
n = banyaknya data
Rumus ini sebagai pendekatan, sehingga
memudahkan para analisator untuk membuat
pengelompokan data.
c. Interval kelas (I)
47
adalah jarak antara nilai terendah sampai nilai

tertinggi masing-masing kelas, bila dirumuskan
R
I=
JK
Tiga rumus di atas digunakan untuk pembuatan tabel,
dengan contoh soal sebagai berikut:
Contoh soal :
Hasil pengukuran berat badan 20 Balita dalam satuan Kg di
Posyandu Mawar, sebagai berikut :
5, 6, 7, 10, 11, 15, 14, 16,17, 20, 3, 5, 6, 7, 8, 9, 11, 13, 15, 14.
Hasil pengukuran tersebut harus dihitung dulu :

a. Range (R)
R = ( Nilai tertinggi − nilai terendah ) + 1
R= (20-3)+1=18
b. Jumlah Kelas (JK)

JK = 1 + 3,3 log 20 = 1 + 3,3 . x 1,3
JK = 1 + 4 ,29
JK = 5 ,29 dibulatkan = 5
c. Interval (I)
R 18
I= = = 3,6 , bulatkan 4
JK 5
Setelah dihitung semuanya, maka baru dibuat tabel,

mulailah dari nilai paling rendah sebagai batas kelas ke
satu, pada saat membuat draft tabel, guna memudahkan
buatlah tally/melidi agar terhindar dari kesalahan dalam
memasukkan ke dalam tabel, namun setalah jadi tallynya
dihapus, maka hasilnya sebagai berikut :
Tabel 3.6. Distribusi Berat Badan (BB) Balita

di Posyandu Mawar 2019
48
No. BB Balita Tally Frekuensi %

1. 3 - 6 1111 5 25
2. 7 – 10 1111 5 25
3. 11 – 14 1111 5 25
4. 15 – 18 1111 4 20
5. 19 - 21 1 1 5
JUMLAH 20 100
Sumber: data terolah
Hasil perhitungan jumlah dan interval kelas,
seringkali dibulatkan, jika dua-duanya dibulatkan ke
bawah, boleh jadi bisa menambah kelas, jika interval kelas
dibulatkan ke bawah kemudian dikalikan dengan jumlah
kelas melebihi satu, maka jumlah kelas akan nambah,
namun jika tidak lebih dari satu jumlah kelas akan tetap.
misal interval kelas 3,2 dibulatkan 3 sementara jumlah
kelasnya tujuh misalnya, maka sisa pembulatan interval
kelas 0,2 kali jumlah kelas 7 = 1,4. Maka jumlah kelas
bertambah.
Persentase (%) diperoleh dengan rumus

frek
%= x 100 %
banyaknya data
Contoh kelas 1: frekuensi 5; banyaknya data 20, maka
5
diperoleh:%= x 100 %=5; begitu seterusnya cara
20
perhitungan
2. Histogram
Penyajian data dengan cara ini berupa grafik yang
saling berhimpit antara satu sisi dengan sisi lainnya, hal ini
disebabkan karena datanya kontinyu (bersambung); adapun
cara pembuatannya dengan langkah-langkah sebagai
berikut:
Batas Atas Kelas (BAK) dan Batas Bawah Kelas (BBK)
adapun rumusan untuk BAK dan BBK sebagai berikut :
BAK =(nilai tertinggi+0,5); pada masing-masing kelas

BBK =¿−0,5); pada masing-masing kelas
49
Pengurangan 0,5 ini digunakan untuk nilai terendah

dan tertinggi masing-masing kelas yang bulat, jika nilai
terendah dan tertinggi untuk masing-masing kelas
mempunyai desimal, maka pengurangannya ditambah satu
desimal dibelakangnya. Misal : nilai terendah kelas pertama
5.6, karena ada satu angka dibelakang koma, maka
pengurangannya ditambah satu angka dibelakang desimal,
sehingga menjadi 0,05, sehingga nilai BAK=5,6+0,05=5,65
sedangkan BBK= 5,6-0,05= 5,55
Tabel 3.7. hasil perhitungan BBK dan BAK
No. BB Balita BBK BAK

1. 3 - 6 3-0,5=2,5 6+0,5=6,5
2. 7 – 10 7-0,5=6,5 10+0,5=10,5
3. 11 – 14 11-0,5=10,5 14+0,5=14,5
4. 15 – 18 15-0,5=14,5 18+0,5=18,5
5. 19 - 21 19-0,5=18,5 21+0,5=21,5
Hasil perhitungan menunjukkan BAK sebelumnya
merupakan BBK sesudahnya, dengan demikian cara
pembuatan diagramnya berimpit sebagai berikut:
frek
5 .
4 .
3 .
2 .
1 .
. . . . . .
2,5 6,5 10,5 14,5 18,5 21,5 BB
Gambar 3.1. Histogram Berat badan Balita
50
Penyajian data dengan histogram tidak menunjukkan

berapa data sebenarnya antara 2,5 sampai dengan 6,5, tetapi
yang diketahui pada rentang kelas tersebut ada 5 data.
3. Poligon
Pembuatan poligon dengan garis antar titik pada histogram,
didasarkan pada titik tengah kelas untuk masing-masing
kelas. Adapun rumus titik tengah kelas (TTK) sebagai
berikut:
[ Nilaitertinggi−nilai terendah ]
TTK = ; masing-masing kelas
2
TTK masing-masing kelas bisa dihitung, sebagai berikut:
Tabel 3.8. Hasil Perhitungan TTK BB Balita

No. BB Balita TTK
1. 3- 6 (3+6)/2=4,5
2. 7-10 8,5
3. 11-14 12,5
4. 15-18 16,5
5. 19-22 20,5
Hasil perhitungan digunakan untuk membuat grafik,

sebagai berikut:
frek
5 .
4 .
3 .
51
2 .
1 .
. . . . . .
4,5 8,5 12,5 16,5 20,5 BB balita
Gambar 3.2. Poligon Berat badan Balita
4. Steam and leaf plot (stemplot)

Stemplot diperkenalkan oleh Arthur Bowley di awal tahun
1900-an. Namun penggunaannya secara umum baru
dimulai pada tahun 1980 setelah John Tukey’s
mempublikasikan Exploratory Data Analysis pada tahun
1977
Penyajian data dengan cara ini mengatasi kelemahan pada
histogram yang tidak diketahui data sebenarnya. Pada
stemplot ini data dibagi menjadi tiga bagian yaitu frekuensi,
batang adalah pokok angka (steam) apakah puluhan,
ratusan dan daun (leaf) yang merupakan satuan. Bisa juga
hanya dua yaitu steam dan leafnya saja.
Contoh data berat badan Balita yang sudah digunakan
sebelumnya:
5, 6, 7, 10, 11, 15, 14, 16,17, 20, 3, 5, 6, 7, 8, 9, 11, 13, 15, 14;
jika diperhatikan pokoknya ada dua saja yaitu satuan dan
puluhan; maka bisa dibuat steamplotnya sebagai berikut33:
fr Pohon Daun
9 0 355667789
1 1 0113445567
0
1 2 0
Cara menginterpretasikan data sebagai berikut:

52
Kolom fr menunjukkan frekuensi, kolom pohon menunjukkan

pokok angka 0 diterjemahkan satuan, 1 sepuluhan, 2 dua
puluhan; sekarang diartikan “0” satuan banyaknya ada 9 yaitu
3, 5 sampai dengan sembilan; 1 sepuluhan banyaknya ada 10
yang meliputi 10, 11 ada dua, 13, 14 dan 15 ada dua dst;
sedangkan “2” dua puluhan ada satu dengan nilai 20.
Penyajian seperti ini secara komputerize akan tersusun dengen
sendirinya, tetapi secara manual diabaikan berapa satuannya
dan hanya disajikan pokoknya saja, adapun nilai satuannya
ditandai dengan noktah (bulatan) dengan tampilan sebagai
berikut:
fr Pohon Daun
9 0 000000000
1 1 0000000000
0
1 2 0
Dari cara interpretasi sama, yaitu satuan sebanyak 9,
sepuluhan sebanyak 10 dan dua puluhan ada 1; tetapi
kelemahannya berapa angka sebenarnya tidak diketahui, tetapi
secara visual sama2.
Data Deskrit
Data yang berasal dari hasil perhitungan ini cenderung
bulat, seperti jumlah laki-laki dalam satu kelas 15 dan jumlah
perempuan 35; maka tidak ada jumlah laki-laki 15,5 tidak
mungkin. Adapun penyajian datanya antara lain:
1. Tabel
Tabel pada data diskrit tidak ada tahapan perhitungan
dalam pembuatannya, karena bersifat kategorial, maka
banyaknya baris menyesuaikan berapa kategori. Pada
pembuatan tabel kategorial ini ada dua dimensi yaitu:
a. Satu dimensi
Satu dimensi yang dimaksudkan adalah hanya satu
variabel saja, semisal:
53
Tabel 3.9. Lima Penyakit di Desa Makmur 2019

No Jenis Frekuensi %
Penyakit
1. ISPA 30 27,27
2. Malaria 20 18,18
3. Diare 15 13,63
4. Kulit 10 9,09
5. Thypoid 5 4,54
6. Lain-lain 30 27,27
Jumlah 110 100
Sumber:Laporan bidan desa.
Variabel yang disajikan satu variabel yaitu jenis

penyakit.
b. Dua dimensi
Penyajian dengan cara ini dimaksudkan dua variabel
disajikan dalam tampilan yang sama, misalnya jenis
kelamin dan tingkat pendidikan, dengan tampilan
sebagai berikut:
Tabel 3.10. Distribusi Jenis Kelamin dan Tingkat Pendidikan

Responden di Desa Makmur 2019
No. Jenis Tingkat pendidikan Jumlah
kelamin SD SMP SMA PT
1 Laki-laki 1 20 59 20 100
2 Perempua 0 5 25 20 50
54
n
Jumlah 1 25 84 40 150
Sumber : data primer terolah
Cara interpretasi tabel seperti ini, diambil data mayoritas

dan yang paling kecil, dalam bentuk persentase, dan sangat
tergantung dari sudut pandang peneliti, mana yang akan
dikedepankan. Jika ingin dibuat komparasi dari keseluruhan
subyek (150 responden) seperti berikut ini: 66,7 %
responden laki-laki, dengan pendidikan SMA sebesar
39,3%, sedangkan yang wanita yang berpendidikan SMA
sebanyak 16,7%; hal ini dapat diartikan juga responden
laki-laki yang berpendidikan SMA 2,37 kali lebih besar
dibandingkan dengan wanita. Bisa juga pembandingnya
adalah masing-masing jenis kelamin, semisal pendidikan
20
Perguruan tinggi laki-laki 20% ( x 100 % ¿, sedangkan
100
20
wanita 40% ( x 100 % ¿ maka ratio wanita yang
50
mempunyai pendidikan tinggi 2 kali lebih besar
dibandingkan laki-laki.
2. Diagram batang (Bar diagram)

Penyajian grafik batang ini dibuat secara terpisah antara
batang yang satu dengan batang yang lain, hal ini
disebabkan karena datanya diskrit (terpisah), berbeda
dengan histogram yang berhimpit karena dasarnya BBK
dan BAK, sehingga penyajiannya berhimpit, adapun
contohnya sebagai berikut:
55
SAKIT
F re ku e n si
40
30
20
10
0
ISPA MALARIA DIARE KULIT THYPOID LAIN-LAIN
SAKIT
Gambar 3.3. Lima Besar Penyakit

di Desa Arga Makmur 2019
Penyakit terbesar di Desa Arga Makmur didominasi oleh

ISPA. Visual pada garis vertikal frekuensi sebaiknya
digunakan satuan %.
3. Diagram lingkaran (Pie diagram)

Diagram ini didasarkan pada suatu lingkaran yang besarnya
360o, sehingga untuk mengetahui berapa derajat masing-
masing komponen, harus dibuat persentase dulu baru
dikalikan dengan360o , maka akan diketahui proporsi
derajat masing-masing komponen tersebut. Contohnya
sebagai berikut:
ISPA
LAIN-LAIN 27%
27%
THYPOID MALARIA
5% 18%
KULIT
9%
DIARE
14%
Gambar 3.4. Distribusi Penyakit di Desa Arga Makmur 2019
56
4. Diagram gambar/pictogram
Visualisasi data dengan keterwakilan gambar, digunakan
untuk mengilustrasikan berapa jumlah yang diwakili oleh
satu gambar, maka jumlah dihitung dengan cara
mengalikan banyaknya gambar dengan perwakilan satu
gambar. Sebagai contoh: 1 gambar orang mewakili 10 juta,
maka jika ada 10 orang gambar, bisa dikatakan ada 100 juta
orang, bagaimana jika kelipatannya tidak sampai 10 juta,
maka orang yang digambarkan tidak utuh, inilah
kelemahannya, sehingga seringkali dilengkapi dengan
jumlah yang ada dalam bentuk angka:
Contoh:
Gambar 3.5. Distribusi Tingkat Pendidikan

di Kecamatan Purwokerto Utara 2019
5. Diagram peta
Diagram ini digunakan untuk menentukan secara cepat
distribusi dan derajat potensi endemisitas suatu daerah,
sebagai contoh:
57
Gambar 3.6. Distribusi Penyakit TB Paru di Dunia 1997
6. Diagram garis
Analisis kecenderungan bisa dilihat dari arah grafik yang
ditunjukkan melalui perubahan pola menurut deret waktu,
sebagai contoh:
Sumber: data hasil riset

Gambar 3.7. Distribusi Penyakit Malaria sejak 2008-2010
Interpretasi gambar 3.6 bisa ditafsirkan penyakit malaria di

Kabupaten Purworejo mencapai titik paling rendah pada
bulan november dan mulai naik bulan Januari dan ada
beberapa puncak kasus yaitu bulan Mei dan Oktober.
Penafsiran data kontinyu lebih cenderung pada nilai-
nilai angka seperti rata-rata, sehingga dalam menafsirkan
angka seringkali kurang komunikatif, sebagai contoh rata-
rata Kadar Hb Ibu Hamil 11 gr%; artinya apa; tetapi
kemudian jika hasil pengukuran data kontinyu tersebut di
58
konversi ke data kategorial dengan narasi 45% ibu hamil

mengalami Anemia, maka kesan psychologisnya lebih
mudah difahami dibanding dengan rata-rata kadar Hb 11 gr
%. Bagaimana memecahkan hal ini, untuk kepentingan
komunikasi deskriptif lebih mudah digunakan data
kategorial, tetapi untuk kepentingan analisis kausalitas
untuk memverifikasi hipotesis tetap digunakan data hasil
pengukuran. Bagaimana jika tidak ada parameter untuk
menentukan kategori, maka peneliti tetap menggunakan
hasil ukur sebagai basis data baik secara deskriptif maupun
analitiknya.
59
58
BAB IV. PROBABILITAS
Pendahuluan
Ketidak pastian merupakan salah satu hukum kehidupan,
bagaimana cara memastikan ketidak pastian itulah probabilitas
atau peluang suatu kejadian, sehingga kejadian yang tidak pasti
adalah suatu ketidak pastian itu sendiri. Contoh rata-rata berat
badan mahasiswa di suatu perguruan tinggi 65 Kg, artinya ada
mahasiswa yang kurang dan lebih dari rata-rata, itulah yang
dimaksud ketidak pastian bahwa rata-rata itu mempunyai makna
tidak tunggal, tetapi itulah yang pasti dari sekumpulan data
diwakili oleh satu nilai yang disebut rata-rata. Berbeda dengan
kesimpulan grafitasi 9,8 m/dt; maka kesimpulan yang diambil
tersebut mempunyai nilai tunggal, tidak ada yang kurang atau
lebih.
Teori-teori dikembangkan dalam konsep ilmiah seringkali
merupakan penyederhanaan suatu realitas, statistik menggunakan
logika induktif dalam menarik kesimpulan yaitu didasarkan
pengumpulan sekelompok data, kemudian diambil
kesimpulannya; teori terbentuk dari sekumpulan kesimpulan
induktif yang diteliti berulang kali pada subyek dengan
karakteritik sama dan lokasi berbeda beda menghasilkan
kesimpulan yang relatif sama.
Kesimpulan lain yang dikembangkan berdasarkan aksioma
tertentu melalui logika deduktif yang tidak ada kaitannya dengan
realitas37, sehingga realitas menyesuaikan aksioma deduktif
tersebut, seperti dalam konsep matematik contoh tentang luas
(panjang x lebar), volume (p x l x t) itu berkaitan dengan realitas,
tetapi dalam matematika secara konsep ada M4, ... Mn yang secara
konsep ada tapi dalam realitas tidk ada, pada statistik juga ada
tentang konsep distribusi normal pada sampel tidak terbatas,
sehingga tabel mempunyai batas antara -∞ s/d ∞, tetapi dalam
penerapannya selalu mempunyai keterbatasan sampel.
Peluang lazim dipakai pada banyak aktifitas manusia, ahli
epidemiologi sering membuat estimasi kejadian berdasarkan data-
data yang ada dengan mengatakan risiko perokok terkena Ca Paru
59
5:4; perbandingan ini yang disebut dengan Odds.8, jika dijadikan

5
peluang menjadi =0,55.
9
Probabilitas didefinisikan sebagai peluang munculnya satu
atau lebih kejadian dari satu set total kejadian yang mempunyai
kesempatan yang sama untuk muncul sebagai suatu kejadian 35,36,
tetapi peluang kejadian yang sama apakah bisa berulang pada
kondisi lain yang tidak terbatas dengan hasil yang sama,
jawabnya sulit untuk ditentukan, itulah sebabnya Kendall
mengatakan probabilitas merupakan sesuatu yang sulit untuk
didefinisikan.34. pada populasi terbatas peluang bisa dihitung
dengan konsep proporsi yaitu perbandingan antara suatu kejadian
dengan total kejadian yang mungkin. Sebagai contoh desa A
dengan penduduk 100 jiwa, yang menderita diare 10 orang maka
peluang kejadian diare di desa A
kejadian diare 10
= =0,1 .
total penduduk yang rentan kena diare 100
Sebelum membahas lebih lanjut, sebaiknya diperhatikan berbagai

macam cara mendefinisikan probabilitas4,38.
1. Definisi aksiomatik/matematik
Yaitu suatu peluang kejadian berkaitan dengan aksioma
dan teorema dasar yang digunakan dalam bidang
matematika, ada tiga aksioma:
a. Probabilitas dari setiap kejadian harus merupakan
bilangan positif , dengan notasi Pr (A)≥0
b. Jika suatu kejadian pasti terjadi, maka nilai
probabilitasnya=1, dengan notasi Pr (A)=1
c. Peluang kejadian saling pisah (disjoint atau mutually
exclusive) merupakan penjumlahan dari peluang
kejadian dari urutan kejadian yang tidak terbatas,
notasinya sebagai berikut:
∞
Pr ( ¿i=1 ¿ ∞ Ai ) =∑ Pr ⁡( A1 ¿ )¿
i=1
2. Definisi frekuensi relatif

60
Probabilitas kejadian adalah frekuensi relatif dari satu set

kejadian yang diperoleh dari suatu percobaan yang tidak
terbatas4; dengan kata lain merupakan peluang kejadian
dari satu rangkaian percobaan.
Contoh:
Jika suatu eksperimen diulang n kali dan jika kejadian A
timbul nA kali, maka:
nA
Pr ⁡( A)=
n
Beberapa istilah yang digunakan pada teori probablititas antara

lain38:
Ruang sampel/sample space4

Istilah pengamatan atau observasi seringkali dipakai
saat penelitian, misal dari 100 orang di desa A berapa
orang yang terkena Diare, tetapi pada statistika disebut
percobaan yaitu berapa banyak kejadian yang diinginkan
muncul dari serangkaian percobaan, inilah peluang.
Peluang tersebut menunjukkan suatu ketidak pastian.
Sebagai contoh dilempar satu mata uang, yang keluar
gambar atau angka, maka tidak seorangpun dapat
memastikan apa yang akan muncul, tetapi orang bisa
memastikan kalau tidak gambar ya angka, inilah yang
disebut peluang. Sedangkan banyak elemen yang ada
disebut ruang sampel.
Ruang sampel adalah himpunan semua hasil yang
mungkin terjadi dari suatu percobaan; sedangkan hasil
dari setiap ruang sampel disebut dengan unsur, elemen,
anggota atau titik sampel. Jika unsur mempunyai anggota
yang terbatas maka bisa dibuat daftar titik sampelnya
dengan cara menuliskan diantara dua akolade/{}, sebagai
contoh berapa ruang sampel untuk satu mata uang, bisa
ditulis {Gambar/G, Angka/A} atau singkatnya T={G,A};
T adalah total ruang sampel.
Sebuah dadu dilantunkan, maka ruang sampelnya
T={1,2,3,4,5,6}; bila yang diinginkan nomer ganjil maka
61
ruang sampelnya T={1,3,5}, bila yang diinginkan hanya

dua kategori maka bisa ditulis T={ganjil, genap}. Jika
percobaan lebih dari satu; maka sebagai alat bentu
gunakan diagram pohon atau tabel untuk menentukan
ruang sampel:
Contoh:
Dua mata uang dilemparkan secara bersamaan, berapa ruang
sampel:
Tabel 4.1. Ruang Sampel Dua Lemparan Koin Mata Uang
Kemungkinan Kemungkinan Kemungkinan mata

uang ke satu uang ke dua uang yang muncul
G G GG
A GA
A G AG
A AA
Dengan demikian ruang sampelnya

T={GG, GA, AG, AA}; dengan logika yang sama bisa
dikembangkan dengan berbagai model percobaan, untuk memberi
wacana tambahan diberi narasi sebagai berikut:
Tahap pertama dilemparkan mata uang, jika yang keluar Gambar,

dilemparkan mata uang ke dua, jika yang keluar angka maka
dilemparkan sebuah dadu, bagaimana gambaran ruang
sampelnya.
Tabel 4.2. Ruang Sampel Lemparan Koin Mata Uang dan dadu
Lemparan Lemparan ke Kemungkinan mata

62
uang ke satu dua uang yang muncul
G G GG
A GA
1 A1
A
2 A2
3 A3
4 A4
5 A5
6 A6
Maka ruang sampelnya T={GG, GA, A1, A2, A3, A4, A5, A6}
Kejadian/even
Peristiwa yang muncul dari suatu percobaan,
sebagai contoh berapa kejadian dadu dapat dibagi dua;
maka peristiwa yang boleh jadi muncul adalah ={2, 4, 6};
dengan demikian kejadian dapat didefinisikan sebagai
suatu peristiwa yang menjadi bagian dari ruang sampel.
Kejadian kelahiran bayi laki-laki pada satu wanita hamil= {laki-
laki}
Himpunan37,38
Notasi
63
Penulisan simbul atau notasi digunakan untuk memudahkan

komunikasi tentang simbul tertentu yang mewakili kaidah
tertentu, adapun notasi yang ada sebagai berikut:
1. Himpunan dinyatakan huruf besar, sedangkan elemen
himpunan dinyatakan huruf kecil dengan diberi tanda
akolade/{} contoh himpunan A={a, b, c, d, e}
2. p ⸦ A artinya p elemen himpunan A
3. p ⸦ A artiya p bukan elemen himpunan A
4. A⸦B artinya himpunan A menjadi anggota himpunan B
atau semua elemen himpunan A menjadi anggota himpunan
B
5. B⸧A semua Elemen himpunan A menjadi anggota
himpunan B
6. A≠B artinya himpunan A tidak sama dengan himpunan B
7. {}=Ø artinya himpunan kosong atau tidak mempunyai
anggota elemen
8. Komplemen (Ꞌ atau Á ) artinya selain itu; misal AꞋ, selain
elemen himpunan A; misal komplemen himpunan A
terhadap X artinya himpunan semua elemen X yang tidak
termasuk himpunan A; X penyakit saluran pencernaan dan
A penyakit diare, maka X semua penyakit saluran
pencernaan selain diare.
9. ∩ irisan (intersection) artinya elemen himpunan yang
menjadi anggota lebih dari satu himpunan; contoh A={a, b,
c, d, e}; B={a, b, x, y, z} maka A∩B={a, b}; jika A dan B
saling terpisah mutually exclusive, maka = Ø; contoh A={a,
b, c, d, e} dan B={ x, y, z} maka A∩B= Ø; contoh lain
pada tekanan darah diastole, A={x|x≥90} dan B={x|
75≤x≤100}, maka A∩B={x| 90≤x≤100}
10. Ս gabungan (union) artinya kejadian himpunan A atau
kejadian himpunan B atau kejadian di keduanya.4
Himpunan yang mempunyai nilai sama dihitung satu
elemen; misal Desa A dengan pola penyakit A={diare,
kulit, thypoid, ispa}; Desa B dengan pola penyakit
B={diare, hipertensi,jantung, malaria}, dengan demikian
jika dijadikan unian notasinya AՍB
={diare,kulit,thypoid,ispa,hipertensi,jantung, malaria}
64
Contoh lain diastole pada tekanan darah, A={x|x≥90} dan

B={x| 75≤x≤100}, maka AՍB={x| x≥75}
Beberapa contoh penulisan himpunan sebagai berikut:
1. B himpunan bilangan genap yang lebih kecil dari 11 dapat
ditulis {2, 4, 6, 8, 10}
2. A himpunan bilangan ganjil dapat ditulis A={x|x bilangan
ganjil}; tanda | dibaca sedemikian hingga atau dimana;
sehingga membacanya x dimana x bilangan ganjil contoh:
D bilangan prima dibawah 15; bisa ditulis D={x|x
bilangan prima, x<15}atau D={1,3,5,7,11,13}
3. Z adalah himpunan obat antibiotik generik Z={tetrasiklin,
chloramphenicol, ampicilline}
4. Z himpunan manusia yang berumur lebih dari 250 tahun,
maka Z={}atau =Ø, artinya tidak ada.
65
Menghitung titik sampel

Sudah dijelaskan sebelumnya cara menentukan
ruang sampel pada satu kali momen, sekarang jika ruang
sampel yang diinginkan lebih dari satu, maka cara
membuat ilustrasi akan banyak sekali dilakukan, untuk itu
perlu ditetapkan ketentuan dasar untuk membuat elemen
yang berada pada ruang sampel; dalam definisi:
“bila suatu operasi dapat dilakukan dengan n1 cara
dan operasi lainnya dengan n2 cara, maka kedua operasi
tersebut dapat dikerjakan bersama-sama dalam n1. n2 cara;
dengan demikian jika ada nk; maka operasinya n1.n2.n3...nk
Satu dadu dilempar ada 6 elemen yang mungkin
muncul, dadu kedua dilempar lagi, berarti elemen sampel
yang berpeluang muncul ada 6x6=36
Faktorial
Notasi faktorial !. faktorial bilangan asli n adalah hasil perkalian
antara bilangan bulat positif yang kurang dari atau sama
dengan n. , dengan ketentuan 0!=1! = 1.
Misal :
3! = 3. 2.1 = 6
4! = 4. 3. 2. 1 = 24
n ! = 1. 2. (n-2). (n-1). n
Faktorial biasa digunakan untuk menghitung banyaknya susunan
yang dapat dibentuk dari sekumpulan benda tanpa
memperhatikan urutannya.41
Contoh faktorial untuk susunan huruf A, B, C (urutan tidak
deperhatikan, maka ABC ; ACB ; BCA ; CAB : BAC ; dan
CBA.
Perhatikan komponennya sama hanya posisi huruf yang berbeda.
Permutasi
Susunan yang dapat dibentuk dari satu kumpulan
benda yang diambil sebagian atau seluruhnya atau suatu
cara untuk menyusun unsur-unsur dengan memperhatikan
urutan unsur penyusunnya. Unsur penyusunnya dapat
66
diletakkan pada posisi yang berbeda dari sebelumnya,

meskipun unsur penyusunnnya sama. 2,37,38,41
Contoh :
Susunlah huruf ABC, dengan variasi tiga huruf tersebut, maka
dari ketiga huruf dapat disusun menjadi : ABC ; ACB ; BCA ;
CAB : BAC ; dan CBA.
Ketiga huruf tersebut, jika disusun dengan jumlah huruf yang
n
sama maka dapat dirumuskan menjadi Pn = n!=1. 2.3=6 ;
P33=3 !=3.2 .1=6; posisi pilihan yang sama dengan unsur
penyusunnya sama dengan faktorial.
N buah data jika diurutkan dengan jumlah yang berbeda akan

n!
Pnr =
mengikuti rumus ( n−r ) !
Contoh soal :
Suatu masalah flu burung, hasil diskusi ahli dengan
menggunakan teknik Delphi ternyata ada 8 (n) pendekatan untuk
mengatasi masalah flu burung, jika setiap ahli diberi kesempatan
untuk memilih 5 (r) cara terbaik untuk mengatasi masalah flu
burung. Ada berapa cara pilihan terbaik dari delapan solusi yang
diberikan.
Soal diatas dapat dihitung dengan cara :
8! 8.7.6.5.4.3.2.1
P85 = = = 6.720
(8−5) ! 3.2.1
Berbagai kasus permutasi ada beberapa diantaranya mempunyai

subyek yang sama, maka berlaku rumus permutasi sebagai
n!
berikut: P= ; banyaknya permutasi yang berlaianan
n1 ! . n2 ! … n k !
dari n subyek, bila n1 berjenis sama pertama; n2 berjenis sama
kedua sampai nk.
Contoh: Kejadian Luar Biasa Demam Berdarah di Indonesia,

maka Kementerian Kesehatan menetapkan 9 ahli dibidangnya.
Ada berapa cara menyusun ahli dalam satu team penanggulangan.
67
Adapun ahlinya sebagai berikut: 3 orang ahli imunologi; 4 ahli

epidemiologi demam berdarah; 2 ahli biostatistik
Jawabnya :
Diketahui: n=9; n1=3; n2= 4; n2=2; maka permutasi kejadian
9!
tersebut P= =1260 cara.
3 ! .4 ! 2 !
Kombinasi
Penyusunan urutan kejadian dari r subyek dari
sejumlah n subyek yang lebih besar, tanpa memperhatikan
urutan disebut kombinasi38. Hakekatnya sama dengan
permutasi, namun urutan tidak diperhatikan, jika
komponen penyusunnya sama dianggap satu urutan2.
Misal : ABC, jika dibuat kombinasi ACB, CAB, dan lain-lain

hanya dianggap satu kombinasi, sehingga kombinasi dirumuskan
n!
Crn =
r ! (n−r) ! , contoh di atas dapat dihitung kombinasi
sebagai berikut :
3! 3! 3 .!
C33 = = = =1
3 ! ( 3 !−3) ! 3 ! (0) ! 3 ! . 1 yaitu ABC
Dari tiga huruf yang ada bila dibuat dua kombinasi akan
memperoleh jumlah kombinasi sebanyak
3! 3.2.1
C32 = = =3
2 ! (3−2) ! 2! . 1 !
yaitu AB, AC dan BC, karena
AB=BA demikian juga yang lain, sehingga dihitung satu. Contoh
lain berapa banyaknya cara memilih 2 ahli bio statistik dari 4 ahli
yang sama, maka dapat dihitung:
4! 1.2.3.4! 24
Crn = = = =6
2 ! (4−2) ! 1.2!1.2! 4 ; misal ahlinya A, B, C dan
D, maka kombinasi 2 dari 4 ahli biostatistik adalah AB, AC, AD,
BC, BD, CD
Peluang
68
Perbandingan antara kejadian yang mungkin terjadi

dengan seluruh elemen dalam ruang sampel.
Contoh :
1. Berapa peluang munculnya angka pada satu kali lemparan

mata uang, maka bisa dihitung sebagai berikut:
Ruang sampel: T={G,A}, ruang sampelnya 2 dan angka 1,
1
maka peluangnya P ( A )= =0,5; jika mata uang dilempar
2
sebanyak 10; maka peluang munculnya angka 0,5 x 10= 5
kali.
2. Berapa peluang munculnya angka ganjil pada satu kali

lemparan dadu, bisa dihitung sebagai berikut:
Ruang sampel T={1,2,3,4,5,6}; sedangkan kejadian angka
ganjilnya A={1,3,5}, dengan demikian dapat dihitung
3
peluangnya P ( angka ganjil ) = =0,5; jika dilempar 10 kali
6
dadu yang sama, maka hasilnya 0,5 x 10= 5 kali angka
ganjil
3. Berapa peluang mendapatkan anak laki-laki dari satu
kehamilan, bisa dihitung sebagai berikut:
T={Laki-laki,wanita}; laki-laki 1 dengan demikian
peluangnya 0,5. Sekarang apakah peluang ini benar secara
empirik, maka dapat dilihat dari data statistik
Tabel 4.3. Peluang Angka Kelahiran
Waktu Jumlah Jumlah Peluang Tempat

kelahiran kelahiran Laki-laki
laki-laki wanita
1965 1.927.054 1.833.304 0,51 Amerika
1965-1969 9.219.202 8.770.159 0,51 Serikat4
1965-1974 17.857.857 16.974.194 0,51
jumlah laki−laki
Seks rasio ( ¿ per 100 wanita
jumlah wanita
69
Tahun laki-laki wanita Peluang

laki-laki
1971 97,18 100 0,49 Indonesia39
1980 98,82 100 0,497
1990 99,45 100 0,498
1995 99,05 100 0,497
2000 100,6 100 0,50
2005 101,11 100 0,50
2010 101,4 100 0,50
2014 101 100 0,50
2015 84,8 100 0,45 Latvia40
2015 89 100 0,47 Armenia40
Data tabel 4.3 terlihat di Amerika peluangnya 0,5 artinya jika ada
seorang wanita hamil, peluang melahirkan antara laki-laki dan
perempuan sama. Pada kasus seks rasio atau perbandingan jenis
kelamin. Jika dikonversi menjadi peluang dapat dihitung, sebagai
contoh di Amerika tahun 1965 jumlah kelahiran= 3.760.358 bayi
lahir hidup (sample space), maka peluang mendapatkan bayi laki-
laki di Amerika tahun 1965 (p)=
kejadian 1.927 .054
= =0,51 ; berarti peluang mendapatkan
sample space 3.760.358
anak laki-laki orang Amerika tahun 1965 lebih besar
dibandingkan anak perempuan lahir hidup, angka 0,51 dapat
diartikan setiap 100 kelahiran hidup bayi di Amerika tahun 1965
ada 51 bayi laki-laki. Seks rasio Indonesia tahun 2014 dengan
seks rasio 101, maka peluangnya:
101
p ( laki−laki )= =0,5; nilai 0,5 di Indonesia peluangnya relatif
201
sama antara laki-laki dan wanita;
Latvia dengan seks rasio 84,8, maka peluangnya
kejadian 84,8
p ( laki−laki ) ¿ = =0,458; artinya peluang
sample space 184,8
lahir bayi wanita lebih banyak dibandingkan laki-laki, dari 1000
bayi lahir hidup di Latvia ada 458 laki-laki dan wanita 542 atau
dengan kata lain setiap 1000 kelahiran hidup kelebihan 84 wanita.
Cara analisis seks rasio dapat dijelaskan sebagai berikut: asumsi

kelahiran laki-laki dan perempuan mempunyai peluang yang
70
sama maka hasilnya 1 (100) maka peluangnya 0,5, tetapi jika

kurang dari 1, maka laki-laki lebih sedikit dibanding wanita;
tetapi jika >1 maka laki-laki lebih banyak dibanding wanita.
Kasus di Indonesia sejak tahun 1971 penduduk laki-laki lebih
sedikit, tetapi mulai tahun 2005 laki laki lebih banyak, tahun
2014 nilai rasionya 101 hal ini menunjukkan bahwa, jika jumlah
penduduk 1.000.000, berarti kelebihan laki-laki 10.000 orang hal
ini dihitung dengan cara sebagai berikut:
101
proporsi= =1,01 , sehingga kelebihan laki-laki 1,01-1= 0,01.
100
Nilai 1 sebagai pengurang merupakan rasio wanita; sehingga
kelebihan laki-lakinya per satu juta penduduk adalah 0,01x
1.000.000= 10.000 orang.
Sedangkan untuk Latvia bisa diartikan setiap 84,8 laki-laki, maka

jika ada 1000 wanita ada 848 laki-laki artinya kelebihan 152
wanita setiap seribu orang.
Contoh 1 dan 2 adalah contoh konsep peluang yang ada dalam

tataran pemikiran; sedangkan contoh no 3 adalah penerapan
konsep matematik diterapkan dalam tataran riil yaitu jumlah
kelahiran antara laki-laki dan wanita.
Hukum Peluang
Ilmu statistik yang berbasis matematika,
menetapkan beberapa hukum perhitungan suatu kejadian
akan muncul dari suatu rangkaian kejadian. Adapun
Peluang bersyarat
Yaitu peluang kejadian tertentu, jika kejadian
lainnya telah diketahui, dilambangkan dengan P(B|A)
artinya “peluang B terjadi bila diketahui A telah
terjadi” rumusan peluang bersyarat42 :
n( B ∩ A )
n ( B ∩ A ) n( A ∪ B)
P ( B| A )= =
n(A) n( A)
n( A ∪ B)
71
n
B∩ A=n ; sedangkan A ∪B=N ; dengan demikian =P
N
n( B∩ A )
Maka =P ( B∩ A )=P ( A ∩B ) ; sifat komutatif
n( A ∪ B)
n(A ) n( A)
Sedangkan = =P( A), sehingga
n( A ∪ B) n . N (A ∪B)
rumusnya2:
P ( A ∩B )
P (B | A ) = , bila P ( A ) > 0
P( A)
Rumus ini digunakan untuk mengidentifikasi peluang kejadian

pada dua himpunan yang terjadi secara bersama-sama
(intersection atau dan (membacanya) atau dengan kata lain
seseorang atau sekelompok orang mengalami peristiwa yang
sama sebagaimana seseorang atau sekelompok orang pada
kelompok yang berbeda.
Contoh soal :
Hasil penelitian tentang hubungan antara kualitas mandi dengan
penyakit kulit, seperti terlihat pada tabel berikut :
Tabel 4.4. Hubungan Antara Kualitas Mandi

dengan Penyakit Kulit
PENYAKIT KULIT KUALITAS MANDI JUMLAH
KURANG BAIK
BAIK
Berpenyakit 400 100 500
Tidak berpenyakit 200 300 500
Jumlah 600 400 1000

72
Berapa peluang seseorang yang kualitas mandinya kurang baik

dan terkena penyakit kulit, maka dapat dihitung :
Misal :
P (KB) = peluang kualitas mandi kurang baik
P (PK) = Peluang berpenyakit kulit
600
P ( KB ) =
1000
400
P ( KB ∩PK ) =
1000
P ( KB ∩PK )
P ( KB|PK ) =
P ( KB )
400
1000 1000 400
P ( KB|PK ) = = x =4/ 6
600 600 1000
1000
Penjumlahan
Peluang terjadinya kejadian tertentu dalam satu set kemungkinan
dengan peristiwa lainnya secara sembarang yang merupakan
penggabungan dari lebih satu himpunan dapat dihitung dengan
menggunakan rumus peluang penjumlahan:
Hukum penjumlahan 1
Bila A dan B dua kejadian sembarang, digunakan rumus:
P ( AUB )=P ( A ) + P ( B ) −P ( A ∩ B ) … teorema1; jika digambarkan
dalam diagram venn, berikut ini:
A∩B
Gambar 4.1 diagram venn gabungan
Contoh soal:
73
Desa A jumlah penduduk 100 jiwa; yang terkena Thypoid 5

orang, Demam berdarah 10 orang, yang kena kedua penyakit
tersebut 2 orang, hitunglah berapa peluang seseorang terkena
paling sedikit terkena satu penyakit.
5 10
Jawaban : P ( T ) = =0,05 ; P ( DB )= =0,1:
100 100
2
Peluang terkena kedua penyakit P(T&DB)¿ =0,02
100
Dengan demikian peluang penduduk terkena paling sedikit satu
penyakit:
P ( T U DB ) =P ( T ) + P ( DB )−P ( T ∩ DB )= ( 0,05+0,1 )−0,02=0,13

Artinya dari 100 orang yang terkena minimal satu penyakit
sebanyak 13 orang di Desa A
Bila kejadian saling terpisah (mutually exclusive), maka

rumusnya:
P ( AUB )=P ( A ) + P ( B ) ;
jika kejadian saling pisah irisan keduanya {}atau =Ø;
contoh kasus:
Kelurahan A bebas malaria (daerah tidak ada kasus malaria dan
tidak ada vektor Anopheles Spp.) dan Desa B endemis malaria.
Dengan asumsi penduduk Kelurahan A tidak datang di daerah
endemis. Kelurahan A penduduk 100 ada 10 orang terkena diare
(D); sedangkan Desa B ada 10 penderita malaria (M) dari 100
penduduk yang ada di desa tersebut. Berapa peluang seseorang
yang berinteraksi di Kelurahan A dan Desa B terkena penyakit
diare atau malaria.
10 10
Diketahui : P ( D )= =0,1 ; P ( M )= =0,1
100 100
P ( DU M )=P ( A ) + P ( B )=0,1+0,1=0,2; artinya dari 10 orang

yang terkena salah satu penyakit diare atau malaria ada 2 orang.
Penjumlahan peluang yang terjadi dari satu ruang sampel yang

sama jumlahnya 1; rumusnya sebagai berikut:
P( A1 U A 2 … An )=P( A 1)+ P ¿
74
Contoh soal:
100 penduduk desa A, terdiri dari 3 penderita hipertensi (H), 10
DM, 5 gagal ginjal kornik (GGK). Berapa peluang seseorang
yang tinggal di desa tersebut minimal salah satu dari ketegori
yang ada:
Jawab : P(H)
3 10 5
¿ =0,03 ; P ( DM )= =0,1; P ( GGK )= =0,05 ; kecuali
100 100 100
itu ada penduduk yang sehat (S), maka probabilatasnya
82
P ( S )= =0,82 ; dengan demikian probabilitas total P (T) dapat
100
dihitung sebesar:
P ( T ) =0,03+0,1+0,05+0,82=1
Artinya setiap orang yang ada di desa A tersebut pasti salah satu
diantara ke empat kategori yang ada yaitu kalau tidak kena
hipertensi, DM, GGK atau kondisi sehat.
Pengembangan teorema 1 masih penjumlahan peluang, untuk

gabungan 3 himpunan:
P(A U B U C)= P(A) + P(B) + P(C) - P(A∩B) - P(A∩C) -P(B∩C) + P(A∩B∩C)
Bila kejadian komplementer, maka penjumlahan dua peluang

tersebut 1; P(A) + P(A|)=1
Contoh:
Kejadian komplementer adalah selain kejadian tersebut, misal
satu mata uang dilempar muncul gambar, maka kejadian
komplementer lainnya adalah akan muncul angka, kasus DHF
disuatu daerah 10 % dari jumlah penduduk, maka
komplementernya yang non DHF 90 %, artinya yang non DHF
tersebut bisa terkena penyakit lainnya ataupun kelompok
masyarakat yang sehat. Perhitungannya 0,1 + 0,9= 1
Hukum perkalian
Perkalian dilakukan dalam probabilitas jika kejadian terjadi
secara bersama sama dari lebih dari satu himpunan, sehingga
kejadian tersebut terjadi pada himpunan A juga terjadi pada
himpunan B, demikian seterusnya
75
Kejadian independen atau mutually exclusive

Artinya kejadian pada satu kelompok tidak dipengaruhi oleh
kelompok lainnya, atau dengan kata lain dua kejadian bebas
terjadi secara bersama, maka berlaku rumus :
P (A∩B)= P(A) x P(B);
Contoh:
Rumah sakit (RS) A dan B melakukan operasi jantung dengan
kualifikasi yang sama. 100 pasien di RS A yang berhasil dan
sembuh 85, sedangkan di RS B ada 80 pasien yang dioperasi
berhasil dan sembuh 70; berapa peluang pasien sembuh dan
berhasil di kedua RS tersebut.
85 70
P(A) ¿ =0,85 ; P ( B )= =0,8235 ; maka peluangnya dapat
100 85
dihitung: P (A∩B)= P(A) x P(B)= 0,85 x 0,8235=0,69; artinya
dari seratus orang yang dioperasi di kedua RS kurang lebih 69
berhasil dan sembuh.
Kejadian bersyarat
Kejadian B terjadi setelah kejadian A diketahui kejadiannya;
rumus yang digunakan:
P (A∩B)= P(A) x P(B|A)
Contoh kasus:
Hasil Penyelidikan Epidemiologi kasus malaria di suatu desa
endemis diketahui ada 5 penderita malaria positif dengan jumlah
penduduk desa 100. Direkomendasikan dilakukan Mass Blood
Survei (MBS) yaitu pemeriksaan sediaan darah tebal dengan
target 80% jumlah penduduk untuk mencegah KLB lebih lanjut.
Jika satu bulan berikutnya dilakukan pemeriksaan darah pada
penduduk desa tersebut, berapakah peluang dua penduduk
pertama hasil pemeriksaan darah positif malaria.
Jawab:
Diketahui sample spacenya 100 dengan target 80%, berarti 80
penduduk, sehingga peluang pemeriksaan orang pertama positif
5
malaria =0,0625 ; sesudah pemeriksaan yang bersangkutan
80
76
tidak akan diperiksa lagi, sehingga penderita tinggal 4 dan

4
penduduk target 79, dengan demikian maka P (A|B)= =0,0506
79
; maka peluangnya 0,0625 x 0,0506= 0,0031625.
Kejadian bersyarat terjadi pada dua kelompok sampel

Kejadian di satu kelompok tertentu dan kejadian yang sama pada
kelompok yang lain, diantara kelompok tersebut terjadi secara
acak, bagaimana menghitung peluangnya.
Contoh:
Desa A kejadian Demam Berdarah (DB); desa B berjauhan juga
mengalami KLB DB. Maka populasinya bisa dibagi dua kategori
yaitu penderita DB dan non penderita DB. Adapun narasinya
sebagai berikut Desa A ada 100 penduduk dengan jumlah
penderita 10; desa B dengan jumlah penduduk 150, penderita DB
nya ada 20; jika diketahui ada mobilitas penduduk dari desa B ke
Desa A sebanyak 10 orang tanpa diketahui apakah penderita atau
bukan. Berapakah peluang penderita DB di Desa A.
Misalkan PA penderita dari desa A; NPA berarti non penderita
dari desa A; sedangkan PB penderita dari desa B; NPB berarti
Non penderita dari desa B. Maka bisa dirumuskan sebagai
berikut:
P¿
¿ P¿
Cara membacanya sebagai berikut:
Ada mobilitas penduduk dari desa B ke desa A sebanyak 10
orang tanpa diketahui apakah penderita atau non penderita,
dengan demikian di desa A boleh jadi ketambahan penderita atau
bukan penderita, yang ditanyakan berapakah peluang
mendapatkan penderita DB di desa A. Supaya bisa menghitung
hal tersebut dibuatlah tabel kemungkinan sebagai berikut:
77
Tabel 4.5. Cara Perhitungan Peluang Kejadian Dua Desa

Desa B Peluang Desa A Peluang Peluang irisan
Kena DB= Tambah 10+10=20 20/110=0,18 P ( PB ∩ PA ) =¿
20 DB P( PB∨PA ) 0,13x0,18=0.023
=0,13NonDB
150 =90 90/110=0,81 P ( PB ∩ NPA )=¿
P(PB) P(NPA)
0,13x0,81=0,105
PB=20 Catatan: ada tambahan 10 warga dari desa B ke desa A, yang boleh jadi 10
NPB=130 penderita, boleh jadi 10 bukan penderita
Non DB= Tambah 10+90=100 100/110=0,91 P ( NPB ∩ NPA )
130 NDB
=0,87x0,91=0,79
=0 , PA
150 10 10/110=0,091 P ( NPB ∩ PA )
87
P(NPB)
¿ 0,87 x 0,091=0,079
Setelah dihitung peluangnya, maka peluang kejadian penyakit di

Desa A;
P¿
= (0,13x0,81) +(0,87x0,091)=0,105 x 0,079=0,00829
Artinya setiap 10 ribu penduduk di Desa A peluang terkena DB

ada sekitar 83 orang.
Penjelasan tambahan dari perhitungan peluang:

P(PB) artinya peluang penderita DB di desa B
P(PB|PA) artinya peluang penderita DB di Desa A, setelah terjadi
perpindahan penderita dari desa B
P ( PB ∩ PA ) =¿P(PB) x P( PB∨PA )
Dengan cara yang sama, juga bisa digunakan untuk menjelaskan

yang non DB; tabel 4.5 yang diberi bayangan hitam adalah
peluang terkena demam berdarah.
Teorema Bayes
Teorema ini menjelaskan suatu kejadian yang
terjadi secara bersamaan dari berbagai perubahan pada
himpunan lain yang saling berinteraksi. Teorema ini di
jelaskan pertama kali oleh Thomas Bayes, setelah tiga
tahun kematiannya yaitu 1763. Sekarang teorema ini yang
diparbaiki oleh Laplace, menjadi dasar perhitungan
probabilitas pada hampir semua bidang ilmu termasuk
bidang kesehatan.
78
Teorema ini mendasarkan pada peluang kejadian

dan peluang kejadian bersyarat. Dengan demikian peluang
terjadinya dua peristiwa atau lebih secara berturut-turut,
dimana A terjadi lebih dulu, kemudian diikuti kejadian B
atau dengan kata lain peluang terjadinya B diketahui, jika
kejadian A lebih dahulu diketahui (kejadian
bersyarat/P(B|A), penurunan rumus peluang bersyarat
yang sudah dibahas pada sub pokok bahasan sebelumya,
ditemukan rumus peluang bersyarat adalah:
P( A ∩ B)
P ( B| A )= ; P ( A ∩ B )=P ( B ∩ A ) , hukum komutatif
P ( A)
Dengan demikian, maka

P( B ∩ A)
P ( A|B )= ; dimana P ( B∩ A )=P ( A|B ) . P ( B ) ( perkalian silang)
P (B )
Karena berlaku hukum komutatif untuk interaksi, maka
P(A∩ B ¿=P( B ∩ A), dengan demikian
P ( A|B ) . P ( B )=P ( B| A ) . P ( A ) , sehingga rumus peluang bersyarat,
bisa juga digunakan rumus:
P ( B| A ) . P( A)
P( A∨B)=
P(B)
Menggunakan teori komplementer (yang bukan), bisa dinotasikan
B(A∩ B ¿ U ( A ∩B Ꞌ ); dimana keduanya saling bebas (disjoint),
maka:
P(B)=P(A∩ B ¿+ P( A ∩ BꞋ )=P(A|B).P(B)+P(A|BꞋ ¿ . P(B Ꞌ )
Sehingga jika disubstitusikan pada persamaan probabilitas P(A|

B), menjadi:
P ( B| A ) . P( A)
P( A∨B)= ; secara umum
P( A∨B). P(B)+ P( A∨BꞋ ). P(B Ꞌ )
rumusan ini menjadi dasar teorema bayes; sehingga jika ada r
yang bersamaan, menjadi38:
79
P ( Br ∩ A )
P ( B r| A ) = k
P ( B r ) . P ( A|Br )
∑ P (B 1¿ ∩ A)= k
¿
i
∑ P ( Bi ) . P( A∨Bi ¿ )¿
i
Dimana r= 1, 2, 3, ... k
Jika kasus terjadi secara bersama-sama dari dua himpunan, bisa
dirumuskan sebagai berikut:
P ( B|A ) . P( A)
P( A∨B)= ;
P(B∨A). P(A )+ P (B∨ A Ꞌ) . P( A Ꞌ)
Contoh soal:
Daerah endemis malaria yang sudah diyatakan eliminasi,
mengupayakan sedemikian rupa supaya tidak menjadi endemis
malaria kembali. Salah satu upaya yang dilakukan adalah
pemeriksaan darah setempat terhadap pendatang (migran) yang
berasal dari daerah endemis lainnya. Setiap ada migran dilakukan
pemeriksaan darah dengan menggunakan Rapid Diagnostic test
(RDT). Jika diketahui hasil pemeriksaan RDT 5% positif malaria
dari pendatang yang datang. Hasil pemeriksaan RDT yang positif
tersebut di konfirmasi ulang dengan metode mikroskopis (gold
standard) ditemukan 95% yang positif; sedangkan pemeriksaan
RDT yang negatif juga dikonfirmasi dengan mikroskopis, 10%
positif malaria.
Pertanyaannya:
Jika sembarang migran datang di daerah endemis ditest dan
hasilnya positif, berapakah peluangnya orang tersebut benar-
benar menderita malaria?
Jawab:
Diketahui : A= hasil pemeriksaan RDT positif; AꞋ= hasil
pemeriksaan RDT negatif; B= hasil pemeriksaan mikroskopis
positif; BꞋ=hasil pemeriksaan mikroskopis negatif. P(B|A)=
peluang pemeriksaan konfirmasi mikroskopis positif dari hasil
pemeriksaan RDT yang positif; P(B|AꞋ)= peluang pemeriksaan
konfirmasi mikroskopis positif dari hasil pemeriksaan RDT yang
negatif; P(BꞋ|A)= peluang pemeriksaan konfirmasi mikroskopis
80
negatif dari hasil pemeriksaan RDT yang positif; P(BꞋ|AꞋ)= hasil

pemeriksaan mikroskopis negatif dari hasil pemeriksaan RDT
negatif. P(A|B) peluang hasil pemeriksaan RDT positif dan
pemeriksaan mikroskopis juga positif.
Dihitung probabilitasnya:
P(A)=5%; P(AꞋ)=95%; P(B|A)=95%; P(B|AꞋ)=10%; P(BꞋ|
A)=0,05; P(BꞋ|AꞋ)=0,9; hasil perhitungan peluang ini, bisa dibagi
dalam 4 kuadran, sebagai berikut:
A=5% AꞋ=95%
B True positif False positif

P(B∩A)=P(A)xP(B|A) P(B∩AꞋ)=P(AꞋ)xP(B|AꞋ)
=0,05x0,95 = 0,95 x 0,1
= 0,0475 = 0,095
BꞋ False negatif True negatif
P(BꞋ∩A)=P(A)xP(BꞋ|A) P(BꞋ∩AꞋ)=P(AꞋ) P(BꞋ|AꞋ)
=0,05 x 0,05 = 0,95 x 0,9
=0,025 =0,855
Hasil perhitungan, dimasukkan ke dalam rumus
P ( B|A ) . P ( A ) 0,0475
P ( A|B )= = =0,33
P(B∨ A) . P( A)+ P( B∨A Ꞌ ) . P( A Ꞌ ) 0,0475+ 0,095
Artinya jika ada migran datang ke daerah endemis peluangnya

0,33 x 100%=33% artinya jika ada 100 pendatang peluang jika
diperiksa darahnya positif malaria dengan dua alat pemeriksaan
(RDT dan mikroskopis) sebanyak 33 orang. Dengan logika yang
sama berapa orang pendatang untuk tidak positif hasil
pemeriksaan darah:
P ( B Ꞌ|A Ꞌ ) . P ( A Ꞌ ) 0,855
P ( A Ꞌ |B Ꞌ )= = =0,97
P( BꞋ ∨A Ꞌ ). P ( A Ꞌ )+ P(B Ꞌ ∨ A). P( A) 0,855+0,025
Artinya peluang seseorang untuk negatif hasil pemeriksaan kedua
metode pemeriksaan malaria 0,97 dengan kata lain jika ada 100
orang migran, maka 97 orang hasil pemeriksaannya negatif.
Contoh kasus yang lain10:

81
Hasil analisis data yang ada terhadap ibu hamil 6% menderita

bakteriuria (bakteri dalam urin), 30% diantaranya mengalami
Pyelonephritis (infeksi pada ginjal); sedangkan yang tidak
menderita bakteri uria 1% mengalami Pyelonephritis. Berapakah
peluang seorang wanita hamil dengan Pyelonephritis mengalami
bakteriuria.
Narasi soal di atas dapat diuraikan sebagai berikut:
Jika A wanita hamil yang mengalami bakteriuria=0,06; AꞋ
(komplemen A) wanita hamil yang tidak mengalami
bakteriauria= (1-0,06=0,94). B merupakan wanita hamil
mengalami Pyelonephritis; dengan demikian notasi peluang
bersyaratnya dapat ditulis:
B/A wanita hamil dengan bakteriuria yang mengalami
Pyelonephritis =0,30
B/ AꞋ, wanita hamil tidak mengalami bakteriuria tapi mengalami
Pyelonephritis=0,01; maka bisa dihitung:
1. Peluang wanita hamil dengan bakteriuria yang mengalami
Pyelonephritis;
P(A∩B)= P(B|A) . P(A)=0,30 x 0,06=0,0180
2. Peluang wanita hamil yang tidak mengalami bakteriuria,
tetapi mengalami Pyelonephritis;
P(AꞋ∩B)= P(B|AꞋ) . P(AꞋ)=0,01 x 0,94=0,0094
3. Peluang wanita hamil mengalami Pyelonephritis (P(B));
kasus ini pada wanita hamil ada dua cara yaitu dengan
atau tanpa bakteri uria; dengan demikian yang digunakan
adalah hukum tambahan (union)
P(B)= P(A∩B) + P(AꞋ∩B)= 0,0180+0,0094=0,0274
4. Bila diketahui wanita hamil yang mengalami
Pyelonephritis,berapakah peluangnya dia mengalami
bakteriuria ( notasinya P(A|B)), bisa dihitung:
P ( A ∩B) 0,0180
P(A|B)= = =0,65
P(B) 0,0274
Prinsip dasar statistik yang didasarkan pada probabilitas ini

membawa konsekuensi ketidakpastian dalam penarikan
kesimpulan, tetapi kesimpulan itulah kepastian berbasis data yang
ada, sehingga “satu-satunya kepastian di dalam statistik adalah
82
ketidak pastian itu sendiri” sebagai hukum statistik. (Aris

Santjaka, 2021)
80
BAB V. STATISTIK DESKRIPTIF
Pendahuluan.
Statistik terapan paling dasar adalah mempelajari fakta-
fakta berupa data hasil pengumpulan, kemudian disajikan dalam
berbagai bentuk penyajian baik tabel, gambar, grafik maupun
menggunakan angka mutlak maupun dalam bentuk persentase,
sehingga pengguna bisa dengan mudah untuk mengetahui
kecenderungan, pemusatan dan penyebaran data.
Ruang lingkup statistik deskriptif hanya menggambarkan
fakta-fakta hasil pengukuran apa adanya, tidak dilakukan
penyimpulan lebih luas pada populasi, karena langkah ini sudah
membuat generalisasi, namun dalam beberapa kasus hal ini tidak
bisa dihindari (karena menyangkut persepsi pengguna) juga
terjadi di populasi. Dengan demikian kesimpulan diambil dengan
kriteria yang jelas yaitu batasan populasi dan minimal sample
size pada besar sampel yang diambil, jika kedua persyaratan ini
dipenuhi, maka generalisasi bisa dilakukan.
Contoh :
Hasil survei lembaga survei untuk menentukan elektabilitas
(keterpilihan) kandidat presiden misal diketahui calon presiden A
45% dan Calon Presiden B 52 % sisanya belum menentukan
pilihan. Maka persepsi pembaca boleh jadi hal yang sama juga
terjadi di Populasi (perhitungan manusal nasional).
Inferensi statistik deskriptif terbatas dari data yang diambil,

kecuali teknik sampling digunakan pada proses pengumpulan
data tersebut, maka estimasi maupun penyimpulan pada uji
hipotesis bisa dilakukan. Pembacaan data hasil pengukuran
dilakukan pada tabel, grafik, ukuran pemusatan dan dispersinya.
Adapun contoh pembacaan tabel dan grafik dapat dibaca pada
Bab sebelumnya pada penyajian data.
Dua pengukuran sebagai indikator statistik deskriptif adalah
tendency central (TC) dan dispersi. Adapun beberapa hal yang
perlu dijelaskan sebagai berikut:
81
Notasi penjumlahan (∑)

Notasi tersebut dibaca sigma, jika dinotasikan lebih luas
n
∑ X i; cara membacanya jumlah data mulai dari 1 sampai ke n;

i=1
ada beberapa kaidah dengan notasi penjumlahan59:
1. Penjumlahan suatu bilangan tetap sebanyak n kali adalah sama
dengan n kali bilangan itu sendiri
4
∑ 3=3+3+3+ 3=4.3=12
i=1
jika digunakan notasi
n
∑ k=k +k + k +… k =n . k
i=1
2. Penjumlahan dari perkalian suatu bilangan tetap dengan suatu

nilai yang berubah-ubah.
3.4+3.5+3.8 =3.(4+5+8); jika dinotasikan
n
∑ k . x i=k . x 1+ k x2 +… k x n=k .(¿ x1 + x 2 +… x n) ¿

i=1
❑ ❑
k= konstanta; jika disederhanakan ∑ k . x n=k . ∑ x n
❑ ❑
3. Penjumlahan dari jumlah atau selisih beberapa nilai (atau

perkalian bilangan tetap dengan nilai lainnya) adalah sama
dengan jumlah atau selisih dari penjumlahan nilai-nilai itu:
Contoh:
n n n n
∑ ( a . x i +b . y i−c . z i ) =∑ a . xi +∑ b . y i−∑ c . z i;
i=1 i=1 i i
disederhanakan menjadi:
❑ ❑ ❑
a ∑ X+ b . ∑ Y −c ∑ Z
❑ ❑ ❑
Ukuran pemusatan (Tendency central)

82
Gejala alam menunjukkan kecenderungan mengarah pada

hal-hal yang dipusat, sebagai contoh galaksi mengitari poros
tengahnya, pada Bimasakti mengitari Matahari sebagai porosnya,
aspek sosial juga menunjukkan gejala yang sama seperti pusat
kekuasaan selalu dikeliligi oleh orang-orang yang menginginkan
berkuasa, itulah sebabnya pemilihan kepala daerah, presiden
selalu ramai, karena kalau jadi berharap mendapatkan kelimpahan
dari kekuasaan; contoh lain pusat perbelanjaan (mall, pasar)
cenderung ramai. Hanya ada satu yang sepi yaitu pusat kematian
(kuburan) sepi.
Penarikan kesimpulan dari sekumpulan data dibutuhkan
untuk menjelaskan secara sederhana berapa nilai dari sekumpulan
data tersebut itulah yang disebut ukuran pemusatan yaitu suatu
indikator yang digunakan untuk menjelaskan nilai agregasi dari
sekumpulan data. Contoh yang sederhana bisa digunakan secara
mudah, apapun namanya, kita mempunyai data sebagai berikut:
4,5,6,7,8; bagaimana kesimpulan yang bisa diambil dari 5 data
berikut, maka tidak mungkin disebutkan satu per satu data
tersebut, maka dibutuhkan satu indikator untuk menggambarkan
lima data tersebut.
Ada tiga indikator yang bisa digunakan untuk
menggambarkan agregasi data, ketiganya adalah mean, median
dan modus. Adapun penerapannya bisa digunakan untuk data
tunggal dan data kelompok.
Data Tunggal
Data ini bersifat data mentah hasil pengukuran langsung, belum
diubah bentuk tabel dengan kategori tertentu. Beberapa
ukurannya:
Rata-rata (mean/x́ )
Konsep rata-rata hakekatnya membagi data ditengah, nilai rata-
rata mencerminkan akumulasi semua nilai dibandingkan dengan
banyaknya data penyusunnya. Ada beberapa jenis penilaian rata-
rata, yaitu :
1. Rata-rata hitung (Arithmatic Mean)
83
Rata-rata ini dihitung dengan menjumlahkan semua data

dibagi dengan banyaknya data, adapun rumusnya2,4,10:
❑
∑ xi ❑
1 ❑ ; dimana x́= rata-rata; ∑ x i= jumlah
x́= ❑
atau ∑ x i
n n ❑ ❑
data dan n= banyaknya data

Jumlah data, jika kita punya data x1, x2, x3; maka jumlah
datanya= x1+x2+x3, aplikasi dengan menggunakan data
4,5,6,7,8; maka rata-rata bisa dihitung:
❑
∑ xi
4+5+6+ 7+8 ; jika digunakan rumus yang
x́= ❑
= =6
n 5
lainnya:
1 ❑
∑ x = 1 x 30=6 ; Rata-rata akan membagi data ditengah,
n ❑ i 5
maka sebelum nilai rata-rata pasti nilainya lebih kecil (jika
data sudah diurutkan) dan sesudah rata-rata nilainya lebih
tinggi dari pada rata-rata. Logika ini menjadi dasar
perhitungan deviasi yang akan dijelaskan pada bab dispersi.
Rata-rata aritmatika ini digunakan untuk data kontinyu,
indika, Xtor ini paling baik jika data berdistribusi normal
dan tidak ada data ekstrim apalagi pencilan (far outlier)
2. Rata-rata geometrik
Rata-rata ini digunakan untuk memperkirakan suatu nilai
tertentu dalam satuan waktu tertentu, berdasarkan data yang
sudah ada.
Rata-rata geometrik G dari sekumpulan angka-angka X1,
X2...Xn, merupakan akar pangkat n dari perkalian angka-
angka tersebut, dengan notasi:
G= √n X 1. X 2 ... X n
Misal ada data 2, 4, 8; maka rata-rata geometriknya dapat
dihitung sebagai berikut:
n=3; maka persamaannya menjadi G= √3 2.4 . 8=4
84
Hasil 4 bisa dicari dengan kalkulator scientific dengan cara

tekan angka 3 shift √x Hex¿ 64, kemudian tekan =, maka
akan muncul angka 4.
Atau bisa dihitung dengan menggunakan log; log 100=2

diperoleh dari 102.
G= G= √n X 1. X 2 ... X n = (X1. X2. ...Xn )1/n
1
Log G= ( ) (log X1 +logX2+...log Xn )
n
n
1 1
Log G= () ∑
n i=1 ()
log X i atau
n
log (X1. X2. ...Xn)
Dengan data yang sama yaitu 2, 4, 8, maka bisa dihitung

rata-rata geometriknya
1 1 1
Log G= () 3
log (2.4.8)=() 3 ()
log 64= . 1,806=0,602;
3
maka berapa nilai G sebenarnya maka nilai tersebut
menjadi pangkat dari 10, yaitu G= 100,602=3,999= 4 hal ini
disebabkan pembulatan 3 digit dibelakang koma, tetapi jika
hasilnya ditulis lengkap hasilnya = 4
Rata-rata geometrik juga bisa digunakan untuk

memperkirakan pertumbuhan konstan dalam periode waktu
tertentu. Misal diketahui jumlah penduduk di Indonesia
tahun 2010 = 242 juta dan tahun 2020= 270 juta; berapa
pertumbuhan penduduk setiap tahun selama sepuluh tahun
tersebut. Maka bisa digunakan pendekatan dengan rumus:
Pt= Po. (1+r)t; dimana Pt= keadaan penduduk pada tahun
terakhir; Po=keadaan penduduk pada tahun awal perkiraan;
r=pertumbuhan tahunan; t= waktu perkiraan yang
diinginkan; maka bisa dihitung angka pertumbuhan
penduduk sebagai berikut:
Diketahui:
Pt=270 juta; Po=242 juta; t=10 tahun; maka persamaannya:
270= 242. (1+r)10
Log 270= log 242. +10 log (1+r)
85
2,43136=2,38381 + 10. Log (1+r)

2, 43136-2,38381= 10 log (1+r)
0,04755= 10 log (1+r)
0,04755
= log (1+r)
10
0,004755= log (1+r)
100,004755= 1+r
1,011= 1 + r
r=1,011-1= 0,11 x 100%= 1,1%
jadi pertumbuhan penduduk Indonesia selama 10 tahun

terakhir rata-rata 1,1% pertahun.
Kegunaan lainnya bisa digunakan untuk menghitung bunga

berganda dalam periode waktu yang ditentukan, tingkat
pertumbuhan pendapatan nasional dan lain-lain.
Contoh:
Si A menabung 100 juta selama lima tahun mendapatkan
110 juta, berapa persenkah rata-rata bunga tiap tahunnya:
Persentase bunga selama lima tahun bisa dicari dengan cara
10 juta/100 juta x100%=10% selama lima tahun, sehingga
10 %
setiap tahun bunganya =2 % per tahun.
5
Dengan menggunakan rumus pertumbuhan:
n Pn
r= (√ ) ( √ )
Po
−1=
5 110
100
−1=1,019−1=0,019.100 %=1,9%
dengan menggunakan kalkulator 5 shift ^(110/100)= 1,019
3. Rata-rata hitung pembobotan (Weighted Arithmatic Mean)

Rata-rata ini digunakan jika diperlukan penilaian sesuatu
yang mempunyai bobot yang berbeda pada setiap poin
penilaian. Misal dalam kaidah akademis ada penilian
mencakup berbagai aspek misal:
Tabel 5.1. Pembobotan Nilai
Aspek Nilai Bobot Jumlah
Penilaian (1) (2) nilai
(1)x(2)
86
Pengetahuan 90 30 2700
Sikap 70 30 2100
Praktek 60 40 2400
Jumlah 100 7200
Adapun perhitungan rata-rata sebagai berikut:

❑
∑ w i . xi .
x́= ❑
❑ ; dimana wi= bobot ke i; tabel 5.1. dapat
∑ wi
❑
dijadikan contoh perhitungan sebagai berikut:
❑
∑ w i . xi
( 30.90 ) + ( 30.70 ) + ( 60.40 ) 7200
x́= ❑
= = =72
❑
30+30+40 100
∑ wi
❑
Nilai Tengah (median/Md/~ x)

Median merupakan ukuran pemusatan yang menunjukkan
nilai paling tengah setelah data diurutkan, jika banyaknya data
ganjil ambil data paling tengah, tetapi jika data genap ambil dua
data paling tengah dijumlahkan kemudian dibagi dua. Kata
kuncinya data diurutkan baru diambil paling bawah.
Contoh:
Data ganjil
4,5,6,7,8; maka mediannya 6; sebelum nilai 6 ada dua data,
demikian juga sesudahnya.
Data genap
4,5,6,7,8,9; maka sebelumnya menentukan median, dicari dulu
dua data paling tengah (setelah data diurutkan), maka mediannya:
6+7 13
Md= = =6,5; sebelum dan sesudah dua data yang paling
2 2
ditengah ada dua data.
Data median lebih bagus digunakan untuk data skala ordinal,
ataupun data kontinyu yang berdistribusi normal atau ada yang
ektrim.
87
Nilai paling banyak (modus/Mo)

Modus merupakan nilai yang paling banyak muncul dari
satu agregasi data, seringkali modus tidak tunggal (lebih dari
satu), sehingga modus bukan merupakan ideal untuk
menggambarkan agregasi data. Tetapi modus merupakan cara
yang lebih mudah untuk menarik kesimpulan dari data kategori.
Data kategori seringkali digunakan dalam menggambarkan
prevalensi penyakit.
Contoh:
4,5,6,7,8,9; berdasarkan data tersebut tidak ada nilai modus;
tetapi jika data tersebut ditambahkan dengan data lain sebagai
berikut: 4,5,5,6,7,7,8,9, berdasarkan data tersebut modusnya ada
dua yaitu 5 dan 7 karena frekuensinya sama yaitu 2; sedangkan
untuk data kategorialnya:
Tabel 5.2. Prevalensi Penyakit Puskesmas “A”
No. Jenis Penyakit Frekuensi %

1. ISPA 350 35
2. Diare 300 30
3. Thypoid 150 15
4. Hipertensi 50 5
5. Lain-lain 150 15
Jumlah 1000 100
Penyakit prevalensi paling tinggi di Puskesmas “A” penyakit
ISPA sebesar 35%.
Ukuran penyebaran (Dispersi)

Ukuran penyebaran merupakan indikator yang digunakan
untuk menentukan heterogenitas suatu data. Ukuran ini penting
untuk mengetahui karakteristik data, apakah data merupakan
homogen atau heterogen. Jika data homogen maka kesimpulan
yang diambil akan mendekati nilai populasi dalam suatu estimasi,
tetapi jika heterogen, kesimpulan yang diambil
kecenderungannya bias.
Pemahaman yang mudah untuk ukuran penyebaran dapat
diilustrasikan sebagai berikut: jika kita ingin mengukur sebaran
88
mahasiswa maka bisa dihitung dari rumah mahasiswa ke kampus

berapa jaraknya, selisih itu jika digabung dalam sekumpulan data
itulah yang disebut dengan sebaran. Dengan demikian maka
sebaran minimal ada dua data yang penting yaitu data hasil
pengukuran dan titik sentralnya. Titik sentralnya adalah kampus,
data hasil pengukuran adalah rumah mahasiswa. adalah nilai
tendency central yang dimaksud adalah rata-rata. Ada beberapa
ukuran dispersi yang bisa dilakukan yaitu2,4,10,38:
1. Deviasi (D)
Selisih antara nilai hasil pengukuran dengan nilai patokan
(rata-rata) dari sekumpulan data, jika dinotasikan:
D=( xi −x́ ) ; dimana x i data hasil pengukuran ke i
2. Mean Deviasi (MD)

Mean deviasi sama dengan konsep rata-rata yaitu jumlah data
dibagi banyaknya data, dengan demikian Mean deviasi jumlah
deviasi dibagi banyaknya deviasi. Adapun rumusnya sebagai
berikut:
❑ ❑
∑| Di| ∑ |xi −x́|; sebagai contoh digunakan data
MD= ❑
= ❑
n n
4,5,6,7,8 berdasarkan data tersebut dihitung nilai MD sebagai
berikut:
xi 4 5 6 7 8 ❑
∑ xi
30
x́= ❑
= =6
n 5
D -2 -1 0 1 2 0
MD= =0
5
Nilai mean deviasi selalu sama dengan nol jika tidak diberi
tanda mutlak||, hal ini bisa difahami karena jika nilai rata-rata
sebagai patokan maka data akan dibagi ditengah sehingga nilai
sebelum rata-rata selalu bertanda – (negatif) dan sesudah rata-
rata selalu bertanda + (positif), sehingga (-) + (+)=0; untuk itu
maka MD diberi tanda mutlak artinya negative dianggap
positif, sehingga perhitungan menjadi :
89
xi 4 5 6 7 8
D 2 1 0 1 2
Nilai D dianggap mutlak (negatif dianggap positif), sehingga
❑
∑ | xi −x́| 6
MD= ❑
= =1,2
n 5
3. Varians (σ 2)
Varians merupakan konsep untuk menghilangkan tanda negatif
yang dianggap mutlak, cara menghilangkan tanda tersebut
dengan cara mengkuadratkan nilai deviasi, sehingga rumusnya
menjadi:
n n
2
∑ Din ∑ [ x i−x́ ] ; sekarang berdasarkan rumus tersebut,
σ 2= i=1 = i=1
n n
diuraikan secara aljabar, sebagai berikut:
n
2
∑ [ x i− x́ ] , sekarang pembilangnya diuraikan secara
σ 2= i=1
n
aljabar, sedangkan pembaginya “n” diabaikan dulu, maka:
n n
∑ ( xi −x́ ) 2=∑ ( x 2i −2 x i . x́ .+ x́ 2 ), sekarang dikalikan masing-

i=1 i=1
masing dengan jumlah, sehingga menjadi:
n n n
∑ x 2i −¿ ∑ 2. x i . x́ +∑ x́ 2 ¿;
i=1 i i=1
n
guna memudahkan penjelasan ∑ x́ 2, dibuat ilustrasi sebagai
i=1
berikut:
3
3+3+3=∑ 3=3.3; jika mempunyai
i=1
90
3
k + k +k =∑ k =3. k ; sehingga jika punya notasi
i=1
❑
n n
2 2 ∑ xi
∑ k=n. k ; dan jika ∑ x́ =n. x́ ; sedangkan x́= ❑
i=1
n i=1
Maka rumus sebelumnya bisa diuraikan sebagai berikut:

❑ ❑ ❑
n n n n n ∑ xi ∑ xi ∑ xi
∑ x 2i −¿ ∑ 2. x i . x́ +∑ x́ 2=∑ x 2i −∑ 2. x i . ❑
n
+n. ❑
n
❑
.
n
¿
i=1 i i=1 i=1 i
; maka menjadi:
n n n n
n ∑ xi ∑ xi ∑ xi ∑ x i
2 i=1 i=1 i=1 i=1
∑ x −2. i
n
.
n
+n .
n
.
n
i=1
jika disederhanakan menjadi sebagai berikut:
n 2 n 2 n 2
∑ x −2. 2
i
(∑ ) (∑ )
i=1
xi
+
i=1
xi
=∑ x −
n
2
i
(∑ )
i=1
xi
; maka pembagi
i=1 n n i=1 n
“n” dikembalikan lagi, sehingga rumusnya menjadi:
n 2
∑ x 2i −
( ) ∑ xi
i=1
; rumus ini digunakan untuk menentukan
n
σ 2= i=1
n
varian populasi; sekarang coba dihitung contoh sederhana
berikut:
Data (apapun namanya) 4, 5, 6, 7, 8, berapa variannya; maka:
Diketahui:
❑
x 2i 16 25 36 49 64
∑
❑
¿190
91
xi 4 5 6 7 8 ❑
∑
❑
¿30
Sehingga varians:
n 2
∑ x 2i −
( )∑ xi
i=1
=
190−
( 30 )2
5 190−180 10 ;
n = = =2
2
σ = i=1
5 5 5
n
perhitungan ini untuk penelitian pada populasi, sedangkan jika
pada sampel rumusnya sama, hanya pembaginya n-1, sehingga
menjadi:
n 2
∑x − 2
i
(∑ )
i=1
xi
n 10
σ = i=1
2
n = =2,5
n−1 4
perhitungan dengan cara lainnya, diambil dari rumus awal,

yaitu
❑
∑ D i2
; maka terlebih dahulu dicarai nilai deviasinya (D),
σ 2= ❑
n
sebagai berikut:
xi 4 5 6 7 8
D 2 1 0 1 2
D2 4 1 0 1 4
, maka nilai D2 jika dijumlahkan =10; dengan demikian:
❑
∑ Di2
10 ; perhatikan hasilnya sama...; lalu sebagai
σ 2= ❑
=2 =
n 5
pengguna pilih yang mana? Jika dataya sedikit bisa digunakan
rumus asal dari deviasi, sedangkan jika datanya banyak
gunakan rumus turunan varian dengan bantuan kalkulator
92
scientific bisa dihitung dengan mudah, lihat lampiran

perhitungan dengan menggunakan kalkulator.
4. Standard error (Se)

Galat baku (Se) adalah indeks yang menggambarkan sebaran
data dari nilai rata-ratanya; jika diperhatikan penurunan rumus
varian yaitu diperoleh dari data deviasi yang dikuadratkan;
kemudian data tersebut distandarisasi dengan cara membagi
dengan banyaknya data (n), dengan demikian rumusnya
menjadi:
σ2
Se= ; karena cara memperoleh varian dengan cara
n
mengkuadratkan deviasi, maka supaya kembali ke nilai
sebenarnya harus diakar, dengan demikian rumusnya menjadi:
σ2
√
Se=❑ ; rumus ini digunakan jika penelitian dilakukan pada
n
populasi, sedangkan untuk penelitian sampel digunakan
rumus:
2
❑ σ
Sen=
√
dihitung:
n−1
; dengan demikian, contoh soal pada varian bisa
σ2 2
√ √
Se=❑ =❑ =0,63; untuk populasi; jika untuk sampel maka
hasilnya
n 5
σ2 ❑ 2
Sen=❑
√ √ n−1
=
4
=0,707 ; pada perhitungan kalkulator
disediakan kedua nilai tersebut; notasi pada kalkulator (
σ n=untuk populasi ; σ n−1 untuk sampel ); sedangkan untuk soft
ware perhitungan statistik seperti SPSS, STATA Standard
error yang dimaksud adalah Se untuk sampel (ingat konsep
statistik selalu berbasis sampel)
5. Standard Deviasi (SD)

SD merupakan indeks yang menggambarkan sebaran data
terhadap rata-ratanya. Nilai ini selalu berhubungan dengan
sampel dan nilainya diperoleh dengan cara:
93
n 2
SD=❑√ σ 2n atau
√
❑
n
∑x −
i=1
n−1
2
i
(∑ )
i=1
n
xi
; jika dari data varian sampel
yang dihitung sebelumnya diketahui σ 2n=2,5; maka

SD=❑√ 2,5=1,58; perhitungan ini tersedia dikalkulator, dan
untuk soft ware statistik jika diketahui SD yang dimaksud
adalah nilai SD untuk sampel.
Data Kelompok
Perhitungan data kelompok artinya data yang sudah disusun
dalam tabel distribusi frekuensi atau data sudah dikelompokkan
dalam kategori tertentu. Pada perhitungan ini juga dibagi dua
yaitu tendency central dan dispersi, adapun penjelasannya sebagai
berikut:
Ukuran Pemusatan (Tendency Central)
Rata-rata
Data kelompok tidak diketahui berapa persisnya nilai hasil
pengukuran setiap individu (xi), sehingga nilai xi didekati dengan
nilai tengah, kenapa yang dipakai nilai tengah, hal ini disebabkan
karena jika batas atas kelas yang dipakai, hasilnya bisa over
estimate dan jika batas bawah kelas maka hasilnya bisa under
estimate, maka digunakanlah nilai tengah untuk menghindari
kedua perkiraan yang terlalu tinggi dan terlalu rendah. Hal ini
bisa juga diambil pelajaran bahwa orang yang belajar statistik
selalu berada ditengah-tengah. Adapun rumusnya sebagai berikut:
n
¿
∑ xi . f i xi fi
X = i=1
n ; titik tengah kelas; frekuensi masing-masing
kelas; sebagai contoh: Hasil pengukuran asam urat pada 100
orang laki-laki di atas 40 tahun diperoleh data sebagai berikut:
Tabel 5.3. Kadar Asam Urat pada Laki-laki di RS “A”

94
No Asam Urat Frekuensi

. (mg/100 ml) (fi)
1. 3-5 50
2. 6-8 35
3. 9-11 10
4. 12-14 5
Jumlah 100
Hitunglah rata-rata asam urat laki-laki di RS “A” tersebut.

Guna menghitung perhatikan rumus perhitungannya:
n
¿
∑ f i . xi
X = i=1
n
, maka dibutuhkan perpanjangan tabel,
ditambah dua kolom yaitu titik tengah dan hasil perkalian
antara titik tengah dengan frekuensi masing0masing kelas,
sehingga tabelnya sebagai berikut:

No Asam Urat Titik tengah Frekuensi xi . fi
. (mg/100 ml) kelas (xi) (fi)
1. 3-5 4 50 200
2. 6-8 7 35 245
3. 9-11 10 10 100
4. 12-14 13 5 65
Jumlah 100 610

95
Setelah semua nilai dalam rumus rata-rata diketahui, maka

rata-rata bisa dihitung:
n
∑ f i xi610 ; nilai rata-rata asam urat ini masih

x́= i=1 ==6,10
n 100
dalam rentang normal (2-8,5)61
Median (Md/~ x)
Median adalah nilai tengah setelah data di urutkan
n
atau dengan kata lain data pada urutan paling tengah ( ).
2
Pada data kelompok sebelum dicari nilai median,
ditentukan dulu kelas mediannya, dengan cara
n
menghitung ( ). Adapun rumusnya sebagai berikut:
2
n
Md=B bkm+ ( )−f
2 cb ; dimana Bbkm= batas bawah kelas median
fm
.i
f cb frekuensi komulatif
(nilai terendah -0,5)kelas median;
sebelum kelas median yaitu penjumlahan frekuensi kelas yang
bersangkutan dengan kelas sebelumnya; fm frekuensi kelas
median.
Contoh : dari tabel 5.3. asam urat.

. (mg/100 ml) (fi)
1. 3-5 50
2. 6-8 35
3. 9-11 10
4. 12-14 5
Jumlah 100
96
Berapa nilai mediannya?

Tabel 5.5. harus ditambahkan beberapa kolom untuk melengkapi
notasi pada rumus yang sudah ada, sehingga tabelnya menjadi:
No Asam Urat Frekuensi Frek.
. (mg/100 ml) (fi) komulatif
(fc)
1. 3-5 50 50
2. 6-8 35 85
3. 9-11 10 95
4. 12-14 5 100
Jumlah 100
Langkah-langkah penyelesaian:
1. Cara mencari frekuensi kumulatif (fc), kelas pertama ada 50,
sebelumnya tidak ada kelas berarti frekuensinya 0, sehingga fc
kelas pertama 50, kelas kedua sebelumnya 50 dan kelas kedua
35 berarti fc=85; kelas ke tiga frekuensinya 10 sebelumnya
ada kelas 1 dan kelas kedua yang jumlah frekuensinya 85;
demikian seterusnya.
n 100
2. Tentukan kelas median, dengan cara = =50; berarti
2 2
kelas median berada pada frekuensi ke 50, perhatikan kelas
pertama frekuensinya 50, berarti kelas median berada pada
kelas pertama
3. Kelas median sudah ditemukan berarti bisa dihitung notasi
lainnya, maka nilai mediannya sebagai berikut:
Bbkm=3−0,5=2,5 ; f cb =0 , karena sebelum kelas1 tidak ada ;
fm=frekuensi kelas median=50 ; i=interval kelas 3
97
n 100
Md=B bkm+
2
( ) ( )
−f cb
fm
.i=2,5+
2
50
−0
.3=2,5+
50
50 ( )
.3=5,5
Nilai median 5,5 tersebut masih dalam batas normal.
Modus (Mo)
Nilai yang paling sering muncul, dalam tataran
praktis kadang nilai modus lebih dari satu, jika hal ini
terjadi maka semuanya harus dihitung nilai modusnya.
Adapun rumusnya sebagai berikut:
a
Mo=Bbkmo + ( )
a+ b
. i; Bbkmo= batas bawah kelas modus, i interval
kelas; a=f mo−f b; b=f mo−f a; fb= frek. Sebelum kelas modus; fa=
frek. Sesudah kelas modus.
Contoh digunakan kasus asam urat tabel 5.3.; maka bisa
ditentukan kelas modus berada pada kelas ke 1; sehingga bisa
diketahui:
Bbkmo=3−0,5=2,5 ; a=50−0=50; b=50−35=15 ; i=3 , maka
modus:
a 50
Mo=Bbkmo + ( )
a+ b
. i=2,5+( 50+35) .3=4,26
Bagaimana jika kelas modus lebih dari satu, maka harus dihitung
semuanya, dengan cara yang sama.
Ukuran Sebaran (Dispersi)

Ukuran ini pada data kelompok, hakekatnya sama dengan
data tunggal, namun ukuran yang penting digunakan adalah
varians (σ 2n) dan simpangan deviasi (SD), varians yang digunakan
varians sampel, karena penelitian berbasis sampel, adapun
penjelasannya sebagai berikut:
Varians (σ 2n)
Varians pada data kelompok hakekatnya sama dengan data
tunggal, tetapi diambil dari asalnya yaitu deviasi yang
98
dikuadratkan, kemudian dikalikan dengan frekuensi masing-

masing kelas. Adapun rumusnya:
2
n
f i . ( xi −x́ ) 2
σ n=∑ ; xi titik tengah kelas; sedangkan fi frekuensi
i=1 n−1
masing-masing kelas, sebagai contoh soal sebagai berikut:
Tabel 5.7. Distribusi BB Balita di Posyandu Mawar 2019

H NO BB fi xi fi.xi x i−x́ ( x i−x́ )
2
f i ( xi − x́) as
. BALITA
il
1. 3 - 6 5 4,5 22,5 -6,2 38,44 192,2
2. 7 – 10 5 8,5 42,5 -2,2 4,84 24,2
3. 11 – 14 5 12,5 62,5 1,8 3,24 16,2
4. 15 – 18 4 16,5 66 5,8 33,64 134,56
5. 19 - 21 1 20,5 20,5 9,8 96,04 96,04
JUMLAH 20 214 463,2
perhitungan tersebut, dimasukkan ke dalam rumus varians sampel menjadi:

2
f i . ( xi −x́ ) 2 463,2
n
σ =∑ n = =24,37; perhitungan ini menjadi dasar
i=1 n−1 20−1
perhitungan Simpangan Deviasi.
Simpangan Deviasi (SD)

Varian sampel merupakan kuadrat dari deviasi,
sehingga untuk mengembalikan pada nilai sebenarnya
harus di akar, konsep ini disebut dengan SD, sehingga
rumusnya menjadi:
f i . ( x i−x́ )2 ❑ 2
n
SD=
√
∑ n−1 = √ σ n; dengan demikian SD bisa dihitung
❑
i=1
dari tabel 5.7 menjadi SD=❑√ σ 2n=❑√ 24,37=4,94
Catatan untuk tendency central dan dispersi:

Kedua indikator ini merupakan indikator terpenting dalam
statistik baik deskriptif maupun inferensial. Pada statistik
99
deskriptif merupakan satu ukuran tunggal untuk menggambarkan

secara baik dari sekumpulan data, jika ukuran dispersinya kecil
maka kesimpulan yang diambil akan menggambarkan di populasi
(representatifness nya bisa dijamin) tetpai jika dispersinya (misal
SD) besar bahkan lebih besar dari rata-rata, maka data tersebut
terindikasi ada data ekstrim atau sangat ekstrim (far outlier),
sehingga data seperti itu harus dikelola dengan baik. itulah
sebabnya penggunaan mean sebagai indikator sangat peka
terhadap nilai ekstrim tersebut.
Ukuran lainnya selain tendency central dan dispersi,

di dalam pembagian data dan terkait dengan perhitungan
kemiringan kurva (skewnes) dan bentuk kurva (curtosis),
maka perlu ditambahkan beberapa indikator lainnya,
antara lain:
Kuartil
Konsep median data dibagi ditengah setelah
diurutkan atau data dibagi dua, pada pendekatan lainnya
data juga dibagi dalam beberapa kategori yang sering
digunakan yaitu kuartil dan persentil.
Kuartil data dibagi empat bagian baik data tunggal
maupun data kelompok. Jika pada data tunggal data
diurutkan terlebih dahulu baru dibagi 4, jika datanya
ganjil pilih data ke “i” nya, sebagaimana penentuan pada
median. Ada dua indikator yang digunakan yaitu
simpangan kuartil dan simpangan antar kuartil.
1. Data Tunggal
Beberapa ukuran kuartil yang perlu diketahui adalah
1
K1 kuartil 1 rumusnya data ke . n , K2 sama dengan
4
3
median, K3 kuartil 3= . n ; sedangkan simpangan kuartil
4
dengan rumus:
K 3−K 1
Q= ; Q simpangan kuartil.
2
100
Contoh soal:
Data hasil pengukuran BB Balita, diketahui sebagai
berikut:
5, 8, 9, 10, 11, 12, 12, 16, 17, 19, 20, 21; banyaknya data
(n)=12
1
Maka bisa dihitung: K1 = .12=3; kuartil 1 ada pada data
4
3
ke 3 yaitu 9; K3= .12=9 ; berada pada data ke 9 dengan
4
BB=17; jadi simpangan kuartil
K 3−K 1 17−9
Q= = =4; simpangan antar kuartil (wilayah
2 2
antar kuartil/WAK) WAK= K3 - K1= 17-9=8
2. Data kelompok
Perhitungan simpangan kuartil dan wilayah antar kuartil
pada data kelompok rumusnya sama, hanya cara mencari
nilai K3 dan K1 yang berbeda, adapun rumusnya sebagai
berikut:
n.i
K i=Bbki +( 4
−fc b
f ki )
. i; Bbki= Batas bawah kuartil ke i; fc b=
frekuensi komulatif sebelum kuartil ke i, fki frekuensi

kuartil ke i.
Sama dengan median, nilai median tidak bisa dihitung
sebelum kelas mediannya bisa ditentukan, demikian juga
kuartil, kelas kuartil ke i nya harus ditentukan terlebih
dahulu, baru kuartil ke i nya bisa dihitung.
Contoh soal kasus asam urat pada tabel 5.3 di atas.
. (mg/100 ml) (fi)
1. 3-5 50
101
2. 6-8 35
3. 9-11 10
4. 12-14 5
Jumlah 100
Berapa simpangan kuartil dan wilayah antar kuartil, maka

diperlukan perhitungan K1 dan K3; maka ditentukan dulu
n 100 3 3
kelas K1= = =25 ; K 3 = .n= .100=75 ; maka K1
4 4 4 4
ada pada frekuensi ke 25, pada kelas ke 1 banyaknya
frekuensi ada 50, berarti K1 berada di kelas ke 1; K3 ada
pada frekuensi ke 75, kelas ke 2 ada 35 berarti frekuensi ke
75 ada di kelas ke dua. Guna perhitungan selanjutnya dicari
dulu frkuensi kumulatif (fc), sehingga tabel 5.8 menjadi:
No Asam Urat Frekuensi fc
. (mg/100 ml) (fi)
1. 3-5 50 50
2. 6-8 35 85
3. 9-11 10 95
4. 12-14 5 100
Jumlah 100
Maka perhitungannya:
n.i 100.1
K 1=Bbki +( ) (
4
−fc b
f ki
. i=2,5+
4
50
−0
)
.3=4
102
n.i 100.3
K 3=Bbki +( 4
−fc b
f ki ) (
. i=5,5+
Simpangan kuartilnya (Q)

4
50
−50
)
.3=7
K 3−K 1 7−4
Q= = =1,5; sedangkan WAK= 7-4=3
2 2
Persentil
Persentil digunakan untuk membagi data dalam 100
bagian sama banyaknya. Ukuran yang digunakan sama
yaitu simpangan persentil (SP) dan wilayah antar persentil
(WAP), logikanya sama dengan kuartil hanya
pembagiannya yang berbeda. Adapun rumusnya:
P90−P10
SP= ; sedangkan WAP=P90−P10 ; untuk mengetahui
2
nilai Pi digunakan rumus:
n. i
Pi=Bbpi + (100
f pi )
−fc b
. i; p berarti persentil adapun yang lain
logikanya sama dengan pada kuartil.

1. Data tunggal:
Sama dengan data Berat Badan Balita 5, 8, 9, 10, 11, 12,
12, 16, 17, 19, 20, 21; maka berapa simpangan persentil dan
wilayah antar persentil, sebelumnya dihitung dulu:
n .i 12.10
P10= = =1,2, maka data antara 1 dan 2 yaitu 5 dan
100 100
8, jarak antara 5 sampai 8 adalah 3. P 10= 1,2, artinya data ke
1=5, sisanya 0,2 sedangkan jarak antara data ke 1 dan ke 2
=3; maka sebagai pendekatan 0,2 . 3=0,6; dengan demikian
diperkirakan nilai P10=5+0,6= 5,6.
n .i 12.90
P90 juga bisa dihitung P90= = =10,8 , maka data ke
100 100
90 berada antara data ke 10 sampai 11; data ke 10=19 data
103
ke 11= 20, sehingga jaraknya 1; sehingga 0,8 . 1= 0,8;

dengan demikian perkiraan P90=19,8; sehingga:
P90−P10 19,8−10,8
SP= = =4,5 ; WAP=19,8−10,8=9
2 2
2. Data Kelompok.
Perhitungan data kelompok, logikanya sama dengan kuartil
tetapi pada persentil data dibagi 100, sebagai contoh
digunakan data asam urat pada tabel 5.3.
Berapa SP dan WAP, maka dapat dihitung sebagai berikut:
No Asam Urat Frekuensi fc
. (mg/100 ml) (fi)
1. 3-5 50 50
2. 6-8 35 85
3. 9-11 10 95
4. 12-14 5 100
Jumlah 100
Dihitung terlebih dahulu nilai P10 dan P90, dengan

menghitung terlebih dulu masing-masing berada pada kelas
n .i 100.10
ke berapa, P10 = = =10 ; berarti ada pada
100 100
frekuensi ke 10, padahal di kelas pertama ada 50
frekuensinya, sehingga P10 berada di kelas 1; P90=
n .i 100.90
= =90; ada pada frekuensi ke 90, kelas ke 2 ada
100 100
85 frekuensinya, berarti kuran 5 diambil kelas ke 3 ada 10,
sehingga P90 ada di kelas ke 3. Setelah diketahui kelasnya,
maka bisa dihitung nilai masing-masing sebagai berikut:
n.i 100.10
P10=Bbpi +( 100
f pi ) (
−fc b
. i=2,5+
100
50
−0
).3=3,1
104
n. i 100.90
P90=Bbpi +
Maka:
(100
−fc b
f pi ) (
. i=8,5+
100
10
−85
)
.3=10
P90−P10 10−3,1
SP= = =3,45 ; WAP=10−3,1=6,9
2 2
Penggunaan kuartil, desil atau persentil dalam kehidupan sehari-
hari dimanfaatkan untuk membuat kategori berdasarkan nilai
tertentu (cut point ), maka hasil perhitungan yang sudah
dilakukan pada ketiganya bisa digunakan untuk kategori tersebut.
Seperti kategori ergonomi atau tidak digunakan nilai persentil.
Penarikan kesimpulan hasil pengukuran sekumpulan data,

seringkali dengan melihat kurva, inilah yang kemudian
melahirkan konsep distribusi sampling yang sudah berulangkali
diuji coba (dibahas lebih lanjut). Ada dua model kurva yang
dibahas dalam buku ini yaitu ukuran kemencengan (Skewnes )
dan bentuk kurva (kurtosis) adapun penjelasannya sebagai
berikut:
Skewness (sk)
Bentuk kurva yang baik dalam konsep adalah simetris, tetapi
dalam praktek yang diukur pada sampel terbatas, sringkali tidak
ideal (simetris), untuk itu dibutuhkan suatu indikator mengukur
seberapa jauh dan kearah mana kemencengan tersebut. Ukuran
itu disebut Skewness. Gambar kemencengan dilihat dari
kelandaian kurva, jika yang landai sebelah kanan disebut kurva
menceng ke kanan dan jika sebaliknya menceng ke kiri, adapun
gambarannya sebagai berikut:
max max
105
Menceng ke kanan Menceng ke kiri

Gambar 5.1. model kemencengan kurva
Perhitungan dengan menggunakan Karl Pearson (koefisien

pearson) didasarkan pada nilai tendency central dan dispersi,
adapun rumusnya:
x́−Mo
sk= .... (1) sk= skewness, bila nilai modus tidak diketahui
SD
bisa digunakan pendekatan dengan rumus:
x́−modus=3( x́−median), maka Mo=( 3 x́−3. Md )+ x́; sehingga
Mo=3. Md−2 x́; rumus sk bisa juga digunakan rumus berikut:
x́−Mo x́−( 3 Md −2 x́ ) x́−3 Md +2 x́ 3 ( x́ −Md )
sk= = = = ......(2)
SD SD SD SD
Nilai sk bervariasi ± 3, secara normal ± 1; jika mendekati nol
grafik simetris59.
Tabel 5.5. tentang asam urat sudah dihitung sebagai berikut:

x́=6,10 ; Md=5,5; Mo=4,26 ; Sd=5,79 (hasil perhitungan
x́−Mo 6,10−4,26
tersendiri); maka Sk= = =0,31; jika digunakan
SD 5,79
3(6,10−5,5) 1,8
dengan median, hasilnya: Sk= = =0,31; dua
5,79 5,79
pendekatan nilainya sama.
Nilai Sk mendekati 0 menunjukkan grafik relatif simetris.
Kurtosis
Kurtosis merupakan ukuran untuk mengetahui bentuk
keruncingan kurva distribusi frekuensi.
Pembandingnya adalah distribusi normal. Model distribusi
normal bisa dibedakan menjadi tiga model yaitu leptocurtic yaitu
model kurva runcing, dengan demikian kurva ini mempunyai
varians yang kecil sehingga data relatif paling homogen,
dibandingkan kurva lainnya; kedua model platycurtic modelnya
lebih datar, sehingga variannya paling besar; ketiga model
mesocurtic model menengah tidak kurus dan tidak terlalu datar.
Jika digambarkan ketiga kurva tersebut sebagai berikut:
106
Leptocurtic Platycurtic Mesocurtic
Gambar 5.2. model kurva normal
Pengukuran kurtosis digunakan rumus momen ke 4 dan

simpangan deviasi; jika di notasikan sebagai berikut:
m4 m4
a 4= 4 = 2
SD m 2
Keterangan: a4=koefisien momen kurtosis; m4 momen ke 4
sekitar rata-rata (deviasi); SD simpangan deviasi atau momen ke
2 (m2). Adapun rumus umum momen adalah:
n
∑ ( x i− x́ ) r
mr = i=1
n
Rumus ini digunakan untuk data tunggal
Penjelasan dari rumus tersebut mr momen ke r (r=1 s/d n), jika
digunakan untuk perhitungan kurtosis 2 dan 4; n banyaknya data.
Hakekatnya momen diperoleh dari nilai deviasi dan jika m2 sama
dengan deviasi dikuadratkan itu artinya sama dengan nilai varians
yang sudah dihitung sebelumnya.
Data kelompok rumus momen yang digunakan dikalikan dengan
frekuensi untuk deviasinya, sehingga notasinya sebagai berikut:
n
∑ f i . ( x i− x́ )r
m r = i=1
n
Kriteria bentuk kurva hasil perhitungan sebagai berikut: jika a4>3
kurva leptokurtik, jika <3 platikurtik dan a4=3 mesokurtik.
107
Contoh untuk data tunggal

Data umur pada 10 ibu saat kelahiran anak pertama (primipara)
Tabel 5.11. Perhitungan Momen ke 2 dan ke 4
U 21 22 20 20 24 25 26 28 23 21
Rata-ratanya =23
D -2 -1 -3 -3 1 2 3 5 0 -2
2
D 4 1 9 9 1 4 9 25 0 4
D4 16 1 81 81 1 16 81 625 0 16
Keterangan:
❑ ❑
2 4
U= umur; D= deviasi; ∑ D =66 ; ∑ D =918
❑ ❑
Maka momen ke dua bisa dihitung:

n ❑
∑ ( x i−x́ )2 ∑ D 2 66
i=1
m 2= = ❑
= =6,6
n n 10
Momen ke 4
n ❑
∑ ( xi −x́ ) 4 ∑ D4 918
i=1
m4 = = ❑
=
=91.8
n 10 10
Dengan demikian koefisien kurtosisnya (a4)
m 91,8
a 4= 4 2 = 2 =2,107; nilai sebesar ini berarti <3; sehingga
( m2 ) 6,6
masuk kategori platikurtik/datar
Data kelompok
Contoh data kelompok diambil dari perhitungan yang sudah ada
pada tabel 5.7 Bab V, sudah dihitung besarnya varians atau m2,
untuk itu tabel dipotong untuk menghitung m4, hasilnya dibuat
lagi tabel yang ada dengan mengurangi isi tabel, sehingga
menjadi sebagai berikut:
108
Tabel 5.12. Distribusi BB Balita di Posyandu Mawar 2019

NO BB fi 2 2 4
f i ( x i− x́ ) 4
. BALITA ( x i−x́ ) f i ( x i− x́ ) ( x i−x́ )
m2 m4
1. 3 - 6 5 38,44 192,2 1477,63 7388,15
2. 7 – 10 5 4,84 24,2 23,43 117,15
3. 11 – 14 5 3,24 16,2 10,50 52,5
4. 15 – 18 4 33,64 134,56 1131,65 4526,60
5. 19 - 21 1 96,04 96,04 9223,68 9223,68
JUMLAH 20 463,2 21308,08
Dari hasil uraian perhitungan tersebut, dimasukkan ke dalam rumus koefisien

kurtosis:
Maka momen ke dua bisa dihitung:

n ❑
∑ ( x i−x́ )2 ∑ f i D2 463,2
i=1
m 2= ❑
= = =23,16
n n 20
Momen ke 4
n ❑
∑ f i . ( x i− x́ ) 4 ∑ f i . D 4
21.308,08
i=1
m4 = = ❑
=
=1.065,404
n 10 20
Dengan demikian koefisien kurtosisnya (a4)
m4 1.065,404
a 4= 2
= =1,99; nilai sebesar ini berarti <3;
( m2 ) 23,162
sehingga masuk kategori platikurtik.
Cara lain untuk menentukan koefisien kurtosis (K) dengan

menggunakan simpangan kuartil (Q) dan wilayah antar persentil
(WAP), dengan rumus:
K 3−K 1
Q 2
K= =
WAP P90−P10
109
Kriteria yang digunakan jika K=0,263 kurva mesokurtik, jika

<0,263 platikurtik dan jika >0,263 leptokurtik.
Contoh kasus Asam Urat pada tabel 5.9, sudah dihitung

simpangan quartilnya (Q)=1,5 sedangkan wilayah antar persentil
(WAP)= 6,9; sehingga nilai koefisien kurtosisnya:
Q 1,5
K= = =0,217 ; karena <0,263 maka bentuk kurvanya
WAP 6,9
platikurtik. Hal ini relatif sama perolehannya dengan
menggunakan ukuran Skewness (Sk)
Catatan:
Desil (tidak dibahas, tapi logikanya sama dengan kuartil dan
persentil yang membedakan kategori data yang dibagi 10);
merupakan upaya membuat kategori atau pengelompokkan dari
agregasi data, meskipun ada cara lain untuk menentukan
pengelompokkan.
Sedangkan bentuk kurva bisa digunakan ukuran kemiringan
(skewness) atau kurtosis. Artinya bentuk kurva normal bukan
berarti bentuk tunggal, tetapi bisa jamak dan miringpun (dalam
batas tertentu) juga kurva normal.
Cara pembacaan data.

Data yang disajikan perlu dibacakan oleh analisator
atau peneliti, hal ini dimaksudkan untuk membantu
pembaca dalam memahami data yang disajikan oleh
peneliti secara sekilas, meskipun pengguna juga bisa
membaca dengan sudut pandang yang lain. Pembacaan
tabel bukan sekedar mengulang isi data yang ada di tabel
tersebut, tetapi lebih pada memaknai tabel tersebut.
Adapun cara pembacaan bisa dengan cara sebagai berikut:
Tabel satu dimensi
Tabel satu dimensi hanya memuat satu variabel
dalam satu tampilan, seperti berikut ini:
Tabel 5.13. Distribusi Malaria di Lima Puskesmas Tertinggi

Kabupaten Purworejo Tahun 2019
110
No. Puskesmas Jumlah %
1. Kaligesing 55 31,43
2. Loano 45 25,71
3. Bagelen 37 21,14
4. Cangkrep 23 13,14
5. Banyuasin 15 8,5
Jumlah 175 100
Pembacaan tabel: ada beberapa cara pembacaan tabel yang

disajikan, antara lain:
1. Puskesmas Kaligesing merupakan Puskesmas tertinggi kasus
malarianya di Kabupaten Purworejo yaitu dengan 31,43% dari
175 kasus malaria yang ada, sedangkan yang paling rendah
adalah Puskesmas Banyuasin dengan 8,5%..
2. Puskesmas Kaligesing kasus malarianya 3,69 lebih besar
dibandingkan dengan Puskesmas Banyuasin
Tabel dua dimensi
Tabel dua dimensi yang dimaksudkan adalah dua
variabel yang disajikan dalam satu tampilan tabel. Adapun
contoh tabelnya sebagai berikut:
Tabel 5. 14. Hubungan Antara Pernikahan Kerabat Dekat Dengan

Kasus Deabetes Millitus di Kabupaten Pekalongan Tahun 2019
Perkawinan Kasus DM Jumlah

Kerabat Dekat
Ya Tidak
Ya 45 5 50
Tidak 2 48 50
Jumlah 47 53 100
111
Pembacaan Tabel:
1. Perkawinan Kerabat dekat 90% terkena DM, sisanya tidak
kena DM, diperoleh dari total perkawinan kerabat dekat
sebanyak 50 orang, yang kena DM ada 45 sehingga
45
x 100 %=90 %; atau logikanya dibalik perkawinan
50
keluarga dekat yang tidak kena DM hanya 10%; penyebutan
kata “hanya” untuk menunjukkan penguatan yang tidak
terkena hanya sedikit.
2. Perkawinan kerabat dekat kecenderungannya terkena DM
90%.
3. Jika yang mau ditonjolkan, sebagai anjuran supaya tidak
melakukan perkawinan keluarga dekat, bisa sebaliknya yaitu
perkawinan keluarga bukan keluarga dekat, yang terkena DM
2
hanya 4% ( x 100 %=4 % ¿
50
4. Keduanya juga bisa ditampilkan risiko terkena DM bagi
keluarga dekat 90%; sedangkan perkawinan bukan keluarga
dekat 4%
5. .... dll.
Analisis dalam epidemiologi yang diutamakan adalah analisis
faktor risiko, sehingga pertemuan antara paparan dan kasus yang
diteliti. Paparannya adalah perkawinan keluarga dekat (faktor
genetik) sedangkan munculnya kasus adalah kasus DM.
Tabel tiga dimensi
Tiga variabel yang ditampilkan dalam satu tampilan
tabel disebut tabel tiga dimensi, sebagai contoh:
Tabel 5. 15. Pengaruh Waktu Relaksasi, Pijat dan

Jenis Aroma Therapi terhadap Kecemasan Primigravida
di Klinik A Tahun 2019
Waktu Pijat Waktu Ralaksasi (menit)

(menit)
5 10 15
112
15 40 35 25
37(A) 25(B) 20(C)
46 20 25
30 40 30 20
35(B) 35(C) 15(A)
30 28 19
45 25 15 15
20(C) 19(A) 12(B)
15 14 10
Keterangan:
A = Aroma terapi jeruk; B= aroma terapi vanila; C= Aroma terapi
melon
Masing-masing perlakuan ada tiga responden yang ketiganya
diberi tiga perlakuan secara bersamaan, misal pada tabel baris 1
dan kolom ke 1, ketiga subyek diberi perlakuan pijat 15 menit,
diberi aroma therapi rasa jeruk, kemudian diberikan relaksasi 5
menit, begitu seterusnya.
Pembacaan tabel:
1. Melihat kecenderungan, perhatikan data dari baris, kiri ke
kanan, maka bisa dibaca waktu pijat yang sama, semakin
lama relaksasi, maka skore kecemasan menurun, hal ini
bisa dilihat pada baris ke 1 dengan waktu pijat 15 menit
dan relaksasi 5 menit, rata-rata skore kecemasan 41,
sedangkan pada waktu pijat yang sama dan relaksasi
selama 15 menit rata-rata kecemasannya 23,3 atau terjadi
41−23,3
penurunan sebesar 17,7 atau 43,17%; ( 41 ) x 100 %
2. Melihat dari sisi kolom; waktu relaksasi yang sama,
semakin lama waktu pijat terjadi penurunan skore
kecemasan, hal ini bisa dilihat pada kolom ke 1 dengan
waktu relaksasi 5 menit dan pijat 15 menit, rata-rata skore
113
kecemasan 41, sedangkan pada waktu relaksasi yang sama

dan pijat selama 45 menit rata-rata kecemasannya 20 atau
terjadi penurunan sebesar 21 atau 51,21%
41−20
( 41 )
x 100 %
3. Melihat keseluruhan; semakin lama pijat dan relaksasi

terjadi penurunan skore kecemasan, hal ini bisa dilihat
pada kolom ke 1 dengan waktu relaksasi 5 menit dan pijat
15 menit, rata-rata skore kecemasan 41, sedangkan pada
waktu relaksasi 15 menit dan pijat selama 45 menit rata-
rata kecemasannya 12,33 atau terjadi penurunan sebesar
41−12,33
28,7 atau 70% , diperoleh dari (41
x 100 % )
Tabel Komparasi
Tabel ini membandingkan antara satu kondisi
dengan kondisi lainnya yang saling independen. Saling
independen berarti terjadinya keadaan pada subyek bukan
karena pengaruh kelompok yang lain, tetapi karena
kondisi yang terjadi pada kelompok tersebut.
Adapun contohnya sebagai berikut:
Tabel 5.16. Komparasi Tekanan Darah Diastole

pada Kelompok Umur Berbeda
di Puskesmas “X” 2019.
No. Usia (tahun)
≤40 >40
1. 80 90
2. 75 85
3. 80 100
114
4. 85 95
5. 80 90
Jumla 400 460

h
Pembacaan tabel:
1. Rata-rata tekanan darah diastole kelompok umur 40 tahun
80 mm/Hg dan di atas 40 tahun 92 mmHg.
2. (berdasarkan rata-rata) Tekanan darah diastole kelompok
umur di atas 40 tahun 1,15 kali lebih besar dibandingkan
kelompok umur kurang dari atau 40 tahun.
Grafik/gambar
Pembacaan grafik pada prinsipnya sama dengan
tabel yaitu kecenderungan, pada grafik juga sama ada
satu, dua dimensi, contohnya sebagai berikut:
Satu dimensi
Hanya ada satu variabel yang disajikan, sepeti kasus
Demam Berdarah dalam satu tahun.
35
30
25
20
15
10
0
JAN PEB MAR APR MEI JUN JUL AUG SEP OKT NOV DES
Sumber: Data primer terolah

Gambar 5.2. Distribusi Kasus Demam Berdarah
di Puskesmas “X” 2019
Pembacaan gambar:
115
1. Puncak kasus demam berdarah tahun 2019 terjadi bulan

Pebruari dan cenderung turun pada bulan juni sampai dengan
September dan cenderung naik lagi setelah bulan November.
2. Puncak kasus di bulan Pebruari dan tidak ada kasus bulan juni
sampai September dan mulai meningkat lagi bulan Novemver.
3. Dll...
Dua dimensi
Grafik dua dimensi dua variabel dijadikan dalam
satu tampilan grafik, adapun contohnya sebagai berikut:
35
30
25
2015
2016
20 2017
2018
15 2019
MIN
MAX
10 MEAN
0
JAN PEB MAR APR MEI JUN JUL AUG SEP OKT NOV DES
Sumber: Data sekunder

Gambar 5.3. distribusi DBD Selama Lima Tahun Terakhir
Penyajian data epidemiologi seringkali ditambahkan grafik

minimal dan maksimal serta rata-rata, untuk mengetahui
kecenderungan, adapun pembacaannya sebagai berikut:
1. Selama lima tahun terakhir kasus terttinggi pada tahun 2016.
2. Bulan Januari sampai dengan April merupakan bulan kejadian
DBD dan puncaknya bulan Pebruari.
3. Dll...
116
112
BAB VI. INDIKATOR KESEHATAN
Pendahuluan
Indikator kesehatan dalam buku statistik memang
kurang lazim, tetapi pada praktek kegiatan perhitungan
maupun kepentingan pembuatan kategori dan analisis data
seringkali dibutuhkan indikator dan besaran parameter,
hal ini dapat membantu pengguna statistik lebih mudah
dalam membuat kategorisasi dan analisis.
Indikator Kesehatan ini, pada tataran praktis
seringkali digunakan untuk menentukan keberhasilan
capaian program yang dijalankan disamping itu indikator
ini menjadi acuan pemegang program atau mahasiswa
agar mengetahui apa saja yang menjadi indikator program
pembangunan bidang Kesehatan.
Pendekatan yang digunakan adalah ukuran dasar,
vital statistik dan indikator. Indikator yang digunakan
menggunakan teori Blum derajat kesehatan dipengaruhi
oleh lingkungan, perilaku, pelayanan kesehatan dan
genetik. Disamping itu ditambahkan beberapa indikator
yang dijadikan parameter untuk mengukur kesehatan
individu. Dengan demikian informasi ini akan
memudahkan peneliti, mahasiswa dan praktisi untuk
menentukan kategorisasi maupun analisis hasil riset atau
jika analisis statistik dengan pembanding nilai parameter,
yang akan dijelaskan kemudian.
Ukuran dasar
Ukuran ini menjadi dasar dari hampir semua
indikator epidemiologi untuk mnggambarkan besarnya
masalah kesehatan, terutama pada vital statistik yang
meliputi kesakitan (morbiditas), kematian (mortalitas) dan
angka kelahiran (ferlititas). Adapun ukurannya sebagai
berikut:
Proporsi :
Angka ini digunakan sebagai angka perbandingan
untuk menentukan besarnya kejadian dalam sekumpulan
113
data atau dengan kata lain perbandingan antara bagian

dibagi keseluruhan, jika di notasikan sebagai berikut:
x x
P= = ; bisa dibaca sebagai x dibagi x+y
x+ y N
atau bagian (n) dibagi keseluruhan (N) atau pada
epidemiologi kejadian dibagi populasi berisiko
(population at risk)
Rate
Angka ini sesungguhnya adalah proporsi yang
dikalikan bilangan konstanta tertentu. Besarnya perkalian
tersebut sangat tergantung dari proporsi yang ada. Jika
proporsinya terlalu kecil maka konstantanya besar, hal ini
dimaksudkan mempermudah mengartikan suatu hasil
perbandingan. Konstanta besarannya mulai dari 100
(persentase); 1000 (permil), 10.000 bahkan 100.000. jika
dirumuskan menjadi:
Rate=P x K; P proporsi dan K konstanta
Konstanta 100 berarti setiap 100 mempunyai

kejadian sebesar “X”; contoh: prevalensi penyakit jantung
koroner 10%; artinya setiap 100 orang berisiko ada 10
orang terkena penyakit jantung koroner.
Ratio
Nilai ini merupakan perbandingan antara bagian per
x
bagian lainnya, jika dirumuskan menjadi: Ratio= ,
y
berbeda dengan rate yang merupakan proporsi, tetapi
ratio dua bagian berbeda yang dibandingkan. Tujuan
perbandingan ini untuk mengetahui kelipatan antara
bagian yang dibandingkan.
Misal : seks ratio, yaitu perbandingan antara jenis kelamin laki-
jumlah laki−laki
laki dan perempuan dengan notasi SR= ; jika
jumlah wanita
nilainya lebih dari 1 berarti jumlah laki-laki lebih besar dari
wanita dan jika sebaliknya maka jumlah wanita lebih besar.
114
Indeks65
Angka indeks adalah suatu angka yang dibentuk
untuk menunjukkkan perubahan atau perbandingan dari
sebuah atau lebih ciri pada waktu dan tempat yang sama
atau berbeda. Nilai hasil perbandingan, tetapi tidak
mempunyai satuan tertentu.
Perbandingan ini bisa digunakan lintas satuan. Nilai
ini akan menghilangkan satuan. Indeks juga sebagai
ukuran tertentu suatu perbandingan yang hasilnya berupa
angka yang menunjukkan derajat tertentu.
Contoh:
nilai x bobot SKS
Indeks prestasi belajar IP= ; dengan skala 0-4
jumlah SKS
Indeks Pembangunan Manusia (IPM) merupakan komponen

gabungan antara indeks kesehatan berupa umur harapan hidup
(UHH), indeks pendidikan, indeks pengeluaran (hidup layak)
sebagai dimensi ekonomi, yang jika dirumuskan menjadi:
1
IPM = (I . UHH+ I . P+ I . HL ); keterangan: I.UHH=indeks
3
umur harapan hidup, I.P=indeks pendidikan; I.HL= Indeks hidup
layak.
guna menentukan masing-masing indeks digunakan rumus.
UHH−UH H min
I K es= ; Indeks Kesehatan (IKes); UHH umur
UH H maks−UH H min
Harapan hidup, maks= maksimum (tertinggi); min= minimum
(terendah)
Dimensi pendidikan
HLS−HL S min
IHLS= ; HLS= harapan lama sekolah;
HL Smaks −HL S min
sedangkan rata-rata lama sekolah indeksnya sebagai berikut:
RLS−RL Smin
IRLS= ; RLS= rata-rata lama sekolah; IRLS
RL S maks−RL Smin
indeks rata-rata lama sekolah; dengan demikian indeks
pendidikan (IPend)
115
IHLS+ IRLS
I Pend =
2
Indeks Pengeluaran
rata−rata peng−Pengmin
I Peng = ; Peng= Pengeluaran; I= indeks.
Peng maks−Pengmin
Perhatikan komponen IPM, mempunyai satuan yang berbeda,

satuan kesehatan umur harapan hidup dalam tahun, indeks
pendidikan lama belajar dan melek huruf serta indek ekonomi
berupa besarnya pengeluaran per kapita, dengan demikian indeks
tidak punya satuan. IPM ini digunakan untuk mengkategorikan
kemajuan suatu negara. Jika diperhatikan ada satuan yang
berbeda diantara ketiga komponen penilaian tersebut.
Vital statistik
Indikator ini digunakan untuk mengukur data
kehidupan yang penting yaitu kelahiran, kesakitan dan
kematian. Ukurannya mengacu pada ukuran dasar yaitu
rate. Adapun beberapa indikator antara lain:
Morbiditas66,
Beberapa ukuran yang termasuk di dalam angka kesakitan antara
lain:
Prevalensi rate (PR)
Ukuran ini menggambarkan angka kesakitan yang
lama dan baru dalam satuan population at risk pada
pertengahan tahun, adapun ukuran PR ada dua yaitu:
Periode Prevalence Rate (PPR)
Prevalens model ini lebih sederhana prevalens rate (PR)
didasarkan waktu pengamatan tertentu, biasanya selama satu
tahun. Adapun rumusnya:
penderita baru+ penderita lama
PR= x K; K
population at risk pertengahan tahun
adalah konstanta dengan nilai tertentu, jika untuk penyakit
biasa digunakan 100%. Perhitungan penduduk
pertengahan tahun yaitu penduduk bulan juni, tetapi jika
tidak diketahui dan yang diketahui penduduk tanggal 1
116
januari (P1) dan 31 Desember (P2) pada tahun yang sama

dijumlahkan dibagi dua, sehingga jika dirumuskan
sebagai berikut:
P 1+ P 2 1
atau P1 + ( P2−P1 ); jika penduduk 1maret di ketahui dan
2 2
31 Desember pada tahun yang sama, maka rumusnya menjadi:
3
P1 + . P2 ;PR dihitung pada periode waktu dan penyakit tertentu
12
yang diamati. PR perlu diketahui oleh ahli statistik kesehatan
guna menentukan besarnya masalah kesehatan secara cepat.
Contoh :
Dalam satu wilayah ada 1000 penduduk dalam satu tahun
diketahui ada 100 penderita TB, berapa PR.
Diketahui penderita 100, sudah termasuk penderita lama, karena
sejak masuk tahun yang bersangkutan terekam data penderita
sebelum tahun tersebut yang masih menderita sakit, demikian
sesudah tahun tersebut boleh jadi masih sakit, sehingga PR bisa
dihitung:
100
PR= x 100 %=10 %; population at risk (PAR) dilihat,
1000
apakah penyakit tersebut bisa menimbulkan kekebalan atau tidak,
jika bisa menimbulkan kekebalan rumusnya menjadi
PAR=jml. Penduduk - penderita penyakit tersebut
Point Prevalens Rate (PPR)

Numerator (pembilang)nya sama dengan Prevalens Rate tetapi
denumerator (penyebut) nya jumlah penduduk saat pengamatan
(point), jika dirumuskan menjadi:
penderita baru+ penderita lama
PR= x K ; nilai K=100%
population at risk saat pengamatan
Incidence Rate (IR)

Ukuran kasus baru dalam periode waktu tertentu
pengamatan dilakukan dan pada populasi berisiko yang
diamati (wilayah terbatas yang diamati). Masuknya
117
penyakit pada tubuh orang yang rentan sulit diketahui,

untuk itu kasus baru dalam konteks pengukurannya
dimaksudkan sebagai, kapan penderita tersebut tercatat
sebagai pasien baru di unit pelayanan kesehatan selama
periode waktu yang diamati. Adapun rumusnya sebagai
berikut:
penderita baru
IR= x K ; nilai K adalah
population at risk pertengahan tahun
konstanta (%) atau per seribu
Attack Rate (AR)

Indikator ini digunakan sebagai ukuran besarnya
serangan penyakit tertentu dalam waktu dan wilayah
tertentu dan terbatas. Angka serangan ini sering dipakai
kalau terjadi Kejadian Luar Biasa (KLB) atau wabah. Jika
x
AR= x K ; dimana x= jumlah penderita penyakit baru sejak
y
indeks kasus (kasus pertama) di daerah tersebut sampai
berakhirnya masa inkubasi penderita terakhir di wilayah dan
waktu tertentu; sedangkan y jumlah penduduk yang berisiko
terserang penyakit tersebut dalam waktu dan wilayah tertentu;
K=100 atau 1000 sangat tergantung pada besar kecilnya nilai
proporsi, jika kecil gunakan konstanta yang besar.
Pembacaan hasil sangat tergantung dari besarnya konstanta, jika

% maka pembacaannya setiap 100 penduduk ada “X” orang yang
diserang penyakit tersebut dalam periode waktu tertentu (waktu
pengamatan bisa hari, minggu, bulan atau tahun). Semakin
pendek waktu serangan semakin cepat cara penyebaran penyakit
tersebut, masa inkubasi dan media penularannya setempat.
Analisis bisa dikembangkan ke variabel lingkungan boleh jadi
juga sebagai pemicu penularan, sebagaimana penyakit di daerah
endemis.
118
Hubungan antara PR dan IR sangat tergantung dari banyaknya

penyakit baru dan lama waktu serangan, sehingga jika
PR=IR x T; T merupakan lama waktu pengamatan.
Mortalitas
Angka kematian yang diukur dalam waktu dan
wilayah terbatas. Angka ini berkaitan dengan banyak
indikator lainnya baik pelayanan kesehatan, kecepatan
diagnosis, jangkauan pelayanan, ketenagaan, upaya
kesehatan meliputi promotif, preventif, kuratif, adapun
beberapa jenis indikator yang digunakan antara lain:
Angka Kematian Kasar (Crude Death Rate/CDR)

Nilai ini didasarkan pada semua kematian yang
terjadi pada satu periode waktu penganatan tertentu dan
wilayah tertentu. Adapun rumusnya sebagai berikut:
Jumlah seluruh kematian
CDR= xK
jumlah penduduk pertengahan tahun
Angka ini menggambarkan angka kematian secara keseluruhan
dan menjadi indikator paling makro dari suatu wilayah dan
periode waktu tertentu.
Angka Kematian Perinatal (Perinatal Mortality Rate/PMR)

Indikator ini digunakan untuk menentukan angka
kematian bayi baru lahir pada hari ke tujuh sejak
kelahirannya. Adapun rumusnya sebagai berikut:
jml kematian janin 28 minggu atau lebih sampai berumur <7 hari
PMR= xK
jumlah bayibaru lahir hidup pada tahun yang sama
Nilai K=1000; indikator ini menjadi paling sensitif bagi

pelayanan kesehatan, status gizi, status sosial ekonomi, penyakit
infeksi dan lingkungan yang bermasalah. Dengan demikian
merupakan interaksi yang begitu dinamis diantara satu set
variabel yang menyebabkan kematian bayi kurang dari 7 hari.
Angka Kematian Bayi Baru Lahir (Neonatal Mortality

Rate/NMR)
119
Indikator ini digunakan untuk menentukan kematian

bayi sebelum berumur 28 hari pada periode waktu satu
tahun pengamatannya. Adapun rumusnya sebagai
berikutnya:
jumlah kematian bayi <28 hari
NMR= x K;
Jumlah bayilahir hidup pada tahun yang sama
K=1000
Bayi lahir hidup yang dimaksud adalah bayi yang begitu lahir ada
tanda-tanda kehidupan baik berupa denyut nadi, tangisan, gerak
dll, tanpa memperhitungkan berapa lama tanda-tanda kehidupan
tersebut.
Angka Kematian Bayi (Infant Mortality Rate/IMR)

Indikator ini merupakan yang paling banyak
digunakan dan merupakan indikator sensitif pada suatu
negara. Indikator ini menjadi simpul berbagai
permasalahan antara lain pelayanan kesehatan, jangkauan
pelayanan kesehatan baik tenaga maupun fasilitas
kesehatan, penyakit infeksi, sosial ekonomi dan masalah
lingkungan. Adapun rumusnya sebagai berikut:
jml . kematian bayi< 1tahun

IMR= xK ; K=1000
jumlah kelahiran hidup pada tahun yang sama
Angka Kematian Ibu Melahirkan (Maternal Mortality

Rate/MMR)
Indikator yang berhubungan dengan komplikasi
kehamilan, persalinan dan masa nifas dalam satu tahun
per 1000 kelahiran hidup pada tahun yang sama. Adapun
rumusnya sebagai berikut:
Jml . kematian ibu hamil , persalinan∧nifas

MMR= x K ; K=1000
jumlah lahir hidup pada tahun yang sama
120
Indikator ini berkaitan dengan banyak faktor yaitu sosial

ekonomi, gizi, pelayanan kesehatan, promotif dan preventif,
kewaspadaan dini terhadap faktor risiko, tenaga pelayanan
kesehatan.
Angka Kematian Fatal (Case Fatality Rate)

Kematian yang terjadi karena kasus penyakit
tertentu dalam satu tahun pengamatan. Indikator ini untuk
menunjukkan virulensi penyakit. Adapun rumusnya
sebagai berikut:
Jml . Kematian krn penyakit tertentu

CFR= xK ; K=1000
Jml . seluruh penderita penyakit tersebut
Semakin tinggi CFR maka penyakit tersebut semakin virulensi,

perbandingan dengan menggunakan ratio menunjukkan jika >1
maka penyakit tersebut mempunyai tingkat virulensi ..sekian kali
lipat lebih virulensi.
Fertilitas67
Istilah ini digunakan untuk menggambarkan berapa
banyak kelahiran hidup dalam satu wilayah dan waktu
tertentu, sedangkan fekunditas adalah kemampuan
fisiologis dan biologis wanita untuk menghasilkan anak
lahir hidup. Beberapa ukuran fertilitas antara lain:
Angka kelahiran kasar (Crude Birth Rate/CBR)

Angka ini dimaksudkan untuk menggambarkan
jumlah kelahiran hidup secara keseluruhan dalam satu
periode waktu tertentu (pertengahan tahun) per 1000
penduduk. Adapun rumusnya sebagai berikut:
B
CBR= x K ; dimana B jumlah kelahiran hidup, Pm jumlah
Pm
penduduk tengah tahun dan K konstanta (1000)
Disebut kasar disebabkan karena penyebutnya
jumlah penduduk secara umum, sehingga di dalamnya
termasuk kelompok yang tidak mempunyai kemampuan
121
mempunyai anak, seperti laki-laki, wanita mandul, anak-

anak, wanita usia lanjut.
Angka Kelahiran Umum (General Fertiliy Rate/GFR)

Indikator ini sudah membatasi kelompok usia yang
mempunyai kemampuan melahirkan yaitu usia produktif
(15-49 tahun), dengan demikian rumusnya sebagai
berikut:
B
GFR= x K ; Pfm jumlah wanita usia produktif pertengahan
P fm
tahun.
Ukuran GFR lebih besar angkanya dibandingkan dengan CBR
dan bisa digunakan sebagai ukuran kelahiran dari 1000 wanita
usia produktif.
Angka Kelahiran per Golongan Umur (Age Spesific Fertility

Rate/ASFR)
Angka ini bisa mengatasi kelemahan pada CBR dan
GFR, karena kemampuan malahirkan pada wanita per
golongan umur berbeda. Adapun rumusnya sebagai
berikut:
B
ASFR= i x K; Bi jumlah kelahiran per kelompok umur tertentu,
P fi
Pfi jumlah wanita pertengahan tahun per umur tertentu dan K
konstanta 1000.
Nilai ASFR ini akan menunjukkan kemampuan wanita umur
tertentu punya kemampuan melahirkan dan jika dilakukan
perhitungan ratio antar kelompok umur akan diketahui kelompok
umur berapa yang paling besar kemampuan melahirkan.
Indikator lainnya
Penyusunan indikator dalam buku statistik ini
didasarkan pengalaman penulis dalam membimbing
mahasiswa, karena kesulitan untuk mencari indikator dan
menentukan kategorisasi, dengan demikian memasukkan
beberapa indikator utama dapat memudahkan pengguna
buku ini dalam analisis permasalahan yang sedang diteliti.
122
Indikator yang dimaksud adalah nilai teoritis atau

standard yang digunakan untuk menentukan kategorisasi
keadaan tertentu. Indikator ini sebagai cut point untuk
menyatakan sesuatu itu (variabel) berada dalam kondisi
ideal (sehat) atau tidak sehat.
Pengetahuan tentang indikator ini penting dalam
statistik untuk membuat dua hal yaitu kategorisasi
berdasarkan ukuran tertentu yang sudah ditetapkan dan
juga bisa digunakan untuk analisis inferensi dengan
menggunakan nilai standard tersebut atau kategori
tertentu, semisal pada analisis pendugaan nilai parameter
(uji Z), uji Chi Square, Exact Fisher ataupun regresi
logistik yang menggunakan kategorisasi dalam
analisisnya.
Penyusunan indikator ini digunakan dengan
pendekatan teori HL Blum yang menyatakan derajat
kesehatan seseorang dipengaruhi oleh Lingkungan,
Perilaku, Pelayanan Kesehatan dan genetik, disamping itu
juga ada indikator kesehatan individu yang sudah lazim
digunakan untuk menentukan kondisi ideal atau
tertoleransi. Adapun indikator tersebut.
Lingkungan 68,69,70,71
Lingkungan merupakan reservoar terbesar kehidupan manusia,
sekaligus menjadi media penularan penyakit yang efektif antara
manusia yang rentan dengan penderita ataupun dengan
lingkungan secara langsung melalui pemaparan baik terjadi sesaat
ataupun akumulatif. Adapun indikatornya sebagai berikut:
Tabel 6.1. Parameter Perumahan Sehat
No. Parameter Baku mutu satuan Sumber
1. Tinggi rumah dari jalan 25 Cm

Pustaka
2. Tinggi rumah dari pekarangan 10 Cm no. 71
3. Luas Jendela 10-20 % Pustaka

no. 70
1/9 L.lantai Pustaka

123
no. 71
4. Cahaya dalam rumah 60 Lux Pustaka

no. 70
5. Kebisingan 45-55 dbA Pustaka

no. 68
dan 70
6. Debu dengan diameter 10ug 150 ug/m3
7. Gas SO2 0,10 ppm
8. Debu terendap <350 mm3/m2/ Pustaka

perhari no. 70
9. Getaran <10 mm/dt
10. Kualitas tanah:

<300 mg/Kg
a. Timah hitam (Pb) <100
b. Arsenik (As) <20
c. Cadmium (Cd)
11. Persyaratan Air minum: Pustaka
0 100 ml no. 72
a. E Coli 0 100 ml
b. Coliform 3 mg/lt
c. NO2 50 mg/lt
d. NO3 5 NTU
e. Kekeruhan ±3 suhu o
C
f. Suhu lingkungan
500 mg/lt
g. Kesadahan 6,5-8,5 o
C
h. Suhu 10 mg/lt
i. Zat Organik
12. Indeks Jentik Nyamuk <5 % Pustaka
no. 70
13. Kuantitas air bersih 60/org/hr Liter
14. Indikator vector:
Pustaka
a. Angka gigitan nyamuk <0,025 no. 112
Anopheles Spp. (MBR)
b. Larva Anopheles Spp. <1
c. Nyamuk Aedes Sp. resting <0,025
d. Larva Aedes Sp. ABJ >95%
e. Indeks pinjal khusus <1
124
f. Indeks pinjal umum <2

g. Kepadatan lalat <2
h. Kepadatan kecoa <2
Perilaku73
Indikator perilaku merupakan kegiatan yang
dilakukan oleh seseorang sehingga terhindar dari risiko
kesakitan lebih besar. Adapun beberapa kegiatan tersebut
antara lain:
Tabel 6.2. Indikator perilaku Hidup Sehat
No. Parameter Nilai patokan Satuan Keterangan
1. Persalinan nakes (tenaga Pustaka no.

kesehatan) 73
2. ASI Eksklusif
3. Balita timbang setiap bulan Baik 80-100

Cukup 60-79 %
4. Pengguna air bersih Kurang 40-
59
Rumah tangga mencuci
Buruk 0 - 39
tangan dengan sabun
5. Rumah tangga pengguna

jamban sehat
6. Rumah tangga memberantas

jentik
7. Rumah tangga makan sayur

dan buah setiap hari
8. Rumah tangga aktifitas

setiap hari
9. Rumah tangga tidak

merokok
Indikator perilaku semua dalam bentuk %, sudah

dibahas sebelumnya bagaimana cara mendapatkan nilai
prosentase, yang hakekatnya nilai proporsi x 100%.
Bagaimana cara analisis data tersebut, jika dianalisis
125
dengan statistik tetap nilai prosentase variabel yang

diteliti, sedangkan untuk analisis deskriptif bisa
digunakan kategorisasi yang sudah ada. (dijelaskan pada
analisis deskriptif)
Pelayanan kesehatan74, 75, 76

Pelayanan kesehatan merupakan indikator kinerja
kegiatan unit pelayanan kesehatan. Indikator ini penting
untuk menentukan tingkatan unit pelayanan kesehatan.
Penilaian indikator ini dilakukan secara mandiri oleh
Rumah Sakit (self assesment) adapun indikatornya
sebagai berikut:
Tabel 6.3. Indikator di Unit Pelayanan Kesehatan
No. Indikator Standard Satuan Keterangan
I Rumah Sakit
Indikator Pemanfaatan Rumah Sakit
1. Bed Occupancy Rate 60-85 % Pustaka no 74

(BOR)
2. Average Length of Stay 6-9 Hari

(AvLOS)
3. Turn Over Interval (TOI) 1-3 Hari
4. Bed Turn Over (BTO) 40-50 kali
5. Net Death Rate (NDR) <25 0 /¿ 00 ¿

6. Gross Death Rate (GDR) <45 0 /¿ 00 ¿
Indikator Kinerja Terpilih (IKT)
7. Ketepatan Identifikasi 100/bln % Pustaka no 75

Pasien dan 76 (lebih
lengkap)
8. Kepatuhan terhadap 100/bln %
Clinical Pathway
9. Kepuasan Pelanggan 80 %
126
10. Ratio PNBP terhadap 65 %

Biaya Operasional (PB)
II. Puskesmas
1. Kinerja Manajemen : Pustaka no 77

≥8,5 dan 78
a. Baik 5,5-8,4
b. Cukup <5,5
c. Kurang
2. Pelayanan Kesehatan:
>91
a. Baik 81-90 %
b. Cukup ≤80
c. Kurang
III. Target Program/Nasional
1. Angka Kematian Ibu 306 100 ribu Pustaka no.82

2. Angka Kematian Bayi 24 penduduk
3. Prevalensi Gizi Kurang 17
4. Prevalensi Stunting 28
5. Baduta 95 %
Kab/kota UCI 80%
Keterangan :
Bed Occupancy Rate (BOR) adalah persentase pemakaian tempat
tidur rumah sakit pada satuan waktu tertentu dengan rumus:
Jumlah hari perawatan rumah sakit
BOR= x 100 %
Jml Tempat Tidur x Jml Hari dalam periode
Average Length of Stay (AvLOS) adalah rata-rata lamanya pasien
dirawat di rumah sakit tersebut atau dengan kata lain setiap
pasien rawat nginap berapa lama dirawat.
Jumlah lama dirawat
AvLOS= x 100 %
Jml pasien keluar(hidup+mati )
Turn Over Interval (TOI) adalah rata-rata hari dimana tempat
tidur tidak digunakan yaitu rata-rata lama tempat tidur tersebut
tidak digunakan pasien rawat inap.
( Jml TTxJml Hari per periode )−Jml hari perawatan
TOI= x 100 %
Jml pasienkeluar (hidup +mati)
Jika dalam satu tahun periode=365 hari
127
Bed Turn Over (BTO) adalah frekuensi pemakaian tempat tidur

pada suatu periode waktu tertentu, biasanya satu tahun atau
dengan kata lain dalam waktu satu tahun berapa kali tempat tidur
tersebut digunakan oleh pasien.
Jml pasien keluar (hidup+ mati)
BTO= x 100 %
jmltempat tidur(TT )
Jika BTO rangenya 40-50 kali dalam satu tahun, maka ALOSnya
antara 5-6; sehingga perkiraan maksimal tempat tidur tersebut
digunakan oleh pasien selama satu tahun antara 200 sampai 300
hari, sisanya untuk pembersihan tempat tidur tersebut sebagai
TOI yaitu waktu dimana tempat tidur tersebut tidak digunakan.
Jika diasumsikan TOI 3 dan BTOnya 50 dan ALOSnya 6 berarti
tempat tidur tersebut digunakan selama 300 hari; tidak digunakan
sebanyak 150 hari itu secara makro mengartikan, masih tersisa
waktu 15 hari. Jika digunakan data riil, maka tidak aka nada
tersisa waktu hilang.
Kesehatan individu
Indikator individu digunakan untuk menentukan
derajat seseorang sakit atau mempunyai risiko terhadap
peyakit tertentu, adapun beberapa indikator antara lain:
Tabel 6.4. Indikator Individu Terhadap
Penyakit atau Risiko Penyakit
No. Indikator Standard Satuan Keterangan
I Status Gizi Balita
1. Berat Badan Menurut Pustaka no 79

Umur (BB/U):
>+2SD
a. Gizi Lebih ≥ -2 SD s/d+2SD
b. Gizi Baik < -2SD s/d ≥ -3SD
c. Gizi Kurang < -3SD
d. Gizi Buruk
2. Tinggi Badan Menurut
Umur (TB/U):
≥2 SD
a. Normal <-2SD
b. Pendek (Stunted)
128
3. Berat Badan per Tinggi

Badan (BB/TB)
>+2 SD
a. Gemuk ≥ -2 SD s/d+2SD
b. Normal < -2SD s/d ≥ -3SD
c. Kurus (wasted) < -3SD
d. Kurus sekali
4. Indeks Massa Tubuh Pustaka no 80
(IMT):
Untuk Wanita
<17
a. Kurus 17-23
b. Normal 23-27
c. Kegemukan >27
d. Obesitas
Laki-Laki <18
a. Kurus 18- 25
b. Normal 25-27
c. Kegemukan >27
d. Obesitas
BB
Rumus IMT= ; TB dalam meter
TB. TB
5. BB ideal (TB-100)±10%.(TB-100)
II. Biomarker
1. Urine :
1,5/24 jam lt Pustaka no 81
a. Volume 1,003-1,030
d. Berat Jenis 250-750/24 jam mg/dl
e. Asam urat ≤150/24jam
f. Protein 10/spesimen
160-180
g. Glucosa
2. Darah:
a. Asam Urat 3,4-7 mg/dl

1) Laki-laki 2,4-6
2) perempuan 2,0-5,5
3) anak-anak
b. Cholesterol darah
(total) <200 mg/dl
1) Normal 200-239
2) Sedang
129
3) Tinggi >240
c. Cholesterol LDL
(berbahaya):
1) Normal <100 mg/dl
2) Sedang 100-129
3) Batas Tinggi 130-159
4) Tinggi 160-189
5) Sangat tinggi >190
d. Trigliserida:
1) Normal <150 mg/dl
2) Batas tinggi 150-199
3) Tinggi 200-499
4) Sangat tinggi >500
e. Hipertensi:
Sistole/Diastole mm/Hg
1) Normal 120/80
2) Pre Hipertensi 120-139/80-89
3) Hipertensi ringan 140-159/90-99
4) Hipertensi sedang 160-179/100-109
5) Hipertensi berat 180-209/110-119
6) Hipertensi >210/>120 mg/dl
maligna 150.000-400.000 mikro lt
f. Trombosit 13,8-17,2 g/DL
g. Kadar Hb laki-laki 12,1-15,1 g/DL
h. Kadar Hb wanita
Catatan Vital statistik.

Nilai baku mutu/nilai standard itu sebagai nilai patokan untuk
membuat kategorisasi, nilai baku mutu/standard tersebut sebagai
cut point maksimal, sehingga kategorinya <... baik; >... kurang
baik; tetapi jika sudah ada kategorisasi teoritis maka yang
digunakan kategorisasi tersebut untuk statisitik deskriptif, tetapi
untuk analisis statistik gunakan data langsung hasil pengukuran.
Jika hasil pengukuran belum ada nilai standard atau
kategorisasinya, maka peneliti bisa menggunakan beberapa cara
dalam mendeskripsikan misal dengan menggunakan tendency
central misal mean dan nilai dispersi misal SD; atau
kategorisasinya digunakan kuartil jika 4 kategori, jika dua
kategori ≤mean atau >mean, jika ingin kategori lebih banyak
gabungan antara mean dan SD; misal x́ ± 1 SD normal; <-1SD
kurang; >1SD baik.
130
128
BAB VII. POPULASI DAN SAMPEL
Pendahuluan
Konsep dasar pemahaman populasi dan sampel menjadi dasar
filosofi paling mendasar pada statistika. Konsep ini sebagaimana
dijelaskan pada Bab I tentang populasi sampel diilustrasikan
ketika rasa masakan pada sendok sama dengan yang ada pada
panci, ini menunjukkan sampel hasil ukurnya sama dengan
populasi; sehingga menjadi rumus: “kalau kesimpulan yang
diambil dari data kecil (sampel) sama dengan data yang besar
(populasi); kenapa harus melakukan pengukuran pada data yang
besar, kalau kesimpulannya sama dengan data yang kecil”2.
Dengan demikian maka kesimpulan yang digunakan
merupakan kesimpulan pada populasi inilah yang disebut
generalisasi atau inferensi, inilah salah satu cabang statistik yaitu
statistik inferensial. Berbeda dengan epidemiologi yang disebut
epidemiologi analitik, karena digunakan untuk menentukan
kausalitas determinan yang menjadi faktor risiko suatu masalah
kesehatan, inilah yang bisa menjelaskan terminologi yang
berbeda antara statistik dan epidemiologi.
Prinsip dasar penelitian sampel, didasarkan pada filosofi
dasar statistik, karena kesimpulan dari sampel berlaku di
populasi, sehingga nilai sampel sama dengan populasi (unbiased).
Hal ini bisa terpenuhi jika sampel representatif (mewakili)
populasi yaitu ciri-ciri populasi sama dengan ciri-ciri sampel
dengan syarat sampel harus random artinya setiap anggota
populasi mempunyai kesempatan sama untuk menjadi anggota
sampel; tanpa random kesimpulan yang diambil tidak bisa
dipertanggungjawabkan secara statistik, mungkin secara science
bisa, dengan hanya mendeskripsikan data apa adanya tanpa
menarik kesimpulan pada populasi yang dimaksud107. Dengan
demikian penarikan sampling dengan cara non random
merupakan kesalahan fatal pada penelitian untuk estimasi dan
penarikan hipotesis.
Populasi homogen, berapapun besar sampel yang diambil
akan mencerminkan kondisi populasi. Pertanyaannya adalah
bagaimana jika populasi heterogen. Disinilah dibutuhkan suatu
prosedur tertentu yang sistematis untuk mendapatkan sampel
129
representatif, sehingga kesimpulan yang diambil pada sampel

mendekati nilai populasi (unbiased). Mungkinkah?
Konsekuensi penelitian sampel cenderung bias, dengan
demikian bagaimana kesimpulannya bisa
dipertanggungjawabkan. Disinilah konsep statistik ada risiko bias
yang bisa ditolerensi (α ¿ galat artinya kesimpulan yang diambil
kebenarannya tidak melebihi batas galat yang sudah ditetapkan.
contoh risiko bias 10%, dengan nilai rata-ratanya 50, maka
range kebenaran dari kesimpulan tersebut antara 45-55.
Hasil ini menunjukkan kebenaran yang diambil bukan nilai
tunggal, inilah yang dimaksud kesimpulan statistik bukan nilai
tunggal tetapi relatif, artinya peluang benar kesimpulan hasil riset
lebih besar dibandingkan salahnya. Itulah sebabnya kesimpulan
hasil riset yang menggunakan statistik sebagai instrumen analisis
menghasilkan “teori” bukan hukum.
Teori seringkali sesuai untuk situasi dan tempat tertentu,
tetapi untuk situasi dan tempat lain tidak sesuai. Berbeda dengan
hukum berlaku secara universal artinya dimana-mana sama misal
hukum grafitasi, hukum Newton dan hukum alam lainnya. Hal ini
disebabkan hukum alam bersifat tunggal, dengan gejala dimana-
mana sama.
Hasil penelitian sampel digunakan menarik kesimpulan di
populasi (inferensi). Hal ini sangat terkait dengan validitas hasil
riset tersebut, ada dua validitas yaitu validitas internal dan
validitas eksternal. Validitas internal yaitu validitas yang terkait
dengan kausalitas yang merupakan “conditio sine qua non”
artinya syarat mutlak bagi penarikan kausalitas. Dengan demikian
vailiditas ini sangat terkait dengan metodologi, prosedur
pengukuran, analisis data (keterkaitan statistik) yang benar.23
Analisis data yang harus benar itu meliputi persyaratan uji, skala
data dan besar sampel (meskipun dengan teknik bootstrap besar
sampel tidak berpengaruh lagi).23.
Validitas eksternal terkait dengan apakah generalisasi yang
dilakukan, menghasilkan hasil yang sama jika diterapkan pada
populasi yang berbeda. Pertanyaan dari pernyataan ini adalah
apakah penelitian bisa diulang hanya dengan berbeda lokasi
untuk mengetahui validitas eksternal. Secara konsep dibenarkan
sepanjang belum ada penelitian sejenis yang pernah dilakukan,
130
tetapi jika ada penelitian sejenis yang sudah dilakukan tinggal

membuat komparasi antara hasil penelitian tersebut, apakah
hasilnya sama atau berbeda, jika hasilnya sama maka penelitian
tersebut bisa menjadi teori baru, tetapi jika hasilnya berbeda itu
menjadi fenomena baru untuk dilanjutkan penelitian berikutnya.
Penelitian eksperimen pada hewan coba istilah yang
digunakan adalah replikasi (banyaknya unit sampel atau elemen
sampel yang diberi perlakuan) generalisasi eksternalnya pada
hewan coba yang lainnya, jika hasilnya sama secara berulang,
baru dilakukan uji klinis pada manusia secara terbatas. apakah
hasil tersebut bisa diekstrapolasi pada manusia.22
Metode sampel hanya digunakan pada penelitian
observasional dengan metode survei yaitu suatu metode yang
digunakan untuk mengamati kondisi populasi sebagaimana
adanya secara alamiah baik perorangan, institusi maupun obyek
fisik yang selanjutnya digunakan untuk membuat pernyataan
kuantitatif yang menggambarkan karakteristik populasi 22,43,44,45;
sedangkan untuk penelitian eksperimen digunakan istilah
replikasi.
Terminologi
Sampel merupakan bagian dari populasi dimana
pengukuran dilakukan. Namun beberapa istilah yang menjadi
bagian dari sampel perlu dijelaskan sebagai berikut2,22:
1. Populasi
Populasi dibagi tiga yaitu populasi sasaran (reference
population atau populasi target); populasi sumber dan populasi
eksternal. Populasi sasaran adalah keseluruhan subyek, item,
pengukuran yang ingin ditarik kesimpulannya oleh peneliti
melalui inferensi; populasi sumber adalah himpunan subyek
dari populasi sasaran yang digunakan sebagai sumber
pencuplikan; populasi eksternal adalah populasi yang lebih
luas atau diluar populasi sasaran tetapi peneliti masih berminat
membuat generalisasi55. Penerapan hasil riset tersebut bisa
diterapkan (validitas eksternal) pada populasi sumber dan
eksternal.
131
Contoh:
Penelitian tentang prestasi belajar mahasiswa yang aktif dalam
kegiatan kemahasiswaan di Fakultas Ilmu Kesehatan
Universitas “X”; maka jenis populasinya bisa dibagi menjadi:
a. Populasi sasaran: seluruh mahasiswa
yang aktif pada kegiatan mahasiswa di Fakultas Ilmu
Kesehatan Universitas “X” populasi ini yang menjadi
generalisasi riset.
b. Populasi sumber: seluruh mahasiswa
yang ada di Fakultas Ilmu Kesehatan Universitas “X”
c. Populasi eksternal: seluruh mahasiswa
yang aktif ada di Universitas “X”.
2. Unit sampel.
Adalah kumpulan individu yang berasal dari populasi yang
tidak saling tumpang tindih (mutually exclusive) atau dengan
kata lain mempunyai karakteristik/ciri-ciri tertentu23.
3. Elemen sampel
Adalah individu yang berasal dari populasi, dimana
pengukuran dilakukan kepadanya.
4. Sampling Frame
Adalah daftar populasi yang berisi daftar kelompok atau
individu penyusunnya.
5. Variabel
Adalah ciri-ciri yang melekat pada subyek yang diteliti dan
mempunyai variasi dari hasil pengukurannya. Adapun ciri
variabel harus dapat diukur (dikuantifikasi) dan hasil ukurnya
lebih dari satu.
6. Generalisasi.
Adalah upaya menarik kesimpulan dari data yang kecil
(sampel) untuk menggambarkan keadaan yang ada di
populasi
7. Random.
Adalah setiap anggota populasi mendapatkan chance
(kesempatan) yang sama untuk menjadi anggota sampel.
Prinsip dasar statistik adalah probability yaitu peluang

terjadinya suatu kejadian dari kesatuan sample space, pada uji
132
coba dengan mata uang atau dadu mempersyaratkan sisi sisi

yang baik, tidak boleh ada sisi yang lebih berat dibandingkan
sisi lainnya, kenapa…? Karena hal ini akan menghasilkan
peluang tidak sama untuk muncul sebagai kejadian. Inilah
sebabnya random menjadi sesuatu yang tidak boleh diabaikan
dari generalisasi statistik pada populasi.107
Random penerapannya pada sampling ini tetap dipegang,
sehingga pada penelitian dengan tujuan untuk generalisasi
populasi dengan teknik non random, tidak bisa
dipertanggungjawabkan hasil generalisasinya.
Guna memberikan gambaran yang lebih kongkret dari beberapa

pengertian di atas, dapat dibuat ilustrasi sebagai berikut :
“Penelitian ingin membuat prakiraan status gizi Balita di

Puskesmas “X” tahun 2020, ukuran yang dipakai untuk
menentukan status gizi adalah berat badan dan umur balita”.
Kasus tersebut digunakan sebagai dasar untuk menjelaskan

perbagian istilah sampel secara makro, adapun rinciannya sebagai
berikut:
1. Populasi.
a. Seluruh Balita yang ada di Puskesmas “X”
b. Seluruh Kepala Keluarga yang mempunyai Balita di
Puskesmas “X”
Pilihan di atas sangat tergantung pada data awal yang
tersedia di lapangan, jika peneliti mendapatkan jumlah
seluruh balita di Puskesmas “X”, maka populasinya pada
pilihan “a”, tapi jika data dilapangan yang ada adalah daftar
KK yang memiliki Balita, maka populasinya pilihan “b”
2. Sampel.
Sebagian Balita di Puskesmas “X”
3. Unit sampel.
KK yang mempunyai Balita, ingat pengertian unit sampel
yaitu sekumpulan individu, sehingga satu KK dengan KK
lainnya boleh jadi memiliki satu atau lebih dari satu Balita.
133
Jika KK yang mempunyai Balita lebih dari satu, terpilih jadi

anggota sampel maka semua Balita yang ada dalam KK
tersebut menjadi anggota sampel.
4. Elemen sampel.
Individu Balita di Puskesmas “X” yang akan dilakukan
pengukuran BB dan umurnya.
5. Sampling Frame
Daftar populasi, yang dipakai ada dua yaitu berdasarkan KK
yang punya Balita, berarti daftar populasinya nama KK yang
punya Balita berupa unit sampel, jika nama Balita yang
menjadi daftar populasi, maka yang dipakai adalah elemen
sampel. Penentuan sampling frame ini didasarkan pada hasil
studi pendahuluan, jika data yang tersedia nama KK, maka
unit sampel yang dipakai sbg sampling frame, tetapi jika
sebaliknya digunakan elemen sampelnya.
6. Variabel .
Ada dua variabel dalam penelitian ini, yaitu :
a. BB/U yang digunakan ratio keduanya.
b. Status Gizi, hasil kategorisasi atau pengelompokkan ukuran
BB/U.
Ada baiknya membuat variabel itu dari hasil pengukuran

langsung, bukan data yang sudah di kategorisasi. Data
kategorisasi bisa diakomodir di deskripsi data univariate
sedangkan data yang dianalisis digunakan data hasil pengukuran
langsung.
Kriteria sampel yang baik. 8,43,45

Tujuan teori penarikan sampel adalah efisiensi,
tanpa mengabaikan presisi (ketepatan) yaitu tingkat
ketelitian antara nilai populasi dan nilai sampel, dalam
menerapkan prinsip ini setiap prosedur penarikan sampel
selalu mempertimbangkan ketelitian dan biaya sebagai
konsekuensi dari pendekatan penentuan besar sampel,
persoalan kemudian muncul, ketika setiap penelitian
hanya menggunakan sampel sebagai data untuk penarikan
kesimpulan, untuk itu diperlukan pemahaman tentang
kriteria sampel yang baik, antara lain :
134
a. UnBiased/ tidak bias44

¿
Artinya nilai pada sampel (X) sama dengan nilai pada

¿ ¿
populasi ( μ ) , jika dirumuskan X = μ atau D=X − μ = 0 ,
bias selalu ada, pengaruh bias diabaikan jika selisih nilai bias
kurang dari 10%. Contoh hasil penelusuran sebanyak 500
Balita diberikan Makanan Tambahan selama tiga bulan untuk
menambah berat badannya, setelah itu ditimbang berat
badannya, diketahui ada peningkatan rata-rata 500 gr;
kemudian dilakukan pengamatan lima kali dan setiap kali
pengamatan secara acak diambil 10 balita, hasil perhitungan
rata-ratanya 495 gr8; bias ... ya, tetapi bias tersebut masih bisa
ditolerir jika dibandingkan dengan penelitian pada populasi.
b. Varians minimum
Suatu cara penarikan sampel dengan cara tertentu yang
dilakukan secara berkali-kali, menghasilkan varians paling
kecil itulah sampel yang baik, maka cara penentuan besar
sampel itulah yang terbaik. Varian minimum berkaitan dengan
karakteristik populasi yang tercermin pada sampel yaitu
sampel homogen, dengan demikian maka kesimpulan yang
diambil akan mendekati kondisi riil di populasi. Prinsip
pengambilan sampel, semakin homogen sampel, berapapun
banyaknya yang diambil akan mendekati kondisi populasi.
Jika dilihat dari pola grafik distribusi normal modelnya model
leptocurtic menjadi sampel yang baik. Dengan demikian,
maka pengambilan sampel sangat tergantung pada
karakteristik populasi.
c. Konsistensi.
Artinya jika besar sampel diperbesar terus hingga mendekati
¿
besarnya populasi, maka nilai sampel ( X ) akan mendekati

nilai populasi ( μ ) X́ ≅ µ
d. Sufficient (kecukupan)
135
Indikator secara definitif tentang kecukupan ini tidak ada,

pendekatan yang dipakai adalah jika kaidah penentuan besar
sampel sudah terpenuhi sudah dianggap sufficient.
Empat kriteria sampel yang baik di atas,

menimbulkan pertanyaan besar yaitu apakah bisa
dibuktikan. Dari keempat kriteria ada dua kriteria yang
pembandingnya nilai parameter yaitu un biased dan
konsistensi. Nilai parameter adalah nilai di populasi yang
tidak diketahui berapa besarannya, sedangkan riset
berbasis sampel.57
Bagaimana bisa diketahui kedua nilai ini. Secara
teoritis memang sulit untuk dibuktikan, karena penelitian
berbasis sampel, kecuali peneliti melakukan dua
penelitian sekaligus yaitu pada sampel dan populasi untuk
menentukan diantara teknik penentuan besar sampel,
mana yang lebih baik. Jika ini dilakukan maka bisa
diklarifikasi besar sampel berapa yang baik dipakai untuk
menentukan besar sampel.
Uraian di atas justru memperkuat pada satu ciri

utama yaitu karakteristik populasi, jika populasinya
homogen, maka berapapun besar sampel yang diambil
akan memberikan bias yang tidak signifikan, hal ini sama
dengan yang dikatakan oleh Cochran “jika nilai deviasi
sama pada dua populasi, besar sampel 500 dari ukuran
sampel 200.000 akan memberikan ketepatan yang sama
dengan perkiraan rata-rata populasi dengan besar sampel
500 dari ukuran populasi 10.000”.44
Teknik sampling
Istilah ini sering disederhanakan menjadi sampling adalah
suatu cara untuk mendapatkan sampel. Tekniknya dibagi dua
yaitu:
1. Random
Teknik ini mensyaratkan satu prinsip, yaitu menjamin setiap
anggota populasi mempunyai peluang yang sama menjadi
anggota sampel.
136
Ilustrasi sederhana, untuk menjamin peluang yang sama.

Satu kelompok arisan ibu-ibu, sebanyak 50 orang, maka yang
lazim dilakukan adalah menulis nama peserta pada kertas yang
sudah disediakan; kemudian kertas tersebut di linting dengan
cara rame-rame, sehingga setiap gulungan mempunyai besaran
yang tidak sama; langkah ketiga memasukkan lintingan kertas
ke dalam wadah tertentu, kemudian ditutup dengan kertas
yang dilobangi dengan diameter tertentu.
Catatan: arisan dilakukan setiap bulan; berarti ada 50 bulan
baru arisan tersebut selesai.
Pertanyaannya: apakah cara ini random
Guna menjawab pertanyaan tersebut, mari dilihat tahapan
arisan yang dilakukan:
Tahap 1: pemberian nama apakah dilakukan pada kertas yang
berukuran dan berjenis yang sama... ya/tidak
Tahap 2: apakah cara melinting kertas tersebut, dapat dijamin
besaran lintingannya sama ... ya/tidak
Tahap 3: apakah seiring dengan perkembangan waktu
lintingan kertas tersebut tidak mengalami pembesaran,
sehingga memungkinkan pembesaran tersebut melebihi
besaran lubang keluarnya ... ya/tidak
Jika semua dijawab ya... maka random, jika satu saja

jawabannya tidak, maka cara tersebut tidak random,
bagaimana supaya ada jaminan sama semua... lintingan kertas
tersebut harus dimasukkan pada sedotan air minum yang sama.
Baru dapat dikatakan setiap peserta arisan mempunyai peluang
yang sama untuk keluar, inilah random.
Dengan demikian random dapat menjamin keterwakilan
populasi (representatif) terhadap sampel yang diambil, itulah
sebabnya hanya cara random yang bisa digunakan sebagai
dasar penarikan kesimpulan pada populasi.
Adapun beberapa cara pengambilan sampelnya:

a. Simple Random Sampling (SRS)
Metode ini dilakukan dengan cara mengambil
sejumlah n sampel dari N populasi, sehingga setiap N
mempunyai peluang sama untuk menjadi n; dengan notasi
137
C Nn . Peneliti harus mempunyai sampling frame yaitu daftar

populasi dari 1 sampai N. Sampel yang diambil merupakan
bagian dari anggota populasi yang terpilih menjadi anggota
sampel.
Dua cara yang dapat dilakukan dengan metode ini
yaitu:
1) Bilangan random
Bilangan random merupakan tabel yang mempunyai
susunan angka secara acak guna mempertahankan
“equal probability”
Contoh:
Penelitian pada 1000 Balita di satu ecamatan “A”, maka
peneliti menentukan besar sampel (minimal sampel
size) dengan rumus besar sampel tertentu, katakanlah
besar sampel ketemu 50 Balita. Maka peneliti membuat
sampling frame dari no. 0001 sampai 1000 (karena 4
digit), peneliti mengambil tabel bilangan random (lihat
lampiran 1), melempar pensil secara acak pada tabel
tersebut. Dari nokhtah (titik) yang dibuat oleh pensil
tersebut, dimulailah penentuan n1 (sampel ke satu),
kedua, ketiga sampai ke 50 sebagaimana besar sampel
yang dimaksudkan. Sebagai contoh
Misal deretan tabel bilangan random sebagai berikut:
001201 234019 010325 000123 021780
660012 021340 000120 127658 012030
Katakanlah tanda panah sebagai nokhtah, dengan cara

melemparkan pensil (katakanlah) secara acak, maka
sampel n1 0012 (sampel no 12 pada sampling frame),
yang kedua ambil empat angka di depan yaitu 6600,
angka ini melebihi 1000 (jumlah populasi) maka tidak
memenuhi syarat, dilanjutkan nomernya secara vertikal
tanpa dilewati sampai angka paling bawah (catatan
tidak boleh empat angka tersebut melewati 1000),
138
melompat ke kolom ke dua; karena 2340 melebihi 1000,

maka dilewati, lanjut ke kolom ke dua baris kedua
0213, maka diambil dua angka terakhir yaitu sampel 13
(berarti sampel terambil no 13 pada sampling frame)
begitu seterusnya sampai peneliti mendapatkan 50
sampel atau n50.
Bagaimana jika pensil turun pada baris terakhir,
sedangkan besar sampel belum diperoleh, maka peneliti
naik ke baris pertama pada tabel bilangan random dan
dilanjutkan secara vertikal. Sebenarnya mau
menggunakan alur verikal atau horisontal pada tabel
bilangan random tidak masalah asal konsisten.
2) Undian
Cara ini paling banyak dilakukan karena dua alasan
yaitu lebih sederhana dan secara sosiologis masyarakat
Indonesia terbiasa menggunakan cara undian lewat
budaya arisan.
Peneliti membuat sampling frame terlebih dahulu
nomer 0001 sampai dengan 1000, baru lintingan kertas
yang dimasukkan ke dalam sedotan untuk membuat
peluang sama, sebanyak no 0001 sampai 1000; baru
dikocok satu persatu sampai mendapatkan n50. Nomer
yang keluar dari kocokan itu menjadi anggota sampel,
sedangkan individunya menyesuaikan dari sampling
frame yang ada.
Cara mendapatkan besar sampel, secara praktis dilebihkan

guna antisipasi kendala di lapangan yang seringkali di luar
jangkauan peneliti. Misal responden yang didatangi lebih
dari tiga kali tidak ketemu, kemudian diambillah sampel
cadangan untuk menutupi kekurangan tersebut, kegunaan
yang lain adalah untuk mengatasi data ekstrim (far outlier).
Data ekstrim sangat mengganggu dalam penarikan
kesimpulan, karena bias yang ditimbulkan, dengan
demikian cenderung dikeluarkan dari analisis, untuk diganti
dengan data lain yang masih dalam satu kali penarikan
sampel secara random.
139
Berapa besaran kelebihan penarikan sampel, secara umum

diambil antara 10-20%; misal jika hasil perhitungan
minimal sampel size = 50 (besar sampel), maka cara
random yang diambil 55-60 sampel, meskipun yang
dianalisis 50, bagaimana kalau dilebihkan dari 60?
Boleh saja, karena prinsip konsistensi mengatakan semakin
besar sampel semakin mendekati nilai populasi,
argumentasi yang lain rumus besar sampel adalah sampel
minimal, jadi boleh diambil lebih.
Ada beberapa kelebihan dan kelemahan dari pendekatan

ini :
Kelebihan:
Bias kecil karena populasi homogen, pelaksanaan
samplingnya sederhana.
Kelemahan:
Dibutuhkan daftar lengkap dari populasi, dan seringkali
jarang ditemui
b. Systematic Random Sampling (SyRS)

Persyaratannya sama dengan simple random sampling,
teknik lebih sederhana dan mudah dibandingkan simple
random sampling. Tehnik ini didasarkan pada urutan
sampel ke”i”. Urutan sampel ke “i” didasarkan hasil
pembagian antara banyaknya populasi dan besar sampel
yang sudah ditentukan sebelumnya melalui perhitungan
N
ni =
rumus besar sampel, dengan rumus n .
Cara menentukan ada dua cara yang dilakukan (disinilah
yang menentukan random tidaknya teknik sampling ini),
yaitu :
1) Semua anggota populasi dimasukkan dalam tempat
undian yang sama. Misal anggota populasi 1000; maka
peneliti membuat sampling frame nomer 0001 sampai
1000, kemudian membuat undian nomer 0001 sampai
1000 (sebagaimana SRS).
140
Langkah selanjutnya menentukan sampel pertama (n1),

dengan cara mengundi. Nomer yang keluar sebagai n1.
Langkah selanjutnya sampel kedua, ketiga dan
seterusnya tidak perlu dikocok, tetapi ditentukan
melalui kelipatan ke “i”; misal N=1000 dan n=50 maka
kelipatannya 20; misal n1=200; maka n2=220; n3=240;
begitu seterusnya. Apabila sudah sampai ke 1000
sampel masih kurang maka diteruskan pada sampel 1,
dengan hitungan kelipatan yang sama.43Cochran
menyebutkan penyusunan sampling frame tidak vertikal
tetapi berbentuk lingkaran. Ini hanya pembahasaan saja,
tetapi substansinya sama.
2) Didasarkan pada minimal sampel size.
Misal minimal sampel size hasil perhitungan besar
sampel sebanyak 50, maka peneliti membuat undian
dari nomer 1 s/d 50, kemudian diundi untuk menjadi
sampel ke 1, selanjutnya menentukan n2, n3 dan
seterusnya mengikuti kelipatan yang ada.
Dari kedua cara berikut, bisa ditelaah mana yang random.

cara pertama memberi kesempatan yang sama semua
anggota populasi untuk menjadi n1; sedangkan cara kedua
nomer responden dari 0051 sampai dengan 1000, tidak
mempunyai kesempatan yang sama untuk menjadi n1.
Dua cara inilah yang kemudian menjadi dua pendapat,
bahwa systematic sampling tersebut tidak random (cara
kedua), sedangkan yang lainnya random (cara pertama)47
Kelebihan
Sebaran subyek yang terpilih lebih merata, sehingga
keterwakilan populasi lebih baik; bias manusia lebih kecil;
lebih sederhana dibandingkan simple random sampling.
Kelemahan
Jika daftar populasinya disusun tidak acak atau dengan tata
urutan tertentu, maka ada kecenderungan yang terpilih
kelompok tertentu.
141
Misal disusun daftar populasi ganjil laki-laki dan genap

perempuan; jika yang keluar ganjil, maka sampel urutan
kesekian berikutnya akan cenderung pada kelompok
tertentu. Pada contoh 1 cenderung genap maka sampel ke
“i” akan genap terus, begitu juga sebaliknya.47
Catatan:
Teknik SRS dan SyRS adalah elemen atau unit sampel ada
di dalam daftar populasi (sampling frame) artinya apa,
sampel tersebut benar-benar bagian dari populasi. Pada
penelitian kesehatan atau kedokteran dimana pasien unit
pelayanan kesehatan menjadi sampel atau menghadapi
pasien yang bergerak. Boleh jadi pasien yang diambil
bukan bagian dari populasi, karena pasien tersebut pasien
baru, berada di luar wilayah kerja unit pelayanan kesehatan,
terus pengambilan sampelnya non random. Apakah ini
masuk bagian dari sampel atau bagaimana cara menentukan
subyek sampel yang bergerak seperti ini.
Apakah random bisa juga diterjemahkan peneliti tidak
memilih secara subyektif dari subyek sampel yang ada, ada
beberapa prinsip umum pada sampling, sehingga
kesimpulan yang diambil melalui analisis statistik,
menggambarkan kondisi di populasi, prinsip dasar tersebut
antara lain:
1. Jika populasi homogen, maka berapapun besar sampel

yang diambil hasilnya akan sama dengan nilai populasi
(model grafik leptocurtic, atau mesocurtic)
2. Upaya menghomogenkan populasi bisa dilakukan
dengan cara menentukan kriteria inklusi pada sampel
yang diambil
3. “jika nilai deviasi sama pada dua populasi, besar sampel
500 dari ukuran sampel 200.000 akan memberikan
ketepatan yang sama dengan perkiraan rata-rata
populasi dengan besar sampel 500 dari ukuran populasi
10.000”.44
4. Jika diasumsikan bahwa sampel merupakan bagian dari
populasi dimana pengukuran dilakukan; maka
142
konsekuensinya harus ada sampling frame daftar

populasi, sehingga ketika dilakukan random, maka yang
terambil adalah subyek yang ada di dalam daftar
populasi tersebut.
Jika kita memahami sampling frame dalam bentuk fisik
adanya daftar populasi, maka untuk sampel yang
bergerak seperti di unit pelayanan kesehatan, akan
kesulitan tersendiri, karena pasien yang datang belum
tentu pasien lama yang pernah berobat, tetapi pasien
baru yang tidak ada dalam sampling frame.
Empat kaidah di atas dijadikan dasar untuk membuat

asumsi-asumsi sebagai berikut:
Asumsi pertama
Besaran populasi untuk menentukan besar sampel
ditentukan berdasarkan data tahunan jumlah pasien
penyakit tertentu yang akan diteliti; bisa juga selama tiga
atau lima tahun (asumsi epidemiologi fluktuasinya relatif
stabil), kemudian di rata-rata maka ketemu berapa jumlah
pasien katakanlah “X”, maka “X” tersebut dijadikan
populasi (N) sebagai dasar untuk menentukan minimal
sample size. (jika rumus besar sampel digunanakan N).
Dengan demikian maka peneliti sudah mengetahui daftar
populasi imajiner yang ada di unit pelayanan kesehatan
tersebut, tanpa harus membongkar semua catatan medis
yang ada.
Penelitian sering dibatasi oleh waktu, untuk itu bagi
mahasiswa perlu diperhatikan berapa jumlah kasus yang
diteliti dalam periode waktu tertentu, jika cukup besar,
maka tidak ada masalah; jika terlalu sedikit maka wilayah
penelitiannya bisa diperluas.
Asumsi kedua
Menjawab pertanyaan siapa pasien yang jadi subyek
penelitian?
Berdasarkan prinsip sampel bagian dari populasi, maka
sambil melakukan pemeriksaan, peneliti hanya mencari
pasien lama yang pernah berkunjung; kapan terakhir kali
143
kunjungan (bisa dilihat pada catatan medis Puskesmas),

pasien baru di screening untuk tidak masuk dalam subyek
penelitian.
Langkah berikutnya untuk mendapatkan sampel bisa
dilakukan dengan mengambil pasien lama yang datang ke
unit pelayanan kesehatan dalam periode waktu tertentu,
bisa model systematic random sampling yaitu kelipatan
N
tertentu dengan rumus
n
Dengan penjelasan N= rata-rata pasien satu tahun, n= besar
sampel yang dihitung menggunakan rumus minimal sample
size tertentu. Bisa juga menggunakan teknik ganjil genap
untuk random kelompok kontrol dan perlakuan.
Jadi peneliti bidang kesehatan ataupun kedokteran tidak
perlu teknik sampling yang digunakan non random seperti
accidental, purposive, karena statistik yang digunakan tidak
bisa digeneralisasikan ke populasi. Begitu seterusnya
sampai besar sampel terpenuhi.
Jika systematic random sampling yang dijadikan acuan,
bagaimana cara menentukan n1; hal ini dapat dilakukan
dengan cara menentukan kriteria inklusi; misal jika dalam
satu minggu pengamatan pertama ada pasien dengan
“penyakit X”, maka itulah yang dianggap n1.
Subyek silahkan dipilih sebagai pasien baru saja atau pasien

lama (untuk menghindari bias sampling) sangat tergantung
dari jenis penelitian; jika penelitian melihat dampak
akumulasi efek obat, maka yang diambil pasien lama; tetapi
jika peneliti ingin memberi perlakuan baru, dengan
memperkecil pengaruh variabel lainnya, maka yang
digunakan pasien baru.
Upaya pendekatan ini dilakukan, masih lebih baik daripada

pilihan sampel non random yang dilakukan pada banyak
penelitian bidang kesehatan yang pada akhir dipertanyakan
generalisasi ke populasi yang mana, padahal kesimpulan
analisis statistik bukan berlaku di sampel, tetapi berlaku di
144
populasi. Dengan pendekatan tersebut maka populasi

dimaksud lebih jelas, sehingga generalisasinya juga jelas.
c. Stratified Random Sampling (StRS)

Teknik sampling sebelumnya mempersyaratkan
populasi homogen. Bagaimana jika populasi heterogen,
maka cara pengambilan sampelnya harus memperhitungkan
karakteristik populasi, sehingga kesimpulan yang diambil
benar-benar menggambarkan karakteristik populasinya.
Teknik samplingnya ada dua yaitu StRS dan cluster
random sampling (CRS) yang akan dibahas sesudahnya.
Beberapa ciri yang bisa digunakan untuk
menunjukkan ciri teknik StRS antara lain: Populasi terdiri
dari beberapa kelompok yang mempunyai ciri-ciri yang
sama, perbedaan antar strata besar, sedangkan perbedaan di
dalam strata relatif sama.
Definisi yang digunakan mengambil dari elementary
sampling theory yang mengatakan proses pengambilan
sampel dari populasi yang sudah dibagi dalam strata
(kelompok yang mempunyai ciri yang sama), kemudian
memilih sampel secara sederhana dari setiap strata dan
menggabungkan menjadi satu sampel yang digunakan
untuk menaksir parameter di Populasi.48,49
Tahapan menentukan pengambilan sampel model ini
dibagi beberapa tahapan yaitu : tahap 1 populasi dibagi
menjadi beberapa strata (sub populasi) yang mempunyai
ciri-ciri yang sama, sehingga tidak ada antar sub populasi
saling tumpang tindih. Misalkan populasi N, maka sub
populasinya N1, N2, N3.. Nn, dengan demikian N1+N2+N3..+
Nn= N; tahap 2 sampel diambil di setiap strata secara
terpisah, sehingga masing-masing strata mempunyai sampel
n1, n2, n3..nn, maka jika dijumlahkan n1+ n2+ n3..+nn= n;
tahap 3, penaksiran populasi didasarkan hasil analisis pada
sampel yang diperoleh.
Beberapa cara yang digunakan untuk menentukan
pengalokasian berapa besar subyek sampel yang diambil
setiap strata setelah besar sampel ditemukan, antara lain:
a. Alokasi sembarang
145
Besar sampel yang sudah ditentukan melalui

perhitungan rumus minimal sample size, dibagi dalam
masing-masing strata oleh peneliti secara sembarang,
ketentuan yang diambil cuma satu yaitu masing-masing
strata minimal dua subyek. Dua subyek ini
dimaksudkan bisa diperoleh variasi dalam satu strata.
Cara ini tidak di sarankan untuk digunakan, karena
prinsip representatif sampel kurang terpenuhi.
b. Alokasi proporsional
Dasar alokasi ini disebabkan karena prinsip
representatif dalam keterwakilan anggota strata pada
sampel secara umum, jika anggota strata besar maka
besar sampelnyapun juga berbanding lurus.
Metode ini paling banyak digunakan karena lebih
sederhana, cost relatif rendah karena berada dalam
strata yang sama, adapun rumusnya sebagai berikut:
Ns
n s= . n ;
N
n s sampel setiap strata ;
N s banyaknya subyek pada setiap st rata;
N banyaknya populasi n besar sampel
Contoh :
Penelitian tentang hipertensi di suatu rumah sakit,
diketahui seluruh penderita hipertensi (N) 200 orang,
jika hasil perhitungan besar sampel diketahui 50 orang,
dan dibuat stratifikasi pada penderita hipertensi sebagai
berikut:
Tabel 7.1. Kategori Hipertensi
Kategori Frekuensi Alokasi sampel

hipertensi
Ringan 100 100
x 50=25
200
Sedang 75 75
x 50=18,75=19
200
146
Berat 25 25
x 50=6,25=7
200
Jumlah 200 51
d. Cluster Random Sampling (CRS)

Sampling dengan cara ini dilakukan berdasarkan
kelompok (rumpun), ciri-cirinya antar rumpun mempunyai
variasi yang kecil sedangkan di dalamnya mempunyai
variasi yang besar.
Metode ini dipilih jika sampling frame elemen sampel
tidak dimiliki atau terlalu mahal untuk mendapatkannya.
Sampling ini menjadi solusi cukup baik dengan presisi yang
baik untuk menjelaskan gambaran populasi, karena peneliti
lebih mudah mengambil sampel dalam satu lokasi tertentu
yang menjadi sampel penelitian, peneliti lebih bisa
memahami karakteristik subyek lebih dalam jika peneliti
tinggal bersama mereka beberapa saat.
Beberapa contoh rumpun misal kepala keluarga yang
mempunyai elemen suami, istri, anak, pembantu, rumpun
puskesmas yang mempunyai variasi penyakit, RT yang
mempunyai rumpun karakteristik elemen yang bervariasi
baik pendidikan, pekerjaan, sosial ekonomi, pola penyakit
dll. Pertimbangan lain penarikan sampling ini adalah
peneliti tidak mempunyai informasi awal yang cukup
tentang karakteristik populasi secara spesifik, subyek yang
berada di dalam rumpun akan menjadi anggota sampel22.
Dua metode yang bisa dilakukan yaitu Metode One-
Stage Cluster Sampling dimana populasi dibagi menjadi
rumpun-rumpun wilayah, kemudian seluruh elemen atau
individu yang ada di dalamnya menjadi anggota sampel;
sedangkan metode Two-Stage Cluster Sampling dilakukan
dalam dua tahap, yaitu tahap pertama, memilih beberapa
rumpun dalam populasi secara acak sebagai sampel dan
tahap kedua memilih elemen dari tiap rumpun terpilih
secara acak. Jadi dari rumpun yang luas kemudian diambil
sampel elemen yang ada secara lebih terbatas47,50.
Kelemahan teknik sampling ini adalah karakteristik
subyek penelitian antar rumpun heterogen antara satu
147
rumpun dengan rumpun lainnya relatif homogen. Untuk

mengatasi hal tersebut, maka peneliti harusnya ekstra hati-
hati di dalam membuat kategorisasi rumpun, semestinya
dilakukan secara bertahap
Jika rumpun satu pedesaan yang sama, kemudian
dibagi per RW atau RT, maka karakteristiknya relatif sama,
tetapi jika rumpunnya antara kota dan desa; maka harus
dilakukan secara bertahap. Pertama dipisah antara kota dan
desa; kemudian kota dibagi menjadi perumahan dan non
perumahan, daerah slum (kumuh) dan urban; sedangkan
desa juga dibagi berdasarkan karakteristik yang relatif
sama. Dengan demikian gambaran populasi juga akan
terwakili berdasarkan rumpun tersebut.
e. Multystage random sampling (MRS)

Cara ini merupakan perpaduan dari berbagai cara yang
sudah disebutkan di atas, cara ini dilakukan pada populasi
yang heterogen dan tersebar luas, sehingga dibutuhkan
kombinasi untuk mendapat sampel yang representatif
2. Non Random50,51,52,53
Istilah ini digunakan untuk menggambarkan cara
mendapatkan sampel yang tidak menggunakan pertimbangan
representasi dari populasi, untuk itu maka generalisasi pada
populasi tidak bisa dilakukan. Bagaimana dengan hasil
penelitian cara non random, kesimpulan yang diambil hanya
menggambarkan sampel data saja dan statistik yang digunakan
hanya menjelaskan kondisi sampel, bukan pada populasi. Ada
beberapa cara pengambilan sampel ini yaitu:
a. Accidental/convenience sampling
Sampling ini didasarkan pada upaya peneliti untuk
mendapatkan sampel mengalami kesulitan, karena sampel
yang dimaksud jarang terjadi atau merupakan fenomena
baru, sehingga begitu mendapatkan subyek penelitian yang
sesuai yang akan diteliti, maka akan diteliti sebagai sampel;
atau hasil pengamatan orang lain yang melihat fenomena
baru, kemudian dirujuk ke lembaga riset yang ada,
148
kemudian dilakukan eksplorasi lebih mendalam; contoh:

saat pertama kali ditemukan kasus Aids.
Meskipun metode ini juga bisa disebut sebagai
metode seketemunya, tetapi peneliti bisa mendekati dengan
mengambil kelompok yang mempunyai faktor risiko lebih
besar; seperti penelitian pada Aids, kelompok yang berisiko
misal pengguna Narkoba, Sopir luar kota dll.
b. Purposive sampling
Teknik sampling yang digunakan oleh peneliti yang
disesuaikan dengan tujuan/kriteria yang sudah ditetapkan
oleh peneliti. Lagi-lagi sampling ini mengingat populasinya
sangat sedikit.
Teknik ini berbeda dengan kriteria inklusi; jika
kriteria inklusi populasi yang besar, dibatasi dengan kriteria
inklusi yaitu batasan yang diberlakukan peneliti terhadap
subyek yang diteliti. Hasil pembatasan inilah yang
kemudian menjadi populasi terjangkau untuk menentukan
besar sampel.
c. Quota sampling
Cara mendapatkan sampel dengan menggunakan
target tertentu; misal seorang calon bidan bisa diangkat
menjadi bidan, jika sudah melakukan pertolongan partus
normal sebanyak 50 persalinan.
d. Snow Balling
Cara pengambilan sampel seperti bola salju, bermula
dari sedikit, kemudian menjadi banyak artinya peneliti
berangkat dari satu informan utama baik pelaku atau orang
terdekat yang mengetahui kasus tersebut, baru kemudian
menanyakan kepada informan pertama siapa yang
dikenalnya mengalami kasus tersebut, demikian seterusnya
sampai peneliti yakin bahwa kasus yang lain mempunyai
tipikal yang sama dengan kasus lainnya.
Sampel non random ini sebaiknya digunakan untuk penelitian

fenomenologis ataupun kualitatif yang kasus sedikit sekali, butuh
pendekatan emosional, sehingga perlu dilakukan pendekatan
149
secara pribadi ataupun peneliti ingin mengetahui kronologis suatu

kejadian kasus.
Besar sampel
Besar sampel merupakan salah satu prinsip dalam kriteria
sampel yang baik yaitu kecukupan (sufficient). Tujuan utama
penentuan besar sampel ini antara lain; satu keterwakilan
populasi dirasakan cukup secara kuantitatif, kedua kebutuhan
analisis statistik ketiga inferensi di populasi dan keempat
pertimbangan efisiensi dari sisi pengelolaan sumberdaya peneliti.
Pendekatan penentuan besar sampel cukup beragam, jika
dilihat dari tujuannya digunakan untuk estimasi parameter dan
penarikan hipotesis inilah inferensi pada populasi; penggunaan
rumus minimal sample size digunakan untuk dua tujuan utama
tersebut yaitu estimasi, uji hipotesis, keduanya sangat tergantung
dari jenis datanya, apakah kontinyu atau proporsi.
Begitu banyaknya rumus besar sampel yang dikemukakan
oleh para ahli statistik, penulis mempertimbangkan untuk
beberapa jenis saja yang sering berkaitan dengan riset yang
dilakukan. Beberapa jenis rumus penentuan besar sampel sebagai
berikut:
1. Estimasi
Nilai parameter( μ)yang tidak diketahui besarannya ditaksir
berdasarkan nilai sampel ¿) yang diperoleh dari hasil riset.
Penaksiran ini bisa rata–rata atau nilai keragaman. Estimasi ini
besar sampelnya menggunakan pendekatan teknik sampling.
Adapun penjabaran rumusnya:
a. Data kontinyu
1) Simple or systematic random sampling
Data ini diperoleh dari hasil pengukuran, adapun
penjelasannya sebagai berikut2,47:
Pendekatan yang digunakan didasarkan pada nilai
2
varian/ σ nilainya diperoleh dari hasil penelitian
sebelumnya atau hasil studi pendahuluan. Perhitungan
rumus didasarkan pada toleransi galat (error) yang ada
(Bound on the error). Rumus yang dipakai57 :
150
2
Nσ
n=
( N−1) D + σ 2
dimana:
n = Besar sampel hasil perhitungan.
N= total populasi yang ada.
2
σ = varians atau SD2; SD/ σ simpangan deviasi; jika
SD tidak diketahui bisa juga diperoleh dengan cara22
σ =
max−min
4
2
D= B /4, dimana B adalah Bound on the error yang sangat
tergantung dari nilai α (alpha) yang ada, jika α= 5% ,
maka CI 95 % sehingga pada distribusi normal akan
diperoleh nilai Z=1,96, dibulatkan menjadi 2, turunan
rumusnya akan menjadi :
σ 2 N −n
σ =
X
2
¿
n N −1 [ ] , sedangkan B = 2σ ; dari dua

persamaan tersebut, gabungkan pada rumus B, maka akan
menghasilkan rumus:
σ 2 N −n
B=2
√
n N −1 ( ), untuk menentukan “n”, kuadratkan
masing-masing sisi, yang hasilnya sebagai berikut:
σ 2 N−n B 2 σ 2 N−n
B 2 =4 x ( )
n N−1
atau = ( )
4 n N−1
B
2
σ 2 ( N−n)
Jika D = maka D=
4 n (N −1)
2
n ( N −1) D = σ ( N−n )
n ( N −1) D = σ 2 . N − σ 2 n
n (N −1) . D + nσ 2 = N . σ 2
n [ ( N−1 ) D + σ 2 ] = N . σ 2
N . σ2
n=
[ ( N −1 ) D + σ 2 ]
151
nilai B hakekatnya seberapa jauh batas kesalahan

ditoleransi, jika CI 68%, maka nilai B= σ , untuk CI 90%
nilai B=1,64. σ
Contoh soal22:
Seorang peneliti ingin menaksir rata-rata berat badan
neonatus di populasi. Peneliti kurang memiliki informasi
yang cukup berapa besar varian yang ada di populasi
maupun di hasil penelitian sebelumnya. Bila diketahui
laporan klinik bersalin selama tiga tahun terakhir diketahui
BB neonatus terendah 2.000 gram dan tertinggi 3500 gram,
sedangkan populasi neonatus sebanyak 3.000. tentukan
besar sampel yang diperlukan untuk menaksir rata-rata di
populasi (μ ), jika batas risiko kesalahan penaksiran (B)
neonatus 125 gram.
Perhitungannya sebagai berikut:
BB max−BBmin Neonatus 3500−2000
σ= = =375
4 4
Mencari nilai varian dengan cara mengkuadratkan SD/σ ,
sehingga nilainya σ 2=3752=140.625;
2 2 ❑
B 25
D= ¿ =156,25 , nilai yang ada sudah diketahui,
4 4
maka dimasukkan ke dalam rumus besar sampel:
N σ2 3000 x 140.625
n= =
2 (3000−1) x156 , 25+140 . 625
( N−1 ) D + σ
421.875 .000 421.875 .000

n= = =692,4=693
468.593,75+140.625 609.218,75
Sampel yang diambil 693 neonatus (pembulatan ke atas

menggunakan prinsip konsistensi)
2) Stratified random sampling

Penentuan besar sampel dengan teknik strata
memberikan pengalokasian secara proporsional
152
keterwakilan populasi pada sampel, adapun rumus besar

sampelnya sebagai berikut52:
L
L ∑ N 2i .σ 2i
i=1
n= L ; L= banyaknya stratum; Ni=
2 2
N . D+ ∑ N i . σ i
i=1
banyaknya sub populasi ke i; N= banyaknya populasi
B2
keseluruhan; σ i2 varian populasi ke i; D= ; w i= fraksi
4
pengamatan yang dialokasikan ke stratum ke i atau dengan
bahasa lebih mudah proporsi antara stratum dengan
keseluruhan.
Contoh soal:
Penelitian tentang kinerja Puskesmas lintas strata baik,
sedang dan jelek. Peneliti ingin menaksir rerata kinerja
organisasi Puskesmas di populasi Puskesmas. Unit
samplingnya Puskesmas, indikator yang digunakan kinerja
Puskesmas dengan format penilaian Balance skore card,
hasil kategorisasi dari penelitian sebelumnya dapat
digambarkan sebagai berikut:
Tabel 7.2. Kategorisasi Puskesmas di Propinsi “X”
Kategori Strata ke i Ni variansσ i2

Puskesmas
Strata baik 1 100 10
Strata sedang 2 300 12
Strata kurang baik 3 600 5
Jumlah 3 1.000
Keterangan : jika diketahui nilai B=0,5, maka
B2 0,52
D= = =0,06; sedangkan N 2.D=10002 .0,06=60.000
4 4
153
Guna memudahkan perhitungan, dibuatlah tabel

berdasarkan rumus yang sudah ada:
Tabel 7.3. Hasil Perhitungan Rumus
Strata Ni Ni2 σ i2 N 2i . σ 2i Ni.σ i2

1 100 10.000 10 100.000 1.000
2 300 90.000 12 1.080.000 3.600
3 600 360.000 5 1.800.000 900
Jumlah 2.980.000 5.500
Berdasarkan hasil perhitungan yang sudah dilakukan, maka

besar sampelnya:
L
L ∑ N 2i .σ 2i
i=1 3.2.980 .000 8.940 .000
n= L
= = =136,49
2 2 60.000+5.500 65.500
N . D+ ∑ N i . σ i
i=1
Besar sampel yang diambil dibulatkan 137
Puskesmas.bagaimana pengalokasian terhadap masing-
masing strata, dengan perhitungan sebagai berikut:
Tabel 7.4. Alokasi Besar Sampel Tiap Strata
Kategori Strata Ni n
Puskesmas ke i
Strata baik 1 100 100
x 137=13,7=14
1.000
Strata sedang 2 300
Strata kurang baik 3 600 42
83
Jumlah 3 1.000 139
Besar sampel pada setiap strata sampel menjadi naik dari

hasil perhitungan besar sampel sebelumnya, disebabkan
pembulatan keatas.
154
3) Cluster random sampling

Besar sampel dengan metode ini dengan unit analisis
kelompok beragam dalam satu kelompok misal wilayah
RT, RW atau desa, jika cluster tersebut terambil, maka
elemen sampel dalam satu cluster tersebut menjadi anggota
sampel. Adapun rumusnya sebagai berikut22:
N . σ2 B2 . X́ 2
n= ; dimana D= ;dimana X́ rata-rata
N . D+σ 2 4
elemen sampel yang ada di keseluruhan kluster.
Contoh soal:
Penelitian di suatu Kabupaten “X” terdiri dari 600 RW
ingin mengetahui berapa rata-rata stunting Balita, salah satu
ukuran stunting yang digunakan adalah tinggi badan, dari
data sekunder yang ada rata-rata satu RW terdiri dari 5 RT
dengan varian stunting 5; berapa besar sampel yang diambil
kluster RW, jika nilai B=0,05 (diambil dari nilai risiko
kesalahan 5%)
Diketahui:
N=600 RW; σ 2=5; B=0,05 dan X́ =5,
0,052 .5 2
maka D= =0,02, maka besar sampel untuk kluster
4
bisa dihitung:
N . σ2 600.5 3.000
n= 2
= = =208,7
N . D+σ 600. 0,02+5 14,38
Besar sampel yang diambil 209 RW
Pendekatan lainnya dengan mengkombinasikan antara nilai

Proporsi kejadian tertentu dengan jumlah kelompok yang
ada. Kelebihan cara ini adalah mengkombinasikan
prevalensi yang banyak terjadi di dunia kesehatan.
Sebagai contoh prevalensi penderita demam berdarah di
daerah endemis 20% di daerah endemis, sedangkan
kelurahan endemis ada 20, maka bisa dihitung besarnya
kluster daerah endemis yang terambil sebagai sampel.
Adapun tabelnya sebagai berikut58 :
155
Tabel 7.5. Penaksiran Besar Sampel Model Kluster

Jml TAKSIRAN PROPORSI KEJADIAN
Cluste p .05 .10 .15 .20 .25 .30 .35 .40 .45 .50
r q .95 .90 .85 .80 .75 .70 .65 .60 .55 .50
>400 26 24 23 21 20 18 17 15 14 13
400 25 24 22 21 19 18 17 15 14 13
300 25 23 22 21 19 18 16 15 14 12
250 24 23 22 20 19 17 16 15 14 12
200 24 23 21 20 19 17 16 15 13 12
150 23 22 21 19 18 17 16 14 13 12
100 22 20 19 18 17 16 15 14 13 12
90 21 20 19 18 17 16 15 14 12 11
80 20 19 18 17 16 15 14 13 12 11
70 20 19 18 17 16 15 14 13 12 11
60 19 18 17 16 15 14 14 13 12 11
50 18 17 16 15 15 14 13 12 11 10
40 16 16 15 14 14 13 12 12 11 10
35 15 15 14 14 13 12 12 11 10 10
30 14 14 13 13 12 12 11 11 10 9
25 13 13 12 12 11 11 10 10 9 9
20 12 12 11 11 10 10 10 9 9 8
15 10 10 9 9 9 9 8 8 8 7
10 8 8 7 7 7 7 7 7 6 6
Dikutip dengan modifikasi dari Luts58.
Diketahui: Prevalensi Demam berdarah 20%=0,2; jumlah

kelurahan endemis 20 (kluster); maka besar sampel yang
diambil 11 Kelurahan.
Penggunaan tabel ini jauh lebih mudah tanpa harus
mengumpulkan data pendukung terlalu banyak. Pada
bidang kesehatan banyak kasus yang datanya berupa
proporsi yaiti prevalensi atau insidens.
b. Data proporsi
Proporsi yang dimaksud adalah perbandingan kasus dengan
banyaknya subyek yang akan diteliti, seperti dari 100 orang
20 orang terkena malaria (p)=20/100=0,20; sedangkan yang
156
tidak terkena malaria (q)=1-0,20=0,80 atau dengan kata lain

p+q=1.
Rumus penentuan besar sampel untuk estimasi proporsi
kejadian di populasi, sebagai berikut52:
N . p.q B2
n= ; dimana D=
( N −1 ) . D+ p . q 4
Contoh soal:
Jika diketahui penderita leukemia dari 300, hasil penelitian
sebelumnya diketahui penderita leukemia yang terkena
paparan radiasi sebanyak 30%, jika diketahui bound on the
error (B)=0,05; berapa sampel yang diambil:
Diketahui:
B2 0,052
N=300; p=0,3; q=1-0,3=0,7; D= = =0,000625
4 4
Dengan demikian besar sampel bisa dihitung:
N . p.q 300.0,3. 0,7 63

n= = = =158,6=159
( N −1 ) . D+ p . q ( 300−1 ) . 0,000625.+ 0,3. 0,7 0,397
Contoh di atas, penentuan besar sampel ditentukan oleh

nilai D dan besarnya populasi. Nilai D seringkali
dibeberapa referensi disebutkan sebagai nilai presisi yang
dikehendaki oleh peneliti; bisa digunakan 5% (0,05% atau
10% (0,1). Dengan demikian jika peneliti menentukan nilai
D besar sampel yang diperoleh kecil, tetapi ketepatan
penelitiannya menjadi lebih kecil.
Sekarang dibuat simulasi dengan asumsi yang sama pada
kasus kejadian dan nilai B, tetapi populasi diperbesar
menjadi 5000, maka besar sampel bisa dihitung sbb:
N . p.q 5000.0,3. 0,7
n= =
( N −1 ) . D+ p . q ( 5000−1 ) . 0,000625.+ 0,3. 0,7
1.050
¿ =314,9=315
3,334
157
Pada contoh pertama jika dikonversi dalam bentuk %=53%

159
yang diperoleh dari x 100 %=53 % ; sebaliknya contoh
300
315
ke dua x 100 %=6,3 % .
5000
Data proporsi dengan rumus lainnya

Rumus ini agak berbeda karena melibatkan nilai Z
distribusi normal pada penyebut (denumerator), adapun
rumusnya sebagai berikut54:
N . Z 2α . P . Q
n= ; d= presisi yang ditentukan oleh
( N −1 ) d 2+ Z 2α . P .Q
peneliti, baik sebagai selisih antara nilai sampel dengan
nilai parameter, atau ditentukan oleh peneliti dalam bentuk
desimal mulai dari 0,01, 0,05 atau 0,10.53
2. Uji hipotesis
Penentuan besar sampel pada penelitian uji hipotesis,
pendekatannya cukup beragam. Beberapa diantaranya22:
a. Jenis uji statistik yang digunakan pada data kontinyu
4) Pre and post test
Besar sampel ini ditujukan untuk penelitian yang analisis
datanya menggunakan uti pair t test, karena
penelitiannya sebelum dan sesudah atau dengan kata lain
satu subyek diukur dua kali yaitu kondisi sebelum dan
sesudah. Adapun rumusnya sebagai berikut:
2 2
( Z α ) .σ d
n=
D2
Z∝ = nilai Z pada distribusi normal; jika 5%=1,96;
1%=2,58. Besaran nilai ini sangat tergantung dari jenis
penelitian, jika penelitian di laboratorium gunakan 1 %
dan di masyarakat gunakan 5%. Nilai ini sebagai nilai
konvensi.
158
σ 2d= merupakan nilai varian dari d=nilai sesudah – nilai

sebelum; nilai ini diperoleh dari hasil penelitian
sebelumnya.
D= merupakan nilai presisi yang ditentukan oleh peneliti
misal 1%, 5%, 10% atau diperoleh dari hasil selisih
antara data sampel dengan nilai parameter (misal hasil
pemeriksaan kadar Hb 10 ibu hamil 10, sedangkan nilai
parameter kadar Hb ibu hamil 11, maka D=10-11=1
pakai angka mutlak)
Contoh soal:
Peneliti ingin menguji efektifitas program suplementasi
tablet Fe pada ibu hamil, jika ditentukan nilai ∝=5 %;
Standard deviasi (sd) hasil penelitian sebelumnya 0,15
dan presisi yang dikehendaki oleh peneliti (D)=0.05;
berapa sampel yang harus diambil:
Diketahui :
∝=5 %= Z=1,96; SD=0,15, berarti σ 2d= 0,152=0,0225;
D=0,05, sehingga besar sampel yang diambil:
2 2
( Z α ) .σ d ( 1,96 )2 . 0,0225 0,086
n= = = =34,4=35
D2 0,052 0,0025
Besar sampel yang diambil adalah 35 elemen sampel.
5) Uji t 2n independent
Penentuan besar sampel pada uji beda dua kelompok
yang saling independent, perhitungan rumusnya sebagai
berikut22,57:
2 2
n=
[ ( Z ∝+ Z β ) . σ ]
d2
Dimana :
∝= nilai Z pada distribusi normal atau juga dimaknai
menolak Ho dan Ho benar, sedangkan β adalah risiko
menerima Ho dan Ho salah, pada Z β =0,10=1,285 ;σ 2 =
varian dari kedua kelompok data yang digabung
(diperoleh dari hasil penelitian sebelumnya); d= selisih
159
rata-rata pada kelompok yang dibandingkan (diperoleh

dari hasil penelitian sebelumnya)
Contoh soal:
Peneliti ingin membandingkan antara khasiat obat A dan
B pada penderita hipertensi, jika diketahui niali ∝=5 %
dan nilai β=10%; sedangkan hasil studi pendahuluan
yang diambil dari 10 orang diketahui SD tekanan
darahnya 10 mmHg dan perbedaan rata-rata tekanan
darahnya 5, berapa besar sampel yang diambil:
Diketahui:
Z∝ =1,96 ; Z β =0,10=1,28 dan σ 2=102=100; d=5, maka
besar sampelnya:
2 2
[ ( Z ∝+ Z β ) . σ ] [ ( 1,96+1,28 )2 . 100 ] 1049,76
n= = = =41,99
d2 52 25
Besar sampel yang diinginkan 42 sampel.
6) Uji Anova
Prinsip uji Anova diperoleh dari hasil percobaan,
sehingga istilah yang digunakan pada uji ini adalah
perlakuan, dengan demikian istilahnya bukan besar
sampel, tapi replikasi dengan rumus:
(t-1)(r-1)≥15; keterangan t banyaknya perlakuan; r=

replikasi;
Contoh soal:
Suatu penelitian untuk menentukan kemampuan daya
hambat daun binahong terhadap pertumbuhan bakteri
Salmonella Thyposa, peneliti membuat berbagai
konsentrasi daun binahong mulai dari 20%, 40%, 60%,
80%, 100%; berapa replikasi yang dibutuhkan:
Perlakuan (treatment) sebanyak 5; dengan demikian
replikasinya bisa dihitung:
(t-1)(r-1)≥15= (5-1) (r-1)=15
4 (r-1)=154r-4=154r=15+4==>
160
15+ 4
r= =4,75=5 ; pembulatan ke atas.
4
7) Uji Regresi
Penentuan besar sampel didasarkan uji regresi atau
hubungan ini didasarkan pada tiga poin utama yaitu
berapa nilai Z∝ , Z β dan nilai r (besaran hubungan) yang
dikonversi dari nilai r menjadi nilai Z 0, adapun nilai ini
diperoleh dari tabel transformasi Z Fisher, sebagai
berikut:
Tabel 7.6. Transformasi Z Fisher
r Z r Z r Z r Z r Z
.00 .000
.01 .010 .21 .213 .41 .436 .61 .709 .81 1.127
.02 .020 .22 .224 .42 .448 .62 .725 .82 1.157
.03 .030 .23 .234 .43 .460 .63 .741 .83 1.188
.04 .040 .24 .245 .44 .472 .64 .758 .84 1.221
.05 .050 .25 .255 .45 .485 .65 .775 .85 1.256
.06 .060 .26 .266 .46 .497 .66 .793 .86 1.293
.07 .070 .27 .277 .47 .510 .67 .811 .87 1.333
.08 .080 .28 .288 .48 .523 .68 .829 .88 1.376
.09 .090 .29 .299 .49 .536 .69 .848 .89 1.422
.10 .100 .30 .310 .50 .549 .70 .867 .90 1.472
.11 .110 .31 .321 51 .563 .71 .887 .91 1.528
.12 .121 .32 .332 .52 .576 .72 .908 .92 1.569
.13 .131 .33 .343 .53 .590 .73 .929 .93 1.658
.14 .141 .34 .354 .54 .604 .74 .950 .94 1.738
.15 .151 .35 365 .55 .618 .75 .973 .95 1.832
.16 .161 .36 .377 .56 .633 .76 .996 .96 1.946
.17 .172 .37 .388 .57. .648 .77 1.020 .97 2.092
.18 .182 .38 .400 .58 .662 .78 1.045 .98 2.298
.19 .192 .39 .412 .59 .678 .79 1.071 .99 2.647
.20 .203 .40 .424 .60 .693 .80 1.099
Sumber : Rosner (2006)
Adapun rumus besar sampelnya, sebagai berikut:
161
[ (Z ∝ + Z β )2 ]
n= +3
Z 02
Contoh soal:
Seorang peneliti ingin mengetahui hubungan antara
kholesterol darah dengan konsumsi lemak. Hasil
penelitian riset sebelumnya diketahui nilai r=0,52
(dilihat konversi Z=0,576), jika nilai ∝=5 % nilai
Z=1,96 dan nilai β=10 %=Z 1−0,1=Z 0,90 =1,28; nilai Z 0,90
bisa dilihat di tabel Z; cara membacanya ada dua cara:
jika tabel Z nya penuh, maka langsung dicari pada nilai
CI (nilai pada kolom ditengah, cirinya lihat nilai nilai
paling kanan paling bawah 0,9998) dicari 0,90 atau yang
mendekati (0,8997), kemudian ditarik garis ke kiri
ketemu 1,2; ditarik garis ke atas sampai ujung ketemu 8
maka nilainya 1,28; cara kedua jika tabel dibuat separuh
(lihat nilai paling kanan paling bawah 0,5000) caranya
0,90
= 0,40; sama carilah di kolom ditengah (CI) angka
2
0,4000 (atau mendekati, akan ketemu 0,3997), tarik garis
ke kiri di kolom Z ketemu 1,2; tarik garis ke atas terus
akan ketemu .8; berarti Z90= 1,28 dapat dilihat di tabel
B1 (distribusi normal); atau menggunakan nilai tersebut
Z β 20 % =0,84 ; Z β 10 %=1,28 ; Z β 5 % =1,64 ; Z β 1 %=2,33
Dengan demikian besar sampelnya:
n=
[ (1,96+ 1,28 )2 ] +3= 10,49 +3=34,81=35
0,5762 0,33
b. Uji hipotesis data proporsi
1) Besar sampel untuk dua kelompok
Uji hipotesis untuk menentukan besar sampel pada dua
kelompok dengan data proporsi, digunakan rumus 22,53:
2
n=
[ Z α . ❑√2 P .Q−Z β . ❑√ P1 Q 1 + P2 . Q2 ]
2
( P2−P1 )
Contoh soal:
162
Suatu riset tentang kepuasan pasien yang berobat di

kelas 3 pada dua rumah sakit (RS) yaitu RS A type B
dan RS B type A, hasil penelitian di rumah sakit yang
setype sebelumnya diketahui pada RS type B tingkat
kepuasan pasien 80% dan Type A 70%. Peneliti
menggunakan α =0,05 dan β=0,10.
Berapa besar sampel yang diambil dari penelitian
tersebut:
Diketahui:
P1=0,8, berarti Q1=1- P1=1-0,8=0,2
P2=0,70, berarti Q2=1-P2=1-0,7=0,3
P1 + P2 0,8+ 0,7
P= = =0,75 ; berarti Q=1-0,75=0,25
2 2
Z5 % =1,96 ; Z β 10 %=1,28 ; maka besar sampel bisa
dihitung:
2
n=
[ Z α . ❑√2 P .Q−Z β . ❑√ P1 Q 1 + P2 . Q2 ]
2
( P2−P1 )
2
[ 1,96. ❑√2. 0,75 .0,25−1,28 ❑√ 0,8. 0,2+0,7.0,75 ]
n=
( 0,70−0,8 )2
( 1,20−1,059 )2 1,3
n= = =130,24=131
0,01 0,01
Sampel yang diambil dari populasi sebanyak 131 untuk
masing-masing kelompok.
Contoh lain pada nilai P yang lebih kecil.

Suatu penelitian untuk menguji hipotesis dua kelompok
yaitu pedesaan dan perkotaan tentang prevalensi
tuberkulosis di kedua wilayah tersebut. Di pedesaan
prevalensinya 0,10 dan perkotaan 0,04; nilai α =0,05
dan β=0,10; maka bisa dihitung masing-masing
komponen sebagai berikut:
P1=0,10, berarti Q1=1- P1=1-0,1=0,9

P2=0, 04, berarti Q2=1-P2=1-0,04=0,96
163
P1 + P2 0,10+ 0,04
P= = =0,07 ; berarti Q=1-0,07=0,93
2 2
Z5 % =1,96 ; Z β 10 %=1,28 ; maka besar sampel bisa
dihitung
2
[ 1,96. ❑√2.0,07 .0,93−1,28 ❑√ 0,10 . 0,90+0,04.0,96 ]
n=
( 0,04−0,10 )2
( 0,707−0,458 )2 0,06
n= 2
= =16,66=17
(−0,06 ) 0,0036
Diantara kedua contoh tersebut yang membedakan
adalah nilai proporsi, semakin kecil nilai proporsinya,
maka sampel yang diambil lebih banyak, hal ini bisa
difahami, karena kasus yang sedikit, untuk
mendapatkannya dengan cara memperbesar sampel.
3. Pendekatan lainnya
Pendekatan lainnya ini bisa digunakan untuk estimasi
dan uji hipotesis, ada dua pendekatan yaitu:
a. Central Limit Theorema (CLT)38
Teori ini didasarkan pada distribusi normal, dikatakan
sampel besar jika n>30 dan jika n≤ 30 disebut sampel kecil.
Teori ini juga mempersyaratkan skala data yang dipakai
interval atau ratio
b. Judgment peneliti
Teori ini didasarkan pada pengalaman peneliti, tidak
diperlukan rumus tertentu, tetapi digunakan persentase dari
banyaknya populasi yang ada. Cara ini lazim dipakai untuk
penelitian survey, seperti di Amerika sensus tahun 1940
hanya diambil 5%, tahun 1950 20%, pertimbangan yang
nyata adalah keterbatasan sumber daya44.
Populasi kurang dari 100 hendaknya diambil 50%dari
populasi, jika populasi beberapa ratus diambil 25 sampai 30
%.
Hasil penelitian sampel 20 % dari populasi dengan
teknik systematic random sampling paling baik,
164
dibandingkan dengan persentase yang lebih besar, hal ini

disebabkan karena jika sampelnya besar bahkan lebih dari
50% justru hasilnya kurang baik berdasarkan kriteria
sampel yang baik, nilai-nilai yang ekstrim peluang terambil
menjadi sampel menjadi lebih besar, sehingga nilai
unbiased, varian minimum dan konsistensinya menjadi
kurang baik57.
c. Rumus solvin
Rumus ini lebih sederhana, karena didasarkan pada
banyaknya populasi dan presisi (d) yang ditetapkan oleh
peneliti, teknik sampling bisa digunakan untuk hipotesis
dan estimasi populasi. Adapun rumusnya sebagai berikut:
N
n= ; dimana : N= besar populasi; d= presisi yang
1+ N . d 2
ditentukan oleh peneliti, semakin kecil nilai “d”, maka
semakin besar sampelnya; d berbeda dengan alpha (α=0,05
atau 0,01), tetapi d adalah presisi yang ditentukan oleh
peneliti yang besarnya sebaiknya tidak lebih dari 10% atau
0,1.
Jika nilai d=10%, artinya hasil kesimpulan penelitian
biasnya ±10% dengan populasi, misal rata-rata Tb
mahasiswa 165, maka sebenarnya di populasi antara 148,5-
181,5; tetapi jika ditentukan d=5%, maka presisinya antara
156,75-173,25.
d. Replikasi pada penelitian eksperimen

Penelitian eksperimen mempunyai persyaratan yang
berbeda dengan penelitian observasional, jika penelitiam
observasional istilah yang digunakan besar sampel, tetapi
pada penelitian eksperimen persyaratan yang digunakan ada
empat yaitu 1). adanya perlakuan peneliti terhadap subyek
yang diteliti; 2) randomisasi; 3) control dan 4) replikasi.
Empat persyaratan tersebut tidak ada tercantum besar
sampel, tetapi replikasi (yang berkaitan dengan besarnya
subyek yang diukur dalam suatu penelitian). Adapun
penentuan besar replikasi sebagai berikut:
165
1) (t-1)(r-1)≥15; keterangan t banyaknya perlakuan; r=

replikasi;
Contoh soal:
Suatu penelitian ingin mengetahui pengaruh pemberian
3 dosis yaitu 10ppm, 15ppm dan 20ppm dari 3 jenis
pengawet alami yaitu lengkuas, bawang putih dan sereh
terhadap kandungan angka kuman pada ikan mujair.
Jika diperhatikan berapa jumlah perlakuan ada dua jenis
perlakuan yaitu 3 jenis pengawet alami masing-masing
ada 3 dosis, sehingga total keseluruhan perlakuan ada 9.
Replikasi dapat dihitung sebagai berikut:
( t−1 ) ( r−1 ) ≥15; masukkan masing-masing ke dalam
rumus dan buatlah persamaan, sehingga:
( 9−1 )( r −1 )=15
8 ( r −1 )=15=¿ 8r −8=15=¿ 8 r =15+8
23
8 r =23=¿ r = =2,8
8
Pembulatan replikasi selalu ke atas, sehingga minimal
untuk masing-masing perlakuan ada 3 replikasi. Hasil
replikasi ini dapat disimpulkan ada 27 replikasi,
masing-masing jenis pengawet alami dan dosis 3.
2) Rumus dari vincent gaspers60

2. t 2α , df . s2
r= r= replikasi; t nilai tabel t pada alpha
d2
yang diinginkan dan derajat bebas (n-1); s= simpangan
deviasi dan d= derajat ketelitian (presisi) yang
diinginkan oleh peneliti atau selisih antara rata-rata nilai
sampel (diperoleh dari pendahuluan atau penelitian
sebelumnya) dengan nilai parameter (teoritis), nilai t
diperoleh dari tabel t. Jika penelitian pendahuluan pada
10 orang maka df=n-1=10-1=9, α =¿ 5%, maka nilai
tabel t diketahui, nilai s diketahui dari 10 data,
kemudian dihitung simpangan deviasinya.
Contoh soal:
166
Seorang peneliti pada hewan coba, ingin mengetahui

pengaruh kekerasan gigi tikus setelah diberi paparan
flour selama 14 hari. Kemudian diambil 10 tikus pada
uji pendahuluan, setelah dilakukan perlakuan diukur
kekerasan gigi tikus diketahui SD=0,2; maka nilai t
tabel diketahui t 5 % ,9 artinya α =5 % dan df=9, maka t
tabel=2,262 (uji dua arah dilihat tabel t), jika presisi
ditentukan peneliti 10%=0,1; maka replikasi bisa
dihitung:
2. t 2α , df . s2 2.2,2622 . 0,22 0,9048
r= = = =90,48
d2 0,12 0,01
Binatang yang diambil sebanyak 91 hewan coba.
Catatan sampel:
Pada tataran praktis penentuan besar sampel ada banyak pilihan
sebagai pendekatan, ada yang diturunkan lewat rumus matematik,
ada juga yang non matematik, tetapi tidak pernah peneliti
menentukan mana yang paling baik diantara pendekatan tersebut.
hal ini disebabkan penelitian berbasis sampel tanpa ada klarifikasi
penelitian populasi yang menghasilkan nilai parameter, maka
peneliti tidak tahu mana diantara pendekatan tersebut yang
mendekati nilai populasi. Dengan demikian jika peneliti ingin
mengetahui mana yang lebih baik harus membuat dua penelitian
sekaligus, baru secara empirik bisa menentukan mana yang lebih
baik.
Jika keduanya tidak dilakukan dan memang tidak dapat dilakukan
oleh peneliti, kecuali seseorang yang melakukan penelitian
keduanya, maka prinsip dasar sampel harus random, jika
generalisasinya di populasi, maka rumus minimal sampel size
yang digunakan akan mendekati nilai populasi.
Mana yang lebih baik, tergantung sudut pandangnya; bagi
peneliti sampel paling kecil itu yang efisien; bagi kaidah ilmu
yang paling besar itu yang paling baik, karena prinsip konsistensi.
167

Judul Buku

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Judul Buku

Diunggah oleh

Hak Cipta:

Format Tersedia

BIOSTATISTIK DASAR

(Deskriptif, Indikator kesehatan dan Sampling)

BIDANG ILMU KESEHATAN

KATA PENGANTAR ............................................................................................... i

BAB I. STATISTIK SEBAGAI SEBUAH KONSEP DAN TERAPAN

BAB II. PENGUMPULAN DATA

BAB III. PENGOLAHAN DAN PENYAJIAN DATA

BAB IV. PROBABILITAS

BAB V. STATISTIK DESKRIPTIF

BAB VI. INDIKATOR KESEHATAN

BAB VII. POPULASI DAN SAMPEL

Konsep dan sejarah statistik.

Sejarah perkembangan ilmu pengetahuan dimulai dari

ke 12 M yang sudah memadukan filsafat yunani dengan

seiring dengan telah dirumuskannya universalitas gejala alam

kelebihannya pada yang kurang dari 160 cm, sehingga

Kesimpulan pendekatan gejala stochastic, karena berangkat

Karl Pearson menemukan di suatu perpustakaan. Sampai Gauss

Fungsi dan Peran Statistik

grafik minimal maksimal, rata-rata tahunan dan median

Penggunaan gabungan obat anti viral dan malaria bisa

Peran dan fungsi statistik no 8 merupakan ujung dari hasil riset

Definisi terakhir lebih menunjukkan ruang lingkup

numerik, tabulating sampai pada pilihan berupa

Narasi lebih lengkap dikemukakan oleh Bernard

untuk medis dan masalah biologi4. Dengan demikian

subyektif, sementara subyektifitas individual hanya dapat

Data yang diperoleh dari hasil perhitungan cenderung bulat,

Jenis pekerjaan bisa dibuat lebih dari dua kategori

Kategori ini dibuat berdasarkan hasil pengukuran

komunikasi dan pemaknaan yang lebih mudah

Misal : kita membeli bensin, pada alat ukurnya

b). Jarak antar skala ukur sama.

Skala data ini bisa dibandingkan, karena

Skala data apakah ratio atau interval, pada prinsipnya tidak

Coba diperhatikan mahasiswa dengan initial A dan B, kalau

demikian juga yang lain ada selisihnya. Tetapi jika dibuat

Sekarang kita perhatikan antara mahasiswa, dengan mencari

Penjelasan sebelumnya menunjukkan bahwa inferensi suatu

Ilustrasi di atas ada beberapa hal yang dapat diambil

dari hasil penelitian untuk diberlakukan secara umum

Dengan demikian dapat disimpulkan bahwa

Ilustrasi di atas dapat didefinisikan masing-masing

pengukuran dan penarikan kesimpulan, adapun

dimaksudkan untuk mendimensionalkan konsep abstrak subyek

1. Teknik atau cara-cara yang dapat digunakan oleh peneliti

Hasil penelusuran definisi pengumpulan data (dalam

kuantifikasi hasil pengukuran dengan instrumen yang sudah

Data yang diperoleh dari data mentah pada suatu institusi

Metode dan instrumen pengumpulan data

kejadian-kejadian yang sudah berlangsung lama. Jika

Pengukuran pada dasarnya upaya peneliti/seseorang untuk

Pengukuran gejala dimensional akan jelas disepakati orang

Pengukuran dimensional saja masih perlu dipertanyakan

Beberapa alat ukur yang lazim digunakan pada suatu

5. Validitas dan reliabilitas

Diartikan sebagai kesesuaian antara sesuatu yang

Keduanya akan dilakukan pembahasan dengan

terhadap fenomena yang dipersepsikannya nilainya

Tabel 2.1. Beberapa Contoh Skala Likert

FREKUENSI PELUANG BENAR

Beberapa contoh yang disampaikan pada tabel 2.1,