ARIS SANTJAKA
Alhamdulillah hi robbil alamin segala puji bagi Allah SWT yang telah memberi
kekuatan penulis untuk menyelesaikan penulisan buku ini. Banyak hal yang saling
berinteraksi untuk menyusun buku ini, hal pertama yang menjadi pertimbangan kebutuhan
mahasiswa dan kebutuhan praktis ilmu statistik dikaitkan dengan kebutuhan keilmuan
kesehatan yang membutuhkan analisis sebagai penguat argumentasi akademis dari beberapa
fenomena yang dijumpai dalam penelitian kesehatan. Pertimbangan kedua dalam analisis
biostatistik yang membutuhkan rujukan tidak hanya teoritis tetapi juga data-data empirik
untuk memperkuat dasar teoritis tersebut benar, seperti teori probabilitas peluang kejadian
kelahiran yang dikaitkan dengan proporsi penduduk didasarkan pada jenis kelamin.
Pertimbangan ketiga saat melakukan uji statistik dibutuhkan nilai parameter, maka juga
disisipkan satu bab indikator kesehatan yang bisa digunakan oleh mahasiswa maupun praktisi
sebagai rujukan untuk menentukan parameter maupun keberhasilan derajat kesehatan.
Ketiga pertimbangan inilah yang dijadikan dasar pengembangan buku ini dari buku-
buku yang sudah ditulis sebelumnya. Termasuk materi sampling di dalam buku ini yang lebih
banyak ditambahkan dan lebih bervariasi dibandingkan buku sebelumnya. Sampling ini
sangat penting di dalam statistik, karena proses pengambilan keputusan berupa inferensi
statistik memerlukan representasi populasi, sehingga kesimpulan yang diambil dari sampel
akan mendekati kondisi di populasi.
Statistik secara filosofi teologis, sebenarnya sudah tersirat dalam kitab suci
sebagaimana tertulis dalam Al-Qur’an yaitu surat Luqman ayat 34 (QS:31:34) ...dan tiada
seorangpun yang dapat mengetahui (dengan pasti) apa yang akan diusahakannya besok, dan
tiada seorangpun yang dapat mengetahui dibumi mana dia akan mati, sesungguhnya Allah
maha mengetahui lagi maha mengenal. Ini menunjukkan adanya ketidak pastian (uncertinity)
di dalam hidup yang dikenal dengan gejala stochastic sebagai prinsip dasar statistik
(probabilistik), sebagai contoh efektifitas satu alat kontrasepsi 99%; tetapi ada satu orang
yang hamil setelah ikut alat kontrasepsi tersebut, maka bisa dikatakan satu orang yang hamil
itu masuk yang satu persen. Atas dasar inilah maka penulis bisa mengatakan bahwa hukum
statistik:
“satu satunya yang pasti dalam statistik adalah ketidak pastian itu sendiri”
Ayat yang lain di surat Al Furqon ayat 2 (QS. 25:2) “ ..KepunyaanNyalah yang ada di
langit dan dibumi, ......, dan Dia telah menetapkan ukuran-ukurannya dengan serapi-rapinya”.
Ayat ini justru menunjukkan suatu kepastian bahwa segala sesuatu ada ukuran yang jelas,
inilah yang disebut dengan gejala deterministik di dalam ilmu, gejala ini melahirkan hukum
alam di dalam terminologi keilmuan, sehingga dikenal hukum Newton I, II dan III, hukum
Archimedes dll yang kesemuanya menetapkan satu gejala yang sama dan berlaku universal.
Dua gejala ini yang mewarnai kaidah dalam keilmuan.
Konsep lain yang bisa ditafsir dengan pendekatan statistik seperti memaknai Al- Qur’an
Surat Al Baqoroh ayat 35 bagi seorang statistisi, ayat tersebut berbunyi “ Dan Kami
berfirman: wahai Adam diamilah oleh kamu dan istrimu surga ini dan makanlah makanan-
makanannya yang banyak lagi baik dimana saja yang kamu sukai, dan janganlah kamu
mendekati pohon ini yang menyebabkan kamu termasuk orang-orang yang zalim”.
Ayat ini menegaskan bagaimana Allah memberikan kebebasan kepada Adam untuk
berbuat apa saja, kecuali mendekati satu pohon. Konsep ini terbayang oleh penulis seperti
konsep degree of freedom (derajat bebas), dimana seseorang bebas menentukan apa saja,
tetapi hanya satu yang tidak bebas, sehingga df dirumuskan “n-1”.
Ilustrasi teologis tersebut merupakan perspektif penulis terhadap kaidah keilmuan
statistik, pada akhirnya perkenankan penulis mengucapkan terima kasih kepada:
1. Prof. Dr. H. Kuntoro dr, MPH. selaku dosen biostatistik Universitas Airlangga
Surabaya yang telah banyak memberikan bekal ilmu dengan begitu tulus.
2. Dr. Hari Basuki dr, MPH. selaku dosen biostatistik Universitas Airlangga Surabaya
yang telah banyak meluangkan waktu berdiskusi dengan penulis pada berbagai
konsep statistik.
3. Direktur Poltekkes Kemenkes Semarang yang mendorong penulis untuk selalu
berkarya, sehingga bisa menjadi pustaka di kalangan civitas akademis.
4. Keluargaku termasuk istriku Mamik SW, Hana IS dan Bahrul IS yang paling
banyak memberikan semangan, terlebih pada Bahrul IS yang banyak membantu
dalam akses informasi, sehingga buku ini selesai
5. Teman-teman semuanya yang tidak bisa disebutkan satu persatu dan seseorang
yang memberikan kekuatan untuk menyelesaikan buku ini.
6. Para user buku sebelumnya yaitu mahasiswa, temen-temen dosen maupun
pengguna di seluruh tanah air yang telah banyak memberikan masukan, untuk
perbaikan materi, penulisan di dalam buku ini.
7. Penerbit dan staf yang telah memberi kesempatan penulis, sehingga buku ini bisa
diterbitkan.
Penulis berharap buku sederhana ini menjadi start untuk penulisan buku serial
biostatistik berikutmya, sehingga menjadi salah satu alternatif bacaan untuk membantu
memberikan salah satu referensi dalam menganalisis masalah bidang kesehatan.
Mei 2021
Penulis
Aris Santjaka
DAFTAR ISI
Halaman
Beberapa pengertian
Pengertian dimaksudkan untuk membatasi ruang lingkup
pembicaraan dan pemahaman bersama tentang suatu istilah yang
sedang didiskusikan, ada beberapa definisi yang disampaikan
antara lain:
1. Statistika
Beberapa definisi yang diberikan tentang statistika:
a. Ilmu yang berhubungan dengan pengumpulan dan
analisis data numerik dari sekumpulan data yang
berasal dari sampel representatif.
b. Cabang matematika yang berhubungan dengan
pengumpulan, analisis, interpretasi, dan penyajian
sekumpulan data numerik 3
c. Ilmu yang digunakan untuk menarik kesimpulan dari
fenomena tertentu secara acak dengan berdasarkan
sampel yang relatif terbatas4
d. Ilmu tentang cara mengumpulkan, menabulasi,
menggolong-golongkan, menganalisis, dan mencari
keterangan yang berarti dari data yang berupa angka
(KKBI)
e. Ilmu pengetahuan yang berhubungan dengan cara-
cara pengumpulan, pengolahan, penyajian, analisis
data, penarikan kesimpulan2
2. Statistik
a. Hasil observasi yang disajikan dalam bentuk penyajian
data-data baik berupa angka, grafik atau hasil analisis
data yang diperoleh dari sampel.
b. Nilai tertentu yang diperoleh dari sampel yang
digunakan untuk membuat estimasi nilai parameter
yang ada pada populasi5
3. Data
a. Fakta atau informasi yang digunakan untuk menghitung,
menganalisis atau merencanakan sesuatu.3
b. Fakta berupa angka 2
Data di dalam statistik harus berupa angka, bukan
berupa naratif, hal ini dikaitkan dengan metode analisis
kuantitatif dengan menggunakan uji-uji statistik yang ada.
Mungkin ada yang bertanya, kesimpulan kan tidak
selalu harus menggunakan data yang berupa angka, dengan
menggunakan feeling, wangsit atau apapun namanya itu
juga bisa tapi itu diluar bidang statistik, memang
berdasarkan fakta, kadangkala kesimpulan berdasarkan
feeling toh juga mendapatkan hasil yang lebih baik, boleh
jadi pernyataan ini benar.
Problematika yang kemudian muncul adalah bagaimana
kaidah ilmunya, sehingga kesimpulan itu bisa
dikomunikasikan dengan cara yang runtut, difahami oleh
semua orang, logis dan obyektif. Kesimpulan berdasarkan
feeling merupakan kesimpulan individu yang sangat
10
Kesimpulan:
Semua yang sederajat (ekivalen) nominal meskipun
tidak dikotomi, sedangkan semua yang dikotomi
bukan nominal kecuali yang sederajat.
b. Ordinal
Merupakan skala hasil pengukuran yang bisa
digunakan untuk membedakan antara hasil ukur yang
satu ke hasil ukur lainnya.
Hasil pengukuran ini bisa bersifat subyektifitas
maupun obyektifitas. Subyektifitas yang dimaksud
adalah tidak adanya batasan secara jelas antara
peringkat yang satu ke peringkat lainnya; misal
derajat persetujuan bisa dibedakan sangat setuju,
setuju, kurang setuju dan sangat tidak setuju;
batasannya dimana…tidak ada, karena didasarkan
pada kondisi psychologis subyek yang diteliti; pada
kondisi yang sama jika diukur oleh orang lai, jika
diajukan pertanyaan sikap yang sama boleh jadi
berubah derajat persetujuannya.
Obyektifitas bisa juga diperoleh dengan hasil
pengukuran kuantitatif, misal derajad hipertensi yang
dikategorikan dalam:
c. Interval
Ciri utama skala ini adalah tidak punya nilai nol
mutlak, sementara ciri lainnya sama dengan skala
ordinal yaitu bisa membedakan, karena tidak punya
nilai nol mutlak maka hasil pengukurannya tidak bisa
dibandingkan; misal Desa A suhu udara 10oC, Desa B
20oC, maka tidak bisa disimpulkan Desa B dua kali
lebih panas dibandingkan desa A.
Arti kata tidak mempunyai nol mutlak dapat
diilustrasikan sebagai berikut, seorang mahasiswa
dapat nilai statistik nol, bukan berarti mahasiswa
tersebut tidak tahu sama sekali tentang statistik.
Contoh lain, suhu air diukur 0oC, bukan berarti tidak
ada panas pada air tersebut, buktinya ketika diukur
dengan 0o F, suhunya 32o F.
d. Ratio
Ciri skala data ini antara lain :
1) Mempunyai nilai nol mutlak.
Pengertian nilai nol mutlak adalah jika alat ukur
yang digunakan untuk mengukur subyek yang
akan diukur, menunjukkan angka nol, maka
memang tidak ada sesuatu yang diukur.
13
Nilai 90 80 100 30 40 70 75 60 65
Initial A B C D E F G H I
Nilai A A A E E B B C C
Mutu
Initial A B C D E F G H I
Nilai L L L TL TL L L L L
Mutu
Initial A B C D E F G H I
Nilai tidak lulus (TL) yang ada nilai 40, sedangkan lainnya
nilai lebih dari 55 maka masuk kategori lulus, perhatikan
selisihnya menjadi 100-40= 60, semakin jauh.
Ilustrasi di atas dapat disimpulkan semakin sedikit
kategori yang digunakan untuk data kontinyu, semakin
tidak peka membedakan sesuatu yang berbeda, dengan
demikian hasil analisis statistik yang digunakan juga relatif
kurang baik. Dengan demikian pemahaman skala data ini
penting, jika punya skala data yang lebih tinggi jangan
buru-buru diturunkan skala datanya, upayakan tetap
menggunakan skala data yang tinggi, karena ada sangkut
pautnya dengan pemilihan jenis uji statistik yang
digunakan. Jika skala data interval atau ratio tidak
mengubah jenis uji statistik, tetapi jika ordinal yang
kategorial dan non kategorial dapat mengubah jenis uji
statistik.
5. Populasi dan sampel
15
BAB. II
PENGUMPULAN DATA
Pendahuluan
Data merupakan kata kunci analisis menjadi benar, jika data
diperoleh dengan kaidah yang benar, dalam analisis statistik data
harus berupa numerik/angka, karena hanya dengan angka data
dapat dianalisis. Pendekatan lain dengan menggunakan data
narasi (penelitian kualitatif) tidak bisa di lakukan analisis
statistik. Dengan demikian narasi harus di ubah dulu menjadi
angka sebagai suatu simbul abstraksi tertentu, supaya bisa
dianalisis. (lihat skala data pada bab I)
Problem utama mendapatkan data yang valid adalah cara
pengumpulan data dan instrumen yang digunakan untuk
mendapatkan data. Upaya menghindari bias pengukuran selalu
diupayakan oleh peneliti, hal ini dimaksudkan supaya sesuatu
yang diukur tersebut, memang menggambarkan subyek yang
diukur. Problem kedua adalah apakah subyek yang diukur dengan
alat yang sama akan menghasilkan hasil ukur yang sama.
Disinilah muncul konsep validitas dan reliabilitas.
Validitas berkaitan dengan keterandalan alat ukur untuk
mengukur subyek sesuai dengan alat ukurnya atau tidak; seperti
Berat Badan diukur dengan timbangan, maka dikatakan valid;
sedangkan reliabilitas berkaitan dengan alat ukur yang digunakan
secara berulang untuk mengukur subyek yang sama
menghasilkan hasil yang sama, maka alat tersebut disebut
reliable.
Konsep ini memunculkan berbagai metode dan instrumen
alat ukur yang dikembangkan oleh para ahli, hal ini dimaksudkan
untuk membuat kuantifikasi dari fenomena yang diteliti. Awalnya
pengukuran dilakukan pada sesuatu yang dimensional, tetapi
perkembangan kebutuhan riset membutuhkan pengukuran non
dimensional, seperti pengukuran pengetahuan, sikap, perilaku,
psychologis.
Kuantifikasi non dimensional inilah, menyebabkan peneliti
mengembangkan beberapa alat ukur seperti sosiometrik,
psychometrik, ekonometrik, yang pada akhirnya mengupayakan
fenomena abstrak untuk bisa dikuantifikasikan8,9,10. Hal ini
19
Pengertian-pengertian
Pembatasan terminologi diperlukan untuk menentukan
kesepakatan terhadap istilah yang didiskusikan termasuk di
dalamnya ruang lingkup. Adapun beberapa pengertian
pengumpulan data sebagai berikut:
Sumber data
Cara memperoleh data dapat dilakukan dengan
mendapatkan dari berbagai sumber, adapun sumber data dapat
dibuat dalam berbagai kategori yaitu:
1. Data primer
Yaitu data yang diperoleh sendiri oleh peneliti baik melalui
pengukuran maupun memilah-milah data mentah yang sudah
ada pada suatu institusi9,10.
Contoh :
Data yang diukur sendiri oleh peneliti misal BB, TB, Kadar
Hb atau hasil laboratorium dll yang diukur secara langsung
oleh peneliti terhadap subyek yang diteliti.
Pengukuran secara langsung dimaksudkan peneliti dibantu
oleh tenaga teknis sesuai dengan kompetensi untuk mengukur
parameter yang dimaksud oleh peneliti, semisal tenaga
laboratorium.
Beberapa cara yang dilakukan untuk mendapatkan data
primer antara lain wawancara dengan instrumen kuesioner,
observasi dengan lembar check list, pengukuran fisik,
laboratorium dll9.
Contoh:
“Penelitian dengan judul hubungan antara usia dengan
tekanan darah”; maka peneliti mengambil catatan medis pasien
yang ada di unit pelayanan kesehatan. Dilihat pada catatan
medis pasien, kemudian dianalisis menggunakan uji statistik
dan diperoleh hubungan kausalitas tersebut.
2. Data sekunder
Yaitu data yang diperoleh oleh peneliti dari pihak lain dalam
bentuk data sudah jadi baik berupa grafik, profil, sehingga
peneliti hanya mengutip berdasarkan penyajian data yang
sudah ada.9
Misal:
a. Data dari profil institusi tertentu (rumah sakit, Puskesmas,
BPS dll)
b. Data laporan penyakit instusi kesehatan atau laporan suatu
institusi non kesehatan.
c. Data hasil investigasi kejadian penyakit baik berupa
Penyelidikan Epidemiologi atau Kejadian Luar Biasa.
d. Data kependudukan yang dikeluarkan oleh institusi paling
rendah yaitu Desa, Kecamatan, Kabupaten sampai tingkat
Nasional.
e. Data hasil penelitian orang lain.
f. Dan lain-lain.
Metode
Lebih menitik beratkan pada aspek cara atau teknik
mendapatkan data yang digunakan oleh peneliti. Beberapa
metode yang digunakan untuk mendapatkan data antara lain:
22
1. Observasi/pengamatan
Adalah suatu upaya pengumpulan data yang
diarahkan ke suatu tujuan riset yang sudah ditetapkan
secara sistematis dengan menggunakan indrawi. Secara
statistik hasil pengamatan ini harus dapat di konversi
menjadi suatu bilangan baik kontinyu maupun diskrit8,9.
Pengamatan yang didasarkan pada indrawi ini sangat
tergantung pada kemampuan indra yang digunakan, tetapi
dengan berkembangnya ilmu pengetahuan, hal itu bisa
diatasi dengan sistem digital yang meminimalkan peran
indrawi tersebut. Sistem digital sudah harus melalui proses
uji tera dengan gold standard yang ada.
Beberapa alat yang bisa digunakan sebagai observasi
antara lain anecdotal records, catatan berkala, check list,
rating scale, mechanical devices.
2. Wawancara
Merupakan metode pengumpulan data dengan cara
tanya jawab secara langsung antara interviewer
(pewawancara) dan responden. Tanya jawab ini bisa
berhadapan langsung, via telpon, Watch Up (WA),
teleconference dll.
Tanya jawab secara langsung merupakan cara terbaik
untuk mengetahui gestur (bahasa tubuh) responden apakah
baik dalam penerimaan saat proses wawancara atau
cenderung menolak, perubahan gestur (gerak tubuh
seseorang merupakan bahasa alami seseorang sebagai
respon terhadap situasi disekitarnya) sehingga teknik ini
juga digabung dengan observasi.
Metode wawancara bisa sebagai metode primer jika
memang hanya metode itu untuk mendapatkan data, tetapi
bisa juga sebagai metode sekunder pelengkap metode yang
lain. Seperti hasil laboratorium menunjukkan kadar
cholesterol tinggi, maka peneliti menanyakan beberapa
aspek menyangkut pola makan, olah raga, gejala yang
dirasakan oleh subyek yang bersangkutan dll.
Metode ini baik untuk mengeksplorasi pendapat dan
sikap seseorang, tetapi kurang begitu baik untuk merecall
23
3. Pengukuran
Pengukuran merupakan upaya peneliti untuk menegaskan
dimensi variabel yang telah ditetapkan, ada beberapa
definisi pengukuran, antara lain:
a. Suatu kegiatan yang ditujukan untuk mengidentifikasi
besar kecilnya obyek atau gejala.16
b. Angka yang menunjukkan ukuran atau jumlah sesuatu.
Biasanya angkanya mengacu pada beberapa pengukuran
standar, seperti satu meter atau kilogram.17
c. Upaya yang dilakukan untuk mengkuantifikasi variabel
tertentu dengan menggunakan instrumen yang
terstandarisasi atau instrumen lain yang dapat
menggambarkan suatu nilai dari variabel tersebut2
b. Check list
Instrumen ini berisi tentang item-item yang akan
dinilai secara rinci. Peneliti tinggal memberi tanda
tertentu pada instrumen yang sudah disediakan.
Check list ini bisa ya/tidak atau skore tertentu berupa
angka-angka yang menunjukkan tingkatan tertentu
c. Pengukuran dimensional
Pengukuran ini dilakukan pada subyek yang
mempunyai dimensi tertentu, sehingga subyek
tersebut mempunyai massa tertentu untuk diberi
penilaian besaran massa tersebut. Seperti berat, luas,
panjang, spektrum dll.
Hal yang paling penting sebelum menggunakan alat
ukur ini, alat ini harus dikalibrasi dengan alat ukur
lainnya yang dianggap standar. Institusi resmi untuk
melakukan kalibrasi adalah badan metrologi.
b. Reliabilitas
Diartikan sebagai keajekan alat yang digunakan untuk
mengukur suatu subyek yang sama menghasilkan
nilai yang sama dengan hasil pengukuran
sebelumnya.
6. Skala pengukuran
Pengukuran non dimensional membutuhkan alat ukur
tersendiri, berbeda dengan dimensional yang alat ukurnya
sudah terstandarisasi secara rinci, tetapi untuk mengukur
pengetahuan, sikap dan tanggapan seseorang terhadap
fenomena tertentu dibutuhkan alat ukur untuk mengukur
variabel tersebut. Penskalaan yang digunakan untuk
mengukur variabel non dimensional, merupakan upaya
untuk meningkatkan skala data dari ordinal ke tingkat
interval. Beberapa alat ukur yang digunakan antara lain:
a. Skala likert
Skala ini disampaikan pertama kali oleh Rensis
Likert, sehingga skala ini dinisbahkan pada
penggagas pertama kalinya. Skala ini digunakan
untuk mengukur persepsi atau sikap seseorang atau
kelompok terhadap suatu peristiwa atau fenomena
tertentu yang ada di masyarakat atau lingkungan
sekitarnya, sehingga skala ini banyak digunakan di
ilmu sosial, psychometric bahkan di dunia
pendidikan.18,19,20
Data hasil pengukuran pada variabel non
dimensional banyak menggunakan skala ini.
Penggunaan skala ini ada dua model, model pertama
yang positif artinya semakin baik persepsi seseorang
27
PERSETUJUAN KEPENTINGAN
1 sangat tidak setuju 1 sangat penting
2 tidak setuju 2 sedikit penting
3 ragu-ragu 3 cukup penting
4 setuju 4 penting
5 sangat setuju 5 sangat penting
b. Skala Thurstone29
31
Keterangan:
f : Frekuensi/banyaknya penilai dari skor yang ada
misal skor 1 ada 2 orang yang memilih
p : Proporsi/perbandingan f masing-masing
skor/jumlah penilai pada skor 1 nilai p=0,07
diperoleh dari f=2 dan jumlah penilai 30, sehingga
2
p= =0,066=0,07
30
0,75−Pkb
Q 1=BbQ 1 +
[PQ1 ]
. i dengan menggunakan
c. Skala Guttman30,31
Skala ini dikenalkan oleh Louis Guttman (1944-
1950) dan pertama kali dikenalkan pada tentara
Amerika30, disamping itu dikenal juga sebagai skala
kumulatif atau analisis skalogram. Skala ini lebih
sederhana dari skala sebelumnya, karena hanya ada dua
pilihan untuk menegaskan suatu sikap dari agregasi satu
set pernyataan, yang sudah disusun sesuai dengan
konstruk untuk menilai satu variabel. Semisal setuju
tidak setuju; menerima atau menolak, benar dan salah;
skore setuju, benar, menerima diberi nilai 1 sedangkan
sebaliknya 0.
Pengukuran skala ini ada dua model, instrumen
yang ada bisa digunakan langsung untuk mengetahui
seberapa besar persetujuan atau sikap membenarkan
terhadap subyek yang diukur dan hasil ukurnya bisa
digunakan sikap seseorang terhadap fenomena yang
harus disikapinya cut pointnya 0,5 x jumlah pernyataan;
untuk mengetahui kecenderungan responden dilihat dari
total skore jika sudah lebih 60% setuju maka itulah
sikap responden yang ada30; tetapi juga bisa digunakan
untuk menentukan validitas instrumen.
36
Responde Pertanyaan ke
n P1 P2 P3 P4 P5
1 0 0 0 0 0
2 1 0 0 0 0
3 1 1 0 0 0
4 1 1 1 0 0
5 1 1 1 1 1
Responde Pertanyaan ke
n P1 P2 P3 P4 P5
1 1 1 1 1 1
2 1 1 1 0 1
3 1 1 1 0 0
4 1 1 1 1 0
5 1 1 0 0 0
6 1 1 0 1 0
7 0 0 0 0 0
8 1 0 0 1 0
9 1 1 0 0 0
38
10 1 0 0 0 0
e 3
K s =1− =1− =0,87
p . ( n− ji ) 0,5. ( 50−5 )
Dengan demikian instrumen tersebut mempunyai
ketepatan yang baik untuk mengukur variabel yang
dimaksud.
39
BAB III.
PENGOLAHAN DAN PENYAJIAN DATA
Pendahuluan
Data yang sudah dikumpulkan secara kuantitatif,
dilanjutkan ke proses pengolahan data, sehingga menjadi
informasi sesuai yang diinginkan. Kuantifikasi ini merupakan
konsekuensi jika data diolah secara statistik. Konsekuensi inilah
yang membuat data non dimensional (subyektif) diukur dengan
cara penskalaan, meskipun batas antara satu skore dengan skore
lainnya secara pasti sulit untuk dibuat batasan secara tepat,
kelemahan lainnya apakah hasil pengukuran secara berulang
hasilnya sama (reliability) tidak ada jaminan. Dengan demikian
rumus penskalaan (penilaian) adalah subyektifitas seseorang
diantara obyektifitas penilaian.
Pengolahan data
Pengertian pengolahan data cukup beragam, tetapi bisa
dirumuskan sebagai upaya mengelola fakta-fakta kuantitatif
menjadi informasi yang dibutuhkan oleh analisator dan pengguna
data tersebut.32,33
Adapun tahap pengolahan data, secara statistik dapat
dibedakan menjadi:
Editing
Editing adalah suatu kegiatan pengecekan ulang terhadap
kemungkinan adanya kesalahan. Kemungkinan kesalahan
tersebut bisa terjadi pada :
a. Konten/isi instrumen (kuesioner atau
check list) apakah sudah sesuai dengan kerangka konsep
penelitian berupa variabel-variabel penelitian, sehingga
instrumen disusun fokus pada variable penelitian.
b. Pengisian jawaban pada instrumen
penelitian, apakah sudah sesuai dengan jawaban yang ada
ataukah tidak, atau jawaban belum lengkap dari instrumen
yang ada. jika masih belum lengkap, maka perlu dilakukan
40
Koding
Koding yaitu upaya konversi (mengubah) pernyataan menjadi
angka tertentu yang mewakili sesuatu yang ingin diukur.
Koding berupa simbul tertentu atau bisa juga mewakili derajat
tertentu.
Contoh:
Koding sebagai simbul tertentu:
Kuesioner dengan option jawaban a, b, c dan d; diganti menjadi
1, 2, 3 dan 4.
Contoh:
Apakah pekerjaan bapak keseharian:
a. PNS
b. Swasta
c. Petani
d. Pengusaha
Rekapitulasi
Data hasil koding, di rekap dalam satu tabulasi tertentu
yang disebut rekapitulasi. Tabulasi dibuat sedemikian rupa sesuai
dengan konstruk teoritis yang dibagi menjadi beberapa faktor,
kemudian dibagi lagi menjadi beberapa item pertanyaan.
41
menerus..
Mekanisme 1. Aids
munculnya menyerang
sistem
imunitas
2. dll
Faktor risiko 1. Pengguna
narkoba
2. Homoseksual
3. dll
Persepsi 1. penyakit
masyarakat yang
berujung
pada
kematian
2. penyakit
tidak bisa
disembuhkan
3. bisa
ditularkan
melalui
sentuhan
4. dll
Dll
3
4
5
6
Pemrosesan Data.
Adalah tahapan pengolahan data dimulai dari proses entry data,
pemilihan jenis penyajian data. Upaya ini dilakukan oleh prosesor
(pengolah) data, yang seringkali tidak dilakukan oleh peneliti
sendiri.
Penyajian data
Upaya memvisualisasikan data hasil pengolahan disebut
dengan penyajian data. Upaya ini dimaksudkan untuk
mengkomunikasi sekumpulan data ke dalam visual/tampilan yang
45
Data Kontinyu
Data yang berasal dari hasil pengukuran tidak bulat, seperti
berat badan 55,1 Kg; cenderung disederhakan menjadi 55 Kg
demikian juga hasil pengukuran lainnya. Ada beberapa cara
penyajian data kontinyu antara lain:
1. Tabel
Tabel merupakan cara penyajian data berupa narasi
angka yang disajikan dalam bentuk tabulasi, jika dalam data
memuat terlalu banyak informasi, maka tabel mejadi
kurang menarik, untuk itu ada beberapa cara untuk
membuat tabel sederhana dan mudah difahami, dengan
langkah-langkah sebagai berikut:
a. Range (R)
Range adalah jarak antara nilai terendah sampai
dengan nilai tertinggi, jika dirumuskan menjadi :
R = ( Nilai tertinggi − nilai terendah ) + 1
Penambahan angka satu ini disebabkan mulai dari
nilai yang paling rendah sampai paling tinggi.
b. Jumlah Kelas (JK)
JK merupakan banyaknya kelas dari hasil kategorisasi
data mentah yang ada. Beberapa ahli menyarankan
jumlah kelas antara 5–9 kelas, hal ini disebabkan
kalau lebih kecil dari lima, boleh jadi interval kelas
semakin lebar, sehingga data cenderung bias, kalau
lebih dari sembilan data lebih teliti, tetapi terlalu
panjang, sehingga kurang komunikatif bagi pembaca.
Digunakan rumus sturgess
jml kelas = 1 + 3,3 log n
n = banyaknya data
Rumus ini sebagai pendekatan, sehingga
memudahkan para analisator untuk membuat
pengelompokan data.
c. Interval kelas (I)
47
5, 6, 7, 10, 11, 15, 14, 16,17, 20, 3, 5, 6, 7, 8, 9, 11, 13, 15, 14.
frek
5 .
4 .
3 .
2 .
1 .
. . . . . .
2,5 6,5 10,5 14,5 18,5 21,5 BB
Gambar 3.1. Histogram Berat badan Balita
50
3. Poligon
Pembuatan poligon dengan garis antar titik pada histogram,
didasarkan pada titik tengah kelas untuk masing-masing
kelas. Adapun rumus titik tengah kelas (TTK) sebagai
berikut:
[ Nilaitertinggi−nilai terendah ]
TTK = ; masing-masing kelas
2
frek
5 .
4 .
3 .
51
2 .
1 .
. . . . . .
4,5 8,5 12,5 16,5 20,5 BB balita
Gambar 3.2. Poligon Berat badan Balita
di Posyandu Mawar 2019
fr Pohon Daun
9 0 355667789
1 1 0113445567
0
1 2 0
fr Pohon Daun
9 0 000000000
1 1 0000000000
0
1 2 0
Dari cara interpretasi sama, yaitu satuan sebanyak 9,
sepuluhan sebanyak 10 dan dua puluhan ada 1; tetapi
kelemahannya berapa angka sebenarnya tidak diketahui, tetapi
secara visual sama2.
Data Deskrit
Data yang berasal dari hasil perhitungan ini cenderung
bulat, seperti jumlah laki-laki dalam satu kelas 15 dan jumlah
perempuan 35; maka tidak ada jumlah laki-laki 15,5 tidak
mungkin. Adapun penyajian datanya antara lain:
1. Tabel
Tabel pada data diskrit tidak ada tahapan perhitungan
dalam pembuatannya, karena bersifat kategorial, maka
banyaknya baris menyesuaikan berapa kategori. Pada
pembuatan tabel kategorial ini ada dua dimensi yaitu:
a. Satu dimensi
Satu dimensi yang dimaksudkan adalah hanya satu
variabel saja, semisal:
53
b. Dua dimensi
Penyajian dengan cara ini dimaksudkan dua variabel
disajikan dalam tampilan yang sama, misalnya jenis
kelamin dan tingkat pendidikan, dengan tampilan
sebagai berikut:
n
Jumlah 1 25 84 40 150
Sumber : data primer terolah
SAKIT
F re ku e n si
40
30
20
10
0
ISPA MALARIA DIARE KULIT THYPOID LAIN-LAIN
SAKIT
THYPOID MALARIA
5% 18%
KULIT
9%
DIARE
14%
Gambar 3.4. Distribusi Penyakit di Desa Arga Makmur 2019
56
4. Diagram gambar/pictogram
Visualisasi data dengan keterwakilan gambar, digunakan
untuk mengilustrasikan berapa jumlah yang diwakili oleh
satu gambar, maka jumlah dihitung dengan cara
mengalikan banyaknya gambar dengan perwakilan satu
gambar. Sebagai contoh: 1 gambar orang mewakili 10 juta,
maka jika ada 10 orang gambar, bisa dikatakan ada 100 juta
orang, bagaimana jika kelipatannya tidak sampai 10 juta,
maka orang yang digambarkan tidak utuh, inilah
kelemahannya, sehingga seringkali dilengkapi dengan
jumlah yang ada dalam bentuk angka:
Contoh:
5. Diagram peta
Diagram ini digunakan untuk menentukan secara cepat
distribusi dan derajat potensi endemisitas suatu daerah,
sebagai contoh:
57
6. Diagram garis
Analisis kecenderungan bisa dilihat dari arah grafik yang
ditunjukkan melalui perubahan pola menurut deret waktu,
sebagai contoh:
Pendahuluan
Ketidak pastian merupakan salah satu hukum kehidupan,
bagaimana cara memastikan ketidak pastian itulah probabilitas
atau peluang suatu kejadian, sehingga kejadian yang tidak pasti
adalah suatu ketidak pastian itu sendiri. Contoh rata-rata berat
badan mahasiswa di suatu perguruan tinggi 65 Kg, artinya ada
mahasiswa yang kurang dan lebih dari rata-rata, itulah yang
dimaksud ketidak pastian bahwa rata-rata itu mempunyai makna
tidak tunggal, tetapi itulah yang pasti dari sekumpulan data
diwakili oleh satu nilai yang disebut rata-rata. Berbeda dengan
kesimpulan grafitasi 9,8 m/dt; maka kesimpulan yang diambil
tersebut mempunyai nilai tunggal, tidak ada yang kurang atau
lebih.
Teori-teori dikembangkan dalam konsep ilmiah seringkali
merupakan penyederhanaan suatu realitas, statistik menggunakan
logika induktif dalam menarik kesimpulan yaitu didasarkan
pengumpulan sekelompok data, kemudian diambil
kesimpulannya; teori terbentuk dari sekumpulan kesimpulan
induktif yang diteliti berulang kali pada subyek dengan
karakteritik sama dan lokasi berbeda beda menghasilkan
kesimpulan yang relatif sama.
Kesimpulan lain yang dikembangkan berdasarkan aksioma
tertentu melalui logika deduktif yang tidak ada kaitannya dengan
realitas37, sehingga realitas menyesuaikan aksioma deduktif
tersebut, seperti dalam konsep matematik contoh tentang luas
(panjang x lebar), volume (p x l x t) itu berkaitan dengan realitas,
tetapi dalam matematika secara konsep ada M4, ... Mn yang secara
konsep ada tapi dalam realitas tidk ada, pada statistik juga ada
tentang konsep distribusi normal pada sampel tidak terbatas,
sehingga tabel mempunyai batas antara -∞ s/d ∞, tetapi dalam
penerapannya selalu mempunyai keterbatasan sampel.
Peluang lazim dipakai pada banyak aktifitas manusia, ahli
epidemiologi sering membuat estimasi kejadian berdasarkan data-
data yang ada dengan mengatakan risiko perokok terkena Ca Paru
59
G G GG
A GA
A G AG
A AA
G G GG
A GA
1 A1
A
2 A2
3 A3
4 A4
5 A5
6 A6
Maka ruang sampelnya T={GG, GA, A1, A2, A3, A4, A5, A6}
Kejadian/even
Peristiwa yang muncul dari suatu percobaan,
sebagai contoh berapa kejadian dadu dapat dibagi dua;
maka peristiwa yang boleh jadi muncul adalah ={2, 4, 6};
dengan demikian kejadian dapat didefinisikan sebagai
suatu peristiwa yang menjadi bagian dari ruang sampel.
Kejadian kelahiran bayi laki-laki pada satu wanita hamil= {laki-
laki}
Himpunan37,38
Notasi
63
Faktorial
Notasi faktorial !. faktorial bilangan asli n adalah hasil perkalian
antara bilangan bulat positif yang kurang dari atau sama
dengan n. , dengan ketentuan 0!=1! = 1.
Misal :
3! = 3. 2.1 = 6
4! = 4. 3. 2. 1 = 24
n ! = 1. 2. (n-2). (n-1). n
Faktorial biasa digunakan untuk menghitung banyaknya susunan
yang dapat dibentuk dari sekumpulan benda tanpa
memperhatikan urutannya.41
Contoh faktorial untuk susunan huruf A, B, C (urutan tidak
deperhatikan, maka ABC ; ACB ; BCA ; CAB : BAC ; dan
CBA.
Perhatikan komponennya sama hanya posisi huruf yang berbeda.
Permutasi
Susunan yang dapat dibentuk dari satu kumpulan
benda yang diambil sebagian atau seluruhnya atau suatu
cara untuk menyusun unsur-unsur dengan memperhatikan
urutan unsur penyusunnya. Unsur penyusunnya dapat
66
Contoh :
Susunlah huruf ABC, dengan variasi tiga huruf tersebut, maka
dari ketiga huruf dapat disusun menjadi : ABC ; ACB ; BCA ;
CAB : BAC ; dan CBA.
Ketiga huruf tersebut, jika disusun dengan jumlah huruf yang
n
sama maka dapat dirumuskan menjadi Pn = n!=1. 2.3=6 ;
P33=3 !=3.2 .1=6; posisi pilihan yang sama dengan unsur
penyusunnya sama dengan faktorial.
Kombinasi
Penyusunan urutan kejadian dari r subyek dari
sejumlah n subyek yang lebih besar, tanpa memperhatikan
urutan disebut kombinasi38. Hakekatnya sama dengan
permutasi, namun urutan tidak diperhatikan, jika
komponen penyusunnya sama dianggap satu urutan2.
Dari tiga huruf yang ada bila dibuat dua kombinasi akan
memperoleh jumlah kombinasi sebanyak
3! 3.2.1
C32 = = =3
2 ! (3−2) ! 2! . 1 !
yaitu AB, AC dan BC, karena
AB=BA demikian juga yang lain, sehingga dihitung satu. Contoh
lain berapa banyaknya cara memilih 2 ahli bio statistik dari 4 ahli
yang sama, maka dapat dihitung:
4! 1.2.3.4! 24
Crn = = = =6
2 ! (4−2) ! 1.2!1.2! 4 ; misal ahlinya A, B, C dan
D, maka kombinasi 2 dari 4 ahli biostatistik adalah AB, AC, AD,
BC, BD, CD
Peluang
68
jumlah laki−laki
Seks rasio ( ¿ per 100 wanita
jumlah wanita
69
Data tabel 4.3 terlihat di Amerika peluangnya 0,5 artinya jika ada
seorang wanita hamil, peluang melahirkan antara laki-laki dan
perempuan sama. Pada kasus seks rasio atau perbandingan jenis
kelamin. Jika dikonversi menjadi peluang dapat dihitung, sebagai
contoh di Amerika tahun 1965 jumlah kelahiran= 3.760.358 bayi
lahir hidup (sample space), maka peluang mendapatkan bayi laki-
laki di Amerika tahun 1965 (p)=
kejadian 1.927 .054
= =0,51 ; berarti peluang mendapatkan
sample space 3.760.358
anak laki-laki orang Amerika tahun 1965 lebih besar
dibandingkan anak perempuan lahir hidup, angka 0,51 dapat
diartikan setiap 100 kelahiran hidup bayi di Amerika tahun 1965
ada 51 bayi laki-laki. Seks rasio Indonesia tahun 2014 dengan
seks rasio 101, maka peluangnya:
101
p ( laki−laki )= =0,5; nilai 0,5 di Indonesia peluangnya relatif
201
sama antara laki-laki dan wanita;
Latvia dengan seks rasio 84,8, maka peluangnya
kejadian 84,8
p ( laki−laki ) ¿ = =0,458; artinya peluang
sample space 184,8
lahir bayi wanita lebih banyak dibandingkan laki-laki, dari 1000
bayi lahir hidup di Latvia ada 458 laki-laki dan wanita 542 atau
dengan kata lain setiap 1000 kelahiran hidup kelebihan 84 wanita.
Peluang bersyarat
Yaitu peluang kejadian tertentu, jika kejadian
lainnya telah diketahui, dilambangkan dengan P(B|A)
artinya “peluang B terjadi bila diketahui A telah
terjadi” rumusan peluang bersyarat42 :
n( B ∩ A )
n ( B ∩ A ) n( A ∪ B)
P ( B| A )= =
n(A) n( A)
n( A ∪ B)
71
n
B∩ A=n ; sedangkan A ∪B=N ; dengan demikian =P
N
n( B∩ A )
Maka =P ( B∩ A )=P ( A ∩B ) ; sifat komutatif
n( A ∪ B)
n(A ) n( A)
Sedangkan = =P( A), sehingga
n( A ∪ B) n . N (A ∪B)
rumusnya2:
P ( A ∩B )
P (B | A ) = , bila P ( A ) > 0
P( A)
Contoh soal :
Hasil penelitian tentang hubungan antara kualitas mandi dengan
penyakit kulit, seperti terlihat pada tabel berikut :
KURANG BAIK
BAIK
A∩B
Gambar 4.1 diagram venn gabungan
Contoh soal:
73
Contoh soal:
100 penduduk desa A, terdiri dari 3 penderita hipertensi (H), 10
DM, 5 gagal ginjal kornik (GGK). Berapa peluang seseorang
yang tinggal di desa tersebut minimal salah satu dari ketegori
yang ada:
Jawab : P(H)
3 10 5
¿ =0,03 ; P ( DM )= =0,1; P ( GGK )= =0,05 ; kecuali
100 100 100
itu ada penduduk yang sehat (S), maka probabilatasnya
82
P ( S )= =0,82 ; dengan demikian probabilitas total P (T) dapat
100
dihitung sebesar:
P ( T ) =0,03+0,1+0,05+0,82=1
Artinya setiap orang yang ada di desa A tersebut pasti salah satu
diantara ke empat kategori yang ada yaitu kalau tidak kena
hipertensi, DM, GGK atau kondisi sehat.
Hukum perkalian
Perkalian dilakukan dalam probabilitas jika kejadian terjadi
secara bersama sama dari lebih dari satu himpunan, sehingga
kejadian tersebut terjadi pada himpunan A juga terjadi pada
himpunan B, demikian seterusnya
75
Kejadian bersyarat
Kejadian B terjadi setelah kejadian A diketahui kejadiannya;
rumus yang digunakan:
P (A∩B)= P(A) x P(B|A)
Contoh kasus:
Hasil Penyelidikan Epidemiologi kasus malaria di suatu desa
endemis diketahui ada 5 penderita malaria positif dengan jumlah
penduduk desa 100. Direkomendasikan dilakukan Mass Blood
Survei (MBS) yaitu pemeriksaan sediaan darah tebal dengan
target 80% jumlah penduduk untuk mencegah KLB lebih lanjut.
Jika satu bulan berikutnya dilakukan pemeriksaan darah pada
penduduk desa tersebut, berapakah peluang dua penduduk
pertama hasil pemeriksaan darah positif malaria.
Jawab:
Diketahui sample spacenya 100 dengan target 80%, berarti 80
penduduk, sehingga peluang pemeriksaan orang pertama positif
5
malaria =0,0625 ; sesudah pemeriksaan yang bersangkutan
80
76
Contoh:
Desa A kejadian Demam Berdarah (DB); desa B berjauhan juga
mengalami KLB DB. Maka populasinya bisa dibagi dua kategori
yaitu penderita DB dan non penderita DB. Adapun narasinya
sebagai berikut Desa A ada 100 penduduk dengan jumlah
penderita 10; desa B dengan jumlah penduduk 150, penderita DB
nya ada 20; jika diketahui ada mobilitas penduduk dari desa B ke
Desa A sebanyak 10 orang tanpa diketahui apakah penderita atau
bukan. Berapakah peluang penderita DB di Desa A.
Misalkan PA penderita dari desa A; NPA berarti non penderita
dari desa A; sedangkan PB penderita dari desa B; NPB berarti
Non penderita dari desa B. Maka bisa dirumuskan sebagai
berikut:
P¿
¿ P¿
Cara membacanya sebagai berikut:
Ada mobilitas penduduk dari desa B ke desa A sebanyak 10
orang tanpa diketahui apakah penderita atau non penderita,
dengan demikian di desa A boleh jadi ketambahan penderita atau
bukan penderita, yang ditanyakan berapakah peluang
mendapatkan penderita DB di desa A. Supaya bisa menghitung
hal tersebut dibuatlah tabel kemungkinan sebagai berikut:
77
P( A ∩ B)
P ( B| A )= ; P ( A ∩ B )=P ( B ∩ A ) , hukum komutatif
P ( A)
P ( B| A ) . P( A)
P( A∨B)=
P(B)
Menggunakan teori komplementer (yang bukan), bisa dinotasikan
B(A∩ B ¿ U ( A ∩B Ꞌ ); dimana keduanya saling bebas (disjoint),
maka:
P(B)=P(A∩ B ¿+ P( A ∩ BꞋ )=P(A|B).P(B)+P(A|BꞋ ¿ . P(B Ꞌ )
P ( Br ∩ A )
P ( B r| A ) = k
P ( B r ) . P ( A|Br )
∑ P (B 1¿ ∩ A)= k
¿
i
∑ P ( Bi ) . P( A∨Bi ¿ )¿
i
Dimana r= 1, 2, 3, ... k
Jika kasus terjadi secara bersama-sama dari dua himpunan, bisa
dirumuskan sebagai berikut:
P ( B|A ) . P( A)
P( A∨B)= ;
P(B∨A). P(A )+ P (B∨ A Ꞌ) . P( A Ꞌ)
Contoh soal:
Daerah endemis malaria yang sudah diyatakan eliminasi,
mengupayakan sedemikian rupa supaya tidak menjadi endemis
malaria kembali. Salah satu upaya yang dilakukan adalah
pemeriksaan darah setempat terhadap pendatang (migran) yang
berasal dari daerah endemis lainnya. Setiap ada migran dilakukan
pemeriksaan darah dengan menggunakan Rapid Diagnostic test
(RDT). Jika diketahui hasil pemeriksaan RDT 5% positif malaria
dari pendatang yang datang. Hasil pemeriksaan RDT yang positif
tersebut di konfirmasi ulang dengan metode mikroskopis (gold
standard) ditemukan 95% yang positif; sedangkan pemeriksaan
RDT yang negatif juga dikonfirmasi dengan mikroskopis, 10%
positif malaria.
Pertanyaannya:
Jika sembarang migran datang di daerah endemis ditest dan
hasilnya positif, berapakah peluangnya orang tersebut benar-
benar menderita malaria?
Jawab:
Diketahui : A= hasil pemeriksaan RDT positif; AꞋ= hasil
pemeriksaan RDT negatif; B= hasil pemeriksaan mikroskopis
positif; BꞋ=hasil pemeriksaan mikroskopis negatif. P(B|A)=
peluang pemeriksaan konfirmasi mikroskopis positif dari hasil
pemeriksaan RDT yang positif; P(B|AꞋ)= peluang pemeriksaan
konfirmasi mikroskopis positif dari hasil pemeriksaan RDT yang
negatif; P(BꞋ|A)= peluang pemeriksaan konfirmasi mikroskopis
80
Dihitung probabilitasnya:
P(A)=5%; P(AꞋ)=95%; P(B|A)=95%; P(B|AꞋ)=10%; P(BꞋ|
A)=0,05; P(BꞋ|AꞋ)=0,9; hasil perhitungan peluang ini, bisa dibagi
dalam 4 kuadran, sebagai berikut:
A=5% AꞋ=95%
Pendahuluan.
Statistik terapan paling dasar adalah mempelajari fakta-
fakta berupa data hasil pengumpulan, kemudian disajikan dalam
berbagai bentuk penyajian baik tabel, gambar, grafik maupun
menggunakan angka mutlak maupun dalam bentuk persentase,
sehingga pengguna bisa dengan mudah untuk mengetahui
kecenderungan, pemusatan dan penyebaran data.
Ruang lingkup statistik deskriptif hanya menggambarkan
fakta-fakta hasil pengukuran apa adanya, tidak dilakukan
penyimpulan lebih luas pada populasi, karena langkah ini sudah
membuat generalisasi, namun dalam beberapa kasus hal ini tidak
bisa dihindari (karena menyangkut persepsi pengguna) juga
terjadi di populasi. Dengan demikian kesimpulan diambil dengan
kriteria yang jelas yaitu batasan populasi dan minimal sample
size pada besar sampel yang diambil, jika kedua persyaratan ini
dipenuhi, maka generalisasi bisa dilakukan.
Contoh :
Hasil survei lembaga survei untuk menentukan elektabilitas
(keterpilihan) kandidat presiden misal diketahui calon presiden A
45% dan Calon Presiden B 52 % sisanya belum menentukan
pilihan. Maka persepsi pembaca boleh jadi hal yang sama juga
terjadi di Populasi (perhitungan manusal nasional).
∑ 3=3+3+3+ 3=4.3=12
i=1
jika digunakan notasi
n
∑ k=k +k + k +… k =n . k
i=1
∑ ( a . x i +b . y i−c . z i ) =∑ a . xi +∑ b . y i−∑ c . z i;
i=1 i=1 i i
disederhanakan menjadi:
❑ ❑ ❑
a ∑ X+ b . ∑ Y −c ∑ Z
❑ ❑ ❑
Data Tunggal
Data ini bersifat data mentah hasil pengukuran langsung, belum
diubah bentuk tabel dengan kategori tertentu. Beberapa
ukurannya:
Rata-rata (mean/x́ )
Konsep rata-rata hakekatnya membagi data ditengah, nilai rata-
rata mencerminkan akumulasi semua nilai dibandingkan dengan
banyaknya data penyusunnya. Ada beberapa jenis penilaian rata-
rata, yaitu :
1. Rata-rata hitung (Arithmatic Mean)
83
2. Rata-rata geometrik
Rata-rata ini digunakan untuk memperkirakan suatu nilai
tertentu dalam satuan waktu tertentu, berdasarkan data yang
sudah ada.
Rata-rata geometrik G dari sekumpulan angka-angka X1,
X2...Xn, merupakan akar pangkat n dari perkalian angka-
angka tersebut, dengan notasi:
G= √n X 1. X 2 ... X n
Misal ada data 2, 4, 8; maka rata-rata geometriknya dapat
dihitung sebagai berikut:
n=3; maka persamaannya menjadi G= √3 2.4 . 8=4
84
Diketahui:
Pt=270 juta; Po=242 juta; t=10 tahun; maka persamaannya:
270= 242. (1+r)10
Log 270= log 242. +10 log (1+r)
85
100
−1=1,019−1=0,019.100 %=1,9%
Pengetahuan 90 30 2700
Sikap 70 30 2100
Praktek 60 40 2400
Jumlah 100 7200
xi 4 5 6 7 8 ❑
∑ xi
30
x́= ❑
= =6
n 5
D -2 -1 0 1 2 0
MD= =0
5
Nilai mean deviasi selalu sama dengan nol jika tidak diberi
tanda mutlak||, hal ini bisa difahami karena jika nilai rata-rata
sebagai patokan maka data akan dibagi ditengah sehingga nilai
sebelum rata-rata selalu bertanda – (negatif) dan sesudah rata-
rata selalu bertanda + (positif), sehingga (-) + (+)=0; untuk itu
maka MD diberi tanda mutlak artinya negative dianggap
positif, sehingga perhitungan menjadi :
89
xi 4 5 6 7 8
D 2 1 0 1 2
Nilai D dianggap mutlak (negatif dianggap positif), sehingga
hasilnya sebagai berikut:
❑
∑ | xi −x́| 6
MD= ❑
= =1,2
n 5
3. Varians (σ 2)
Varians merupakan konsep untuk menghilangkan tanda negatif
yang dianggap mutlak, cara menghilangkan tanda tersebut
dengan cara mengkuadratkan nilai deviasi, sehingga rumusnya
menjadi:
n n
2
∑ Din ∑ [ x i−x́ ] ; sekarang berdasarkan rumus tersebut,
σ 2= i=1 = i=1
n n
diuraikan secara aljabar, sebagai berikut:
n
2
∑ [ x i− x́ ] , sekarang pembilangnya diuraikan secara
σ 2= i=1
n
aljabar, sedangkan pembaginya “n” diabaikan dulu, maka:
n n
∑ x 2i −¿ ∑ 2. x i . x́ +∑ x́ 2 ¿;
i=1 i i=1
n
guna memudahkan penjelasan ∑ x́ 2, dibuat ilustrasi sebagai
i=1
berikut:
3
3+3+3=∑ 3=3.3; jika mempunyai
i=1
90
3
k + k +k =∑ k =3. k ; sehingga jika punya notasi
i=1
❑
n n
2 2 ∑ xi
∑ k=n. k ; dan jika ∑ x́ =n. x́ ; sedangkan x́= ❑
i=1
n i=1
n ∑ xi ∑ xi ∑ xi ∑ x i
2 i=1 i=1 i=1 i=1
∑ x −2. i
n
.
n
+n .
n
.
n
i=1
n 2 n 2 n 2
∑ x −2. 2
i
(∑ ) (∑ )
i=1
xi
+
i=1
xi
=∑ x −
n
2
i
(∑ )
i=1
xi
; maka pembagi
i=1 n n i=1 n
“n” dikembalikan lagi, sehingga rumusnya menjadi:
n 2
∑ x 2i −
( ) ∑ xi
i=1
; rumus ini digunakan untuk menentukan
n
σ 2= i=1
n
varian populasi; sekarang coba dihitung contoh sederhana
berikut:
Data (apapun namanya) 4, 5, 6, 7, 8, berapa variannya; maka:
Diketahui:
❑
x 2i 16 25 36 49 64
∑
❑
¿190
91
xi 4 5 6 7 8 ❑
∑
❑
¿30
Sehingga varians:
n 2
∑ x 2i −
( )∑ xi
i=1
=
190−
( 30 )2
5 190−180 10 ;
n = = =2
2
σ = i=1
5 5 5
n
perhitungan ini untuk penelitian pada populasi, sedangkan jika
pada sampel rumusnya sama, hanya pembaginya n-1, sehingga
menjadi:
n 2
∑x − 2
i
(∑ )
i=1
xi
n 10
σ = i=1
2
n = =2,5
n−1 4
xi 4 5 6 7 8
D 2 1 0 1 2
D2 4 1 0 1 4
, maka nilai D2 jika dijumlahkan =10; dengan demikian:
❑
∑ Di2
10 ; perhatikan hasilnya sama...; lalu sebagai
σ 2= ❑
=2 =
n 5
pengguna pilih yang mana? Jika dataya sedikit bisa digunakan
rumus asal dari deviasi, sedangkan jika datanya banyak
gunakan rumus turunan varian dengan bantuan kalkulator
92
σ2 2
√ √
Se=❑ =❑ =0,63; untuk populasi; jika untuk sampel maka
hasilnya
n 5
σ2 ❑ 2
Sen=❑
√ √ n−1
=
4
=0,707 ; pada perhitungan kalkulator
disediakan kedua nilai tersebut; notasi pada kalkulator (
σ n=untuk populasi ; σ n−1 untuk sampel ); sedangkan untuk soft
ware perhitungan statistik seperti SPSS, STATA Standard
error yang dimaksud adalah Se untuk sampel (ingat konsep
statistik selalu berbasis sampel)
n 2
SD=❑√ σ 2n atau
√
❑
n
∑x −
i=1
n−1
2
i
(∑ )
i=1
n
xi
; jika dari data varian sampel
Data Kelompok
Perhitungan data kelompok artinya data yang sudah disusun
dalam tabel distribusi frekuensi atau data sudah dikelompokkan
dalam kategori tertentu. Pada perhitungan ini juga dibagi dua
yaitu tendency central dan dispersi, adapun penjelasannya sebagai
berikut:
Rata-rata
Data kelompok tidak diketahui berapa persisnya nilai hasil
pengukuran setiap individu (xi), sehingga nilai xi didekati dengan
nilai tengah, kenapa yang dipakai nilai tengah, hal ini disebabkan
karena jika batas atas kelas yang dipakai, hasilnya bisa over
estimate dan jika batas bawah kelas maka hasilnya bisa under
estimate, maka digunakanlah nilai tengah untuk menghindari
kedua perkiraan yang terlalu tinggi dan terlalu rendah. Hal ini
bisa juga diambil pelajaran bahwa orang yang belajar statistik
selalu berada ditengah-tengah. Adapun rumusnya sebagai berikut:
n
¿
∑ xi . f i xi fi
X = i=1
n ; titik tengah kelas; frekuensi masing-masing
kelas; sebagai contoh: Hasil pengukuran asam urat pada 100
orang laki-laki di atas 40 tahun diperoleh data sebagai berikut:
1. 3-5 50
2. 6-8 35
3. 9-11 10
4. 12-14 5
Jumlah 100
¿
∑ f i . xi
X = i=1
n
, maka dibutuhkan perpanjangan tabel,
1. 3-5 4 50 200
2. 6-8 7 35 245
3. 9-11 10 10 100
4. 12-14 13 5 65
Median (Md/~ x)
Median adalah nilai tengah setelah data di urutkan
n
atau dengan kata lain data pada urutan paling tengah ( ).
2
Pada data kelompok sebelum dicari nilai median,
ditentukan dulu kelas mediannya, dengan cara
n
menghitung ( ). Adapun rumusnya sebagai berikut:
2
n
Md=B bkm+ ( )−f
2 cb ; dimana Bbkm= batas bawah kelas median
fm
.i
f cb frekuensi komulatif
(nilai terendah -0,5)kelas median;
sebelum kelas median yaitu penjumlahan frekuensi kelas yang
bersangkutan dengan kelas sebelumnya; fm frekuensi kelas
median.
Contoh : dari tabel 5.3. asam urat.
1. 3-5 50
2. 6-8 35
3. 9-11 10
4. 12-14 5
Jumlah 100
96
1. 3-5 50 50
2. 6-8 35 85
3. 9-11 10 95
4. 12-14 5 100
Jumlah 100
Langkah-langkah penyelesaian:
1. Cara mencari frekuensi kumulatif (fc), kelas pertama ada 50,
sebelumnya tidak ada kelas berarti frekuensinya 0, sehingga fc
kelas pertama 50, kelas kedua sebelumnya 50 dan kelas kedua
35 berarti fc=85; kelas ke tiga frekuensinya 10 sebelumnya
ada kelas 1 dan kelas kedua yang jumlah frekuensinya 85;
demikian seterusnya.
n 100
2. Tentukan kelas median, dengan cara = =50; berarti
2 2
kelas median berada pada frekuensi ke 50, perhatikan kelas
pertama frekuensinya 50, berarti kelas median berada pada
kelas pertama
3. Kelas median sudah ditemukan berarti bisa dihitung notasi
lainnya, maka nilai mediannya sebagai berikut:
Bbkm=3−0,5=2,5 ; f cb =0 , karena sebelum kelas1 tidak ada ;
fm=frekuensi kelas median=50 ; i=interval kelas 3
97
n 100
Md=B bkm+
2
( ) ( )
−f cb
fm
.i=2,5+
2
50
−0
.3=2,5+
50
50 ( )
.3=5,5
Modus (Mo)
Nilai yang paling sering muncul, dalam tataran
praktis kadang nilai modus lebih dari satu, jika hal ini
terjadi maka semuanya harus dihitung nilai modusnya.
Adapun rumusnya sebagai berikut:
a
Mo=Bbkmo + ( )
a+ b
. i; Bbkmo= batas bawah kelas modus, i interval
kelas; a=f mo−f b; b=f mo−f a; fb= frek. Sebelum kelas modus; fa=
frek. Sesudah kelas modus.
Contoh digunakan kasus asam urat tabel 5.3.; maka bisa
ditentukan kelas modus berada pada kelas ke 1; sehingga bisa
diketahui:
Bbkmo=3−0,5=2,5 ; a=50−0=50; b=50−35=15 ; i=3 , maka
modus:
a 50
Mo=Bbkmo + ( )
a+ b
. i=2,5+( 50+35) .3=4,26
Bagaimana jika kelas modus lebih dari satu, maka harus dihitung
semuanya, dengan cara yang sama.
Varians (σ 2n)
Varians pada data kelompok hakekatnya sama dengan data
tunggal, tetapi diambil dari asalnya yaitu deviasi yang
98
i=1
Kuartil
Konsep median data dibagi ditengah setelah
diurutkan atau data dibagi dua, pada pendekatan lainnya
data juga dibagi dalam beberapa kategori yang sering
digunakan yaitu kuartil dan persentil.
Kuartil data dibagi empat bagian baik data tunggal
maupun data kelompok. Jika pada data tunggal data
diurutkan terlebih dahulu baru dibagi 4, jika datanya
ganjil pilih data ke “i” nya, sebagaimana penentuan pada
median. Ada dua indikator yang digunakan yaitu
simpangan kuartil dan simpangan antar kuartil.
1. Data Tunggal
Beberapa ukuran kuartil yang perlu diketahui adalah
1
K1 kuartil 1 rumusnya data ke . n , K2 sama dengan
4
3
median, K3 kuartil 3= . n ; sedangkan simpangan kuartil
4
dengan rumus:
K 3−K 1
Q= ; Q simpangan kuartil.
2
100
Contoh soal:
Data hasil pengukuran BB Balita, diketahui sebagai
berikut:
5, 8, 9, 10, 11, 12, 12, 16, 17, 19, 20, 21; banyaknya data
(n)=12
1
Maka bisa dihitung: K1 = .12=3; kuartil 1 ada pada data
4
3
ke 3 yaitu 9; K3= .12=9 ; berada pada data ke 9 dengan
4
BB=17; jadi simpangan kuartil
K 3−K 1 17−9
Q= = =4; simpangan antar kuartil (wilayah
2 2
antar kuartil/WAK) WAK= K3 - K1= 17-9=8
2. Data kelompok
Perhitungan simpangan kuartil dan wilayah antar kuartil
pada data kelompok rumusnya sama, hanya cara mencari
nilai K3 dan K1 yang berbeda, adapun rumusnya sebagai
berikut:
n.i
K i=Bbki +( 4
−fc b
f ki )
. i; Bbki= Batas bawah kuartil ke i; fc b=
1. 3-5 50
101
2. 6-8 35
3. 9-11 10
4. 12-14 5
Jumlah 100
1. 3-5 50 50
2. 6-8 35 85
3. 9-11 10 95
4. 12-14 5 100
Jumlah 100
Maka perhitungannya:
n.i 100.1
K 1=Bbki +( ) (
4
−fc b
f ki
. i=2,5+
4
50
−0
)
.3=4
102
n.i 100.3
K 3=Bbki +( 4
−fc b
f ki ) (
. i=5,5+
K 3−K 1 7−4
Q= = =1,5; sedangkan WAK= 7-4=3
2 2
Persentil
Persentil digunakan untuk membagi data dalam 100
bagian sama banyaknya. Ukuran yang digunakan sama
yaitu simpangan persentil (SP) dan wilayah antar persentil
(WAP), logikanya sama dengan kuartil hanya
pembagiannya yang berbeda. Adapun rumusnya:
P90−P10
SP= ; sedangkan WAP=P90−P10 ; untuk mengetahui
2
nilai Pi digunakan rumus:
n. i
Pi=Bbpi + (100
f pi )
−fc b
. i; p berarti persentil adapun yang lain
1. 3-5 50 50
2. 6-8 35 85
3. 9-11 10 95
4. 12-14 5 100
Jumlah 100
n. i 100.90
P90=Bbpi +
Maka:
(100
−fc b
f pi ) (
. i=8,5+
100
10
−85
)
.3=10
P90−P10 10−3,1
SP= = =3,45 ; WAP=10−3,1=6,9
2 2
Penggunaan kuartil, desil atau persentil dalam kehidupan sehari-
hari dimanfaatkan untuk membuat kategori berdasarkan nilai
tertentu (cut point ), maka hasil perhitungan yang sudah
dilakukan pada ketiganya bisa digunakan untuk kategori tersebut.
Seperti kategori ergonomi atau tidak digunakan nilai persentil.
Skewness (sk)
Bentuk kurva yang baik dalam konsep adalah simetris, tetapi
dalam praktek yang diukur pada sampel terbatas, sringkali tidak
ideal (simetris), untuk itu dibutuhkan suatu indikator mengukur
seberapa jauh dan kearah mana kemencengan tersebut. Ukuran
itu disebut Skewness. Gambar kemencengan dilihat dari
kelandaian kurva, jika yang landai sebelah kanan disebut kurva
menceng ke kanan dan jika sebaliknya menceng ke kiri, adapun
gambarannya sebagai berikut:
max max
105
Kurtosis
Kurtosis merupakan ukuran untuk mengetahui bentuk
keruncingan kurva distribusi frekuensi.
Pembandingnya adalah distribusi normal. Model distribusi
normal bisa dibedakan menjadi tiga model yaitu leptocurtic yaitu
model kurva runcing, dengan demikian kurva ini mempunyai
varians yang kecil sehingga data relatif paling homogen,
dibandingkan kurva lainnya; kedua model platycurtic modelnya
lebih datar, sehingga variannya paling besar; ketiga model
mesocurtic model menengah tidak kurus dan tidak terlalu datar.
Jika digambarkan ketiga kurva tersebut sebagai berikut:
106
∑ ( x i− x́ ) r
mr = i=1
n
Rumus ini digunakan untuk data tunggal
Penjelasan dari rumus tersebut mr momen ke r (r=1 s/d n), jika
digunakan untuk perhitungan kurtosis 2 dan 4; n banyaknya data.
Hakekatnya momen diperoleh dari nilai deviasi dan jika m2 sama
dengan deviasi dikuadratkan itu artinya sama dengan nilai varians
yang sudah dihitung sebelumnya.
Data kelompok rumus momen yang digunakan dikalikan dengan
frekuensi untuk deviasinya, sehingga notasinya sebagai berikut:
n
∑ f i . ( x i− x́ )r
m r = i=1
n
Kriteria bentuk kurva hasil perhitungan sebagai berikut: jika a4>3
kurva leptokurtik, jika <3 platikurtik dan a4=3 mesokurtik.
107
U 21 22 20 20 24 25 26 28 23 21
Rata-ratanya =23
D -2 -1 -3 -3 1 2 3 5 0 -2
2
D 4 1 9 9 1 4 9 25 0 4
D4 16 1 81 81 1 16 81 625 0 16
Keterangan:
❑ ❑
2 4
U= umur; D= deviasi; ∑ D =66 ; ∑ D =918
❑ ❑
m4 1.065,404
a 4= 2
= =1,99; nilai sebesar ini berarti <3;
( m2 ) 23,162
sehingga masuk kategori platikurtik.
Catatan:
Desil (tidak dibahas, tapi logikanya sama dengan kuartil dan
persentil yang membedakan kategori data yang dibagi 10);
merupakan upaya membuat kategori atau pengelompokkan dari
agregasi data, meskipun ada cara lain untuk menentukan
pengelompokkan.
Sedangkan bentuk kurva bisa digunakan ukuran kemiringan
(skewness) atau kurtosis. Artinya bentuk kurva normal bukan
berarti bentuk tunggal, tetapi bisa jamak dan miringpun (dalam
batas tertentu) juga kurva normal.
1. Kaligesing 55 31,43
2. Loano 45 25,71
3. Bagelen 37 21,14
4. Cangkrep 23 13,14
5. Banyuasin 15 8,5
Ya 45 5 50
Tidak 2 48 50
Jumlah 47 53 100
111
Pembacaan Tabel:
1. Perkawinan Kerabat dekat 90% terkena DM, sisanya tidak
kena DM, diperoleh dari total perkawinan kerabat dekat
sebanyak 50 orang, yang kena DM ada 45 sehingga
45
x 100 %=90 %; atau logikanya dibalik perkawinan
50
keluarga dekat yang tidak kena DM hanya 10%; penyebutan
kata “hanya” untuk menunjukkan penguatan yang tidak
terkena hanya sedikit.
2. Perkawinan kerabat dekat kecenderungannya terkena DM
90%.
3. Jika yang mau ditonjolkan, sebagai anjuran supaya tidak
melakukan perkawinan keluarga dekat, bisa sebaliknya yaitu
perkawinan keluarga bukan keluarga dekat, yang terkena DM
2
hanya 4% ( x 100 %=4 % ¿
50
4. Keduanya juga bisa ditampilkan risiko terkena DM bagi
keluarga dekat 90%; sedangkan perkawinan bukan keluarga
dekat 4%
5. .... dll.
Analisis dalam epidemiologi yang diutamakan adalah analisis
faktor risiko, sehingga pertemuan antara paparan dan kasus yang
diteliti. Paparannya adalah perkawinan keluarga dekat (faktor
genetik) sedangkan munculnya kasus adalah kasus DM.
Tabel tiga dimensi
Tiga variabel yang ditampilkan dalam satu tampilan
tabel disebut tabel tiga dimensi, sebagai contoh:
15 40 35 25
37(A) 25(B) 20(C)
46 20 25
30 40 30 20
35(B) 35(C) 15(A)
30 28 19
45 25 15 15
20(C) 19(A) 12(B)
15 14 10
Keterangan:
A = Aroma terapi jeruk; B= aroma terapi vanila; C= Aroma terapi
melon
Masing-masing perlakuan ada tiga responden yang ketiganya
diberi tiga perlakuan secara bersamaan, misal pada tabel baris 1
dan kolom ke 1, ketiga subyek diberi perlakuan pijat 15 menit,
diberi aroma therapi rasa jeruk, kemudian diberikan relaksasi 5
menit, begitu seterusnya.
Pembacaan tabel:
1. Melihat kecenderungan, perhatikan data dari baris, kiri ke
kanan, maka bisa dibaca waktu pijat yang sama, semakin
lama relaksasi, maka skore kecemasan menurun, hal ini
bisa dilihat pada baris ke 1 dengan waktu pijat 15 menit
dan relaksasi 5 menit, rata-rata skore kecemasan 41,
sedangkan pada waktu pijat yang sama dan relaksasi
selama 15 menit rata-rata kecemasannya 23,3 atau terjadi
41−23,3
penurunan sebesar 17,7 atau 43,17%; ( 41 ) x 100 %
2. Melihat dari sisi kolom; waktu relaksasi yang sama,
semakin lama waktu pijat terjadi penurunan skore
kecemasan, hal ini bisa dilihat pada kolom ke 1 dengan
waktu relaksasi 5 menit dan pijat 15 menit, rata-rata skore
113
≤40 >40
1. 80 90
2. 75 85
3. 80 100
114
4. 85 95
5. 80 90
Pembacaan tabel:
1. Rata-rata tekanan darah diastole kelompok umur 40 tahun
80 mm/Hg dan di atas 40 tahun 92 mmHg.
2. (berdasarkan rata-rata) Tekanan darah diastole kelompok
umur di atas 40 tahun 1,15 kali lebih besar dibandingkan
kelompok umur kurang dari atau 40 tahun.
Grafik/gambar
Pembacaan grafik pada prinsipnya sama dengan
tabel yaitu kecenderungan, pada grafik juga sama ada
satu, dua dimensi, contohnya sebagai berikut:
Satu dimensi
Hanya ada satu variabel yang disajikan, sepeti kasus
Demam Berdarah dalam satu tahun.
35
30
25
20
15
10
0
JAN PEB MAR APR MEI JUN JUL AUG SEP OKT NOV DES
Dua dimensi
Grafik dua dimensi dua variabel dijadikan dalam
satu tampilan grafik, adapun contohnya sebagai berikut:
35
30
25
2015
2016
20 2017
2018
15 2019
MIN
MAX
10 MEAN
0
JAN PEB MAR APR MEI JUN JUL AUG SEP OKT NOV DES
Pendahuluan
Indikator kesehatan dalam buku statistik memang
kurang lazim, tetapi pada praktek kegiatan perhitungan
maupun kepentingan pembuatan kategori dan analisis data
seringkali dibutuhkan indikator dan besaran parameter,
hal ini dapat membantu pengguna statistik lebih mudah
dalam membuat kategorisasi dan analisis.
Indikator Kesehatan ini, pada tataran praktis
seringkali digunakan untuk menentukan keberhasilan
capaian program yang dijalankan disamping itu indikator
ini menjadi acuan pemegang program atau mahasiswa
agar mengetahui apa saja yang menjadi indikator program
pembangunan bidang Kesehatan.
Pendekatan yang digunakan adalah ukuran dasar,
vital statistik dan indikator. Indikator yang digunakan
menggunakan teori Blum derajat kesehatan dipengaruhi
oleh lingkungan, perilaku, pelayanan kesehatan dan
genetik. Disamping itu ditambahkan beberapa indikator
yang dijadikan parameter untuk mengukur kesehatan
individu. Dengan demikian informasi ini akan
memudahkan peneliti, mahasiswa dan praktisi untuk
menentukan kategorisasi maupun analisis hasil riset atau
jika analisis statistik dengan pembanding nilai parameter,
yang akan dijelaskan kemudian.
Ukuran dasar
Ukuran ini menjadi dasar dari hampir semua
indikator epidemiologi untuk mnggambarkan besarnya
masalah kesehatan, terutama pada vital statistik yang
meliputi kesakitan (morbiditas), kematian (mortalitas) dan
angka kelahiran (ferlititas). Adapun ukurannya sebagai
berikut:
Proporsi :
Angka ini digunakan sebagai angka perbandingan
untuk menentukan besarnya kejadian dalam sekumpulan
113
Rate
Angka ini sesungguhnya adalah proporsi yang
dikalikan bilangan konstanta tertentu. Besarnya perkalian
tersebut sangat tergantung dari proporsi yang ada. Jika
proporsinya terlalu kecil maka konstantanya besar, hal ini
dimaksudkan mempermudah mengartikan suatu hasil
perbandingan. Konstanta besarannya mulai dari 100
(persentase); 1000 (permil), 10.000 bahkan 100.000. jika
dirumuskan menjadi:
Rate=P x K; P proporsi dan K konstanta
Ratio
Nilai ini merupakan perbandingan antara bagian per
x
bagian lainnya, jika dirumuskan menjadi: Ratio= ,
y
berbeda dengan rate yang merupakan proporsi, tetapi
ratio dua bagian berbeda yang dibandingkan. Tujuan
perbandingan ini untuk mengetahui kelipatan antara
bagian yang dibandingkan.
Misal : seks ratio, yaitu perbandingan antara jenis kelamin laki-
jumlah laki−laki
laki dan perempuan dengan notasi SR= ; jika
jumlah wanita
nilainya lebih dari 1 berarti jumlah laki-laki lebih besar dari
wanita dan jika sebaliknya maka jumlah wanita lebih besar.
114
Indeks65
Angka indeks adalah suatu angka yang dibentuk
untuk menunjukkkan perubahan atau perbandingan dari
sebuah atau lebih ciri pada waktu dan tempat yang sama
atau berbeda. Nilai hasil perbandingan, tetapi tidak
mempunyai satuan tertentu.
Perbandingan ini bisa digunakan lintas satuan. Nilai
ini akan menghilangkan satuan. Indeks juga sebagai
ukuran tertentu suatu perbandingan yang hasilnya berupa
angka yang menunjukkan derajat tertentu.
Contoh:
nilai x bobot SKS
Indeks prestasi belajar IP= ; dengan skala 0-4
jumlah SKS
Dimensi pendidikan
HLS−HL S min
IHLS= ; HLS= harapan lama sekolah;
HL Smaks −HL S min
sedangkan rata-rata lama sekolah indeksnya sebagai berikut:
RLS−RL Smin
IRLS= ; RLS= rata-rata lama sekolah; IRLS
RL S maks−RL Smin
indeks rata-rata lama sekolah; dengan demikian indeks
pendidikan (IPend)
115
IHLS+ IRLS
I Pend =
2
Indeks Pengeluaran
rata−rata peng−Pengmin
I Peng = ; Peng= Pengeluaran; I= indeks.
Peng maks−Pengmin
Vital statistik
Indikator ini digunakan untuk mengukur data
kehidupan yang penting yaitu kelahiran, kesakitan dan
kematian. Ukurannya mengacu pada ukuran dasar yaitu
rate. Adapun beberapa indikator antara lain:
Morbiditas66,
Beberapa ukuran yang termasuk di dalam angka kesakitan antara
lain:
Prevalensi rate (PR)
Ukuran ini menggambarkan angka kesakitan yang
lama dan baru dalam satuan population at risk pada
pertengahan tahun, adapun ukuran PR ada dua yaitu:
Periode Prevalence Rate (PPR)
Prevalens model ini lebih sederhana prevalens rate (PR)
didasarkan waktu pengamatan tertentu, biasanya selama satu
tahun. Adapun rumusnya:
penderita baru+ penderita lama
PR= x K; K
population at risk pertengahan tahun
adalah konstanta dengan nilai tertentu, jika untuk penyakit
biasa digunakan 100%. Perhitungan penduduk
pertengahan tahun yaitu penduduk bulan juni, tetapi jika
tidak diketahui dan yang diketahui penduduk tanggal 1
116
P 1+ P 2 1
atau P1 + ( P2−P1 ); jika penduduk 1maret di ketahui dan
2 2
31 Desember pada tahun yang sama, maka rumusnya menjadi:
3
P1 + . P2 ;PR dihitung pada periode waktu dan penyakit tertentu
12
yang diamati. PR perlu diketahui oleh ahli statistik kesehatan
guna menentukan besarnya masalah kesehatan secara cepat.
Contoh :
Dalam satu wilayah ada 1000 penduduk dalam satu tahun
diketahui ada 100 penderita TB, berapa PR.
Diketahui penderita 100, sudah termasuk penderita lama, karena
sejak masuk tahun yang bersangkutan terekam data penderita
sebelum tahun tersebut yang masih menderita sakit, demikian
sesudah tahun tersebut boleh jadi masih sakit, sehingga PR bisa
dihitung:
100
PR= x 100 %=10 %; population at risk (PAR) dilihat,
1000
apakah penyakit tersebut bisa menimbulkan kekebalan atau tidak,
jika bisa menimbulkan kekebalan rumusnya menjadi
PAR=jml. Penduduk - penderita penyakit tersebut
penderita baru
IR= x K ; nilai K adalah
population at risk pertengahan tahun
konstanta (%) atau per seribu
Mortalitas
Angka kematian yang diukur dalam waktu dan
wilayah terbatas. Angka ini berkaitan dengan banyak
indikator lainnya baik pelayanan kesehatan, kecepatan
diagnosis, jangkauan pelayanan, ketenagaan, upaya
kesehatan meliputi promotif, preventif, kuratif, adapun
beberapa jenis indikator yang digunakan antara lain:
Bayi lahir hidup yang dimaksud adalah bayi yang begitu lahir ada
tanda-tanda kehidupan baik berupa denyut nadi, tangisan, gerak
dll, tanpa memperhitungkan berapa lama tanda-tanda kehidupan
tersebut.
Fertilitas67
Istilah ini digunakan untuk menggambarkan berapa
banyak kelahiran hidup dalam satu wilayah dan waktu
tertentu, sedangkan fekunditas adalah kemampuan
fisiologis dan biologis wanita untuk menghasilkan anak
lahir hidup. Beberapa ukuran fertilitas antara lain:
Indikator lainnya
Penyusunan indikator dalam buku statistik ini
didasarkan pengalaman penulis dalam membimbing
mahasiswa, karena kesulitan untuk mencari indikator dan
menentukan kategorisasi, dengan demikian memasukkan
beberapa indikator utama dapat memudahkan pengguna
buku ini dalam analisis permasalahan yang sedang diteliti.
122
Lingkungan 68,69,70,71
Lingkungan merupakan reservoar terbesar kehidupan manusia,
sekaligus menjadi media penularan penyakit yang efektif antara
manusia yang rentan dengan penderita ataupun dengan
lingkungan secara langsung melalui pemaparan baik terjadi sesaat
ataupun akumulatif. Adapun indikatornya sebagai berikut:
Tabel 6.1. Parameter Perumahan Sehat
No. Parameter Baku mutu satuan Sumber
no. 71
Perilaku73
Indikator perilaku merupakan kegiatan yang
dilakukan oleh seseorang sehingga terhindar dari risiko
kesakitan lebih besar. Adapun beberapa kegiatan tersebut
antara lain:
Tabel 6.2. Indikator perilaku Hidup Sehat
No. Parameter Nilai patokan Satuan Keterangan
2. ASI Eksklusif
I Rumah Sakit
9. Kepuasan Pelanggan 80 %
126
II. Puskesmas
Keterangan :
Bed Occupancy Rate (BOR) adalah persentase pemakaian tempat
tidur rumah sakit pada satuan waktu tertentu dengan rumus:
Jumlah hari perawatan rumah sakit
BOR= x 100 %
Jml Tempat Tidur x Jml Hari dalam periode
Average Length of Stay (AvLOS) adalah rata-rata lamanya pasien
dirawat di rumah sakit tersebut atau dengan kata lain setiap
pasien rawat nginap berapa lama dirawat.
Jumlah lama dirawat
AvLOS= x 100 %
Jml pasien keluar(hidup+mati )
Turn Over Interval (TOI) adalah rata-rata hari dimana tempat
tidur tidak digunakan yaitu rata-rata lama tempat tidur tersebut
tidak digunakan pasien rawat inap.
( Jml TTxJml Hari per periode )−Jml hari perawatan
TOI= x 100 %
Jml pasienkeluar (hidup +mati)
Jika dalam satu tahun periode=365 hari
127
Kesehatan individu
Indikator individu digunakan untuk menentukan
derajat seseorang sakit atau mempunyai risiko terhadap
peyakit tertentu, adapun beberapa indikator antara lain:
Tabel 6.4. Indikator Individu Terhadap
Penyakit atau Risiko Penyakit
No. Indikator Standard Satuan Keterangan
II. Biomarker
1. Urine :
1,5/24 jam lt Pustaka no 81
a. Volume 1,003-1,030
d. Berat Jenis 250-750/24 jam mg/dl
e. Asam urat ≤150/24jam
f. Protein 10/spesimen
160-180
g. Glucosa
2. Darah:
3) Tinggi >240
c. Cholesterol LDL
(berbahaya):
1) Normal <100 mg/dl
2) Sedang 100-129
3) Batas Tinggi 130-159
4) Tinggi 160-189
5) Sangat tinggi >190
d. Trigliserida:
1) Normal <150 mg/dl
2) Batas tinggi 150-199
3) Tinggi 200-499
4) Sangat tinggi >500
e. Hipertensi:
Sistole/Diastole mm/Hg
1) Normal 120/80
2) Pre Hipertensi 120-139/80-89
3) Hipertensi ringan 140-159/90-99
4) Hipertensi sedang 160-179/100-109
5) Hipertensi berat 180-209/110-119
6) Hipertensi >210/>120 mg/dl
maligna 150.000-400.000 mikro lt
f. Trombosit 13,8-17,2 g/DL
g. Kadar Hb laki-laki 12,1-15,1 g/DL
h. Kadar Hb wanita
Pendahuluan
Konsep dasar pemahaman populasi dan sampel menjadi dasar
filosofi paling mendasar pada statistika. Konsep ini sebagaimana
dijelaskan pada Bab I tentang populasi sampel diilustrasikan
ketika rasa masakan pada sendok sama dengan yang ada pada
panci, ini menunjukkan sampel hasil ukurnya sama dengan
populasi; sehingga menjadi rumus: “kalau kesimpulan yang
diambil dari data kecil (sampel) sama dengan data yang besar
(populasi); kenapa harus melakukan pengukuran pada data yang
besar, kalau kesimpulannya sama dengan data yang kecil”2.
Dengan demikian maka kesimpulan yang digunakan
merupakan kesimpulan pada populasi inilah yang disebut
generalisasi atau inferensi, inilah salah satu cabang statistik yaitu
statistik inferensial. Berbeda dengan epidemiologi yang disebut
epidemiologi analitik, karena digunakan untuk menentukan
kausalitas determinan yang menjadi faktor risiko suatu masalah
kesehatan, inilah yang bisa menjelaskan terminologi yang
berbeda antara statistik dan epidemiologi.
Prinsip dasar penelitian sampel, didasarkan pada filosofi
dasar statistik, karena kesimpulan dari sampel berlaku di
populasi, sehingga nilai sampel sama dengan populasi (unbiased).
Hal ini bisa terpenuhi jika sampel representatif (mewakili)
populasi yaitu ciri-ciri populasi sama dengan ciri-ciri sampel
dengan syarat sampel harus random artinya setiap anggota
populasi mempunyai kesempatan sama untuk menjadi anggota
sampel; tanpa random kesimpulan yang diambil tidak bisa
dipertanggungjawabkan secara statistik, mungkin secara science
bisa, dengan hanya mendeskripsikan data apa adanya tanpa
menarik kesimpulan pada populasi yang dimaksud107. Dengan
demikian penarikan sampling dengan cara non random
merupakan kesalahan fatal pada penelitian untuk estimasi dan
penarikan hipotesis.
Populasi homogen, berapapun besar sampel yang diambil
akan mencerminkan kondisi populasi. Pertanyaannya adalah
bagaimana jika populasi heterogen. Disinilah dibutuhkan suatu
prosedur tertentu yang sistematis untuk mendapatkan sampel
129
Terminologi
Sampel merupakan bagian dari populasi dimana
pengukuran dilakukan. Namun beberapa istilah yang menjadi
bagian dari sampel perlu dijelaskan sebagai berikut2,22:
1. Populasi
Populasi dibagi tiga yaitu populasi sasaran (reference
population atau populasi target); populasi sumber dan populasi
eksternal. Populasi sasaran adalah keseluruhan subyek, item,
pengukuran yang ingin ditarik kesimpulannya oleh peneliti
melalui inferensi; populasi sumber adalah himpunan subyek
dari populasi sasaran yang digunakan sebagai sumber
pencuplikan; populasi eksternal adalah populasi yang lebih
luas atau diluar populasi sasaran tetapi peneliti masih berminat
membuat generalisasi55. Penerapan hasil riset tersebut bisa
diterapkan (validitas eksternal) pada populasi sumber dan
eksternal.
131
Contoh:
Penelitian tentang prestasi belajar mahasiswa yang aktif dalam
kegiatan kemahasiswaan di Fakultas Ilmu Kesehatan
Universitas “X”; maka jenis populasinya bisa dibagi menjadi:
a. Populasi sasaran: seluruh mahasiswa
yang aktif pada kegiatan mahasiswa di Fakultas Ilmu
Kesehatan Universitas “X” populasi ini yang menjadi
generalisasi riset.
b. Populasi sumber: seluruh mahasiswa
yang ada di Fakultas Ilmu Kesehatan Universitas “X”
c. Populasi eksternal: seluruh mahasiswa
yang aktif ada di Universitas “X”.
2. Unit sampel.
Adalah kumpulan individu yang berasal dari populasi yang
tidak saling tumpang tindih (mutually exclusive) atau dengan
kata lain mempunyai karakteristik/ciri-ciri tertentu23.
3. Elemen sampel
Adalah individu yang berasal dari populasi, dimana
pengukuran dilakukan kepadanya.
4. Sampling Frame
Adalah daftar populasi yang berisi daftar kelompok atau
individu penyusunnya.
5. Variabel
Adalah ciri-ciri yang melekat pada subyek yang diteliti dan
mempunyai variasi dari hasil pengukurannya. Adapun ciri
variabel harus dapat diukur (dikuantifikasi) dan hasil ukurnya
lebih dari satu.
6. Generalisasi.
Adalah upaya menarik kesimpulan dari data yang kecil
(sampel) untuk menggambarkan keadaan yang ada di
populasi
7. Random.
Adalah setiap anggota populasi mendapatkan chance
(kesempatan) yang sama untuk menjadi anggota sampel.
1. Populasi.
a. Seluruh Balita yang ada di Puskesmas “X”
b. Seluruh Kepala Keluarga yang mempunyai Balita di
Puskesmas “X”
Pilihan di atas sangat tergantung pada data awal yang
tersedia di lapangan, jika peneliti mendapatkan jumlah
seluruh balita di Puskesmas “X”, maka populasinya pada
pilihan “a”, tapi jika data dilapangan yang ada adalah daftar
KK yang memiliki Balita, maka populasinya pilihan “b”
2. Sampel.
Sebagian Balita di Puskesmas “X”
3. Unit sampel.
KK yang mempunyai Balita, ingat pengertian unit sampel
yaitu sekumpulan individu, sehingga satu KK dengan KK
lainnya boleh jadi memiliki satu atau lebih dari satu Balita.
133
b. Varians minimum
Suatu cara penarikan sampel dengan cara tertentu yang
dilakukan secara berkali-kali, menghasilkan varians paling
kecil itulah sampel yang baik, maka cara penentuan besar
sampel itulah yang terbaik. Varian minimum berkaitan dengan
karakteristik populasi yang tercermin pada sampel yaitu
sampel homogen, dengan demikian maka kesimpulan yang
diambil akan mendekati kondisi riil di populasi. Prinsip
pengambilan sampel, semakin homogen sampel, berapapun
banyaknya yang diambil akan mendekati kondisi populasi.
Jika dilihat dari pola grafik distribusi normal modelnya model
leptocurtic menjadi sampel yang baik. Dengan demikian,
maka pengambilan sampel sangat tergantung pada
karakteristik populasi.
c. Konsistensi.
Artinya jika besar sampel diperbesar terus hingga mendekati
¿
d. Sufficient (kecukupan)
135
Teknik sampling
Istilah ini sering disederhanakan menjadi sampling adalah
suatu cara untuk mendapatkan sampel. Tekniknya dibagi dua
yaitu:
1. Random
Teknik ini mensyaratkan satu prinsip, yaitu menjamin setiap
anggota populasi mempunyai peluang yang sama menjadi
anggota sampel.
136
2) Undian
Cara ini paling banyak dilakukan karena dua alasan
yaitu lebih sederhana dan secara sosiologis masyarakat
Indonesia terbiasa menggunakan cara undian lewat
budaya arisan.
Peneliti membuat sampling frame terlebih dahulu
nomer 0001 sampai dengan 1000, baru lintingan kertas
yang dimasukkan ke dalam sedotan untuk membuat
peluang sama, sebanyak no 0001 sampai 1000; baru
dikocok satu persatu sampai mendapatkan n50. Nomer
yang keluar dari kocokan itu menjadi anggota sampel,
sedangkan individunya menyesuaikan dari sampling
frame yang ada.
Kelebihan
Sebaran subyek yang terpilih lebih merata, sehingga
keterwakilan populasi lebih baik; bias manusia lebih kecil;
lebih sederhana dibandingkan simple random sampling.
Kelemahan
Jika daftar populasinya disusun tidak acak atau dengan tata
urutan tertentu, maka ada kecenderungan yang terpilih
kelompok tertentu.
141
Catatan:
Teknik SRS dan SyRS adalah elemen atau unit sampel ada
di dalam daftar populasi (sampling frame) artinya apa,
sampel tersebut benar-benar bagian dari populasi. Pada
penelitian kesehatan atau kedokteran dimana pasien unit
pelayanan kesehatan menjadi sampel atau menghadapi
pasien yang bergerak. Boleh jadi pasien yang diambil
bukan bagian dari populasi, karena pasien tersebut pasien
baru, berada di luar wilayah kerja unit pelayanan kesehatan,
terus pengambilan sampelnya non random. Apakah ini
masuk bagian dari sampel atau bagaimana cara menentukan
subyek sampel yang bergerak seperti ini.
Apakah random bisa juga diterjemahkan peneliti tidak
memilih secara subyektif dari subyek sampel yang ada, ada
beberapa prinsip umum pada sampling, sehingga
kesimpulan yang diambil melalui analisis statistik,
menggambarkan kondisi di populasi, prinsip dasar tersebut
antara lain:
Asumsi kedua
Menjawab pertanyaan siapa pasien yang jadi subyek
penelitian?
Berdasarkan prinsip sampel bagian dari populasi, maka
sambil melakukan pemeriksaan, peneliti hanya mencari
pasien lama yang pernah berkunjung; kapan terakhir kali
143
Sedang 75 75
x 50=18,75=19
200
146
Berat 25 25
x 50=6,25=7
200
Jumlah 200 51
2. Non Random50,51,52,53
Istilah ini digunakan untuk menggambarkan cara
mendapatkan sampel yang tidak menggunakan pertimbangan
representasi dari populasi, untuk itu maka generalisasi pada
populasi tidak bisa dilakukan. Bagaimana dengan hasil
penelitian cara non random, kesimpulan yang diambil hanya
menggambarkan sampel data saja dan statistik yang digunakan
hanya menjelaskan kondisi sampel, bukan pada populasi. Ada
beberapa cara pengambilan sampel ini yaitu:
a. Accidental/convenience sampling
Sampling ini didasarkan pada upaya peneliti untuk
mendapatkan sampel mengalami kesulitan, karena sampel
yang dimaksud jarang terjadi atau merupakan fenomena
baru, sehingga begitu mendapatkan subyek penelitian yang
sesuai yang akan diteliti, maka akan diteliti sebagai sampel;
atau hasil pengamatan orang lain yang melihat fenomena
baru, kemudian dirujuk ke lembaga riset yang ada,
148
Besar sampel
Besar sampel merupakan salah satu prinsip dalam kriteria
sampel yang baik yaitu kecukupan (sufficient). Tujuan utama
penentuan besar sampel ini antara lain; satu keterwakilan
populasi dirasakan cukup secara kuantitatif, kedua kebutuhan
analisis statistik ketiga inferensi di populasi dan keempat
pertimbangan efisiensi dari sisi pengelolaan sumberdaya peneliti.
Pendekatan penentuan besar sampel cukup beragam, jika
dilihat dari tujuannya digunakan untuk estimasi parameter dan
penarikan hipotesis inilah inferensi pada populasi; penggunaan
rumus minimal sample size digunakan untuk dua tujuan utama
tersebut yaitu estimasi, uji hipotesis, keduanya sangat tergantung
dari jenis datanya, apakah kontinyu atau proporsi.
Begitu banyaknya rumus besar sampel yang dikemukakan
oleh para ahli statistik, penulis mempertimbangkan untuk
beberapa jenis saja yang sering berkaitan dengan riset yang
dilakukan. Beberapa jenis rumus penentuan besar sampel sebagai
berikut:
1. Estimasi
Nilai parameter( μ)yang tidak diketahui besarannya ditaksir
berdasarkan nilai sampel ¿) yang diperoleh dari hasil riset.
Penaksiran ini bisa rata–rata atau nilai keragaman. Estimasi ini
besar sampelnya menggunakan pendekatan teknik sampling.
Adapun penjabaran rumusnya:
a. Data kontinyu
1) Simple or systematic random sampling
Data ini diperoleh dari hasil pengukuran, adapun
penjelasannya sebagai berikut2,47:
Pendekatan yang digunakan didasarkan pada nilai
2
varian/ σ nilainya diperoleh dari hasil penelitian
sebelumnya atau hasil studi pendahuluan. Perhitungan
rumus didasarkan pada toleransi galat (error) yang ada
(Bound on the error). Rumus yang dipakai57 :
150
2
Nσ
n=
( N−1) D + σ 2
dimana:
n = Besar sampel hasil perhitungan.
N= total populasi yang ada.
2
σ = varians atau SD2; SD/ σ simpangan deviasi; jika
SD tidak diketahui bisa juga diperoleh dengan cara22
σ =
max−min
4
2
D= B /4, dimana B adalah Bound on the error yang sangat
tergantung dari nilai α (alpha) yang ada, jika α= 5% ,
maka CI 95 % sehingga pada distribusi normal akan
diperoleh nilai Z=1,96, dibulatkan menjadi 2, turunan
rumusnya akan menjadi :
σ 2 N −n
σ =
X
2
¿
Contoh soal22:
Seorang peneliti ingin menaksir rata-rata berat badan
neonatus di populasi. Peneliti kurang memiliki informasi
yang cukup berapa besar varian yang ada di populasi
maupun di hasil penelitian sebelumnya. Bila diketahui
laporan klinik bersalin selama tiga tahun terakhir diketahui
BB neonatus terendah 2.000 gram dan tertinggi 3500 gram,
sedangkan populasi neonatus sebanyak 3.000. tentukan
besar sampel yang diperlukan untuk menaksir rata-rata di
populasi (μ ), jika batas risiko kesalahan penaksiran (B)
neonatus 125 gram.
Perhitungannya sebagai berikut:
BB max−BBmin Neonatus 3500−2000
σ= = =375
4 4
Mencari nilai varian dengan cara mengkuadratkan SD/σ ,
sehingga nilainya σ 2=3752=140.625;
2 2 ❑
B 25
D= ¿ =156,25 , nilai yang ada sudah diketahui,
4 4
maka dimasukkan ke dalam rumus besar sampel:
N σ2 3000 x 140.625
n= =
2 (3000−1) x156 , 25+140 . 625
( N−1 ) D + σ
Contoh soal:
Penelitian tentang kinerja Puskesmas lintas strata baik,
sedang dan jelek. Peneliti ingin menaksir rerata kinerja
organisasi Puskesmas di populasi Puskesmas. Unit
samplingnya Puskesmas, indikator yang digunakan kinerja
Puskesmas dengan format penilaian Balance skore card,
hasil kategorisasi dari penelitian sebelumnya dapat
digambarkan sebagai berikut:
Kategori Strata Ni n
Puskesmas ke i
Strata baik 1 100 100
x 137=13,7=14
1.000
Strata sedang 2 300
Strata kurang baik 3 600 42
83
Jumlah 3 1.000 139
150 23 22 21 19 18 17 16 14 13 12
100 22 20 19 18 17 16 15 14 13 12
90 21 20 19 18 17 16 15 14 12 11
80 20 19 18 17 16 15 14 13 12 11
70 20 19 18 17 16 15 14 13 12 11
60 19 18 17 16 15 14 14 13 12 11
50 18 17 16 15 15 14 13 12 11 10
40 16 16 15 14 14 13 12 12 11 10
35 15 15 14 14 13 12 12 11 10 10
30 14 14 13 13 12 12 11 11 10 9
25 13 13 12 12 11 11 10 10 9 9
20 12 12 11 11 10 10 10 9 9 8
15 10 10 9 9 9 9 8 8 8 7
10 8 8 7 7 7 7 7 7 6 6
Dikutip dengan modifikasi dari Luts58.
b. Data proporsi
Proporsi yang dimaksud adalah perbandingan kasus dengan
banyaknya subyek yang akan diteliti, seperti dari 100 orang
20 orang terkena malaria (p)=20/100=0,20; sedangkan yang
156
Contoh soal:
Jika diketahui penderita leukemia dari 300, hasil penelitian
sebelumnya diketahui penderita leukemia yang terkena
paparan radiasi sebanyak 30%, jika diketahui bound on the
error (B)=0,05; berapa sampel yang diambil:
Diketahui:
B2 0,052
N=300; p=0,3; q=1-0,3=0,7; D= = =0,000625
4 4
Dengan demikian besar sampel bisa dihitung:
2. Uji hipotesis
Penentuan besar sampel pada penelitian uji hipotesis,
pendekatannya cukup beragam. Beberapa diantaranya22:
a. Jenis uji statistik yang digunakan pada data kontinyu
4) Pre and post test
Besar sampel ini ditujukan untuk penelitian yang analisis
datanya menggunakan uti pair t test, karena
penelitiannya sebelum dan sesudah atau dengan kata lain
satu subyek diukur dua kali yaitu kondisi sebelum dan
sesudah. Adapun rumusnya sebagai berikut:
2 2
( Z α ) .σ d
n=
D2
Z∝ = nilai Z pada distribusi normal; jika 5%=1,96;
1%=2,58. Besaran nilai ini sangat tergantung dari jenis
penelitian, jika penelitian di laboratorium gunakan 1 %
dan di masyarakat gunakan 5%. Nilai ini sebagai nilai
konvensi.
158
5) Uji t 2n independent
Penentuan besar sampel pada uji beda dua kelompok
yang saling independent, perhitungan rumusnya sebagai
berikut22,57:
2 2
n=
[ ( Z ∝+ Z β ) . σ ]
d2
Dimana :
∝= nilai Z pada distribusi normal atau juga dimaknai
menolak Ho dan Ho benar, sedangkan β adalah risiko
menerima Ho dan Ho salah, pada Z β =0,10=1,285 ;σ 2 =
varian dari kedua kelompok data yang digabung
(diperoleh dari hasil penelitian sebelumnya); d= selisih
159
Diketahui:
Z∝ =1,96 ; Z β =0,10=1,28 dan σ 2=102=100; d=5, maka
besar sampelnya:
2 2
[ ( Z ∝+ Z β ) . σ ] [ ( 1,96+1,28 )2 . 100 ] 1049,76
n= = = =41,99
d2 52 25
6) Uji Anova
Prinsip uji Anova diperoleh dari hasil percobaan,
sehingga istilah yang digunakan pada uji ini adalah
perlakuan, dengan demikian istilahnya bukan besar
sampel, tapi replikasi dengan rumus:
Contoh soal:
Suatu penelitian untuk menentukan kemampuan daya
hambat daun binahong terhadap pertumbuhan bakteri
Salmonella Thyposa, peneliti membuat berbagai
konsentrasi daun binahong mulai dari 20%, 40%, 60%,
80%, 100%; berapa replikasi yang dibutuhkan:
Perlakuan (treatment) sebanyak 5; dengan demikian
replikasinya bisa dihitung:
(t-1)(r-1)≥15= (5-1) (r-1)=15
4 (r-1)=154r-4=154r=15+4==>
160
15+ 4
r= =4,75=5 ; pembulatan ke atas.
4
7) Uji Regresi
Penentuan besar sampel didasarkan uji regresi atau
hubungan ini didasarkan pada tiga poin utama yaitu
berapa nilai Z∝ , Z β dan nilai r (besaran hubungan) yang
dikonversi dari nilai r menjadi nilai Z 0, adapun nilai ini
diperoleh dari tabel transformasi Z Fisher, sebagai
berikut:
r Z r Z r Z r Z r Z
.00 .000
.01 .010 .21 .213 .41 .436 .61 .709 .81 1.127
.02 .020 .22 .224 .42 .448 .62 .725 .82 1.157
.03 .030 .23 .234 .43 .460 .63 .741 .83 1.188
.04 .040 .24 .245 .44 .472 .64 .758 .84 1.221
.05 .050 .25 .255 .45 .485 .65 .775 .85 1.256
.06 .060 .26 .266 .46 .497 .66 .793 .86 1.293
.07 .070 .27 .277 .47 .510 .67 .811 .87 1.333
.08 .080 .28 .288 .48 .523 .68 .829 .88 1.376
.09 .090 .29 .299 .49 .536 .69 .848 .89 1.422
.10 .100 .30 .310 .50 .549 .70 .867 .90 1.472
.11 .110 .31 .321 51 .563 .71 .887 .91 1.528
.12 .121 .32 .332 .52 .576 .72 .908 .92 1.569
.13 .131 .33 .343 .53 .590 .73 .929 .93 1.658
.14 .141 .34 .354 .54 .604 .74 .950 .94 1.738
.15 .151 .35 365 .55 .618 .75 .973 .95 1.832
.16 .161 .36 .377 .56 .633 .76 .996 .96 1.946
.17 .172 .37 .388 .57. .648 .77 1.020 .97 2.092
.18 .182 .38 .400 .58 .662 .78 1.045 .98 2.298
.19 .192 .39 .412 .59 .678 .79 1.071 .99 2.647
.20 .203 .40 .424 .60 .693 .80 1.099
Sumber : Rosner (2006)
Adapun rumus besar sampelnya, sebagai berikut:
161
[ (Z ∝ + Z β )2 ]
n= +3
Z 02
Contoh soal:
Seorang peneliti ingin mengetahui hubungan antara
kholesterol darah dengan konsumsi lemak. Hasil
penelitian riset sebelumnya diketahui nilai r=0,52
(dilihat konversi Z=0,576), jika nilai ∝=5 % nilai
Z=1,96 dan nilai β=10 %=Z 1−0,1=Z 0,90 =1,28; nilai Z 0,90
bisa dilihat di tabel Z; cara membacanya ada dua cara:
jika tabel Z nya penuh, maka langsung dicari pada nilai
CI (nilai pada kolom ditengah, cirinya lihat nilai nilai
paling kanan paling bawah 0,9998) dicari 0,90 atau yang
mendekati (0,8997), kemudian ditarik garis ke kiri
ketemu 1,2; ditarik garis ke atas sampai ujung ketemu 8
maka nilainya 1,28; cara kedua jika tabel dibuat separuh
(lihat nilai paling kanan paling bawah 0,5000) caranya
0,90
= 0,40; sama carilah di kolom ditengah (CI) angka
2
0,4000 (atau mendekati, akan ketemu 0,3997), tarik garis
ke kiri di kolom Z ketemu 1,2; tarik garis ke atas terus
akan ketemu .8; berarti Z90= 1,28 dapat dilihat di tabel
B1 (distribusi normal); atau menggunakan nilai tersebut
Z β 20 % =0,84 ; Z β 10 %=1,28 ; Z β 5 % =1,64 ; Z β 1 %=2,33
Dengan demikian besar sampelnya:
n=
[ (1,96+ 1,28 )2 ] +3= 10,49 +3=34,81=35
0,5762 0,33
b. Uji hipotesis data proporsi
1) Besar sampel untuk dua kelompok
Uji hipotesis untuk menentukan besar sampel pada dua
kelompok dengan data proporsi, digunakan rumus 22,53:
2
n=
[ Z α . ❑√2 P .Q−Z β . ❑√ P1 Q 1 + P2 . Q2 ]
2
( P2−P1 )
Contoh soal:
162
n=
[ Z α . ❑√2 P .Q−Z β . ❑√ P1 Q 1 + P2 . Q2 ]
2
( P2−P1 )
2
[ 1,96. ❑√2. 0,75 .0,25−1,28 ❑√ 0,8. 0,2+0,7.0,75 ]
n=
( 0,70−0,8 )2
( 1,20−1,059 )2 1,3
n= = =130,24=131
0,01 0,01
Sampel yang diambil dari populasi sebanyak 131 untuk
masing-masing kelompok.
P1 + P2 0,10+ 0,04
P= = =0,07 ; berarti Q=1-0,07=0,93
2 2
Z5 % =1,96 ; Z β 10 %=1,28 ; maka besar sampel bisa
dihitung
2
[ 1,96. ❑√2.0,07 .0,93−1,28 ❑√ 0,10 . 0,90+0,04.0,96 ]
n=
( 0,04−0,10 )2
( 0,707−0,458 )2 0,06
n= 2
= =16,66=17
(−0,06 ) 0,0036
Diantara kedua contoh tersebut yang membedakan
adalah nilai proporsi, semakin kecil nilai proporsinya,
maka sampel yang diambil lebih banyak, hal ini bisa
difahami, karena kasus yang sedikit, untuk
mendapatkannya dengan cara memperbesar sampel.
3. Pendekatan lainnya
Pendekatan lainnya ini bisa digunakan untuk estimasi
dan uji hipotesis, ada dua pendekatan yaitu:
a. Central Limit Theorema (CLT)38
Teori ini didasarkan pada distribusi normal, dikatakan
sampel besar jika n>30 dan jika n≤ 30 disebut sampel kecil.
Teori ini juga mempersyaratkan skala data yang dipakai
interval atau ratio
b. Judgment peneliti
Teori ini didasarkan pada pengalaman peneliti, tidak
diperlukan rumus tertentu, tetapi digunakan persentase dari
banyaknya populasi yang ada. Cara ini lazim dipakai untuk
penelitian survey, seperti di Amerika sensus tahun 1940
hanya diambil 5%, tahun 1950 20%, pertimbangan yang
nyata adalah keterbatasan sumber daya44.
Populasi kurang dari 100 hendaknya diambil 50%dari
populasi, jika populasi beberapa ratus diambil 25 sampai 30
%.
Hasil penelitian sampel 20 % dari populasi dengan
teknik systematic random sampling paling baik,
164
c. Rumus solvin
Rumus ini lebih sederhana, karena didasarkan pada
banyaknya populasi dan presisi (d) yang ditetapkan oleh
peneliti, teknik sampling bisa digunakan untuk hipotesis
dan estimasi populasi. Adapun rumusnya sebagai berikut:
N
n= ; dimana : N= besar populasi; d= presisi yang
1+ N . d 2
ditentukan oleh peneliti, semakin kecil nilai “d”, maka
semakin besar sampelnya; d berbeda dengan alpha (α=0,05
atau 0,01), tetapi d adalah presisi yang ditentukan oleh
peneliti yang besarnya sebaiknya tidak lebih dari 10% atau
0,1.
Jika nilai d=10%, artinya hasil kesimpulan penelitian
biasnya ±10% dengan populasi, misal rata-rata Tb
mahasiswa 165, maka sebenarnya di populasi antara 148,5-
181,5; tetapi jika ditentukan d=5%, maka presisinya antara
156,75-173,25.
Contoh soal:
166
Catatan sampel:
Pada tataran praktis penentuan besar sampel ada banyak pilihan
sebagai pendekatan, ada yang diturunkan lewat rumus matematik,
ada juga yang non matematik, tetapi tidak pernah peneliti
menentukan mana yang paling baik diantara pendekatan tersebut.
hal ini disebabkan penelitian berbasis sampel tanpa ada klarifikasi
penelitian populasi yang menghasilkan nilai parameter, maka
peneliti tidak tahu mana diantara pendekatan tersebut yang
mendekati nilai populasi. Dengan demikian jika peneliti ingin
mengetahui mana yang lebih baik harus membuat dua penelitian
sekaligus, baru secara empirik bisa menentukan mana yang lebih
baik.
Jika keduanya tidak dilakukan dan memang tidak dapat dilakukan
oleh peneliti, kecuali seseorang yang melakukan penelitian
keduanya, maka prinsip dasar sampel harus random, jika
generalisasinya di populasi, maka rumus minimal sampel size
yang digunakan akan mendekati nilai populasi.
Mana yang lebih baik, tergantung sudut pandangnya; bagi
peneliti sampel paling kecil itu yang efisien; bagi kaidah ilmu
yang paling besar itu yang paling baik, karena prinsip konsistensi.
167