Anda di halaman 1dari 194

Peranan Statistika dalam dunia kedokteran dan kesehatan

masyarakat sangat besar sehingga pengetahuan tentang teori


statistika mutlak diperlukan agar tidak keliru dalam mengambil
kesimpulan.
Buku Biostatistika 1 ini diterbitkan untuk menambah khasanah
pengetahuan statistika mahasiswa dan masyarakat yang
berkecimpung di dunia kedokteran dan kesehatan masyarakat.
Setiap materi dalam buku ini dipaparkan secara sederhana
menggunakan bahasa yang lugas disertai contoh agar mudah
dipahami pembaca.
Buku ini terdiri dari buku Biostatistika 1 dan Biostatistika 2.
Biostatistika 1 terdiri dari 9 Bab, membahas tentang dasar-dasar
statistika, teknik sampling, statistika deskriptif dan teori estimasi.
Pembahasan pada buku Biostatistika 2 lebih menekankan pada
statistika inferensi yang dimulai dari uji hipotesis, uji komparatif
antara dua sampel, uji anava dan statistika non parametrik.

Materi yang dibahas pada buku Biostatistika 1 adalah:

1. Mengenal Statistika. 6. Probabilitas.


2. Teknik Sampling. 7. Distribusi Probabilitas.
3. Penyajian Data. 8. Distribusi Sampling.
4. Ukuran Pemusatan. 9. Teori Estimasi
5. Ukuran Penyebaran.
Biostatistika 1

Oleh:
Darnah Andi Nohe

i
Biostatistika 1

Oleh:
Darnah Andi Nohe

Editor: Jeli Brian Andika


Desain: Catur S.

Cetakan 1, April 2013


Cetakan 2, Februari 2014
ISBN: 978-602-269-003-0
Hak cipta dilindungi oleh undang-undang

Penerbit

Halaman Moeka Publishing:


Penerbit & Jasa Penerbitan Buku
Jl. Manggis IV, No. 2 RT/RW 07/04
Tanjung Duren Selatan Grogol Petamburan, Jakarta Barat
Blog: http://halamanmoeka.blogspot.com

ii
Kupersembahkan buku ini untuk:
Ibuku Andi Donno Petta Asseng (Alm) dan
Ayahku Andi Nohe Petta Longi.
Suamiku Agri Andi Mappiajo, terima kasih telah memberiku waktu
yang banyak untuk menulis buku ini.
Dan anak-anakku:
Andi Syaifullah Al Maslulil Agri,
Andi Ahmad Dzaky Palewai Agri dan
Andi Muhammad Akhtar Al Fadi Agri,

My love for you all, you are my spirit and my inspiration…!

iii
PRAKATA

Assalamu Alaikum Wr. Wbr…

Alhamdulillah, segala puji bagi Allah SWT yang telah


memberikan nikmat yang luar biasa banyaknya dan telah memberi
kita secuil ilmuNya. Semoga ilmu yang kita peroleh bermanfaat dan
menjadi berkah bagi diri kita sendiri, keluarga dan masyarakat. Amin
Buku Biostatistika 1, untuk Kedokteran dan Kesehatan
Masyarakat penulis hadirkan sebagai salah satu upaya menambah
referensi bagi mahasiswa dan masyarakat yang berkecimpung pada
penelitian kedokteran dan kesehatan masyarakat. Seperti kita ketahui
bersama, peranan statistika dalam setiap penelitian Kedokteran dan
Kesehatan Masyarakat sangat besar sehingga pengetahuan tentang
dasar-dasar statistika, statistika deskriptif dan statistika inferensi
mutlak diperlukan agar tidak keliru dalam mengambil kesimpulan
dan keputusan.
Pada buku Biostatistika 1 ini, penulis berusaha memaparkan
materi yang ada secara sederhana menggunakan bahasa yang lugas
disertai contoh agar mudah dipahami pembaca. Materi pada buku
Biostatistika 1 ini lebih menekankan pada pengenalan statistika,
statistika deskriptif dan teori estimasi.
Buku Biostatistika 1 cetakan kedua hadir untuk menambah
kekurangan yang ada pada cetakan sebelumnya. Hal ini dilakukan
penulis karena melihat animo mahasiswa dan masyarakat yang
sangat tinggi terhadap keberadaan buku ini.
Pada kesempatan ini, penulis mengucapkan terima kasih
kepada Ibu Dra. Hj. Siti Badrah, M.Kes selaku Dekan Fakultas

iv
Kesehatan Masyarakat (FKM) Universitas Mulawarman dan Ibu
Hj. Masitah, SKM, MQIH selaku dekan FKM Universitas
Widyagama Mahakam Samarinda atas sambutannya yang hangat
disertai respon yang positif atas hadirnya buku ini. Terima kasih juga
kepada Jeli Brian Andika, S. Si yang telah membantu selama proses
penulisan buku ini serta semua pihak yang tidak dapat disebutkan
satu persatu.
Akhir kata, semoga buku ini bermanfaat bagi kita semua dan
tentunya buku ini masih jauh dari kesempurnaan sehingga saran dan
kritik yang konstruktif untuk perbaikan buku ini sangat penulis
harapkan. Saran dapat disampaikan melalui email:
darnah.98@gmail.com, pin BB: 29253A63 atau nomor Hp:
085250014187.

Wassalamu Alaikum Wr. Wbr…

Samarinda, Maret 2013

Darnah Andi Nohe

v
SAMBUTAN DEKAN FKM
UNIVERSITAS MULAWARMAN

Assalamu Alaikum Wr. Wbr.

Mahasiswa maupun alumni kesehatan masyarakat mempunyai


peran untuk mempromosikan kesehatan dan melakukan pencegahan
terjadinya suatu penyakit atau masalah kesehatan lainnya dalam
masyarakat, untuk menjalankan peran tersebut diperlukan suatu
pemahaman akan masalah-masalah kesehatan yang ada. Salah satu
cara memahaminya adalah mengetahui gambaran permasalahan
kesehatan berdasarkan data atau melakukan penelitian langsung ke
masyarakat. Harapan kami dengan hadirnya buku Biostatitika 1 ini
akan memberikan kontribusi bagi mahasiswa untuk memahami teori
statistika sehingga dapat mengaplikasikannya pada bidang kesehatan.
Kami menyambut baik atas terbitnya buku ini dan kami
sampaikan terima kasih kepada penulis atas upayanya menyusun
buku ini. Semoga menumbuhkan motivasi bagi dosen-dosen lain
untuk menyusun buku-buku yang relevan sehingga dapat menjadi
referensi bagi mahasiswa.
Akhir kata, semoga buku ini memberi manfaat bagi mahasiswa
kesehatan pada khususnya dan masyarakat pada umumnya.

Wassalamu Alaikum Wr. Wbr.

Dekan FKM Universitas Mulawarman,

Dra. Hj. Siti Badrah, M.Kes

vi
SAMBUTAN DEKAN FKM
UNIVERSITAS WIDYAGAMA MAHAKAM

Assalamu Alaikum Wr. Wbr…

Salah satu kendala utama yang dialami mahasiswa selama ini


adalah kurang memahami konsep-konsep statistika sehingga
mengalami kesulitan dalam melakukan penelitian sampai pada
pengambilan kesimpulan hasil penelitian. Terbitnya buku
Biostatistika 1 ini diharapkan dapat membantu mahasiswa
memahami konsep-konsep statistika dan sekaligus dapat
mengaplikasikannya dalam penelitian. Buku ini menekankan pada
pengembangan cara berpikir kritis, sehingga Anda dapat menilai
kredibilitas dan nilai sebuah kesimpulan yang diolah dari
sekumpulan data.
Saya sangat berterima kasih kepada penulis yang telah
bekerja keras demi tersusunnya buku ini. Buku ini sangat membantu
mahasiswa kesehatan masyarakat, yang salah satu kompetensinya
mampu mengaplikasikan biostatistika dan menganalisa data
kesehatan.
Akhirnya semoga buku ini bermanfaat bagi mahasiswa
kesehatan masyarakat dan kita semua.

Wassalamu Alaikum Wr. Wbr.

Dekan FKM Universitas Widyagama Mahakam

Hj. Masitah, SKM, MQIH

vii
DAFTAR ISI

Prakata ......................................................................................... iv
Sambutan Dekan FKM Universitas Mulawarman .................. vi
Sambutan Dekan FKM Universitas Widyagama Mahakam ... vii
Daftar Isi ...................................................................................... viii
Bab 1 Mengenal Statistika ......................................................... 1
1.1. Pengantar ................................................................... 1
1.2. Pengertian Statistika .................................................. 1
1.3. Pembagian Statistika .................................................. 2
1.4. Jenis-jenis Statistika ................................................... 5
1.5. Syarat Data yang Baik ............................................... 11
1.6. Jenis-jenis Variabel .................................................... 11
Bab 2 Teknik Sampling .............................................................. 14
2.1. Pengantar ................................................................... 14
2.2. Pengertian Populasi dan Sampel ................................ 14
2.3. Ukuran Sampel .......................................................... 15
2.4. Cara Pengambilan Elemen Sampel ............................ 19
2.5. Teknik Sampling ........................................................ 21
2.6. Probability Sampling ................................................. 23
2.7. Nonprobability Sampling ........................................... 29
Bab 3 Penyajian Data ................................................................. 32
3.1. Pengantar ................................................................... 32
3.2. Tabel .......................................................................... 32
3.3. Grafik ......................................................................... 41
Bab 4 Ukuran Pemusatan .......................................................... 49
4.1. Pengantar ................................................................... 49
4.2. Ukuran Pemusatan ..................................................... 49
4.3. Ukuran Letak ............................................................. 60

viii
Bab 5 Ukuran Penyebaran ......................................................... 72
5.1. Pengantar ................................................................... 72
5.2. Ukuran Penyebaran .................................................... 72
5.3. Kemenjuluran (Skewness) ......................................... 80
5.4. Keruncingan (Kurtosis) .............................................. 82
Bab 6 Probabilitas ....................................................................... 87
6.1. Pengantar ................................................................... 87
6.2. Pengertian Probabilitas .............................................. 87
6.3. Menentukan Probabilitas Suatu Peristiwa ................. 90
6.4. Probabilitas Gabungan Beberapa Peristiwa ............... 92
6.5. Probabilitas Peristiwa Saling Bebas .......................... 96
6.6. Probabilitas Bersyarat ................................................ 97
6.7. Metode Perhitungan Peristiwa ................................... 99
Bab 7 Distribusi Probabilitas ..................................................... 103
7.1. Pengantar ................................................................... 103
7.2. Disribusi Binomial (Bernoulli) dan Multinomial ...... 103
7.3. Distribusi Hipergeometrik ......................................... 109
7.4. Distribusi Poisson ...................................................... 112
7.5. Distribusi Normal ...................................................... 115
7.6. Pendekatan Normal terhadap Distribusi Binomial .... 120
Bab 8 Distribusi Sampling ......................................................... 123
8.1. Pengantar ................................................................... 123
8.2. Distribusi Sampling Rata-Rata .................................. 129
8.3. Distribusi Sampling Proporsi ..................................... 133
8.4. Distribusi Selisih Rata-Rata ....................................... 135
8.5. Distribusi Selisih Proporsi ......................................... 136
Bab 9 Teori Estimasi .................................................................. 138
9.1. Pengantar ................................................................... 138
9.2. Ciri-ciri Estimator yang Baik ..................................... 138
9.3. Cara Mengestimasi Nilai Parameter .......................... 140
9.4. Menentukan Ukuran Sampel ..................................... 151

ix
Referensi ...................................................................................... 155
Glosarium .................................................................................... 157
Distribusi Binomial ..................................................................... 159
Distribusi Poisson ........................................................................ 171
Tabel Z ......................................................................................... 177
Tabel t ........................................................................................... 183

x
Biostatistika 1

BAB 1
MENGENAL STATISTIKA

1.1 Pengantar
Statistika merupakan bagian dari matematika yang
dikembangkan di atas teori peluang untuk membantu manusia
memecahkan berbagai persoalan kehidupan. Pengolahan informasi
statistika mempunyai sejarah jauh ke belakang sejak awal peradaban
manusia. Pada zaman awal Masehi, bangsa-bangsa mengumpulkan
data statistik untuk mendapatkan informasi deskriptif mengenai
pajak, perang, hasil pertanian, dan bahkan pertandingan atletik. Pada
abad ke 17, petugas gereja Katolik menggunakan statistika untuk
mencatat kematian (mortality), kelahiran (fertility), migrasi
(migration) dan perkawinan (wedding).
Seiring dengan berkembangnya ilmu pengetahuan dan
teknologi, peranan statistika semakin luas dan digunakan di berbagai
bidang seperti kesehatan, ekonomi, sosial, pendidikan, pertanian dan
perusahaan. Statistika telah mampu melakukan pengambilan
keputusan melalui generalisasi dan peramalan periode yang akan
datang.
1.2 Pengertian Statistika
Sebelum kita berbicara lebih jauh tentang metode-metode
statistika, sebaiknya kita mengerti terlebih dahulu definisi statistika.
Statistika adalah ilmu yang mempelajari bagaimana merencanakan,
mengumpulkan, menyajikan, menginterpretasikan data, menganalisis
dan menarik kesimpulan dari hasil analisis.

1
Darnah Andi Nohe

Statistika (dalam bahasa Inggris statistics) berbeda dengan statistik


(statistic). Secara singkat dapat diartikan bahwa statistika adalah
ilmu yang berbicara tentang data sedangkan statistik adalah data,
informasi atau hasil dari statistika.
1.3 Pembagian Statistika
Statistika sebagai suatu ilmu yang berkenaan dengan data yang
telah didefinisikan sebelumnya, dapat dibagi menjadi beberapa
bagian yaitu berdasarkan cara pengolahan datanya, berdasarkan
ruang lingkup penggunaannya dan berdasarkan bentuk parameternya.
Untuk lebih jelasnya, berikut akan diuraikan satu persatu.
1.3.1 Statistika berdasarkan cara pengolahan datanya
Berdasarkan cara pengolahan datanya, statistika dibagi menjadi
statistika deskriptif (deduktif) dan statistika inferensi (induktif).
Statistika deskriptif, sesuai dengan namanya yaitu gambaran
(description) adalah metode-metode statistika yang berkenaan
dengan pengumpulan dan penyajian suatu data dengan hanya
memberikan gambaran pada data yang ada dan tidak dapat
memberikan generalisasi dan kesimpulan apapun tentang data yang
lebih besar (populasi).
Contoh statistika deskriptif adalah sebagai berikut:
a. Jumlah kasus malaria di Kalimantan Timur mengalami
peningkatan dari tahun 2009 ke tahun 2010 yaitu dari 14.201
kasus menjadi 15.099 kasus.
b. Gambar berikut merupakan contoh diagram lingkaran (pie
chart) untuk menggambarkan distribusi sarapan pagi
responden.

2
Biostatistika 1

c. Tabel berikut merupakan contoh distribusi penerapan Perilaku


Hidup Bersih dan Sehat (PHBS) dengan jumlah sampel 100
orang.

Penerapan PHBS Jumlah Persen (%)


PHBS 56 75
Tidak PHBS 19 25
Jumlah 75 100

Statistika inferensi atau dikenal juga dengan statistika induktif


merupakan metode-metode statistika yang berkenaan dengan cara
analisis sebagian data untuk kemudian sampai kepada peramalan
atau penarikan kesimpulan berdasarkan data yang diperoleh dari
sampel untuk menggambarkan karakteristik atau ciri dari suatu
populasi. Jadi pada statistika inferensi sudah dapat dilakukan
generalisasi pada populasi berdasarkan data sampel yang diperoleh.
Generalisasi yang berhubungan dengan statistika inferensi selalu
mempunyai sifat ketidakpastian (uncertainty) karena hanya
didasarkan dari sebagian data sehingga pengetahuan tentang teori
probabilitas (peluang) mutlak diperlukan. Teori tentang probabilitas
akan dibahas pada Bab 6.

3
Darnah Andi Nohe

Contoh statistika inferensi:


a. Ada hubungan antara pengetahuan dan sikap dengan PHBS di
wilayah kerja puskesmas X.
b. Terdapat perbedaan rata-rata berat badan sebelum dan setelah
melakukan diet selama tiga bulan pada penderita obesitas di
Kabupaten Bone.
c. Faktor-faktor yang mempengaruhi penyakit jantung koroner di
Rumah Sakit X pada tahun 2011 adalah usia, kadar glukosa
dan kadar kolesterol dalam darah pasien.
1.3.2 Statistika berdasarkan ruang lingkup penggunaannya.
Statistika juga dapat dibagi berdasarkan ruang lingkup (bidang)
dimana statistika digunakan. Jenis statistika berdasarkan ruang
lingkup penggunaannya sangat banyak jika disebutkan satu persatu.
Misalnya, statistika yang digunakan pada bidang kedokteran dan
kesehatan masyarakat disebut sebagai biostatistika. Statistika yang
digunakan pada bidang ekonomi disebut statistika ekonomi, statistika
yang digunakan pada bidang pendidikan disebut statistika
pendidikan, ada juga statistika keuangan dan bisnis, statistika
pertanian dan lain sebagainya.
Pada dasarnya, semua metode statistika yang ada dapat
digunakan pada seluruh bidang. Tidak ada perbedaan konseptual
antara biostatistika dengan statistika keuangan dan bisnis begitu pula
bidang lainnya, yang membedakan hanya kebutuhan dan masalah
yang ditemukan disesuaikan bidangnya kemudian menggunakan
metode statistika yang sesuai.
1.3.3 Statistika berdasarkan distribusi populasi.
Metode-metode statistika yang ada terus mengalami
perkembangan dan metode statistika inferensi yang pertama ada
adalah metode yang membuat sejumlah asumsi (syarat) mengenai

4
Biostatistika 1

populasi darimana sampel diambil. Nilai-nilai dari populasi disebut


parameter maka metode statistika pertama disebut statistika
parametrik. Salah satu asumsi yang harus dipenuhi pada metode ini
adalah data populasi mengikuti distribusi (sebaran) normal.
Distribusi normal merupakan bagian dari continuous probability
distribution, sehingga skala pengukurannya pun haruslah kontinu
(interval atau rasio).
Pada penelitian di bidang kedokteran dan kesehatan
masyarakat maupun penelitian sosial seringkali mengalami kesulitan
untuk menspesifikasikan distribusi data karena banyak data yang
diperoleh bersifat kategorik (nominal dan ordinal), umumnya
diperoleh dari kuesioner yang menggunakan skala Likert atau
Guttman maupun pengkategorian lainnya. Sehingga penerapan
metode statistika parametrik tidak dapat digunakan. Untuk
mengatasinya, dibutuhkan suatu metode yang tidak mensyaratkan
asumsi tertentu pada distribusi populasinya. Karena kita tidak
menspesifikasikan distribusi dari populasinya maka kita tidak
berhubungan dengan parameter. Metode alternatif yang kita gunakan
adalah statistika non parametrik.
Statistika non parametrik adalah metode statistika yang bebas
distribusi (distribution free statistics atau assumption free test),
sehingga metode statistik nonparametrik merupakan metode statistik
yang dapat digunakan dengan mengabaikan segala asumsi yang
melandasi metode statistika parametrik, terutama yang berkaitan
dengan distribusi normal. Statistika non parametrik biasanya
digunakan untuk melakukan analisis pada data kategorik (nominal
atau ordinal).
1.4 Jenis-jenis Data
Data merupakan bentuk jamak (plural) dari kata “datum”,
berasal dari bahasa latin yang berarti “sesuatu yang diberikan”.

5
Darnah Andi Nohe

Dengan demikian, tidak ada istilah “data-data”, kita cukup


menyatakan “data” saja.
Data dapat diartikan sebagai catatan atas kumpulan fakta yang
merupakan hasil mengamati atau mengukur unit sampel ataupun
populasi.
Data dibagi didalam beberapa bagian yaitu berdasarkan
jenisnya, sifatnya, skala pengukurannya, waktu pengumpulannya dan
berdasarkan sumbernya.
1.4.1 Data Berdasarkan Jenisnya.
Berdasarkan jenisnya, data dibagi menjadi data kualitatif dan
data kuantitatif. Data kualitatif merupakan data yang bukan dalam
bentuk angka (bukan numerik), misalnya persetujuan tentang
Keluarga Berencana (KB), ada yang menyatakan kurang setuju,
setuju dan sangat setuju. Begitu juga perilaku pemberantasan sarang
nyamuk ada yang baik dan kurang baik merupakan contoh data
kualitatif. Jadi data kualitatif digunakan jika kita ingin mengetahui
bagian yang termasuk dalam kategori tertentu.
Data kuantitatif adalah data dalam bentuk bilangan numerik,
misalnya jumlah balita yang telah mendapatkan imunisasi, kadar gula
darah sewaktu penderita diabetes mellitus dan lain-lain. Semua
ukuran tersebut berupa angka. Data kuantitatif dapat dibuat menjadi
data kualitatif, misalnya tinggi badan dapat dikategorikan menjadi
pendek, sedang dan tinggi, begitu pula kadar gula darah sewaktu
dapat dikategorikan menjadi normal dan tidak normal.
1.4.2 Data Berdasarkan Sifatnya.
Berdasarkan sifatnya, data dibagi menjadi data diskrit dan data
kontinu. Data diskrit diperoleh dari hasil perhitungan, selalu
bernilai positif dimulai dari angka 0, dapat dipisahkan satu dengan

6
Biostatistika 1

lain secara jelas dan bukan bilangan desimal. Misalnya jumlah


lansia, jumlah penderita TBC dan banyaknya penderita HIV AIDS.
Tidak mungkin jumlah lansia 56,25 atau 78,5 dan sebagainya. Jadi
data diskrit selalu berbentuk bilangan bulat.
Data kontinu diperoleh dari hasil pengukuran, bilangan bulat
atau desimal tergantung alat ukur yang dipakai, antara dua interval
angka dapat disisipkan angka berapa saja masih mempunyai makna.
Misalnya berat badan bisa 40 kg dan 55 kg tetapi bisa juga 40,5 kg
dan 55,5 kg. Tekanan darah sistolik, intensitas kebisingan dan lain-
lain yang diperoleh dari pengukuran merupakan data kontinu.
1.4.3 Berdasarkan Skala Pengukurannya.
Berdasarkan skala pengukurannya, data dibagi menjadi skala
nominal, ordinal, interval dan rasio. Skala nominal merupakan skala
data yang paling sederhana, objek diklasifikasikan atau dikategorikan
kemudian diberi angka yang mempunyai arti sebagai label saja tanpa
menunjukkan tingkatan apa-apa. Setiap objek hanya dapat masuk
kedalam salah satu kategori sehingga tidak terjadi tumpang tindih
(over lapping). Skala nominal termasuk dalam data kualitatif.
Contoh data nominal adalah jenis kelamin (1: laki-laki dan
2:perempuan), jenis penyakit (1: demam berdarah, 2: kanker, 3:
diabetes mellitus, 4: hepatitis, 5: asma) dan lain-lain. Angka-angka
tersebut hanya sebagai label, tidak berarti bahwa 2 lebih tinggi dari 1
begitu juga sebaliknya. Jadi pada skala nominal, selisih dari dua
urutan dan operasi hitung lainnya tidak berlaku. Misalnya pada
hukum penjumlahan 1+2=3, tetapi kita tidak bisa mengatakan bahwa
demam berdarah ditambah kanker akan menjadi diabetes mellitus.
Skala ordinal merupakan skala data yang satu tingkat lebih
tinggi dari skala nominal, objek diklasifikasikan atau dikategorikan
kemudian diberi angka yang mengandung pengertian tingkatan
(urutan/jenjang). Tingkatan objek atau data bisa dibuat dari data yang

7
Darnah Andi Nohe

tertinggi sampai terendah begitu juga sebaliknya. Sama halnya pada


skala nominal, selisih dari dua urutan serta operasi hitung lainnya
pada skala ordinal juga tidak mempunyai makna. Skala ordinal juga
termasuk dalam data kualitatif.
Contoh data ordinal adalah status pendidikan pasien (1: rendah,
2: menengah, 3: tinggi), status gizi balita (1: gizi lebih, 2: gizi baik,
3: gizi cukup, 4: gizi kurang, 5: gizi buruk) dan lain sebagainya. Kita
tidak dapat mengatakan bahwa jarak antara 1 dan 2 akan sama
dengan 3 dan 4 pada status gizi balita karena perbedaan antara gizi
lebih dengan gizi baik tidak sama dengan perbedaan antara gizi
cukup dengan gizi kurang.
Skala interval merupakan suatu skala pemberian angka pada
klasifikasi atau kategori yang mempunyai sifat skala ordinal dan
ditambah sifat lain yaitu jarak atau interval yang sama dan dapat
diukur, selain itu pada skala interval tidak mempunyai nol mutlak
(absolute). Misalnya ketika seorang bayi dimasukkan kedalam
kelompok umur 0 tahun, tidak berarti bahwa bayi tersebut tidak
mempunyai umur akan tetapi umurnya kurang dari 1 tahun. Contoh
lain adalah suhu, ketika dikatakan bahwa suatu di daerah tertentu
adalah 0 derajat Celcius tidak berarti bahwa daerah tersebut tidak
mempunyai suhu.
Skala interval sudah termasuk dalam ukuran yang bersifat
numerik, interval antara dua ukuran yang berbeda mempunyai
makna. Misalnya, interval antara 0 sampai 10 derajat Celcius sama
dengan interval antara 20 sampai 30 derajat Celcius. Jadi interval
antara dua angka tersebut mempunyai makna.

8
Biostatistika 1

Contoh lain skala interval dapat dilihat pada tabel berikut:

Umur (tahun) Jarak Jumlah


0–4 5 20
5–9 5 6
10 – 14 5 12
15 – 19 5 38

Klasifikasi yang mempunyai urutan kemudian mempunyai interval


dengan jarak yang sama merupakan skala interval. Skala interval
termasuk dalam data kuantitatif, tetapi rasio antara dua nilai tidak
mempunyai makna.
Skala rasio adalah skala dengan tingkatan yang paling tinggi
karena mencakup semua sifat-sifat yang ada pada skala nominal,
ordinal dan interval. Perbedaan utama antara skala interval dan rasio
adalah pada skala rasio mempunyai nilai nol mutlak (absolute) dan
rasio antara keduanya mempunyai makna.
Contoh skala rasio adalah jumlah penderita TBC, ketika kita
mengatakan bahwa jumlah penderita TBC adalah nol itu berarti
bahwa tidak ada yang menderita TBC. Jadi pada skala rasio
menunjukkan nilai yang sebenarnya dari objek yang diukur atau
dihitung. Contoh lain adalah berat badan Syaifullah adalah 40 kg dan
Akhtar adalah 20 kg, rasio berat badan keduanya adalah 20 kg
sehingga dapat dikatakan bahwa berat badan Syaifullah adalah 2 kali
berat badan Akhtar. Umur juga termasuk dalam skala rasio jika tidak
dilakukan klasifikasi.
1.4.4 Data Berdasarkan Waktu Pengumpulannya.
Berdasarkan waktu pengumpulannya, data dibagi menjadi data
cross sectional dan data time series. Data cross sectional adalah data
yang dikumpulkan pada waktu tertentu yang sama atau hampir sama,
penelitian yang menggunakan data cross sectional biasa disebut

9
Darnah Andi Nohe

sebagai penelitian cross sectional. Misalnya data jumlah penderita


asma dan faktor-faktor yang dianggap berhubungan atau
mempengaruhinya di Puskesmas Bengkuring tahun 2011. Sedangkan
data time series adalah data yang dikumpulkan selama kurun
waktu/periode tertentu, periode waktunya dapat berupa tahun, bulan,
minggu, hari, jam dan sebagainya. Misalnya:
a. Jumlah penderita anemia di Samarinda dari tahun 2000 sampai
2010 (yang menjadi periode adalah tahun)
b. Jumlah kunjungan poliklinik di RS Dirgahayu Samarinda dari
Januari 2005 sampai Desember 2012 (yang menjadi periode
adalah bulan)
1.4.5 Data Berdasarkan Sumbernya.
Data berdasarkan sumbernya mengacu pada sumber data
diperoleh yaitu internal dan eksternal. Data internal adalah data yang
menggambarkan situasi dan kondisi suatu organisasi atau kelompok
secara internal, misalnya data anggaran dan belanja suatu rumah
sakit, data kepegawaian dan lain sebagainya. Sedangkan data
eksternal adalah data yang menggambarkan kondisi yang ada di luar
organisasi misalnya data jumlah bayi lahir hidup, jumlah wanita usia
subur dan lain sebagainya yang dikumpulkan oleh Badan Pusat
Statistika (BPS).
1.4.6 Data Berdasarkan Cara Memperolehnya
Berdasarkan cara memperolehnya, data dibagi menjadi dua
yaitu data primer dan data sekunder. Data primer merupakan data
yang dikumpulkan oleh penelitinya sendiri, baik melalui pengukuran,
perhitungan, wawancara langsung dan tidak langsung maupun dari
kuesioner. Sedangkan data sekunder adalah data yang diperoleh
peneliti dari instansi lain sebagai sumber data, misalnya BPS, rekam
medik Puskesmas, jurnal atau dari internet.

10
Biostatistika 1

1.5 Syarat Data yang Baik


Data dijadikan dasar dalam membuat suatu kesimpulan dan
keputusan tentang suatu hal, termasuk penelitian. Oleh karena itu
agar keputusan dapat sesuai dengan tujuan penelitian, maka
diperlukan data yang baik. Penggunaan data yang salah akan
mengakibatkan kesimpulan yang salah sehingga tidak tepat dalam
mengambil keputusan dan kebijakan. Syarat data yang baik adalah:
1. Data harus obyektif, artinya data harus sesuai dengan keadaan
yang sebenarnya. Untuk hasil yang akurat, data tidak boleh
dimanipulasi. Misalnya hasil pengukuran status gizi balita
menunjukkan 40 balita gizi buruk, tetapi dilaporkan hanya 20
balita. Pengguna alat kontrasepsi semakin menurun tetapi
dilaporkan meningkat dan lain sebagainya.
2. Data harus representatif (mewakili). Data yang diambil harus
benar-benar mewakili semua kondisi. Misalnya laporan tentang
konsumsi susu pada tahun 2012 yang hanya didasarkan pada
golongan orang kaya saja, data ini tidak mewakili kondisi
konsumsi susu secara keseluruhan.
3. Kesalahan baku (standard error) harus kecil. Suatu hasil
perkiraan (estimate) akan dikatakan baik jika mempunyai
tingkat ketelitian yang tinggi. Tingkat ketelitian diukur dari
nilai kesalahan baku, semakin kecil nilai kesalahan baku maka
semakin tinggi tingkat ketelitian hasil perkiraan begitu pula
sebaliknya. Cara menghitung kesalahan baku akan dibahas
pada Bab 9.
1.6 Jenis-jenis Variabel
Setiap variabel atau peubah yang akan diteliti harus
diidentifikasi dan didefinisikan secara jelas sehingga dapat diukur

11
Darnah Andi Nohe

(measurable). Dengan demikian, pemahaman tentang variable dan


teknik pengukurannya menjadi hal yang esensial.
Variabel adalah konsep yang sedang diselidiki dan menjadi fokus
perhatian serta mempunyai sifat atau nilai-nilai yang bervariasi.
Seperti halnya data, variable juga dibagi menjadi beberapa
bagian yaitu berdasarkan bentuknya, berdasarkan hubungan
fungsionalnya dan berdasarkan skala pengukurannya. Berikut akan
dibahas satu persatu:
1.6.1 Variabel Berdasarkan Bentuknya
Berdasarkan bentuknya, variabel dibagi menjadi variabel
kualitatif dan kuantitatif. Variabel kualitatif merupakan variabel yang
menunjukkan suatu intensitas yang sulit diukur secara angka atau
numerik. Variabel kualitatif yang mempunyai dua kategori disebut
variabel dikotomus (dichotomus), misalnya jenis kelamin (laki-laki
dan perempuan), umur penderita hipertensi dengan kategori berisiko
dan tidak berisiko dan sebagainya. Sedangkan variabel kualitatif
yang mempunyai lebih dari dua kategori disebut variabel
polikotomus (polichotomus), misalnya jenis pekerjaan (PNS, Swasta,
TNI/POLRI, Wiraswasta, Petani), tingkat pengetahuan gizi sehat
dengan kategori baik, sedang, kurang dan sebagainya.
Berbeda dengan variabel kualitatif, pada variabel kuantitatif
kita dapat melakukan pengukuran secara numerik. Variabel
kuantitatif yang diperoleh dari hasil perhitungan disebut sebagai
variabel diskrit, misalnya penderita penyakit jantung koroner, peserta
askes dan sebagainya. Sedangkan variabel kuantitatif yang diperoleh
dari hasil pengukuran disebut sebagai variabel kontinu, misalnya
berat badan, tekanan darah sistolik dan sebagainya.

12
Biostatistika 1

1.6.2 Variabel Berdasarkan Hubungan Fungsionalnya


Berdasarkan hubungan fungsionalnya, variabel dibagi menjadi
variabel terikat dan variabel bebas. Variabel terikat biasa juga
disebut sebagai variabel tergantung atau variabel dependen atau
variabel respon merupakan variabel yang dipengaruhi oleh variabel
bebas. Sedangkan variabel bebas yang dikenal juga sebagai variabel
independen atau variabel prediktor adalah variabel yang
mempengaruhi variabel lain.
Contoh variabel terikat adalah status gizi balita, variabel
bebasnya adalah pola makan, hygiene pemberian makanan, tingkat
pendidikan orang tua dan sebagainya.
1.6.3 Variabel Berdasarkan Skala Pengukurannya
Berdasarkan skala pengukurannya, variabel dibagi menjadi
variabel nominal, variabel ordinal, variabel interval dan variabel
rasio. Variabel nominal adalah variabel yang mempunyai skala
pengukuran nominal. Variabel ordinal adalah variabel yang
mempunyai skala pengukuran ordinal. Begitu pula interval dan
rasio. Penjelasan masing-masing skala pengukuran sudah dibahas
sebelumnya.

13
Darnah Andi Nohe

BAB 2
TEKNIK SAMPLING

2.1 Pengantar
Pada Bab 1 kita mengenal statistika induktif yaitu statistika
yang berkenaan dengan penarikan kesimpulan umum tentang
populasi berdasarkan data sampel. Agar hasil penelitian yang
dilakukan terhadap sampel bisa tetap dipercaya dan mewakili
karakteristik populasi, maka teknik pengambilan sampel harus
dilakukan secara benar. Teknik pengambilan sampel dikenal dengan
nama teknik sampling.
Pada Bab ini, akan dibahas tentang pengertian populasi dan
sampel, ukuran sampel, teknik sampling dan kesalahan sampling.
2.2 Pengertian Populasi dan Sampel
Populasi (universe) adalah keseluruhan objek pengamatan
yang menjadi perhatian kita. Objek yang dimaksud bukan hanya
manusia, tetapi bisa juga berupa hewan, tumbuhan, darah dan benda-
benda lainnya yang ada di alam. Setiap satuan objek dari populasi
disebut elemen atau unsur populasi.
Populasi berdasarkan ukurannya terbagi menjadi populasi
terbatas (finite) dan populasi tidak terbatas (infinite). Populasi
terbatas adalah populasi yang jumlah elemennya diketahui dengan
pasti, misalnya jumlah pasien rawat inap di rumah sakit X tahun
2012 sebanyak 1.200 orang, akseptor IUD di wilayah kerja
puskesmas X bulan Februari 2013 sebanyak 35 orang, dan lain
sebagainya.
Sedangkan populasi tak terbatas adalah populasi yang jumlah
elemennya berubah-ubah sehingga tidak dapat diketahui dengan pasti

14
Biostatistika 1

jumlahnya, misalnya jumlah darah yang ada pada setiap orang,


jumlah trombosit, jumlah bakteri dalam suatu daerah dan lain
sebagainya.

Populasi juga dibagi berdasarkan keadaannya, yaitu populasi


homogen dan populasi heterogen. Populasi homogen adalah populasi
yang memiliki sifat-sifat yang relatif seragam satu sama lainnya.
Misalnya darah, obat dalam satu botol dan lain sebagainya. Apabila
kita ingin mengetahui rasa dari suatu obat dalam suatu botol, cukup
kita mencoba setetes akan mewakili rasa dalam sebotol obat tersebut.

Populasi heterogen adalah populasi yang memiliki sifat-sifat


yang relatif berbeda satu sama lainnya. Karakteristik seperti ini
banyak ditemukan dalam penelitian sosial dan perilaku, yang
objeknya manusia atau gejala-gejala dalam kehidupan manusia yang
bersifat unik dan kompleks. Misalnya ingin meneliti pengetahuan
dan perilaku hidup bersih suatu masyarakat. Masyarakat tersebut
heterogen karena mempunyai karakteristik yang berbeda-beda,
berbeda tingkat pendidikan, jenis kelamin, pekerjaan dan lain
sebagainya.

Sampel adalah sebagian dari populasi yang dianggap


mewakili karakteristik populasi, dan setiap satuan objek dari sampel
disebut elemen sampel. Misalnya pasien rawat inap yang ada di
Ruang Mawar, Melati dan Teratai, 25 akseptor IUD di wilayah kerja
puskesmas X, 3 ml darah dan lain sebagainya.
2.3 Ukuran Sampel
Pada penelitian yang dilakukan menggunakan analisis
kualitatif, banyaknya sampel bukan menjadi nomor satu, karena yang
dipentingkan adalah kekayaan informasi. Walau jumlahnya sedikit
tetapi jika kaya akan informasi, maka sampelnya lebih bermanfaat.

15
Darnah Andi Nohe

Meskipun demikian, menurut Gay dan Diehl (1992), untuk penelitian


kualitatif sebaiknya jumlah sampel minimal 10% dari populasi.
Ukuran atau jumlah sampel yang diambil menjadi persoalan
yang penting manakala jenis penelitian yang akan dilakukan adalah
penelitian yang menggunakan analisis kuantitatif karena harus
mempertimbangkan hal berikut:
1. Makin kecil sampel yang dipilih makin rendah kemampuan
untuk membuat generalisasi atas kesimpulan penelitian.
2. Makin kecil sampel makin tinggi kecenderungan kekeliruan
penarikan kesimpulan.
3. Makin tidak seragam sifat atau karakter setiap elemen populasi,
makin banyak sampel yang harus diambil. Ketidak seragaman
dapat diukur dengan menggunakan standar deviasi yang akan
dibahas pada Bab 5.
Sehingga masih menurut Gay dan Diehl (1992), untuk
penelitian korelasional jumlah sampel sebaiknya minimal 30 elemen,
untuk penelitian komparatif jumlah sampel minimal 30 elemen per
kelompok, dan untuk penelitian eksperimen 15 elemen per
kelompok.
Sedangkan Roscoe (1975) dalam Uma Sekaran (1984)
memberikan pedoman penentuan jumlah sampel sebagai berikut :
1. Sebaiknya jumlah sampel di antara 30 sampai dengan 500
elemen.
2. Jika sampel dipecah lagi ke dalam sub sampel (laki-
laki/perempuan, SD/SLTP/SMU, dan sebagainya), maka
jumlah subsampel minimal 30 elemen. Jadi jika sub sampel
terdiri dari laki-laki dan perempuan, jumlah sampel minimal 60
elemen.

16
Biostatistika 1

3. Pada penelitian multivariat (termasuk analisis regresi), ukuran


sampel minimal 10 kali dari jumlah variabel yang akan
dianalisis. Misalnya jika akan mengetahui faktor-faktor yang
berpengaruh terhadap hipertensi (Y) dengan 5 variabel bebas
(X) maka jumlah sampel minimal adalah 6 x 10 = 60 elemen.
4. Untuk penelitian eksperimen yang sederhana dengan
pengendalian yang ketat, jumlah sampel bisa antara 10 sampai
dengan 20 elemen. Misalnya penelitian yang dilakukan untuk
mengetahui warna yang lebih disukai nyamuk di suatu ruangan
tertutup.
Tabel Krejcie dan Morgan juga dapat dipakai untuk
menentukan jumlah sampel (n) berdasarkan jumlah populasi (N)
yang diketahui seperti disajikan pada Tabel 2.1 berikut:
Tabel 2.1 Tabel Penentuan Jumlah Sampel
N n N n N n
10 10 220 140 1200 291
15 14 230 144 1300 297
20 19 240 148 1400 302
25 24 250 152 1500 306
30 28 260 155 1600 310
35 32 270 159 1700 313
40 36 280 162 1800 317
45 40 290 165 1900 320
50 44 300 169 2000 322
55 48 320 175 2200 327
60 52 340 181 2400 331
65 56 360 186 2600 335
70 59 380 191 2800 338

17
Darnah Andi Nohe

Tabel 2.1 Tabel Penentuan Jumlah Sampel (Lanjutan)

N n N n N n
75 63 400 196 3000 341
80 66 420 201 3500 346
85 70 440 205 4000 351
90 73 460 210 4500 354
95 76 480 214 5000 357
100 80 500 217 6000 361
110 86 550 226 7000 364
120 92 600 234 8000 367
130 97 650 242 9000 368
140 103 700 248 10000 370
150 108 750 254 15000 375
160 113 800 260 20000 377
170 118 850 265 30000 379
180 123 900 269 40000 380
190 127 950 274 50000 381
200 132 1000 278 75000 382
210 136 1100 285 1000000 384
Sumber: Krejcie dan Morgan (1970) dalam Uma Sekaran
(1984)
Jika kita menggunakan rumus Slovin akan memberikan jumlah
sampel yang hampir sama dengan Tabel 2.1 untuk nilai α = 5%.
Berikut adalah rumus Slovin:

N
n=
1 + Nα 2
Dimana:
n : banyaknya sampel
N : banyaknya populasi
α : tingkat signifikansi

18
Biostatistika 1

Contoh 2.1
Misalnya akan dilakukan pengambilan sampel dari populasi yang
berjumlah 120 orang, jika α = 5% maka diperoleh jumlah sampel
menurut rumus Slovin berikut:

N 120
n= = = 92,3 orang.
1 + Nd 2
1 + 120(0,05) 2

Berarti kita dapat mengambil sampel dengan jumlah minimal 92


orang, angka ini sama dengan yang diperoleh pada Tabel 2.1 untuk N
= 120 diperoleh n = 92.
Penentuan jumlah sampel juga dapat dilakukan dengan
menyesuaikan tujuan penelitian dengan uji statistika yang digunakan,
misalnya jika ingin mengetahui adanya hubungan antara merokok
dengan asma menggunakan uji Chi Square maka jumlah sampel
sebaiknya di atas 40 elemen sesuai dengan syarat uji Chi Square.
Akan tetapi jika ingin mengetahui perbedaan rata-rata kadar gula
darah sewaktu penderita DM sebelum dan setelah diet 1700 kalori
maka jumlah sampel kurang dari 30 elemen pun sudah cukup karena
dapat menggunakan uji t paired asalkan datanya berdistribusi
normal dan lain sebagainya.
Pada Bab 9 juga akan dibahas cara menentukan ukuran sampel
disesuaikan parameter yang akan diestimasi dan kesalahan yang
ditolerir.
2.4 Cara Pengambilan Elemen Sampel
Pengambilan elemen sampel dapat dilakukan dengan dua cara
yaitu tanpa pengembalian (without replacement) dan dengan
pengembalian (with replacement). Pengambilan elemen sampel tanpa
pengembalian merupakan pengambilan sampel di mana tiap elemen
sampel yang sudah diambil dan diamati tidak dikembalikan kepada

19
Darnah Andi Nohe

populasinya sebelum sampel berikutnya diambil sehingga tidak ada


kemungkinan terpilih kembali menjadi sampel. Banyaknya sampel
berukuran r yang diambil dari populasi berukuran N tanpa
pengembalian adalah:

N!
C(N, r) =
r!( N − r )!

Dimana:
C: kombinasi.
N : jumlah populasi.
r: ukuran sampel
Lambang “!” dibaca faktorial, didefinisikan bahwa 1! = 1,
0! = 1 dan n!= n x (n-1) x (n-2) x …x 3 x 2 x 1.
Contoh 2.1
Misalnya diketahui di dalam suatu kotak terdapat 8 jenis obat, jika
dilakukan pengambilan sampel berukuran 4 tanpa pengembalian,
maka banyaknya sampel yang diambil adalah:

8! 8x7x6x5x4!
C(8,4) = = = 70 sampel.
4!(8 − 4)! 4! 4x3x2x1

Jika kita mengambil sampel yang berukuran 1 dari dalam kotak akan
diperoleh jumlah sampel berikut:

8! 8x7!
C(8,1) = = = 8 sampel.
1!(8 − 1)! 1x 7!

Pemilihan elemen sampel dengan pengembalian merupakan


pengambilan sampel dimana tiap elemen sampel yang sudah diambil
dikembalikan kepada populasinya sehingga dapat terpilih lagi

20
Biostatistika 1

menjadi sampel. Banyaknya sampel berukuran n yang diambil dari


populasi berukuran N dengan pengembalian adalah N n .

Contoh 2.2
Misalnya diketahui populasi 4 orang penderita penyakit malaria, jika
diambil sampel berukuran 2, maka banyaknya sampel yang diambil
adalah N n = 42 = 16 orang. Jika inisial 4 populasi tersebut adalah A,
B, C dan D maka kemungkinan yang sampel yang bisa terpilih
adalah AA, AB, AC, AD, BB, BC, BD, CC, CD, DD, DC, DB, DA,
CB, CA dan BA.
2.5 Teknik Sampling
Secara umum, teknik pengambilan sampel terdiri dua macam
yaitu teknik pengambilan sampel secara acak (random sampling /
probability sampling) dan teknik pengambilan sampel secara tidak
acak (nonrandom sampling/ nonprobability sampling). Pembagian
teknik sampling secara skema dapat dilihat pada Gambar 2.1.
Probability sampling adalah teknik pengambilan sampel yang
memberikan kesempatan (probabilitas) yang sama kepada setiap
elemen populasi untuk terpilih sebagai sampel. Misalnya akan
dilakukan pengambilan sampel sebanyak 45 dari 100 penderita gagal
jantung, maka setiap penderita tersebut mempunyai probabilitas
sebesar 45/100=0,45 untuk terpilih menjadi sampel.
Sedangkan nonprobability sampling merupakan teknik
pengambilan sampel yang tidak memberi kesempatan yang sama
pada setiap elemen populasi untuk menjadi sampel. Misalnya
seorang peneliti mengambil 25 rumah tetangga sebagai sampel untuk
mengetahui adanya jentik di tempat penampungan air minum, berarti
rumah yang letaknya jauh dari rumah peneliti tidak mempunyai
kemungkinan untuk terpilih atau nilai probabilitasnya 0.

21
Darnah Andi Nohe

Setiap teknik pengambilan sampel digunakan sesuai dengan


tujuan peneliti. Jika jumlah maupun elemen populasi diketahui
secara lengkap dan peneliti ingin melakukan generalisasi terhadap
populasi, maka probability sampling lebih tepat digunakan. Tetapi
jika peneliti tidak ingin melakukan generalisasi terhadap populasi
maka non probability sampling dapat dilakukan.
Contoh 2.3
Misalnya dilakukan penelitian kualitas pelayanan rumah sakit,
kemudian diambil sampel 50 pengunjung pertama pada hari Senin.
Hasilnya menunjukkan bahwa 20 di antaranya merasa puas terhadap
pelayanan rumah sakit. Hasil ini hanya berlaku pada ke-50 sampel
tersebut, tidak bisa disimpulkan bahwa 40% (20/50) pengunjung
sudah merasa puas terhadap pelayanan rumah sakit.

22
Biostatistika 1

Teknik Sampling

Probability Sampling Non Probability Sampling

1. Simple Random 1. Accidental Sampling


Sampling 2. Purposive Sampling
2. Stratified Random 3. Quota Sampling
Sampling 4. Snow Ball Sampling
3. Cluster Random 5. Total Sampling
4. Systematic Random
Sampling

Gambar 2.1 Skema Pembagian Teknik Sampling


2.5 Probability Sampling.
Syarat pertama yang harus dilakukan untuk menggunakan
probabilty sampling adalah membuat kerangka sampling (sampling
frame). Kerangka sampling adalah daftar yang berisikan setiap
elemen populasi yang dapat dijadikan sebagai sampel, misalnya jika
populasi penelitian adalah balita di wilayah kerja puskesmas X, maka
peneliti harus mempunyai daftar semua balita yang ada selengkap
mungkin. Nama, usia, jenis kelamin, alamat dan informasi lain yang
berguna bagi penelitiannya. Dari daftar ini, peneliti akan bisa secara
pasti mengetahui jumlah populasinya (N).
Di samping sampling frame, peneliti juga harus mempunyai alat
yang bisa dijadikan penentu sampel. Dari semua elemen populasi,
elemen mana saja yang terpilih menjadi sampel. Alat yang umumnya

23
Darnah Andi Nohe

digunakan adalah Tabel Angka Random, kalkulator, atau undian.


Pemilihan sampel secara acak bisa dilakukan melalui sistem undian
jika elemen populasinya tidak begitu banyak. Tetapi jika sudah
ratusan, bisa menggunakan kalkulator atau komputer.
Probability sampling yang akan dibahas dalam buku ini adalah
simple random sampling, stratified random sampling, cluster random
sampling dan systematic random sampling. Berikut akan dibahas satu
persatu.
2.5.1 Simple Random Sampling.
Simple random sampling atau pengambilan sampel secara acak
sederhana merupakan teknik pengambilan sampel tanpa
memperhatikan perbedaan strata yang ada pada elemen populasi dan
setiap elemen populasi mempunyai kesempatan yang sama untuk
terpilih menjadi sampel. Misalnya meskipun dalam populasi ada laki-
laki dan perempuan, dalam simple random sampling jenis kelamin
tidak diperhatikan sehingga semuanya mempunyai kesempatan yang
sama untuk terpilih menjadi sampel.
Prosedur yang dilakukan dalam simple random sampling
adalah sebagai berikut :
1. Menyusun sampling frame.
2. Menetapkan jumlah sampel yang akan diambil.
3. Menentukan alat pemilihan sampel.
4. Memilih sampel sampai jumlah sampel terpenuhi.
Contoh 2.4
Misalnya kita akan mengambil sampel 10 dari 40 mahasiswa di suatu
kelas untuk mengetahui rata-rata tinggi badan mereka. Untuk itu
dilakukan pengundian berdasarkan nomor urut yang ada di daftar
hadir. Jika nomor urut 5 yang pertama muncul, maka mahasiswa
yang berada pada urutan ke-5 dijadikan sebagai sampel pertama, jika

24
Biostatistika 1

pada undian kedua yang muncul adalah nomor urut 9, maka


mahasiswa yang berada pada urutan ke-9 akan dijadikan sebagai
sampel kedua, begitu seterusnya sampai terambil 10 mahasiswa.
2.5.2 Stratified Random Sampling
Stratified random sampling atau pengambilan sampel secara
acak berlapis merupakan teknik pengambilan sampel yang dilakukan
dengan membagi anggota populasi ke dalam kelompok yang lebih
kecil yang disebut stratum atau sub population. Hal ini dilakukan
karena populasi sangat heterogen (bervariasi) sehingga apabila tidak
dibagi ke dalam stratum, hasil penelitian kurang memuaskan yaitu
nilai taksiran terlalu tinggi (over estimate) atau terlalu rendah (under
estimate) dengan kesalahan sampling sekitar 50%. Jadi pada teknik
sampling ini, populasi dalam setiap stratum homogen atau relatif
homogen tetapi antar stratum bersifat heterogen.
Prosedur yang dilakukan dalam stratified random sampling
adalah:
1. Menyiapkan sampling frame.
2. Membagi sampling frame ke dalam stratum.
3. Menentukan jumlah sampel dalam setiap stratum.
4. Memilih sampel dari setiap stratum secara acak.
Terdapat dua cara untuk menentukan jumlah sampel pada
stratified random sampling yaitu proportionate stratified random
sampling dan non proportionate stratified random sampling.
Proportionate stratified random sampling artinya pengambilan
sampel dilakukan secara proporsional pada setiap stratum. Misalnya
populasi berjumlah 220 balita terdiri dari 100 laki-laki dan 120
perempuan (jenis kelamin kita anggap sebagai stratum), jika akan
diambil sampel (n) sebanyak 140 balita maka banyaknya balita
berjenis kelamin laki-laki adalah:

25
Darnah Andi Nohe

100
n1 = x140 = 63,6 ≈ 64 balita.
220
dan banyaknya balita perempuan adalah:
120
n2 = x140 = 76,4 ≈ 76 balita.
220
Terlihat bahwa 64 + 76 = 140 atau n1 + n 2 = n. Setelah menentukan
jumlah sampel dari setiap stratum secara proporsional, dilanjutkan
pengambilan sampel dari setiap stratum secara acak.
Non proportionate stratified random sampling artinya
pengambilan sampel dilakukan secara tidak proporsional pada setiap
stratum.
Contoh 2.5
Misalnya pada populasi berjumlah 24 orang terdiri dari 1
berpendidikan S3, 3 S2 dan 20 S1 (status pendidikan dianggap
sebagai stratum), jika akan diambil sampel (n) sebanyak 10 orang
maka banyaknya sampel yang berpendidikan S3 adalah:
1
n1 = x10 = 0,04 ≈ 0 .
24
Banyaknya sampel yang berpendidikan S2:
3
n2 = x10 = 1,25 ≈ 1
24
Banyaknya sampel yang berpendidikan S1:
20
n3 = x10 = 8,3 ≈ 8
24
Berdasarkan perhitungan pengambilan sampel secara proporsional,
tidak ada sampel dari populasi yang berpendidikan S3. Karena
peneliti tetap menginginkan S3 terwakili, maka 1 orang yang
berpendidikan S3 tersebut dijadikan sampel. Kemudian diambil

26
Biostatistika 1

jumlah sampel dari kelompok pendidikan S2 dan S3 sesuai kehendak


peneliti.
Contoh lain adalah peneliti mengambil semua elemen populasi
yang berpendidikan S2 dan S3 sebagai sampel karena jumlahnya
sedikit kemudian sisanya diambil dari populasi berpendidikan S1.
Jadi pada non proportionate stratified random sampling, jumlah
sampel dalam setiap strata diambil secara tidak proporsional. Setelah
jumlah sampel ditetapkan, dilanjutkan pengambilan sampel secara
acak.
2.5.2 Cluster Sampling
Cluster sampling atau teknik pengambilan sampel kelompok
merupakan teknik pengambilan sampel dengan memilih sampel dari
kelompok unit-unit yang lebih kecil (cluster) dari sebuah populasi
yang besar dan tersebar luas secara geografis sehingga disebut juga
area sampling. Berbeda dengan stratified random sampling yang
homogen dalam setiap stratum, pada cluster sampling setiap
kelompok boleh bersifat heterogen.
Prosedur yang dilakukan dalam cluster sampling adalah:
1. Menyusun sampling frame berdasarkan kelompok.
2. Menentukan berapa kelompok yang akan diambil sebagai
sampel.
3. Memilih kelompok sebagai sampel dengan cara acak.
4. Menentukan jumlah sampel dalam setiap kelompok.
5. Memilih elemen sampel dari setiap kelompok dengan cara
acak.

27
Darnah Andi Nohe

Contoh 2.6
Misalnya akan dilakukan penelitian untuk mengetahui prevalensi
pengguna alat kontrasepsi IUD pada wanita usia subur di Kabupaten
X yang terdiri dari 23 kecamatan, kemudian diambil sampel
sebanyak 5 kecamatan secara acak. Dari setiap kecamatan yang
terpilih, diambil sampel secara acak.
2.5.4 Systematic Sampling
Systematic sampling atau teknik pengambilan sampel secara
sistematis merupakan teknik pengambilan sampel dimana elemen
pertama diambil secara acak dari k elemen yang pertama dari
sampling frame dan elemen lainnya diambil berdasarkan jarak
sebesar k. Nilai k tergantung jumlah sampel dan jumlah populasi,
rumus yang digunakan untuk menentukan nilai k adalah:

N
k=
n
Dimana:
k: jarak antar sampel.
N: banyaknya populasi
n: banyaknya sampel
Prosedur yang dilakukan dalam sistematic sampling adalah:
1. Menyusun sampling frame.
2. Menetapkan jumlah sampel.
3. Menentukan jarak (k).
4. Menentukan sampel pertama secara acak.
5. Menentukan sampel kedua dan seterusnya berdasarkan jarak
yang diperoleh pada nomor 3.

28
Biostatistika 1

Contoh 2.7
Misalnya dalam suatu populasi terdapat 10.000 rumah. Sampel yang
akan diambil adalah 500 rumah maka jarak antara sampel pertama,
kedua, dan seterusnya adalah 20. Diperoleh dari:
N 10.000
k= = = 20
n 500
Rumah pertama yang diambil sebagai sampel dipilih secara acak,
jika yang terpilih adalah rumah bernomor 5 maka nomor rumah
berikutnya adalah 25, 45, 65 dan seterusnya sampai jumlah sampel
terpenuhi.
2.6 Nonprobability Sampling
Seperti telah diuraikan sebelumnya, jenis sampel ini dipilih
secara tidak acak. Semua unsur atau elemen populasi tidak
mempunyai kesempatan yang sama untuk terpilih menjadi sampel.
Unsur populasi yang terpilih menjadi sampel bisa disebabkan karena
kebetulan atau karena faktor lain yang sebelumnya sudah
direncanakan oleh peneliti. Non probability sampling yang akan
dibahas adalah accidental sampling, purposive sampling, quota
sampling, snow ball sampling dan total sampling.
2.6.1 Accidental Sampling
Accidental sampling dikenal juga dengan istilah convenience
sampling atau captive sample (man on the street) merupakan teknik
pengambilan sampel berdasarkan kebetulan, yaitu siapa saja yang
secara kebetulan bertemu dengan peneliti dan dapat digunakan
sebagai sampel bila orang yang kebetulan ditemui dianggap cocok
sebagai sumber data. Misalnya peneliti mengambil sampel hanya
berdasarkan pada pengunjung puskesmas yang ditemuinya saat
penelitian berlangsung, jadi orang yang tidak berkunjung ke

29
Darnah Andi Nohe

puskesmas pada saat itu tidak mempunyai kesempatan terpilih


menjadi sampel.
2.6.2 Purposive Sampling
Purposive sampling merupakan teknik pengambilan sampel
berdasarkan pertimbangan tertentu dari peneliti. Suatu sampel
diambil karena peneliti menganggapnya memiliki informasi yang
diperlukan bagi penelitiannya. Misalnya akan meneliti balita dengan
status gizi buruk, maka sampel yang sengaja dipilih oleh peneliti
adalah balita dengan status gizi buruk.
2.6.3 Quota Sampling
Quota sampling merupakan teknik pengambilan sampel
berdasarkan jumlah (kuota) yang diinginkan oleh peneliti. Teknik
pengambilan sampel ini merupakan bentuk lain dari proportionate
stratified random sampling. Namun pada quota sampling, sampel
tidak diambil secara acak melainkan secara kebetulan saja.

Contoh 2.8

Misalnya akan dilakukan penelitian terhadap kinerja tenaga


kesehatan di suatu rumah sakit dan ditentukan kuotanya 40 sampel.
Jumlah kuota tersebut dijadikan dasar pengambilan sampel. Jika
banyaknya tenaga kesehatan di rumah sakit tersebut ada sebanyak
145 yang terdiri dari 50 bidan, 70 perawat dan 25 dokter maka
supaya kuota terpenuhi dan semua tenaga kesehatan yang dimaksud
dapat terwakili, maka :
50
Kuota bidan adalah x 40 = 13,8 ≈ 14 orang.
145
70
Kuota perawat adalah x 40 = 19,3 ≈ 19 orang.
145

30
Biostatistika 1

25
Kuota dokter adalah x 40 = 6,9 ≈ 7 orang.
145
Setelah jumlah sampel dari masing-masing kuota diketahui,
kemudian dilakukan pengambilan sampel secara tidak acak.
2.6.4 Snowball Sampling
Snowball sampling merupakan teknik pengambilan sampel
yang dilakukan dengan system jaringan responden. Mulai dari
mewawancarai satu responden. Kemudian, responden tersebut akan
menunjukkan responden lain dan responden lain tersebut akan
menunjukkan responden berikutnya. Hal ini dilakukan secara terus-
menerus sampai dengan terpenuhinya jumlah anggota sampel yang
diingini oleh peneliti. Hal ini disebabkan peneliti tidak banyak tahu
tentang populasi penelitiannya. Teknik sampling ini biasanya
digunakan untuk meneliti kelompok masyarakat yang ekslusif seperti
kaum lesbian, gay, pengguna narkoba dan lain sebagainya.
Misalnya seorang peneliti ingin mengetahui faktor-faktor yang
mempengaruhi seseorang menjadi pengguna narkoba. Peneliti cukup
mencari satu pengguna narkoba kemudian melakukan wawancara.
Setelah selesai, peneliti tadi minta kepada pengguna tersebut untuk
menunjukkan teman pengguna lainnya, begitu seterusnya sampai
jumlah pengguna dianggap sudah cukup sebagai sampel.

2.6.5 Total Sampling

Total sampling dikenal juga dengan sampling jenuh atau


sensus, merupakan teknik pengambilan sampel dengan menjadikan
semua elemen populasi menjadi elemen sampel. Misalnya akan
dilakukan penelitian terhadap penderita TBC di suatu kota, jika
diketahui ada 200 penderita TBC maka peneliti menjadikan 200
penderita tersebut sebagai sampel penelitian.

31
Darnah Andi Nohe

BAB 3
PENYAJIAN DATA

3.1 Pengantar
Pada bab ini kita akan membahas penyajian data yang
diperoleh dari sampel ataupun populasi sehingga mempunyai
informasi yang bernilai dan bermakna. Pentingnya penyajian data
dapat kita lihat pada contoh berikut.
Contoh 3.1
Misalkan diketahui data hasil pengukuran berat badan (kg) dari 30
mahasiswa adalah sebagai berikut:
40 56 50 45 60
55 48 64 56 45
68 60 55 67 50
58 64 45 60 55
51 48 44 63 40
61 63 59 54 42
Sangat sukar bila kita ingin menginterpretasikan data tersebut
dan hanya sedikit sekali informasi yang bisa kita peroleh, apalagi jika
jumlah sampelnya mencapai 100 atau lebih. Sehingga untuk
memudahkan kita memperoleh informasi dari data maka perlu
dilakukan penyajian data, baik dalam bentuk tabel maupun grafik
dan grafik.
3.2 Tabel
Penyajian data dengan menggunakan tabel merupakan
penyajian data dengan menyusun data menurut kategori (kelompok)

32
Biostatistika 1

tertentu dengan memakai kolom dan baris. Untuk penyajian yang


baik perlu diingat beberapa hal:
a. Judul tabel dibuat singkat, jelas dan lengkap sehingga dapat
menjawab apa yang disajikan, di mana kejadiannya dan kapan
terjadinya.
b. Nomor tabel dapat disesuaikan dengan bab di mana tabel
berada, misalnya tabel yang pertama di Bab 4 diberi nomor
Tabel 4.1.
c. Sumber tabel umumnya dicantumkan pada bagian bawah tabel,
merupakan jawaban darimana tabel diperoleh. Jika data berasal
dari hasil penelitian sendiri, sumber tidak perlu dicantumkan.
Penyajian data dengan menggunakan tabel ada bermacam-
macam, yang paling umum digunakan pada penelitian kedokteran
maupun kesehatan adalah Master Tabel (Tabel Induk), Tabel Satu
Arah (One Way Table), Tabel Dua Arah (Two Way Table) atau
tabulasi silang (cross tabulation) dan Tabel Tiga Arah (Three Way
Table).
3.2.1 Master Tabel (Tabel Induk)
Master tabel merupakan tabel yang berisikan data mentah yang
diperoleh dari pengumpulan data yang dilakukan oleh peneliti.
Umumnya terdiri dari nama, umur, jenis kelamin, pendidikan, data
variabel yang diteliti dan sebagainya yang relevan dengan penelitian.
Master tabel biasanya disajikan pada lampiran, contohnya adalah
sebagai berikut:

33
Darnah Andi Nohe

Tabel 3.1
Master Tabel Penelitian Hubungan Antara Higiene
Perseorangan dengan Demam Tifoid di Desa X
Bulan Desember Tahun 2012

No Nama Umur (tahun) Jenis Kelamin Higiene Tifoid


1. Ani 31 Perempuan Baik Ya
2. Nani 20 Perempuan Kurang Ya
3. Adi 65 Laki-laki Kurang Ya
4. Ali 45 Laki-laki Baik Tidak
5. Mira 30 Perempuan Baik Ya
6. Badu 18 Laki-laki Baik Tidak
7. Mita 56 Perempuan Kurang Tidak
8. Budi 40 Laki-laki Baik Tidak
9. Dalmi 38 Perempuan Baik Tidak
10. Ina 29 Perempuan Kurang Ya

Berdasarkan master tabel yang telah dibuat, kita dapat


melakukan analisis lebih lanjut. Misalnya pada master tabel pada
Tabel 3.1 kita dapat melakukan analisis deskriptif responden
berdasarkan umur, jenis kelamin, higiene perseorangan dan demam
tifoid. Kita juga dapat melakukan analisis inferensi untuk mengetahui
ada atau tidaknya hubungan antara higiene perseorangan dengan
demam tifoid di desa X pada bulan Desember tahun 2012.
3.2.2 Tabel Satu Arah (One Way Table)
Tabel satu arah merupakan penyajian data tentang satu variabel
atau satu karakteristik. Penyajian data dengan menggunakan tabel
satu arah umumnya digunakan untuk menyajikan data untuk variabel
kualitatif atau variabel kuantitatif yang dibuat menjadi beberapa
kategori, misalnya tingkat pendidikan, jenis kelamin, berat badan
yang dibagi menjadi beberapa kategori dan sebagainya.

34
Biostatistika 1

Contoh tabel untuk variabel kualitatif dapat dilihat pada Tabel


3.2 berikut:
Tabel 3.2
Distribusi Responden Berdasarkan Tingkat Pendidikan
di Puskesmas X Tahun 2011

No. Tingkat Pendidikan Frekuensi


1. Tidak Sekolah 15
2. SD 20
3. SLTP 35
4. SLTA 18
5. PT 12
Jumlah 100

Jika kita mempunyai data kuantitatif yang akan dibuat menjadi


beberapa kelompok atau kategori, maka akan diperoleh tabel
distribusi frekuensi. Tabel distribusi frekuensi merupakan penyajian
data yang digunakan dengan membagi data kuantitatif kedalam
beberapa kelompok atau kategori, setiap data hanya dapat
dimasukkan dalam salah satu kelompok.
Langkah-langkah dalam membuat tabel distribusi frekuensi
adalah sebagai berikut:
1. Menentukan rentang atau jangkauan (range), yaitu nilai data
terbesar dikurangi nilai terkecil. Pada contoh berat badan 30
mahasiswa, diperoleh :
Rentang (R) = 68 – 40= 28
2. Menentukan banyak kategori atau kelas interval yang
diperlukan, umumnya diambil paling sedikit 5 kelas dan paling
banyak 15 kelas yang dipilih menurut kebutuhan. Cara lain
yang dapat digunakan adalah dengan menggunakan aturan
Sturges yaitu:

35
Darnah Andi Nohe

Banyak kelas (k) = 1 + (3,3) log n;


Dimana n adalah banyaknya data.
Untuk contoh kita dengan n=30 maka:
k = 1 + (3,3) log 30
= 1 + (3,3) (1,4771)
= 5,87443 ≈ 6

Kita dapat membuat tabel distribusi frekuensi dengan banyak


kelas 6.
3. Menentukan panjang interval kelas (p) dengan rumus berikut:
R
p=
k
Untuk contoh kita dengan R = 28 dan k = 6, diperoleh:
28
p= = 4,6666 ≈ 5
6
4. Menentukan nilai batas bawah kelas interval pertama dengan
mengambil nilai data terkecil atau nilai data yang lebih kecil
dari data terkecil tetapi selisihnya harus kurang dari panjang
kelas interval. Untuk contoh kita, dapat diambil nilai batas
bawah kelas interval pertama 40 atau 39.
Sebelum membuat tabel distribusi frekuensi, dibuat daftar penolong
yaitu kolom tabulasi untuk menentukan banyaknya data yang
terdapat dalam kelas interval yang bersangkutan. Misalnya untuk
contoh kita, banyak kelas 6, panjang kelas 5 dan dimulai dengan nilai
ujung bawah kelas yaitu 40 maka diperoleh daftar penolong berikut:

36
Biostatistika 1

Berat Badan (Kg) Tabulasi Frekuensi


40 - 44 //// 4
45 - 49 ///// 5
50 - 54 //// 4
55 - 59 ///// // 7
60 - 64 ///// /// 8
65 - 69 // 2

Setelah dilakukan tabulasi, data disajikan dalam bentuk tabel


distribusi frekuensi berikut:
Tabel 3.3
Distribusi Frekuensi Berat Badan Responden di
Wilayah Kerja Puskesmas X pada Januari 2013

Berat Badan (Kg) Frekuensi


40 - 44 4
45 - 49 5
50 - 54 4
55 - 59 7
60 - 64 8
65 - 69 2
Jumlah 30

Pada tabel distribusi frekuensi dikenal beberapa istilah berikut:


a. Batas kelas, berdasarkan Tabel 2.3, angka 40, 45, 50, 55, 60
dan 65 merupakan batas bawah kelas tiap-tiap kelas. Angka 44,
49, 54, 59, 64 dan 69 merupakan batas atas tiap-tiap kelas.
b. Tepi kelas (batas nyata kelas), untuk menentukan tepi kelas
dapat menggunakan rumus berikut:
Tepi bawah = batas bawah – 0,5.
Tepi atas = batas atas + 0,5.

37
Darnah Andi Nohe

Pada Tabel 2.3, tepi bawah kelas pertama adalah 39,5 dan tepi
atas kelas adalah 69,5.
c. Titik tengah kelas, diperoleh dengan rumus berikut:
Batas Bawah + Batas Atas
2
Titik tengah kelas pertama pada Tabel 2.3 adalah:
40 + 44
= 42
2
titik tengah untuk kelas berikutnya dapat ditentukan dengan
cara yang sama.
Pada tabel distribusi frekuensi, frekuensi dinyatakan dengan
banyak data yang terdapat dalam tiap kelas dalam bentuk absolut.
Jika kita ingin mengetahui sebaran (distribusi) frekuensi dalam
bentuk persentase, maka nilai frekuensi absolut diubah menjadi
distribusi frekuensi relatif tanpa menghilangkan makna dari data.
Bentuk tabel distribusi frekuensi relatif dari Tabel 3.3 adalah sebagai
berikut:
Tabel 3.4
Distribusi Frekuensi Relatif Berat Badan Responden

Berat Badan (Kg) Frekuensi Relatif (%)


40 - 44 13,3
45 - 49 16,7
50 - 54 13,3
55 - 59 23,3
60 - 64 26,7
65 - 69 6,7
Jumlah 100,0

Berdasarkan Tabel 3.4 dapat diketahui persentase setiap kelas, untuk


kelas pertama diperoleh dari :

38
Biostatistika 1

4
x100% = 13,3%
30
Cara yang sama digunakan untuk menentukan kelas-kelas
berikutnya.
Seringkali kita lebih tertarik bukan pada banyaknya frekuensi
dalam suatu kelas tertentu, tetapi banyaknya frekuensi diatas atau
dibawah suatu nilai tertentu. Misalnya dalam Tabel 3.3 banyaknya
responden yang berat badannya kurang dari 60 kg ada 20 orang.
Frekuensi total semua nilai yang lebih kecil daripada batas atas kelas
suatu interval kelas disebut distribusi frekuensi kumulatif. Dikenal
dua jenis distribusi frekuensi kumulatif yaitu kurang dari dan atau
lebih. Untuk mempersingkat penulisan, contoh kedua jenis distribusi
frekuensi tersebut dapat dilihat pada Tabel 3.5 berikut:
Tabel 3.5
Frekuensi Kumulatif Kurang Dari dan Kumulatif Lebih Dari

Berat Badan (Kg) f kum BeratBadan (Kg) f kum


Kurang dari 40 0 40 atau lebih 30
Kurang dari 45 4 45 atau lebih 26
Kurang dari 50 9 50 atau lebih 21
Kurang dari 55 13 55 atau lebih 17
Kurang dari 60 20 60 atau lebih 10
Kurang dari 65 28 65 atau lebih 2
Kurang dari 70 30 70 atau lebih 0
3.2.2 Tabel Dua Arah (Two Way Table)
Tabel dua arah dikenal juga sebagai tabel kontingensi (cross
tabulation) digunakan untuk menyajikan data dari dua variabel
kualitatif. Setiap variabel bisa terdiri dari dua atau lebih kategori.
Jika hubungan kedua variabel ingin dikaji, maka disarankan variabel
independent menjadi kolom dan variabel dependen menjadi baris.
Contoh tabel dua arah dapat dilihat pada Tabel 3.6 berikut:

39
Darnah Andi Nohe

Tabel 3.6
Jumlah Responden Berdasarkan Status Fertilitas
dan Kebiasaan Merokok

Status Kebiasaan Merokok


Jumlah
Fertilitas Tidak Merokok Merokok
Subur 18 35 53
Tidak Subur 17 26 43
Jumlah 35 61 96

Tabel 3.6 menunjukkan bahwa terdapat 53 responden dengan status


fertilitas subur, 35 orang diantaranya merokok dan 18 orang yang
tidak merokok. Terdapat 43 responden dengan status fertilitas tidak
subur, 26 orang diantaranya merokok dan 17 orang yang tidak
merokok.
3.2.3 Tabel Tiga Arah (Three Way Table)

Tabel tiga arah merupakan tabel yang menunjukkan tiga


variabel, setiap variabel dapat terdiri dari dua atau lebih kategori.
Contoh tabel tiga arah dapat dilihat pada Tabel 3.7 berikut:

Tabel 3.7
Jumlah Pegawai Dinas Kesehatan Provinsi X Menurut Umur,
Pendidikan dan Golongan

Umur (tahun) Pendidikan


Golongan
25 – 35 > 35 Bukan Sarjana Sarjana
I 100 80 600 0
II 500 520 370 0
III 1.350 2.150 1.730 1.200
IV 10 220 0 150
Jumlah 1.860 2.970 2.700 1.350

40
Biostatistika 1

Tabel 3.7 menunjukkan bahwa dari 1.860 pegawai yang berumur 25


sampai 35 tahun, yang paling banyak adalah pegawai golongan III
yaitu sebanyak 1.350 orang dan yang paling sedikit adalah pegawai
golongan IV yaitu 10 orang. Sedangkan pegawai yang berumur
diatas 35 tahun ada sebanyak 2.970 orang, juga didominasi pegawai
golongan III yaitu sebanyak 2.150 orang dan yang paling sedikit
adalah pegawai golongan I yaitu 80 orang. Jika dilihat dari
pendidikan, pegawai bukan sarjana lebih banyak daripada pegawai
yang bukan sarjana.
3.3 Grafik
Grafik merupakan penyajian data untuk memberikan
gambaran tentang variabel kualitatif maupun kuantitatif. Dengan
menggunakan grafik, kita dapat dengan cepat melihat perkembangan
suatu data. Grafik yang akan kita bahas pada bagian ini adalah grafik
garis, lingkaran dan batang.
3.3.1 Grafik Garis (Line Chart)
Grafik garis merupakan grafik yang berbentuk garis lurus,
biasanya digunakan untuk menyajikan data kuantitatif yang
dikumpulkan selama kurun waktu/periode tertentu (data time series).
Sumbu X menunjukkan waktu pengamatan, sedangkan sumbu Y
menunjukkan nilai data pengamatan untuk suatu waktu tertentu.
Kumpulan waktu dan pengamatan membentuk titik-titik pada bidang
XY, selanjutnya titik-titik tersebut dihubungkan dengan garis lurus
sehingga akan diperoleh grafik garis.

41
Darnah Andi Nohe

Grafik garis terdiri dari grafik garis tunggal (single line chart)
dan grafik garis berganda (multiple line chart).
Grafik garis tunggal merupakan grafik yang terdiri dari satu garis
untuk menggambarkan perkembangan dari suatu variabel atau
karakteristik. Contoh grafik garis tunggal adalah sebagai berikut:

Gambar 3.1 Data Persentase Rumah Tangga yang Akses air


Minumnya Layak Menurut Susenas 2000-2011
Berdasarkan Gambar 3.1, dapat diketahui bahwa tahun 2010,
persentase rumah tangga yang akses air minumnya layak masih di
bawah 40% kemudian sedikit meningkat di tahun 2001, tahun 2002
sampai 2009 persentasenya tidak mengalami perubahan yang berarti,
namun kemudian persentasenya turun pada tahun 2010 dan 2011.
Grafik garis berganda merupakan grafik yang terdiri dari dua
atau lebih garis untuk menggambarkan beberapa hal atau kejadian.
Contoh grafik garis berganda dapat dilihat pada Gambar 3.2 berikut:

42
Biostatistika 1

Gambar 3.2 Data Jumlah Penduduk Miskin (ribuan) di Provonsi X


Tahun 2000-2011
Gambar 3.2 menunjukkan bahwa penduduk miskin di daerah
pedesaan lebih tinggi daripada daerah perkotaan. Pada tahun 2001
penduduk miskin di daerah perkotaan mengalami penurunan
dibanding tahun sebelumnya sedangkan penduduk miskin di daerah
pedesaan mengalami peningkatan dari tahun sebelumnya.
3.3.2 Grafik Lingkaran (Pie Chart)

Grafik lingkaran merupakan penyajian data dengan


menggunakan gambar yang berbentuk lingkaran, digunakan jika data
yang diperoleh adalah data kualitatif atau data kuantitatif yang
dikategorikan. Lingkaran dibagi menjadi beberapa bagian sesuai
dengan proporsi data, yang umumnya dinyatakan dalam persentase.
Grafik lingkaran lebih cocok untuk menyajikan data cross sectional,
dimana data tersebut dapat dijadikan bentuk presentase. Contoh
grafik lingkaran adalah:

43
Darnah Andi Nohe

Gambar 3.3 Status Gizi Balita Berdasarkan BB/TB di


Kalimantan Timur Tahun 2010
Gambar 3.3 menunjukkan bahwa mayoritas balita di
Kalimantan Timur tahun 2010 mempunyai status gizi normal yaitu
sebesar 77% dan balita yang sangat kurus dan kurus mempunyai
presentase yang hampir sama besarnya.
Grafik lingkaran juga dapat dibuat dalam bentuk lingkaran yang
terpisah-pisah agar lebih menarik ketika disajikan.

Gambar 3.4 Data Jumlah Pasien Rawat Inap Rumah Sakit X


pada bulan Januari 2013

44
Biostatistika 1

3.3.3 Grafik Batang (Bar Chart)


Grafik batang lebih cocok digunakan untuk menyajikan data
kualitatif atau data kuantitatif yang dikumpulkan secara berkala (data
time series) tetapi dalam jangka waktu (periode) yang pendek. Jika
jangka waktunya panjang, grafik garis lebih sesuai. Grafik batang
menunjukkan keterangan-keterangan dengan batang-batang tegak
atau mendatar dan sama lebar dengan batang-batang terpisah. Grafik
batang juga terdiri dari grafik batang tunggal dan grafik batang
ganda. Contoh grafik tunggal untuk data kualitatif adalah sebagai
berikut:

Gambar 3.5 Penilaian Responden terhadap Kualitas Pelayanan


Rumah Sakit X
Berdasarkan Gambar 3.5 dapat dilihat bahwa dari 300
responden, mayoritas pasien (150 orang) menilai bahwa kualitas
pelayanan Rumah Sakit X sudah baik dan hanya sebagian kecil
responden (14 orang) yang menilai kualitas pelayanan rumah sakit
sangat buruk.
Misalkan kita mempunyai data jenis kelamin responden yang
memberikan penilaian terhadap kualitas pelayanan Rumah Sakit X,

45
Darnah Andi Nohe

maka kita dapat menyajikannya dalam grafik batang ganda seperti


berikut:

Gambar 3.6 Penilaian Responden terhadap Kualitas Pelayanan


Rumah Sakit X berdasarkan Jenis Kelamin
Gambar 3.6 menunjukkan bahwa responden yang menilai
kualitas pelayanan Rumah Sakit X sudah baik lebih banyak yang
berjenis kelamin laki-laki dibanding perempuan, begitu pula yang
menilai kualitas pelayanan Rumah Sakit X sangat buruk juga lebih
banyak yang berjenis kelamin laki-laki.
Selain menggunakan tabel dan grafik yang dipaparkan di atas,
penyajian data juga dapat dilakukan dengan menggunakan
histogram, polygon dan ogif. Ketiga grafik tersebut didasarkan pada
tabel distribusi frekuensi agar lebih menarik dan informatif.
3.3.4 Histogram
Histogram merupakan penyajian data frekuensi dalam bentuk
balok. Tepi kelas sebagai sumbu horizontal (X) dan frekuensi setiap
kelas sebagai sumbu vertical (Y). Jika Tabel 3.3 kita sajikan dalam
bentuk histogram akan diperoleh gambar berikut:

46
Biostatistika 1

Gambar 3.7. Grafik Histogram Berat Badan 30 Responden


Berdasarkan Gambar 3.7 dapat diketahui bahwa jumlah
responden yang berat badannya pada kisaran 59,5 kg sampai 64,5 kg
hampir sama dengan jumlah responden yang berat badannya pada
kisaran 54,5 kg sampai 59,5 kg.
3.3.5 Poligon
Pada dasarnya, poligon hampir sama dengan histogram. Jika
pada histogram menggunakan tepi kelas sebagai sumbu horisontal,
pada poligon menggunakan nilai tengah kelas kemudian
menggunakan garis yang menghubungkan nilai tengah kelas dengan
frekuensi. Grafik poligon dari Tabel 3.3 adalah sebagai berikut:

Gambar 3.8 Grafik Poligon Berat Badan 30 Responden

47
Darnah Andi Nohe

3.3.6 Ogif
Kurva ogif digunakan untuk menggambarkan frekuensi
kumulatif dari setiap kategori. Sumbu horinzontal (X) pada kurva
Ogif menunjukkan tepi bawah kelas sedangkan sumbu vertikal (Y)
menunjukkan frekuensi kumulatif. Contoh kurva Ogif menggunakan
data pada Tabel 3.5 adalah sebagai berikut:

Gambar 3.9 Grafik Ogif Berat Badan 30 Responden

48
Biostatistika 1

BAB 4
UKURAN PEMUSATAN

4.1 Pengantar
Pada data kuantitatif, tidak semua data yang ada harus
disajikan. Untuk itu dibutuhkan suatu ukuran yang dapat mewakili
sekumpulan data yang kita peroleh dari sampel maupun populasi.
Ukuran yang dihitung dari kumpulan data sampel disebut statistik
sedangkan apabila diperoleh dari populasi disebut parameter. Salah
satu ukuran data yang dapat mewakili sekumpulan data adalah
ukuran pemusatan.
Selain ukuran pemusatan, ada juga yang disebut ukuran letak.
Ukuran letak merupakan ukuran yang menjelaskan atau
menunjukkan dimana letak sebagian data berada setelah data
diurutkan dari terkecil sampai terbesar.
4.2. Ukuran Pemusatan
Ukuran pemusatan yang paling umum digunakan adalah rata-
rata, median, dan modus. Yang paling penting diantaranya adalah
rata-rata, dan itu pula yang pertama akan dibahas.
4.2.1 Rata-rata
Rata-rata merupakan nilai yang diperoleh dengan
menjumlahkan semua nilai data kemudian membaginya dengan
jumlah data. Rata-rata terdiri dari rata-rata populasi, sampel,
tertimbang dan kelompok.

49
Darnah Andi Nohe

Misalkan nilai-nilai data kuantitatif dari sebuah populasi


berukuran N kita nyatakan sebagai: x1 , x 2 , x 3 ,K, x N , maka rata-rata
populasi adalah:
N

∑x i
x1 + x 2 + x 3 + K + x N
μ= i =1
=
N N
Contoh 4.1
Misalkan diketahui banyaknya pegawai di enam puskesmas adalah
12, 7, 10, 8, 9 dan 8. Dengan memandang data itu sebagai populasi,
maka rata-rata banyaknya pegawai bagi enam puskesmas adalah:
6

∑x x1 + x 2 + x 3 + x 4 + x 5 + x 6
i
μ= i =1
=
6 6
12 + 7 + 10 + 8 + 9 + 8
= = 9 orang.
6
Cara perhitungan rata-rata sampel pada dasarnya hampir sama
dengan rata-rata populasi. Misalkan nilai-nilai data kuantitatif sampel
yang berukuran n kita nyatakan sebagai: x1 , x 2 , x 3 ,K, x n , maka
rata-rata sampel adalah:
n

∑x i
x1 + x 2 + x 3 + K + x n
x= i =1
=
n n
Contoh 4.2
Misalkan diperoleh nilai kadar nikotin yang dikandung lima batang
rokok Surya yang dijadikan sebagai sampel adalah 20,1 mg ; 18 mg;

50
Biostatistika 1

21,2 mg; 20 mg dan 22 mg, maka rata-rata kadar nikotin lima batang
rokok adalah :
5

∑x x1 + x 2 + x 3 + x 4 + x 5
i
x= i =1
=
5 5
20,1 + 18 + 21,2 + 20 + 22
= = 20,26 mg.
5
Pada perhitungan rata-rata populasi dan sampel, setiap data
dianggap mempunyai tingkat atau bobot yang sama. Jika data
mempunyai bobot yang berbeda maka digunakan rata-rata tertimbang
dengan menggunakan rumus berikut:
n

∑ (w x ) i i
w1x1 + w 2 x 2 + w 3 x 3 + K + w n x n
x= i =1
=
n
w1 + w 2 + w 3 + K + w n
∑w
i =1
i

Contoh 4.3
Misalkan pada Contoh 4.2, diketahui bahwa ada 4 batang rokok yang
mempunyai kadar nikotin 20,1 mg ; 6 batang dengan kadar nikotin
18 mg; 5 batang dengan kadar nikotin 21,2 mg; 8 batang dengan
kadar nikotin 20 mg dan 10 batang dengan kadar nikotin 22 mg,
maka rata-rata tertimbang data tersebut adalah:

51
Darnah Andi Nohe

∑ (w x ) i i
w 1x1 + w 2 x 2 + w 3 x 3 + w 4 x 4 + w 5 x 5
x= i =1
=
5
w1 + w 2 + w 3 + w 4 + w 5
∑w
i =1
i

4(20,1) + 6(18) + 5(21,2) + 8(20) + 10(22)


=
4 + 6 + 5 + 8 + 10
= 20,42 mg

Untuk lebih memudahkan, akan lebih baik jika data dituliskan dalam
tabel berikut:
wi xi wixi
4 20,1 80,4
6 18 108
5 21,2 106
8 20 160
10 22 220

Sehingga diperoleh hasil yang sama yaitu:


5

∑ (w x ) i i
674
x= i =1
5
= = 20,42 mg.
33
∑w
i =1
i

Rata-rata yang kita bahas sebelumnya merupakan rata-rata


untuk data tunggal, selanjutnya akan dibahas tentang rata-rata untuk
data berkelompok yaitu data yang sudah dikelompokkan dalam tabel
distribusi frekuensi. Rumus yang digunakan adalah sebagai berikut:

52
Biostatistika 1

∑f xi =1
i i
x= k

∑f
i =1
i

Dimana:
f i : frekuensi kelas ke-i
x i : nilai tengah kelas ke-i
k : banyak kelas

Contoh 4.4
Misalkan kita tertarik untuk menghitung rata-rata berat badan
responden pada Contoh 3.4, maka untuk mempermudah perhitungan
dibuat tabel berikut:

BeratBadan (Kg) Frekuensi ( f i ) xi fi x i


40 - 44 4 42 168
45 - 49 5 47 235
50 - 54 4 52 208
55 - 59 7 57 399
60 - 64 8 62 496
65 - 69 2 67 134
Jumlah 30 1.640

Sehingga diperoleh rata-rata berat badan 30 responden sebagai


berikut:
k

∑f x i i
1.640
x= i =1
k
= = 54,7 kg
30
∑f
i =1
i

53
Darnah Andi Nohe

Sebelum kita melanjutkan bahasan kita tentang ukuran


pemusatan lainnya, sebaiknya kita mengetahui terlebih dahulu sifat
rata-rata berikut:
a. Hanya data kuantitatif (interval dan rasio) yang mempunyai
rata-rata.
b. Dalam menentukan rata-rata, semua nilai data dimasukkan
dalam perhitungan.
c. Setiap kelompok data dari populasi ataupun sampel hanya
mempunyai satu nilai rata-rata.
d. Rata-rata sangat dipengaruhi oleh nilai ekstrim yaitu nilai yang
sangat kecil atau sangat besar.
e. Rata-rata terletak ditengah data.
f. Bagi data yang sifatnya terbuka (lebih dari/kurang dari) tidak
mempunyai rata-rata.
4.2.2 Median
Ukuran pemusatan yang dibahas pada sub bab ini adalah
median. Median merupakan nilai tengah dari sekelompok data yang
telah diurutkan dari nilai terkecil sampai nilai terbesar atau terbesar
sampai terkecil.
Median untuk data tunggal setelah data diurutkan tepat berada
ditengah-tengah jika jumlah data ganjil atau rata-rata kedua data
yang ditengah jika jumlah data genap. Letak median dapat ditentukan
(n + 1)
dengan menggunakan rumus .
2

Contoh 4.5
Misalkan diketahui data lama rawat inap tujuh pasien di suatu rumah
sakit adalah 6 hari, 10 hari, 7 hari, 9 hari, 8 hari, 3 hari dan 7 hari.

54
Biostatistika 1

Setelah data diurutkan dari terkecil sampai terbesar diperoleh: 3, 6, 7,


7, 8, 9, 10. Letak median dapat ditentukan dengan rumus:
(7 + 1)
=4.
2
Jadi median terletak pada data ke-4 yaitu 7.
Contoh 4.6
Misalkan data denyut nadi enam penduduk dewasa adalah 80, 75, 77,
78, 73 dan 74. Setelah diurutkan dari nilai terkecil sampai terbesar
diperoleh: 73, 74, 75, 77, 78 , 80.
Letak median adalah:
(6 + 1)
= 3,5
2
atau terletak antara data ke-3 dan ke-4 sehingga median data tersebut
adalah:
(75 + 77)
= 76 .
2
Untuk menentukan median data berkelompok atau data yang
telah disusun dalam tabel distribusi frekuensi terlebih dahulu letak
n
median ditentukan, yaitu dimana n adalah banyaknya data,
2
kemudian median ditentukan dengan menggunakan rumus berikut:
n
−F
Me = L + 2 p
f
Dimana:
L : nilai tepi bawah kelas dimana median berada
n : banyaknya data
F : frekuensi kumulatif sebelum kelas median berada
f : frekuensi kelas median
p : panjang interval kelas

55
Darnah Andi Nohe

Contoh 4.7
Misalkan pada Contoh 3.4 akan ditentukan median data berat badan
30 responden, langkah pertama yang dilakukan adalah menentukan
letak media yaitu:
n 30
= = 15.
2 2
Jadi data terletak pada data ke 15 atau berada pada kelas 4 dengan
interval 55 – 59. Selanjutnya data pada Contoh 3.4 disajikan kembali
pada tabel berikut:

Berat Badan (Kg) f f kum Tepi Bawah Kelas


40 - 44 4 0 39,5
45 - 49 5 9 44,5
50 - 54 4 13 49,5
55 - 59 7 20 54,5
60 - 64 8 28 59,5
65 - 69 2 30 64,5

Dimana:
L : 54,5 yaitu tepi bawah kelas median berada
n : 30 yaitu banyaknya data
F : 13 yaitu frekuensi kumulatif sebelum kelas median
f : 7 yaitu frekuensi kelas median berada
p : 5 yaitu panjang interval kelas median
Sehingga diperoleh median data berat badan 30 responden sebagai
berikut:
30
− 13
Me = 54,5 + 2 5 = 55,9 kg.
7

56
Biostatistika 1

Seperti halnya rata-rata, sifat-sifat median juga perlu diketahui


yaitu:
a. Untuk sekelompok data hanya mempunyai satu median.
b. Data harus diurutkan terlebih dahulu dari data yang terkecil
sampai yang terbesar atau sebaliknya, dari terbesar sampai
terkecil.
c. Median tidak dipengaruhi oleh nilai ekstrim.
d. Median dapat ditentukan pada data dengan skala pengukuran
ordinal, interval dan rasio.

4.2.3 Modus
Ukuran pemusatan yang terakhir kita bahas adalah modus.
Modus adalah nilai yang paling sering terjadi atau nilai yang
mempunyai frekuensi paling tinggi. Modus tidak selalu ada, hal ini
terjadi jika semua data mempunyai frekuensi terjadi yang sama. Pada
data tertentu, bisa terdapat beberapa nilai dengan frekuensi tertinggi.
Satu kelompok data yang mempunyai satu modus disebut uni modus.
Jika mempunyai dua modus disebut bimodus dan apabila mempunyai
tiga atau lebih modus disebut multi modus.
Pada data tunggal, modus adalah nilai yang paling sering
terjadi atau mempunyai frekuensi paling tinggi. Sedangkan untuk
data berkelompok atau dalam tabel distribusi frekuensi, modus
ditentukan dengan menggunakan rumus berikut:

d1
Mo = L + p
d1 + d 2

Dimana:
L : nilai tepi bawah kelas dimana modus berada

57
Darnah Andi Nohe

d1 : selisih frekuensi kelas modus dengan kelas sebelumnya


d 2 : selisih frekuensi kelas modus dengan kelas sesudahnya
p : panjang interval kelas
Contoh 4.8
Misalkan masih berdasarkan Contoh 4.4 tetapi kita tertarik untuk
menentukan modus data berat badan 30 responden. Untuk
mempermudah perhitungan, disajikan kembali menjadi tabel berikut:

Berat Badan (Kg) f Tepi Bawah Kelas


40 - 44 4 39,5
45 - 49 5 44,5
50 - 54 4 49,5
55 - 59 7 54,5
60 - 64 8 59,5
65 - 69 2 64,5

Modus terletak pada kelas dengan frekuensi paling tinggi yaitu 8


yang terletak di kelas lima pada interval 60 – 64. Sehingga diperoleh
nilai-nilai berikut:
L : 59,5 yaitu nilai tepi bawah kelas lima
d1 : 8-7=1 yaitu selisih frekuensi kelas lima dengan empat
d 2 : 8-2=6 yaitu selisih frekuensi kelas lima dengan enam
p : 5 yaitu panjang interval kelas
Sehingga nilai modus data berat badan 30 responden adalah:
1
Mo = 59,5 + 5 = 60,2 kg
1+ 6

58
Biostatistika 1

4.2.4 Penggunaan dan Hubungan Rata-rata, Median dan Modus


Telah dibahas tiga ukuran pemusatan, yaitu rata-rata, median
dan modus. Berdasarkan ketiga ukuran pemusatan tersebut, kita
dapat mengetahui jenis kurva dari data yang ada, yaitu:
1. Kurva normal atau simetris jika rata-rata, median dan modus
data mempunyai nilai yang sama. Pada kurva normal, luas sisi
kiri dan sisi kanannya sama sehingga kalau dilipat ditengahnya
maka akan ada dua bagian yang sama. Kurva normal tidak
menjulur ke kanan maupun ke kiri seperti pada Gambar 4.1
berikut:

x = Me = Mo
Gambar 4.1. Kurva normal

2. Kurva menjulur ke kiri atau menjulur negatif jika nilai rata-rata


lebih kecil dari nilai median dan modus. Hal ini disebabkan
adanya nilai ekstrim yang rendah sedangkan nilai data lainnya
relative tinggi. Kurva menjulur ke kiri dapat dilihat pada
gambarberikut:

x < Me < Mo
Gambar 4.2 Kurva Menjulur ke Kiri

59
Darnah Andi Nohe

3. Kurva menjulur ke kanan atau menjulur positif jika nilai rata-


rata lebih besar dari nilai median dan modus. Dengan kata lain,
kurva menjulur ke kanan merupakan ke balikan dari kurva
menjulur ke kiri. Nilai ekstrim yang tinggi sedang kannilai data
lainnya relative rendah menjadi penyebab terbentuknya kurva
ini sehingga dapat digambarkan sebagai berikut:

x > Me > Mo
Gambar 4.3 Kurva Menjulur ke Kanan
Selanjutnya dapat disimpulkan penggunaan nilai rata-rata, median
dan modus sebagai suatu ukuran pemusatan yang dapat mewakili
sekumpulan data sebagai berikut:
1. Jika rata-rata, median dan modus mempunyai nilai yang sama
atau hampir sama maka ketiga ukuran tersebut baik untuk
digunakan.
2. Jika data mempunyai nilai ekstrim (tinggi atau rendah) maka
lebih baik menggunakan nilai median atau modus.
Pada kurva normal seperti pada Gambar 4.1, hubungan antara
rata-rata, median dan modus adalah sebagai berikut:

(3Median − Modus)
1. Rata - rata =
2
(2Rata - rata + Modus)
2. Median =
3
3. Modus = Rata-rata – 3(Rata-rata − Median)

60
Biostatistika 1

4.3 Ukuran Letak


Dalam sub bab 4.2 telah dibahas tentang ukuran pemusatan
data yaitu rata-rata, median dan modus, begitupula penggunaan dan
hubungan diantara ketiganya. Ukuran yang akan kita bahas pada
bagian ini adalah ukuran letak. Ukuran letak terdiri dari kuartil, desil
dan presentil.
4.3.1 Kuartil
Kuartil adalah nilai-nilai yang membagi suatu kelompok data
menjadi empat bagian yang sama besar, yaitu sebesar 25%. Oleh
karena itu ada tiga kuartil, yaitu kuartil pertama dilambangkan
dengan K 1 , artinya 25% data berada dibawah K 1 . Kuartil kedua
dilambangkan dengan K 2 , artinya 50% data berada dibawah K 2 .
Kuartil ketiga dilambangkan dengan K 3 , artinya 75% data berada
dibawah K 3 .

Untuk data tunggal, nilai kuartil dapat ditentukan dengan cara:


1. Data diurutkan dari nilai terkecil sampai terbesar.
2. Menentukan letak kuartil.
3. Menentukan nilai-nilai kuartil.
Letak kuartil dapat ditentukan dengan rumus berikut:

i(n + 1)
Ki = ,
4
dimana i = 1, 2, 3 dan n adalah banyaknya data.
Contoh 4.9
Misalkan diketahui jumlah penderita 11 penyakit di Provinsi X pada
tahun 2012 adalah sebagai berikut:

61
Darnah Andi Nohe

110; 67; 55; 80; 200; 89; 75; 44; 20; 92; 31
Untuk menentukan nilai-nilai kuartil, data diurutkan menjadi:
20; 31; 44; 55; 67; 75; 80; 89; 92; 110; 200
Kemudian menentukan letak kuartil, yaitu:
1(11 + 1)
K1 = = 3 , berarti K 1 terletak pada data ke-3.
4
2(11 + 1)
K2 = = 6 ,berarti K 2 terletak pada data ke-6.
4
3(11 + 1)
K3 = = 9 , berarti K 3 terletak pada data ke-9.
4
Setelah diketahui letak kuartil, maka dapat diketahui bahwa nilai K 1
adalah nilai data ke-3 yaitu 44 dan nilai K 2 adalah nilai data ke-6
yaitu 75. Nilai K 3 adalah nilai data ke-9 yaitu 92, hal ini berarti
bahwa ada 75% penyakit dengan jumlah penderita kurang dari 92
orang, dan 25% penyakit dengan jumlah penderita di atas 92 orang.
Contoh 4.10
Misalkan diketahui tinggi badan (cm) dari 10 sampel sebagai berikut:
145; 150; 157; 160; 163; 165; 165; 168; 170; 173
Data tersebut telah diurutkan sehingga kita dapat menentukan letak
kuartilnya, yaitu:

1(10 + 1)
K1 = = 2,75
4
2(10 + 1)
K2 = = 5,5
4
3(10 + 1)
K3 = = 8,25
4

62
Biostatistika 1

Letak kuartil pada jumlah data genap selalu berupa desimal, sehingga
tidak ada nilai yang sesuai dengan letak tersebut. Oleh karena itu
dibutuhkan rumus untuk menghitung nilai-nilai kuartil, yaitu:

Nk i = Nb i + [(Lk i − Lkb i )(Na i - Nb i )]

Dimana:
i = 1, 2, 3
Nk i : Nilai kuartil ke-i
Nkb i : Nilai data yang berada sebelum letak kuartil ke-i
Lk i : Letak kuartil ke-i
Lkbi : Letak kuartil yang berada sebelum letak kuartil ke-i
Nka i : Nilai data yang berada setelah letak kuartil ke-i

Sehingga nilai K 1 dengan letak kuartil 2,75 adalah:


Nk 1 = Nb1 + [(Lk1 − Lkb1 )(Na 1 - Nb1 )]
= 150 + [(2,75 − 2)(157 - 150) ]
= 150 + [(0,75)(7)]
= 155,25
Nilai K 2 dengan letak kuartil 5,5 adalah:
Nk 2 = Nb 2 + [(Lk 2 − Lkb 2 )(Na 2 - Nb 2 )]
= 163 + [(5,5 − 5)(165 - 163)]
=163 + [(0,5)(2)]
= 164
Nilai K 3 dengan letak kuartil 8,25 adalah:
Nk 3 = Nb 3 + [(Lk 3 − Lkb3 )(Na 3 - Nb 3 )]

63
Darnah Andi Nohe

= 168 + [(8,25 − 8)(170 - 168)]


=168 + [(0,25)(2)]
= 168,5
Dapat diinterpretasikan bahwa nilai K 1 adalah 155,2 cm artinya ada
sebanyak 25% sampel yang mempunyai tinggi badan di bawah 155,2
cm. Nilai K 2 adalah 164 cm artinya, ada sebanyak 50% sampel yang
mempunyai tinggi badan di bawah 164 cm. Nilai K 3 adalah 168,5
cm artinya ada sebanyak 75% sampel dengan tinggi badan di bawah
168,5 cm dan sisanya sebesar 25% sampel mempunyai tinggi badan
di atas 168,5 cm.
Pada data yang telah dikelompokkan dalam tabel distribusi
frekuensi, nilai-nilai kuartil dapat ditentukan dengan terlebih dahulu
menentukan letak kuartil dengan menggunakan rumus berikut:

in
Ki = ; i = 1, 2, 3 dan n = banyaknya data.
4
Selanjutnya menghitung nilai-nilai kuartil dengan rumus:

in
−F
Ki = L + 4 p;
f
Dimana:
i : 1, 2, 3
L : nilai tepi bawah kelas dimana K i berada
n : banyaknya data
F : frekuensi kumulatif sebelum kelas K i berada
f : frekuensi kelas K i
p : panjang interval kelas K i

64
Biostatistika 1

Contoh 4.11
Misalkan diketahui table distribusi frekuensi jumlah kunjungan
berdasarkan umur di Poli Gigi suatu Puskesmas pada bulan Januari
2013 adalah sebagai berikut:

Umur (tahun) Frekuensi (f)


6 – 10 14
11 – 15 18
16 – 20 22
21 – 25 10
26 – 30 28
31 – 35 8
Jumlah 100

Untuk menentukan nilai-nilai kuartil data berkelompok tersebut,


terlebih dahulu ditentukan letak kuartil, yaitu:

1(100) 2(100) 3(100)


K1 = = 25 , K 2 = = 50 , K 3 = = 75
4 4 4

K1 terletak pada data ke-25 atau berada di kelas dua, sehingga


diperoleh:

(25 − 14) 55
K1 = 10,5 + 5 = 10,5 +
18 18
= 11,5
K 2 terletak pada data ke-50 atau berada di kelas tiga, maka nilai K 2
adalah:
(50 − 32) 90
K 2 = 15,5 + 5 = 15,5 +
22 22
= 19,6

65
Darnah Andi Nohe

Dan K 3 terletak pada data ke-75 atau berada di kelas tiga, sehingga
nilai K 3 adalah:
(75 − 64) 55
K 3 = 25,5 + 5 = 25,5 +
28 28
= 27,5
Nilai K 3 =27,5 artinya bahwa ada 75% pengunjung Poli Gigi yang
berumur di bawah 27,5 tahun.
4.3.2 Desil
Desil adalah ukuran letak yang membagi data menjadi sepuluh
bagian yang sama besar yaitu sebesar 10%, sehingga diperoleh
sembilan nilai desil yaitu desil pertama dilambangkan dengan D1 ,
desil kedua dilambangkan dengan D 2 dan seterusnya sampai desil
kesembilan. Untuk menentukan nilai-nilai desil, dilakukan cara yang
sama seperti ketika menentukan nilai-nilai kuartil, yaitu:
1. Data diurutkan dari nilai terkecil sampai terbesar.
2. Menentukan letak desil.
3. Menentukan nilai-nilai desil.
Letak desil untuk data tunggal dapat ditentukan dengan rumus
berikut:

i(n + 1)
Di = ,
10
dimana i = 1, 2, ..., 9 dan n adalah banyaknya data.
Contoh 4.11
Misalkan berdasarkan Contoh 4.9, kita ingin mengetahui berapa
jumlah penderita yang termasuk dalam 10% penyakit dengan jumlah

66
Biostatistika 1

penderita tertinggi, maka terlebih dahulu kita menentukan letak


desilnya. Desil yang menyatakan 10% penyakit dengan jumlah
penderita tertinggi adalah D 9 , letaknya adalah:

9(11 + 1)
D9 = = 10,8
10
Seperti halnya kuartil, apabila letak desil yang diperoleh adalah
desimal, maka nilai desil dapat ditentukan dengan rumus berikut:

Nd i = Ndb i + [(Ld i − Ldbi )(Nda i - Ndb i )]

Dimana:
i = 1, 2, ..., 9
Nd i : Nilai desil ke-i
Ndb i : Nilai data yang berada sebelum letak desil ke-i
Ld i : Letak desil ke-i
Ldbi : Letak desil yang berada sebelum letak desil ke-i
Nda i : Nilai data yang berada setelah letak desil ke-i

Sehingga nilai desil ke-9 adalah:


Nd 9 = Ndb 9 + [(Ld 9 − Ldb9 )(Nda 9 - Ndb 9 )]
= 110 + [(10,8 − 10)(200 − 110)]
= 110 + [(0,8)(90)]
= 182
Jadi penyakit dengan jumlah penderita di atas 182 orang termasuk
10% penyakit dengan jumlah penderita tertinggi.
Untuk data berkelompok, letak desil dapat ditentukan dengan
rumus berikut:

67
Darnah Andi Nohe

in
Di = ; i = 1, 2, ..., 9 dan n = banyaknya data.
10
Kemudian nilai-nilai desil dapat dihitung dengan rumus:

in
−F
Di = L + 4 p;
f
Dimana:
i : 1, 2, ..., 9
L : nilai tepi bawah kelas dimana D i berada
n : banyaknya data
F : frekuensi kumulatif sebelum kelas D i berada
f = frekuensi kelas D i
p = panjang interval kelas D i

Contoh 4.12
Misalkan berdasarkan Contoh 4.10, kita tertarik untuk mengetahui
10% pengunjung Poli Gigi dengan umur terendah, desil yang dapat
menunjukkan hal tersebut adalah D1 . Letak D1 adalah:

1(n) 100
D1 = = = 10 ,
10 10

Berarti D1 terletak pada data ke-10, yang berada pada kelas pertama.
Sehingga nilai D1 adalah:

68
Biostatistika 1

(10 − 0)
D1 = 5,5 + 5
14
= 5,5 + 3,6
= 9,1
Jadi pengunjung Poli Gigi yang berumur dibawah 9,1 tahun termasuk
dalam 10% pengunjung dengan umur terendah.

4.3.3 Persentil
Persentil adalah ukuran letak yang membagi data menjadi
seratus bagian yang sama besar yaitu sebesar 1%, karena itu persentil
sering disebut ukuran perseratusan. Jadi diperoleh 99 nilai persentil
yaitu persentil pertama dilambangkan dengan P1 , persentil kedua
dilambangkan dengan P2 dan seterusnya sampai persentil ke-99.
Untuk menentukan nilai-nilai persentil, dilakukan cara perhitungan
yang sama dengan desil.
Letak persentil untuk data tunggal dapat ditentukan dengan rumus
berikut:

i(n + 1)
Pi = ,
100
dimana i = 1, 2, ..., 99 dan n adalah banyaknya data.
Contoh 4.11
Misalkan berdasarkan Contoh 4.9, kita ingin mengetahui berapa
jumlah penderita yang termasuk dalam 15% penyakit dengan jumlah
penderita terendah, maka terlebih dahulu kita menentukan letak
persentilnya. Persentil yang menyatakan 15% penyakit dengan
jumlah penderita terendah adalah P15 , letaknya adalah:

69
Darnah Andi Nohe

15(11 + 1)
P15 = = 1,8
100
Seperti halnya kuartil dan desil, apabila letak persentil yang
diperoleh adalah desimal, maka nilai persentil dapat ditentukan
dengan rumus berikut:

Np i = Npb i + [(Lpi − Lpbi )(Npa i - Npb i )]

Dimana:
i : 1, 2, ..., 99
Np i : Nilai persentil ke-i
Npb i : Nilai data yang berada sebelum letak persentil ke-i
Lpi : Letak persentil ke-i
Lpbi : Letak persentil yang berada sebelum letak persentil ke-i
Npa i : Nilai data yang berada setelah letak persentil ke-i

Sehingga nilai P15 adalah:


Np15 = Npb15 + [(Lp15 − Lpb15 )(Npa15 - Npb15 )]
= 20 + [(1,8 − 1)(31 − 20)]
= 20 + [(0,8)(11)]
= 28,8 ≈ 30
Jadi penyakit dengan jumlah penderita kurang dari 30 orang
termasuk 15% penyakit dengan jumlah penderita terendah.
Pada data berkelompok, letak persentil dapat ditentukan
dengan rumus berikut:

in
Pi = ; i = 1, 2, ..., 99 dan n = banyaknya data.
100
Dan nilai-nilai persentil dapat dihitung dengan rumus:

70
Biostatistika 1

in
−F
Pi = L + 100 p;
f
Dimana:
i : 1, 2, ..., 99
L : nilai tepi bawah kelas dimana Pi berada
n : banyaknya data
F : frekuensi kumulatif sebelum kelas Pi berada
f : frekuensi kelas Pi
p : panjang interval kelas Pi

Contoh 4.12
Misalkan kembali ke Contoh 4.10, kita tertarik untuk mengetahui
35% pengunjung Poli Gigi dengan umur tertinggi, persentil yang
dapat menunjukkan hal tersebut adalah P65 yang diperoleh dari (100-
35)%=65%. Letak P65 adalah:

65(100) 6500
P65 = = = 65 ,
100 100

Berarti P65 terletak pada data ke-35, yang berada pada kelas pertama.
Sehingga nilai P65 adalah:
(65 − 64)
P65 = 25,5 + 5
28
= 25,5 + 0,2
= 25,7
Jadi pengunjung Poli Gigi yang berumur di atas 25,7 tahun termasuk
dalam 35% pengunjung dengan umur tertinggi.

71
Darnah Andi Nohe

BAB 5
UKURAN PENYEBARAN

5.1 Pengantar
Selain ukuran pemusatan dan ukuran letak, ada juga ukuran
lain yaitu ukuran penyebaran atau dikenal juga sebagai ukuran
simpangan atau ukuran dispersi dan seringkali juga disebut sebagai
ukuran variasi. Pada buku ini akan menggunakan istilah ukuran
penyebaran. Ukuran penyebaran merupakan ukuran untuk
menggambarkan seberapa besar penyimpangan data dari nilai rata-
ratanya. Ukuran penyebaran yang akan dibahas pada bab ini adalah
rentang, simpangan baku dan varians.
5.2 Ukuran Penyebaran
Pada Bab 4 dibahas tiga ukuran pemusatan tetapi belum
memberikan deskripsi yang cukup bagi kita karena belum
mengetahui seberapa besar penyimpangan data kita dari nilai rata-
ratanya. Dua kumpulan data yang mempunyai nilai rata-rata hitung
dan median yang sama, bisa jadi mempunyai keragaman yang
berbeda.
Contoh 5.1
Misalkan pada label dua obat penurun panas untuk anak-anak merk
A dan B tercantum isi botol 60 ml, untuk itu diambil sampel masing-
masing 5 botol kemudian diukur isinya dalam ml dan diperoleh hasil
berikut:
Merk A : 58 60 59 62 61
Merk B : 66 61 48 51 74

72
Biostatistika 1

Hasil perhitungan rata-rata isi botol merk A dan B akan memperoleh


nilai yang sama yaitu 60 ml. Tetapi sangat jelas bahwa merk A
mempunyai isi botol yang lebih seragam daripada merk B. Sehingga
kita lebih percaya bahwa isi botol merk A mendekati nilai yang
tercantum pada labelnya.
Berdasarkan Contoh 5.1, kita dapat memahami pentingnya
ukuran penyebaran. Ukuran penyebaran yang akan dibahas adalah
rentang, varians dan standar deviasi.
5.2.1 Rentang
Rentang atau biasa juga disebut jarak atau jangkauan atau
range merupakan ukuran penyebaran yang paling sederhana.
Rentang dari sekumpulan data sampel ataupun populasi merupakan
selisih antara nilai terbesar (maximum) dengan nilai terkecil
(minimum) dari kumpulan data tersebut.
Rentang = Nilai Terbesar – Nilai Terkecil
Semakin kecil nilai rentang maka semakin baik karena menunjukkan
bahwa data mendekati nilai rata-rata hitung dan lebih seragam.
Contoh 5.2
Misalkan kita tertarik menghitung rentang data isi botol merk A dan
merk B pada Contoh 5.1, diperoleh:
Rentang isi botol merk A = 62 – 58 = 4
Rentang isi botol merk B = 74 – 48 = 26
Rentang isi botol merk B lebih tinggi daripada merk A, hal ini
menunjukkan bahwa data isi botol merk B lebih menyebar daripada
merk A.

73
Darnah Andi Nohe

Walaupun perhitungannya sangat sederhana, rentang memiliki


kekurangan, utamanya untuk jumlah data sampel atau populasi yang
lebih besar. Rentang hanya menggunakan dua nilai ekstrim tanpa
mempertimbangkan penyebaran data yang terdapat diantara kedua
nilai tersebut.
5.2.2 Varians
Varians dikembangkan untuk mengatasi kekurangan yang ada
pada rentang dengan menunjukkan simpangan setiap data terhadap
nilai rata-rata hitungnya.
a. Varians populasi
Varians populasi merupakan varians data yang dihitung dari
data populasi, dirumuskan sebagai berikut:

1 N
σ2 = ∑ (x i − μ) 2
N i =1

Dimana:
σ 2 : varians populasi
N : banyaknya data populasi
x i : nilai data ke-i
μ : nilai rata-rata populasi

Contoh 5.3
Misalkan diketahui hasil pemeriksaan kadar Hb (g/dL) enam orang di
Puskesmas A adalah: 13; 11; 12; 10; 13; dan 13. Jika ke enam orang
tersebut dianggap sebagai populasi maka untuk menentukan varians
populasi terlebih dahulu dihitung rata-rata populasi, yaitu:

13 + 11 + 12 + 10 + 13 + 13 72
μ= = = 12
6 6

74
Biostatistika 1

Kemudian diperoleh:
1 6
σ 2 = ∑ (x i − μ) 2
6 i =1
=
1
6
[
(13 − 12) 2 + (11 − 12) 2 + (12 − 12) 2 + (10 − 12) 2 + (13 − 12) 2 + (13 − 12) 2 ]
=
6
[
1 2
1 + (−1) 2 + 02 + (−2) 2 + 12 + 12 ]
8
== 1,33
6
Misalkan diketahui pula hasil pemeriksaan kadar Hb (g/dL) enam
orang di Puskesmas B adalah 11,2; 10,8; 12; 11; 12,6; dan 10,4.
Dengan cara perhitungan yang sama diperoleh:
μ = 11,3 dan σ 2 = 0,56
Nilai varians atau sebaran kadar Hb di Puskesmas B lebih kecil
dibandingkan Puskesmas A. Hal ini menunjukkan bahwa kadar Hb di
Puskesmas B mengelompok disekitar rata-ratanya dibandingkan
dengan Puskesmas A.
b. Varians Sampel
Apabila kita menggunakan data sampel untuk menghitung
varians, akan disebut sebagai varians sampel. Varians sampel
merupakan penduga (estimator) bagi varians populasi.
Pada dasarnya, rumus varians sampel tidak berbeda jauh
dengan varians populasi. Hanya saja, selain mengganti parameter
menjadi statistik, dilakukan koreksi dengan mengganti n dengan n-1
pada pembaginya, hal ini dilakukan agar varians sampel
menghasilkan dugaan (estimate) yang tidak bias atau menyimpang
dari populasi. Apabila digunakan n, akan menghasilkan dugaan yang
lebih rendah (under estimate) terhadap varians populasinya. Rumus
varians sampel dapat dituliskan sebagai berikut:

75
Darnah Andi Nohe

1 n
s2 = ∑
n - 1 i =1
(x i − x) 2

Dimana:
n : banyaknya data sampel
x i : nilai data ke-i
x : nilai rata-rata hitung sampel
Contoh 5.4
Misalkan dipilih secara acak (random) 5 bayi dari ibu yang baru
melahirkan di suatu rumah sakit bersalin dan diperoleh berat badan
(kg) mereka sebagai berikut:
4 3,7 3 2,8 3,5
Rata-rata sampel adalah:
4 + 3,7 + 3 + 2,8 + 3,5 17
x= = = 3,4
5 5
Sehingga varians sampel adalah:
1 5
s2 = ∑
5 - 1 i =1
(x i − x) 2

=
1
4
[
(4 − 3,4) 2 + (3,7 − 3,4) 2 + (3 − 3,4) 2 + (2,8 − 3,4) 2 + (3,5 − 3,4) 2 ]
1
[
= (0,6) 2 + (0,3) 2 + (−0,4) 2 + (−0,6) 2 + (0,1) 2
4
]
0,98
= = 0,245
4
Jadi data berat badan bayi menyimpang sebesar 0,245 dari rata-
ratanya.
5.2.3 Standar Deviasi (Simpangan Baku)
Seperti halnya dengan rentang, varians sebagai ukuran
penyebaran juga mempunyai kekurangan. Nilai varians dalam bentuk

76
Biostatistika 1

kuadrat, misalnya dalam Contoh 5.4 “kg kuadrat” sehingga


menyulitkan dalam interpretasi. Untuk memperoleh satuan yang
sama dengan satuan awal maka digunakan standar deviasi yang
merupakan akar dari varians.
a. Standar deviasi populasi
Standar deviasi populasi merupakan akar dari varians populasi
sehingga dapat dituliskan sebagai berikut:

1 N
σ= ∑
N i =1
(x i − μ) 2

Dimana:
σ : standar deviasi populasi
N : banyaknya data populasi
x i : nilai data ke-i
μ : nilai rata-rata populasi

Contoh 5.5
Berdasarkan Contoh 5.3, diketahui varians populasi di Puskesmas A
adalah:
1 6
σ 2 = ∑ (x i − μ)2 = 1,33
6 i =1
maka standar deviasi populasinya adalah:
1 6
σ= ∑
6 i =1
(x i − μ) 2 = 1,33 = 1,15

Dan diketahui varians populasi di Puskesmas B adalah σ 2 = 0,56


sehingga standar deviasinya adalah σ = 0,56 =0,75.

77
Darnah Andi Nohe

Dari perhitungan varians populasi maupun standar deviasi populasi,


diperoleh kesimpulan yang sama yaitu penyebaran kadar Hb populasi
di Puskesmas B lebih kecil dibandingkan dengan Puskesmas A.
b. Standar Deviasi Sampel

Seperti halnya varian sampel ( s 2 ) yang merupakan penduga


(estimator) bagi varian populasi ( σ 2 ), standar deviasi sampel (s)
merupakan estimator bagi standar deviasi populasi ( σ ) dan
dirumuskan sebagai berikut:

1 n
s= ∑
n - 1 i =1
(x i − x) 2

Dimana:
s : standar deviasi sampel
n : banyaknya data sampel
x i : nilai data ke-i
x : nilai rata-rata sampel
Contoh 5.6
Berdasarkan Contoh 5.4 diketahui varians sampel adalah:

1 5
s2 = ∑ (x i − x) 2 = 0,245
5 - 1 i =1

Sehingga diperoleh standar deviasi sampel:

1 5
s= ∑
5 - 1 i =1
(x i − x) 2 = 0,245 = 0,495

Jadi dapat diketahui bahwa penyimpangan data berat badan kelima


bayi tersebut terhadap rata-ratanya adalah 0,495.

78
Biostatistika 1

5.2.4 Hubungan antara Standar Deviasi dan Rata-rata


Ukuran pemusatan yang paling umum digunakan adalah rata-
rata dan ukuran penyebaran yang paling umum adalah standar
deviasi. Semakin kecil nilai standar deviasi suatu kelompok data
maka semakin kecil penyebaran (keragaman) data tersebut sehingga
sebagian besar data mengumpul disekitar rata-ratanya. Sebaliknya,
semakin besar nilai standar deviasi maka semakin besar keragaman
data sehingga data lebih menyebar jauh dari rata-ratanya.
P. L. Chebychev (1821-1894) adalah seorang matematikawan
asal Rusia yang menemukan teorema mengenai hubungan antara
rata-rata dengan standar deviasi sehingga dapat diketahui proporsi
minimal data yang berada dalam standar deviasi tertentu dari rata-
ratanya. Teorema ini kemudian dikenal dengan Teorema Chebychev
yang menyatakan bahwa pada sekelompok data, minimal
1 − 1 k 2 bagian data berada dalam k standar deviasi dari rata-
ratanya, dimana k adalah konstanta yang bernilai lebih besar dari 1.
Berdasarkan Teorema Chebychev dapat diketahui untuk k=2
maka minimal 75% data akan berada dalam μ ± 2σ untuk data
populasi dan x ± 2 s untuk data sampel. Untuk k=3 maka minimal
89,9% data akan berada dalam μ ± 3σ atau x ± 3s dan untuk k=8
maka minimial 98% data akan berada dalam μ ± 8σ atau x ± 8s .

Contoh 5.7
Misalkan diketahui rata-rata pajanan debu yang dialami 120 pekerja
yang diambil secara acak pada suatu perusahaan besar adalah 11
mg/m³ dengan standar deviasi 3. Maka dapat diketahui bahwa
minimal 75% atau 90 orang pekerja mengalami pajanan debu pada
kisaran 5 mg/m³ sampai dengan 17 mg/m³ yang diperoleh dari
x ± 2s = 11 ± (2)(3) = 11 ± 6 .

79
Darnah Andi Nohe

Teorema Chebychev berlaku untuk semua distribusi data dan


hanya memberikan nilai batas bawah, sehingga pernyataan-
pernyataan yang dihasilkan tidak terlalu akurat. Untuk data yang
berdistribusi normal, akan lebih baik jika menggunakan hukum
empiris atau hukum normal yang menyatakan bahwa sekitar 68%
data berada dalam rata-rata ditambah satu kali standar deviasi
( μ ± σ atau x ± s ), 95% data berada dalam rata-rata ditambah dua
kali standar deviasi ( μ ± 2σ atau x ± 2 s ) dan 99,7% data berada
dalam rata-rata ditambah tiga kali standar deviasi ( μ ± 3σ atau
x ± 3s ).

-3s -2s -s x s 2s 3s

Gambar 5.1 Hukum Empiris pada Distribusi Normal

5.3 Kemenjuluran (Skewness)


Pada Bab 4 telah dbahas tentang ukuran pemusatan, yaitu
rata-rata, median dan modus serta penggunaan dan hubungan antara
ketiganya. Jika ketiga ukuran pemusatan mempunyai nilai yang
sama, maka akan diperoleh kurva yang simetris atau berdistribusi
normal. Tetapi jika ketiga ukuran pemusatan mempunyai nilai yang
tidak sama, maka akan terjadi kemenjuluran sehingga kurva yang
diperoleh tidak simetris. Dikenal dua kemenjuluran (kecondongan)
yaitu menjulur ke kanan dan menjulur ke kiri. Apabila kurva
menjulur ke kanan, dimana rata-rata lebih besar dari median dan
median lebih besar dari modus maka kurva disebut kurva positif atau

80
Biostatistika 1

menjulur positif. Sebaliknya, jika kurva menjulur ke kanan, dimana


rata-rata lebih kecil dari median dan median lebih kecil dari modus
maka kurva disebut kurva negatif atau menjulur negatif.
Untuk mengetahui derajat kemenjuluran digunakan suatu
ukuran yang disebut sebagai koefisien kemenjuluran Pearson
(coefficient of skewness) disingkat SK, dirumuskan sebagai berikut:

Rata - rata − Modus


SK = , atau
Standar deviasi
3(Rata - rata − Median)
SK = .
Standar deviasi

Nilai SK terletak antara -3 sampai +3. SK yang bernilai positif


menunjukkan kurva positif, sebaliknya SK yang bernilai negatif
menunjukkan kurva negatif. SK yang bernilai nol menunjukkan
kurva yang diperoleh adalah kurva simetris (normal), nilai SK yang
mendekati nol menunjukkan bahwa kurva yang diperoleh mendekati
kurva normal.
Contoh 5.8
Misalkan kita ingin mengetahui nilai SK dari data hasil pemeriksaan
kadar Hb (g/dL) enam orang di Puskesmas A. Berdasarkan Contoh
5.3 diperoleh rata-rata kadar Hb keenam orang tersebut adalah 12
g/dL, dari Contoh 5.5 diperoleh standar deviasi 1 g/dL. Dari hasil
perhitungan median diperoleh 12,5 g/dL dan modus 13 g/dL
sehingga:

Rata - rata − Modus 12 − 13


SK = = = −1 , atau
Standar deviasi 1
3(Rata - rata − Median) 3(12 − 12,5)
SK = = = −1,5
Standar deviasi 1

81
Darnah Andi Nohe

Kedua nilai SK tersebut menunjukkan nilai yang negatif sehingga


dapat disimpulkan bahwa kurva yang diperoleh adalah kurva negatif
atau menjulur ke kanan.
5.4 Keruncingan (Kurtosis)
Keruncingan merupakan suatu ukuran untuk mengetahui
keruncingan atau ketinggian kurva dengan membandingkannya
dengan kurva normal (simetris). Kurva normal merupakan kurva
yang tidak runcing dan tidak mendatar, disebut mesokurtik seperti
pada Gambar 4.1. Kurva yang puncaknya runcing disebut leptokurtik
dan kurva yang puncaknya mendatar disebut platikurtik dan
ditunjukkan pada Gambar 5.2 berikut:

Gambar 5.2 Kurva Leptokurtik dan Platikurtik


Keruncingan suatu data dapat diketahui dengan menggunakan
koefisien kurtosis ( α 4 ). Jika α 4 = 3 maka diperoleh kurva platikurtik
(normal), α 4 > 3 maka diperoleh kurva leptokurtik dan α 4 < 3
diperoleh kurva platikurtik. Pada data tunggal yang diperoleh dari
populasi, rumus yang digunakan adalah:
N

∑ (x
i =1
i − μ)
α4 =
Nσ 4

82
Biostatistika 1

Dimana:
α 4 : Koefisien kurtosis
N : banyaknya data populasi
x i : data ke-i
μ : rata-rata data populasi
σ : standar deviasi populasi
Apabila kita menghitung koefisien kurtosis data tunggal yang
diperoleh dari sampel, maka digunakan rumus:
n

∑ (xi =1
i − x)
α4 =
ns 4

Dimana:
α 4 : Koefisien kurtosis
n : banyaknya data sampel
x i : data ke-i
x : rata-rata data sampel
s : standar deviasi sampel
Contoh 5.9
Misalkan kita juga tertarik untuk menghitung koefisien kurtosis
untuk data kadar Hb (g/dL) enam orang pada Puskesmas A yaitu 13;
11; 12; 10; 13; dan 13. Dari Contoh 5.3 diperoleh σ = 1 dan μ = 12 ,
sehingga koefisien kurtosisnya adalah:
N

∑ (x i − μ) 4
α4 = i =1

Nσ 4

83
Darnah Andi Nohe

(13 − 12) 4 + (11 − 12) 4 + (12 − 12) 4 + (10 − 12) 4 + (13 − 12) 4 + (13 − 12) 4
=
6.14
14 + (−1)4 + 0 + (−2) 4 + 14 + 14
=
6
20
= = 3,3
6
Nilai koefisien kurtosis α 4 (3,3) > 3, maka diperoleh kurva
leptokurtik.
Pada data berkelompok atau dalam bentuk tabel distribusi
frekuensi yang diperoleh dari populasi, nilai koefisien kurtosis
dihitung dengan menggunakan rumus berikut:
n

∑ (x i − x) 4
α4 = i =1
ns 4
Dimana:
α 4 : Koefisien kurtosis
k : banyak kelas
N : banyaknya data populasi
f i : jumlah frekuensi kelas
x i : titik tengah kelas ke-i
μ : rata-rata data populasi
σ : standar deviasi populasi

Sedangkan koefisien kurtosis data berkelompok yang diperoleh


dari sampel, menggunakan rumus:
k

∑ f (x i i − x) 4
α4 = i =1
ns 4

84
Biostatistika 1

Dimana:
α 4 : Koefisien kurtosis
k : banyak kelas
n : banyaknya data sampel
f i : jumlah frekuensi kelas ke-i
x i : titik tengah kelas ke-i
x : rata-rata data sampel
s : standar deviasi sampel
Contoh 5.10
Tabel berikut merupakan tabel distribusi frekuensi jumlah kunjungan
berdasarkan umur di Poli Gigi suatu Puskesmas pada bulan Januari
2013 yang ada pada Contoh 4.11.
Umur (tahun) Frekuensi (f)
6 – 10 14
11 – 15 18
16 – 20 22
21 – 25 10
26 – 30 28
31 – 35 8
Jumlah 100
Untuk menghitung nilai koefisien kurtosis, dibuat kolom pembantu
seperti berikut:
xi fi fi x i x i − x (x i − x) 2 fi (x i − x)2 (x i − x) 4 f(x i − x) 4
8 14 112 6,77 45,8 641,7 2.100,65 29.409,17
13 18 234 11,77 138,5 2.493,6 19.191,36 34.544,56
18 22 396 16,77 281,5 6.187,1 79.091,94 1.741.022,77
23 10 230 21,77 473,9 4.739,3 224.612,39 2.246.123,94
28 28 784 26,77 716,6 20.065,7 513.562,71 14.379.755,97
33 8 264 31,77 1.009,3 8.074,7 1.018.752,9 8.150.023,22
Jumlah 2.020 42.201,1 1.857.312,0 26.890.779,6

85
Darnah Andi Nohe

Diperoleh :
6

∑f x i i
2020
x= i =1
6
= = 20,2
100
∑f
i =1
i

∑ f (x i i − x) 2
42.202,1
σ= i =1
= = 462,8 = 20,65
100 - 1 99
k

∑ f (x i i − μ) 4
26.890.779,6 26.890.779,6
α4 = i =1
4
= = = 1,48
ns 100(20,65) 4 18.183.614,85

Nilai koefisien kurtosis adalah α 4 (1,48) < 3 maka diperoleh kurva


platikurtik.

86
Biostatistika 1

BAB 6
PROBABILITAS

6.1 Pengantar
Seperti disebutkan sebelumnya pada Bab 1 bahwa statistika
merupakan bagian dari matematika yang dikembangkan diatas teori
peluang. Banyak peristiwa dalam keseharian kita yang sulit diketahui
dengan pasti, terutama peristiwa yang akan datang atau sesuatu yang
belum terjadi. Misalnya, apa jenis kelamin bayi yang akan dilahirkan
oleh seorang ibu hamil, apakah operasi jantung yang dilakukan tim
dokter besok siang akan berhasil, apakah angka maternal mortality di
Kalimantan Timur tahun depan meningkat dan sebagainya.
Peristiwa-peristiwa tersebut mengandung ketidakpastian, sehingga
sangat penting mempelajari kemungkinan terjadinya suatu peristiwa
yang akan datang. Bagian dari ilmu statistika yang mempelajari
kemungkinan suatu peristiwa akan terjadi disebut teori peluang
(probabilitas).
6.2 Pengertian Probabilitas
Ketika kita berbicara tentang probabilitas, kita tidak lepas dari
tiga hal penting yang merupakan unsur-unsur probabilitas, yaitu
eksperimen (experiment), hasil (outcome), dan peristiwa (event).
Eksperimen disebut juga sebagai percobaan merupakan kegiatan
yang menghasilkan peristiwa tanpa dapat memastikan peristiwa apa
yang akan terjadi. Contoh eksperimen adalah mengukur suhu badan
pasien setiap hari selama dirawat di rumah sakit, menghitung
banyaknya pengunjung poliklinik setiap hari, melakukan operasi
terhadap penderita penyakit kanker servix, dan yang paling sederhana
adalah melakukan pelemparan uang logam. Masih banyak
eksperimen lainnya dalam kehidupan sehari-hari kita. Dari semua
eksperimen kita memperoleh hasil yang mungkin terjadi. Jika kita

87
Darnah Andi Nohe

melakukan eksperimen yang berulang-ulang dalam kondisi yang


sama maka kita akan memperoleh hasil yang berbeda-beda. Satu atau
lebih hasil yang mungkin kita peroleh dari eksperimen disebut
peristiwa.
Pada setiap eksperimen yang kita lakukan, hanya akan
menghasilkan satu peristiwa, misalnya ketika dokter melakukan
operasi terhadap penderita penyakit kanker servix, peristiwa yang
terjadi adalah berhasil. Jika tidak berhasil berarti operasi gagal, dua
peristiwa berhasil dan gagal tidak dapat terjadi bersamaan. Peristiwa
biasanya dinyatakan dengan menggunakan huruf-huruf besar A, B, C
dan seterusnya.
Contoh 6.1
Eksperimen Hasil Peristiwa
Operasi terhadap 1. Berhasil Berhasil
penderita penyakit 2. Gagal
kanker servix
Mengukur suhu badan 1. Tinggi Rendah
pasien 2. Rendah
Melempar uang logam 1. Angka Gambar
2. Gambar
Menghitung banyaknya Jumlah 100 orang
pengunjung poliklinik pengunjung

Berdasarkan Contoh 6.1 kita dapat mengetahui semua kemungkinan


hasil yang bisa kita peroleh dari suatu eksperimen. Himpunan semua
hasil yang mungkin terjadi dari suatu eksperimen disebut ruang
sampel, dilambangkan S. Setiap hasil dalam ruang sampel disebut
titik sampel.

88
Biostatistika 1

Contoh 6.2
Ruang sampel dari eksperimen melempar uang logam adalah:
S={Angka, Gambar}
Titik sampelnya adalah Angka dan Gambar.
Peristiwa yang terjadi adalah muncul Angka atau ditulis
A = {Angka}.
Contoh 6.3
Ruang sampel dari eksperimen 2 kali operasi terhadap penderita
penyakit kanker servix adalah kedua operasi berhasil (BB), operasi
pertama berhasil tapi operasi kedua gagal (BG), operasi pertama
gagal tapi operasi kedua berhasil (GB) dan kedua operasi gagal
(GG), atau dapat dituliskan :
S={BB, BG, GB, GG}
Titik sampelnya adalah:
BB, BG, GB, GG.
Peristiwa yang terjadi adalah paling sedikit satu operasi berhasil atau
A = {BB, BG, GB}.
Setelah kita membicarakan unsur-unsur probabilitas,
selanjutnya kita akan mendefinisikan probabilitas suatu peristiwa.
Probabilitas adalah kemungkinan terjadinya suatu peristiwa yang
nilainya berkisar dari 0 sampai 1.
Probabilitas dapat dinyatakan dalam desimal maupun persentase.
Jika probabilitas suatu peristiwa bernilai 0 maka peristiwa tersebut
tidak mungkin terjadi, misalnya angka kematian (mortalitas) di
Indonesia tahun 2013 adalah 0, seorang laki-laki melahirkan bayi,
seorang ibu ingin hidup 1000 tahun lagi dan lain sebagainya.
Sebaliknya, jika nilai probabilitas suatu peristiwa bernilai 1 maka
peristiwa tersebut pasti akan terjadi, misalnya semua makhluk hidup
pasti akan mati, harga obat-obatan pasti berubah, direktur rumah

89
Darnah Andi Nohe

sakit pasti akan berganti dan lain sebagainya. Jika nilai probabilitas
mendekati 0 maka semakin kecil kemungkinan peristiwa tersebut
terjadi dan jika semakin mendekati 1 maka semakin besar
kemungkinan suatu pristiwa terjadi.
6. 3 Menentukan Probabilitas Suatu Peristiwa
Probabilitas suatu peristiwa dapat ditentukan dengan
menggunakan tiga asumsi yaitu asumsi klasik, asumsi relatif dan
asumsi subjektif.
6.3.1 Asumsi Klasik
Asumsi klasik menyatakan bahwa peristiwa yang dihasilkan
dari suatu eksperimen mempunyai kesempatan yang sama untuk
terjadi (equalliy likely). Misalkan peristiwa A dapat terjadi sebanyak
n kali dari jumlah semua kemungkinan hasil (N) maka peluang
terjadinya A ditulis P(A) dapat dirumuskan sebagai berikut:
n
P(A) = .
N
N yang merupakan jumlah semua kemungkinan adalah banyaknya
titik sampel yang ada pada ruang sampel.
Contoh 6.4
Pada eksperimen melempar uang logam seperti pada Contoh 6.2,
banyaknya titik sampel yang ada pada ruang sampel ada 2 sehingga
probabilitas peristiwa munculnya Angka ditulis P(A) = ½. Begitu
pula probabilitas peritiwa munculnya Gambar P(G)= ½.

Pada Contoh 6.4 dapat diketahui, jika yang terjadi adalah


peristiwa munculnya Angka maka peristiwa munculnya Gambar
tidak terjadi. Suatu eksperimen dimana yang terjadi hanya ada satu
peristiwa sehingga mencegah terjadinya peristiwa lain disebut
peristiwa saling lepas atau saling asing (mutually exlusive).

90
Biostatistika 1

6.3.2 Asumsi Frekuensi Relatif


Pada asumsi empiris, probabilitas terjadinya suatu peristiwa
dianggap sama satu sama lain sehingga asumsi frekuensi relatif lebih
sering digunakan. Asumsi frekuensi relatif juga disebut asumsi
empiris menyatakan bahwa probabilitas terjadinya suatu peristiwa
dianggap berbeda satu sama lain, tergantung pada berapa banyak
frekuensi suatu peristiwa terjadi dari hasil keseluruhan eksperimen
yang dilakukan di bawah kondisi yang sama.
Contoh 6.5
Pada eksperimen penentuan status gizi pada 100 balita di Kelurahan
X diperoleh 3 balita gizi buruk, 45 balita gizi cukup, 42 balita gizi
baik dan 10 balita gizi lebih. Jika diambil secara random satu balita,
maka probabilitas terambilnya balita dengan status gizi buruk adalah
3/100=0,03 atau 3% , status gizi cukup adalah 0,45 atau 45%, status
gizi baik adalah 0,42 atau 42% dan gizi lebih adalah 0,10 atau10%.
6.3.3 Asumsi Subjektif
Berbeda dengan asumsi klasik dan asumsi frekuensi relatif
yang menentukan probabilitas berdasarkan hasil perhitungan, pada
asumsi subjektif, probabilitas suatu peristiwa ditentukan berdasarkan
penilaian pribadi seseorang. Munculnya penilaian pribadi terjadi
karena kurangnya informasi atau data yang mendasari keyakinan
pembuat asumsi sehingga setiap orang bisa mempunyai penilaian
yang berbeda-beda terhadap probabilitas terjadinya suatu peristiwa.

Contoh 6.6
Contoh asumsi subjektif:
1. Menurut Menteri Kesehatan, gizi buruk pada balita di
Indonesia akan turun tahun depan.
2. Direktur rumah sakit umum daerah X yakin 95% dirinya akan
tetap diposisinya pada periode berikutnya.

91
Darnah Andi Nohe

6.4 Probabilitas Gabungan Beberapa Peristiwa


Menentukan probabilitas suatu peristiwa lebih mudah jika
berdasarkan peluang terjadinya peristiwa lain. Pada bagian ini akan
dibahas tentang gabungan dua atau lebih peristiwa. Diagram Venn
untuk gabungan dua peristiwa dapat dilihat pada Gambar 6.1 berikut:

S
B AB
A A∩B

Gambar 6.1 Diagram Venn Gabungan Dua Peristiwa


Misalkan A adalah suatu peristiwa sembarang dan
probabilitas terjadinya A ditulis P(A), sedangkan B adalah peristiwa
sembarang lainnya dan probabilitas terjadinya B ditulis P(B) maka
probabilitas gabungan A dan B adalah :
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)

Gambar 6.1 menunjukkan ada bagian A yang menjadi bagian B


begitu pula sebaliknya dengan kata lain ada irisan (intersection)
antara A dan B ditulis A ∩ B , sedangkan P(A ∪ B) merupakan
jumlah semua titik sampel dalam A ∪ B sehingga terjadi perhitungan
dua kali pada A ∩ B . Oleh karena itu, ketika menentukan
probabilitas bersama yang merupakan gabungan peristiwa A dan B,
kita mengurangkan P(A ∩ B) .
Contoh 6.7
Berdasarkan Contoh 6.3, diketahui ruang sampel dari eksperimen 2
kali operasi terhadap penderita penyakit kanker servix adalah:
S={BB, BG, GB, GG}

92
Biostatistika 1

Misalkan A adalah peristiwa terjadinya paling sedikit satu operasi


berhasil atau
n(A) 3
A={BB,BG,GB}maka probabilitias A adalah P(A) = = 0,75
N(S) 4
Misalkan B adalah peristiwa terjadinya operasi yang kedua gagal
atau
n(B) 2
B= {BG, GG} maka peluang B dalah P(B) = = = 0,5
N(S) 4
Peristiwa A yang juga merupakan peristiwa B adalah:
A ∩B= {BG}maka peluang A dan B
n(A ∩ B) 1
adalah P(A ∩ B) = = = 0,25
n(S) 4
Sehingga probabilitas gabungan A dan B adalah:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
= 0,75 + 0,5 – 0,25
=1
Probabilitas lulus sekurang-kurangnya satu mata kuliah, berarti bisa
jadi hanya lulus mata kuliah Biostatistika 1, bisa jadi hanya lulus
mata kuliah Metodologi Penelitian, dan bisa jadi lulus keduanya.
Sehingga probabilitas lulus sekurang-kurangnya satu mata kuliah
ditulis P(A ∪ B) adalah:
P(A ∪ B) = P(A) + P(B) - P(A ∩ B)
3 2 1 11
P(A ∪ B) = + − =
4 3 2 12
Jika A dan B merupakan peristiwa yang saling lepas (mutually
exclusive) disebut juga disjoint maka probabilitas gabungan A dan B
adalah:
P(A ∪ B) = P(A) + P(B)
Peristiwa A dan B dikatakan peristiwa saling lepas jika terjadinya
peristiwa A menyebabkan tidak terjadinya peristiwa B seperti pada
Gambar 6.2 berikut:

93
Darnah Andi Nohe

S A B
A B

Gambar 6.2 Peristiwa A dan B Saling Lepas


Berdasarkan Gambar 6.2 dapat diketahui bahwa tidak ada bagian A
yang menjadi bagian B begitu pula sebaliknya dengan kata lain tidak
ada irisan antara A dan B atau A ∩ B = φ , sehingga P(A ∩ B) = 0 .

Jika ada sebanyak n peristiwa yang saling lepas maka berlaku:


P(A1 ∪ A 2 ∪ L ∪ A n ) = P(A1 ) + P(A 2 ) + L + P(A n )

Contoh 6.8
Dinas kesehatan kota X akan menerima seorang pegawai, dari data
10 pendaftar diketahui bahwa terdapat 5 orang sarjana kesehatan
masyarakat, 3 orang sarjana sains dan 2 orang sarjana keperawatan.
Jika kita ingin menentukan probabilitas terpilihnya sarjana kesehatan
masyarakat atau sarjana sains maka kita misalkan:
A: peristiwa terpilihnya sarjana kesehatan masyarakat.
5
P(A) = = 0,5
10
B: peristiwa terpilihnya sarjana sains.
3
P(B) = = 0,3
10
Peristiwa A dan B saling lepas, sehingga probabilitas terpilihnya
sarjana kesehatan masyarakat atau sarjana sains adalah:
P(A ∪ B) = P(A) + P(B)
P(A ∪ B) = 0,5 + 0,3 = 0,8

94
Biostatistika 1

Jika probabilitas suatu peristiwa A disebut P(A) lebih sulit dihitung


daripada probabilitas tidak terjadinya peristiwa A disebut P( A c )
maka kita dapat menghitung P(A) menggunakan rumus berikut:
P(A) + P(A c ) = 1 maka
A c dibaca komplemen dari A artinya bukan peristiwa A dapat dilihat
pada Gambar 6.3 berikut:
S
Ac
A

Gambar 6.3 Diagram Venn Peristiwa A dan A c

Contoh 6.9
Tim dokter berencana akan melakukan operasi caesar besok
terhadap 4 ibu hamil yang tidak bisa melahirkan normal, jika kita
ingin mengetahui berapa probabilitas salah satu operasi gagal maka
kita misalkan:
A: peristiwa terjadinya salah satu operasi gagal.
Banyaknya titik sampel dalam ruang sampel S adalah 2 4 = 16 karena
dalam melakukan operasi ada dua peristiwa yang mungkin terjadi
yaitu gagal atau berhasil. Misalkan A c adalah peristiwa terjadinya
semua operasi berhasil, peristiwa ini hanya sekali terjadi yaitu jika ke
1
4 operasi yang dilakukan berhasil sehingga P(A c ) = , maka:
16
1
P(A c ) = =0,0625, maka:
16
P(A) = 1 - P(A c )
P(A) = 1 - P(A c ) = 1 − 0,0625 = 0,9375

95
Darnah Andi Nohe

6.5 Probabilitas Peristiwa Saling Bebas


Pada sub bab 6.4 sudah dibahas probabilitas gabungan
beberapa peristiwa dan kita mengenal adanya peristiwa saling lepas,
pada bagian ini akan dibahas tentang peristiwa saling bebas
(independen). Dua peristiwa A dan B adalah independen jika
terjadinya salah satu di antara peristiwa yang ada tidak berhubungan
atau tidak mempengaruhi terjadinya peristiwa lain sehingga berlaku
hukum perkalian berikut :
P(A ∩ B) = P(A) × P(B)
Contoh 6.10
Misalkan diketahui seorang ibu dengan kehamilan tunggal akan
melahirkan yang kedua kalinya, jika anak pertamanya adalah laki-
laki, anak kedua yang lahir bisa perempuan atau laki-laki lagi. Jadi
peristiwa kelahiran bayi laki-laki pada anak pertama tidak ada
hubungan atau pengaruhnya dengan peristiwa kelahiran anak kedua.
Jika kita tertarik menghitung probabilitas lahirnya anak laki-laki lagi
pada kelahiran kedua maka kita misalkan:
A: peristiwa lahirnya anak laki-laki pada kelahiran pertama, maka
1
P(A) = = 0,5
2
B: peristiwa lahirnya anak laki-laki pada kelahiran kedua, maka P(B)
1
= = 0,5
2
Sehingga probabilitas A dan B adalah:
P(A ∩ B) = P(A) × P(B) =0,5 × 0,5=0,25

96
Biostatistika 1

6.6 Probabilitas Bersyarat


Probabilitas bersyarat merupakan probabilitas terjadinya suatu
peristiwa dengan syarat peristiwa lainnya telah terjadi. Misalkan A
adalah suatu peristiwa dan B adalah peristiwa lainnya, maka
probabilitas bersyarat terjadinya B dengan syarat A telah terjadi
adalah P(B|A). Jadi pada probabilitas bersyarat, probabilitas
terjadinya peristiwa A berhubungan atau mempengaruhi terjadinya
peristiwa B. Probabilitas bersyarat terjadinya B dengan syarat A
telah terjadi dapat dirumuskan sebagai berikut:

P(A ∩ B)
P(B | A) = ; dimana P(A) > 0.
P(A)
Contoh 6.11
Diketahui kategori berat badan berdasarkan jenis kelamin 130 balita
di Kota X pada tahun 2010 adalah sebagai berikut:
Jenis Sangat Kurus Normal Gemuk Jumlah
Kelamin Kurus
Laki-laki 10 12 38 1 61
Perempuan 9 25 32 3 69
Jumlah 19 37 70 4 130

Misalkan A: balita berjenis kelamin laki-laki


B: balita berkategori berat badan normal
C: balita berjenis kelamin perempuan
D: balita berkategori berat badan gemuk
Jika kita memilih seorang balita secara acak, maka probabilitas
terpilihnya balita berkategori berat badan normal dengan syarat balita
tersebut laki-laki adalah :

97
Darnah Andi Nohe

38
P(A ∩ B) 130 38 130 38
P(B | A ) = = = × = = 0,6229
P(A) 61 130 61 61
130
Dan probabilitas terpilihnya balita berstatus gizi gemuk dengan
syarat balita tersebut perempuan yang adalah:
3
P(C ∩ D) 130 3 130 3
P(D | C) = = = × = =0,0434
P(C) 69 130 69 69
130
Contoh 6.12
Berdasarkan Contoh 6.11, kita akan menghitung probabilitas
peristiwa terpilihnya seorang balita berjenis kelamin perempuan dan
berstatus gizi sangat kurus. Misalkan E: balita berstatus gizi sangat
kurus, maka P(C ∩ E) dapat diperoleh dengan melakukan sedikit
manipulasi aljabar pada rumus peluang bersyarat, yaitu:

P(A ∩ B)
P(B | A ) = maka
P(A)

P(A ∩ B) = P(B | A) × P(A) .

Sehingga:
P(C ∩ E) = P(E | C) × P(C)
9 69 9
= × = = 0,0692
69 130 130

98
Biostatistika 1

6.7 Metode Perhitungan Peristiwa


Didalam melakukan suatu eksperimen, seringkali peristiwa
yang terjadi terlalu banyak untuk dihitung satu persatu dalam suatu
daftar, begitu pula banyaknya titik sampel dalam ruang sampel S.
Untuk itu diperlukan suatu metode perhitungan yang sesuai agar
probabilitas suatu peristiwa dapat kita tentukan dengan mudah,
metode perhitungan yang akan dibahas pada bagian ini adalah aturan
penggandaan (multiple rule), permutasi dan kombinasi.

6.7.1 Aturan Penggandaan


Aturan penggandaan menyatakan bahwa bila suatu prosedur
dapat dilakukan sebanyak n1 cara yang berlainan, kemudian
prosedur kedua juga dapat dilakukan sebanyak n 2 cara yang
berlainan, prosedur ketiga juga dapat dilakukan sebanyak n 3 cara
yang berlainan dan seterusnya sampai ada sebanyak m prosedur
maka banyaknya cara yang berurutan dalam m prosedur tersebut
adalah n1 × n 2 × n 3 × K× n m cara.
Contoh 6.13
Pada eksperimen melakukan operasi caesar terhadap dua ibu hamil,
tanpa mendaftar unsur-unsur dari anggota ruang sampelnya kita
dapat menentukan banyaknya titik sampel yang ada yaitu 2 × 2 = 4 .
Rincian unsur-unsur tersebut sudah kita peroleh pada Contoh 6.3.
Contoh 6.14
Seorang bidan desa yang tinggal di kampung X akan pergi ke
kampung W untuk menolong persalinan, tetapi dia harus melewati
kampung Y dan Z. Dari kampung X ke kampung Y, terdapat 3 rute
yang dapat ditempuh dengan mobil, dari kampung Y ke kampung Z
terdapat dua rute yang dapat ditempuh dengan sepeda motor, dan dari
kampung Z ke kampung W terdapat dua rute juga tetapi hanya dapat
ditempuh dengan jalan kaki.
Banyaknya rute yang berlainan agar bidan tersebut bisa sampai ke
kampung W adalah 3 × 2 × 2 = 12 cara.

99
Darnah Andi Nohe

6.7.2 Permutasi

Permutasi merupakan susunan semua kemungkinan yang dapat


dibentuk dari sekelompok objek dengan memperhatikan urutan
susunannya. Misalkan kita ingin mengetahui permutasi tinggi badan
wanita yang telah melahirkan dan telah dikategorikan menjadi
pendek(p), sedang (s) dan tinggi (t). Kemungkinan permutasinya
adalah pst, pts, spt, stp, tsp dan tps. Jadi diperoleh 6 susunan yang
berbeda, 3 pilihan untuk posisi pertama, dua pilihan untuk posisi
kedua dan 1 pilihan untuk posisi ketiga. Tanpa membuat daftar dari
unsur-unsur yang ada, kita dapat menghitung banyaknya permutasi
yaitu 3 x 2 x 1= 6 cara.

Secara umum, banyaknya permutasi n objek yang berbeda


adalah:
n x (n-1) x (n-2) x …x 3 x 2 x 1= n! cara.

Jenis permutasi ini biasa disebut permutasi lengkap ditulis P(n,n).


Lambang n! dibaca n faktorial dan didefinisikan bahwa 1! = 1 dan
0! = 1.

Banyaknya permutasi yang dapat disusun berdasarkan empat


status gizi balita pada Contoh 6.11 adalah 4! = 24 cara. Misalkan
status gizi balita tersebut diberi kode, yaitu sangat kurus (s), kurus
(k), normal (n) dan gemuk (g). Jika diambil dua balita berdasarkan
status gizinya dari empat yang ada maka susunan yang mungkin ada
12, yaitu sk, sn, sg, kn, kg, ng, gn, gk, nk, gs, ns dank s. Posisi
pertama dapat diisi oleh 4 pilihan dan posisi kedua adalah 3 pilihan
sehingga tanpa membuat daftar unsur-unsurnya dapat diketahui
banyaknya permutasi adalah 4 x 3 = 12 cara.

Secara umum, jika diambil sebanyak r objek dari n objek yang


berbeda maka banyaknya permutasi P(n,r) adalah:

100
Biostatistika 1

n x (n-1) x (n-2) x … x (n-r+1) cara .

atau secara matematis dapat dituliskan sebagai berikut:

n!
P(n, r) = , untuk r = 0, 1, 2, …, n
(n − r )!

Jika r = n maka banyaknya permutasi yang mungkin akan sama


dengan permutasi lengkap.

Contoh 6.15

PT. ASKES akan menentukan dokter keluarga yang akan


ditempatkan pada dua wilayah di Kotamadya X untuk melayani para
peserta ASKES, berdasarkan data yang masuk, ada 4 dokter yang
telah memasukkan permohonan untuk menempati 2 posisi tersebut.
Banyaknya permutasi yang mungkin adalah:

n! 4! 4! 4 × 3 × 2!
P(n, r) = = = = = 12 cara.
(n − r )! (4 − 2)! 2! 2!

Jika dimisalkan 4 dokter tersebut mempunyai inisial A, B, C, dan D


maka urutan susunan yang mungkin adalah AB, AC, AD, BC, BD,
BA, CD, CB, CA, DA, DB dan DC.

6.7.3 Kombinasi

Seringkali dalam kondisi lain, banyaknya cara mengambil r


objek yang diambil dari n objek yang berbeda tidak menjadi penting
untuk memperhatikan urutan susunanya. Pengambilan objek
demikian disebut kombinasi. Berbeda dengan permutasi yang
memperhatikan urutan, pada kombinasi, urutan dari susunan objek

101
Darnah Andi Nohe

tidak diperhatikan. Misalnya pada Contoh 6.15, AB dianggap


berbeda dengan BA sedangkan pada kombinasi, AB dianggap sama
saja dengan BA begitu pula urutan susunan lainnya.

Kombinasi membagi sel menjadi dua bagian, yaitu satu sel


berisi berisi r objek yang terpilih dan satu sel lainnya berisi n – r
objek yang tidak terpilih. Kombinasi biasa dilambangkan C(n,r)
dirumuskan sebagai berikut:

n!
C(n, r) =
r!(n − r )!

Contoh 6.16

Berdasarkan Contoh 6.15, kita akan menghitung banyaknya


kombinasi 2 dari 4 dokter yang memasukkan permohonan untuk
melayani peserta ASKES sebagai berikut:

4! 4! 4 × 3 × 2!
C(4,2) = = = =6
2!(4 − 2)! 2!2! 2!2 × 1

Diperoleh banyaknya kombinasi adalah 6 cara, yaitu AB, AC, AD,


BC, BD, dan CD. Hasil ini tentu berbeda dengan banyaknya
permutasi yang kita peroleh sebelumnya yaitu 12 cara.

102
Biostatistika 1

BAB 7
DISTRIBUSI PROBABILITAS

7.1 Pengantar
Pada bab 6, kita sudah membahas tentang probabilitas
terjadinya suatu peristiwa dari suatu eksperimen. Pada bab ini akan
dibahas tentang distribusi probabilitas, yaitu keseluruhan nilai
probabilitas setiap peristiwa dari hasil eksperimen yang diperoleh
berdasarkan table distribusi frekuensi.
Secara umum, distribusi probabilitas terbagi menjadi distribusi
probabilitas diskrit dan distribusi probabilitas kontinu. Distribusi
probabilitas diskrit merupakan distribusi yang diperoleh dari variabel
acak diskrit, yaitu variabel yang nilai datanya berupa bilangan bulat
positif dan diperoleh dari hasil perhitungan. Distribusi probabilitas
yang diperoleh dari variabel acak kontinu disebut distribusi kontinu.
Variabel acak kontinu adalah variabel yang nilai datanya kontinu dan
diperoleh dari hasil pengukuran.
Distribusi probabilitas diskrit yang akan dibahas pada bab ini
adalah distribusi binomial, distribusi multinomial, distribusi
hipergeometrik dan distribusi Poisson sedangkan distribusi
probabilitas kontinu yang akan dibahas adalah distribusi normal.
7.2 Disribusi Binomial (Bernoulli) dan Multinomial
Suatu eksperimen yang dilakukan berulang-ulang dan
mempunyai dua kemungkinan hasil (outcome), misalnya sukses dan
gagal, laki-laki dan perempuan, hidup dan mati dan lain sebagainya
maka eksperimen tersebut dinamakan eksperimen (percobaan)
binomial, biasa juga disebut percobaan Bernoulli sesuai dengan
nama penemunya yaitu James Bernoulli.

103
Darnah Andi Nohe

Eksperimen binomial mempunyai ciri-ciri sebagai berikut:


1. Eksperimen diulang sebanyak n kali.
2. Hasil setiap ulangan dapat digolongkan dalam sukses atau
gagal.
3. Probabilitas sukses p sama pada setiap ulangan dan probabilitas
gagal, q = 1 - p.
4. Pengulangan pada setiap eksperimen bersifat independen satu
sama lain.
5. Nilai n < 20 dan p > 0,05.
Contoh 7.1
Seorang ibu ingin mempunyai 3 anak laki-laki, maka dikatakan
sukses jika anak yang lahir adalah laki-laki (L). Maka banyaknya
sukses dapat disebut sebagai peubah acak X yang mempunyai nilai 0
jika ketiga anak yang dilahirkannya perempuan (P) semua, nilai 1
jika terdapat satu laki-laki dari tiga anak yang dilahirkannya, nilai 2
jika terdapat dua laki-laki dari tiga anak yang dilahirkannya dan nilai
3 jika ketiga anak yang dilahirkannya laki-laki semua. Karena
terdapat 2 jenis kelamin dan 3 anak maka banyaknya kemungkinan
hasil yang diperoleh adalah 2 x 2 x 2 = 23 = 8. Delapan kemungkinan
hasil yang diperoleh adalah:

X 0 1 1 1 2 2 2 3
Hasil PPP PPL PLP LPP LLP LPL PLL LLL

Peristiwa melahirkan anak pertama, kedua dan ketiga saling bebas


dan masing-masing mempunyai probabilitas sukses(p) yang sama
1 1
yaitu sehingga probabilitas gagal(q) adalah 1-p=1- =
2 2
1 1 1 1 1
. Probabilitas(LLP) = x x = , begitu pula hasil lainnya
2 2 2 2 8

104
Biostatistika 1

1
mempunyai probabilitas sebesar sehingga distribusi probabilitas
8
bagi variabel acak X adalah:
X 0 1 2 3
P(X=x) 1 3 3 1
8 8 8 8

Variabel acak X yang menyatakan banyaknya sukses dalam n


ulangan pada eksperimen binomial disebut variabel acak binomial.
Distribusi probabilitas bagi variabel acak diskrit binomial disebut
distribusi binomial.
Secara umum, jika suatu peristiwa binomial mempunyai
probabilitas sukses p dan probabilitas gagal q = 1- p, maka
distribusi probabilitas bagi variabel acak X, yaitu banyaknya sukses
dalam n ulangan adalah :

P(X = x) = b(x; n; p) = C(n, x)p x q n − x

Dimana:
x = 0,1,2,3,.....,n
n!
C(n, x) =
x!(n - x)!

Contoh 7.2
Diketahui probabilitas seorang balita terkena asma adalah 0,10. Jika
ada 5 balita yang datang ke UGD karena keluhan sesak nafas, maka
probabilitas 3 diantaranya terkena asma adalah:

P(X = x) = b(x; n; p) = C(n, x)p x q n − x


P(X = 3) = b(3;5;0,10) = C(5,3)(0,10)3 (0,9)5−3

105
Darnah Andi Nohe

5!
= (0,001)(0,81)
3!(5 − 3)!
5 × 4 × 3!
= (0,00081) = 0,0081
3!×2 ×1
Jadi probabilitas 3 diantara 5 balita terkena asma adalah 0,0081 atau
0,81 %.
Selain menggunakan rumus binomial, kasus pada Contoh 7.2
juga dapat diselesaikan dengan menggunakan Tabel Probabilitas
Binomial Kumulatif pada Lampiran 1 dengan langkah-langkah
berikut:
1. Mencari pada tabel banyaknya n yang sesuai. Pada Contoh 7.2
, nilai n=5.
2. Mencari nilai x yang sesuai pada kolom k. Misalnya x=3,
maka nilai probabilitas terletak pada baris tersebut.
3. Mencari nilai p yang sesuai pada kolom p. Misalnya p=0,10.
Potongan Tabel Probabilitas Binomial Kumulatif berikut
disajikan sebagai contoh:
p
N k
0,10 0,20 0,30 0,40 0,50
0 0,5905 0,3277 0,1681 0,0778 0,0313
1
2 0,9914
5
3 0,9995
4
5

4. Perpotongan antara nilai p pada kolom p dengan nilai x pada


kolom k merupakan nilai probabilitas kumulatif. Misalkan kita
ingin menentukan nilai probabilitas x=3, maka kita harus
mengurangkannya dengan nilai probabilitas x=2 pada kolom p
yang sama. Nilai probabilitas kumulatif pada x=3 adalah

106
Biostatistika 1

0,9995 dan pada x=2 adalah 0,9914 sehingga nilai probabilitas


x=3 adalah 0,9995-0,9914=0,0081.
Pada kasus tertentu yang mengharuskan kita menghitung
P(X < x) atau P(a ≤ X ≤ b) , kita dapat langsung menggunakan Tabel
Probabilitas Binomial Kumulatif.
Contoh 7.3
Seorang pekerja yang terpapar debu di lokasi tambang mempunyai
probabilitas terkena pterigium sebesar 0,2. Jika terdapat 10 orang
yang bekerja di lokasi tambang dan kita tertarik mengetahui
probabilitas berikut:
a. Sekurang-kurangnya 5 orang pekerja yang terkena pterigium.
b. Ada 4 sampai 8 orang pekerja yang terkena pterigium.
c. Paling banyak 9 orang pekerja yang terkena pterigium.
Kita misalkan X adalah banyaknya pekerja yang terkena pterigium,
maka:
a. Probabilitas sekurang-kurangnya 5 orang pekerja yang terkena
pterigium adalah:
P(X ≥ 5) = 1 − P(X < 5)
4
= 1 − ∑ b(x;10;0,2)
x =0
=1- 0,9672 = 0,328.
b. Probabilitas ada 4 sampai 8 orang pekerja yang terkena
pterigium adalah:
8
P(4 ≤ X ≤ 8) = ∑ b(x;10;0,2)
x=4
8 3
= ∑ b(x;10;0,2) - ∑ b(x;10;0,2)
x =0 x =0
=1- 0,8791=0,1209.

107
Darnah Andi Nohe

c. Probabilitas paling banyak 9 orang pekerja yang terkena


pterigium adalah:
9
P(X ≤ 9) = ∑ b(x;10;0,2)
x =0
=1
Jika probabilitas sukses p dan probabilitas gagal q = 1- p
dalam n ulangan, distribusi binomial mempunyai rata-rata dan
standar deviasi sebagai berikut :
μ = np dan σ = npq

Contoh 7.4
Berdasarkan Contoh 7.3, dapat diketahui rata-rata pekerja yang
terkena pterigium adalah μ = np = (10)(0,2) = 2 orang dan standar
deviasi σ = npq = (10)(0,2)(0,8) = 1,6 .

Jika eksperimen binomial diperluas dimana setiap ulangan dari


eksperimen yang dilakukan menghasilkan lebih dari dua
kemungkinan hasil, maka eksperimen tersebut dinamakan
eksperimen multinomial.
Misalkan pada eksperimen multinomial menghasilkan
peristiwa A1 , A 2 , K, A k dan probabilitas masing-masing peristiwa
adalah p1 , p 2 , K, p k maka p1 + p 2 + L + p k = 1 . Distribusi
probabilitas bagi variabel acak X1 , X 2 , K, X k yang menyatakan
banyaknya peristiwa A1 , A 2 , K, A k terjadi dalam n ulangan adalah:

n!
P(x 1 , x 2 , K , x k ) = p1x1 , p 2x 2 , K , p kx k
x1! x 2 !K x k !

108
Biostatistika 1

Contoh 7.5
Hasil penelitian pada suatu perguruan tinggi terkemuka di kota X
menunjukkan bahwa 40% mahasiswanya berperilaku sex tidak
berisiko, 45 % berperilaku sex berisiko dan 15% berperilaku sex
risiko tinggi. Jika diambil sampel sebanyak 10 orang, untuk
menentukan probabilitas terdapat 5 mahasiswa berperilaku sex tidak
berisiko, 3 mahasiswa berperilaku sex berisiko dan 2 berperilaku sex
risiko tinggi maka kita misalkan:
x1 = 5; banyaknya mahasiswa berperilaku sex tidak berisiko,
x 2 = 3; banyaknya mahasiswa berperilaku sex berisiko,
x 3 = 2; banyaknya mahasiswa berperilaku sex risiko tinggi,
p1 = 40%=0,40
p 2 = 45%=0,45
p 3 = 15%=0,15

Sehingga diperoleh:
10!
P(5,3, 2) = (0,40) 5 (0,45) 3 (0,15) 2
5!3!2!
= 0,05

7.3 Distribusi Hipergeometrik


Distribusi binomial seperti yang dibahas pada sub bab 7.3
mengasumsikan bahwa probabilitas peristiwa sukses dan gagal yang
dihasilkan pada setiap pengulangan adalah sama. Distribusi binomial
tidak berlaku pada kasus ini: Misalkan didalam kotak P3K terdapat 4
syrup penurun panas untuk anak-anak yaitu merk A, B, C dan D.
Dilakukan pengambilan tanpa pengembalian, maka probabilitas
1
terpilihnya merk A pada pengambilan pertama adalah .
4

109
Darnah Andi Nohe

1
Probabilitas terambilnya merk B pada pengambilan kedua adalah .
3
1
probabilitas terambilnya merk C pada pengambilan ketiga adalah ,
2
dan probabilitas terambilnya merk D pada pengambilan terakhir
adalah 1 karena sisa merk D yang ada di dalam kotak.
Pada kasus tanpa pengembalian, distribusi binomial tidak dapat
digunakan karena pengulangan pada setiap eksperimen tidak lagi
bersifat independen satu sama lain. Hal ini berarti bahwa probabilitas
suatu peristiwa yang dihasilkan dari ekperimen akan mempengaruhi
probabilitas peristiwa berikutnya sehingga nilai probabilitas setiap
ulangan tidak lagi sama.
Pada eksperimen tanpa pengembalian dengan banyaknya
sampel 5% dari jumlah populasi, maka lebih tepat menggunakan
distribusi hipergeometrik. Ciri-ciri ekperimen hipergeometrik adalah:
1. Sebanyak n sampel acak diambil dari N populasi.
2. Dari N populasi terdapat k sukses dan N-k gagal.
Secara umum, jika dalam N populasi terdapat k sukses dan N-k
gagal, maka distribusi probabilitas bagi variabel acak hipergeometrik
X, yaitu banyaknya sukses dalam n sampel acak adalah :
C(k, x)C(N - k, n - x)
H(x; N; n; k) =
C(N, n)
Dimana:
x = 0,1,2,3,.....,k
k!
C(k, x) =
x!(k - x)!
(N - k)!
C(N - k, n - x) =
(n - x)!((N - k) - (n - x))!
N!
C(N, n) =
n!(N - n)!

110
Biostatistika 1

Contoh 7.6
Seorang dokter memeriksa secara acak 6 pasien dari 10 pasien rawat
inap di Ruang Melati RS X, ternyata 4 diantaranya sudah bisa keluar
hari ini. Jika kita tertarik menghitung probabilitas bahwa 3 pasien
bisa keluar hari ini, maka kita misalkan N=10, n=6, k=4, x=3
sehingga:
C(4,3)C(10 - 4,6 - 3) C(4,3)C(6,3)
H(3;8;6;4) = =
C(10,6) C(10,6)
Dimana :
4! 4.3!
C(4,3) = = =4
3!(4 - 3)! 3!1!
6! 6.5.4.3!
C(6,3) = = = 20
3!(6 - 3)! 3.2.1.3!
1. C(10,6) = 10! 10.9.8.7.6!
= = 210
6!(10 - 6)! 6!4.3.2.1

diperoleh:
C(4,3)C(6,3) 4.20 80
H(3;10;6;4) = = = = 0,381
C(10,6) 210 210

Jadi probabilitas bahwa 3 pasien bisa keluar hari ini adalah 0,381.
Jika diambil sampel secara acak sebanyak n dari N populasi dan
terdapat k sukses dengan N-k gagal maka distribusi hipergeometrik
mempunyai rata-rata dan standar deviasi sebagai berikut:
nk ⎛ N-n ⎞ k ⎛ k ⎞
μ= dan σ = n⎜ ⎟ ⎜1 - ⎟
N ⎝ N -1 ⎠ N ⎝ N ⎠

7.4 Distribusi Poisson


Suatu eksperimen yang menghasilkan peristiwa yang jarang
terjadi selama interval waktu tertentu atau daerah tertentu disebut

111
Darnah Andi Nohe

eksperimen Poisson. Jika eksperimen tersebut menghasilkan nilai-


nilai bagi suatu variabel acak X, maka distribusi probabilitas bagi X
disebut distribusi Poisson.
Jadi distribusi Poisson merupakan suatu distribusi untuk
menentukan probabilitas peristiwa yang jarang terjadi pada interval
waktu tertentu atau di suatu daerah tertentu. Contoh peristiwa yang
jarang terjadi adalah gunting tertinggal dalam perut seorang pasien
setelah dilakukan operasi caesar, balita meninggal setelah diberi
imunisasi polio, seorang nenek hidup kembali setelah meninggal
selama dua minggu dan lain sebagainnya.
Distribusi Poisson dirumuskan sebagai berikut:

e -μ μ x e -np (np) x
P(X = x) = p(x; μ) = =
x! x!
Dimana:
x :1, 2, …
μ : rata-rata banyaknya hasil eksperimen
n : banyaknya sampel
p : probabilitas terjadinya peristiwa
e = 2,718128
Contoh 7.7
Misalkan diketahui probabilitas seorang balita terkena polio setelah
diberi imunisasi polio adalah 0,0002. Petugas puskesmas sudah
memberi imunisasi polio pada 3.000 balita di suatu kota, jika kita
tertarik menghitung probabilitas terdapat 4 balita akan terkena polio
maka kita misalkan X adalah banyaknya balita yang terkena polio.
Diperoleh μ = 3.000(0,0002) = 6 , sehingga:

e -μ μ x (2,71828)-6 (6) 4
P(X = 4) = =
x! 4!
(0,002479)(1.296)
=
24
= 0,1339

112
Biostatistika 1

Seperti halnya pada distribusi binomial, nilai probabilitas pada


distribusi Poisson dapat dihitung dengan menggunakan Tabel
Distribusi Probabilitas Poisson Kumulatif pada Lampiran 2 dengan
mencari perpotongan antara nilai μ dengan nilai k. Pada Contoh 7.7,
nilai perpotongan μ = 6 dengan x = 4 adalah 0,2851. Nilai yang kita
peroleh merupakan nilai probabilitas kumulatif sehingga nilai
probabilitas tersebut harus dikurangkan dengan nilai probabilitas x=3
pada kolom yang sama. Potongan Tabel Distribusi Probabilitas
Poisson Kumulatif berikut diberikan sebagai contoh:
µ
x
5.20 5.30 … 6.00
0 0.0055 0.0050 0.0025
1 0.0174
2 0.0620
3 0.1512
4 0.2851
5 0.5809 0.5635 0.4457
… … … … …

sehingga:
P(X=4)= 0,2851-0,1512= 0,1339
Nilai tersebut sama dengan yang kita peroleh dengan perhitungan
menggunakan rumus.

Contoh 7.8
Berdasarkan Contoh 7.7, kita dapat menentukan:
a. Probabilitas sekurang-kurangnya 8 balita terkena polio,
P(X ≥ 8) = 1 − P(X < 8)
7
= 1 − ∑ p(x;7)
x =0
= 1- 0,7440 = 0,256

113
Darnah Andi Nohe

b. Probabilitas ada 5 sampai 10 balita akan terkena polio,


10
P(5 ≤ X ≤ 10) = ∑ p(x;6)
x =5
10 4
= ∑ p(x;6) - ∑ p(x;6)
x =0 x =0
=0,9574- 0,2851=0,6273
c. Probabilitas paling banyak 8 balita akan terkena polio.
8
P(X ≤ 8) = ∑ p(x;6)
x =0
=0,8472
Jika jumlah sampel n besar dan nilai probabilitas p kecil
sehingga mendekati nol, maka distribusi Poisson mempunyai
histogram yang mirip dengan distribusi Binomial. Dengan demikian,
distribusi Poisson dengan μ = np dapat digunakan untuk mendekati
probabilitas binomial. Jika nilai p dekat dengan 1, kita dapat
menukar definisi kita tentang sukses dan gagal sehingga nilai p
menjadi nilai yang dekat dengan 1.
Contoh 7.7 merupakan eksperimen binomial karena terdapat
dua out come, yaitu terkena polio dan tidak terkena polio. Jumlah
sampel n besar yaitu 3.000 balita sedangkan nilai p mendekati nol
yaitu 0,0002, sehingga kasus ini dapat diselesaikan dengan
melakukan pendekatan distribusi Poisson dengan terlebih dahulu
menentukan μ = np seperti yang telah dikerjakan pada Contoh 7.7.

7.5 Distribusi Normal


Distribusi normal merupakan distribusi yang paling umum
digunakan dalam statistika karena sebagian besar analisis statistika
inferensi menjadikan distribusi normal sebagai dasar analisisnya.
Penurunan persamaan matematika bagi kurva normal dilakukan oleh

114
Biostatistika 1

Abraham DeMoivre pada tahun 1733, kemudian dikembangkan oleh


Karl Gauss pada tahun 1777-1855. Gauss melakukan eksperimen
yang berulang terhadap benda yang sama sehingga berhasil
mendapatkan persamaan matematika dari distribusi ini. Untuk
mengenang jasanya, distribusi normal sering juga disebut sebagai
distribusi Gauss.
Distribusi normal sebagai hasil dari variabel acak kontinu
banyak ditemukan dalam dunia kedokteran dan kesehatan
masyarakat, misalnya kadar Hb, tekanan darah sistolik dan diastolik,
intensitas kebisingan dan lain sebagainya.
Jika X adalah variabel acak kontinu yang berdistribusi normal
dengan rata-rata μ dan standar deviasi σ , maka persamaan kurva
normalnya adalah:
2
1 ⎛ x −μ ⎞
1 − ⎜ ⎟
N(x; μ; σ) = e 2⎝ σ ⎠
2πσ
Dimana:
− ∞ < x < ∞ ; π = 3,14159 dan e = 2,71828

Kurva normal mempunyai ciri-ciri sebagai berikut:


1. Kurva berbentuk lonceng dan mempunyai nilai rata-rata,
median dan modus yang sama. Ketiga ukuran pemusatan
tersebut berada ditengah sehingga membagi kurva menjadi dua
bagian yaitu sebagian kurang dari nilai ukuran pemusatan dan
sebagian lebih dari nilai ukuran pemusatan.
2. Kurva berbentuk simetris yaitu luas sisi kiri dan sisi kanannya
sama sehingga kalau dilipat ditengahnya maka akan ada dua
bagian yang sama.
3. Kurva normal bersifat asimtotik, artinya kurva mendekati
sumbu mendatar dengan dua arah yaitu ke arah kanan dan kiri
mendekati nol, tetapi tidak sampai menyentuh titik nol.

115
Darnah Andi Nohe

4. Nilai modus pada sumbu mendatar membuat fungsi mencapai


puncaknya pada x = μ .
5. Luas daerah di bawah kurva tetapi di atas sumbu mendatar
sama dengan 1.

x = Me = Mo
Gambar 7.1 Distribusi Normal
Untuk menentukan nilai probabilitas di bawah kurva normal,
dilakukan transformasi dari fungsi distribusi normal umum menjadi
distribusi normal baku. Distribusi normal baku merupakan distribusi
peubah acak normal dengan nilai rata-rata sama dengan nol dan
standar deviasi sama dengan satu. Transformasi yang digunakan
untuk mengubah distribusi normal umum menjadi distribusi normal
baku disebut transformasi Z yang dirumuskan sebagai berikut:
X−μ
Z=
σ
Jika nilai X berada di antara x = x1 dan x = x 2 , maka variabel acak
Z akan berada di antara nilai berikut:

x1 − μ x −μ
z1 = dan z 2 = 2
σ σ

X1 0 X2 Z1 0 Z2

116
Biostatistika 1

Gambar 7.2. Luas Daerah di antara nilai X dan Z

Padanan semua nilai X yang berada di antara x1 dan x 2 adalah


semua nilai Z yang berada di antara z1 dan z 2 sehingga luas daerah
di bawah kurva X dan Z juga sama, hal ini ditunjukkan pada
Gambar 7.2. Oleh karena itu, nilai probabilitas X dan Z dapat
dituliskan sebagai berikut:

P(x1 < X < x 2 ) = P(z1 < Z < z 2 )

Contoh 7.9
Misalkan diketahui rata-rata kadar leukosit (white blood cell) 120
anak usia 5 sampai 10 tahun adalah 6 (103 / ul) dengan standar
deviasi 1,5 (103 / ul) . Misalkan X adalah kadar leukosit anak usia 5
sampai 10 tahun, untuk menentukan probabilitas mendapatkan
seorang anak dengan leukosit:

a. Kurang dari 8 (103 / ul) atau P(X < 8) , terlebih dahulu kita
menentukan nilai Z yang merupakan padanan X, yaitu:

X−μ 8−6
Z= = = 1,33
σ 1,5

Sehingga P(X < 8) = P(Z < 1,33) = 0,9082 , nilai tersebut


diperoleh dari Tabel Distribusi Normal pada Lampiran 4
dengan cara mencari angka desimal pertama yaitu 1,3 pada
kolom Z kemudian mencari angka desimal kedua yaitu 0,03
pada kolom 0,03. Perpotongan antara 1,3 dengan 0,03
menghasilkan nilai P(Z < 1,33) yaitu 0,90824.
z 0,00 0,01 0,02 0,03 0,04

117
Darnah Andi Nohe

0,0 0,50000 0,50399 0,50798 0,51197 0,51595

1,3 0,90824 0,90988


1,4
1,5

Luas daerah P(Z < 1,33) dapat dilihat pada Gambar 7.3
berikut:

0 1,33

Gambar 7.3 Luas Daerah Z < 1,33

b. Lebih dari 9 (103 / ul) atau P(X > 9) . Nilai Z yang merupakan
padanan X adalah:

X−μ 9−6
Z= = = 2,00
σ 1,5
Sehingga:

P(X > 9) = P(Z > 2,00)


= 1 − P(Z < 2,00)
= 1− 0,97725
= 0,02275

Luas daerah P(Z > 2,00) dapat dilihat pada Gambar 7.4
berikut:

118
Biostatistika 1

0 2,00

Gambar 7.4 Luas Daerah Z > 2,00

c. Antara 3 sampai 5 (103 / ul) atau P(3 < X < 5) , nilai-nilai z


yang menjadi padanan x1 = 3 dan x 2 = 5 adalah:

x1 − μ 3 − 6
z1 = = = −2,00
σ 1,5
dan
x2 − μ 5 − 6
z2 = = = −0,67
σ 1,5
Sehingga
P(3 < X < 5) = P(-2,00 < Z < −0,67)
= P( Z < −0,67) − P( Z < −2,00)
= 0,25143 − 0,02275
= 0,22868

Luas daerah P(-2,00 < Z < −0,67) dapat dilihat pada Gambar
7.5 berikut:

Gambar 7.5
− 2,00 − 0,670 0
Gambar 7.5 Luas Daerah -2,00 < Z < -0,670

119
Darnah Andi Nohe

7.6 Pendekatan Normal terhadap Distribusi Binomial


Pada tabel binomial dengan mudah dapat kita tentukan nilai
probabilitas suatu eksperimen binomial jika jumlah sampel n kecil
dan kita dapat melakukan pendekatan distribusi Poisson jika n besar
dan p sangat dekat dengan 0 atau 1 seperti yang telah dibahas pada
pada sub bab 7.4 .

Meskipun distribusi binomial merupakan distribusi probabilitas


diskrit, distribusi normal yang merupakan distribusi kontinu dapat
mendekati distribusi binomial dengan hasil yang sangat baik jika n
besar dan p mendekati 0,5. Bahkan, distribusi normal memberikan
hampiran yang cukup baik meskipun n kecil dan p tidak terlalu dekat
dengan 0 atau 1. Selain kondisi tersebut, kita juga dapat
menggunakan hasil perhitungan np dan nq, jika keduanya lebih besar
dari 5 maka pendekatan normal baik dilakukan. Dalil yang melandasi
kemungkinan dilakukannya pendekatan distribusi normal terhadap
distribusi binomial adalah sebagai berikut:

Jika X adalah suatu variabel acak binomial dengan rata-rata µ

= np dan standar deviasi σ = npq , maka nilai transformasi Z untuk


distribusi normal adalah:
X − np
Z=
npq
Dimana nilai n → ∞ dan p mendekati 0,5.

Pendekatan distribusi normal terhadap distribusi binomial


memerlukan faktor koreksi sebesar 0,5 dengan cara menambahkan
atau mengurangi nilai variabel acak distribusi binomial.

120
Biostatistika 1

Contoh 7.10
Misalkan diketahui probabilitas seorang pasien akan sembuh dari
suatu penyakit adalah 0,8 dan terdapat 200 orang yang menderita
penyakit ini. Untuk menentukan:
a. Probabilitas kurang dari 150 orang yang sembuh, kita
misalkan X adalah banyaknya penderita yang sembuh,
x = 150-0,5=149,5 ; µ = np = 200(0,8)=160,
σ = npq = 200(0,8)(0,2) = 5,66

Untuk mendapatkan nilai P(X<150), kita harus menghitung


luas daerah sebelah kiri x = 149,5, nilai z yang menjadi
padanan x adalah:

X − np 149,5 − 160
Z= = = −1,85
npq 5,66

Probabilitas yang sembuh kurang dari 150 orang diperoleh


hasil berikut:
149
P(X < 150) = ∑ b( x;200;0,8) .
x =0
= P(Z < −1,85)
= 0,032160
Luas daerah P(Z < −1,85) dapat dilihat pada gambar 7.6 berikut:

− 1,85 0
Gambar 7.6Luas Daerah Z < -1,85

121
Darnah Andi Nohe

b. Probabilitas 145 sampai 165 orang yang sembuh atau P (145


≤ X ≤ 165), kita harus menghitung luas daerah antara:
x1 = 145 − 0,5 = 144,5 dan x 2 = 165 + 0,5 = 165,5
Nilai z yang menjadi padanan x1 dan x 2 adalah:
x − μ 144,5 − 160
z1 = 1 = = −2,74
σ 5,66

dan
x 2 − μ 165,5 − 160
z2 = = = 0,97
σ 5,66
Sehingga:
P(145 < X < 164) = P(-2,74 < Z < 0,97)
= P( Z < 0,97) − P( Z < −2,74)
= 0,83398 − 0,00307
= 0,83091

− 2,74 0 0,97

Gambar 7.7 Luas Daerah -2,74<Z<0,97

122
Biostatistika 1

BAB 8
DISTRIBUSI SAMPLING

8.1 Pengantar
Dalam statistika, kita lebih banyak berbicara mengenai data
sampel yang diambil dari suatu populasi. Pada Bab 2 kita sudah
membahas tentang teknik sampling, yaitu metode atau cara-cara yang
digunakan untuk mengambil sampel dari populasi tertentu. Dari
sampel yang sudah diambil, kita akan melakukan generalisasi
terhadap populasi dengan menggunakan statistika inferensi.
Teori yang mendasari statistika inferensi adalah distribusi
sampling. Distribusi sampling terdiri dari beberapa macam,
umumnya diberi nama sesuai dengan nama statistik yang digunakan,
misalnya distribusi sampling rata-rata, distribusi sampling proporsi,
distribusi sampling deviasi dan lain-lain. Pada bab ini, akan dibahas
distribusi sampling satu persatu.
8.2 Distribusi sampling rata-rata
Kesalahan dalam teknik sampling (sampling error) dapat
diketahui dari nilai rata-rata yang diperoleh dari setiap kelompok
sampel. Nilai rata-rata antar kelompok sampel yang sangat bervariasi
menunjukkan sampling error yang besar. Rata-rata dan standar
deviasi sampel hendaknya mencerminkan rata-rata dan standar
deviasi populasinya. Setiap populasi hanya mempunyai satu nilai
rata-rata dan standar deviasi.
Berbeda dengan populasi, setiap kita melakukan penarikan
sampel akan diperoleh nilai rata-rata dan standar deviasi sehingga
akan diperoleh kombinasi nilai rata-rata dan standar deviasi yang
banyak. Dari kumpulan rata-rata tersebut, diperoleh rata-rata dari

123
Darnah Andi Nohe

rata-rata dilambangkan μ x dan standar deviasi dari rata-rata


dilambangkan σ x . Probabilitas dari setiap kemungkinan rata-rata
sampel akan membentuk suatu distribusi yang disebut distribusi
sampling rata-rata disingkat distribusi sampling rata-rata.
Contoh 8.1
Misalkan diketahui jumlah suatu populasi N=6 orang, kemudian
diukur kadar trombositnya ( 103 /ul ) dan diperoleh data berikut: 262,
300, 322, 280, 400 dan 350. Kemudian dilakukan perhitungan, maka:
Rata-rata populasi:

262 + 300 + 322 + 280 + 400 + 35


μ= = 319
6
Standar deviasi populasi:

1 N 1 6
σ= ∑
N i =1
(x i − μ) 2
= ∑
6 i =1
(x i − 319) 2 = 50,32 .

Diambil sampel berukuran n = 2 tanpa pengembalian sehingga


n 2
= = 0,33 . Maka banyaknya sampel adalah:
N 6
n!
C(n, r) =
r!(n − r )!
6!
C(6,2) =
2!(6 − 2)!
6.5.4!
= = 15 buah sampel
2!4!

124
Biostatistika 1

Data setiap sampel dan rata-ratanya dapat dilihat pada Tabel 8.1
berikut:
Tabel 8.1 Sampel dan Rata-ratanya
Sampel Rata-rata
(262,300) 281
(262,322) 292
(262,280) 271
(262,400) 331
(262,350) 306
(300,322) 311
(300,280) 290
(300,400) 350
(300,350) 325
(322,280) 301
(322,400) 361
(322,350) 336
(280,400) 340
(280,350) 315
(400,350) 375
Jumlah 4.785

Jumlah dari 15 rata-rata adalah 4.785, sehingga rata-rata dari 15


rata-rata tersebut adalah:
4.785
μx = = 319
15
Dan standar deviasi dari 15 rata-rata adalah:

(281 - 319) 2 + (292 − 319) 2 + L + (375 − 319) 2


σx =
15
= 31,83

125
Darnah Andi Nohe

Diperoleh:

μ x = μ = 319
σ N − n 50,32 6 − 2
σx = = = 31,83
n N −1 2 6 −1

Kita juga dapat menghitung frekuensi rata-rata dan masing-masing


probabilitasnya (p) yaitu pada Tabel 8.2 berikut:
Tabel 8.2 Distribusi Probabilitas Rata-rata

Sampel Rata-rata Frekuensi p


(262,300) 281 1 1/15
(262,322) 292 1 1/15
(262,280) 271 1 1/15
(262,400) 331 1 1/15
(262,350) 306 1 1/15
(300,322) 311 1 1/15
(300,280) 290 1 1/15
(300,400) 350 1 1/15
(300,350) 325 1 1/15
(322,280) 301 1 1/15
(322,400) 361 1 1/15
(322,350) 336 1 1/15
(280,400) 340 1 1/15
(280,350) 315 1 1/15
(400,350) 375 1 1/15
Jumlah 4.785 15 1

Tabel 8.1 menunjukkan bahwa rata-rata untuk semua sampel


membentuk distribusi probabilitas rata-rata sampel.
Jika pengambilan sampel dilakukan tanpa pengembalian
(without replacement) yaitu tiap elemen sampel yang sudah diambil

126
Biostatistika 1

tidak dikembalikan lagi kepada populasinya maka untuk n ≥ 30 dan


jumlah populasi minimal dua kali jumlah sampel berlaku Dalil 1
berikut:
Apabila suatu sampel berukuran n diambil dari suatu populasi
terhingga yang berukuran N dengan nilai rata-rata μ dan standar
deviasi σ , maka distribusi sampling rata-rata sampel x akan
mendekati normal dengan nilai rata-rata dan standar deviasi
berikut:

μx = μ

dan

σ N−n
σx =
n N −1

Standar deviasi dari rata-rata ( σ x ) sering disebut juga standar error


rata-rata digunakan mengetahui variasi sampel sekitar rata-rata
N−n
populasi ( μ ) dan disebut factor koreksi populasi terhingga.
N −1

Jika pengambilan sampel dilakukan dengan pengembalian


(with replacement) yaitu tiap elemen sampel yang sudah diambil dan
diamati selalu dikembalikan kepada populasinya sebelum sampel
berikutnya diambil maka untuk jumlah sampel n ≥ 30 berlaku Dalil 2
berikut:
Apabila suatu sampel berukuran n diambil dari suatu populasi
terhingga yang berukuran N dengan nilai rata-rata μ dan standar
deviasi σ , maka distribusi sampling rata-rata sampel x akan
mendekati normal dengan nilai rata-rata dan standar deviasi
berikut:

127
Darnah Andi Nohe

μx = μ

dan
σ
σx =
n

Kembali pada Dalil 1, jika jumlah populasi N relatif besar


dibandingkan dengan jumlah sampel, maka faktor koreksi populasi
terhingga akan mendekati 1, sehingga berlaku rumus seperti pada
Dalil 2.
Jadi bagaimanapun bentuk distribusi populasinya, distribusi
sampling rata-rata selalu mendekati distribusi normal jika jumlah
sampelnya besar (n ≥ 30). Tetapi jika distribusi populasinya normal
atau standar deviasi populasi diketahui maka walaupun n < 30,
distribusi sampling rata-rata akan berdistribusi normal.
Untuk populasi yang besar atau tak hingga, baik diskrit atau
kontinu akan berlaku dalil Limit Pusat berikut:
Jika suatu sampel berukuran n diambil dari suatu populasi yang
besar atau tak hingga dengan nilai rata-rata μ dan standar deviasi
σ , maka nilai rata-rata sampel x akan mendekati normal dengan
σ
nilai rata-rata μ x = μ dan standar deviasi σ x = , sehingga
n
distribusi normal baku dapat digunakan dengan menggunakan
transformasi berikut:

x -μ
z=
σ n

128
Biostatistika 1

Contoh 8.3
Misalkan diketahui rata-rata berat badan mahasiswa Fakultas X
adalah 60 kg dan standar deviasi 9,5 kg. Kemudian diambil secara
acak 55 mahasiswa, maka:
d. Untuk menentukan probabilitas rata-rata berat badan ke-55
mahasiswa kurang dari 56 kg atau P(X < 56) , terlebih dahulu
kita menentukan nilai z yaitu:
x -μ 56 - 60
z= = = −3,13
σ n 9,5 55
Sehingga P(X < 56) = P(Z < −3,13) = 0,00087 .

e. Untuk menentukan probabilitas rata-rata berat badan ke-55


mahasiswa tersebut antara 62 sampai 68 atau P(62 ≤ X ≤ 68)
maka kita menentukan nilai-nilai z yang menjadi padanan x 1
dan x 2 , yaitu :

x1 - μ 62 - 60
z1 = = = 1,56 dan
σ n 9,5 55
x -μ 68 - 60
z2 = 2 = = 6,25 .
σ n 9,5 55

Sehingga:
P(62 < X < 68) = P(1,56 < Z < 6,25)
= P( Z < 6,25) − P( Z < 1,56)
= 1 - 0,94062
= 0,05938.

129
Darnah Andi Nohe

8.2 Distribusi sampling proporsi


Selain distribusi sampling rata-rata, ada juga distribusi
sampling proporsi. Suatu populasi yang berjumlah N dan didalamnya
terdapat suatu peristiwa sebanyak A, maka parameter proporsi
A
adalah P = . Jika dari populasi tersebut diambil sampel sebanyak n
N
dan di dalam sampel terdapat suatu peristiwa sebanyak a, maka
a
proporsi sampel adalah p = . Pada dasarnya nilai proporsi berbeda
n
dengan nilai persentase, nilai persentase diperoleh dari nilai proporsi
yang dikalikan dengan 100%. Namun dalam pembahasan ini, kata
proporsi menunjukkan nilai persentase.
Setiap kita melakukan penarikan sampel dari suatu populasi,
akan diperoleh proporsi sampel sehingga akan diperoleh kumpulan
proporsi sampel. Dari kumpulan proporsi sampel, kita dapat
memperoleh nilai rata-rata proporsi yang dilambangkan μ p dan
standar deviasi dari proporsi dilambangkan σ p .

Jika pengambilan sampel dilakukan dengan pengembalian dan


hasil perbandingan antara jumlah sampel dengan jumlah populasi
n
diatas 5% ( > 5% ), berlaku:
N
μp = P
dan
P(1 − P) N − n
σp =
n N −1

Dimana:
μ p : rata-rata dari kumpulan proporsi sampel

130
Biostatistika 1

P : proporsi populasi
σ p : standar error proporsi sampel
N: jumlah populasi
n: jumlah sampel
Sebaliknya, jika pengambilan sampel dilakukan dengan
pengembalian maka berlaku rumus berikut:
μp = P
dan
P(1 − P)
σp =
n

Standar deviasi dari proporsi ( σ p ) sering disebut juga standar error


proporsi (kekeliruan standar proporsi).
Jika dari populasi yang berdistribusi binomial dengan proporsi
parameter P dan proporsi sampel p, maka untuk ukuran sampel n
a
cukup besar atau n ≥ 30, maka distribusi sampling proporsi p =
n
mendekati distribusi normal. Sehingga:
μp = P
dan
P(1 − P)
σp =
n

Distribusi normal baku dapat digunakan dengan menggunakan


transformasi berikut:

p-P
z=
P(1 − P)
n

131
Darnah Andi Nohe

Dimana:
p: proporsi sampel.
P: proporsi populasi
n : banyaknya sampel

Contoh 8.3
Misalkan diketahui 20% wanita usia subur menggunakan kontrasepsi
non hormonal. Jika diambil sampel secara acak sebanyak 150 orang,
maka untuk menentukan probabilitas kurang dari 25 orang
diantaranya menggunakan kontrasepsi non hormonal, kita misalkan
X adalah banyaknya pengguna kontrasepsi non hormonal,
P= 0,20;
a = 25 : jumlah pengguna kontrasepsi non hormonal.
n= 150 : jumlah sampel.
a 25 P(1 − P) 0,20(1 − 0,20)
p= = = 0,17 ; σ p = = = 0,03 ;
n 150 n 150

Dan nilai z yang menjadi padanan x:

p-P 0,17 − 0,20


z= = = −1,00
P(1 − P) 0,03
n

Jadi probabilitas kurang dari 25 orang diantaranya menggunakan


kontrasepsi non hormonal adalah:
P(X < 25) = P(Z < -1,00)
= 0,15866 .

132
Biostatistika 1

8.3 Distribusi Selisih Rata-rata


Misalkan kita mempunyai dua populasi, yaitu populasi pertama
N1 dengan rata-rata μ1 dan standar deviasi σ1 , populasi kedua N 2
dengan rata-rata μ 2 dan standar deviasi σ 2 . Jika dari N1 diambil
sampel secara acak berukuran n 1 , akan diperoleh rata-rata x 1 dan
standar deviasi s1 . Begitu pula dari N 2 , jika diambil sampel secara
acak berukuran n 2 maka diperoleh rata-rata x 2 dan standar deviasi
s 2 . Distribusi semua selisih rata-rata sampel antara x 1 dan x 2 yang
independen disebut distribusi selisih rata-rata. Tujuan dipelajarinya
distribusi selisih rata-rata sampel adalah untuk mengetahui apakah
selisih rata-rata sampel x 1 - x 2 sama dengan selisih rata-rata populasi
μ1 - μ 2 .

Jika jumlah populasi N1 dan N 2 terhingga ataupun tak


terhingga dan relatif jauh lebih besar dibandingkan jumlah sampel
n 1 dan n 2 dan dilakukan pengambilan sampel secara acak dengan
pengembalian , baik data diskrit maupun kontinu akan berlaku:

μ x1 − x 2 = μ 1 − μ 2

dan

σ12 σ 22
σ x1 − x 2 = +
n1 n 2

Jika jumlah sampel n 1 dan n 2 lebih besar atau sama dengan 30,
maka selisih rata-rata sampel x 1 - x 2 akan berdistribusi normal.
Sehingga untuk perhitungan, kita membuat distribusi normal umum
menjadi distribusi normal baku dengan menggunakan transformasi
berikut:

133
Darnah Andi Nohe

(x1 − x 2 ) − (μ1 − μ 2 )
z=
σ12 σ 22
+
n1 n 2

dimana :
σ1 , σ 2 : standar deviasi populasi pertama dan kedua.
n 1 , n 2 : banyaknya sampel pertama dan kedua.
x 1 , x 2 : rata-rata sampel pertama dan kedua.
μ1 , μ 2 : rata-rata populasi pertama dan kedua.

Contoh 8.4
Misalkan diketahui rata-rata berat badan bayi laki-laki yang baru
lahir adalah 3,7 kg dengan standar deviasi 0,8 kg, sedangkan untuk
perempuan adalah 3,0 kg dengan standar deviasi 0,7 kg. Kemudian
diambil sampel independen dengan jumlah sampel yang sama, yaitu
100 bayi. Jika kita tertarik menentukan probabilitas selisih berat
badan bayi laki-laki dan perempuan kurang dari 1 kg atau
P( x 1 - x 2 ) < 1 , maka kita misalkan :

μ1 = 3,7; σ1 = 0,8; n 1 = 100;


μ 2 = 3,0; σ 2 = 0,7; n 2 = 100;
μ X1 − X 2 = μ1 − μ 2 = 3,7 – 3,0 = 0,7

dan

σ 12 σ 22 (0,8) 2 (0,7) 2
σ x1 − x2 = + = + = 0,11
n1 n2 100 100

134
Biostatistika 1

Nilai z yang menjadi padanan ( x1 - x 2 ) < 1 adalah:

(x1 − x 2 ) − (μ1 − μ 2 ) 1 − 0,7


z= = = 2,73
σ 2
σ 2 0,11
+
1 2
n1 n 2

Sehingga:
P(x1 − x 2 ) < 1 = P(Z < 2,73)
= 0,99683

8.4 Distribusi Selisih Proporsi


Misalkan kita mempunyai dua populasi, yaitu populasi pertama
N1 dan didalamnya terdapat suatu peristiwa sebanyak A1 maka
A
parameter proporsi pertama adalah P1 = 1 , populasi kedua N 2 dan
N1
didalamnya terdapat suatu peristiwa sebanyak A 2 maka parameter
A
proporsi kedua adalah P2 = 2 . Jika dari N1 diambil sampel secara
N2
acak berukuran n 1 dan di dalam sampel terdapat suatu peristiwa
a
sebanyak a 1 , maka proporsi sampel pertama adalah p1 = 1 . Jika
n1
dari N 2 diambil sampel secara acak berukuran n 2 dan di dalam
sampel terdapat suatu peristiwa sebanyak a 2 , maka proporsi sampel
a
kedua adalah p 2 = 2 . Distribusi semua selisih proporsi sampel
n2
antara p1 dan p 2 yang independen disebut distribusi selisih proporsi.
Tujuan dipelajarinya distribusi selisih proporsi sampel adalah untuk

135
Darnah Andi Nohe

mengetahui apakah selisih proporsi sampel p1 - p 2 sama dengan


selisih proporsi populasi P1 − P2 .

Jika jumlah populasi N1 dan N 2 terhingga ataupun tak


terhingga dan relatif jauh lebih besar dibandingkan jumlah sampel
n 1 dan n 2 kemudian dilakukan pengambilan sampel secara acak
dengan pengembalian , baik data diskrit maupun kontinu akan
berlaku:

μ p1 − p 2 = P1 − P2

dan

P1 (1 − P1 ) P2 (1 − P2 )
σ p1 − p 2 = +
n1 n2

Jika jumlah sampel n 1 dan n 2 lebih besar atau sama dengan 30,
maka selisih proporsi sampel p1 - p 2 yang berdistribusi binomial akan
berdistribusi normal. Sehingga untuk perhitungan, kita membuat
distribusi normal menjadi distribusi normal baku dengan
menggunakan transformasi berikut:

(p1 − p 2 ) − (P1 − P2 )
z=
P1 (1 − P1 ) P2 (1 − P2 )
+
n1 n2
dimana :
p1 , p 2 : proporsi sampel pertama dan kedua.
P1 , P2 : proporsi sampel pertama dan kedua.
n 1 , n 2 : banyaknya sampel pertama dan kedua.

136
Biostatistika 1

Contoh 8.5
Misalkan diketahui penderita Penyakit Jantung Koroner (PJK) di
kota A adalah 4% dan dikota B adalah 3,5%. Dari kota A diambil
sampel sebanyak 80 orang dan dari kota B sebanyak 100 orang. Jika
kita tertarik menentukan probabilitas selisih proporsi penderita PJK
antara kota A dan kota B lebih dari 0,65% atau P(p1 − p 2 ) > 0,0065 ,
maka kita misalkan :

P1 = 4%=0,04; n 1 = 80;
P2 = 3,5%=0,035; n 2 = 100;
μ p1 − p 2 = P1 − P2 = 0,04 – 0,035 = 0,005

dan

P1 (1 − P1 ) P2 (1 − P2 )
σ p1 − p 2 = +
n1 n2
0,04(1 − 0,04) 0,035(1 − 0,035)
= +
80 100
= 0,029

Nilai z yang menjadi padanan (p1 − p 2 ) > 0,0065 adalah:


(p1 − p 2 ) − (μ p1 − p 2 ) 0,0065 − 0,005
z= = = 0,05
σ p1 − p 2 0,029

Sehingga diperoleh:

P(p1 − p 2 ) > 0,0065 = P(Z > 0,05


= 1- P(Z<0,05)
= 1-0,51994
=0,4006

137
Darnah Andi Nohe

BAB 9
TEORI ESTIMASI

9.1 Pengantar
Pengumpulan data kuantitatif yang dilakukan dari penelitian
sampel menghasilkan nilai statistik yang bertujuan untuk menarik
suatu kesimpulan atau inferensi tentang nilai parameter populasi
darimana sampel tersebut diambil. Bagian statistika yang membahas
tentang penarikan kesimpulan atau generalisasi mengenai populasi
disebut statistika inferensi. Statistika inferensi dibagi menjadi dua
bagian utama, yaitu estimasi (pendugaan) dan pengujian hipotesis.
Pada bab ini akan dibahas tentang teori estimasi sedangkan pengujian
hipotesis akan dibahas terpisah.
Nilai yang diperoleh dari sampel disebut nilai statistik dan
nilai yang diperoleh dari populasi disebut nilai parameter. Nilai
statistik rata-rata yang diperoleh dari sampel adalah x dan
parameternya adalah μ . Nilai statistik yang digunakan untuk
menduga nilai parameter populasi disebut estimator, x merupakan
estimator bagi μ dan s merupakan estimator bagi σ . Dalam bab ini
akan dibahas tentang ciri-ciri estimator yang baik dan cara
mengestimasi nilai parameter rata-rata, proporsi, selisih rata-rata dan
selisih proporsi.
9.2 Ciri-ciri Estimator yang Baik
Estimator yang baik adalah estimator yang mendekati nilai
parameter populasi. Dengan kata lain, nilai statistik sampel tidak
bervariasi terlalu jauh dari nilai parameter. Ciri-ciri estimator yang
baik adalah tidak bias, efisien dan konsisten.

138
Biostatistika 1

9.2.1 Tidak Bias (unbiased)


Suatu estimator dikatakan tidak bias jika nilai harapan
(expected value) dari nilai statistik sampel sama dengan nilai
parameter populasi. x merupakan estimator yang tidak bias bagi μ
karena nilai harapan x sama dengan nilai parameter μ atau secara
matematis ditulis:
E(x) = μ

Sebaliknya, estimator dianggap bias jika E(x) ≠ μ .

Semakin dekat nilai statistik sampel dengan nilai parameter,


maka semakin baik dugaan yang diperoleh. Misalkan diketahui rata-
rata kadar nikotin rokok merk A adalah 21 mg. Pada pengambilan
sampel pertama sebanyak 8 batang dan diperoleh rata-rata kadar
nikotin 19,5 mg. Kemudian diambil sampel kedua sebanyak 12
batang, dari hasil pengukuran diperoleh rata-rata kadar nikotin 20,5
mg. Hal ini menunjukkan bahwa pengukuran kadar nikotin 12 batang
menghasilkan nilai statistik yang lebih baik karena lebih mendekati
nilai parameter dibandingkan dengan pengukuran kadar nikotin 8
batang.
9.2.2 Efisien (Efficient)
Estimator yang efisien adalah estimator yang tidak bias dan
mempunyai standar deviasi yang kecil dibandingkan estimator
lainnya. Jika x 1 dan x 2 adalah estimator tidak bias bagi nilai
parameter populasi dan masing-masing mempunyai standar deviasi
s1 dan s 2 , maka x 1 dikatakan estimator yang lebih baik daripada x 2
jika nilai s1 lebih kecil daripada s 2 , begitu pula sebaliknya.

Misalnya pada hasil pengukuran kadar nikotin rokok merk A,


pada sampel pertama diperoleh standar deviasi s1 = 0,7 mg dan pada

139
Darnah Andi Nohe

sampel kedua diperoleh standar deviasi s 2 = 0,5 mg. Nilai standar


deviasi sampel kedua lebih kecil dibandingkan sampel pertama
sehingga dapat dikatakan bahwa estimator yang diperoleh dari
sampel kedua lebih efisien daripada sampel pertama.
9.2.3 Konsisten (Consistent)
Estimator yang konsisten adalah estimator yang semakin
mendekati nilai parameter jika jumlah sampel n bertambah. x
merupakan estimator yang konsisten jika jumlah sampel bertambah
nilai x semakin mendekati nilai μ . Bahkan ketika jumlah sampel n
sama dengan jumlah populasi N maka nilai x = μ .

Kembali pada pengukuran kadar nikotin merk A, ketika


diambil sampel pertama sebanyak 8 batang diperoleh rata-rata kadar
nikotin 19,5 mg, pada sampel kedua sebanyak 12 batang diperoleh
rata-rata kadar nikotin 20,5 mg, jika diambil sampel ketiga sebanyak
40 batang rokok diperoleh kadar nikotin 20,89 mg maka dapat
dikatakan bahwa semakin banyak jumlah sampel maka nilai x
semakin mendekati nilai μ yaitu 21 mg. Jadi x adalah estimator
yang konsisten.
9.3 Cara Mengestimasi Nilai Parameter
Terdapat dua cara dalam mengestimasi nilai parameter, yaitu
estimasi titik dan estimasi interval. Estimasi titik merupakan
pendugaan dengan menggunakan satu nilai (titik) sampel untuk
mengestimasi nilai parameter populasi. Nilai parameter rata-rata
populasi μ diestimasi oleh x dan standar deviasi populasi σ
diestimasi oleh s.
Estimasi interval merupakan pendugaan dengan menggunakan
interval kepercayaan (confidence interval) berupa nilai batas bawah
dan batas atas dimana dengan probabilitas tertentu, nilai parameter

140
Biostatistika 1

populasi diduga berada pada interval tersebut. Berikut akan dibahas


estimasi interval untuk rata-rata, proporsi, selisih rata-rata dan selisih
proporsi.
9.3.1 Estimasi Interval untuk Rata-rata Populasi ( μ )

Pada Bab 8 telah dibahas bahwa distribusi sampling rata-rata


bagi x adalah normal dengan nilai rata-rata μ x = μ dan standar
σ
deviasi bagi x adalah σ x = . Jika luas daerah di sebelah kiri dan
n
α
kanan di bawah kurva normal adalah , dimana α adalah tingkat
2
signifikansi dan ( 1 − α )100% adalah interval kepercayaan, maka:

P(-z α < Z < z α ) = 1 − α


2 2

Dimana:

x −μ
Z=
σ
n
Sehingga:

x -μ
P(-z α < < zα ) =1− α
2
σ 2
n

σ
Jika kedua suku ketaksamaan dikalikan dengan , kemudian
n
mengurangkan x pada setiap suku dan terakhir mengalikan kedua
suku ketaksamaan dengan -1 akan diperoleh:

141
Darnah Andi Nohe

σ σ
P(x - z α < μ < x + zα ) =1− α
2 n 2 n

Sehingga untuk n ≥ 30 atau standar deviasi populasi diketahui maka


estimasi interval untuk rata-rata populasi adalah:

σ σ
x - zα < μ < x + zα
2 n 2 n

Dimana:
x : rata-rata sampel.
z : nilai yang diperoleh dari tabel normal.
α : tingkat signifikansi.
σ : standar deviasi populasi
n : banyaknya sampel
Sedangkan untuk n ≥ 30 tetapi standar deviasi populasi ( σ )
tidak diketahui, maka σ x diestimasi dengan s x sehingga estimasi
interval untuk rata-rata populasi adalah:

s s
x - zα < μ < x + zα
2 n 2 n

Dimana:
x : rata-rata sampel.
z : nilai yang diperoleh dari tabel normal.
α : tingkat signifikansi.
s : standar deviasi sampel
n : banyaknya sampel
Rumus tersebut juga berlaku meskipun jumlah sampel kecil (n < 30)
tetapi diambil dari populasi berdistribusi normal.

142
Biostatistika 1

Contoh 9.1
Misalkan seorang peneliti di bidang kesehatan ingin mengestimasi
rata-rata kadar gula darah sewaktu pasien diabetes mellitus (DM) di
rumah sakit X. Oleh karena itu diambil sampel sebanyak 49 orang
pasien secara random dan diperoleh rata-rata kadar gula darah
sewaktu ke-49 pasien tersebut adalah 300 mg/dL dengan standar
deviasi 94 mg/dL. Dengan menggunakan interval kepercayaan 95%,
nilai estimasi interval untuk rata-rata kadar gula darah sewaktu
pasien di rumah sakit X adalah:

s s
x - zα < μ < x + zα
2 n 2 n
94 94
300 - (1,96) < μ < 300 - (1,96)
49 49
273,67 < μ < 326,33 .

Jadi peneliti tersebut percaya 95% bahwa rata-rata kadar gula darah
sewaktu pasien DM di rumah sakit X berada di antara 273,67 mg/dL
dan 326,33 mg/dL sehingga jika dilakukan pengambilan sampel
sebanyak 100 kali hanya 5% diantaranya yang tidak berada pada
interval tersebut.
Sebelum kita melanjutkan pembahasan estimasi interval untuk
rata-rata populasi untuk jumlah sampel kecil, sebaiknya terlebih
dahulu dipahami cara menentukan nilai z dari Tabel Normal.
Langkah-langkahnya adalah:

α
1. Nilai α dibagi dengan 2, misalnya untuk α=5% maka = 0,025
2
2. Luas di bawah kurva normal adalah 1, maka 1 dikurangi
dengan nilai yang diperoleh pada nomor 1 sehingga diperoleh

143
Darnah Andi Nohe

nilai probabilitas di bawah kurva normal. Misalnya p = 1-0,025


= 0,97500.
3. Nilai yang diperoleh pada nomor 2 dicari pada Tabel Normal
di Lampiran 3, maka diperoleh nilai z yang bersesuaian.
Misalnya untuk p = 0,97500 diperoleh nilai z yang bersesuaian
adalah 1,96.
Selanjutnya untuk jumlah sampel n < 30 dan standar deviasi
populasi tidak diketahui maka σ x diestimasi dengan s x , maka
variabel random tidak mendekati distribusi normal tetapi mendekati
distibusi t–student. Seperti halnya distribusi normal, distribusi t–
student juga merupakan distribusi kontinu. Jika jumlah sampel
semakin besar, distribusi t akan mendekati distribusi normal.
Estimasi interval untuk rata-rata populasi untuk jumlah sampel
n < 30 dan standar deviasi populasi tidak diketahui adalah:

s s
x - tα < μ < x + tα
2 n 2 n

Dimana:
x : rata-rata sampel.
t : nilai yang diperoleh dari tabel t dengan df = n-1
α : tingkat signifikansi.
s : standar deviasi sampel
n : banyaknya sampel
Untuk menentukan nilai t, kita menggunakan tabel t pada Lampiran
4. Pada kolom terdapat nilai taraf signifikansi (α) dan pada baris
terdapat nilai derajat bebas (db) atau degree of freedom (df) yang
diperoleh dari jumlah sampel dikurangi satu atau df = n-1.
Perpotongan antara nilai α nilai df merupakan nilai t. Pada estimasi
interval, nilai α dibagi 2 sehingga jika nilai α = 5% maka kolom yang
dilihat adalah 0,025.

144
Biostatistika 1

Contoh 9.2
Berdasarkan kasus pada Contoh 9.1, misalkan sampel yang
diambil hanya 25 pasien, dan diperoleh rata-rata kadar gula darah
sewaktu ke-25 pasien tersebut adalah 230 mg/dL dengan standar
deviasi 110 mg/dL. Dengan menggunakan interval kepercayaan
95%, nilai estimasi interval untuk rata-rata kadar gula darah sewaktu
pasien di rumah sakit X adalah:
s s
x - tα < μ < x + tα
2 n 2 n
110 110
230 - (2,064) < μ < 230 - (2,064)
25 25
184,59 < μ < 275,41 .

Jadi peneliti tersebut percaya 95% bahwa rata-rata kadar gula darah
sewaktu pasien DM di rumah sakit X berada di antara 184,59 mg/dL
dan 275,41 mg/dL sehingga jika dilakukan pengambilan sampel
sebanyak 100 kali hanya 5% diantaranya yang tidak berada pada
interval tersebut.
9.3.2 Estimasi Interval untuk Proporsi Populasi (P)
Estimasi interval untuk proporsi hampir sama dengan rata-rata.
Untuk ukuran sampel n cukup besar atau n ≥ 30, distribusi binomial
akan mendekati distribusi normal sehingga estimasi interval untuk
proporsi populasi adalah:

p(1 - p) p(1 - p)
p - zα < P < p + zα
2 n 2 n

Dimana:
p: proporsi sampel.
z : nilai yang diperoleh dari tabel normal.

145
Darnah Andi Nohe

α : tingkat signifikansi.
n : banyaknya sampel
Contoh 9.3
Misalkan suatu penelitian dilakukan untuk mengetahui kualitas
pelayanan rumah sakit. Dari 500 pasien yang berkunjung di
Poliklinik pada 1 minggu terakhir, 300 orang diantaranya
menyatakan puas terhadap pelayanan rumah sakit dan sisanya merasa
tidak puas. Hal ini berarti proporsi pasien yang merasa puas terhadap
pelayanan rumah sakit adalah:

300 p(1 − p) 0,6(1 − 0,6)


p= = 0,6 dan = = 0,02
500 n 500

Dengan menggunakan interval kepercayaan 95%, estimasi interval


untuk proporsi kepuasan pelayanan pasien adalah:

p(1 - p) p(1 - p)
p - zα < P < p + zα
2 n 2 n
0,6 - (1,96 )(0,02) < P < 0,6 + (1,96 )(0,02)
0,56 < P < 0,64

Jadi peneliti percaya 95% bahwa pasien yang merasa puas terhadap
pelayanan rumah sakit ada sebanyak 0,56 x 500 = 280 orang sampai
0,64 x 500 = 320 orang.
Untuk ukuran sampel kecil atau n < 30, distribusi binomial akan
mendekati distribusi t-student sehingga estimasi interval untuk
proporsi populasi adalah:

p(1 - p) p(1 - p)
p- tα < P < p + tα
2 n 2 n

146
Biostatistika 1

Dimana:
p: proporsi sampel.
t : nilai yang diperoleh dari tabel t.
α : tingkat signifikansi.
n : banyaknya sampel
Contoh 9.4
Berdasarkan Contoh 9.3, misalkan dari 28 pasien yang berkunjung di
Poliklinik, 20 orang diantaranya menyatakan puas terhadap
pelayanan rumah sakit dan sisanya merasa tidak puas. Berarti
proporsi pasien yang merasa puas terhadap pelayanan rumah sakit
adalah:
20 p(1 − p) 0,7(1 − 0,7)
p= = 0,7 dan = = 0,09
28 n −1 28 − 1

Dengan menggunakan interval kepercayaan 95%, estimasi interval


untuk proporsi kepuasan pelayanan pasien adalah:
p(1 - p) p(1 - p)
p- tα < P < p + tα
2 n 2 n
0,7 - (2,052 )(0,09) < P < 0,7 + (2,052 )(0,09)
0,52 < P < 0,88
Jadi peneliti percaya 95% bahwa pasien yang merasa puas terhadap
pelayanan rumah sakit ada sebanyak 0,52 x 28 = 15 orang sampai
0,88 x 20 = 25 orang.
9.3.3 Estimasi Interval untuk Selisih Rata-Rata Populasi

Jika n ≥ 30 atau standar deviasi kedua populasi ( σ1 dan σ 2 )


diketahui, maka estimasi interval untuk selisih rata-rata populasi ( μ 1 -
μ 2 ) adalah :

147
Darnah Andi Nohe

σ 12 σ 22 σ 12 σ 22
(x1 - x 2 ) - z α + < (μ1 − μ 2 ) < (x1 - x 2 ) + z α +
2 n1 n2 2 n1 n2
dimana :
σ1 , σ 2 : standar deviasi populasi pertama dan kedua.
n 1 , n 2 : banyaknya sampel pertama dan kedua.
z : nilai yang diperoleh dari tabel normal.
x 1 , x 2 : rata-rata sampel pertama dan kedua.

Jika standar deviasi populasi tidak diketahui, nilai σ1 dan σ 2


diestimasi dengan s1 dan s 2 . Rumus tersebut juga berlaku untuk n <
30 tetapi diketahui distribusi kedua populasi berdistribusi normal.
Contoh 9.5
Misalkan diketahui standar deviasi berat badan bayi laki-laki yang
baru lahir adalah 0,8 kg dan perempuan 0,7 kg. Diambil sampel
masing-masing sebanyak 100 bayi, diperoleh rata-rata berat badan
bayi laki-laki 3,9 kg dan perempuan 3,4 kg. Diperoleh:

σ12 σ 22 (0,8) 2 (0,7) 2


+ = + = 0,11 .
n1 n 2 100 100

Dengan menggunakan interval kepercayaan 95%, estimasi interval


untuk selisih rata-rata berat badan bayi laki-laki dan perempuan
adalah:

σ 12 σ 22 σ 12 σ 22
(x1 - x 2 ) - z α + < (μ1 − μ 2 ) < (x1 - x 2 ) + z α +
2 n1 n2 2 n1 n2
(3,9 - 3,4) - (1,96)(0,11) < (μ1 − μ 2 ) < (3,9 - 3,4) + (1,96)(0,11)
0,28 < (μ1 − μ 2 ) < 0,72

148
Biostatistika 1

Jadi kita percaya 95% bahwa selisih rata-rata berat badan bayi laki-
laki dan perempuan berkisar antara 0,28 kg sampai 0,72 kg.

Jika n < 30 atau standar deviasi kedua populasi ( σ1 dan σ 2 )


tidak sama atau tidak diketahui, maka estimasi interval untuk selisih
rata-rata populasi ( μ1 - μ 2 ) adalah :
s12 s 22 s12 s 22
(x1 - x 2 ) - t α + < (μ1 − μ 2 ) < (x1 - x 2 ) + t α +
2 n1 n 2 2 n1 n 2

dimana :

s1 , s 2 : standar deviasi sampel pertama dan kedua.


n 1 , n 2 : banyaknya sampel pertama dan kedua.
x 1 , x 2 : rata-rata sampel pertama dan kedua.
t : nilai yang diperoleh dari tabel t dengan derajat bebas:
2
⎛ s12 s22 ⎞
⎜⎜ + ⎟⎟
df = ⎝ 12 2 ⎠ 2
n n
⎛ s12 ⎞ ⎛ s22 ⎞
⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟
⎝ 1 ⎠ + ⎝ n2 ⎠
n
n1 − 1 n2 − 1

9.3.4 Estimasi Interval untuk Selisih Proporsi Populasi

Selisih proporsi populasi ( P1 - P2 ) untuk n ≥ 30 dapat diestimasi


dengan menggunakan rumus berikut :
p1 (1 − p1 ) p (1 − p1 )
(p1 - p 2 ) - z α < (P1 − P2 ) < (p1 - p 2 ) + z α 1
2 n1 2 n1
dimana :
p1 , p 2 : proporsi sampel pertama dan kedua.

149
Darnah Andi Nohe

n 1 , n 2 : banyaknya sampel pertama dan kedua.


z: nilai yang diperoleh dari tabel normal.
Contoh 9.6
Misalkan ingin diketahui selisih proporsi penderita demam tifoid di
daerah perkotaan dan pedesaan. Untuk itu diambil sampel 200 orang
di daerah perkotaan dan 190 orang di pedesaan. Ternyata 135 orang
di daerah perkotaan dan 80 orang di daerah pedesaan menderita
demam tifoid. Hal ini berarti:

135
p1 = = 0,675 ; n 1 = 200
200
80
p2 = = 0,421 ; n 2 = 190
190
p1 - p 2 = 0,675-0,421 = 0,254.
0,675(1 − 0,675) 0,421(1 − 421)
+ = 0,049
200 190
Dengan menggunakan interval kepercayaan 95%, selisih proporsi
penderita demam tifoid di daerah perkotaan dan pedesaan adalah:
p1 (1 − p1 ) p (1 − p1 )
(p1 - p 2 ) - z α < (P1 − P2 ) < (p1 - p 2 ) + z α 1
2 n1 2 n1
0,254 - (1,96)(0,049) < (P1 − P2 ) < 0,254 + (1,96)(0,049)
0,518 < (P1 − P2 ) < 0,349

Jadi selisih penderita demam tifoid di daerah perkotaan dan pedesaan


berkisar antara 0,518 x 200 = 32 orang sampai 0,349 x 190 = 66
orang.

150
Biostatistika 1

9.4 Menentukan Ukuran Sampel


Pada dasarnya, kita menghendaki nilai statistik sampel yang
kita peroleh sama dengan nilai parameter populasi. Akan tetapi, hal
tersebut sulit terjadi karena kita harus melakukan sensus atau total
sampling, yaitu jumlah sampel sama dengan jumlah populasi.
Sehingga dibutuhkan ukuran sampel yang sesuai agar menghasilkan
nilai estimasi yang baik. Untuk menentukan ukuran sampel, ada
beberapa factor yang perlu diperhatikan, yaitu:
1. Apa yang akan diestimasi, misalnya rata-rata populasi atau
proporsi populasi.
2. Interval kepercayaan yang digunakan, misalnya 95% , 99%
atau angka lainnya.
3. Berapa besar kesalahan yang ditolerir.
4. Nilai standar deviasi, jika kita menginginkan nilai standar
deviasi sampel yang kecil maka dibutuhkan jumlah sampel
yang besar.
9.4.1 Jumlah Sampel untuk Estimasi Rata-rata Populasi
Interval kepercayaan merupakan ukuran ketelitian, bila semua
rata-rata populasi μ berada pada interval yang kita buat berarti x
mengestimasi μ tanpa kesalahan (error). Kesalahan biasanya
dilambangkan dengan ε . Akan tetapi hal tersebut sangat jarang
terjadi sehingga setiap nilai estimasi akan mempunyai kesalahan.
Kesalahan x dalam mengestimasi μ pada interval kepercayaan (1-
σ
α)100% tidak akan melebihi Z α atau ditulis:
2 n

σ
ε ≤ Zα
2 n

Dimana:

151
Darnah Andi Nohe

ε : kesalahan yang ditolerir.


z : nilai yang diperoleh dari tabel normal.
α : tingkat signifikansi.
σ : standar deviasi populasi
n : banyaknya sampel

Sehingga jumlah sampel yang harus diambil agar nilai rata-rata


sampel x dapat mengestimasi dengan baik nilai rata-rata populasi μ
adalah:

σ 2 z 2α
n= 2
2

ε
dimana:
n: banyaknya sampel.
σ : standar deviasi populasi
ε : kesalahan yang ditolerir.
z : nilai yang diperoleh dari tabel Normal
Contoh 9.7
Akan dilakukan penelitian untuk mengestimasi rata-rata kadar
haemoglobin (Hb) orang sehat, jika diketahui standar deviasi
populasi ( σ ) adalah 2,5 gr% maka banyaknya sampel yang harus
diambil dengan interval kepercayaan 95% bahwa selisih rata-rata
sampel dengan populasi tidak lebih dari 0,8 gr% adalah:

σ 2 z 2α
(2,5) 2 (1,96) 2
n= 2
= = 37,5 ≈ 38 orang.
ε2 (0,8) 2

152
Biostatistika 1

9.4.2 Jumlah Sampel untuk Estimasi Proporsi Populasi


Kesalahan proporsi sampel p dalam mengestimasi proporsi
populasi P pada interval kepercayaan (1-α)100% tidak akan melebihi
p(1 − p)
Zα atau ditulis:
2 n

p(1 − p)
ε ≤ Zα
2 n

Dimana:
ε : kesalahan yang ditolerir.
z : nilai yang diperoleh dari tabel normal.
p : proporsi.
n : banyaknya sampel

Sehingga jumlah sampel yang harus diambil untuk mengestimasi


proporsi populasi adalah:
2
⎛ Zα ⎞
⎜ ⎟
n = 0,25⎜ 2 ⎟
⎜ ε ⎟
⎝ ⎠
dimana:
n: banyaknya sampel.
ε : error atau kesalahan yang ditolerir.
z : nilai yang diperoleh dari tabel normal
Contoh 9.8
Misalkan kita ingin mengestimasi proporsi lansia di suatu provinsi
yang aktif berkunjung ke Posyandu Lansia, banyaknya sampel yang

153
Darnah Andi Nohe

harus diambil dengan interval kepercayaan 95% dan kesalahan


penarikan sampel tidak melebihi 6% adalah:
2
⎛ Zα ⎞ 2
⎜ ⎟ ⎛ 1,96 ⎞
n = 0,25⎜ 2 ⎟ = 0,25⎜ ⎟ = 1.067,11 ≈ 1.068 orang.
⎜ ε ⎟ ⎝ 0,06 ⎠
⎝ ⎠

154
Biostatistika 1

REFERENSI

Ardilly, P. 2006. Sampling Methods ,Exercises and Solutions.


Springer. New York.
Azwar, A dan Prihartono, J. 2003. Metodologi Penelitian
Kedokteran dan Kesehatan Masyarakat. Binarupa Aksara.
Jakarta.
Budiarto, E. 2003. Biostatistik. Penerbit Buku Kedokteran, EGC.
Jakarta.
Dahlan S. 2008. Statistik Untuk Kedokteran dan Kesehatan. Salemba
Medika. Jakarta.
Fisher etc. Biostatistics, A Methodology for the Health Sciences.
John Wiley & Sons. New York.
Gay,L.R dan Diehl,P.L. 1992. Research Methods for Business and
Management, MacMillan Publishing Company, New York.

Notoatmodjo, S. 2005. Metodologi Penelitian Kesehatan. Rineka


Cipta. Jakarta.
Siegel, S. Non Parametrc Statistics for The Bihavoural Sciences.
McGraw-Hill Book Company. New York.
Sekaran, U. 1984. Research Methods for Business. Southern Illinois
University. Carbondale.
Supranto, J. 2000. Teknik Sampling untuk Survei dan Eksperimen.
Rineka Cipta. Jakarta.
Supranto, J. 2000. Statistika, Teori dan Aplikasi. Erlangga. Jakarta.

155
Darnah Andi Nohe

Sudjana. 2005. Metoda Statistika. Tarsito. Bandung.


Sugiyono. 2008. Metode Penelitian Kuantitatif Kualitatif dan R&D.
Alfabeta. Bandung.
Walpole, RE. 1995. Pengantar Statistika. Gramedia. Jakarta.

156
Biostatistika 1

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,9000 0,8000 0,7000 0,6000 0,5000 0,4000 0,3000 0,2000 0,1000
1
1 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,8100 0,6400 0,4900 0,3600 0,2500 0,1600 0,0900 0,0400 0,0100


2 1 0,9900 0,9600 0,9100 0,8400 0,7500 0,6400 0,5100 0,3600 0,1900
2 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,7290 0,5120 0,3430 0,2160 0,1250 0,0640 0,0270 0,0080 0,0010


1 0,9720 0,8960 0,7840 0,6480 0,5000 0,3520 0,2160 0,1040 0,0280
3
2 0,9990 0,9920 0,9730 0,9360 0,8750 0,7840 0,6570 0,4880 0,2710
3 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,6561 0,4096 0,2401 0,1296 0,0625 0,0256 0,0081 0,0016 0,0001


1 0,9477 0,8192 0,6517 0,4752 0,3125 0,1792 0,0837 0,0272 0,0037
4 2 0,9963 0,9728 0,9163 0,8208 0,6875 0,5248 0,3483 0,1808 0,0523
3 0,9999 0,9984 0,9919 0,9744 0,9375 0,8704 0,7599 0,5904 0,3439
4 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,5905 0,3277 0,1681 0,0778 0,0313 0,0102 0,0024 0,0003 0,0000


1 0,9185 0,7373 0,5282 0,3370 0,1875 0,0870 0,0308 0,0067 0,0005
2 0,9914 0,9421 0,8369 0,6826 0,5000 0,3174 0,1631 0,0579 0,0086
5
3 0,9995 0,9933 0,9692 0,9130 0,8125 0,6630 0,4718 0,2627 0,0815
4 1,0000 0,9997 0,9976 0,9898 0,9688 0,9222 0,8319 0,6723 0,4095
5 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

157
Darnah Andi Nohe

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,5314 0,2621 0,1176 0,0467 0,0156 0,0041 0,0007 0,0001 0,0000
1 0,8857 0,6554 0,4202 0,2333 0,1094 0,0410 0,0109 0,0016 0,0001
2 0,9842 0,9011 0,7443 0,5443 0,3438 0,1792 0,0705 0,0170 0,0013
6 3 0,9987 0,9830 0,9295 0,8208 0,6563 0,4557 0,2557 0,0989 0,0159
4 0,9999 0,9984 0,9891 0,9590 0,8906 0,7667 0,5798 0,3446 0,1143
5 1,0000 0,9999 0,9993 0,9959 0,9844 0,9533 0,8824 0,7379 0,4686
6 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,4783 0,2097 0,0824 0,0280 0,0078 0,0016 0,0002 0,0000 0,0000


1 0,8503 0,5767 0,3294 0,1586 0,0625 0,0188 0,0038 0,0004 0,0000
2 0,9743 0,8520 0,6471 0,4199 0,2266 0,0963 0,0288 0,0047 0,0002
3 0,9973 0,9667 0,8740 0,7102 0,5000 0,2898 0,1260 0,0333 0,0027
7
4 0,9998 0,9953 0,9712 0,9037 0,7734 0,5801 0,3529 0,1480 0,0257
5 1,0000 0,9996 0,9962 0,9812 0,9375 0,8414 0,6706 0,4233 0,1497
6 1,0000 1,0000 0,9998 0,9984 0,9922 0,9720 0,9176 0,7903 0,5217
7 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,4305 0,1678 0,0576 0,0168 0,0039 0,0007 0,0001 0,0000 0,0000


1 0,8131 0,5033 0,2553 0,1064 0,0352 0,0085 0,0013 0,0001 0,0000
2 0,9619 0,7969 0,5518 0,3154 0,1445 0,0498 0,0113 0,0012 0,0000
3 0,9950 0,9437 0,8059 0,5941 0,3633 0,1737 0,0580 0,0104 0,0004
8 4 0,9996 0,9896 0,9420 0,8263 0,6367 0,4059 0,1941 0,0563 0,0050
5 1,0000 0,9988 0,9887 0,9502 0,8555 0,6846 0,4482 0,2031 0,0381
6 1,0000 0,9999 0,9987 0,9915 0,9648 0,8936 0,7447 0,4967 0,1869
7 1,0000 1,0000 0,9999 0,9993 0,9961 0,9832 0,9424 0,8322 0,5695
8 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

158
Biostatistika 1

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,3874 0,1342 0,0404 0,0101 0,0020 0,0003 0,0000 0,0000 0,0000
1 0,7748 0,4362 0,1960 0,0705 0,0195 0,0038 0,0004 0,0000 0,0000
2 0,9470 0,7382 0,4628 0,2318 0,0898 0,0250 0,0043 0,0003 0,0000
3 0,9917 0,9144 0,7297 0,4826 0,2539 0,0994 0,0253 0,0031 0,0001
4 0,9991 0,9804 0,9012 0,7334 0,5000 0,2666 0,0988 0,0196 0,0009
9
5 0,9999 0,9969 0,9747 0,9006 0,7461 0,5174 0,2703 0,0856 0,0083
6 1,0000 0,9997 0,9957 0,9750 0,9102 0,7682 0,5372 0,2618 0,0530
7 1,0000 1,0000 0,9996 0,9962 0,9805 0,9295 0,8040 0,5638 0,2252
8 1,0000 1,0000 1,0000 0,9997 0,9980 0,9899 0,9596 0,8658 0,6126
9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
0 0,3487 0,1074 0,0282 0,0060 0,0010 0,0001 0,0000 0,0000 0,0000
1 0,7361 0,3758 0,1493 0,0464 0,0107 0,0017 0,0001 0,0000 0,0000
2 0,9298 0,6778 0,3828 0,1673 0,0547 0,0123 0,0016 0,0001 0,0000
3 0,9872 0,8791 0,6496 0,3823 0,1719 0,0548 0,0106 0,0009 0,0000
4 0,9984 0,9672 0,8497 0,6331 0,3770 0,1662 0,0473 0,0064 0,0001
10 5 0,9999 0,9936 0,9527 0,8338 0,6230 0,3669 0,1503 0,0328 0,0016
6 1,0000 0,9991 0,9894 0,9452 0,8281 0,6177 0,3504 0,1209 0,0128
7 1,0000 0,9999 0,9984 0,9877 0,9453 0,8327 0,6172 0,3222 0,0702
8 1,0000 1,0000 0,9999 0,9933 0,9893 0,9536 0,8507 0,6242 0,2639
9 1,0000 1,0000 1,0000 0,9999 0,9990 0,9940 0,9718 0,8926 0,6513
10 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

159
Darnah Andi Nohe

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,3138 0,0859 0,0198 0,0036 0,0005 0,0000 0,0000 0,0000 0,0000
1 0,6974 0,3221 0,1130 0,0302 0,0059 0,0007 0,0000 0,0000 0,0000
2 0,9104 0,6174 0,3127 0,1189 0,0327 0,0059 0,0006 0,0000 0,0000
3 0,9815 0,8389 0,5696 0,2963 0,1133 0,0293 0,0043 0,0002 0,0000
4 0,9972 0,9496 0,7897 0,5328 0,2744 0,0994 0,0216 0,0020 0,0000
5 0,9997 0,9883 0,9218 0,7535 0,5000 0,2465 0,0782 0,0117 0,0003
11
6 1,0000 0,9980 0,9784 0,9006 0,7256 0,4672 0,2103 0,0504 0,0028
7 1,0000 0,9998 0,9957 0,9707 0,8867 0,7037 0,4304 0,1611 0,0185
8 1,0000 1,0000 0,9994 0,9941 0,9673 0,8811 0,6873 0,3826 0,0896
9 1,0000 1,0000 1,0000 0,9993 0,9941 0,9698 0,8870 0,6779 0,3026
10 1,0000 1,0000 1,0000 1,0000 0,9995 0,9964 0,9802 0,9141 0,6862
11 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

0 0,2824 0,0687 0,0138 0,0022 0,0002 0,0000 0,0000 0,0000 0,0000


1 0,6590 0,2749 0,0850 0,0196 0,0032 0,0003 0,0000 0,0000 0,0000
2 0,8891 0,5583 0,2528 0,0834 0,0193 0,0028 0,0002 0,0000 0,0000
3 0,9744 0,7946 0,4925 0,2253 0,0730 0,0153 0,0017 0,0001 0,0000
4 0,9957 0,9274 0,7237 0,4382 0,1938 0,0573 0,0095 0,0006 0,0000
5 0,9995 0,9806 0,8822 0,6652 0,3872 0,1582 0,0386 0,0039 0,0001
12 6 0,9999 0,9961 0,9614 0,8418 0,6128 0,3348 0,1178 0,0194 0,0005
7 1,0000 0,9994 0,9905 0,9427 0,8062 0,5618 0,2763 0,0726 0,0043
8 1,0000 0,9999 0,9983 0,9847 0,9270 0,7747 0,5075 0,2054 0,0256
9 1,0000 1,0000 0,9998 0,9972 0,9807 0,9166 0,7472 0,4417 0,1109
10 1,0000 1,0000 1,0000 0,9997 0,9968 0,9804 0,9150 0,7251 0,3410
11 1,0000 1,0000 1,0000 1,0000 0,9998 0,9978 0,9862 0,9313 0,7176
12 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

160
Biostatistika 1

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,2542 0,0550 0,0097 0,0013 0,0001 0,0000 0,0000 0,0000 0,0000
1 0,6213 0,2336 0,0637 0,0126 0,0017 0,0001 0,0000 0,0000 0,0000
2 0,8661 0,5017 0,2025 0,0579 0,0112 0,0013 0,0001 0,0000 0,0000
3 0,9658 0,7473 0,4206 0,1686 0,0461 0,0078 0,0007 0,0000 0,0000
4 0,9935 0,9009 0,6543 0,3530 0,1334 0,0321 0,0040 0,0002 0,0000
5 0,9991 0,9700 0,8346 0,5744 0,2905 0,0977 0,0182 0,0012 0,0000
6 0,9999 0,9930 0,9376 0,7712 0,5000 0,2288 0,0624 0,0070 0,0001
13
7 1,0000 0,9988 0,9818 0,9023 0,7095 0,4256 0,1654 0,0300 0,0009
8 1,0000 0,9998 0,9960 0,9679 0,8666 0,6470 0,3457 0,0991 0,0065
9 1,0000 1,0000 0,9993 0,9922 0,9539 0,8314 0,5794 0,2527 0,0342
10 1,0000 1,0000 0,9999 0,9987 0,9888 0,9421 0,7975 0,4983 0,1339
11 1,0000 1,0000 1,0000 0,9999 0,9983 0,9874 0,9363 0,7664 0,3787
12 1,0000 1,0000 1,0000 1,0000 0,9999 0,9987 0,9903 0,9450 0,7458
13 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

161
Darnah Andi Nohe

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,2288 0,0440 0,0068 0,0008 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,5846 0,1979 0,0475 0,0081 0,0009 0,0001 0,0000 0,0000 0,0000
2 0,8416 0,4481 0,1608 0,0398 0,0065 0,0006 0,0000 0,0000 0,0000
3 0,9559 0,6982 0,3552 0,1243 0,0287 0,0039 0,0002 0,0000 0,0000
4 0,9908 0,8702 0,5842 0,2793 0,0898 0,0175 0,0017 0,0000 0,0000
5 0,9985 0,9561 0,7805 0,4859 0,2120 0,0583 0,0083 0,0004 0,0000
6 0,9998 0,9884 0,9067 0,6925 0,3953 0,1501 0,0315 0,0024 0,0000
14 7 1,0000 0,9976 0,9785 0,8499 0,6047 0,3075 0,0933 0,0116 0,0002
8 1,0000 0,9996 0,9917 0,9417 0,7880 0,5141 0,2195 0,0439 0,0015
9 1,0000 1,0000 0,9983 0,9825 0,9102 0,7207 0,4158 0,1298 0,0092
10 1,0000 1,0000 0,9998 0,9961 0,9713 0,8757 0,6448 0,3018 0,0441
11 1,0000 1,0000 1,0000 0,9994 0,9935 0,9602 0,8392 0,5519 0,1584
12 1,0000 1,0000 1,0000 0,9999 0,9991 0,9919 0,9525 0,8021 0,4145
13 1,0000 1,0000 1,0000 1,0000 0,9999 0,9992 0,9932 0,9560 0,7712
14 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

162
Biostatistika 1

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,2059 0,0352 0,0047 0,0005 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,5490 0,1671 0,0353 0,0052 0,0005 0,0000 0,0000 0,0000 0,0000
2 0,8159 0,3980 0,1268 0,0271 0,0037 0,0003 0,0000 0,0000 0,0000
3 0,9444 0,6482 0,2969 0,0905 0,0176 0,0019 0,0001 0,0000 0,0000
4 0,9873 0,8358 0,5155 0,2173 0,0592 0,0093 0,0007 0,0000 0,0000
5 0,9978 0,9389 0,7216 0,4032 0,1509 0,0338 0,0037 0,0001 0,0000
6 0,9997 0,9819 0,8689 0,6098 0,3036 0,0950 0,0152 0,0008 0,0000
7 1,0000 0,9958 0,9500 0,7869 0,5000 0,2131 0,0500 0,0042 0,0000
15
8 1,0000 0,9992 0,9848 0,9050 0,6964 0,3902 0,1311 0,0181 0,0003
9 1,0000 0,9999 0,9963 0,9662 0,8491 0,5968 0,2784 0,0611 0,0022
10 1,0000 1,0000 0,9993 0,9907 0,9408 0,7827 0,4845 0,1642 0,0127
11 1,0000 1,0000 0,9999 0,9981 0,9824 0,9095 0,7031 0,3518 0,0556
12 1,0000 1,0000 1,0000 0,9997 0,9963 0,9729 0,8732 0,6020 0,1841
13 1,0000 1,0000 1,0000 1,0000 0,9995 0,9948 0,9647 0,8329 0,4510
14 1,0000 1,0000 1,0000 1,0000 1,0000 0,9995 0,9953 0,9648 0,7941
15 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

163
Darnah Andi Nohe

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,1853 0,0281 0,0033 0,0003 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,5147 0,1407 0,0261 0,0033 0,0003 0,0000 0,0000 0,0000 0,0000
2 0,7892 0,3518 0,0994 0,0183 0,0021 0,0001 0,0000 0,0000 0,0000
3 0,9316 0,5981 0,2459 0,0651 0,0106 0,0009 0,0000 0,0000 0,0000
4 0,9830 0,7982 0,4499 0,1666 0,0384 0,0049 0,0003 0,0000 0,0000
5 0,9967 0,9183 0,6598 0,3288 0,1051 0,0191 0,0016 0,0000 0,0000
6 0,9995 0,9733 0,8247 0,5272 0,2272 0,0583 0,0071 0,0002 0,0000
7 0,9999 0,9930 0,9256 0,7161 0,4018 0,1423 0,0257 0,0015 0,0000
16 8 1,0000 0,9985 0,9743 0,8577 0,5982 0,2839 0,0744 0,0070 0,0001
9 1,0000 0,9998 0,9929 0,9417 0,7728 0,4728 0,1753 0,0367 0,0005
10 1,0000 1,0000 0,9984 0,9809 0,8949 0,6712 0,3402 0,0817 0,0033
11 1,0000 1,0000 0,9997 0,9951 0,9616 0,8334 0,5501 0,2018 0,0170
12 1,0000 1,0000 1,0000 0,9991 0,9894 0,9349 0,7541 0,4019 0,0684
13 1,0000 1,0000 1,0000 0,9999 0,9979 0,9817 0,9006 0,6482 0,2108
14 1,0000 1,0000 1,0000 1,0000 0,9997 0,9967 0,9739 0,8593 0,4853
15 1,0000 1,0000 1,0000 1,0000 1,0000 0,9997 0,9967 0,9719 0,8147
16 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

164
Biostatistika 1

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,1668 0,0225 0,0023 0,0002 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,4818 0,1182 0,0193 0,0021 0,0001 0,0000 0,0000 0,0000 0,0000
2 0,7618 0,3096 0,0774 0,0123 0,0012 0,0001 0,0000 0,0000 0,0000
3 0,9174 0,5489 0,2019 0,0464 0,0064 0,0005 0,0000 0,0000 0,0000
4 0,9779 0,7582 0,3887 0,1260 0,0245 0,0025 0,0001 0,0000 0,0000
5 0,9953 0,8943 0,5968 0,2639 0,0717 0,0106 0,0007 0,0000 0,0000
6 0,9992 0,9623 0,7752 0,4478 0,1662 0,0348 0,0032 0,0001 0,0000
7 0,9999 0,9891 0,8954 0,6405 0,3145 0,0919 0,0127 0,0005 0,0000
8 1,0000 0,9974 0,9597 0,8011 0,5000 0,1989 0,0403 0,0026 0,0000
17
9 1,0000 0,9995 0,9873 0,9081 0,6855 0,3595 0,1046 0,0109 0,0001
10 1,0000 0,9999 0,9968 0,9652 0,8338 0,5522 0,2248 0,0377 0,0008
11 1,0000 1,0000 0,9993 0,9894 0,9283 0,7361 0,4032 0,1057 0,0047
12 1,0000 1,0000 0,9999 0,9975 0,9755 0,8740 0,6113 0,2418 0,0221
13 1,0000 1,0000 1,0000 0,9995 0,9936 0,9536 0,7981 0,4511 0,0826
14 1,0000 1,0000 1,0000 0,9999 0,9988 0,9877 0,9226 0,6904 0,2382
15 1,0000 1,0000 1,0000 1,0000 0,9999 0,9979 0,9807 0,8818 0,5182
16 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9977 0,9775 0,8332
17 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

165
Darnah Andi Nohe

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)
p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,1501 0,0180 0,0016 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,4503 0,0991 0,0142 0,0013 0,0001 0,0000 0,0000 0,0000 0,0000
2 0,7338 0,2713 0,0600 0,0082 0,0007 0,0000 0,0000 0,0000 0,0000
3 0,9018 0,5010 0,1646 0,0328 0,0038 0,0002 0,0000 0,0000 0,0000
4 0,9718 0,7164 0,3327 0,0942 0,0154 0,0013 0,0000 0,0000 0,0000
5 0,9936 0,8671 0,5344 0,2088 0,0481 0,0058 0,0003 0,0000 0,0000
6 0,9988 0,9487 0,7217 0,3743 0,1189 0,0203 0,0014 0,0000 0,0000
7 0,9998 0,9837 0,8593 0,5634 0,2403 0,0576 0,0061 0,0002 0,0000
8 1,0000 0,9957 0,9404 0,7368 0,4073 0,1347 0,0210 0,0009 0,0000
18 9 1,0000 0,9991 0,9790 0,8653 0,5927 0,2632 0,0596 0,0043 0,0000
10 1,0000 0,9998 0,9939 0,9424 0,7597 0,4366 0,1407 0,0163 0,0002
11 1,0000 1,0000 0,9986 0,9797 0,8811 0,6257 0,2783 0,0513 0,0012
12 1,0000 1,0000 0,9997 0,9942 0,9519 0,7912 0,4656 0,1329 0,0064
13 1,0000 1,0000 1,0000 0,9987 0,9846 0,9058 0,6673 0,2836 0,0282
14 1,0000 1,0000 1,0000 0,9998 0,9962 0,9672 0,8354 0,4990 0,0982
15 1,0000 1,0000 1,0000 1,0000 0,9993 0,9918 0,9400 0,7287 0,2662
16 1,0000 1,0000 1,0000 1,0000 0,9999 0,9987 0,9858 0,9009 0,5497
17 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9984 0,9820 0,8499
18 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

166
Biostatistika 1

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)

p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,1351 0,0144 0,0011 0,0001 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,4203 0,0829 0,0104 0,0008 0,0000 0,0000 0,0000 0,0000 0,0000
2 0,7054 0,2369 0,0462 0,0055 0,0004 0,0000 0,0000 0,0000 0,0000
3 0,8850 0,4551 0,1332 0,0230 0,0022 0,0001 0,0000 0,0000 0,0000
4 0,9648 0,6733 0,2822 0,0696 0,0096 0,0006 0,0000 0,0000 0,0000
5 0,9914 0,8369 0,4739 0,1629 0,0318 0,0031 0,0001 0,0000 0,0000
6 0,9983 0,9324 0,6655 0,3081 0,0835 0,0116 0,0006 0,0000 0,0000
7 0,9997 0,9767 0,8180 0,4878 0,1796 0,0352 0,0028 0,0000 0,0000
8 1,0000 0,9933 0,9161 0,6675 0,3238 0,0885 0,0105 0,0003 0,0000
9 1,0000 0,9984 0,9674 0,8139 0,5000 0,1861 0,0326 0,0016 0,0000
19
10 1,0000 0,9997 0,9895 0,9115 0,6762 0,3325 0,0839 0,0067 0,0000
11 1,0000 1,0000 0,9972 0,9648 0,8204 0,5122 0,1820 0,0233 0,0003
12 1,0000 1,0000 0,9994 0,9884 0,9165 0,6919 0,3345 0,0676 0,0017
13 1,0000 1,0000 0,9999 0,9969 0,9682 0,8371 0,5261 0,1631 0,0086
14 1,0000 1,0000 1,0000 0,9994 0,9904 0,9304 0,7178 0,3267 0,0352
15 1,0000 1,0000 1,0000 0,9999 0,9978 0,9770 0,8668 0,5449 0,1150
16 1,0000 1,0000 1,0000 1,0000 0,9996 0,9945 0,9538 0,7631 0,2946
17 1,0000 1,0000 1,0000 1,0000 1,0000 0,9992 0,9896 0,9171 0,5797
18 1,0000 1,0000 1,0000 1,0000 1,0000 0,9999 0,9989 0,9856 0,8649
19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

167
Darnah Andi Nohe

Lampiran 1. Tabel Distribusi Probabilitas Binomial Kumulatif


(Lanjutan)

p
n x
0,10 0,20 0,30 0,40 0,50 0,60 0,70 0,80 0,90
0 0,1216 0,0115 0,0008 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000
1 0,3917 0,0692 0,0076 0,0005 0,0000 0,0000 0,0000 0,0000 0,0000
2 0,6769 0,2061 0,0355 0,0036 0,0002 0,0000 0,0000 0,0000 0,0000
3 0,8670 0,4114 0,1071 0,0160 0,0013 0,0000 0,0000 0,0000 0,0000
4 0,9568 0,6296 0,2357 0,0510 0,0059 0,0003 0,0000 0,0000 0,0000
5 0,9887 0,8042 0,4164 0,1256 0,0207 0,0016 0,0000 0,0000 0,0000
6 0,9976 0,9133 0,6080 0,2500 0,0577 0,0065 0,0003 0,0000 0,0000
7 0,9996 0,9679 0,7723 0,4159 0,1316 0,0210 0,0013 0,0000 0,0000
8 0,9999 0,9900 0,8867 0,5956 0,2517 0,0565 0,0051 0,0001 0,0000
9 1,0000 0,9974 0,9520 0,7553 0,4119 0,1275 0,0171 0,0006 0,0000
20 10 1,0000 0,9994 0,9829 0,8725 0,5881 0,2447 0,0480 0,0026 0,0000
11 1,0000 0,9999 0,9949 0,9435 0,7483 0,4044 0,1133 0,0100 0,0001
12 1,0000 1,0000 0,9987 0,9790 0,8684 0,5841 0,2277 0,0321 0,0004
13 1,0000 1,0000 0,9997 0,9935 0,9423 0,7500 0,3920 0,0867 0,0024
14 1,0000 1,0000 1,0000 0,9984 0,9793 0,8744 0,5836 0,1958 0,0113
15 1,0000 1,0000 1,0000 0,9997 0,9941 0,9490 0,7625 0,3704 0,0432
16 1,0000 1,0000 1,0000 1,0000 0,9987 0,9840 0,8929 0,5886 0,1330
17 1,0000 1,0000 1,0000 1,0000 0,9998 0,9964 0,9645 0,7939 0,3231
18 1,0000 1,0000 1,0000 1,0000 1,0000 0,9995 0,9924 0,9308 0,6083
19 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9992 0,9885 0,8784
20 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000

168
Biostatistika 1

Lampiran 2. Tabel Distribusi Poisson


µ
x
0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 1.00
0 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066 0.3679
1 0.9825 0.9631 0.9384 0.9098 0.8781 0.8442 0.8088 0.7725 0.7358
2 0.9989 0.9964 0.9921 0.9856 0.9769 0.9659 0.9526 0.9371 0.9197
3 0.9999 0.9997 0.9992 0.9982 0.9966 0.9942 0.9909 0.9865 0.9810
4 1.0000 1.0000 0.9999 0.9998 0.9996 0.9992 0.9986 0.9977 0.9963
5 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9998 0.9997 0.9994
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999
µ
x
1.20 1.30 1.40 1.50 1.60 1.70 1.80 1.90 2.00
0 0.3012 0.2725 0.2466 0.2231 0.2019 0.1827 0.1653 0.1496 0.1353
1 0.6626 0.6268 0.5918 0.5578 0.5249 0.4932 0.4628 0.4337 0.4060
2 0.8795 0.8571 0.8335 0.8088 0.7834 0.7572 0.7306 0.7037 0.6767
3 0.9662 0.9569 0.9463 0.9344 0.9212 0.9068 0.8913 0.8747 0.8571
4 0.9923 0.9893 0.9857 0.9814 0.9763 0.9704 0.9636 0.9559 0.9473
5 0.9985 0.9978 0.9968 0.9955 0.9940 0.9920 0.9896 0.9868 0.9834
6 0.9997 0.9996 0.9994 0.9991 0.9987 0.9981 0.9974 0.9966 0.9955
7 1.0000 0.9999 0.9999 0.9998 0.9997 0.9996 0.9994 0.9992 0.9989
8 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9999 0.9998 0.9998
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

169
Darnah Andi Nohe

Lampiran 2. Tabel Distribusi Poisson (Lanjutan)

µ
X
2.20 2.30 2.40 2.50 2.60 2.70 2.80 2.90 3.00
0 0.1108 0.1003 0.0907 0.0821 0.0743 0.0672 0.0608 0.0550 0.0498
1 0.3546 0.3309 0.3084 0.2873 0.2674 0.2487 0.2311 0.2146 0.1991
2 0.6227 0.5960 0.5697 0.5438 0.5184 0.4936 0.4695 0.4460 0.4232
3 0.8194 0.7993 0.7787 0.7576 0.7360 0.7141 0.6919 0.6696 0.6472
4 0.9275 0.9162 0.9041 0.8912 0.8774 0.8629 0.8477 0.8318 0.8153
5 0.9751 0.9700 0.9643 0.9580 0.9510 0.9433 0.9349 0.9258 0.9161
6 0.9925 0.9906 0.9884 0.9858 0.9828 0.9794 0.9756 0.9713 0.9665
7 0.9980 0.9974 0.9967 0.9958 0.9947 0.9934 0.9919 0.9901 0.9881
8 0.9995 0.9994 0.9991 0.9989 0.9985 0.9981 0.9976 0.9969 0.9962
9 0.9999 0.9999 0.9998 0.9997 0.9996 0.9995 0.9993 0.9991 0.9989
10 1.0000 1.0000 1.0000 0.9999 0.9999 0.9999 0.9998 0.9998 0.9997
11 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9999
µ
x
3.20 3.30 3.40 3.50 3.60 3.70 3.80 3.90 4.00
0 0.0408 0.0369 0.0334 0.0302 0.0273 0.0247 0.0224 0.0202 0.0183
1 0.1712 0.1586 0.1468 0.1359 0.1257 0.1162 0.1074 0.0992 0.0916
2 0.3799 0.3594 0.3397 0.3208 0.3027 0.2854 0.2689 0.2531 0.2381
3 0.6025 0.5803 0.5584 0.5366 0.5152 0.4942 0.4735 0.4532 0.4335
4 0.7806 0.7626 0.7442 0.7254 0.7064 0.6872 0.6678 0.6484 0.6288
5 0.8946 0.8829 0.8705 0.8576 0.8441 0.8301 0.8156 0.8006 0.7851
6 0.9554 0.9490 0.9421 0.9347 0.9267 0.9182 0.9091 0.8995 0.8893
7 0.9832 0.9802 0.9769 0.9733 0.9692 0.9648 0.9599 0.9546 0.9489
8 0.9943 0.9931 0.9917 0.9901 0.9883 0.9863 0.9840 0.9815 0.9786
9 0.9982 0.9978 0.9973 0.9967 0.9960 0.9952 0.9942 0.9931 0.9919
10 0.9995 0.9994 0.9992 0.9990 0.9987 0.9984 0.9981 0.9977 0.9972
11 0.9999 0.9998 0.9998 0.9997 0.9996 0.9995 0.9994 0.9993 0.9991
12 1.0000 1.0000 0.9999 0.9999 0.9999 0.9999 0.9998 0.9998 0.9997
13 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9999
14 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

170
Biostatistika 1

Lampiran 2. Tabel Distribusi Poisson (Lanjutan)

µ
x
4.20 4.30 4.40 4.50 4.60 4.70 4.80 4.90 5.00
0 0.0150 0.0136 0.0123 0.0111 0.0101 0.0091 0.0082 0.0074 0.0067
1 0.0780 0.0719 0.0663 0.0611 0.0563 0.0518 0.0477 0.0439 0.0404
2 0.2102 0.1974 0.1851 0.1736 0.1626 0.1523 0.1425 0.1333 0.1247
3 0.3954 0.3772 0.3594 0.3423 0.3257 0.3097 0.2942 0.2793 0.2650
4 0.5898 0.5704 0.5512 0.5321 0.5132 0.4946 0.4763 0.4582 0.4405
5 0.7531 0.7367 0.7199 0.7029 0.6858 0.6684 0.6510 0.6335 0.6160
6 0.8675 0.8558 0.8436 0.8311 0.8180 0.8046 0.7908 0.7767 0.7622
7 0.9361 0.9290 0.9214 0.9134 0.9049 0.8960 0.8867 0.8769 0.8666
8 0.9721 0.9683 0.9642 0.9597 0.9549 0.9497 0.9442 0.9382 0.9319
9 0.9889 0.9871 0.9851 0.9829 0.9805 0.9778 0.9749 0.9717 0.9682
10 0.9959 0.9952 0.9943 0.9933 0.9922 0.9910 0.9896 0.9880 0.9863
11 0.9986 0.9983 0.9980 0.9976 0.9971 0.9966 0.9960 0.9953 0.9945
12 0.9996 0.9995 0.9993 0.9992 0.9990 0.9988 0.9986 0.9983 0.9980
13 0.9999 0.9998 0.9998 0.9997 0.9997 0.9996 0.9995 0.9994 0.9993
14 1.0000 1.0000 0.9999 0.9999 0.9999 0.9999 0.9999 0.9998 0.9998
15 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9999
16 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

171
Darnah Andi Nohe

Lampiran 2. Tabel Distribusi Poisson (Lanjutan)

µ
x
5.20 5.30 5.40 5.50 5.60 5.70 5.80 5.90 6.00
0 0.0055 0.0050 0.0045 0.0041 0.0037 0.0033 0.0030 0.0027 0.0025
1 0.0342 0.0314 0.0289 0.0266 0.0244 0.0224 0.0206 0.0189 0.0174
2 0.1088 0.1016 0.0948 0.0884 0.0824 0.0768 0.0715 0.0666 0.0620
3 0.2381 0.2254 0.2133 0.2017 0.1906 0.1800 0.1700 0.1604 0.1512
4 0.4061 0.3895 0.3733 0.3575 0.3422 0.3272 0.3127 0.2987 0.2851
5 0.5809 0.5635 0.5461 0.5289 0.5119 0.4950 0.4783 0.4619 0.4457
6 0.7324 0.7171 0.7017 0.6860 0.6703 0.6544 0.6384 0.6224 0.6063
7 0.8449 0.8335 0.8217 0.8095 0.7970 0.7841 0.7710 0.7576 0.7440
8 0.9181 0.9106 0.9027 0.8944 0.8857 0.8766 0.8672 0.8574 0.8472
9 0.9603 0.9559 0.9512 0.9462 0.9409 0.9352 0.9292 0.9228 0.9161
10 0.9823 0.9800 0.9775 0.9747 0.9718 0.9686 0.9651 0.9614 0.9574
11 0.9927 0.9916 0.9904 0.9890 0.9875 0.9859 0.9841 0.9821 0.9799
12 0.9972 0.9967 0.9962 0.9955 0.9949 0.9941 0.9932 0.9922 0.9912
13 0.9990 0.9988 0.9986 0.9983 0.9980 0.9977 0.9973 0.9969 0.9964
14 0.9997 0.9996 0.9995 0.9994 0.9993 0.9991 0.9990 0.9988 0.9986
15 0.9999 0.9999 0.9998 0.9998 0.9998 0.9997 0.9996 0.9996 0.9995
16 1.0000 1.0000 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9998
17 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999
18 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

172
Biostatistika 1

Lampiran 2. Tabel Distribusi Poisson (Lanjutan)

µ
x
6.20 6.30 6.40 6.50 6.60 6.70 6.80 6.90 7.00
0 0.0020 0.0018 0.0017 0.0015 0.0014 0.0012 0.0011 0.0010 0.0009
1 0.0146 0.0134 0.0123 0.0113 0.0103 0.0095 0.0087 0.0080 0.0073
2 0.0536 0.0498 0.0463 0.0430 0.0400 0.0371 0.0344 0.0320 0.0296
3 0.1342 0.1264 0.1189 0.1118 0.1052 0.0988 0.0928 0.0871 0.0818
4 0.2592 0.2469 0.2351 0.2237 0.2127 0.2022 0.1920 0.1823 0.1730
5 0.4141 0.3988 0.3837 0.3690 0.3547 0.3406 0.3270 0.3137 0.3007
6 0.5742 0.5582 0.5423 0.5265 0.5108 0.4953 0.4799 0.4647 0.4497
7 0.7160 0.7017 0.6873 0.6728 0.6581 0.6433 0.6285 0.6136 0.5987
8 0.8259 0.8148 0.8033 0.7916 0.7796 0.7673 0.7548 0.7420 0.7291
9 0.9016 0.8939 0.8858 0.8774 0.8686 0.8596 0.8502 0.8405 0.8305
10 0.9486 0.9437 0.9386 0.9332 0.9274 0.9214 0.9151 0.9084 0.9015
11 0.9750 0.9723 0.9693 0.9661 0.9627 0.9591 0.9552 0.9510 0.9467
12 0.9887 0.9873 0.9857 0.9840 0.9821 0.9801 0.9779 0.9755 0.9730
13 0.9952 0.9945 0.9937 0.9929 0.9920 0.9909 0.9898 0.9885 0.9872
14 0.9981 0.9978 0.9974 0.9970 0.9966 0.9961 0.9956 0.9950 0.9943
15 0.9993 0.9992 0.9990 0.9988 0.9986 0.9984 0.9982 0.9979 0.9976
16 0.9997 0.9997 0.9996 0.9996 0.9995 0.9994 0.9993 0.9992 0.9990
17 0.9999 0.9999 0.9999 0.9998 0.9998 0.9998 0.9997 0.9997 0.9996
18 1.0000 1.0000 1.0000 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
19 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

173
Darnah Andi Nohe

Lampiran 2. Tabel Distribusi Poisson (Lanjutan)

µ
x
7.20 7.30 7.40 7.50 7.60 7.70 7.80 7.90 8.00
0 0.0007 0.0007 0.0006 0.0006 0.0005 0.0005 0.0004 0.0004 0.0003
1 0.0061 0.0056 0.0051 0.0047 0.0043 0.0039 0.0036 0.0033 0.0030
2 0.0255 0.0236 0.0219 0.0203 0.0188 0.0174 0.0161 0.0149 0.0138
3 0.0719 0.0674 0.0632 0.0591 0.0554 0.0518 0.0485 0.0453 0.0424
4 0.1555 0.1473 0.1395 0.1321 0.1249 0.1181 0.1117 0.1055 0.0996
5 0.2759 0.2640 0.2526 0.2414 0.2307 0.2203 0.2103 0.2006 0.1912
6 0.4204 0.4060 0.3920 0.3782 0.3646 0.3514 0.3384 0.3257 0.3134
7 0.5689 0.5541 0.5393 0.5246 0.5100 0.4956 0.4812 0.4670 0.4530
8 0.7027 0.6892 0.6757 0.6620 0.6482 0.6343 0.6204 0.6065 0.5925
9 0.8096 0.7988 0.7877 0.7764 0.7649 0.7531 0.7411 0.7290 0.7166
10 0.8867 0.8788 0.8707 0.8622 0.8535 0.8445 0.8352 0.8257 0.8159
11 0.9371 0.9319 0.9265 0.9208 0.9148 0.9085 0.9020 0.8952 0.8881
12 0.9673 0.9642 0.9609 0.9573 0.9536 0.9496 0.9454 0.9409 0.9362
13 0.9841 0.9824 0.9805 0.9784 0.9762 0.9739 0.9714 0.9687 0.9658
14 0.9927 0.9918 0.9908 0.9897 0.9886 0.9873 0.9859 0.9844 0.9827
15 0.9969 0.9964 0.9959 0.9954 0.9948 0.9941 0.9934 0.9926 0.9918
16 0.9987 0.9985 0.9983 0.9980 0.9978 0.9974 0.9971 0.9967 0.9963
17 0.9995 0.9994 0.9993 0.9992 0.9991 0.9989 0.9988 0.9986 0.9984
18 0.9998 0.9998 0.9997 0.9997 0.9996 0.9996 0.9995 0.9994 0.9993
19 0.9999 0.9999 0.9999 0.9999 0.9999 0.9998 0.9998 0.9998 0.9997
20 1.0000 1.0000 1.0000 1.0000 1.0000 0.9999 0.9999 0.9999 0.9999

174
Biostatistika 1

175
Darnah Andi Nohe

176
Biostatistika 1

177
Darnah Andi Nohe

178
Biostatistika 1

179
Darnah Andi Nohe

180
Biostatistika 1

Lampiran 4. Tabel Distribusi t


α
df
0,10 0,05 0,025 0,01 0,005
1 3,0777 6,3138 12,7062 31,8205 63,6567
2 1,8856 2,9200 4,3027 6,9646 9,9248
3 1,6377 2,3534 3,1824 4,5407 5,8409
4 1,5332 2,1318 2,7764 3,7469 4,6041
5 1,4759 2,0150 2,5706 3,3649 4,0321
6 1,4398 1,9432 2,4469 3,1427 3,7074
7 1,4149 1,8946 2,3646 2,9980 3,4995
8 1,3968 1,8595 2,3060 2,8965 3,3554
9 1,3830 1,8331 2,2622 2,8214 3,2498
10 1,3722 1,8125 2,2281 2,7638 3,1693
11 1,3634 1,7959 2,2010 2,7181 3,1058
12 1,3562 1,7823 2,1788 2,6810 3,0545
13 1,3502 1,7709 2,1604 2,6503 3,0123
14 1,3450 1,7613 2,1448 2,6245 2,9768
15 1,3406 1,7531 2,1314 2,6025 2,9467
16 1,3368 1,7459 2,1199 2,5835 2,9208
17 1,3334 1,7396 2,1098 2,5669 2,8982
18 1,3304 1,7341 2,1009 2,5524 2,8784
19 1,3277 1,7291 2,0930 2,5395 2,8609
20 1,3253 1,7247 2,0860 2,5280 2,8453
21 1,3232 1,7207 2,0796 2,5176 2,8314
22 1,3212 1,7171 2,0739 2,5083 2,8188
23 1,3195 1,7139 2,0687 2,4999 2,8073
24 1,3178 1,7109 2,0639 2,4922 2,7969
25 1,3163 1,7081 2,0595 2,4851 2,7874
26 1,3150 1,7056 2,0555 2,4786 2,7787
27 1,3137 1,7033 2,0518 2,4727 2,7707
28 1,3125 1,7011 2,0484 2,4671 2,7633
29 1,3114 1,6991 2,0452 2,4620 2,7564
30 1,3104 1,6973 2,0423 2,4573 2,7500

Sumber: Dimodifikasi dari Walpole, 1995

181
Darnah Andi Nohe

Darnah Andi Nohe, lahir di Bone, 9 Maret 1977.


Pendidikan SD sampai SMA diselesaikan di Bone.
Pada tahun 1998 mulai menempuh pendidikan S1 di
Jurusan Matematika FMIPA Universitas Hasanuddin
Makassar dan menyelesaikan studinya pada tahun
2002. Tahun 2007 melanjutkan pendidikan S2 di
Jurusan Statistika FMIPA Institutut Teknologi Sepuluh
Nopember Surabaya dan selesai tahun 2009.
Selain mengabdi di Program Studi Statistika FMIPA
Universitas Mulawarman dari tahun 2003 sampai sekarang, juga
menjadi pengajar mata kuliah Biostatistika di Fakultas Kesehatan
Masyarakat Universitas Mulawarman, Fakultas Kesehatan
Masyarakat Universitas Widyagama Mahakam Samarinda dan
Politeknik Kesehatan Pemprov Kalimantan Timur.

182
Biostatistika 1

183

Anda mungkin juga menyukai