Anda di halaman 1dari 57

BIOSTATISTIK

MODUL 1 MODUL 1
KONSEP DASAR STATISTIK UMUM
1.1. PENGERTIAN STATISTIKA
Secara umum statistika adalah disiplin ilmu yang mempelajari metode dan
prosedur pengumpulan, penyajian, analisa dan penyimpulan suatu data mentah, agar
menghasilkan informasi yang lebih jelas untuk keperluan suatu pendekatan ilmiah (scientific
inferences), dan dapat dikelompokkan menjadi dua bagian, yaitu statistik deskriptif dan
statistik inferensial.
Statistik deskriptif merupakan metode dan prosedur statistik yang dipakai hanya
terbatas pada pengumpulan, penyajian dan analisa data dalam bentuk narasi, tabulasi atau
diagram. Ukuran-ukuran yang dapat dihitung dalam analisis ini adalah ukuran tendensi
sentral dan ukuran variasi tanpa perlu adanya peramalan (estimasi) dan pembuktian
statistik terhadap parameter populasi.
Statistik inferensial (induktif) merupakan alat untuk merancang riset,
menganalisis data dan menarik kesimpulan tentang populasi dari data sampel. Namun
sebelum proses generalisasi tersebut, kita perlu mengetahui sifat-sifat data sampel itu
sendiri, yang pada gilirannya dapat menentukan jenis statistik yang digunakan, apakah
statistik parametrik atau non-parametrik.
Pola berfikir yang dipakai dalam inferensi statistik lebih cenderung induksi dari pada
deduksi, yaitu prosedur yang berkenaan dengan generalisasi dari khusus ke umum. Ada dua
kelompok besar kegunaan statistik inferensi yang dikenal, yaitu : (1) membuat pendugaan
(estimasi) tentang parameter populasi, dan (2) melakukan uji hipotesis tentang
karakteristik populasi.
Prosedur uji inferensial parametrik dibuat berdasarkan sejumlah asumsi,
diantaranya yang paling mendasar adalah data sampel yang digunakan dalam penelitian
berasal dari populasi beristribusi normal, atau paling tidak mendekati normal. Disamping
normalitas distribusi populasi ini, juga dilengkapi dengan asumsi yang lainnya, yaitu : (1)
pemilihan unit sampel dari populasi secara acak (random), (2) pengamatan pada unit
observasi independen, (3) untuk pengamatan pada dua atau lebih unit observasi dengan
varians (ragam) homogen, dan (4) variabel pengamatan diukur dalam skala interval atau
rasio.
Sedangkan prosedur pada statistik uji inferensial non-parametrik dipersiapkan
sebagai alternatif jika asumsi pada statistik parametrik tidak terpenuhi. Dengan kata lain,
statistik non-parametrik disebut juga bebas distribusi. Hal ini bisa terjadi, karena statistik
non-parametrik tidak bertujuan menduga atau menguji parameter populasi, tetapi cukup
membandingkan karakteristik populasi-populasi secara umum.
Biostatistik merupakan salah satu aplikasi konsep dan metode statistika yang
diterapkan pada ilmu biologi, kedokteran, farmasi dan kesehatan. Sifat aplikatif dari
Biostatistik juga bermanfaat untuk menganalisis, membuat interprestasi, dan memahami
fakta dan temuan-temuan riset biologi, kedokteran, farmasi dan kesehatan.

1.2. KENGUNAAN STATISTIK
Statistik dapat digunakan dalam bidang administrasi, bidang perencanaan dan
evaluasi serta dalam bidang penelitian. Dalam bidang penelitian dapat dimanfaatkan untuk
(1) memberikan gambaran tentang suatu objek secara lengkap dan ringkas (2)
membandingkan kejadian satu dengan kejadian lainnya dengan dengan beracuan pada
1
BIOSTATISTIK
waktu dan tempat, dan (3) membuat ramalan pada kejadian yang sama dimasa yang akan
datang.
1.3. DATA STATISTIK
1.3.1. Definisi, Karakteristik, Sifat, Jenis dan Sumber Data
Defenisi Data
Data adalah fakta yang dinyatakan dengan angka (bilangan), baik yang diperoleh
dengan menghitung maupun mengukur. Disamping itu ada juga data yang hanya bisa
diamati, tidak bisa dihitung dan diukur, data yang seperti ini disebut dengan data kualitatif.
Untuk maksud tertentu, data kualitatif ini juga bisa disimbolkan dengan angka (bilangan),
dengan demikian data kualitatif yang sudah disimbolkan dengan bilangan tadi, dapat
dikatakan sebagai data kuantitatif.
Jenis Data
Berdasarkan jenisnya, data dapat dibagi dalam 2 kelompok, yaitu :
1. Data kontinu, merupakan variabel numerikal yang nilainya dapat diukur terus
menerus, sampai sekecil-kecilnya atau merupakan bilangan bulat dan pecahan.
Misalnya nilai Hb darah = 14,20 gr %, berat badan = 65,75 Kg, dan lain-lain.
2. Data diskrit, merupakan variabel numerikal yang nilai tidak dapat diukur sekecil-
kecilnya dan merupakan satu kesatuan atau merupakan bilangan bulat, data diskrit
dapat bersifat kuantitatif atau kualitatif. Misalnya jumlah ibu hamil di desa A, nilai
pembobotan pada pengukuran skala likert, dan lain-lain.
Sifat Data
1. Data kualitatif, yaitu data yang tidak bisa diukur dan dihitung serta disajikan bukan
dalam bentuk angka. Misalnya : agama, jenis kelamin, suku bangsa, dan lain-lain.
2. Data kuantitatif, yaitu data yang bisa diukur dan dihitung serta disajikan dalam
bentuk angka. Misalnya Tekanan darah sistolik, jumlah cakupan imunisasi, dan lain-lain.
Sumber Data :
Berdasarkan sumbernya, data dapat dikelompokkan menjadi 3, yaitu :
1. Data primer, yaitu data yang dikumpulkan sendiri oleh sipeneliti pada saat
berlangsung suatu penelitian.
2. Data sekunder, yaitu data yang dikumpulkan secara rutin oleh instansi tertentu,
yang kemudian digunakan oleh si peneliti.
3. Data tertier, yaitu data yang sudah diproses dan dipublikasikan sebagai suatu karya/
karangan ilmiah.
1.3.2. Pengumpulan Data
Dapat dilakukan secara langsung atau tidak langsung, dan tergantung dari
kebutuhan informasi yang ingin dikumpulkan, tenaga pelaksana penelitian, serta dana yang
tersedia. Ada lima cara yang sering dilakukan dalam kegiatan pempulan data, yaitu :
1. Observasi, merupakan cara pengumpulan data yang dilakukan secara langsung
dengan cara mengamati dengan tanpa adanya perlakukan terhadap objek
penelitian. Hasil pengukuran dengan cara ini lebih banyak dalam bentuk data
kualitatif.
2. Interview atau Wawancara, yaitu pengumpulan data yang dilakukan secara
langsung di lapangan antara petugas pengumpul data dengan cara mewawancarai
2
BIOSTATISTIK
secara langsung reponden yang diteliti. Hal ini sangat baik dilakukan untuk
mendapatkan informasi (data) yang lebih lengkap dan mendalam.
3. Kuesioner atau Angket, yaitu berupa lembaran berisi pertanyaan-pertanyaan
yang disiapkan sedemikian rupa, yang berfungsi sebagai alat pengumpul data
panelitian. Biasanya kuesioner dapat digunakan pada saat interview atau wawancara
atau dapat juga dilakukan dengan cara mengirimkannya melalui pos kepada
responden yang telah terpilih, dengan harapan akan dikembalikan.
4. Registrasi dan Pencatatan, yaitu berupa pengumpulan data secara rutin terhadap
setiap kegiatan atau kejadian, dengan menggunakan sistem manajemen data yang
baik, seperti angka kelahiran, kematian, kesakitan dan lain-lain.
5. Hasil ujian (test) atau hasil laboratorium, yaitu berupa pengumpulan data yang
dilakukan untuk mengukur tingkat pengetahuan atau keahlian seseorang atau
pencatatan hasil pemeriksaan laboratorium dan lain sebagainya.
1.3.3. Pengolahan Data
Pengertian Pengolahan Data
Pengolahan data ialah proses penataan data, karena data hasil pengumpulan
merupakan data kasar.
Guna Pengolahan Data
Pengolahan data digunakan agar data kasar dapat diorganisir, disajikan dan dianalisa
hingga dapat ditarik kesimpulan.
Proses Pengolahan Data
Kegiatan dalam proses pengolahan data adalah :
1. Memeriksa data (editing)
Yang dimaksud dengan proses editing ialah memeriksa data yang telah dikumpulkan
baik berupa daftar pertanayaan, kartu atau buku register.
Pemeriksaan ini meliputi hal-hal senagai berikut :
a. Penjumlahan
Menjumlah ialah menghitung banyaknya lembaran daftar pertanyaan yang telah
diisi untuk mengetahui apakah sesuai dengan jumlah yang telah ditentukan.
b. Koreksi
Yang termasuk dalam proses koreksi ialah proses membenarkan atau
menyelesaaikan hal-hal yang salah atau kurang jelas
2. Memberi kode (coding)
Untuk mempermudahkan pengolahan, sebaiknya semua variabel diberi kode
terutama data klasifikasi, misalnya jenis kelamin untuk laki-laki diberi kode 1 dan
wanita diberi kode 2.
3. Menyusun data (tabulating)
Penyusunan data merupakan pengorganisasian data sedemikian rupa agar dengan
mudah dapat dijumlah, disusun dan ditata untuk disajikan dan dianalisis
Proses tabulasi dapat dilakukan dengan berbagai cara antara lain dengan metode
tally, menggunakan kartu dan menggunakan komputer.
Proses Pengolahan dan Analisis Data

3
Editing
Data ?
Coding
Data ?
Cleaning
Data ?
Proses
Analisis
Data
Dengan
Komputeris
asi
BIOSTATISTIK


Belum

Sesuai
Sudah Sesuai

1.4. VARIABEL DAN SKALA PENGUKURAN
1.4.1. Variabel
Variabel adalah karakteristik unit yang diukur dalam pengumpulan data yang nilainya
bervariasi misalnya umur, tinggi badan, berat badan, tekanan darah, diagnosis, pengobatan
dll
1.4.2. Skala Pengukuran
Skala pengukuran yang dikembangkan oleh S.S. Stevens, cukup luas digunakan dalam
setiap penelitian yang membagi tingkat ukuran ke dalam empat kategori, yaitu :
1. Skala nominal, skala ini merupakan tingkat pengukuran yang paling sederhana.
Numerikal yang diberikan kepada objek tidak mempunyai makna besaran (hanya
sekedar label) dan tidak bisa diurut atau dijumlah. Misalnya : Jenis kelamin (1 = Pria; 2
= Wanita), Agama (1 = Islam; 2 = Kristen; 3 = Buddha), Apakah anda suka statistika (1
= Ya; 2 = Tidak), dan lain-lain.
2. Skala ordinal, penomoran pada objek ini disusun menurut besar atau urutan (rank),
tetapi nomor-nomor tersebut tidak menunjukkan jarak yang sama antara dua nomor.
Misalnya : Stadium penyakit (1 = Berat; 2 = Sedang; 3 = Ringan), Tingkat pendidikan
(1 = SD; 2 = SLTP; 3 = SLTA; 4 = Sarjana), dan lain-lain.
3. Skala interval, skala ini mempunyai sifat berurutan. Pada skala ini jarak atau
perbedaan antara nilai pengamatan satu dan nilai pengamatan lainnya dapat diketahui
dengan pasti. Besar interval dapat ditambah atau dikurangi, dimana yang dijumlahkan
bukanlah kuantitas atau besaran, tetapi interval. Misalnya : Temperatur (
o
C atau
o
K),
Tekanan darah, dan lain-lain. Misalnya, temperatur 36
o
C jelas 12
o
C lebih panas dari
24
o
C, dan tidak dikatakan bahwa 36
o
C 1 kali dari 24
o
C. Alasanya, penentuan skala 0
o
C bukan keberadaan panas absolut, tetapi hanya merupakan batas pengukuran positif
dan negatif. Dengan kata lain, pada skala interval tidak dijumpai nol absolut.
4. Skala rasio, skala ini merupakan tingkat pengukuran tertinggi. Skala rasio selain
memiliki sifat skala nominal, ordinal dan interval, juga mempunyai titik nol absolut
dengan makna empiris. Pada skala rasio semua operasi matematik (penambahan,
penguangan, pengalian dan pembagian) dapat diterapkan. Misalnya : Temperatur yang
diukur dalam skala Kelvin, besar penghasilan, berat badan, elektrolit serum, dan denyut
nadi.
4
Data
Kasar
Edit
Data
Stati
stik
Uji ?
Hasil Analisis
Sudah Sesuai
dengan Tujuan
penelitian
BIOSTATISTIK
MODUL 2
MANFAAT DAN TEKNIK PENYAJIAN DATA
2.1. Pengertian Penyajian Data
Penyajian data merupakan salah satu kegiatan dalam pembuatan laporan hasil
penelitian yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan tujuan
yang diinginkan.
Data yang disajikan harus sederhana dan jelas agar mudak dibaca. Penyajian
data juga dimaksudkan agar para pengamat dapat dengan mudah memahami apa yang kita
sajikan untuk selanjutnya dilakukan penilaian atau perbandingan, dan lain-lain.
2.2. Jenis-Jenis Cara Penyajian Data
Data-data yang telah dikumpulkan, setelah dianalisis sedemikian rupa, perlu disusun
secara sistematik agar menjadi sederhana dan mudah dimengerti oleh pengkonsumsi
informasi dan juga dapat dipresentarsikan dengan baik. Ada beberapa cara penyajian data,
yaitu :
1. Textular (narasi), yaitu penyajian data berupa tulisan atau narasi. Hal ini dapat
dilakukan untuk data yang jumlahnya kecil serta memerlukan kesimpulan sederhana.
2. Tabulasi, yaitu penyajian data dalam bentuk table-tabel yang terdiri dari beberapa
baris dan beberapa kolom, yang digunakan untuk memaparkan sekaligus beberapa
variabel hasil observasi, survei, atau penelitian lainnya, sehingga mudah dibaca dan
dipahami.
3. Diagram atau Grafik, yaitu penyajian data dalam bentuk diagram ataupun grafik
dapat dilakukan dengan beberapa cara sesuai dengan jenis data dan kebutuhan,
seperti terlihat pada table berikut :
Tabel 1.1. Cara penggunaan Jenis Diagram/Grafik.
No. Jenis Diagram Variabel Data/Fungsi
1. Bar diagram Kategorikal Perbandingan frekuensi distribusi
5
BIOSTATISTIK
2.
3.
4.
5.
6.
(Horizontal/vertical)
Pie Chart
Line diagram
Scatter point/ dot diagram
Pictogram/Diagram gambar
Curtogram/Diagram peta
Kategorikal
Numerikal
Numerikal
Kategorikal
Kategorikal
data
Proporsi data
Trend data (time series study)
Korelasi data
Perbandingan frekuensi distribusi
data
Perbandingan frekuensi distribusi
data
2.3. Jenis Tabel Penyajian Data
Jenis tabel penyajian data adalah :
1. Tabel distribusi frekuensi
2. Tabel frekuensi
3. Tabel distribusi relative
4. Tabel distribusi kumulatif
5. Tabel silang (tabel kontingensi = contingency table = cross tabulation)
2.4. Cara Membuat Tabel
Suatu tabel yang lengkap terdiri dari (1) nomor tabel, (2) judul tabel, (3) catatan
pendahuluan, (4) badan tabel, (5) catatan kaki, dan (6) sumber data.
Tabel 1 Contoh tabel
Judul Tabel
Judul
Kompartemen
Judul Kolom Jumlah
Sel
Judul Baris Badan Tabel
Cacatan kaki :
Sumber :
2.5. Menyajikan Tabel Dalam Bentuk Tabel
2.5.1. Tabel Distribusi Frekuensi
Contoh Tabel distribusi frekuensi
Kelompok umur (tahun) Frekuensi Persentase (%)
15 19 5 5,0
20 24 10 10,0
25 29 16 16,0
30 34 43 43,0
35 39 12 12,0
40 44 14 14,0
Jumlah 100 100,0
2.5.2. Tabel Silang 2 Variabel
Contoh : Tabel Silang
Status Gizi Diare Jumlah
6
BIOSTATISTIK
Sakit Tidak Sakit
Baik 3 9 12
Sedang 18 25 43
Buruk 29 16 45
Jumlah 50 50 100
2.6. Penyajian Data Kualitatif Secara Grafik
1
Diagram batang
(Diagram balok
= Bar diagram = Bar chart)
0
50
100
150
200
250
300
350
400
450
Pil Suntikan IUD
Alat Kontrasepsi
J
u
m
l
a
h
Gambar 6. Jumlah Akseptor KB Tahun 2006
(Single Bar)
7
BIOSTATISTIK
1
0
50
100
150
200
250
300
350
400
450
2002 2003 2004 2005 2006
Tahun
J
u
m
l
a
h
Pil
Suntikan
IUD
Gambar 7. Jumlah Akseptor KB Tahun 2006
(Multiple Bar)
1
50
75
100
150
200
75
125
175
225
300
100
150
200
250
400
0
100
200
300
400
500
600
700
800
900
1000
2002 2003 2004 2005 2006
Tahun
J
u
m
l
a
h
IUD
Suntikan
Pil
Gambar 8. Jumlah Akseptor KB Tahun 2006
(Subdivided Bar)
8
BIOSTATISTIK
ISPA 40%
DIARE 30%
DHF 19%
MALARIA 11%
Proporsi Penderita ISPA, Diare, DHF, Malaria Sumut Bulan Agustus
2010
Histogram
0
5
10
15
20
Tingkat Pendidikan
SD
SMP
SMA
PT
Poligon
9
BIOSTATISTIK
Tingkat Pendidikan
1
Ogive
0
10
20
30
40
50
60
70
80
90
100
89.5 109.5 129.5 149.5 169.5 189.5 209.5
Tekanan Darah Sistolik (mmHg)
F
r
e
k
u
e
n
s
i

R
e
l
a
t
i
f

K
u
m
u
l
a
t
i
f

(
%
)
Less than
More than
Gambar 4. Distribusi Tekanan Darah Sistolik 37 Orang Perokok
(Ogive)
1
Diagram garis
(Line diagram)
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
1 0 0
1 2 3 4
K u a r t a l
J
u
m
l
a
h
D H F
D i a r e
I S P A
Gambar 5. Jumlah Penderita DHF, Diare, ISPA
di Puskesmas X Tahun 2006
Sccater Diagram
10
BIOSTATISTIK
0
10
20
30
40
50
60
70
80
90
0 1 2 3 4 5
PIL
MODUL 3
MENGHITUNG NILAI RATA-RATA SUATU DISTRIBUSI DATA
Penghitungan data-data sampel dalam analisis statistik deskriptif biasa dilakukan dengan
memperhatikan jumlah data. Jika jumlah data kecil (biasanya kurang dari 30) dapat dengan
mudah langsung dihitung tanpa harus mengelompokkannya dengan tabel distribusi
frekuensi (ungrouped data), sedangkan untuk jumlah data besar (biasanya lebih dari 30)
untuk memudah perhitungan secara manual dapat dilakukan dengan mengelompokkannya
dengan tabel distribusi frekuensi (grouped data). Selanjutnya perhitungan akan
dikelompokkan berdasarkan pembagian data ini. Dalam analisis statistik deskriptif ada dua
ukuran yang dapat dihitung, yaitu ; (1) ukuran terpusat (central tendency), dan (2) ukuran
variasi atau sebaran (variation/dispersion)
3.1. PENGHITUNGAN PADA DATA TIDAK BERKELOMPOK.
3.1.1. Ukuran Terpusat.
Ukuran gejala terpusat menggambarkan suatu nilai (besaran) yang khas atau yang
mewakili suatu himpunan data. Nilai yang khas yang demikian cendrung terletak secara
terpusat dalam suatu himpunan data yang tersusun menurut besarnya. Ada beberapa
ukuran terpusat yang lazim digunakan dalam statistik, antara lain :
a). Rata-rata hitung (mean) yang dinyatakan dengan x adalah suatu nilai (besaran)
yang menggambarkan keterwakilan dari dari sekumpulan data. Rata-rata hitung ialah
jumlah semua hasil pengamatan (x) dibagi dengan banyaknya pengamatan (n). Jika
suatu himpunan data sebanyak n bilangan, yaitu :
n
x x x , ,......... ,
2 1
, maka x (baca : x
bar = lambing rata-rata hitung) adalah :
11
BIOSTATISTIK
n
x
n
x
x
i
n
i
i


1
.
..(3.1)
dimana : x = rata-rata hitung (mean)
i
x = jumlah seluruh titik data pengamatan
n = jumlah bilangan titik data pengamatan.
Contoh 1. 1. Data berat bayi lahir (Kg) dari ibu perokok :
3,18 2,84 2,90 3,27 3,85 3,52 3,29 2,76 3,60 3,18 3,59
Berapakah : Rata-rata hitungnya ( x ) ?
Jawab :
n
x
x
n
i
i

1
=
11
59 , 3 18 , 3 60 , 3 76 , 2 29 , 3 52 , 3 85 , 3 27 , 3 90 , 2 84 , 2 18 , 3 + + + + + + + + + +
=
11
98 , 35
= 3,27
Jika bilangan-bilangan
n
x x x ,........, ,
2 1
masing-masing terjadi
n
f f f ,......., ,
2 1
kali, maka
rata-rata hitungnya adalah :
n
x f
n
x f
x
i i
n
i
i i


1
......
(3-2)
dimana : x = rata-rata hitung (mean)
i i
x f = jumlah seluruh titik data pengamatan
n = jumlah bilangan titik data pengamatan.
Contoh 1. 2. Data berat bayi lahir (Kg) dari ibu perokok :
3,18 2,84 2,90 3,27 3,60 3,52 3,18 2,76 3,60 3,18 3,59
Berapakah : Rata-rata hitungnya ( x ) ?
Jawab : x =
n
x f
n
i
i i
1
=
11
59 , 3 76 , 2 52 , 3 ) 60 , 3 ( 2 27 , 3 90 , 2 84 , 2 ) 18 , 3 ( 3 + + + + + + +
=
11
62 , 35
= 3,238
12
BIOSTATISTIK
b). Modus (Mode) yang dinyatakan dengan
o
M adalah suatu nilai (besaran) yang
terjadi dengan frekuensi terbanyak (nilai yang paling umum).
Dengan mengambil soal pada contoh 1.1., maka :
o
M = 3,18 (karena data 3,18 muncul
2 kali (
i
f = 1) atau yang paling banyak)
c). Letak (Posisi) Data
Jika data sudah tersusun (array) dengan susunan data terkecil sampai dengan data
terbesar atau sebaliknya, maka masing-masing posisi atau letak data tersebut dapat
ditentukan, seperti : untuk letak data di pertengahan (Median), letak data di
perempatan (Quartil), letak data di persepuluhan (Desil) dan letak data di perseratusan
(Persentil).
c.1.) Median (Pertengahan), dari suatu himpunan bilangan yang disusun menurut
urutan besarnya (array data) adalah nilai pertengahan atau nilai tengah hitung
dari pertengahan, dinyatakan dengan
o
M adalah :

,
_

2
1 n
Data ke M
e
.....
.(3-3)
dalam bentuk garis bilangan :
Me
Contoh 1.3. Data berat bayi lahir (Kg) dari ibu perokok (data ganjil) :
2,76 2,84 2,90 3,18 3,18 3,27
3,29 3,52 3,59 3,60 3,85
Berapakah : Mediannya (
o
M ) ?
Jawab :
,
_

2
1 n
Data ke M
e
=
,
_

+
2
1 11
Data ke = Data ke 6 = 3,27
Data berat bayi lahir (Kg) dari ibu perokok (data genap) :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60
3,85 4,00
Berapakah : Mediannya (Me) ?
Jawab :
,
_

2
1 12
Data ke M
e
= Data ke 6,5 = Data ke 6 + 0,5 (Data ke 7 Data ke
6)
= 3,27 + 0,5 (3,29 - 3,27) = 3,28
13
BIOSTATISTIK
c.2.) Quartil (Perempatan) , dari suatu himpunan bilangan yang disusun menurut
urutan besarnya (array data) adalah nilai perempatan atau nilai tengah hitung dari
dua nilai tengah dinyatakan dengan
i
Q adalah :
4
1) i(n
Data ke Q
i
+
.....
.(3-4)
dimana : i =1,2,3.
Dalam bentuk garis bilangan :

1
Q
2
Q =
e
M
3
Q
Contoh 1.4. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59
3,60 3,85
Berapakah :
1
Q ,
2
Q dan
3
Q
?
Jawab :
4
1 1
1
) (n
Data ke Q
+
=
4
1 11 ) (
Data ke
+
= Data ke 3 = 2,90
2
Q =
e
M = 3,27
4
1 11 3
3
) (
Data ke Q
+
= Data ke 9 = 3,59
c.3.) Desil (Persepuluhan), dari suatu himpunan bilangan yang disusun menurut
urutan besarnya (array data) adalah nilai persepuluhan atau nilai-nilai yang
membagi data atas sepuluh bagian yang sama, dinyatakan dengan
i
D adalah :
10
1) i(n
Data ke D
i
+
.
.(3-5)
dimana: i =1,2,3,.,9.
Dalam bentuk garis bilangan :
D1 D2 D3 D4 D5=Q2=Me D6 D7 D8 D9
Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59
3,60 3,85
Berapakah :
3
D ,
5
D dan
8
D
?
14
BIOSTATISTIK
Jawab :
10
1 3
3
) (n
Data ke D
+
=
10
1 11 3 ) (
Data ke
+
= Data ke 3,60
= Data ke 3 + 0,6 (Data ke 4 Data ke 3) = 2,90 + 0,6 (3,18 - 2,90) =
3,068.
5
D =
2
Q =
e
M = 3,27
10
1 11 8
8
) (
Data ke D
+
= Data ke 9,6 = Data ke 9 + 0,6 (Data ke 10 Data ke
9)
= 3,59 + 0,6 (3,60 3,59) = 3,596
c.4.) Persentil (Perseratusan) dari suatu himpunan bilangan yang disusun
menurut urutan besarnya (array data) adalah nilai perseratusan atau nilai-nilai yang
membagi data atas seratus bagian yang sama, dinyatakan dengan
i
P adalah :
100
1) i(n
Data ke P
i
+
...
.(3-6)
dimana : I =1,2,3, ., 99.
Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59
3,60 3,85
Berapakah :
35
P ,
50
P dan
70
P
?
Jawab :
100
1 35
35
) (n
Data ke P
+
=
100
1 11 35 ) (
Data ke
+
= Data ke 4,2
= Data ke 4 + 0,2 (Data ke 5 Data ke 4) = 3,18 + 0,2 (3,18 3,18) =
3,18.
50
P =
5
D =
2
Q =
e
M = 3,27
100
1 11 70
70
) (
Data ke P
+
= Data ke 8,4 = Data ke 8 + 0,4 (Data ke 9 Data
ke 8)
= 3,52 + 0,4 (3,59 3,52) = 3,548
3.2. PENGHITUNGAN PADA DATA BERKELOMPOK.
Jika data sampel dalam jumlah besar (n > 30) maka data-data ini harus dikelompokk
dalam upaya memudah penghitungan jika dilakukan secara manual. Proses
mengelompokkan ini dapat dibantu dengan membuat tabel distribusi frekuensi.
3.2.1. Tabel Distribusi Frekuensi.
15
BIOSTATISTIK
Langkah-langkah membuat tabel ditribusi frekuensi dapat dilakukan dengan :
1. Mencari nilai rangenya : R = Data terbesar Data terkecil.
2. Menghitung jumlah kelas dengan rumus Sturgess, yaitu : n K log 3 , 3 1+ .....
..(3-7)
3. Menghitung lebar kelas (Confidence Interval) :
K
R
C
i
..
..(3-8)
Dengan mempedomani perhitungan di atas, selanjutnya dapat dibuat tabel disribusi
frekuensi berikut :
No.
i
C
i
f
Kumlatif
f
i
x
i i
x f
i
d
i i
d f
2
i i
x f
1. BB1 BA1
1
f
1
f
1
x
1 1
x f
1
d
1 1
d f
2
1 1
x f
2. BB2 BA2
2
f
2 1
f f +
2
x
2 2
x f
2
d
2 2
d f
2
2 2
x f
3. BB3 BA3
3
f
3 2 1
f f f + +
3
x
3 3
x f
3
d
3 3
d f
2
3 3
x f
. .. .. .. .. .. .. ..
. .. .. .. .. .. .. ..
. .. .. .. .. .. .. ..
. .. .. .. .. .. .. ..
K BBK BAK
k
f
k
f f + +..
1 k
x
k k
x f
k
d
k k
d f
2
k k
x f
i
f
i i
x f
i i
d f

2
i i
x f
Keterangan :
No. = Nomor kelas
i
C
=
Lebar kelas (Interval kelas) :
i
C = BPA BPB ; BPA = batas paling atas;
dan BPB = batas paling bawah
i
f
= Jumlah seluruh frekuensi
Kumulatif
f
= Jumlah kumulatif semua frekuensi kelas pada kelas ke-i
i
x
=
Nilai tengah (mid point), yaitu :
i
x = (BPA + BPB)/2
i
d
=
Simpangan, yaitu :
i S i i
C x x d / ) (
Contoh 1.7. Data berat bayi lahir (bbl) dari 40 anak.
3,18 2,84 2,90 3,27 3,85 3,52 3,23 3,90 3,25 2,50
2,76 3,60 3,75 3,59 3,63 2,38 2,34 2,75 3,00 2,60
3,99 3,79 3,60 3,73 3,25 3,60 4,08 3,00 2,75 2,50
3,61 3,83 3,31 4,13 3,26 3,54 3,51 3,25 3,50 2,65
Langkah-langkah membuat tabel ditribusi frekuensi
16
BIOSTATISTIK
R = Data terbesar Data terkecil = : 4,13 2,34 = 1,79
Jumlah kelas : n K log 3 , 3 1+ = 1 + 3,3 log 40 = 6,29 6
Lebar kelas (Confidence Interval) :
K
R
C
i

6
79 , 1
= 0,298 0,3
Tabel 2.2. Data berat bayi lahir (bbl) dari 40 anak.
No
i
C
i
f
Kum
f
i
x
i i
x f
i
d
i i
d f
2
i i
d f
1. 2,34-2,63 5 5 2,485 12,42
5
-4 -20 80
2. 2,64-2,93 6 11 2,785 16,71
0
-3 -18 54
3. 2,94-3,23 5 16 3,085 15,42
5
-2 -10 20
4. 3,24-3,53 8 24 3,385 27,08
0
-1 -8 8
5. 3,54-3,83 11 35 3,685 40,53
5
0 0 0
6. 3,84-4,13 5 40 3,985 19,92
5
1 5 5
40 132,100 -51 167
dimana : i
f
= 40 ; i i
x f
= 132,100 ;
i i
d f
= - 51 ;

2
i i
d f
= 167
Keterangan :
Batas bawah (BB) pada kelas nomor 1 = 2,34 Batas Paling Bawah (BPB) = 2,34
0,005 = 2,335
Batas Atas (BA) pada kelas nomor 1 = 2,63 Batas paling Atas (BPA) = 2,63 + 0,005 =
2,635

i
C
= BPA BPB = 2,635 2,335 = 0,3

1
x = (BPA + BPB)/2 = (2,635+2,335)/2 = 2,485 (nilai tengah pada kelas nomor 1)
i
C x x +
1 2
= 2,485 + 0,3 = 2,785 (nilai tengan pada kelas nomor 2)
i
C x x +
2 3
= 2,785 + 0,3 = 3,085 (nilai tengan pada kelas nomor 3), demikian
seterusnya

i S
C x x d / ) (
5 5

= (3,685-3,685)/0,3 = 0 (simpangan pada kelas nomor 5)
S
x
=
3,685 yaitu nilai tengah pada kelas nomor 5, yaitu kelas dengan frekuen kelas
yang terbesar)
i S
C x x d / ) (
4 4
= (3,385-3,685)/0,3 = -1
i S
C x x d / ) (
3 3
= (3,085-3,685)/0,3 = -2 (demikian seterusnya)
i S
C x x d / ) (
6 6
= (3,985-3,685)/0,3 = 1
3.2.2. Ukuran Terpusat.
17
BIOSTATISTIK
Penghitungan ukuran terpusat untuk data berkelompok pada dasarnya sama pada
penghitungan data tidak berkelompok.
a). Rata-rata hitung (mean) :

i
i i
n
i
i
n
i
i i
f
.x f
f
.x f
x
1
1
....
..(3-9)
dimana
:
x = rata-rata hitung
i i
x f
= Jumlah hasil kali frekuensi kelas dengan nilai tengah pada kelas
yang sama
i
f
= Jumlah seluruh frekuensi kelas
Dari tabel 1.2. Diketahui :
i i
x f = 132,100 ;
i
f = 40
Jadi :
40
100 , 132

i
i i
f
.x f
x = 3,3025
atau, dengan menggunakan rata-rata sementara :

'

'

i
i i
i S
n
i
i
n
i
i i
i S
f
d f
C x
f
d f
C x x
1
1
...
(3-10)
dimana
:
x = rata-rata hitung
S
x
= rata-rata sementara (guessed mean) diambil dari salah satu
nilai tengah (
i
x ) dan biasanya pada kelas dengan frekuensi
terbesar.
i
C
= Lebar kelas (confidence interval)
i i
d f
= Jumlah hasil kali frekuensi kelas dengan simpangan pada kelas
yang sama
i
f
= Jumlah seluruh frekuensi kelas
Dari tabel 1.2. Diketahui :
i i
d f = -51 ;
i
f = 40 ;
S
x = 3,685 dan
i
C = 0,3
18
BIOSTATISTIK

'

i
i i
i S
f
d f
C x x

'

+
40
51
3 , 0 685 , 3 = 3,3025
b). Modus (Mode) :

'

+
+
2 1
1

C BPB M
i Mo o
...
(3-11)
dimana
:
o
M
BPB
= Batas paling bawah pada kelas modus. Kelas modus adalah
kelas dengan frekuensi terbesar.
1

= Frekuensi kelas modus frekuensi kelas sebelumnya


2

= Frekuensi kelas modus frekuensi kelas sesudahnya


i
C
= Lebar kelas
Catatan : BPB = BB 0,5 ; jika BB bilangan bulat, (mis : BB = 10).
BPB = BB 0,05 ; jika BB bilangan bulat dengan satu desimal, (mis : BB = 10,1).
BPB = BB 0,005 ; jika BB bilangan bulat dengan dua desimal, (mis : BB =
10,01) dan seterusnya.
Dari tabel 1.2.
Diketahui : Kelas Modus ada pada kelas nomor 5 (karena frekuensi yang besar pada
kelas nomor 5)
o
M
BPB = 3,54 0,005 = 3,535
i
C = 0,3 ;
1
= 11 8 = 3 ;
2
= 11 5 = 6
Jadi :

'

+
+
6 3
3
) 3 , 0 ( 535 , 3
o
M = 3,635
c). Letak data :
c.1.) Median (Pertengahan) :
( )

'

+

Me
k
i
i Me e
f
f
N
C BPB M
2
...
(3-12)
dimana
:
e
M
BPB
= Batas paling bawah pada kelas median. Kelas median
adalah kelas dimana data ke ( 2 / N ) berada.

i
f N
= jumlah keseluruhan data
( )
k
i
f

= Frekuensi kumulatif sebelum kelas median atau jumlah


seluruh frekuensi kelas sebelum frekuensi kelas median.
e
M
f
= Frekuensi pada kelas median
i
C
= Lebar kelas
19
BIOSTATISTIK
Dari tabel 1.2.
Diketahui : Kelas Median ada pada kelas nomor 4 (karena data ke 20 pada kelas
nomor 4)
e
M
BPB = 3,24 0,005 = 3,235 ;
i
C = 0,3 ; ( )
k
i
f

= 5+6+5 = 16 :

i
f N = 40 ;
e
M
f = 8
Jadi :

'

+
8
16
2
40
) 3 , 0 ( 235 , 3 M
e
= 3,385
c.2.) Quartil (Perempatan) :
( )

'

+

i
i
Q
k
i
i Q i
f
f
i.N
C BPB Q
4
........
(3-13)

dimana
:
i
Q
BPB
= Batas Paling Bawah pada kelas Kuartil ke-i. Kelas Kuartil
ke-i adalah kelas dimana data ke ( 4 .N i ) berada.

i
f N
= jumlah keseluruhan data
( )
k
i
f

= Frekuensi kumulatif sebelum kelas Kuartil ke-i atau


jumlah seluruh frekuensi kelas sebelum frekuensi kelas
Kuartil ke-i.
i
Q
f
= Frekuensi pada kelas Kuartil ke-i
i
C
= Lebar kelas
i = 1, 2, dan 3.
Dari tabel 1.2.
Diketahui : Kelas Quartil ke-1 ( )
1
Q ada pada kelas nomor 2 (karena data ke 10
pada kelas nomor 2)
1
Q
BPB = 2,64 0,005 = 2,635 ;
i
C = 0,3 ;
( )
k
i
f

= 5 :

i
f N =
40 ;
1
Q
f = 6
Jadi :

'

+
6
5
4
40
) 3 , 0 ( 635 , 2
1
Q = 2,885
385 , 3
2 2
M Q
Kelas Quartil ke-3 ( )
3
Q ada pada kelas nomor 5 (karena data ke 30 pada kelas
nomor 5)
20
BIOSTATISTIK
3
Q
BPB = 3,54 0,005 = 3,535 ;
i
C = 0,3 ;
( )
k
i
f

= 24 :

i
f N = 40 ;
3
Q
f =
11
Jadi :

'

+
11
24
4
40 . 3
) 3 , 0 ( 535 , 3
3
Q = 3,698
c.3.) Desil (Persepuluhan :
( )

'

+

i
i
D
k
i
i D i
f
f
i.N
C BPB D
10
......
.(3-14)

dimana
:
i
D
BPB
= Batas Paling Bawah pada kelas Desil ke-i. Kelas Desil ke-i
adalah kelas dimana data ke ( 10 .N i ) berada.

i
f N = jumlah keseluruhan data
( )
k
i
f

= Frekuensi kumulatif sebelum kelas Desil ke-i atau jumlah


seluruh frekuensi kelas sebelum frekuensi kelas Desil ke-i.
i
D
f
= Frekuensi pada kelas Desil ke-i
i
C
= Lebar kelas
i = 1, 2, .., 9.
Dari tabel 1.2.
Diketahui : Kelas Desil ke-3 ( )
3
D ada pada kelas nomor 3 (karena data ke 12 pada
kelas nomor 3)
1
D
BPB = 2,94 0,005 = 2,935 ;
i
C = 0,3 ;
( )
k
i
f

= 11 :

i
f N =
40 ;
1
Q
f = 5
Jadi :

'

+
5
11
10
40 . 3
) 3 , 0 ( 935 , 2
3
D = 2,995
385 , 3
2 2 5
M Q D
Kelas Desil ke-8 ( )
8
D ada pada kelas nomor 5 (karena data ke 32 pada kelas nomor
5)
8
D
BPB = 3,54 0,005 = 3,535 ;
i
C = 0,3 ; ( )
i
f

= 24 :

i
f N = 40 ;
3
Q
f =
11
21
BIOSTATISTIK
Jadi :

'

+
11
24
10
40 . 8
) 3 , 0 ( 535 , 3
8
D = 3,753
c.3.) Persentil (Perseratusan) :
( )

'

+

i
i
P
k
i
i P i
f
f
i.N
C BPB P
100
....
(3-15)
dimana
:
i
P
BPB
= Batas Paling Bawah pada kelas Persentil ke-i. Kelas
Persentil ke-i adalah kelas dimana data ke ( 100 .N i )
berada.

i
f N = jumlah keseluruhan data
( )
k
i
f

= Frekuensi kumulatif sebelum kelas Persentil ke-i atau


jumlah seluruh frekuensi kelas sebelum frekuensi kelas
Persentil ke-i.
i
P
f
= Frekuensi pada kelas Persentil ke-i
i
C
= Lebar kelas
i = 1, 2, .., 9.
Dari tabel 1.2.
Diketahui : Kelas Persentil ke-40 ( )
40
P ada pada kelas nomor 3 (karena data ke 16
pada kelas nomor 3)
40
P
BPB = 2,94 0,005 = 2,935 ;
i
C = 0,3 ;
( )
k
i
f

= 11 :

i
f N =
40 ;
1
Q
f = 5
Jadi :

'

+
5
11
100
40 . 40
) 3 , 0 ( 935 , 2
40
D = 3,235
385 , 3
2 2 5 50
M Q D P
Kelas Persentil ke-85 ( )
85
P ada pada kelas nomor 5 (karena data ke 34 pada kelas
nomor 5)
85
P
BPB = 3,54 0,005 = 3,535 ;
i
C = 0,3 ;
( )
i
f

= 24 :

i
f N = 40 ;
3
Q
f =
11
22
BIOSTATISTIK
Jadi :

'

+
11
24
100
40 . 85
) 3 , 0 ( 535 , 3
85
P = 3,808
3.3. Nilai Penyebaran/Ukuran Variasi (Sebaran).
3.3.1. Nilai Penyebaran Dengan Data Tidak Berkelompok
Variasi atau sebaran adalah variabelitas data atau titk-titik sebaran sejauh mana
data numerik cenderung untuk tersebar disekitas suatu nilai rata-ratanya. Ada beberapa
ukuran variasi yang sering digunakan, antara lain :
a). Rentang atau Jangkauan (Range), adalah selisih bilangan terbesar dan terkecil
dalam suatu himpunan data, dinyatakan oleh R adalah :
R = Data terbesar Data tekecil .
..(3.16)
Contoh 1.6. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59
3,60 3,85
R = 3,85 2,76 = 1,09
b). Rata-rata Simpangan (Mean Daviation) suatu himpunan n bilangan
n
x x x ,........, ,
2 1

dinyatakan dengan MD didefenisikan oleh :
1 1
1
n-
x x f
n-
x x f
MD
i i
n
i
i i


....(3-17)
Tabel 1.1. Data bbl dari kelompok ibu perokok
No. i
x
i
f x x f
i i

( )
2
x x f
i i

2
i
x
23
BIOSTATISTIK
1. 2,76 1 0,51 0,2601
(2.76)
2
2. 2,84 1 0,43 0,1849 (2.84)
2
3. 2,90 1 0,37 0,1369 (2,90)
2
4. 3,18 2 0,18 0,0162 2x(3.18)
2
5. 3,27 1 0,00 0,0000
6. 3,29 1 0,02 0,0004
7. 3,52 1 0,25 0,0625
8. 3,59 1 0,32 0,1024
9. 3,60 1 0,33 0,1089
10. 3,85 1 0,58 0,3364
35,98 11 2,99 1,2087 118,8760
i
x
i
f

x x f
i i

2
) ( x x f
i i

2
i
x
299 , 0
1 11
99 , 2
1

n-
x x f
MD
i i
c). Simpangan baku (Standard Daviation) suatu himpunan n bilangan
n
x x x , ,......... ,
2 1

dan dinyatakan dengan S didefenisikan oleh :

( )
( )
1 1
2
2
1
n-
x x f
n-
x x f
S
i i
n
i
i i


...
(3-18)
perhatikan tabel 1.1., dimana :


2
) ( x x f
i i
= 1,2087 dan
i
f = n = 11.
( )
1
2
n-
x x f
S
i i

=
1 11
2087 , 1
-
= 0,348
atau, dengan rumus :
24
BIOSTATISTIK
) n(n
x x n
S
n
i
n
i
i i
1
1
2
1
2

,
_



=
( )
) n(n-
x x n
i i
1
2
2

.....
..(3-19)
perhatikan tabel 1.1., dimana :
i
x = 35,98 ;

2
i
x = 118,876 dan
i
f = n = 11
( )
) n(n-
x x n
S
i i
1
2
2

=
) - ( 1 11 11
) 98 , 35 ( ) 876 , 118 ( 11
2

= 0,345
d). Varians atau Ragam (Variance) adalah kuadrat dari simpangan baku, dinyatakan
dengan S
2
adalah :
( )
( )
1 1
2
2
1 2
n-
x x
n-
x x
S
i
n
i
i


..
(3-20)
atau, dengan rumus :
) n(n-
x x n
S
n
i
n
i
i i
1
1
2
1
2
2

,
_

=
( )
) n(n-
x x n
i i
1
2
2

...
..(3-21)
Jika nilai Simpangan baku sudah didapatkan, maka Varians dapat dihitung dengan
mengkuadratkan nilai simpangan bakunya, yaitu :
2 2
) (S S =
2
) 345 , 0 ( = 0,119
e). Koefisien variasi adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan
dinyatakan dengan KV didefenisikan oleh :
% x
x
S
KV 100 ...
(3-22)
Telah diketahui : x = 3,27 dan S = 0,345.
Jadi : % x KV 100
27 , 3
345 , 0
= 10,55%
f). Koefisien Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan
dinyatakan dengan KQ didefenisikan oleh :
25
BIOSTATISTIK
% x
Q Q
Q Q
KQ 100
1 3
1 3
+

..
(3-24)
Telah diketahui :
3
Q = 3,59 dan
1
Q = 2,90
Jadi : % x KQ 100
90 , 2 59 , 3
90 , 2 59 , 3
+

= 10,63%
g). Simpangan Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase,
dan dinyatakan dengan
d
Q didefenisikan oleh :
) (
2
1
1 3
Q Q Q
d
...
(3-25)
Telah diketahui :
3
Q = 3,59 dan
1
Q = 2,90
Jadi : 345 , 0 ) 90 , 2 59 , 3 (
2
1

d
Q
h). Inter Quartil Range adalah ukuran variabelitas yang dinyatakan dalam parsentase,
dan dinyatakan dengan IQRdidefenisikan oleh :
1 3
Q Q IQR .......
(3-26)
Telah diketahui :
3
Q = 3,59 dan
1
Q = 2,90
Jadi : 90 , 2 59 , 3 IQR = 0,69
3.3.2. Nilai Penyebaran Dengan Data k Berkelompok
Pada dasarnya penghitungan ukuran variasi pada data berkelompok hampir sama
dengan penghitungan pada data tidak berkelompok.
a). Rata-rata Simpangan (Mean Daviation) :
26
BIOSTATISTIK

i
i i
n
i
i
n
i
i i
f
x x f
f
x x f
MD
1
1
......
(3-27)
= 0,414 Dari tabel 1.2.
Diketahui :

x x f
i i
= 16,5600 ;
i
f = 40
Jadi :
40
5600 , 16

i
i i
f
x x f
MD =
b). Simpangan baku (Standard Daviation) :
( )
( )

i
i i
n
i
i
n
i
i i
f
x x f
f
x x f
S
2
1
1
2
......
(3-28)
Dari tabel 1.2.
Diketahui : ( )


2
x x f
i i
= 9,1777 ;
i
f = 40
Jadi :
( )
40
1777 , 9
2

i
i i
f
x x f
S
= 0,479
Atau dengan rumus ;
2
2
2
1
1
1
1
2
S

,
_

,
_

i
i i
i
i i
n
i
i
n
i
i i
n
i
i
n
i
i i
f
x f
f
x f
f
x f
f
x f
.
(3-29)
Dari tabel 1.2.
Diketahui :


i i
x f 132,100 ;

2
i i
x f = 445,4380 dan
i
f = 40
2
2
2
40
100 , 132
40
4380 , 445
S
,
_

,
_

i
i i
i
i i
f
x f
f
x f
= 0,479
atau, dengan rumus :
27
BIOSTATISTIK
2
2
2
1
1
1
1
2
S

,
_

,
_

i
i i
i
i i
i
n
i
i
n
i
i i
n
i
i
n
i
i i
i
f
d f
f
d f
C
f
d f
f
d f
C
...
(3-30)
Dari tabel 1.2.
Diketahui :


i i
d f - 51 ;

2
i i
d f = 167 dan
i
f = 40
2
2
2
40
51
40
167
) 3 , 0 ( S
,
_

,
_

i
i i
i
i i
i
f
d f
f
d f
C
= 0,479
d). Varians atau Ragam (Variance) :
( )
( )

i
i i
n
` i
i
n
i
i i
f
x x f
f
x x f
S
2
2
1 2
.
(3-31)
Dari tabel 1.2.
Diketahui : ( )


2
x x f
i i
= 9,1777 dan
i
f = 40
Jadi :
( )
40
1777 , 9
2
2

i
i i
f
x x f
S = 0,229
atau, dengan rumus :
( ) ( )

'

,
_

'

,
_

2
2
2
1
1
2
2 2
i
i i
i
i i
i
n
i
i
n
` i
i i
n
` i
i
n
i
i i
i
f
d f
f
d f
C
f
d f
f
d f
C S ...(3-
32)
Dari tabel 1.2.
Diketahui :


i i
d f - 51 ;

2
i i
d f = 167 dan
i
f = 40
Jadi : ( ) ( )

'

,
_

'

,
_

2
2
2
2
2 2
40
51
40
167
3 , 0
i
i i
i
i i
i
f
d f
f
d f
C S = 0,229
28
BIOSTATISTIK
MODUL 4
KONSEP DASAR POPULASI DAN SAMPEL
29
BIOSTATISTIK
4.1. PENGERTIAN POPULASI DAN SAMPEL
Dalam suatu penelitian, jika kita ingin megamati atau memeriksa secara keseluruhan
subjek, hal ini berarti kita mempelajri populasi. Populasi adalah totalitas semua nilai yang
mungkin, hasil menghitung ataupun pengukuran kuantitatif maupun kualitatif mengenai
karakteristik tertentu dari semua anggota kumpulan yang lengkap dan jelas yang ingin
dipelajari sifat-sifatnya. Sangat sering kita mengalami kesulitan untuk mengamati populasi,
karena dari segi jumlah subjek, dana, tenaga, dan alat yang dibutuhkan sangat besar,
maka dengan teori sampling dapat dilakukan dengan mengamati sebagian dari jumlah
populasinya saja.
Pada dasarnya suatu penelitian harus mampu dilaksanakan (feasible), artinya
tersedianya subjek penelitian, dana, waktu, alat dan tenaga ahli yang sesuai. Apabila dalam
pelaksanaanya ditemukan kendala seperti keterbatasan dana, waktu, alat dan tenaga ahli,
tetapi kita harus melakukan pengamatan kritis pada seluruh sabjek penelitian, maka dapat
dilakukan pada sebagian subjek yang tersedia saja, hal seperti ini disebut dengan sampling.
Sampling adalah cara pengumpulan data penelitian yang hanya mengamati
sebagian (elemen sampel) dari keseluruhan subjek penelitian yang diteliti.
Keuntungan-keuntungan dari penarikan sampel, antara lain :
1. Dana, waktu, alat dan tenaga ahli yang diperlukan lebih sedikit dibandingkan jika
penelitian dilakukan langsung pada populasi.
2. Mudah dan lebih cepat dikerjakan serta hasilnya dapat segera dievaluasi dan dianalisa.
3. Data yang dikumpulkan lebih komprehensif (dengan cakupan lebih besar) dan
representatif, serta merupakan refleksi dari karakteristik populasi yang diteliti.
4. Tingkat ketelitian lebih besar, artinya pemeriksaan pada sampel akan lebih teliti dan
sangat objektif daripada pemeriksaan lengkap pada seluruh elemen populasi.
Penarikan sampel bila dilakukan dengan prosedur yang sesuai dan benar, maka
suatu sampel dapat merupakan cara yang lebih efisien (cost efficient) untuk mengunpulkan
data dari harus meliputi keseluruhan elemen populasi.
Penelitian survei adalah merupakan salah satu penelitan yang dalam penyelidikan
kritis-nya dalam rangka memperoleh atau mencari keterangan atas suatu persoalan atau
fenomena tertentu dalam suatu daerah atau wilayah tertentu dilakukan dengan mengambil
sampel dari suatu populasi yang tersedia. Biasanya alat ukur (instrumen) yang digunakan
dalam penelitian survei ini adalah kuesioner. Jadi, pada penelitian survei kesimpulan
tentang sifat populasi yang dihasil-kan sangat tergantung pada sampel yang dipelajari,
artinya sampel ynag dipelajari ini diperoleh dengan prosedur teknik sampling yang
bagaimana.
Sedangkan Sensus adalah cara pengumpulan data atau penelitian yang
menggunakan seluruh elemen populasi yang diteliti satu per satu (a complete enumeration)
dan hasilnya merupakan data yang sebenarnya (parameter)
4.2. Teknik penarikan sampel
Peranan yang terpenting dari penarikan sampel dalam suatu penelitian survei adalah
untuk mendapatkan sampel yang betul-betul representatif dan pada gilirannya akan
menghasilkan kete-rangan (informasi) yang dapat diandalkan mengenai sifat-sifat populasi
yang ingin dijelaskannya.
Disamping itu tujuan mempelajari teknik sampling adalah (1) untuk membuat
penarikan sampel menjadi lebih efesien, (2) untuk mengetahui apakah metoda penarikan
sampel sudah benar, dan (3) untuk dapat melakukan pendugaan atau pengujian terhadap
nilai parameter populasi dengan tingkat ketepatan yang tinggi.
Sesuai dengan tujuan utama melaksanakan survei adalah untuk membuat kesim-
pulan tentang sifat-sifat populasi berdasarkan informasi yang terkandung dalam sample.
30
BIOSTATISTIK
Untuk mendapatkan ketepatan (precision), kepekaan (sensitivity), dan banyaknya
informasi (amount of information) yang terkandung dalam sampel diukur sebagai
berbanding terbalik dari ragam (variance) dan nilai rata-rata (mean), dan secara matematis
digambarkan sebagai berikut :
( )
2 2 2
x
n /
1 1
I

n

.
. (4-1)
dimana : I
2

n
= banyaknya informasi yang terkandung dalam sample
= varians populasi
= banyak sample
Dari formula di atas, terlihat bahwa jika varians populasi (
2

) besar, maka banyak


infor-masi dalam sample berkurang (sedikit), juga apabila ukuran semakin sampel besar,
maka banyak informasi dalam sampel akan bertambah. Jadi ada dua faktor yang
mempengaruhi banyak atau berkurang informasi yang terkandung dalam sampel, yang
pada giliranya akan mempengaruhi ketepatan dari prosedur pembuatan kesimpulan tentang
populasi.
Untuk mendapatkan sampel yang benar-benar representatif bagi populasinya
dengan mem-perhatikan keragaman data yang ada dalam populasinya, dapat dilakukan
dengan teknik pencupli-kan sampel (sampling technique). Dengan teknik sampling ini
diharapkan bisa memperoleh informasi yang optimal yang terkandung dalam sampel,
sehingga survei yang dilakukan dapat bersifat lebih efesien dalam artian dengan
mengeluarkan ongkos yang minimum dapat diperoleh informasi yang maksimal.
Teknik penarikan sampel dapat dikelompok dalam dua bagian, yaitu penarikan
sampel acak (probabilitas sampling random) dan pencuplikan sampel tidak acak (non-
probabilitas sampling random).
(1) Probability random samling,
Hal prinsip pada probability sampling adalah bahwa setiap unit (elemen) dalam
populasi mempunyai kesempatan yang sama untuk terpilih (terambil) sebagai sampel.
1. Penarikan Sampel Acak Sederhana (Simple Random Sampling)
Pada setiap unit (elemen) populasi diberi nomor, kemudian sampel yang diinginkan
ditarik secara acak, baik dengan menggunakan tabel random ataupun dengan
undian.
2. Penarikan Sampel Acak Sistematik (Systematic Random Sampling)
Pada setiap unit (elemen) populasi diberi nomor dan diurut, kemudian ditentukan
satu nomor sebagai titik tolak penarikan sampel sampel secara acak. Nomor berikut
dapat ditarik dengan kelipatan (K = N/n) yang dilakukan secara sistematis.
3. Penarikan Sampel Acak Berlapis (Stratified Random Sampling)
Populasi dibagi dalam kelompok yang homogen lebih dahulu, atau dalam strata.
Elemen sampel dapat ditarik dari setiap strata.
4. Penarikan Sampel Acak Bergerombol (Cluster Random Sampling)
Populasi dibagi dulu atas kelompok berdasarkan area atau cluster. Elemen sub
populasi tiap cluster tidak harus homogen. Lakukan sampling acak pada cluster lebih
dulu, kemudian pada cluster yang terpilih dapat dilakukan sampling dengan cara
31
BIOSTATISTIK
simple random sampling atau systematic random sampling ataupun juga dapat
langsung mengamati seluruh elemen dalam cluster.
5. Penarikan Sampel Acak Bertahap Ganda (Multistage Random Sampling)
Populasi dibagi dalam beberapa tahap (stage). Tahap pertama menentukan
subpopulasi dimana sampel akan ditarik. Jika peneliti ingin menentukan populasi
tahap berikutnya dapat dilakukan dengan menentukan sub-sub populasi sampai
dimungkinkan pada populasi mana elemen sampel dapat ditarik.
(2) Non probability random sampling.
Penarikan sampel non probability prosedurnya lebih sederhana dan lebih praktis.
Oleh karena penarikan sampelnya tidak acak, maka kesahihan sampel non probability
tergantung pada sejauh mana penarikan sampel yang dilakukan dapat menyerupai
probability sampling. Cara yang dilakukan untuk mendekati prosedure probability
sampling yang dimaksdud, dilakukan dengan menentukan kriteria inklusi dan
eksklusi terhadap sampel sampel yang ditetapkan berdasarkan pencapaian tujuan
penelitian yang diinginkan. Apakah penarikan sampel non probability ini sudah sesuai
dengan kriteria inklusi dan eksklusi.
1. Purposive Sampling
Pengambilan sampel ditentukan berdasarkan pertimbangan yang dibuat oleh peneliti
sendiri, berdasarkan karakteristik atau sifat populasi yang sudah dikatahui
sebelumnya.
2. Quota Sampling
Penarikan sampel dilakukan dengan cara menetapkan sejumlah eleman sampel
secara kuota (jatah) sesuai dengan keiinginan peneliti.
3. Convinience Sampling
Sampel dipilih dengan semaunya saja tanpa menggunakan prosedur yang jelas.
4. Consecutive Sampling
Pemilihan sampling ditetapkan berdasarkan kriteria penelitian dalam kurun waktu
terentu sampai jumlah sampel yang diinginkan terpenuhi.
5. Judgement Sampling
Pada cara ini peneliti memilih subjek penelitian berdasarkan pertimbangan
subjektifnya, dengan harapan subjek tersebut nantinya akan mampu memberikan
informasi yang memadai untuk menjawab permasalahan penelitian.
6. Panel Sampling
Sampel semi permanen yang dipilih untuk keperluan suatu studi yang berkelanjutan.
4.3. Kriteria rancangan sampel yang dapat diandalkan.
Rancangan sampel yang dapat diandalkan, apabila memenuhi kriteria sebagai
berikut :
1. Mempunyai kemampuan untuk mewakili (representativeness). Suatu sampel harus
menjadi wakil dari populasi induknya sehingga penalaran yang diambil dari sampel
32
BIOSTATISTIK
dapat digene-ralisasi terhadap populasi tersebut dengan tingkat ketepatan dan
kepercayaan yang dapat diukur.
2. Efisien dan ekonomis dalam artian rancangan sampling yang disiapkan sedemikian rupa
sehingga penghematan waktu dan biaya dapat dicapai tanpa mengurangi pencapaian
tujuan penelitian. Dengan kata lain, sampel harus dapat memberikan informasi yang
dikehendaki didalam batas kesalahan sampling yang sudah diperkirakan tetapi masih
dapat ditoleransi untuk biaya yang paling murah. Sebaliknya, sampel harus dapat
meberikan informasi pada suatu biaya pasti dengan kesalahan sampling (sampling
error) paling kecil.
3. Terukur (measurability), artinya peneliti dapat memperkirakan sejauh mana temuan-
temuan dari sampel cendrung berbeda dari yang akan ia temukan jika ia meneliti
seluruh populasi induknya.
4. Ukuran (size) sampel minimal harus cukup besar untuk memperkecil ragam
(variabelitas) sampel bagi pendugaan parameter yang harus dibuat dengan tingkat
ketepatan (presisi) yang dapat diukur.
5. Prosedur sampling harus sederhana dan praktis sehingga mudah dilaksanakan
dilapangan
4.4. Beberapa terminologi dalam sampling
1. Populasi (population), ialah kumpulan yang lengkap dari seluruh elemen yang
sejenis, tetapi dapat dibedakan berdasarkan karakteristiknya. Populasi dapat dibagi
menjadi dua, yaitu :
a. Populasi target (target population) yang ditentukan berdasarkan karakteristik
subjek yang diteliti dan demografis. Misalnya penderita anemia ibu hamil dengan
umur kehamilan kurang dari 12 minggu di kota X.
b. Populasi terjangkau (accessible population, source population) disebut juga
populasi sampling adalah bagian dari populasi target dengan spesifikasi yang lebih
tegas dan terfokus pada subjek yang ingin diteliti dan dibatasi oleh tempat serta
waktu. Misalnya Ibu hamil dengan kasus anemia berat yang berkunjung di beberapa
Puskesmas di kota X selama tahun 1990-1991.
Catatan, dalam penelitian survei yang dilakukan, populasi yang didefenisikan
langsung menggambarkan populasi terjangkau.
2. Elemen (element) ialah sesuatu yang menjadi objek (boleh orang atau benda) yang
padanya dapat dilaku-kan pengukuran untuk memperoleh nilai data yang diharapkan.
3. Karakteristik (characteristics) ialah sifat-sifat atau ciri-ciri yang melekat (dimiliki)
elemen.
4. Unit sampling (sampling units) ialah kumpulan elemen-elemen dari populasi
tertentu yang tidak bersifat tumpang tindih.
5. Kerangka sampling (sampling frame) ialah daftar unit-unit sampling.
6. Populasi (population) ialah kumpulan yang lengkap dari seluruh elemen yang sejenis,
tetapi dapat dibedakan karena karakteristiknya.
7. Parameter (parametric) ialah nilai sesungguhnya dari populasi, dimana nilai ini bisa
diperoleh jika yang diamati (dipelajari) keseluruhan dari elemen populasi.
7. Sampel (sample) ialah sebagian elemen dari keseluruhan elemen populasi, Jika n =
jumlah elemen sampel dan N = jumlah elemen populasi, maka n (sampel) lebih kecil dari
N (populasi).
9. Statistik (statistics) ialah nilai yang diperoleh dari penghitungan pada sampel
dan dapat digunakan untuk menduga (menaksir) parameter populasi.
33
BIOSTATISTIK
10. Distribusi sampling (sampling distribution) ialah distribusi penarikan sampel dari
nilai-nilai statistik yang didapatkan dari sampel-sampel yang dikumpulkan (baik dengan
penarikan sampel dengan atau tampa pengembalian). Jika nilai statistik yang
dimaksudkan adalah rata-rata (mean), maka distribusinya disebut distribusi penarikan
sampel dari nilai rata-rata (sampling distribution of the mean). Demikian juga dengan
ditribusi sampling lainnya, dapat dilakukan dengan nilai statistik seperti simpangan
baku, varians, median, proporsi dan nilai-lain.
11. Sampling error ialah kesalahan yang terjadi karena pengukuran data sampel yang
dikumpul-kan, sehingga terjadi selisih antara perkiraan statistik dengan parameter.
12. Sampling acak ialah penarikan elemen sampel dari elemen populasi yang dilakukan
secara acak (random). Acak adalah memberikan kesempatan yang sama kepada seluruh
elemen populasi untuk terpilih sebagai sampel.
MODUL 5
PENGUJIAN HIPOTESIS
A. PENDUGAAN PARAMETER
Pendugaan atau estimasi disebut juga dengan penaksiran dan berguna untuk menaksir
nilai-nilai parameter populasi atau membuat kesimpulan tentang populasi lewat sampel
yang representatif untuk inferensi statistic. Nilai-nilai statistik, misalnya : mean, proporsi
dan SD dan sbb
Istilah-istilah yg perlu dipahami
Simpangan baku (standard Deviation) merupakan ukuran variabelitas atau sebaran nilai yg
menggambarkan variasi nilai individual sekitar rata-rata.
Kesalahan baku (Standard Error = SD), adalah kesalahan baku rata-rata yg berkaitan dgn
ketepatan rata-rata yg diduga sesungguhnya.
Galat Pendugaan adalah merupakan perbedaan absolut dari nilai statistik dan parameter,
atau suatu nilai yang ditolerir untuk suatu kesalahan dalam pendugaan titik sampel
terhadap ruang pupulasi.
Interval kepercayaan (Confidence Interval = CI) atau interval taksiran (Estimasi taksiran),
digunakan untuk mendapatkan nilai taksiran yang relatif atas nilai yg diharapkan.
Tingkat kepercayaan (Confidence Level = CL) yang lazim dilambangkan dengan adalah
merupakan kesalahan atas penolakan hipotesis nol yang benar (error tipe I), artinya nilai
ini dalam estimasi berfungsi untuk menunjukkan besarnya probabilitas atau kesalahan tipe I
yang berakibat pada tinggi rendahnya tingkat kepercayaan.
B. Uji Hipotesa
34
BIOSTATISTIK
Utk membuat suatu keputusan terhadap suatu objek penelitian atau populasi berdasarkan
informasi yang berasal dari data sampel, haruslah dimulai dengan suatu asumsi atau
penaksiran terhadap segala kemungkinan yg akan terjadi pd suatu populasi, dimana
kemungkinan ini dapat diterima atau ditolak, kegiatan ini disebut sebagai Statistical
Hypothesis
Dalam uji hipotesis diperoleh kemungkinan menerima atau menolak hipotesis. Bila kita
menyatakan bahwa tidak ada perbedaan bermakna secara statistik antara parameter
sampel dengan populasi, hal ini disebut dengan hipotesis nol (Ho), sebaliknya bila kita
menyatakan ada perbedaan bermakna secara statistik, disebut hipotesis alternatif
(Ha).
5.1. PENDUGAAN DAN UJI HIPOTESA SATU PARAMETER
5.1.1. Pendugaan bagi rata-rata populasi () dengan n 30 (sampel besar) dan
diketahui
Jika x adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu
populasi dengan
2
(varians atau ragam) diketahui, maka Interval Kepercayaan (1-).100 %
bagi adalah :
...
..(5-1)

diman
a
:

x
ZC

n
=
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku normal berdasarkan error type I () yang ditentukan
Simpangan baku populasi
Jumlah sampel.
ZC.(/n) adalah batas galat pendugaan bagi , artinya bila x (rata-rata sampel)
digunakan untuk menduga (rata-rata populasi), maka kita percaya (1-).100 % bahwa
galatnya tidak akan lebih dari ZC.(/n).
Galat Pendugaan

x -ZC.(/n) x x + ZC.
(/n)

5.1.2. Uji Hipotesis rata-rata populasi (

) dengan n 30 (sampel besar) dan


diketahui
35
) / , ( C C
Z Z
n

Z x
2 5 0
t
BIOSTATISTIK
Jika x adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu
populasi dengan
2
(varians atau ragam) diketahui, maka uji hipotesis rata-rata populasi
(sesungguhnya) digunakan statistik uji berikut :
...
(5-2)
dimana :
0

x
H
Z

n
=
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku normal yang besarnya tergantung eror type I () yang
ditentukan
Simpangan baku populasi
Jumlah sampel.
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
= o
o Terima Ho, jika :
C H C
Z Z Z ; sebaliknya tolak Ho.
dimana :
) 2 / 5 , 0 (
Z Z
C
atau : dengan membandingkan nilai probabilitas (Prob.) maksimal
penolakan Ho ber-dasarkan data sampel yang diamati, dengan nilai
yang ditentukan sebelumnya.
Tolak Ho, jika : Prob. < (/2), sebaliknya Ho diterima.
Ho
Ha
:
:
= o
> o Tolak Ho, jika :
C H
Z Z > ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
= o
< o Tolak Ho, jika :
C H
Z Z < ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.1.
Hasil pemeriksaan oleh tim kesehatan universitas menyatakan bahwa rata-rata tekanan
darah sistolik seluruh mahasiswa yang masuk tahun sebelumnya adalah 127,5 mmHg.
Seorang mahasiswa FKM ingin membandingkannya dengan mahasiswa yang ada saat ini.
Untuk maksud tersebut ia membuat suatu survei mini dan mengambil sampel secara acak
sebanyak 50 orang mahasiswa. Diasumsikan data ke 50 mahasiswa ini, data populasinya
menyebar normal. Dari data sampel yang dikumpulkan dapat dihitung rata-rata tekanan
darah sistoliknya ( x ) 124 mmHg dan simpangan baku (S) 26,9 mmHg. Gunakan Confidence
Level () 5 %.
Pertanyaan :
a). Buatlah taksiran dengan interval kepercayaan 95 % bagi tekanan darah sistolik (tks)
mahasiswa sesung-guhnya ?
36
n

- x
Z
o
H

BIOSTATISTIK
b). Selanjutnya jelaskan galat pendugaan bagi rata-rata tekanan darah sistolik mahasiswa
sesungguhnya oleh titik taksiran sebesar 124 mmHg ?
c). Ujilah, apakah rata-rata tekanan darah sistolik mahasiswa sekarang berbeda dengan
tahun sebelumnya ? Gunakan = 0,05.
Jawab :
a). Untuk melakukan pendugaan bagi rata-rata populasi (

) oleh rata-rata sampel ( x )


sebesar 124 mmHg dengan ukuran sampel (n ) sebanyak 50 mahasiswa dapat dilakukan
dengan rumus (1-1).
n
Z x
C

t ZC = Z(0,5 - /2) = Z0,4750 = 1,96 (Tabel. II)
Jika (simpangan baku populasi) tidak diinformasikan pada soal,
dapat digunakan S (simpangan baku sampel).
Jadi :
50
9 , 26
) 96 , 1 ( 124 t
= 124 t 7,46
atau : Interval kepercayaan 95 % bagi

adalah : [116,54 ; 131,46]


Kesimpulan : Kita percaya 95 % bahwa rata-rata sesungguhnya () tekanan darah
sistolik mahasiswa ada dalam interval dengan batas bawah 116,54 sampai dengan batas
atas 131,46 atau dalam jangkauan sekitar 14,92 mmHg.
b). Dapat dinterpretasikan bahwa jika kita ingin menaksir rata-rata sesungguhnya ()
dengan mengguna-kan rata-rata sampel ( x ) sebesar 124 mmHg dalam interval
kepercayan 95%, maka kita boleh membuat kesalahan dalam penaksiran (galat
penduggaan) tidak lebih dari (
n
Z
C

. ) atau sebesar 7,46 mmHg. Atau dapat juga
dinyatakan bahwa batas galat pendugaan (GBP) dalam pendugaan x bagi

sama
dengan 7,46 mmHg.
c). Ho :
0

Ha :
0

0
127,5 mmHg.
Statistik uji yang digunakan :
50
9 , 26
5 , 127 124
0

n
x
Z
H

= -0,92 Nilai Prob. = 0,3576


a)
Titik kritis : ZC = Z(0,5-/2) = Z0,4750 = 1,96
Ternyata : -1,96 <ZH (= -0,92) < 1,96 dapat dinyatakan ZH berada pada daerah
penerimaan Ho. atau berdasarkan nilai probabilitas, dimana : Prob. (= 0,3578) > (=
0,025) artinya. Ho diterima.
Kesimpulan : Hasil penyelidikan yang dilakukan mahasiswa AKBID tersebut
mendukung pernyataan tim kesehatan terdahulu bahwa rata-rata TKS mahasiswa
sekarang sesungguhnya sama dengan mahasiswa tahun sebelumnya pada taraf uji () 5
%
5.1. 3. Pendugaan bagi rata-rata populasi () dengan n < 30 (sampel kecil) tidak
diketahui
37
BIOSTATISTIK
Jika x adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu
populasi dengan
2
(varians atau ragam) tidak diketahui, maka Interval Kepercayaan (1-
).100 % bagi adalah :
...
..(5-3)
dimana :

x
tC
S
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku t-student berdasarkan error type I () yang ditentukan
Simpangan baku sampel.
5.1.4. Uji Hipotesis rata-rata populasi () dengan n < 30 (sampel kecil) tidak
diketahui
Jika x adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu
populasi dengan
2
(varians atau ragam) tidak diketahui, maka uji hipotesis bagi rata-rata
populasi (sesungguhnya) digunakan statistik uji berikut :
........
(5-4)
diman
a
o
x
tC
S
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku t-student yang besarnya bergantung pada yang ditentukan
Simpangan baku sampel.
a) Prob. = 2{0,5 L(ZH = -0,92)} = 2(0,5 0,3212) = 0,3576
atau : Prob. = 1 2{L(ZH = -0,92)} = 1 2(0,3212) = 0,357
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
= o
o Terima Ho, jika :
C H C
t t t ; sebaliknya tolak Ho.
dimana :
dk C
t t
); 2 / (

dk = n - 1
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
= o
> o
Tolak Ho, jika : tH > tC ; sebaliknya terima Ho.
dimana :
dk C
t t
;

dk = n - 1
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
= o
< o
Tolak Ho, jika : tH < -tC ; sebaliknya terima Ho.
38
1
2
n- dk t t
n
S
t x
);dk / ( C C
t

n S
- x
t
o
H

BIOSTATISTIK
dimana :
dk C
t t
;

dk = n - 1
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.2.
Dari 25 mahasiswa yang diambil secara acak, masing-masing diukur tinggi badan mereka,
dan diperoleh data seperti berikut : 160,5 ; 160,0 ; 157,0 ; 154,0 ; 165,0 ; 167,0 ; 170,5 ;
172,5 ; 167,5 ; 174,5 ; 167,0 ; 168,0 ; 150,0 ; 145,0; 150,0 ; 155,0 ; 160,0 ; 162,5 ; 170,0 ;
166,0 ; 165,5 ; 170,0 ; 174,0 ; 155,5 ; 175,0.

i
x = 4082 dan

2
i
x = 668169.
Dari data yang terkumpul diperoleh rata-ratanya adalah 163,28 cm, dan simpangan baku
sebesar 8,317 cm. Berdasarkan data tahun sebelumnya rata-rata tinggi badan adalah 165,7
cm.
a). Buatlah pendugaan bagi rata-rata tinggi badan mahasiswa yang sesungguhnya (

) pada tingkat keyakinan 99%.


b). Jelaskan tentang galat pendugaan bagi pendugaan

oleh x pada tingkat keyakinan


99%.
c). Ujilah apakah tinggi badan mahasiswa tahun sekarang lebih rendah dari tahun
sebelumnya. Gunakan = 0,01.
Jawab :
a). Untuk melakukan pendugaan bagi rata-rata populasi (

) oleh rata-rata sampel ( x )


sebesar 163,28 cm dengan ukuran sampel (n ) sebanyak 25 mahasiswa dapat dilakukan
dengan rumus (7-3).
n
S
t x
C
t
dk C
t t
); 2 / (
=
24 ); 005 , 0 (
t = 2,797 (Tabel. III)
Jadi :
25
317 , 8
) 797 , 2 ( 28 , 163 t
= 163,28 t 4,65
atau : Interval kepercayaan 99 % bagi

adalah : [158,63 ; 167,93]


Kesimpulan : Kita percaya 99 % bahwa rata-rata sesungguhnya () tinggi badan
mahasiswa ada dalam interval dengan batas 158,63 sampai dengan 167,93 atau dalam
jangkauan sekitar 9,3 cm.
b). Dapat dinterpretasikan bahwa jika kita ingin menaksir rata-rata sesungguhnya ()
dengan menggunakan rata-rata sampel ( x ) sebesar 163,28 cm dalam interval
kepercayaan 99%, maka kita boleh membuat kesalahan dalam penaksiran (galat
penduggaan) tidak lebih dari (
n
S
t
C
. ) atau sebesar 4,65 cm. Atau dapat juga dinyatakan
bahwa batas galat pendugaan (BGP) dalam pendugaan x untuk

sama dengan 4,65.


c). Ho :
0

Ha :
0 0
< = 165,7 cm
39
BIOSTATISTIK
Statistik uji :
455 , 1
25
317 , 8
7 , 165 28 , 163
0

n
S
x
t
H

Prob. = 0,165
b)
Titik kritis :
) 1 ( ); (

n C
t t

=
24 ; 01 , 0
t = 2,492
Ternyata :
H
t (= -1,455) >
C
t (= -2,492) Ho diterima. (Prob. (= 0,165) > (= 0,01)
Ho diterima).
Kesimpulan : Tidak benar bahwa tinggi badan mahasiswa sekarang lebih rendah dari
tinggi badan mahasiswa tahun sebelumnya, pada taraf uji () 1 %.
5.2. PENDUGAAN DAN UJI HIPOTESIS PARAMETER POPULASI DENGAN DUA SAMPEL
5.2.1. Pendugaan beda dua rata-rata populasi : (1-2) dengan 1
2
dan 2
2
diketahui
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran n1 dan n2
yang diambil dari suatu populasi dengan varians
2
1
dan
2
2
diketahui (n 30), maka
Interval Kepercayaan (1-).100% bagi (1-2) adalah :
....(5-5)
dimana
:
1-2
= selisih rata-rata sesungguhnya (populasi)
1
x -
2
x
= selisih rata-rata sampel
2
2
2
1
dan
= varians pada kelompok populasi 1 dan 2
1
x dan
2
x
= rata-rata sampel pada kelompok populasi 1 dan 2 .
5.2.2. Uji Hipotesis perbedaan dua rata-rata populasi : (
2 1
) dengan 1
2
dan
2
2
diketahui
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran n1 dan n2
yang diambil dari suatu populasi dengan varians 1
2
dan 2
2
diketahui (n 30), maka uji
hipotesis beda rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :
.........
..(5-6)
dimana :
1-2
= beda rata-rata sesungguhnya (populasi)
1
x -
2
x
= beda rata-rata sampel
40
( )
) - , ( C C
Z Z
n

Z x x -
2 5 0
2
2
2
1
2
1
2 1 2 1
+ t
2
2
2
1
2
1
2 1
n

x - x
Z
H
+

BIOSTATISTIK
1
2
dan 2
2
=
varians pada kelompok populasi 1 dan 2
1
x dan
2
x
= rata-rata sampel pada kelompok populasi 1 dan 2 .
d). Interpolasi :
546 , 0 . Pr
651 , 11 338 , 18
571 , 17 338 , 18
900 , 0 500 , 0
. Pr 500 . 0
18,338

571 , 17

651 , 11
2
0,500;19
2
19 .; Pr
2
19 ; 900 , 0

ob
ob
ob

Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
1 = 2
1 2 Terima Ho, jika :
C H C
Z Z Z ; sebaliknya tolak Ho.
dimana :
) 2 / 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya Ho diterima.
Ho
Ha
:
:
1 2
1 > 2 Tolak Ho, jika :
C H
Z Z ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
1 2
1 < 2 Tolak Ho, jika :
C H
Z Z ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.5.
Suatu sampel acak mahasiswi berukuran n1 = 25, yang ditarik dari suatu populasi normal
dapat dicatat hasil ujian Biostatistik mereka sebagai berikut : 70 ; 80 ; 85 ; 75 ; 60 ; 65 ; 75 ;
41
BIOSTATISTIK
60 ; 75 ; 80 ; 85 ; 90 ; 85 ; 70 ; 65 ; 60 ; 65 ; 60 ; 55 ; 85 ; 80 ; 70 ; 75 ; 80 ; dan 60. Dapat
dihitung
1
x = 72,40 dan S1 = 10,12.
Suatu sampel acak lain berukuran n2 = 36 dapat dicatat hasil ujian Biostatistik sebagai
berikut : 60 ; 60 ; 65 ; 65 ; 60 ; 75 ; 75 ; 80 ; 80 ; 75 ; 70 ; 65 ; 80 ; 65 ; 75 ; 70 ; 50 ; 50 ;
55 ; 65 ; 60 ; 75 ; 75 ; 80 ; 75 ; 60 ; 60 ; 55 ; 55 ; 50 ; 60 ; 75 ; 70 ; 75 ; 85 ; dan 70.
Diperoleh
2
x = 67,22 dan S2 = 9,67.
Pertanyaan :
a). Buatlah penaksiran terhadap selisih rata-rata sesungguhnya ( )
2 1
pada tingkat
kepercayaan 99 % dan 95 %.
c). Jelaskan galat pendugaan bagi penaksiran selisih rata-rata sesungguhnya dengan
menggunakan rata-rata sampel pada intervak kepercayaan 99 % dan 95 %.
b). Ujilah apakah kedua kelompok mahasiswi dan mahasiswa tersebut nilai ujiannya
berbeda nyata ? Gunakan = 0,01 dan 0,05.
Jawab :
a). Untuk melakukan taksiran bagi selisih rata-rata populasi (
2 1
) oleh selisih rata-rata
sampel (
2 1
x x ) dengan ukuran sampel n1 dan/atau n2 lebih dari 30 (sampel besar)
dapat dilakukan dengan rumus (5-9).
2
2
2
1
2
1
2 1 2 1
n n
Z x x
C

+ t
575 , 2 01 , 0
4950 , 0 )) 2 / 01 , 0 ( 5 , 0 (


Z Z Z
C

dan 96 , 1 05 , 0
4750 , 0 )) 2 / 05 , 0 ( 5 , 0 (


Z Z Z
C

Jika
2
1
atau
2
2
(varians populasi) tidak diinformasikan pada soal, dapat digunakan
2
1
S atau
2
2
S (varians sampel).
Pada

= 0,01 66 , 6 18 , 5
36
) 67 , 9 (
25
) 12 , 10 (
) 575 , 2 ( ) 22 , 67 40 , 72 (
2 2
2 1
t + t
atau : Interval kepercayaan 99 % bagi selisih
2 1
adalah : [-1,48 ; 11,84]
Kesimpulan : Kita percaya 99 % bahwa selisih rata-rata sesungguhnya (
2 1
)
nilai ujian mahasiswa ada dalam interval dengan batas 1,48 sampai dengan 11,84
atau dalam jangkauan sekitar 13,32.
Pada

= 0,05 07 , 5 18 , 5
36
) 67 , 9 (
25
) 12 , 10 (
) 96 , 1 ( ) 22 , 67 40 , 72 (
2 2
2 1
t + t
atau : Interval kepercayaan 95 % bagi selisih
2 1
adalah : [0,11 ; 10,25]
Kesimpulan : Kita percaya 95 % bahwa selisih rata-rata sesungguhnya (
2 1
)
nilai ujian mahasiswa ada dalam interval dengan batas 0,11 sampai dengan 10,25
atau dalam jangkauan sekitar 10,14.
b). Pada

= 0,01 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih
rata-rata sesung-guhnya (
2 1
) dengan menggunakan selisih rata-rata sampel (
42
BIOSTATISTIK
2 1
x x ) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (
2
2
2
1
2
1
n

. Z
C
+ ) atau sebesar 6,66.
Pada

= 0,05 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih
rata-rata sesungguhnya (
2 1
) dengan menggunakan selisih rata-rata sampel (
2 1
x x ) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (
2
2
2
1
2
1
n

. Z
C
+ ) atau sebesar 5,07.
c). Ho :
2 1

Ha :
2 1

Statisti uji :
002 , 2
36
) 67 , 9 (
25
) 12 , 10 (
22 , 67 40 , 72
2 2
2
2
2
1
2
1
2 1

n n
x x
Z
H
Prob. = 0,0456
Titik kritis : untuk = 0,01ZC = Z0,4950 = 2,575
dan = 0,05ZC = Z0,4750 = 1,96
Ternyata : pada = 0,01 ZH (= 2,002) < ZC (2,575) Ho diterima,
dan pada = 0,05 ZH (= 2,002) > ZC (1,96) Ho ditolak.
Atau berdasarkan nilai probabiltas, yaitu : Prob. (= 0,0456) > (= 0,01)

Ho diterima,
dan Prob. (= 0,0456) < (= 0,05)

Ho ditolak.
Kesimpulan : Hasil statistik pada taraf nyata () 1% Ho diterima dan pada taraf nyata
() 5% Ho ditolak, hal ini menunjukkan tingkat signifikasi yang tidak terlalu kuat, artinya
ada keraguan untuk menyatakan ada perbedaan nilai ujian kedua kelompok mahasiswa
tersebut. Oleh karena masih diragukan, maka diperlukan penelitian lanjutan dengan
manambah besar sampel.
5.2.3. Pendugaan beda dua rata-rata populasi : (
2 1
) dengan 1
2
= 2
2
(Independent samples t-test)
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran kecil n1
dan n2 (n < 30), yang diambil dari dua populasi dengan varians
2
1
dan
2
2
tidak diketahui.
Diasumsikan kedua varians sama (
2
1
=
2
2
), maka Interval Kepercayaan (1-).100 % bagi
(1-2) adalah :
.....(.5-
7)
dimana :
1-2 = selisih rata-rata sesungguhnya (populasi)
1
x -
2
x
= selisih rata-rata sampel
43
( )
2
2
1 1 1 1
2 1
2
2 1
2
2 2
2
1 1
2 1
2 1 2 1
+
+
+
+ t
n n dk t t

n n
)S (n )S (n
S
n n
. .S t x x -
):dk

(
C
g g C
BIOSTATISTIK
2
1
S dan
2
2
S
= varians pada sampel dari kelompok populasi 1 dan 2
Sg = simpangan baku gabungan
1
x dan
2
x
= Rata-rata sampel
5.2.4. Uji Hipotesis beda dua rata-rata populasi : (
2 1
) dengan 1
2
= 2
2
(Independent samples t-
test)
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran kecil n1
dan n2 (n < 30), yang diambil dari dua populasi dengan varians 1
2
dan 2
2
tidak diketahui.
Diasumsikan kedua varians sama (1
2
= 2
2
), maka uji hipotesis beda dua rata-rata
populasi digunakan statistik uji berikut :
........
(5-8)
Dimana :
1-2
1
x -
2
x
S1
2
dan S2
2
Sg
1
x dan
2
x
=
=
=
=
=
beda rata-rata sesungguhnya (populasi)
beda rata-rata sampel
varians pada sampel dari kelompok populasi 1 dan 2
simpangan baku gabungan
rata-rata sampel dari kelompok populasi 1 dan 2 .
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
1 = 2
1 2 Terima Ho, jika :
C H C
t t t ; sebaliknya tolak Ho.
dimana :
dk C
t t
); 2 / (

dk = n1 + n2 - 2
atau
:
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
1 = 2
1 > 2 Tolak Ho, jika :
C H
t t > ; sebaliknya terima Ho.
dimana :
dk C
t t
;

dk = n1 + n2 - 2
atau
:
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
1 = 2
1 < 2 Tolak Ho, jika :
C H
t t < ; sebaliknya terima Ho.
dimana :
dk C
t t
;

dk = n1 + n2 - 2
atau
:
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.6.
44
2
1 1
1 1
2 1
2
2 2
2
1 1
2 1
2 1
+
+

+

n n
)S (n )S (n
S
n n
. S
x x
t
g
g
H
BIOSTATISTIK
Umur (dalam tahun) mulai gejala penderita kanker wanita dan pria yang
independen dapat dicatat sebagai berikut :
Wanita 58 52 50 49 56 52 54 48 41 37 67
70
Pria 26 41 57 66 36 55 41 61 53 50 52
37 50
Sumber : data rekaan.
Pertanyaan :
a). Buatlah pendugaan bagi selisih rata-rata sesungguhnya antara rata-rata umur mulai
gejala penderita kanker wanita dan pria pada interval kepercayaan 94 %
b). Jelaskan galat pendugaan bagi pendugaan selisih rata-rata tersebut pada pertanyaan a).
c). Ujilah pada taraf signifikansi 6 %, apakah umur rata-rata mulai gejala penderita kanker
wanita lebih tinggi dari umur rata-rata penderita kenker pria ? Untuk kasus ini
diasumsikan kedua varians sama.
Jawab :
Dari dapat diketahui :
1
n = 12 ;
1
x = 634 ;

2
1
x = 34468 ;
2
n = 13 ;
2
x = 625 dan

2
2
x = 31567
maka 33 , 88
) 11 ( 12
) 634 ( ) 34468 ( 12
2
2
1

S ; 58 , 126
) 12 ( 13
) 625 ( ) 31567 ( 13
2
2
2

S
a). Untuk melakukan taksiran bagi selisih rata-rata populasi (
2 1
) oleh selisih rata-rata
sampel (
2 1
x x ) dengan ukuran sampel n1 dan n2 kurang dari 30 (sampel kecil) dan
2
1
=
2
2
dapat dilakukan dengan rumus (1-11).
2 1
2 1 2 1
1 1
.
n n
S t x x
g C
+ t
) 2 ( ); 2 / (
2 1
+

n n C
t t

=
23 ); 3 . ( o o
t = 1.998
e)
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+

n n
S n S n
S
g
=
2 13 12
) 58 , 126 )( 1 13 ( ) 33 , 88 )( 1 12 (
+
+
= 10,41
Jadi : 33 , 8 75 , 4
13
1
12
1
) 41 , 10 ).( 998 , 1 ( ) 08 , 48 83 , 52 (
2 1
t + t
atau : Interval kepercayaan 94 % bagi selisih
2 1
adalah : [-3,58 ; 13,08]
Kesimpulan : Kita percaya 94 % bahwa selisih rata-rata sesungguhnya (
2 1
) umur
pertama kali menderita kanker antara pria dan wanita ada dalam interval dengan batas
3,58 sampai dengan 13,08 atau dalam jangkauan sekitar 16,66.
b). Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih rata-rata
sesungguhnya (
2 1
) dengan menggunakan selisih rata-rata sampel (
2 1
x x )
sebesar 4,75 maka kita boleh membuat galat pendugaan tidak lebih dari (
2 1
1 1
.
n n
S t
g C
+ )
atau sebesar 8,33.
45
BIOSTATISTIK
c). Ho :
2 1

Ha :
2 1
>
Statistik uji :
41 , 10
2 13 12
) 58 , 126 ( 12 ) 33 , 88 ( 11
1 1
2 1
2 1

+
+

+

g
g
H
S
n n
S
x x
t

e). Dalam tabel t, nilai probabilitas t-student untuk 0.03 tdak dijumpai. Untuk menghitung
nilai baku t-student senilai dengan nilai probabilitas sebesar 0.03 tersebut dapat
dilakukan dengan teknik interpolasi.
Perhatikan tabel t (tabel III), baris ke 23 kolom 0.05 dan kolom 0.025, selanjut dapat
ditulis seperti berikut :
069 . 2 714 1
23 ; 025 . 0 23 ; 03 . 0 23 05 0
t

t
t

.
t
C
; .

714 , 1 069 , 2
069 , 2
05 , 0 025 , 0
03 , 0 025 , 0

C
t
tC = 1,998


+

140 , 1
13
1
12
1
41 , 10
08 , 48 83 , 52
H
t
prob. = 0,269
Statistik tabel :
C
t = 1,635
Kriteria penolakan Ho : Tolak jika
C H
t t >
Ternyata : ) 635 , 1 ( ) 140 , 1 ( <
C H
t t
Atau berdasarkan kriteria nilai probabilitas, ternyata : Prob. (0,269) > (0,05) Ho
diterima.
Kesimpulan : Terbukti pada taraf signifikansi ( ) 6 % bahwa rata-rata umur mulai
gejala penderita kanker wanita tidak lebih tinggi dari rata-rata umur penderita kanker
pria.
MODUL 6 MODUL 6
UJI TABEL SILANG (CROSSTAB TEST) UJI TABEL SILANG (CROSSTAB TEST)
A. PENDAHULUAN

Dalam analisis statististik parametrik yang prosedurnya dibuat berdasarkan sejumlah
asumsi, antara lain :
(1). sampel yang dicuplik dari populasi yang berdistribusi normal, atau paling sedikit
mendekati normal.
(2) pemilihan unit sampel dari populasi harus independen.
(3). pengamatan unit observasi juga harus independen.
46
BIOSTATISTIK
(4). Jika membandingkan dua atau sejumlah sampel, maka varians (ragam)
populasinya harus homogen.
(5). Variabel yang diukur dalam skala interval atau dalam skala rasio.
Jika asumsi-asumsi tersebut terpenuhi, maka penggunaan uji statistik parametrik sudah
valid. Namun jika terjadi pelanggaran atas asumsi-asumsi ini, sebagai alternatifnya dapat
digunakan uji statistik nonparametrik.
Uji nonparametrik atau uji bebas sebaran adalah suatu metode statistik yang hanya sedikit
membuat dugaan tentang populasi asal sampel. Juga uji ini tidak bertujuan menduga
maupun menguji parameter populasi, tetapi cukup membandingkan karakteristik populasi
secara umum.
Oleh karena banyaknya kelemahan yang melekat pada uji nonparametrik ini,
terutama tidak maksimalnya dalam memanfaatkan informasi yang dikandung sampel,
mengakibat uji nonparametrik ini kurang efisien dibandingkan dengan prosedur parametrik
jika kedua metode ini dapat diterapkan. Dengan kata lain, jika uji parametrik dan
nonparametrik dapat digunakan untuk data yang sama, kita sebaiknya menghindari uji
nonparametrik, yang konotasinya cepat dan mudah ini dan mengerjakannya dengan
teknik parametrik yang lebih efisien.
Untuk memberikan gambaran yang lengkap keuntungan dan kelemahan penggunaan
statistik nonparametrik, dapat dijelaskan sebagai berikut :
B. Keuntungan :
(1). Dapat digunakan pada ukuran sampel yang relatif kecil.
(2). Tidak memerlukan asumsi-asumsi yang ketat.
(3). Dapat digunakan pada ukuran skala nominal (kategorikal) atau ordinal
(peringkat).
(4). Relatif mudah dilakukan walaupun dengan manual.
(5). Mudah dipahami karena memiliki konsep lebih sederhana dibandingkan dengan
prosedur parametrik.
C. Kelemahan :
(1). Metode nonparametrik secara statistik kurang kuat (rigorous) daripada metode
parametrik, karena didasari oleh persyaratan yang sedikit, bahkan sering tanpa
persyaratan sama sekali.
(2). Metode nonparametrik kurang memiliki kuasa uji (power of test), jika dengan
ukuran sampel yang sama, metode parametrik dapat diterapkan.
(3). Kecenderungan penyederhanaan data dari skala rasio atau interval menjadi
nominal atau ordinal merupakan pemborosan informasi yang sudah
dikumpulkan.
Uji tabel silang (crosstab) merupakan uji bivariat yang dapat digunakan untuk melihat ada
atau tidaknya perbedaan atau hubungan atau pengaruh dua variabel yang memiliki data
distribusi (nominal atau ordinal) yang mana data-data yang dianalisis data populasinya tidak
harus menyebar normal. Uji tabel silang meliputi uji Chi Square, uji Chi Square dengan
Koreksi Yate, uji Eksaks Fisher dan uji Mc Nemar.
6.1. UJI CHI SQUARE (
2
)
Uji Chi-Square atau juga dikenal dengan uji Kai-Kuadrat yang dikembangkan oleh
Pearson tahun 1900, umumnya digunakan jika data yang tersedia berupa data jumlah
atau data yang siap disajikan dalam bentuk frekuensi, misalnya banyak subjek dalam
klasifikasi pria dan wanita, banyak subjek dalam kategori terpapar dan tidak terpapar,
47
BIOSTATISTIK
atau banyaknya penderita diabetes melitus dalam kategori I, II, III dan IV menurut
kaparahan penyakitnya.
Pada umumnya, uji Kai-Kuadrat (
2
) dapat digunakan untuk :
(1). Uji kesesuaian (test of goodness of fit), yaitu untuk memeriksa apakah ada
kesesuaian (fit) suatu distribusi data sampel dengan distribusi data populasi
tertentu, dimana data yang ingin diuji dalam skala pengukuran nominal atau
ordinal.
(2). Uji independensi (test of independence), yaitu untuk memerika apakah dua
variabel dari sebuah sampel saling bebas (independen) atau tidak bebas.
(3). Uji homogenitas (test of homogeneity), yaitu untuk memeriksa beberapa data
sampel apakah berasal dari populasi-populasi yang sama (homogen) dalam
hal variabel tertentu.
6.1.1. SYARAT-SYARAT PENGGUNAAN UJI KAI-KUADRAT
Dalam melakukan uji Kai-Kuadrat, ada syarat-syarat yang harus dipenuhi, antara lain ;
(1). Sampel dipilih acak dan data yang tersedia dalam bentuk jumlah atau diskrit.
(2). Semua pengamatan dilakukan independen
(3). Sel-sel dengan frekuensi harapan (expected value) kurang dari 5 jika ada dapat
dibenarkan sekitar 25% dari total sel, dan pada sembarang frekuensi harapan (
ij
E
)
nilainya paling sedikit 1.
(4). Khusus untuk tabel kontingensi 2x2, syarat tersebut berarti tidak ada satu selpun
boleh berisi frekuensi harapan (
ij
E
) < 5. Jika ada, maka disarankan untuk menggunakan
uji Exact Fisher atau uji Chi Square dengan koreksi Yates.
(5). Meskipun dapat diterapkan pada sampel kecil, uji Chi Square sebaiknya pada sampel
yang ukuran > 40
6.1.2. LANGKAH-LANGKAH PENGGUNAAN UJI KAI-KUADRAT (
2
)
Uji Chi Square dapat digunakan untuk menetapkan signifikansi perbedaan antara dua
kelompok pengamatan (variabel) saling bebas (independen) atau tidak (non-
independen). Pengukuran yang dituntut disini dapat selemah skala nominal.
Hipotesis yang diuji biasanya adalah dua kelompok (bivariat), apakah berbeda dalam
hal ciri khas tertentu, dengan demikian perbedaan itu berhubungan dengan frekuensi
relatif masuknya anggota-anggota kelompok ke dalam beberapa kategori.
Langka-langkah penggunaan statistik uji :
Pasangan hipotesis :
Ho : Kedua variabel tidak saling tergantung (independen)
Ha : Kedua variabel saling tergantung (tidak independen), atau
Ho : Tidak ada perbedaan (hubungan) yang signifikan antara variabel pertama
dengan variabel kedua.
Ha : Ada perbedaan (hubungan) yang signifikan antara variabel pertama dengan
variabel kedua.
Statistik Uji yang digunakan :
48
BIOSTATISTIK
.....(6-1)
dimana :
N
k b
E
j i
ij

) )( (

i = baris ke 1, ke 2, ke 3, .., ke b.
j
= kolom ke 1, ke 2, ke 3, .., ke k.
Tabel. 4. Tabel penolong perhitungan Chi Square :
SEL
ij
O
ij
E
ij ij ij
E E O / ) (
2

1 1
K B
11
O
11
E
11
2
11 11
/ ) ( E E O
2 1
K B
12
O
12
E
12
2
12 12
/ ) ( E E O

1 2
K B
21
O
21
E
21
2
21 21
/ ) ( E E O
2 2
K B
22
O
22
E
22
2
22 22
/ ) ( E E O
. .
k b
K B
bk
O
bk
E
/ ) (
2
bk bk bk
E E O
ij ij ij
b
i
k
j
H
E E O / ) (
2
1 1
2

Titik Kritis :
2
;
2
dk C
dimana
) 1 )( 1 ( k b dk
Daerah Kritis : Tolak Ho, jika
2 2
C H
> , sebaliknya terima Ho.
Catatan : Pada data tabel kontingensi 2x2, uji Kai-Kuadrat sebaiknya tidak digunakan bila :
49
( )

b
i
k
j
ij
ij ij
H
E
E O
1 1
2
2

BIOSTATISTIK
1). n 20, dianjurkan menggunakan uji Eksak Fisher.
2). 20 < n < 40, jika ada
ij
E
5, dianjurkan menggunakan uji Eksak Fisher.
3). n 40, jika ada ij
E
1, dianjurkan menggunakan uji Eksak Fisher. Sebaliknya jika : 1
<
ij
E
5, dapat
diterapkan uji Chi Square dengan koreksi Yate (Continuity corecction)
Pada tabel kontingensi 2x2 berikut :
Tabel 5 : Tabel Kontingensi 2x2
Variabel Pertama
Variabel Kedua
Jumlah
Kategori 1 Kategori 2
Kategori 1 a b a+b
Kategori 2 c d c+d
Jumlah a+c b+d n
dimana : a, b, c dan c adalah data hasil pengamatan
n adalah jumlah seluruh pengamatan (n = a+b+c+d)
disamping dapat menggunakan rumus (4-3) juga dapat digunakan rumus berikut :
..(6-2)
Contoh 3 :
Suatu studi dilakukan dengan maksud mengetahui hubungan persepsi seseorang
tentang kerentanan terhadap penyakit dan pilihan jenis pelayanan kesehatan yang
diinginkan. Hasil pengukuran pada responden disajikan dalan tabel berkut :
Pilihan Pelayanan
Kesehatan yang
dikehendaki
Persepsi Kerentanan Terhadap
Penyakit
Jumlah
Serius Tidak serius
Medis 20 11 31
Tradisional 13 16 29
Jumlah 33 27 60
Ujilah, apakah data yang dikumpulkan dapat menjelaskan bahwa ada hubungan antara
persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang
diinginkan. Gunakan taraf nyata ( ) 5 %.
Jawab :
Ho : tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan
pilihan pelayanan kesehatan yang diinginkan
50
( )
( ) ( ) ( ) ( ) d c b a d b c a
bc ad n
+ + + +

2
2

BIOSTATISTIK
Ha : terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan
pilihan pelayanan kesehatan yang diinginkan
Tabel perhitungan ;
SEL
ij
O
ij
E
ij ij ij
E E O / ) (
2

1 1
K B
20 17,05 0,510
2 1
K B
11 13,95 0,624
1 2
K B
13 15,95 0,546
2 2
K B
16 13,05 0,667
ij ij ij
b
i
k
j
H
E E O / ) (
2
1 1
2

= 2,347
Pemeriksaan pada nilai expected (frekuensi harapan) tidak ditemukan ada < 5, hal ini
dibenarkan untuk terus menggunakan statistik uji Chi Square.
Titik Kritis :
2
) 1 2 )( 1 2 ( ; 05 , 0
2


C

2
1 ; 05 , 0
= 3,841
Daerah Kritis : Tolak Ho, jika
2 2
C H
> ,
ternyata : ) 841 , 3 ( ) 347 , 2 (
2 2
<
C H
, artinya Ho diterima.
Kesimpulan : Berdasarkan data sampel yang dikumpulkan dapat menjelaskan bahwa
tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan
pelayanan kesehatan yang diinginkan, pada taraf nyata ( ) 5 %.
Atau, dapat juga dengan menggunakan rumus (10-4) :
( )
( )( ) ( ) ( ) d c b a d b c a
bc ad n
+ + + +

2
2

( ) ( ) { }
( ) ( )( ) ( ) 29 31 27 33
13 . 11 16 . 20 60
2

= 2,347
Jadi, terlihat bahwa hasil yang ditunjukkan dengan rumus (10-3) atau rumus (10-4)
sama. Keuntung-an yang diperoleh dengan menggunakan rumus (10-3), kita bisa melihat
51
BIOSTATISTIK
besaran nilai expectednya, sehingga kita bisa menegaskan apakah uji Chi-Square dapat
dilanjutkan. Sebaliknya dengan rumus (10-4) hal yang sama tidak ditemukan.
6.2. UJI EKSAK FISHER (TEST FISHER EXACT)
Uji Eksak Fisher adalah uji independensi dua set pengamatan dengan dua
variabel kategorial, menggunakan pendekatan probabilitas pasti (exact probability).
(Fisher, 1973).
Uji Eksak Fisher dapat digunakan bila dalam uji Kai-Kuadrat dengan format
tabel kontingensi 2x2 dan derajat kebebasan (dk) satu, bila :
(1) jumlah seluruh pengamatan (n) kurang dari 20,
(2) terdapat sel harapan (expected) kurang dari 5 dengan jumlah pengamatan antara
20 sampai dengan 40, dan
(3) jumlah pengamatan (n) lebih besar 40 dan terdapat sel harapan ada yang kurang
dari satu.
Prosedur uji pasti Fisher lebih memungkinkan untuk mendapatkan hasil
akurat untuk semua format tabel 2x2, yang nilai-nilai harapannya terlalu kecil untuk
dapat dianalisis dengan uji Kai-Kuadrat.
Untuk memperoleh nilai probabilitas pasti Fisher ( P ) dapat diperhatikan
tabel 5, di atas dengan sel teramati terdiri dari a, b, c dan d adalah sebagai berikut :
..(6-3)
Langkah-langkah penggunaan uji Eksaks Fisher dapat dimulai dengan membuat tabel
konfigurasi yang bertitik tolak dari tabel induknya dengan jumlah pinggir baris dan
kolom tetap seperti tabel teramati aslinya (tabel 8-5). Untuk tabel konfigurasi yang
mundur akan berhenti jika nilai sel a pada sel utama sama dengan nol, dan untuk tabel
konfigurasi yang maju akan berhenti jika nilai sel c pada tabel utama sama dengan nol.
Tabel konfigurasi yang dimaksud dapat dimulai dari
tabel utama (tabel pengamatan) dengan asumsi nilai sel a = 3 dan nilai sel b juga = 3,
dengan demikian tabel konfogurasi mundur dan maju dapat dibuat sebagai berikut :
52
! !. !. !. !.
)! ( )! ( )! ( )! (
) 0 (
d c b a N
d b c a d c b a
a P
+ + + +

BIOSTATISTIK
0 b+a a+b

a-2 b+2 a+b

a-1 b+1 a+b


c+a d-a c+d c+2 d-2 c+d c+1 d-1 c+d
a+c b+d n a+c b+d n a+c b+d n
Tabel Induk
Misalkan a = 3 dan c = 3 a b a+b dst
c d c+d
dst a+c b+d n
a+1 b-1 a+b

a+2 b-2 a+b

a+c b-c a+b


c-1 d+1 c+d c-2 d+2 c+d 0 d+c c+d
a+c b+d n a+c b+d n a+c b+d n
Dengan mememperhatikan konfigurasi tabel di atas, perhitungan probabilitas
dimulai dari tabel ke 1 dengan menyesuaikan rumus (10-7) :
)! )!.( )!.( !.( 0 !.
)! ( )! ( )! ( )! (
) 0 (
a d a c a b n
d b c a d c b a
a P
+ +
+ + + +

Penghitungan probabiltas tabel-tabel berikutnya cukup memakai rumus ulangan
seperti berikut :
) 2 )( 2 (
) )( (
) 0 ( ) 2 (

+ +

d a
a b a c
a P a a P
) 1 )( 1 (
) 2 )( 2 (
) 2 ( ) 1 (

+ +

d a
b c
a a P a a P
d a
b c
a a P a a P
.
) 1 )( 1 (
) 1 ( ) (
+ +

) 1 )( 1 (
.
) ( ) 1 (
+ +
+
d a
b c
a a P a a P
) 2 )( 2 (
) 1 )( 1 (
) 1 ( ) 2 (
+ +

+ +
d a
b c
a a P a a P
53
BIOSTATISTIK
) )( (
) 2 )( 2 (
) 2 ( ) (
c d c a
b c
a a P c a a P
+ +

+ +
Dengan memisalkan :
1

: Kemungkinan kejadian A disebabkan oleh kejadian B, dan


2
: Kemungkinan kejadian A bukan disebabkan oleh kejadian B.
Maka kriteria keputusan statistiknya dapat mengacu kenilai Probabilitasnya
(Probabilitas value) selanjutnya disingkat dengan Prob. Andaikan tabel teramati ialah
tabel a dan tabel konfigurasinya adalah 0 sampai dengan k, dengan demikian dapat
dibuat kriteria sebagai berikut :
a). Pada uji dua pihak (two tailed test)
Ho :
2 1

Ha :
2 1

Nilai Prob. = 2 min [P(0) + P(1) + .+ P(a), P(a) + P(a+1) + + P(k)]
Tolak Ho, Jika : Prob. < (yang ditentukan)
b). Pada uji pihak kanan (one tailed test)
Ho :
2 1

Ha :
2 1
>
Nilai Prob. = P(a) + P(a+1) + + P(k)
Tolak Ho, Jika : Prob. < (yang ditentukan)
c). Pada uji pihak kiri (one tailed test)
Ho :
2 1

Ha :
2 1
<
Nilai Prob. = P(0) + P(1) + .+ P(a)
Tolak Ho, Jika : Prob. < (yang ditentukan)
54
BIOSTATISTIK
Contoh 7 :
Suatu studi dilakukan untuk melihat kesatuan pendapat tentang paket program
kesehatan yang ditawarkan dalam suatu kampanye pemilihan umum berdasarkan
tempat tinggal (hunian) kelompok masyarakat dengan kelas social tertentu, yaitu
kelompok hunian dikompleks perumahan dan kelompok hunian bukan kompleks
perumahan (tinggal terpisah-pisah). Hasil pengumpulan data pada 21 orang di kota
besar, dapat dilihat pada tabel berikut :
Pola lokasi hunian kelompok
masyarakat dengan kelas sosial
tertentu
Kesatuan pendapat diantara
anggota kelompok Jumlah
Rendah Tinggi
Tinggal dalam kompleks 4 9 13
Tinggal diluar kompleks 3 5 8
Jumlah 7 14 21
Gunakan = 0,05
Jawab :
Ho : Tidak terdapat hubungan antara kematian karena CVD dengan riwayat konsumsi
garam yang tinggi
Ha : Terdapat hubungan antara kematian karena CVD dengan riwayat konsumsi
garam yang tinggi.
Penyelidikan terhadap expected value : 33 , 4
21
) 7 )( 13 (
11
E : 67 , 8
21
) 14 )( 13 (
12
E ;
67 , 2
21
) 7 )( 8 (
21
E dan 33 , 5
21
) 14 )( 8 (
22
E
Dapat dilihat bahwa ditemukan ada sel expected yang kurang dari 5 (50%), dengan
demikian disarankan untuk menggunakan uji eksak Fisher.
Kemungkinan konfigurasi tabel dengan jumlah tepi tetap seperti tabel teramati (tabel
induk)
55
BIOSTATISTIK
0 13 13

1 12 13

2 11 13

3 10 13
7 1 8 6 2 8 5 3 8 4 4 8
7 14 21 7 14 21 7 14 21 7 14 21

7 6 13

6 7 1
3
5 8 13

4 9 13
0 8 8 1 7
8
2 6 8 3 5 8
7 14 21 7 14 2
1
7 14 21 7 14 21
Tabel Induk
Perhitungan nilai-nilai probabilitas uji eksaks Fisher berdasarkan tabel konfigurasiyang
dimungkinkan, adalah sebagai berikut :
000069 , 0
! 14 . 15 . 16 . 17 . 18 . 19 . 20 . 21
! 14 !. 8
! 1 !. 7 !. 13 !. 0 !. 21
! 14 !. 7 !. 8 !. 13
) 0 ( P
003130 , 0
2 . 1
13 . 7
) 0 ( ) 1 ( P P
037564 , 0
3 . 2
12 . 6
) 1 ( ) 2 ( P P
172171 , 0
4 . 3
11 . 5
) 2 ( ) 3 ( P P
344341 , 0
5 . 4
10 . 4
) 3 ( ) 4 ( P P
309907 , 0
6 . 5
9 . 3
) 4 ( ) 5 ( P P
118060 , 0
7 . 6
8 . 2
) 5 ( ) 6 ( P P
014757 , 0
8 . 7
7 . 1
) 6 ( ) 7 ( P P
Untuk uji dua pihak, nilai :
Prob. = 2.min.
{ } { } [ ]
) 7 ( ) 6 ( ) 5 ( ) 4 ( ) 4 ( ) 3 ( ) 2 ( ) 1 ( ) 0 (
, P P P P P P P P P + + + + + + +
= 2.min. { } { } [ ] 787065 , 0 , 557275 , 0 = 2.(0,557275) = 1,114550
Daerah kritis : Tolak Ho, jika nilai Prob. < (yang ditentukan)
Ternyata, Prob. (1,114550) > (0,05), artinya Ho diterima.
56
BIOSTATISTIK
Kesimpulan : Pada taraf nyata ( ) 5 %, diyakini bahwa ada kesatuan pendapat
masyarakat tentang paket program kesehatan yang ditawarkan melalui kampanye
pemilu, baik untuk masayarakat yang tinggal dalam kompleks hunian ataupun
masyarakat yang tinggal secara terpisah-pisah (diluar kompleks hunian)
15-19 : 18 derajat
20-24 36 derajat
25-29 : 57,6 derajat
30-34 : 154,8 derajat
35-39 : 43,2 derajat
40-44 : 50,4 derajat
57