MODUL 1 MODUL 1
KONSEP DASAR STATISTIK UMUM
1.1. PENGERTIAN STATISTIKA
Secara umum statistika adalah disiplin ilmu yang mempelajari metode dan
prosedur pengumpulan, penyajian, analisa dan penyimpulan suatu data mentah, agar
menghasilkan informasi yang lebih jelas untuk keperluan suatu pendekatan ilmiah (scientific
inferences), dan dapat dikelompokkan menjadi dua bagian, yaitu statistik deskriptif dan
statistik inferensial.
Statistik deskriptif merupakan metode dan prosedur statistik yang dipakai hanya
terbatas pada pengumpulan, penyajian dan analisa data dalam bentuk narasi, tabulasi atau
diagram. Ukuran-ukuran yang dapat dihitung dalam analisis ini adalah ukuran tendensi
sentral dan ukuran variasi tanpa perlu adanya peramalan (estimasi) dan pembuktian
statistik terhadap parameter populasi.
Statistik inferensial (induktif) merupakan alat untuk merancang riset,
menganalisis data dan menarik kesimpulan tentang populasi dari data sampel. Namun
sebelum proses generalisasi tersebut, kita perlu mengetahui sifat-sifat data sampel itu
sendiri, yang pada gilirannya dapat menentukan jenis statistik yang digunakan, apakah
statistik parametrik atau non-parametrik.
Pola berfikir yang dipakai dalam inferensi statistik lebih cenderung induksi dari pada
deduksi, yaitu prosedur yang berkenaan dengan generalisasi dari khusus ke umum. Ada dua
kelompok besar kegunaan statistik inferensi yang dikenal, yaitu : (1) membuat pendugaan
(estimasi) tentang parameter populasi, dan (2) melakukan uji hipotesis tentang
karakteristik populasi.
Prosedur uji inferensial parametrik dibuat berdasarkan sejumlah asumsi,
diantaranya yang paling mendasar adalah data sampel yang digunakan dalam penelitian
berasal dari populasi beristribusi normal, atau paling tidak mendekati normal. Disamping
normalitas distribusi populasi ini, juga dilengkapi dengan asumsi yang lainnya, yaitu : (1)
pemilihan unit sampel dari populasi secara acak (random), (2) pengamatan pada unit
observasi independen, (3) untuk pengamatan pada dua atau lebih unit observasi dengan
varians (ragam) homogen, dan (4) variabel pengamatan diukur dalam skala interval atau
rasio.
Sedangkan prosedur pada statistik uji inferensial non-parametrik dipersiapkan
sebagai alternatif jika asumsi pada statistik parametrik tidak terpenuhi. Dengan kata lain,
statistik non-parametrik disebut juga bebas distribusi. Hal ini bisa terjadi, karena statistik
non-parametrik tidak bertujuan menduga atau menguji parameter populasi, tetapi cukup
membandingkan karakteristik populasi-populasi secara umum.
Biostatistik merupakan salah satu aplikasi konsep dan metode statistika yang
diterapkan pada ilmu biologi, kedokteran, farmasi dan kesehatan. Sifat aplikatif dari
Biostatistik juga bermanfaat untuk menganalisis, membuat interprestasi, dan memahami
fakta dan temuan-temuan riset biologi, kedokteran, farmasi dan kesehatan.
1.2. KENGUNAAN STATISTIK
Statistik dapat digunakan dalam bidang administrasi, bidang perencanaan dan
evaluasi serta dalam bidang penelitian. Dalam bidang penelitian dapat dimanfaatkan untuk
(1) memberikan gambaran tentang suatu objek secara lengkap dan ringkas (2)
membandingkan kejadian satu dengan kejadian lainnya dengan dengan beracuan pada
1
BIOSTATISTIK
waktu dan tempat, dan (3) membuat ramalan pada kejadian yang sama dimasa yang akan
datang.
1.3. DATA STATISTIK
1.3.1. Definisi, Karakteristik, Sifat, Jenis dan Sumber Data
Defenisi Data
Data adalah fakta yang dinyatakan dengan angka (bilangan), baik yang diperoleh
dengan menghitung maupun mengukur. Disamping itu ada juga data yang hanya bisa
diamati, tidak bisa dihitung dan diukur, data yang seperti ini disebut dengan data kualitatif.
Untuk maksud tertentu, data kualitatif ini juga bisa disimbolkan dengan angka (bilangan),
dengan demikian data kualitatif yang sudah disimbolkan dengan bilangan tadi, dapat
dikatakan sebagai data kuantitatif.
Jenis Data
Berdasarkan jenisnya, data dapat dibagi dalam 2 kelompok, yaitu :
1. Data kontinu, merupakan variabel numerikal yang nilainya dapat diukur terus
menerus, sampai sekecil-kecilnya atau merupakan bilangan bulat dan pecahan.
Misalnya nilai Hb darah = 14,20 gr %, berat badan = 65,75 Kg, dan lain-lain.
2. Data diskrit, merupakan variabel numerikal yang nilai tidak dapat diukur sekecil-
kecilnya dan merupakan satu kesatuan atau merupakan bilangan bulat, data diskrit
dapat bersifat kuantitatif atau kualitatif. Misalnya jumlah ibu hamil di desa A, nilai
pembobotan pada pengukuran skala likert, dan lain-lain.
Sifat Data
1. Data kualitatif, yaitu data yang tidak bisa diukur dan dihitung serta disajikan bukan
dalam bentuk angka. Misalnya : agama, jenis kelamin, suku bangsa, dan lain-lain.
2. Data kuantitatif, yaitu data yang bisa diukur dan dihitung serta disajikan dalam
bentuk angka. Misalnya Tekanan darah sistolik, jumlah cakupan imunisasi, dan lain-lain.
Sumber Data :
Berdasarkan sumbernya, data dapat dikelompokkan menjadi 3, yaitu :
1. Data primer, yaitu data yang dikumpulkan sendiri oleh sipeneliti pada saat
berlangsung suatu penelitian.
2. Data sekunder, yaitu data yang dikumpulkan secara rutin oleh instansi tertentu,
yang kemudian digunakan oleh si peneliti.
3. Data tertier, yaitu data yang sudah diproses dan dipublikasikan sebagai suatu karya/
karangan ilmiah.
1.3.2. Pengumpulan Data
Dapat dilakukan secara langsung atau tidak langsung, dan tergantung dari
kebutuhan informasi yang ingin dikumpulkan, tenaga pelaksana penelitian, serta dana yang
tersedia. Ada lima cara yang sering dilakukan dalam kegiatan pempulan data, yaitu :
1. Observasi, merupakan cara pengumpulan data yang dilakukan secara langsung
dengan cara mengamati dengan tanpa adanya perlakukan terhadap objek
penelitian. Hasil pengukuran dengan cara ini lebih banyak dalam bentuk data
kualitatif.
2. Interview atau Wawancara, yaitu pengumpulan data yang dilakukan secara
langsung di lapangan antara petugas pengumpul data dengan cara mewawancarai
2
BIOSTATISTIK
secara langsung reponden yang diteliti. Hal ini sangat baik dilakukan untuk
mendapatkan informasi (data) yang lebih lengkap dan mendalam.
3. Kuesioner atau Angket, yaitu berupa lembaran berisi pertanyaan-pertanyaan
yang disiapkan sedemikian rupa, yang berfungsi sebagai alat pengumpul data
panelitian. Biasanya kuesioner dapat digunakan pada saat interview atau wawancara
atau dapat juga dilakukan dengan cara mengirimkannya melalui pos kepada
responden yang telah terpilih, dengan harapan akan dikembalikan.
4. Registrasi dan Pencatatan, yaitu berupa pengumpulan data secara rutin terhadap
setiap kegiatan atau kejadian, dengan menggunakan sistem manajemen data yang
baik, seperti angka kelahiran, kematian, kesakitan dan lain-lain.
5. Hasil ujian (test) atau hasil laboratorium, yaitu berupa pengumpulan data yang
dilakukan untuk mengukur tingkat pengetahuan atau keahlian seseorang atau
pencatatan hasil pemeriksaan laboratorium dan lain sebagainya.
1.3.3. Pengolahan Data
Pengertian Pengolahan Data
Pengolahan data ialah proses penataan data, karena data hasil pengumpulan
merupakan data kasar.
Guna Pengolahan Data
Pengolahan data digunakan agar data kasar dapat diorganisir, disajikan dan dianalisa
hingga dapat ditarik kesimpulan.
Proses Pengolahan Data
Kegiatan dalam proses pengolahan data adalah :
1. Memeriksa data (editing)
Yang dimaksud dengan proses editing ialah memeriksa data yang telah dikumpulkan
baik berupa daftar pertanayaan, kartu atau buku register.
Pemeriksaan ini meliputi hal-hal senagai berikut :
a. Penjumlahan
Menjumlah ialah menghitung banyaknya lembaran daftar pertanyaan yang telah
diisi untuk mengetahui apakah sesuai dengan jumlah yang telah ditentukan.
b. Koreksi
Yang termasuk dalam proses koreksi ialah proses membenarkan atau
menyelesaaikan hal-hal yang salah atau kurang jelas
2. Memberi kode (coding)
Untuk mempermudahkan pengolahan, sebaiknya semua variabel diberi kode
terutama data klasifikasi, misalnya jenis kelamin untuk laki-laki diberi kode 1 dan
wanita diberi kode 2.
3. Menyusun data (tabulating)
Penyusunan data merupakan pengorganisasian data sedemikian rupa agar dengan
mudah dapat dijumlah, disusun dan ditata untuk disajikan dan dianalisis
Proses tabulasi dapat dilakukan dengan berbagai cara antara lain dengan metode
tally, menggunakan kartu dan menggunakan komputer.
Proses Pengolahan dan Analisis Data
3
Editing
Data ?
Coding
Data ?
Cleaning
Data ?
Proses
Analisis
Data
Dengan
Komputeris
asi
BIOSTATISTIK
Belum
Sesuai
Sudah Sesuai
1.4. VARIABEL DAN SKALA PENGUKURAN
1.4.1. Variabel
Variabel adalah karakteristik unit yang diukur dalam pengumpulan data yang nilainya
bervariasi misalnya umur, tinggi badan, berat badan, tekanan darah, diagnosis, pengobatan
dll
1.4.2. Skala Pengukuran
Skala pengukuran yang dikembangkan oleh S.S. Stevens, cukup luas digunakan dalam
setiap penelitian yang membagi tingkat ukuran ke dalam empat kategori, yaitu :
1. Skala nominal, skala ini merupakan tingkat pengukuran yang paling sederhana.
Numerikal yang diberikan kepada objek tidak mempunyai makna besaran (hanya
sekedar label) dan tidak bisa diurut atau dijumlah. Misalnya : Jenis kelamin (1 = Pria; 2
= Wanita), Agama (1 = Islam; 2 = Kristen; 3 = Buddha), Apakah anda suka statistika (1
= Ya; 2 = Tidak), dan lain-lain.
2. Skala ordinal, penomoran pada objek ini disusun menurut besar atau urutan (rank),
tetapi nomor-nomor tersebut tidak menunjukkan jarak yang sama antara dua nomor.
Misalnya : Stadium penyakit (1 = Berat; 2 = Sedang; 3 = Ringan), Tingkat pendidikan
(1 = SD; 2 = SLTP; 3 = SLTA; 4 = Sarjana), dan lain-lain.
3. Skala interval, skala ini mempunyai sifat berurutan. Pada skala ini jarak atau
perbedaan antara nilai pengamatan satu dan nilai pengamatan lainnya dapat diketahui
dengan pasti. Besar interval dapat ditambah atau dikurangi, dimana yang dijumlahkan
bukanlah kuantitas atau besaran, tetapi interval. Misalnya : Temperatur (
o
C atau
o
K),
Tekanan darah, dan lain-lain. Misalnya, temperatur 36
o
C jelas 12
o
C lebih panas dari
24
o
C, dan tidak dikatakan bahwa 36
o
C 1 kali dari 24
o
C. Alasanya, penentuan skala 0
o
C bukan keberadaan panas absolut, tetapi hanya merupakan batas pengukuran positif
dan negatif. Dengan kata lain, pada skala interval tidak dijumpai nol absolut.
4. Skala rasio, skala ini merupakan tingkat pengukuran tertinggi. Skala rasio selain
memiliki sifat skala nominal, ordinal dan interval, juga mempunyai titik nol absolut
dengan makna empiris. Pada skala rasio semua operasi matematik (penambahan,
penguangan, pengalian dan pembagian) dapat diterapkan. Misalnya : Temperatur yang
diukur dalam skala Kelvin, besar penghasilan, berat badan, elektrolit serum, dan denyut
nadi.
4
Data
Kasar
Edit
Data
Stati
stik
Uji ?
Hasil Analisis
Sudah Sesuai
dengan Tujuan
penelitian
BIOSTATISTIK
MODUL 2
MANFAAT DAN TEKNIK PENYAJIAN DATA
2.1. Pengertian Penyajian Data
Penyajian data merupakan salah satu kegiatan dalam pembuatan laporan hasil
penelitian yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan tujuan
yang diinginkan.
Data yang disajikan harus sederhana dan jelas agar mudak dibaca. Penyajian
data juga dimaksudkan agar para pengamat dapat dengan mudah memahami apa yang kita
sajikan untuk selanjutnya dilakukan penilaian atau perbandingan, dan lain-lain.
2.2. Jenis-Jenis Cara Penyajian Data
Data-data yang telah dikumpulkan, setelah dianalisis sedemikian rupa, perlu disusun
secara sistematik agar menjadi sederhana dan mudah dimengerti oleh pengkonsumsi
informasi dan juga dapat dipresentarsikan dengan baik. Ada beberapa cara penyajian data,
yaitu :
1. Textular (narasi), yaitu penyajian data berupa tulisan atau narasi. Hal ini dapat
dilakukan untuk data yang jumlahnya kecil serta memerlukan kesimpulan sederhana.
2. Tabulasi, yaitu penyajian data dalam bentuk table-tabel yang terdiri dari beberapa
baris dan beberapa kolom, yang digunakan untuk memaparkan sekaligus beberapa
variabel hasil observasi, survei, atau penelitian lainnya, sehingga mudah dibaca dan
dipahami.
3. Diagram atau Grafik, yaitu penyajian data dalam bentuk diagram ataupun grafik
dapat dilakukan dengan beberapa cara sesuai dengan jenis data dan kebutuhan,
seperti terlihat pada table berikut :
Tabel 1.1. Cara penggunaan Jenis Diagram/Grafik.
No. Jenis Diagram Variabel Data/Fungsi
1. Bar diagram Kategorikal Perbandingan frekuensi distribusi
5
BIOSTATISTIK
2.
3.
4.
5.
6.
(Horizontal/vertical)
Pie Chart
Line diagram
Scatter point/ dot diagram
Pictogram/Diagram gambar
Curtogram/Diagram peta
Kategorikal
Numerikal
Numerikal
Kategorikal
Kategorikal
data
Proporsi data
Trend data (time series study)
Korelasi data
Perbandingan frekuensi distribusi
data
Perbandingan frekuensi distribusi
data
2.3. Jenis Tabel Penyajian Data
Jenis tabel penyajian data adalah :
1. Tabel distribusi frekuensi
2. Tabel frekuensi
3. Tabel distribusi relative
4. Tabel distribusi kumulatif
5. Tabel silang (tabel kontingensi = contingency table = cross tabulation)
2.4. Cara Membuat Tabel
Suatu tabel yang lengkap terdiri dari (1) nomor tabel, (2) judul tabel, (3) catatan
pendahuluan, (4) badan tabel, (5) catatan kaki, dan (6) sumber data.
Tabel 1 Contoh tabel
Judul Tabel
Judul
Kompartemen
Judul Kolom Jumlah
Sel
Judul Baris Badan Tabel
Cacatan kaki :
Sumber :
2.5. Menyajikan Tabel Dalam Bentuk Tabel
2.5.1. Tabel Distribusi Frekuensi
Contoh Tabel distribusi frekuensi
Kelompok umur (tahun) Frekuensi Persentase (%)
15 19 5 5,0
20 24 10 10,0
25 29 16 16,0
30 34 43 43,0
35 39 12 12,0
40 44 14 14,0
Jumlah 100 100,0
2.5.2. Tabel Silang 2 Variabel
Contoh : Tabel Silang
Status Gizi Diare Jumlah
6
BIOSTATISTIK
Sakit Tidak Sakit
Baik 3 9 12
Sedang 18 25 43
Buruk 29 16 45
Jumlah 50 50 100
2.6. Penyajian Data Kualitatif Secara Grafik
1
Diagram batang
(Diagram balok
= Bar diagram = Bar chart)
0
50
100
150
200
250
300
350
400
450
Pil Suntikan IUD
Alat Kontrasepsi
J
u
m
l
a
h
Gambar 6. Jumlah Akseptor KB Tahun 2006
(Single Bar)
7
BIOSTATISTIK
1
0
50
100
150
200
250
300
350
400
450
2002 2003 2004 2005 2006
Tahun
J
u
m
l
a
h
Pil
Suntikan
IUD
Gambar 7. Jumlah Akseptor KB Tahun 2006
(Multiple Bar)
1
50
75
100
150
200
75
125
175
225
300
100
150
200
250
400
0
100
200
300
400
500
600
700
800
900
1000
2002 2003 2004 2005 2006
Tahun
J
u
m
l
a
h
IUD
Suntikan
Pil
Gambar 8. Jumlah Akseptor KB Tahun 2006
(Subdivided Bar)
8
BIOSTATISTIK
ISPA 40%
DIARE 30%
DHF 19%
MALARIA 11%
Proporsi Penderita ISPA, Diare, DHF, Malaria Sumut Bulan Agustus
2010
Histogram
0
5
10
15
20
Tingkat Pendidikan
SD
SMP
SMA
PT
Poligon
9
BIOSTATISTIK
Tingkat Pendidikan
1
Ogive
0
10
20
30
40
50
60
70
80
90
100
89.5 109.5 129.5 149.5 169.5 189.5 209.5
Tekanan Darah Sistolik (mmHg)
F
r
e
k
u
e
n
s
i
R
e
l
a
t
i
f
K
u
m
u
l
a
t
i
f
(
%
)
Less than
More than
Gambar 4. Distribusi Tekanan Darah Sistolik 37 Orang Perokok
(Ogive)
1
Diagram garis
(Line diagram)
0
1 0
2 0
3 0
4 0
5 0
6 0
7 0
8 0
9 0
1 0 0
1 2 3 4
K u a r t a l
J
u
m
l
a
h
D H F
D i a r e
I S P A
Gambar 5. Jumlah Penderita DHF, Diare, ISPA
di Puskesmas X Tahun 2006
Sccater Diagram
10
BIOSTATISTIK
0
10
20
30
40
50
60
70
80
90
0 1 2 3 4 5
PIL
MODUL 3
MENGHITUNG NILAI RATA-RATA SUATU DISTRIBUSI DATA
Penghitungan data-data sampel dalam analisis statistik deskriptif biasa dilakukan dengan
memperhatikan jumlah data. Jika jumlah data kecil (biasanya kurang dari 30) dapat dengan
mudah langsung dihitung tanpa harus mengelompokkannya dengan tabel distribusi
frekuensi (ungrouped data), sedangkan untuk jumlah data besar (biasanya lebih dari 30)
untuk memudah perhitungan secara manual dapat dilakukan dengan mengelompokkannya
dengan tabel distribusi frekuensi (grouped data). Selanjutnya perhitungan akan
dikelompokkan berdasarkan pembagian data ini. Dalam analisis statistik deskriptif ada dua
ukuran yang dapat dihitung, yaitu ; (1) ukuran terpusat (central tendency), dan (2) ukuran
variasi atau sebaran (variation/dispersion)
3.1. PENGHITUNGAN PADA DATA TIDAK BERKELOMPOK.
3.1.1. Ukuran Terpusat.
Ukuran gejala terpusat menggambarkan suatu nilai (besaran) yang khas atau yang
mewakili suatu himpunan data. Nilai yang khas yang demikian cendrung terletak secara
terpusat dalam suatu himpunan data yang tersusun menurut besarnya. Ada beberapa
ukuran terpusat yang lazim digunakan dalam statistik, antara lain :
a). Rata-rata hitung (mean) yang dinyatakan dengan x adalah suatu nilai (besaran)
yang menggambarkan keterwakilan dari dari sekumpulan data. Rata-rata hitung ialah
jumlah semua hasil pengamatan (x) dibagi dengan banyaknya pengamatan (n). Jika
suatu himpunan data sebanyak n bilangan, yaitu :
n
x x x , ,......... ,
2 1
, maka x (baca : x
bar = lambing rata-rata hitung) adalah :
11
BIOSTATISTIK
n
x
n
x
x
i
n
i
i
1
.
..(3.1)
dimana : x = rata-rata hitung (mean)
i
x = jumlah seluruh titik data pengamatan
n = jumlah bilangan titik data pengamatan.
Contoh 1. 1. Data berat bayi lahir (Kg) dari ibu perokok :
3,18 2,84 2,90 3,27 3,85 3,52 3,29 2,76 3,60 3,18 3,59
Berapakah : Rata-rata hitungnya ( x ) ?
Jawab :
n
x
x
n
i
i
1
=
11
59 , 3 18 , 3 60 , 3 76 , 2 29 , 3 52 , 3 85 , 3 27 , 3 90 , 2 84 , 2 18 , 3 + + + + + + + + + +
=
11
98 , 35
= 3,27
Jika bilangan-bilangan
n
x x x ,........, ,
2 1
masing-masing terjadi
n
f f f ,......., ,
2 1
kali, maka
rata-rata hitungnya adalah :
n
x f
n
x f
x
i i
n
i
i i
1
......
(3-2)
dimana : x = rata-rata hitung (mean)
i i
x f = jumlah seluruh titik data pengamatan
n = jumlah bilangan titik data pengamatan.
Contoh 1. 2. Data berat bayi lahir (Kg) dari ibu perokok :
3,18 2,84 2,90 3,27 3,60 3,52 3,18 2,76 3,60 3,18 3,59
Berapakah : Rata-rata hitungnya ( x ) ?
Jawab : x =
n
x f
n
i
i i
1
=
11
59 , 3 76 , 2 52 , 3 ) 60 , 3 ( 2 27 , 3 90 , 2 84 , 2 ) 18 , 3 ( 3 + + + + + + +
=
11
62 , 35
= 3,238
12
BIOSTATISTIK
b). Modus (Mode) yang dinyatakan dengan
o
M adalah suatu nilai (besaran) yang
terjadi dengan frekuensi terbanyak (nilai yang paling umum).
Dengan mengambil soal pada contoh 1.1., maka :
o
M = 3,18 (karena data 3,18 muncul
2 kali (
i
f = 1) atau yang paling banyak)
c). Letak (Posisi) Data
Jika data sudah tersusun (array) dengan susunan data terkecil sampai dengan data
terbesar atau sebaliknya, maka masing-masing posisi atau letak data tersebut dapat
ditentukan, seperti : untuk letak data di pertengahan (Median), letak data di
perempatan (Quartil), letak data di persepuluhan (Desil) dan letak data di perseratusan
(Persentil).
c.1.) Median (Pertengahan), dari suatu himpunan bilangan yang disusun menurut
urutan besarnya (array data) adalah nilai pertengahan atau nilai tengah hitung
dari pertengahan, dinyatakan dengan
o
M adalah :
,
_
2
1 n
Data ke M
e
.....
.(3-3)
dalam bentuk garis bilangan :
Me
Contoh 1.3. Data berat bayi lahir (Kg) dari ibu perokok (data ganjil) :
2,76 2,84 2,90 3,18 3,18 3,27
3,29 3,52 3,59 3,60 3,85
Berapakah : Mediannya (
o
M ) ?
Jawab :
,
_
2
1 n
Data ke M
e
=
,
_
+
2
1 11
Data ke = Data ke 6 = 3,27
Data berat bayi lahir (Kg) dari ibu perokok (data genap) :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59 3,60
3,85 4,00
Berapakah : Mediannya (Me) ?
Jawab :
,
_
2
1 12
Data ke M
e
= Data ke 6,5 = Data ke 6 + 0,5 (Data ke 7 Data ke
6)
= 3,27 + 0,5 (3,29 - 3,27) = 3,28
13
BIOSTATISTIK
c.2.) Quartil (Perempatan) , dari suatu himpunan bilangan yang disusun menurut
urutan besarnya (array data) adalah nilai perempatan atau nilai tengah hitung dari
dua nilai tengah dinyatakan dengan
i
Q adalah :
4
1) i(n
Data ke Q
i
+
.....
.(3-4)
dimana : i =1,2,3.
Dalam bentuk garis bilangan :
1
Q
2
Q =
e
M
3
Q
Contoh 1.4. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59
3,60 3,85
Berapakah :
1
Q ,
2
Q dan
3
Q
?
Jawab :
4
1 1
1
) (n
Data ke Q
+
=
4
1 11 ) (
Data ke
+
= Data ke 3 = 2,90
2
Q =
e
M = 3,27
4
1 11 3
3
) (
Data ke Q
+
= Data ke 9 = 3,59
c.3.) Desil (Persepuluhan), dari suatu himpunan bilangan yang disusun menurut
urutan besarnya (array data) adalah nilai persepuluhan atau nilai-nilai yang
membagi data atas sepuluh bagian yang sama, dinyatakan dengan
i
D adalah :
10
1) i(n
Data ke D
i
+
.
.(3-5)
dimana: i =1,2,3,.,9.
Dalam bentuk garis bilangan :
D1 D2 D3 D4 D5=Q2=Me D6 D7 D8 D9
Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59
3,60 3,85
Berapakah :
3
D ,
5
D dan
8
D
?
14
BIOSTATISTIK
Jawab :
10
1 3
3
) (n
Data ke D
+
=
10
1 11 3 ) (
Data ke
+
= Data ke 3,60
= Data ke 3 + 0,6 (Data ke 4 Data ke 3) = 2,90 + 0,6 (3,18 - 2,90) =
3,068.
5
D =
2
Q =
e
M = 3,27
10
1 11 8
8
) (
Data ke D
+
= Data ke 9,6 = Data ke 9 + 0,6 (Data ke 10 Data ke
9)
= 3,59 + 0,6 (3,60 3,59) = 3,596
c.4.) Persentil (Perseratusan) dari suatu himpunan bilangan yang disusun
menurut urutan besarnya (array data) adalah nilai perseratusan atau nilai-nilai yang
membagi data atas seratus bagian yang sama, dinyatakan dengan
i
P adalah :
100
1) i(n
Data ke P
i
+
...
.(3-6)
dimana : I =1,2,3, ., 99.
Contoh 1.5. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 2,52 3,59
3,60 3,85
Berapakah :
35
P ,
50
P dan
70
P
?
Jawab :
100
1 35
35
) (n
Data ke P
+
=
100
1 11 35 ) (
Data ke
+
= Data ke 4,2
= Data ke 4 + 0,2 (Data ke 5 Data ke 4) = 3,18 + 0,2 (3,18 3,18) =
3,18.
50
P =
5
D =
2
Q =
e
M = 3,27
100
1 11 70
70
) (
Data ke P
+
= Data ke 8,4 = Data ke 8 + 0,4 (Data ke 9 Data
ke 8)
= 3,52 + 0,4 (3,59 3,52) = 3,548
3.2. PENGHITUNGAN PADA DATA BERKELOMPOK.
Jika data sampel dalam jumlah besar (n > 30) maka data-data ini harus dikelompokk
dalam upaya memudah penghitungan jika dilakukan secara manual. Proses
mengelompokkan ini dapat dibantu dengan membuat tabel distribusi frekuensi.
3.2.1. Tabel Distribusi Frekuensi.
15
BIOSTATISTIK
Langkah-langkah membuat tabel ditribusi frekuensi dapat dilakukan dengan :
1. Mencari nilai rangenya : R = Data terbesar Data terkecil.
2. Menghitung jumlah kelas dengan rumus Sturgess, yaitu : n K log 3 , 3 1+ .....
..(3-7)
3. Menghitung lebar kelas (Confidence Interval) :
K
R
C
i
..
..(3-8)
Dengan mempedomani perhitungan di atas, selanjutnya dapat dibuat tabel disribusi
frekuensi berikut :
No.
i
C
i
f
Kumlatif
f
i
x
i i
x f
i
d
i i
d f
2
i i
x f
1. BB1 BA1
1
f
1
f
1
x
1 1
x f
1
d
1 1
d f
2
1 1
x f
2. BB2 BA2
2
f
2 1
f f +
2
x
2 2
x f
2
d
2 2
d f
2
2 2
x f
3. BB3 BA3
3
f
3 2 1
f f f + +
3
x
3 3
x f
3
d
3 3
d f
2
3 3
x f
. .. .. .. .. .. .. ..
. .. .. .. .. .. .. ..
. .. .. .. .. .. .. ..
. .. .. .. .. .. .. ..
K BBK BAK
k
f
k
f f + +..
1 k
x
k k
x f
k
d
k k
d f
2
k k
x f
i
f
i i
x f
i i
d f
2
i i
x f
Keterangan :
No. = Nomor kelas
i
C
=
Lebar kelas (Interval kelas) :
i
C = BPA BPB ; BPA = batas paling atas;
dan BPB = batas paling bawah
i
f
= Jumlah seluruh frekuensi
Kumulatif
f
= Jumlah kumulatif semua frekuensi kelas pada kelas ke-i
i
x
=
Nilai tengah (mid point), yaitu :
i
x = (BPA + BPB)/2
i
d
=
Simpangan, yaitu :
i S i i
C x x d / ) (
Contoh 1.7. Data berat bayi lahir (bbl) dari 40 anak.
3,18 2,84 2,90 3,27 3,85 3,52 3,23 3,90 3,25 2,50
2,76 3,60 3,75 3,59 3,63 2,38 2,34 2,75 3,00 2,60
3,99 3,79 3,60 3,73 3,25 3,60 4,08 3,00 2,75 2,50
3,61 3,83 3,31 4,13 3,26 3,54 3,51 3,25 3,50 2,65
Langkah-langkah membuat tabel ditribusi frekuensi
16
BIOSTATISTIK
R = Data terbesar Data terkecil = : 4,13 2,34 = 1,79
Jumlah kelas : n K log 3 , 3 1+ = 1 + 3,3 log 40 = 6,29 6
Lebar kelas (Confidence Interval) :
K
R
C
i
6
79 , 1
= 0,298 0,3
Tabel 2.2. Data berat bayi lahir (bbl) dari 40 anak.
No
i
C
i
f
Kum
f
i
x
i i
x f
i
d
i i
d f
2
i i
d f
1. 2,34-2,63 5 5 2,485 12,42
5
-4 -20 80
2. 2,64-2,93 6 11 2,785 16,71
0
-3 -18 54
3. 2,94-3,23 5 16 3,085 15,42
5
-2 -10 20
4. 3,24-3,53 8 24 3,385 27,08
0
-1 -8 8
5. 3,54-3,83 11 35 3,685 40,53
5
0 0 0
6. 3,84-4,13 5 40 3,985 19,92
5
1 5 5
40 132,100 -51 167
dimana : i
f
= 40 ; i i
x f
= 132,100 ;
i i
d f
= - 51 ;
2
i i
d f
= 167
Keterangan :
Batas bawah (BB) pada kelas nomor 1 = 2,34 Batas Paling Bawah (BPB) = 2,34
0,005 = 2,335
Batas Atas (BA) pada kelas nomor 1 = 2,63 Batas paling Atas (BPA) = 2,63 + 0,005 =
2,635
i
C
= BPA BPB = 2,635 2,335 = 0,3
1
x = (BPA + BPB)/2 = (2,635+2,335)/2 = 2,485 (nilai tengah pada kelas nomor 1)
i
C x x +
1 2
= 2,485 + 0,3 = 2,785 (nilai tengan pada kelas nomor 2)
i
C x x +
2 3
= 2,785 + 0,3 = 3,085 (nilai tengan pada kelas nomor 3), demikian
seterusnya
i S
C x x d / ) (
5 5
= (3,685-3,685)/0,3 = 0 (simpangan pada kelas nomor 5)
S
x
=
3,685 yaitu nilai tengah pada kelas nomor 5, yaitu kelas dengan frekuen kelas
yang terbesar)
i S
C x x d / ) (
4 4
= (3,385-3,685)/0,3 = -1
i S
C x x d / ) (
3 3
= (3,085-3,685)/0,3 = -2 (demikian seterusnya)
i S
C x x d / ) (
6 6
= (3,985-3,685)/0,3 = 1
3.2.2. Ukuran Terpusat.
17
BIOSTATISTIK
Penghitungan ukuran terpusat untuk data berkelompok pada dasarnya sama pada
penghitungan data tidak berkelompok.
a). Rata-rata hitung (mean) :
i
i i
n
i
i
n
i
i i
f
.x f
f
.x f
x
1
1
....
..(3-9)
dimana
:
x = rata-rata hitung
i i
x f
= Jumlah hasil kali frekuensi kelas dengan nilai tengah pada kelas
yang sama
i
f
= Jumlah seluruh frekuensi kelas
Dari tabel 1.2. Diketahui :
i i
x f = 132,100 ;
i
f = 40
Jadi :
40
100 , 132
i
i i
f
.x f
x = 3,3025
atau, dengan menggunakan rata-rata sementara :
'
'
i
i i
i S
n
i
i
n
i
i i
i S
f
d f
C x
f
d f
C x x
1
1
...
(3-10)
dimana
:
x = rata-rata hitung
S
x
= rata-rata sementara (guessed mean) diambil dari salah satu
nilai tengah (
i
x ) dan biasanya pada kelas dengan frekuensi
terbesar.
i
C
= Lebar kelas (confidence interval)
i i
d f
= Jumlah hasil kali frekuensi kelas dengan simpangan pada kelas
yang sama
i
f
= Jumlah seluruh frekuensi kelas
Dari tabel 1.2. Diketahui :
i i
d f = -51 ;
i
f = 40 ;
S
x = 3,685 dan
i
C = 0,3
18
BIOSTATISTIK
'
i
i i
i S
f
d f
C x x
'
+
40
51
3 , 0 685 , 3 = 3,3025
b). Modus (Mode) :
'
+
+
2 1
1
C BPB M
i Mo o
...
(3-11)
dimana
:
o
M
BPB
= Batas paling bawah pada kelas modus. Kelas modus adalah
kelas dengan frekuensi terbesar.
1
'
+
+
6 3
3
) 3 , 0 ( 535 , 3
o
M = 3,635
c). Letak data :
c.1.) Median (Pertengahan) :
( )
'
+
Me
k
i
i Me e
f
f
N
C BPB M
2
...
(3-12)
dimana
:
e
M
BPB
= Batas paling bawah pada kelas median. Kelas median
adalah kelas dimana data ke ( 2 / N ) berada.
i
f N
= jumlah keseluruhan data
( )
k
i
f
= 5+6+5 = 16 :
i
f N = 40 ;
e
M
f = 8
Jadi :
'
+
8
16
2
40
) 3 , 0 ( 235 , 3 M
e
= 3,385
c.2.) Quartil (Perempatan) :
( )
'
+
i
i
Q
k
i
i Q i
f
f
i.N
C BPB Q
4
........
(3-13)
dimana
:
i
Q
BPB
= Batas Paling Bawah pada kelas Kuartil ke-i. Kelas Kuartil
ke-i adalah kelas dimana data ke ( 4 .N i ) berada.
i
f N
= jumlah keseluruhan data
( )
k
i
f
= 5 :
i
f N =
40 ;
1
Q
f = 6
Jadi :
'
+
6
5
4
40
) 3 , 0 ( 635 , 2
1
Q = 2,885
385 , 3
2 2
M Q
Kelas Quartil ke-3 ( )
3
Q ada pada kelas nomor 5 (karena data ke 30 pada kelas
nomor 5)
20
BIOSTATISTIK
3
Q
BPB = 3,54 0,005 = 3,535 ;
i
C = 0,3 ;
( )
k
i
f
= 24 :
i
f N = 40 ;
3
Q
f =
11
Jadi :
'
+
11
24
4
40 . 3
) 3 , 0 ( 535 , 3
3
Q = 3,698
c.3.) Desil (Persepuluhan :
( )
'
+
i
i
D
k
i
i D i
f
f
i.N
C BPB D
10
......
.(3-14)
dimana
:
i
D
BPB
= Batas Paling Bawah pada kelas Desil ke-i. Kelas Desil ke-i
adalah kelas dimana data ke ( 10 .N i ) berada.
i
f N = jumlah keseluruhan data
( )
k
i
f
= 11 :
i
f N =
40 ;
1
Q
f = 5
Jadi :
'
+
5
11
10
40 . 3
) 3 , 0 ( 935 , 2
3
D = 2,995
385 , 3
2 2 5
M Q D
Kelas Desil ke-8 ( )
8
D ada pada kelas nomor 5 (karena data ke 32 pada kelas nomor
5)
8
D
BPB = 3,54 0,005 = 3,535 ;
i
C = 0,3 ; ( )
i
f
= 24 :
i
f N = 40 ;
3
Q
f =
11
21
BIOSTATISTIK
Jadi :
'
+
11
24
10
40 . 8
) 3 , 0 ( 535 , 3
8
D = 3,753
c.3.) Persentil (Perseratusan) :
( )
'
+
i
i
P
k
i
i P i
f
f
i.N
C BPB P
100
....
(3-15)
dimana
:
i
P
BPB
= Batas Paling Bawah pada kelas Persentil ke-i. Kelas
Persentil ke-i adalah kelas dimana data ke ( 100 .N i )
berada.
i
f N = jumlah keseluruhan data
( )
k
i
f
= 11 :
i
f N =
40 ;
1
Q
f = 5
Jadi :
'
+
5
11
100
40 . 40
) 3 , 0 ( 935 , 2
40
D = 3,235
385 , 3
2 2 5 50
M Q D P
Kelas Persentil ke-85 ( )
85
P ada pada kelas nomor 5 (karena data ke 34 pada kelas
nomor 5)
85
P
BPB = 3,54 0,005 = 3,535 ;
i
C = 0,3 ;
( )
i
f
= 24 :
i
f N = 40 ;
3
Q
f =
11
22
BIOSTATISTIK
Jadi :
'
+
11
24
100
40 . 85
) 3 , 0 ( 535 , 3
85
P = 3,808
3.3. Nilai Penyebaran/Ukuran Variasi (Sebaran).
3.3.1. Nilai Penyebaran Dengan Data Tidak Berkelompok
Variasi atau sebaran adalah variabelitas data atau titk-titik sebaran sejauh mana
data numerik cenderung untuk tersebar disekitas suatu nilai rata-ratanya. Ada beberapa
ukuran variasi yang sering digunakan, antara lain :
a). Rentang atau Jangkauan (Range), adalah selisih bilangan terbesar dan terkecil
dalam suatu himpunan data, dinyatakan oleh R adalah :
R = Data terbesar Data tekecil .
..(3.16)
Contoh 1.6. Data berat bayi lahir (Kg) dari ibu perokok :
2,76 2,84 2,90 3,18 3,18 3,27 3,29 3,52 3,59
3,60 3,85
R = 3,85 2,76 = 1,09
b). Rata-rata Simpangan (Mean Daviation) suatu himpunan n bilangan
n
x x x ,........, ,
2 1
dinyatakan dengan MD didefenisikan oleh :
1 1
1
n-
x x f
n-
x x f
MD
i i
n
i
i i
....(3-17)
Tabel 1.1. Data bbl dari kelompok ibu perokok
No. i
x
i
f x x f
i i
( )
2
x x f
i i
2
i
x
23
BIOSTATISTIK
1. 2,76 1 0,51 0,2601
(2.76)
2
2. 2,84 1 0,43 0,1849 (2.84)
2
3. 2,90 1 0,37 0,1369 (2,90)
2
4. 3,18 2 0,18 0,0162 2x(3.18)
2
5. 3,27 1 0,00 0,0000
6. 3,29 1 0,02 0,0004
7. 3,52 1 0,25 0,0625
8. 3,59 1 0,32 0,1024
9. 3,60 1 0,33 0,1089
10. 3,85 1 0,58 0,3364
35,98 11 2,99 1,2087 118,8760
i
x
i
f
x x f
i i
2
) ( x x f
i i
2
i
x
299 , 0
1 11
99 , 2
1
n-
x x f
MD
i i
c). Simpangan baku (Standard Daviation) suatu himpunan n bilangan
n
x x x , ,......... ,
2 1
dan dinyatakan dengan S didefenisikan oleh :
( )
( )
1 1
2
2
1
n-
x x f
n-
x x f
S
i i
n
i
i i
...
(3-18)
perhatikan tabel 1.1., dimana :
2
) ( x x f
i i
= 1,2087 dan
i
f = n = 11.
( )
1
2
n-
x x f
S
i i
=
1 11
2087 , 1
-
= 0,348
atau, dengan rumus :
24
BIOSTATISTIK
) n(n
x x n
S
n
i
n
i
i i
1
1
2
1
2
,
_
=
( )
) n(n-
x x n
i i
1
2
2
.....
..(3-19)
perhatikan tabel 1.1., dimana :
i
x = 35,98 ;
2
i
x = 118,876 dan
i
f = n = 11
( )
) n(n-
x x n
S
i i
1
2
2
=
) - ( 1 11 11
) 98 , 35 ( ) 876 , 118 ( 11
2
= 0,345
d). Varians atau Ragam (Variance) adalah kuadrat dari simpangan baku, dinyatakan
dengan S
2
adalah :
( )
( )
1 1
2
2
1 2
n-
x x
n-
x x
S
i
n
i
i
..
(3-20)
atau, dengan rumus :
) n(n-
x x n
S
n
i
n
i
i i
1
1
2
1
2
2
,
_
=
( )
) n(n-
x x n
i i
1
2
2
...
..(3-21)
Jika nilai Simpangan baku sudah didapatkan, maka Varians dapat dihitung dengan
mengkuadratkan nilai simpangan bakunya, yaitu :
2 2
) (S S =
2
) 345 , 0 ( = 0,119
e). Koefisien variasi adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan
dinyatakan dengan KV didefenisikan oleh :
% x
x
S
KV 100 ...
(3-22)
Telah diketahui : x = 3,27 dan S = 0,345.
Jadi : % x KV 100
27 , 3
345 , 0
= 10,55%
f). Koefisien Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase, dan
dinyatakan dengan KQ didefenisikan oleh :
25
BIOSTATISTIK
% x
Q Q
Q Q
KQ 100
1 3
1 3
+
..
(3-24)
Telah diketahui :
3
Q = 3,59 dan
1
Q = 2,90
Jadi : % x KQ 100
90 , 2 59 , 3
90 , 2 59 , 3
+
= 10,63%
g). Simpangan Quartil adalah ukuran variabelitas yang dinyatakan dalam parsentase,
dan dinyatakan dengan
d
Q didefenisikan oleh :
) (
2
1
1 3
Q Q Q
d
...
(3-25)
Telah diketahui :
3
Q = 3,59 dan
1
Q = 2,90
Jadi : 345 , 0 ) 90 , 2 59 , 3 (
2
1
d
Q
h). Inter Quartil Range adalah ukuran variabelitas yang dinyatakan dalam parsentase,
dan dinyatakan dengan IQRdidefenisikan oleh :
1 3
Q Q IQR .......
(3-26)
Telah diketahui :
3
Q = 3,59 dan
1
Q = 2,90
Jadi : 90 , 2 59 , 3 IQR = 0,69
3.3.2. Nilai Penyebaran Dengan Data k Berkelompok
Pada dasarnya penghitungan ukuran variasi pada data berkelompok hampir sama
dengan penghitungan pada data tidak berkelompok.
a). Rata-rata Simpangan (Mean Daviation) :
26
BIOSTATISTIK
i
i i
n
i
i
n
i
i i
f
x x f
f
x x f
MD
1
1
......
(3-27)
= 0,414 Dari tabel 1.2.
Diketahui :
x x f
i i
= 16,5600 ;
i
f = 40
Jadi :
40
5600 , 16
i
i i
f
x x f
MD =
b). Simpangan baku (Standard Daviation) :
( )
( )
i
i i
n
i
i
n
i
i i
f
x x f
f
x x f
S
2
1
1
2
......
(3-28)
Dari tabel 1.2.
Diketahui : ( )
2
x x f
i i
= 9,1777 ;
i
f = 40
Jadi :
( )
40
1777 , 9
2
i
i i
f
x x f
S
= 0,479
Atau dengan rumus ;
2
2
2
1
1
1
1
2
S
,
_
,
_
i
i i
i
i i
n
i
i
n
i
i i
n
i
i
n
i
i i
f
x f
f
x f
f
x f
f
x f
.
(3-29)
Dari tabel 1.2.
Diketahui :
i i
x f 132,100 ;
2
i i
x f = 445,4380 dan
i
f = 40
2
2
2
40
100 , 132
40
4380 , 445
S
,
_
,
_
i
i i
i
i i
f
x f
f
x f
= 0,479
atau, dengan rumus :
27
BIOSTATISTIK
2
2
2
1
1
1
1
2
S
,
_
,
_
i
i i
i
i i
i
n
i
i
n
i
i i
n
i
i
n
i
i i
i
f
d f
f
d f
C
f
d f
f
d f
C
...
(3-30)
Dari tabel 1.2.
Diketahui :
i i
d f - 51 ;
2
i i
d f = 167 dan
i
f = 40
2
2
2
40
51
40
167
) 3 , 0 ( S
,
_
,
_
i
i i
i
i i
i
f
d f
f
d f
C
= 0,479
d). Varians atau Ragam (Variance) :
( )
( )
i
i i
n
` i
i
n
i
i i
f
x x f
f
x x f
S
2
2
1 2
.
(3-31)
Dari tabel 1.2.
Diketahui : ( )
2
x x f
i i
= 9,1777 dan
i
f = 40
Jadi :
( )
40
1777 , 9
2
2
i
i i
f
x x f
S = 0,229
atau, dengan rumus :
( ) ( )
'
,
_
'
,
_
2
2
2
1
1
2
2 2
i
i i
i
i i
i
n
i
i
n
` i
i i
n
` i
i
n
i
i i
i
f
d f
f
d f
C
f
d f
f
d f
C S ...(3-
32)
Dari tabel 1.2.
Diketahui :
i i
d f - 51 ;
2
i i
d f = 167 dan
i
f = 40
Jadi : ( ) ( )
'
,
_
'
,
_
2
2
2
2
2 2
40
51
40
167
3 , 0
i
i i
i
i i
i
f
d f
f
d f
C S = 0,229
28
BIOSTATISTIK
MODUL 4
KONSEP DASAR POPULASI DAN SAMPEL
29
BIOSTATISTIK
4.1. PENGERTIAN POPULASI DAN SAMPEL
Dalam suatu penelitian, jika kita ingin megamati atau memeriksa secara keseluruhan
subjek, hal ini berarti kita mempelajri populasi. Populasi adalah totalitas semua nilai yang
mungkin, hasil menghitung ataupun pengukuran kuantitatif maupun kualitatif mengenai
karakteristik tertentu dari semua anggota kumpulan yang lengkap dan jelas yang ingin
dipelajari sifat-sifatnya. Sangat sering kita mengalami kesulitan untuk mengamati populasi,
karena dari segi jumlah subjek, dana, tenaga, dan alat yang dibutuhkan sangat besar,
maka dengan teori sampling dapat dilakukan dengan mengamati sebagian dari jumlah
populasinya saja.
Pada dasarnya suatu penelitian harus mampu dilaksanakan (feasible), artinya
tersedianya subjek penelitian, dana, waktu, alat dan tenaga ahli yang sesuai. Apabila dalam
pelaksanaanya ditemukan kendala seperti keterbatasan dana, waktu, alat dan tenaga ahli,
tetapi kita harus melakukan pengamatan kritis pada seluruh sabjek penelitian, maka dapat
dilakukan pada sebagian subjek yang tersedia saja, hal seperti ini disebut dengan sampling.
Sampling adalah cara pengumpulan data penelitian yang hanya mengamati
sebagian (elemen sampel) dari keseluruhan subjek penelitian yang diteliti.
Keuntungan-keuntungan dari penarikan sampel, antara lain :
1. Dana, waktu, alat dan tenaga ahli yang diperlukan lebih sedikit dibandingkan jika
penelitian dilakukan langsung pada populasi.
2. Mudah dan lebih cepat dikerjakan serta hasilnya dapat segera dievaluasi dan dianalisa.
3. Data yang dikumpulkan lebih komprehensif (dengan cakupan lebih besar) dan
representatif, serta merupakan refleksi dari karakteristik populasi yang diteliti.
4. Tingkat ketelitian lebih besar, artinya pemeriksaan pada sampel akan lebih teliti dan
sangat objektif daripada pemeriksaan lengkap pada seluruh elemen populasi.
Penarikan sampel bila dilakukan dengan prosedur yang sesuai dan benar, maka
suatu sampel dapat merupakan cara yang lebih efisien (cost efficient) untuk mengunpulkan
data dari harus meliputi keseluruhan elemen populasi.
Penelitian survei adalah merupakan salah satu penelitan yang dalam penyelidikan
kritis-nya dalam rangka memperoleh atau mencari keterangan atas suatu persoalan atau
fenomena tertentu dalam suatu daerah atau wilayah tertentu dilakukan dengan mengambil
sampel dari suatu populasi yang tersedia. Biasanya alat ukur (instrumen) yang digunakan
dalam penelitian survei ini adalah kuesioner. Jadi, pada penelitian survei kesimpulan
tentang sifat populasi yang dihasil-kan sangat tergantung pada sampel yang dipelajari,
artinya sampel ynag dipelajari ini diperoleh dengan prosedur teknik sampling yang
bagaimana.
Sedangkan Sensus adalah cara pengumpulan data atau penelitian yang
menggunakan seluruh elemen populasi yang diteliti satu per satu (a complete enumeration)
dan hasilnya merupakan data yang sebenarnya (parameter)
4.2. Teknik penarikan sampel
Peranan yang terpenting dari penarikan sampel dalam suatu penelitian survei adalah
untuk mendapatkan sampel yang betul-betul representatif dan pada gilirannya akan
menghasilkan kete-rangan (informasi) yang dapat diandalkan mengenai sifat-sifat populasi
yang ingin dijelaskannya.
Disamping itu tujuan mempelajari teknik sampling adalah (1) untuk membuat
penarikan sampel menjadi lebih efesien, (2) untuk mengetahui apakah metoda penarikan
sampel sudah benar, dan (3) untuk dapat melakukan pendugaan atau pengujian terhadap
nilai parameter populasi dengan tingkat ketepatan yang tinggi.
Sesuai dengan tujuan utama melaksanakan survei adalah untuk membuat kesim-
pulan tentang sifat-sifat populasi berdasarkan informasi yang terkandung dalam sample.
30
BIOSTATISTIK
Untuk mendapatkan ketepatan (precision), kepekaan (sensitivity), dan banyaknya
informasi (amount of information) yang terkandung dalam sampel diukur sebagai
berbanding terbalik dari ragam (variance) dan nilai rata-rata (mean), dan secara matematis
digambarkan sebagai berikut :
( )
2 2 2
x
n /
1 1
I
n
.
. (4-1)
dimana : I
2
n
= banyaknya informasi yang terkandung dalam sample
= varians populasi
= banyak sample
Dari formula di atas, terlihat bahwa jika varians populasi (
2
x
ZC
n
=
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku normal berdasarkan error type I () yang ditentukan
Simpangan baku populasi
Jumlah sampel.
ZC.(/n) adalah batas galat pendugaan bagi , artinya bila x (rata-rata sampel)
digunakan untuk menduga (rata-rata populasi), maka kita percaya (1-).100 % bahwa
galatnya tidak akan lebih dari ZC.(/n).
Galat Pendugaan
x -ZC.(/n) x x + ZC.
(/n)
5.1.2. Uji Hipotesis rata-rata populasi (
Z x
2 5 0
t
BIOSTATISTIK
Jika x adalah rata-rata sampel acak berukuran n (n 30) yang diambil dari suatu
populasi dengan
2
(varians atau ragam) diketahui, maka uji hipotesis rata-rata populasi
(sesungguhnya) digunakan statistik uji berikut :
...
(5-2)
dimana :
0
x
H
Z
n
=
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku normal yang besarnya tergantung eror type I () yang
ditentukan
Simpangan baku populasi
Jumlah sampel.
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
= o
o Terima Ho, jika :
C H C
Z Z Z ; sebaliknya tolak Ho.
dimana :
) 2 / 5 , 0 (
Z Z
C
atau : dengan membandingkan nilai probabilitas (Prob.) maksimal
penolakan Ho ber-dasarkan data sampel yang diamati, dengan nilai
yang ditentukan sebelumnya.
Tolak Ho, jika : Prob. < (/2), sebaliknya Ho diterima.
Ho
Ha
:
:
= o
> o Tolak Ho, jika :
C H
Z Z > ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
= o
< o Tolak Ho, jika :
C H
Z Z < ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.1.
Hasil pemeriksaan oleh tim kesehatan universitas menyatakan bahwa rata-rata tekanan
darah sistolik seluruh mahasiswa yang masuk tahun sebelumnya adalah 127,5 mmHg.
Seorang mahasiswa FKM ingin membandingkannya dengan mahasiswa yang ada saat ini.
Untuk maksud tersebut ia membuat suatu survei mini dan mengambil sampel secara acak
sebanyak 50 orang mahasiswa. Diasumsikan data ke 50 mahasiswa ini, data populasinya
menyebar normal. Dari data sampel yang dikumpulkan dapat dihitung rata-rata tekanan
darah sistoliknya ( x ) 124 mmHg dan simpangan baku (S) 26,9 mmHg. Gunakan Confidence
Level () 5 %.
Pertanyaan :
a). Buatlah taksiran dengan interval kepercayaan 95 % bagi tekanan darah sistolik (tks)
mahasiswa sesung-guhnya ?
36
n
- x
Z
o
H
BIOSTATISTIK
b). Selanjutnya jelaskan galat pendugaan bagi rata-rata tekanan darah sistolik mahasiswa
sesungguhnya oleh titik taksiran sebesar 124 mmHg ?
c). Ujilah, apakah rata-rata tekanan darah sistolik mahasiswa sekarang berbeda dengan
tahun sebelumnya ? Gunakan = 0,05.
Jawab :
a). Untuk melakukan pendugaan bagi rata-rata populasi (
sama
dengan 7,46 mmHg.
c). Ho :
0
Ha :
0
0
127,5 mmHg.
Statistik uji yang digunakan :
50
9 , 26
5 , 127 124
0
n
x
Z
H
x
tC
S
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku t-student berdasarkan error type I () yang ditentukan
Simpangan baku sampel.
5.1.4. Uji Hipotesis rata-rata populasi () dengan n < 30 (sampel kecil) tidak
diketahui
Jika x adalah rata-rata sampel acak berukuran n (n < 30) yang diambil dari suatu
populasi dengan
2
(varians atau ragam) tidak diketahui, maka uji hipotesis bagi rata-rata
populasi (sesungguhnya) digunakan statistik uji berikut :
........
(5-4)
diman
a
o
x
tC
S
=
=
=
=
rata-rata sesungguhnya (populasi)
rata-rata sampel
Nilai baku t-student yang besarnya bergantung pada yang ditentukan
Simpangan baku sampel.
a) Prob. = 2{0,5 L(ZH = -0,92)} = 2(0,5 0,3212) = 0,3576
atau : Prob. = 1 2{L(ZH = -0,92)} = 1 2(0,3212) = 0,357
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
= o
o Terima Ho, jika :
C H C
t t t ; sebaliknya tolak Ho.
dimana :
dk C
t t
); 2 / (
dk = n - 1
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
= o
> o
Tolak Ho, jika : tH > tC ; sebaliknya terima Ho.
dimana :
dk C
t t
;
dk = n - 1
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
= o
< o
Tolak Ho, jika : tH < -tC ; sebaliknya terima Ho.
38
1
2
n- dk t t
n
S
t x
);dk / ( C C
t
n S
- x
t
o
H
BIOSTATISTIK
dimana :
dk C
t t
;
dk = n - 1
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.2.
Dari 25 mahasiswa yang diambil secara acak, masing-masing diukur tinggi badan mereka,
dan diperoleh data seperti berikut : 160,5 ; 160,0 ; 157,0 ; 154,0 ; 165,0 ; 167,0 ; 170,5 ;
172,5 ; 167,5 ; 174,5 ; 167,0 ; 168,0 ; 150,0 ; 145,0; 150,0 ; 155,0 ; 160,0 ; 162,5 ; 170,0 ;
166,0 ; 165,5 ; 170,0 ; 174,0 ; 155,5 ; 175,0.
i
x = 4082 dan
2
i
x = 668169.
Dari data yang terkumpul diperoleh rata-ratanya adalah 163,28 cm, dan simpangan baku
sebesar 8,317 cm. Berdasarkan data tahun sebelumnya rata-rata tinggi badan adalah 165,7
cm.
a). Buatlah pendugaan bagi rata-rata tinggi badan mahasiswa yang sesungguhnya (
n
S
x
t
H
Prob. = 0,165
b)
Titik kritis :
) 1 ( ); (
n C
t t
=
24 ; 01 , 0
t = 2,492
Ternyata :
H
t (= -1,455) >
C
t (= -2,492) Ho diterima. (Prob. (= 0,165) > (= 0,01)
Ho diterima).
Kesimpulan : Tidak benar bahwa tinggi badan mahasiswa sekarang lebih rendah dari
tinggi badan mahasiswa tahun sebelumnya, pada taraf uji () 1 %.
5.2. PENDUGAAN DAN UJI HIPOTESIS PARAMETER POPULASI DENGAN DUA SAMPEL
5.2.1. Pendugaan beda dua rata-rata populasi : (1-2) dengan 1
2
dan 2
2
diketahui
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran n1 dan n2
yang diambil dari suatu populasi dengan varians
2
1
dan
2
2
diketahui (n 30), maka
Interval Kepercayaan (1-).100% bagi (1-2) adalah :
....(5-5)
dimana
:
1-2
= selisih rata-rata sesungguhnya (populasi)
1
x -
2
x
= selisih rata-rata sampel
2
2
2
1
dan
= varians pada kelompok populasi 1 dan 2
1
x dan
2
x
= rata-rata sampel pada kelompok populasi 1 dan 2 .
5.2.2. Uji Hipotesis perbedaan dua rata-rata populasi : (
2 1
) dengan 1
2
dan
2
2
diketahui
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran n1 dan n2
yang diambil dari suatu populasi dengan varians 1
2
dan 2
2
diketahui (n 30), maka uji
hipotesis beda rata-rata populasi (sesungguhnya) digunakan statistik uji berikut :
.........
..(5-6)
dimana :
1-2
= beda rata-rata sesungguhnya (populasi)
1
x -
2
x
= beda rata-rata sampel
40
( )
) - , ( C C
Z Z
n
Z x x -
2 5 0
2
2
2
1
2
1
2 1 2 1
+ t
2
2
2
1
2
1
2 1
n
x - x
Z
H
+
BIOSTATISTIK
1
2
dan 2
2
=
varians pada kelompok populasi 1 dan 2
1
x dan
2
x
= rata-rata sampel pada kelompok populasi 1 dan 2 .
d). Interpolasi :
546 , 0 . Pr
651 , 11 338 , 18
571 , 17 338 , 18
900 , 0 500 , 0
. Pr 500 . 0
18,338
571 , 17
651 , 11
2
0,500;19
2
19 .; Pr
2
19 ; 900 , 0
ob
ob
ob
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
1 = 2
1 2 Terima Ho, jika :
C H C
Z Z Z ; sebaliknya tolak Ho.
dimana :
) 2 / 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya Ho diterima.
Ho
Ha
:
:
1 2
1 > 2 Tolak Ho, jika :
C H
Z Z ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
1 2
1 < 2 Tolak Ho, jika :
C H
Z Z ; sebaliknya terima Ho.
dimana :
) 5 , 0 (
Z Z
C
atau : Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.5.
Suatu sampel acak mahasiswi berukuran n1 = 25, yang ditarik dari suatu populasi normal
dapat dicatat hasil ujian Biostatistik mereka sebagai berikut : 70 ; 80 ; 85 ; 75 ; 60 ; 65 ; 75 ;
41
BIOSTATISTIK
60 ; 75 ; 80 ; 85 ; 90 ; 85 ; 70 ; 65 ; 60 ; 65 ; 60 ; 55 ; 85 ; 80 ; 70 ; 75 ; 80 ; dan 60. Dapat
dihitung
1
x = 72,40 dan S1 = 10,12.
Suatu sampel acak lain berukuran n2 = 36 dapat dicatat hasil ujian Biostatistik sebagai
berikut : 60 ; 60 ; 65 ; 65 ; 60 ; 75 ; 75 ; 80 ; 80 ; 75 ; 70 ; 65 ; 80 ; 65 ; 75 ; 70 ; 50 ; 50 ;
55 ; 65 ; 60 ; 75 ; 75 ; 80 ; 75 ; 60 ; 60 ; 55 ; 55 ; 50 ; 60 ; 75 ; 70 ; 75 ; 85 ; dan 70.
Diperoleh
2
x = 67,22 dan S2 = 9,67.
Pertanyaan :
a). Buatlah penaksiran terhadap selisih rata-rata sesungguhnya ( )
2 1
pada tingkat
kepercayaan 99 % dan 95 %.
c). Jelaskan galat pendugaan bagi penaksiran selisih rata-rata sesungguhnya dengan
menggunakan rata-rata sampel pada intervak kepercayaan 99 % dan 95 %.
b). Ujilah apakah kedua kelompok mahasiswi dan mahasiswa tersebut nilai ujiannya
berbeda nyata ? Gunakan = 0,01 dan 0,05.
Jawab :
a). Untuk melakukan taksiran bagi selisih rata-rata populasi (
2 1
) oleh selisih rata-rata
sampel (
2 1
x x ) dengan ukuran sampel n1 dan/atau n2 lebih dari 30 (sampel besar)
dapat dilakukan dengan rumus (5-9).
2
2
2
1
2
1
2 1 2 1
n n
Z x x
C
+ t
575 , 2 01 , 0
4950 , 0 )) 2 / 01 , 0 ( 5 , 0 (
Z Z Z
C
dan 96 , 1 05 , 0
4750 , 0 )) 2 / 05 , 0 ( 5 , 0 (
Z Z Z
C
Jika
2
1
atau
2
2
(varians populasi) tidak diinformasikan pada soal, dapat digunakan
2
1
S atau
2
2
S (varians sampel).
Pada
= 0,01 66 , 6 18 , 5
36
) 67 , 9 (
25
) 12 , 10 (
) 575 , 2 ( ) 22 , 67 40 , 72 (
2 2
2 1
t + t
atau : Interval kepercayaan 99 % bagi selisih
2 1
adalah : [-1,48 ; 11,84]
Kesimpulan : Kita percaya 99 % bahwa selisih rata-rata sesungguhnya (
2 1
)
nilai ujian mahasiswa ada dalam interval dengan batas 1,48 sampai dengan 11,84
atau dalam jangkauan sekitar 13,32.
Pada
= 0,05 07 , 5 18 , 5
36
) 67 , 9 (
25
) 12 , 10 (
) 96 , 1 ( ) 22 , 67 40 , 72 (
2 2
2 1
t + t
atau : Interval kepercayaan 95 % bagi selisih
2 1
adalah : [0,11 ; 10,25]
Kesimpulan : Kita percaya 95 % bahwa selisih rata-rata sesungguhnya (
2 1
)
nilai ujian mahasiswa ada dalam interval dengan batas 0,11 sampai dengan 10,25
atau dalam jangkauan sekitar 10,14.
b). Pada
= 0,01 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih
rata-rata sesung-guhnya (
2 1
) dengan menggunakan selisih rata-rata sampel (
42
BIOSTATISTIK
2 1
x x ) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (
2
2
2
1
2
1
n
. Z
C
+ ) atau sebesar 6,66.
Pada
= 0,05 Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih
rata-rata sesungguhnya (
2 1
) dengan menggunakan selisih rata-rata sampel (
2 1
x x ) sebesar 5,18 maka kita boleh membuat galat pendugaan tidak lebih dari (
2
2
2
1
2
1
n
. Z
C
+ ) atau sebesar 5,07.
c). Ho :
2 1
Ha :
2 1
Statisti uji :
002 , 2
36
) 67 , 9 (
25
) 12 , 10 (
22 , 67 40 , 72
2 2
2
2
2
1
2
1
2 1
n n
x x
Z
H
Prob. = 0,0456
Titik kritis : untuk = 0,01ZC = Z0,4950 = 2,575
dan = 0,05ZC = Z0,4750 = 1,96
Ternyata : pada = 0,01 ZH (= 2,002) < ZC (2,575) Ho diterima,
dan pada = 0,05 ZH (= 2,002) > ZC (1,96) Ho ditolak.
Atau berdasarkan nilai probabiltas, yaitu : Prob. (= 0,0456) > (= 0,01)
Ho diterima,
dan Prob. (= 0,0456) < (= 0,05)
Ho ditolak.
Kesimpulan : Hasil statistik pada taraf nyata () 1% Ho diterima dan pada taraf nyata
() 5% Ho ditolak, hal ini menunjukkan tingkat signifikasi yang tidak terlalu kuat, artinya
ada keraguan untuk menyatakan ada perbedaan nilai ujian kedua kelompok mahasiswa
tersebut. Oleh karena masih diragukan, maka diperlukan penelitian lanjutan dengan
manambah besar sampel.
5.2.3. Pendugaan beda dua rata-rata populasi : (
2 1
) dengan 1
2
= 2
2
(Independent samples t-test)
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran kecil n1
dan n2 (n < 30), yang diambil dari dua populasi dengan varians
2
1
dan
2
2
tidak diketahui.
Diasumsikan kedua varians sama (
2
1
=
2
2
), maka Interval Kepercayaan (1-).100 % bagi
(1-2) adalah :
.....(.5-
7)
dimana :
1-2 = selisih rata-rata sesungguhnya (populasi)
1
x -
2
x
= selisih rata-rata sampel
43
( )
2
2
1 1 1 1
2 1
2
2 1
2
2 2
2
1 1
2 1
2 1 2 1
+
+
+
+ t
n n dk t t
n n
)S (n )S (n
S
n n
. .S t x x -
):dk
(
C
g g C
BIOSTATISTIK
2
1
S dan
2
2
S
= varians pada sampel dari kelompok populasi 1 dan 2
Sg = simpangan baku gabungan
1
x dan
2
x
= Rata-rata sampel
5.2.4. Uji Hipotesis beda dua rata-rata populasi : (
2 1
) dengan 1
2
= 2
2
(Independent samples t-
test)
Jika
1
x dan
2
x masing-masing adalah rata-rata sampel acak berukuran kecil n1
dan n2 (n < 30), yang diambil dari dua populasi dengan varians 1
2
dan 2
2
tidak diketahui.
Diasumsikan kedua varians sama (1
2
= 2
2
), maka uji hipotesis beda dua rata-rata
populasi digunakan statistik uji berikut :
........
(5-8)
Dimana :
1-2
1
x -
2
x
S1
2
dan S2
2
Sg
1
x dan
2
x
=
=
=
=
=
beda rata-rata sesungguhnya (populasi)
beda rata-rata sampel
varians pada sampel dari kelompok populasi 1 dan 2
simpangan baku gabungan
rata-rata sampel dari kelompok populasi 1 dan 2 .
Pasangan hipotesis dan daerah kritis :
Ho
Ha
:
:
1 = 2
1 2 Terima Ho, jika :
C H C
t t t ; sebaliknya tolak Ho.
dimana :
dk C
t t
); 2 / (
dk = n1 + n2 - 2
atau
:
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
1 = 2
1 > 2 Tolak Ho, jika :
C H
t t > ; sebaliknya terima Ho.
dimana :
dk C
t t
;
dk = n1 + n2 - 2
atau
:
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Ho
Ha
:
:
1 = 2
1 < 2 Tolak Ho, jika :
C H
t t < ; sebaliknya terima Ho.
dimana :
dk C
t t
;
dk = n1 + n2 - 2
atau
:
Tolak Ho, jika : Prob. < , sebaliknya terima Ho.
Contoh : 3.6.
44
2
1 1
1 1
2 1
2
2 2
2
1 1
2 1
2 1
+
+
+
n n
)S (n )S (n
S
n n
. S
x x
t
g
g
H
BIOSTATISTIK
Umur (dalam tahun) mulai gejala penderita kanker wanita dan pria yang
independen dapat dicatat sebagai berikut :
Wanita 58 52 50 49 56 52 54 48 41 37 67
70
Pria 26 41 57 66 36 55 41 61 53 50 52
37 50
Sumber : data rekaan.
Pertanyaan :
a). Buatlah pendugaan bagi selisih rata-rata sesungguhnya antara rata-rata umur mulai
gejala penderita kanker wanita dan pria pada interval kepercayaan 94 %
b). Jelaskan galat pendugaan bagi pendugaan selisih rata-rata tersebut pada pertanyaan a).
c). Ujilah pada taraf signifikansi 6 %, apakah umur rata-rata mulai gejala penderita kanker
wanita lebih tinggi dari umur rata-rata penderita kenker pria ? Untuk kasus ini
diasumsikan kedua varians sama.
Jawab :
Dari dapat diketahui :
1
n = 12 ;
1
x = 634 ;
2
1
x = 34468 ;
2
n = 13 ;
2
x = 625 dan
2
2
x = 31567
maka 33 , 88
) 11 ( 12
) 634 ( ) 34468 ( 12
2
2
1
S ; 58 , 126
) 12 ( 13
) 625 ( ) 31567 ( 13
2
2
2
S
a). Untuk melakukan taksiran bagi selisih rata-rata populasi (
2 1
) oleh selisih rata-rata
sampel (
2 1
x x ) dengan ukuran sampel n1 dan n2 kurang dari 30 (sampel kecil) dan
2
1
=
2
2
dapat dilakukan dengan rumus (1-11).
2 1
2 1 2 1
1 1
.
n n
S t x x
g C
+ t
) 2 ( ); 2 / (
2 1
+
n n C
t t
=
23 ); 3 . ( o o
t = 1.998
e)
2
) 1 ( ) 1 (
2 1
2
2 2
2
1 1
+
+
n n
S n S n
S
g
=
2 13 12
) 58 , 126 )( 1 13 ( ) 33 , 88 )( 1 12 (
+
+
= 10,41
Jadi : 33 , 8 75 , 4
13
1
12
1
) 41 , 10 ).( 998 , 1 ( ) 08 , 48 83 , 52 (
2 1
t + t
atau : Interval kepercayaan 94 % bagi selisih
2 1
adalah : [-3,58 ; 13,08]
Kesimpulan : Kita percaya 94 % bahwa selisih rata-rata sesungguhnya (
2 1
) umur
pertama kali menderita kanker antara pria dan wanita ada dalam interval dengan batas
3,58 sampai dengan 13,08 atau dalam jangkauan sekitar 16,66.
b). Juga dapat dinterpretasikan bahwa jika kita ingin menaksir selisih rata-rata
sesungguhnya (
2 1
) dengan menggunakan selisih rata-rata sampel (
2 1
x x )
sebesar 4,75 maka kita boleh membuat galat pendugaan tidak lebih dari (
2 1
1 1
.
n n
S t
g C
+ )
atau sebesar 8,33.
45
BIOSTATISTIK
c). Ho :
2 1
Ha :
2 1
>
Statistik uji :
41 , 10
2 13 12
) 58 , 126 ( 12 ) 33 , 88 ( 11
1 1
2 1
2 1
+
+
+
g
g
H
S
n n
S
x x
t
e). Dalam tabel t, nilai probabilitas t-student untuk 0.03 tdak dijumpai. Untuk menghitung
nilai baku t-student senilai dengan nilai probabilitas sebesar 0.03 tersebut dapat
dilakukan dengan teknik interpolasi.
Perhatikan tabel t (tabel III), baris ke 23 kolom 0.05 dan kolom 0.025, selanjut dapat
ditulis seperti berikut :
069 . 2 714 1
23 ; 025 . 0 23 ; 03 . 0 23 05 0
t
t
t
.
t
C
; .
714 , 1 069 , 2
069 , 2
05 , 0 025 , 0
03 , 0 025 , 0
C
t
tC = 1,998
+
140 , 1
13
1
12
1
41 , 10
08 , 48 83 , 52
H
t
prob. = 0,269
Statistik tabel :
C
t = 1,635
Kriteria penolakan Ho : Tolak jika
C H
t t >
Ternyata : ) 635 , 1 ( ) 140 , 1 ( <
C H
t t
Atau berdasarkan kriteria nilai probabilitas, ternyata : Prob. (0,269) > (0,05) Ho
diterima.
Kesimpulan : Terbukti pada taraf signifikansi ( ) 6 % bahwa rata-rata umur mulai
gejala penderita kanker wanita tidak lebih tinggi dari rata-rata umur penderita kanker
pria.
MODUL 6 MODUL 6
UJI TABEL SILANG (CROSSTAB TEST) UJI TABEL SILANG (CROSSTAB TEST)
A. PENDAHULUAN
Dalam analisis statististik parametrik yang prosedurnya dibuat berdasarkan sejumlah
asumsi, antara lain :
(1). sampel yang dicuplik dari populasi yang berdistribusi normal, atau paling sedikit
mendekati normal.
(2) pemilihan unit sampel dari populasi harus independen.
(3). pengamatan unit observasi juga harus independen.
46
BIOSTATISTIK
(4). Jika membandingkan dua atau sejumlah sampel, maka varians (ragam)
populasinya harus homogen.
(5). Variabel yang diukur dalam skala interval atau dalam skala rasio.
Jika asumsi-asumsi tersebut terpenuhi, maka penggunaan uji statistik parametrik sudah
valid. Namun jika terjadi pelanggaran atas asumsi-asumsi ini, sebagai alternatifnya dapat
digunakan uji statistik nonparametrik.
Uji nonparametrik atau uji bebas sebaran adalah suatu metode statistik yang hanya sedikit
membuat dugaan tentang populasi asal sampel. Juga uji ini tidak bertujuan menduga
maupun menguji parameter populasi, tetapi cukup membandingkan karakteristik populasi
secara umum.
Oleh karena banyaknya kelemahan yang melekat pada uji nonparametrik ini,
terutama tidak maksimalnya dalam memanfaatkan informasi yang dikandung sampel,
mengakibat uji nonparametrik ini kurang efisien dibandingkan dengan prosedur parametrik
jika kedua metode ini dapat diterapkan. Dengan kata lain, jika uji parametrik dan
nonparametrik dapat digunakan untuk data yang sama, kita sebaiknya menghindari uji
nonparametrik, yang konotasinya cepat dan mudah ini dan mengerjakannya dengan
teknik parametrik yang lebih efisien.
Untuk memberikan gambaran yang lengkap keuntungan dan kelemahan penggunaan
statistik nonparametrik, dapat dijelaskan sebagai berikut :
B. Keuntungan :
(1). Dapat digunakan pada ukuran sampel yang relatif kecil.
(2). Tidak memerlukan asumsi-asumsi yang ketat.
(3). Dapat digunakan pada ukuran skala nominal (kategorikal) atau ordinal
(peringkat).
(4). Relatif mudah dilakukan walaupun dengan manual.
(5). Mudah dipahami karena memiliki konsep lebih sederhana dibandingkan dengan
prosedur parametrik.
C. Kelemahan :
(1). Metode nonparametrik secara statistik kurang kuat (rigorous) daripada metode
parametrik, karena didasari oleh persyaratan yang sedikit, bahkan sering tanpa
persyaratan sama sekali.
(2). Metode nonparametrik kurang memiliki kuasa uji (power of test), jika dengan
ukuran sampel yang sama, metode parametrik dapat diterapkan.
(3). Kecenderungan penyederhanaan data dari skala rasio atau interval menjadi
nominal atau ordinal merupakan pemborosan informasi yang sudah
dikumpulkan.
Uji tabel silang (crosstab) merupakan uji bivariat yang dapat digunakan untuk melihat ada
atau tidaknya perbedaan atau hubungan atau pengaruh dua variabel yang memiliki data
distribusi (nominal atau ordinal) yang mana data-data yang dianalisis data populasinya tidak
harus menyebar normal. Uji tabel silang meliputi uji Chi Square, uji Chi Square dengan
Koreksi Yate, uji Eksaks Fisher dan uji Mc Nemar.
6.1. UJI CHI SQUARE (
2
)
Uji Chi-Square atau juga dikenal dengan uji Kai-Kuadrat yang dikembangkan oleh
Pearson tahun 1900, umumnya digunakan jika data yang tersedia berupa data jumlah
atau data yang siap disajikan dalam bentuk frekuensi, misalnya banyak subjek dalam
klasifikasi pria dan wanita, banyak subjek dalam kategori terpapar dan tidak terpapar,
47
BIOSTATISTIK
atau banyaknya penderita diabetes melitus dalam kategori I, II, III dan IV menurut
kaparahan penyakitnya.
Pada umumnya, uji Kai-Kuadrat (
2
) dapat digunakan untuk :
(1). Uji kesesuaian (test of goodness of fit), yaitu untuk memeriksa apakah ada
kesesuaian (fit) suatu distribusi data sampel dengan distribusi data populasi
tertentu, dimana data yang ingin diuji dalam skala pengukuran nominal atau
ordinal.
(2). Uji independensi (test of independence), yaitu untuk memerika apakah dua
variabel dari sebuah sampel saling bebas (independen) atau tidak bebas.
(3). Uji homogenitas (test of homogeneity), yaitu untuk memeriksa beberapa data
sampel apakah berasal dari populasi-populasi yang sama (homogen) dalam
hal variabel tertentu.
6.1.1. SYARAT-SYARAT PENGGUNAAN UJI KAI-KUADRAT
Dalam melakukan uji Kai-Kuadrat, ada syarat-syarat yang harus dipenuhi, antara lain ;
(1). Sampel dipilih acak dan data yang tersedia dalam bentuk jumlah atau diskrit.
(2). Semua pengamatan dilakukan independen
(3). Sel-sel dengan frekuensi harapan (expected value) kurang dari 5 jika ada dapat
dibenarkan sekitar 25% dari total sel, dan pada sembarang frekuensi harapan (
ij
E
)
nilainya paling sedikit 1.
(4). Khusus untuk tabel kontingensi 2x2, syarat tersebut berarti tidak ada satu selpun
boleh berisi frekuensi harapan (
ij
E
) < 5. Jika ada, maka disarankan untuk menggunakan
uji Exact Fisher atau uji Chi Square dengan koreksi Yates.
(5). Meskipun dapat diterapkan pada sampel kecil, uji Chi Square sebaiknya pada sampel
yang ukuran > 40
6.1.2. LANGKAH-LANGKAH PENGGUNAAN UJI KAI-KUADRAT (
2
)
Uji Chi Square dapat digunakan untuk menetapkan signifikansi perbedaan antara dua
kelompok pengamatan (variabel) saling bebas (independen) atau tidak (non-
independen). Pengukuran yang dituntut disini dapat selemah skala nominal.
Hipotesis yang diuji biasanya adalah dua kelompok (bivariat), apakah berbeda dalam
hal ciri khas tertentu, dengan demikian perbedaan itu berhubungan dengan frekuensi
relatif masuknya anggota-anggota kelompok ke dalam beberapa kategori.
Langka-langkah penggunaan statistik uji :
Pasangan hipotesis :
Ho : Kedua variabel tidak saling tergantung (independen)
Ha : Kedua variabel saling tergantung (tidak independen), atau
Ho : Tidak ada perbedaan (hubungan) yang signifikan antara variabel pertama
dengan variabel kedua.
Ha : Ada perbedaan (hubungan) yang signifikan antara variabel pertama dengan
variabel kedua.
Statistik Uji yang digunakan :
48
BIOSTATISTIK
.....(6-1)
dimana :
N
k b
E
j i
ij
) )( (
i = baris ke 1, ke 2, ke 3, .., ke b.
j
= kolom ke 1, ke 2, ke 3, .., ke k.
Tabel. 4. Tabel penolong perhitungan Chi Square :
SEL
ij
O
ij
E
ij ij ij
E E O / ) (
2
1 1
K B
11
O
11
E
11
2
11 11
/ ) ( E E O
2 1
K B
12
O
12
E
12
2
12 12
/ ) ( E E O
1 2
K B
21
O
21
E
21
2
21 21
/ ) ( E E O
2 2
K B
22
O
22
E
22
2
22 22
/ ) ( E E O
. .
k b
K B
bk
O
bk
E
/ ) (
2
bk bk bk
E E O
ij ij ij
b
i
k
j
H
E E O / ) (
2
1 1
2
Titik Kritis :
2
;
2
dk C
dimana
) 1 )( 1 ( k b dk
Daerah Kritis : Tolak Ho, jika
2 2
C H
> , sebaliknya terima Ho.
Catatan : Pada data tabel kontingensi 2x2, uji Kai-Kuadrat sebaiknya tidak digunakan bila :
49
( )
b
i
k
j
ij
ij ij
H
E
E O
1 1
2
2
BIOSTATISTIK
1). n 20, dianjurkan menggunakan uji Eksak Fisher.
2). 20 < n < 40, jika ada
ij
E
5, dianjurkan menggunakan uji Eksak Fisher.
3). n 40, jika ada ij
E
1, dianjurkan menggunakan uji Eksak Fisher. Sebaliknya jika : 1
<
ij
E
5, dapat
diterapkan uji Chi Square dengan koreksi Yate (Continuity corecction)
Pada tabel kontingensi 2x2 berikut :
Tabel 5 : Tabel Kontingensi 2x2
Variabel Pertama
Variabel Kedua
Jumlah
Kategori 1 Kategori 2
Kategori 1 a b a+b
Kategori 2 c d c+d
Jumlah a+c b+d n
dimana : a, b, c dan c adalah data hasil pengamatan
n adalah jumlah seluruh pengamatan (n = a+b+c+d)
disamping dapat menggunakan rumus (4-3) juga dapat digunakan rumus berikut :
..(6-2)
Contoh 3 :
Suatu studi dilakukan dengan maksud mengetahui hubungan persepsi seseorang
tentang kerentanan terhadap penyakit dan pilihan jenis pelayanan kesehatan yang
diinginkan. Hasil pengukuran pada responden disajikan dalan tabel berkut :
Pilihan Pelayanan
Kesehatan yang
dikehendaki
Persepsi Kerentanan Terhadap
Penyakit
Jumlah
Serius Tidak serius
Medis 20 11 31
Tradisional 13 16 29
Jumlah 33 27 60
Ujilah, apakah data yang dikumpulkan dapat menjelaskan bahwa ada hubungan antara
persepsi kerentanan terhadap penyakit dengan pilihan pelayanan kesehatan yang
diinginkan. Gunakan taraf nyata ( ) 5 %.
Jawab :
Ho : tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan
pilihan pelayanan kesehatan yang diinginkan
50
( )
( ) ( ) ( ) ( ) d c b a d b c a
bc ad n
+ + + +
2
2
BIOSTATISTIK
Ha : terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan
pilihan pelayanan kesehatan yang diinginkan
Tabel perhitungan ;
SEL
ij
O
ij
E
ij ij ij
E E O / ) (
2
1 1
K B
20 17,05 0,510
2 1
K B
11 13,95 0,624
1 2
K B
13 15,95 0,546
2 2
K B
16 13,05 0,667
ij ij ij
b
i
k
j
H
E E O / ) (
2
1 1
2
= 2,347
Pemeriksaan pada nilai expected (frekuensi harapan) tidak ditemukan ada < 5, hal ini
dibenarkan untuk terus menggunakan statistik uji Chi Square.
Titik Kritis :
2
) 1 2 )( 1 2 ( ; 05 , 0
2
C
2
1 ; 05 , 0
= 3,841
Daerah Kritis : Tolak Ho, jika
2 2
C H
> ,
ternyata : ) 841 , 3 ( ) 347 , 2 (
2 2
<
C H
, artinya Ho diterima.
Kesimpulan : Berdasarkan data sampel yang dikumpulkan dapat menjelaskan bahwa
tidak terdapat hubungan antara persepsi kerentanan terhadap penyakit dengan pilihan
pelayanan kesehatan yang diinginkan, pada taraf nyata ( ) 5 %.
Atau, dapat juga dengan menggunakan rumus (10-4) :
( )
( )( ) ( ) ( ) d c b a d b c a
bc ad n
+ + + +
2
2
( ) ( ) { }
( ) ( )( ) ( ) 29 31 27 33
13 . 11 16 . 20 60
2
= 2,347
Jadi, terlihat bahwa hasil yang ditunjukkan dengan rumus (10-3) atau rumus (10-4)
sama. Keuntung-an yang diperoleh dengan menggunakan rumus (10-3), kita bisa melihat
51
BIOSTATISTIK
besaran nilai expectednya, sehingga kita bisa menegaskan apakah uji Chi-Square dapat
dilanjutkan. Sebaliknya dengan rumus (10-4) hal yang sama tidak ditemukan.
6.2. UJI EKSAK FISHER (TEST FISHER EXACT)
Uji Eksak Fisher adalah uji independensi dua set pengamatan dengan dua
variabel kategorial, menggunakan pendekatan probabilitas pasti (exact probability).
(Fisher, 1973).
Uji Eksak Fisher dapat digunakan bila dalam uji Kai-Kuadrat dengan format
tabel kontingensi 2x2 dan derajat kebebasan (dk) satu, bila :
(1) jumlah seluruh pengamatan (n) kurang dari 20,
(2) terdapat sel harapan (expected) kurang dari 5 dengan jumlah pengamatan antara
20 sampai dengan 40, dan
(3) jumlah pengamatan (n) lebih besar 40 dan terdapat sel harapan ada yang kurang
dari satu.
Prosedur uji pasti Fisher lebih memungkinkan untuk mendapatkan hasil
akurat untuk semua format tabel 2x2, yang nilai-nilai harapannya terlalu kecil untuk
dapat dianalisis dengan uji Kai-Kuadrat.
Untuk memperoleh nilai probabilitas pasti Fisher ( P ) dapat diperhatikan
tabel 5, di atas dengan sel teramati terdiri dari a, b, c dan d adalah sebagai berikut :
..(6-3)
Langkah-langkah penggunaan uji Eksaks Fisher dapat dimulai dengan membuat tabel
konfigurasi yang bertitik tolak dari tabel induknya dengan jumlah pinggir baris dan
kolom tetap seperti tabel teramati aslinya (tabel 8-5). Untuk tabel konfigurasi yang
mundur akan berhenti jika nilai sel a pada sel utama sama dengan nol, dan untuk tabel
konfigurasi yang maju akan berhenti jika nilai sel c pada tabel utama sama dengan nol.
Tabel konfigurasi yang dimaksud dapat dimulai dari
tabel utama (tabel pengamatan) dengan asumsi nilai sel a = 3 dan nilai sel b juga = 3,
dengan demikian tabel konfogurasi mundur dan maju dapat dibuat sebagai berikut :
52
! !. !. !. !.
)! ( )! ( )! ( )! (
) 0 (
d c b a N
d b c a d c b a
a P
+ + + +
BIOSTATISTIK
0 b+a a+b
1 12 13
2 11 13
3 10 13
7 1 8 6 2 8 5 3 8 4 4 8
7 14 21 7 14 21 7 14 21 7 14 21
7 6 13
6 7 1
3
5 8 13
4 9 13
0 8 8 1 7
8
2 6 8 3 5 8
7 14 21 7 14 2
1
7 14 21 7 14 21
Tabel Induk
Perhitungan nilai-nilai probabilitas uji eksaks Fisher berdasarkan tabel konfigurasiyang
dimungkinkan, adalah sebagai berikut :
000069 , 0
! 14 . 15 . 16 . 17 . 18 . 19 . 20 . 21
! 14 !. 8
! 1 !. 7 !. 13 !. 0 !. 21
! 14 !. 7 !. 8 !. 13
) 0 ( P
003130 , 0
2 . 1
13 . 7
) 0 ( ) 1 ( P P
037564 , 0
3 . 2
12 . 6
) 1 ( ) 2 ( P P
172171 , 0
4 . 3
11 . 5
) 2 ( ) 3 ( P P
344341 , 0
5 . 4
10 . 4
) 3 ( ) 4 ( P P
309907 , 0
6 . 5
9 . 3
) 4 ( ) 5 ( P P
118060 , 0
7 . 6
8 . 2
) 5 ( ) 6 ( P P
014757 , 0
8 . 7
7 . 1
) 6 ( ) 7 ( P P
Untuk uji dua pihak, nilai :
Prob. = 2.min.
{ } { } [ ]
) 7 ( ) 6 ( ) 5 ( ) 4 ( ) 4 ( ) 3 ( ) 2 ( ) 1 ( ) 0 (
, P P P P P P P P P + + + + + + +
= 2.min. { } { } [ ] 787065 , 0 , 557275 , 0 = 2.(0,557275) = 1,114550
Daerah kritis : Tolak Ho, jika nilai Prob. < (yang ditentukan)
Ternyata, Prob. (1,114550) > (0,05), artinya Ho diterima.
56
BIOSTATISTIK
Kesimpulan : Pada taraf nyata ( ) 5 %, diyakini bahwa ada kesatuan pendapat
masyarakat tentang paket program kesehatan yang ditawarkan melalui kampanye
pemilu, baik untuk masayarakat yang tinggal dalam kompleks hunian ataupun
masyarakat yang tinggal secara terpisah-pisah (diluar kompleks hunian)
15-19 : 18 derajat
20-24 36 derajat
25-29 : 57,6 derajat
30-34 : 154,8 derajat
35-39 : 43,2 derajat
40-44 : 50,4 derajat
57