BIOSTATISTIK DASAR
dr. I Ketut Tangking Widarsa, MPH.
Denpasar, 2009
1
Module 1
Introduction to Biostatistics
1.1 Pendahuluan
Pada modul ini akan dipelajari beberapa pengertian, istilah, singkatan, dan notasi yang akan
banyak djumpai dalam mempelajari biostatistik. Mahasiswa seharusnya memiliki
pemahaman yang jelas pada awal mempelajari biostatistik. Pengertian, istilah, singkatan
dan notasi tersebut akan dipergunkan secara inten dalam pembelajaran berikutnya. Pada
akhir dari modul ini mahasiswa akan mempelajari tentang:
1. Batasan biostatistik
2. Peranan biostatistik dalam bidang kedokteran dan kesehatan
3. Observasi dan variabel
4. Skala pengukuran data
5. Populasi dan sampel
Secara umum, di bidang kedokteran, statistik banyak digunakan dalam pengumpulan data,
evaluasi, dan penyajian data kesehatan.
2
1.3 Peranan statistik
Penggunaan metoda statistik dalam ilmu kedokteran bukan suatu hal yang baru. Sejarah
perkembangan kedokteran modern dan epidemiologi menggunakan banyak percobaan baik
dengan binatang atau pada manusia. Untuk mengevaluasi hasil dari percobaan tersebut,
statistik dipakai sebagai alat bantu. Pada tahun 1772, suatu trial yang dilakukan oleh
Kapten Cook menggunakan juice dari wortel sebagai anti scorbutics. Pada tahun 1913,
dengan mempelajari diet makanan yang dimakan, Gold menyimpulkan bahwa penyakit
pellagra adalah suatu penyakit defisiensi. Selanjutnya Panum meneliti tentang cacar,
Takaki tentang beri-beri, Budd tentang typhoid, dan lain-lain.
Pada dekade ini masih banyak penelitian yang ditujukan untuk menemukan dan
mendeskripsikan beberapa penyakit atau syndrom baru terutama penyakit infeksi.
Penelitian-penelitian laboratorium dengan menggunakan binatang masih banyak dilakukan
untuk tujuan ini. Peranan statistik dalam menentukan rancangan penelitian dan evaluasi
hasil penelitian sangat besar agar hasilnya dapat dipertanggungjawabkan secara ilmiah.
3
4) Mempelajari efikasi obat
Studi efikasi obat di klinik adalah sangat perlu untuk dapat memilih obat yang
mempunyai daya penyembuhan yang tinggi. Dalam studi ini, biasa dilakukan dengan
pembanding atau tanpa pembanding. Untuk menentukan rancangan penelitian, variabel,
sampel, dan analisis, peran dari Metoda Statistik sangat besar.
4
3) Untuk mencari determinan faktor
Program kesehatan yang dilaksanakan pemerintah melalui Departemen Kesehatan
dimaksudkan untuk meningkatkan derajat kesehatan masyarakat. Keberhasilan suatu
program ditentukan oleh banyak faktor. Faktor yang memberikan pengaruh positif
terhadap keberhasilan program kita sebut sebagai potensi, sedangkan yang mempunyai
pengaruh negatif kita sebut faktor kendala. Faktor potensi dan faktor kendala tersebut
kita kategorikan sebagai determinan faktor. Untuk menentukan determinan faktor dari
suatu program perlu dilakukan studi. Dalam hal ini, peranan metoda statistik, mulai dari
penentuan rancangan, variabel, pengukuran, dan analisis sangat menentukan.
1.4.1 Populasi
Populasi adalah sekumpulan individu, biasanya merupakan kumpulan orang. Walupun
demikian, populasi bisa merupakan kumpulan dari binatang, tumbuhan atau benda, tempat,
dan lainnya. Oleh karena itu, populasi didifinsikan sebagai berikut: populasi adalah
kumpulan dalam jumlah besar individu yang pada waktu tertentu menjadi kelompok
interes. Misalnya, yang menjadi tujuan penelitian adalah untuk mengetahui kadar kolesterol
pada pasien diabetes, maka populainya adalah kadar kolesterol semua pasien diabetes atau
semua pasien diabestes. Contoh yang lain, misalnya akan diteliti tingkat stress mahasiswa
semester I sebelum ujian akhir, maka populasinya adalah tingkat stres semua mahasiswa
semester I atau semua mahasiswa semester I.
1.4.2 Sampel
Sampel didifinisikan sebagai bagian dari suatu populasi. Misalnya yang diteliti adalah
kadar kolesterol pasisen diabetes, maka populasinya adalah semua kadar kolesterol pasien
diabetes. Seandainya jumlah pasien diabetes sangat banyak dan yang diukur kadar
kolesterol darahnya hanya pada 50 pasien diabetes, kita hanya memeriksa sebagain dari
populasi. 50 kadar darah pasien diabetes merupakan sampel dari kadar kolesterol semua
pasien diabetes.
1) Tentukan stating point dengan cara menjatuhkan pensil pada tabel bilangan random.
Misalnya yang menjadi starting point adalah baris ke 3 dan kolom 3 dari tabel bilangan
random. Bilangan random yang menjadi starting point adalah 40311. Karena jumlah
populasi terdiri dari dua digit (99), sedangkan tabel bilangan randomnya terdiri dari 5
5
digit, maka hanya dua digit pertama yang dibaca. Untuk bilangan random pertama
yang terpilih adalah 40311, maka nomor yang dipakai sampel adalah individu nomor
40 (dua gigit pertama).
2) Untuk memilih sampel berikutnya dapat dilakukan dengan memilih bilangan random
yang terletak pada kolom yang sama dengan stating point atau pada baris yang sama
dengan baris starting point atau dipilih secara diagonal dari starting point. Misalnya
yag dipilih adalah bilangan random yang terdapat pada kolom yang sama dengan
starting point, maka yang terpilih adalah bilangan random 93540 dan 05085. Maka
sampel ke dua dan ke tiga adalah individu nomor 93 dan nomor 5.
3) Bila dua digit pertama dari bilangan random yang terpilih lebih besar dari N (99),
maka nomor tersebut tidak memenuhi persyaratan menjadi sampel, karena tidak ada
individu di populasi yang memiliki nomor urut lebih dari N, maka bilangan random
tersebut tidak dipilih atau dilewati.
6
1.5 Variabel dan Data
1.5.1 Variabel
Variabel adalah atribut atau karakteristik atau kejadian yang memiliki nilai yang berbeda.
Bila atribut atau karakteristik atau kejadian tersebut diobservasi atau diukur dan
memberikan nilai hasil pengukuran yang berbeda dari satu orang ke orang lain atau dari
satu tempat ke tempat laian atau dari satu waktu ke waktu yag lain, maka karakteristik, atau
atribut atau kejadian tersebut diberi label variabel. Sebagai contoh misalnya: usia, jenis
kelamin, kadar kolesterol, tekanan darah dan lainnya.
1.5.2 Data
Data adalah fakta yang didapatkan dari hasil wawancara, pengamatan, atau pengukuran
terhadap suatu objek pengamatan dari sutu subjek. Misalnya data pribadi si A: umur 25
tahun, kelamin laki, tinggi badan 170 cm, berat badan 70 kg, golongan darah O, dan
sebagainya. Untuk contoh di atas, objek pengamatan/pengukuran dari subjek A adalah,
umur, kelamin, tinggi badan, berat badan, dan golongan darah. Objek pengamatan ini
disebut VARIABEL. Sedangkan fakta hasil pengamatan/pengukuran terhadap objek
pengamatan seperti umur di dapat 25 tahun, berat badan didapat 70 kg, dan sebagainya
disebut DATA.
3) Data Kualitatif
Objek pengamatan atau variabel yang diamati seperti seks, pekerjaan, sakit atau mati, yang
hasil pengamatannya tidak dapat dikuantifikasikan dan hanya dapat dinilai dari kualitasnya
saja dikelompokkan ke dalam data kualitatif. Misalnya variabel Seks dengan kemungkinan
nilainya laki atau wanita. Hasil pengukuran dari variabel Seks tidak bisa dibagi, dikalikan,
atau dijumlahkan, karena kalau misalnya wanita dibagi 2 akan menjadi tidak berarti. Data
seperti itu dikelompokkan menjadi data KUALITATIF dan variabelnya disebut juga
variabel KUALITATIF.
4) Data kuantitatif
Berbeda dengan data kualitatif, objek pengamatan seperti tinggi, berat, kadar Hb, kadar
gula darah, dan sejenisnya mempunyai nilai pengamatan yang bisa dikuantifisir (dibagi,
dikalikan, dijumlah, diakarkan, dilogkan, dan sebagainya). Hasil pengamatan yang dapat
dikuantifikasikan disebut data KUANTITATIF dan variabelnya disebut juga variabel
KUANTITATIF.
Data kuantitatif dibedakan lagi menjadi dua kelompok, yaitu data kuantitatif KONTINYU
dan DISKRIT. Data kuantitatif kontinyu adalah data kuantitatif dimana batas interval 1 unit
pengukuran dengan 1 unit pengukuran di atasnya adalah sama atau berimpit. Atau data
kuantitatif yang satuan unit pengukurannya mempunyai sub unit pengukuran yang lebih
kecil, misalnya umur dengan satuan pengukuran tahun. Tahun mempunyai ukuran yang
lebih kecil yaitu bulan; bulan mempunyai ukuran yang lebih kecil yaitu hari, dan seterusnya
sampai nano detik. Sedangkan data kuantitatif diskrit, batas satuan ukurannya tidak
berimpit dan tidak mempunyai sub satuan ukuran yang lebih kecil, misalnya jumlah anak
hidup dengan satuan “1 orang”. Tidak ada sub-satuan ukuran yang lebih kecil lagi, seperti
misalnya 0,1 orang anak, dan sebagainya.
8
5) Data Nominal
Data berskala pengukuran NOMINAL termasuk data kualitatif yang nilai pengukurannya
memiliki skala yang tidak ada intervalnya dan tidak dapat diurut. Data kelompok ini
dibedakan lagi menjadi data nominal binomial dan multinomial. Data nominal binomial
artinya data nominal yang nilainya mempunyai hanya dua variasi, seperti seks dengan nilai
laki dan wanita, sakit dengan nilai sakit dan tidak sakit (sehat), dan sebagainya. Sedangkan
data nominal multinomial adalah data nominal yang mempunyai variasi nilai lebih dari dua,
misalnya pekerjaan. Pekerjaan mempunyai variasi seperti petani, buruh, pegawai,
pedagang, ABRI, dan wiraswasta.
6) Data Ordinal
Data berskala ORDINAL termasuk data kualitatif, tidak mempunyai interval yang sama
untuk setiap unit pengukuran, tetapi nilainya dapat diurut. Misalnya status gizi dengan
variasi baik, kurang, buruk. Interval gizi baik, kurang, dan buruk tidak sama, tetapi gizi
baik lebih tinggi dari gizi kurang, demikian pula gizi kurang lebih baik dari gizi buruk.
7) Data Interval
Data INTERVAL tergolong ke dalam data kuantitatif dan mempunyai interval yang tetap
dengan batas yang tegas dan dapat diurut, tetapi tidak mempunyai nilai nol absolut.
Misalnya pengukuran suhu dengan derajat Celcius atau Fahrenheit. Nol derajat Celcius
bukan berarti tidak ada suhu melainkan suhu tersebut adalah suhu dimana air akan
membeku. Tidak memiliki nilai nol absolut artinga nilai dari variabel tersebut bisa di
bawah nol atau negatif, seperti suhu di kutub minus 20º C.
8) Data Ratio
Data ratio juga tergolong ke dalam data kuantitatif, mempunyai interval tetap dan berbatas
tegas serta mempunyai titik Nol-Absolut artinya tidak mungkin hasil pengukuran akan
mendapatkan nilai negatif. Misalnya tinggi, panjang, berat, dimana variabel tersebut tidak
mungkin memiliki hasil pengukuran di bawah nol.
10
Module 2
Describing Data
2.1 Pendahuluan
Pada Modul 1 sudah dijelaskan tentang jenis data menurut skala pengukuran seperti data
dengan skala pengukuran nominal, ordinal, interval, dan ratio. Juga data dapat
dikelompokkan menjadi data kategorikal (nominal dan ordinal) dan data numerik (interval
dan ratio). Data hasil pengamatan atau hasil pengukuran disebut data mentah (raw data),
yang sama sekali belum diorganisir, sehingga tidak mudah untuk dibaca dan dimengerti.
Data mentah tersebut akan menjadi mudah dimengerti bila diorganisir ke dalam bentuk
frekuensi distribusi atau dalam bentuk grafik.
Pada modul ini akan dibahas beberapa metode yang umunya dipakai meringkas dan
mendeskripsikan data kategorikal maupun data numerik. Modul ini akan mencakup topik
sebagai berikut.
• Tabel Distribusi dan Grafik
o Tabel Distribusi
o Grafik Balok, Grafik Lingkaran, Histogram, dan Box-plot
• Bentuk Distribusi Data
o Distribusi Simetris, menceng ke kanan, dan menceng ke kiri
• Statistik Deskriptif
o Tendensi Sentral (mean, median, modus, dan persentil)
o Ukuran sebaran (Range, Inter-quartile Range, dan Standar Deviasi)
11
2.2 Cara Meringkas Data Kategorikal dalam bentuk Tabel Distribusi
dan Grafik
Data kategorikal juga disebut data kualitatif, yang terdiri dari data berskala pengukuran
nominal dan ordinal seperti jenis kelamin, pekerjaan, status gizi, dan lainnya. Data
kategorikal dapat diringkas dalam sebuah tabel distribusi tunggal dan silang serta dalam
grafik balok (bar chart) atau grafik lingkaran (pie chart)
Tabel 2.2.1 Cara persalinan dari 600 kelahiran di Rumah Sakit Maria
Tabel 2.2.1 Cara persalinan dari 600 kelahiran di Rumah Sakit Maria
Dari contoh tabel 2.2.1 di atas, dari 200 sampel yang memilki kebiasaan merokok,
sebanyak 30 orang yang menderita PJK atau kejadian PJK pada perokok adalah 15% (row
percented). Sebaliknya, dari 400 sampel tidak merokok, terdapat 20 penderita PJK atau 5%
dari sampel tidak merokok. Tampak bahwa kejadian PJK pada perokok 3 kali lebih tinggi
dari yang tidak merokok.
Berikut adalah contoh grafik lingkaran dari data pada tabel 2.2.1 di atas.
13
persalinan
normal
forcep
seksio
57
65
478
500
400
300
Count
478
200
100
65 57
0
normal forcep seksio
persalinan
14
2.2.5 Cluster Bar Chart
Cluster bar chart dipakai menyajikan distribusi silang dalam bentuk grafik balok. Kalau
pada contoh pada tabel 2.2.2 di atas akan disajikan kejadian PJK antara perokok dengan
tidak perokok, maka yang menjadi kluster adalah kejadian PJK, sedangkan kebiasaan
merokok menjadi kelompok yang dibandingkan yang ditempatkan pada sumbu X dari
grafik. Berikut adalah contoh Cluster Bar Chart kejadian PJK antara kelompok perokok dan
non perokok.
400
PJK
PJK
Tidak PJK
300
Count
200
380
100
170
30
20
0
Merokok Tidak merokok
perokok
2.3 Cara Meringkas Data Numerik dalam bentuk Tabel Distribusi dan
Grafik
15
Tabel 2.3.1 Paritas Ibu Bersalian di Rumah Sakit Maria
Tabel 2.3.2 Umur Pasien Rawat Jalan Rumah Sakit Maria Tahun 2010
Kelompok Umur Frekuensi Persentase
0-1 185 37,3
1-4 109 22,0
5-9 38 7,7
10-14 31 6,3
15-19 15 3,0
20-24 6 1,2
25-29 5 1,0
30-34 3 0,6
35-39 7 1,4
40-44 21 4,2
45-49 25 5,0
50-54 30 6,0
55- 21 4,2
Total 496 100,0
16
Data disajikan di dalam sebuah distribusi berkelompok bila range suatu data > 15, misalnya
umur dengan variasi data dari 0 – 89 tahun. Data umur diubah menjadi kelompok umur
yang disebut kelas. Misalnya, untuk meringkas data umur dilakukan dengan membuat 14
kelompok umur, yaitu 0-1, 1-4, 5-9, 10-14, 15-19, 20-24, 25-29, 30-34, 35-39, 40-44, 45-
49,50-54, 55-59, 60 ke atas. Setiap kelas memiliki rentangan data yang disebut interval
kelas. Untuk contoh di atas, setiap kelas mempunyai interval 5. Setiap interval kelas
memiliki batas bawah dan batas atas kelas. Seperti contoh di atas, kelompok umur “0-4”, 0
adalah batas bawah kelas dan 4 adalah batas atas kelas. Setiap kelas juga mempunyai nilai
tengah adalah nilai yang terletak di tengah-tengah. Kelas “0-4” terdiri dari nilai 0, 1, 2, 3,
dan 4 dan yang menjadi nilai tengah kelas adalah 2.
2.3.3 Histogram
Histogram merupakan grafik balok dimana setiap balok menyatakan frekuensi dari setiap
nilai data atau kelas untuk distribusi berkelompok. Dalam histogram, tidak ada spasi
diantara balok atau balok yang satu berimpit dengan balok berikutnya. Berikut adalah
contoh sebuah histogram dari data paritas yang disajikan pada tabel 2.3.1 di atas.
250
200
Frequency
150
100
50
0
0.00 2.00 4.00 6.00
paritas
17
2.4 Bentuk Distribusi Data
30
25
20
Frequency
Annotation
15
10
0
0.00 2.00 4.00 6.00 8.00
kolesterol
18
30
25
20
Frequency
15
10
0
0.00 2.00 4.00 6.00 8.00 10.00 12.00
pendapatan
25
20
Frequency
15
10
0
0.00 2.00 4.00 6.00 8.00 10.00 12.00
Kelompok Umur
Grafik 6. Kelompok Umur Kasus Bedah Jantung di Rumah Sakit Maria 2010
19
2.5 Statistik Deskripif
Hampir semua karakteristik makhluk hidup mempunyai nilai atau ukuran yang berbeda
atau bervariasi dari satu individu dengan individu lainnya. Walaupun demikian, nilai atau
ukuran tersebut umumnya memusat pada nilai tertentu. Oleh karena itu, karakteristik dari
sekelompok individu dari suatu sample atau suatu populasi dapat diidentifikasi dari nilai
dimana observasi memusat. Nilai dimana nilai suatu observasi memusat dinamakan nilai
“Tendensi Sentral”.
Ada tiga ukuran nilai tendensi sentral untuk suatu data, yaitu nilai rata-rata (Mean), nilai
tengah (Median), dan nilai tersering (Modus). Ketiga ukuran ini nilainya bisa sama dan bisa
pula tidak sama pada suatu grup data. Ketiga nilai tendensi sentral tersebut sama besarnya
bila data tersebut mempunyai distribusi normal. Sedangkan, nilai tersebut akan berbeda bila
distribusi data tersebut tidak normal atau menceng. Oleh karena itu, penggunaan dari
ukuran-ukuran tersebut tergantung dari bentuk distribusi datanya. Bila distribusi data
normal atau mendekati normal, nilai rata-rata, nilai tengah, dan modus akan sama besarnya
atau mendekati, oleh karena itu, ukuran tendensi sentral yang dipakai adalah nilai rata-rata.
Sebaliknya, bila distribusi data menceng baik menceng ke kanan atau ke kiri, sebaiknya
nilai tengah (Median) yang dipakai untuk menggambarkan tendensi sentral dari data
tersebut. Modus dipakai untuk menunjukkan nilai yang paling sering atau terbanyak ada
pada data tersebut.
Pada buku teks, nilai rata-rata sering disebut “Mean” atau “Average”. Yang dimaksud
dengan nilai rata-rata disini adalah “arithmetic mean” yang diberi simbul x untuk sampel
dan µ untuk populasi. Nilai rata-rata dari suatu observasi dapat dihitung dengan membagi
jumlah semua nilai observasi dengan banyaknya observasi. Penghitungan nilai rata-rata
20
akan dibedakan menjadi dua cara, yaitu cara penghitungan nilai rata-rata untuk data yang
tidak berkelompok dan untuk data berkelompok.
x1 x2 x3 x4 .... ... xn
x + x2 + x3 + x4 + ..... + xn ∑x i
x= 1 = i =1
n n
Contoh:
Suatu sampel survei dilakukan pada 30 ibu hamil untuk mempelajari kadar Hb ibu hamil.
Dari penelitian tersebut didapatkan data sebagai berikut:
Banyaknya observasi :n = 30
Penyajian data seperti umu lebih sering disajikan dalam distribusi frekuensi berkelompok.
Setiap kelompok atau juga disebut kelas mempunyai interval tertentu. Dalam penghitungan
nilai rata-rata dari observasi berkelompok, nilai tengah dari setiap kelas dianggap mewakili
kelas tersebut. Sehingga dalam penghitungan jumlah nilai observasi akan dihitung dari
jumlah perkalian nilai tengah kelas dengan frekuensi dari kelas bersangkutan. Bila nilai
tengah kelas adalah X’i dan frekuenasi kelas adalah fi, maka jumlah nilai observasi sama
dengan ∑fiX’i.
X =
∑ f X'
i i
n
Keterangan:
_
X = nilai rata-rata
fi = frekuenasi kelas interval ke i
X’i = nilai tengah kelas ke i
n = jumlah sampel
Contoh:
Suatu survei untuk menentukan jumlah protein yang dikonsumsi oleh setiap
keluarga. Survei dilakukan pada 400 keluarga. penghitungan nilai rata-rata
konsumsi protein disajikan dalam tabel di bawah ini.
22
Tabel No. 5.3 Penghitungan konsumsi protein keluarga
Nilai tengah juga disebut “Median” dari suatu observasi. Nilai tengah merupakan nilai yang
di tengah-tengah dari seluruh nilai observasi setelah diurut dari yang terkecil ke yang
terbesar atau sebaliknya. Bila jumlah observasi ganjil, maka nilai tengahnya adalah nilai
yang ke (n+1)/2. Misalnya ada 7 observasi, maka nilai observasi yang ke 4 merupakan nilai
tengah. Sedangkan, bila jumlah observasi genap, maka mediannya adalah rata-rata dari dua
nilai observasi yang paling di tengah. Misalnya ada 6 observasi, maka nilai observasi yang
paling di tengah adalah nilai dari observasi ke 3 dan ke 4. Maka nilai tengahnya adalah
(nilai observasi ke 3 + nilai ke 4)/2.
23
Contoh jumlah observasi ganjil:
Ada 7 observasi dan setelah diurut adalah sebagai berikut:
X1 X2 X3 X4 X5 X6 X7
3 5 6 9 11 30 50
X1 X2 X3 X4 X5 X6
3 5 6 9 11 30
Bila data dari suatu observasi sudah dalam bentuk distribusi tunggal, maka penghitungan
nilai tengah dapat dilakukan sebagai berikut:
1. Buat frekuensi kumulatif dari distribusi frekuensi tersebut.
2. Tentukan kelas dimana nilai yang ke n/2 terdistribusi dan nilai kelas tersebut adalah
median
Untuk memudahkan pemahaman dari metode tersebut berikut adalah sebuah contoh
penentuan nilai tengah (median) dari satu data dalam bentuk distribusi.
Contoh:
24
Tabel No. 5.4 Kadar Hb dari 30 sampel ibu hamil di daerah X, 1992
Kadar Hb Frekuensi Frek Kum Relatif Kum
Nilai tengah dari data di atas adalah yang ke 50% atau nilai yang ke (n + 1)/2 atau nilai
yang ke 15,5 atau nilai antara observasi ke 15 dan ke 16. Nilai observasi tersebut
terdistribusi pada Xi = 10. Maka, nilai tengah kadar Hb adalah 10.
Bila data dari suatu observasi sudah dalam bentuk distribusi berkelompok, maka
penghitungan nilai tengah dapat dilakukan sebagai berikut:
1. Buat frekuensi kumulatif dari distribusi frekuensi tersebut
2. Tentukan kelas dimana nilai yang ke n/2 terdistribusi dan
3. Menghitung nilai tengah dengan rumus sebagai berikut:
(n / 2 − fk )
Nilai tengah : Md = L+
fm
Keterangan: x i
Md = nilai tengah (median)
L = nilai batas nyata bawah kelas median
fk = frekuensi kumulatif sebelum kelas median
fm = frekuensi kelas median
i = interval kelas median
n = jumlah observasi
25
Kelas median = kelas dimana median terdistribusi
Contoh :
Tabel No. 5.5 Penghitungan konsumsi protein keluarga
Konsumsi Jumlah keluarga Frekuensi
Protein (fi) kumulatif
(Xi) (f.cum)
15-24 30 30
25-34 40 70
35-44 100 170
Kelas
45-54 110 280 Median
55-64 80 360
65-74 30 390
75-84 10 400
Jumlah 400
1. Menentukan kelas median atau kelas dimana observasi ke (n/2), atau observasi yang ke
200 terdistribusi, yaitu pada kelas (45 – 54)
2. Menentukan batas bawah nyata kelas median: L = 44,5
3. Menentukan frekuensi kelas median : fm = 110
4. Menentukan frekuensi kumulatif dari kelas sebelum kelas median, yaitu : fk = 170
5. Menentukan interval kelas median : i = 10
6. Menghitung median dengan rumus sebagai berikut:
(n / 2 − fk )
Nilai tengah : Md = L+ x i
fm
(400 / 2 − 170)
= 44,5 + x 10
110
= 47,23 gr
26
Modus
Modus adalah nilai observasi yang paling banyak dijumpai. Dalam kata lain, modus dari
suatu observasi adalah nilai dimana hasil observasi paling memusat. Misalnya dari
observasi 5 keluarga didapatkan jumlah anak sebagai berikut: 1, 2, 2, 2, 3. Jadi modus
jumlah anak dari ke 5 keluarga tersebut adalah 2 anak. Bila hasil pengamatan dari ke 5
keluarga tersebut sebagai berikut: 1, 2, 3, 4, 5, maka data tersebut tidak memiliki modus.
Kadang kala, suatu observasi dapat mempunyai lebih dari satu modus, misalnya dua modus
(bimodal), tiga modus (tripelmodal), dan sebagainya. Untuk suatu observasi dimana
distribusinya asimetris, modus dapat dihitung dengan hubungan emperis sebagai berikut:
dimana:
Lm = batas bawah kelas dengan modus
D1 = selisih frekuensi kelas modus dengan kelas sebelumnya
D2 = selisih frekuensi kelas modus dengan kelas sesudahnya
i = interval kelas modus
27
Sehingga besar modus dari data pada tabel 4.3.5 adalah:
D1 x i
Modus = Lm +
D1 + D 2
10 x 10
= 45 +
10 + 30
= 47,5 gr
Pada hasil observasi dimana distribusinya normal, maka nilai tendensi sentral seperti nilai
rata-rata (X), nilai tengah (Md), dan Modus (Mo) adalah sama. Dengan kata lain, bila suatu
observasi berdistribusi normal, maka ketiga nilai tendensi sentralnya berimpit.
Mean
Median
Modus
Gambar 1. Posisi Mean, Median dan Modus pada distribusi normal
Posisi mean, median dan modus pada data yang mempunyai distribusi menceng ke kanan
ataupun ke kiri berbeda dengan data yang berdistribusi normal. Posisi nilai tengah pada
observasi yang berdistribusi menceng adalah selalu diantara nilai rata-rata dan modus. Pada
observasi yang distribusinya menceng ke kanan, maka nilai rata-rata akan lebih besar dari
nilai tengah, nilai tengah akan lebih besar dari modus. Sebaliknya, pada observasi yang
menceng ke kiri, nilai rata-rata lebih kecil dari nilai tengah, dan nilai tengah lebih kecil dari
28
modus. Untuk lebih jelasnya, posisi nilai rata-rata, nilai tengah, dan modus akan
digambarkan dalam bagan di bawah ini.
Mo Md Mean Mean Md Mo
Gambar 2. Posisi Mean, Median, dan Modus pada distribusi menceng ke kiri dan ke kanan
Ada beberapa ukuran sebaran dari suatu kelompok data, yaitu: range, deviasi terhadap rata-
rata (mean deviation), standar deviasi, dan koefisien variasi (coefficient of variation). Di
bawah ini akan diuraikan keempat jenis ukuran sebaran tersebut secara lebih rinci.
29
Range
Range dari suatu hasil observasi adalah jarak antara hasil observasi yang paling kecil
sampai yang paling besar. Besarnya range dari suatu hasil observasi hanya ditentukan oleh
dua nilai observasi yang paling ekstrim, yaitu yang paling kecil dan yang paling besar.
Tidak jarang nilai ekstrim tersebut jauh dari nilai observasi pada umumnya, sehingga range
tidak merupakan ukuran sebaran yang baik. Range dari suatu nilai observasi sangat mudah
dibuat. Misalnya suatu observasi terhadap tekanan darah distole didapatkan data tekanan
darah diastole sebagai berikut:
50, 70, 74, 75, 75, 75, 80, 80, 80, 80, 85, 85, 90, 140
Data tekanan diastole dari 14 sampel di atas mempunyai range antara 50 sampai 140
mmHg.
Untuk data yang disajikan dalam distribusi berkelompok, sangat sulit untuk menentukan
range yang sesungguhnya. Untuk data yang disajikan secara berkelompok, kita hanya dapat
menentukan nilai kelas terendah dan yang tertinggi. Misalnya untuk data konsumsi protein
keluarga di bawah ini mempunyai range antara 15 sampai 75 gr.
30
Mean Deviasi
Mean deviasi adalah rata-rata penyimpangan nilai observasi terhadap nilai rata-ratanya
dengan tidak memperhatikan tanda plus dan minus. Mean deviasi dapat dihitung dengan
rumus sebagai berikut:
Mean deviasi =
∑ Xi − X
n
Ukuran Mean deviasi tidak banyak dipergunakan sebagai ukuran sebaran, karena kurang
dapat dipergunakan untuk tujuan yang lebih luas.
= 11,375
31
Varian (galat) dan Standar Deviasi (simpang baku)
Standar deviasi (SD) merupakan ukuran sebaran yang paling penting. SD mempunyai
hubungan dengan Range dan distribusi frekuensi dari hasil observasi. SD dengan nilai rata-
rata dapat menjelaskan distribusi data secara unik. Misalnya, bila kelompok data
berdistribusi normal, 95% dari data tersebut terdistribusi antara Mean +/- 1,96 SD dan 99%
dari data tersebut terdistribusi antara mean +/- 2,57 SD.
Standar deviasi adalah akar dari jumlah kuadrat beda nilai observasi dengan nilai rata-rata
dibagi dengan derajat bebas (jumlah observasi – 1). Oleh karena itu, SD dapat dihitung
dengan rumus sebagai berikut:
SD =
∑ (Xi − X )
n −1
atau
SD =
∑ Xi − (∑ Xi )
2
/n
(n − 1)
Untuk hasil observasi yang sudah disajikan dalam tabel distribusi, dengan menggunakan
analog dari rumus di atas, SD dapat dihitung dengan rumus sebagai berikut:
SD =
∑ fiXi − (∑ fiXi )
2
/n
(n − 1)
Sedangkan varian (S) dari hasil suatu observasi adalah kuadrat dari SD dari observasi
tersebut, maka dari itu varian dapat dihitung sebagai berikut:
S = SD2
32
Berikut adalah contoh penghitungan SD dan Varian dari konsumsi protein keluarga. Dalam
contoh ini ditunjukan tabel bantu penghitungan SD dan Varian dengan membuat kolom fiXi
dan kolom fiXi2 agar penghitungan SD dengan rumus di atas dapat dikerjakan.
Tabel 2.5.2.3 Tabel bantu penghitungan SD dan varian komsumsi protein keluarga
Xi X’i Fi f i Xi f i Xi 2
15 – 25 20 30 600 12000
25 – 35 30 40 1200 36000
35 – 45 40 100 4000 160000
45 – 55 50 110 5500 275000
55 – 65 60 80 4800 288000
65 – 75 70 30 2100 147000
75 - 85 80 10 800 64000
Jumlah 400 19000 982000
Standar Deviasi:
2
982000 − (19000 ) / 400
SD =
(400 − 1)
= 14,10 gr
Varian:
S = SD2 = 198,75
Koefisien Variasi
Koefisien variasi adalah besarnya standar deviasi (SD) dinyatakan dalam nilai rata-rata.
Koefisien variasi digunakan untuk membandingkan variabilitas beberapa kelompok
observasi dengan unit pengukurannya berbeda. Koefisien variasi dinyatakan dalam persen
dan cara menghitungnya adalah sebagai berikut:
SD
Koefisien variasi (kv) = x100%
rata − rata
33
Contoh:
Dengan melihat besarnya nilai koefisien variasi (KV) dari kedua data yang terdapat pada
tabel di atas ternyata data berat badan lebih bervariasi dibandingkan dengan data tinggi
badan, walaupun range dari data tinggi badan lebih lebar dari range data berat badan. data
tinggi badan mempunyai KV sebesar 4,7% sedangkan data berat badan mempunyai KV
sebesar 15,0%.
2.5.3 Persentil
34
Misalnya dari distribusi data Hb ibu hamil seperti yang disajikan pada Tabel 2.5.3.1 di atas
diketahui bahwa persentil 10 adalah 9 mg/dl. Persentil 10 adalah 9 mg/dl artinya Hb dari
sampel ibu hamil yang ke 10% adalah 9 mg%. Contoh lain, nilai persentil 25 adalah 9
mg/dl, artinya Hb dari sampel yang ke 25% adalah 9 mg/dl. Contoh lain, persentil 50
adalah 10 mg/dl, artinga Hb pasien yang ke 50% adalah 10 mg/dl. Hal penting yang perlu
diketahui bahwa persentil 50 sama dengan median.
Keterangan:
p = persentil ke p%
L = nilai batas nyata bawah kelas persentil ke p%
fk = frekuensi kumulatif sebelum kelas persentil ke p%
fm = frekuensi kumulatif kelas persentil ke p%
i = interval kelas
35
Misalnya akan dihitung nilai persentil 10 dari distribusi data di atas, maka nilai p = 10.
Nilai persentil 10 terletak di kelas 25-34 (kelas persentil ke 10), dengan nilai batas bawah
kelas adalah 25 (L), dengan frekuensi kumulatif di bawah kelas persentil 10% adalah 7,5
(fk), frekuensi kumulatif kelas persentil ke p adalah 17,5 (fm), dan interval kelas adalah 10
(i), maka nilai persentil 10 dapat dihitung sebagai berikut.
( p − fk )
Persentil (10) = L + i
( fm − fk )
(10 − 7,5)
Pesentil (10) = 25 + x10
(17,5 − 7,5)
Persentil (10) = 25 + 2,5 = 27,5
Jadi nilai persentil 10 adalah 27,5 artinya nilai sampel yang ke 10% adalah 27,5.
Dari tabel 2.5.3.2 di atas didapatkan nilai quartil 1 (Q1) = 38 dan quartil 2 (Q2) = 57,5,
maka interquartil Q2 – Q1 = 57,5 – 38 = 19,5
2.5.5 Box-Plot
Box-Plot merupakan grafik distribusi data yang menggambarkan 99% data berada di dalam
batas bawah dan batas atas grafik dan data yang berada di luar batas bawah dan batas atas
grafik disebut outlier. Di dalam grafik ada BOX dimana batas bawah Box adalah nilai Q1
dan batas atas Box adalah nilai Q2. Garis tebal yang ada di dalam Box adalah Median.
Berikut adalah contoh sebuah Box Plot.
36
*3 ................................................ outlier
*21
............... Median
Kota Desa
LATIHAN
1. Dalam suatu experimen untuk mempelajari efek obat “X” terhadap kadar kolesterol
darah pada laki-laki umur 30 tahun atau lebih. Data pengukuran kadar kolesterol dari
30 sampel adalah sebagai berikut:
230 235 200 195 200 230 175 170 290 240 200 230
181 245 150 165 265 210 190 120 145 250 210 215
a. Buatlah tabel frekuensi dengan lebar interval 20 dengan frekuensi relatif dan
frekuensi kumulatif dari data di atas.
b. Buat histogram dari data tersebut di atas.
37
c. Hitung rata-rata, median, modus, range, varian dan SD.
2. Berdasarkan data berikut:
1 2 1 2 4 3 3 4 6 5 8 7 10 2
1 7 12 9 3 6 3
a. Buatlah histogram dengan lebar interval 2.
b. Apakah data di atas berdistribusi menceng atau normal.
c. Hitung mean, median, dan modus. Bagaimana ketiga nilai tersebut bila
dibandingkan.
3. Pada suatu penelitian yang mempelajari pengaruh merokok terhadap metabolis obat
Phenacetin dalam tubuh. Kadar phenacetin dalam serum diukur setelah 2 jam minum
obat pada 10 perokok dan 12 bukan perokok. Hasil pengukuran kadar Phenacetin
dalam darah adalah sebagai berikut:
38
e. Untuk kelompok perokok, mana yang lebih besar mean atau
mediannya?berdasarkan hasil di atas, apa kesimpulan anda tentang pengaruh
merokok terhadap metabolis Phenacetin?
4. Di satu laboratorium sedang dilakukan pengujian tiga jenis alat ukur. Untuk menguji
akurasi ketiga alat tersebut, ketiga alat tersebut akan dipakai mengukur kadar Zat Z di
dalam 10 contoh larutan yang masing-masing mengandung 10 mg/ml Zat X di
dalamnya. Hasil pengukuran dengan ketiga alat tersebut adalah sebagai berikut:
a. Hitung mean dan Standar Deviasi hasil pengukuran ketiga alat di atas.
5. Dari dua tenaga teknisi lab akan dipilih satu dari mereka untuk melakukan penelitian.
untuk menguji yang mana dari mereka yang lebih baik, kedua mereka disuruh
memeriksa kadar Zat X’’ di dalam satu larutan yang kadarnya sudah ditetapkan
5mg/ml. Mereka ditest di dua laboratorium. Hasil test dari kedua teknisi tersebut
adalah sebagai berikut:
39
Modul 3
Some Basic Probability Concepts
3.1 PENDAHULUAN
Bagian ini merupakan bagian yang paling tidak menyenangkan untuk dipelajari karena
sering membuat frustasi terutama pada bagian philosofi dan konsep matematiknya. Dengan
menyadari hal tersebut, maka pada bagian ini akan diuraikan hal-hal yang pragmatis
dengan mengambil contoh peristiwa sehari-hari.
Probabilitas bukan istilah yang asing bagi tenaga kesehatan, misalnya dalam keseharian
kita dengar bahwa kemungkinan sembuh pasien Ca mama sekitar 10%. Petugas kesehatan
masyarakat berkata bahwa perokok kemungkinan menderita CHD 3 kali lebih sering
dibandingkan bukan perokok. Banyak pihak mengekpresikan probablitas sebagai
persentase. Bila x adalah terjadinya kondisi yang diamati misalnya jumlah perokok yang
menderita CHD dan n adalah jumlah perokok yang diamati, maka kemungkinan terjadinya
CHD pada perokok adalah:
x x
P(CHD) = -------- dapat juga dinyatakan dalam persen P(CHD) = ----- x 100 %
n n
Bila A dan B adalah dua peristiwa, maka A dan B dinyatakan sebagai dua peristiwa yang
mutually exclusive bila A dan B tidak pernah terjadi secara bersamaan. Misalnya peristiwa
munculnya salah satu muka dari mata uang atau munculnya salah satu muka dari dadu atau
munculnya outcome suatau penelitian dimana kemungkinan outcomenya adalah mati atau
hidup.
40
Bila E1, E2, E3, ...Ei adalah kemungkinan outcome dari satu percobaan dan E1, E2, E3,
..Ei adalah mutually exclusive events, maka:
Complementary Events
Kemungkinan outcome suatu percobaan disebut komplementer bila jumlah probabilitas dari
setiap outcome = 1. Misalnya outcome suatu percobaan adalah sembuh (E1) atau tidak
sembuah (E2). E1 dan E2 disebut dua kejadian yang komplementer, maka probablitas
munculnya kejadian E1 + probabilitas munculnya kejadian E2 sama dengan 1.
P(E1) + P(E2) = 1.
Pada umumnya, penjelasan tentang probabilitas diberikan dengan contoh melempar dadu
yang berorientasi kepada Teori Probabilitas, tetapi penjelasan kami akan menggunakan
contoh biomedis. Tabel 3.1 di bawah ini menggambarkan kadar cholesterol darah dari 1047
orang dewasa normal.
41
Tabel No. 3.1 Distribusi kadar cholesterol darah pada laki-laki normal umur 40 – 59 tahun
Bila dari 1046 laki normal dipilih satu orang secara random, berapakah besar kemungkinan
(probabilitas) untuk mendapatkan orang dengan kadar cholesterol darah antara (160 – 179)
mg/100 ml. Dari data di atas terdapat sebanyak 37 orang yang mempunyai kadar
cholesterol darah pada rentangan tersebut dari 1047. Maka probabilitas mendapatkan
sampel secara random yang mempunyai kadar kolesterol antara 160-179 adalah:
Mari kita lihat problem yang lain, misalnya kita ingin mengetahui berapa probabilitas
mendapatkan orang laki-laki yang mempunyai kadar cholesterol lebih rendah dari 200
mg/100 ml dari satu sampel yang dipilih secara random dari populasi. Dengan cara yang
sama, kita mendapatkan sebanyak 15,8 % (lihat % kumulatif untuk kadar cholesterol lebih
kecil dari 200 mg/100 ml).
42
3.3 ADDITONAL RULE
Misalnya kita ingin mengetahui probabilitas seorang sampel yang dipilih secara random
dari 1047 orang laki-laki normal memiliki kadar cholesterol lebih rendah dari 200 atau
lebih besar dari 300 mg/100 ml. Kedua peristiwa tadi (kadar cholesterol < 200 dan > 300)
merupakan peristiwa yang mutually exclusive (tidak mungkin terjadi bersamaan pada
seseorang). Oleh karena itu, probabilitas memiliki cholesterol < 200 atau > 300 merupakan
penjumlahan probabilitas memiliki cholesterol < 200 dan probabilitas memiliki cholesterol
> 300. Bila Probabilitas P (A or B) adalah probabilitas memiliki cholesterol < 200 atau >
300, P (A) adalah probabilitas memiliki cholesterol < 200 dan P (B) adalah probabilitas
memiliki cholesterol > 300, maka dengan menggunakan data dalam Tabel 3.1:
P (A or B) = P (A) + P (B)
Additional Rule
Probabilitas munculnya “A” atau “B” dimana A dan B adalah peristiwa yang mutually
exclusive sama dengan penjumlahan dari Probabilitas A ditambah Probabilitas B.
P (A or B) = P (A) + P (B)
Pada uraian di atas telah dibicarakan cara menghitung probabilitas sampel random terhadap
keseluruhan sampel. Pada kenyataan sehari-hari kita dihadapkan kepada keinginan untuk
mengetahui probabilitas sampel dengan kondisi tertentu, misalnya ingin mengetahui
probabilitas penderita diare yang minum Es Mambo. Jadi dalam hal ini kita akan
menghitung probabilitas penderita diare minum dari yang minum es mambo. Probabilitas
ini lazim dikenal dengan conditional probability. Bila kejadian minum es mambo diberi
43
simbol B dan kejadian diare diberi simbol A, maka probabilitas kondisionalnya diberi
simbol P(B|A) yang besarnya dapat dihitung sebagai berikut:
Keterangan:
Contoh:
Untuk mempelajari sumber penularan suatu wabah diare di Kota Denpasar tahun 1980
dilakukan studi penelusuran makanan (food hystorical study) dengan rancangan Case-
Control. Data yang didapat adalah sebagai berikut:
P (A) = 30/60
P (A dan B) = 25/60
P (B|A) = P (A dan B) / P (A)
= (25/60) / (30/60)
= 25/30
= 0,83
44
3.5 MULTIFLICATION RULE
A dan B adalah dua kejadian yang saling berkaitan (dependence events). Besarnya
kemungkinan kedua peristiwa A dan B terjadi secara bersamaan yang disimbulkan dengan
P(A dan B) adalah sama dengan kemungkinan terjadinya B pada kondisi dimana A terjadi,
yaitu: P(B|A) dikalikan dengan kemungkinan kejadian A, yaitu: P( A). Dengan contoh di
atas, kemungkinan terjadinya Adan B secara bersamaan dapat dihitung sebagai berikut.
Bila peristiwa B tidak berkaitan dengan peristiwa A, maka peristiwa A dan B saling tidak
tergantung atau “independence events”, maka P (B|A) = P (B) atau sebaliknya P (A|B) = P
(A). Maka oleh karena itu, probabilitas terjadinya peristiwa A dan B bersamaan dapat
dihitung sebagai berikut:
Jadi,
Contoh:
Kalau kejadian diare (A) tidak berkaitan dengan minum es mambo (B), berapa
kemungkinan seorang sampel yang dipilih secara random mimum es mambo (B) dan juga
menderita diare (A).
Dari data pada Tabel 3.3, didapatkan probabilitas menderita diare (kasus) atau P(A) = 30/60
dan probabilitas minum esmambo (B) atau P(B) = 32/60, maka probabilitas sampel minum
esmambo dan juga diare adalah sbb:
45
P (A dan B) = P(A) P(B)
= 30/60 x 32/60
= 0,267
Bayes’ Rule dapat dipakai untuk menghitung kemungkinan terjadinya suatu peristiwa dari
suatu kondisi lain yang sudah terjadi. Misalnya untuk mengetahui kemungkinan orang yang
tes kulit tuberkulin positif akan menderita TBC atau kemungkinan terjadi kanker paru pada
perokok berat, dan sebagainya.
Kalau D simbol sakit dan D’ simbol tidak sakit serta T simbul adanya gejala dan S’ tanpa
gejala, maka dari data di atas diketahui:
Yang mau dicari adalah P (D|T), yaitu kemungkinan dari orang yang memiliki gejala T
menderita penyakit D?
46
sehingga : P(D dan T) = P(D|T) P(T)
Juga : P(T dan D) = P(T|D) P(D)
Oleh karena P(D dan T) dan P(T dan D) adalah peristiwa yang sama, maka:
P(D|T) P(T) = P(T|D) P(D)
atau : P(D|T) = {P(T|D) P(D)}/P(T)
Dari data yang diberikan di atas, P(T|D) dan P(D) diketahui, sedangkan P(T) tidak
diketahui.
Mereka yang memiliki gejala bisa sakit dan bisa tidak sakit, jadi bisa kita kategorikan
menjadi T dan D atau T dan D’. Kedua peristiwa tersebut adalah mutually exclusive, oleh
karena itu P(T) dapat dihitung sebagai berikut:
P(T) = P(T dan D) P(T dan D’)
Oleh karena;
P(T dan D) = P(T|D) P(D) dan
P(T dan D’) = P(T|D’) P(D’) maka,
P(T) = P (T|D) P(D) + P(T|D’) P(D’)
Jadi,
P (D|T)= P(T|D) P(D) / P(T)
= P(T|D) P(D) / {P(T|D) P(D) + P(T|D’) P(D’)
= (0,80 x 0,05)/{(0,80 x 0,05) + (0,10 x 0,95)}
= 0,30
Bayes’ role didasarkan kepada konsep bahwa kemungkinan terjadinya suatu peristiwa
tergantung dari beberapa peristiwa lainnya. Dari contoh di atas, kita bisa memperkirakan
berapa kemungkinan orang dengan gejala tertentu menderita penyakit tertentu dari
informasi kemungkinan kejadian sakit P(D) dan kemungkinan orang yang sakit memiliki
gejala T tersebut P(T|D) dan yang tidak sakit ada gejala atau p(T|D’).
47
3.7 SENSITIVITAS, SPESIFISITAS, DAN NILAI DUGA POSITIF & NEGATIF
Konsep probabilitas dan Baye’s Theorem banyak diaplikasikan dalam uji diagnostik dan
screening. Hasil uji diagnostik atau creening dipakai meningkatkan kemampuan klinikus
mendiagnosis sutau penyakit berdasarkan hasil test atau berdasarkan gejala yang ada. Pada
bagian ini akan dibahas sensitivitas, spesifisitas, nilai duga positif, nilai duga negatif, nilai
duga positif palsu dan nilai duga negatif palsu.
Pada uji diagnostik atau screening setiap sampel akan diperiksa dengan alat
screening/diagnostik dan juga diperiksa dengan gold standar. Hasil dari kedua pemeriksaan
tersebut disilang, sehingga akan didapatkan tabel distribusi sebagai berikut.
Ada beberapa ukuran yang sering dipakai dalam uji diagnostik, yaitu:
1. Sensitivitas
Sensitivitas merupakan probabilitas sampel yang sakit menunjukan hasil test positif
atau P(T|D).
Dengan menggunakan data pada tabel distribusi di atas dapat dihitung nilai sensitivitas
alat test sbb:
P(T|D) = P(T dan D)/P(D) = a/n / {(a+c)/n} = a/(a+c)
2. Spesifisitas
Spesifisitas adalah probabilitas orang yang tidak sakit memiliki hasil test negatif atau
P(T’|D’)
48
Dengan menggunakan tabel distribusi di atas, spesifisitas dapat dihitung sbb:
P(T’|D’) = P(T’ dan D’) / P(D’) = d/n / {(b+d)/n} = d/(b+d)
49
6. Nilai negatif palsu
Nilai negatif palsu (false negative) adalah probabilitas orang dengan test negatif tetapi
menderita sakit atau P(D|T’)
Nilai positif palsu dapat dihitung conditional probability dan baye’s theorem sbb:
P(D|T’) = P(T’|D) P(D) / P(T’)
P(D|T’) = {c/(a+c) x (a+c)/n}/{(c+d)/n}= (c/n)/{(c+d)/n} = c/(c+d)
LATIHAN:
1. Misalnya anda adalah salah satu dari 12 voluntir untuk percobaan efek obat “X”. Ada
tiga kelompok perlakuan, yaitu obat baru, obat standar, dan placebo. kelompok yang
mendapat obat baru sebanyak 4 orang, obat standar 4 orang dan placebo juga 4 orang.
a. Berapa kemungkinan anda mendapatkan obat baru
b. Berapa kemungkinan anda mendapatkan obat (baru atau standar).
2. Kemungkinan kegagalan alat alarm pada intensive care bed adalah 0,001. untuk
amannya, pada intensive bed dipasang lagi satu duplikat alat alarm. Berapa
kemungkinan gagalnya alat alarm pada intensive bed tersebut sekarang.
50
4. Suatu test “X” positif pada 95% kasus penyakit “Y”, tetapi juga 3% kasus bukan
penyakit “Y” positif. Kejadian penyakit “Y” pada populasi sebesar 1%. Berapa
probabilitas seseorang yang dipilih secara random dari populasi tersebut mempunyai
test positif dan juga menderita penyakit “Y”? Hitung pula sensitivitas, spesifitas, dan
nilai duga (predictive value) dari tset “X”.
Solusi no 4.
1. P(T dan D) ?
2. Sensitiftas P(T|D)?
o P(T|D) = 0,95
3. Spesifisitas P(T’|D’)?
51
Modul 4
The Teoritical Distributions
4.1 PENDAHULUAN
Pada modul sebelumnya telah dibahas beberapa konsep probabilitas dan cara
menghitungnya. Pada modul ini akan dibahas tentang distribusi probabilitas atau juga
disebut distribusi teoritis yang meliputi distrubusi binomial, distribusi poisson, distribusi
normal, dan aplikasi dari distribusi normal.
Distribusi teroritis dapat diekpresikan dalam bentuk tabel, grafik atau formula. Distribusi
teoritis adalah distribusi hipotetik dari probabilitas munculnya suatu nilai dari variabel
random menurut teori atau formula tertentu. Misalnya distribusi Binomial adalah distribusi
probabilitas berdasarkan teori Bernouli, disribusi normal adalah ditribusi probabilitas
berdasarkan formula yang dibuat dari Gaus, dan distribusi Poisson adalah distribusi
berdasarkan formula dari Poisson.
Distribusi binomial adalah satu distribusi probabilitas munculnya x sukses dari suatu
peristiwa yang hanya memiliki dua kategori (binomial) dari n sampel (kecil). Distribusi
Binomial dikembangkan oleh James Bernoulli (1654-1705) yang dihasilkan dari hasil
penelitian yang dikenal dengan nama Bernoulli trial. Bila suatu trial menghasilkan luaran
(out-come) dengan dua kemungkinan yang mutually excusive (binomial), seperti misalnya
jenis kelamin bayi yang lahir, dimana jenis kelamin hanya terdapat dua kemungkinan yaitu
laki atau perempuan, maka trial tersebut dinamai Bernoulli Trial.
52
Dalam Bernoulli trial, probabilitas munculnya out-come yang diharapkan misalnya
probabilitas bayi lahir laki-laki disebut p dan probabilitas bayi lahir perempuan disebut q,
maka q = 1 – p.
Sebagai contoh, misalnya dalam sebuah penelitian dengan jumlah sampel n = 5 akan
dipelajari berapa probabilitas x (x = 0, 1,2 ...5) bayi laki lahir dari 5 sampel tersebut. Dari
data sensus penduduk diketahui bahwa probabilitas bayi laki lahir p = 0,51 dan probabilitas
bayi perempuan lahir q = 0,49.
Penentuan probabilitas lahirnya x bayi dengan jenis kelamin laki dari n sampel ditentukan
dengan rumus sbb:
Koefisien Bernoulli
Koefisien Bernoulli menyatakan jumlah kombinasi yang dapat dibuat dari n objek dengan x
jumlah objek dengan outcome yang diharapkan. Misalnya outcome yang diharapkan adalah
bayi laki dan x = jumlah bayi laki yang lahir serta n adalah jumlah sampel. Berapa
kombinasi yang dapat dibuat dari sampel n = 5 dan dari sampel tersebut terdapat bayi laki x
= 3. Koefisien Bernoulli untuk x sukses dari n sampel dihitung dengan formula sbb:
n!
n Cx =
x!(n − x)!
5! 5 x 4 x3 x 2 x1 120
5 C3 = = = = 10
3!(5 − 3)! (3 x 2 x1)(2 x1) 12
53
Keterangan: nCx = koefisien Bernoulli
n = jumlah sampel
x = jumlah outcome yang diharapkan
Penghitungan Probabilitas
Dari contoh di atas diketahui probabilitas bayi laki lahir p = 0,51 dan bayi peremuan q =
0,49, maka probabilitas julah bayi laki lahir 0, 1, 2, 3, 4, dan 5 dari jumlah sampel n = 5
dapat dihitung sebagai berikut.
1. Dari data survei nasional diketahui bahwa 30% anak memiliki kekebalan terhadap
Influensa. Bila dilakukan survei terhadap 10 anak SD di Denpasar yang dipilih secara
random, berapa probabilitas 4 dari 10 anak memiliki kekebalan terhadap influensa?
Hasil analisis menunjukan bahwa sekitar 20,01% kemungkinan dari 10 sampel dengan
4 orang memiliki kekebalan terhadap influensa.
54
2. Dari data populasi diketahui bahwa sekitar 10% penduduk mengalami kebutaan. Bila
sebanyak 25 orang sampel penduduk dipilih secara random, berapa kemungkinan dari
mereka 5 atau kurang dari 5 menderita kebutaan atau P(x≤5).
Untuk menghitung P(x≤5) dapat digunakan additional rule yaitu P(x≤5) = P(x=0) +
P(x=1) + P(x=2) + P(x=3) + P(x=4) + P(x=5), sbb:
Distribusi Poisson adalah distribusi probabilitas waktu atau tempat dengan x kejadian
tertentu, dimana x adalah variabel diskret (misalnya jumlah kasus bunuh diri dalam
sebulan). Misalnya ingin diketahui berapa probabilitas bila dipilih bulan secara random
dengan jumlah kasus buhuh diri sebanyak 3. Pada contoh ini, bulan merupakan kesatuan
waktu yang diteliti. Contoh lain, berapa kemungkinan satu lapang pandang yang dipilih
secara acak ditemukan 10 koloni bakteri. Pada contoh ke dua ini, lapangan pandang sebagai
satuan tempat yang diteliti.
Distribusi Poisson dikembangkan oleh Simeon Denis Pisson (1781-1840) seorang ahli
matematik kebangsaan Prancis. Distribusi Poisson banyak dipakai sebagai model
probabilitas di bidang ilmu biologi dan kedokteran. Sebagi contoh misalnya akan diteliti
berapa kemungkinan “bulan” dengan jumlah kasus bunuh diri 3 orang, bila salah satu bulan
dipilih secara random dari 12 bulan yang ada.
55
Apabila x adalah jumlah kasus yang terjadi dalam interval waktu tertentu misalnya jumlah
kasus bunuh diri dalam satu bulan dan probabilitas waktu dengan x kejadian ditentukan
dengan rumus berikut.
e −λ λx
f ( x) = dimana x = 0, 1, 2, .......
x!
Keterangan: x = jumlah kasus dalam interval waktu/tempat
e = konstan yang besarnya 2,7183
λ = rerata kejadian dalam interval waktu/tempat
f(x)= probabilitas interval waktu/tempat dengan munculnya x kasus
Sebagai contoh, dalam penelitian bunuh diri diasumsikan bahwa jumlah kasus bunuh diri
perbulan mengikuti distribusi Poisson dengan rerata jumlah kasus perbulan λ = 2,75.
Berapa probabilitas bulan yang dipilih scara random dengan jumlah kasus bunuh diri
sebanyak x = 3 orang.
Jadi probabilitas bulan yang dipilih secara random dimana pada bulan tersebut terdapat 3
kasus bunuh diri adalah 0,2216 atau 22,16%.
Misalnya dari data penelitian di atas ingin diketahui probabilitas bulan dengan jumlah
kasus bunuh diri 3 atau 4 orang. Penghitung probabilitas pada kasus ini dihitung dengan
menggunakan additional rule dimana P(x=3 or x=4) = P(x=3) + P(x=4), sehingga
penghitungan probabilitasnya adalah sebagai berikut.
56
4.4 DISTRIBUSI NORMAL
Distribusi probabilitas yang paling penting adalah distribusi normal. Formula distribusi
normal dibuat oleh Abraham De Moivre (1667-1754), kemudian Carl Friedrich Gauss
(1977-1855) dan distribusi normal sering disebut distribusi Gauss. Data kontinyu atau
interval seperti umur, tinggi badan, berat badan, kadar gula darah dan lainnya cenderung
berdistribusi normal.
1 2
/ 2σ 2
f ( x) = e −( x − µ ) dimana - ∞ < x < ∞
2πσ
3. Total area di bawah curve distribusi normal dan di atas sumbu X = 100% dan 50%
dari area di bawah curve distribusi normal berada di bawah mean dan 50% lainnya
di atas mean.
4. Luas area di bawah curve distribusi normal yang terletak ± 1 SD dari Mean = 68%
dari luas curve keseluruhan; ± 1,96 SD dari Mean = 95% dari luas curve keseluruha,
dan ± 3 SD dari Mean = 99,7% dari luas curve keseluruhan.
57
Mean
-1SD 68% + 1SD
- 1,96SD 95% +1,96SD
- 3SD 99,6% + 3SD
Tinggi dan lebar kaki dari distribusi normal ditentukan oleh mean dan SD. Nilai rerata akan
menentukan letak cuve distribusi normal pada sumbu X, sedangkan nilai SD akan
menentukan lebar kaki dan tinggi puncak curve, dimana makin tinggi SD makin lebar kaki
dan makin rendah puncak curve, sebagai contoh di bawah ini.
σ1
σ1 < σ2 < σ3
σ2
σ3
Mean
58
Distribusi Normal Standar
Pada uraian sebelumnya telah diuraikan bahwa dilihat dari karakteristik distribusi normal,
sebenarnya terdapat satu keluarga distribusi normal yang dibedakan oleh nilai rerata dan
nilai SD dari datanya. Salah satu dari anggota distribusi normal yang penting adalah
distribsi normal standar (standard normal distribution) adalah distribusi normal dari data
standar (standardized data) dan bukan dari raw data. Data standar juga disebut Z skor dari
data. Nilai standar (Zskor) mempunyai nilai rerata nol dan SD = 1. Nilai standar (Zskor)
dari satu data dihitung berdasarkan rumus Z = (X – Mean)/SD. Karena rerata nol dan SD =
1, maka formula dari distribusi normal standar adalah sbb:
1 2
f ( z) = e −z /2
dimana - ∞ < z < ∞
2π
Nilai standar (z) dari suatu data selalu mempunyai mean = 0 dan SD = 1, maka berapapun
mean dan SD suatu data, akan ada hanya satu bentuk distribusi normal standar dari data
tersebut karena mean selalau sama dengan nol dan SD = 1.
σ1=1
Mean = 0
59
Tabel distribusi normal
Tabel Distribusi Normal atau juga disebut Normal Curve Area atau Tabel Z adalah tabel
yang berisikan luas area di bawah curve normal untuk nilai Z tertentu. Pada kolom pertama
dari Tabel berisikan nilai Z dengan gigit pertama di belakang koma, sedangkan pada baris
pertama terdapat digit ke dua di belakang koma dari nilai Z. Sel pada baris ke dua dan
seterusnya berisikan luas area di bawah curve normal sampai nilai Z tertentu. Berikut
adalah potongan dari Tabel Z.
Z
z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.80 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
-3.70 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
-3.60 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0002 .0002
-3.50 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002
-3.40 .0002 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003
-3.30 .0003 .0004 .0004 .0004 .0004 .0004 .0004 .0005 .0005 .0005
-3.20 .0005 .0005 .0005 .0006 .0006 .0006 .0006 .0006 .0007 .0007
-3.10 .0007 .0007 .0008 .0008 .0008 .0008 .0009 .0009 .0009 .0010
-3.00 .0010 .0010 .0011 .0011 .0011 .0012 .0012 .0013 .0013 .0013
-2.90 .0014 .0014 .0015 .0015 .0016 .0016 .0017 .0018 .0018 .0019
Misalnya akan ditentukan berapa luas area di bawah kurve normal untuk nilai Z ≤ -3,15.
Maka untuk itu, carilah sel dalam tabel Z untuk nilai Z = - 3,15 dan angka yang terdapat
pada sel tersebut sama dengan luas area di bawah kuve untuk nilai Z ≤ - 3,15.
Caranya: cari nilai Z = - 3.1 pada kolom Z dan cari nilai Z = 0,05 pada baris pertama,
kemudian dari garis horizontal dari nilai Z = -3.10 dan garis vertikal ke bawah dari nilai Z
= 0,05 (pada baris pertama tabel Z), sel dari tabel yang menjadi persilangan kedua garis
menyatakan luas area di bawah kurve untuk nilai Z ≤ - 3,15. Pada contoh kasus ini
60
didapatkan luar area di bawah kurve normal dengan nulai Z ≤ - 3,15 = 0,0008 atau sebesar
0,08%.
Kasus 1.
Pada penelitian penyakit Alzeimer didapatkan bahwa berat otak penderita Alzeimer
berdistribusi normal dengan rerata 1076,80 gr dan SD = 105,76 gr. Berapa probabilitas
sampel dengan berat otak kurang dari 800 gr dengan ilustari seperti bagan di bawah ini.
σ=105,76 gr
P?
800 1076,80
Langkah penyelesaian:
Kasus 2.
Diketahui bahwa tinggi badan di satu populasi berdistribusi normal dengan nilai rerata 175
cm dengan SD = 10 cm. Ingin diketahui berapa probabilitas seorang dari populasi tersebut
yang dipilih secara random tingginya antara 160 – 180 cm, seperti bagan di bawah ini.
61
σ=10 cm
P?
Langkah penyelesaian:
1. Hitung nilai Z untuk tinggi 160 cm
Z(x=160) = (X-mean)/SD = (160 – 170)/10 = -1,00
2. Cari luas are di bawah curve untuk Z ≤ - 1,00 à = 0,1587
3. Hitung nilai Z untuk tinggi 180 cm
Z(x=180) = (X-mean)/SD = (180 – 170)/10 = +1,00
4. Cari luas area di bawah curve untuk Z ≤ + 1 = 0,8413
5. Hitung luas area di bawah kurve antara Z≤ -1 sampai Z≤ + 1= 0,8413 – 0,1587 =
0,6826 atau sebesar 68,26%.
Kasus 3
Kadar gula darah populasi tertetu diketahui berdistribusi normal dengan nilai rerata 100
g/dl dengan SD = 5 g/dl. Ingin diketahui berapa retangan kadar gula dari 95% populassi
disekitar rerata, seperti bagan di bawah ini.
σ=5 g/dl
95%
62
Langkah penyelesaian:
P1 = (1 – 0,95)/2 = 0,025
3. Hitung nilai X1
Z(x1) = (X1-Mean)/SD
6. Hitung nilai X2
Z(x2) = (X2-Mean)/SD
Jadi 95% dari populasi mempunyai kadar gula darah antara 90,2 g/dl s/d 109,8 g/dl.
63
Modul 5
Distribusi Sampel
5.1 Pendahuluan
Setelah memahami pengertian tentang populasi, sampel, cara pengambilan sampel, dan
penentuan besarnya sampel, maka selanjutnya perlu dipahami tentang pengertian distribusi
sampel sebagai dasar untuk memahami konsep statistik inferensial. Yang dimaksud dengan
distribusi sampel (sampling distribution) adalah distribusi rerata atau proporsi semua
kemungkinan sampel dari suatu populasi.
Ada beberapa distribusi sampel yang perlu diketahui agar dapat memahami lebih jelas
konsep statistik inferensial, antara lain 1) distribusi nilai rata-rata sampel (distribution of
the sample mean, 2) distribusi perbedaan rata-rata dua sampel (distribution of the difference
between two sample means, 3) distribusi proporsi sample (distribution of the sample
proportion), dan 4) distribusi perbedaan proporsi dari dua sample (distribution of the
difference between two sample proportions).
Misalnya akan diteliti jumlah anak yang dimiliki populasi daerah X. Jumlah populasi KK di
daerah X adalah 5 KK, yaitu A, B, C, D, dan E. Jumlah anak dari ke 5 populasi KK tersebut
adalah 1, 2, 3, 4, dan 5. Rerata jumlah anak populasi µ = 3 orang.
Apabila penelitian tentang jumlah anak di populasi tersebut menggunakan sampel dengan
jumlah sampel n = 2, maka kemungkinan sampel yang bisa dibuat dari populasi tersebut
adalah sebanyak 10 sampel sbb:
64
Sampel Data Jumlah Anak Rerata
1. AB 1 dan 2 1,5
2. AC 1 dan 3 2,0
3. AD 1 dan 4 2,5
4. AE 1 dan 5 3,00
5. BC 2 dan 3 2,5
6. BD 2 dan 4 3,0
7. BE 2 dan 5 3,5
8. CD 3 dan 4 3,5
9. CE 3 dan 5 4,0
10. DE 4 dan 5 4,5
Total = 30,0
Rerata = 3,0
Distribusi rerata dari sampel di atas disebut distribusi rerata sampel atau sering disebut
dengan distribusi sampel.
1. Rerata dari nilai rerata sampel akan sama dengan rerata populasi
2. Standar deviasi dari rerata sampel disebut standar error of mean yang disingkat
dengan SE of mean. Secara umum, besarnya SE = SD/√n.
3. Distribusi sampel akan mengikuti distribusi data. Bila data berdistribusi normal,
maka distribusi sampel juga berdistribusi normal. Sebaliknya, bila data tidak
berdistribusi normal, maka distribusi sampel juga akan berdistribusi tidak normal,
kecuali bila jumlah sampelnya cukup besar. Kalau jumlah sampel cukup besar,
walaupun data tidak berdistribusi normal, maka distribusi sampelnya akan
berdistribus normal (Central Limit Theorem).
65
4. BDengan karakteristik tersebut, rerata populasi dapat diestimasi dari rerata sampel.
Bila dari n sampel didapatkan rerata sampel adalah X dengan simpang baku SD,
maka 95% kemungkinan rerata popuasi terletak antara X ± 1,96 xSD / n .
Contoh:
Suatu survei penentuan umur kawin ibu dilakukan pada 200 sampel ibu rumah tangga di
Bali. Dari sampel tersebut didapatkan rata-rata umur kawin ibu adalah 18 th dengan standar
deviasi (SD) sama dengan 2 tahun. Dengan berdasarkan distribusi rerata sampel, kita dapat
memperkirakan rata-rata populasi yang dimaksud hanya dari hasil satu survei.
Msalnya dari hasil survei di atas dapat statistik sampel sebagai berikut:
X = 18
SE = SD / n = 2 / 200 = 0,14
maka 95% kemungkinan rerata populasi terletak antara 18 – 1,96 x 0,14 sampai 18 + 1,96 x
0,14 atau antara 17,72 – 18,27 th, seperti gambar di bawah ini.
95%
17,72 18,27
Bagan 5.1 Nilai batas bawah dan batas atas 95% kemungkinan rerata populasi
66
5.3 DISTRIBUSI PERBEDAAN RATA-RATA DUA SAMPEL
Misalnya suatu survei dengan tujuan untuk mengetahui perbedaan umur kawin antara
wanita dan laki-laki, maka dalam penelitian ini terdapat dua kelompok populasi, yaitu
populasi wanita (ibu) dan populasi laki-laki (bapak). Bila dari dua kelompok populasi ini
diambil sampel masing-masing n1 dan n2, maka dari kedua sampel tersebut akan dapat
dihitung rata-rata umur kawin pada sampel ibu X 1 dengan standar deviasi (SD1) dan pada
sampel bapak X 2 dan (SD2). Dari kedua statistik sampel tersebut bisa dihitung perbedaan
rata-ratanya X beda . Bila survei ini dilakukan berkali-kali pada kedua populasi tersebut,
maka kita akan dapatkan juga banyak beda rata-rata sampel. Distribusi dari beda rata-rata
sampel tersebut dinamakan distribusi perbedaan rata-rata dua sampel.
Distribusi perbedaan rata-rata dua sampel mempunyai karakteristik mirip dengan distribusi
normal dengan perkiraan nilai rata-rata (µ) sama dengan beda rata-rata dari kedua sampel
2 2
X beda dengan standar error perbedaan SE = √(SD1 /n1 + SD2 /n2). Bila pengambilan
sampel diulang sebanyak tak berhingga, maka dapat diperkirakan 95% dari sampel tadi
akan mempunyai rata-rata perbedaan antara ( X beda – 1,96 SE) sampai ( X beda + 1,96 SE).
Contoh:
Bila jumlah sampel ibu dan bapak masing-masing 120 orang dan rata-rata umur kawin ibu
( X 1) = 18 th dengan SD1 = 2 tahun dan rata-rata umur kawin bapak ( X 2 ) = 22 th dengan
SD2 = 3 tahun, maka selanjutnya dapat dihitung
1. Rata-rata perbedaan ( X b ) = X 1 − X 2 = 18 – 22 = - 4
2. Standar error beda (SEb) = √(SD12/n1 + SD22/n2)
= √(4/120 + 9/120)
= 0,329
3. Estimate beda rata-rata kedua kelompok populasi pada tingkat kemaknaan 95%
adalah antara – 4,64 sampai – 3,36
67
95%
-4,64 -3,36
Bagan 5.1 Nilai batas bawah dan batas atas 95% perbedaan rerata dua populasi
Apabila peristiwa yang diteliti adalah terjadinya peristiwa x, dimana x adalah variabel
nominal seperti sakit, mati, pekerjaan,dll, maka staristik yang dipakai menggambarka
besaran maslah tersebut adalah angka kejadian dalam persen atau disebut angka proporsi.
Misalnya akan diteliti proporsi bayi yang menderita diare. Kalau sampel yang disurvei
adalah n dan yang megalami diare adalah k, maka kejadian diare pada sampel bayi (p) = k/n
x 100% dengan standar deviasi (SD) = √p(1-p). Seandainya survei tersebut dilakukan
berkali-kali pada populasi tersebut, maka akan didapatkan banyak nilai proporsi (p).
Distribusi dari nilai p tersebut dinamakan distribusi proporsi sampel.
68
Dari contoh di atas didapatkan:
Proporsi bayi pada sampel :p = 0,012 dan
Standar Error : SE = 0,003
maka 95% proporsi diare pada populasi bayi antara (0,012 – 1,96x0,003) sampai (0,012 +
1,96x0,003) atau antara 0,0064 sampai 0,0178.
95%
0,0064 0,0178
Bagan 5.1 Nilai batas bawah dan batas atas 95% proporsi diare di populasi
Seandainya dalam suatu penelitian aka dipelajari perbedaan kejadian diare pada bayi di
kota dan di desa, maka kita harus membandingkan dua proporsi diare pada bayi antara
proporsi diare pada sampel bayi di kota dengan proporsi diare pada sampel bayi di desa.
Kalu proporsi diare pada bayi di kota adalah P1 dan proporsi diare pada bayi di desa P2,
maka perbedaan proporsi dari kedua sampel (Pb) = P1- P2 dengan standar error (SE) =
√{p1(1-p1)/n1 + p2(1-p2)/n2}. Kalau survei ini dilakukan berkali-kali, maka kita akan
mendapatkan banyak beda proporsi (Pb). Distribusi dari Pb ini dinamakan distribusi
perbedaan proporsi dari dua sampel.
Misalnya dari penelitian terhadap 100 sampel bayi di kota dan 100 sampel bayi di desa,
didapatkan bahwa proposi diare pada bayi di kota adalah 0,50 dan di desa 0,33. Berdasarka
hasil penelitian tersebut dapat diperkirakan bahwa perbedaan kejadian diare pada bayi di
kota dan di desa sbb:
P1 = 0,50
P2 = 0,33
Pb = 0,50 – 0,33 = 0,17
SE = √{P1(1-P1)/n1 + P2(1-P2)n2} = √{(0,5x0,5/100) + (0,33x0,67/100)}= 0,068
95% Pb terletak antara Pb ± 1,96SE,
yaitu atara: (0,17 – 1,96x0,068) s/d (0,17+1,96x0,068) atau antara 0,037 s/d 0,303
70
Modul 6
Confidence Interval
6.1 Pendahuluan
Rerata atau proporsi atau relatif risk atau odd ratio populasi disebut parameter,
sedangkan rerata sampel, proporsi sampel, relatif risk sampel atau odd ratio sampel
disebut statistik sampel dan sering disebut sebagai statistik. Rerata populasi diberi
simbul µ sedangkan statistik rerata diberi simbul X, parameter proporsi diberi simbul π
dan statistik proporsi diberi simbul p, parameter relatif risk diberi simbul φ sedangkan
sstatistik relatif risk diberi simbul RR, parameter odd ratio diberi simbul ψ sedangkan
statistik odd ratio diberi simbul OR.
Pada umumnya kita tidak mengetahui rerata populasi atau proporsi populasi, relatif
risk populasi atau odd ratio populasi dan paramter tersebut nilainya diestimasikan dari
statistik sampel. Ada dua metode yang umum dipakai untuk estimasi paramter populasi
dari statistik sampel, yaitu: menggunakan point estimasi dan interval estimasi. Berikut
akan dibahas kedua metode estimasi tersebut.
Point estimasi tidak memberikan banyak informasi bagaimana variasi dari nilai
estimasi tersebut karena hanya satu nilai saja. Kita tidak mengetahui seberapa dekat
nilai estimasi tersebut dengan rerata populasi yang sebenarnya (true mean). Perlu
diketahui bahwa rerata sampel belum tentu sama dengan rerata populasi. Perbedaan
rerata sampel dengan rerata populasi tersebut terjadi karena adanya sampling error atau
71
karena faktor kebetulan (by chance). Oleh karena itu, akan lebih sensitif bila estimasi
rerata populasi (parameter populasi) menggunakan interval disekitas rerata sampel
yang disebut dengan interval kepercayaan (confidence interval of mean).
Misalnya akan diteliti tekanan sistole mahasiswa. Untuk tujuan tersebut dipilih
sebanyak 60 sampel mahasiswa. Dari data tekanan sistole sampel didapatkan rata-rata
sistole X = 120 mmHg dengan SD = 2,5 mmHg. Menggunakan data sampel tersebut
dapat diperkirakan bahwa 95% kemungkinan rata-rata tekanan sistole populasi
mahasiswa berkisar antara:
72
Penentuan CI untuk sampel kecil
Apabila varian populasi tidak diketahui atau jumlah sampel lebih kecil dari 30 (sampel
kecil), distribusi rerata atau beda rerata sampel akan mengikuti distribus ‘t’ dengan
derajat bebas (df) = n – 1 dan dengan standar error (SE) = SD/√n. Penghitungan CI
dengan distribusi t adalah sebagai berikut:
Misalnya sampel mahasiswa yang diperiksa tekanan darah sistolenya 30 orang dan
didapat rata-rata ( X ) = 120 mmHg dengan Sd = 2,5 mmHg, maka penghitungan
convidence intervalnya adalah sebagai berikut:
• Hitung nilai derajat bebas (df) = n – 1 = 30 – 1 = 29.
• Lihat nilai t pada tabel t untuk df = 29 dan tingkat kepercayaan (confidence level) =
95% adalah 2,04
• Menghitung nilai batas bawah dan atas:
Batas bawah = X - (t x SD/√n) = 120 – (2,04 x 2,5/√60) = 119,34
Batas atas = X + (t x SD/√n) = 120 + (2,04 x 2,5/√60) = 120,66
73
Berdasarkan hasil analisis deskriptif data sampel IMT ibu di Bali tersebut selanjutnya
dapat dihitung CI 95% dari rerata IMT ibu di Bali dengan langkah sebagai berikut.
Perhitungan:
• Hitung standar error SE = SD/√n = 2,99/√30 = 0,5468
• Hitung CI dengan rumus: CI = mean ± tα x SE, dengan tahapan:
o Menentukan derajat bebas (df) = n – 1 = 30-1=29
o Mencari nilai t untuk α 0,05 pada tabel t, didapatkan t = 2,0452
α
Bila menggunakan program SPSS dengan prosedur Explore akan didapatkan hasil
seperti berikut:
Descriptives
Kesimpulan;
Dari hasil analisis tersebut dapat disimpulkan bahwa 95% kemungkinan rerata IMT
populasi terletak antara 25,75 kg/m2 s/d 27,98 kg/m2.
Perhitungan:
• Hitung rerata dan SD masing-masing kelompok
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
Sex n Mean SD
Laki 24 29,2792 5,064
Wanita 21 27,6429 4,921
• Hitung homogenitas
Homogenitas data kedua kelompok diuji dengan levene’s test menggunakan statistk
F dengan rumus: F = SD12/SD12 = 1,0588 dengan p > 0,05. Berarti kedua sampel
homogen (equal variances).
Kesimpulan
95% kemungkinan beda rerata kedua sampel terletak antara -1,3757 s/d 4,6483
75
Kasus 2 (data kedua sampel heterogen)
Suatu penelitian akan mempelajari apakah rerata IMT remaja putri berbeda dengan
remaja putra. Untuk menjawab pertanyaan tersebut, peneliti melakukan penelitian pada
20 sampel anak sekolah menengah atas laki dan 20 wanita yang dipilih secara stratified
simple random. Hasil pengukuran IMT dari kedua kelompok sampel adalah sbb:
Tabel 4.2 Data IMT (kg/m2) siswa SMA laki dan perempuan
IMT siswa laki IMT siswa perempuan
17,80 29,40 25,40 31,60
12,00 27,00 29,40 25,40
30,50 44,50 29,30 30,90
34,60 22,70 32,70 21,90
19,60 32,80 23,30 23,20
24,50 24,80 28,60 20,10
24,80 49,60 30,10 28,90
35,50 29,40 30,10 31,50
34,30 31,00 30,10 32,20
30,00 21,90 22,50 30,30
Perhitungan:
• Hitung rerata dan SD masing-masing kelompok
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
Sex n Mean SD
Laki 20 28,8350 8,7063
Wanita 20 27,8750 3,8722
• Hitung homogenitas
Homogenitas data kedua kelompok diuji dengan levene’s test menggunakan statistk
F dengan rumus: F = SD12/SD12 = 5,055 dengan p < 0,05. Berarti kedua sampel
heterogen (unequal variances).
Kesimpulan
95% kemungkinan rerata beda kedua sampel berkisar antara -3,4177 s/d 5,3377
Kesimpulan:
95% kemungkinan kejadian obesitas pada remaja putri berkisar antara 6,3% s/d 33,7%.
Untuk estimasi perbedaan proporsi kejadian obesitas di kedua popuasi tersebut akan
dipergunan interval estimasi atau juga disebut confidence interval, yang dihitung
dengan cara sebagai berikut:
Ø Hitung beda proporsi kedua sampel: p1-p2 = 30% - 20% = 10%.
Ø Hitung standar error beda proporsi: SE = √{p1(1-p1)/n1 + p2(1-p2)/n2} =
√{(0,3x0,7/60) + (0,2x0,8/60)} = 0,079
77
Ø Batas bawah LL = beda proporsi – 1,96 SE = 0,10 – 1,96 x 0,079 = - 0,0548
Ø Batas atas UL = beda proporsi + 1,96 x 0,079 = 0,2548
Kesimpulan;
95% kemungkinan beda proporsi kejadia obase antara kota dan desa terletak antara –
5,48% s/d 25,48%.
6.8 Latihan
1. Suatu survel likakukan terhadap siswa sekolah dasar (SD) di kota dengan tujuan untuk
mengetahui kejadian obesitas pada siswa. Sebanyak 200 siwa (100 laki dan 100
perempuan) SD Negeri dan Swasta dipakai sampel yang dipilih secara random. Dari
hasil pengukuran IMT didapatkan sebesar 30% siswa obase. Berapa perkiraan kejadian
obase pada siswa SD di kota dengan tingkat kepercayaan 95%.
2. Berapa perbedaan kejadian obase antara siswa laki dan peremuan di populasi siswa SD
di kota bila kejadian obase pada sampel siswa laki 25% dan pada sampel siswa
perempuan 35%.
3. Dari suatu survei terhadap 30 sampel ibu didapatkan data indek masa tubuh (IMT) sbb:
26,0 25,3 26,0 26,3 28,5 24,5 30,2 26,5 31,5 19,0 21,7 27,5 29,0 29,6 25,7 30,5
26,5 25,7 27,4 20,8 27,1 31,2 30,3 25,4 27,5 25.8 21,3 28,7 22,0 26,7
Berapa perkiraan rerata IMT dari populasi ibu dengan tingkat kepercayaan 95%.
78
Modul 7
Uji Hipotesis Perbedaan Dua Sampel
7.1 Pendahuluan
Pada Modul 4, telah dibahas tentang Confidence Interval (CI) yang menyatakan rentangan
nilai dimana kemungkinan paramter populasi terletak. Pada Modul ini akan dibahas cara
menguji hipotesis perbedaan dua sampel dan pemanfaatan CI dalam uji hipotesis perbedaan
rerata sampel. Pada modul ini akan didiskusikan topik sebagai berikut:
• Prinsip dasar uji hipotesis
• Tahapan uji hipotesis
• Uji hipotesis perbedaan rerata dua sampel bebas
• Uji hipotesis perbedaan rerata dua sampel berpasangan
• Uji hipotesis perbedaan rerata satu sampel dengan konstan
Hipotesis Statistik
Hipotesis adalah jawaban terhadap pertanyaan penelitian yang dibuat berdasarkan premis-
premis yang relevan dan up to date, oleh karena itu, kebenaran dari suatu hipotesis masih
perlu dibuktikan dengan data empiris yang didapatkan dari hasil pengukuran sampel.
Sebagai contoh, misalnya pertanyaan penelitiannya adalah: “Apakah ada perbedaan
kejadian obesitas anak sekolah dasar di kota dengan di desa?” Hipotesis dari pertanyaan
penelitian tersebut adalah: “Kejadian obasitas pada siswa sekolah dasar di kota lebih tinggi
dari kejadian obesitas anak sekolah dasar di desa”. Untuk menguji kebenaran hipotesis
tersebut, maka hipotesis penelitian yang dimaksud harus dijabarkan ke dalam hipotesis
statistik.
79
Jenis Hipotesis Statistik
Hipotesis Statistik dibedakan menjadi dua, yaitu hipotesis nol atau null hypothesis dan
hipotesis alternatif atau alternative hypothesis.
Kalau misalnya yang akan diuji adalah perbedaan rerata IMT antara anak SD di kota
dengan di desa, maka hipotesis nol dari penelitian tersebut adalah: tidak ada perbedaan
rerata IMT antara siswa SD di kota dengan di desa. Cara penulisan Hipotesis Nol dengan
lambang adalah sbb:
Ho : µk = µd atau Ho :µk - µd = 0
Keterangan:
µk dan µd adalah rerata IMT di populasi siswa di kota dan di desa (true means)
Hipotesis Alternatif:
Hipotesis alternatif adalah pernyataan yang dianggap benar terjadi di populasi yang
merupakan kebalikan dari pernyataan dalam hipotesis nol. Hipotesis alternatif ditulis
dengan lambang Ha atau H1. Untuk contoh di atas, hipotesis alternatifnya adalah:
Hipotesis alternatif: Terdapat perbedaan rerata IMT antara anak SD di kota dengan anak
SD di desa. Secara lambang dapat ditulis sebagai berikut.
Ha : µk # µd atau Ha :µk - µd # 0
Kebenaran dari hipotesis nol atau hipotesis alternatif harus diuji dengan data emperis agar
dapat disimpulkan apakah hipotesis nol yang benar atau sebaliknya hipotesis alternatif yang
benar. Bila hipotesis nol yang benar maka kita harus menerima hipotesis nol dan sebaliknya
bila hipotesis alternatif yang benar maka kita harus menolak hipotesis nol.
80
7.2.1 Jenis Uji Hipotesis
Uji hipotesis dibedakan menjadi uji parametrik dan nonparametrik sebagai berikut:
Uji parametrik dapat dipakai bila data berdistribusi normal dan memiliki varian yang
homogen serta dikumpulkan dari sampel yang dipilih secara random. Sementara, uji
hipotesis nonparamterik tidak memerlukan persyaratan apapun, oleh karena itu, uji
hipotesis nonparametrik juga disebut sebagai free methods.
81
Kesalahan Type II (Type II Error)
Kesalahan type II adalah menerima hipotesis nol yang seharusnya di tolak. Misalnya
terdapat perbedaan rerata IMT antara populasi siswa SD di kota dan di desa (hipotesis
alternatif yang benar) di populasi, tetapi hasil uji hipotesis dengan data sampel menunjukan
tidak terdapat perbedaan (hipotesis nol benar). Kesalahan type II diberi simbul β. Untuk
memperjelas pengertian kealasahan type I dan type II disajikan matrik berikut.
Keadaan di Populasi
Hasil test pada sampel Ho diterima Ho ditolak
(tidak berbeda) (berbeda)
Ho diterima Correct (1-α) Type II Error (β)
Tingkat kemaknaan adalah probabilitas terjadinya kesalahan type I (α) yang masih
diterima. Konvensi menetapakan besar tingkat kemaknaan adalah 0,05 atau 0,01. Dalam uji
hipotesis probabilitas kesalahan type I (α) ini harus dibuat sekecil mungkin dan umumnya
pada penelitian ilmu sosial menggunakan α sebesar 0,05 dan untuk penelitian klinis atau
laboratorium menggunakan α sebesar 0,01.
Ho : µ1 = µ2
Ha : µ1 # µ2
83
Nilai statistik perbedaan tersebut memberikan informasi berapa standar error (SE) beda
rerata kedua sampel berata di atas atau di bawah nilai nol (perbedaan rerata populasi bila
hipotesis nol benar).
__ __
0 (X1-X2)
Bila analisis menggunakan paket program seperti SPSS, maka CI akan diberikan secara
otomatis pada hasil analisisnya.
84
2) dengan melihat posisi angka nol dalam CI, dimana:
Ho diterima bila angka nol berada dalam CI atau tanda (sign) dari nilai batas bawah dan
batas atas CI berlawanan, seperti contoh berikut:
Ho ditolak bila angka nol berada di luar CI atau sign dari nilai batas bawah dan batas
atas CI sama, seperti contoh berikut:
86
Ø Menghitung statistik test perbedaan kedua sampel:
Beda rerata kedua sampel
Nilai statistik perbedaan (t) = -------------------------------------------------------
Standar error perbedaan rerata kedua sampel
1,6363
t = -------------- = 1,0956
1,4935
Group Statistics
Std. Error
klp N Mean Std. Deviation Mean
IMT siswa SD kota 24 29,2792 5,06419 1,03372
siswa SD desa 21 27,6429 4,92144 1,07395
87
Dari output 1 diketahui bahwa rerata IMT siswa SD di kota adalah 29,2792 dengan SD =
5,064, sedangkan rerata IMT siswa di desa adalah 27,6429 denga SD = 4,921.
Ouput 3: Uji t
Perbedaan rerata kedua sampel (Mean difference) adalah sebesar 1,6363 dengan nilai
statistik t = 1,096. Berarti perbedaan rerata sampel tersebut terletak 1,6363 SE di atas nol
dengan nilai p = 0,279. Berdasarkan hasil uji t tersebut dapat disimpulkan bahwa hipotesis
nol diterima. Berati rerata IMT siswa SD di kota dan di desa tidak berbeda (lihat nilai t dan
Sig pada tabel Independence Sample Test di bawah ini).
88
7.4.3 Uji hipotesis perbedaan rerata dua sampel heterogen
Suatu penelitian akan mempelajari apakah rerata IMT remaja putri berbeda dengan remaja
putra. Untuk menjawab pertanyaan tersebut, peneliti melakukan penelitian pada 20 sampel
anak sekolah menengah atas laki dan 20 wanita yang dipilih secara stratified simple
random. Hasil pengukuran IMT dari kedua kelompok sampel adalah sbb:
Tabel 5.4.3 Data IMT (kg/m2) siswa SMA laki dan perempuan
IMT siswa laki IMT siswa perempuan
17,80 29,40 25,40 31,60
12,00 27,00 29,40 25,40
30,50 44,50 29,30 30,90
34,60 22,70 32,70 21,90
19,60 32,80 23,30 23,20
24,50 24,80 28,60 20,10
24,80 49,60 30,10 28,90
35,50 29,40 30,10 31,50
34,30 31,00 30,10 32,20
30,00 21,90 22,50 30,30
0,96
t = -------------- = 0,45056
2,13067
Group Statistics
Std. Error
klp N Mean Std. Deviation Mean
IMT laki 20 28,8350 8,70634 1,94680
wanita 20 27,8750 3,87229 ,86587
Dari output 1 diketahui bahwa rerata IMT siswa laki adalah 28,835 dengan SD = 8,7063,
sedangkan rerata IMT siswa wanita adalah 27,875 denga SD = 3,8722.
Ouput 3: Uji t
Perbedaan rerata kedua sampel (Mean difference) adalah sebesar 0,96 dengan nilai statistik
t = 0,451 yang artinya perbedaan rerata kedua sampel tersebut terletak 0,451 SE di atas nol
dengan nilai p = 0,656. Berdasarkan hasil uji t tersebut dapat disimpulkan bahwa rerata
IMT siswa laki dan wanita tidak berbeda (lihat nilai t dan Sig pada tabel Independence
Sample Test di bawah ini).
91
Output 4: CI 95% beda rerata sampel
Nilai CI 95% perbedaan rerata IMT siswa laki dan wanita adalah - 3,4177 s/d 5,3377.
Berdasarkan hasil analisis tersebut dapat disimpulkan bahwa 95% kemungkinan rerata
kedua sampel terletak antara - 3,4177 s/d 5,3377. Dapat disimpulkan bahwa Ho diterima
(lihat 95% Confidence Interval of the Difference pada tabel Independence Sample Test
baris ke dua seperti di bawah ini).
Independent Samples Test
92
Tabel 5.4.2 Data IMT (kg/m2) siswa SD di kota dan di desa
No. Kota Desa No. Kota Desa
Pasangan Pasangan
1 27,8 29,4 13 25,4 31,6
2 22,0 27,0 14 29,4 25,4
3 30,5 44,5 15 29,3 34,9
4 34,6 22,7 16 32,7 21,9
5 29,6 32,8 17 23,3 23,2
6 24,5 24,8 18 28,6 20,1
7 24,8 29,6 19 30,1 28,9
8 30,5 29,4 20 19,1 31,5
9 34,3 31,0 21 35,1 35,2
10 30 21,9 22 22,5 25,5
11 25,8 36,5 23 24,4 26,0
12 29,7 29,0 24 27,9 29,6
93
Kota 24 27,9588 4,1743
Desa 24 28,8500 5,5596
Beda rerata 24 - 0,8541 6,6531
Std. Error
Mean N Std. Deviation Mean
Pair kota 27,9958 24 4,17430 ,85208
1 desa 28,8500 24 5,55964 1,13486
Dari output 1 diketahui bahwa rerata IMT siswa di kota adalah 27,9958 dengan SD =
4,1743, sedangkan rerata IMT siswa di desa adalah 28,8500 denga SD = 5,5596.
Ouput 2: Uji t
Rerata beda kedua pasangan sampel (Mean difference) adalah sebesar - 0,85417 dengan
nilai statistik t = - 0,629 yang artinya perbedaan rerata kedua sampel tersebut terletak 0,629
SE di bawah nol dengan nilai p = 0,536. Berdasarkan hasil uji t tersebut dapat disimpulkan
bahwa rerata IMT siswa di kota dan di desa tidak berbeda (lihat nilai t dan Sig pada Paired
Samples Test di bawah ini).
Nilai CI 95% perbedaan rerata IMT siswa laki dan wanita adalah - 3,66354 s/d 1,95521.
Berdasarkan hasil analisis tersebut dapat disimpulkan bahwa 95% kemungkinan rerata beda
kedua sampel terletak antara - 3,66354 s/d 1,95521. Dari CI tersebut diketahui angka nol
berada di dalam CI, maka dapat disimpulkan bahwa Ho diterima. Berarti tidak terdapat
perbedaan rerata IMT antara siswa di kota denga di desa (lihat 95% Confidence Interval of
the Difference pada Paaired Samples Test di bawah ini).
Paired Differences
95% Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair 1 kota - desa -,85417 6,65314 1,35807 -3,66354 1,95521 -,629 23 ,536
95
7.6 Uji hipotesis perbedaan rerata satu sampel dengan nilai test tertentu
7.6.1 Penelitian dengan satu sampel
Dalam bidang kedokteran sering dilakukan penelitian dengan membandingkan suatu
sampel dengan nilai standar. Misalkan dalam pabrik obat dilakukan uji petik terhadap
tetrasiklin 250 mg yang diproduksi oleh pabrik tersebut. Setiap satu jam akan diambil satu
kapsul sebagai sampel, sehingga dalam satu hari akan terdapat 24 sampel kapsul tetrasiklin
250 mg. Tujuan dari uji petik ini adalah untuk menguji apakah kandungan tetrasiklin Hcl
pada setiap kapsul sama dengan nilai standar (250 mg). Contoh yang lain seperti uji pasar
yang dilakukan Balai POM untuk menguji kandungan zat atau bahan obat dari suatu
produk. Dalam kontek ini, peneliti akan membandingkan data sampel dengan nilai test
tertentu. Untuk tujuan pengujian tersebut, dalam sesi ini akan dibahas uji hipotesis
perbedaan rerata sampel dengan nilai test (standar) tertentu.
Umumnya kita tidak mengetahui standar deviasi masalah yang diteliti di populasi, sehingga
standar deviasi populasi diestimasikan dari sampel. Karena standar deviasi populasi tidak
diketahui, maka itu data diasumsikan berdistribusi ‘t’. Uji hipotesis yang tepat dipakai
untuk menguji perbedaan rerata satu sampel dengan nilai test (standar) adalah One Sample
T Test dengan rumus nilai t sebagai berikut.
X −C
t=
SE
SD
SE =
n
Dimana: _
t = nilai statistik t X = nilai rata-rata sampel
C = nilai standar atau konstan SE = standar error
SD = standar deviasi sampel n = jumlah sampel
Contoh kasus
Balai POM (Pengawasan Obat dan Makanan) melakukan sampel survei untuk
mengantisipasi adanya isu tetrasiklin merk X palsu. Sebanyak 30 sampel kapsul
tetrasiklin merk X diambil secara acak di apotik di Denpasar. Dari survei ini akan
96
dibuktikan apakah kandungan tetrasiklin HCl pada kapsul tetra merk X itu sama
dengan yang tertera pada label yaitu 250 mg tetracyclin HCl.
Dari survei ini didapatkan data kandungan tetrasiklin pada sampel adalah sebagai
berikut:
No Kadar No Kadar
1 250 16 249
2 245 17 251
3 254 18 243
4 248 19 255
5 241 20 245
6 250 21 248
7 246 22 247
8 251 23 252
9 250 24 253
10 245 25 249
11 251 26 243
12 254 27 255
13 248 28 245
14 214 29 248
15 250 30 243
97
Hipotesis nol juga dapat ditulis sbb:
Ho : µ = 250 atau Ho : µ - 250 = 0
Ø Hipotesis Alternatif:
Hipotesis alternatif menyatakan: rerata kandungan tertrasiklin yang beredar tidak
sama dengan 250.
Dapat juga dinyatakan dengan simbul sbb:
Ha: µ # 250 atau Ha: µ - 250 # 0
Kesimpulan
Ø Menggunakan nilai p:
Berdasarkan hasil analisis didapatkan nilai p > 0,05, maka dapat disimpulkan bahwa
Ho diterima, berarti tidak terdapat perbedaan rerata tetrasilkin HCL dengan 250 mg.
98
Ø Menggunakan CI:
Sebesar 95% kemungkinan rerata beda populasi terletak antara – 5,3118 s/d 0,1785.
Angka nol berada di dalam CI, dengan demikian dapat disimpulkan bahwa Ho
diterima. Berarti tidak terdapat perbedaan rerata kandungan tetrasilkin HCl dengan
250 mg.
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
tetracyclin 30 247,4333 7,35168 1,34223
Dari output 1 diketahui bahwa dari 30 sampel terata X didapatkan nilai rerata kandungan
tetrasilin 247,433 mg dengan standar deviasi = 7,35168.
One-Sample Test
99
Modul 8
Analisis Varian One-Way Anova
8.1 Pendahuluan
Pada modul sebelumnya telah dibahas metode analisis perbedaan rerata satu sampel
(one sample T Test), dua sampel bebas (independent samples T Test), dan dua sampel
berpasangan (paired samples T Test). Pada modul ini akan dibahas metode analisis
untuk perbedaan rerata lebih dari dua sampel bebas. Metode analisis yang akan dibahas
adalah metode one way analysis of variance. Metode ini didefinisikan sebagai suatu
teknik dimana total variasi suatu set data dibagi menjadi dua bagian atau lebih menurut
sumber variasi dan akan dihitung kontribusi masing-masing sumber variasi terhadap
total variasi.
Metode analisis varian One-Way sangat banyak dipakai dalam analisis data penelitian
eksperimen dengan rancangan acak lengkap (completely randomized design). Metode
analisis varian umumnya dipergunakan untuk dua tujuan yang berbeda, yaitu (1) untuk
estimasi dan uji hipotesis tentang hipotesis populasi varian dan (2) untuk estimasi dan
uji hipotesis perbedaan rerata populasi. Pada modul ini akan dibahas penggunaan
analisis varian untuk tujuan estimasi dan uji hipotesis perbedaan rerata populasi.
Misalnya peneliti ingin menguji apakah ada perbedaan Hb antara pasien dengan tipe
sickle sel SS, S/thalasemia, dan SC. Pada kasus ini akan dibandingkan rerata Hb dari
ketiga kelompok tipe sickle sel. Data hasil pengukuran adalah sebagai di bawah ini.
100
8.2 Prinsip Dasar One-way Anova
8.2.1 Model
Model matematik adalah menggambarkan kaitan nilai tertentu dari satu set data dengan
simbul-simbul tertentu. Umumnya hasil pengukuran variabel tergantung dilambangkan
dengan xij, rerata populasi dari semua kelompok dengan µ atau juga disebut grand
mean, efek perlakuan dilambangkan dengan τj yang menyatakan perbedaan rerata grup
perlakuan dengan rerata populasi, dan error atau galat percobaan dilambangkan dengan
εij, yang menyatakan variasi individu di dalam kelompok, maka model matematik
analisis varian one-way adalah sbb:
xij = µ + τj + εij
Model analisis varian one-way terdiri dari tiga komponen, yaitu (1) grand mean (µ). (2)
treatment effect (τj), dan (3) error term (εij). Berdasarkan model tersebut, dalam
analisis varian one-way, total variasi bersumber dari variasi kelompok (treatment
effect) dan variasi individu dalam kelompok (error term).
8.2.2 Asumsi
Asumsi yang harus dipenuhi untuk analisis varian one way adalah:
Ø Alokasi sampel atau perlakuan dilakukan secara random
Ø Data dari setiap kelompok perlakuan berdistribusi normal
Ø Semua kelompok memiliki varian yang sama (homogen)
8.2.3 Hipotesis
Hipotesis nol menyatakan: rerata populasi dari semua kelompok perlakuan sama atau
efek semua perlakuan sama.
Hipotesis nol juga dapat dinyatakan sbb:
Hipotesis alternatif menyatakan: paling sedikit ada rerata dua kelompok berbeda atau
paling sedikit efek dari dua perlakuan berbeda.
Hipotesis alternatif juga dapat dinyatakan sbb:
101
Hipotesis statistik untuk kasus di atas dinyatakan sbb:
Ho : µ1 = µ2 = µ3
Ha : tidak semua µj sama atau
Keterangan:
µ1 : rerata Hb ibu dengan sickle cell type SS
µ2 : rerata Hb ibu dengan sickle cell type S/thalasemia
µ3 : rerata Hb ibu dengan sickle cell type SC
( )
2
SST = ∑ xi j − x = ∑ xij − (∑ xij ) / n
2 2
Keterangan:
SST : total jumlah kuadrat
xij : nilai individu sampel ke i dari kelompok perlakuan ke j
x : grand mean
n : jumlah semua sampel
j i =1 j =1
Keterangan:
SSW: jumlah kuadrat di dalam kelompok (within groups Sum Square)
xij : nilai individu ke i dari kelompok ke j
x . j : rerata kelompok perlakuan j
102
SDj: standar deviasi kelompok perlakuan ke j
nj: jumlah sampel pada kelompok perlakuan ke j
Ø Menghitung rerata variasi individu kuadrat di dalam kelompok atau variance within
group (MSW)
Rerata variasi dalam kelompok atau disebut varian dalam kelompok (MSW)
dihitung dengan rumus sbb:
MSW = SSW/(n – k)
Keterangan:
MSW: Mean square within group atau rerata variasi dalam kelompok atau varian
dalam kelompok
SSW : jumlah kuadrat dalam kelompok
n : jumlah seluruh sampel
k : jumlah kelompok perlakuan
Keterangan:
SSG: jumlah kuadrat antara kelompok perlakuan
nj : jumlah sampel kelompok perlakuan ke j
x . j : rerata kelompok perlakuan ke j
x : grand mean
103
Untuk contoh kasus di atas:
MSG = SSG/(k – 1)
Keterangan:
MSG: mean sumsquare groups atau varian antara kelompok
SSG : sumsquare between groups atau jumlah kuadrat antar kelompok
k : jumlah kelompok perlakuan
F= MSG/MSW
Keterangan:
F : statistik varian ratio
MSG : varian antara kelompok perlakuan atau mean square between groups
MSW: varian dalam kelompok atau mean square within groups
104
o Lihat tabel F untuk mencari posisi nilai F hitung pada df nominator (k-1) dan
denominator (n-k)
o Menentukan nilai p sesuai dengan nilai α dari tabel F dimana posisi F(hitung)
berada
Bila analisis varian One-way dilakukan dengan paket program statistik seperti SPSS
atau Stata, maka nilai p akan ditampilkan pada output analisis.
8.2.5 Kesimpulan
Kesimpulan analisis one-way anova bisa menerima atau menolak hipotesis nol.
Hipotesis nol diterima bila nilai p > α , berarti tidak ada perbedaan rerata antara
kelompok perlakuan atau tidak ada perbedaan efek perlakuan. Sebaliknya, Ho ditolak,
bila nilai p ≤ α, artinya paling sedikit ada dua kelompok yang berbeda.
105
Dari analisis one-way anova tidak dapat diketahui kelompok mana yang berbeda.
Untuk menentukan kelompok ibu mana yang berbeda, perlu dilakukan uji Post Hoc.
Akan tetapi, seandainya dari hasil analisis One-way anova ternyata Ho diterima, maka
analisis hanya sampai disini saja dan tidak perlu dilanjutkan ke uji Post Hoc.
8.2.6 Output analisis one-way anova dengan SPSS dari kasus di atas
Output 1: Deskriptif statistik
Descriptives
Hb
95% Confidence Interval for
Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1,00 16 8,6563 ,84693 ,21173 8,2050 9,1075 7,20 10,30
2,00 10 10,6300 1,28413 ,40608 9,7114 11,5486 8,10 12,10
3,00 15 12,3000 ,94188 ,24319 11,7784 12,8216 10,70 13,90
Total 41 10,4707 1,87846 ,29337 9,8778 11,0636 7,20 13,90
Dari hasil analisis deskriptif ke tiga kelompok didapatkan bahwa kelompok ibu dengan
sikcl cell type SS memiliki rerata Hb 8,65 (± 0,211), kelompok ibu dengan sickle cell
type S/talasemia memiliki rerata Hb 10,63 (± 1,284) dan kelompok ibu dengan sickle
cell type SC memilki rerata Hb 12,30 (± 0,941).
Hb
Levene
Statistic df1 df2 Sig.
,929 2 38 ,404
Dari hasil analis homogenitas varian dengan uji Levene didapatkan bahwa ke tiga
kelompok memiliki varian yang sama. Hasil uji menunjukan nilai statistil Levene
sebesar 0,929 dengan nilai p 0,404.
106
Output 3: Hasil analisis varian one-way
ANOVA
Hb
Sum of
Squares df Mean Square F Sig.
Between Groups 103,125 2 51,562 51,535 ,000
Within Groups 38,020 38 1,001
Total 141,145 40
Hasil analisis varian menunjukan VR sebasar 51,535 dengan nilai p = 0,000. Dari hasil
ini ddapatkan tidak cukup bukti untuk menerima Ho yang menyatakan semua
kelompok memiliki rerata Hb sama, maka Ho ditolak. Oleh karena itu, dapat
disimpulkan bahwa paling sedikit terdapat dua kelompok yang berbeda.
8.3 Post Hoc
Post Hoc adalah uji hipotesis lanjutan yang juga disebut multiple comparasions test.
Uji Post Hoc diperlukan bila dari analisis one-way anova disimpulkan hipotesis nol
ditolak atau ada efek perlakuan. Uji Post Hoc ditujukan untuk menguji kelompok
perlakuan mana yang berbeda dengan kelompok yang mana.
8.3.1 Hipotesis
Setiap kelompok yang akan diuji harus dibuatkan hipotesis statistiknya. Misalnya ada
tiga kelompok perlakuan, maka uji Post Hoc akan menguji perbedaan antara kelompok
I dengan kelompok II, kelompok I dengan kelompok III, dan kelompok II dengan
kelompok III, maka ada 3 hipotesis:
107
Uji ke tiga antara kelompok II vs III:
Ho : µ2 = µ3 (tidak ada perbedaan rerata klp II dengan klp III)
Ha : µ2 # µ3 (ada perbedaan rerata klp II dengan klp III)
8.3.3 Kesimpulan
Hipotesis nol diterima bila nilai P > α, berarti tidak terdapat perbedaan antara
kelompok yang dibandingkan. Sebaliknya, Ho ditolak bila nilai p ≤ α, berarti terdapat
perbedaan antara kelompok yang dibandingkan.
Uji LSD adalah uji Post Hoc untuk kelompok sampel yang homogen dan Tamhane
untuk kelompok sampel yang tidak homogen. Karena dari uji homogenitas varian dari
Levene test didapatkan nilai p > 0,05, yang artinya semua kelompok memiliki varian
yang sama atau homogen, maka uji Post Hoc yang dibaca adalah uji LSD.
108
Multiple Comparisons
Dependent Variable: Hb
Mean
Difference 95% Confidence Interval
(I) Sikclecell (J) Sikclecell (I-J) Std. Error Sig. Lower Bound Upper Bound
LSD 1,00 2,00 -1,97375* ,40322 ,000 -2,7900 -1,1575
3,00 -3,64375* ,35949 ,000 -4,3715 -2,9160
2,00 1,00 1,97375* ,40322 ,000 1,1575 2,7900
3,00 -1,67000* ,40836 ,000 -2,4967 -,8433
3,00 1,00 3,64375* ,35949 ,000 2,9160 4,3715
2,00 1,67000* ,40836 ,000 ,8433 2,4967
Tamhane 1,00 2,00 -1,97375* ,45796 ,002 -3,2151 -,7324
3,00 -3,64375* ,32245 ,000 -4,4622 -2,8253
2,00 1,00 1,97375* ,45796 ,002 ,7324 3,2151
3,00 -1,67000* ,47333 ,009 -2,9375 -,4025
3,00 1,00 3,64375* ,32245 ,000 2,8253 4,4622
2,00 1,67000* ,47333 ,009 ,4025 2,9375
*. The mean difference is significant at the .05 level.
Hasil analisis Post Hoc menggunakan uji LSD didapatkan, ketiga kelompok memiliki
rerata Hb yang berbeda secara bermakna. Kelompok 1 berbeda dengan kelompok 2,
kelompok 1 juga berbeda dengan kelompok 3, dan kelompok 2 juga berbeda dengan
kelompok 3.
LATIHAN:
Dari survei ini didapatkan data kandungan tetrasiklin pada sampel adalah sebagai
berikut:
109
No Kadar No Kadar
1 250 16 249
2 245 17 251
3 254 18 243
4 248 19 255
5 241 20 245
6 250 21 248
7 246 22 247
8 251 23 252
9 250 24 253
10 245 25 249
11 251 26 243
12 254 27 255
13 248 28 245
14 214 29 248
15 250 30 243
Buktikan tujuan penelitian tersebut dengan menggunakan data sampel di atas pada
tingkat kemaknaan 5%.
8. Kasus 3
Suatu penelitian klinik efek obat KB pada pria dilakukan terhadap 15 voluntir. Setiap
voluntir diberikan suntikan obat KB pria setiap bulan sebanyak 3 kali. Kandungan
sperma pada air mani diukur sebanyak dua kali, yaitu sebelum diberi obat dan setelah 3
kali suntikan. Dihipotesakan bahwa obat KB pria berfungsi menekan proses
pembentukan sperma sehingga dapat menurunkan kandungan sperma pada air mani.
Dari trial ini didapatkan data sebagai berikut:
110
Buktikan hipotesa dari penelitian tersebut dengan menggunakan data di atas dengan
tingkat kemaknaan 1%.
111
Modul 9
Two-Way Anova
9.1 Pendahuluan
Pada modul sebelumnya telah dibahas metode analisis varian untuk satu faktor yang
disebut dengan One-Way Anova. Bagaimana bila yang diteliti efek dari dua faktor atau
lebih terhadap luar penelitain tertentu. Misal akan diteliti efek obat tablet besi sebagai
faktor yang diteliti terhadap kadar serum feritin tikus dengan rancangan acak kelompok
dimana jenis kelamin tikus sebagai perancu. Atau akan diteliti efek tablet besi sebagai
faktor pertama dan vit C sebagai faktor ke dua terhadap serum feritin tikus dengan
rancangan faktorial. Pada ke dua contoh di atas, metode analisis One-way Anova tidak
dapat dipakai karena jumlah faktor yang diteliti lebih dari satu. Dalam kontek penelitian
tersebut, variasi nilai variabel outcome dipengaruhi oleh dua faktor, maka metode analisis
yang dapat dipakai adalah analisis Two-Way Anova. Metode analisis Two-Way Anova
memungkinkan peneliti untuk menganalisis efek dari setiap faktor dan kemungkinan
adanya interaksi dari faktor-faktor yang diteliti. Pada Modul ini akan dibahas metode
analisis varian untuk rancangan acak kelompok, rancangan faktorial, dan rancangan
pengukuran berulang (repeated meassures).
Tujuan dari rancangan aca blok adalah untuk menghilangkan atau mengendalikan pengaruh
dari blok dalam hal ini sebagai variabel perancu.
Tabel 9.2.2 Tabel hasil pengukuran luaran penelitian dengan rancangan acak kelompok
Blok Perlakuan
1 2 .... j Total Mean
1 x11 x12 .... x1j T1. x1.
2 x21 x22 .... x2j T2. x 2.
...
i xi1 xi2 .... xij Ti. x i.
Total T.1 T.2 .... T.j T
Mean x .1 x .2 x. j x..
113
Model
Model matermatik analisis Two-Way Anova untuk rancangan acak kelompok adalah
sebagai berikut.
xij = µ + βi + τj + eij
dimana:
xij = nilai variabel luaran
µ = konstan yang tidak diketahui
β = efek blok
τ = efek perlakuan
e = residu atau error term
Asumsi Model
1) xij merupakan variabel random dengan nilai kontinyu (interval)
2) data xij untuk masing-masing subpopulasi berdistribusi normal
3) tidak ada interaksi antara variabel perlakuan dengan variabel blok.
Hipotesis Statistik
Ho: τj = 0 (perlakuan tidak memberikan efek)
Ha: tidak semua τj # 0 (perlakuan memberikan efek)
Uji Statistik
Untuk menguji hipotesis nihil pada rancangan acak kelompok dilakukan dengan uji varian
atau Varian Ratio, yaitu membandingkan varian perlakuan dengan varia residu dengan tabel
resume sebagai berikut.
Tabel 9.2.2 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah kwadrat d.b. varian Varian Ratio
Perlakuan JKP j-1 MKP=JKP/(j-1) MKP/MKE
Blok JKB i-1 MKB=JKB/(i-1)
Residu/Eror JKE (j-1)(i-1) MKE=JKE/(j-1)(i-1)
Total JKT n-1
114
Keterangan:
JKP = jumlah kwadrwat kelompok perlakuan
JKB=jumlah kwadrat blok
JKE=jumlah kwadrat residu
JKT= jumlah kwadrat total
n= jumlah sampel
j= jumlah kelompok perlakuan
i = jumlah blok
MKP= varian antar kelompok perlakuan
MKB= varian antar blok
MKE= varian residu
j i
JKP = ∑∑ ( x . j − x .. ) 2
j =1 i =1
j i
JKB = ∑∑ ( x i. − x .. ) 2
j =1 i =1
Contoh kasus
Akan diteliti pengaruh metode pembelajaran A, B, dan C terhadap waktu (hari) yang
diperlukan sampai bisa menggunkan suatu alat. Umur dianggap sebagai variabel perancu.
Data hasil penelitian adalah sebagai berikut.
115
Tabel 9.2.3 Waktu yang diperlukan sampai bisa menggunakan suatu alat bantu
Kesimpulan
Ho ditolak (p < 0,05), berarti jenis metode pembelajaran memberikan efek yang berbeda
terhadap rerata waktu yang diperlukan sampai bisa memakai alat bantu tersebut.
116
Analisis Post Hoc
Bila jumlah perlakuan yang diteliti lebih dari dua, seperti contoh di atas terdapat 3 jenis
perlakuan dan Ho pada analisis Two-Way Anova ditolak, maka untuk menentukan
perlakuan mana yang berbeda dari tiga perlakuan yang ada, diperlukan analisis lanjutan
yang disebut dengan analisis Post Hoc seperti pada analisis One-Way Anova sebelumnya.
Type III
Sum of
Source Squares df Mean Square F Sig.
Perlakuan 18.533 2 9.267 21.385 .001
Blok 24.933 4 6.233 14.385 .001
Error 3.467 8 .433
Total 46.933 14
a R Squared = .926 (Adjusted R Squared = .871)
Dari hasil di atas didapatkan bahwa Ho. ditolak, berarti perlakuan berpengaruh secara
bermakna terhadap waktu bejalar sampai mampu memakai alat bantu, dimana nilai p dari
analisis varian perbedaan rerata waktu belajar antara kelompok perlakuan < 0,05.
Berikut adalah hasil analisis perbedaan rerata waktu belajar antar metode pembelajaran.
Post Hoc test dipakai untuk mengetahui perbedaan antar kelompok perlakuan. Hasil
analisis menunjukan bahwa perlakuan A dan B memberikan hasil yang tidak berbeda,
sedangan perlakuan C memiliki rerata waktu belajar lebih panjang dari perlakuan A dan B,
seperti hasil analisis Post Hoc dengan metode scheffe berikut.
117
Scheffe
Metode Subset
Pembelajaran N 1 2
A 5 9.00
B 5 9.60
C 5 11.60
Sig. .397 1.000
Means for groups in homogeneous subsets are displayed.
Dari tabel di atas diketahui bawah rerata perlakuan A adalah 9,00, perlakuan B adalah 9,60
dan perlakuan C adalah 11,60. Rerata perlakuan A dan B terletak di dalam satu Subset,
berarti kedua metode tersebut memiliki rerata yang tidak berbeda secara bermakna dimana
nilai p dar perbedaan kedua kelompok adalah 0,397. Sebaliknya, metode C terletak di
dalam subset yang berbeda dengan metode A dan B, berarti B memiliki rerata yang berbeda
dengan A maupun B. Oleh karena itu dapat disimpulkan bahwa metode A dan B
memerlukan waktu belajar yang lebih pendek dari metode C sampai dapat memakai alat
bantu tersebut.
118
9.3.2 Two-Way Anova
Teknik analisis Two-Way Anova merupakan teknik analisis varian yang dipakai
menganalisis data penelitian rancangan repeated mesures. Dalam analisis Two-Way Anova,
hasil observasi dikategorikan berdasarkan subjek penelitian dan pengukuran, sebagai bagan
di bawah ini.
Tabel 9.3.2 Tabel hasil pengukuran luaran penelitian dengan rancangan acak kelompok
Model
Model matermatik analisis Two-Way Anova untuk rancangan repeated measures adalah
sebagai berikut.
xij = µ + βi + τj + eij
dimana:
xij = nilai variabel luaran
µ = konstan yang tidak diketahui
β = efek subjek
τ = efek waktu pengukuran
e = residu atau error term
i = jumlah subjek
j = jumlah pengukuran
119
Asumsi Model
1) xij merupakan variabel random dengan nilai kontinyu (interval)
2) data xij untuk masing-masing subpopulasi berdistribusi normal
3) tidak ada interaksi antara variabel waktu pengukuran dengan subjek.
Hipotesis Statistik
Ho: τj = 0 (perlakuan tidak memberikan efek atau tidak terdapat perbedaan antara
pengukuran)
Ha: tidak semua τj # 0 (perlakuan memberikan efek atau terdapat perbedaan antara
pengukuran)
Uji Statistik
Untuk menguji hipotesis nihil pada rancangan repeated measures dilakukan dengan uji
varian atau Varian Ratio, yaitu membandingkan varian antar waktu pengukuran dengan
varian residu dengan tabel resume sebagai berikut.
Tabel 9.2.2 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah kwadrat d.b. varian Varian Ratio
Pengukuran JKP j-1 MKP=JKP/(j-1) MKP/MKE
Subjek JKB i-1 MKB=JKB/(i-1)
Residu/Eror JKE (j-1)(i-1) MKE=JKE/(j-1)(i-1)
Total JKT n-1
Keterangan:
JKP = jumlah kwadrat antar waktu pengukuran
JKB=jumlah kwadrat antar subjek
JKE=jumlah kwadrat residu
JKT= jumlah kwadrat total
n= jumlah sampel
j= jumlah pengukuran
i = jumlah subjek
MKP= varian antar waktu pengukuran
MKB= varian antar subjek
MKE= varian residu
120
Cara menghitung Jumlah Kwadrat (JK)
j i
JKT = ∑∑ ( xij − x .. ) 2
j =1 i =1
j i
JKP = ∑∑ ( x . j − x .. ) 2
j =1 i =1
j i
JKB = ∑∑ ( x i. − x .. ) 2
j =1 i =1
Contoh kasus
Suatu penelitian dengan rancangan repeated measures dilakukan untuk mengetahui
efektivitas program penurunan tingkat stress dengan meditasi. Tingkat tress diukur
sebanyak tiga kali, yaitu sebelum perlakuan, setelah perlakuan dan 3 bulan setelah
perlakuan. Hasil pengukuran adalah sbb:
Tabel 9.3.2 Data hasil pengukuran tingkat stress pada 14 dengan kecemasan
Subjek Pretest Posttest 3 bulan Mean
1 21 17 15 17,67
2 35 10 20 21,67
3 19 16 10 15,00
4 35 29 20 28,00
5 34 25 10 23,00
6 41 30 23 31,33
7 15 10 6 10,33
8 11 8 5 8,00
9 40 23 17 26,67
10 23 20 12 18,33
11 25 17 13 18,33
12 18 10 7 11,67
121
13 37 30 19 28,67
14 31 15 12 19,33
Mean 27,50 18,57 13,50 19,86
Kesimpulan
Ho ditolak (p < 0,05), berarti jenis metode pembelajaran memberikan efek yang berbeda
terhadap rerata waktu yang diperlukan sampai bisa memakai alat bantu tersebut.
122
a R Squared = .880 (Adjusted R Squared = .811)
Dari tabel hasil analisis di atas diketahui bahwa VR perbedaan skor stress sebelum
perlakuan, setelah perlakuan dan 3 bulan setelah perlakuan sebesar 39,416 dengan nilai p =
0,000. Ini berarti Ho yang menyatakan tidak terdapat perbedaan rerata di tolak. Sehingga
dapat disimpulkan bahwa terdapat perbedaan rerata skor stres antara sebelum perlakuan
dengan setelah perlakuan dan 3 bulan setelah perlakuan.
Untuk mengetahui mana yang berbeda dengan yang maka, maka selanjutnya dilakukan
Post Hoc test dengan metode Sheffe dan hasilnya adalah sebagai berikut.
Tabel 9.3.5 Hasil analisis Post Hoc antara skor stres sebelum, sesudah dan
3 bulan setelah perlakuan
pengukuran N Subset
1 2 3
3 14 13.50
2 14 18.57
1 14 27.50
Sig. 1.000 1.000 1.000
Means for groups in homogeneous subsets are displayed.
Dari tabel di ats diketahui bahwa rerata skor stress sebelum perlakuan adalah 27,5, setelah
perlakuan adalah 18,57 dan 3 bulan setelah perlakuan adalah 13,5. Ketiga rerata tersebut
terletak di dalam subset yang berbeda, berarti ketiga skor tersebut berbeda secara
bermakna, dimana terjadi penurunan skor setelah perlakuan dan menurun lagi setelah 3
bulan pasca perlakuan. Sehingga dapat disimpulkan bahwa program reduksi stres dapat
menurunkan tingkat stress secara bermakna.
123
disebut sebagai faktor dan jumlah kategori dari setiap faktor disebut level. Bila yang diteliti
adalah Faktor I obat A dengan 2 level, yaitu dosis 1 (50mg) dan dosis 2 (placebo) dan
faktor II adalah vitamin C dengan 2 level, yaitu vit 1 diberi 500 mg vit C dan vit 2
(placebo), maka percobaan ini disebut rancangan faktorial 2x2. Berati akan terdapat 4
kelompok percobaan, yaitu percobaan 1 mendapat dosis obat 50 mg + 500mg vit C,
percobaan 2 mendapat dosis obat 50 mg, percobaan 3 mendapat 500 vit C, dan percobaan 4
mendapat placebo saja, seperti bagan di bawah ini.
Faktor II
Faktor I Vitamin Placebo
Obat Percobaan 1 Percobaan 2
Obat + Vitamin Obat
Placebo Percobaan 3 Percobaan 4
Vitamin Placebo
Pada penelitian dengan rancangan faktorial, peneliti tidak saja akan mempelajari efek dari
masing-masing faktor, akan tetapi juga dapat meneliti adanya efek interaksi antara faktor
yang diteliti. Interaksi antar faktor menunjukan bahwa respon faktor I berubah pada salah
satu level dari faktor II. Berikut contoh bagan yang menunjukan adanya efek interaksi dan
yang tidak ada interaksi.
30 30
vit C Vit C
25 placebo 25 Placebo
20 20
15 15
10 10
5 5
0 0
Obat plcebo Obat Placebo
Gambar 2. Interaksi antara obat dan vit Gambar 3. Tidak ada interaksi obat dengan vit
124
9.4.2 Analisis Two-Way Anova pada Rancanga Faktorial
Dalam analisis data rancangan faktorial, teknik analisis Two-Way Anova merupakan teknik
analisis varian dimana hasil observasi dikategorikan berdasarkan faktor yang diteliti,
sebagai bagan di bawah ini.
Tabel 9.2.2 Tabel hasil pengukuran luaran penelitian dengan rancangan acak kelompok
Model
Model matermatik analisis Two-Way Anova untuk rancangan faktorial adalah sebagai
berikut.
xijk = µ + αi + βj + (αβ)ij + eijk
dimana:
xijk = nilai variabel luaran
µ = konstan yang tidak diketahui
αi = efek faktor I (A)
βj = efek faktor II (B)
(αβ)ij = interaksi faktor I dan II
eijk = residu atau error term
125
Asumsi Model
1) xijk merupakan variabel random dengan nilai kontinyu (interval)
2) data xijk untuk masing-masing subpopulasi berdistribusi normal
3) semua kelompok memiliki varian yang sama (homogen)
Hipotesis Statistik
Faktor I (A)
Ho: αi = 0 (perlakuan A tidak memberikan efek)
Ha: tidak semua αi # 0 (perlakuan A memberikan efek)
Faktor II(B)
Ho: βj = 0 (perlakuan B tidak memberikan efek)
Ha: tidak semua βj # 0 (perlakuan B memberikan efek)
Interaksi A dan B
Ho: (αβ)ij = 0 (tidak ada interaksi)
Ha: tidak semua (αβ)ij # 0 (ada interaksi)
Uji Statistik
Untuk menguji hipotesis nihil pada rancangan repeated measures dilakukan dengan uji
varian atau Varian Ratio, yaitu membandingkan varian antar waktu pengukuran dengan
varian residu dengan tabel resume sebagai berikut.
Tabel 9.2.2 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah d.b. varian Varian Ratio
kwadrat
Faktor I (A) JKA i-1 MKP=JKP/(i-1) MKP/MKE
Faktor II (B) JKB j-1 MKB=JKB/(j-1) MKB/MKE
Interaksi (AB) JKAB (i - 1)(j - 1) MKAB=JKAB/(i-1)(j-1) MKAB/MKE
Residu/Eror JKE ij(k - 1) MKE=JKE/(j-1)(i-1)
Total JKT ijk - 1
126
Keterangan:
JKA = jumlah kwadrat faktor A JKB=jumlah kwadrat faktor B
JKAB=jumlah kwadrat interaksi AB JKE=jumlah kwadrat residu
JKT= jumlah kwadrat total MKP= varian antar perlakuan A
MKB= varian antar perlakuan B MKAB=varian ineraksi AB
MKE= varian residu k= jumlah sampel di setiap kelompok percobaan
j= jumlah perlakuan pada faktor B i = jumlah perlakuan pada faktor A
j i
JKA = ∑∑ ( x i. − x .. ) 2
j =1 i =1
b a
JKB = ∑∑ ( x . j − x .. ) 2
j =1 i =1
b a n
JKAB = ∑∑∑ ( x ij − x .. ) 2
j =1 1=1 k =1
Contoh kasus
Akan diteliti efek kastrasi sebagai faktor I dan adrenektomi sebagai faktor II terhadap
intake kalori pada tikus. Faktor I (kastrasi) dengan 2 perlakuan, yaitu 1=dikastrasi dan
2=tidak), dan faktor II (adrenektomi) juga dengan 2 perlakuan, yaitu 1=diadrektomi dan
2=tidak. Pada percobaan ini terdapat 4 kelompok percobann dan jumlah binatang coba
untuk setiap kelompok percobaan adalah 5 ekor tikus. Data hasil percobaan adalah sbb:
128
3078 3670
Total 17264 19232 36496
Mean 3452,8 3846,4 3649,6
Jumlah Varian
Sumber variasi Kwadrat d.b. Varian Ratio Nilai P.
kastrasi 1686062,450 1 1686062,450 10,115 < 0,05
adrenalektomi 1522968,050 1 1522968,050 9,136 < 0,05
kastrasi *
125294,450 1 125294,450 0,752 >0,05
adrenalektomi
Error 2667118,000 16 166694,875
Total 6001442,950 19
Kesimpulan
1) Efek kastrasi:
Ho yang menyatakan tidak ada efek kastrasi terharap kalori intik ditolak dimana VR =
10,115 dengan nilai p < 0,05, berarti kastrasi berpengaruh terhadap kalori intake. Tikus
yang dikastrasi mempunyai rerata iktake kalori lebih rendah dari yang tidak dikastrasi.
129
2) Efek adrenalektomi:
Ho yang menyatakan tidak ada efek adrenalekotomi terharap kalori intik ditolak dimana
VR = 9,136 dengan nilai p < 0,05, berarti adrenalektomi berpengaruh terhadap kalori
intake. Tikus yang diadrenalektomi mempunyai rerata iktake kalori lebih rendah dari
yang tidak diadrenalektomi.
3) Interaksi:
Ho yang menyatakan tidak terdapat interaksi antara kastrasi dan adrenalektomi diterima
dimana VR = 0,752 dan nilai p > 0,05. Ini berarti tidak terdapat interaksi antara kastrasi
dengan adrenalektomi.
4600.00 kastrasi
ya
tidak
4400.00
Estimated Marginal Means
4200.00
4000.00
3800.00
3600.00
3400.00
ya tidak
adrenalektomi
130
MODUL 10
Simple Correlation and Regression Analysis
10.1 Pendahuluan
Pada modul 6 dan 7 telah dibahas metode analisis perbedaan rerata antara kelompok
penelitian. Selain membandingkan antar kelompok penelitian, pada banyak penelitian
dipelajari hubungan antara variabel. Sebagai contoh misalnya akan diteliti hubungan atara
kadar hormon estriol pada ibu hamil pada umur kehamilan trimester 3 dengan berat badan
lahir dari bayi yang dilahirkan. Pada modul ini akan dibahas metode analisis hubungan atau
pengaruh antara variabel numerik dengan variabel numerik lainnya, yaitu metode analisis
korelasi dan regresi.
131
Arah hubungan kedua variabel X dan Y bisa positif atau searah dan bisa negatif atau
berlawanan arah. Kedua variabel dinyatakan memiliki hubungan serarah bila gambar
menunjukan jika nilai X bertambah, nilai Y juga bertambah. Sebaliknya kedua variabel
dikatakan memilki hubungan negatif bila scatter plot menunjukan bila nilai X bertambah
akan diukuti oleh penurunan dari nilai Y. Berikut adalah contoh beberapa bentuk scatter
plot.
17.50 14.00
12.00
15.00
10.00
12.50
8.00
Y
Y
6.00
10.00
4.00
7.50
2.00
5.00 0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
X X
15.00 14.00
12.00
12.00
10.00
9.00
8.00
Y
6.00
6.00
4.00
3.00
2.00
0.00 0.00
0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00
X X
15.00
10.00
Y
5.00
0.00
132
10.2.3 Koefisien Korelasi
Apabila variabel X dan Y yang diteliti hubungannnya, maka kuat dan arah hubungan dari
kedua variabel tersebut, selain dapat dilihat secara kasar dari scatter plot, juga dapat
ditentukan dengan koefisien korelasi dari hubungan kedua variabel tersebut. Koefisien
korelasi diberi simbul ‘r’ memiliki rentang nilai absolutnya dari 0 sampai dengan 1. Nilai r
= 0, berarti kedua variabel tersebut sama sekali tidak berhubungan atau nilai dari variabel
yang satu sama sekali tidak berkaitan dengan nilai variabel yang lainnya. Bila nilai r antara
0,1 – 0,39 dinyatakan ada hubungan yang ringan, nilai r antara 0,4-0,69 disebut ada
hubungan sedang, nilai r 0,7-0,99 dinyatakan ada hubungan yang kuat dan bila nilai r = 1
menunjukkan adanya hubungan yang sempurna antara kedua variabel tersebut. Hubungan
sempurna artinya setiap kenaikan satu unit dari variabel yang pertama akan diikuti pula
oleh meningkatnya satu unit dari variabel yang kedua dan scatter plotnya akan berbentuk
sebuah garis lurus.
Arah hubungan dari kedua variabel tersebut ditentukan dari tanda +/- dari nilai r. Bila nilai
r bertanda negatif maka kedua variabel tersebut dinyatakan memiliki hubungan negatif
(berlawanan arah). Sebaliknya, bila nilai r bertanda positif maka kedua variabel tersebut
memiliki hubungan positif (searah). Hubungan positif artinya arah perubahan kedua nilai
variabel tersebut searah. Bila nilai dari variabel yang satunya naik akan diikuti pula oleh
naiknya nilai variabel yang satu lagi. Misalnya umur dan berat badan mempunyai hubungan
positif artinya bila umur bertambah, maka berat badan juga bertambah. Sebaliknya,
hubungan negatif berarti arah perubahan nilai kedua variabel tersebut berlawanan. Bila nilai
variabel yang satu naik, akan diikuti oleh menurunnya nilai variabel yang lain. Misalnya
hubungan antara bensin dalam tangki dengan jarak yang ditempuh. Makin jauh jarak yang
ditempuh, makin berkurang jumlah bensin di dalam tangki.
Rumus:
r=
∑ XY − (∑ X ∑ Y )/ n
{∑ X 2
− (∑ X ) / n}{∑ Y − (∑ Y )
2 2 2
}
/n
Keterangan:
r = koefisien korelasi
ƩXY = jumlah hasil kali nilai var X dengan var Y
133
ƩX = jumlah nilai var X
ƩY = jumlah nilai var Y
ƩX2 = jumlah nilai var X kwadrat
ƩY2 = jumlah nilai var Y kwadrat
n = jumlah sampel
Misalnya suatu survei dilakukan pada 15 ibu dengan kegemukan untuk mempelajari
hubungan berat badan dengan kadar kolesterol darah. Hipotesis penelitian menyatakan ada
hubungan positif antara berat badan dengan kolesterol darah. Berikut akan diuraikan cara
menghitung koefisien korelasi antara berat badan dengan kolesterol darah.
BB Koles
No XY X2 Y2
(X) (Y)
1 60 150 9000 3600 22500
2 75 200 15000 5625 40000
3 80 250 20000 6400 62500
4 81 275 22275 6561 75625
5 65 250 16250 4225 62500
6 72 235 16920 5184 55225
7 65 185 12025 4225 34225
8 73 200 14600 5329 40000
9 74 225 16650 5476 50625
10 68 210 14280 4624 44100
11 63 200 12600 3969 40000
12 80 270 21600 6400 72900
13 76 250 19000 5776 62500
14 69 225 15525 4761 50625
15 67 200 13400 4489 40000
Total 1068 3325 239125 76644 753325
134
10.2.4 Uji Hipotesa Koefisien Korelasi
Sangatlah tidak mungkin menentukan korelasi variabel X dan Y di populasi, maka pada
banyak penelitian, penentuan korelasi X dan Y dilakukan pada sampel. Untuk menentukan
apakah korelasi yang ditentukan dari sampel benar menggambarkan korelasi X dan Y di
poluasi, maka perlu dilakukan uji hipotesis degan langkah berikut.
1) Menetapakan hipotesis untuk korelasi
Hipotesis statistik sbb:
Ho: ρ = 0 (tidak ada hubungan)
Ha: ρ # 0 (ada hubungan)
Keterangan:
t = nilai statistik t
r = koefisien korelasi sampel
n = jumlah sampel
135
10.2.5 Contoh output SPSS
1. Scatter Plot
6.00
5.00
4.00
Loyalitas
3.00
2.00
1.00
Tingkat kepuasan
Dari grafik pencar di atas tampak terdapat hubungan positif antara tingkat kepuasan
dengan loyalitas klien rumah sakit. Makin tinggi tingkat kepuasan klien makin
tinggi pula tingkat loyalitas klien terhadap rumah sakit tersebut.
2. Koefisien Korelasi
Correlations
Tingkat
kepuasan Loyalitas
Tingkat kepuasan Pearson Correlation 1 ,572**
Sig. (2-tailed) ,000
N 200 200
Loyalitas Pearson Correlation ,572** 1
Sig. (2-tailed) ,000
N 200 200
**. Correlation is significant at the 0.01 level (2-tailed).
Dari contoh output SPSS di atas diketahui bahwa tingkat kepuasan klien memiliki
koefisien korelasi 0,572 dengan nilai p = 0,000. Hasil tersebut menunjukan bahwa
kepuasan pasien memiliki hubungan positif sedang dengan tingkat loyalitas klien
dan hubungan tersebut secara statistik bermakna.
136
10.3 Regresi Linear Sederhana
10.3.1 Indikasi
Analisa regresi dalam bidang kesehatan dapat dipakai untuk dua tujuan, yaitu: untuk tujuan
estimasi atau memperkirakan nilai suatu variabel dari nilai variabel yang lainnya. Misalnya
memperkirakan umur kehamilan dari tinggi fundus uteri. Selain itu, regresi juga dipakai
untuk tujuan menentukan besar pengaruh satu variabel bebas (independent variable)
terhadap suatu variabel tergantung (dependent variable). Kegunaan analisa regresi untuk
mempelajari besarnya pengaruh variabel bebas terhadap variabel tergantung paling sering
dijumpai dalam penelitian kesehatan. Variabel yang mempengaruhi disebut sebagai
variabel bebas atau prediktor atau risk faktor, sedangkan variabel yang dipengaruhi disebut
variabel tergantung atau outcome atau efek.
Sebagai contoh, misalnya dalam satu penelitia akan dipelajari pengaruh berat badan lahir
(BBL) dengan pertambahan berat badan bayi. BBL merupakan variabel bebas X,
sedangkan pertambahan berat badan bayi sebagai variabel tergantung Y. Pengaruh BBL
terhadap pertambahan berat badan dihipotesakan bahwa makin besar berat badan lahir,
akan makin kecil pertambahan berat badan bayi. Studi ini dilakukan terhadap 30 sampel
bayi yang dipilih secara random. Berat badan baru lahir (BBL) dan berat badan setelah
berumur 3 bulan diukur dengan alat timbangan bayi yang standar. Data pengukuran berat
badan bayi adalah sebagai berikut:
137
10.3.2 Model Regresi Linear
Dalam analisa regresi, pengaruh variabel bebas X terhadap variabel tergantung Y
diasumsikan linier, sehingga hubungan dari kedua variabel tersebut dapat dinyatakan dalam
suatu persamaan garis lurus yang disebut sebagai Model Regresi Linier sebagai berikut:
Y = a + bX
Keterangan:
Y = variabel tergantung (dependent variable)
X = variabel bebas (independent variable)
b = koefisien regresi
a = konstan atau intercept
Dalam penelitian pengaruh BBL terhadap pertambahan berat badan seperti contoh di atas,
berat badan waktu lahir merupakan variabel bebas X, sedangkan persentase pertambahan
berat badan setelah 3 bulan merupakan variabel tergantung Y. Dari model di atas
digambarkan, bahwa besarnya perubahan berat badan (Y) dipengaruhi oleh berat badan
waktu lahir (X).
b=
∑ XY − (∑ X )(∑ Y ) / n
2 2
∑ X − (∑ X ) / n
Keterangan:
b = koefisien regresi
∑XY = jumlah hasil kali nilai var bebas (X) dengan nilai var tak bebas (Y)
∑X = jumlah nilai variabel bebas (X)
∑Y = jumlah nilai var tak bebas (Y)
2
∑X = jumlah kwadrat nilai var bebas (X)
n = jumlah sampel
138
Besarnya koefisien regresi hubungan antara BBL dengan persentase perubahan berat badan
setelah 3 bulan dari penelitian di atas dapat dihitung sebagai berikut:
X Y XY X2 Y2
2,4 68 163,2 5,76 4624
3,7 63 233,1 13,69 3969
3,7 66 244,2 13,69 4356
3,5 72 252,0 12,25 5184
3,9 52 202,8 15,21 2704
3,0 75 225,0 9,00 5625
4,2 76 319,2 17,64 5776
2,6 118 306,8 6,76 13924
2,7 120 324,0 7,29 14400
2,8 114 319,2 7,84 12996
3,8 29 110,2 14,44 841
3,9 42 163,8 15,21 1764
4,3 48 206,4 18,49 2304
4,3 50 215,0 18,49 2500
4,1 69 282,9 16,81 4761
3,9 59 230,1 15,21 3481
4,1 27 110,7 16,81 729
4,2 60 252,0 17,64 3600
4,0 71 284,0 16,00 5041
4,2 88 369,6 17,64 7744
4,2 63 264,6 17,64 3969
2,9 88 255,2 8,41 7744
4,7 53 249,1 22,09 2809
4,4 50 220,0 19,36 2500
2,9 111 321,9 8,41 12321
4,1 59 241,9 16,81 3481
4,4 76 334,4 19,36 5776
3,5 72 252,0 12,25 5184
3,4 90 306,0 11,56 8100
3,1 91 282,1 9,61 8281
∑X = 110,9 ∑Y = 2120 ∑XY = 7541,4 ∑X2 = 421,37 ∑Y2=166488
139
2) Menghitung koefisien b:
7541,4 − (110,9)(2120) / 30
b=
421,37 − (110,9) 2 / 30
− 295,533
b= = −25,9
11,409
Nilai b = - 25,9 artinya kalau BBL bertambah 1 kg, maka persentase pertambahan BB
akan berkurang 25,9% .
140
Penyimpangan nilai Yi terhadap rata-rata Y dapat digambarkan pada bagan di bawah ini.
Y
(Xi,Yi) Y’= a + bX
_ (Yi-Yi’)
(Yi-Y) _
(Yi’-Y)
_
Y
Dari bagan di atas tampak deviasi Y’i terhadap Y terbagi menjadi dua bagian, sehingga
dapat dinyatakan seperti persamaan berikut ini:
Bila jumlah kuadrat dari masing-masing deviasi tersebut dihitung, maka akan didapatkan
sebagai berikut:
2 2 2
∑ (Yi − Y ) = ∑ (Yi − Y ' i) + ∑ (Y ' i − Y )
dimana:
2
∑ (Yi − Y ) = adalah Total Sum Square (TSS)
2
∑ (Yi − Y ' i) = adalah Residu Sum Square (ESS)
2
∑ (Y ' i − Y ) = adalah Regression Sum Square (RSS)
maka:
R 2 = RSS / TSS
141
RSS = (Y ' i − Y ) 2 , maka
2
{∑ XY − (∑ X )(∑ Y ) / n}
RSS = 2 2
∑ X − (∑ X ) / n
Oleh karena itu, nilai koefisien determinasi untuk contoh penelitian di atas dapat dihitung
sebagai berikut:
1) menghitung Total Sum Squared (TSS):
n = 30
ƩX = 110,9 ƩY = 2120
2 2
ƩX = 421,37 ƩY = 166488
Jadi berat badan waktu lahir berpengaruh sekitar 46% terhadap perubahan berat badan anak
setelah berumur 3 bulan dan 54% lainnya ditentukan oleh faktor lain.
142
10.3.5 Uji Hipotesis R2
Apakah nilai koefisien determinasi pada sampel juga berlaku untuk populasi? Untuk
menjawab pertanyaan ini, kita perlu menguji kemaknaan dari nilai koefisien determinasi
tersebut. Uji kemaknaan koefisien determinasi dilakukan dengan uji F (varian) dengan cara
penghitungan sebagai berikut:
1) Hipotesa statistik:
Ho: R2 = 0
Ha : R2 # 0
2) Menghitung nilai F:
F = Msreg / Msres
dimana:
MSreg = SSR/k
MSres = (TSS – SSR) / (n-k-1)
Keterangan:
F = nilai statistik F
MSreg = rata-rata varian regresi
MSres = rata-rata varian residu
SSR = total varian regresi
k = jumlah variabel bebas dalam model
TSS = total varian variabel tergantung
n = jumlah sampel
Dengan menggunakan data penelitian di atas dapat dihitung nilai statistik F sebagai
berikut:
1) Total Sum Square (TSS) = 16674,6667
2) Regression Sum Sqquare (RSS) = 7654,8857
3) Derajat Bebas Regresi (k) = 1 (jumlah var bebas)
4) Rata-rata RSS (MRSS) = RSS/k = 7654,8857
5) Residu Sum Square (ESS) = TSS-RSS = 9019,781
6) Rata-rata Residu Sum Square (MESS) = ESS/df res
= ESS/n-k-1
= 9019,781/28
= 322,1350
7) Statistik F = MRSS/MESS
= 7654,8857/322,1350 = 23,769
143
Resume Anova test
Hasil perhitungan di atas dapat disajikan dalam sebuah tabel resume sbb:
α
4,20
Ho diterima CV Ho ditolak
4) Kesimpulan:
Ho: ditolak karena kemungkinan Ho benar adalah lebih kecil dari 5% (p<0,05) dan ini
berartti koefisien determinasi R2 = 0,45 adalah berlaku untuk populasi, sehingga dapat
disimpulkan 45% perubahan berat badan bayi setelah berumur 3 bulan ditentukan oleh
BBL dari bayi tersebut.
144
Y
120.00 Observed
Linear
100.00
80.00
60.00
40.00
20.00
Dari Scatter plot diatas tampak hubungan variabel X dan Y berdistribusi normal.
2) Nilai variabel tergantung Y memiliki varian yang sama untuk setiap nilai X dan
berdistribsi normal serta memilki nilai rerata yang terletak pada satu garis lurus
atau dikenal dengan istilah homoskedastik. Homoskedasitas dari variabel
tergantung Y dapat dilihat dari scatter plot antara nilai prediksi standar (ZPRED)
dengan nilai student T residu (SRESID).
Scatterplot
Dependent Variable: Y
2
Regression Studentized Residual
-1
-2
-2 -1 0 1 2
Dari scatter plot residu di atas tampak bahwa distribusi plotnya tidak menunjukan
bentuk spesifik, maka dapat disimpulkan asumsi homoskedastik terpenuhi.
145
LATIHAN:
1. Suatu eksperimen telah dilakukan untuk mengukur efek obat X terhadap penurunan
denyut jantung. Variabel bebasnya adalah dosis obat dalam mg dan sebagai variabel
tergantung adalah penurunan denyut jantung dari sebelum diberi obat dengan sesudah
diberi obat. Data yang didapat adalah sebagai berikut:
Penurunan Penurunan
Dosis obat Denyut jantung Dosis obat Denyut jantung
(X) (Y) (X) (Y)
0,5 10 0,75 8
1,0 12 1,25 12
1,5 14 1,75 12
2,0 16 2,25 18
2,5 17 2,75 17
3,0 18 3,25 20
3,5 21 3,75 20
Gambarkan sketer plot dari hubungan kedua variabel tersebut dan hitung koefisien
korelasinya serta uji apakah obat tersebut memberikan efek terhadap penurunan denyut
jantung pada tingkat kemaknaan 99%.
Hitung pula koefisien regresi “b” dan koefisien determinasi “R2” nya.
2. Bagian phatologi Klinik FK ditugaskan ubtuk menera alat pengukur tekanan darah
yang menggunakan pegas. Alat pengukur tekanan darah yang dipakai standar
selanjutnya disebut metoda I dan yang akan ditera disebut sebagai metoda II. Sebanyak
25 pasien diukur tekanan sistolenya dengan menggunakan kedua metoda tadi dan
hasilnya adalah sebagai berikut:
146
Data hasil pengukuran tekanan darah dengan kedua metoda
13 180 168
Peneliti ingin mengetahui kuatnya hubungan antara metoda. Buatlah sketer plot dari
kedua variabel tersebut, hitung koefisien korelasinya dan uji apakah kedua metoda
setara pada kemaknaan 99%.
Hitung pula koefisien regresi “b” dan koefisien determinasi “R2” nya.
147
MODUL 11
PERBEDAAN RISIKO
Comparing Risks
11.1 Pendahuluan
Pada penelitian kesehatan sering dipelajari hubungan antara dua variabel kategori atau
lebih, seperti misalnya terjadinya suatu penyakit dikaitkan dengan keberadaan faktor risio
tertentu. Sebagai contoh, misalnya akan diteliti apakah kebiasaan merokok meningkatkan
resiko terjadinya penyakit jantung koroner.
Dua jenis ratio yang sering dipakai untuk memperkirakan besarnya resiko, yaitu: relatif risk
(RR) dan odd ratio (OR). RR dan OR dikembagkan di bidang epidemiologi, tetapi sekarang
pengunaannya tidak hanya di bidang epidemiologi melainnya dibanyak penelitian
kesehatan. RR dan OR dipakai menentukan besarnya resiko pada penelitian prospektif dan
OR dipakai dalam penelitian retrospektif.
Pada modul ini akan dibahas tentang pengertian penelitain prospektif dan retrospektif, RR,
OR dan uji Chi-square.
Penelitian prospektif merupakan kjenis penelitian dimana variabel tergantung atau variabel
outcome diamati secara prospektif. Pada rancangan penelitian ini terdapat dua kelompok
subjek yaitu kelompok yang memiliki faktor resiko yang dipelajri dan kelompok yang tidak
memiliki faktor resiko. Kelompok subjek pertama disebut kelompok terpapar dan
kelompok subjek ke dua disebut kelompok kontrol. Kedua kelompok selanjutnya diikuti ke
depan (they are followed prospectively) sampai waktu tertentu. Terjadinya outcome pada
kedua kelompok sunjek yang diteliti direkod sampai penelitian selesai.
Penelitian retrospektif (case-control study) adalah kebalikan dari penelitian prospetif. Pada
penelitian case-control, pemilihan subjek penelitian dimuai dari mereka yang memiliki
148
kategori outcome variabel sebagai kasus dan yang tidak memiliki kategori outcome dipakai
sebagai kontrol. Selanjutnya, pada kelompok kasus dan kontrol diteliti kebelakang (look
back) apakah terdapat faktor resiko yang diteliti atau tidak.
Hasil pengukuran outcome dan risk factors pada penelitian prospektif ataupun penelitian
retrospektif disajikan dalam tabel 2x2 sebagai berikut:
Reralif risk (RR) tepat dipakai sebagai ukurkan resiko relatif antara kelompok ekspose dan
nonekspose pada penelitian prospektif (kohort), trial, dan penelitian cross-sectional. Relatif
risk merupakan perbanding resiko sakit antara kelompok terekspose dengan kelompok
nonekspose. Resiko sakit pada kelompok terekspose adalah jumlah yang sakit dibagi
dengan jumlah kelompok terekspose = a/(a+b). Resiko sakit dari kelompok nonekspose
(kontrol) adalah = c/(c+d), maka resiko relatif antara ke dua kelompok adalah:
a/(a+b)
RR = ------------
c/(c+d)
Nilai RR = 1, berarti resiko sakit antara kelompok yang memilki resiko sama dengan resiko
sakit dari kelompok yang tidak memiliki resiko. Bila RR = 1 menunjukan bahwa faktor
tersebut tidak meningkatkan resiko terjadinya penyakit tersebut. Nilai RR > 1
mengindikasikan bahwa keberadaan faktor resiko tersebut meningkatkan resiko terjadinya
penyakit pada kelompok ekspose. Nilai RR < 1 mengindikasikan bahwa keberadaan faktor
yang diteliti tersebut memberikan efek pencegahan atau dapat menurunkan resiko
terjadinya penyakit tersebut pada yang memilki faktor tersebut.
149
Untuk mengetahui apakah RR di populasi berbeda dengan 1, maka nilai RR yang
didapatkan dari sampel dihitung nilai conviden intervalnya atau diuji kemaknaannya
dengan uji chi-square.
Penentuan CI dari RR
Nilai CI dari RR dapat dihitung dengan langkah sebagai berikut:
1. hitung nilai RR
2. hitung batas bawah CI 95% RR = RR x Exp{-1,96 √(1/a-1/(a+b)+1/c-1/(c+d)}
3. hitung batas atas CI 95% RR = RR x Exp{-1,96 √(1/a-1/(a+b)+1/c-1/(c+d)}
Contoh:
Misalnya akan diteliti resiko bayi memiliki APGAR < 7 antara ibu dengan riwayat
persalinan beresiko dengan yang tidak memiliki riwayat persalinan beresiko. Hasil
pengukuran APGAR skor dari kedua kelompok adalah sbb:
Resiko memiliki Apgar <7 pada kelompok ibu yang memeiliki riwayat persalinan berresiko
= 33/91 = 0,36 dan resiko pada kelompok ibu yang tidak memiliki persalinan beresiko =
2/16 = 0,125. Dari hasil tersebut didapatkan nilai RR sampel = 0,36/0,125 = 2,88.
150
Jadi dengan tingkat kepercayaan 95%, RR memilki apgar < 7 antara ibu yang memeiliki
riwayat persalinan beresiko dengan yang tidak memeilki riwayat persalinan bersiko
berkisar antara 0,76 s/d 10,83.
Dari hasl tersebut didapat bahwa RR = 1 ada dalam CI tersebut, maka dapat dismpulkan
bahwa resiko memiliki apgar skor <7 antara ibu yang memilki persalinan bersiko dengan
yang tidak memiliki riwayat persalinan beresiko adalah sama. Dengan kata lain dapat
disimpulkan bahwa memeilki riwayat persalinan beresiko tidak meningkatkan resiko
melahirkan bayi dengan apgar skor < 7.
Perbedaan resiko antara kelompok ekspose dan nonekspose juga dapat diuji dengan uji chi-
square. Uji chi-square untuk RR akan dibahas pada bagian 9.5 di bawah.
Odd Ratio adalah ratio antara Odd terjadinya ekspose antara kasus dan kontrol. Odd
didefinisikan sebagai perbanding probabilitas terjadinya ekspose dan nonekspose. Bila p
adalah probabilitas terjadinya ekspose maka 1-p merupakan probabilitas tidak terjadinya
ekspose, oleh karena itu Odd = p/(1-p). Maka Odd Ratio dapat dihitung sbb:
151
2. Odd kontrol terekspose = b/(b+d)/d/(b+d) = b/d
3. OR = Odd kasus/Odd kontrol = a/c/b/d = ad/bc
Nilai OR sama dengan 1 menunjukan bahwa resiko terjadi sakit antara kelompok ekspose
dan nonekspose tidak berbeda. Nilai OR > 1 menunjukan bahwa resiko terjadinya sakit
pada kelompok ekspose lebih tinggi dari nonekspose. Nilai OR < 1 mengindikasikan
terjadinya penurunan resiko sakit pada kelompok terekspose atau juga disebut keberadaan
faktor tersebut memberikan efek pencegahan.
Nilai OR di populasi dari diperkirakan dengan menghitung confident interval (CI) dari OR
sampel. Cara menghitung CI OR adalah sbb:
1. Hitung nilai OR sampel
2. Hitung batas bawah CI = OR x Exp{-1,96 √(1/a+1/b+1/c+1/d)}
3. Hitung batas atas CI = OR x Exp{1,96 √(1/a+1/b+1/c+1/d)}
Contoh kasus:
Suatu penelitian case-control dilakukan untuk mempelajari hubungan antara paparan debu
asbes dengan kanker paru (bronchial carcinoma). Sebanyak 223 kasus dan 715 kontrol yang
diteliti. Data hasil penelitian disajikan sbb:
152
Jadi 95% kemungkinan OR di populasi berkisar antara 1,337 sampai 2,506. Berarti paparan
debu asbes meningkatkan resiko kanker paru (bronchial carcinoma) antara 1,33 sampai 2,5
kali dibandingkan dengan yang tidak terpapar oleh debu asbes.
Pada rancangan matched case-control, setiap kasus dipilihkan kontrol yang memiliki ciri
yang sama dengan kasus. Dalam penelitian ini, yang menjadi subjek analisis adalah
pasangan kasus-kontrol, misalnya subjek yang dipakai sebanyak 60 orang yang terdiri dari
30 kasus dan 30 kontrol, maka pasangan subjeknya adalah sebanyak 30 pasang. Penyajian
hasil pengamatan faktor resiko berbeda dengan rancangan independent case-control.
Penyajian data matched case-control adalah sbb;
Keterangan:
a = jumlah pasangan dimana kasus dan kontrol terekspose
b = jumlah pasangan dimana kasusnya terekspose dan kontrol tidak
c = jumlah pasangan dimana kasusnya tidak terekspose dan kontrol terekspose
d = jumlah pasangan dimana kasus dan kontrol keduanya tidak terekspose
OR = b/c
153
Contoh kasus:
Suatu penelitian matched case-control dilakukan untuk mempelajari hubungan antara
paparan debu asbes dengan kanker paru (bronchial carcinoma). Sebanyak 223 pasangan
kasus dan kontrol yang diteliti. Data hasil penelitian disajikan sbb:
Jadi 95% kemungkinan OR populasi berkisar antara 1,84 s/d 3,99, berarti ekspose debu
asber meningkat resiko kanker paru.
Uji Chi-square dipakai menguji hipotesis hubungan antara variabel kategorikal. Pada modul
ini akan dibahas uji hipotesis hubungan antara dua variabel kategori untuk rancangan
random dan rancangan berpasngan (matched design). Berikut adalah jenis uji hipotesis
hubungan dua variabel kategori dan indikasi penggunaannya.
154
Jenis uji hipotesis hubungan dua variabel kategorikal
Pada uji Chi Square dikenal ada dua jenis frekuensi yaitu frekuensi yang didapat (obsered
frequencies diberi simbol “O”) dan frekuensi yang diharapkan (expected frequencies
dengan simbol “E”). Frekuensi yang diharapkan adalah frekuensi dari setiap sel dari
kontingensi tabel yang didapat dari hasil tabulasi data yang dikumpulkan dari penelitian,
sedangkan frekuensi yang diharapkan adalah frekuensi yang diharapkans kalau Hipotesa
Null yang menyatakan kedua variabel tersebut tidak berhubungan itu benar. Pada
prinsipnya, Uji Chi square adalah membandingkan frekuensi yang didapat (obsered)
dengan frekuensi yang diharapkan (expected) dari setiap sel. Apabila kedua variabel
tersebut tidak berhubungan maka frekuensi yang didapat akan tidak berbeda dengan
frekuensi yang diharapkan, sehingga O – E = 0. Sedangkan nilai Chi Square adalah jumlah
(O – E)2/E dari semua sel pada tabel kontingensi, dengan rumus sebagai berikut:
(Oi − Ei ) 2
Rumus: X2 =∑
Ei
dimana
Oi = frekuensi yang didapat untuk sel ke i
Ei = frekuensi yang diharapkan untk sel ke I
155
11.5.1 Uji Chi-square untuk tabel 2 X 2
Indikasi
Bila di dalam suatu penelitian akan dipelajari hubungan dari dua variabel nominal yang
masing-masing variabel memiliki dua kategori, misalnya hubungan antara vacinasi
influensa dengan kejadian influensa. Vaksinasi influensa memiliki kategori dua yaitu
kategori pertama mendapat vaksin influensa dan kategori kedua tidak mendapat vaksin
influensa tetapi mendapat suntikan flacebo. Demikian pula dengan variabel kejadian
influensa memiliki dua kategori yaitu kategori pertama menderita influensa dan kategori
kedua tidak menderita influensa. Bila data dari kedua variabel tersebut didistribusikan ke
dalam sebuah tabel silang, maka akan didapat sebuah tabel kontingensi dengan 2 kolom
dan 2 baris yang dikenal dengan tabel kontingensi 2 x 2 atau tabel 2 x 2.
Uji Chi square untuk tabel 2 x 2 juga dapat dipergunakan untuk menguji perbedaan
proporsi dua sampel bebas. Misalnya untuk menguji perbedaan kejadian influensa pada
kelompok anak yang mendapat vaksinasi influensa dengan kejadian influensa pada
kelompok anak yang mendapat suntikan placebo.
Prosedur pengujian
1. Membuat frekuensi silang dari kedua variabel
Misalnya terdapat 460 orang yang mengikuti percobaan efektivitas vaksin influensa
dimana 240 mendapat vaksin dan 220 mendapat placebo. Data frekuensinya sebagai
berikut:
156
Tabel kerja:
Jmlbarisxjmlkolom (O − E ) 2
Sel O E=
Jmlsampel E
1 20 100x240/460 = 52,1739 19,84
2 80 100x220/460 = 47,8261 21,64
3 220 360x240/460 = 187,8261 5,51
4 140 360x220/460 = 172,1739 6,01
Jml 460 460,0000 53,00
Pada contoh di atas : df = (2-1) (2-1) = 1 dan α = 0,05. Dari tabel Chi Square
didapatkan nilai Chi Square batas adalah 3,841.
Ho : diterima bila nilai chi square hitung < 3,841
Ho : ditolak bila nilai Chi Square hitung ≥ 3,841
157
11.5.2 Uji Chi-square dengan koreksi Yate
Variabel kategorikal seperti variabel dengan skala pengukuran nominal atau ordinal tidak
memiliki satuan pengukuran yang kontinyu. Oleh karena itu, untuk meningkatkan validitas
nilai Chi Square dilakukan koreksi terhadap kontinuitas data dengan rumus sebagai berikut:
Rumus umum Chi-square dengan koreksi:
2
( Oi − Ei − 0,5) 2
X =∑
Ei
Untuk contoh kasus di atas akan didapatkan nilai Chi Square denga koreksi sebagai berikut:
Tabel kerja:
2
n( ad − bc − n / 2) 2
X =
(a + b)(c + d )(a + c)(b + d )
2
460( 20 x140 − 80 x 220 − 230) 2
X = = 51,37
(100)(360)(240)(220)
158
11.5.3 Fisher Exact Test
Indikasi
Exact test atau juga dikenal dengan uji Fisher Exact Probability adalah uji statistik non
parametrik yang sangat berguna untuk menganalisis data diskrit atau data kategorikal atau
nominal atau ordinal yang mempunyai dua kategori sehingga tabel analisisnya berbentuk
tabel 2 x 2, dengan sampel sangat kecil (n < 20) atau bila jumlah sampel antara 20 – 40
dimana salah satu sel memiliki frekuensi yang diharapkan (expected frequency) lebih kecil
dari 5. Untuk kondisi data seperti itu, uji Chi Square kurang valid. Bentuk umum tabel 2 x
2 adalah sebagai berikut:
Tabel kontingensi 2 x 2
+ - Total
Grup I a b a+b
Grup II c d c+d
Total a+c b+d n
Grup I dan II bisa kategori dari variabel bebas misalnya obat A dan obat B atau jenis
kelamin laki dan perempuan, dan sebagainya. Pada judul kolom ada tanda + dan -. Ini bisa
efek dari obat, kesembuhan, dan sebagainya.
Exact probabilitas dari frekuensi tabel 2 x 2 dengan jumlah pada baris dan kolomnya tetap
merupakan jumlah eksak probabilitas dari tabel yang didapat dari penelitian dan semua
kemungkinan tabel yang memiliki frekuensi yang lebih ekstrem dari tabel yang didapat dari
penelitian yang jumlah pada baris dan kolomnya tetap sama seperti tabel hasil penelitian.
Penghitungan eksak probabilitas setiap tabel 2 x 2 dihitung dengan menggunakan distribusi
hypergeometrik sebagai acuan. Penghitungan exact probablitas dilakukan dengan rumus
sbb:
159
Sebagai ilustrasi, mari ikuti contoh berikut. Misalnya dalam suatu penelitian klinil akan
dicobakan dua jenis obat sebut saja obat A dan obat B. Kedua obat tersebut akan diuji
efeknya terhadap pencegahan perdarahan pada operasi penderita haemopilia. Pelakuan
(obat A dan B) dialokasikan secara random. Dari 25 kasus yang dijadikan orang percobaan,
13 mendapat obat A dan 12 mendapat obat B. Langkah pengujian adalah sebagai berikut:
Tabel Perbandingan efek obat A dan B terhadap pencegahan perdarahan post operasi
pada penderita haemopilia
Tabel 2 x 2 di atas mempunyai dua sel yang memiliki frekuensi yang diharapkan
(expected frequency) lebih kecil dari 5, yaitu sel (a) dan sel (b) dengan frekuensi yang
diharapkan sebesar 2,8 untuk sel (a) dan 1,92 untuk sel (b). Pada kondisi seperti ini, uji
Chi Square tidak valid dipakai untuk menguji hubungan kedua variabel tersebut.
Kondisi seperti ini merupakan indikasi pemakaian uji Exact.
160
Komplikasi Jenis Obat
Jumlah
perdarahan Obat A Obat B
• Ya 0 (a) 4 (b) 4 (a + b)
• Tidak 13 (c) 8 (d) 21 (c + d)
Jumlah 13 (a + c) 12 (b + d) 25 (n)
5) Menghitung total eksak probabilitas tabel frekuensi hasil penelitian dan tabel frekuensi
yang lebih ekstrem
6) Kesimpulan
Probabilitas eksak p = 0,2652 adalah lebih besar dari α (0,05), maka dapat disimpulkan
Ho: diterima. Itu berarti obat A dan B memberikan efek pencegahan terhadap
perdarahan post operasi pada penderita haemopilia sama.
Indikasi
Uji McNemar dipakai untuk menguji signifikansi perbedaan atau hubungan dari dua sampel
berpasangan atau penelitian dengan rancangan “pre and post” dimana kedua variabel yang
akan dipelajari memiliki skala nominal atau ordinal dengan dua kategori. Setiap pasangan
sampel memiliki empat kemungkinan yaitu:
1. anggota pertama + dan anggota kedua +: A à (+,+)
2. anggota pertama + dan anggota kedua – : B à (+,-)
3. anggota pertama – dan anggota kedua + : C à (-.+)
4. anggota pertama – dan anggota kedua – : D à (-,-);
161
sehingga tabel frekuensi distribusi dari pasangan tersebut adalah sebagai berikut:
Sebelum Sesudah
+ -
+ A (+;+) B (+;-)
- C (-;+) D (-;-)
Dari tabel di atas diketahui bahwa B + C adalah jumlah pasangan yang mengalami
perubahan dari sebelum dengan sesudah perlakuan, maka frekuensi harapan sesuai dengan
Ho akan menjadi ½ (B + C) pasangan mengalami perubahan ke satu sisi dan ½ (B + C)
akan mengalami perubahan ke arah yang berlawanan. Dalam kata lain, ½ (B + C) adalah
frekuensi harapan untuk sel B dan sel C.
Apabila frekuensi hasil observasi dan frekuensi yang diharapkan bila Ho benar diterapkan
pada rumus Chi Square akan didapatkan:
2 (Oi − Ei ) 2
X =∑
Ei
X2 =
{B − 1 / 2( B + C )}2 + {C − 1 / 2( B + C )}2
1 / 2( B + C ) 1 / 2( B + C )
Dengan ekspansi rumus di atas didapatkan rumus Chi Square McNemar sebagai berikut:
2 (B − C) 2
X =
B+C
Koreksi kontinuitas
Hasil uji dengan rumus di atas akan lebih valid bila ketidakkontinuitas data dikontrol.
Rumus Chi Square McNemar dengan koreksi adalah sebagai berikut:
2
( B − C − 1) 2
X =
B+C
Contoh aplikasi:
Seandainya psikologi anak akan mempelajari inisiatif kontak sosial dari anak-anak.
Penelitian dilakukan pada murid baru taman kanak-kanak. Pada mulanya anak-anak akan
162
lebih banyak kontak dengan orang tua (pengantar) daripada dengan anak-anak sesamanya,
tetapi setelah ada pengalaman dan saling mengenal, anak-anak akan menjadi lebih sering
kontak dengan teman-temannya dibandingkan pada saat baru masuk. Dalam penelitian ini
diamati sebanyak 25 orang anak baru. Pada hari pertama anak tersebut diamati apakah
mereka lebih banyak kontak pada orang tua atau kepada temannya. Pengamatan kedua
dilakukan setelah anak mengikuti program sekolah selama satu bulan, yang diamati dan
kategorinya sama dengan pengamatan pertama.
Prosedur penghitungan:
1) Hipotesa statistik:
Ho: Untuk anak yang berubah inisiatif sosial kontaknya, probabilitas anak akan
berubah inisiatif sosial kontaknya dari orang tua ke anak (PB) adalah sama dengan dari
anak ke orang tua (PC), sehingga:
Ho: PB = PC = ½
Ha: PB > PC
2) Statistik:
Tabel Distribusi perubahan inisiatif kontak sosial murid taman kanak-kanak
1 Bulan Sesudah
Hari I Sekolah
Orang Tua Anak-anak
Orang Tua 4 14
Anak-anak 4 3
2
( B − C − 1) 2 ( 14 − 4 − 1) 2
X = = = 4,5
B+C 14 + 4
4) Kesimpulan:
Nilai Chi Square yang didapat dari perhitungan di atas adalah 4,5, maka Ho: ditolak.
Ini berarti bahwa proporsi anak yang berubah inisiatif kontak sosialnya dari orang tua
ke anak-anak lebih besar dari yang dari anak berubah ke orang tua.
163
LATIHAN:
1. Seorang peneliti ingin mengetahui apakah data hasil pemeriksaan asam urat dari 250
sampel penelitiannya mempunyai distribusi normal atau tidak. Data hasil pengukuran
asam urat dari sampel tersebut adalah sebagai berikut:
Asam urat Frekuensi
0 – 0,99 1
1 – 1,99 5
2 – 2,99 15
3 – 3,99 24
4 – 4,99 43
5 – 5,99 50
6 – 6,99 45
7 – 7,99 30
8 – 8,99 22
9 – 9,99 10
10 – 10,99 5
2. Pusat studi lingkungan meneliti 100 sampel air laut yang diambil dari pantai di Bali.
Dari sampel tersebut didapatkan data sebagai berikut:
Jml jenis organisme per Frekuensi
sampel
0 15
1 30
2 25
3 20
4 5
5 4
6 1
Apakah jumlah jenis organisme di dalam sampel air berdistribusi normal atau tidak.
3. Suatu trial klinik dilakukan pada 120 kasus histerektomi. Sebanyak 60 kasus diberikan
antibiotika selama 3 hari mulai dari saat dioperasi dan sisanya diberi placebo.
Perlakuan diberikan secara random dan double blind. Angka infeksi setelah operasi
adalah sebagai berikut:
164
Infeksi Tidak infeksi jumlah
Antibiotika 5 55 60
Placebo 25 35 60
jumlah 30 90 120
4. Suatu studi kasus (case-control) dilakukan untuk mengetahui sumber penular dari suatu
wabah kolera di kota A. Pemilihan kontrol dilakukan secara random. Data yang
diperoleh adalah sebagai berikut:
Kasus Kontrol
No Minum Es Air Mentah No Minum Es Air Mentah
1 + + 1 + -
2 + + 2 - -
3 + - 3 - +
4 + - 4 - -
5 - + 5 - -
6 + - 6 + -
7 + + 7 - -
8 - - 8 - -
9 + + 9 - -
10 - + 10 - -
11 - + 11 - -
12 - + 12 - -
13 + + 13 + -
14 + - 14 - -
15 + + 15 - +
16 + + 16 + -
17 + + 17 - -
18 + - 18 - +
19 + - 19 - -
20 - + 20 - -
21 + - 21 + -
22 + + 22 - -
23 - - 23 - -
24 + + 24 - -
165
25 - + 25 - -
26 - + 26 - -
27 - + 27 - -
28 + + 28 + -
29 + - 29 - -
30 + + 30 - +
Makanan mana yang menjadi sumber penularan dari wabah di kota A tersebut.
***************
LAMPIRAN
Bilangan Random
Tabel Distribusi t
166
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
120
140
160
180
200
∞
Tabel Chi-Square
Tabel Distribusi F
167
DAFTAR ACUAN
4. Fleiss, Josephl, Statistics Methods for Rate and Proportions, 2nd Edition, Wiley, 1981.
8. Masri Saingarimbun, dkk.; Metode Penelitian Survai, Pusat Penelitian dan Studi
Kependudukan UGM, 1980.
10. Schmidt J. Marty, Understanding and Using Statistics: basic Concepts D.C. Health and
Company, Lexington, 1979.
11. Steel R G.D, Torrie J.H. Prinsip dan Prosedur Statistika suatu pendekatan biometrik.
Pt. Gramedia Pustaka Utama, Jakarta, 1991.
168