Anda di halaman 1dari 168

BUKU AJAR

BIOSTATISTIK DASAR
dr. I Ketut Tangking Widarsa, MPH.

Program Studi Ilmu Kesehatan Masyarakat

Fakultas Kedokteran Universita Udayana

Denpasar, 2009

1
Module 1
Introduction to Biostatistics

1.1 Pendahuluan
Pada modul ini akan dipelajari beberapa pengertian, istilah, singkatan, dan notasi yang akan
banyak djumpai dalam mempelajari biostatistik. Mahasiswa seharusnya memiliki
pemahaman yang jelas pada awal mempelajari biostatistik. Pengertian, istilah, singkatan
dan notasi tersebut akan dipergunkan secara inten dalam pembelajaran berikutnya. Pada
akhir dari modul ini mahasiswa akan mempelajari tentang:

1. Batasan biostatistik
2. Peranan biostatistik dalam bidang kedokteran dan kesehatan
3. Observasi dan variabel
4. Skala pengukuran data
5. Populasi dan sampel

1.2 Batasan Biostatistiks


Bagi mahasiswa kedokteran sebaiknya mengetahui pengertian Statistik. Statistik dapat
diartikan sebagai informasi/fakta yang dipakai untuk menggambarkan suatu situasi dari
suatu peristiwa, seperti: Statistik Kematian, Statistik Kesehatan, Statistik Penduduk,
Statistik Desa, dan sejenisnya. Statistik juga diartikan sebagai suatu cabang ilmu
pengetahuan yang berkaitan dengan penangan data secara umum mulai dari pengumpulan,
pengolahan, analisis, dan interpretasi. Berikut adalah beberapa definisi statistik sebagai
cabang ilmu pengetauan dan seni.
1. Statistik adalah prinsip dan metoda untuk pengumpulan, penyajian, menganalisis, dan
interpretasi dari data numerikal dari bermacam hal.
2. Statistik adalah ilmu dan seni yang digunakan untuk menyimpulkan sesuatu dari yang
bervariasi.
3. Statistik adalah metoda yang digunakan untuk membuat statistik pada bidang
kedokteran, biologi dan kedokteran komunitas, dan untuk perencanaan.

Secara umum, di bidang kedokteran, statistik banyak digunakan dalam pengumpulan data,
evaluasi, dan penyajian data kesehatan.

2
1.3 Peranan statistik

Penggunaan metoda statistik dalam ilmu kedokteran bukan suatu hal yang baru. Sejarah
perkembangan kedokteran modern dan epidemiologi menggunakan banyak percobaan baik
dengan binatang atau pada manusia. Untuk mengevaluasi hasil dari percobaan tersebut,
statistik dipakai sebagai alat bantu. Pada tahun 1772, suatu trial yang dilakukan oleh
Kapten Cook menggunakan juice dari wortel sebagai anti scorbutics. Pada tahun 1913,
dengan mempelajari diet makanan yang dimakan, Gold menyimpulkan bahwa penyakit
pellagra adalah suatu penyakit defisiensi. Selanjutnya Panum meneliti tentang cacar,
Takaki tentang beri-beri, Budd tentang typhoid, dan lain-lain.
Pada dekade ini masih banyak penelitian yang ditujukan untuk menemukan dan
mendeskripsikan beberapa penyakit atau syndrom baru terutama penyakit infeksi.
Penelitian-penelitian laboratorium dengan menggunakan binatang masih banyak dilakukan
untuk tujuan ini. Peranan statistik dalam menentukan rancangan penelitian dan evaluasi
hasil penelitian sangat besar agar hasilnya dapat dipertanggungjawabkan secara ilmiah.

1.3.1 Peranan statistik dalam kedokteran klinik


Di bawah ini akan dibicarakan beberapa ruang lingkup aplikasi statistik dalam bidang
kesehatan atau kedokteran.
1) Mempelajari faktor risiko penyakit
Metoda Statistik pada kedokteran klinik banyak dipakai untuk mempelajari faktor yang
meningkatkan kemungkinan terjadinya suatu penyakit. Pada suatu kohort studi yang
dilakukan di beberapa negara maju untuk mempelajari faktor-faktor risiko terjadinya
penyakit jantung koroner, faktor risiko penyakit AIDS, Hepatitis, dan lain-lain. Di
samping studi kohort, banyak juga studi case-control dilakukan untuk mempelajari
faktor-faktor risiko dari suatu penyakit terutama penyakit yang kejadiannya sangat
jarang, seperti Ca Cervix dan lain-lainnya.
2) Menentukan kriteria diagnose
Di samping untuk mempelajari faktor risiko, metoda statistik juga dipergunakan untuk
mempelajari kriteria diagnosa suatu penyakit. Penentuan kriteria diagnosa dimulai
dengan mengidentifikasi gejala dan tanda-tanda yang dijumpai pada penyakit tersebut.
Dari gejala dan tanda tadi dipilih beberapa yang dianggap sering ditemukan dan
selanjutnya diuji spesivisitas dan sensitivitasnya.
3) Pengembangan obat atau vaksin
Pengembangan suatu vaksin dimulai dari laboratorium lewat percobaan pada binatang,
bila didapatkan hasiat pencegahan yang baik dan efek samping yang kecil, maka akan
dilanjutkan dengan percobaan pada manusia sebelum vaksin tersebut dipergunakan
secara luas. Metoda statistik sangat memegang peranan penting dari suatu
pengembangan ini mulai dari pemilihan rancangan, variabel penelitian, sampel, dan
analisis.

3
4) Mempelajari efikasi obat
Studi efikasi obat di klinik adalah sangat perlu untuk dapat memilih obat yang
mempunyai daya penyembuhan yang tinggi. Dalam studi ini, biasa dilakukan dengan
pembanding atau tanpa pembanding. Untuk menentukan rancangan penelitian, variabel,
sampel, dan analisis, peran dari Metoda Statistik sangat besar.

1.3.2 Perana biostatistik pada kesehatan masyarakat


Di dalam kedokteran komunitas, peran utama metoda statistik adalah untuk memberikan
informasi (data) yang relevan, complete, comparable, dan up-to-date. Informasi ini sangat
diperlukan oleh pengelola pelayanan kesehatan masyarakat untuk mengetahui apa yang
sesungguhnya terjadi di masyarakat di wilayah kerja mereka dan dapat digunakan untuk
mengorganisir serta memanfaatkan staf yang jumlahnya terbatas. Dari informasi tersebut,
pengelola pelayanan kesehatan akan dapat menilai apa yang kurang, apa yang salah dari
apa yang telah mereka kerjakan, sehingga dapat disusun rencana kegiatan untuk tahun yang
akan datang. Pada dasarnya penggunaan statistik di dalam bidang kedokteran komunitas
adalah untuk hal sebagai berikut:

1) menentukan derajat kesehatan masyarakat


Derajat kesehatan masyarakat di suatu negara sering ditentukan dengan beberapa
indikator, seperti angka kematian bayi (infant mortality), angka kematian ibu bersalin
(maternal mortality), angka rata-rata harapan hidup (life expectancy), angka kelahiran
(birth rate), jumlah penduduk yang sudah terjangkau oleh penyediaan air bersih, dan
sebagainya. Semua angka indikator tersebut, baik cara mendapatkan datanya serta cara
penghitungannya memerlukan metoda statistik.

2) mengidentifikasi faktor risiko


Dalam Kedokteran Komunitas, aspek pencegahan primer seperti penyuluhan dan
pencegahan spesifik merupakan ciri utamanya. Untuk tujuan tersebut, maka pemahaman
faktor risiko dari suatu masalah kesehatan masyarakat menjadi sangat penting dan
mutlak. Dengan melakukan intervensi terhadap faktor resiko tersebut diharapkan
masalah kesehatan masyarakat tersebut akan dapat dicegah. Untuk mengidentifikasi
faktor risiko tersebut, metoda statistik sangat berperan, mulai dari menentukan
rancangan, penentuan variabel yang akan dipelajari, pengukuran, dan analisisnya.
Misalnya masalah kematian bayi karena tetanus. Penyebab tetanusnya sudah diketahui,
tetapi dengan mengetahui penyebabnya belum bisa mencegah terjadinya masalah
tersebut. Oleh karena itu, kita harus mempelajari perilaku masyarakat yang
meningkatkan risiko infeksi tetanus pada bayi. Bila misalnya diketahui bahwa cara
memotong tali pusar dan cara merawat tali pusar yang tidak steril merupakan faktor
risiko, maka dengan mengubah perilaku tersebut menjadi perilaku yang sehat dapat
diharapkan masalah kejadian tetanus pada bayi akan berkurang sampai tidak ada. Inilah
salah satu contoh pentingnya mengetahui faktor risiko.

4
3) Untuk mencari determinan faktor
Program kesehatan yang dilaksanakan pemerintah melalui Departemen Kesehatan
dimaksudkan untuk meningkatkan derajat kesehatan masyarakat. Keberhasilan suatu
program ditentukan oleh banyak faktor. Faktor yang memberikan pengaruh positif
terhadap keberhasilan program kita sebut sebagai potensi, sedangkan yang mempunyai
pengaruh negatif kita sebut faktor kendala. Faktor potensi dan faktor kendala tersebut
kita kategorikan sebagai determinan faktor. Untuk menentukan determinan faktor dari
suatu program perlu dilakukan studi. Dalam hal ini, peranan metoda statistik, mulai dari
penentuan rancangan, variabel, pengukuran, dan analisis sangat menentukan.

1.4 Populasi dan Sampel

1.4.1 Populasi
Populasi adalah sekumpulan individu, biasanya merupakan kumpulan orang. Walupun
demikian, populasi bisa merupakan kumpulan dari binatang, tumbuhan atau benda, tempat,
dan lainnya. Oleh karena itu, populasi didifinsikan sebagai berikut: populasi adalah
kumpulan dalam jumlah besar individu yang pada waktu tertentu menjadi kelompok
interes. Misalnya, yang menjadi tujuan penelitian adalah untuk mengetahui kadar kolesterol
pada pasien diabetes, maka populainya adalah kadar kolesterol semua pasien diabetes atau
semua pasien diabestes. Contoh yang lain, misalnya akan diteliti tingkat stress mahasiswa
semester I sebelum ujian akhir, maka populasinya adalah tingkat stres semua mahasiswa
semester I atau semua mahasiswa semester I.

1.4.2 Sampel
Sampel didifinisikan sebagai bagian dari suatu populasi. Misalnya yang diteliti adalah
kadar kolesterol pasisen diabetes, maka populasinya adalah semua kadar kolesterol pasien
diabetes. Seandainya jumlah pasien diabetes sangat banyak dan yang diukur kadar
kolesterol darahnya hanya pada 50 pasien diabetes, kita hanya memeriksa sebagain dari
populasi. 50 kadar darah pasien diabetes merupakan sampel dari kadar kolesterol semua
pasien diabetes.

1.4.3 Pemilihan Sampel Secara Random


Ada banyak cara yang dipakai memeilih sampel secara random. Cara yang paling mudah
adalah dengan menggunakan tabel bilangan random. Misalnya dari 99 populasi akan dipilih
sampel sebanyak n = 3. Lagkahnya adalah sebagai berikut:

1) Tentukan stating point dengan cara menjatuhkan pensil pada tabel bilangan random.
Misalnya yang menjadi starting point adalah baris ke 3 dan kolom 3 dari tabel bilangan
random. Bilangan random yang menjadi starting point adalah 40311. Karena jumlah
populasi terdiri dari dua digit (99), sedangkan tabel bilangan randomnya terdiri dari 5
5
digit, maka hanya dua digit pertama yang dibaca. Untuk bilangan random pertama
yang terpilih adalah 40311, maka nomor yang dipakai sampel adalah individu nomor
40 (dua gigit pertama).

2) Untuk memilih sampel berikutnya dapat dilakukan dengan memilih bilangan random
yang terletak pada kolom yang sama dengan stating point atau pada baris yang sama
dengan baris starting point atau dipilih secara diagonal dari starting point. Misalnya
yag dipilih adalah bilangan random yang terdapat pada kolom yang sama dengan
starting point, maka yang terpilih adalah bilangan random 93540 dan 05085. Maka
sampel ke dua dan ke tiga adalah individu nomor 93 dan nomor 5.

3) Bila dua digit pertama dari bilangan random yang terpilih lebih besar dari N (99),
maka nomor tersebut tidak memenuhi persyaratan menjadi sampel, karena tidak ada
individu di populasi yang memiliki nomor urut lebih dari N, maka bilangan random
tersebut tidak dipilih atau dilewati.

Tabel Bilangan Random

75933 05250 79362 42350 37650 79788 25335 32049 63707


68531 69567 40311 16521 69648 35863 31181 46469 45242
93184 82616 93540 86013 57602 32260 44012 64961 65637
02302 22807 05085 56534 43573 47791 77031 46321 95628
43153 30553 80110 87607 17250 27264 78850 12048 35586

41066 30148 00860 62858 46809 31903 34738 77915 80790


28316 06672 38914 90497 95178 64608 38025 68181 29261
27989 94197 32122 88310 14709 69994 37726 24989 75495
31619 48676 64713 73498 50414 39009 30398 57971 57006
56726 27952 38589 04251 68956 42928 16710 30639 34116

28963 60880 28741 84568 64754 69143 74842 43250 73202


75555 44854 30396 42543 35374 29120 08167 27282 47122
58599 26917 72287 53123 45053 88809 16884 39602 73383
47450 23293 75429 11883 19237 43154 40181 34165 62547
55937 82563 73472 91303 91474 87244 51343 63042 70890

6
1.5 Variabel dan Data
1.5.1 Variabel
Variabel adalah atribut atau karakteristik atau kejadian yang memiliki nilai yang berbeda.
Bila atribut atau karakteristik atau kejadian tersebut diobservasi atau diukur dan
memberikan nilai hasil pengukuran yang berbeda dari satu orang ke orang lain atau dari
satu tempat ke tempat laian atau dari satu waktu ke waktu yag lain, maka karakteristik, atau
atribut atau kejadian tersebut diberi label variabel. Sebagai contoh misalnya: usia, jenis
kelamin, kadar kolesterol, tekanan darah dan lainnya.

1.5.2 Data
Data adalah fakta yang didapatkan dari hasil wawancara, pengamatan, atau pengukuran
terhadap suatu objek pengamatan dari sutu subjek. Misalnya data pribadi si A: umur 25
tahun, kelamin laki, tinggi badan 170 cm, berat badan 70 kg, golongan darah O, dan
sebagainya. Untuk contoh di atas, objek pengamatan/pengukuran dari subjek A adalah,
umur, kelamin, tinggi badan, berat badan, dan golongan darah. Objek pengamatan ini
disebut VARIABEL. Sedangkan fakta hasil pengamatan/pengukuran terhadap objek
pengamatan seperti umur di dapat 25 tahun, berat badan didapat 70 kg, dan sebagainya
disebut DATA.

1.5.3 Variabel Random


Variabel random adalah variabel yang dinilainya ditentukan oleh faktor kebetulan, maka
variabel tersebut dikatakan sebagai variabel random. Kalau nilai pengukuran satu variabel
ditentukan oleh faktor kebetulan, maka nilainya tidak bisa diperkirakan secara pasti. Bila
dalam suatu penelitian sampel dipilih secara random, maka variabel yang akan diteliti
dikenal sebagai variabel random. Sebaliknya, bila variabel tersebut ditetapkan nilainya,
misalnya dalam satu eksperimen akan dipelajari efek obat terhadap kesembuhan, dimana
perlakuan obat yang diberikan sudah ditentukan besarnya yaitu 10 mg/kg BB dan 50 mg/kg
BB, maka variabel dosis obat tersebut dinyatakan sebagai Fix variable atau bukan variabel
random.

1.6 Jenis Data


Data merupakan isu sentral dalam biostatistik, oleh karena itu sangat penting untuk
membahas berbagi tipe atau jenis data yang banyak dijumpai dibidang kesehatan. Jenis data
yang akan dinalisis sangat berhubungan dengan pemilihan metode analisis satatistik yang
tepat untuk data tersebut.Data dibedakan menurut cara mendapatkannya, dapat atau
tidaknya dikuantifikasikan, dan dari skala pengukurannya. Data menurut cara mendapatkan
dibedakan menjadi data primer dan data sekunder. Menurut dapat atau tidaknya
7
dikuantifisir, data dibedakan menjadi data kualitatif dan data kuantitatif. Sedangkan bila
dilihat dari skala pengukurannya, data dibedakan menjadi data nominal, ordinal, interval,
dan ratio.
1) Data primer
Data primer adalah data yang didapat dengan cara pengukuran/pengamatan langsung
kepada subjek pengamatan. Misalnya data hasil wawancara kepada responden dalam survei
rumah tangga merupakan data primer. Data hasil penimbangan berat badan bayi,
pengukuran kadar Hb yang dilakukan peneliti adalah data primer.
2) Data sekunder
Data sekunder adalah data yang didapat bukan langsung dari subjek pengamatan, tetapi dari
sumber kedua seperti register rumah sakit, catatan medik, laporan sensus, laporan statistik,
dan sebagainya.

3) Data Kualitatif
Objek pengamatan atau variabel yang diamati seperti seks, pekerjaan, sakit atau mati, yang
hasil pengamatannya tidak dapat dikuantifikasikan dan hanya dapat dinilai dari kualitasnya
saja dikelompokkan ke dalam data kualitatif. Misalnya variabel Seks dengan kemungkinan
nilainya laki atau wanita. Hasil pengukuran dari variabel Seks tidak bisa dibagi, dikalikan,
atau dijumlahkan, karena kalau misalnya wanita dibagi 2 akan menjadi tidak berarti. Data
seperti itu dikelompokkan menjadi data KUALITATIF dan variabelnya disebut juga
variabel KUALITATIF.

4) Data kuantitatif
Berbeda dengan data kualitatif, objek pengamatan seperti tinggi, berat, kadar Hb, kadar
gula darah, dan sejenisnya mempunyai nilai pengamatan yang bisa dikuantifisir (dibagi,
dikalikan, dijumlah, diakarkan, dilogkan, dan sebagainya). Hasil pengamatan yang dapat
dikuantifikasikan disebut data KUANTITATIF dan variabelnya disebut juga variabel
KUANTITATIF.

Data kuantitatif dibedakan lagi menjadi dua kelompok, yaitu data kuantitatif KONTINYU
dan DISKRIT. Data kuantitatif kontinyu adalah data kuantitatif dimana batas interval 1 unit
pengukuran dengan 1 unit pengukuran di atasnya adalah sama atau berimpit. Atau data
kuantitatif yang satuan unit pengukurannya mempunyai sub unit pengukuran yang lebih
kecil, misalnya umur dengan satuan pengukuran tahun. Tahun mempunyai ukuran yang
lebih kecil yaitu bulan; bulan mempunyai ukuran yang lebih kecil yaitu hari, dan seterusnya
sampai nano detik. Sedangkan data kuantitatif diskrit, batas satuan ukurannya tidak
berimpit dan tidak mempunyai sub satuan ukuran yang lebih kecil, misalnya jumlah anak
hidup dengan satuan “1 orang”. Tidak ada sub-satuan ukuran yang lebih kecil lagi, seperti
misalnya 0,1 orang anak, dan sebagainya.

8
5) Data Nominal
Data berskala pengukuran NOMINAL termasuk data kualitatif yang nilai pengukurannya
memiliki skala yang tidak ada intervalnya dan tidak dapat diurut. Data kelompok ini
dibedakan lagi menjadi data nominal binomial dan multinomial. Data nominal binomial
artinya data nominal yang nilainya mempunyai hanya dua variasi, seperti seks dengan nilai
laki dan wanita, sakit dengan nilai sakit dan tidak sakit (sehat), dan sebagainya. Sedangkan
data nominal multinomial adalah data nominal yang mempunyai variasi nilai lebih dari dua,
misalnya pekerjaan. Pekerjaan mempunyai variasi seperti petani, buruh, pegawai,
pedagang, ABRI, dan wiraswasta.

6) Data Ordinal
Data berskala ORDINAL termasuk data kualitatif, tidak mempunyai interval yang sama
untuk setiap unit pengukuran, tetapi nilainya dapat diurut. Misalnya status gizi dengan
variasi baik, kurang, buruk. Interval gizi baik, kurang, dan buruk tidak sama, tetapi gizi
baik lebih tinggi dari gizi kurang, demikian pula gizi kurang lebih baik dari gizi buruk.

7) Data Interval
Data INTERVAL tergolong ke dalam data kuantitatif dan mempunyai interval yang tetap
dengan batas yang tegas dan dapat diurut, tetapi tidak mempunyai nilai nol absolut.
Misalnya pengukuran suhu dengan derajat Celcius atau Fahrenheit. Nol derajat Celcius
bukan berarti tidak ada suhu melainkan suhu tersebut adalah suhu dimana air akan
membeku. Tidak memiliki nilai nol absolut artinga nilai dari variabel tersebut bisa di
bawah nol atau negatif, seperti suhu di kutub minus 20º C.

8) Data Ratio
Data ratio juga tergolong ke dalam data kuantitatif, mempunyai interval tetap dan berbatas
tegas serta mempunyai titik Nol-Absolut artinya tidak mungkin hasil pengukuran akan
mendapatkan nilai negatif. Misalnya tinggi, panjang, berat, dimana variabel tersebut tidak
mungkin memiliki hasil pengukuran di bawah nol.

1.7 Beberapa hal yang mempengaruhi hasil pengukuran


Ada beberapa hal yang dapat mempengaruhi hasil pengukuran, tetapi pada uraian ini akan
diuraikan tiga hal saja, yaitu:

1) Pengaruh Subyektivitas (yang melakukan observasi)


Skill, pengetahuan, pengalaman, dan temperamen observer dapat mempengaruhi hasil
pengamatan. Misalnya pengamatan tentang gradasi keadaan pasien, menilai keadaan
sanitasi rumah tangga, dan lain-lain. Untuk mendapatkan data yang obyektif, maka
pengaruh subyektivitas pengamat harus dikurangi semaksimal mungkin. Misalnya dengan
meningkatkan validitas dan reliabilitas alat pengumpulan data. Walaupun demikian, perlu
9
diketahui, bahwa faktor subjek masih tetap akan berpengaruh, misalnya skill, pengalaman,
dan temperamen. Oleh karena itu, petugas pengumpul data harus dilatih menggunakan
instrumen yang akan dipakai untuk mengumpulkan data.

2) Terjadi perubahan pada kejadian yang diamati


Hampir semua peristiwa biologi mengalami perubahan yang kontinyu. Misalnya denyut
jantung, temperatur badan, berat badan dan sebagainya. Perubahan tersebut ada yang
berfluktuasi dalam waktu yang pendek, ada dalam hari, ada dalam minggu, bulan, musim
dan tahun. Misalnya, kejadian penyakit diare adalah berfluktuasi dimana puncaknya terjadi
pada bulan Februari dan Oktober. Bila pengukuran dilakukan pada saat puncak kejadian,
maka akan didapatkan angka diare di daerah tersebut tinggi. Tetapi, bila dilakukan saat
bukan musimnya, maka kejadian di daerah tersebut akan didapatkan rendah. Dari contoh
ini kita dapatkan informasi yang berbeda untuk satu daerah, karena pengamatan dilakukan
pada waktu yang berbeda.

3) Informasi dikumpulkan dengan kuesioner


Banyak data kesehatan seperti riwayat kesakitan, keluhan utama, kebiasaan, dan lain-
lainnya akan diukur dengan cara menanyakan responden. Berarti ada dua orang yang
terlibat dalam hal ini, yaitu responden dan pewawancara. Kualitas informasi akan
dipengaruhi oleh pertanyaan yang ditanyakan (questionair), kemampuan responden untuk
menangkap maksud dari pertanyaan yang ditanyakan kepada mereka dan kemampuan
responden untuk mengingat kembali peristiwa yang ditanyakan (recall ability), emosi baik
responden maupun interviwer dan sikap dari responden. Bila responden asal menjawab,
maka kualitas data yang terkumpul patut diragukan. Oleh karena itu, di dalam
pengembangan instrumen pengumpulan data perlu mempertimbangkan umur, pendidikan,
bahasa yang umum dipakai dan istilah-istilah yang secara umum diketahui oleh masyarakat
di lokasi penelitian, supaya kemungkinan tidak pahamnya responden dengan apa yang
dimaksudkan di dalam pertanyaan tersebut dapat dihindarkan.

10
Module 2
Describing Data

2.1 Pendahuluan
Pada Modul 1 sudah dijelaskan tentang jenis data menurut skala pengukuran seperti data
dengan skala pengukuran nominal, ordinal, interval, dan ratio. Juga data dapat
dikelompokkan menjadi data kategorikal (nominal dan ordinal) dan data numerik (interval
dan ratio). Data hasil pengamatan atau hasil pengukuran disebut data mentah (raw data),
yang sama sekali belum diorganisir, sehingga tidak mudah untuk dibaca dan dimengerti.
Data mentah tersebut akan menjadi mudah dimengerti bila diorganisir ke dalam bentuk
frekuensi distribusi atau dalam bentuk grafik.

Pada modul ini akan dibahas beberapa metode yang umunya dipakai meringkas dan
mendeskripsikan data kategorikal maupun data numerik. Modul ini akan mencakup topik
sebagai berikut.
• Tabel Distribusi dan Grafik
o Tabel Distribusi
o Grafik Balok, Grafik Lingkaran, Histogram, dan Box-plot
• Bentuk Distribusi Data
o Distribusi Simetris, menceng ke kanan, dan menceng ke kiri
• Statistik Deskriptif
o Tendensi Sentral (mean, median, modus, dan persentil)
o Ukuran sebaran (Range, Inter-quartile Range, dan Standar Deviasi)

11
2.2 Cara Meringkas Data Kategorikal dalam bentuk Tabel Distribusi
dan Grafik
Data kategorikal juga disebut data kualitatif, yang terdiri dari data berskala pengukuran
nominal dan ordinal seperti jenis kelamin, pekerjaan, status gizi, dan lainnya. Data
kategorikal dapat diringkas dalam sebuah tabel distribusi tunggal dan silang serta dalam
grafik balok (bar chart) atau grafik lingkaran (pie chart)

2.2.1 Distribusi Frekuensi Tunggal


Penyajian data dalam sebuah tabel distribusi adalah untuk meringkas suatau data mentah
menurut kategori dari data tersebut. Berapa jumlah sampel untuk kategori pertama, kedua
dan seterusnya. Jumlah sampel dari setiap kategori tersebut dapat disajikan dalam jumlah
absolut atau persen. Persentase sampel untuk setiap kategori terhadap seluruh sampel
disebut frekuensi relatif yang dinyatakan dalam persen. Sebagai contoh, tabel 2.2.1
meyajikan ringkasan data cara persalinan dari 600 persalinan di sebuah rumah sakit.
Variabel yang dipelajari adalah cara persalinan, yang merupakan variabel nominal atau
kategorikal dengan tiga kategori, yaitu: persalinan normal, persalinan dengan forcep, dan
persalinan dengan seksio.

Tabel 2.2.1 Cara persalinan dari 600 kelahiran di Rumah Sakit Maria

Cara persalinan Jml. Kelahiran Persentase


Normal 478 79,7
Forcep 65 10,8
Seksio 57 9,5
Total 600 100,0
Sumber: Betty R. Kirwood; Medical Statistics

2.2.2 Distribusi Silang


Bila dalam penelitian dikumpulkan dua jenis data dari setiap sampel, yaitu data kebiasaan
merokok dengan kategori merokok dan tidak dan kejadian penyakit jantung koroner (PJK)
dengan kategori ya dan tidak. Bila peneliti ingin menganalisis hubungan antara merokok
dan PJK maka langkah pertama yang harus dilakukan adalah membuat frekuensi distribusi
silang kedua variabel tersebut. Dari distribusi silang akan diketahui berepa perokok yag
12
menderita PJK dan tidak menderita PJK. Juga dapat diketahui berapa yang tidak merokok
menderita PJK dan yang tidak menderita. Setiap sel dari tabel distribusi silang
menggambarkan jumlah sampel yang memiliki dua kategori. Seperti contoh tabel distribusi
silang di bawah ini, sel pertama menyatakan jumlah sampel yang memeiliki kebiasaan
merokok dan menderita PJK. Jumlah sampel dari setiap sel dapat dinyatakan dalam jumlah
absolut dan juga dalam % menurut jumlah barias (row persented) atau persen menurut
jumlah kolom (collumn persented).

Tabel 2.2.1 Cara persalinan dari 600 kelahiran di Rumah Sakit Maria

Kebiasaan Merokok PJK


Ya Tidak Total

Merokok 30 (15%) 170 (85%) 200 (100%)


Tidak 20 ( 5%) 380 (95%) 400 (100%)
Total 50 (8,3%) 550 (91,7%) 600 (100%)

Dari contoh tabel 2.2.1 di atas, dari 200 sampel yang memilki kebiasaan merokok,
sebanyak 30 orang yang menderita PJK atau kejadian PJK pada perokok adalah 15% (row
percented). Sebaliknya, dari 400 sampel tidak merokok, terdapat 20 penderita PJK atau 5%
dari sampel tidak merokok. Tampak bahwa kejadian PJK pada perokok 3 kali lebih tinggi
dari yang tidak merokok.

2.2.3 Pie Chart


Pie Chart atai grafik lingkaran adalah salah satu grafik yang dapat dipakai menyajikan data
dari satu variabel kategorikal. Agar grafik menjadi jelas maka perlu dilengkapi dengan:

1) judul grafik yang umumnya ditempatkan di bagian bawah grafik,


2) potongan dari lingkaran yang menggambarkan proposi sampel untuk setiap kategori data
perlu diberikan label (legen)
3) Setiap ptongan dari grafik lingkaran dilengkai dengan frekuensi dalam bentuk absiolut
atau dalam bentuk persen.

Berikut adalah contoh grafik lingkaran dari data pada tabel 2.2.1 di atas.

13
persalinan
normal
forcep
seksio

57

65

478

Grafik 1. Distribusi Kasus Persalinan Menurut Jenis Persalinan

2.2.4 Simple Bar Chart


Simple Bar Chart juga disebut grafik balok dipakai untuk menyajikan distribusi data dari
satu variabel kategorikal sama seperti grafik lingkaran. Setiap balok (bar) pada grafik balok
menyatakan frekuensi atau persen sampel dari setiap kategori data dari variabel tersebut.
Agar grafik menjadi jelas maka perlu dilengkapi dengan: 1) judul grafik yang umumnya
ditempatkan di bagian bawah grafik, 2) sumbu X dan Y diberi nama dan skala, dan 3)
setiap balok diberi label. Berikut adalah contoh grafik balok dari data pada tabel 2.2.1 di
atas.

500

400

300
Count

478

200

100

65 57

0
normal forcep seksio

persalinan

Grafik 2. Distribusi Kasus Persalinan Menurut Jenis Persalinan

14
2.2.5 Cluster Bar Chart
Cluster bar chart dipakai menyajikan distribusi silang dalam bentuk grafik balok. Kalau
pada contoh pada tabel 2.2.2 di atas akan disajikan kejadian PJK antara perokok dengan
tidak perokok, maka yang menjadi kluster adalah kejadian PJK, sedangkan kebiasaan
merokok menjadi kelompok yang dibandingkan yang ditempatkan pada sumbu X dari
grafik. Berikut adalah contoh Cluster Bar Chart kejadian PJK antara kelompok perokok dan
non perokok.

400
PJK
PJK
Tidak PJK

300
Count

200
380

100
170

30
20
0
Merokok Tidak merokok

perokok

Grfaik 3. Distribusi Kasus PJK antara Perokok dan Non Perokok

2.3 Cara Meringkas Data Numerik dalam bentuk Tabel Distribusi dan
Grafik

2.3.1 Tabel Distribusi Tunggal


Tabel distribusi tunggal adalah distribusi data menurutvariasi data dari satu variabel.
Distribusi tunggal dipakai bila variasi data dari satu variabel < 15, misalnya paritas yang
memiliki variasi data dari 0 – 5. Bila satu variabel mempunyai variasi data > 15 seperti
umur yang bervariasi dari 0 – 85, sebaiknya disajikan dalam distribusi berkelompok atau
data umur disajikan dalam kelompok umur. Berikut adalah contoh distribusi tunggal.

15
Tabel 2.3.1 Paritas Ibu Bersalian di Rumah Sakit Maria

Paritas Frekuensi Persentase


0 200 24,8
1 250 31,1
2 225 28,0
3 100 12,4
4 25 3,1
5 4 0,5
6 atau lebih 1 0,1
Total 805 100,0

2.3.2 Tabel Distribusi Berkelompok


Ditribusi berkelompok adalah distribusi data dalam kelompok tertentu dimana retangan
nilai tertentu dijadikan sebuah kelompok, seperti contoh berikut.

Tabel 2.3.2 Umur Pasien Rawat Jalan Rumah Sakit Maria Tahun 2010
Kelompok Umur Frekuensi Persentase
0-1 185 37,3
1-4 109 22,0
5-9 38 7,7
10-14 31 6,3
15-19 15 3,0
20-24 6 1,2
25-29 5 1,0
30-34 3 0,6
35-39 7 1,4
40-44 21 4,2
45-49 25 5,0
50-54 30 6,0
55- 21 4,2
Total 496 100,0

16
Data disajikan di dalam sebuah distribusi berkelompok bila range suatu data > 15, misalnya
umur dengan variasi data dari 0 – 89 tahun. Data umur diubah menjadi kelompok umur
yang disebut kelas. Misalnya, untuk meringkas data umur dilakukan dengan membuat 14
kelompok umur, yaitu 0-1, 1-4, 5-9, 10-14, 15-19, 20-24, 25-29, 30-34, 35-39, 40-44, 45-
49,50-54, 55-59, 60 ke atas. Setiap kelas memiliki rentangan data yang disebut interval
kelas. Untuk contoh di atas, setiap kelas mempunyai interval 5. Setiap interval kelas
memiliki batas bawah dan batas atas kelas. Seperti contoh di atas, kelompok umur “0-4”, 0
adalah batas bawah kelas dan 4 adalah batas atas kelas. Setiap kelas juga mempunyai nilai
tengah adalah nilai yang terletak di tengah-tengah. Kelas “0-4” terdiri dari nilai 0, 1, 2, 3,
dan 4 dan yang menjadi nilai tengah kelas adalah 2.

2.3.3 Histogram
Histogram merupakan grafik balok dimana setiap balok menyatakan frekuensi dari setiap
nilai data atau kelas untuk distribusi berkelompok. Dalam histogram, tidak ada spasi
diantara balok atau balok yang satu berimpit dengan balok berikutnya. Berikut adalah
contoh sebuah histogram dari data paritas yang disajikan pada tabel 2.3.1 di atas.

250

200
Frequency

150

100

50

0
0.00 2.00 4.00 6.00

paritas

Grafik 3. Paritas Ibu Bersalin di Rumah Sakit Maria 2010

17
2.4 Bentuk Distribusi Data

2.4.1 Distribusi Data Simetris


Suatau data dinyatakan berdistribusi simetris bila histogram frekuensi dari masing nilai
(distribus tunggal) atau kelas (distribusi berkelompk) menyerupai sebuarikuth bell dimana
bentuk kedua sisinya simetris. Berikut adalah contoh distribusi data simetris.

30

25

20
Frequency

Annotation
15

10

0
0.00 2.00 4.00 6.00 8.00

kolesterol

Grafik 4. Distribusi Kadar Kolesterol Kasus Rawat Jalan RS Maria 2010

2.4.2 Distribusi Data Menceng ke Kanan


Data berdistribusi menceng ke kanan atau right skewed menunjukan bahwa data cendung
lebih banyak memiliki nilai rendah dan sedikit yang memiliki nilai tinggi atau terdapat dilai
ekstrim tinggi. Berikut adalah contoh data berdistribusi pendapatan dalam jutaan rupian.

18
30

25

20

Frequency
15

10

0
0.00 2.00 4.00 6.00 8.00 10.00 12.00

pendapatan

Grafik 5. Pendapatan PNS Rumah Sakit Maria dalam jutaan rupian

2.4.3 Distribusi Data Menceng ke kiri


Data berdistribusi menceng ke kiri atau left skewed bila sebagian besar data cenderung
pada nilai tinggi dan jarang pada nilai kecil. Berikut adalah distribus umur kasus bedah
jantung di Rumah Sakit Maria 2010.

25

20
Frequency

15

10

0
0.00 2.00 4.00 6.00 8.00 10.00 12.00

Kelompok Umur

Grafik 6. Kelompok Umur Kasus Bedah Jantung di Rumah Sakit Maria 2010

19
2.5 Statistik Deskripif

2.5.1 Ukuran Sentral (Tendensi Central)

Hampir semua karakteristik makhluk hidup mempunyai nilai atau ukuran yang berbeda
atau bervariasi dari satu individu dengan individu lainnya. Walaupun demikian, nilai atau
ukuran tersebut umumnya memusat pada nilai tertentu. Oleh karena itu, karakteristik dari
sekelompok individu dari suatu sample atau suatu populasi dapat diidentifikasi dari nilai
dimana observasi memusat. Nilai dimana nilai suatu observasi memusat dinamakan nilai
“Tendensi Sentral”.

Ada tiga ukuran nilai tendensi sentral untuk suatu data, yaitu nilai rata-rata (Mean), nilai
tengah (Median), dan nilai tersering (Modus). Ketiga ukuran ini nilainya bisa sama dan bisa
pula tidak sama pada suatu grup data. Ketiga nilai tendensi sentral tersebut sama besarnya
bila data tersebut mempunyai distribusi normal. Sedangkan, nilai tersebut akan berbeda bila
distribusi data tersebut tidak normal atau menceng. Oleh karena itu, penggunaan dari
ukuran-ukuran tersebut tergantung dari bentuk distribusi datanya. Bila distribusi data
normal atau mendekati normal, nilai rata-rata, nilai tengah, dan modus akan sama besarnya
atau mendekati, oleh karena itu, ukuran tendensi sentral yang dipakai adalah nilai rata-rata.
Sebaliknya, bila distribusi data menceng baik menceng ke kanan atau ke kiri, sebaiknya
nilai tengah (Median) yang dipakai untuk menggambarkan tendensi sentral dari data
tersebut. Modus dipakai untuk menunjukkan nilai yang paling sering atau terbanyak ada
pada data tersebut.

Nilai Rata-Rata (Mean)

Pada buku teks, nilai rata-rata sering disebut “Mean” atau “Average”. Yang dimaksud
dengan nilai rata-rata disini adalah “arithmetic mean” yang diberi simbul x untuk sampel
dan µ untuk populasi. Nilai rata-rata dari suatu observasi dapat dihitung dengan membagi
jumlah semua nilai observasi dengan banyaknya observasi. Penghitungan nilai rata-rata

20
akan dibedakan menjadi dua cara, yaitu cara penghitungan nilai rata-rata untuk data yang
tidak berkelompok dan untuk data berkelompok.

Penghitungan rata-rata data tidak berkelompok

Misalnya ada sebanyak n observasi dengan nilai pengukuran:

x1 x2 x3 x4 .... ... xn

nilai rata-rata dari observasi tersebut adalah:

x + x2 + x3 + x4 + ..... + xn ∑x i
x= 1 = i =1

n n

Contoh:

Suatu sampel survei dilakukan pada 30 ibu hamil untuk mempelajari kadar Hb ibu hamil.
Dari penelitian tersebut didapatkan data sebagai berikut:

Tabel No. 5.1 Kadar Hb ibu hamil

Kasus Kadar Hb Kasus Kadar Hb


1 10 16 12
2 9 17 9
3 12 18 10
4 8 19 9
5 11 20 10
6 10 21 10
7 12 22 9
8 10 23 12
9 9 24 8
10 14 25 11
11 11 26 10
12 10 27 11
13 11 28 10
14 9 29 9
15 11 30 13
21
Jumlah semua nilai observasi : ∑x = 310

Banyaknya observasi :n = 30

Nilai rata-rata : x = ∑Xi/n = 10,333

Menghitung rata-rata dari distribusi frekuensi berkelompok:

Penyajian data seperti umu lebih sering disajikan dalam distribusi frekuensi berkelompok.
Setiap kelompok atau juga disebut kelas mempunyai interval tertentu. Dalam penghitungan
nilai rata-rata dari observasi berkelompok, nilai tengah dari setiap kelas dianggap mewakili
kelas tersebut. Sehingga dalam penghitungan jumlah nilai observasi akan dihitung dari
jumlah perkalian nilai tengah kelas dengan frekuensi dari kelas bersangkutan. Bila nilai
tengah kelas adalah X’i dan frekuenasi kelas adalah fi, maka jumlah nilai observasi sama
dengan ∑fiX’i.

Sehingga nilai rata-ratanya menjadi:

X =
∑ f X'
i i

n
Keterangan:

_
X = nilai rata-rata
fi = frekuenasi kelas interval ke i
X’i = nilai tengah kelas ke i
n = jumlah sampel

Contoh:

Suatu survei untuk menentukan jumlah protein yang dikonsumsi oleh setiap
keluarga. Survei dilakukan pada 400 keluarga. penghitungan nilai rata-rata
konsumsi protein disajikan dalam tabel di bawah ini.

22
Tabel No. 5.3 Penghitungan konsumsi protein keluarga

Kelas Interval X’i f fX’i


15 - 25 20 30 600
25 - 35 30 40 1200
35 - 45 40 100 4000
45 - 55 50 110 5500
55 - 65 60 80 4800
65 - 75 70 30 2100
75 - 85 80 10 800
Jumlah 400 19000
Sumber: An Introduction to Biostatistik.
P.S.S. Sundar Rao, G. Jesudian, J. Richard

Dari data di atas didapatkan:

Jumlah nilai observasi : ƩfiX’i = 19000


Jumlah Observasi :n = 400
Nilai rata-rata : X = 47,50 gr

Nilai Tengah (Median)

Nilai tengah juga disebut “Median” dari suatu observasi. Nilai tengah merupakan nilai yang
di tengah-tengah dari seluruh nilai observasi setelah diurut dari yang terkecil ke yang
terbesar atau sebaliknya. Bila jumlah observasi ganjil, maka nilai tengahnya adalah nilai
yang ke (n+1)/2. Misalnya ada 7 observasi, maka nilai observasi yang ke 4 merupakan nilai
tengah. Sedangkan, bila jumlah observasi genap, maka mediannya adalah rata-rata dari dua
nilai observasi yang paling di tengah. Misalnya ada 6 observasi, maka nilai observasi yang
paling di tengah adalah nilai dari observasi ke 3 dan ke 4. Maka nilai tengahnya adalah
(nilai observasi ke 3 + nilai ke 4)/2.

23
Contoh jumlah observasi ganjil:
Ada 7 observasi dan setelah diurut adalah sebagai berikut:

X1 X2 X3 X4 X5 X6 X7
3 5 6 9 11 30 50

maka, nilai tengahnya (Md) = 9

Contoh jumlah observasi genap:

X1 X2 X3 X4 X5 X6
3 5 6 9 11 30

maka nilai tengahnya (Md) = (6 + 9)/2


= 7,5

Menghitung nilai tengah dari distribusi frekuensi tunggal

Bila data dari suatu observasi sudah dalam bentuk distribusi tunggal, maka penghitungan
nilai tengah dapat dilakukan sebagai berikut:
1. Buat frekuensi kumulatif dari distribusi frekuensi tersebut.
2. Tentukan kelas dimana nilai yang ke n/2 terdistribusi dan nilai kelas tersebut adalah
median

Untuk memudahkan pemahaman dari metode tersebut berikut adalah sebuah contoh
penentuan nilai tengah (median) dari satu data dalam bentuk distribusi.
Contoh:

24
Tabel No. 5.4 Kadar Hb dari 30 sampel ibu hamil di daerah X, 1992
Kadar Hb Frekuensi Frek Kum Relatif Kum

(Xi) (fi) (f. cum) (% cum)


8 2 2 7
9 7 9 30
10 9 18 60 Median
11 6 24 80
12 4 28 93
13 1 29 97
14 1 30 100
Jumlah 30

Nilai tengah dari data di atas adalah yang ke 50% atau nilai yang ke (n + 1)/2 atau nilai
yang ke 15,5 atau nilai antara observasi ke 15 dan ke 16. Nilai observasi tersebut
terdistribusi pada Xi = 10. Maka, nilai tengah kadar Hb adalah 10.

Menghitung nilai tengah dari distribusi frekuensi berkelompok

Bila data dari suatu observasi sudah dalam bentuk distribusi berkelompok, maka
penghitungan nilai tengah dapat dilakukan sebagai berikut:
1. Buat frekuensi kumulatif dari distribusi frekuensi tersebut
2. Tentukan kelas dimana nilai yang ke n/2 terdistribusi dan
3. Menghitung nilai tengah dengan rumus sebagai berikut:

(n / 2 − fk )
Nilai tengah : Md = L+
fm
Keterangan: x i
Md = nilai tengah (median)
L = nilai batas nyata bawah kelas median
fk = frekuensi kumulatif sebelum kelas median
fm = frekuensi kelas median
i = interval kelas median
n = jumlah observasi
25
Kelas median = kelas dimana median terdistribusi
Contoh :
Tabel No. 5.5 Penghitungan konsumsi protein keluarga
Konsumsi Jumlah keluarga Frekuensi
Protein (fi) kumulatif
(Xi) (f.cum)
15-24 30 30
25-34 40 70
35-44 100 170
Kelas
45-54 110 280 Median
55-64 80 360
65-74 30 390
75-84 10 400
Jumlah 400

Langkah penghitungan nilai tengah:

1. Menentukan kelas median atau kelas dimana observasi ke (n/2), atau observasi yang ke
200 terdistribusi, yaitu pada kelas (45 – 54)
2. Menentukan batas bawah nyata kelas median: L = 44,5
3. Menentukan frekuensi kelas median : fm = 110
4. Menentukan frekuensi kumulatif dari kelas sebelum kelas median, yaitu : fk = 170
5. Menentukan interval kelas median : i = 10
6. Menghitung median dengan rumus sebagai berikut:

(n / 2 − fk )
Nilai tengah : Md = L+ x i
fm

(400 / 2 − 170)
= 44,5 + x 10
110

= 47,23 gr

26
Modus

Modus adalah nilai observasi yang paling banyak dijumpai. Dalam kata lain, modus dari
suatu observasi adalah nilai dimana hasil observasi paling memusat. Misalnya dari
observasi 5 keluarga didapatkan jumlah anak sebagai berikut: 1, 2, 2, 2, 3. Jadi modus
jumlah anak dari ke 5 keluarga tersebut adalah 2 anak. Bila hasil pengamatan dari ke 5
keluarga tersebut sebagai berikut: 1, 2, 3, 4, 5, maka data tersebut tidak memiliki modus.
Kadang kala, suatu observasi dapat mempunyai lebih dari satu modus, misalnya dua modus
(bimodal), tiga modus (tripelmodal), dan sebagainya. Untuk suatu observasi dimana
distribusinya asimetris, modus dapat dihitung dengan hubungan emperis sebagai berikut:

Modus = 3 x Median – 2 x Mean,

Penghitungan Modus dari distribusi data berkelompok

Penghitungan modus data dalam distribusi berkelompok menggunakan rumus sebagai


berikut:
D1 x i
Modus = Lm +
D1 + D 2

dimana:
Lm = batas bawah kelas dengan modus
D1 = selisih frekuensi kelas modus dengan kelas sebelumnya
D2 = selisih frekuensi kelas modus dengan kelas sesudahnya
i = interval kelas modus

Untuk data pada tabel No. 5.5 di atas, didapatkan:


1. kelas modus adalah kelas (45 – 54)
2. batas bawah kelas modus (Lm) adalah 45
3. D1 = 110 – 100 = 10
4. D2 = 110 – 80 = 30
5. i = 10

27
Sehingga besar modus dari data pada tabel 4.3.5 adalah:

D1 x i
Modus = Lm +
D1 + D 2

10 x 10
= 45 +
10 + 30

= 47,5 gr

Posisi Tendensi Sentral pada beberapa distribusi

Pada hasil observasi dimana distribusinya normal, maka nilai tendensi sentral seperti nilai
rata-rata (X), nilai tengah (Md), dan Modus (Mo) adalah sama. Dengan kata lain, bila suatu
observasi berdistribusi normal, maka ketiga nilai tendensi sentralnya berimpit.

Mean
Median
Modus
Gambar 1. Posisi Mean, Median dan Modus pada distribusi normal

Posisi mean, median dan modus pada data yang mempunyai distribusi menceng ke kanan
ataupun ke kiri berbeda dengan data yang berdistribusi normal. Posisi nilai tengah pada
observasi yang berdistribusi menceng adalah selalu diantara nilai rata-rata dan modus. Pada
observasi yang distribusinya menceng ke kanan, maka nilai rata-rata akan lebih besar dari
nilai tengah, nilai tengah akan lebih besar dari modus. Sebaliknya, pada observasi yang
menceng ke kiri, nilai rata-rata lebih kecil dari nilai tengah, dan nilai tengah lebih kecil dari

28
modus. Untuk lebih jelasnya, posisi nilai rata-rata, nilai tengah, dan modus akan
digambarkan dalam bagan di bawah ini.

Distribusi menceng ke kanan Distribusi menceng ke kiri

Mo Md Mean Mean Md Mo

Gambar 2. Posisi Mean, Median, dan Modus pada distribusi menceng ke kiri dan ke kanan

2.5.2 Ukuran Sebaran


Di samping ke arah mana hasil observasi memusat, kita juga perlu mengetahui variasi
antara nilai observasi yang satu dengan yang lainnya agar kita dapat menjelaskan
karakteristik dari kelompok subjek yang diobservasi dengan lebih jelas. Nilai tendensi
sentral dari suatu data tidak menjelaskan bagaimana variabilitas data hasil observasi dari
kelompok subjek tersebut. Misalnya, dua kelompok anak sekolah yang terdiri dari 10 anak
SD di kota dan 10 anak SD di desa. Kedua kelompok anak SD tersebut mempunyai rata-
rata tinggi badan sama yaitu 100 cm. Apakah variasi tinggi pada kedua kelompok tersebut
sama, tidak bisa kita jawab sebelum kita mengukur sebarannya atau variasinya.

Ada beberapa ukuran sebaran dari suatu kelompok data, yaitu: range, deviasi terhadap rata-
rata (mean deviation), standar deviasi, dan koefisien variasi (coefficient of variation). Di
bawah ini akan diuraikan keempat jenis ukuran sebaran tersebut secara lebih rinci.

29
Range

Range dari suatu hasil observasi adalah jarak antara hasil observasi yang paling kecil
sampai yang paling besar. Besarnya range dari suatu hasil observasi hanya ditentukan oleh
dua nilai observasi yang paling ekstrim, yaitu yang paling kecil dan yang paling besar.
Tidak jarang nilai ekstrim tersebut jauh dari nilai observasi pada umumnya, sehingga range
tidak merupakan ukuran sebaran yang baik. Range dari suatu nilai observasi sangat mudah
dibuat. Misalnya suatu observasi terhadap tekanan darah distole didapatkan data tekanan
darah diastole sebagai berikut:

50, 70, 74, 75, 75, 75, 80, 80, 80, 80, 85, 85, 90, 140

Data tekanan diastole dari 14 sampel di atas mempunyai range antara 50 sampai 140
mmHg.

Untuk data yang disajikan dalam distribusi berkelompok, sangat sulit untuk menentukan
range yang sesungguhnya. Untuk data yang disajikan secara berkelompok, kita hanya dapat
menentukan nilai kelas terendah dan yang tertinggi. Misalnya untuk data konsumsi protein
keluarga di bawah ini mempunyai range antara 15 sampai 75 gr.

Tabel 2.5.2.1 Hasil penghitungan konsumsi protein keluarga

Konsumsi protein (gr) Jumlah keluarga


(Xi) (fi)
15 – 25 30
25 – 35 40
35 – 45 100
45 – 55 110
55 – 65 80
65 - 75 30
Jumlah 390
Sumber: An Introduction to Biostatistik; P.S.S. Sundar Rao, G. Jesudian, J. Richard

30
Mean Deviasi

Mean deviasi adalah rata-rata penyimpangan nilai observasi terhadap nilai rata-ratanya
dengan tidak memperhatikan tanda plus dan minus. Mean deviasi dapat dihitung dengan
rumus sebagai berikut:

Mean deviasi =
∑ Xi − X
n

Ukuran Mean deviasi tidak banyak dipergunakan sebagai ukuran sebaran, karena kurang
dapat dipergunakan untuk tujuan yang lebih luas.

Contoh penghitungan konsumsi protein keluarga

Tabel 2.5.2.2 Tabel bantu perhitungan nilai mean Deviasi

Konsumsi Nilai tengah Jumlah Deviasi dengan Hasil kali


(gr)
protein Kelas Keluarga Mean Fi x (Mean-dev)
Xi X’i fi X 'i − X
15 – 25 20 30 -27,5 825
25 – 35 30 40 -17,5 700
35 – 45 40 100 -7,5 750
45 – 55 50 110 +2,5 275
55 – 65 60 80 +12,5 1000
65 – 75 70 30 +22,5 675
75 - 85 80 10 +32,5 325
400 4550

Nilai rata-rata = 47,5 gr

825 + 700 + 750 + 275 + 1000 + 675 + 325


Mean Deviasi =
400

= 11,375

31
Varian (galat) dan Standar Deviasi (simpang baku)

Standar deviasi (SD) merupakan ukuran sebaran yang paling penting. SD mempunyai
hubungan dengan Range dan distribusi frekuensi dari hasil observasi. SD dengan nilai rata-
rata dapat menjelaskan distribusi data secara unik. Misalnya, bila kelompok data
berdistribusi normal, 95% dari data tersebut terdistribusi antara Mean +/- 1,96 SD dan 99%
dari data tersebut terdistribusi antara mean +/- 2,57 SD.

Standar deviasi adalah akar dari jumlah kuadrat beda nilai observasi dengan nilai rata-rata
dibagi dengan derajat bebas (jumlah observasi – 1). Oleh karena itu, SD dapat dihitung
dengan rumus sebagai berikut:

SD =
∑ (Xi − X )
n −1

atau

SD =
∑ Xi − (∑ Xi )
2
/n
(n − 1)

Untuk hasil observasi yang sudah disajikan dalam tabel distribusi, dengan menggunakan
analog dari rumus di atas, SD dapat dihitung dengan rumus sebagai berikut:

SD =
∑ fiXi − (∑ fiXi )
2
/n
(n − 1)

Sedangkan varian (S) dari hasil suatu observasi adalah kuadrat dari SD dari observasi
tersebut, maka dari itu varian dapat dihitung sebagai berikut:

S = SD2

32
Berikut adalah contoh penghitungan SD dan Varian dari konsumsi protein keluarga. Dalam
contoh ini ditunjukan tabel bantu penghitungan SD dan Varian dengan membuat kolom fiXi
dan kolom fiXi2 agar penghitungan SD dengan rumus di atas dapat dikerjakan.

Tabel 2.5.2.3 Tabel bantu penghitungan SD dan varian komsumsi protein keluarga

Xi X’i Fi f i Xi f i Xi 2
15 – 25 20 30 600 12000
25 – 35 30 40 1200 36000
35 – 45 40 100 4000 160000
45 – 55 50 110 5500 275000
55 – 65 60 80 4800 288000
65 – 75 70 30 2100 147000
75 - 85 80 10 800 64000
Jumlah 400 19000 982000

Standar Deviasi:

2
982000 − (19000 ) / 400
SD =
(400 − 1)
= 14,10 gr
Varian:

S = SD2 = 198,75

Koefisien Variasi

Koefisien variasi adalah besarnya standar deviasi (SD) dinyatakan dalam nilai rata-rata.
Koefisien variasi digunakan untuk membandingkan variabilitas beberapa kelompok
observasi dengan unit pengukurannya berbeda. Koefisien variasi dinyatakan dalam persen
dan cara menghitungnya adalah sebagai berikut:

SD
Koefisien variasi (kv) = x100%
rata − rata

33
Contoh:

Tabel 2.5.2.3 Data deskriptif tinggi dan berat badan

Data Kasus Mean Range SD KV


Tinggi 33 164,6 142 – 180 7,64 4,7%
Berat 33 43,1 42 – 45 6,48 15,0%

Dengan melihat besarnya nilai koefisien variasi (KV) dari kedua data yang terdapat pada
tabel di atas ternyata data berat badan lebih bervariasi dibandingkan dengan data tinggi
badan, walaupun range dari data tinggi badan lebih lebar dari range data berat badan. data
tinggi badan mempunyai KV sebesar 4,7% sedangkan data berat badan mempunyai KV
sebesar 15,0%.

2.5.3 Persentil

2.5.3.1 penghitungan persentil dari distribusi tunggal


Persentil menunjukan nilai individu yang ke sekian persen dari sampel setelah nilainya
diurut dari kecil ke besar, misalnya persentil 10 artinya nilai sample yang ke 10%, persentil
25 artinya nilai sampel yang ke 25%, persentil 50 artinya nila sampel yang ke 50%,
persentil 75 artinya nilai sampel yang ke 75%, dan seterusnya.

Tabel 2.5.3.1 Distribusi tunggal kadar Hb ibu hamil

Kadar Hb Frekuensi Frek Kum Relatif Kum

(Xi) (fi) (f. cum) (% cum)


8 2 2 7
9 7 9 30
10 9 18 60
11 6 24 80
12 4 28 93
13 1 29 97
14 1 30 100
Jumlah 30

34
Misalnya dari distribusi data Hb ibu hamil seperti yang disajikan pada Tabel 2.5.3.1 di atas
diketahui bahwa persentil 10 adalah 9 mg/dl. Persentil 10 adalah 9 mg/dl artinya Hb dari
sampel ibu hamil yang ke 10% adalah 9 mg%. Contoh lain, nilai persentil 25 adalah 9
mg/dl, artinya Hb dari sampel yang ke 25% adalah 9 mg/dl. Contoh lain, persentil 50
adalah 10 mg/dl, artinga Hb pasien yang ke 50% adalah 10 mg/dl. Hal penting yang perlu
diketahui bahwa persentil 50 sama dengan median.

2.5.3.2 Penghitungan persentil dari distribusi data berkelompok


Penghitungan nilai persentil dari data yang disajikan dalam distribusi berkelompok
menggunakan rumus sebagai berikut.
( p − fk )
Persentil( p) = L + i
( fm − fk )

Keterangan:

p = persentil ke p%
L = nilai batas nyata bawah kelas persentil ke p%
fk = frekuensi kumulatif sebelum kelas persentil ke p%
fm = frekuensi kumulatif kelas persentil ke p%
i = interval kelas

Tabel 2.5.3.2 Distribusi Komsumsi Protein Keluarga

Konsumsi Protein Frekuensi % Kumulatif


(Xi) (Fi)
15-24 30 7.5
25-34 40 17.5
35-44 100 42.5
45-54 110 70.0
55-64 80 90.0
65-74 30 97.5
75-84 10 100.0
Jumlah 400

35
Misalnya akan dihitung nilai persentil 10 dari distribusi data di atas, maka nilai p = 10.
Nilai persentil 10 terletak di kelas 25-34 (kelas persentil ke 10), dengan nilai batas bawah
kelas adalah 25 (L), dengan frekuensi kumulatif di bawah kelas persentil 10% adalah 7,5
(fk), frekuensi kumulatif kelas persentil ke p adalah 17,5 (fm), dan interval kelas adalah 10
(i), maka nilai persentil 10 dapat dihitung sebagai berikut.

( p − fk )
Persentil (10) = L + i
( fm − fk )
(10 − 7,5)
Pesentil (10) = 25 + x10
(17,5 − 7,5)
Persentil (10) = 25 + 2,5 = 27,5

Jadi nilai persentil 10 adalah 27,5 artinya nilai sampel yang ke 10% adalah 27,5.

2.5.4 Quartil dan Inter Quartil


Quartil terdiri dari quartil 1, quartil 2, dan quartil 3. Quartil 1 menyatakan nilai sampel
yang ke 25% atau sama dengan nilai persetil 25, quartil 2 menyatakan nilai sampel yang ke
50% atau sama dengan persentil 50, dan quatil 3 menyatakan nilai sampel yang ke 75%
atau sama dengan nilai persentil 75. Inter Quartil adalah lebar rentang data antara quartil 1
(Q1) sampai dengan quartil 2 (Q2) atau = Q2 – Q1.

Dari tabel 2.5.3.2 di atas didapatkan nilai quartil 1 (Q1) = 38 dan quartil 2 (Q2) = 57,5,
maka interquartil Q2 – Q1 = 57,5 – 38 = 19,5

2.5.5 Box-Plot
Box-Plot merupakan grafik distribusi data yang menggambarkan 99% data berada di dalam
batas bawah dan batas atas grafik dan data yang berada di luar batas bawah dan batas atas
grafik disebut outlier. Di dalam grafik ada BOX dimana batas bawah Box adalah nilai Q1
dan batas atas Box adalah nilai Q2. Garis tebal yang ada di dalam Box adalah Median.
Berikut adalah contoh sebuah Box Plot.

36
*3 ................................................ outlier
*21

................ batas atas (mean + 3 SD)

............... batas atas BOX (Q2)

............... Median

............... batas bawah BOX (Q1)

............. batas bawah (mean – 3 SD)

Kota Desa

Garfik 2.5.4 Box-Plot Intake Protein penduduk di Kota dan Pedesaan

LATIHAN

1. Dalam suatu experimen untuk mempelajari efek obat “X” terhadap kadar kolesterol
darah pada laki-laki umur 30 tahun atau lebih. Data pengukuran kadar kolesterol dari
30 sampel adalah sebagai berikut:

230 235 200 195 200 230 175 170 290 240 200 230

181 245 150 165 265 210 190 120 145 250 210 215

220 225 215 190 270 250

a. Buatlah tabel frekuensi dengan lebar interval 20 dengan frekuensi relatif dan
frekuensi kumulatif dari data di atas.
b. Buat histogram dari data tersebut di atas.
37
c. Hitung rata-rata, median, modus, range, varian dan SD.
2. Berdasarkan data berikut:
1 2 1 2 4 3 3 4 6 5 8 7 10 2
1 7 12 9 3 6 3
a. Buatlah histogram dengan lebar interval 2.
b. Apakah data di atas berdistribusi menceng atau normal.
c. Hitung mean, median, dan modus. Bagaimana ketiga nilai tersebut bila
dibandingkan.
3. Pada suatu penelitian yang mempelajari pengaruh merokok terhadap metabolis obat
Phenacetin dalam tubuh. Kadar phenacetin dalam serum diukur setelah 2 jam minum
obat pada 10 perokok dan 12 bukan perokok. Hasil pengukuran kadar Phenacetin
dalam darah adalah sebagai berikut:

Kadar Penacetin Bukan Perokok Perokok


0,005 – 0,505 1 4
0,505 – 1,005 1 2
1,005 – 1,505 2 2
1,505 – 2,005 3 1
2,005 – 2,505 1 0
2,505 – 3,005 2 1
3,005 – 3,505 1 0
3,505 – 4,005 1 0
Jumlah 12 10

a. Buatlah frekuensi relatif dan kumulatif dari tabel di atas.


b. Mengapa frekuensi relatif yang dipakai membandingkan kedua kelompok di atas
dan bukan menggunakan nilai absolutnya?
c. Berapa persen observasi mempunyai kadar Phenacetin di bawah mean pada
kelompok perokok dan non-perokok?
d. Apakah distribusi kadar Phenacetin normal atau menceng pada perokok dan non-
perokok?

38
e. Untuk kelompok perokok, mana yang lebih besar mean atau
mediannya?berdasarkan hasil di atas, apa kesimpulan anda tentang pengaruh
merokok terhadap metabolis Phenacetin?
4. Di satu laboratorium sedang dilakukan pengujian tiga jenis alat ukur. Untuk menguji
akurasi ketiga alat tersebut, ketiga alat tersebut akan dipakai mengukur kadar Zat Z di
dalam 10 contoh larutan yang masing-masing mengandung 10 mg/ml Zat X di
dalamnya. Hasil pengukuran dengan ketiga alat tersebut adalah sebagai berikut:

Instrumen I Instrumen II Instrumen III


5 10 10
10 9 11
7 10 9
15 9 10
16 11 10
12 8 9
4 9 11
8 7 12
10 8 8
13 9 10

a. Hitung mean dan Standar Deviasi hasil pengukuran ketiga alat di atas.

b. Instrumen mana yang paling akurat dan jelaskan alasan anda.

5. Dari dua tenaga teknisi lab akan dipilih satu dari mereka untuk melakukan penelitian.
untuk menguji yang mana dari mereka yang lebih baik, kedua mereka disuruh
memeriksa kadar Zat X’’ di dalam satu larutan yang kadarnya sudah ditetapkan
5mg/ml. Mereka ditest di dua laboratorium. Hasil test dari kedua teknisi tersebut
adalah sebagai berikut:

a. Hitung Mean dan Standar Deviasi hasil pengukuran setiap teknisi


b. Berdasarkan hasil analisa di atas, teknisi mana yang akan anda pilih.
c. Hitung mean dan standar deviasi hasil pengukuran setiap teknisi untuk setiap Lab.
d. Hasil pengukuran yang mana yang paling akurat.

39
Modul 3
Some Basic Probability Concepts

3.1 PENDAHULUAN

Bagian ini merupakan bagian yang paling tidak menyenangkan untuk dipelajari karena
sering membuat frustasi terutama pada bagian philosofi dan konsep matematiknya. Dengan
menyadari hal tersebut, maka pada bagian ini akan diuraikan hal-hal yang pragmatis
dengan mengambil contoh peristiwa sehari-hari.

Probabilitas bukan istilah yang asing bagi tenaga kesehatan, misalnya dalam keseharian
kita dengar bahwa kemungkinan sembuh pasien Ca mama sekitar 10%. Petugas kesehatan
masyarakat berkata bahwa perokok kemungkinan menderita CHD 3 kali lebih sering
dibandingkan bukan perokok. Banyak pihak mengekpresikan probablitas sebagai
persentase. Bila x adalah terjadinya kondisi yang diamati misalnya jumlah perokok yang
menderita CHD dan n adalah jumlah perokok yang diamati, maka kemungkinan terjadinya
CHD pada perokok adalah:

x x
P(CHD) = -------- dapat juga dinyatakan dalam persen P(CHD) = ----- x 100 %
n n

Mutually Excusive Events

Bila A dan B adalah dua peristiwa, maka A dan B dinyatakan sebagai dua peristiwa yang
mutually exclusive bila A dan B tidak pernah terjadi secara bersamaan. Misalnya peristiwa
munculnya salah satu muka dari mata uang atau munculnya salah satu muka dari dadu atau
munculnya outcome suatau penelitian dimana kemungkinan outcomenya adalah mati atau
hidup.
40
Bila E1, E2, E3, ...Ei adalah kemungkinan outcome dari satu percobaan dan E1, E2, E3,
..Ei adalah mutually exclusive events, maka:

1. Probabilitas munculnya salah satu outcome P(Ei) ≥ 0

2. Jumlah probabilitas munculnya setiap outcome akan sama dengan 1.

P(E1) + P(E2) + P(E3) + ....+ P(Ei) = 1

3. Probabilitas munculnya outcome E1 atau E2 sama dengan jumlah dari probabilitas


masing-masing outcome.

P(E1 atau E2) = P(E1) + P(E2)

Complementary Events

Kemungkinan outcome suatu percobaan disebut komplementer bila jumlah probabilitas dari
setiap outcome = 1. Misalnya outcome suatu percobaan adalah sembuh (E1) atau tidak
sembuah (E2). E1 dan E2 disebut dua kejadian yang komplementer, maka probablitas
munculnya kejadian E1 + probabilitas munculnya kejadian E2 sama dengan 1.

P(E1) + P(E2) = 1.

Kejadian yang mutually exclusive juga merupakan kejadian yang komplementer.

3.2 CARA MENGHITUNG PROBABILITAS

Pada umumnya, penjelasan tentang probabilitas diberikan dengan contoh melempar dadu
yang berorientasi kepada Teori Probabilitas, tetapi penjelasan kami akan menggunakan
contoh biomedis. Tabel 3.1 di bawah ini menggambarkan kadar cholesterol darah dari 1047
orang dewasa normal.

41
Tabel No. 3.1 Distribusi kadar cholesterol darah pada laki-laki normal umur 40 – 59 tahun

Kadar Cholesterol Frekuensi Frekuensi relatif % kumulatif


120 – 139 10 1,0 1,0
140 – 159 21 2,0 3,0
160 – 179 37 3,5 6,5
180 – 199 97 9,3 15,8
200 – 219 152 14,5 30,3
220 – 239 206 19,7 50,0
240 – 259 195 18,6 68,6
260 – 279 131 12,5 81,1
280 – 299 96 9,2 90,3
300 – 319 47 4,5 94,8
320 – 339 30 2,9 97,7
340 – 359 13 1,2 98,9
360 – 379 6 0,6 99,5
380 – 399 4 0,4 99,9
400 - 419 1 0,1 100,0
Jumlah 1046 100,0

Bila dari 1046 laki normal dipilih satu orang secara random, berapakah besar kemungkinan
(probabilitas) untuk mendapatkan orang dengan kadar cholesterol darah antara (160 – 179)
mg/100 ml. Dari data di atas terdapat sebanyak 37 orang yang mempunyai kadar
cholesterol darah pada rentangan tersebut dari 1047. Maka probabilitas mendapatkan
sampel secara random yang mempunyai kadar kolesterol antara 160-179 adalah:

P = 37/1047 = 0,035 atau (3,5%)

Mari kita lihat problem yang lain, misalnya kita ingin mengetahui berapa probabilitas
mendapatkan orang laki-laki yang mempunyai kadar cholesterol lebih rendah dari 200
mg/100 ml dari satu sampel yang dipilih secara random dari populasi. Dengan cara yang
sama, kita mendapatkan sebanyak 15,8 % (lihat % kumulatif untuk kadar cholesterol lebih
kecil dari 200 mg/100 ml).

42
3.3 ADDITONAL RULE

Misalnya kita ingin mengetahui probabilitas seorang sampel yang dipilih secara random
dari 1047 orang laki-laki normal memiliki kadar cholesterol lebih rendah dari 200 atau
lebih besar dari 300 mg/100 ml. Kedua peristiwa tadi (kadar cholesterol < 200 dan > 300)
merupakan peristiwa yang mutually exclusive (tidak mungkin terjadi bersamaan pada
seseorang). Oleh karena itu, probabilitas memiliki cholesterol < 200 atau > 300 merupakan
penjumlahan probabilitas memiliki cholesterol < 200 dan probabilitas memiliki cholesterol
> 300. Bila Probabilitas P (A or B) adalah probabilitas memiliki cholesterol < 200 atau >
300, P (A) adalah probabilitas memiliki cholesterol < 200 dan P (B) adalah probabilitas
memiliki cholesterol > 300, maka dengan menggunakan data dalam Tabel 3.1:

P (A or B) = P (A) + P (B)

= 0,158 + 0,097 = 0,255

Additional Rule

Probabilitas munculnya “A” atau “B” dimana A dan B adalah peristiwa yang mutually
exclusive sama dengan penjumlahan dari Probabilitas A ditambah Probabilitas B.

P (A or B) = P (A) + P (B)

3.4 CONDITIONAL PROBABILITY

Pada uraian di atas telah dibicarakan cara menghitung probabilitas sampel random terhadap
keseluruhan sampel. Pada kenyataan sehari-hari kita dihadapkan kepada keinginan untuk
mengetahui probabilitas sampel dengan kondisi tertentu, misalnya ingin mengetahui
probabilitas penderita diare yang minum Es Mambo. Jadi dalam hal ini kita akan
menghitung probabilitas penderita diare minum dari yang minum es mambo. Probabilitas
ini lazim dikenal dengan conditional probability. Bila kejadian minum es mambo diberi

43
simbol B dan kejadian diare diberi simbol A, maka probabilitas kondisionalnya diberi
simbol P(B|A) yang besarnya dapat dihitung sebagai berikut:

P (B|A) = P (A dan B)/P (A)

Keterangan:

P (B|A) = Prob. kejadian B pada kondisi A


P (A dan B) = Prob. kejadian A dan B bersamaan
P (A) = Prob. kejadian A

Contoh:

Untuk mempelajari sumber penularan suatu wabah diare di Kota Denpasar tahun 1980
dilakukan studi penelusuran makanan (food hystorical study) dengan rancangan Case-
Control. Data yang didapat adalah sebagai berikut:

Tabel 3.3 Distribusi kasus dan kontrol menurut minum esmambo

Es mambo Kasus (A) Kontrol Jumlah


Minum (B) 25 7 32
Tidak minum 5 23 28
Jumlah 30 30 60

Dari data ini dapat dihitung:

P (A) = 30/60
P (A dan B) = 25/60
P (B|A) = P (A dan B) / P (A)
= (25/60) / (30/60)
= 25/30
= 0,83
44
3.5 MULTIFLICATION RULE

A dan B adalah dua kejadian yang saling berkaitan (dependence events). Besarnya
kemungkinan kedua peristiwa A dan B terjadi secara bersamaan yang disimbulkan dengan
P(A dan B) adalah sama dengan kemungkinan terjadinya B pada kondisi dimana A terjadi,
yaitu: P(B|A) dikalikan dengan kemungkinan kejadian A, yaitu: P( A). Dengan contoh di
atas, kemungkinan terjadinya Adan B secara bersamaan dapat dihitung sebagai berikut.

P (A dan B) = P (B|A) P (A)


= 25/30 x 30/60
= 25/60

Bila peristiwa B tidak berkaitan dengan peristiwa A, maka peristiwa A dan B saling tidak
tergantung atau “independence events”, maka P (B|A) = P (B) atau sebaliknya P (A|B) = P
(A). Maka oleh karena itu, probabilitas terjadinya peristiwa A dan B bersamaan dapat
dihitung sebagai berikut:

P (A dan B) = P (B|A) P (A)

Oleh karena peristiwa A dan B independen, maka P (B|A) = P (B).

Jadi,

P (A dan B) = P (B) P (A)

Contoh:

Kalau kejadian diare (A) tidak berkaitan dengan minum es mambo (B), berapa
kemungkinan seorang sampel yang dipilih secara random mimum es mambo (B) dan juga
menderita diare (A).

Dari data pada Tabel 3.3, didapatkan probabilitas menderita diare (kasus) atau P(A) = 30/60
dan probabilitas minum esmambo (B) atau P(B) = 32/60, maka probabilitas sampel minum
esmambo dan juga diare adalah sbb:

45
P (A dan B) = P(A) P(B)

= 30/60 x 32/60

= 0,267

3.6 BAYES’ RULE

Bayes’ Rule dapat dipakai untuk menghitung kemungkinan terjadinya suatu peristiwa dari
suatu kondisi lain yang sudah terjadi. Misalnya untuk mengetahui kemungkinan orang yang
tes kulit tuberkulin positif akan menderita TBC atau kemungkinan terjadi kanker paru pada
perokok berat, dan sebagainya.

Seandainya diketahui angka kejadian suatu penyakit D di masyarakat sebesar 5% atau P


(D) = 0,05 dan 80% kasus penyakit D menunjukkan adanya gejala T atau P(T|D), serta 10%
yang tidak menderita penyakit D’ juga menunjukkan gejala T atau P(T|ND). Bila satu orang
sampel dipilih secara random dari masyarakat tersebut, berapa kemungkinan orang dengan
gejala T menderita penyakit D atau P(D|T).

Kalau D simbol sakit dan D’ simbol tidak sakit serta T simbul adanya gejala dan S’ tanpa
gejala, maka dari data di atas diketahui:

Kemungkinan sakit : P(D) = 0,05


Kemungkinan tidak sakit : P(D’) = 1 – P(D) = 1 – 0,05 = 0,95
Kemungkinan gejala T pada yang sakit : P (T|D) = 0,80
Kemungkinan gejala T pada yang tidak sakit : P (T|D’) = 0,10

Yang mau dicari adalah P (D|T), yaitu kemungkinan dari orang yang memiliki gejala T
menderita penyakit D?

Menurut teori probabilitas kondisional, maka:


P(D|T) = P(D dan T) / P(T)

46
sehingga : P(D dan T) = P(D|T) P(T)
Juga : P(T dan D) = P(T|D) P(D)

Oleh karena P(D dan T) dan P(T dan D) adalah peristiwa yang sama, maka:
P(D|T) P(T) = P(T|D) P(D)
atau : P(D|T) = {P(T|D) P(D)}/P(T)

Dari data yang diberikan di atas, P(T|D) dan P(D) diketahui, sedangkan P(T) tidak
diketahui.

Mereka yang memiliki gejala bisa sakit dan bisa tidak sakit, jadi bisa kita kategorikan
menjadi T dan D atau T dan D’. Kedua peristiwa tersebut adalah mutually exclusive, oleh
karena itu P(T) dapat dihitung sebagai berikut:
P(T) = P(T dan D) P(T dan D’)
Oleh karena;
P(T dan D) = P(T|D) P(D) dan
P(T dan D’) = P(T|D’) P(D’) maka,
P(T) = P (T|D) P(D) + P(T|D’) P(D’)
Jadi,
P (D|T)= P(T|D) P(D) / P(T)
= P(T|D) P(D) / {P(T|D) P(D) + P(T|D’) P(D’)
= (0,80 x 0,05)/{(0,80 x 0,05) + (0,10 x 0,95)}
= 0,30
Bayes’ role didasarkan kepada konsep bahwa kemungkinan terjadinya suatu peristiwa
tergantung dari beberapa peristiwa lainnya. Dari contoh di atas, kita bisa memperkirakan
berapa kemungkinan orang dengan gejala tertentu menderita penyakit tertentu dari
informasi kemungkinan kejadian sakit P(D) dan kemungkinan orang yang sakit memiliki
gejala T tersebut P(T|D) dan yang tidak sakit ada gejala atau p(T|D’).

47
3.7 SENSITIVITAS, SPESIFISITAS, DAN NILAI DUGA POSITIF & NEGATIF

Konsep probabilitas dan Baye’s Theorem banyak diaplikasikan dalam uji diagnostik dan
screening. Hasil uji diagnostik atau creening dipakai meningkatkan kemampuan klinikus
mendiagnosis sutau penyakit berdasarkan hasil test atau berdasarkan gejala yang ada. Pada
bagian ini akan dibahas sensitivitas, spesifisitas, nilai duga positif, nilai duga negatif, nilai
duga positif palsu dan nilai duga negatif palsu.

Pada uji diagnostik atau screening setiap sampel akan diperiksa dengan alat
screening/diagnostik dan juga diperiksa dengan gold standar. Hasil dari kedua pemeriksaan
tersebut disilang, sehingga akan didapatkan tabel distribusi sebagai berikut.

Hasil test Gold Standar Total


Sakit (D) Tidak Sakit (D’)
Positif (T) a b a+b
Negatif (T’) c d c+d
Total a+c b+d n

Ada beberapa ukuran yang sering dipakai dalam uji diagnostik, yaitu:
1. Sensitivitas
Sensitivitas merupakan probabilitas sampel yang sakit menunjukan hasil test positif
atau P(T|D).
Dengan menggunakan data pada tabel distribusi di atas dapat dihitung nilai sensitivitas
alat test sbb:
P(T|D) = P(T dan D)/P(D) = a/n / {(a+c)/n} = a/(a+c)

2. Spesifisitas
Spesifisitas adalah probabilitas orang yang tidak sakit memiliki hasil test negatif atau
P(T’|D’)
48
Dengan menggunakan tabel distribusi di atas, spesifisitas dapat dihitung sbb:
P(T’|D’) = P(T’ dan D’) / P(D’) = d/n / {(b+d)/n} = d/(b+d)

3. Nilai duga positif


Nilai duga positif (predictive value positive) adalah probabilitas orang dengan test
positif menderita sakit atau P(D|T)
Nilai duga positif dapat dihitung dengan menggunakan conditional probability atau
Baye’s Theorem dimana
P(D|T) = P(T|D) P(D) / P(T)
P(D|T) = {a/(a+c) x (a+c)/n}/{(a+b)/n}= a/(a+b)
Atau
P(D|T) = P(T|D) P(D) / {P(T|D) P(D) + P(T|D’) P(D’)
P(D|T) = {a/(a+c) x (a+c)/n}/{a/(a+c) x (a+c)/n + b/(b+d) x (b+d)/n}
= (a/n)/{(a/n) + (b/n)} = (a/n)/(a+b)n = a/(a+b)

4. Nilai duga negatif


Nilai duga negatif (predictive value negatif) adalah probabilitas orang dengan test
negatif tidak sakit atau P(D’|T’)
Nilai duga negatif dapat dihitung conditional probability dan baye’s theorem sbb:
P(D’|T’) = P(T’|D’) P(D’) / P(T’)
P(D’|T’) = {d/(b+d) x (b+d)/n}/{(c+d)/n}= d/(c+d)

5. Nilai positif palsu


Nilai positif palsu (false positive) adalah probabilitas orang dengan test positif tetapi
tidak menderita sakit atau P(D’|T)
Nilai positif palsu dapat dihitung conditional probability dan baye’s theorem sbb:
P(D’|T) = P(T|D’) P(D’) / P(T)
P(D’|T) = {b/(b+d) x (b+d)/n}/{(a+b)/n}= (b/n)/{(a+b)/n} = b/(a+b)

49
6. Nilai negatif palsu
Nilai negatif palsu (false negative) adalah probabilitas orang dengan test negatif tetapi
menderita sakit atau P(D|T’)
Nilai positif palsu dapat dihitung conditional probability dan baye’s theorem sbb:
P(D|T’) = P(T’|D) P(D) / P(T’)
P(D|T’) = {c/(a+c) x (a+c)/n}/{(c+d)/n}= (c/n)/{(c+d)/n} = c/(c+d)

LATIHAN:

1. Misalnya anda adalah salah satu dari 12 voluntir untuk percobaan efek obat “X”. Ada
tiga kelompok perlakuan, yaitu obat baru, obat standar, dan placebo. kelompok yang
mendapat obat baru sebanyak 4 orang, obat standar 4 orang dan placebo juga 4 orang.
a. Berapa kemungkinan anda mendapatkan obat baru
b. Berapa kemungkinan anda mendapatkan obat (baru atau standar).

2. Kemungkinan kegagalan alat alarm pada intensive care bed adalah 0,001. untuk
amannya, pada intensive bed dipasang lagi satu duplikat alat alarm. Berapa
kemungkinan gagalnya alat alarm pada intensive bed tersebut sekarang.

3. Data keracunan makanan sebagai berikut:


Sakit Tidak sakit Total
Makan 75 25 100
Tidak 5 10 15
Total 80 35 115

a. Hitung probabilitas yang makan menjadi sakit?

b. Hitung probabilitas yang tidak makan menjadi sakit?

c. Hitung probabilitas yang makan tidak menjadi sakit?

50
4. Suatu test “X” positif pada 95% kasus penyakit “Y”, tetapi juga 3% kasus bukan
penyakit “Y” positif. Kejadian penyakit “Y” pada populasi sebesar 1%. Berapa
probabilitas seseorang yang dipilih secara random dari populasi tersebut mempunyai
test positif dan juga menderita penyakit “Y”? Hitung pula sensitivitas, spesifitas, dan
nilai duga (predictive value) dari tset “X”.

Solusi no 4.

Diketahui : P(T|D) = 0,95 ; P(T|D’) = 0,03; dan P(D) = 0,01

1. P(T dan D) ?

o P(T|D) = P(T dan D)/P(D)

o P(T dan D) = P(T|D) x P(D) = 0,95 x 0,01 = 0,095

2. Sensitiftas P(T|D)?

o P(T|D) = 0,95

3. Spesifisitas P(T’|D’)?

o P(T’|D’) = 1-P(T|D’) = 1 – 0,03 = 0,97

4. Nilai duga positif P(D|T)?

P(D|T) = P(T|D) P(D) / {P(T|D) P(D) + P(T|D’) P(D’)


= (0,95 x 0,01)/{(0,95x0,01)+(0,03 x 0,99) = 0,0095/(0,0095+0,0297) = 0,242

51
Modul 4
The Teoritical Distributions

4.1 PENDAHULUAN

Pada modul sebelumnya telah dibahas beberapa konsep probabilitas dan cara
menghitungnya. Pada modul ini akan dibahas tentang distribusi probabilitas atau juga
disebut distribusi teoritis yang meliputi distrubusi binomial, distribusi poisson, distribusi
normal, dan aplikasi dari distribusi normal.

Distribusi teroritis dapat diekpresikan dalam bentuk tabel, grafik atau formula. Distribusi
teoritis adalah distribusi hipotetik dari probabilitas munculnya suatu nilai dari variabel
random menurut teori atau formula tertentu. Misalnya distribusi Binomial adalah distribusi
probabilitas berdasarkan teori Bernouli, disribusi normal adalah ditribusi probabilitas
berdasarkan formula yang dibuat dari Gaus, dan distribusi Poisson adalah distribusi
berdasarkan formula dari Poisson.

4.2 DISTRIBUSI BINOMIAL

Distribusi binomial adalah satu distribusi probabilitas munculnya x sukses dari suatu
peristiwa yang hanya memiliki dua kategori (binomial) dari n sampel (kecil). Distribusi
Binomial dikembangkan oleh James Bernoulli (1654-1705) yang dihasilkan dari hasil
penelitian yang dikenal dengan nama Bernoulli trial. Bila suatu trial menghasilkan luaran
(out-come) dengan dua kemungkinan yang mutually excusive (binomial), seperti misalnya
jenis kelamin bayi yang lahir, dimana jenis kelamin hanya terdapat dua kemungkinan yaitu
laki atau perempuan, maka trial tersebut dinamai Bernoulli Trial.

52
Dalam Bernoulli trial, probabilitas munculnya out-come yang diharapkan misalnya
probabilitas bayi lahir laki-laki disebut p dan probabilitas bayi lahir perempuan disebut q,
maka q = 1 – p.

Sebagai contoh, misalnya dalam sebuah penelitian dengan jumlah sampel n = 5 akan
dipelajari berapa probabilitas x (x = 0, 1,2 ...5) bayi laki lahir dari 5 sampel tersebut. Dari
data sensus penduduk diketahui bahwa probabilitas bayi laki lahir p = 0,51 dan probabilitas
bayi perempuan lahir q = 0,49.

Penentuan probabilitas lahirnya x bayi dengan jenis kelamin laki dari n sampel ditentukan
dengan rumus sbb:

f(x) = nCx px qn-x

Keterangan: f(x) = probabilitas xi bayi laki lahir dari n sampel,


dimana x = 0, 1, 2 ...n
p = probabilitas bayi laki lahir
q = probabilitas bayi perempua lahir, dimana q = 1 – p
n = jumlah sampel
x = jumlah outcome yang diharapkan terjadi
C
n x = koefisien Bernoulli

Koefisien Bernoulli

Koefisien Bernoulli menyatakan jumlah kombinasi yang dapat dibuat dari n objek dengan x
jumlah objek dengan outcome yang diharapkan. Misalnya outcome yang diharapkan adalah
bayi laki dan x = jumlah bayi laki yang lahir serta n adalah jumlah sampel. Berapa
kombinasi yang dapat dibuat dari sampel n = 5 dan dari sampel tersebut terdapat bayi laki x
= 3. Koefisien Bernoulli untuk x sukses dari n sampel dihitung dengan formula sbb:

n!
n Cx =
x!(n − x)!
5! 5 x 4 x3 x 2 x1 120
5 C3 = = = = 10
3!(5 − 3)! (3 x 2 x1)(2 x1) 12

53
Keterangan: nCx = koefisien Bernoulli
n = jumlah sampel
x = jumlah outcome yang diharapkan

Penghitungan Probabilitas

Dari contoh di atas diketahui probabilitas bayi laki lahir p = 0,51 dan bayi peremuan q =
0,49, maka probabilitas julah bayi laki lahir 0, 1, 2, 3, 4, dan 5 dari jumlah sampel n = 5
dapat dihitung sebagai berikut.

Kemungkinan outcome Probabilitas f(xi) = nCx pxqn-x


(x) dari 5 sampel
0 (tdk ada laki) 5C0 p0q5 = 5!/(0!5!) x 0,510 x 0,495 = 0,028248
1 4
1 (satu laki) 5C1 p q = 5!/(1!4!) x 0,511 x 0,494 = 0,147002
2 3
2 (dua laki) 5C2 p q = 5!/(2!3!) x 0,512 x 0,493 = 0,306005
3 2
3 (tiga laki) 5C3 p q = 5!/(3!2!) x 0,513 x 0,492 = 0,318495
4 1
4 (empat laki) 5C4 p q = 5!/(4!1!) x 0,514 x 0,491 = 0,165747
5 0
5 (semua laki) 5C5 p q = 5!/(5!0!) x 0,515 x 0,490 = 0,034503
Total = 1,000000

Contoh aplikasi distribusi Binomial

1. Dari data survei nasional diketahui bahwa 30% anak memiliki kekebalan terhadap
Influensa. Bila dilakukan survei terhadap 10 anak SD di Denpasar yang dipilih secara
random, berapa probabilitas 4 dari 10 anak memiliki kekebalan terhadap influensa?

Penghitungan probabilitas adalah sbb:

F(4) = 10C4 P4Q6

= 10!/(4!6!) x 0,34 x 0,76 = 0,2001

Hasil analisis menunjukan bahwa sekitar 20,01% kemungkinan dari 10 sampel dengan
4 orang memiliki kekebalan terhadap influensa.

54
2. Dari data populasi diketahui bahwa sekitar 10% penduduk mengalami kebutaan. Bila
sebanyak 25 orang sampel penduduk dipilih secara random, berapa kemungkinan dari
mereka 5 atau kurang dari 5 menderita kebutaan atau P(x≤5).

Untuk menghitung P(x≤5) dapat digunakan additional rule yaitu P(x≤5) = P(x=0) +
P(x=1) + P(x=2) + P(x=3) + P(x=4) + P(x=5), sbb:

P(x=0) = 25C0 x P0 x Q25 = 25!/(0!25!) x (0,1)0 x (0,9)25 = 0.07179


P(x=1) = 25C1 x P1 x Q24 = 25!/(1!24!) x (0,1)1 x (0,9)24 = 0.19941
P(x=2) = 25C2 x P2 x Q23 = 25!/(2!23!) x (0,1)2 x (0,9)23 = 0.26588
P(x=3) = 25C3 x P3 x Q22 = 25!/(3!22!) x (0,1)3 x (0,9)22 = 0.22649
P(x=4) = 25C4 x P4 x Q21 = 25!/(4!21!) x (0,1)4 x (0,9)21 = 0.13841
P(x=5) = 25C5 x P5 x Q20 = 25!/(5!20!) x (0,1)5 x (0,9)20 = 0.06459
Total = 0.9666

4.3 DISTRIBUSI POISSON

Distribusi Poisson adalah distribusi probabilitas waktu atau tempat dengan x kejadian
tertentu, dimana x adalah variabel diskret (misalnya jumlah kasus bunuh diri dalam
sebulan). Misalnya ingin diketahui berapa probabilitas bila dipilih bulan secara random
dengan jumlah kasus buhuh diri sebanyak 3. Pada contoh ini, bulan merupakan kesatuan
waktu yang diteliti. Contoh lain, berapa kemungkinan satu lapang pandang yang dipilih
secara acak ditemukan 10 koloni bakteri. Pada contoh ke dua ini, lapangan pandang sebagai
satuan tempat yang diteliti.

Distribusi Poisson dikembangkan oleh Simeon Denis Pisson (1781-1840) seorang ahli
matematik kebangsaan Prancis. Distribusi Poisson banyak dipakai sebagai model
probabilitas di bidang ilmu biologi dan kedokteran. Sebagi contoh misalnya akan diteliti
berapa kemungkinan “bulan” dengan jumlah kasus bunuh diri 3 orang, bila salah satu bulan
dipilih secara random dari 12 bulan yang ada.

55
Apabila x adalah jumlah kasus yang terjadi dalam interval waktu tertentu misalnya jumlah
kasus bunuh diri dalam satu bulan dan probabilitas waktu dengan x kejadian ditentukan
dengan rumus berikut.

e −λ λx
f ( x) = dimana x = 0, 1, 2, .......
x!
Keterangan: x = jumlah kasus dalam interval waktu/tempat
e = konstan yang besarnya 2,7183
λ = rerata kejadian dalam interval waktu/tempat
f(x)= probabilitas interval waktu/tempat dengan munculnya x kasus

Contoh Aplikasi Distribusi Poisson

Sebagai contoh, dalam penelitian bunuh diri diasumsikan bahwa jumlah kasus bunuh diri
perbulan mengikuti distribusi Poisson dengan rerata jumlah kasus perbulan λ = 2,75.
Berapa probabilitas bulan yang dipilih scara random dengan jumlah kasus bunuh diri
sebanyak x = 3 orang.

Penghitungan probabilitasnya dilakukan sebagai berikut:

e −λ λ x 2,7183−2,75 2,75 3 (0,0639)(20,797)


f ( x) = = = = 0,2216
x! 3! 6

Jadi probabilitas bulan yang dipilih secara random dimana pada bulan tersebut terdapat 3
kasus bunuh diri adalah 0,2216 atau 22,16%.

Misalnya dari data penelitian di atas ingin diketahui probabilitas bulan dengan jumlah
kasus bunuh diri 3 atau 4 orang. Penghitung probabilitas pada kasus ini dihitung dengan
menggunakan additional rule dimana P(x=3 or x=4) = P(x=3) + P(x=4), sehingga
penghitungan probabilitasnya adalah sebagai berikut.

2,7183−2,75 2,75 3 2,7183−2,75 2,75 4


f (3or 4) = + = 0,2216 + 0,1523 = 0,3739
3! 4!

56
4.4 DISTRIBUSI NORMAL

Distribusi probabilitas yang paling penting adalah distribusi normal. Formula distribusi
normal dibuat oleh Abraham De Moivre (1667-1754), kemudian Carl Friedrich Gauss
(1977-1855) dan distribusi normal sering disebut distribusi Gauss. Data kontinyu atau
interval seperti umur, tinggi badan, berat badan, kadar gula darah dan lainnya cenderung
berdistribusi normal.

Distribusi normal dibuat berdasarkan formula sbb:

1 2
/ 2σ 2
f ( x) = e −( x − µ ) dimana - ∞ < x < ∞
2πσ

Keterangan: π = konstanta = 3,14159


e = konstanta = 2,1783
σ = SD
µ = rata-rata
x = random variable

Karakteristik Distribusi Normal

Karakteristik penting dari distribusi normal adalah:

1. Bentuknya seperti bell simetris

2. Nilai Mean, Median, dan Modusnya sama

3. Total area di bawah curve distribusi normal dan di atas sumbu X = 100% dan 50%
dari area di bawah curve distribusi normal berada di bawah mean dan 50% lainnya
di atas mean.

4. Luas area di bawah curve distribusi normal yang terletak ± 1 SD dari Mean = 68%
dari luas curve keseluruhan; ± 1,96 SD dari Mean = 95% dari luas curve keseluruha,
dan ± 3 SD dari Mean = 99,7% dari luas curve keseluruhan.

57
Mean
-1SD 68% + 1SD
- 1,96SD 95% +1,96SD
- 3SD 99,6% + 3SD

Bagan 1. Distribusi Normal dan Luas Area di bawah Curve Normal

Tinggi dan lebar kaki dari distribusi normal ditentukan oleh mean dan SD. Nilai rerata akan
menentukan letak cuve distribusi normal pada sumbu X, sedangkan nilai SD akan
menentukan lebar kaki dan tinggi puncak curve, dimana makin tinggi SD makin lebar kaki
dan makin rendah puncak curve, sebagai contoh di bawah ini.

σ1
σ1 < σ2 < σ3

σ2

σ3

Mean

Bagan 2. Bentuk Distribusi Normal dengan SD yang Berbeda

58
Distribusi Normal Standar

Pada uraian sebelumnya telah diuraikan bahwa dilihat dari karakteristik distribusi normal,
sebenarnya terdapat satu keluarga distribusi normal yang dibedakan oleh nilai rerata dan
nilai SD dari datanya. Salah satu dari anggota distribusi normal yang penting adalah
distribsi normal standar (standard normal distribution) adalah distribusi normal dari data
standar (standardized data) dan bukan dari raw data. Data standar juga disebut Z skor dari
data. Nilai standar (Zskor) mempunyai nilai rerata nol dan SD = 1. Nilai standar (Zskor)
dari satu data dihitung berdasarkan rumus Z = (X – Mean)/SD. Karena rerata nol dan SD =
1, maka formula dari distribusi normal standar adalah sbb:

1 2
f ( z) = e −z /2
dimana - ∞ < z < ∞

Nilai standar (z) dari suatu data selalu mempunyai mean = 0 dan SD = 1, maka berapapun
mean dan SD suatu data, akan ada hanya satu bentuk distribusi normal standar dari data
tersebut karena mean selalau sama dengan nol dan SD = 1.

σ1=1

Mean = 0

Bagan 2. Bentuk Distribusi Normal Standar

59
Tabel distribusi normal

Tabel Distribusi Normal atau juga disebut Normal Curve Area atau Tabel Z adalah tabel
yang berisikan luas area di bawah curve normal untuk nilai Z tertentu. Pada kolom pertama
dari Tabel berisikan nilai Z dengan gigit pertama di belakang koma, sedangkan pada baris
pertama terdapat digit ke dua di belakang koma dari nilai Z. Sel pada baris ke dua dan
seterusnya berisikan luas area di bawah curve normal sampai nilai Z tertentu. Berikut
adalah potongan dari Tabel Z.

Z
z -0.09 -0.08 -0.07 -0.06 -0.05 -0.04 -0.03 -0.02 -0.01 -0.00
-3.80 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
-3.70 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001
-3.60 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0001 .0002 .0002
-3.50 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002 .0002
-3.40 .0002 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003 .0003
-3.30 .0003 .0004 .0004 .0004 .0004 .0004 .0004 .0005 .0005 .0005
-3.20 .0005 .0005 .0005 .0006 .0006 .0006 .0006 .0006 .0007 .0007
-3.10 .0007 .0007 .0008 .0008 .0008 .0008 .0009 .0009 .0009 .0010
-3.00 .0010 .0010 .0011 .0011 .0011 .0012 .0012 .0013 .0013 .0013
-2.90 .0014 .0014 .0015 .0015 .0016 .0016 .0017 .0018 .0018 .0019

Cara menggunakan Tabel Z.

Misalnya akan ditentukan berapa luas area di bawah kurve normal untuk nilai Z ≤ -3,15.

Maka untuk itu, carilah sel dalam tabel Z untuk nilai Z = - 3,15 dan angka yang terdapat
pada sel tersebut sama dengan luas area di bawah kuve untuk nilai Z ≤ - 3,15.

Caranya: cari nilai Z = - 3.1 pada kolom Z dan cari nilai Z = 0,05 pada baris pertama,
kemudian dari garis horizontal dari nilai Z = -3.10 dan garis vertikal ke bawah dari nilai Z
= 0,05 (pada baris pertama tabel Z), sel dari tabel yang menjadi persilangan kedua garis
menyatakan luas area di bawah kurve untuk nilai Z ≤ - 3,15. Pada contoh kasus ini

60
didapatkan luar area di bawah kurve normal dengan nulai Z ≤ - 3,15 = 0,0008 atau sebesar
0,08%.

Contoh Aplikasi Distribusi Normal

Kasus 1.

Pada penelitian penyakit Alzeimer didapatkan bahwa berat otak penderita Alzeimer
berdistribusi normal dengan rerata 1076,80 gr dan SD = 105,76 gr. Berapa probabilitas
sampel dengan berat otak kurang dari 800 gr dengan ilustari seperti bagan di bawah ini.

σ=105,76 gr

P?

800 1076,80

Bagan 3. Luas area di bawah kurve normal dibawah 800 gr

Langkah penyelesaian:

1. Hitung nilai Z(x=800) = (800 - 1076,80)/105,76 = - 2,62


2. Cari luas area untuk Z = - 2,62 pada Tabel Z. Dari Tabel Z di dapatkan nilai 0,0044
3. Jadi probabilitas penderita Alzeimer dengan berat otak < 800 gr adalah 0,0044 atau
0,44%.

Kasus 2.

Diketahui bahwa tinggi badan di satu populasi berdistribusi normal dengan nilai rerata 175
cm dengan SD = 10 cm. Ingin diketahui berapa probabilitas seorang dari populasi tersebut
yang dipilih secara random tingginya antara 160 – 180 cm, seperti bagan di bawah ini.

61
σ=10 cm

P?

160 175 180


Bagan 4. Luas area di bawah kurve normal antara 160 – 180 cm

Langkah penyelesaian:
1. Hitung nilai Z untuk tinggi 160 cm
Z(x=160) = (X-mean)/SD = (160 – 170)/10 = -1,00
2. Cari luas are di bawah curve untuk Z ≤ - 1,00 à = 0,1587
3. Hitung nilai Z untuk tinggi 180 cm
Z(x=180) = (X-mean)/SD = (180 – 170)/10 = +1,00
4. Cari luas area di bawah curve untuk Z ≤ + 1 = 0,8413
5. Hitung luas area di bawah kurve antara Z≤ -1 sampai Z≤ + 1= 0,8413 – 0,1587 =
0,6826 atau sebesar 68,26%.
Kasus 3

Kadar gula darah populasi tertetu diketahui berdistribusi normal dengan nilai rerata 100
g/dl dengan SD = 5 g/dl. Ingin diketahui berapa retangan kadar gula dari 95% populassi
disekitar rerata, seperti bagan di bawah ini.
σ=5 g/dl

95%

X1? 100 X2?


Bagan 5. Nilai batas 95% area di bawah kurve normal disekitar rerata

62
Langkah penyelesaian:

1. Hitung luas area di bawah kurve di bawah X1

P1 = (1 – 0,95)/2 = 0,025

2. Cari nilai Z pada Tabel Z untuk luas area = 0,025

Nilai Z(X1) = - 1,96

3. Hitung nilai X1

Z(x1) = (X1-Mean)/SD

-1,96 = (X1- 100)/5 à X1 = -1,96 x 5 + 100 = 90,2 g/dl

4. Hitung luas area di bawah kurve di bawah X2

P2 = 0,95 + 0,025 = 0,975

5. Cari nilai Z pada Tabel Z untuk luas area = 0,975

Nilai Z(X2) = 1,96

6. Hitung nilai X2

Z(x2) = (X2-Mean)/SD

1,96 = (X2 – 100)/5 à X2 = 1,96 x 5 + 100 = 109,8g/dl

Jadi 95% dari populasi mempunyai kadar gula darah antara 90,2 g/dl s/d 109,8 g/dl.

63
Modul 5
Distribusi Sampel

5.1 Pendahuluan

Setelah memahami pengertian tentang populasi, sampel, cara pengambilan sampel, dan
penentuan besarnya sampel, maka selanjutnya perlu dipahami tentang pengertian distribusi
sampel sebagai dasar untuk memahami konsep statistik inferensial. Yang dimaksud dengan
distribusi sampel (sampling distribution) adalah distribusi rerata atau proporsi semua
kemungkinan sampel dari suatu populasi.

Ada beberapa distribusi sampel yang perlu diketahui agar dapat memahami lebih jelas
konsep statistik inferensial, antara lain 1) distribusi nilai rata-rata sampel (distribution of
the sample mean, 2) distribusi perbedaan rata-rata dua sampel (distribution of the difference
between two sample means, 3) distribusi proporsi sample (distribution of the sample
proportion), dan 4) distribusi perbedaan proporsi dari dua sample (distribution of the
difference between two sample proportions).

5.2 Distribusi Rerata Sampel

Misalnya akan diteliti jumlah anak yang dimiliki populasi daerah X. Jumlah populasi KK di
daerah X adalah 5 KK, yaitu A, B, C, D, dan E. Jumlah anak dari ke 5 populasi KK tersebut
adalah 1, 2, 3, 4, dan 5. Rerata jumlah anak populasi µ = 3 orang.

Apabila penelitian tentang jumlah anak di populasi tersebut menggunakan sampel dengan
jumlah sampel n = 2, maka kemungkinan sampel yang bisa dibuat dari populasi tersebut
adalah sebanyak 10 sampel sbb:

64
Sampel Data Jumlah Anak Rerata
1. AB 1 dan 2 1,5
2. AC 1 dan 3 2,0
3. AD 1 dan 4 2,5
4. AE 1 dan 5 3,00
5. BC 2 dan 3 2,5
6. BD 2 dan 4 3,0
7. BE 2 dan 5 3,5
8. CD 3 dan 4 3,5
9. CE 3 dan 5 4,0
10. DE 4 dan 5 4,5
Total = 30,0
Rerata = 3,0

Distribusi rerata dari sampel di atas disebut distribusi rerata sampel atau sering disebut
dengan distribusi sampel.

Ciri dari suatu distribusi sampel adalah:

1. Rerata dari nilai rerata sampel akan sama dengan rerata populasi

2. Standar deviasi dari rerata sampel disebut standar error of mean yang disingkat
dengan SE of mean. Secara umum, besarnya SE = SD/√n.

3. Distribusi sampel akan mengikuti distribusi data. Bila data berdistribusi normal,
maka distribusi sampel juga berdistribusi normal. Sebaliknya, bila data tidak
berdistribusi normal, maka distribusi sampel juga akan berdistribusi tidak normal,
kecuali bila jumlah sampelnya cukup besar. Kalau jumlah sampel cukup besar,
walaupun data tidak berdistribusi normal, maka distribusi sampelnya akan
berdistribus normal (Central Limit Theorem).

65
4. BDengan karakteristik tersebut, rerata populasi dapat diestimasi dari rerata sampel.
Bila dari n sampel didapatkan rerata sampel adalah X dengan simpang baku SD,
maka 95% kemungkinan rerata popuasi terletak antara X ± 1,96 xSD / n .

Contoh:

Suatu survei penentuan umur kawin ibu dilakukan pada 200 sampel ibu rumah tangga di
Bali. Dari sampel tersebut didapatkan rata-rata umur kawin ibu adalah 18 th dengan standar
deviasi (SD) sama dengan 2 tahun. Dengan berdasarkan distribusi rerata sampel, kita dapat
memperkirakan rata-rata populasi yang dimaksud hanya dari hasil satu survei.

Msalnya dari hasil survei di atas dapat statistik sampel sebagai berikut:

X = 18

SE = SD / n = 2 / 200 = 0,14

maka 95% kemungkinan rerata populasi terletak antara 18 – 1,96 x 0,14 sampai 18 + 1,96 x
0,14 atau antara 17,72 – 18,27 th, seperti gambar di bawah ini.

95%

17,72 18,27
Bagan 5.1 Nilai batas bawah dan batas atas 95% kemungkinan rerata populasi

66
5.3 DISTRIBUSI PERBEDAAN RATA-RATA DUA SAMPEL

Misalnya suatu survei dengan tujuan untuk mengetahui perbedaan umur kawin antara
wanita dan laki-laki, maka dalam penelitian ini terdapat dua kelompok populasi, yaitu
populasi wanita (ibu) dan populasi laki-laki (bapak). Bila dari dua kelompok populasi ini
diambil sampel masing-masing n1 dan n2, maka dari kedua sampel tersebut akan dapat
dihitung rata-rata umur kawin pada sampel ibu X 1 dengan standar deviasi (SD1) dan pada
sampel bapak X 2 dan (SD2). Dari kedua statistik sampel tersebut bisa dihitung perbedaan
rata-ratanya X beda . Bila survei ini dilakukan berkali-kali pada kedua populasi tersebut,
maka kita akan dapatkan juga banyak beda rata-rata sampel. Distribusi dari beda rata-rata
sampel tersebut dinamakan distribusi perbedaan rata-rata dua sampel.

Distribusi perbedaan rata-rata dua sampel mempunyai karakteristik mirip dengan distribusi
normal dengan perkiraan nilai rata-rata (µ) sama dengan beda rata-rata dari kedua sampel
2 2
X beda dengan standar error perbedaan SE = √(SD1 /n1 + SD2 /n2). Bila pengambilan
sampel diulang sebanyak tak berhingga, maka dapat diperkirakan 95% dari sampel tadi
akan mempunyai rata-rata perbedaan antara ( X beda – 1,96 SE) sampai ( X beda + 1,96 SE).

Contoh:

Bila jumlah sampel ibu dan bapak masing-masing 120 orang dan rata-rata umur kawin ibu
( X 1) = 18 th dengan SD1 = 2 tahun dan rata-rata umur kawin bapak ( X 2 ) = 22 th dengan
SD2 = 3 tahun, maka selanjutnya dapat dihitung
1. Rata-rata perbedaan ( X b ) = X 1 − X 2 = 18 – 22 = - 4
2. Standar error beda (SEb) = √(SD12/n1 + SD22/n2)
= √(4/120 + 9/120)
= 0,329
3. Estimate beda rata-rata kedua kelompok populasi pada tingkat kemaknaan 95%
adalah antara – 4,64 sampai – 3,36
67
95%

-4,64 -3,36
Bagan 5.1 Nilai batas bawah dan batas atas 95% perbedaan rerata dua populasi

5.4 DISTRIBUSI PROPORSI SAMPEL

Apabila peristiwa yang diteliti adalah terjadinya peristiwa x, dimana x adalah variabel
nominal seperti sakit, mati, pekerjaan,dll, maka staristik yang dipakai menggambarka
besaran maslah tersebut adalah angka kejadian dalam persen atau disebut angka proporsi.
Misalnya akan diteliti proporsi bayi yang menderita diare. Kalau sampel yang disurvei
adalah n dan yang megalami diare adalah k, maka kejadian diare pada sampel bayi (p) = k/n
x 100% dengan standar deviasi (SD) = √p(1-p). Seandainya survei tersebut dilakukan
berkali-kali pada populasi tersebut, maka akan didapatkan banyak nilai proporsi (p).
Distribusi dari nilai p tersebut dinamakan distribusi proporsi sampel.

Distribusi proporsi sampel (p) mempunyai karakteristik menyerupai distribusi normal


dengan estimate rata-rata proporsi (µp) = p dengan standar error (SE) = √(pq)/n. Bila dalam
survei tadi besar sampel n = 1000 dan terdapat 12 bayi diare, maka proporsi bayi diare (p) =
12/1000 = 0,012 dengan SE = √(0,012 x 0,988)/1000 = 0,003. Dari sampel tersebut dapat
diestimasikan bahwa 95% proporsi diare pada populasi bayi antara p +/- 1,96 SE.

68
Dari contoh di atas didapatkan:
Proporsi bayi pada sampel :p = 0,012 dan
Standar Error : SE = 0,003
maka 95% proporsi diare pada populasi bayi antara (0,012 – 1,96x0,003) sampai (0,012 +
1,96x0,003) atau antara 0,0064 sampai 0,0178.

95%

0,0064 0,0178
Bagan 5.1 Nilai batas bawah dan batas atas 95% proporsi diare di populasi

5.5 DISTRIBUSI PERBEDAAN PROPORSI DUA SAMPEL

Seandainya dalam suatu penelitian aka dipelajari perbedaan kejadian diare pada bayi di
kota dan di desa, maka kita harus membandingkan dua proporsi diare pada bayi antara
proporsi diare pada sampel bayi di kota dengan proporsi diare pada sampel bayi di desa.
Kalu proporsi diare pada bayi di kota adalah P1 dan proporsi diare pada bayi di desa P2,
maka perbedaan proporsi dari kedua sampel (Pb) = P1- P2 dengan standar error (SE) =
√{p1(1-p1)/n1 + p2(1-p2)/n2}. Kalau survei ini dilakukan berkali-kali, maka kita akan
mendapatkan banyak beda proporsi (Pb). Distribusi dari Pb ini dinamakan distribusi
perbedaan proporsi dari dua sampel.

Distribusi perbedaan proporsi dari dua sampel mempunyai karakteristik menyerupai


distribusi normal dengan perkiraan rata-rata beda proporsi = Pb dengan standar error (SE).
Bila pengambilan sampel dilakukan berulang kali, maka 95% sampel akan mempunyai
perbedaan proporsi antara Pb +/- 1,96 SE.
69
Contoh

Misalnya dari penelitian terhadap 100 sampel bayi di kota dan 100 sampel bayi di desa,
didapatkan bahwa proposi diare pada bayi di kota adalah 0,50 dan di desa 0,33. Berdasarka
hasil penelitian tersebut dapat diperkirakan bahwa perbedaan kejadian diare pada bayi di
kota dan di desa sbb:
P1 = 0,50
P2 = 0,33
Pb = 0,50 – 0,33 = 0,17
SE = √{P1(1-P1)/n1 + P2(1-P2)n2} = √{(0,5x0,5/100) + (0,33x0,67/100)}= 0,068
95% Pb terletak antara Pb ± 1,96SE,
yaitu atara: (0,17 – 1,96x0,068) s/d (0,17+1,96x0,068) atau antara 0,037 s/d 0,303

70
Modul 6
Confidence Interval

6.1 Pendahuluan
Rerata atau proporsi atau relatif risk atau odd ratio populasi disebut parameter,
sedangkan rerata sampel, proporsi sampel, relatif risk sampel atau odd ratio sampel
disebut statistik sampel dan sering disebut sebagai statistik. Rerata populasi diberi
simbul µ sedangkan statistik rerata diberi simbul X, parameter proporsi diberi simbul π
dan statistik proporsi diberi simbul p, parameter relatif risk diberi simbul φ sedangkan
sstatistik relatif risk diberi simbul RR, parameter odd ratio diberi simbul ψ sedangkan
statistik odd ratio diberi simbul OR.

Pada umumnya kita tidak mengetahui rerata populasi atau proporsi populasi, relatif
risk populasi atau odd ratio populasi dan paramter tersebut nilainya diestimasikan dari
statistik sampel. Ada dua metode yang umum dipakai untuk estimasi paramter populasi
dari statistik sampel, yaitu: menggunakan point estimasi dan interval estimasi. Berikut
akan dibahas kedua metode estimasi tersebut.

6.2 Point Estimate


Point estimasi menggunakan satu nilai sebagai nilai estimasi parameter populasi yang
akan dipelajari. Misalnya akan diteliti rerata indek masa tubuh (IMT) dari ibu-ibu di
Bali. Untuk mengukur rerata IMT yang sebenarnya (true mean) adalah sangat tidak
mungkin karena faktor teknis, waktu dan biaya. Oleh karena itu, rerata IMT ibu di Bali
dapat diperkirakan dari 30 sampel ibu yang dipilih secara random. Dari hasil
pengukuran IMT sampel kemudian dihitung rerata IMT sampel. Misalnya didapatkan
26,86 kg/m2 dimana rerata sampel tersebut merupakan nilai point estimate dari
parameter rerata IMT populasi ibu di Bali.

Point estimasi tidak memberikan banyak informasi bagaimana variasi dari nilai
estimasi tersebut karena hanya satu nilai saja. Kita tidak mengetahui seberapa dekat
nilai estimasi tersebut dengan rerata populasi yang sebenarnya (true mean). Perlu
diketahui bahwa rerata sampel belum tentu sama dengan rerata populasi. Perbedaan
rerata sampel dengan rerata populasi tersebut terjadi karena adanya sampling error atau

71
karena faktor kebetulan (by chance). Oleh karena itu, akan lebih sensitif bila estimasi
rerata populasi (parameter populasi) menggunakan interval disekitas rerata sampel
yang disebut dengan interval kepercayaan (confidence interval of mean).

6.3 Interval Estimate


Interval estimasi adalah metode yang dipakai untuk estimasi rerata populasi (true
mean) dengan menggunakan confidence interval (CI). Variabilitas sampel (SE)
diperhitungkan dalam proses penghitungan nilai CI. CI adalah sebuah rentangan nilai
disekitar rerata sampel yang dibatasi oleh dua nilai yang disebut batas bawah (lower
limit) dan nilai batas atas (upper limit). Nilai rerata populasi diperkirakan akan terletak
di dalam interval tersebut. Nilai CI ditentukan oleh tingkat kepercayaan yang akan
dipakai, umumnya untuk penelitian sosial, menggunakan tingkat kepercayaan 95% dan
untuk penelitian laboratorium atau klinik menggunakan tingkat kepercayaan 99%.
Selain tingkat kepercayaan, nilai CI juga ditentukan oleh besar sampel. Makin besar
jumlah sampel, nilai CI akan bertambah sempitdan estimasi rerata populasi akan makin
akurat.

Penentuan CI untuk sampel besar


Apabila suatu sampel dengan jumlah besar (n>60) dipilih dari suatu populasi, maka
95% nilai rata-rata sampel besarnya akan berkisaran antara 1,96 SE (standar eror) di
bawah rata-rata sampel sampai 1,96 SE di atas rata-rata sampel. Hal ini didasarkan
kepada asumsi bahwa distribusi nilai rata-rata sampel dengan jumlah sampel besar
adalah normal dengan SE = ơ/√n. Pada umumnya standar deviasi populasi (σ) sering
tidak diketahui, maka σ populasi diestimasikan dengan nilai standar deviasi sampel,
sehingga SE = SD/√n.

Misalnya akan diteliti tekanan sistole mahasiswa. Untuk tujuan tersebut dipilih
sebanyak 60 sampel mahasiswa. Dari data tekanan sistole sampel didapatkan rata-rata
sistole X = 120 mmHg dengan SD = 2,5 mmHg. Menggunakan data sampel tersebut
dapat diperkirakan bahwa 95% kemungkinan rata-rata tekanan sistole populasi
mahasiswa berkisar antara:

Batas bawah = X -1,96 SD/√n = 120 – (1,96 x 2,5/√60) = 119,37


Batas atas = X +1,96 SD/√n = 120 + (1,96 x 2,5/√60) = 120,63

72
Penentuan CI untuk sampel kecil
Apabila varian populasi tidak diketahui atau jumlah sampel lebih kecil dari 30 (sampel
kecil), distribusi rerata atau beda rerata sampel akan mengikuti distribus ‘t’ dengan
derajat bebas (df) = n – 1 dan dengan standar error (SE) = SD/√n. Penghitungan CI
dengan distribusi t adalah sebagai berikut:

Batas bawah = X - (t x SD/√n)


α

Batas atas = X + (t x SD/√n)


α

Misalnya sampel mahasiswa yang diperiksa tekanan darah sistolenya 30 orang dan
didapat rata-rata ( X ) = 120 mmHg dengan Sd = 2,5 mmHg, maka penghitungan
convidence intervalnya adalah sebagai berikut:
• Hitung nilai derajat bebas (df) = n – 1 = 30 – 1 = 29.
• Lihat nilai t pada tabel t untuk df = 29 dan tingkat kepercayaan (confidence level) =
95% adalah 2,04
• Menghitung nilai batas bawah dan atas:
Batas bawah = X - (t x SD/√n) = 120 – (2,04 x 2,5/√60) = 119,34
Batas atas = X + (t x SD/√n) = 120 + (2,04 x 2,5/√60) = 120,66

6.4 Estimasi Rerata


Suatu penelitian dilakukan untuk mengetahui rerata IMT ibu di Bali. Untuk
mengetahui rerata IMT yang sebenarnya agak sulit, maka rerata populas tersebut akan
diestimasikan dari rerata sampel. Untuk maksud tersebut, sebanyak 30 sampel ibu
dipilih secara random dan dari hasil analisis secara deskriptif didapatkan rerata IMT
sampel 26,86 kg/m2 dengan simpang baku (SD) 2,99 kg/m2 dari hasil pengukuran
berikut.

Tabel 4.1 Index Masa Tubuh (kg/m2) 30 sampel ibu di Bali.

31,0 31,2 26,6


26,5 29,8 25,7
30,2 28,0 26,1
31,1 29,7 27,5
25,2 22,8 28,5
19,7 25,9 20,8
27,5 27,2

73
Berdasarkan hasil analisis deskriptif data sampel IMT ibu di Bali tersebut selanjutnya
dapat dihitung CI 95% dari rerata IMT ibu di Bali dengan langkah sebagai berikut.
Perhitungan:
• Hitung standar error SE = SD/√n = 2,99/√30 = 0,5468
• Hitung CI dengan rumus: CI = mean ± tα x SE, dengan tahapan:
o Menentukan derajat bebas (df) = n – 1 = 30-1=29
o Mencari nilai t untuk α 0,05 pada tabel t, didapatkan t = 2,0452
α

o Menghitung batas bawah LL = mean – 2,0452 x SE = 26,86 – 2,0452 x 0,5468 =


25,74
o Menghitung batas atas UL = mean + 2,0452 x SE = 26,86 – 2,0452 x 0,5468 =
27,98

Bila menggunakan program SPSS dengan prosedur Explore akan didapatkan hasil
seperti berikut:
Descriptives

Statistic Std. Error


imt Mean 26,860 ,5468
95% Confidence Lower Bound 25,742
Interval for Mean Upper Bound
27,978

5% Trimmed Mean 26,998


Median 26,900
Variance 8,969
Std. Deviation 2,9949
Minimum 19,7
Maximum 31,2
Range 11,5
Interquartile Range 4,5
Skewness -,579 ,427
Kurtosis ,148 ,833

Kesimpulan;
Dari hasil analisis tersebut dapat disimpulkan bahwa 95% kemungkinan rerata IMT
populasi terletak antara 25,75 kg/m2 s/d 27,98 kg/m2.

6.5 Estimasi Beda Rerata


Kasus 1 (data kesua sampel homogen)
Suatu penelitian akan mempelajari apakah rerata IMT remaja putri berbeda dengan
remaja putra. Sangat tidak mungkin meneliti semua populasi remaja putri, oleh karena
itu, untuk menjawab pertanyaan tersebut, peneliti melakukan penelitian pada 24 sampel
anak sekolah menengah atas laki dan 20 wanita yang dipilih secara stratified simple
random. Hasil pengukuran IMT dari kedua kelompok sampel adalah sbb:
74
Tabel 4.2 Data IMT (kg/m2) siswa SMA laki dan perempuan
IMT siswa laki IMT siswa perempuan
27,8 29,4 25,4 31,6
22,0 27,0 29,4 25,4
30,5 44,5 29,3 34,9
34,6 22,7 32,7 21,9
29,6 32,8 23,3 23,2
24,5 24,8 28,6 20,1
24,8 29,6 30,1 28,9
30,5 29,4 19,1 31,5
34,3 31,0 35,1 35,2
30 21,9 22,5
25,8 36,5 24,4
29,7 29,0 27,9

Perhitungan:
• Hitung rerata dan SD masing-masing kelompok
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
Sex n Mean SD
Laki 24 29,2792 5,064
Wanita 21 27,6429 4,921

• Hitung homogenitas
Homogenitas data kedua kelompok diuji dengan levene’s test menggunakan statistk
F dengan rumus: F = SD12/SD12 = 1,0588 dengan p > 0,05. Berarti kedua sampel
homogen (equal variances).

• Hitung CI untuk varian ke dua kelompok sama


Ø Hitung beda rerata kedua sampel = 29,2792 – 27,6429 = 1,6363
Ø Hitung SDp2 = {(n1-1)SD12 + (n2-1)SD22}/(n1+n2-2) = 24,8502
Ø Hitung SE = SDp√(1/n1 + 1/n2) = 1,4935
Ø Nilai tα pada tabel t dengan df = 43. Nilai tα adalah 2,0141
Ø Bata bawah LL = beda mean - tα x SE = 1,6363 – 2,0141 x 1,4935 = -1,3757
Ø Batas atas UL = beda mean + tα x SE = 1,6363 – 2,0141 x 1,4935 = 4,6483

Kesimpulan
95% kemungkinan beda rerata kedua sampel terletak antara -1,3757 s/d 4,6483

75
Kasus 2 (data kedua sampel heterogen)
Suatu penelitian akan mempelajari apakah rerata IMT remaja putri berbeda dengan
remaja putra. Untuk menjawab pertanyaan tersebut, peneliti melakukan penelitian pada
20 sampel anak sekolah menengah atas laki dan 20 wanita yang dipilih secara stratified
simple random. Hasil pengukuran IMT dari kedua kelompok sampel adalah sbb:
Tabel 4.2 Data IMT (kg/m2) siswa SMA laki dan perempuan
IMT siswa laki IMT siswa perempuan
17,80 29,40 25,40 31,60
12,00 27,00 29,40 25,40
30,50 44,50 29,30 30,90
34,60 22,70 32,70 21,90
19,60 32,80 23,30 23,20
24,50 24,80 28,60 20,10
24,80 49,60 30,10 28,90
35,50 29,40 30,10 31,50
34,30 31,00 30,10 32,20
30,00 21,90 22,50 30,30

Perhitungan:
• Hitung rerata dan SD masing-masing kelompok
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
Sex n Mean SD
Laki 20 28,8350 8,7063
Wanita 20 27,8750 3,8722


• Hitung homogenitas
Homogenitas data kedua kelompok diuji dengan levene’s test menggunakan statistk
F dengan rumus: F = SD12/SD12 = 5,055 dengan p < 0,05. Berarti kedua sampel
heterogen (unequal variances).

• Hitung CI untuk varian ke dua kelompok sama


Ø Hitung beda rerata kedua sampel = 28,8350 – 27,8750 = 0,96
Ø Hitung SE = √(SD12/n1 + SD22/n2) = 2,13067
Ø Nilai tα pada tabel t dengan df = 38. Nilai tα adalah 2,0211
Ø Bata bawah LL = beda mean - tα x SE = 0,96 – 2,0211 x 2,13067 = -3,4177
76
Ø Batas atas UL = beda mean + tα x SE = 0,96 – 2,0211 x 2,13067 = 5,3377

Kesimpulan
95% kemungkinan rerata beda kedua sampel berkisar antara -3,4177 s/d 5,3377

6.6 Estimasi Proporsi


Bila peristiwa yang diteliti adalah peristiwa nominal misalnya kejadian obesitas atau
anemia dan lainnya. Misalnya akan diteliti kejadian obase pada remaja putri di Bali.
Untuk mempelajari kejadian (%) obase pada remaja putri akan diteliti 30 sampel
remaja putri yang dipilih secara simple random. Dari analisis deskriptif didapatkan
proporsi obase adalah 20%. Dari hasil analisis deskriptif tersebut dapat dihtung CI 9%
dari kejadian obase pada remaja putri di Bali dengan cara sbb:

Penghitungan CI 95% dengan rumus: CI = p ± Zα x SE


Langkah perhitungan:
Ø Hitung standar error SE = √{p (1-p)}/n = √(0,2 x 0,8)/30 = 0,07
Ø Batas bawah LL = p – Zα x SE = 0,20 – 1,96 x 0,07 = 0,063
Ø Batas atas UL = p + Zα x SE = 0,20 + 1,96 x 0,07 = 0,337

Kesimpulan:
95% kemungkinan kejadian obesitas pada remaja putri berkisar antara 6,3% s/d 33,7%.

6.7 Estimasi Beda Proporsi


Misalnya akan diteliti perbedaan kejian obesitas antara remaja putri di kota dan
dipedesaan. Dari wilayah kota dipilih sebanyak 60 sampel dan dari pedesaan juga
dipilih sebanyak 60 sampel remaja putri. Dari kedua sampel tersebut didapatkan
kejadian obesitasnya sebesar 20% untuk pedesaan dan 30% untuk perkotaan, sehingga
terdapat perbedaan proporsi obesitas sebesar 10% pada sanpel. Berapa perbedaan
kejadian obesitas di kedua populasi tersebut.

Untuk estimasi perbedaan proporsi kejadian obesitas di kedua popuasi tersebut akan
dipergunan interval estimasi atau juga disebut confidence interval, yang dihitung
dengan cara sebagai berikut:
Ø Hitung beda proporsi kedua sampel: p1-p2 = 30% - 20% = 10%.
Ø Hitung standar error beda proporsi: SE = √{p1(1-p1)/n1 + p2(1-p2)/n2} =
√{(0,3x0,7/60) + (0,2x0,8/60)} = 0,079
77
Ø Batas bawah LL = beda proporsi – 1,96 SE = 0,10 – 1,96 x 0,079 = - 0,0548
Ø Batas atas UL = beda proporsi + 1,96 x 0,079 = 0,2548

Kesimpulan;
95% kemungkinan beda proporsi kejadia obase antara kota dan desa terletak antara –
5,48% s/d 25,48%.

6.8 Latihan
1. Suatu survel likakukan terhadap siswa sekolah dasar (SD) di kota dengan tujuan untuk
mengetahui kejadian obesitas pada siswa. Sebanyak 200 siwa (100 laki dan 100
perempuan) SD Negeri dan Swasta dipakai sampel yang dipilih secara random. Dari
hasil pengukuran IMT didapatkan sebesar 30% siswa obase. Berapa perkiraan kejadian
obase pada siswa SD di kota dengan tingkat kepercayaan 95%.
2. Berapa perbedaan kejadian obase antara siswa laki dan peremuan di populasi siswa SD
di kota bila kejadian obase pada sampel siswa laki 25% dan pada sampel siswa
perempuan 35%.
3. Dari suatu survei terhadap 30 sampel ibu didapatkan data indek masa tubuh (IMT) sbb:
26,0 25,3 26,0 26,3 28,5 24,5 30,2 26,5 31,5 19,0 21,7 27,5 29,0 29,6 25,7 30,5
26,5 25,7 27,4 20,8 27,1 31,2 30,3 25,4 27,5 25.8 21,3 28,7 22,0 26,7
Berapa perkiraan rerata IMT dari populasi ibu dengan tingkat kepercayaan 95%.

78
Modul 7
Uji Hipotesis Perbedaan Dua Sampel

7.1 Pendahuluan
Pada Modul 4, telah dibahas tentang Confidence Interval (CI) yang menyatakan rentangan
nilai dimana kemungkinan paramter populasi terletak. Pada Modul ini akan dibahas cara
menguji hipotesis perbedaan dua sampel dan pemanfaatan CI dalam uji hipotesis perbedaan
rerata sampel. Pada modul ini akan didiskusikan topik sebagai berikut:
• Prinsip dasar uji hipotesis
• Tahapan uji hipotesis
• Uji hipotesis perbedaan rerata dua sampel bebas
• Uji hipotesis perbedaan rerata dua sampel berpasangan
• Uji hipotesis perbedaan rerata satu sampel dengan konstan

7.2 Prinsip Dasar dari Uji Hipotesis


Pada seksi ini akan dibahas beberapa prinsip dasar yang perlu dipahami tentang uji
hipotesis, yaitu:
• Hipotesis Statistik
• Jenis Uji Hipotesis
• Tingkat Kemaknaan (significant level)
• Nilai p (observed significant level)

Hipotesis Statistik
Hipotesis adalah jawaban terhadap pertanyaan penelitian yang dibuat berdasarkan premis-
premis yang relevan dan up to date, oleh karena itu, kebenaran dari suatu hipotesis masih
perlu dibuktikan dengan data empiris yang didapatkan dari hasil pengukuran sampel.
Sebagai contoh, misalnya pertanyaan penelitiannya adalah: “Apakah ada perbedaan
kejadian obesitas anak sekolah dasar di kota dengan di desa?” Hipotesis dari pertanyaan
penelitian tersebut adalah: “Kejadian obasitas pada siswa sekolah dasar di kota lebih tinggi
dari kejadian obesitas anak sekolah dasar di desa”. Untuk menguji kebenaran hipotesis
tersebut, maka hipotesis penelitian yang dimaksud harus dijabarkan ke dalam hipotesis
statistik.

79
Jenis Hipotesis Statistik
Hipotesis Statistik dibedakan menjadi dua, yaitu hipotesis nol atau null hypothesis dan
hipotesis alternatif atau alternative hypothesis.

Hipotesis Nol (Null hypothesis)


Hipotesis Nol berisikan pernyataan negatif dari yang diujikan. Misalnya, kalau yang diuji
tentang perbedaan, maka hipotesis nol-nya menyatakan ‘tidak berbeda’ dan kalau yang
diuji tentang asosiasi, maka hipotesis nol-nya menyatakan ‘tidak ada asosiasi’. Hipotesis
nol ditulis dengan lambang ‘Ho’

Kalau misalnya yang akan diuji adalah perbedaan rerata IMT antara anak SD di kota
dengan di desa, maka hipotesis nol dari penelitian tersebut adalah: tidak ada perbedaan
rerata IMT antara siswa SD di kota dengan di desa. Cara penulisan Hipotesis Nol dengan
lambang adalah sbb:

Ho : µk = µd atau Ho :µk - µd = 0

Keterangan:
µk dan µd adalah rerata IMT di populasi siswa di kota dan di desa (true means)

Hipotesis Alternatif:
Hipotesis alternatif adalah pernyataan yang dianggap benar terjadi di populasi yang
merupakan kebalikan dari pernyataan dalam hipotesis nol. Hipotesis alternatif ditulis
dengan lambang Ha atau H1. Untuk contoh di atas, hipotesis alternatifnya adalah:

Hipotesis alternatif: Terdapat perbedaan rerata IMT antara anak SD di kota dengan anak
SD di desa. Secara lambang dapat ditulis sebagai berikut.

Ha : µk # µd atau Ha :µk - µd # 0

Kebenaran dari hipotesis nol atau hipotesis alternatif harus diuji dengan data emperis agar
dapat disimpulkan apakah hipotesis nol yang benar atau sebaliknya hipotesis alternatif yang
benar. Bila hipotesis nol yang benar maka kita harus menerima hipotesis nol dan sebaliknya
bila hipotesis alternatif yang benar maka kita harus menolak hipotesis nol.

80
7.2.1 Jenis Uji Hipotesis
Uji hipotesis dibedakan menjadi uji parametrik dan nonparametrik sebagai berikut:

Tujuan Uji Parametrik Uji Nonparametrik


Menguji beda rerata • One samples t test • Mann-Whitney
• Independent samples t test • Wilcoxon
• Paired samples t test • Priedman
• One Way Aova • Kruskal-Wallis
Menguji asosiasi • Pearson Correlation • Spearman Correlation by
• Linear Regression Rank
Menguji perbedaan • Uji Z • Chi-Square
proporsi atau risk • Fisher-Exact
• McNemar

Uji parametrik dapat dipakai bila data berdistribusi normal dan memiliki varian yang
homogen serta dikumpulkan dari sampel yang dipilih secara random. Sementara, uji
hipotesis nonparamterik tidak memerlukan persyaratan apapun, oleh karena itu, uji
hipotesis nonparametrik juga disebut sebagai free methods.

7.2.2 Tingkat Kemaknaan (Significant Level)


Hakekat uji hipotesis adalah menguji kebenaran hipotesis nol, sehingga hasil uji hipotesis
menyatakan hipotesis nol diterima (kalau hipotesis nol benar) atau hipotesis nol ditolak
(bila hipotesis alternatif yang benar). Karena pengujian hipotesis menggunakan data
sampel, maka ada kemungkinan kesalahan hasil uji. Misalnya yang sebenarnya hipotesis
nol benar, hasil uji menyatakan hipotesis alternatif yang benar atau sebaliknya. Dalam uji
hipotesis terdapat dua jenis kesalah yang mungkin terjadi, yaitu kesalahan type I (type I
errror) dan kesalahan type II (type II error).

Kesalahan Type I (Type I Error)


Bila dari hasil uji dinyatakan hipotesis nol ditolak, sedangkan seharusnya di populasi
hipotesis nol diterima (benar). Sebagai contoh, misalnya rerata IMT pada populasi siswa di
desa dan di kota sama atau tidak berbeda, tetapi berdasarkan hasil uji hipotesis yang
menggunakan data sampel terdapat perbedaan rerata antara siswaSD di desa dengan di kota
(Ho ditolak). Kesalahan ini disebut kesalahan type I yang juga diberi smbul α.

81
Kesalahan Type II (Type II Error)
Kesalahan type II adalah menerima hipotesis nol yang seharusnya di tolak. Misalnya
terdapat perbedaan rerata IMT antara populasi siswa SD di kota dan di desa (hipotesis
alternatif yang benar) di populasi, tetapi hasil uji hipotesis dengan data sampel menunjukan
tidak terdapat perbedaan (hipotesis nol benar). Kesalahan type II diberi simbul β. Untuk
memperjelas pengertian kealasahan type I dan type II disajikan matrik berikut.

Matrik kesalahan type I dan II.

Keadaan di Populasi
Hasil test pada sampel Ho diterima Ho ditolak
(tidak berbeda) (berbeda)
Ho diterima Correct (1-α) Type II Error (β)

Ho ditolak Type I Error (α) Power (1-β)

Tingkat kemaknaan adalah probabilitas terjadinya kesalahan type I (α) yang masih
diterima. Konvensi menetapakan besar tingkat kemaknaan adalah 0,05 atau 0,01. Dalam uji
hipotesis probabilitas kesalahan type I (α) ini harus dibuat sekecil mungkin dan umumnya
pada penelitian ilmu sosial menggunakan α sebesar 0,05 dan untuk penelitian klinis atau
laboratorium menggunakan α sebesar 0,01.

7.2.3 Nilai p (Observed Significant Level)


Nilai p (observed significant level) adalah probabilitas mendapatkan hasil seperti yang
didapatkan pada sampel atau yang lebih ekstrem dari nilai tersebut, bila hipotesis nol benar
(Ho: µ1-µ2 = 0). Misalnya, dari populasi siswa SD di kota dan di desa diambil sampel dan
dari kedua sampel tersebut didapatkan beda rerata IMT sebasar 10. Berapa probabilitas
mendapatkan beda rerata ≥10 bila antara kedua populasi siswa SD tersebut tidak terdapat
perbedaan atau Ho: µ1-µ2=0 adalah benar. Nilai probabilitas tersebut dinamakan nilai p.

Cara menghitung nilai p


Hampir semua paket program statistik akan memberikan nilai p pada setiap hasil uji
hipotesis. Selain itu, nilai p juga dapat ditentukan secara manual dengan menggunakan
tabel distribusi Z, distribusi t, distribus F, dan distribusi Chi-square sesuai dengan uji
statistik yang dipakai.
82
Penggunaan nilai p
Nilai p dipakai sebagai salah satu acuan dalam pengambilan kesimpulan apakah hipotesis
nol diterima atau ditolak. Cara pengambilan kesimpulan adalah sbb:

Ø Hipotesis nol diterima bila nilai p > α dan


Ø Hipotesis nol ditolak bila nilai p ≤ α.

7.3 Tahapan Uji Hipotesis


Uji hipotesis adalah suatu metode yang dipakai menguji kebenaran hipotesis nol suatau
penelitian. Uji hipotesis menggunakan data emperis (sampel) untuk membuktikan apakah
hipotesis nol diterima atau ditolak. Ada 4 tahap dalam uji hipotesis, yaitu:

Step 1: membuat hipotesis statistik


Setiap hipotesis penelitian yang akan diuji harus dijabarkan menjadi hipotesis statistik,
makan step 1 adalah membuat hipotesis statistik yang akan diuji, yang terdiri dari hipotesis
nol dan hipotesis alternatifnya. Sebagai contoh, misalnya akan menguji hipotesis perbedaan
rerata IMT siswa SD di kota dengan di desa, maka rumusan hipotesis statistiknya adalah
sebagai berikut.

Ho : µ1 = µ2
Ha : µ1 # µ2

dimana: µ1 adalah parameter rerata IMT populasi siswa SD di kota


µ2 adalah parameter rerata IMT populasi siswa SD di desa

Step 2: menghitung nilai statistik


Nilai statistik perbedaan rerata dapat dihitung dengan rumus sbb:

(Rerata sampel 1) – (Rerata sampel 2)


Statistik perbedaan = -----------------------------------------------------
(Standar Error beda rerata kedua sampel)

83
Nilai statistik perbedaan tersebut memberikan informasi berapa standar error (SE) beda
rerata kedua sampel berata di atas atau di bawah nilai nol (perbedaan rerata populasi bila
hipotesis nol benar).

__ __
0 (X1-X2)

Step 3: menghitung nilai p


Umumnya standar deviasi data di populasi tidak diketahui, maka diasumsikan distribus
perbedaan rerata sampel mengikuti distribusi ‘t’. Oleh karena itu, penghitungan nilai p dari
hasil uji dapat dilakukan secara manual dengan menggunakan tabel distribusi t dengan
derajat bebas df = n1 + n2 – 2. Bila analisis menggunakan paket program statistik, maka
nilai p akan diberikan pada hasil analisisnya.

Step 4: menghitung Confidence Interval (CI)


Penghitungan CI untuk tingkat signifikansi tertentu dari perbedaan rerata sampel dapat
dilakukan dengan cara sbb:

1) Batas awah CI (LL) = beda rerata - tα x SE


2) Batas atas CI (UL) = beda rerata + tα x SE

Bila analisis menggunakan paket program seperti SPSS, maka CI akan diberikan secara
otomatis pada hasil analisisnya.

Step 5: membuat kesimpulan


Kesimpulan hasil uji dapat dibuat dengan dua cara, yaitu;
1) dengan membandingkan nilai p dengan nilai α, dimana;
Ho diterima bila nilai p > α
Ho ditolak bila nilai p ≤ α

84
2) dengan melihat posisi angka nol dalam CI, dimana:
Ho diterima bila angka nol berada dalam CI atau tanda (sign) dari nilai batas bawah dan
batas atas CI berlawanan, seperti contoh berikut:

CI 95%: - 5 s/d +15

Ho ditolak bila angka nol berada di luar CI atau sign dari nilai batas bawah dan batas
atas CI sama, seperti contoh berikut:

CI 95%: +5 s/d +15 atau CI 95%: - 10 s/d -5

7.4 Uji Hipotesis Perbedaan Rerata Dua Sampel Bebas


7.4.1 Dua sampel bebas
Dua sampel digolongkan menjadi dua sampel bebas bila masing-masing sampel di pilih
secara random dari masing-masing populasi. Dalam hal ini, sampel dari populasi pertama
sama sekali tidak tergantung dari sampel populasi ke dua. Sebagai contoh, misalnya akan
membandingkan rerata IMT siswa SD di kota dengan di desa, berarti pada penelitian ini
terdapat dua kelompok populasi yaitu populasi siswa SD di kota dan populasi siswa SD di
desa. Bila dari populasi siswa SD di kota dipilih sampel sebanyak n1 secara random dan
dari populasi siswa SD di desa juga dipilih sampel secara random sebayak n2, maka kedua
sampel tersebut termasuk dua sampel bebas (independent samples).

7.4.2 Uji hipotesis perbedaan rerata dua sampel bebas homogen


Misalnya akan diteliti perbedaan rerata IMT siswa SD di kota dengan di desa. Hipotesis
penelitian menyatakan: terdapat perbedaan rerata IMT antara siswa SD di kota dengan di
desa. Untuk menguji hipotesis tersebut, dari kedua populasi dipilih masing-masing sampel
sebanyak 24 siswa SD di kota dan 21 siswa SD di desa secara random. Data hasil
pengukuran IMT dari kedua sampel adalah sbb:
Tabel 5.4.2 Data IMT (kg/m2) siswa SD di kota dan di desa
IMT siswa SD di kota IMT siswa SD di desa
27,8 29,4 25,4 31,6
22,0 27,0 29,4 25,4
30,5 44,5 29,3 34,9
34,6 22,7 32,7 21,9
29,6 32,8 23,3 23,2
85
24,5 24,8 28,6 20,1
24,8 29,6 30,1 28,9
30,5 29,4 19,1 31,5
34,3 31,0 35,1 35,2
30 21,9 22,5
25,8 36,5 24,4
29,7 29,0 27,9

Langkah analisis adalah sebagai berikut:


Step 1: Merumuskan hipotesis statistik
Hipotesis Nol menyatakan: tidak terdapat perbedaan rerata IMT antara siswa SD di
kota dengan di desa.
Hipotesis nol juga dapat ditulis menggunakan lambang berikut:
Ho : µ1 = µ2 atau Ho : µ1 - µ2 = 0
Dimana: µ1 = rerata IMT siswa di kota dan µ2= rerata IMT siswa SD di desa

Step 2: Menghitung nilai statistik perbedaan


Terdapat beberapa statistik dan test yang harus dilakukan pada step 2 uji hipotesis,
yaitu:
Ø Menghitung mean dan SD dari masing-masing sampel:
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
Sekolah Dasar n Mean SD
Kota 24 29,2792 5,064
Desa 21 27,6429 4,921

Ø Hitung beda rerata kedua sampel = 29,2792 – 27,6429 = 1,6363


Ø Menguji homogentias varian kedua sampel:
Homogenitas data kedua kelompok diuji dengan Levene’s test menggunakan
statistk F dengan rumus: F = SD12/SD12 = 1,0588 dengan p > 0,05. Berarti kedua
sampel homogen (equal variances).
Ø Menghiung SE perbedaan kedua sampel:
Hitung SDp2 = {(n1-1)SD12 + (n2-1)SD22}/(n1+n2-2) = 24,8502
Hitung SE = SDp√(1/n1 + 1/n2) = 1,4935

86
Ø Menghitung statistik test perbedaan kedua sampel:
Beda rerata kedua sampel
Nilai statistik perbedaan (t) = -------------------------------------------------------
Standar error perbedaan rerata kedua sampel

1,6363
t = -------------- = 1,0956
1,4935

Step 3: Menghitung nilai p secara manual


Ø Hitung nilai derajat bebas df = n1 + n2 – 2 = 43
Ø Lihat tabel distribusi t, cari nilai p untuk nilai t = 1,0956 pada derajat bebas (df)
= 43. Nilai p dari nilai t = 1,0956 pada df = 43 adalah > 0,20

Step 4: Menghitung CI perbedaan rerata


Ø Cari nilai t untuk α = 0,05 pada tabel t dengan df = 43. Nilai tα adalah 2,0141
α

Ø Hitung nilai batas bawah CI 95% LL = beda mean - tα x SE


= 1,6363 – 2,0141 x 1,4935 = -1,3757
Ø Hitung nilai batas atas CI 95% UL = beda mean + tα x SE
= 1,6363 – 2,0141 x 1,4935 = 4,6483
Step 5: Membuat simpulan
Ø Menggunakan nilai p:
Berdasarkan hasil analisis didapatkan nilai p > 0,05, maka dapat disimpulkan
bahwa Ho diterima, berarti tidak terdapat perbedaan rerata IMT siswa di kota
dengan di desa.
Ø Menggunakan CI:
Berdasarkan nilai CI 95% dari perbedaan rerata sampel dapat disimpulkan bahwa
Ho diterima, berarti tidak terdapat perbedaan rerata IMT siswa SD di kota
dengan didesa.
Dengan menggunakan program SPSS didapatkan hasil analisis sbb:
Output 1: Statistik deskriptif

Group Statistics

Std. Error
klp N Mean Std. Deviation Mean
IMT siswa SD kota 24 29,2792 5,06419 1,03372
siswa SD desa 21 27,6429 4,92144 1,07395


87
Dari output 1 diketahui bahwa rerata IMT siswa SD di kota adalah 29,2792 dengan SD =
5,064, sedangkan rerata IMT siswa di desa adalah 27,6429 denga SD = 4,921.

Output 2: Uji homogenitas dengan Levene’s Test


Dari uji Levene antara varian IMT siswa di desa dengan siswa di kota didapat varian rasio
F = 0,420 dengan nilai p = 0,520. Hasil uji homogenitas ini menunjukan bahwa kedua
sampel memiliki varian yang tidak berbeda atau kedua sampel dapat dinyatakan homogen
(lihat Levene’s Test for Equality of Variances pada tabel Independence Sample Test di
bawah ini)

Ouput 3: Uji t
Perbedaan rerata kedua sampel (Mean difference) adalah sebesar 1,6363 dengan nilai
statistik t = 1,096. Berarti perbedaan rerata sampel tersebut terletak 1,6363 SE di atas nol
dengan nilai p = 0,279. Berdasarkan hasil uji t tersebut dapat disimpulkan bahwa hipotesis
nol diterima. Berati rerata IMT siswa SD di kota dan di desa tidak berbeda (lihat nilai t dan
Sig pada tabel Independence Sample Test di bawah ini).

Output 4: CI 95% beda rerata sampel


Nilai CI 95% perbedaan rerata IMT siswa di kota dan di desa adalah - 1,375 s/d 4,648. Hal
ini menunjukan bahwa bahwa 95% kemungkinan beda rerata IMT siswa di desa dengan di
kota terletak antara – 1,375 s/d 4,648arena nilai nol berada di dalam CI, maka Ho diterima.
Berarti tidak terdapat perbedaan rerata IMT siswa SD di kota dengan di desa (lihat 95%
Confidence Interval of the Difference pada tabel Independence Sample Test di bawah ini).

Independent Samples Test

Levene's Test for


Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Mean Std. Error Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
IMT Equal variances
,420 ,520 1,096 43 ,279 1,63631 1,49353 -1,37568 4,64830
assumed
Equal variances
1,098 42,503 ,278 1,63631 1,49062 -1,37083 4,64345
not assumed

88
7.4.3 Uji hipotesis perbedaan rerata dua sampel heterogen
Suatu penelitian akan mempelajari apakah rerata IMT remaja putri berbeda dengan remaja
putra. Untuk menjawab pertanyaan tersebut, peneliti melakukan penelitian pada 20 sampel
anak sekolah menengah atas laki dan 20 wanita yang dipilih secara stratified simple
random. Hasil pengukuran IMT dari kedua kelompok sampel adalah sbb:

Tabel 5.4.3 Data IMT (kg/m2) siswa SMA laki dan perempuan
IMT siswa laki IMT siswa perempuan
17,80 29,40 25,40 31,60
12,00 27,00 29,40 25,40
30,50 44,50 29,30 30,90
34,60 22,70 32,70 21,90
19,60 32,80 23,30 23,20
24,50 24,80 28,60 20,10
24,80 49,60 30,10 28,90
35,50 29,40 30,10 31,50
34,30 31,00 30,10 32,20
30,00 21,90 22,50 30,30

Langkah analisis adalah sebagai berikut:

Step 1: Merumuskan hipotesis statistik


Hipotesis Nol menyatakan: tidak terdapat perbedaan rerata IMT antara siswa SD di
kota dengan di desa.
Hipotesis nol juga dapat ditulis menggunkan lambang berikut:
Ho : µ1 = µ2 atau Ho : µ1 - µ2 = 0
Dimana: µ1 = rerata IMT siswa di kota dan µ2= rerata IMT siswa SD di desa

Step 2: Menghitung nilai statistik perbedaan


Terdapat beberapa statistik dan test yang harus dilakukan pada step 2 uji hipotesis,
yaitu:
Ø Menghitung mean dan SD dari masing-masing sampel:
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
89
Sex n Mean SD
Laki 20 28,8350 8,7063
Wanita 20 27,8750 3,8722

Ø Hitung beda rerata kedua sampel = 28,8350 – 27,8750 = 0,96


Ø Menguji homogentias varian kedua sampel:
Homogenitas data kedua kelompok diuji dengan levene’s test menggunakan
statistk F dengan rumus: F = SD12/SD12 = 5,055 dengan p < 0,05. Berarti kedua
sampel heterogen (unequal variances).
Ø Hitung SE = √(SD12/n1 + SD22/n2) = 2,13067
Ø Menghitung statistik test perbedaan kedua sampel:
Beda rerata kedua sampel
Nilai statistik perbedaan (t) = -------------------------------------------------------
Standar error perbedaan rerata kedua sampel

0,96
t = -------------- = 0,45056
2,13067

Step 3: Menghitung nilai p secara manual


Ø Hitung nilai derajat bebas df = n1 + n2 – 2 = 38
Ø Lihat tabel distribusi t, cari nilai p untuk nilai t = 0,45056 pada derajat bebas (df)
= 38. Nilai p dari nilai t = 0,45056 pada df = 40 adalah > 0,20

Step 4: Menghitung CI perbedaan rerata


Ø Mencari nilai t pada tabel t untuk α = 0,05 dengan df = 40 (df terdekat dengan
α

38). Nilai t adalah 2,0211


α

Ø Hitung batas bawah CI 95% beda rerata LL = beda mean - t x SE = 0,96 – α

2,0211 x 2,13067 = -3,4177


Ø Hitung batas atas CI 95% beda rerata UL = beda mean + tα x SE = 0,96 –
2,0211 x 2,13067 = 5,3377

Step 5: Membuat simpulan


Ø Menggunakan nilai p:
Berdasarkan hasil analisis didapatkan nilai p > 0,05, maka dapat disimpulkan
bahwa Ho diterima, berarti tidak terdapat perbedaan rerata IMT siswa laki
dengan siswa perempuan.
90
Ø Menggunakan CI:
95% kemungkinan beda rerata IMT siswa laki dan siswa wanita terletak antara -
3,4177 s/d 5,3377. Kerena angka nol berada didalam CI, maka dapat disimpulkan
Ho diterima. Berarti tidak terdapat perbedaan rerata IMT siswa laki dengan
wanita.

Hasil analisis SPSS menunjukan:


Output 1: Statistik deskriptif mean dan SD

Group Statistics

Std. Error
klp N Mean Std. Deviation Mean
IMT laki 20 28,8350 8,70634 1,94680
wanita 20 27,8750 3,87229 ,86587

Dari output 1 diketahui bahwa rerata IMT siswa laki adalah 28,835 dengan SD = 8,7063,
sedangkan rerata IMT siswa wanita adalah 27,875 denga SD = 3,8722.

Output 2: Uji homogenitas dengan Levene’s test


Dari uji Levene antara varian IMT siswa laki dengan siswa wanita didapat varian rasio F =
5,457 dengan nilai p = 0,025. Hasil uji homogenitas ini menunjukan bahwa kedua sampel
memeiliki varian yang berbeda atau kedua sampel dapat dinyatak heterogen (lihat Levene’s
Test for Equality of Variances pada tabel Independence Sample Test di bawah ini)

Ouput 3: Uji t
Perbedaan rerata kedua sampel (Mean difference) adalah sebesar 0,96 dengan nilai statistik
t = 0,451 yang artinya perbedaan rerata kedua sampel tersebut terletak 0,451 SE di atas nol
dengan nilai p = 0,656. Berdasarkan hasil uji t tersebut dapat disimpulkan bahwa rerata
IMT siswa laki dan wanita tidak berbeda (lihat nilai t dan Sig pada tabel Independence
Sample Test di bawah ini).

91
Output 4: CI 95% beda rerata sampel
Nilai CI 95% perbedaan rerata IMT siswa laki dan wanita adalah - 3,4177 s/d 5,3377.
Berdasarkan hasil analisis tersebut dapat disimpulkan bahwa 95% kemungkinan rerata
kedua sampel terletak antara - 3,4177 s/d 5,3377. Dapat disimpulkan bahwa Ho diterima
(lihat 95% Confidence Interval of the Difference pada tabel Independence Sample Test
baris ke dua seperti di bawah ini).
Independent Samples Test

Levene's Test for


Equality of Variances t-test for Equality of Means
95% Confidence
Interval of the
Mean Std. Error Difference
F Sig. t df Sig. (2-tailed) Difference Difference Lower Upper
IMT Equal variances
5,457 ,025 ,451 38 ,655 ,96000 2,13067 -3,35331 5,27331
assumed
Equal variances
,451 26,234 ,656 ,96000 2,13067 -3,41775 5,33775
not assumed

7.5 Uji hipotesis perbedaan rerata dua sampel berpasangan


7.5.1 Dua sampel berpasangan
Dua sampel berpasangan adalah dua sampel dimana sampel yang satu tergantung dari
sampel yang lain. Rancangan pre-test post-test merupakan salah satu jenis sampel
berpasangan, dimana setiap subyek diukur dua kali. Pada penelitian matched case-control,
dimana setiap sampel kasus dipasangkan dengan sampel kontrol berdasarkan ciri-ciri
tertentu seperti jenis kelamin, umur, pekerjaan dan lainnya. Pada rancangan dengan sampel
berpasaangan, yang menjadi target analisis adalah pasangan sampel dan bukan individu
sampel.

7.5.2 Uji hipotesis perbedaan rerata dua sampel berpasangan


Misalnya akan diteliti perbedaan rerata IMT siswa SD di kota dengan didesa. Hipotesis
penelitian menyatakan terdapat perbedaan rerata IMT antara siswa SD di kota dengan di
desa. Untuk menguji hipotesis tersebut, dari kedua populasi dipilih sampel sebanyak 24
pasangan siswa SD di kota dan desa, yang dipasangkan menurut jenis kelamin dan umur.
Bila sampel di SD kota yang terpilih adalah laki-laki dengan usia 10 tahun, maka
pasangannya dari SD desa dipilihkan juga yang laki dan usia 10 tahun. Data hasil
pengukuran IMT dari pasangan sampel adalah sbb:

92
Tabel 5.4.2 Data IMT (kg/m2) siswa SD di kota dan di desa
No. Kota Desa No. Kota Desa
Pasangan Pasangan
1 27,8 29,4 13 25,4 31,6
2 22,0 27,0 14 29,4 25,4
3 30,5 44,5 15 29,3 34,9
4 34,6 22,7 16 32,7 21,9
5 29,6 32,8 17 23,3 23,2
6 24,5 24,8 18 28,6 20,1
7 24,8 29,6 19 30,1 28,9
8 30,5 29,4 20 19,1 31,5
9 34,3 31,0 21 35,1 35,2
10 30 21,9 22 22,5 25,5
11 25,8 36,5 23 24,4 26,0
12 29,7 29,0 24 27,9 29,6

Langkah analisis adalah sebagai berikut:

Step 1: Merumuskan hipotesis statistik


Hipotesis Nol menyatakan: tidak terdapat perbedaan rerata IMT antara siswa SD di
kota dengan di desa.
Hipotesis nol juga dapat ditulis menggunkan lambang berikut:
Ho : µd = 0
dimana: µd = rerata beda IMT dari pasangan siswa di kota dan desa

Step 2: Menghitung nilai statistik perbedaan


Terdapat beberapa statistik dan test yang harus dilakukan pada step 2 uji hipotesis,
yaitu:
Ø Menghitung mean dan SD beda pasangan sampel:
Dari analisis deskritif didapatkan nilai rerata dan standar deviasi sampel sebagai
berikut.
SD n Mean SD

93
Kota 24 27,9588 4,1743
Desa 24 28,8500 5,5596
Beda rerata 24 - 0,8541 6,6531

Ø Menghitung SE perbedaan kedua sampel:


Hitung SE beda rerata = SD/√n = 6,6531/√24 = 1,35807
Ø Menghitung statistik test perbedaan kedua sampel:
Beda rerata pasangan sampel
Nilai statistik perbedaan (t) = -------------------------------------------------------
Standar error rerata beda pasangan sampel
-0,8541
t = -------------- = - 0,629
1,35807

Step 3: Menghitung nilai p secara manual


Ø Hitung nilai derajat bebas df = n (pasangan) – 1 = 23
Ø Lihat tabel distribusi t, cari nilai p untuk nilai t = - 0,629 pada derajat bebas (df)
= 23. Nilai p dari nilai t = 0,629 pada df = 23 adalah > 0,20

Step 4: Menghitung CI perbedaan rerata


Ø Cari nilai t untuk α = 0,05 pada tabel t dengan df = 23. Nilai tα adalah 2,0687
α

Ø Hitung nilai batas bawah CI 95% LL = mean beda - tα x SE


= - 0,8541 – 2,0687 x 1,35807 = -3,663
Ø Hitung nilai batas atas CI 95% UL = mean beda + tα x SE
= - 0,8541 – 2,0687 x 1,35807 = 1,955

Step 5: Membuat simpulan


Ø Menggunakan nilai p:
Berdasarkan hasil analisis didapatkan nilai p > 0,05, maka dapat disimpulkan
bahwa Ho diterima, berarti tidak terdapat perbedaan rerata IMT siswa di kota
dengan di desa.
Ø Menggunakan CI:
Sebesar 95% kemungkinan rerata beda sampel terletak antara – 3,663 s/d 1,955.
Angka nol berada di dalam CI, dengan demikian dapat disimpulkan bahwa Ho
diterima. Berarti tidak terdapat perbedaan rerata IMT siswa SD di kota dengan
didesa.
94
Dengan menggunakan program SPSS didapatkan hasil analisis sbb:
Output 1: statistik deskriptif

Paired Samples Statistics

Std. Error
Mean N Std. Deviation Mean
Pair kota 27,9958 24 4,17430 ,85208
1 desa 28,8500 24 5,55964 1,13486

Dari output 1 diketahui bahwa rerata IMT siswa di kota adalah 27,9958 dengan SD =
4,1743, sedangkan rerata IMT siswa di desa adalah 28,8500 denga SD = 5,5596.

Ouput 2: Uji t

Rerata beda kedua pasangan sampel (Mean difference) adalah sebesar - 0,85417 dengan
nilai statistik t = - 0,629 yang artinya perbedaan rerata kedua sampel tersebut terletak 0,629
SE di bawah nol dengan nilai p = 0,536. Berdasarkan hasil uji t tersebut dapat disimpulkan
bahwa rerata IMT siswa di kota dan di desa tidak berbeda (lihat nilai t dan Sig pada Paired
Samples Test di bawah ini).

Output 3: CI 95% beda rerata sampel

Nilai CI 95% perbedaan rerata IMT siswa laki dan wanita adalah - 3,66354 s/d 1,95521.
Berdasarkan hasil analisis tersebut dapat disimpulkan bahwa 95% kemungkinan rerata beda
kedua sampel terletak antara - 3,66354 s/d 1,95521. Dari CI tersebut diketahui angka nol
berada di dalam CI, maka dapat disimpulkan bahwa Ho diterima. Berarti tidak terdapat
perbedaan rerata IMT antara siswa di kota denga di desa (lihat 95% Confidence Interval of
the Difference pada Paaired Samples Test di bawah ini).

Paired Samples Test

Paired Differences
95% Confidence
Interval of the
Std. Error Difference
Mean Std. Deviation Mean Lower Upper t df Sig. (2-tailed)
Pair 1 kota - desa -,85417 6,65314 1,35807 -3,66354 1,95521 -,629 23 ,536

95
7.6 Uji hipotesis perbedaan rerata satu sampel dengan nilai test tertentu
7.6.1 Penelitian dengan satu sampel
Dalam bidang kedokteran sering dilakukan penelitian dengan membandingkan suatu
sampel dengan nilai standar. Misalkan dalam pabrik obat dilakukan uji petik terhadap
tetrasiklin 250 mg yang diproduksi oleh pabrik tersebut. Setiap satu jam akan diambil satu
kapsul sebagai sampel, sehingga dalam satu hari akan terdapat 24 sampel kapsul tetrasiklin
250 mg. Tujuan dari uji petik ini adalah untuk menguji apakah kandungan tetrasiklin Hcl
pada setiap kapsul sama dengan nilai standar (250 mg). Contoh yang lain seperti uji pasar
yang dilakukan Balai POM untuk menguji kandungan zat atau bahan obat dari suatu
produk. Dalam kontek ini, peneliti akan membandingkan data sampel dengan nilai test
tertentu. Untuk tujuan pengujian tersebut, dalam sesi ini akan dibahas uji hipotesis
perbedaan rerata sampel dengan nilai test (standar) tertentu.

7.6.2 Uji hipotesis perbedaan sampel dengan nilai test (standar)

Umumnya kita tidak mengetahui standar deviasi masalah yang diteliti di populasi, sehingga
standar deviasi populasi diestimasikan dari sampel. Karena standar deviasi populasi tidak
diketahui, maka itu data diasumsikan berdistribusi ‘t’. Uji hipotesis yang tepat dipakai
untuk menguji perbedaan rerata satu sampel dengan nilai test (standar) adalah One Sample
T Test dengan rumus nilai t sebagai berikut.

X −C
t=
SE
SD
SE =
n
Dimana: _
t = nilai statistik t X = nilai rata-rata sampel
C = nilai standar atau konstan SE = standar error
SD = standar deviasi sampel n = jumlah sampel

Contoh kasus
Balai POM (Pengawasan Obat dan Makanan) melakukan sampel survei untuk
mengantisipasi adanya isu tetrasiklin merk X palsu. Sebanyak 30 sampel kapsul
tetrasiklin merk X diambil secara acak di apotik di Denpasar. Dari survei ini akan
96
dibuktikan apakah kandungan tetrasiklin HCl pada kapsul tetra merk X itu sama
dengan yang tertera pada label yaitu 250 mg tetracyclin HCl.
Dari survei ini didapatkan data kandungan tetrasiklin pada sampel adalah sebagai
berikut:

No Kadar No Kadar
1 250 16 249
2 245 17 251
3 254 18 243
4 248 19 255
5 241 20 245
6 250 21 248
7 246 22 247
8 251 23 252
9 250 24 253
10 245 25 249
11 251 26 243
12 254 27 255
13 248 28 245
14 214 29 248
15 250 30 243

Buktikan apakah kandungan tetrasiklin HCl berbeda dengan 250 mg dengan


menggunakan data sampel di atas pada tingkat kemaknaan 5%.

Langkah analisis adalah:


Step1 : Penetapan hipotesis perbedaan satu sampel dengan nilai test
Hipotesis statistik dari penelitian tersebut adalah:
Ø Hipotesis Nol:
Hipotesis nol menyatakan: tidak terdapat peerbedaan rerata kandungan tetrasiklin
dengan 250 mg.

97
Hipotesis nol juga dapat ditulis sbb:
Ho : µ = 250 atau Ho : µ - 250 = 0

Ø Hipotesis Alternatif:
Hipotesis alternatif menyatakan: rerata kandungan tertrasiklin yang beredar tidak
sama dengan 250.
Dapat juga dinyatakan dengan simbul sbb:
Ha: µ # 250 atau Ha: µ - 250 # 0

Step 2: Penghitungan nilai statistik t:


Penghitungan nilai statistik perbedaan rerata sampel dengan nilai test 250 mg secara
manual dilakukan dengan cara berikut:
Ø Hitung nilai rerata sampel = ∑X/n = 7423/30 = 247,4333
Ø Hitung nilai SD = √{∑(Xi-mean)2/(n-1)} = 7,35168
Ø Hitung standar error SE = SD/√n = 7,35168/√30 = 1,342
Ø Hitung nilai t = (mean – nilai test)/SE = (247,4333 – 250)/1,342
= - 1,912

Step 3: Menentuan nilai p


Besar kemungkinan mendapatkan beda rerata sampel - 2,56667 atau lebih ekstrem bila
hipotesis nol benar, yang juga disebut nilai p dapat ditentukan secara manual sbb:
Ø Tentukan besar derajat bebas (df) = n - 1 = 30 – 1 = 29.
Ø Cari nilai p dari nilai t hitung – 1,912 pada df = 29 pada tabel distribusi t. Dari hasil
didapatkan nilai t hitung 1,912 terletah diantara t0,90 dan t 0,95, maka nilai p
adalah: 0,05 < p < 0,10 uji dua sisi.

Step 4: Menghitung CI 95% dari rerata sampel


CI 95%: beda mean denga standar ± tα x SE:
Ø Batas bawah LL = beda mean - tα x SE = - 2,56667 – 2,0452 x 1,34223 = - 5,3118
Ø Batas atas UL = beda mean + tα x SE = - 2,56667 + 2,0452 x 1,34223 = 0,1785

Kesimpulan
Ø Menggunakan nilai p:
Berdasarkan hasil analisis didapatkan nilai p > 0,05, maka dapat disimpulkan bahwa
Ho diterima, berarti tidak terdapat perbedaan rerata tetrasilkin HCL dengan 250 mg.
98
Ø Menggunakan CI:
Sebesar 95% kemungkinan rerata beda populasi terletak antara – 5,3118 s/d 0,1785.
Angka nol berada di dalam CI, dengan demikian dapat disimpulkan bahwa Ho
diterima. Berarti tidak terdapat perbedaan rerata kandungan tetrasilkin HCl dengan
250 mg.

Hasil analisis dengan SPSS


Output 1: Deskriptif Statistik

One-Sample Statistics

Std. Error
N Mean Std. Deviation Mean
tetracyclin 30 247,4333 7,35168 1,34223

Dari output 1 diketahui bahwa dari 30 sampel terata X didapatkan nilai rerata kandungan
tetrasilin 247,433 mg dengan standar deviasi = 7,35168.

Ouput 2: Beda mean dengan nilai test


Dari tabel output 2 diketahui bahwa, beda rerata tetrasiklin sampel dengan nilai test 250 mg
adalah – 2,56667 mg. Perbedaan tersebut secara statistik tidak bermakna karena nilai p >
0,05 dan CI 95% terletak antara – 5, 3118 s/d 0,1785.

One-Sample Test

Test Value = 250


95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
tetracyclin -1,912 29 ,066 -2,56667 -5,3118 ,1785

99
Modul 8
Analisis Varian One-Way Anova
8.1 Pendahuluan
Pada modul sebelumnya telah dibahas metode analisis perbedaan rerata satu sampel
(one sample T Test), dua sampel bebas (independent samples T Test), dan dua sampel
berpasangan (paired samples T Test). Pada modul ini akan dibahas metode analisis
untuk perbedaan rerata lebih dari dua sampel bebas. Metode analisis yang akan dibahas
adalah metode one way analysis of variance. Metode ini didefinisikan sebagai suatu
teknik dimana total variasi suatu set data dibagi menjadi dua bagian atau lebih menurut
sumber variasi dan akan dihitung kontribusi masing-masing sumber variasi terhadap
total variasi.

Metode analisis varian One-Way sangat banyak dipakai dalam analisis data penelitian
eksperimen dengan rancangan acak lengkap (completely randomized design). Metode
analisis varian umumnya dipergunakan untuk dua tujuan yang berbeda, yaitu (1) untuk
estimasi dan uji hipotesis tentang hipotesis populasi varian dan (2) untuk estimasi dan
uji hipotesis perbedaan rerata populasi. Pada modul ini akan dibahas penggunaan
analisis varian untuk tujuan estimasi dan uji hipotesis perbedaan rerata populasi.
Misalnya peneliti ingin menguji apakah ada perbedaan Hb antara pasien dengan tipe
sickle sel SS, S/thalasemia, dan SC. Pada kasus ini akan dibandingkan rerata Hb dari
ketiga kelompok tipe sickle sel. Data hasil pengukuran adalah sebagai di bawah ini.

Tipe sickle sel Jumlah Hb Ibu


Pasien Mean SD Data individu
Hb SS 16 8,7125 0,8445 7,2;7,7;8,0;8,1;8,3;8,4;8,4;8,5;8,
6;8,7;9,1;9,1;9,1;9,8;10,1;10,3
Hb S/ 10 10,630 1,2841 8,1;9,2;10,0;10,4;10,6;10,9;11,1;
thalassaemia 11,9;12,0;12,1
10,7;11,3;11,5;11,6;11,7;11,8;12
HB SC 15 12,300 0,9419 ,0;12,1;12,3;12,6;12,6;13,3;13,3;
13,8;13,9

100
8.2 Prinsip Dasar One-way Anova
8.2.1 Model
Model matematik adalah menggambarkan kaitan nilai tertentu dari satu set data dengan
simbul-simbul tertentu. Umumnya hasil pengukuran variabel tergantung dilambangkan
dengan xij, rerata populasi dari semua kelompok dengan µ atau juga disebut grand
mean, efek perlakuan dilambangkan dengan τj yang menyatakan perbedaan rerata grup
perlakuan dengan rerata populasi, dan error atau galat percobaan dilambangkan dengan
εij, yang menyatakan variasi individu di dalam kelompok, maka model matematik
analisis varian one-way adalah sbb:

xij = µ + τj + εij

Model analisis varian one-way terdiri dari tiga komponen, yaitu (1) grand mean (µ). (2)
treatment effect (τj), dan (3) error term (εij). Berdasarkan model tersebut, dalam
analisis varian one-way, total variasi bersumber dari variasi kelompok (treatment
effect) dan variasi individu dalam kelompok (error term).

8.2.2 Asumsi
Asumsi yang harus dipenuhi untuk analisis varian one way adalah:
Ø Alokasi sampel atau perlakuan dilakukan secara random
Ø Data dari setiap kelompok perlakuan berdistribusi normal
Ø Semua kelompok memiliki varian yang sama (homogen)

8.2.3 Hipotesis
Hipotesis nol menyatakan: rerata populasi dari semua kelompok perlakuan sama atau
efek semua perlakuan sama.
Hipotesis nol juga dapat dinyatakan sbb:

Ho: µ1 = µ2 = µ3 = .... = µk atau


Ho: τj = 0 j = 1, 2, ....k

Hipotesis alternatif menyatakan: paling sedikit ada rerata dua kelompok berbeda atau
paling sedikit efek dari dua perlakuan berbeda.
Hipotesis alternatif juga dapat dinyatakan sbb:

Ha : tidak semua µj sama atau


Ha : tidak semua τj = 0

101
Hipotesis statistik untuk kasus di atas dinyatakan sbb:
Ho : µ1 = µ2 = µ3
Ha : tidak semua µj sama atau
Keterangan:
µ1 : rerata Hb ibu dengan sickle cell type SS
µ2 : rerata Hb ibu dengan sickle cell type S/thalasemia
µ3 : rerata Hb ibu dengan sickle cell type SC

8.2.4 Test statistik


Uji statistik yang dipakai untuk menguji hipoteis nol tersebut adalah uji F atau
Variance Ratio, yaitu ratio varian antar kelompok dengan varian di dalam kelompok,
dengan tahapan analisis sbb:
Ø Menghitung total variasi kuadrat (SST)
Jumlah kuadrat dari deviasi setiap individu terhadap grand mean disebut jumlah
kuadrat atau Sum-square Total (SST) yang dihitung dengan rumus sbb:

( )
2
SST = ∑ xi j − x = ∑ xij − (∑ xij ) / n
2 2

Keterangan:
SST : total jumlah kuadrat
xij : nilai individu sampel ke i dari kelompok perlakuan ke j
x : grand mean
n : jumlah semua sampel

Untuk contoh kasus di atas:

∑xij2 = 7,22 + 7,72 +.....+ 13,82 + 13,92 = 4.636,23


∑xij = 7,2 + 7,7 +.....+ 13,8 + 13,9 = 429,30
n = 16 + 10 + 15 = 41
SST = ∑xij2 – (∑xij)2/n = 4.636,23 – (429,30)2/41= 141,145

Ø Menghitung jumlah variasi individu kuadrat di dalam kelompok (SSW)


k nj 2 n
SSW = ∑∑ xij − x . j ( ) = ∑ (n j − 1)xSD j
2

j i =1 j =1

Keterangan:
SSW: jumlah kuadrat di dalam kelompok (within groups Sum Square)
xij : nilai individu ke i dari kelompok ke j
x . j : rerata kelompok perlakuan j
102
SDj: standar deviasi kelompok perlakuan ke j
nj: jumlah sampel pada kelompok perlakuan ke j

Untuk contoh kasus di atas:

SSW = ∑{(nj-1) x SDj2}


= (16 – 1) x 0,84692 + (10 – 1) x 1,28412 + (15 – 1) x 0,94182 = 38,02

Ø Menghitung rerata variasi individu kuadrat di dalam kelompok atau variance within
group (MSW)
Rerata variasi dalam kelompok atau disebut varian dalam kelompok (MSW)
dihitung dengan rumus sbb:

MSW = SSW/(n – k)

Keterangan:
MSW: Mean square within group atau rerata variasi dalam kelompok atau varian
dalam kelompok
SSW : jumlah kuadrat dalam kelompok
n : jumlah seluruh sampel
k : jumlah kelompok perlakuan

Untuk contoh kasus di atas:


MSW = SSW/(n – k) = 38,02/(41-3) = 1,001

Ø Menghitung jumlah variasi kuadrat antar kelompok (SSG)


Jumlah kuadrat antar kelompok SSG = jumlah kuadrat dari beda rerata kelompok
dengan grand mean dikalikan jumlah sampel kelompok. SSG dihitung dengan
rumus sbb:
k k
( )
2
SSG = ∑ n j x . j − x = ∑ n j x . j − (∑ xij )/ n
j =1 j =1
2

Keterangan:
SSG: jumlah kuadrat antara kelompok perlakuan
nj : jumlah sampel kelompok perlakuan ke j
x . j : rerata kelompok perlakuan ke j
x : grand mean

103
Untuk contoh kasus di atas:

SSG = 16 x 8,65632 + 10 x 10,632 + 15 x 12,302 – 429,302/41 = 103,125

Ø Menghitung rerata variasi kuadrat antar kelompok (variance between group)


Rerata variasi kuadrat antar kelompok atau varian antar kelompok MSG = SSG
dibagi derajat bebas kelompok (k-1). Cara menghitungnya dapat dilakukan dengan
cara sbb:

MSG = SSG/(k – 1)
Keterangan:
MSG: mean sumsquare groups atau varian antara kelompok
SSG : sumsquare between groups atau jumlah kuadrat antar kelompok
k : jumlah kelompok perlakuan

Untuk contoh kasus di atas:


MSG = SSG/(k-1) = 103,125/2 = 51,562

Ø Menghitung varian ratio (F)


Statistik F yang juga disebut sebagai varian ratio dihitung dari ratio antara varian
antara kelompok (MSG) dengan varian dalam kelompok (MSW) dengan rumus sbb:

F= MSG/MSW
Keterangan:
F : statistik varian ratio
MSG : varian antara kelompok perlakuan atau mean square between groups
MSW: varian dalam kelompok atau mean square within groups

Untuk contoh kasus di atas didapatkan:


F = 51,562/1,001 = 51,535

Ø Menentukan nilai p hasil test


Nilai probabilitas untuk mendapatkan VR seperti yang didapatkan dari sampel atau
yang lebih ektrem, yang juga disebut sebagai nilai p, dapat dilakukan secara manual
dengan melihatnya pada tabel distribusi F dengan langkah sbb:
o Menentukan derajat bebas pembilang (df nominator) = k -1
o Menentukan derajat bebas penyebut (df denominator) = n – k

104
o Lihat tabel F untuk mencari posisi nilai F hitung pada df nominator (k-1) dan
denominator (n-k)
o Menentukan nilai p sesuai dengan nilai α dari tabel F dimana posisi F(hitung)
berada

Bila analisis varian One-way dilakukan dengan paket program statistik seperti SPSS
atau Stata, maka nilai p akan ditampilkan pada output analisis.

Untuk contoh kasus di atas didapatkan:


Dari tabel distribusi F untuk df numerator = 2 dan df denominator 38 didapatkan
nilai F tabel untuk α 0,005 = 6,07. Jadi nilai p untuk F(hitung) = 50 adalah < 0,005.

Ø Resume hasil analisis varian one-way


Untuk memudahkan penghitungan statistik F, pada setiap analisis varian, hasil
analisisnya disajikan dalam sebuah tabel analisis varian. Berikut adalah tabel
analisis varian untuk contoh kasus di atas.

Tabel. Resume Hasil Analisis Varian

Sumber Sum square df Mean square Nilai F Nilai


Variasi/galat (SS) (MS = SS/df) p
Between Groups 103,125 2 51,562 51,535 < 0,005
Within Groups 38,020 38 1,001
Total 141,145 40

8.2.5 Kesimpulan
Kesimpulan analisis one-way anova bisa menerima atau menolak hipotesis nol.
Hipotesis nol diterima bila nilai p > α , berarti tidak ada perbedaan rerata antara
kelompok perlakuan atau tidak ada perbedaan efek perlakuan. Sebaliknya, Ho ditolak,
bila nilai p ≤ α, artinya paling sedikit ada dua kelompok yang berbeda.

Untuk contoh kasus di atas:


Dari hasil analisis kasus di atas dapat disimpulkan bahwa Ho yang menyatakan rerata
Hb dari ketiga kelompok sickle cell type adalah sama ditolak, karena nilai p < 0,05.
Berarti dari ketiga kelompok ibu tersebut paling sedikit terdapat dua kelompok yang
berbeda.

105
Dari analisis one-way anova tidak dapat diketahui kelompok mana yang berbeda.
Untuk menentukan kelompok ibu mana yang berbeda, perlu dilakukan uji Post Hoc.
Akan tetapi, seandainya dari hasil analisis One-way anova ternyata Ho diterima, maka
analisis hanya sampai disini saja dan tidak perlu dilanjutkan ke uji Post Hoc.

8.2.6 Output analisis one-way anova dengan SPSS dari kasus di atas
Output 1: Deskriptif statistik

Descriptives

Hb
95% Confidence Interval for
Mean
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1,00 16 8,6563 ,84693 ,21173 8,2050 9,1075 7,20 10,30
2,00 10 10,6300 1,28413 ,40608 9,7114 11,5486 8,10 12,10
3,00 15 12,3000 ,94188 ,24319 11,7784 12,8216 10,70 13,90
Total 41 10,4707 1,87846 ,29337 9,8778 11,0636 7,20 13,90

Dari hasil analisis deskriptif ke tiga kelompok didapatkan bahwa kelompok ibu dengan
sikcl cell type SS memiliki rerata Hb 8,65 (± 0,211), kelompok ibu dengan sickle cell
type S/talasemia memiliki rerata Hb 10,63 (± 1,284) dan kelompok ibu dengan sickle
cell type SC memilki rerata Hb 12,30 (± 0,941).

Output 2: Uji Homogenitas Kelompok

Test of Homogeneity of Variances

Hb
Levene
Statistic df1 df2 Sig.
,929 2 38 ,404

Dari hasil analis homogenitas varian dengan uji Levene didapatkan bahwa ke tiga
kelompok memiliki varian yang sama. Hasil uji menunjukan nilai statistil Levene
sebesar 0,929 dengan nilai p 0,404.

106
Output 3: Hasil analisis varian one-way

ANOVA

Hb
Sum of
Squares df Mean Square F Sig.
Between Groups 103,125 2 51,562 51,535 ,000
Within Groups 38,020 38 1,001
Total 141,145 40

Hasil analisis varian menunjukan VR sebasar 51,535 dengan nilai p = 0,000. Dari hasil
ini ddapatkan tidak cukup bukti untuk menerima Ho yang menyatakan semua
kelompok memiliki rerata Hb sama, maka Ho ditolak. Oleh karena itu, dapat
disimpulkan bahwa paling sedikit terdapat dua kelompok yang berbeda.


8.3 Post Hoc
Post Hoc adalah uji hipotesis lanjutan yang juga disebut multiple comparasions test.
Uji Post Hoc diperlukan bila dari analisis one-way anova disimpulkan hipotesis nol
ditolak atau ada efek perlakuan. Uji Post Hoc ditujukan untuk menguji kelompok
perlakuan mana yang berbeda dengan kelompok yang mana.

8.3.1 Hipotesis
Setiap kelompok yang akan diuji harus dibuatkan hipotesis statistiknya. Misalnya ada
tiga kelompok perlakuan, maka uji Post Hoc akan menguji perbedaan antara kelompok
I dengan kelompok II, kelompok I dengan kelompok III, dan kelompok II dengan
kelompok III, maka ada 3 hipotesis:

Uji pertama antara kelompok I vs II:


Ho : µ1 = µ2 (tidak ada perbedaan rerata klp I dengan klp II)
Ha : µ1 # µ2 (ada perbedaan rerata klp I dengan klp II)

Uji kedua antara kelompok I vs III:


Ho : µ1 = µ3 (tidak ada perbedaan rerata klp I dengan klp III)
Ha : µ1 # µ3 (ada perbedaan rerata klp I dengan klp III)

107
Uji ke tiga antara kelompok II vs III:
Ho : µ2 = µ3 (tidak ada perbedaan rerata klp II dengan klp III)
Ha : µ2 # µ3 (ada perbedaan rerata klp II dengan klp III)

8.3.2 Test Statistik


Uji statistik untuk Post Hoc Test dikelompokan menjadi dua kelompok, yaitu (1)
kelompok uji statistik bila kedua kelompok memiliki varian yang sama (homogen) dan
(2) kelompok uji statistik untuk varian yang tidak homgen.

Kelompok uji untuk varian homogen:


Uji statistik Post Hoc untuk varian kedua kelompok homogen antara lain LSD,
Benferoni, Duncan, Turkey, dll.

Kelompok uji statistik untuk varian tidak homogen:


Beberapa uji statistik Post Hoc untuk varian tidak homogen antara lain uji Thamhane
atau Dunnet.

8.3.3 Kesimpulan
Hipotesis nol diterima bila nilai P > α, berarti tidak terdapat perbedaan antara
kelompok yang dibandingkan. Sebaliknya, Ho ditolak bila nilai p ≤ α, berarti terdapat
perbedaan antara kelompok yang dibandingkan.

Output SPSS untuk uji Post Hoc

Uji LSD adalah uji Post Hoc untuk kelompok sampel yang homogen dan Tamhane
untuk kelompok sampel yang tidak homogen. Karena dari uji homogenitas varian dari
Levene test didapatkan nilai p > 0,05, yang artinya semua kelompok memiliki varian
yang sama atau homogen, maka uji Post Hoc yang dibaca adalah uji LSD.

108
Multiple Comparisons

Dependent Variable: Hb

Mean
Difference 95% Confidence Interval
(I) Sikclecell (J) Sikclecell (I-J) Std. Error Sig. Lower Bound Upper Bound
LSD 1,00 2,00 -1,97375* ,40322 ,000 -2,7900 -1,1575
3,00 -3,64375* ,35949 ,000 -4,3715 -2,9160
2,00 1,00 1,97375* ,40322 ,000 1,1575 2,7900
3,00 -1,67000* ,40836 ,000 -2,4967 -,8433
3,00 1,00 3,64375* ,35949 ,000 2,9160 4,3715
2,00 1,67000* ,40836 ,000 ,8433 2,4967
Tamhane 1,00 2,00 -1,97375* ,45796 ,002 -3,2151 -,7324
3,00 -3,64375* ,32245 ,000 -4,4622 -2,8253
2,00 1,00 1,97375* ,45796 ,002 ,7324 3,2151
3,00 -1,67000* ,47333 ,009 -2,9375 -,4025
3,00 1,00 3,64375* ,32245 ,000 2,8253 4,4622
2,00 1,67000* ,47333 ,009 ,4025 2,9375
*. The mean difference is significant at the .05 level.

Hasil analisis Post Hoc menggunakan uji LSD didapatkan, ketiga kelompok memiliki
rerata Hb yang berbeda secara bermakna. Kelompok 1 berbeda dengan kelompok 2,
kelompok 1 juga berbeda dengan kelompok 3, dan kelompok 2 juga berbeda dengan
kelompok 3.

LATIHAN:

1. Jelaskan indikasi penggunaan statistik uji t ?


2. Apa perbedaan uji satu sisi dengan dua sisi?
3. Berapa batas penerimaan Ho pada uji t satu sisi, bila jumlah sampel 30 dengan tingkat
kemaknaan 5%?
4. Berapa batas penerimaan Ho pada uji t dua sisi, bila jumlah sampel 30 dengan tingkat
kemaknaan 5%?
5. Apa artinya Ho ditolak pada tingkat kemaknaan 5%?
6. Apa artinya Ho ditolak pada tingkat kemaknaan 1 %?
7. Kasus 1:
Balai POM (Pengawasan Obat dan Makanan) melakukan sampel survei untuk
mengantisipasi adanya isu tetrasiklin merk X palsu. Sebanyak 30 sampel kapsul
tetrasiklin diambil secara acak di apotik di Denpasar. Dari survei ini akan dibuktikan
apakah kandungan tetrasiklin Hcl pada kapsul tetramerk X itu sama dengan yang
tertera pada label yaitu 250 mg.

Dari survei ini didapatkan data kandungan tetrasiklin pada sampel adalah sebagai
berikut:
109
No Kadar No Kadar
1 250 16 249
2 245 17 251
3 254 18 243
4 248 19 255
5 241 20 245
6 250 21 248
7 246 22 247
8 251 23 252
9 250 24 253
10 245 25 249
11 251 26 243
12 254 27 255
13 248 28 245
14 214 29 248
15 250 30 243

Buktikan tujuan penelitian tersebut dengan menggunakan data sampel di atas pada
tingkat kemaknaan 5%.

8. Kasus 3
Suatu penelitian klinik efek obat KB pada pria dilakukan terhadap 15 voluntir. Setiap
voluntir diberikan suntikan obat KB pria setiap bulan sebanyak 3 kali. Kandungan
sperma pada air mani diukur sebanyak dua kali, yaitu sebelum diberi obat dan setelah 3
kali suntikan. Dihipotesakan bahwa obat KB pria berfungsi menekan proses
pembentukan sperma sehingga dapat menurunkan kandungan sperma pada air mani.
Dari trial ini didapatkan data sebagai berikut:

Jumlah sperma sebelum dan sesudah percobaan


No Sebelum Sesudah No Sebelum Sesudah
1 200 50 9 222 60
2 250 60 10 235 33
3 225 40 11 201 40
4 200 70 12 200 50
5 210 40 13 210 54
6 220 65 14 214 45
7 210 75 15 250 65
8 215 35

110
Buktikan hipotesa dari penelitian tersebut dengan menggunakan data di atas dengan
tingkat kemaknaan 1%.

111
Modul 9
Two-Way Anova

9.1 Pendahuluan
Pada modul sebelumnya telah dibahas metode analisis varian untuk satu faktor yang
disebut dengan One-Way Anova. Bagaimana bila yang diteliti efek dari dua faktor atau
lebih terhadap luar penelitain tertentu. Misal akan diteliti efek obat tablet besi sebagai
faktor yang diteliti terhadap kadar serum feritin tikus dengan rancangan acak kelompok
dimana jenis kelamin tikus sebagai perancu. Atau akan diteliti efek tablet besi sebagai
faktor pertama dan vit C sebagai faktor ke dua terhadap serum feritin tikus dengan
rancangan faktorial. Pada ke dua contoh di atas, metode analisis One-way Anova tidak
dapat dipakai karena jumlah faktor yang diteliti lebih dari satu. Dalam kontek penelitian
tersebut, variasi nilai variabel outcome dipengaruhi oleh dua faktor, maka metode analisis
yang dapat dipakai adalah analisis Two-Way Anova. Metode analisis Two-Way Anova
memungkinkan peneliti untuk menganalisis efek dari setiap faktor dan kemungkinan
adanya interaksi dari faktor-faktor yang diteliti. Pada Modul ini akan dibahas metode
analisis varian untuk rancangan acak kelompok, rancangan faktorial, dan rancangan
pengukuran berulang (repeated meassures).

9.2 Analisis Multivariate Rancangan Acak Kelompok

9.2.1 Rancangan Acak Kelompok


Rancangan Acak Kelompok (The Randomized Complete Block Design) dimana kelompok
eksperimen dibagi menjadi sub-kelompok yang disebut blok. Individu atau binatang coba
di setiap blok memiliki karakteristik yang sama atau homogen. Jumlah individu atau
binatang percobaan di dalam setiap blok sama dengan jumlah perlakuan yang diteliti.
Misalnya yang akan diteliti adalah efek obat (dengan 3 dosis bernbeda) terhadap kadar
112
feritin pada binatang percoban dan jenis kelamin binatang percobaan dianggap sebagai
variavel perancu dan akan dikontrol by design. Pada penelitian ini, jumlah perlakuan 3
dosis, yaitu A, B, dan C serta jumlah bloknya 2, yaitu blok 1 adalah tikus betina dan blok 2
adalah tikus jantan. Jumlah sampel tikus untuk blok 1 adalah 3 ekor dan pada blok dua juga
3 ekor. Perlakuan A, B, dan C akan dirandom untuk ke 3 sampel tikus di masing-masing
blok, seperti bagan di bawah ini.
Blok 1 (tikus betina) Blok 2 (tikus jantan)
A C
Perlakuan C B
B A

Tujuan dari rancangan aca blok adalah untuk menghilangkan atau mengendalikan pengaruh
dari blok dalam hal ini sebagai variabel perancu.

9.2.2 Two-Way Anova


Dalam analisis data rancangan acak kelompok, teknik analisis Two-Way Anova merupakan
teknik analisis varian dimana hasil observasi dikategorikan berdasarkan blok dan
perlakuan, sebagai bagan di bawah ini.

Tabel 9.2.2 Tabel hasil pengukuran luaran penelitian dengan rancangan acak kelompok

Blok Perlakuan
1 2 .... j Total Mean
1 x11 x12 .... x1j T1. x1.
2 x21 x22 .... x2j T2. x 2.
...
i xi1 xi2 .... xij Ti. x i.
Total T.1 T.2 .... T.j T
Mean x .1 x .2 x. j x..

113
Model
Model matermatik analisis Two-Way Anova untuk rancangan acak kelompok adalah
sebagai berikut.
xij = µ + βi + τj + eij
dimana:
xij = nilai variabel luaran
µ = konstan yang tidak diketahui
β = efek blok
τ = efek perlakuan
e = residu atau error term

Asumsi Model
1) xij merupakan variabel random dengan nilai kontinyu (interval)
2) data xij untuk masing-masing subpopulasi berdistribusi normal
3) tidak ada interaksi antara variabel perlakuan dengan variabel blok.

Hipotesis Statistik
Ho: τj = 0 (perlakuan tidak memberikan efek)
Ha: tidak semua τj # 0 (perlakuan memberikan efek)

Uji Statistik
Untuk menguji hipotesis nihil pada rancangan acak kelompok dilakukan dengan uji varian
atau Varian Ratio, yaitu membandingkan varian perlakuan dengan varia residu dengan tabel
resume sebagai berikut.
Tabel 9.2.2 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah kwadrat d.b. varian Varian Ratio
Perlakuan JKP j-1 MKP=JKP/(j-1) MKP/MKE
Blok JKB i-1 MKB=JKB/(i-1)
Residu/Eror JKE (j-1)(i-1) MKE=JKE/(j-1)(i-1)
Total JKT n-1

114
Keterangan:
JKP = jumlah kwadrwat kelompok perlakuan
JKB=jumlah kwadrat blok
JKE=jumlah kwadrat residu
JKT= jumlah kwadrat total
n= jumlah sampel
j= jumlah kelompok perlakuan
i = jumlah blok
MKP= varian antar kelompok perlakuan
MKB= varian antar blok
MKE= varian residu

Cara menghitung Jumlah Kwadrat (JK)


j i
JKT = ∑∑ ( xij − x .. ) 2
j =1 i =1

j i
JKP = ∑∑ ( x . j − x .. ) 2
j =1 i =1

j i
JKB = ∑∑ ( x i. − x .. ) 2
j =1 i =1

JKE = JKT − JKP − JKB


Cara membuat kesimpulan
1) Ho diterima bila VR hitung < VR tabel, atau nilai p untuk efek perlakuan > α.
Berarti tidak ada pengaruh perlakuan terhadap luaran penelitian
2) Ho ditolak, bila VR hitung ≥ VR tabel, atau nilai p untuk efek perlakuan ≤ α.
Berarti perlakuan berpengaruh terhadap luaran penelitian.

Contoh kasus
Akan diteliti pengaruh metode pembelajaran A, B, dan C terhadap waktu (hari) yang
diperlukan sampai bisa menggunkan suatu alat. Umur dianggap sebagai variabel perancu.
Data hasil penelitian adalah sebagai berikut.

115
Tabel 9.2.3 Waktu yang diperlukan sampai bisa menggunakan suatu alat bantu

Blok Metode Pembelajaran


(Klp Umur) A B C Total Mean
- 20 7 9 10 26 8,67
20 – 29 8 9 10 27 9,00
30 – 39 9 9 12 30 10,00
40 – 49 10 9 12 31 10,33
50 - 11 12 14 37 12,33
Total 45 48 58 151
Mean 9,0 9,6 11,6 10,07
Sumber: Daniel, 1999: 328

Penghitungan Jumlah Kwadrat


1) JKT = (7-10,07)2 + (8-10,07)2 + . . . . + (14-10,07)2 = 46,933
2) JKP = 5{(9,0-10,07)2 + (9,6-10,07)2 + (11,6-10,07)2} = 18,533
3) JKB = 3{(8,67-10,07)2 + (9-10,07)2 + . . . . . . + (12,33-10,07)2 = 24,933
4) JKE = 46,9335 – 18,5335 – 24,855 = 3,467

Penghitungan Varian Ratio


Tabel 9.2.4 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah kwadrat d.b. varian Varian Ratio Nilai P
Perlakuan 18,533 2 9,267 21,385 < 0,005
Blok 24,933 4 6,233 14,385
Residu/Eror 3,467 8 0,433
Total 46,933 14

Kesimpulan
Ho ditolak (p < 0,05), berarti jenis metode pembelajaran memberikan efek yang berbeda
terhadap rerata waktu yang diperlukan sampai bisa memakai alat bantu tersebut.

116
Analisis Post Hoc
Bila jumlah perlakuan yang diteliti lebih dari dua, seperti contoh di atas terdapat 3 jenis
perlakuan dan Ho pada analisis Two-Way Anova ditolak, maka untuk menentukan
perlakuan mana yang berbeda dari tiga perlakuan yang ada, diperlukan analisis lanjutan
yang disebut dengan analisis Post Hoc seperti pada analisis One-Way Anova sebelumnya.

Berikut adalah output SPSS dari data penelitian kasus di atas.


Hasil Two-Way Anova:
Berikut adalah hasil analisis Two-Way dari kasus di atas.

Tests of Between-Subjects Effects

Dependent Variable: Waktu belajar

Type III
Sum of
Source Squares df Mean Square F Sig.
Perlakuan 18.533 2 9.267 21.385 .001
Blok 24.933 4 6.233 14.385 .001
Error 3.467 8 .433
Total 46.933 14
a R Squared = .926 (Adjusted R Squared = .871)

Dari hasil di atas didapatkan bahwa Ho. ditolak, berarti perlakuan berpengaruh secara
bermakna terhadap waktu bejalar sampai mampu memakai alat bantu, dimana nilai p dari
analisis varian perbedaan rerata waktu belajar antara kelompok perlakuan < 0,05.

Hasil Post Hoc Test

Berikut adalah hasil analisis perbedaan rerata waktu belajar antar metode pembelajaran.

Post Hoc test dipakai untuk mengetahui perbedaan antar kelompok perlakuan. Hasil
analisis menunjukan bahwa perlakuan A dan B memberikan hasil yang tidak berbeda,
sedangan perlakuan C memiliki rerata waktu belajar lebih panjang dari perlakuan A dan B,
seperti hasil analisis Post Hoc dengan metode scheffe berikut.

117
Scheffe

Metode Subset
Pembelajaran N 1 2
A 5 9.00
B 5 9.60
C 5 11.60
Sig. .397 1.000
Means for groups in homogeneous subsets are displayed.

Dari tabel di atas diketahui bawah rerata perlakuan A adalah 9,00, perlakuan B adalah 9,60
dan perlakuan C adalah 11,60. Rerata perlakuan A dan B terletak di dalam satu Subset,
berarti kedua metode tersebut memiliki rerata yang tidak berbeda secara bermakna dimana
nilai p dar perbedaan kedua kelompok adalah 0,397. Sebaliknya, metode C terletak di
dalam subset yang berbeda dengan metode A dan B, berarti B memiliki rerata yang berbeda
dengan A maupun B. Oleh karena itu dapat disimpulkan bahwa metode A dan B
memerlukan waktu belajar yang lebih pendek dari metode C sampai dapat memakai alat
bantu tersebut.

9.3 Analisis Multivariate Rancangan dengan Pengukuran Berulang

9.3.1 Rancangan dengan Pengukuran Berulang


Pada Modul 7 telah dibahas metode rancangan sama subjek atau pre-post design dimana
pada rancangan ini pengukuran dilakukan hanya dua yaitu sebelum dan sesudah perlakuan.
Pada rancangan dengan pengukuran berulang, pengukuran dilakukan lebih dari dua kali,
misalnya sebelum perlakuan sebagai baseline data, hari 3, hari ke 7, dan 6 bulan setelah
perlakuan diberikan. Jadi pada rancangan pengukuran berulang (the repeated measures)
adalah rancangan sama subjek dimana pengukuran terhadap satu variabel dilakukan
berulang kali pada setiap subjek penelitian. Metode repeated measures dipergunakan untuk
mengendalikan efek variabilitas subjek penelitian. Keuntungan dari metode ini adalah
kemampuan dari rancangan ini untuk mengendalikan efek variabel luar (extraneous
variables).

118
9.3.2 Two-Way Anova
Teknik analisis Two-Way Anova merupakan teknik analisis varian yang dipakai
menganalisis data penelitian rancangan repeated mesures. Dalam analisis Two-Way Anova,
hasil observasi dikategorikan berdasarkan subjek penelitian dan pengukuran, sebagai bagan
di bawah ini.

Tabel 9.3.2 Tabel hasil pengukuran luaran penelitian dengan rancangan acak kelompok

Subjek Pengukuran Total Mean


(Blok) 1 2 .... k Subjek Subjek
1 x11 x12 .... x1k T1. x1.
2 x21 x22 .... x2k T2. x 2.
...
n xn1 xn2 .... xnk Ti. x k.
Total T.1 T.2 .... T.k T
pengukuran
Mean
pengukuran x .1 x .2 x. j x..

Model
Model matermatik analisis Two-Way Anova untuk rancangan repeated measures adalah
sebagai berikut.
xij = µ + βi + τj + eij
dimana:
xij = nilai variabel luaran
µ = konstan yang tidak diketahui
β = efek subjek
τ = efek waktu pengukuran
e = residu atau error term
i = jumlah subjek
j = jumlah pengukuran

119
Asumsi Model
1) xij merupakan variabel random dengan nilai kontinyu (interval)
2) data xij untuk masing-masing subpopulasi berdistribusi normal
3) tidak ada interaksi antara variabel waktu pengukuran dengan subjek.

Hipotesis Statistik
Ho: τj = 0 (perlakuan tidak memberikan efek atau tidak terdapat perbedaan antara
pengukuran)
Ha: tidak semua τj # 0 (perlakuan memberikan efek atau terdapat perbedaan antara
pengukuran)

Uji Statistik
Untuk menguji hipotesis nihil pada rancangan repeated measures dilakukan dengan uji
varian atau Varian Ratio, yaitu membandingkan varian antar waktu pengukuran dengan
varian residu dengan tabel resume sebagai berikut.
Tabel 9.2.2 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah kwadrat d.b. varian Varian Ratio
Pengukuran JKP j-1 MKP=JKP/(j-1) MKP/MKE
Subjek JKB i-1 MKB=JKB/(i-1)
Residu/Eror JKE (j-1)(i-1) MKE=JKE/(j-1)(i-1)
Total JKT n-1

Keterangan:
JKP = jumlah kwadrat antar waktu pengukuran
JKB=jumlah kwadrat antar subjek
JKE=jumlah kwadrat residu
JKT= jumlah kwadrat total
n= jumlah sampel
j= jumlah pengukuran
i = jumlah subjek
MKP= varian antar waktu pengukuran
MKB= varian antar subjek
MKE= varian residu

120
Cara menghitung Jumlah Kwadrat (JK)
j i
JKT = ∑∑ ( xij − x .. ) 2
j =1 i =1

j i
JKP = ∑∑ ( x . j − x .. ) 2
j =1 i =1

j i
JKB = ∑∑ ( x i. − x .. ) 2
j =1 i =1

JKE = JKT − JKP − JKB


Cara membuat kesimpulan
1) Ho diterima bila VR hitung < VR tabel, atau nilai p untuk efek perlakuan > α.
Berarti tidak ada perbedaan rerata antara waktu pengukuran.
2) Ho ditolak, bila VR hitung ≥ VR tabel, atau nilai p untuk efek perlakuan ≤ α.
Berarti terdapat perbedaan rerata antar waktu pengukuran.

Contoh kasus
Suatu penelitian dengan rancangan repeated measures dilakukan untuk mengetahui
efektivitas program penurunan tingkat stress dengan meditasi. Tingkat tress diukur
sebanyak tiga kali, yaitu sebelum perlakuan, setelah perlakuan dan 3 bulan setelah
perlakuan. Hasil pengukuran adalah sbb:

Tabel 9.3.2 Data hasil pengukuran tingkat stress pada 14 dengan kecemasan
Subjek Pretest Posttest 3 bulan Mean
1 21 17 15 17,67
2 35 10 20 21,67
3 19 16 10 15,00
4 35 29 20 28,00
5 34 25 10 23,00
6 41 30 23 31,33
7 15 10 6 10,33
8 11 8 5 8,00
9 40 23 17 26,67
10 23 20 12 18,33
11 25 17 13 18,33
12 18 10 7 11,67
121
13 37 30 19 28,67
14 31 15 12 19,33
Mean 27,50 18,57 13,50 19,86

Penghitungan Jumlah Kwadrat


1) JKT = (21-19,86)2 + (35-19,86)2 + . . . . + (12-19,86)2 = 3871,143
2) JKP = 14{(27,-19,86)2 + (18,57-19,86)2 + (13,50-19,86)2} = 1406,714
3) JKB = 3{(17,67-19,86)2 + (21,67-19,86)2 + . . . . . . + (19,33-19,86)2 = 2000,476
4) JKE = 3871,143 – 1406,714 – 2000,476 = 463,952

Penghitungan Varian Ratio


Tabel 9.2.4 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah kwadrat d.b. varian Varian Ratio Nilai P

Pengukuran 1406,714 2 703,357 39,416 < 0,005


Subjek 2000,476 13 153,883
Residu/Eror 463,952 26 17,844
Total 3871,143 41

Kesimpulan
Ho ditolak (p < 0,05), berarti jenis metode pembelajaran memberikan efek yang berbeda
terhadap rerata waktu yang diperlukan sampai bisa memakai alat bantu tersebut.

Contoh hasil analisis dengan SPSS


Tabel 9.3.4 Resume hasil analisis two-way anova perbedaan skor kecemasan setelah
mendapat program reduksi kecemasan

Type III Sum of Mean


Source Squares df Square F Sig.
pengukuran 1406.714 2 703.357 39.416 .000
subjek 2000.476 13 153.883 8.624 .000
Error 463.952 26 17.844
Total 3871.143 41

122
a R Squared = .880 (Adjusted R Squared = .811)

Dari tabel hasil analisis di atas diketahui bahwa VR perbedaan skor stress sebelum
perlakuan, setelah perlakuan dan 3 bulan setelah perlakuan sebesar 39,416 dengan nilai p =
0,000. Ini berarti Ho yang menyatakan tidak terdapat perbedaan rerata di tolak. Sehingga
dapat disimpulkan bahwa terdapat perbedaan rerata skor stres antara sebelum perlakuan
dengan setelah perlakuan dan 3 bulan setelah perlakuan.

Untuk mengetahui mana yang berbeda dengan yang maka, maka selanjutnya dilakukan
Post Hoc test dengan metode Sheffe dan hasilnya adalah sebagai berikut.

Tabel 9.3.5 Hasil analisis Post Hoc antara skor stres sebelum, sesudah dan
3 bulan setelah perlakuan

pengukuran N Subset
1 2 3
3 14 13.50
2 14 18.57
1 14 27.50
Sig. 1.000 1.000 1.000
Means for groups in homogeneous subsets are displayed.

Dari tabel di ats diketahui bahwa rerata skor stress sebelum perlakuan adalah 27,5, setelah
perlakuan adalah 18,57 dan 3 bulan setelah perlakuan adalah 13,5. Ketiga rerata tersebut
terletak di dalam subset yang berbeda, berarti ketiga skor tersebut berbeda secara
bermakna, dimana terjadi penurunan skor setelah perlakuan dan menurun lagi setelah 3
bulan pasca perlakuan. Sehingga dapat disimpulkan bahwa program reduksi stres dapat
menurunkan tingkat stress secara bermakna.

9.4 Analisis Multivariate Rancangan Faktorial


9.4.1 Rancangan Fktorial
Dalam penelitian eksperimen dapat diteliti efek dari satu variabel atau lebih dari satu
variabel secara bersamaan. Dalam rancangan faktorial terdapat lebih dari satu variabel yang
akan diteliti efeknya terhadap satu variabel luaran. Variabel yang akan diteliti efeknya

123
disebut sebagai faktor dan jumlah kategori dari setiap faktor disebut level. Bila yang diteliti
adalah Faktor I obat A dengan 2 level, yaitu dosis 1 (50mg) dan dosis 2 (placebo) dan
faktor II adalah vitamin C dengan 2 level, yaitu vit 1 diberi 500 mg vit C dan vit 2
(placebo), maka percobaan ini disebut rancangan faktorial 2x2. Berati akan terdapat 4
kelompok percobaan, yaitu percobaan 1 mendapat dosis obat 50 mg + 500mg vit C,
percobaan 2 mendapat dosis obat 50 mg, percobaan 3 mendapat 500 vit C, dan percobaan 4
mendapat placebo saja, seperti bagan di bawah ini.

Faktor II
Faktor I Vitamin Placebo
Obat Percobaan 1 Percobaan 2
Obat + Vitamin Obat
Placebo Percobaan 3 Percobaan 4
Vitamin Placebo

Bagan 1. Rancangan Faktorial 2 x 2

Pada penelitian dengan rancangan faktorial, peneliti tidak saja akan mempelajari efek dari
masing-masing faktor, akan tetapi juga dapat meneliti adanya efek interaksi antara faktor
yang diteliti. Interaksi antar faktor menunjukan bahwa respon faktor I berubah pada salah
satu level dari faktor II. Berikut contoh bagan yang menunjukan adanya efek interaksi dan
yang tidak ada interaksi.

30 30
vit C Vit C
25 placebo 25 Placebo
20 20
15 15
10 10
5 5
0 0
Obat plcebo Obat Placebo

Gambar 2. Interaksi antara obat dan vit Gambar 3. Tidak ada interaksi obat dengan vit
124
9.4.2 Analisis Two-Way Anova pada Rancanga Faktorial
Dalam analisis data rancangan faktorial, teknik analisis Two-Way Anova merupakan teknik
analisis varian dimana hasil observasi dikategorikan berdasarkan faktor yang diteliti,
sebagai bagan di bawah ini.

Tabel 9.2.2 Tabel hasil pengukuran luaran penelitian dengan rancangan acak kelompok

Faktor I Faktor II (j)


(i) j=1 j=2 .... j=b Total Mean
i=1 x111 x121 .... x1b1
x112 x122 .... x1b2
subtotal T11 T12 .... T1b T1.
submean x 11 x 12 .... x 1b x1.

.... .... .... .... ....


.... .... .... .... ....
.... .... .... .... .... ....

i=a xa11 xa21 .... xak1


xa12 xa22 .... xak2
subtotal Ta1 Ta2 .... Tak Ta.
submean x n1 x n2 .... x nk x n.

Total T.1 T.2 .... T.b T


Mean x .1 x .2 x .b x..

Model
Model matermatik analisis Two-Way Anova untuk rancangan faktorial adalah sebagai
berikut.
xijk = µ + αi + βj + (αβ)ij + eijk
dimana:
xijk = nilai variabel luaran
µ = konstan yang tidak diketahui
αi = efek faktor I (A)
βj = efek faktor II (B)
(αβ)ij = interaksi faktor I dan II
eijk = residu atau error term
125
Asumsi Model
1) xijk merupakan variabel random dengan nilai kontinyu (interval)
2) data xijk untuk masing-masing subpopulasi berdistribusi normal
3) semua kelompok memiliki varian yang sama (homogen)

Hipotesis Statistik
Faktor I (A)
Ho: αi = 0 (perlakuan A tidak memberikan efek)
Ha: tidak semua αi # 0 (perlakuan A memberikan efek)
Faktor II(B)
Ho: βj = 0 (perlakuan B tidak memberikan efek)
Ha: tidak semua βj # 0 (perlakuan B memberikan efek)
Interaksi A dan B
Ho: (αβ)ij = 0 (tidak ada interaksi)
Ha: tidak semua (αβ)ij # 0 (ada interaksi)

Uji Statistik
Untuk menguji hipotesis nihil pada rancangan repeated measures dilakukan dengan uji
varian atau Varian Ratio, yaitu membandingkan varian antar waktu pengukuran dengan
varian residu dengan tabel resume sebagai berikut.
Tabel 9.2.2 Tabel resume analis varian rancangan acak kelompok
Sumber variasi Jumlah d.b. varian Varian Ratio
kwadrat
Faktor I (A) JKA i-1 MKP=JKP/(i-1) MKP/MKE
Faktor II (B) JKB j-1 MKB=JKB/(j-1) MKB/MKE
Interaksi (AB) JKAB (i - 1)(j - 1) MKAB=JKAB/(i-1)(j-1) MKAB/MKE
Residu/Eror JKE ij(k - 1) MKE=JKE/(j-1)(i-1)
Total JKT ijk - 1

126
Keterangan:
JKA = jumlah kwadrat faktor A JKB=jumlah kwadrat faktor B
JKAB=jumlah kwadrat interaksi AB JKE=jumlah kwadrat residu
JKT= jumlah kwadrat total MKP= varian antar perlakuan A
MKB= varian antar perlakuan B MKAB=varian ineraksi AB
MKE= varian residu k= jumlah sampel di setiap kelompok percobaan
j= jumlah perlakuan pada faktor B i = jumlah perlakuan pada faktor A

Cara menghitung Jumlah Kwadrat (JK)


a b n
JKT = ∑∑∑ ( xijk − x .. ) 2
i =1 j =1 k =1

j i
JKA = ∑∑ ( x i. − x .. ) 2
j =1 i =1

b a
JKB = ∑∑ ( x . j − x .. ) 2
j =1 i =1

b a n
JKAB = ∑∑∑ ( x ij − x .. ) 2
j =1 1=1 k =1

JKE = JKT − JKP − JKB − JKAB

Cara membuat kesimpulan


1) Faktor I:
Ho diterima bila VR hitung < VR tabel, atau nilai p untuk faktor I > α. Berarti tidak
ada pengaruh faktor I.
Ho ditolak, bila VR hitung ≥ VR tabel, atau nilai p untuk faktor I ≤ α. Berarti
terdapat pengaruh faktor I.
2) Faktor II:
Ho diterima bila VR hitung < VR tabel, atau nilai p untuk faktor II > α. Berarti
tidak ada pengaruh faktor II.
Ho ditolak, bila VR hitung ≥ VR tabel, atau nilai p untuk faktor II ≤ α. Berarti
terdapat pengaruh faktor II.
3) Interaksi Faktor I dengan Faktor II:
127
Ho diterima bila VR hitung < VR tabel, atau nilai p untuk interaksi > α. Berarti
tidak ada interaksi.
Ho ditolak, bila VR hitung ≥ VR tabel, atau nilai p untuk interaksi ≤ α. Berarti
terdapat interaksi antar faktor I dengan II.

9.4.3 Uji Post Hoc


Kalau hasil analisis Two-Way Anova menjunkukan bahwa faktor yag diteliti terbukti
berpengaruh atau berefek dan level dari faktor tersebut lebih dari dua, maka perlu dilakukan
analisis lebih lanjut untuk mengetahui level mana yang berbeda efeknya. Untuk menguji
level mana yang berbeda dari satu faktor maka perlu dilalukan uji Post Hoc dengan metode
Scheffe, Duncan, LSD atau yang lainnya, seperti yang sudah dibahas pada Modul 8
sebelumnya.

Contoh kasus
Akan diteliti efek kastrasi sebagai faktor I dan adrenektomi sebagai faktor II terhadap
intake kalori pada tikus. Faktor I (kastrasi) dengan 2 perlakuan, yaitu 1=dikastrasi dan
2=tidak), dan faktor II (adrenektomi) juga dengan 2 perlakuan, yaitu 1=diadrektomi dan
2=tidak. Pada percobaan ini terdapat 4 kelompok percobann dan jumlah binatang coba
untuk setiap kelompok percobaan adalah 5 ekor tikus. Data hasil percobaan adalah sbb:

Faktor I (A): Faktor II (B): adrenalektomi Total


Kastrasi 1 (Ya) 2 (tidak)
1 (ya) 4753 4571
3924 3994
3497 4138
3417 5175
3785 5049
Total 19376 22927 42303
Mean 3875,5 4585,4 4230,3

2 (tidak) 3557 3824


3831 4069
3528 3782
3270 3887

128
3078 3670
Total 17264 19232 36496
Mean 3452,8 3846,4 3649,6

Total 36640 42159 78799


Mean 3664 4215,9 3939,95

Penghitungan Jumlah Kwadrat

1) JKT = (4753-3939,95)2 + (3924-3939,95)2 + . . . . + (3670-3939,95)2 = 6001442,950


2) JKA = 10{(4230,3- 3939,95)2 + (3649,6-3939,95)2} = 1686062,450
3) JKB = 10{(3664-3939,95)2 + (4215,9-3939,95)2} = 1522968,050
4) JKAB = 5{(3875,5-3939,95)2 + (4585,4 – 3939,95)2 + (3664-3939,95)2 +
(4215,9-3939,95)2} = 125294,450
5) JKE = 6001442,950 – 1686062,450 – 1522968,050 – 125294,450 = 2667118.

Penghitungan Varian Ratio (VR)

Jumlah Varian
Sumber variasi Kwadrat d.b. Varian Ratio Nilai P.
kastrasi 1686062,450 1 1686062,450 10,115 < 0,05
adrenalektomi 1522968,050 1 1522968,050 9,136 < 0,05
kastrasi *
125294,450 1 125294,450 0,752 >0,05
adrenalektomi
Error 2667118,000 16 166694,875
Total 6001442,950 19

Kesimpulan
1) Efek kastrasi:
Ho yang menyatakan tidak ada efek kastrasi terharap kalori intik ditolak dimana VR =
10,115 dengan nilai p < 0,05, berarti kastrasi berpengaruh terhadap kalori intake. Tikus
yang dikastrasi mempunyai rerata iktake kalori lebih rendah dari yang tidak dikastrasi.

129
2) Efek adrenalektomi:
Ho yang menyatakan tidak ada efek adrenalekotomi terharap kalori intik ditolak dimana
VR = 9,136 dengan nilai p < 0,05, berarti adrenalektomi berpengaruh terhadap kalori
intake. Tikus yang diadrenalektomi mempunyai rerata iktake kalori lebih rendah dari
yang tidak diadrenalektomi.

3) Interaksi:
Ho yang menyatakan tidak terdapat interaksi antara kastrasi dan adrenalektomi diterima
dimana VR = 0,752 dan nilai p > 0,05. Ini berarti tidak terdapat interaksi antara kastrasi
dengan adrenalektomi.

Estimated Marginal Means of kalori_intake

4600.00 kastrasi
ya
tidak

4400.00
Estimated Marginal Means

4200.00

4000.00

3800.00

3600.00

3400.00

ya tidak

adrenalektomi

130
MODUL 10
Simple Correlation and Regression Analysis

10.1 Pendahuluan
Pada modul 6 dan 7 telah dibahas metode analisis perbedaan rerata antara kelompok
penelitian. Selain membandingkan antar kelompok penelitian, pada banyak penelitian
dipelajari hubungan antara variabel. Sebagai contoh misalnya akan diteliti hubungan atara
kadar hormon estriol pada ibu hamil pada umur kehamilan trimester 3 dengan berat badan
lahir dari bayi yang dilahirkan. Pada modul ini akan dibahas metode analisis hubungan atau
pengaruh antara variabel numerik dengan variabel numerik lainnya, yaitu metode analisis
korelasi dan regresi.

10.2 Uji Korelasi


10.2.1 Indikasi:
Metode korelasi dipakai bila akan mempelajari hubungan dua variabel dimana masing-
masing variabel mempunyai skala pengukuran interval. Misalnya hubungan antara umur
dan berat badan, dimana variabel umur dan variabel berat badan keduanya dalam skala
interval. Penilaian hubungan dari dua variabel tersebut dapat dilihat dari kuat dan arahnya
hubungan tersebut. Kuat dan arah dari hubungan dua variabel interval dapat dilihat dari
grafik scatter plot dan koefisien korelasinya.

10.2.2 Scatter Plot


Bila X dan Y adalah variabel yang akan dianalisis hubungannya, maka Scatter Plot variabel
X dan Y adalah grafik koordinat (X,Y) dari setiap sampel. Dari Scatter plot tersebut akan
dapat dilihat kuat dan arah hubungan dari kedua variabel tersebut. Bila semua koordinat
(X,Y) terletak pada satu garis lurus, maka hubungan kedua variabel tersebut dinyatakan
sempurna. Sebaliknya, bila koordinat (X,Y) menyebar disemua area grafik dan tidak
menunjukan bentuk tertentu, maka kedua variabel tersebut dinyatakan tidak ada hubungan.
Kalau koordinat (X,Y) menyebar dalam bentuk elip maka kedua variabel tersebut
dinyatakan memiliki hubungan yang tidak sempurna.

131
Arah hubungan kedua variabel X dan Y bisa positif atau searah dan bisa negatif atau
berlawanan arah. Kedua variabel dinyatakan memiliki hubungan serarah bila gambar
menunjukan jika nilai X bertambah, nilai Y juga bertambah. Sebaliknya kedua variabel
dikatakan memilki hubungan negatif bila scatter plot menunjukan bila nilai X bertambah
akan diukuti oleh penurunan dari nilai Y. Berikut adalah contoh beberapa bentuk scatter
plot.

17.50 14.00

12.00

15.00

10.00

12.50
8.00

Y
Y

6.00
10.00

4.00

7.50
2.00

5.00 0.00

0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00

X X

Korelasi sempurna positif Korelasi sempurna negatif

15.00 14.00

12.00

12.00

10.00

9.00
8.00
Y

6.00
6.00

4.00

3.00

2.00

0.00 0.00

0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00 0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00

X X

Korelasi positif Korelasi negatif

15.00

10.00
Y

5.00

0.00

0.00 2.00 4.00 6.00 8.00 10.00 12.00 14.00

Tidak ada korelasi

132
10.2.3 Koefisien Korelasi
Apabila variabel X dan Y yang diteliti hubungannnya, maka kuat dan arah hubungan dari
kedua variabel tersebut, selain dapat dilihat secara kasar dari scatter plot, juga dapat
ditentukan dengan koefisien korelasi dari hubungan kedua variabel tersebut. Koefisien
korelasi diberi simbul ‘r’ memiliki rentang nilai absolutnya dari 0 sampai dengan 1. Nilai r
= 0, berarti kedua variabel tersebut sama sekali tidak berhubungan atau nilai dari variabel
yang satu sama sekali tidak berkaitan dengan nilai variabel yang lainnya. Bila nilai r antara
0,1 – 0,39 dinyatakan ada hubungan yang ringan, nilai r antara 0,4-0,69 disebut ada
hubungan sedang, nilai r 0,7-0,99 dinyatakan ada hubungan yang kuat dan bila nilai r = 1
menunjukkan adanya hubungan yang sempurna antara kedua variabel tersebut. Hubungan
sempurna artinya setiap kenaikan satu unit dari variabel yang pertama akan diikuti pula
oleh meningkatnya satu unit dari variabel yang kedua dan scatter plotnya akan berbentuk
sebuah garis lurus.

Arah hubungan dari kedua variabel tersebut ditentukan dari tanda +/- dari nilai r. Bila nilai
r bertanda negatif maka kedua variabel tersebut dinyatakan memiliki hubungan negatif
(berlawanan arah). Sebaliknya, bila nilai r bertanda positif maka kedua variabel tersebut
memiliki hubungan positif (searah). Hubungan positif artinya arah perubahan kedua nilai
variabel tersebut searah. Bila nilai dari variabel yang satunya naik akan diikuti pula oleh
naiknya nilai variabel yang satu lagi. Misalnya umur dan berat badan mempunyai hubungan
positif artinya bila umur bertambah, maka berat badan juga bertambah. Sebaliknya,
hubungan negatif berarti arah perubahan nilai kedua variabel tersebut berlawanan. Bila nilai
variabel yang satu naik, akan diikuti oleh menurunnya nilai variabel yang lain. Misalnya
hubungan antara bensin dalam tangki dengan jarak yang ditempuh. Makin jauh jarak yang
ditempuh, makin berkurang jumlah bensin di dalam tangki.

10.2.4 Cara Menghitung Koefisien Korelasi (r)


Bila variabel yang akan dipelajari hubungannya adalah variabel X dan Y, maka koefisien
korelasi hubungan dari kedua variabel tersebut dapat dihitung sebagai berikut:

Rumus:

r=
∑ XY − (∑ X ∑ Y )/ n
{∑ X 2
− (∑ X ) / n}{∑ Y − (∑ Y )
2 2 2
}
/n

Keterangan:
r = koefisien korelasi
ƩXY = jumlah hasil kali nilai var X dengan var Y
133
ƩX = jumlah nilai var X
ƩY = jumlah nilai var Y
ƩX2 = jumlah nilai var X kwadrat
ƩY2 = jumlah nilai var Y kwadrat
n = jumlah sampel

Misalnya suatu survei dilakukan pada 15 ibu dengan kegemukan untuk mempelajari
hubungan berat badan dengan kadar kolesterol darah. Hipotesis penelitian menyatakan ada
hubungan positif antara berat badan dengan kolesterol darah. Berikut akan diuraikan cara
menghitung koefisien korelasi antara berat badan dengan kolesterol darah.

1. Menghitung ∑X, ∑Y, ∑XY, ∑X2, ∑Y2:

BB Koles
No XY X2 Y2
(X) (Y)
1 60 150 9000 3600 22500
2 75 200 15000 5625 40000
3 80 250 20000 6400 62500
4 81 275 22275 6561 75625
5 65 250 16250 4225 62500
6 72 235 16920 5184 55225
7 65 185 12025 4225 34225
8 73 200 14600 5329 40000
9 74 225 16650 5476 50625
10 68 210 14280 4624 44100
11 63 200 12600 3969 40000
12 80 270 21600 6400 72900
13 76 250 19000 5776 62500
14 69 225 15525 4761 50625
15 67 200 13400 4489 40000
Total 1068 3325 239125 76644 753325

2. Menghitung koefisien korelasi r:

239125 − (1068 x3325) / 15


r=
{76644 − (1068) 2
}{ }
/ 15 753325 − (3325) 2 / 15
= 0,7615

134
10.2.4 Uji Hipotesa Koefisien Korelasi
Sangatlah tidak mungkin menentukan korelasi variabel X dan Y di populasi, maka pada
banyak penelitian, penentuan korelasi X dan Y dilakukan pada sampel. Untuk menentukan
apakah korelasi yang ditentukan dari sampel benar menggambarkan korelasi X dan Y di
poluasi, maka perlu dilakukan uji hipotesis degan langkah berikut.
1) Menetapakan hipotesis untuk korelasi
Hipotesis statistik sbb:
Ho: ρ = 0 (tidak ada hubungan)
Ha: ρ # 0 (ada hubungan)

2) Menguji tingkat kemaknaan nilai r


Koefisien korelasi mempunyai distribusi menyerupai distribusi t, oleh karena itu, uji
Hipotesa koefisien korelasi dilakukan dengan statistik uji “t” dengan derajat bebas
df = n-2.

Rumus uji t koefisien korelasi:


r r
t= = (n − 2)
(1 − r 2 ) (1 − r 2 )
(n − 2)

Keterangan:
t = nilai statistik t
r = koefisien korelasi sampel
n = jumlah sampel

Statistik “t” untuk data survei di atas adalah:


0,7615
t= (15 − 2) = 2,7456
(1 − 0,7615 2 )

3) Cara kengambilan kesimpulan


Ho diterima bila nilai p > 0,05 dan Ho ditolak bila nilai p ≤ 0,05.
Nilai p dapat dilihat pada tabel distribusi t dan pada semua program paket statsitik
akan mencantumkan nilai p dari hasil uji pada tabel luaran (output) hasil analisnya.

135
10.2.5 Contoh output SPSS

1. Scatter Plot
6.00

5.00

4.00
Loyalitas

3.00

2.00

1.00

1.00 2.00 3.00 4.00 5.00 6.00

Tingkat kepuasan

Scatter Plot Hubungan Tingkat Kepuasan dengan Loyalitas klien

Dari grafik pencar di atas tampak terdapat hubungan positif antara tingkat kepuasan
dengan loyalitas klien rumah sakit. Makin tinggi tingkat kepuasan klien makin
tinggi pula tingkat loyalitas klien terhadap rumah sakit tersebut.

2. Koefisien Korelasi
Correlations

Tingkat
kepuasan Loyalitas
Tingkat kepuasan Pearson Correlation 1 ,572**
Sig. (2-tailed) ,000
N 200 200
Loyalitas Pearson Correlation ,572** 1
Sig. (2-tailed) ,000
N 200 200
**. Correlation is significant at the 0.01 level (2-tailed).


Dari contoh output SPSS di atas diketahui bahwa tingkat kepuasan klien memiliki
koefisien korelasi 0,572 dengan nilai p = 0,000. Hasil tersebut menunjukan bahwa
kepuasan pasien memiliki hubungan positif sedang dengan tingkat loyalitas klien
dan hubungan tersebut secara statistik bermakna.

136
10.3 Regresi Linear Sederhana
10.3.1 Indikasi
Analisa regresi dalam bidang kesehatan dapat dipakai untuk dua tujuan, yaitu: untuk tujuan
estimasi atau memperkirakan nilai suatu variabel dari nilai variabel yang lainnya. Misalnya
memperkirakan umur kehamilan dari tinggi fundus uteri. Selain itu, regresi juga dipakai
untuk tujuan menentukan besar pengaruh satu variabel bebas (independent variable)
terhadap suatu variabel tergantung (dependent variable). Kegunaan analisa regresi untuk
mempelajari besarnya pengaruh variabel bebas terhadap variabel tergantung paling sering
dijumpai dalam penelitian kesehatan. Variabel yang mempengaruhi disebut sebagai
variabel bebas atau prediktor atau risk faktor, sedangkan variabel yang dipengaruhi disebut
variabel tergantung atau outcome atau efek.

Sebagai contoh, misalnya dalam satu penelitia akan dipelajari pengaruh berat badan lahir
(BBL) dengan pertambahan berat badan bayi. BBL merupakan variabel bebas X,
sedangkan pertambahan berat badan bayi sebagai variabel tergantung Y. Pengaruh BBL
terhadap pertambahan berat badan dihipotesakan bahwa makin besar berat badan lahir,
akan makin kecil pertambahan berat badan bayi. Studi ini dilakukan terhadap 30 sampel
bayi yang dipilih secara random. Berat badan baru lahir (BBL) dan berat badan setelah
berumur 3 bulan diukur dengan alat timbangan bayi yang standar. Data pengukuran berat
badan bayi adalah sebagai berikut:

Berat badaan lahir dan % kenaikan berat badan setelah 3 bulan

No BBL % kenaikan No BBL % kenaikan


(X) (Y) (X) (Y)
1 2,4 68 16 3,9 59
2 3,7 63 17 4,1 27
3 3,7 66 18 4,2 60
4 3,5 72 19 4,0 71
5 3,9 52 20 4,2 88
6 3,0 75 21 4,2 63
7 4,2 76 22 2,9 88
8 2,6 118 23 4,7 53
9 2,7 120 24 4,4 50
10 2,8 114 25 2,9 111
11 3,8 29 26 4,1 59
12 3,9 42 27 4,4 76
13 4,3 48 28 3,5 72
14 4,3 50 29 3,4 90
15 4,1 69 30 3,1 91

137
10.3.2 Model Regresi Linear
Dalam analisa regresi, pengaruh variabel bebas X terhadap variabel tergantung Y
diasumsikan linier, sehingga hubungan dari kedua variabel tersebut dapat dinyatakan dalam
suatu persamaan garis lurus yang disebut sebagai Model Regresi Linier sebagai berikut:

Y = a + bX

Keterangan:
Y = variabel tergantung (dependent variable)
X = variabel bebas (independent variable)
b = koefisien regresi
a = konstan atau intercept

Dalam penelitian pengaruh BBL terhadap pertambahan berat badan seperti contoh di atas,
berat badan waktu lahir merupakan variabel bebas X, sedangkan persentase pertambahan
berat badan setelah 3 bulan merupakan variabel tergantung Y. Dari model di atas
digambarkan, bahwa besarnya perubahan berat badan (Y) dipengaruhi oleh berat badan
waktu lahir (X).

10.3.3 Koefisien regresi


Koefisien regresi menyatakan besarnya perubahan yang terjadi pada nilai variabel
tergantung Y sebagai pengaruh dari setiap perubahan satu unit nilai variabel bebas X dan
koefisien regresi diberi simbol “b”. Misalnya dari hasil analisis pengaruh variabel bebas X
terhadap variabel tergantung Y mempunyai nilai b = 3, maka ini berarti kalau nilai nilai X
berubah satu unit maka nilai Y akan berubah 3 unit. Besarnya koefisien regresi dapat
dihitung dengan rumus sebagai berikut:

b=
∑ XY − (∑ X )(∑ Y ) / n
2 2
∑ X − (∑ X ) / n
Keterangan:
b = koefisien regresi
∑XY = jumlah hasil kali nilai var bebas (X) dengan nilai var tak bebas (Y)
∑X = jumlah nilai variabel bebas (X)
∑Y = jumlah nilai var tak bebas (Y)
2
∑X = jumlah kwadrat nilai var bebas (X)
n = jumlah sampel

138
Besarnya koefisien regresi hubungan antara BBL dengan persentase perubahan berat badan
setelah 3 bulan dari penelitian di atas dapat dihitung sebagai berikut:

1) Menghitung total nilai ∑X, ∑Y, ∑XY, ∑X2 dan ∑Y2

X Y XY X2 Y2
2,4 68 163,2 5,76 4624
3,7 63 233,1 13,69 3969
3,7 66 244,2 13,69 4356
3,5 72 252,0 12,25 5184
3,9 52 202,8 15,21 2704
3,0 75 225,0 9,00 5625
4,2 76 319,2 17,64 5776
2,6 118 306,8 6,76 13924
2,7 120 324,0 7,29 14400
2,8 114 319,2 7,84 12996
3,8 29 110,2 14,44 841
3,9 42 163,8 15,21 1764
4,3 48 206,4 18,49 2304
4,3 50 215,0 18,49 2500
4,1 69 282,9 16,81 4761
3,9 59 230,1 15,21 3481
4,1 27 110,7 16,81 729
4,2 60 252,0 17,64 3600
4,0 71 284,0 16,00 5041
4,2 88 369,6 17,64 7744
4,2 63 264,6 17,64 3969
2,9 88 255,2 8,41 7744
4,7 53 249,1 22,09 2809
4,4 50 220,0 19,36 2500
2,9 111 321,9 8,41 12321
4,1 59 241,9 16,81 3481
4,4 76 334,4 19,36 5776
3,5 72 252,0 12,25 5184
3,4 90 306,0 11,56 8100
3,1 91 282,1 9,61 8281
∑X = 110,9 ∑Y = 2120 ∑XY = 7541,4 ∑X2 = 421,37 ∑Y2=166488

139
2) Menghitung koefisien b:
7541,4 − (110,9)(2120) / 30
b=
421,37 − (110,9) 2 / 30
− 295,533
b= = −25,9
11,409

Nilai b = - 25,9 artinya kalau BBL bertambah 1 kg, maka persentase pertambahan BB
akan berkurang 25,9% .

3) Menghitung intercept (a):


a = ƩY/n – b(ƩX/n)
= 70,667 – (-25,9)(3,697) = 166,41

4) Persamaan garis regresi:


Y = 166,41 – 25,9X
Dari persamaan ini dapat diestimasikan persen pertambahan BB setelah 3 bulan. Bila
BBL = 2,5 kg, maka BB setelah 3 bulan akan bertambah secara rata-rata 101,66% dari
BBL. Bila BBL = 1,5 kg, maka rerata perkiraan pertambahan BB setelah 3 bulan adalah
127,56% dari BBL.

10.3.4 Koefisien determinasi R2 (explanatory Power)


Besar pengaruh variabel bebas X terhadap variabel tergantung Y dinyatakan dengan
besarnya nilai koefisien determinan R2. Nilai R2 menyatakan proporsi variasi variabel
tergantung Y yang dapat dijelaskan oleh nilai variabel bebas X. Nilai R2 dapat bervariasi
antara 0 sampai 1. Bilai nilai R2 = 1, berarti semua variasi nilai variabel tergantung Y dapat
dijelaskan oleh variabel bebas X berarti tidak ada faktor lain yang ikut mempengaruhi nilai
variabel tergantung Y tersebut. Sebaliknya, bila nilai R2 = 0 menunjukkan bahwa variabel
bebas X sama sekali tidak berpengaruh terhadap variabel tergantung Y. Apabila persamaan
regresi linear antara variabel bebas X dan variabel tergantung Y adalah: Y’ = a + bX, maka
besar nilai R2 dapat dihitung sebagai berikut.

140
Penyimpangan nilai Yi terhadap rata-rata Y dapat digambarkan pada bagan di bawah ini.

Y
(Xi,Yi) Y’= a + bX
_ (Yi-Yi’)
(Yi-Y) _
(Yi’-Y)
_
Y

Dari bagan di atas tampak deviasi Y’i terhadap Y terbagi menjadi dua bagian, sehingga
dapat dinyatakan seperti persamaan berikut ini:

Yi − Y = (Yi − Y ' i) + (Y ' i − Y )


dimana:
(Yi – Y’i) : adalah selisih setiap nilai Yi observasi dengan nilai Yi’ estimasi
menurut garis regersi, yang selanjutnya disebut RESIDU dari regresi
atau disebut dengan Residu saja, dan
(Y ' i − Y ) : adalah selisih dari setiap nilai Yi’ estimasi terhadap nilai rerata Y
observasi, yang disebut “EXPLAINED by REGRESSION” atau
variasi yang dijelaskan oleh garis regresi

Bila jumlah kuadrat dari masing-masing deviasi tersebut dihitung, maka akan didapatkan
sebagai berikut:

2 2 2
∑ (Yi − Y ) = ∑ (Yi − Y ' i) + ∑ (Y ' i − Y )
dimana:
2
∑ (Yi − Y ) = adalah Total Sum Square (TSS)
2
∑ (Yi − Y ' i) = adalah Residu Sum Square (ESS)
2
∑ (Y ' i − Y ) = adalah Regression Sum Square (RSS)
maka:
R 2 = RSS / TSS

141
RSS = (Y ' i − Y ) 2 , maka
2
{∑ XY − (∑ X )(∑ Y ) / n}
RSS = 2 2
∑ X − (∑ X ) / n

TSS = (Yi − Y ) 2 , maka


TSS = ∑ Y 2 − (∑ Y ) 2 / n

Oleh karena itu, nilai koefisien determinasi untuk contoh penelitian di atas dapat dihitung
sebagai berikut:
1) menghitung Total Sum Squared (TSS):
n = 30
ƩX = 110,9 ƩY = 2120
2 2
ƩX = 421,37 ƩY = 166488

sehingga nilai TSS adalah:


TSS = ƩY2 – (ƩY)2 /n
= 166488 – (2120)2 /30
= 16674,6667

2) menghitung Regression Sum Squared (RSS):


2
{∑ XY − (∑ X )(∑ Y ) / n}
RSS = 2 2
∑ X − (∑ X ) / n
=
{7541,4 − (110,9)(2120) / 30}2
421,37 − (110,9) 2 / 30
87339,95
= = 7654,8857
11,4097

3) menghitung koefisien determinasi R2 :


R2 = RSS/TSS = 7654,8857/16674,6667
= 0,4590

Jadi berat badan waktu lahir berpengaruh sekitar 46% terhadap perubahan berat badan anak
setelah berumur 3 bulan dan 54% lainnya ditentukan oleh faktor lain.

142
10.3.5 Uji Hipotesis R2
Apakah nilai koefisien determinasi pada sampel juga berlaku untuk populasi? Untuk
menjawab pertanyaan ini, kita perlu menguji kemaknaan dari nilai koefisien determinasi
tersebut. Uji kemaknaan koefisien determinasi dilakukan dengan uji F (varian) dengan cara
penghitungan sebagai berikut:

1) Hipotesa statistik:
Ho: R2 = 0
Ha : R2 # 0

2) Menghitung nilai F:
F = Msreg / Msres
dimana:
MSreg = SSR/k
MSres = (TSS – SSR) / (n-k-1)

Keterangan:
F = nilai statistik F
MSreg = rata-rata varian regresi
MSres = rata-rata varian residu
SSR = total varian regresi
k = jumlah variabel bebas dalam model
TSS = total varian variabel tergantung
n = jumlah sampel

Dengan menggunakan data penelitian di atas dapat dihitung nilai statistik F sebagai
berikut:
1) Total Sum Square (TSS) = 16674,6667
2) Regression Sum Sqquare (RSS) = 7654,8857
3) Derajat Bebas Regresi (k) = 1 (jumlah var bebas)
4) Rata-rata RSS (MRSS) = RSS/k = 7654,8857
5) Residu Sum Square (ESS) = TSS-RSS = 9019,781
6) Rata-rata Residu Sum Square (MESS) = ESS/df res
= ESS/n-k-1
= 9019,781/28
= 322,1350
7) Statistik F = MRSS/MESS
= 7654,8857/322,1350 = 23,769

143
Resume Anova test
Hasil perhitungan di atas dapat disajikan dalam sebuah tabel resume sbb:

Resume Hasil Hasil Anova test


Sumber Variasi Sum Square df Mean SS F
Regression 7654,8857 1 7654,8857 23,7629
Residual 9019,7810 28 322,1350
Total 16674,6667 29

3) Batas penerimaan Ho:


Batas penerimaan statistik F dapat dilihat pada tabel F. Bila df pembilang = 1 dan df
penyebut = 28 serta tingkat kemaknaan = 5% didapatkan batas penerimaan Ho atau CV
adalah sebesar 4,20.
Ho: diterima bila nilai statistik F < 4,20 dan
Ho: ditolak bila nilai statistik F ≥ 4,20
Daerah penolakan dan penerimaan Ho: dapat digambarkan seperti bagan di bawah ini:

α
4,20
Ho diterima CV Ho ditolak

4) Kesimpulan:
Ho: ditolak karena kemungkinan Ho benar adalah lebih kecil dari 5% (p<0,05) dan ini
berartti koefisien determinasi R2 = 0,45 adalah berlaku untuk populasi, sehingga dapat
disimpulkan 45% perubahan berat badan bayi setelah berumur 3 bulan ditentukan oleh
BBL dari bayi tersebut.

10.3.6 Asumsi Regresi Linear

1) Variabel X dan Y memiliki hubungan linear


Linearitas hubungan variabel bebas X dan variabel tergantun Y dapat dilihat dari
scatter plot dari X dan Y.

144
Y

120.00 Observed
Linear

100.00

80.00

60.00

40.00

20.00

2.00 2.50 3.00 3.50 4.00 4.50 5.00

Dari Scatter plot diatas tampak hubungan variabel X dan Y berdistribusi normal.

2) Nilai variabel tergantung Y memiliki varian yang sama untuk setiap nilai X dan
berdistribsi normal serta memilki nilai rerata yang terletak pada satu garis lurus
atau dikenal dengan istilah homoskedastik. Homoskedasitas dari variabel
tergantung Y dapat dilihat dari scatter plot antara nilai prediksi standar (ZPRED)
dengan nilai student T residu (SRESID).

Scatterplot

Dependent Variable: Y

2
Regression Studentized Residual

-1

-2

-2 -1 0 1 2

Regression Standardized Predicted Value

Dari scatter plot residu di atas tampak bahwa distribusi plotnya tidak menunjukan
bentuk spesifik, maka dapat disimpulkan asumsi homoskedastik terpenuhi.

145
LATIHAN:

1. Suatu eksperimen telah dilakukan untuk mengukur efek obat X terhadap penurunan
denyut jantung. Variabel bebasnya adalah dosis obat dalam mg dan sebagai variabel
tergantung adalah penurunan denyut jantung dari sebelum diberi obat dengan sesudah
diberi obat. Data yang didapat adalah sebagai berikut:

Penurunan Penurunan
Dosis obat Denyut jantung Dosis obat Denyut jantung
(X) (Y) (X) (Y)
0,5 10 0,75 8

1,0 12 1,25 12

1,5 14 1,75 12

2,0 16 2,25 18

2,5 17 2,75 17

3,0 18 3,25 20

3,5 21 3,75 20

Gambarkan sketer plot dari hubungan kedua variabel tersebut dan hitung koefisien
korelasinya serta uji apakah obat tersebut memberikan efek terhadap penurunan denyut
jantung pada tingkat kemaknaan 99%.
Hitung pula koefisien regresi “b” dan koefisien determinasi “R2” nya.

2. Bagian phatologi Klinik FK ditugaskan ubtuk menera alat pengukur tekanan darah
yang menggunakan pegas. Alat pengukur tekanan darah yang dipakai standar
selanjutnya disebut metoda I dan yang akan ditera disebut sebagai metoda II. Sebanyak
25 pasien diukur tekanan sistolenya dengan menggunakan kedua metoda tadi dan
hasilnya adalah sebagai berikut:

146
Data hasil pengukuran tekanan darah dengan kedua metoda

Pasien Metoda I Metoda II Pasien Metoda I Metoda II

1 132 130 14 180 174

2 138 134 15 188 186

3 144 132 16 194 172

4 146 140 17 194 182

5 148 150 18 200 178

6 152 144 19 200 196

7 158 150 20 204 188

8 130 122 21 210 180

9 162 160 22 210 196

10 168 150 23 216 210

11 172 160 24 220 190

12 174 178 25 220 202

13 180 168

Peneliti ingin mengetahui kuatnya hubungan antara metoda. Buatlah sketer plot dari
kedua variabel tersebut, hitung koefisien korelasinya dan uji apakah kedua metoda
setara pada kemaknaan 99%.
Hitung pula koefisien regresi “b” dan koefisien determinasi “R2” nya.

147
MODUL 11
PERBEDAAN RISIKO
Comparing Risks

11.1 Pendahuluan

Pada penelitian kesehatan sering dipelajari hubungan antara dua variabel kategori atau
lebih, seperti misalnya terjadinya suatu penyakit dikaitkan dengan keberadaan faktor risio
tertentu. Sebagai contoh, misalnya akan diteliti apakah kebiasaan merokok meningkatkan
resiko terjadinya penyakit jantung koroner.

Dua jenis ratio yang sering dipakai untuk memperkirakan besarnya resiko, yaitu: relatif risk
(RR) dan odd ratio (OR). RR dan OR dikembagkan di bidang epidemiologi, tetapi sekarang
pengunaannya tidak hanya di bidang epidemiologi melainnya dibanyak penelitian
kesehatan. RR dan OR dipakai menentukan besarnya resiko pada penelitian prospektif dan
OR dipakai dalam penelitian retrospektif.

Pada modul ini akan dibahas tentang pengertian penelitain prospektif dan retrospektif, RR,
OR dan uji Chi-square.

11.2 Penelitian prospektif dan retrospektif

Penelitian prospektif merupakan kjenis penelitian dimana variabel tergantung atau variabel
outcome diamati secara prospektif. Pada rancangan penelitian ini terdapat dua kelompok
subjek yaitu kelompok yang memiliki faktor resiko yang dipelajri dan kelompok yang tidak
memiliki faktor resiko. Kelompok subjek pertama disebut kelompok terpapar dan
kelompok subjek ke dua disebut kelompok kontrol. Kedua kelompok selanjutnya diikuti ke
depan (they are followed prospectively) sampai waktu tertentu. Terjadinya outcome pada
kedua kelompok sunjek yang diteliti direkod sampai penelitian selesai.

Penelitian retrospektif (case-control study) adalah kebalikan dari penelitian prospetif. Pada
penelitian case-control, pemilihan subjek penelitian dimuai dari mereka yang memiliki
148
kategori outcome variabel sebagai kasus dan yang tidak memiliki kategori outcome dipakai
sebagai kontrol. Selanjutnya, pada kelompok kasus dan kontrol diteliti kebelakang (look
back) apakah terdapat faktor resiko yang diteliti atau tidak.

Hasil pengukuran outcome dan risk factors pada penelitian prospektif ataupun penelitian
retrospektif disajikan dalam tabel 2x2 sebagai berikut:

Faktor Outcome Total


Resiko Sakit Tidak sakit
Ekspose a b a+b
Nonekspose c d c+d
Total a+c b+d n=a+b+c+d

11.3 Relatif Risk

Reralif risk (RR) tepat dipakai sebagai ukurkan resiko relatif antara kelompok ekspose dan
nonekspose pada penelitian prospektif (kohort), trial, dan penelitian cross-sectional. Relatif
risk merupakan perbanding resiko sakit antara kelompok terekspose dengan kelompok
nonekspose. Resiko sakit pada kelompok terekspose adalah jumlah yang sakit dibagi
dengan jumlah kelompok terekspose = a/(a+b). Resiko sakit dari kelompok nonekspose
(kontrol) adalah = c/(c+d), maka resiko relatif antara ke dua kelompok adalah:

a/(a+b)
RR = ------------
c/(c+d)

Nilai RR = 1, berarti resiko sakit antara kelompok yang memilki resiko sama dengan resiko
sakit dari kelompok yang tidak memiliki resiko. Bila RR = 1 menunjukan bahwa faktor
tersebut tidak meningkatkan resiko terjadinya penyakit tersebut. Nilai RR > 1
mengindikasikan bahwa keberadaan faktor resiko tersebut meningkatkan resiko terjadinya
penyakit pada kelompok ekspose. Nilai RR < 1 mengindikasikan bahwa keberadaan faktor
yang diteliti tersebut memberikan efek pencegahan atau dapat menurunkan resiko
terjadinya penyakit tersebut pada yang memilki faktor tersebut.

149
Untuk mengetahui apakah RR di populasi berbeda dengan 1, maka nilai RR yang
didapatkan dari sampel dihitung nilai conviden intervalnya atau diuji kemaknaannya
dengan uji chi-square.

Penentuan CI dari RR
Nilai CI dari RR dapat dihitung dengan langkah sebagai berikut:
1. hitung nilai RR
2. hitung batas bawah CI 95% RR = RR x Exp{-1,96 √(1/a-1/(a+b)+1/c-1/(c+d)}
3. hitung batas atas CI 95% RR = RR x Exp{-1,96 √(1/a-1/(a+b)+1/c-1/(c+d)}

Contoh:
Misalnya akan diteliti resiko bayi memiliki APGAR < 7 antara ibu dengan riwayat
persalinan beresiko dengan yang tidak memiliki riwayat persalinan beresiko. Hasil
pengukuran APGAR skor dari kedua kelompok adalah sbb:

Faktor Outcome Total


Resiko Apgar<7 Apgar≥7
Ekspose 33 58 91
Nonekspose 2 14 16
Total 35 72 107

Resiko memiliki Apgar <7 pada kelompok ibu yang memeiliki riwayat persalinan berresiko
= 33/91 = 0,36 dan resiko pada kelompok ibu yang tidak memiliki persalinan beresiko =
2/16 = 0,125. Dari hasil tersebut didapatkan nilai RR sampel = 0,36/0,125 = 2,88.

Dari RR sampel selanjutnya diperkirakan RR di populasi dengan menghitung nilai


convident interval 95% dari RR sebagai berikut:

1. Batas bawah = RR x Exp{-1,96 √(1/a-1/(a+b)+1/c-1/(c+d)}


= 2,88 x Exp{-1,96√(1/33-1/91+1/2-1/16)
= 0,76
2. Batas atas = RR x Exp{1,96 √(1/a-1/(a+b)+1/c-1/(c+d)}
= 2,88 x Exp{1,96√(1/33-1/91+1/2-1/16)}
= 10,83

150
Jadi dengan tingkat kepercayaan 95%, RR memilki apgar < 7 antara ibu yang memeiliki
riwayat persalinan beresiko dengan yang tidak memeilki riwayat persalinan bersiko
berkisar antara 0,76 s/d 10,83.
Dari hasl tersebut didapat bahwa RR = 1 ada dalam CI tersebut, maka dapat dismpulkan
bahwa resiko memiliki apgar skor <7 antara ibu yang memilki persalinan bersiko dengan
yang tidak memiliki riwayat persalinan beresiko adalah sama. Dengan kata lain dapat
disimpulkan bahwa memeilki riwayat persalinan beresiko tidak meningkatkan resiko
melahirkan bayi dengan apgar skor < 7.

Perbedaan resiko antara kelompok ekspose dan nonekspose juga dapat diuji dengan uji chi-
square. Uji chi-square untuk RR akan dibahas pada bagian 9.5 di bawah.

11.4 Odd Ratio

9.4.1 Odd Ratio pada Independent Case-Control


Odd Ratio tepat dipakai menentukan perbedaan resiko pada penelitian case-control
(retrospektif). Pada penelitian independent case-control, pemilihan subjek dimulai dari
mereka yang sakit dan yang tidak sakit. Subjek yang sakit disebut kasus dan yang tidak
sakit disebut kontrol. Pemilihan kontrol tidak dipasangkan dengan kasus 9independent
case-control). Keberadaan faktor resiko diamati secara retrospektif. Hasil pengamatan
antara kasus dan kontrol dapat disajikan dalam tabel 2x2 seperti berikut.

Faktor Outcome Total


Resiko Kasus Kontrol
Ekspose a b a+b
Nonekspose c d c+d
Total a+c b+d n=a+b+c+d

Odd Ratio adalah ratio antara Odd terjadinya ekspose antara kasus dan kontrol. Odd
didefinisikan sebagai perbanding probabilitas terjadinya ekspose dan nonekspose. Bila p
adalah probabilitas terjadinya ekspose maka 1-p merupakan probabilitas tidak terjadinya
ekspose, oleh karena itu Odd = p/(1-p). Maka Odd Ratio dapat dihitung sbb:

1. Odd kasus terekspose = a/(a+c)/c/(a+c) = a/c

151
2. Odd kontrol terekspose = b/(b+d)/d/(b+d) = b/d
3. OR = Odd kasus/Odd kontrol = a/c/b/d = ad/bc

Nilai OR sama dengan 1 menunjukan bahwa resiko terjadi sakit antara kelompok ekspose
dan nonekspose tidak berbeda. Nilai OR > 1 menunjukan bahwa resiko terjadinya sakit
pada kelompok ekspose lebih tinggi dari nonekspose. Nilai OR < 1 mengindikasikan
terjadinya penurunan resiko sakit pada kelompok terekspose atau juga disebut keberadaan
faktor tersebut memberikan efek pencegahan.

Nilai OR di populasi dari diperkirakan dengan menghitung confident interval (CI) dari OR
sampel. Cara menghitung CI OR adalah sbb:
1. Hitung nilai OR sampel
2. Hitung batas bawah CI = OR x Exp{-1,96 √(1/a+1/b+1/c+1/d)}
3. Hitung batas atas CI = OR x Exp{1,96 √(1/a+1/b+1/c+1/d)}

Contoh kasus:
Suatu penelitian case-control dilakukan untuk mempelajari hubungan antara paparan debu
asbes dengan kanker paru (bronchial carcinoma). Sebanyak 223 kasus dan 715 kontrol yang
diteliti. Data hasil penelitian disajikan sbb:

Faktor Outcome Total


Resiko Kasus Kontrol
Ekspose 148 372 520
Nonekspose 75 343 418
Total 223 715 938

Nilai OR = (148 x 343) / (372 x 75) = 1,83


Nilai CI 95% OR adalah:
1. Hitung batas bawah CI = OR x Exp{-1,96 √(1/a+1/b+1/c+1/d)}
= 1,83 x Exp (-1,96 √(1/148+1/372+1/75+1/343)
= 1,337
2. Hitung batas atas CI = OR x Exp{1,96 √(1/a+1/b+1/c+1/d)}
= 1,83 x Exp (1,96 √(1/148+1/372+1/75+1/343)
= 2,506

152
Jadi 95% kemungkinan OR di populasi berkisar antara 1,337 sampai 2,506. Berarti paparan
debu asbes meningkatkan resiko kanker paru (bronchial carcinoma) antara 1,33 sampai 2,5
kali dibandingkan dengan yang tidak terpapar oleh debu asbes.

11.4.2 Odd Ratio pada Matched Case-Control

Pada rancangan matched case-control, setiap kasus dipilihkan kontrol yang memiliki ciri
yang sama dengan kasus. Dalam penelitian ini, yang menjadi subjek analisis adalah
pasangan kasus-kontrol, misalnya subjek yang dipakai sebanyak 60 orang yang terdiri dari
30 kasus dan 30 kontrol, maka pasangan subjeknya adalah sebanyak 30 pasang. Penyajian
hasil pengamatan faktor resiko berbeda dengan rancangan independent case-control.
Penyajian data matched case-control adalah sbb;

KASUS KONTROL Total


Ekspose Nonekspose
Ekspose a b a+b
Nonekspose c d c+d
Total a+c b+d n=a+b+c+d

Keterangan:
a = jumlah pasangan dimana kasus dan kontrol terekspose
b = jumlah pasangan dimana kasusnya terekspose dan kontrol tidak
c = jumlah pasangan dimana kasusnya tidak terekspose dan kontrol terekspose
d = jumlah pasangan dimana kasus dan kontrol keduanya tidak terekspose

Odd Ratio pada rancangan Matched case-control dihitung dengan rumus:

OR = b/c

CI OR dihitung dengan rumus:


1. Batas bawah = OR x Exp{-1,96√(1/b+1/c)}
2. Batas atas = OR x Exp{1,96√(1/b+1/c)}

153
Contoh kasus:
Suatu penelitian matched case-control dilakukan untuk mempelajari hubungan antara
paparan debu asbes dengan kanker paru (bronchial carcinoma). Sebanyak 223 pasangan
kasus dan kontrol yang diteliti. Data hasil penelitian disajikan sbb:

Kasus Kontrol Total


Ekspose Nonekspose
Ekspose 48 95 143
Nonekspose 35 45 80
Total 83 140 223

Nilai OR = b/c = 95/35 = 2,714


Nilai OR di populasi diperkirakan antara:
1. Batas bawah = OR x Exp{-1,96√(1/b+1/c)}
= 2,714 x Exp(-1,96√(1/95+1/35)
= 1,842
2. Batas atas = OR x Exp{1,96√(1/b+1/c)}
= 2,714 x Exp(1,96√(1/95+1/35)
= 3,998

Jadi 95% kemungkinan OR populasi berkisar antara 1,84 s/d 3,99, berarti ekspose debu
asber meningkat resiko kanker paru.

11.5 Uji Chi-square

Uji Chi-square dipakai menguji hipotesis hubungan antara variabel kategorikal. Pada modul
ini akan dibahas uji hipotesis hubungan antara dua variabel kategori untuk rancangan
random dan rancangan berpasngan (matched design). Berikut adalah jenis uji hipotesis
hubungan dua variabel kategori dan indikasi penggunaannya.

154
Jenis uji hipotesis hubungan dua variabel kategorikal

Jenis Uji Hipotesis Indikasi penggunaan

Chi-square Independent sampel, semua sel mempunyai nilai ekspektasi


≥5 dengan jumlah sampel > 60

Chi-square dengan Independent sampel, salah satu sel mempunyai nilai


koreksi Yate ekspektasi < 5 dan sampel > 60

Fisher Exact Independen sampel dengan jumlah sampel antara 40 - 60 dan


satu sel mempunyai nilai ekspektasi < 5, atau

Independen sampel dengan jumlah sampel < 20

McNemar Dependent samples (matched samples)

Pada uji Chi Square dikenal ada dua jenis frekuensi yaitu frekuensi yang didapat (obsered
frequencies diberi simbol “O”) dan frekuensi yang diharapkan (expected frequencies
dengan simbol “E”). Frekuensi yang diharapkan adalah frekuensi dari setiap sel dari
kontingensi tabel yang didapat dari hasil tabulasi data yang dikumpulkan dari penelitian,
sedangkan frekuensi yang diharapkan adalah frekuensi yang diharapkans kalau Hipotesa
Null yang menyatakan kedua variabel tersebut tidak berhubungan itu benar. Pada
prinsipnya, Uji Chi square adalah membandingkan frekuensi yang didapat (obsered)
dengan frekuensi yang diharapkan (expected) dari setiap sel. Apabila kedua variabel
tersebut tidak berhubungan maka frekuensi yang didapat akan tidak berbeda dengan
frekuensi yang diharapkan, sehingga O – E = 0. Sedangkan nilai Chi Square adalah jumlah
(O – E)2/E dari semua sel pada tabel kontingensi, dengan rumus sebagai berikut:

(Oi − Ei ) 2
Rumus: X2 =∑
Ei
dimana
Oi = frekuensi yang didapat untuk sel ke i
Ei = frekuensi yang diharapkan untk sel ke I

155
11.5.1 Uji Chi-square untuk tabel 2 X 2

Indikasi
Bila di dalam suatu penelitian akan dipelajari hubungan dari dua variabel nominal yang
masing-masing variabel memiliki dua kategori, misalnya hubungan antara vacinasi
influensa dengan kejadian influensa. Vaksinasi influensa memiliki kategori dua yaitu
kategori pertama mendapat vaksin influensa dan kategori kedua tidak mendapat vaksin
influensa tetapi mendapat suntikan flacebo. Demikian pula dengan variabel kejadian
influensa memiliki dua kategori yaitu kategori pertama menderita influensa dan kategori
kedua tidak menderita influensa. Bila data dari kedua variabel tersebut didistribusikan ke
dalam sebuah tabel silang, maka akan didapat sebuah tabel kontingensi dengan 2 kolom
dan 2 baris yang dikenal dengan tabel kontingensi 2 x 2 atau tabel 2 x 2.
Uji Chi square untuk tabel 2 x 2 juga dapat dipergunakan untuk menguji perbedaan
proporsi dua sampel bebas. Misalnya untuk menguji perbedaan kejadian influensa pada
kelompok anak yang mendapat vaksinasi influensa dengan kejadian influensa pada
kelompok anak yang mendapat suntikan placebo.

Prosedur pengujian
1. Membuat frekuensi silang dari kedua variabel
Misalnya terdapat 460 orang yang mengikuti percobaan efektivitas vaksin influensa
dimana 240 mendapat vaksin dan 220 mendapat placebo. Data frekuensinya sebagai
berikut:

Tabel Hasil percobaan efektivitas vaksin influensa

Influensa Vaksin Placebo Jumlah


• Ya 20 (a) 80 (b) 100 (a + b)
• Tidak 220 (c) 140 (d) 360 (c + d)
Jumlah 240 (a + c) 220 (b + d) 460 (n)

2. Menghitung nilai Chi Square


Dengan rumus umum:
2
2
(Oi − Ei )
X =∑
Ei

156
Tabel kerja:
Jmlbarisxjmlkolom (O − E ) 2
Sel O E=
Jmlsampel E
1 20 100x240/460 = 52,1739 19,84
2 80 100x220/460 = 47,8261 21,64
3 220 360x240/460 = 187,8261 5,51
4 140 360x220/460 = 172,1739 6,01
Jml 460 460,0000 53,00

Dengan rumus cepat:


2 n(ad − bc ) 2
X =
(a + b)(c + d )(a + c)(b + d )

460(20 x140 − 80 x 220) 2


X2 = = 53,00
(100)(360)(240)(220)

3. Menentukan batas penerimaan atau penolakan hipotesa Nol.


Batas penerimaan atau penolakan Ho dapat dilihat pada tabel Chi Square dengan df =
(r-1) (c-1) dan tingkat kemaknaan α.

Pada contoh di atas : df = (2-1) (2-1) = 1 dan α = 0,05. Dari tabel Chi Square
didapatkan nilai Chi Square batas adalah 3,841.
Ho : diterima bila nilai chi square hitung < 3,841
Ho : ditolak bila nilai Chi Square hitung ≥ 3,841

4. Menyimpulkan hasil pengujian


Ho: ditolak karena Chi Square hitung lebih besar dari 3,841 (batas penerimaan Ho:
pada df = 1 dan kemaknaan 0,05). Ini berarti ada asosiasi antara vaksinasi dengan
kejadian influensa, dimana kejadian influensa pada kelompok yang mendapat vaksin
lebih kecil dari kelompok yang mendapat placebo.

157
11.5.2 Uji Chi-square dengan koreksi Yate

Variabel kategorikal seperti variabel dengan skala pengukuran nominal atau ordinal tidak
memiliki satuan pengukuran yang kontinyu. Oleh karena itu, untuk meningkatkan validitas
nilai Chi Square dilakukan koreksi terhadap kontinuitas data dengan rumus sebagai berikut:
Rumus umum Chi-square dengan koreksi:
2
( Oi − Ei − 0,5) 2
X =∑
Ei
Untuk contoh kasus di atas akan didapatkan nilai Chi Square denga koreksi sebagai berikut:
Tabel kerja:

Sel O Jmlbarisxjmlkolom ( O − E − 0,5) 2


E=
Jmlsampel E
1 20 100x240/460 = 52,1739 19,23
2 80 100x220/460 = 47,8261 20,98
3 220 360x240/460 = 187,8261 5,34
4 140 360x220/460 = 172,1739 5,83
Jml 460 460,0000 51,36

Rumus cepat dengan koreksi

2
n( ad − bc − n / 2) 2
X =
(a + b)(c + d )(a + c)(b + d )

2
460( 20 x140 − 80 x 220 − 230) 2
X = = 51,37
(100)(360)(240)(220)

158
11.5.3 Fisher Exact Test

Indikasi
Exact test atau juga dikenal dengan uji Fisher Exact Probability adalah uji statistik non
parametrik yang sangat berguna untuk menganalisis data diskrit atau data kategorikal atau
nominal atau ordinal yang mempunyai dua kategori sehingga tabel analisisnya berbentuk
tabel 2 x 2, dengan sampel sangat kecil (n < 20) atau bila jumlah sampel antara 20 – 40
dimana salah satu sel memiliki frekuensi yang diharapkan (expected frequency) lebih kecil
dari 5. Untuk kondisi data seperti itu, uji Chi Square kurang valid. Bentuk umum tabel 2 x
2 adalah sebagai berikut:

Tabel kontingensi 2 x 2

+ - Total
Grup I a b a+b
Grup II c d c+d
Total a+c b+d n

Grup I dan II bisa kategori dari variabel bebas misalnya obat A dan obat B atau jenis
kelamin laki dan perempuan, dan sebagainya. Pada judul kolom ada tanda + dan -. Ini bisa
efek dari obat, kesembuhan, dan sebagainya.

Cara Penghitungan Exact Probability

Exact probabilitas dari frekuensi tabel 2 x 2 dengan jumlah pada baris dan kolomnya tetap
merupakan jumlah eksak probabilitas dari tabel yang didapat dari penelitian dan semua
kemungkinan tabel yang memiliki frekuensi yang lebih ekstrem dari tabel yang didapat dari
penelitian yang jumlah pada baris dan kolomnya tetap sama seperti tabel hasil penelitian.
Penghitungan eksak probabilitas setiap tabel 2 x 2 dihitung dengan menggunakan distribusi
hypergeometrik sebagai acuan. Penghitungan exact probablitas dilakukan dengan rumus
sbb:

(a + b)!(c + d )!(a + c)!(b + d )!


p=
n!a!b!c!d!

159
Sebagai ilustrasi, mari ikuti contoh berikut. Misalnya dalam suatu penelitian klinil akan
dicobakan dua jenis obat sebut saja obat A dan obat B. Kedua obat tersebut akan diuji
efeknya terhadap pencegahan perdarahan pada operasi penderita haemopilia. Pelakuan
(obat A dan B) dialokasikan secara random. Dari 25 kasus yang dijadikan orang percobaan,
13 mendapat obat A dan 12 mendapat obat B. Langkah pengujian adalah sebagai berikut:

1) Membuat frekuensi distribusi hasil penelitian dalam tabel 2 x 2


Pada tabel disajikan hasil trial obat A dan B seperti di bawah ini.

Tabel Perbandingan efek obat A dan B terhadap pencegahan perdarahan post operasi
pada penderita haemopilia

Komplikasi Jenis Obat


Jumlah
perdarahan Obat A Obat B
• Ya 1 (a) 3 (b) 4 (a + b)
• Tidak 12 (c) 9 (d) 21 (c + d)
Jumlah 13 (a + c) 12 (b + d) 25 (n)

Tabel 2 x 2 di atas mempunyai dua sel yang memiliki frekuensi yang diharapkan
(expected frequency) lebih kecil dari 5, yaitu sel (a) dan sel (b) dengan frekuensi yang
diharapkan sebesar 2,8 untuk sel (a) dan 1,92 untuk sel (b). Pada kondisi seperti ini, uji
Chi Square tidak valid dipakai untuk menguji hubungan kedua variabel tersebut.
Kondisi seperti ini merupakan indikasi pemakaian uji Exact.

2) Menghitung Eksak probabilitas frekuensi pada tabel hasil penelitian

(a + b)!(c + d )!(a + c)!(b + d )!


p=
n!a!b!c!d!

Exact probabilitas dari tabel penelitian di atas adalah:


(4)!(21)!(13)!(12)!
p= = 0,2261
25! 1! 3! 12! 9!

3) Mengidentifikasi tabel yang lebih ekstrem


Hanya ada satu kemungkinan tabel yang lebih ekstrem frekuensinya dari tabel frekuensi
hasil penelitian, yaitu:

160
Komplikasi Jenis Obat
Jumlah
perdarahan Obat A Obat B
• Ya 0 (a) 4 (b) 4 (a + b)
• Tidak 13 (c) 8 (d) 21 (c + d)
Jumlah 13 (a + c) 12 (b + d) 25 (n)

4) Menghitung eksak probabilitas tabel-tabel yang lebih ekstrem


Exact probabilitas dari tabel penelitian di atas adalah:
(4)!(21)!(13)!(12)!
p2 = = 0,0391
25! 0! 4! 13! 8!

5) Menghitung total eksak probabilitas tabel frekuensi hasil penelitian dan tabel frekuensi
yang lebih ekstrem

p = p1 + p2 = 0,2261 + 0,0391 = 0,2652

6) Kesimpulan

Probabilitas eksak p = 0,2652 adalah lebih besar dari α (0,05), maka dapat disimpulkan
Ho: diterima. Itu berarti obat A dan B memberikan efek pencegahan terhadap
perdarahan post operasi pada penderita haemopilia sama.

11.5.5 Uji McNemar

Indikasi
Uji McNemar dipakai untuk menguji signifikansi perbedaan atau hubungan dari dua sampel
berpasangan atau penelitian dengan rancangan “pre and post” dimana kedua variabel yang
akan dipelajari memiliki skala nominal atau ordinal dengan dua kategori. Setiap pasangan
sampel memiliki empat kemungkinan yaitu:
1. anggota pertama + dan anggota kedua +: A à (+,+)
2. anggota pertama + dan anggota kedua – : B à (+,-)
3. anggota pertama – dan anggota kedua + : C à (-.+)
4. anggota pertama – dan anggota kedua – : D à (-,-);

161
sehingga tabel frekuensi distribusi dari pasangan tersebut adalah sebagai berikut:

Sebelum Sesudah
+ -
+ A (+;+) B (+;-)
- C (-;+) D (-;-)

Dari tabel di atas diketahui bahwa B + C adalah jumlah pasangan yang mengalami
perubahan dari sebelum dengan sesudah perlakuan, maka frekuensi harapan sesuai dengan
Ho akan menjadi ½ (B + C) pasangan mengalami perubahan ke satu sisi dan ½ (B + C)
akan mengalami perubahan ke arah yang berlawanan. Dalam kata lain, ½ (B + C) adalah
frekuensi harapan untuk sel B dan sel C.
Apabila frekuensi hasil observasi dan frekuensi yang diharapkan bila Ho benar diterapkan
pada rumus Chi Square akan didapatkan:

2 (Oi − Ei ) 2
X =∑
Ei

X2 =
{B − 1 / 2( B + C )}2 + {C − 1 / 2( B + C )}2
1 / 2( B + C ) 1 / 2( B + C )

Dengan ekspansi rumus di atas didapatkan rumus Chi Square McNemar sebagai berikut:
2 (B − C) 2
X =
B+C

dengan derajat bebas (df) = 1

Koreksi kontinuitas
Hasil uji dengan rumus di atas akan lebih valid bila ketidakkontinuitas data dikontrol.
Rumus Chi Square McNemar dengan koreksi adalah sebagai berikut:

2
( B − C − 1) 2
X =
B+C

Contoh aplikasi:
Seandainya psikologi anak akan mempelajari inisiatif kontak sosial dari anak-anak.
Penelitian dilakukan pada murid baru taman kanak-kanak. Pada mulanya anak-anak akan
162
lebih banyak kontak dengan orang tua (pengantar) daripada dengan anak-anak sesamanya,
tetapi setelah ada pengalaman dan saling mengenal, anak-anak akan menjadi lebih sering
kontak dengan teman-temannya dibandingkan pada saat baru masuk. Dalam penelitian ini
diamati sebanyak 25 orang anak baru. Pada hari pertama anak tersebut diamati apakah
mereka lebih banyak kontak pada orang tua atau kepada temannya. Pengamatan kedua
dilakukan setelah anak mengikuti program sekolah selama satu bulan, yang diamati dan
kategorinya sama dengan pengamatan pertama.

Prosedur penghitungan:
1) Hipotesa statistik:
Ho: Untuk anak yang berubah inisiatif sosial kontaknya, probabilitas anak akan
berubah inisiatif sosial kontaknya dari orang tua ke anak (PB) adalah sama dengan dari
anak ke orang tua (PC), sehingga:
Ho: PB = PC = ½
Ha: PB > PC

2) Statistik:
Tabel Distribusi perubahan inisiatif kontak sosial murid taman kanak-kanak

1 Bulan Sesudah
Hari I Sekolah
Orang Tua Anak-anak
Orang Tua 4 14
Anak-anak 4 3

Nilai Chi Square:

2
( B − C − 1) 2 ( 14 − 4 − 1) 2
X = = = 4,5
B+C 14 + 4

3) Batas penerimaan atau penolakan Ho:


Untuk tingkat kemaknaan α = 0,05 dengan df = 1, tabel Chi Square memberikan nilai
3,841 sebagai batas penerimaan Ho.

4) Kesimpulan:
Nilai Chi Square yang didapat dari perhitungan di atas adalah 4,5, maka Ho: ditolak.
Ini berarti bahwa proporsi anak yang berubah inisiatif kontak sosialnya dari orang tua
ke anak-anak lebih besar dari yang dari anak berubah ke orang tua.

163
LATIHAN:
1. Seorang peneliti ingin mengetahui apakah data hasil pemeriksaan asam urat dari 250
sampel penelitiannya mempunyai distribusi normal atau tidak. Data hasil pengukuran
asam urat dari sampel tersebut adalah sebagai berikut:
Asam urat Frekuensi
0 – 0,99 1
1 – 1,99 5
2 – 2,99 15
3 – 3,99 24
4 – 4,99 43
5 – 5,99 50
6 – 6,99 45
7 – 7,99 30
8 – 8,99 22
9 – 9,99 10
10 – 10,99 5

2. Pusat studi lingkungan meneliti 100 sampel air laut yang diambil dari pantai di Bali.
Dari sampel tersebut didapatkan data sebagai berikut:
Jml jenis organisme per Frekuensi
sampel
0 15
1 30
2 25
3 20
4 5
5 4
6 1

Apakah jumlah jenis organisme di dalam sampel air berdistribusi normal atau tidak.

3. Suatu trial klinik dilakukan pada 120 kasus histerektomi. Sebanyak 60 kasus diberikan
antibiotika selama 3 hari mulai dari saat dioperasi dan sisanya diberi placebo.
Perlakuan diberikan secara random dan double blind. Angka infeksi setelah operasi
adalah sebagai berikut:

164
Infeksi Tidak infeksi jumlah
Antibiotika 5 55 60
Placebo 25 35 60
jumlah 30 90 120

Buktikan apakah pemberian antibiotika dapat mencegah terjadinya infeksi setelah


operasi histerektomi dengan tingkat kemaknaan 99%.

4. Suatu studi kasus (case-control) dilakukan untuk mengetahui sumber penular dari suatu
wabah kolera di kota A. Pemilihan kontrol dilakukan secara random. Data yang
diperoleh adalah sebagai berikut:
Kasus Kontrol
No Minum Es Air Mentah No Minum Es Air Mentah
1 + + 1 + -
2 + + 2 - -
3 + - 3 - +
4 + - 4 - -
5 - + 5 - -
6 + - 6 + -
7 + + 7 - -
8 - - 8 - -
9 + + 9 - -
10 - + 10 - -
11 - + 11 - -
12 - + 12 - -
13 + + 13 + -
14 + - 14 - -
15 + + 15 - +
16 + + 16 + -
17 + + 17 - -
18 + - 18 - +
19 + - 19 - -
20 - + 20 - -
21 + - 21 + -
22 + + 22 - -
23 - - 23 - -
24 + + 24 - -

165
25 - + 25 - -
26 - + 26 - -
27 - + 27 - -
28 + + 28 + -
29 + - 29 - -
30 + + 30 - +

Makanan mana yang menjadi sumber penularan dari wabah di kota A tersebut.
***************

LAMPIRAN

Bilangan Random

Tabel Distribusi Normal

Tabel Distribusi t

Nilai P untuk Uji Satu Sisis


0,1 0,05 0,025 0,01 0,005 0,0025 0,001 0,0005
Nilai P untuk Uji Dua Sisis
d.b 0,2 0,1 0,05 0,02 0,01 0,005 0,002 0,001
1 3,078
2 1,886
3 1,638
4 1,533
5 1,476
6 1,440
7 1,415
8 1,397
9 1,383
10 1,372
11
12
13
14
15

166
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
120
140
160
180
200

Tabel Chi-Square

Tabel Distribusi F

167
DAFTAR ACUAN

1. Armitage, P., Statistical Methods in Medical in Medical research, IV Edition,


Blackwell, London, 1995.

2. Conover, W.J., Practical Nonparametric Statistics, 2nd Edition, Wiley, 1978.

3. Daniel, Wayne W. Biostatistics: A Foundation For Analysis in the Health Sciences,


Seventh Edition, Wiley, 1999.

4. Fleiss, Josephl, Statistics Methods for Rate and Proportions, 2nd Edition, Wiley, 1981.

5. Kirkwood, Betty R. Essentials of Medical Statistics, Blackwell Scientific Publications,


Oxford, 1989.

6. Kuncaraningrat, Metode Penelitian Masyarakat, Cetakan II, Gramedia, 1979

7. Lee, James (1979), Introduction to Inferential Statistics and Sampling (upublished


paper).

8. Masri Saingarimbun, dkk.; Metode Penelitian Survai, Pusat Penelitian dan Studi
Kependudukan UGM, 1980.

9. Robert C. Duncan, Rebecca G. Knapp, M. Clinton Miller III. Introductory Biostatistics


For The Health Sciences, 2nd Edition, Delmar Publisher Inc, South Carolina, 1976.

10. Schmidt J. Marty, Understanding and Using Statistics: basic Concepts D.C. Health and
Company, Lexington, 1979.

11. Steel R G.D, Torrie J.H. Prinsip dan Prosedur Statistika suatu pendekatan biometrik.
Pt. Gramedia Pustaka Utama, Jakarta, 1991.

168

Anda mungkin juga menyukai