A. PENGERTIAN STATISTIKA
Dalam arti luas, statistika dapat diartikan sekumpulan konsep dan metode yang digunakan
untuk melakukan pengumpulan data, pengolahan, analisis dan menginterpretasikan data
tentang bidang kegiatan tertentu serta mengambil kesimpulannya.
sehingga disebut juga metode statistik
B. KEGIATAN:
Gambar 1
Kegiatan dalam setiap tahap kegiatan statistik
Tersier
Kesimpulan
Spesifik Umum
Peranan statistika dalam penelitian tentunya sesuai dengan pengertian statistika yaitu
suatu metode yang digunakan untuk mengumpulkan data, mengolah, menganalisis serta
menyajikan data dan pengambilan keputusan. Dengan demikian peranan dalam penelitian
juga dalam pengumpulan data, pengolahan dan analisis data. Juga untuk menguji validitas
dan reliabilitas instrument.
1
Secara skematis dapat dilihat pada bagan berikut :
Teori/ Fakta
konsep
Masalah
Tinjauan Pustaka
- Identifikasi variabel
- Kerangka Teori
- Kerangka Konsep
Hipotesis
Generalisasi
Verifikasi
- Disain
- Sampel
- Instrumen
- Pengumpulan data
- Pengolahan data Peranan statistika
- Analisis data
Kesimpulan
DATA, VARIABEL
DAN SKALA PENGUKURAN
A. PENGERTIAN DATA
Data berasal dari kata Latin yaitu “datum”. Bentuk jamak dari kata datum adalah
“data”. Jadi dalam menyatakan data kita sebetulnya sudah berkata bentuk jamaknya, sehingga
untuk selanjutnya tidak perlu menyatakan data-data, sudah cukup menyatakan “data” saja.
Data adalah suatu himpunan/kumpulan angka yang berasal dari hasil pengukuran individu
atau hasil penelitian.
B. MACAM DATA
Ditinjau dari jenis data maka terdapat bermacam-macam data antara lain:
2
*Berdasarkan bentuk datanya:
a). Data kualitatif: yaitu data dalam bentuk kualitas atau berhubungan
dengan mutu. Atau data hasil dari penggolongan/pengklasifikasian (katagorik).
Contoh: - pernyataan terhadap KB: setuju, kurang setuju, tidak setuju.
- pendidikan: tinggi, menengah, rendah
- status gizi: baik, kurang, buruk
b). Data kuantitatif: yaitu data dalam bentuk bilangan/angka (numerik)
Contoh: - jumlah anak balita: 25 anak.
- tinggi badan 167,2 cm
- kadar hemoglobin 12,0 gr/dl
C. VARIABEL
Variabel adalah suatu sifat yang akan diukur atau diamati yang nilainya bervariasi
antara satu obyek dengan obyek lainnya atau dengan kata lain variabel adalah suatu
sifat/karakteristik yang mempunyai variasi nilai.
D. Macam variabel:
1. a). Variabel katagorik/ kualitatif: variabel hasil dari penggolongan
atau pengklasifikasian.
Contoh: - jenis kelamin (laki-laki, perempuan)
- tingkat pendidikan (SD,SLTP, SLTA, PT)
- status perkawinan (kawin, belum kawin, janda/duda)
b). Variabel numerik/kuantitatif: variabel hasil penghitungan/pengukuran dan
berbentuk bilangan/angka (numerik)
Contoh: - jumlah bayi lahir
- tinggi badan
3
2. a). Variabel diskrit: yaitu variabel yang nilainya dinyatakan dalam bentuk
bilangan bulat dan hasil dari penghitungan
Contoh: - jumlah anak balita dalam keluarga
- jumlah anggota keluarga
- jumlah pasien di kelas VIP
b). Variabel kontinyu: yaitu variabel yang nilainya bisa dalam bentuk desimal,
dan hasil dari pengukuran.
Contoh: - tekanan darah
- suhu tubuh
- kadar hemoglobin
variabel x variabel y
(variabel independent) (variabel dependent)
E. SKALA PENGUKURAN
Dalam mengumpulkan nilai dari variabel perlu juga diketahui skala pengukuran dari
variabel tersebut. Skala ada 4 macam yaitu skala nominal, ordinal, interval dan rasio.
1. Skala Nominal
Merupakan skala pengukuran yang paling lemah tingkatannya. Terjadi bila pengukuran
terhadap variabel tersebut hanya dapat membedakan satu pengamatan dengan pengamatan
yang lain. Setiap obyek akan masuk kedalam salah satu kelompok/ kategori.Tidak
mungkin ada tumpang tindih (over lapping). Nomor yang diberikan kepada obyek tidak
mempunyai besaran, jadi hanya sekedar label.
Ciri : - isinya dapat dibedakan
- nilainya sederajat (antara kategori tidak dapat diketahui tingkat
perbedaannya.
Contoh : - jenis kelamin (laki-laki ; perempuan)
- agama (Islam, Kristen dll)
- suku bangsa (Jawa, Sunda, Betawi, dll)
2. Skala Ordinal
Apabila pengukuran terhadap variabel tersebut dapat membedakan serta mengurutkan
(order = urutan = ranking). Antara kategori dapat diketahui tingkat perbedaannya. Jadi dari
kelompok yang sudah ditentukan dapat diurutkan menurut besar kecilnya. Nomor yang
diberikan kepada obyek mempunyai besaran, yang dapat diurutkan.
Ciri : - dapat dibedakan
- ada tingkatan
- belum ada jarak/ besar beda
Contoh : - Status ekonomi : baik, sedang, kurang
- status gizi : baik, kurang, buruk
- tingkat pendidikan : SD, SLTP, SLTA, PT
4
3. Skala Interval
Apabila pengukuran terhadap variabel tersebut dapat membedakan, mengurutkan, serta
melihat besar beda antara nilai variabel. Jadi pada skala interval dapat ditentukan jarak
dari urutan kelompok tersebut.
Ciri : - dapat dibedakan
- ada tingkatan
- ada jarak/ besar beda
- belum ada kelipatan
Contoh: - Suhu badan (0C) (pasien A: 36,0 0C ; pasien B: 37,5 0C, jarak: 1,5 0C)
Pada skala interval tidak dapat dikaitkan kelipatannya secara mutlak. Subyek yang
bersuhu 50 0C tidak dua kali lebih panas daripada subyek yang bersuhu 25 0C. Hal
ini karena tidak ada nilai nol mutlak. Seperti diketahui bahwa 0 0C adalah 32 0
Fahrenheit.
4. Skala Rasio
Apabila pengukuran terhadap variabel tersebut dapat membedakan, mengurutkan,
memperlihatkan besar beda, serta juga dapat memperlihatkan kelipatannya. Jadi disini
terdapat nilai nol mutlak.
Ciri : - dapat dibedakan
- ada tingkatan
- ada jarak/ besar beda
- ada kelipatan
Contoh : - berat badan
- tinggi badan
Pada skala rasio arti kelipatan disini yaitu bila subyek A mempunyai berat badan 60
kg dan subyek B mempunyai berat badan 30 kg maka subyek A berat badannya 2
kali subyek B.
MACAM-MACAM STATISTIKA
1. Statistika Deskriptif
Yaitu metode statistika yang digunakan untuk menggambarkan /menyajikan dan
analisis data yang telah dikumpulkan.
Kegiatan: pengumpulan data – pengolahan data – penyajian data – analisis data
(mean, SD, persentase dll).
2. Statistika Inferensial/analitik/induktif
Yaitu metode statistika yang dapat menggeneralisir nilai-nilai dari sampel yang
sengaja dikumpulkan menjadi nilai populasi.
Atau metode statistika yang digunakan untuk mengetahui (menarik kesimpulan)
tentang sebuah populasi berdasarkan suatu sampel.
Kegiatan: analisis data, yaitu estimasi/uji hipotesis dan penarikan kesimpulan (dengan
menggunakan sampel)
5
DATA
pengumpulan data
pengolahan data
penyajian data
analisis data
generalisasi
6
Populasi dibagi menjadi 2:
1. Populasi target (target population)
2. Populasi terjangkau (accessible population) atau populasi sumber (source population)
POPULASI TARGET
Populasi target populasi yang merupakan sasaran akhir penerapan hasil penelitian
Biasanya dibatasi oleh karakteristik demografis (misalnya usia, jenis kelamin) dan
karakteristik klinis
Contoh populasi target : anak balita, ibu hamil, remaja pengguna narkoba, pasangan
usia subur, lansia, remaja putri
POPULASI TERJANGKAU
Populasi terjangkau adalah populasi target yang dapat dijangkau peneliti
Atau bagian dari populasi target yang dibatasi tempat dan waktu
Dari populasi terjangkau dipilih sampel yang terdiri dari subyek yang akan langsung
diteliti.
SAMPEL bagian dari populasi yang dipilih dengan cara tertentu hingga dianggap dapat
mewakili populasinya.
Contoh yang salah: “Populasi pasien yg diteliti ini terdiri dari 100 anak balita yg
berobat di poliklinik X”
yg dimaksud sampel ?
Kriteria inklusi : adalah karakteristik umum subyek penelitian pada populasi target dan pada
populasi terjangkau.
Kriteria eksklusi : adalah subyek yang memenuhi kriteria inklusi tetapi harus dikeluarkan
dari studi karena pelbagai sebab seperti a.l.:
1. Terdapat keadaan atau penyakit lain yang mengganggu pengukuran atau interpretasi
2. Terdapat keadaan yang mengganggu kemampulaksanaan seperti pasien yang tidak
mempunyai tempat tinggal tetap sulit dihubungi.
3. Hambatan etis
4. Subyek menolak berpartisipasi
7
ALASAN PENGAMBILAN SAMPEL:
CONTOH:
4 (Z + Zβ ) 2 б 2
2n =
б2
Jumlah sampel tiap kelompok 30 orang
Kriteria inklusi :
1. Wanita premenopause umur 40-45tahun dan siklus haidnya tak teratur
2. Status kawin
3. Sehat, berdasarkan pemeriksaan fisik tidak ada benjolan pada payudara dan atau perut
bagian bawah
4. Tidak ada riwayat keganasan pada payudara dan atau rahim baik diri sendiri maupun
keluarga.
5. Tidak ada riwayat gizi buruk yang ditentukan berdasar IMT < 19
6. Tidak ada riwayat penurunan BB yang cepat
7. Tidak menggunakan sediaan estrogen
8. Tidak memakai kosmetik anti menua
9. Bersedia mengikuti penelitian yang akan dilakukan dan sanggup mengikuti jadwal sampai
selesai sesuai dengan ketentuan penelitian. Kesediaan itu diperkuat dengan mengisi dan
menandatangani surat pernyataan tentang kesediaan mengikuti penelitian.
8
Kriteria eksklusi :
1. Sampel menolak diteliti
2. mengalami menorhagi atau metroraghia.
Karyawati RSDK dan RS Roemani Semarang yang memenuhi syarat, diambil dengan
menggunakan teknik pencuplikan sederhana (Simple Random Sampling) dicuplik sebanyak
60 karyawati.
9
Subyek yang benar diteliti
menyangkut apakah subyek yang telah dipilih menolak diteliti (non-response) atau
terdapat drop out atau loss to follow-up
Pada pengambilan sampel dengan non probabilitas, tiap elemen populasi tidak
memiliki probabilitas yang diketahui untuk terpilih sebagai sampel dan faktor subyektif
memegang peranan penting.
Menurut Lemeshow et al (1990), disebutkan bahwa yang dimaksud dengan non
probabilitas sampling adalah pengambilan sampel dimana sampel yang dipilih
berdasarkan suatu rencana pengambilan sampel yang tidak menggunakan probabilitas
dalam proses seleksinya.
Yang termasuk metode pengambilan sampel non random adalah:
a). Purposif sampling
b). Insidental sampling
c). Accidental Sampling / Haphazard Sampling
d). Quota sampling
e). Voluntary sampling
f). Snowball sampling
10
g). Consecutive sampling
i). Convinient sampling
Keuntungan:
- Mudah pelaksanaannya
- Tidak membutuhkan waktu lama
- Tidak membutuhkan biaya besar
Kerugian:
- Probabilitas setiap unit sampel tidak diketahui
- Tidak obyektif
- Tidak dapat mewakili populasi keseluruhan
PROBABILITY SAMPLING
1. Simple random sampling (SRS)
* Suatu metode pengambilan sampel, dimana sampel diacak dari semua unit yang ada di populasi.
* Syarat:
- Harus ada sampling frame
- Karakteristik populasinya cukup homogen
- Populasinya secara geografis tidak terlalu menyebar
* Cara :
- Memakai undian
- Menggunakan tabel bilangan random
- Menggunakan tabel bilangan komputer
* Keuntungan/kelebihan:
- Kurang praktis kalau populasinya besar
- Relatif mudah untuk populasi kecil
11
N = jumlah populasi
n = jumlah sampel
* Contoh:
N = 100, n = 20, N/n = 5
Subyek 1 dipilih secara acak dari 1 s/d 5 (misalnya terpilih no 3)
Subyek berikutnya diambil dengan kelipatan 5 (yaitu 3+5=8, 8+5=13, . . . dst).
Terpilih: 3, 8, 13, . . . dst.
* Keuntungan:
- Relatif mudah untuk populasi kecil
- Menjamin sampel lebih tersebar ke seluruh anggota populasi
- Bisa diaplikasikan pada sampling frame yang belum ada (mis. pengunjung RS)
- Tidak dianjurkan pada kasus dengan fenomena siklik
Contoh: memilih sampel hari dgn k= 7, sampel akan jatuh pada hari yang sama.
12
* Cara:
- Populasi dinagi berdasarkan kelompoik (cluster) mis. Kelurahan/desa
- Klaster dipilih secara acak dan sampel dalam klater diambil secara acak atau diambil
seluruhnya.
* Contoh: Survey mengetahui cakupan pemeriksaan kehamilan di Kab X
* Subyek: Ibu yang telah melahirkan dalam 1 tahun terakhir
* Cara sampling:
- Buat daftar nama desa/klaster di Kab X
- Pilih secara acak klaster missal satu desa terpilih yaitu desa Tugu
- Di desa Tugu semua ibu yang telah melahirkan dalam 1 tahun terakhir diwawancarai.
* Keuntungan/kelemahan:
- Tidak diperlukan sampling frame unit elementer seluruh populasi.
- Varian (SE) lebih besar dari metode SRS
2. Convinient sampling
* Cara ini merupakan cara termudah untuk menarik sampel, namun sekaligus juga merupakan cara
yang lemah. Pada teknik ini sampel diambil tanpa sistematika tertentu, hingga jarang dapat
dianggap dapat mewakili populasi terjangkau apalagi populasi target.
13
4. Insidental sampling
* Sampel dipilih pada saat tertentu (insidental)
* Sampel tersebut tidak terencana dan penggambaran hasil dari pengumpulan data tersebut bukan
didasarkan suatu metode yang baku. Misalnya dari suatu kejadian yaitu terjadinya suatu
keadaan luar biasa , data yang sudah terkumpul disajikan secara deskriptif dan hasil tersebut
tidak dapat digeneralisir.
6. Quota sampling
* Jumlah sampel ditentukan sesuai keinginan peneliti yang tergantung pada biaya, tenaga dan
waktu (tanpa mempertimbangkan homogenitas/heterogenitas, presisi dan rencana analisa.
* Adalah pengambilan sampel tentang sesuatu yang sudah diperinci terlebih dahulu. Yang
diperlukan menurut pertimbangan dan atau mengambil manfaat dari keterangan di dalam kategori
yang sudah diperinci. Jadi pengambilan sampelnya ditentukan si petugas sampai dirasa cukup.
7. Voluntary sampling
* Sampling Sukarela (Voluntary Sampling). Satuan sampling diperoleh secara sukarela, contohnya
dibidang kedokteran untuk uji coba obat baru.
14
- Perencanaan - pengolahan data
- pengumpulan data - analisa data
Kesalahan bukan karena sampling disebabkan oleh hal-hal yang sering non teknis sifatnya
seperti kekurangsadaran responden, kekeliruan pemeriksa, kesalahan mencatat, kelupaan
karena kelelahan, kecerobohan, kekurangpahaman terhadap konsep dan definisi, salah
mengukur, salah menghitung dan sebagainya. Sedangkan menurut Sabri L dan Hastono S,
1999, kesalahan non sampling maksudnya ialah kesalahan yang bukan karena sampel
tetapi disebabkan pelaksanaan dalam pengambilan sampel sampai analisisnya..
Sampel yang ideal :
- Validitas
Apakah sampel yang diambil benar-benar mengukur apa yang ingin diukur?
Contoh: rata-rata tunggu pasien yang berobat di poliklinik
Pengamatan pada pasien datang pagi hari pada 5 hari pertama bulan Januari tidak valid. Sore
hari? Pertengahan? Atau Akhir bulan?
Validitas berkaitan dengan cara pengambilan sampel (metode sampling)
- Presisi
Seberapa tepat ukuran yang diperoleh dari sampel dapat menggambarkan populasi
Presisi berkaitan dengan besar sampel.
Jika jumlah sampel (n) diperbesar maka SE (standar error) akan makin kecil,
sehingga sampling errornya akan makin kecil atau presisi makin makin meningkat.
BESAR SAMPEL
Perlu diperhatikan :
• Tujuan penelitian/analisis
• Jenis dan rancangan penelitian
• Jumlah populasi
• Karakteristik populasi/cara pengambilan sampel (teknik sampling)
• Jenis (skala pengukuran) data
15
4. Derajat kepercayaan tingkat signifikansi () 1% atau 5%
5. Metode sampling: SRS atau bukan SRS
6. Kekuatan uji. (1 - )
(Lemeshow, S, et al, 1997)
Tolak Ho 1
Kesalahan tipe I Kekuatan uji
Z Z/2
0,10 1,28 1,64
0,05 1,64 1,96
0,025 1,96 2,24
0,01 2,33 2,58
Power (1- ) Z
> 0,50 < 0,50 < 0,00
0,50 0,50 0,00
0,40 0,60 0,25
0,30 0,70 0,53
0,20 0,80 0,84
0,15 0,85 1,03
0,10 0,90 1,28
0,05 0,95 1,64
0,025 0,975 1,96
0,01 0,99 2,33
1. Pada data proporsi, besar sampel pada populasi yang tidak diketahui
jumlah anggota populasinya
* Sebelum menghitung besar sampel peneliti perlu tahu:
Perkiraan proporsi ( p ), presisi ( d ) , dan derajat kemaknaan ( )
16
* Rumus:
Z 2 /2 * p ( 1- p )
n = (1)
d2
dimana : n : besar sampel
Z /2 : nilai Z pada derajat kepercayaan 1-/2
p : proporsi hal yang diteliti
d : presisi
Contoh:
Seorang Kepala Dinas Kesehatan Semarang ingin mengetahui prevalensi anemia pada ibu
hamil. Berdasarkan informasi pada survei gizi ibu hamil di Jawa Tengah diperoleh
prevalensi anemia pada kehamilan sebesar 65%. Berdasarkan masalah dan informasi yang
ada, berapa jumlah sampel yang dibutuhkan jika Kepala Dinas menginginkan presisi mutlak
sebesar 10% dan derajat kepercayaan 90%?
Jawaban :
Dengan menggunakan rumus ( 1 ) dan nilai p=0,65 ; d= 0,10 ; dan Z = 1,64
17
Contoh 2 :
Diketahui : Jumlah penduduk lansia di kota Depok (N) = 4000 jiwa
Proporsi hipertensi pada lansia (P) = 40% = 0,4
a). Jika : Tingkat kepercayaan 95% (Z) = 1,96
Kisaran perkiraan hipertensi 30%-50% sehingga
presisi mutlak (d) = 10%=0,1
Pengambilan sampel secara acak sederhana
18
3. Pada data rata-rata, besar sampel pada populasi yang tidak diketahui
jumlah anggota populasinya
* Untuk menghitung besar sampel peneliti perlu tahu:
Perkiraan varians ( ) , presisi ( d ) dan derajat kemaknaan ( )
* Rumus:
Z 2 /2 * 2
n = (3)
2
d
dimana : n : besar sampel
Z /2 : nilai Z pada derajat kepercayaan 1-/2
: standar deviasi
d : presisi
Contoh :
Suatu penelitian dilakukan untuk mengetahui rata-rata asupan energi pada anak balita di
Desa Sakura. Ingin dipilih sampel secara acak sederhana. Dari penelitian pendahuluan
diperoleh standar deviasi asupan energi pada anak balita adalah 15 Kalori. Berapa besar
sampel yang diperlukan jika peneliti menginginkan derajat kepercayaan 95% dan besar
simpangan maksimum dari rata-rata adalah 5 Kalori (presisi mutlak).
Jawaban:
Diketahui : Z 1-/2 : 1,96 ; : 15 ; d : 0,05 maka
1,96 2 * 15 2
n = = 34,57
52
Jadi besar sampel yang diperlukan adalah 35 anak balita.
19
Z 2/2 * 2 2
n = (5)
2
d
Contoh :
Seorang peneliti ingin membandingkan efek penurunan gula darah antara obat anti diabetes
A dan B. Pada penelitian pendahuluan , diketahui dalam 3 minggu pengobatan , obat A rata-
rata menurunkan kadar gula darah sebesar 40 mg/dl dengan standar deviasi 20 mg/dl.
Sedangkan obat B rata-rata menurunkan kadar gula darah sebesar 30 mg/dl dengan standar
deviasi 15 mg/dl. Pada penelitian awal tersebut, peneliti hanya menggunakan 5 pasien pada
masing-masing kelompok. Berapa besar sampel yang diperlukan jika peneliti ingin
menunjukkan ada perbedaan rata-rata penurunan kadar gula darah antara pasien yang
memperoleh obat A dan B dengan simpangan maksimum 5 mg/dl dari perbedaan yang ada
dan peneliti menginginkan derajat kepercayaan 95% ?
Jawaban :
Diketahui : n1 = 5 , n2 = 5, s1= 20, s2= 15, d = 5 , Z= 1,96
sehingga varians gabungan dapat dihitung :
1,96 2 * 2 * 312,5
n = = 96,04
52
Jadi diperlukan 97 pasien untuk masing-masing kelompok pengobatan.
20
Dimana : : konstanta yaitu 3,1416
e : bilangan logaritma natural yaitu 2,7183
: rata-rata hitung distribusi
: simpangan baku distribusi
x= Me = Mo
Kurva simetris
Mo Me x x Me Mo
Kurva normal
f (x)
1 1 < 2 < 3
1 = 2 = 3
2
3
Dengan demikian jika dan diketahui, maka akan diperoleh bentuk distribusi normal, yang
mana dapat dihitung probabilitas nilai-nilai x dengan memakai rumus fungsi distribusi
normal.
f (x)
x1 x2 sumbu x
Untuk mendapatkan probabilitas setiap nilai Z pada kurva normal standard telah disusun
sebuah daftar yang disebut “tabel distribusi normal standar”. Berdasarkan tabel inilah
probabilitas setiap nilai x pada distribusi normal umum dapat dihitung, melalui suatu
transformasi.
22
Dari hubungan distribusi normal umum dan normal standard dapat diperoleh suatu rumus
transformasi dari nilai x (distribusi normal umum) ke nilai Z (distribusi normal standard).
Transformasinya:
x -
Z =
f (z) =0
=1
-3 -2 -1 0 1 2 3 z
UJI KENORMALAN
Ho : F (x) = Fo (x)
F (x) adalah fungsi distribusi populasi yang diwakili oleh sampel
Fo (x) adalah fungsi distribusi suatu populasi berdistribusi normal
Atau
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
NORMAL
23
Ha : F (x) Fo (x) (uji two tail)
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
TIDAK NORMAL
Kesimpulan :
Jika p-value > 0,05 Ho diterima/gagal ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi normal
umur ibu
Cumulative
Frequency Percent Valid Percent Percent
Valid 22 2 10.0 10.0 10.0
25 3 15.0 15.0 25.0
27 1 5.0 5.0 30.0
31 4 20.0 20.0 50.0
32 1 5.0 5.0 55.0
33 1 5.0 5.0 60.0
34 2 10.0 10.0 70.0
36 1 5.0 5.0 75.0
39 1 5.0 5.0 80.0
40 2 10.0 10.0 90.0
43 1 5.0 5.0 95.0
47 1 5.0 5.0 100.0
Total 20 100.0 100.0
umur ibu
6
2
Frequency
umur ibu
24
Gambar diatas memperlihatkan histogram umur ibu dan garis / kurva normal dari
variabel umur ibu. Terlihat bahwa batang histogram mempunyai kemiripan bentuk
dengan kurva normal (berbentuk seperti lonceng). Hal ini membuktikan bahwa
distribusi tersebut sudah dapat dikatakan normal atau mendekati normal. Namun
pengujian normalitas lebih jelas pada explore data.
Output ini memberikan informasi ringkasan statistik deskripsi dari data umur ibu
95% CI : 29,11 – 35,66 (artinya pada tingkat kepercayaan 95% rata-rata umur ibu pada
populasi antara 29,11 – 35,66 ).
Median atau tititk tengah data jika semua data diurutkan dan dibagi dua sama besar.
Angka median umur ibu adalah 31.5 tahun menunjukkan bahwa 50% pengetahuan gizi
ibu adalah 31,5 tahun keatas dan 50% nya adalah 31,5 tahun ke bawah.
Nilai Minimum adalah 22 tahun dan maximum adalah 47 tahun. Umur ibu terendah
adalah 22 tahun dan umur paling tua adalah 47 tahun.
25
Range adalah data maksimum – data minimum atau dalam kasus ini :
47 – 22 = 25
Rasio skewness adalah = nilai skewness/ standard error of skewness
= 0,328 / 0,512 = 0,640
Oleh karena kedua hasil terletak antara – 2 sampai dengan + 2, maka dapat dikatakan
distribusi data umur ibu adalah normal atau mendekati normal.
Pada uji Kolmogorov Smirnov , nilai sig atau p-value = 0,200. Karena > 0,05 maka dapat
dikatakan bahwa distribusi data umur ibu adalah normal.
Pada uji Saphiro-Wilk, nilai sig atau p-value = 0,542. Karena > 0,05 maka dapat dikatakan
bahwa distribusi data umur ibu adalah normal.
Output histogram
Histogram
6
2
Frequency
0 N = 20,00
20,0 25,0 30,0 35,0 40,0 45,0
umur ibu
26
Output stem and leaf
2,00 2. 22
4,00 2. 5557
8,00 3. 11112344
2,00 3. 69
3,00 4. 003
1,00 4. 7
Stem width: 10
Each leaf: 1 case(s)
Interpretasi :
Pada baris 1 : Ada 2 data umur ibu (frequency = 2) yang mempunyai stem = 2 dan leaf =
22, yang berarti terdapat 2 orang ibu yang mempunyai umur 22 dan 22 tahun.
Pada baris 2 : Ada 4 data umur ibu (frequency = 4) yang mempunyai stem = 2 dan leaf =
5,5,5,7 yang berarti terdapat 4 orang ibu yang mempunyai umur 25, 25, 25, 27
Dan seterusnya sampai pada baris ke 6 , yaitu ada 1 orang ibu yang mempunyai umur 47
tahun.
1,5
1,0
,5
0,0
Expected Normal
-,5
-1,0
-1,5
20 30 40 50
Observed Value
Pada gambar Q-Q plot untuk variabel umur terlihat ada garis lurus dari kiri ke kanan atas.
Garis itu berasal dari nilai Z skore. Jika suatu distribusi data normal, maka data akan
tersebar di sekeliling garis. Oleh karena itu dapat dikatakan bahwa distribusi data adalah
normal.
27
Output untuk menguji normalitas dengan Plot (Detrended NormalQ-Q plot)
,4
,3
,2
,1
-,0
Dev from Normal
-,1
-,2
-,3
20 30 40 50
Observed Value
Output ini untuk mendeteksi pola-pola dari titik-titik yang bukan bagian dari kurva
normal. Terlihat bahwa sebagian data terpola di sekitar garis. Hal ini membuktikan
bahwa distribusi data adalah normal.
Output boxplot
Boxplot adalah kotak pada gambar berwarna merah atau warna lain dengan garis tebal
horizontal di kotak tersebut. Kotak merah tersebut memuat 50% data. Sedangkan garis
tebal hitam median data. Jika garis hitam terletak persis di tengah boxplot, maka
distribusi data adalah normal. Jika berada di sebelah atas, distribusi menceng ke kiri
dan jika di sebelah bawah, distribusi menceng ke kanan.
50
40
30
20
N= 20
umur ibu
Dari output diatas terlihat garis median berada ditengah. Hal ini menunjukkan distribusi
data normal.
28
Daftar Pustaka
29