Anda di halaman 1dari 29

Kuliah 1,2

Dr. Ir. Rahayu Astuti, M.Kes

KONSEP DASAR STATISTIKA

A. PENGERTIAN STATISTIKA

Dalam arti luas, statistika dapat diartikan sekumpulan konsep dan metode yang digunakan
untuk melakukan pengumpulan data, pengolahan, analisis dan menginterpretasikan data
tentang bidang kegiatan tertentu serta mengambil kesimpulannya.
 sehingga disebut juga metode statistik

B. KEGIATAN:

Kegiatan statistik meliputi: pengumpulan, pengolahan, penyajian, analisis dan penyimpulan


data. Di bawah ini disajikan bagan untuk melihat 4 tahap kegiatan statistika dalam suatu
proses penelitian.

Gambar 1
Kegiatan dalam setiap tahap kegiatan statistik

Pengolahan data Penyajian data


Manual Elektronik Tulisan Tabel Grafik

Pengumpulan data Analisa data


Primer Sekunder Tersier Deskriptif Analitik

Tersier
Kesimpulan
Spesifik Umum

C. PERANAN DALAM PENELITIAN

Peranan statistika dalam penelitian tentunya sesuai dengan pengertian statistika yaitu
suatu metode yang digunakan untuk mengumpulkan data, mengolah, menganalisis serta
menyajikan data dan pengambilan keputusan. Dengan demikian peranan dalam penelitian
juga dalam pengumpulan data, pengolahan dan analisis data. Juga untuk menguji validitas
dan reliabilitas instrument.

1
Secara skematis dapat dilihat pada bagan berikut :

Teori/ Fakta
konsep
Masalah

Tinjauan Pustaka
- Identifikasi variabel
- Kerangka Teori
- Kerangka Konsep

Hipotesis
Generalisasi

Verifikasi
- Disain
- Sampel
- Instrumen
- Pengumpulan data
- Pengolahan data Peranan statistika
- Analisis data

Kesimpulan

Bagan 1. Bagan alur penelitian dan peranan statistika

DATA, VARIABEL
DAN SKALA PENGUKURAN

A. PENGERTIAN DATA
Data berasal dari kata Latin yaitu “datum”. Bentuk jamak dari kata datum adalah
“data”. Jadi dalam menyatakan data kita sebetulnya sudah berkata bentuk jamaknya, sehingga
untuk selanjutnya tidak perlu menyatakan data-data, sudah cukup menyatakan “data” saja.
Data adalah suatu himpunan/kumpulan angka yang berasal dari hasil pengukuran individu
atau hasil penelitian.

B. MACAM DATA
Ditinjau dari jenis data maka terdapat bermacam-macam data antara lain:

2
*Berdasarkan bentuk datanya:
a). Data kualitatif: yaitu data dalam bentuk kualitas atau berhubungan
dengan mutu. Atau data hasil dari penggolongan/pengklasifikasian (katagorik).
Contoh: - pernyataan terhadap KB: setuju, kurang setuju, tidak setuju.
- pendidikan: tinggi, menengah, rendah
- status gizi: baik, kurang, buruk
b). Data kuantitatif: yaitu data dalam bentuk bilangan/angka (numerik)
Contoh: - jumlah anak balita: 25 anak.
- tinggi badan 167,2 cm
- kadar hemoglobin 12,0 gr/dl

Pada data kuantitatif, dikelompokkan menjadi:


a). Data diskrit: yaitu data yang berbentuk bilangan bulat (diperoleh dengan cara
menghitung)
Contoh: - jumlah tempat tidur di RS 100 buah
- jumlah akseptor KB 30 orang
- jumlah mahasiswa keperawatan di kelas ini 40 orang
b). Data kontinyu: yaitu data yang dapat merupakan rangkaian data, dan nilainya dapat
dalam bentuk desimal (diperoleh dengan cara mengukur).
Contoh: - tinggi badan mahasiswa 155,3 cm
- berat badan 60,8 kg
- suhu tubuh 36,8 oC

*Berdasarkan sumber data yaitu:


a). Data primer: yaitu data yang dikumpulkan oleh peneliti sendiri atau
data yang diperoleh langsung dari subyek penelitian
b). Data sekunder: yaitu data yang diambil dari suatu sumbe, misalnya Puskesmas,
Rumah Sakit, Kelurahan dll.
c). Data tersier: yaitu data yang diperoleh dari hasil penelitian atau laporan-laporan yang
berupa kesimpulan-kesimpulan.

C. VARIABEL
Variabel adalah suatu sifat yang akan diukur atau diamati yang nilainya bervariasi
antara satu obyek dengan obyek lainnya atau dengan kata lain variabel adalah suatu
sifat/karakteristik yang mempunyai variasi nilai.

D. Macam variabel:
1. a). Variabel katagorik/ kualitatif: variabel hasil dari penggolongan
atau pengklasifikasian.
Contoh: - jenis kelamin (laki-laki, perempuan)
- tingkat pendidikan (SD,SLTP, SLTA, PT)
- status perkawinan (kawin, belum kawin, janda/duda)
b). Variabel numerik/kuantitatif: variabel hasil penghitungan/pengukuran dan
berbentuk bilangan/angka (numerik)
Contoh: - jumlah bayi lahir
- tinggi badan

3
2. a). Variabel diskrit: yaitu variabel yang nilainya dinyatakan dalam bentuk
bilangan bulat dan hasil dari penghitungan
Contoh: - jumlah anak balita dalam keluarga
- jumlah anggota keluarga
- jumlah pasien di kelas VIP
b). Variabel kontinyu: yaitu variabel yang nilainya bisa dalam bentuk desimal,
dan hasil dari pengukuran.
Contoh: - tekanan darah
- suhu tubuh
- kadar hemoglobin

3. a). Variabel dependent/ var. terikat/ akibat/ respon


Yaitu variabel yang tergantung/ terpengaruh oleh variabel lain

b). Variabel independent/ var. bebas/ sebab/ sebab


Yaitu variabel yang mempengaruhi/ menjadi sebab dari variabel lain

variabel x variabel y
(variabel independent) (variabel dependent)

E. SKALA PENGUKURAN
Dalam mengumpulkan nilai dari variabel perlu juga diketahui skala pengukuran dari
variabel tersebut. Skala ada 4 macam yaitu skala nominal, ordinal, interval dan rasio.

1. Skala Nominal
Merupakan skala pengukuran yang paling lemah tingkatannya. Terjadi bila pengukuran
terhadap variabel tersebut hanya dapat membedakan satu pengamatan dengan pengamatan
yang lain. Setiap obyek akan masuk kedalam salah satu kelompok/ kategori.Tidak
mungkin ada tumpang tindih (over lapping). Nomor yang diberikan kepada obyek tidak
mempunyai besaran, jadi hanya sekedar label.
Ciri : - isinya dapat dibedakan
- nilainya sederajat (antara kategori tidak dapat diketahui tingkat
perbedaannya.
Contoh : - jenis kelamin (laki-laki ; perempuan)
- agama (Islam, Kristen dll)
- suku bangsa (Jawa, Sunda, Betawi, dll)

2. Skala Ordinal
Apabila pengukuran terhadap variabel tersebut dapat membedakan serta mengurutkan
(order = urutan = ranking). Antara kategori dapat diketahui tingkat perbedaannya. Jadi dari
kelompok yang sudah ditentukan dapat diurutkan menurut besar kecilnya. Nomor yang
diberikan kepada obyek mempunyai besaran, yang dapat diurutkan.
Ciri : - dapat dibedakan
- ada tingkatan
- belum ada jarak/ besar beda
Contoh : - Status ekonomi : baik, sedang, kurang
- status gizi : baik, kurang, buruk
- tingkat pendidikan : SD, SLTP, SLTA, PT

4
3. Skala Interval
Apabila pengukuran terhadap variabel tersebut dapat membedakan, mengurutkan, serta
melihat besar beda antara nilai variabel. Jadi pada skala interval dapat ditentukan jarak
dari urutan kelompok tersebut.
Ciri : - dapat dibedakan
- ada tingkatan
- ada jarak/ besar beda
- belum ada kelipatan
Contoh: - Suhu badan (0C) (pasien A: 36,0 0C ; pasien B: 37,5 0C, jarak: 1,5 0C)
Pada skala interval tidak dapat dikaitkan kelipatannya secara mutlak. Subyek yang
bersuhu 50 0C tidak dua kali lebih panas daripada subyek yang bersuhu 25 0C. Hal
ini karena tidak ada nilai nol mutlak. Seperti diketahui bahwa 0 0C adalah 32 0
Fahrenheit.

4. Skala Rasio
Apabila pengukuran terhadap variabel tersebut dapat membedakan, mengurutkan,
memperlihatkan besar beda, serta juga dapat memperlihatkan kelipatannya. Jadi disini
terdapat nilai nol mutlak.
Ciri : - dapat dibedakan
- ada tingkatan
- ada jarak/ besar beda
- ada kelipatan
Contoh : - berat badan
- tinggi badan
Pada skala rasio arti kelipatan disini yaitu bila subyek A mempunyai berat badan 60
kg dan subyek B mempunyai berat badan 30 kg maka subyek A berat badannya 2
kali subyek B.

MACAM-MACAM STATISTIKA
1. Statistika Deskriptif
Yaitu metode statistika yang digunakan untuk menggambarkan /menyajikan dan
analisis data yang telah dikumpulkan.
Kegiatan: pengumpulan data – pengolahan data – penyajian data – analisis data
(mean, SD, persentase dll).
2. Statistika Inferensial/analitik/induktif
Yaitu metode statistika yang dapat menggeneralisir nilai-nilai dari sampel yang
sengaja dikumpulkan menjadi nilai populasi.
Atau metode statistika yang digunakan untuk mengetahui (menarik kesimpulan)
tentang sebuah populasi berdasarkan suatu sampel.
Kegiatan: analisis data, yaitu estimasi/uji hipotesis dan penarikan kesimpulan (dengan
menggunakan sampel)

Statistik deskriptif  kegiatannya hanya menggambarkan/mendeskripsikan data tanpa


melakukan generalisasi pada populasi

Statistik inferensial  kegiatannya sudah melakukan generalisasi pada populasi

5
DATA

pengumpulan data

pengolahan data

penyajian data

analisis data

pada populasi pada sampel

generalisasi

uji hipotesa estimasi

uji parametrik uji non parametrik

POPULASI, SAMPEL ,TEKNIK SAMPLING


DAN BESAR SAMPEL
PENGERTIAN
Populasi adalah: keseluruhan dari unit di dalam pengamatan yang akan kita lakukan
Atau Kumpulan individu dimana hasil suatu penelitian akan dilakukan generalisasi.
Unit elementer atau elemen populasi adalah anggota populasi dimana pengukuran
dilakukan.
Sampel adalah: sebagian dari populasi yang nilai/ karakteristiknya akan diukur dan yang
nantinya dipakai untuk menduga karakteristik dari populasi.
Sensus adalah pengumpulan data menggunakan seluruh anggota yang ada di dalam
populasi.
Contoh :
Jika kita ingin melakukan survey anemi pada ibu hamil di Kota Semarang, maka populasinya
adalah keseluruhan ibu hamil yang ada di Kota Semarang. Tiap ibu hamil yang ada di Kota
Semarang adalah unit elementer. Kita tidak mungkin mungukur Hb seluruh ibu hamil
tersebut, untuk itu diambil sebagian dari ibu hamil (sampel) yang representatif yaitu yang
mewakili seluruh ibu hamil yang ada di kota Semarang. Kadar Hb dari ibu hamil yang
terambil sebagai sampel tersebut yang diukur. Hasilnya dapat dipakai untuk menduga
prevalensi anemi ibu hamil di Kota Semarang.

Populasi  sejumlah besar subyek yang mempunyai karakteristik tertentu


Subyek  manusia, hewan coba, data lab dan lainnya
Karakteristik subyek  sesuai dengan ranah dan tujuan penelitian

6
Populasi dibagi menjadi 2:
1. Populasi target (target population)
2. Populasi terjangkau (accessible population) atau populasi sumber (source population)

POPULASI TARGET
 Populasi target populasi yang merupakan sasaran akhir penerapan hasil penelitian
 Biasanya dibatasi oleh karakteristik demografis (misalnya usia, jenis kelamin) dan
karakteristik klinis
 Contoh populasi target : anak balita, ibu hamil, remaja pengguna narkoba, pasangan
usia subur, lansia, remaja putri

POPULASI TERJANGKAU
 Populasi terjangkau  adalah populasi target yang dapat dijangkau peneliti
 Atau bagian dari populasi target yang dibatasi tempat dan waktu
 Dari populasi terjangkau dipilih sampel yang terdiri dari subyek yang akan langsung
diteliti.

SAMPEL  bagian dari populasi yang dipilih dengan cara tertentu hingga dianggap dapat
mewakili populasinya.
 Contoh yang salah: “Populasi pasien yg diteliti ini terdiri dari 100 anak balita yg
berobat di poliklinik X”
  yg dimaksud sampel ?

Subyek terpilih atau sampel yang dikehendaki


 Subyek terpilih (eligible subjects) atau sampel yang dikehendaki (intended sample) 
merupakan bagian dari populasi terjangkau yang direncanakan untuk diteliti langsung
  yaitu mereka yang memenuhi kriteria pemilihan, yaitu kriteria inklusi dan eksklusi
dan terpilih sebagai subyek yang akan diteliti.

Subyek yang benar diteliti


 Subyek yang benar diteliti adalah subyek yang benar mengikuti penelitian sampai
selesai, kelompok ini merupakan bagian dari subyek terpilih dikurangi drop out, loss
to follow-up, dan lainnya.
 Merupakan sampel yang dianalisis

Kriteria inklusi dan eksklusi


Untuk mendapatkan sampel yang memenuhi syarat penelitian maka perlu ditetapkan kriteria
inklusi dan eksklusi sampel

Kriteria inklusi : adalah karakteristik umum subyek penelitian pada populasi target dan pada
populasi terjangkau.

Kriteria eksklusi : adalah subyek yang memenuhi kriteria inklusi tetapi harus dikeluarkan
dari studi karena pelbagai sebab seperti a.l.:
1. Terdapat keadaan atau penyakit lain yang mengganggu pengukuran atau interpretasi
2. Terdapat keadaan yang mengganggu kemampulaksanaan seperti pasien yang tidak
mempunyai tempat tinggal tetap sulit dihubungi.
3. Hambatan etis
4. Subyek menolak berpartisipasi

7
ALASAN PENGAMBILAN SAMPEL:

1. Populasi yang sangat besar (infinite population)


Pada populasi yang sangat besar dan tidak terbatas tidak mungkin seluruh populasi
diteliti karena akan memakan waktu yang lama.
2. Homogenitas
Pada populasi yang homogen tidak perlu semua unit populasi diperiksa/diteliti karena akan
membuang waktu serta tidak ada gunanya karena variabel yang akan diteliti telah terwakili
oleh sebagian saja dari populasi tersebut.
3. Menghemat waktu, biaya dan tenaga
Meneliti sebagian populasi tentu akan menghemat biaya, waktu dan tenaga daripada
meneliti seluruh populasi.
4. Ketelitian/ketepatan pengukuran
Meneliti sampel yang sedikit tentu akan lebih teliti dibandingkan dengan meneliti jumlah
yang banyak (populasi).
5. Percobaan yang bersifat destruktif (merusak)

CONTOH:

Judul : “ PENGARUH ISOFLAVON KEDELAI TERHADAP PENUAAN KULIT PADA


WANITA PREMENOPAUSE”

 Populasi target : Wanita Premenopause


 Populasi terjangkau : Wanita Premenopause yang bekerja sebagai karyawati RSD
Karyadi dan RS Roemani Semarang yang bersedia ikut dalam penelitian.
 Sampel penelitian : Karyawati RSDK dan RS Roemani Semarang sesuai kriteria
sampel.
 Besar sampel :

4 (Z + Zβ ) 2 б 2
2n =
б2
Jumlah sampel tiap kelompok 30 orang

 Kriteria inklusi :
1. Wanita premenopause umur 40-45tahun dan siklus haidnya tak teratur
2. Status kawin
3. Sehat, berdasarkan pemeriksaan fisik tidak ada benjolan pada payudara dan atau perut
bagian bawah
4. Tidak ada riwayat keganasan pada payudara dan atau rahim baik diri sendiri maupun
keluarga.
5. Tidak ada riwayat gizi buruk yang ditentukan berdasar IMT < 19
6. Tidak ada riwayat penurunan BB yang cepat
7. Tidak menggunakan sediaan estrogen
8. Tidak memakai kosmetik anti menua
9. Bersedia mengikuti penelitian yang akan dilakukan dan sanggup mengikuti jadwal sampai
selesai sesuai dengan ketentuan penelitian. Kesediaan itu diperkuat dengan mengisi dan
menandatangani surat pernyataan tentang kesediaan mengikuti penelitian.

8
 Kriteria eksklusi :
1. Sampel menolak diteliti
2. mengalami menorhagi atau metroraghia.

Karyawati RSDK dan RS Roemani Semarang yang memenuhi syarat, diambil dengan
menggunakan teknik pencuplikan sederhana (Simple Random Sampling) dicuplik sebanyak
60 karyawati.

Pemilihan populasi terjangkau


 Pemilihan populasi terjangkau  semata-mata didasarkan pada kenyataan praktis atau
faktual.
 Contoh : studi tentang pemberian ASI di daerah pedesaan
Populasi target ibu laktasi
Populasi terjangkau ibu laktasi di Desa Margerejo
 pemilihan ibu laktasi di Desa Margorejo didasarkan pada kenyataan bahwa
pemberian ASI eksklusif rendah di daerah tersebut dan mudah menghubungi desa
tersebut.
Jadi bukan karena ibu laktasi di desa Margorejo representatif untuk seluruh ibu di
pedesaan
 Demikian juga pemilihan pasien stroke yang dirawat di RSCM semata-mata
didasarkan atas alasan praktis, bukan karena pasien stroke di RSCM mewakili pasien
stoke pada umumnya.

Penetapan subyek terpilih


 Proses ini dapat dan harus dilakukan dengan prosedur tertentu, sehingga dapat
diperoleh sampel yang representatif terhadap populasi terjangkau

9
Subyek yang benar diteliti
 menyangkut apakah subyek yang telah dipilih menolak diteliti (non-response) atau
terdapat drop out atau loss to follow-up

METODE SAMPLING/TEKNIK SAMPLING


Metode sampling adalah suatu cara/teknik yang dipergunakan untuk mengambil sejumlah
sampel dari suatu populasi.
Dua jenis Metode Sampling:
1. Pengambilan sampel dg probabilitas (probability sampling atau random sampling)
Pada pengambilan sampel dengan probabilitas, tiap elemen dalam populasi untuk
terpilih sebagai sampel, probabilitas diketahui.
Yang termasuk metode pengambilan sampel acak adalah:
a). Pengambilan sampel acak sederhana (simple random sampling)
b). Pengambilan sampel acak sistematik (systematic random sampling)
c). Pengambilan sampel acak stratifikasi (stratified random sampling)
d). Pengambilan sampel acak kelompok (cluster random sampling)
e). Pengambilan sampel acak bertahap (multistage random sampling)
Keuntungan:
- Probabilitas setiap unit sampel diketahui
- Lebih obyektif
- Dapat mewakili populasi
Kelemahan:
- Sulit dalam pelaksanaan
- Membutuhkan biaya, waktu dan tenaga relatif lebih besar dibanding non probability
sampling
- Dapat terjadi penyimpangan jika sampel kecil
- Memerlukan kerangka sampel (sampling frame)
Yaitu daftar dari semua unsur dalam populasi, misalnya: Daftar kunjungan pasien RS,
Daftar mahasiswa, Daftar balita di wilayah X, Daftar ibu hamil di propinsi Y.

2. Pengambilan sampel tanpa probabilitas


(non probability sampling atau non random sampling)

Pada pengambilan sampel dengan non probabilitas, tiap elemen populasi tidak
memiliki probabilitas yang diketahui untuk terpilih sebagai sampel dan faktor subyektif
memegang peranan penting.
Menurut Lemeshow et al (1990), disebutkan bahwa yang dimaksud dengan non
probabilitas sampling adalah pengambilan sampel dimana sampel yang dipilih
berdasarkan suatu rencana pengambilan sampel yang tidak menggunakan probabilitas
dalam proses seleksinya.
Yang termasuk metode pengambilan sampel non random adalah:
a). Purposif sampling
b). Insidental sampling
c). Accidental Sampling / Haphazard Sampling
d). Quota sampling
e). Voluntary sampling
f). Snowball sampling

10
g). Consecutive sampling
i). Convinient sampling

Keuntungan:
- Mudah pelaksanaannya
- Tidak membutuhkan waktu lama
- Tidak membutuhkan biaya besar
Kerugian:
- Probabilitas setiap unit sampel tidak diketahui
- Tidak obyektif
- Tidak dapat mewakili populasi keseluruhan

Jika digunakan “probability sampling” maka sampel diharapkan akan mewakili


populasi, serta keuntungan lainnya yaitu :
a). Derajat kepercayaan terhadap sampel dapat ditentukan.
b). Beda penaksiran parameter dengan statistik terhadap parameter yang
sesungguh nya dapat diperkirakan (presisi).
c). Besar sampel yang akan diambil dapat dihitung secara statistik.
d) Dapat dilakukan uji statistik
e) Dapat dilakukan generalisasi populasi.

Sedangkan jika pengambilan sampelnya menggunakan “ non probability sampling”


maka sampel yang diambil tidak mewakili populasi sehingga besar sampel tidak
bisa dihitung secara statistik, dan tidak dapat digunakan untuk generalisasi populasi.

PROBABILITY SAMPLING
1. Simple random sampling (SRS)
* Suatu metode pengambilan sampel, dimana sampel diacak dari semua unit yang ada di populasi.
* Syarat:
- Harus ada sampling frame
- Karakteristik populasinya cukup homogen
- Populasinya secara geografis tidak terlalu menyebar
* Cara :
- Memakai undian
- Menggunakan tabel bilangan random
- Menggunakan tabel bilangan komputer

* Keuntungan/kelebihan:
- Kurang praktis kalau populasinya besar
- Relatif mudah untuk populasi kecil

2. Systematic random sampling


* Suatu metode pengambilan sampel, yang mana sampel dipilih secara acak hanyauntuk obyek
yang pertama, sedangkan obyek berikutnya ditentukan secara kelipatan.
* Syarat:
- Harus ada sampling frame
- Karakteristik populasinya cukup homogen
- Populasinya secara geografis tidak terlalu menyebar
* Cara:
Tentukan interval/kelipatan (k) berikut:
k = N/n = interval kelipatan

11
N = jumlah populasi
n = jumlah sampel
* Contoh:
N = 100, n = 20, N/n = 5
Subyek 1 dipilih secara acak dari 1 s/d 5 (misalnya terpilih no 3)
Subyek berikutnya diambil dengan kelipatan 5 (yaitu 3+5=8, 8+5=13, . . . dst).
Terpilih: 3, 8, 13, . . . dst.
* Keuntungan:
- Relatif mudah untuk populasi kecil
- Menjamin sampel lebih tersebar ke seluruh anggota populasi
- Bisa diaplikasikan pada sampling frame yang belum ada (mis. pengunjung RS)
- Tidak dianjurkan pada kasus dengan fenomena siklik
Contoh: memilih sampel hari dgn k= 7, sampel akan jatuh pada hari yang sama.

3. Stratified random sampling


* Unit populasi dikelompokkan berdasarkan tingkatan (strata) tertentu (mis. Status ekonomi tinggi-
rendah) agar populasi terwakili.
* Stratum: bagian dari populasi yang memiliki karakteristik yang sama dan karakteristik ini
diduga berhubungan dengan variabel yang diteliti.
* Syarat:
- Karakteristik populasinya heterogen
- Sampel dalam strata harus sehomogen mungkin
- Dan antar strata harus seheterogen mungkin
* Cara:
- Populasi dibagi berdasarkan strata
- Buat kerangka sampel masing-masing strata
- Sampel dalam strata diambil secara acak (gunakan tabel random atau undian)
- Jumlah sampel diambil proporsional menurut besarnya unit yang ada di dalam masing-masing
strata.

* Contoh: Proportional Stratified Random Sampling


Kualitas pelayanan pasien rawat inap di RS X
- Dibuat strata kelas VIP, kelas I, kelas II dan kelas III
- Jumlah populasi 500 (VIP=50, kelas I=100, kelas II= 150, kelas III=200)
Dimana jumlah sampel yang diambil 100 pasien
- Jumlah sampel per strata :
Kls VIP = 100/500 * 50 = 10
Kls I = 100/500 * 100 = 20
Kls II = 100/500 * 150 = 30
Kls III = 100/500 * 200 = 40
* Keuntungan /kelemahan:
- Semua ciri heterogen terwakili
- Bisa mencari hubungan atau membandingkan antar strata.
- Pada tiap stratum, kerangka sampel harus dibuat

4. Cluster random sampling


* Populasi masyarakat seringkali sudah terbagi menurut kelompok tertentu, seperti RT, RW, desa
* Pembuatan kerangka sampel mungkin dibuat tapi ada keterbatasan waktu dan biaya.
* Kelompok masyarakat dijadikan kluster dalam pengambilan sampel
* Syarat:
- Populasi heterogen dan menyebar
- Sampel dalam klaster harus seheterogen mungkin
- Dan antar klaster harus sehomogen mungkin

12
* Cara:
- Populasi dinagi berdasarkan kelompoik (cluster) mis. Kelurahan/desa
- Klaster dipilih secara acak dan sampel dalam klater diambil secara acak atau diambil
seluruhnya.
* Contoh: Survey mengetahui cakupan pemeriksaan kehamilan di Kab X
* Subyek: Ibu yang telah melahirkan dalam 1 tahun terakhir
* Cara sampling:
- Buat daftar nama desa/klaster di Kab X
- Pilih secara acak klaster  missal satu desa terpilih yaitu desa Tugu
- Di desa Tugu  semua ibu yang telah melahirkan dalam 1 tahun terakhir diwawancarai.
* Keuntungan/kelemahan:
- Tidak diperlukan sampling frame unit elementer seluruh populasi.
- Varian (SE) lebih besar dari metode SRS

5. Multistage Random Sampling


* Populasi yang secara geografis sangat tersebar, pengambilan sampel dapat dilakukan secara
bertahap. Tiap tahap dapat menggunakan metode yang berbeda-beda.
* Multistage sampling adalah teknik pengambilan sampel dengan menggunakan banyak tingkat
dari kelompok unit yang kecil atau klaster. Multistage sampling merupakan perluasan dari cluster
sampling.
* Misalnya survey untuk mengetahui cakupan imunisasi campak pada anak SD di Kab Semarang
maka pengambilan sampel dapat dilakukan:
- Tingkat 1: memilih kecamatan dari jumlah kecamatan yang ada di Kab Semarang
- Tingkat 2: memilih desa dari jumlah desa yang ada di kecamatan terpilih.
- Tingkat 3: memilih SD dari jumlah SD yang ada di desa terpilih
- Tingkat 4: memilih kelas dari jumlah kelas yang ada di SD terpilih sebagai sampel.
Pada kasus tersebut, kelas berfungsi sebagai unit sampel dan murid sebagai unit elementer

NON PROBABILITY SAMPLING


1. Consecutive sampling
* Sampel ditentukan dengan cara semua subyek yang datang dan memenuhi kriteria pemilihan
dimasukkan dalam penelitian sampai jumlah subyek yang diperlukan terpenuhi.
* Tehnik ini merupakan jenis non probability sampling yang dianggap baik, dan sering merupakan
cara termudah.

2. Convinient sampling
* Cara ini merupakan cara termudah untuk menarik sampel, namun sekaligus juga merupakan cara
yang lemah. Pada teknik ini sampel diambil tanpa sistematika tertentu, hingga jarang dapat
dianggap dapat mewakili populasi terjangkau apalagi populasi target.

3. Judgemental sampling atau Purposive sampling


* Sampel ditentukan berdasarkan pertimbangan subyektifnya, bahwa responden dapat
memberikan informasi yang memadai untuk menjawab pertanyaan penelitian. Atau sampel
ditentukan oleh orang yang telah mengenal betul populasi yang akan diteliti (seorang ahli di
bidang yang akan diteliti ).
* Misalnya untuk meneliti pendapat ibu tentang pemberian ASI dan susu formula, dipilih ibu-ibu
yang pernah memberikan ASI dan pernah pula memberikan susu formula kepada bayinya, atau
ibu yang pendidikannya cukup sehingga dapat memberi keterangan yang lebih akurat.

13
4. Insidental sampling
* Sampel dipilih pada saat tertentu (insidental)
* Sampel tersebut tidak terencana dan penggambaran hasil dari pengumpulan data tersebut bukan
didasarkan suatu metode yang baku. Misalnya dari suatu kejadian yaitu terjadinya suatu
keadaan luar biasa , data yang sudah terkumpul disajikan secara deskriptif dan hasil tersebut
tidak dapat digeneralisir.

5. Sampling Seadanya (Accidental Sampling/Haphazard Sampling).


* Pengambilan sampel berdasarkan seadanya data atau kemudahan nya mendapatkan data tanpa
perhitungan apapun mengenai derajat kerepresentatifannya. Sehingga kesimpulan yang ditarik
bersifat kasar dan sementara

6. Quota sampling
* Jumlah sampel ditentukan sesuai keinginan peneliti yang tergantung pada biaya, tenaga dan
waktu (tanpa mempertimbangkan homogenitas/heterogenitas, presisi dan rencana analisa.
* Adalah pengambilan sampel tentang sesuatu yang sudah diperinci terlebih dahulu. Yang
diperlukan menurut pertimbangan dan atau mengambil manfaat dari keterangan di dalam kategori
yang sudah diperinci. Jadi pengambilan sampelnya ditentukan si petugas sampai dirasa cukup.

7. Voluntary sampling
* Sampling Sukarela (Voluntary Sampling). Satuan sampling diperoleh secara sukarela, contohnya
dibidang kedokteran untuk uji coba obat baru.

8. Snowball Sampling (bola salju)


* Adalah pengambilan sampel dengan menetapkan terlebih dahulu kelompok yang akan diambil
sampelnya, kemudian kelompok ini digunakan untuk menempatkan orang lain yang mempunyai
karakteristik yang serupa dan sebaliknya digunakan untuk mengidentifikasi lainnya
Pengambilan sampel bola salju digunakan untuk penelitian yang respondennya sulit diidentifikasi
dan dihubungi.

Penyimpangan (error) dalam penelitian


* Sampling Error:
- Penyimpangan yang terjadi akibat pengambilan sampel
- Sebaik apapun sampel tetap ada penyimpangan
Sampling error adalah perbedaan antara estimasi yang diperoleh dari sampel dengan parameter
populasi. (Lemeshow S,et al, 1993). Sampling error sebenarnya hal ini bukanlah benar-benar
kesalahan tetapi adalah variasi dari konsekuensi pengambilan sampel (Sabri L dan Hastono S,
1999 ).
Jadi sampling error adalah perbedaan antara estimasi yang diperoleh dari sampel
dengan parameter populasi dan sebetulnya adalah variasi dari konsekuensi
pengambilan sampel..
Kesalahan sampling ini bisa dikontrol maksudnya bisa diperkecil, misalnya dengan
jalan menambah jumlah sampel yang akan diteliti.
Sampling error dalam perhitungan jumlah sampel sering digunakan istilah presisi.
Presisi berhubungan erat dengan confidence interval .

* Non Sampling Error:


Penyimpangan yang terjadi bukan karena pengambilan sampel, tetapi penyimpangan pada saat
pelaksanaan penelitian, misalnya saat:

14
- Perencanaan - pengolahan data
- pengumpulan data - analisa data

Kesalahan bukan karena sampling disebabkan oleh hal-hal yang sering non teknis sifatnya
seperti kekurangsadaran responden, kekeliruan pemeriksa, kesalahan mencatat, kelupaan
karena kelelahan, kecerobohan, kekurangpahaman terhadap konsep dan definisi, salah
mengukur, salah menghitung dan sebagainya. Sedangkan menurut Sabri L dan Hastono S,
1999, kesalahan non sampling maksudnya ialah kesalahan yang bukan karena sampel
tetapi disebabkan pelaksanaan dalam pengambilan sampel sampai analisisnya..
Sampel yang ideal :
- Validitas
Apakah sampel yang diambil benar-benar mengukur apa yang ingin diukur?
Contoh: rata-rata tunggu pasien yang berobat di poliklinik
Pengamatan pada pasien datang pagi hari pada 5 hari pertama bulan Januari  tidak valid. Sore
hari? Pertengahan? Atau Akhir bulan?
Validitas berkaitan dengan cara pengambilan sampel (metode sampling)
- Presisi
Seberapa tepat ukuran yang diperoleh dari sampel dapat menggambarkan populasi
Presisi berkaitan dengan besar sampel.
Jika jumlah sampel (n) diperbesar maka SE (standar error) akan makin kecil,
sehingga sampling errornya akan makin kecil atau presisi makin makin meningkat.

BESAR SAMPEL

Besar sampel merupakan


• Syarat penting untuk suatu generalisasi atau inferensi
• Semakin homogen populasi, semakin kecil sampel, semakin heterogen populasi,
semakin besar sampel
• Tujuan penentuan besar sampel :
1. mewakili populasi (representativeness)
2. keperluan analisis

Perlu diperhatikan :
• Tujuan penelitian/analisis
• Jenis dan rancangan penelitian
• Jumlah populasi
• Karakteristik populasi/cara pengambilan sampel (teknik sampling)
• Jenis (skala pengukuran) data

Besar Sampel ditentukan oleh :


1. Tujuan penelitian :
- Estimasi {proporsi atau estimasi rata-rata}
- Uji hipotesis (sig. level;  dan power: 1-)
2. Disain penelitian :
- Observasi : - cross sectional
- case-control
- cohort
- Experiment (clinical trial).
3. Presisi: deviasi nilai estimasi dg nilai populasi sebenarnya atau
perbedaan antara dua nilai populasi

15
4. Derajat kepercayaan  tingkat signifikansi () 1% atau 5%
5. Metode sampling: SRS atau bukan SRS
6. Kekuatan uji. (1 - )
(Lemeshow, S, et al, 1997)

Tabel Probabilitas Terjadinya Kesalahan Dalam Uji Statistik

Kesimpulan Kaadaan sebenarnya di populasi


Uji statistik Ho benar Ho salah
1 
Gagal tolak Ho Kesalahan tipe II

Tolak Ho  1
Kesalahan tipe I Kekuatan uji

Z untuk nilai  tertentu

 Z Z/2
0,10 1,28 1,64
0,05 1,64 1,96
0,025 1,96 2,24
0,01 2,33 2,58

Z untuk nilai  tertentu

 Power (1- ) Z
> 0,50 < 0,50 < 0,00
0,50 0,50 0,00
0,40 0,60 0,25
0,30 0,70 0,53
0,20 0,80 0,84
0,15 0,85 1,03
0,10 0,90 1,28
0,05 0,95 1,64
0,025 0,975 1,96
0,01 0,99 2,33

BESAR SAMPEL UNTUK SURVEY

BESAR SAMPEL UNTUK METODE “SIMPLE RANDOM SAMPLING”


/’SYSTEMATIC RANDOM SAMPLING”/ “CLUSTER RANDOM SAMPLING”

1. Pada data proporsi, besar sampel pada populasi yang tidak diketahui
jumlah anggota populasinya
* Sebelum menghitung besar sampel peneliti perlu tahu:
Perkiraan proporsi ( p ), presisi ( d ) , dan derajat kemaknaan (  )

16
* Rumus:
Z 2 /2 * p ( 1- p )
n =  (1)
d2
dimana : n : besar sampel
Z /2 : nilai Z pada derajat kepercayaan 1-/2
p : proporsi hal yang diteliti
d : presisi
Contoh:
Seorang Kepala Dinas Kesehatan Semarang ingin mengetahui prevalensi anemia pada ibu
hamil. Berdasarkan informasi pada survei gizi ibu hamil di Jawa Tengah diperoleh
prevalensi anemia pada kehamilan sebesar 65%. Berdasarkan masalah dan informasi yang
ada, berapa jumlah sampel yang dibutuhkan jika Kepala Dinas menginginkan presisi mutlak
sebesar 10% dan derajat kepercayaan 90%?
Jawaban :
Dengan menggunakan rumus ( 1 ) dan nilai p=0,65 ; d= 0,10 ; dan Z = 1,64

(1,64) 2 (0,65) (1-0,65)


maka , n =  = 61,19
(0,1) 2
Jadi 62 ibu hamil diperlukan sebagai sampel agar kita 90% percaya dalam melakukan estimasi
prevalensi anemia pada ibu hamil.

2. Pada data proporsi, besar sampel pada populasi terbatas (Jumlah


anggota populasi diketahui)
* Rumus:
Z 2 /2 * p ( 1- p ) N
n =  (2)
d 2 (N-1) + Z 2 /2 * p ( 1- p )

dimana : n : besar sampel


Z /2 : nilai Z pada derajat kepercayaan 1-/2
p : proporsi hal yang diteliti
d : presisi
N : jumlah populasi
Contoh 1:
Penelitian pendahuluan pada 25 ibu laktasi di Desa Melati diperoleh hasil 15 orang
menderita anemia. Di desa tersebut, terdapat 300 ibu laktasi. Berapa besar sampel yang
diperlukan jika peneliti ingin mengetahui prevalensi anemia pada ibu laktasi di desa tersebut
dengan simpangan maksimum terhadap prevalensi sebenarnya yang dapat diterima adalah
10% pada derajat kepercayaan 95%?
Jawaban :
Dengan menggunakan hasil dari penelitian pendahuluan, besar sampel dapat dihitung :
1,962 * 0,6 (1-0,6) 300
n =  = 71
0,12 (300-1) + 1,962 * 0,6 (1-0,6)

Jadi sampel yang diperlukan sebanyak 71 orang ibu laktasi

17
Contoh 2 :
Diketahui : Jumlah penduduk lansia di kota Depok (N) = 4000 jiwa
Proporsi hipertensi pada lansia (P) = 40% = 0,4
a). Jika : Tingkat kepercayaan 95% (Z) = 1,96
Kisaran perkiraan hipertensi 30%-50% sehingga
presisi mutlak (d) = 10%=0,1
Pengambilan sampel secara acak sederhana

Maka besar sampel adalah :


Z²/2 . P ( 1-P ) . N
n = 
d ² ( N-1 ) + Z²/2 . P ( 1-P )

1,96² . 0,4 ( 1-0,4 ) . 4000


n=  = 90,14
0,1 ² ( 4000-1 ) + 1,96 ² . 0,4 ( 1-0,4 )

Jadi besar sampel minimum yang diperlukan adalah 91 jiwa.

b). Jika : Tingkat kepercayaan 95% (Z) = 1,96


Kisaran perkiraan hipertensi 35%-45% sehingga
presisi mutlak (d) = 5%=0,05
Pengambilan sampel secara acak sederhana
Maka besar sampel adalah :
Z²/2 . P ( 1-P ) . N
n = 
d ² ( N-1 ) + Z²/2 . P ( 1-P )

1,96² . 0,4 ( 1-0,4 ) . 4000


n=  = 337,74
0,05 ² ( 4000-1 ) + 1,96 ² . 0,4 ( 1-0,4 )

Jadi besar sampel minimum yang diperlukan adalah 338 jiwa.

c). Jika : Tingkat kepercayaan 95% (Z) = 1,96


Kisaran perkiraan hipertensi 30%-50% sehingga
presisi mutlak (d) = 10%=0,1
Pengambilan sampel secara cluster dengan disain effek = 2,3
Maka besar sampel adalah :
1,96² . 0,4 ( 1-0,4 ) . 4000
n =  = 90,14
0,1 ² ( 4000-1 ) + 1,96 ² . 0,4 ( 1-0,4 )

Karena ada disain efek maka n = 90,14 x 2,3 = 207,33


Jadi besar sampel yang diperlukan adalah 208 jiwa.

18
3. Pada data rata-rata, besar sampel pada populasi yang tidak diketahui
jumlah anggota populasinya
* Untuk menghitung besar sampel peneliti perlu tahu:
Perkiraan varians (  ) , presisi ( d ) dan derajat kemaknaan (  )
* Rumus:
Z 2 /2 * 2
n =  (3)
2
d
dimana : n : besar sampel
Z /2 : nilai Z pada derajat kepercayaan 1-/2
 : standar deviasi
d : presisi
Contoh :
Suatu penelitian dilakukan untuk mengetahui rata-rata asupan energi pada anak balita di
Desa Sakura. Ingin dipilih sampel secara acak sederhana. Dari penelitian pendahuluan
diperoleh standar deviasi asupan energi pada anak balita adalah 15 Kalori. Berapa besar
sampel yang diperlukan jika peneliti menginginkan derajat kepercayaan 95% dan besar
simpangan maksimum dari rata-rata adalah 5 Kalori (presisi mutlak).
Jawaban:
Diketahui : Z 1-/2 : 1,96 ;  : 15 ; d : 0,05 maka

1,96 2 * 15 2
n =  = 34,57
52
Jadi besar sampel yang diperlukan adalah 35 anak balita.

4. Pada data rata-rata, besar sampel pada populasi terbatas (Jumlah


anggota populasi diketahui)
* Rumus
Z2 /2 * 2 N
n =  (4)
d2 (N-1) + Z2 /2 * ²

dimana : n : besar sampel


Z /2 : nilai Z pada derajat kepercayaan 1-/2
 : standar deviasi
d : presisi
N : jumlah populasi

Data Rata-rata 2 Kelompok Independen


(n1- 1) s12 + (n2 – 1) s22
Sp2 = 
(n1- 1) + (n2 – 1)

19
Z 2/2 * 2  2
n =  (5)
2
d
Contoh :
Seorang peneliti ingin membandingkan efek penurunan gula darah antara obat anti diabetes
A dan B. Pada penelitian pendahuluan , diketahui dalam 3 minggu pengobatan , obat A rata-
rata menurunkan kadar gula darah sebesar 40 mg/dl dengan standar deviasi 20 mg/dl.
Sedangkan obat B rata-rata menurunkan kadar gula darah sebesar 30 mg/dl dengan standar
deviasi 15 mg/dl. Pada penelitian awal tersebut, peneliti hanya menggunakan 5 pasien pada
masing-masing kelompok. Berapa besar sampel yang diperlukan jika peneliti ingin
menunjukkan ada perbedaan rata-rata penurunan kadar gula darah antara pasien yang
memperoleh obat A dan B dengan simpangan maksimum 5 mg/dl dari perbedaan yang ada
dan peneliti menginginkan derajat kepercayaan 95% ?
Jawaban :
Diketahui : n1 = 5 , n2 = 5, s1= 20, s2= 15, d = 5 , Z= 1,96
sehingga varians gabungan dapat dihitung :

(5- 1) 202 + (5 – 1) 152


Sp2 =  = 312,5
(5- 1) + (5 – 1)

Besar sampel dapat dihitung dengan rumus (5) yaitu :

1,96 2 * 2 * 312,5
n =  = 96,04
52
Jadi diperlukan 97 pasien untuk masing-masing kelompok pengobatan.

DISTRIBUSI NORMAL DAN UJI KENORMALAN

Pada distribusi probabilitas yang kontinyu, grafiknya dapat menggambarkan berbagai


tingkat kemiringan atau dalam beberapa kasus simetris sempurna. Diantaranya yang
terpenting adalah distribusi kontinyu yang kurvanya simetris, yaitu distribusi normal.
Distribusi normal merupakan distribusi probabilitas kontinyu yang terpenting dalam seluruh
bidang statistika.
Pada distribusi normal :
- kurvanya simetris
- berbentuk lonceng, merentang tak terbatas ke kedua arah
- menggambarkan data yang terjadi pada alam, pada manusia, industri.
- Disebut juga “distribusi Gauss”
Terjadi jika variabel acak x mempunyai fungsi dengan persamaan :

20
Dimana :  : konstanta yaitu 3,1416
e : bilangan logaritma natural yaitu 2,7183
 : rata-rata hitung distribusi
 : simpangan baku distribusi

 maka x berdistribusi normal


Jika nilai mean = median = modus  kurvanya akan simetris

x= Me = Mo
Kurva simetris

Mo Me x x Me Mo

x > Me > Mo x < Me < Mo


Kurva menceng ke kanan Kurva menceng ke kiri
Kurva positif Kurva negatif

Kurva normal

f (x)

-3  +3 sumbu x

Sifat-sifat penting dari distribusi normal :


1. Grafik selalu diatas sumbu datar x
2. Grafik simetrik terhadap garis vertical melalui x = 
3. Modus tercapai pada x = 
4. Grafik mendekati sumbu datar x mulai dari +3 kekanan dan -3 kekiri
5. Luas grafik selalu sama dengan 1
6. Tinggi rendahnya kurva tergantung besarnya 
21
Makin besar , kurvanya makin rendah (platikurtis)
Makin kecil , kurvanya makin tinggi (leptokurtis)

1 1 < 2 < 3
1 = 2 = 3

2
3

Dengan demikian jika  dan  diketahui, maka akan diperoleh bentuk distribusi normal, yang
mana dapat dihitung probabilitas nilai-nilai x dengan memakai rumus fungsi distribusi
normal.

LUASAN DIBAWAH KURVA NORMAL


Probabilitas dimana nilai x nya mempunyai nilai antara x = x 1 dan x = x2 adalah luasan
dibawah kurva diantara titik x1 dan x2

f (x)

x1  x2 sumbu x

DISTRUBUSI NORMAL STANDARD


Distribusi normal standard adalah distribusi normal dengan rata-rata sama dengan nol ( = 0)
dan simpangan baku sama dengan satu ( = 1)
Fungsi distribusi normal standard :

Z dalam daerah -  < Z < +

Untuk mendapatkan probabilitas setiap nilai Z pada kurva normal standard telah disusun
sebuah daftar yang disebut “tabel distribusi normal standar”. Berdasarkan tabel inilah
probabilitas setiap nilai x pada distribusi normal umum dapat dihitung, melalui suatu
transformasi.

22
Dari hubungan distribusi normal umum dan normal standard dapat diperoleh suatu rumus
transformasi dari nilai x (distribusi normal umum) ke nilai Z (distribusi normal standard).

Transformasinya:

x -
Z = 

Perubahan grafiknya dapat dilihat dalam gambar dibawah ini:


f (x) Rata-rata = 
Simpangan baku = 

-3 -2 -1  +1 +2 +3 x

f (z) =0
=1

-3 -2 -1 0 1 2 3 z

Tabel Distribusi Normal Normal Standard


Untuk mendapatkan probabilitas setiap nilai x pada distribusi normal umum (yang
dapat diperoleh secara empiris) adalah dengan menghitung probabilitas nilai Z yang sesuai
dengan distribusi normal standard dengan suatu transformasi. Dan untuk mendapatkan
probabilitas setiap nilai Z telah disusun “table distribusi normal standard”.
Berdasarkan table distribusi normal standard diperoleh ketentuan-ketentuan sebagai berikut:
  1 SD memberikan luas daerah 68,27 %
  2 SD memberikan luas daerah 95,45 %
  3 SD memberikan luas daerah 99,74 %

UJI KENORMALAN

 Apakah data berasal dari populasi yang berdistribusi normal?


Bisa digunakan uji Kolmogorof Smirnov

Ho : F (x) = Fo (x)
F (x) adalah fungsi distribusi populasi yang diwakili oleh sampel
Fo (x) adalah fungsi distribusi suatu populasi berdistribusi normal
Atau
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
NORMAL

23
Ha : F (x)  Fo (x) (uji two tail)
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
TIDAK NORMAL

Kesimpulan :
Jika p-value > 0,05  Ho diterima/gagal ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi normal

Jika p-value < 0,05  Ho ditolak


Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi tidak normal
Contoh:

umur ibu

Cumulative
Frequency Percent Valid Percent Percent
Valid 22 2 10.0 10.0 10.0
25 3 15.0 15.0 25.0
27 1 5.0 5.0 30.0
31 4 20.0 20.0 50.0
32 1 5.0 5.0 55.0
33 1 5.0 5.0 60.0
34 2 10.0 10.0 70.0
36 1 5.0 5.0 75.0
39 1 5.0 5.0 80.0
40 2 10.0 10.0 90.0
43 1 5.0 5.0 95.0
47 1 5.0 5.0 100.0
Total 20 100.0 100.0

Pada output diatas terlihat distribusi frekuensi masing-masing data umur


Ibu yang berumur 22 tahun sebanyak 2 orang atau 2/20 * 100% = 10,0 %
Ibu yang berumur 25 tahun sebanyak 3 orang atau 3/20 * 100% = 15,0 %
Oleh karena itu kumulatif persen menjadi 10,0 % + 15,0 % = 25,0 %

umur ibu
6

2
Frequency

1 Std. Dev = 6.96


Mean = 32.4
0 N = 20.00
20.0 25.0 30.0 35.0 40.0 45.0

umur ibu

24
Gambar diatas memperlihatkan histogram umur ibu dan garis / kurva normal dari
variabel umur ibu. Terlihat bahwa batang histogram mempunyai kemiripan bentuk
dengan kurva normal (berbentuk seperti lonceng). Hal ini membuktikan bahwa
distribusi tersebut sudah dapat dikatakan normal atau mendekati normal. Namun
pengujian normalitas lebih jelas pada explore data.

Pengujian normalitas dengan explore data.


Descriptives

Statistic Std. Error


umur ibu Mean 32,40 1,557
95% Confidence Lower Bound 29,14
Interval for Mean Upper Bound
35,66

5% Trimmed Mean 32,17


Median 31,50
Variance 48,463
Std. Deviation 6,962
Minimum 22
Maximum 47
Range 25
Interquartile Range 12,75
Skewness ,328 ,512
Kurtosis -,461 ,992

Output ini memberikan informasi ringkasan statistik deskripsi dari data umur ibu

 Mean (rata-rata) umur ibu adalah 32,4 tahun

 95% CI : 29,11 – 35,66 (artinya pada tingkat kepercayaan 95% rata-rata umur ibu pada
populasi antara 29,11 – 35,66 ).

 Median atau tititk tengah data jika semua data diurutkan dan dibagi dua sama besar.
Angka median umur ibu adalah 31.5 tahun menunjukkan bahwa 50% pengetahuan gizi
ibu adalah 31,5 tahun keatas dan 50% nya adalah 31,5 tahun ke bawah.

 Variance adalah kuadrat dari standard deviasi yaitu 48,46 tahun .

 Standard deviasi atau simpangan baku adalah 6,96 dibulatkan 7 tahun


Penggunaan standar deviasi untuk menilai dispersi rata-rata dari sampel. Untuk itu
dengan standard deviasi tertentu dan pada tingkat kepercayaan 95% (SPSS sebagian
besar menggunakan angka ini sebagai standar), rata-rata umur ibu pada sampel menjadi :
rata-rata  2 standard deviasi
NB: angka 2 digunakan karena tingkat kepercayaan 95%
Maka: 32,4  2 ( 7 )
= 46,4 sampai 18,4 (tahun)

 Nilai Minimum adalah 22 tahun dan maximum adalah 47 tahun. Umur ibu terendah
adalah 22 tahun dan umur paling tua adalah 47 tahun.

25
 Range adalah data maksimum – data minimum atau dalam kasus ini :
47 – 22 = 25
 Rasio skewness adalah = nilai skewness/ standard error of skewness
= 0,328 / 0,512 = 0,640

Rasio kurtosis adalah : nilai kurtosis / standard error of kurtosis


= – 0,461 / 0,922 = – 0,5

Oleh karena kedua hasil terletak antara – 2 sampai dengan + 2, maka dapat dikatakan
distribusi data umur ibu adalah normal atau mendekati normal.

 Output uji kenormalan data:


Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu ,120 20 ,200* ,960 20 ,542
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Pada uji kenormalan , pedoman pengambilan keputusan adalah :


Nilai sig (signifikansi) atau nilai probabilitas < 0,05, distribusi adalah tidak normal.
Nilai sig (signifikansi) atau nilai probabilitas > 0,05, distribusi adalah normal.

Pada uji Kolmogorov Smirnov , nilai sig atau p-value = 0,200. Karena > 0,05 maka dapat
dikatakan bahwa distribusi data umur ibu adalah normal.

Pada uji Saphiro-Wilk, nilai sig atau p-value = 0,542. Karena > 0,05 maka dapat dikatakan
bahwa distribusi data umur ibu adalah normal.

Output histogram
Histogram
6

2
Frequency

1 Std. Dev = 6,96


Mean = 32,4

0 N = 20,00
20,0 25,0 30,0 35,0 40,0 45,0

umur ibu

Histogram dari data umur ibu.

26
Output stem and leaf

umur ibu Stem-and-Leaf Plot

Frequency Stem & Leaf

2,00 2. 22
4,00 2. 5557
8,00 3. 11112344
2,00 3. 69
3,00 4. 003
1,00 4. 7

Stem width: 10
Each leaf: 1 case(s)

Interpretasi :
Pada baris 1 : Ada 2 data umur ibu (frequency = 2) yang mempunyai stem = 2 dan leaf =
22, yang berarti terdapat 2 orang ibu yang mempunyai umur 22 dan 22 tahun.

Pada baris 2 : Ada 4 data umur ibu (frequency = 4) yang mempunyai stem = 2 dan leaf =
5,5,5,7 yang berarti terdapat 4 orang ibu yang mempunyai umur 25, 25, 25, 27

Dan seterusnya sampai pada baris ke 6 , yaitu ada 1 orang ibu yang mempunyai umur 47
tahun.

Output untuk menguji normalitas dengan Plot (Q-Q plot)

Normal Q-Q Plot of umur ibu


2,0

1,5

1,0

,5

0,0
Expected Normal

-,5

-1,0

-1,5
20 30 40 50

Observed Value

Pada gambar Q-Q plot untuk variabel umur terlihat ada garis lurus dari kiri ke kanan atas.
Garis itu berasal dari nilai Z skore. Jika suatu distribusi data normal, maka data akan
tersebar di sekeliling garis. Oleh karena itu dapat dikatakan bahwa distribusi data adalah
normal.

27
Output untuk menguji normalitas dengan Plot (Detrended NormalQ-Q plot)

Detrended Normal Q-Q Plot of umur ibu


,5

,4

,3

,2

,1

-,0
Dev from Normal

-,1

-,2

-,3
20 30 40 50

Observed Value

Output ini untuk mendeteksi pola-pola dari titik-titik yang bukan bagian dari kurva
normal. Terlihat bahwa sebagian data terpola di sekitar garis. Hal ini membuktikan
bahwa distribusi data adalah normal.

Output boxplot
Boxplot adalah kotak pada gambar berwarna merah atau warna lain dengan garis tebal
horizontal di kotak tersebut. Kotak merah tersebut memuat 50% data. Sedangkan garis
tebal hitam median data. Jika garis hitam terletak persis di tengah boxplot, maka
distribusi data adalah normal. Jika berada di sebelah atas, distribusi menceng ke kiri
dan jika di sebelah bawah, distribusi menceng ke kanan.

50

40

30

20
N= 20

umur ibu

Dari output diatas terlihat garis median berada ditengah. Hal ini menunjukkan distribusi
data normal.

28
Daftar Pustaka

1. Budiarto. Biostatistika untuk kedokteran dan kesehatan masyarakat. EGC. Jakarta.


2002
2. Dawson B, Trapp RG. Basic and Clinical Biostatistics. Third Edition. McGraw-Hill
International Editions. Lange Medical Books, The McGraw-Hill Companies. 2001.
3. Kuzma. Basic Statistics for the Health Sciences. Mayfield Publishing Company. 1984
4. Norman and Streiner. Biostatistics : The Bare Essentials, Mosby. 1994.
5. Pagano, M dan K. Gaureau. Principles of Biostatistics. Belmont, Duxury Press. 1993.
6. Sabri dan Hastomo. Statistika kesehatan. PT Raja Grafindo Persada. Jakarta. 2006.
7. Sheskin, D.J. Handbook of Parametric and Nonparametric Statistical Prosedures. Third
Edition. Chapman & Hall/CRC. Florida. 2004
8. Ariawan I. Besar dan Metode Sampel pada Penelitian Kesehatan. Jurusan
Biostatistik dan Kependudukan, Fakultas Kesehatan Masyarakat, Universitas
Indonesia, Depok, 1998.
9. Lemeshow, S.; DW Hosmer Jr.; J Klar; SK Lwanga; Adequacy of Sample Size in Health
Studies. WHO. John Wiley & Sons Ltd. England, 1993.
10. Supranto, J, Tehnik Sampling untuk Survey dan Eksperimen, PT Rineka Cipta,
Jakarta, 1992.
11. Sastroasmoro, S; Ismael S. Dasar-dasar Metodologi Penelitian klinis. Edisi 3. CV Sagung
Seto. Jakarta, 2010.

29

Anda mungkin juga menyukai