Anda di halaman 1dari 19

Kuliah 4B

Dr. Ir. Rahayu Astuti, M.Kes

STATISTIK INFERENSIAL, PENGUJIAN HIPOTESIS


DAN DISTRIBUSI NORMAL

STATISTIK INFERENSIAL
Pada statistik induktif/ inferensial kita akan melakukan penyimpulan /
pengambilan keputusan dari suatu populasi tertentu berdasarkan sebagian data
(sampel) yang dikumpulkan.
Konsep dasarnya:
- Distribusi sampling yaitu distribusi dari mean-mean sampel yang diambil
secara berulang kali dari suatu populasi.
- Sampling Error adalah kesalahan karena penelitiannya menggunakan sampel.
- Standard Error (SE) adalah simpangan baku dari distribusi rata-rata sampel.
- Estimasi adalah suatu metode dimana diperkirakan nilai populasi (parameter)
dengan menggunakan nilai sampel (statistik).
- Uji hipotesis. Tujuannya adalah untuk menguji apakah data dari sampel yang
ada sudah cukup kuat untuk menggambarkan populasinya. Atau apakah bisa
dilakukan generalisasi tentang populasi berdasarkan hasil sample

STATISTIKA PARAMETRIK
I. PENDAHULUAN
Statistik adalah ukuran yang menyimpulkan karakteristik suatu sampel. Statistik
digunakan untuk penaksiran parameter populasi dan menguji hipotesis tentang
keadaan parameter populasi.
Parameter adalah ukuran yang menyimpulkan karakteristik suatu populasi
Parameter di populasi statistik pada sampel
Rata-rata  x
Standard deviasi  s atau SD
Varians 2 s2
Proporsi ∏ p
Koef. Korelasi ρ r

Statistika Parametrik menggunakan parameter populasi sebagai basis pemahaman


seperti  dan  yang dalam tingkatan sampel menggunakan x dan s (SD).

Ciri dalam statistika parametrik adalah data yang mempunyai skala pengukuran
interval dan rasio.

Dalam statistika inferensial parametrik distribusi variabel random x yang mendasari


perlu dipertimbangkan. Bila x adalah variabel random yang kontinyu distribusi yang
mendasari adalah distribusi normal.

Jadi distribusi variabel random ini mempunyai peran yang besar dalam statistika
parametrik

R Astuti 1
II. TEKNIK STATISTIKA PARAMETRIK

A. Asumsi
1. Data yang digunakan mempunyai skala pengukuran interval atau rasio
2. Data diambil dari populasi yang mempunyai distribusi normal.
Distribusi normal mrp distribusi probabilitas dengan ciri:
a). Mempunyai bentuk lonceng (bell-shaped).
b). Simetris dimana nilai mean= nilai median=nilai modus
c). Kedua ekor mendekati sumbu x secara asimptotik
d). Merupakan distribusi probabilitas dengan peluang sebagai berikut:

Untuk rentang  ± 1  meliputi area probabilitas 68,27%


Untuk rentang  ± 2  meliputi area probabilitas 95,45%
Untuk rentang  ± 3  meliputi area probabilitas 99,73%

III. JENIS ANALISIS STATISTIK PARAMETRIK


1. Menaksir parameter populasi
2. Menguji hipotesis tentang parameter di populasi
1) Statistik uji komparatif
a. Uji t satu sampel
b. Uji t berpasangan (paired t test)
c. Uji t untuk 2 sampel independent
d. Analisis varian (Anava)
2). Statistik uji korelatif
a. Uji korelasi Pearson
b. Regresi Linier Sederhana

Pada uji hipotesis, dikenal uji statistik parametrik dan non parametrik

UJI STATISTIK PARAMETRIK


Asumsi yang digunakan dalam uji parametrik adalah:
1. Populasi berdistribusi normal
2. Skala data interval/rasio (data numerik)
3. Kesamaan varians, jika membandingkan 2 atau sejumlah sampel
Uji-uji parametrik adalah:
1. Satu sampel: Uji Z atau uji t satu sampel (uji beda mean satu sampel)
2. Dua sampel: Uji Z atau uji t dua sampel independent (independent t test)
3. Tiga atau lebih sampel: - One way anova, two faktor anova, ancova, mancova.
4. Uji hubungan : korelasi dan regresi

UJI STATISTIK NON PARAMETRIK


Digunakan bila asumsi pada uji parametrik tidak dipenuhi.
Digunakan pada keadaan:
1. Distribusi populasi tidak normal
2. Skala data nominal/ ordinal (data kategorik)
Catatan: jika data numerik tetapi distribusi data tidak normal, gunakan uji non
parametrik.
Uji statistik non-parametrik disebut juga statistik bebas distribusi (distribution free
statistic), karena prosedur pengujiannya tidak berdasarkan asumsi distribusi populasi
normal dan dapat dilakukan walaupun dengan sampel yang sedikit.

R Astuti 2
Uji-uji non parametrik adalah:
1. Satu sampel: Uji Chi Square (goodness of fit), uji binomial, uji tanda dsb
2. Dua sampel independent: Uji Chi Square (independensi), uji median, uji Man
Whitney dsb
3. Dua sampel dependent: Uji Mac Nemar, Wilcoxon dsb.
4. Tiga atau lebih sampel independent: Uji Kruskal Wallis

HIPOTESIS DAN PENGUJIAN HIPOTESIS


PENDAHULUAN
Seperti kita ketahui bahwa nilai yang berasal dari sampel dapat digunakan
untuk mengestimasi nilai populasi yang tidak diketahui. Pada bab ini akan dibahas
penarikan kesimpulan (menggeneralisir) nilai yang berasal dari sampel terhadap
keadaan populasi melalui pengujian hipotesis.
Pengujian hipotesis dapat berguna untuk membantu pengambilan keputusan
tentang apakah suatu hipotesis yang diajukan, seperti perbedaan atau hubungan,
cukup meyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini didasarkan pada
besarnya peluang untuk memperoleh hubungan tersebut secara kebetulan (by chance).
Semakin kecil peluang tersebut (peluang adanya by chance), semakin besar keyakinan
bahwa hubungan tersebut memang ada.
Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua kemungkinan
yaitu menolak hipotesis atau gagal menolak hipotesis.

PENGERTIAN :
Hipotesis sesuai dengan asal katanya (hypo berarti dibawah, thesis berarti
dalil, kaidah, hukum), adalah pernyataan tentang suatu dalil atau kaidah, tetapi
kebenarannya belum terujikan secara empirik. Dengan demikian, dikaitkan dengan
dengan masalah penelitian, hipotesis merupakan jawaban sementara terhadap
permasalahan yang diajukan, yang kebenaran jawaban ini akan dibuktikan secara
empirik dengan penelitian yang akan dilakukan.
Secara lebih operasional yaitu :
“Suatu pernyataan sementara yang perlu diuji kebenarannya.”

MACAM HIPOTESIS
Dalam pernyataannya, terdapat dua macam hipotesis statistik yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha).

a). Hipotesis nol (Ho)


Hipotesis nol adalah pernyataan yang menyatakan tidak ada perbedaan suatu kejadian
antara kedua kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara
variabel satu dengan variabel yang lain.

Contoh :
1. Tidak ada hubungan antara kehamilan dengan kadar hemoglobin ibu
2. Tidak ada perbedaan rata-rata kadar hemoglobin antara ibu yang hamil dengan
ibu yang tidak hamil. Atau Rata-rata kadar hemoglobin populasi ibu hamil
sama dengan rata-rata kadar hemoglobin populasi ibu yang tidak hamil..

R Astuti 3
b). Hipotesis alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan suatu kejadian antara kedua kelompok.
Atau hipotesis yang menyatakan ada hubungan variabel satu dengan variabel yang
lain.
Contoh :
1. Ada hubungan antara kehamilan dengan kadar hemoglobin ibu.
2. Ada perbedaan rata-rata kadar hemoglobin antara ibu yang hamil dengan ibu
yang tidak hamil. Atau Rata-rata kadar hemoglobin populasi ibu hamil
berbeda dengan rata-rata kadar hemoglobin populasi ibu yang tidak hamil.

ARAH/BENTUK HIPOTESIS
Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah
(one tail) atau dua arah (two tail).

1. One tail (satu sisi) : Bila hipotesis alternatifnya menyatakan adanya perbedaan dan
ada pernyataan yang mengatakan hal yang satu lebih tinggi/rendah dari hal yang
lain.
Contoh :
Rata-rata kadar hemoglobin populasi ibu tidak hamil lebih tinggi dari rata-rata
kadar hemoglobin populasi ibu yang hamil.

2. Two tail (dua sisi) : merupakan hipotesis alternatif yang hanya menyatakan
perbedaan tanpa melihat apakah hal yang satu lebih tinggi/ rendah dari hal yang
lain.
Contoh :
Ada perbedaan rata-rata kadar hemoglobin antara ibu yang hamil dengan ibu yang
tidak hamil. Atau Rata-rata kadar hemoglobin populasi ibu hamil berbeda dengan
rata-rata kadar hemoglobin populasi ibu yang tidak hamil.

Contoh penulisan hipotesis


Suatu penelitian ingin mengetahui hubungan antara merokok dengan tekanan darah
maka hipotesisnya adalah :

Ho : 1 = 2 ( Tidak ada perbedaan mean tekanan darah antara orang yang merokok
dengan yang tidak merokok ).
Ha : 1  2 (Ada perbedaan mean tekanan darah antara orang yang merokok
Dengan yang tidak merokok ).

Ho :  = 0 (Tidak ada korelasi antara jumlah rokok yang dihisap dengan tekanan
darah)
Ha :  > 0 (Ada korelasi positif antara jumlah rokok yang dihisap dengan tekanan
darah)

Asumsi hipotesis nol


Pada satu hipotesis ilmiah, dimungkinkan untuk dapat diajukan satu atau
beberapa hipotesis statistik. Sebagaimana suatu proses pengujian di ruang sidang,
maka pernyataan yang diuji adalah adalah pernyataan yang menggambarkan praduga
tak bersalah. Jadi pernyataan hipotesis yang diuji secara statistik adalah hipotesis nol.

R Astuti 4
Dapat diingat bahwa sejak awal proses pengujian, maka hipotesis nol dianggap atau
diasumsikan benar.

KESALAHAN PENGAMBILAN KEPUTUSAN


Dalam pengujian hipotesis kita selalu dihadapkan pada suatu kesalahan
pengambilan keputusan. Ada dua jenis kesalahan pengambilan keputusan dalam uji
statistik, yaitu :

1. Kesalahan tipe I (  )
Merupakan kesalahan menolak Ho padahal sesungguhnya Ho benar. Artinya
menyimpulkan adanya perbedaan padahal sesungguhnya tidak ada perbedaan.
Peluang kesalahan tipe I adalah  atau sering disebut Tingkat Signifikansi
(significance level). Sebaliknya peluang untuk tidak membuat kesalahan tipe I
adalah sebesar 1 - , yang disebut dengan Tingkat Kepercayaan (confidence level).

2. Kesalahan tipe II (  )
Merupakan kesalahan tidak menolak Ho padahal sesungguhnya Ho salah. Artinya
menyimpulkan tidak ada perbedaan padahal sesungguhnya ada perbedaan. Peluang
untuk membuat kesalahan tipe II adalah sebesar . Peluang untuk tidak membuat
kesalahan tipe II adalah sebesar 1 - , dan dikenal sebagai Tingkat Kekuatan Uji
(power of the test).
Kesalahan pengambilan keputusan
Keputusan Populasi
Ho benar Ho salah
Tidak menolak Ho Benar (1 -  ) 
Menolak Ho  Benar ( 1 -  )

Power of the test ( Kekuatan uji ) = 1 - 


Merupakan peluang untuk menolak hipotesis nol ( Ho), ketika Ho memang
salah. Atau kemampuan untuk mendeteksi adanya perbedaan bermakna antara
kelompok-kelompok yang diteliti ketika perbedaan –perbedaan itu memang ada .
Dalam pengujian hipotesis kita menghendaki agar  dan  kecil atau 1 -  besar.

MENENTUKAN TINGKAT KEMAKNAAN


Tingkat kemaknaan merupakan kesalahan tipe I yang diberi notasi . Setelah
menentukan Ho dan Ha langkah selanjutnya adalah menentukan kriteria/ batasan yang
digunakan untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang
disebut dengan tingkat kemaknaan (level of significance). Tingkat kemaknaan, atau
sering disebut dengan nilai , merupakan nilai yang menunjukkan besarnya peluang
salah dalam menolak hipotesis nol. Atau dengan kata lain, nilai  merupakan batas
toleransi peluang salah dalam menolak hipotesis nol
Dapat dikatakan bahwa nilai  merupakan nilai batas maksimal kesalahan
menolak Ho atau batas maksimal peluang mendapatkan hipotesis nol yang benar.
Bila kita menolak Ho berarti menyatakan adanya perbedaan / hubungan. Sehingga
nilai  dapat diartikan pula sebagai batas maksimal kita salah menyatakan adanya
perbedaan.
Penentuan nilai alpha () tergantung dari tujuan dan kondisi penelitian. Nilai 
yang sering digunakan adalah 10 %, 5 %, 1 %, Untuk bidang kesehatan masyarakat

R Astuti 5
biasanya digunakan nilai  sebesar 5 %. Sedangkan untuk pengujuan obat-obatan
digunakan batas toleransi kesalahan yang lebih kecil misalnya 1 %, karena
mengandung risiko yang fatal.
KEPUTUSAN UJI STATISTIK
Hasil pengujian statistik menghasilkan dua kemungkinan keputusan yaitu
menolak hipotesis nol dan gagal menolak hipotesis nol. Keputusan uji statistik dapat
dicari dengan dua pendekatan yaitu pendekatan klasik dan penekatan probabilistik.

1. Pendekatan klasik
Untuk memutuskan apakah Ho ditolak atau gagal ditolak, dapat digunakan dengan
cara membandingkan nilai perhitungan uji statistik dengan nilai pada tabel. Nilai
tabel yang dilihat sesuai dengan jenis distribusi uji yang kita lakukan.
Ketentuan :
 Bila nilai perhitungan uji statistik lebih besar dibandingkan nilai yang berasal
dari tabel (nilai perhitungan > nilai tabel), maka keputusannya : Ho ditolak.
Ho ditolak, artinya: ada perbedaan kejadian (mean/proporsi) yang signifikan
antara kelompok data satu dengan kelompok data yang lain.

 Bila nilai perhitungan uji statistik lebih kecil dibandingkan nilai yang berasal
dari tabel ( nilai perhitungan < nilai tabel), maka keputusannya : Ho gagal
ditolak.
Ho gagal ditolak, artinya: tidak ada perbedaan kejadian (mean/ proporsi) antara
kelompok data satu dengan kelompok data yang lain. Perbedaan yang ada
hanya akibat dari faktor kebetulan (by chance).

2. Pendekatan probabilistik
Setiap kita melakukan uji statistik dengan menggunakan komputer maka akan
ditampilkan/dikeluarkan nilai p (p-value). Dengan nilai p kita dapat menggunakan
untuk keputusan uji statistik dengan cara membandingkan nilai p dengan nilai .
Ketentuan :
 Bila nilai p  nilai  maka keputusannya adalah Ho ditolak
 Bila nilai p  nilai  maka keputusannya adalah Ho gagal ditolak
Perlu diketahui bahwa nilai p two tail adalah dua kali nilai p one tail, berarti
kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang
dilakukan two tail maka nilai p dari tabel harus dikalikan 2. Dengan demikian dapat
disederhanakan dengan rumus: nilai p two tail = 2 x nilai p one tail.

NILAI p (p-value)
Pengertian nilai p
Nilai p merupakan nilai yang menunjukkan besarnya peluang untuk
mendapatkan Ho yang benar Harapan kita nilai p adalah sekecil mungkin, sebab bila
nilai p nya kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian
menunjukkan pula adanya perbedaan di populasi. Dengan kata lain kalau nilai p nya
kecil maka peluang bahwa tidak ada perbedaan adalah kecil.
Nilai p dapat diartikan pula sebagai besarnya nilai peluang hasil penelitian
(misalnya adanya perbedaan mean atau proporsi) terjadi karena faktor kebetulan (by
chance). Kalau nilai p nya kecil maka perbedaan yang ada pada penelitian terjadi
karena faktor kebetulan (by chance) adalah kecil.

R Astuti 6
Perbedaan substansi/ klinis dan perbedaan statistik
Perlu disadari oleh peneliti bahwa berbeda bermakna/ signifikan secara statistik
tidak berarti (belum tentu) bahwa perbedaan tersebut juga bermakna dipandang dari
segi substansi/ klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis
akan semakin besar menghasilkan kemungkinan berbeda bermakna. Dengan sampel
besar perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai
manfaat secara substansi/ klinis dapat berubah menjadi bermakna secara statistik.
Oleh karena itu arti kegunaan dari setiap penemuan jangan hanya dilihat secara
statistik saja, tapi harus juga dilihat dari kegunaan dari segi substansi/klinis.

PEMILIHAN METODE STATISTIK PARAMETRIK DAN NON


PARAMETRIK
Dalam pengujian hipotesis sangat berhubungan dengan distribusi data populasi
yang akan diuji. Bila distribusi data populasi yang akan diuji berbentuk
normal/simetris/Gauss, maka proses pengujian dapat digunakan dengan pendekatan
uji statistik parametrik. Sedangkan bila distribusi data populasinya tidak normal
atau tidak diketahui distribusinya maka dapat digunakan pendekatan uji statistik non
parametrik
Kenormalan suatu data dapat juga dilihat dari jenis variabelnya. Bila
variabelnya berjenis numerik/ kuantitatif maka perlu dilihat distribusi datanya normal
atau tidak Bila distribusinya normal maka gunakan uji statistik parametrik, sedangkan
bila distribusi datanya tidak normal maka gunakan uji statistik non parametrik. Bila
jenis variabelnya katagorik/ kualitatif maka bentuk distribusinya tidak normal,
sehingga uji statistik non parametrik yang digunakan.

PROSEDUR UJI HIPOTESIS


1. Menetapkan hipotesis
2. Menentukan tingkat kemaknaan
3. Menetapkan uji statistik yang sesuai
4. Penghitungan uji statistik
5. Keputusan uji statistik
6. Pengambilan kesimpulan

1. Menetapkan hipotesis
Tetapkan hipotesis nol (Ho) dan hipotesis alternatif (Ha).
Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah
(one tail) atau dua arah (two tail).

2. Menentukan tingkat kemaknaan


Batas/tingkat kemaknaan, sering disebut dengan nilai . Penggunaan nilai alpha
tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan masyarakat
biasanya menggunakan nilai  = 5%.

3. Menentukan uji statistik yang sesuai


Ada beragam uji statistik. Setiap uji statistik mempunyai persyaratan tertentu yang
harus dipenuhi. Oleh karena itu harus digunakan uji statistik yang tepat sesuai
dengan data yang diuji. Jenis uji statistik sangat tergantung dari:
1). Jenis variabel yang akan diteliti (numerik atau katagorik)
2). Jenis distribusi data (normal atau tidak normal)

R Astuti 7
4. Penghitungan uji statistik
Penghitungan uji statistik adalah menghitung data sampel kedalam uji hipotesis
yang sesuai dengan data yang akan diuji.

5. Keputusan uji statistik


Hasil pengujian statistik akan menghasilkan dua kemungkinan keputusan yaitu
menolak atau gagal menolak hipotesis nol.
Dengan menggunakan pendekatan klasik, untuk memutuskan apakah Ho ditolak
atau gagal ditolak dapat digunakan dengan cara membandingkan nilai perhitungan
uji statistik dengan nilai pada tabel. Nilai tabel yang dilihat sesuai dengan jenis
distribusi uji yang kita lakukan, misalnya kalau kita lakukan uji Z maka nilai tabel
dilihat dari tabel Z (tabel kurva normal). Jika kita menggunakan uji t maka setelah
diperoleh nilai perhitungan uji t kemudian dibandingkan nilai yang ada pada tabel t.
Besarnya nilai tabel sangat tergantung dari besarnya nilai alpha () dan tergantung
dari apakah uji yang digunakan one tail atau two tail.

*Uji dua arah/ dua sisi/two tail

daerah penolakan daerah penolakan


daerah penerimaan
(1)
/2 /2

* Uji satu arah/ satu sisi/ one tail


Pihak kanan
daerah penolakan
daerah penerimaan
(1)

Pihak kiri
daerah penolakan
daerah penerimaan
(1)

Aturan pengambilan keputusan, dengan contoh menyangkut distribusi normal

1. Uji dua arah


Hipotesis : Ho : =C atau 1 = 2
Ha : C atau 1  2

R Astuti 8
Pada  = 1% maka /2 = 0,05  Z  2,58
Pada  = 5% maka /2 = 0,025  Z  1,96

Bila Z hitung > 1,96 atau Z hitung < - 1,96  Tolak Ho pada taraf kemaknaan
5%. Artinya ada perbedaan atau ada hubungan

Bila Z antara – 1,96 sampai dengan 1,96  Gagal tolak Ho pada taraf kemaknaan
( ) 5%. Artinya tidak ada perbedaan atau tidak ada hubungan

daerah penolakan daerah penolakan


95%

– 1,96 1,96

2. Uji satu arah


a) Hipotesis : Ho :  = C atau 1 = 2
Ha :  > C atau 1 > 2

Pada  = 1%  Z = 2,33
Pada  = 5%  Z = 1,64

Bila Z hitung > 1,64  Tolak Ho pada taraf kemaknaan 5%


Bila Z hitung  1,64  Gagal tolak Ho pada taraf kemaknaan ( ) 5%.

daerah penolakan

95%
1,64

b). Hipotesis : Ho : =C atau 1 = 2


Ha : <C atau 1 < 2

Pada  = 1%  Z =  2,33
Pada  = 5%  Z =  1,64

Bila Z hitung <  1,64  Tolak Ho pada taraf kemaknaan 5%


Bila Z hitung   1,64  Gagal tolak Ho pada taraf kemaknaan ( ) 5%.

daerah penolakan
95%

 1,64

R Astuti 9
Soal :
1. Buat contoh hipotesis nol dan hipotesis alternatif
2. Buat contoh hipótesis satu ekor (one tail) dan hipótesis dua ekor (two tail)
3. Apa yang dimaksud kesalahan tipe 1 ()
4. Apa yang dimaksud kesalahan tipe 2 (β)
5. Apa yang dimaksud dengan kekuatan uji
6. Jelaskan urutan pengujian hipotesis

DISTRIBUSI NORMAL DAN UJI KENORMALAN

Pada distribusi probabilitas yang kontinyu, grafiknya dapat menggambarkan


berbagai tingkat kemiringan atau dalam beberapa kasus simetris sempurna.
Diantaranya yang terpenting adalah distribusi kontinyu yang kurvanya simetris, yaitu
distribusi normal. Distribusi normal merupakan distribusi probabilitas kontinyu yang
terpenting dalam seluruh bidang statistika.

Pada distribusi normal :


- kurvanya simetris
- berbentuk lonceng, merentang tak terbatas ke kedua arah
- menggambarkan data yang terjadi pada alam, pada manusia, industri.
- Disebut juga “distribusi Gauss”
Terjadi jika variabel acak x mempunyai fungsi dengan persamaan :

x- 2
1 -1/2 
f (x) =  e
2

Dimana :  : konstanta yaitu 3,1416


e : bilangan logaritma natural yaitu 2,7183
 : rata-rata hitung distribusi
 : simpangan baku distribusi

 maka x berdistribusi normal


Jika nilai mean = median = modus  kurvanya akan simetris

x= Me = Mo
Kurva simetris

R Astuti 10
Mo Me x x Me Mo

x > Me > Mo x < Me < Mo


Kurva menceng ke kanan Kurva menceng ke kiri
Kurva positif Kurva negatif

Kurva normal

f (x)

-3  +3 sumbu x

Sifat-sifat penting dari distribusi normal :


1. Grafik selalu diatas sumbu datar x
2. Grafik simetrik terhadap garis vertical melalui x = 
3. Modus tercapai pada x = 
4. Grafik mendekati sumbu datar x mulai dari +3 kekanan dan -3 kekiri
5. Luas grafik selalu sama dengan 1
6. Tinggi rendahnya kurva tergantung besarnya 
Makin besar , kurvanya makin rendah (platikurtis)
Makin kecil , kurvanya makin tinggi (leptokurtis)

1 1 < 2 < 3
1 = 2 = 3

2
3

R Astuti 11
Dengan demikian jika  dan  diketahui, maka akan diperoleh bentuk distribusi
normal, yang mana dapat dihitung probabilitas nilai-nilai x dengan memakai rumus
fungsi distribusi normal.

LUASAN DIBAWAH KURVA NORMAL

Probabilitas dimana nilai x nya mempunyai nilai antara x = x 1 dan x = x2 adalah


luasan dibawah kurva diantara titik x1 dan x2

f (x)

x1  x2 sumbu x

DISTRUBUSI NORMAL STANDARD


Distribusi normal standard adalah distribusi normal dengan rata-rata sama dengan nol
( = 0) dan simpangan baku sama dengan satu ( = 1)
Fungsi distribusi normal standard :

2
1 -1/2 [ Z ]
f (Z) =  e
2

Z dalam daerah -  < Z < +

Untuk mendapatkan probabilitas setiap nilai Z pada kurva normal standard telah
disusun sebuah daftar yang disebut “tabel distribusi normal standar”. Berdasarkan
tabel inilah probabilitas setiap nilai x pada distribusi normal umum dapat dihitung,
melalui suatu transformasi.

Dari hubungan distribusi normal umum dan normal standard dapat diperoleh suatu
rumus transformasi dari nilai x (distribusi normal umum) ke nilai Z (distribusi normal
standard).

Transformasinya:

x -
Z = 

Perubahan grafiknya dapat dilihat dalam gambar dibawah ini:

R Astuti 12
f (x) Rata-rata = 
Simpangan baku = 

-3 -2 -1  +1 +2 +3 x

f (z) =0
=1

-3 -2 -1 0 1 2 3 z

Tabel Distribusi Normal Normal Standard


Untuk mendapatkan probabilitas setiap nilai x pada distribusi normal umum
(yang dapat diperoleh secara empiris) adalah dengan menghitung probabilitas nilai Z
yang sesuai dengan distribusi normal standard dengan suatu transformasi. Dan untuk
mendapatkan probabilitas setiap nilai Z telah disusun “table distribusi normal
standard”.
Berdasarkan table distribusi normal standard diperoleh ketentuan-ketentuan sebagai
berikut:
  1 SD memberikan luas daerah 68,27 %
  2 SD memberikan luas daerah 95,45 %
  3 SD memberikan luas daerah 99,74 %

UJI KENORMALAN

 Apakah data berasal dari populasi yang berdistribusi normal?


Bisa digunakan uji Kolmogorof Smirnov
Ho : F (x) = Fo (x)
F (x) adalah fungsi distribusi populasi yang diwakili oleh sampel
Fo (x) adalah fungsi distribusi suatu populasi berdistribusi normal
Atau
DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
NORMAL

Ha : F (x)  Fo (x) (uji two tail)


DATA BERASAL DARI POPULASI YANG BERDISTRIBUSI
TIDAK NORMAL

Kesimpulan :
Jika p-value > 0,05  Ho diterima/gagal ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi normal

R Astuti 13
Jika p-value < 0,05  Ho ditolak
Sehingga kesimpulannya data berasal dari populasi
yang berdistribusi tidak normal

Contoh:

umur ibu

Cumulative
Frequency Percent Valid Percent Percent
Valid 22 2 10.0 10.0 10.0
25 3 15.0 15.0 25.0
27 1 5.0 5.0 30.0
31 4 20.0 20.0 50.0
32 1 5.0 5.0 55.0
33 1 5.0 5.0 60.0
34 2 10.0 10.0 70.0
36 1 5.0 5.0 75.0
39 1 5.0 5.0 80.0
40 2 10.0 10.0 90.0
43 1 5.0 5.0 95.0
47 1 5.0 5.0 100.0
Total 20 100.0 100.0

Pada output diatas terlihat distribusi frekuensi masing-masing data umur


Ibu yang berumur 22 tahun sebanyak 2 orang atau 2/20 * 100% = 10,0 %
Ibu yang berumur 25 tahun sebanyak 3 orang atau 3/20 * 100% = 15,0 %
Oleh karena itu kumulatif persen menjadi 10,0 % + 15,0 % = 25,0 %

umur ibu
6

2
Frequency

1 Std. Dev = 6.96


Mean = 32.4
0 N = 20.00
20.0 25.0 30.0 35.0 40.0 45.0

umur ibu

Gambar diatas memperlihatkan histogram umur ibu dan garis / kurva normal
dari variabel umur ibu. Terlihat bahwa batang histogram mempunyai
kemiripan bentuk dengan kurva normal (berbentuk seperti lonceng). Hal ini
membuktikan bahwa distribusi tersebut sudah dapat dikatakan normal atau
mendekati normal. Namun pengujian normalitas lebih jelas pada explore data.

Pengujian normalitas dengan explore data.

R Astuti 14
Descriptives

Statistic Std. Error


umur ibu Mean 32,40 1,557
95% Confidence Lower Bound 29,14
Interval for Mean Upper Bound
35,66

5% Trimmed Mean 32,17


Median 31,50
Variance 48,463
Std. Deviation 6,962
Minimum 22
Maximum 47
Range 25
Interquartile Range 12,75
Skewness ,328 ,512
Kurtosis -,461 ,992

Output ini memberikan informasi ringkasan statistik deskripsi dari data umur ibu

 Mean (rata-rata) umur ibu adalah 32,4 tahun

 95% CI : 29,11 – 35,66 (artinya pada tingkat kepercayaan 95% rata-rata umur
ibu pada populasi antara 29,11 – 35,66 ).

 Median atau tititk tengah data jika semua data diurutkan dan dibagi dua sama
besar. Angka median umur ibu adalah 31.5 tahun menunjukkan bahwa 50%
pengetahuan gizi ibu adalah 31,5 tahun keatas dan 50% nya adalah 31,5 tahun
ke bawah.

 Variance adalah kuadrat dari standard deviasi yaitu 48,46 tahun .

 Standard deviasi atau simpangan baku adalah 6,96 dibulatkan 7 tahun


Penggunaan standar deviasi untuk menilai dispersi rata-rata dari sampel. Untuk
itu dengan standard deviasi tertentu dan pada tingkat kepercayaan 95% (SPSS
sebagian besar menggunakan angka ini sebagai standar), rata-rata umur ibu pada
sampel menjadi :
rata-rata  2 standard deviasi
NB: angka 2 digunakan karena tingkat kepercayaan 95%
Maka: 32,4  2 ( 7 )
= 46,4 sampai 18,4 (tahun)

 Nilai Minimum adalah 22 tahun dan maximum adalah 47 tahun. Umur ibu
terendah adalah 22 tahun dan umur paling tua adalah 47 tahun.

 Range adalah data maksimum – data minimum atau dalam kasus ini :
47 – 22 = 25
 Rasio skewness adalah = nilai skewness/ standard error of skewness
= 0,328 / 0,512 = 0,640

Rasio kurtosis adalah : nilai kurtosis / standard error of kurtosis


= – 0,461 / 0,922 = – 0,5

R Astuti 15
Oleh karena kedua hasil terletak antara – 2 sampai dengan + 2, maka dapat
dikatakan distribusi data umur ibu adalah normal atau mendekati normal.

 Output uji kenormalan data:


Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu ,120 20 ,200* ,960 20 ,542
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Pada uji kenormalan , pedoman pengambilan keputusan adalah :


Nilai sig (signifikansi) atau nilai probabilitas < 0,05, distribusi adalah tidak normal.
Nilai sig (signifikansi) atau nilai probabilitas > 0,05, distribusi adalah normal.

Pada uji Kolmogorov Smirnov , nilai sig atau p-value = 0,200. Karena > 0,05 maka
dapat dikatakan bahwa distribusi data umur ibu adalah normal.

Pada uji Saphiro-Wilk, nilai sig atau p-value = 0,542. Karena > 0,05 maka dapat
dikatakan bahwa distribusi data umur ibu adalah normal.

Output histogram
Histogram
6

2
Frequency

1 Std. Dev = 6,96


Mean = 32,4

0 N = 20,00
20,0 25,0 30,0 35,0 40,0 45,0

umur ibu

Histogram dari data umur ibu.

Output stem and leaf


umur ibu Stem-and-Leaf Plot

Frequency Stem & Leaf

2,00 2 . 22
4,00 2 . 5557
8,00 3 . 11112344
2,00 3 . 69

R Astuti 16
3,00 4 . 003
1,00 4 . 7

Stem width: 10
Each leaf: 1 case(s)

Interpretasi :
Pada baris 1 : Ada 2 data umur ibu (frequency = 2) yang mempunyai stem = 2
dan leaf = 22, yang berarti terdapat 2 orang ibu yang mempunyai umur 22 dan 22
tahun.

Pada baris 2 : Ada 4 data umur ibu (frequency = 4) yang mempunyai stem = 2
dan leaf = 5,5,5,7 yang berarti terdapat 4 orang ibu yang mempunyai umur 25, 25,
25, 27

Dan seterusnya sampai pada baris ke6 , yaitu ada 1 orang ibu yang mempunyai
umur 47 tahun.

Output untuk menguji normalitas dengan Plot (Q-Q plot)

Normal Q-Q Plot of umur ibu


2,0

1,5

1,0

,5

0,0
Expected Normal

-,5

-1,0

-1,5
20 30 40 50

Observed Value

Pada gambar Q-Q plot untuk variabel umur terlihat ada garis lurus dari kiri ke
kanan atas. Garis itu berasal dari nilai Z skore. Jika suatu distribusi data normal,
maka data akan tersebar di sekeliling garis. Oleh karena itu dapat dikatakan bahwa
distribusi data adalah normal.
Output untuk menguji normalitas dengan Plot (Detrended NormalQ-Q plot)

R Astuti 17
Detrended Normal Q-Q Plot of umur ibu
,5

,4

,3

,2

,1

-,0
Dev from Normal

-,1

-,2

-,3
20 30 40 50

Observed Value

Output ini untuk mendeteksi pola-pola dari titik-titik yang bukan bagian dari
kurva normal. Terlihat bahwa sebagian data terpola di sekitar garis. Hal ini
membuktikan bahwa distribusi data adalah normal.

Output boxplot
Boxplot adalah kotak pada gambar berwarna merah atau warna lain dengan
garis tebal horizontal di kotak tersebut. Kotak merah tersebut memuat 50%
data. Sedangkan garis tebal hitam median data. Jika garis hitam terletak persis
di tengah boxplot, maka distribusi data adalah normal. Jika berada di sebelah
atas, distribusi menceng ke kiri dan jika di sebelah bawah, distribusi menceng
ke kanan.

50

40

30

20
N= 20

umur ibu

Dari output diatas terlihat garis median berada ditengah. Hal ini menunjukkan
distribusi data normal.

R Astuti 18
Daftar pustaka
1. Budiarto. Biostatistika untuk kedokteran dan kesehatan masyarakat. EGC. Jakarta.
2002
2. Chandra, B. Pengantar Statistik Kesehatan. Penerbit Buku Kedokteran EGC.
Jakarta.1995.
3. Dawson B, Trapp RG. Basic and Clinical Biostatistics. Third Edition. McGraw-
Hill International Editions. Lange Medical Books, The McGraw-Hill Companies.
2001.
3. Kuzma. Basic Statistics for the Health Sciences. Mayfield Publishing Company.
1984
4. Norman and Streiner. Biostatistics : The Bare Essentials, Mosby. 1994.
5. Pagano, M dan K. Gaureau. Principles of Biostatistics. Belmont, Duxury Press.
1993.
6. Sabri dan Hastomo. Statistika kesehatan. PT Raja Grafindo Persada. Jakarta. 2006.
7. Sheskin, D.J. Handbook of Parametric and Nonparametric Statistical Prosedures.
Third Edition. Chapman & Hall/CRC. Florida.

R Astuti 19

Anda mungkin juga menyukai