NPM : 20411023
Prodi/Semester : Pendidikan Matematika/4
Mata Kuliah : Statistika Lanjutan
Dosen Pengampu : Pak Egi Adha Juniawan, M.Pd
Pertemuan : 7
Materi : Uji Normalitas
Uji Normalitas berguna untuk menentukan data yang telah dikumpulkan berdistribusi
normal atau diambil dari populasi normal. Metode klasik dalam pengujian normalitas
suatu data tidak begitu rumit. Berdasarkan pengalaman empiris beberapa pakar statistik,
data yang banyaknya lebih dari 30 angka (n > 30), maka sudah dapat diasumsikan
berdistribusi normal. Biasa dikatakan sebagai sampel besar.
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji normalitas. Karena belum tentu data yang lebih dari 30 bisa
dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30
belum tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. uji statistik yang
dapat digunakan diantaranya adalah: Uji Chi-Square, Kolmogrov Smirnov, Liliefors,
Shapiro Wilk, Jarque Bera.
1. Metode Chi Square Dalam Uji Normalitas (Uji Goodness of fit Distribusi
Normal)
Metode Chi-Square atau X2 untuk Uji Goodness of fit Distribusi Normal
menggunakan pendekatan penjumlahan penyimpangan data observasi tiap kelas
dengan nilai yang diharapkan. Uji Chi-square seringkali digunakan oleh para
peneliti sebagai alat uji normalitas.
Rumus uji normalitas untuk Metode Chi Square dalam Uji Normalitas
❑
(Oi−Ei )
X 2 =∑
❑ Ei
Keterangan :
2
X : Nilai X2
O i : Nilai observasi
Ei : Nilai expected/harapan, luasan interval kelas berdasarkan tabel normal dikalikan
N (total frekuensi) pi . N
N : Banyaknya anggota pada data (total frkuensi)
Syarat Uji Square dalam Uji Normalitas
Contoh
Diambil tinggi badan mahasiswa di suatu Perguruan Tinggi tahun 2010
Penyelesaian
1. Hipotesis
Ho : Populai tinggi badan mahasiswa berdistribusi normal
H1 : Populasi tinggi badan mahasiswa tidak berdistribusi normal
2. Nilai α
Nilai α =5 %=0,05
❑ Ei
¿ 0.427
4. Derajat Bebas
Df =( k −3 )= (5−3 ) =2
5. Nilai Tabel
6. Daerah Penolakan
Menggunakan rumus :
|0,427|<|5,991|
7. Kesimpulan
Contoh
Diketahui hasil jumlah benar soal statistik dari 150 nomor soal pilihan ganda yang
diikuti 40 mahasiswa adalah sebagai berikut
Penyelesaian
1. Hipotesis
2. Nilai α
Nilai α =0,05
3. Statistik penguji
Rumus
f kum X i−X
kp= Z=
n sd
Menentukan nilai a1 dan a2
|
a1= selisih z tabel dan kp pada batas bawah a 1= a 2−
f
n |
F(z) : luas kurva F(z) dengan melihat tabel Z negatif dan positif
Jumlah data pada soal sebanyak 40 data serta α =0,05. Maka untuk menentukan
Kolmogorov-Smirnov tabel maka menggunakkan rumus
1,36 1,36
Kolmogorov−Smirnov tabel= = =0,215
√ n √ 40
5. Membandingkan Kolmogorov-Smirnov hitung dan Kolmogorov-Smirnov tabel
0,0451<0,02150
6. Kesimpulan
Uji lilliefors adalah uji yang digunakan untuk mengetahui apakah data berdistribusi
normal atau tidak.
Hipotesis :
Ho : data berdistribusi normal
H1 : data tidak berdistribusi normal
Penarikan Kesimpulan
Apabila nilai Lo hitung < Lo tabel maka Ho diterima dengan kesimpulan data
berdistribusi normal.
Apabila nilai Lo hitung > Lo tabe; maka Ho ditolak dengan kesimpulan data
berdistribusi tidak normal.
Rumus Perhitungan
Y i−Y
1. Z=
Sy
2. F Zi=tabel Z
3. SZ i =¿ ¿
4. |F Zi −S Zi|
5. Lo=Max (|F Zi−S Zi|)
Contoh
Misalkan diketahui data sampel sbb : 23, 27, 33, 40, 48, 48, 57, 59, 62, 68, 69, 70.
Ujilah apakah data sampel ini berasal dari populasi berdistribusi normal
Penyelesain
1. Hipotesis
Ho : data berdistribusi normal
H1 : data tidak berdistribusi normal
2. Nilai α =0,05
3. Statistik Pengujian
Mutlak (F(Zi- Lo
Yi Z F(Zi) S(Zi) Lo
S(Zi) Tabel
1 23 -1,65163 0,049 0,083333 0,034333333
2 27 -1,40993 0,0793 0,166667 0,087366667
3 33 -1,04738 0,1469 0,25 0,1031
4 40 -0,6244 0,2676 0,333333 0,065733333
5 48 -0,14099 0,4443 0,416667 0,027633333
6 48 -0,14099 0,4443 0,5 0,0557
0,117 0,242
7 57 0,402837 0,6554 0,583333 0,072066667
8 59 0,523688 0,7019 0,666667 0,035233333
9 62 0,704965 0,7611 0,75 0,0111
10 68 1,067519 0,8577 0,833333 0,024366667
11 69 1,127944 0,8708 0,916667 0,045866667
12 70 1,18837 0,883 1 0,117
Total 604
Rata-
50,33333
Rata
Varians 273,8788
Simp.
16,54928
Baku
0,117< 0,242
Lo hitung < Lo tabel artinya Ho diterima, H1 ditolak
4. Kesimulan
Dapat disimpulkan bahwa data berdistribusi normal.
4. Shapiro Wilk
Nilai signifikansi Shapiro-Wilk test of normality harus > 0,05. Metode Shapiro-Wilk
menggunakan data yang belum diolah dalam tabel distribusi frekuensi. Data diurut,
kemudian dibagi dalam dua kelompok untuk dikonversi dalam Shapiro Wilk. Dapat
juga dilanjutkan transformasi dalam nilai Z untuk dapat dihitung luasan kurva normal
Rumus
1
T 3= ¿¿
D
Keterangan :
n
D=∑ ( X i− X )
2
i=1
Keterangan :
X : rata-rata data
Prasyarat
Signifikansi
Contoh
Berdasarkan data ujian matematika sebagian siswa yang diambil secara random dari
kelas VII sebanyak 24 siswa, didapatkan data sbb : 58, 36, 24, 23, 19, 36, 58, 34, 33,
56, 33, 26, 46, 41, 40, 37, 36, 35, 18, 55, 48, 32, 30, 27 bulan. Selidikilah data
tersebut apakah data tersebut diambil dari populasi yang berdistribusi normal α =5 %
Jawab
1. Hipotesis
Ho : dataset berdistribusi normal
H1 : dataset tidak berdistribusi normal
2. Nilai α
α =5 %=0,05
3. Statistik Penguji
Mencari Nilai D
2
No X X i −X ( X i−X )
1 18 -18,70833333 350,0017361
2 19 -17,70833333 313,5850694
3 23 -13,70833333 187,9184028
4 24 -12,70833333 161,5017361
5 26 -10,70833333 114,6684028
6 27 -9,708333333 94,25173611
7 30 -6,708333333 45,00173611
8 32 -4,708333333 22,16840278
9 33 -3,708333333 13,75173611
10 33 -3,708333333 13,75173611
11 34 -2,708333333 7,335069444
12 35 -1,708333333 2,918402778
13 36 -0,708333333 0,501736111
14 36 -0,708333333 0,501736111
15 36 -0,708333333 0,501736111
16 37 0,291666667 0,085069444
17 40 3,291666667 10,83506944
18 41 4,291666667 18,41840278
19 46 9,291666667 86,33506944
20 48 11,29166667 127,5017361
21 55 18,29166667 334,5850694
22 56 19,29166667 372,1684028
23 58 21,29166667 453,3350694
24 58 21,29166667 453,3350694
Jumlah 881
36,708
X
3
D 3184,958333
Mencari Nilai T 3
I ai (X ¿ ¿ n−i+1− X i) ¿ a i( X ¿ ¿ n−i+1−X i )¿
1 0,4493 58 18 40 17,972
2 0,3098 58 19 39 12,0822
3 0,2554 56 23 33 8,4282
4 0,2145 55 24 31 6,6495
5 0,1807 48 26 22 3,9754
6 0,1512 46 27 19 2,8728
7 0,1245 41 30 11 1,3695
8 0,0997 40 32 8 0,7976
9 0,0764 37 33 4 0,3056
10 0,0539 36 33 3 0,1617
11 0,0321 36 34 2 0,0642
12 0,0107 36 35 1 0,0107
Jumlah 54,6894
1
T 3= ¿¿
D
4. Nilai Tabel (Shapiro Wilk)
T tabel nilai a ( 0,10 )=0,930; nilai a( 0,50)=0,963
5. Daerah penolakan
Nilai T 3 terletak diantara 0,930 dan 0,963, atau nilai p hitung terletak diantara
0,10 dan 0,50 yang di atas nilai α (0,05) berarti Ho diterima, H1 ditolak
6. Kesimpulan
Sampel diambil dari populasi berdistribusi normal, α =0,05
Langkah-langkah penyelesaian
1. Hipotesis
Ho : Data sampel berasal dari populasi yang berdistribusi normal
H1 : Data sampel berasal dari populasi yang berdistribusi tidak normal
2. Tentukan nilai Z tabel dengan a tertentu (1%, 5%,10%)
α =10 % → Z 0,10 =± 1.64
α
2
α =5 % → Z 0,05 =±1.96
α
2
α =1 % → Z 0,001 =± 2.58
α
2
( )
❑ 3
n xi−x
SKEW =
(n−1)(n−2) ❑ SD
∑
( )
❑ 2
n(n+1) xi−x 4 3 ( n−1 )
KURT =
(n−1)(n−2)(n−3) ❑ SD
∑ −
(n−2)(n−3)
5. Standarisasikan nilai skewness dan kurtosis tersebut
K −0
Z kurt = ,
24
N
S−0
√
Z skew=
6. Keputusan
6
N √
Terima atau tolak Ho
Contoh Soal
Pak Bendot akan meneliti pendapatan per hari tukang-tukang becak di desa
sukagenjot. Untuk keperluan tersebut pak bendot kumpulkan data beberapa orang
tukang becak di wilayahnya. Dari data terkumpul diperoleh informasinya sbb.
Nama Pendapatan
Miskun 10
Misno 12
Muheri 15
Daseri 16
Jiran 9
Jarwo 130
Kijan 16
Sarkum 17
Khasan 14
Sarno 8
Penyelesaian
1. Hipotesis
Ho : Data sampel berasal dari populasi yang berdistribusi normal
H1 : Data sampel berasal dari populasi yang berdistribusi tidak normal
2. Nilai Z tabel a=5 %
Nama
Pendapatan
(xi)
( xi−1 )2 ( σ)
xi−x 3
( σ)
xi−x 4
√
❑
∑ ( xi−x )2
σ= ❑
n−1
=
√ 12410.1
10−1
=37,13
( )
❑ 3
n xi−x 10
SKEW = ∑
(n−1)(n−2) ❑ SD
=
(10−1)(10−2)
22,458=3,11
(3 ( n−1 )2
)
❑
n(n+1) xi−x 4
KURT =
(n−1)(n−2)(n−3) ❑ SD
∑ −
(n−2)(n−3)
2
10 ( 10+1 ) 3 ( 10−1 )
¿ ( 64,792 )− =9,8
(10−1 ) ( 10−2 ) ( 10−3 ) (10−2 ) ( 10−3 )
5. Standarisasikan nilai skewness dan kurtosis tersebut
S−0 3,11−0
Z skew= = =4,01
N
6
√ √
K −0 9,8−0
10
6
Z kurt = = =6,3
24
N √ √ 24
10
6. Keputusan
Asumsikan menggunakan a=5 % , berarti Z tabelnya ± 1,96
Karena nilai Zskew dan Z kurt lebih besar dari Z tabel berarti Ho ditolak dan
data sampel berasal dari populasi yang tidak berdistribusi normal.
Uji Jarque Bera adalah salah satu uji normalitas jenis goodness of fit test yang mana
mengukur apakah skewness dan kurtosis sampel sesuai dengan distribusi normal.Uji
ini didasarkan pada kenyataan bahwa nilai skewness dan kurtosis dari distribusi
normal sama dengan nol. Oleh karena itu, nilai absolut dari parameter ini bisa menjadi
ukuran penyimpangan distribusi dari normal. Dalam aplikasinya nilai Jarque Bera
(JB) dibandingkan dengan nilai Chi-Square TABEL pada derajat kebebasan 2.
( )
2
n 2 (K−3)
JB= S
6 4
n
1
μ́ 4
∑
n i=1
( x i−x )4
K= =
σ́ 4
( )
n 2
1
∑
n i=1
( x i−x )2
n
1
μ́3 ∑
n i=1
( x i−x )
4
S= =
( )
3 3 /2
σ́ 1
n
∑
n i=1
( xi −x)
2
Keterangan
JB : Jarque Bara
n : jumalh sampel
S : Expected Skewness
K : Expected Excess Kurtosis
( )
2
S2 ( K−e K )
JBU= +
vS vK
Dimana
JBU : Adjusted Jarque Bara
S : Expected Skewness
K : Expected Excess Kurtosis
6(n−2)
v S=
(n+1)( n+3)
24 n(n−2)(n−3)
vK =
( n+ 1 )2( n+3)(n+5)
Cara lain yaitu dengan menggunakan Normal Probability Plot yaitu dengan
membandingkan distribusi kumulatif dari data sesungguhnya dengan distribusi
kumulatif dari distribusi normal.distribusi normal digambarkan dengan sebuah garis
diagonal lurus dari kiri bawah ke kanan atas. Distribusi kumulatif dari data
sesungguhnya digambarkan dengan ploting. Jika data normal, maka garis yang
menggambarkan data sesungguhnya akan mengikuti atau merapat ke garis
diagonalnya.