Anda di halaman 1dari 9

BAB II.

UJI GOODNEES OF FIT UNTUK


DISTRIBUSI NORMAL

2.1. Pengantar
Dalam kuliah metode Sraristik I semester yang lalu, kita telah mempelajari berbagai
prosedur uji hipotesis statisrik tentang parameter-parameter suatu populasi, seperti mean µ,
variansi σ2, dan proporsi p. demikian juga, berbagai prosedur uji hipotesis tentang parameter-
parameter dua populasi. Beberapa diantara prosedur-prosedur yang dipelajari, telah diturunkan
dari anggapan bahwa distribusi populasinya adalah normal. Anggapan normalitas seperti itu
kadang-kadang didukung oleh suatu dasar teori tertentu. Namun, kadang-kadang dapat juga
didukung olrh hasil hipotesis tertentu,, yang dikenal sebagai uji goodnees of fit distribusi
normal. Prosedur uji goodnees of fit inilah yang menjadi topik pembicaraan dalam kegiatan
belajar ini.

2.2. Metode Chi-kuadrat.


Prosedur uji goodnees of fit bahwa suatu sample telah diambil dari suatu populasi
berdistribusi normal didasarkan pada metode pendekatan Chi-kuadrat yang telah kita pelajari
sebelumnya, yakni Teorema 1.
Statistik uji yang digunakan adalah:
k
(Oi − Ei ) 2
W = ∑ Ei
i =1

Adapun Oi , i = 1,2,..,k, adalah frekuwensi observasi dan Ei , i = 1,2,…,k, adalah frekwensi yang
diharapkan di bawah H 0 . untuk n besar, transformai W mendekati distribusi Chi-kuadrat dengan
derajat bebas tertentu.
Dalam hal ini, besar derajat bebas sama dengan k dikurangi banyak kuantitas yang diperoleh dari
observasi yang digunakan untuk menghitung frekwensi harapan.
Karena prosedur uji hipotesis ini didasarkan atas distribusi pendekatan, maka prosedur ini
sebaiknya tidak digunakan jika frekuensi harapan sangat kecil. Aturan yang biasanya dijanjikan
adalah prosedur Chi-kuadrat, ini digunakan jika tidak ada frekwensi harapan yang lebh kecil dari
lima. Jika dalam hitungan kita terdapat frekwensi harapan yang lebih kecil dari 5, maka
frekwensi ini dapat dugabungkan dengan frekwensi yang lain, supaya aturan di atas terpenuhi.
Selanjutnya perhatikan contoh di bawah ini.

Contoh 7

Kita pandang distribusi frekuensi tahan hidup empat puluh bateri merek PQR sebagai
berikut.

11
Tabel 2.1 Distribusi Frekuensi Tahan Hidup
40 Bateri Merek PQR
Tahan Hidup (tahun) Banyak Bateri
(Kelas Interval) (frekuensi)
1,45 – 1,95 2
1,95 – 2,45 1
2,45 – 2,95 4
2,95 – 3,45 15
3,45 – 3,95 10
3,95 – 4,45 5
4,45 – 4,49 3
Jumlah 40

Keterangan:
Data tahan hidup ini dicatat dalam bilangan dengan satu angka di belakang koma.

Kita ingin melakukan uji goodness fit, apakah distribusi frekuensi tahan hidup 40 bateri
itu dapat kita pandang sebagai sampel random dari suatu populasi normal yang mean dan deviasi
standarnya tidak diketahui. Uji hipotesis ini kita lakukan dengan statistik penguji W, yakni
membandingkan frekuensi observasi itu dengan frekuensi yang diharapkan apabila populasinya
berdistribusi normal. Frekuensi yang diharapkan untuk tiap-tiap kelas diperoleh dari kurve
normal yang mempunyai mean dan deviasi standar sama dengan mean dan deviasi standar
distribusi frekuensi (sampel) kita itu. Maka, pertama-tama marilah kita hitung mean dan deviasi
standar distribusi frekuensi itu dengan cara seperti yang pernah kita pelajari. Untuk ini kita buat
table sebagai berikut.
Tabel 2.2 Menghitung Mean Dan Deviasi Standart
Kelas Frekuensi Titik tengah fiXi FiXi2
Interval (fi) (Xi)
1,45 – 1,95 2 1,7 3,4 5,78
1,95 – 2,45 1 2,2 2,2 4,84
2,45 – 2,95 4 2,7 10,8 29,16
2,95 – 3,45 15 3,2 48,0 153,60
3,45 – 3,95 10 3,7 37,0 136,90
3,95 – 4,45 5 4,2 21,0 88,20
4,45 – 4,49 3 4,7 14,0 66,27
Jumlah 40 136,5 484,75
Diperoleh

12
k
∑ fi X i 136,5
i =1
Mean : X = k
= = 3, 4125
40
∑ fi
i =1

  k  
2
  ∑ fi xi  
1 k 2  i =1  
S2 = k  ∑ fi xi − k 

∑ fi − 1  i =1
∑ fi 
i =1 i =1
 
1  (136,5)2 
=  (484,75) −  = 2756,84
39  40 

Jadi deviasi standart S= S 2 = 0, 6969

Harga-harga ini selanjutnya kita gunakan untuk menghitung harga z tiap-tiap batas kelas.
Misalnya, harga z untuk batas-batas kelas yang kedua adalah
x−µ 1,95 − 3, 4125
Dari z = → z1 = = − 2,10
σ 0, 6969

2, 45 − 3, 4125
z2 = = − 1,38
0, 6969

harga z untuk batas-batas kelas yang ke-4 adalah


2,95 − 3, 4125
z3 = = −0, 66
0, 6969

3, 45 − 3, 4125
z4 = = 0, 05
0, 6969

harga z untuk batas-batas kelas yang ke-6 adalah


3,95 − 3, 4125
z5 = = 0, 77
0, 6969

4, 45 − 3, 4125
z6 = = 1, 49
0, 6969

Dapat dicatat bahwa dengan hitungan-hitungan tersebut di atas, maka harga z batas-batas
kelas ke tiga dan kelima sudah diketahui pula. Sedangkan untuk kelas pertama kita hanya

13
memerlukan batas atas dan untuk kelas terakhir hanya batas bawahnya yang keduanya telah kita
peroleh juga dari hitungan-hitungan.
Selanjutnya dengan tabel distribusi normal standar dapat kita peroleh luas bagian-bagian
kurve sebagai berikut.

Lx (1,45 < X < 1,95) ≈ L x (-∞ < X < 1,95)


= Lz (-∞ < z < 2,10)
= 0,5 – 0,4821 = 0,0179

Lx (1,95 < X < 2,45) = Lz (– 2,10 < z < – 1,38)


= 0,4821 – 0,4162 = 0,0659

Lx (2,45 < X 2,95) = Lz (– 1,38 < z < – 0,66)


= 0,4162 – 0,2454 = 0,1708

Lx (2,95 < X 3,45) = Lz (– 0,66 < z < 0,05)


= 0,2454 + 0,0199 = 0,2653

Lx (3,45 < X 3,95 = Lz (0,05 < z < 0,77)


= 0,2794 – 0,0199 = 0,2595

Lx (3,95 < X 4,45) = Lz (0,77 < z < 1,49)


= 0,4319 – 0,2794 = 0,1525
Lx (4,45 < X < 4,95) ≈ Lx (– 4,45 < X < ∞ )
= Lz (1,49 < z < ∞ )
= 0,5 – 0,4319 = 0,0681
maka frekuensi harapan untuk masing-masing kelas dapat dihitung, yaitu
Kelas pertama : 0,0179 x 40 = 0,7
Kelas kedua : 0,0659 x 40 = 2,6
Kelas ketiga : 0,1708 x 40 = 6,8
Kelas keempat : 0,2653 x 40 = 10,6
Kelas kelima : 0,2595 x 40 = 10,4
Kelas keenam : 0,1525 x 40 = 6,1
Kelas terakhir : 0,0681 x 40 = 2,8

Maka dapat disusun tabel frekuensi dengan frekuensi observasi ( Oi ), dan frekuensi
harapan ( Ei ) sebagai berikut.

Tabel 2.3. Distribusi Frekuensi dengan Oi dan Ei


Kelas interval Oi Ei
1,45 – 1,95 2 0,7
1,95 – 2,45 1 2,6

14
2,45 – 2,95 4 6,8
2,95 – 3,45 15 10,6
3,45 – 3,95 10 10,4
3,95 – 4,45 5 6,1
4,45 – 4,49 3 2,8

Terlihat ada bebrapa kelas interval yang mempunyai frekuensi harapan kurang dari 5.
Supaya metode Chi-kuadrat untuk uji goodness of fit dapat digunakan, maka perlu
dilakukan penggabungan-penggabungan kelas sehingga tidak ada frekuensi harapan kurang dari
5. untuk ini kelas pertama, kedua, dan ketiga digabungkan menjadi satu, demikian juga kelas
keenam dan terakhir, sehingga kita hanya mempunyai empat kelas saja. Dengan distribusi
frekuensi ini kita ingin menguji hipotesis.

a) Hipotesis: H 0 : Sampel diambil dari populasi berdistribusi normal


H1 : H 0 tidak benar.

b) Digunakan. α = 0, 05 .
k
(Oi − Ei )2
c) Dengan statistik uji : W = ∑ E
i =1 i
Mendekati distribusi Chi-kuadrat dengan derajat bebas 4 − 3 = 1, karena kelas k = 4,
dan 3 kuantitas, yakni jumlah frekuensi n = 40, mean dan deviasi standar yang dihitung
dari data observasi, yang digunakan dalam menghitung frekuensi harapan

d). Daerah kritik H 0 ditolak jika


0,05 W > χ (1;
2
0,05) = 3,8415

0 3,8415
Gambar 2.1. Daerah Kritis Satu sisi

Kita hitung statistik uji

(7 − 10,1)2 (15 − 10, 6)2 (10 − 10, 4)2 (8 − 8, 9)2


W = + + +
10,1 10, 6 10, 4 8,9

= 2,8843
e). Kesimpulan
Karena W = 2,8843 < 3,8415, maka H 0 tidak ditolak.
Dengan demikian dapat kita simpulkan bahwa distribusi normal cukup cocok sebagai
distribusi populasi tahan hidup bateri merek PQR itu.

15
2.3. Uji Normalitas Lilliefors.
Dalam uji goodnees of fit dengan metode Chi-kuadrat yang kita bicarakan diatas, data
yang kita punyai harus dikelompokkan. Data ini harus cukup banyak untuk dapat dikelompokkan
dengan baik. Satu kelemahan dari metode Chi-kuadrat adalah bahwa metode ini merupakan
metode pendekatan.
Di sini akan kita pelajari satu uji goodnees of fit untuk distribusi normal yang lain, yang
pertama kali dikemukakan oleh Lilliefors. Uji normalitas ini dapat kita gunakan untuk sampel
kecil dan data tidak perlu dikelompokkan. Prosedurnya adalah sebgai berikut:
Misalakan kita punya data sampel random berukuran n, X1, X 2 , . . . . , X n , yang diambil
dari suatu populasi yang distribusinya tidak diketahui.
Dihitung mean sampel:
1 n
X = ∑ X i → sebagai estimasi mean populasinya
n i =1

Jika µ yang tidak diketahui, maka deviasi standar sampel adalah

n 2
S =
1
( n − 1) i∑
( Xi − X) → sebagai estimasi deviasi standar populasinya yang juga tidak
=1
diketahui

Selanjutnya kita hitung harga variabel unit standar Zi dengan rumus

Xi − X
Zi = ; i = 1,2,…,n
s

Harga statistik penguji untuk uji normalitas ini kita hitung dari harga-harga Zi ; i=
1,2,…,n, dan bukan dari data sampel aslinya.

• Langkah-langkah uji normalitas ini adalah:


a) Hipotesis
H 0 : sampel ramdom itu berasal dari populasi normal yang mean dan deviasi
standarnya tidak diketahui.
H1 : distribusi populasinya tidak normal.

b) Dipilih timgkat signifikansi α .


c) statistik uji yang digunakan
didefenisikan sebagai jarak vertical maksimum antara fungsi distribusi empirik sample
random X1, X 2 ,. . . . , X n , dengan fungsi distribusi normal dengan mean X dan deviasi
standar S, yakni

16
T = maks F * ( x) − S ( x)
x
Dengan F *( x) adalah fungsi distribusi kumulatif normal standar dan S ( x) adalah funfsi
distribusi kumulatif empirik Z i . Statistik penguji T dinamakan statistik penguji Lillefors.
d). Daerah kritik uji normalitas ini adalah H 0 ditolak apabila harga statistik penguji T di
namakan dalam Tabel VI (lampiran).
Hitungan
Dari data sample random X1, X 2 ,. . . . , X n kita hitung mean X dan deviasi standar S.
Selanjutnya data diurutkan dari kecil ke besar. Untuk tiap-tiao X i yang telah berurut itu
kita hitung harga Z i , dan distribusi normal kumulatif, yakni F * ( xi ) , dan juga harga
distribusi kumulatif empirik S ( xi ) . Kemudian kita hitung statistik uji.

T = maks F * ( x) − S ( x)
x
Yakni kita cari selisih antara F * ( xi ) dan S ( x) yang terbesar.

e). Kesimpulan
Dengan membandingkan T dengan daerah kritik pada d), kita ambil kesimpulan.

Contoh 8

Dipunyai data berat badan 50 orang (anak-anak dan dewasa) dalam kilogram
(dibulatkan). Dapatkah kita kata kan bahwa data itu merupakan sampel random dari suatu
populasi normal?
Pertama-tama kita hitung mean dan deviasi standar data itu, kita peroleh mean = 55,04
dan s = 19,00. Selanjutnya data kita urutkan dari yang terkecil sampai yang terbesar dan kita
hitung harga Z untuk tiap-tiap X. kemudian probabilitas normal kumulatif F ( x ) dan probabilitas
kumulatif empirik S ( x) , serta selisih F *( x) − S ( x) . Kita peroleh seperti yang tertuang dalam
tabel 2.4 dibawah ini.:

Cara menghitung F* (x) dan S (x) adalah sebagai berikut:


Untuk X = 27 misalnya F* (27) adalah luas kurve normal dari X = 27 ke kiri. Sehingga
dengan mengubah X = 27 ke standar unit Z = -1,48, yang dapat digunakan untuk menghitung F*
(27), yakni F* (27) = 0,5 – 0,4306 = 0,0694. Begitu seterusnya.
Sedangkan S(27) adalah banyak data yang lebih kecil atau sama dengan 27 dibagi banyak
semua data yang ada. Jadi, S(27) = 4/50 = 0,08. Demikian seterusnya. Dengan cara ini, table di
atas dapat kita lengkapi, dan selanjutnya dapat dicari

T = maks F * ( x) − S ( x)
x

17
Maka uji normalitas adalah sebagai berikut:
a) H 0 : Sampel random itu berasal dari populasi normal
H1 : Distribusi populasi tidak normal.

b) Digunakan α = 0,05.

c) Dengan statistik penguji T = F *( x) − S ( x)

d) dipunyai daerah kritik: H 0 ditolak apabila T > 0,0125.

Tabel 2.4. Hitungan Untuk Uji Liliefors


Xi Zi F*(Xi) S(xi) [F*(x)-S(x)] Xi Zi F*(Xi) S(xi) [F*(x)-S(x)]
23 58
 -1,69 0,0455 0,04 0,0055 58
23 58
24 -1,63 0,0516 0,06 0,0083  0,16 0,5636 0,58 0,0164
58
27 -1,48 0,0681 0,08 0,0119
29 -1,37 0,0857 0,10 0,0143 59 0,21 0,5832 0,60 0,0168
31 -1,27 0,1020 0,12 0,0180 61
32 -1,21 0,1131 0,14 0,0269  0,31 0,6217 0,64 0,0183
61
33
 -1,16 0,1230 0,18 0,0570 62 0,37 0,6443 0,66 0,0383
33 63 0,42 0,6628 0,68 0,0172
35 -1,05 0,1469 0,20 0,0531 64 0,47 0,6808 0,70 0,0192
36 -1,00 0,1587 0,22 0,0613 65 0,52 0,6985 0,72 0,0215
37 -0,95 0,1711 0,24 0,0689 66 0,58 0,7190 0,74 0,0210
40 -0,79 0,2148 0,26 0,0452 68
42 -0,69 0,2451 0,28 0,0349  0,68 0,7517 0,78 0,0283
68
43
-0,63 0,2643 0,32 0,0557 70 0,79 0,7852 0,80 0,0148

43 73
44 -0,58 0,2810 0,34 0,0590  0,95 0,8289 0,84 0,0111
-0,53 0,2981 0,36 0,0619 73
45
74 1,00 0,8413 0,86 0,0187
48
-0,37 0,3557 0,40 0,0443 75 1,05 0,8531 0,88 0,0269

48 77 1,16 0,8770 0,90 0,0230
81 1,37 0,9147 0,92 0,0053
54  1,68 0,9535 0,94 0,0135
-0,05 0,4801 0,44 0,0401 87
 89 1,79 0,9633 0,96 0,0033
54 
-0,05 0,5199 0,46 0,0599 93 2,00 0,9772 0,98 0,0028
56 97 2,21 0,9864 1,00 0,0136
57 
 -0,10 0,5398 0,50 0,0398
57 

18
e) Dari table di atas dapat dilihat bahwa T = 0,0689.
f) Kesimpulan:
Karena T = 0,0689 < 0.125, maka H 0 tidak ditolak. Ini berarti sample random itu dapat
dianggap dari populasi berdistribusi normal.

Contoh 9

Nilai ujian statistik 20 orang mahasiswa adalah:


91 50 73 74 55 86 70 43 47 80
40 85 64 61 58 95 52 67 83 92

Lakukan uji goodness of fit bahwa sample random berasal dari populasi normal dengan metode
Lilliefors.
Jawab:

a) H 0 : Sampel random itu berasal dari populasi normal


H1 : Distribusi populasi tidak normal.

b) Digunakan α = 0,10
c) Dengan statistik penguji T = [F* (x) – S (x)]

d) dipunyai daerah kritik: H0 ditolak apabila T > 0,174.

Tabel 2.5. Hitungan Untuk Uji Lilliefors

Xi Zi F * ( x) S ( x) F * ( x) − S ( x) Xi Zi F * ( x) S ( x) F * ( x) − S ( x)
40 -1,64 0,0505 0,05 0,0005 70 0,10 0,5398 0,55 0,0102
43 -1,47 0,0708 0,10 0,0292 73 0,27 0,6064 0,60 0,0064
47 -1,24 0,1075 0,15 0,0425 74 0,33 0,6293 0,65 0,0207
50 -1,06 0,1446 0,20 0,0554 80 0,68 0,7517 0,70 0,0517
52 -0,95 0,1711 0,25 0,0789 83 0,85 0,8023 0,75 0,0523
55 -0,77 0,2206 0,30 0,0794 85 0,97 0,8340 0,80 0,0340
58 -0,60 0,2743 0,35 0,0757 86 1,03 0,8485 0,85 0,0015
61 -0,42 0,3372 0,40 0,0628 91 1,32 0,9066 0,90 0,0066
64 -0,25 0,4013 0,45 0,0487 92 1,38 0,9162 0,95 0,0338
67 -0,08 0,4681 0,50 0,0319 95 1,55 0,9394 1,00 0,0606

Dari table di atas terlihat bahwa T = 0,0794


Kita lakukan hitungan dalam tabel yang berikut dengan mean = 68,3 dan s = 17,236.

e) Kesipulan:
Karena T = 0,0794 < 0,174, maka Ho tidak ditolak. Ini berarti sample random di atas
dapat dianggap berasal dari populasi normal.

19

Anda mungkin juga menyukai