Anda di halaman 1dari 11

■ Goodness of Fit Test 1

UJI KECOCOKAN / KESESUAIAN DATA


(GOODNESS OF FIT TEST)

Uji kecocokan data (Goodness of Fit Test) adalah uji statistik yang digunakan untuk
menentukan apakah suatu sampel atau populasi dari data mempunyai distribusi teoritis
tertentu.
Dalam uji ini akan dibandingkan frekuensi dari distribusi data yang diamati dengan frekuensi
harapan dari distribusi teoritis yang dihipotesakan.

UJI KHI KUADRAT (χ2)


Langkah-langkah Pengujian :

 H0 : x ~ berdistribusi teoritis tertentu

H1 : tidak.

 Statistik Uji :

(o i  e i ) 2
k

 e
χ2 hitung = i1 i ~ berdistribusi χ2 α ; υ

dengan :

oi = frekuensi pengamatan data ke-i

ei = frekuensi harapan dari data ke-i

k = banyaknya data yang diamati atau banyaknya kelas interval

m = banyaknya besaran yang diperlukan dari data pengamatan yang


digunakan untuk menghitung frekuensi harapan (parameter distribusi)

α = tingkat signifikansi uji

ν = derajad bebas ; jika parameter distribusi diketahui , makaν = k – m


jika parameter tidak diketahui (dihitung dari data sampel), maka ν = k– m-1

 Daerah Kritis (Daerah Penolakan H0) :


Jika χ2 hitung > χ2 α ; υ → H0 ditolak

χ2 hitung ≤ χ2 α ; υ → H0 diterima

Catatan :
Jika frekuensi harapan dari data (kelas interval) ei < 5 , maka data (kelas interval) tersebut
harus digabung dengan data (kelas interval) didekatnya.
CONTOH :

by:Dana Marsetiya Utama


■ Goodness of Fit Test 2

1. Jumlah kegagalan pershift yang terjadi pada pabrik tenun diduga mengikuti distribusi
Poisson. Berdasarkan pengamatan selama 60 shift, diperoleh data sebagai berikut :
Jumlah Kegagalan Frekuensi Pengamatan
(x) (oi)
0 32
1 15
2 9
3 4
60
Gunakan α = 5% untuk menguji apakah dugaan tersebut benar.

0(32)  1(15)  2(9)  3( 4)
Rata-rata jumlah kegagalan = 60 = 0,75 = λ

 H0 : x ~ Poisson dengan λ = 0,75


H1 : tidak.
(o i  e i ) 2
k

 e
 Statistik Uji : χ2 hitung = i1 i

Menentukan Frekuensi Harapan :

e  λ ( λ) xi e 0,75 (0,75) xi
P(x = xi) = x i! = x i!

xi P(x=x i) ei = P(x=x i).60 oi (ei - oi)2/ei


0 0,472 28,32 32 0,48
1 0,354 21,24 15 1,83
2 0,133 7,98 9,96 9 13 0,93
3 0,033 1,98 4
3,24
2 2 2
(32  28,32) (15  21,24) (13  9,96)
 
χ2 hitung = 28,32 20,7 9,96 = 3,24
χ2 α=0,05 ; υ=3-1-1 = 3,841

Karena χ2 hitung < χ2 0,05 ; 1 → H0 diterima


Berarti x = jumlah kegagalan pershift berdistribusi Poisson dengan λ = 0,75

2. Sebuah dadu dilempar 180 kali. Hasilnya sebagai berikut :


x 1 2 3 4 5 6
Frekuensi (x) 28 36 36 30 27 23

by:Dana Marsetiya Utama


■ Goodness of Fit Test 3

Ujilah dengan α = 1%, apakah dadu tersebut setimbang.



Dadu setimbang jika P(x = xi) = 1/6 ; untuk i = 1, 2, 3, 4, 5, 6
Sehingga :
xi oi ei = P(x=x i).180 (ei - oi)2/ei
1 28 30 0,13
2 36 30 1,20
3 36 30 1,20
4 30 30 0,00
5 27 30 0,30
6 23 30 1,63
4,47

 H0 : dadu setimbang
H1 : tidak.
k
(o i  e i ) 2
 e
 Statistik Uji : χ2 hitung = i1 i = 4,47
χ2 α=0,01 ; υ=6-1 = 15,056
Karena χ2 hitung < χ2 0,01 ; 5 → H0 diterima
Berarti dadu setimbang.

3. Suatu produk tertentu dikatakan berkualitas baik jika mengandung bahan A, B, C dan D
dengan perbandingan 5 : 2 : 2 : 1.
Jika produk seberat 500 kg yang dihasilkan oleh suatu pabrik mengandung 269 bahan
A, 112 kg bahan B, 74 kg bahan C, dan 45 kg bahan D, apakah bisa dikatakan bahwa
produk yang dihasilkan pabrik tersebut berkualitas baik ?

 H0 : produk yang dihasilkan pabrik tersebut berkualitas baik yaitu :
A : B : C : D = 5 : 2 : 2 : 1.
H1 : tidak.
xi P(x=x i) ei = P(x=x i).500 oi (ei - oi)2/ei
A 5/10 250 269 1,444
B 2/10 100 112 1,440
C 2/10 100 74 6,760
D 1/10 50 45 0,500
10,144
k
(o i  e i ) 2
 e
 Statistik Uji : χ2 hitung = i1 i =10,144
χ2 α=0,05 ; ν=4-1 = 7,815

by:Dana Marsetiya Utama


■ Goodness of Fit Test 4

Karena χ2 hitung > χ2 0,05 ; 3 → H0 ditolak


Berarti produk yang dihasilkan pabrik tersebut tidak berkualitas baik.

4. Tiga buah kartu diambil dengan pengembalian dari seperangkat kartu bridge dan
diamati banyaknya kartu hati yang terambil. Setelah percobaan diulang 64 kali diperoleh
hasil sebagai berikut :
Banyaknya kartu hati yang terambil 0 1 2 3
Frekuensi 21 31 12 0
Ujilah dengan α = 0,01, apakah banyaknya kartu hati yang terambil berdistribusi
Binomial dengan n = 3 dan p = 0,25

Misalkan x = banyaknya kartu hati yang terambil dalam pengambilan 3 kartu dengan
pengembalian

 H0 : x ~ Binomial b(x; 3; 0,25)


H1 : tidak.

3 
 (0,25) xi (1  0,25) 3 xi
x 
P(x = xi) =  i 
xi P(x=x i) ei = P(x=x i).64 oi (ei - oi)2/ei
0 0,422 27,000 21 1,333
1 0,422 27,000 31 0,593
2 0,141 9,000 10,00 12 12 0,400
3 0,016 1,000 0
1,000 64,000 64 2,326
3
(o i  e i ) 2
 e
 Statistik Uji : χ2 hitung = i1 i = 2,326
χ2 α=0,01 ; ν=3-1 = 9,210

Karena χ2 hitung < χ2 0,01 ; 2 → H0 diterima


Berarti x berdistribusi Binomial dengan n = 3 dan p = 0,25

5. Tiga bola diambil dari kotak yang berisi 5 bola merah dan 3 bola hijau. Diamati
banyaknya bola merah yang terambil. Setelah percobaan diulang 112 kali diperoleh
hasil sebagai berikut :
Banyaknya bola merah yang terambil 0 1 2 3
Frekuensi 1 31 55 25

by:Dana Marsetiya Utama


■ Goodness of Fit Test 5

Ujilah dengan α = 0,05, apakah banyaknya bola merah yang terambil berdistribusi
Hipergeometrik dengan N = 8 ; n = 3 ; a = 5.

Misalkan x = banyaknya bola merah yang terambil dalam pengambilan 3 bola dari 8
bola

 H0 : x ~ Hipergeometrik h(x; 8 ; 3; 5)
H1 : tidak.

 5  3 
  
 x i  3  x i 
8
 
P(x = xi) = 3
xi P(x=x i) ei = P(x=x i).112 oi (ei - oi)2/ei
0 0,018 2,00 32,00 1 32,00 0,000
1 0,268 30,00 31
2 0,536 60,00 55 0,417
3 0,179 20,00 25 1,250
1,000 112,00 112 1,667
3
(o i  e i ) 2
 e
 Statistik Uji : χ2 hitung = i1 i = 1,667
χ2 α=0,05 ; ν=3-1 = 5,991

Karena χ2 hitung < χ2 0,05 ; 2 → H0 diterima


Berarti x berdistribusi Hipergeometrik dengan N = 8 ; n = 3 dan a = 5

6. Sebuah uang logam dilemparkan sampai muncul sisi gambar yang pertama dan dicatat
banyaknya lemparan yang diperlukan. Setelah percobaan diulang 256 kali diperoleh
hasil sebagai berikut :
Banyaknya lemparan yang diperlukan 1 2 3 4 5 6 7 8
Frekuensi 136 60 34 12 9 1 3 1
Ujilah dengan α = 0,05, apakah banyaknya lemparan yang diperlukan sampai muncul
sisi gambar berdistribusi Geometrik dengan p = 0,5.

Misalkan x = banyaknya lemparan yang diperlukan sampai muncul sisi gambar yang
pertama kali

 H0 : x ~ Geometrik p = 0,5
H1 : tidak.

by:Dana Marsetiya Utama


■ Goodness of Fit Test 6

P(x = xi) = (0,5)xi-1(0,5)


xi P(x=x i) ei = P(x=x i).256 oi (ei - oi)2/ei
1 0,50000000 128,0 136 0,500
2 0,25000000 64,0 60 0,250
3 0,12500000 32,0 34 0,125
4 0,06250000 16,0 12 1,000
5 0,03125000 8,0 9 0,125
6 0,01562500 4,0 1
7 0,00781250 2,0 7,0 3 5 0,571
8 0,00390625 1,0 1
0,99609375 255,0 256 1,875

8
(o i  e i ) 2
 e
 Statistik Uji : χ2 hitung = i1 i = 1,875
χ α=0,05 ; ν=6-1 = 11,070
2

Karena χ2 hitung < χ2 0,05 ; 5 → H0 diterima


Berarti x berdistribusi Geometrik dengan p = 0,5

7. Dari hasil pengamatan umur aki (dalam tahun) diperoleh distribusi frekuensi sebagai
berikut :
Umur Aki (tahun) Frekuensi
1,45 – 1,95 2
1,95 – 2,45 1
2,45 – 2,95 4
2,95 – 3,45 15
3,45 – 3,95 10
3,95 – 4,45 5
4,45 – 4,95 3

Ujilah dengan α = 0,05, apakah umur aki tersebut berdistribusi Normal.


x = umur aki (dalam tahun)

 H0 : x ~ Normal dengan μ = x ; σ = s
H1 : tidak.

 Menentukan : μ = x dan σ = s dari data sampel

Titik tengah (x i ) Frekuensi (fi ) fi x i fi x i2


1,7 2 3,40 5,78
2,2 1 2,20 4,84
2,7 4 10,80 29,16
3,2 15 48,00 153,60
3,7 10 37,00 136,90
4,2 5 21,00 88,20
4,7 3 14,10 66,27
40 136,5 484,75

by:Dana Marsetiya Utama


■ Goodness of Fit Test 7

x 7
136,5
f x
i1
i i
40
Rata-rata = = 40 = = 3,41
 fi x i 2
 2
fi x i 
40
Standard deviasi = s = 40  1 = 0,696948 ≈ 0,7

 a  3,41 b  3,41 
P  Zi  
P(a ≤ xi ≤ b) =  0,7 0,7  ; Zi ~ N(0 ; 1)
Interval kelas xi Interval kelas Zi P(Z≤Zi) P(x=xi) ei=P(x=xi).40 oi (ei - oi)2/ei
1,45 - 1,95 -2,800 - -2,086 0,0026 0,0183 0,0157 0,628 2
1,95 - 2,45 -2,086 - -1,371 0,0183 0,0853 0,0670 2,680 10,1 1 7 0,941
2,45 - 2,95 -1,371 - -0,657 0,0853 0,2546 0,1693 6,772 4
2,95 - 3,45 -0,657 - 0,057 0,2546 0,5239 0,2693 10,772 15 1,659
3,45 - 3,95 0,057 - 0,771 0,5239 0,7794 0,2555 10,220 10 0,005
3,95 - 4,45 0,771 - 1,486 0,7794 0,9319 0,1525 6,100 8,3 5 8 0,009
4,45 - 4,95 1,486 - 2,200 0,9319 0,9861 0,0542 2,168 3
0,9835 39,3 40 2,601

4
(o i  e i ) 2
Statistik Uji : χ2 hitung =
i1 ei = 2,601
χ2 α=0,05 ; ν=4-2-1 = 3,841
Karena χ2 hitung < χ2 0,05 ; 1 → H0 diterima
Berarti umur aki berdistribusi Normal dengan μ = 3,41 dan σ = 0,7

8. Sama seperti soal nomor 7, ujilah dengan α = 5% apakah data umur aki di atas
berdistribusi Normal dengan rata-rata 4 tahun dan standard deviasi 1 tahun.

x = umur aki (dalam tahun)

 H0 : x ~ Normal dengan μ = 4 ; σ = 1
H1 : tidak.
a4 b4
P  Zi  
P(a ≤ xi ≤ b) =  1 1  ; Zi ~ N(0 ; 1)
2
Interval kelas xi Interval kelas Zi P(Z≤Zi) P(x=xi) ei=P(x=xi).40 oi (ei - oi) /ei
1,45 - 1,95 -2,550 - -2,050 0,0054 0,0202 0,0148 0,592 2
1,95 - 2,45 -2,050 - -1,550 0,0202 0,0606 0,0404 1,616 5,7 1 7 0,317
2,45 - 2,95 -1,550 - -1,050 0,0606 0,1469 0,0863 3,452 4
2,95 - 3,45 -1,050 - -0,550 0,1469 0,2912 0,1443 5,772 15 14,753
3,45 - 3,95 -0,550 - -0,050 0,2912 0,4801 0,1889 7,556 10 0,791
3,95 - 4,45 -0,050 - 0,450 0,4801 0,6736 0,1935 7,740 5 0,970
4,45 - 4,95 0,450 - 0,950 0,6736 0,8289 0,1553 6,212 3 1,661
0,8235 32,9 40 15,071

5
(o i  e i ) 2
Statistik Uji : χ2 hitung =

i1 ei = 15,071

by:Dana Marsetiya Utama


■ Goodness of Fit Test 8

χ2 α=0,05 ; ν=5-2 = 7,815


Karena χ2 hitung > χ2 0,05 ; 3 → H0 ditolak
Berarti umur aki tidak berdistribusi Normal dengan μ = 4 dan σ = 1

9. Distribusi frekuensi life time (umur pakai) dari 100 unit vacuum tube yang digunakan
dalam suatu eksperimen diberikan sebagai berikut :
Life time (jam) Frekuensi
0 – 20 46
20 – 40 19
40 – 60 17
60 – 80 12
> 80 6
Gunakan α = 0,01 untuk menguji apakah life time dari vacuum tube tersebut
berdistribusi Eksponensial dengan rata-rata 40 jam.

x = life time dari vacuum tube

 H0 : x ~ Eksponensial dengan rata-rata 40 jam


H1 : tidak.

 Rata-rata = 1/λ = 40 → λ = 1/40 = 0,025


 P(a ≤ xi ≤ b) = F(b) – F(a) = (1 – e-λb) - (1 – e-λa) = e-λa - e-λb = e-(0,025) a - e-(0,025) b

2
Life Time (xi ) P(x) ei = P(x).100 oi (ei - oi ) /ei
0 - 20 0,3935 39,347 46 1,125
20 - 40 0,2387 23,865 19 0,992
40 - 60 0,1447 14,475 17 0,440
60 - 80 0,0878 8,779 12 1,181
80 - 0,1353 13,534 6 4,194
1,0000 100,0 100 3,739
5
(o i  e i ) 2
 Statistik Uji : χ2 hitung =

i1 ei = 3,739
χ2 α=0,01 ; ν=5-1 =13,277
Karena χ2 hitung < χ2 0,01 ; 4 → H0 diterima
Berarti life time dari vacuum tube berdistribusi Eksponensial dengan rata-rata 40
jam

by:Dana Marsetiya Utama


■ Goodness of Fit Test 9

UJI KOLMOGOROV-SIRNOV (NON PARAMETRIK)


Merupakan uji Goodness of Fit antara frekuensi pengamatan dan frekuensi harapan.
Dibandingkan dengan uji Goodness of Fit menggunakan χ2-test :
- Uji Kolmogorov-Smirnov lebih efisien untuk sampel berukuran kecil.
- Uji Kolmogorov-Smirnov hanya bisa digunakan untuk variabel random kontinu,
sementara χ2-test bisa untuk variabel yang kontinu maupun diskret.

Prosedur Uji :
1. H0 : variabel random x (data pengamatan) berdistribusi teoritis tertentu
H1 : tidak.

2. Tingkat signifikansi : α
3. Perhitungan :
 Data pengamatan disusun dan diurutkan dari kecil sampai besar
 Tentukan distribusi frekuensi masing-masing nilai data.
 Hitung distribusi frekuensi relatif kumulatif, notasikan dengan Fa(x)
 Hitung probabilitas kumulatif teoritis, notasikan dengan Fe(x)

 Hitung : Dhitung = maksimum Fa ( x )  Fe ( x )

4. Statistik Uji : Dhitung = maks Fa ( x )  Fe ( x ) ~ Dα ; n


Dα = tabel nilai Uji Kolmogorov-Smirnov untuk sampel tunggal

5. Daerah kritis : Jika Dhitung > Dα ; n → H0 ditolak.

CONTOH :
1. Ujilah dengan α = 0,05 apakah data berikut :
4,8 ; 10,3 ; 28,2 ; 23,1 ; 4,4 ; 28,7 ; 19,5 ; 2,4 ; 25,0 ; 10,3
berdistribusi Uniform dengan α = 0 dan β = 30 atau U(0 ; 30)

 H0 : data berdistribusi U(0 ; 30)
H1 : tidak.

 α = 0,05
 0 ; x0
 x0
; 0  x  30
 30  0

 Fungsi densitas kumulatif dari U(0 ; 30) : Fe(x) =  1 ; x  30

by:Dana Marsetiya Utama


■ Goodness of Fit Test 10

Frekuensi Kumulatif
Frekuensi Fa ( x )  Fe ( x )
x Frekuensi Relatif Teoriris
Relatif
Fa(x) Fe(x)
2,4 1 0,1 0,1 0,08 0,02
4,4 1 0,1 0,2 0,15 0,05
4,8 1 0,1 0,3 0,16 0,14
10,3 2 0,2 0,5 0,34 0,16
19,5 1 0,1 0,6 0,65 0,05
23,1 1 0,1 0,7 0,77 0,07
25,0 1 0,1 0,8 0,83 0,03
28,2 1 0,1 0,9 0,94 0,04
28,7 1 0,1 1,0 0,96 0,04
10

Dhitung = maks Fa ( x )  Fe ( x ) = 0,16


 Daerah kritis : Dtabel = D0,05 ; 10 = 0,410
Karena Dhitung = 0,16 < Dtabel = D0,05 ; 10 = 0,410 ; H0 diterima.

 Kesimpulan :
Data di atas berdistribusi U(0 ; 30)

2. Ujilah dengan α = 0,05 apakah data berikut :


2,1 ; 1,9 ; 3,2 ; 2,8 ; 1,0 ; 5,1 ; 0,9 ; 4,2 ; 3,9 ; 3,6 ; 2,7
berdistribusi Normal dengan μ = 3 dan σ = 1 atau N(3 ; 1)

 H0 : data berdistribusi N(3 ; 1)
H1 : tidak.

 α = 0,05
 Fungsi densitas kumulatif dari N(3 ; 1) :
X3 x3
Fe(x) = P(X < x) = P( 1 < 1 ) = P(Z < z0) dilihat dari tabel normal standard
Frekuensi Kumulatif
Frekuensi Teoriris Fe(x)
x Frek. Relatif Fa ( x )  Fe ( x )
Relatif x3
Fa(x) Fe(x) = P(Z < z0)
z0 = 1
0,9 1 0,0909 0,0909 -2,1 0,0179 0,0730
1,0 1 0,0909 0,1818 -2,0 0,0228 0,1590
1,9 1 0,0909 0,2727 -1,1 0,1357 0,1370
2,1 1 0,0909 0,3636 -0,9 0,1841 0,1795
2,7 1 0,0909 0,4545 -0,3 0,3821 0,0724
2,8 1 0,0909 0,5454 -0,2 0,4207 0,1247
3,2 1 0,0909 0,6363 0,2 0,5793 0,0570
3,6 1 0,0909 0,7272 0,6 0,7257 0,0015
3,9 1 0,0909 0,8181 0,9 0,8159 0,0022
4,2 1 0,0909 0,9090 1,2 0,8849 0,0241

by:Dana Marsetiya Utama


■ Goodness of Fit Test 11

5,1 1 0,0909 0,9999 2,1 0,9821 0,0178


11
Dhitung = maks Fa ( x )  Fe ( x ) = 0,1795

 Daerah kritis : Dtabel = D0,05 ; 11 = 0,395


Karena Dhitung = 0,1795 < Dtabel = D0,05 ; 11 = 0,395 ; H0 diterima.

 Kesimpulan :
Data di atas berdistribusi N(3 ; 1)

by:Dana Marsetiya Utama

Anda mungkin juga menyukai