1
Data Kategorik Univariat, Goodness of Fit Tests
▪ Prosedur uji hipotesis yang disajikan dalam bagian ini dirancang untuk
membandingkan sekumpulan proporsi yang dihipotesiskan dengan sekumpulan
proporsi sebenarnya, untuk memeriksa goodness of fit (Gof).
2
Misal masing-masing pengamatan
berada dalam salah satu 𝒌 kategori
3
Hipotesis
Tes ini sesuai jika semua jumlah sel yang diharapkan setidaknya 5
(𝑒𝑖 = 𝑛𝑝𝑖0 ≥ 5 bagi semua 𝑖).
4
Contoh 1 Honey
Bagi peternak lebah yang ingin memanen lebih banyak madu, ada empat kemungkinan untuk
mendapatkan lebih banyak lebah: package bees, nucs, colonies, swarms. Departemen ilmu
pertanian dari universitas tertentu memperoleh sampel acak dari pembelian lebah, dan masing-
masing diklasifikasikan ke dalam salah satu dari empat kategori tersebut. Gunakan tabel
frekuensi satu arah berikut untuk menguji hipotesis bahwa empat kemungkinan pembelian lebah
terjadi dengan frekuensi yang sama. Gunakan taraf signifikansi 𝛼 = 0.05.
5
Solusi
Jika tipe pembelian lebah itu sama, maka proporsi pembelian berada dalam masing-
1 1
masing kategori adalah = = 0.25.
𝑘 4
Hipotesis
𝐻0 : 𝑝1 = 0.25, 𝑝2 = 0.25, 𝑝3 = 0.25, 𝑝4 = 0.25
𝐻1 : ∃𝑝𝑖 ≠ 𝑝𝑖0 , 𝑖 = 1, 2, 3, 4
Taraf signifikansi: 𝛼 = 0.05
𝑘 𝑛𝑖 −𝑒𝑖 2
𝜒2
Statistik uji: = σ𝑖=1
𝑒𝑖
2
Kriteria keputusan: 𝑘 = 4, 𝜒0.05(3) = 7.8147
Tolak H ditolak jika 𝜒 2 > 7.8147
0
6
Hitungan:
Sel Kategori Nilai observasi Nilai harapan
1 Package bees 31 𝑒1 = 𝑛𝑝10 = 113 0.25 = 28.25
2 Nucs 36 𝑒2 = 𝑛𝑝20 = 113 0.25 = 28.25
3 Colonies 26 𝑒3 = 𝑛𝑝30 = 113 0.25 = 28.25
4 Swarms 20 𝑒4 = 𝑛𝑝40 = 113 0.25 = 28.25
113
Semua cacah sel lebih dari 5, maka uji khi-kuadrat goodness-of-fit bisa digunakan.
8
Contoh 2 Tradisi thanksgiving
Pada hari Thanksgiving, banyak keluarga secara tradisional berkumpul
untuk menikmati hidangan spesial, berbincang-bincang, dan beberapa
wilayah bermain hoki di jalanan. Sampel acak orang dewasa di atas
usia 18 tahun diperoleh dan diminta untuk menyebutkan makanan
Thanksgiving favorit mereka. Data dan proporsi dari survei
sebelumnya diberikan dalam tabel berikut.
10
▪ Hitungan: Semua cacah sel harapan > 5, maka uji khi-kuadrat goodness-of-fit bisa digunakan.
11
▪ Kesimpulan:
Oleh karena 𝜒 2 = 15.15 > 11.0705 atau p-value = 0.0097 < 0.05 maka H0 ditolak.
Pada taraf signifikansi 𝛼 = 0.05, ada bukti untuk menyimpulkan bahwa setidaknya ada
satu proporsi populasi yang berbeda dari nilai proporsi sebelumnya. Proporsi jenis
makanan favorit pada thanksgiving itu ada yang berbeda dengan proporsi sebelumnya.
Dengan program R
> c1 <- c("Turkey","Stuffing","Mashed potatoes","Yams","Green bean casserole","Cranberry sauce")
> c2 <- c(250,148,98,55,30,42)
> dat <- data.frame(kategori=c1,obs=c2)
> str(dat)
'data.frame': 6 obs. of 2 variables:
$ kategori: Factor w/ 6 levels "Cranberry sauce",..: 5 4 3 6 2 1
$ obs : num 250 148 98 55 30 42
12
Contoh 3: Data from 93 Cars on Sale in the USA in 1993 (Cars93.csv)
Cars were selected at random from among 93 passenger car models that were listed in both the Consumer Reports issue and the PACE
Buying Guide. Pickup trucks and Sport/Utility vehicles were eliminated due to incomplete information in the Consumer Reports source.
Source: Lock, R. H. (1993) 1993 New Car Data. Journal of Statistics Education 1(1).
Description
The Cars93 data frame has 93 rows and 27 columns.
Format
This data frame contains the following columns:
Manufacturer
Manufacturer.
Model
Model.
Type
Type: a factor with levels "Small", "Sporty", "Compact", "Midsize", "Large" and "Van".
13
Dengan program R
> dat <- read.csv(file="C:/data/Cars93.csv",head=TRUE)
> str(dat)
'data.frame': 93 obs. of 28 variables:
$ X : int 1 2 3 4 5 6 7 8 9 10 ...
$ Manufacturer : Factor w/ 32 levels "Acura","Audi",..: 1 1 2 2 3 4 4 4 4 5 ...
$ Model : Factor w/ 93 levels "100","190E","240",..: 49 54 9 1 6 24 56 73 72 35 ...
$ Type : Factor w/ 6 levels "Compact","Large",..: 4 3 1 3 3 3 2 2 3 2 ...
…
> cat.car <- table(dat$Type)
> cat.car
Compact Large Midsize Small Sporty Van
16 11 22 21 14 9
14
Solusi
Jika pembelian tipe mobil sama, maka proporsi pembelian mobil dalam masing-masing
1 1
tipe mobil adalah = = 0.1666667.
𝑘 6
Hipotesis
1 1 1 1 1 1
𝐻0 : 𝑝1 = , 𝑝2 = , 𝑝3 = , 𝑝4 = , 𝑝5 = , 𝑝6 =
6 6 6 6 6 6
𝐻1 : ∃𝑝𝑖 ≠ 𝑝𝑖0 , 𝑖 = 1, 2, 3, 4,5,6
Taraf signifikansi: 𝛼 = 0.05
𝑘 𝑛𝑖 −𝑒𝑖 2
𝜒2
Statistik uji: = σ𝑖=1
𝑒𝑖
2
Kriteria keputusan: 𝑘 = 6, 𝜒0.05(5) = 11.0705
Tolak H ditolak jika 𝜒 2 > 11.0705
0
15
Hitungan: Semua cacah sel lebih dari 5, maka uji khi-kuadrat goodness-of-fit bisa digunakan.
17