=
j
2
j j
2
E
E O
Statistik Ujian
Prosedur Menjalankan Ujian Kebagusan
Penyesuaian
1. Tentukan hipotesis
H
0
: Populasi mengikut taburan tertentu.
(Atau H
0
: p
1
=p
2
==p
k
)
H
1
: Populasi tidak mengikut taburan tertentu
(Atau H
1
: sekurang-kurangnya terdapat
satu kebarangkalian berbeza )
2. Dapatkan frekuensi jangkaan E
j
= np
j
bagi
setiap kategori pembolehubah kajian,
(pastikan memenuhi E > 5 )
Di mana n = bilangan sampel dan
p
j
= kebarangkalian kategori menurut H
0
3. Tentukan aras keertian o dan tentukan
kawasan kritikal di hujung kanan taburan
Nilai kritikal = dengan dk = k 1
dan k = bilangan kategori pembolehubah
kajian.
2
2
dk ,
=
m
i 1
j
2
j j
2
E
E O
Dimana m adalah bilangan hasil yang berbeza. Signifikannya besar nilai X, mencadangkan
penyesuaian terbaik yang kurang
Taburan Khi Kuasa Dua
Taburan yang selanjar dan berinteger positif,
berparameter V ( new), yang menentukan
bentuk taburannya.
X tidak boleh bernilai positif, parameter v
dikenali sebagai darjah kebebasan (degree of
freedom) taburan khi kuasa dua berdarjah
kebebasan v
2
v
=
m
i 1
i
2
i i
2
E
E O
Oi Ei Oi-Ei (Oi-Ei)/Ei
4 10 -6 3.6
7 10 -3 0.9
16 10 6 3.6
8 10 -2 0.4
8 10 -2 0.4
17 10 7 4.9
60 60 0 13.8
Dalam kes ini, m=6 dan taburan X mempunyai 5
darjah kebebasan. Taburan bagi di atas
aras signifikan 2.5% adalah 12.83, dimana ia
adalah kurang dari nilai yang diperolehi dari
pengiraan iaitu 13.80 . Oleh itu Ho ditolak
(tidak sesuai, tidak seimbang)
2
5
Contoh 2 :
Satu kajian telah dibuat berkaitan
kemalangan di kilang W. Data yang
diperolehi telah diringkaskan di dalam
jadual di bawah. Uji dakwaan bahawa
kemungkinan berlaku kemalangan
setiap hari bekerja adalah sama
Hari Isnin Selasa Rabu Kha Jum
Bil.
kemalangan
31 42 18 25 31
Penyelesaian
1. H
0
: p
1
= p
2
= p
3
= p
4
= p
5
= 1/5
H
1
: sekurang-kurangnya satu
kebarangkalian adalah tak sama dgn 1/5.
3. Tentukan o = 0.05 , darjah kebebasan=4
Nilai kritikal = _
2
0.05,4
= 9.488
2. Frekuansi jangkaan untuk setiap hari
ialah E = 147 * (1/5) = 29.4 > 5
Pengiraan:
Hari O E (O-E)
2
/E
Isn 31 29.4 0.0871
Sel 42 29.4 5.4
Rabu 18 29.4 4.4204
Kha 25 29.4 0.6585
Jum 31 29.4 0.0871
_
2
= 10.6531
5. Keputusan dan Kesimpulan :
Tolak Ho kerana 10.6531 > 9.488.
Berdasarkan sampel yg diambil, terdapat cukup
bukti untuk membuat kesimpulan bahawa kadar
kemalangan berlaku setiap hari adalah tidak sama
utk o = 0.05
4. Statistik ujian _
2
= E[( O
j
E
j
)
2
/E
j
]
Kaedah Nilai-p
Rujuk jadual taburan _
2
untuk
mendapatkan nilap-p .Iaitu nilai-p untuk
statistik
ujian _
2
=
10.6531 dengan dk = 4
terletak antara 9.488 dan 11.143.
9.488 < 10.6531 < 11.143
0.025 < nilai-p < 0.05
Oleh kerana nilai-p < 0.05 , tolak H
0
Buat kesimpulan seperti sebelum ini.
Contoh 3
Tahap pendidikan yang dimiliki oleh wanita daripada
sebuah kawasan luar bandar dibahagikan kepada
tiga kategori: mempunyai sijil SPM; diploma; ijazah.
Seorang pakar demografi menganggar bahawa 28%
daripada mereka mempunyai sijil SPM, 61%
mempunyai diploma dan 11% mempunyai ijazah.
Untuk membuktikan peratusan ini, sampel rawak
n=100 wanita telah dipilih dari kawasan tersebut dan
tahap pendidikan mereka dicatat. Bilangan wanita
bagi setiap tahap pendidikan ditunjukkan di dalam
jadual berikut. Guna o = .05. Uji untuk menentukan
sama ada data sampel tidak bersetuju dengan
peratusan yang dianggar oleh pakar demografi.
Tahap pendidikan
Sijil SPM
Diploma Ijazah
Jumlah
22
64
14
100
Penyelesaian
H
0
: Kebarangkalian bagi setiap
kategori p
1
= .28, p
2
= .61, p
3
= .11
H
1
: Sekurang-kurangnya dua daripada
p
1
, p
2
, p
3
, berbeza daripada nilai yang
dinyatakan di dalam hipotesis nol.
Tahap pendidikan
Sijil SPM
Diploma
Ijazah
Total
Frekuensi dicerap
Frekuensi
dijangka
22
(100)(.28)=
(28)
64
(100)(61)=
(61)
14
(100)(.11)=
(11)
100
100
Kira frekuensi jangkaan
Statistik ujian
Nilai kritikal _
2
0.05,2
= 5.991. Kita akan
tolak H
0
jika _
2
> 5.991
Oleh kerana nilai statistik ujian _
2
= 2.26 adalah kurang
daripada 5.991, maka kita gagal tolak H
0
. Tidak terdapat
cukup maklumat untuk menunjukkan data sampel tidak
bersetuju dengan peratusan yang dianggar oleh pakar
demografi.
Latihan
Satu kajian telah dijalankan untuk menentukan sama ada
kegemaran surirumah untuk berbelanja di pasaraya pada setiap
hari adalah berbeza. Untuk tujuan ini 300 pelanggan pasaraya
dipilih secara rawak dan ditanya hari kegemaran mereka dalam
seminggu untuk berbelanja. Keputusannya adalah seperti berikut
Hari Isnin Sel Rabu Kha Jum Sab Ahad
Bil. pelanggan 10 20 40 40 80 60 50
Adakah data ini boleh mengesahkan bahwa kegemaran surirumah berbelanja
adalah berbeza-beza mengikut hari. (o = 0.05)
Latihan
Satu sampel rawak bersaiz, n = 500 diperuntukkan kepada k=5 kategori seperti
di jadual. Andaikan kita mahu menguji hipotesis nul bahawa kebarangkalian
bagi setiap kategori ialah p
1
=.1, p
2
=.1, p
3
=.5, p
4
=.1, dan p
5
=.2.
Kategori
Jumlah
1
2
3
4
5
27
62
241
69
101
500
Adakah data yang ada cukup untuk membuktikan bahawa
hipotesis nol adalah salah?
c) Ujian Perkaitan
(Test of association)
Ujian Hipotesis bagi
Khi Kuasa Dua
Jadual kontigensi
Jadual Kontingensi atau jadual kekerapan dua hala ialah
jadual yang menunjukkan kekerapan yang menepati ciri
kepada dua pembolehubah. Pembolehubah pertama
digunakan untuk kategorikan baris dan pembolehubah kedua
digunakan untuk kategorikan lajur .
Tujuan analisis jadual kontigensi adalah untuk menentukan
sama ada kebersandaran wujud di antara dua pembolehubah
kualitatif.
Sepenuh masa
Separuh masa
Jumlah baris
Pelajar
Lelaki
393
248
641
Pelajar
Perempuan
411
368
779
Jumlah lajur
804
616
1420
Contoh Jadual Kontingensi
Ujian ketaksandaran
Tujuan ujian ini ialah untuk menguji sama
ada wujud hubungan (bersandar) di antara
dua pembolehubah (bivariate) bagi satu
populasi
Contohnya kita hendak menguji sama ada
sumber kepuasan kehidupan kaum lelaki
bergantung kepada tahun kajian dilakukan
Pembolehubah ini perlu diklasifikasikan
kepada beberapa kategori diskret dan saling
menyisihkan (mutually exclusive).
Prosedur Menjalankan Ujian Ketaksandaran
1. Tentukan hipotesis
H
0
: pembolehubah I tidak bersandar kepada
pembolehubah II
H
1
: pembolehubah I bersandar kepada
pembolehubah II
2. Dapatkan frekuansi jangkaan E
ij
bagi
setiap kategori pembolehubah kajian,
(pastikan memenuhi E
ij
> 5 )
sampel saiz
lajur) lah baris)(Jum (Jumlah
E
ij
=
3. Tentukan aras keertian o dan tentukan kawasan kritikal di hujung
kanan taburan
Nilai kritikal = dengan dk = (B-1)(L-1) di mana
B = bil. baris dlm. jadual kontigensi
L = bil. lajur dlm. jadual kontigensi
2
2
dk ,
=
ij
2
ij ij
2
E
E O
O
ij
= kekerapan yg dicerap utk baris ke i , lajur ke j
E
ij
= kekerapan yg dijangka utk baris ke i , lajur ke j
Contoh :
Lelaki 1990
Lelaki 2001
Pekerjaan
65
25
Keluarga
42
68
Lain lain
13
17
Jumlah
120
110
Jumlah
90
110
30
230
Sumber Kepuasan Hidup
Satu kajian pada tahun 1990 telah dijalankan terhadap 120 lelaki berkahwin dan
berumur 30-45 thn mengenai sumber kepuasan hidup mereka. Kajian yg sama
dijalankan pula terhadap 110 lelaki berkahwin pada tahun 2001. Maklumat yg
diperolehi diringkaskan di dlm jadual kontigensi di bawah. Uji sama ada sumber
kepuasan kehidupan lelaki telah berubah atau sebaliknya. (guna o = 0.05)
Penyelesaian
1. H
0
: Sumber kepuasan hidup lelaki tidak bersandar
kepada tahun kajian
H
1
:Sumber kepuasan hidup lelaki bersandar kepada
tahun kajian
Lelaki 1990
Pekerjaan
O
11
= 65
E
11
= 46.96
Keluarga
O
12
= 42
E
12
= 57.39
Lain-lain
O
13
= 13
E
13
=15.65
Jumlah
120
Lelaki 2001
O
21
= 25
E
21
= 43.04
O
22
= 68
E
22
= 52.61
O
23
= 17
E
23
=14.35
110
Jumlah
90
110
30
Jum = 230
Sumber Kepuasan Hidup
2. Frekuensi jangkaan
3. Aras keertian o = 0.05
nilai kritikal _
2
0.
05,2
= 5.991
di mana dk = ( B 1)(L 1)
= ( 2 1) (3 1) = 2
4. Statistik ujian _
2 =
E [ ( O
ij
E
ij
)
2
/ E
ij
]
Pengiraan:
O E (O-E)
2
/E
5. Kesimpulan :
Tolak Ho kerana 24.0588 > 5.991. Oleh itu, berdasarkan sampel yg diambil,
terdapat cukup bukti untuk membuat kesimpulan bahawa taburan sumber kepuasan
hidup lelaki bersandar kepada tahun kajian yang dibuat pada aras keertian 0.05.
Dengan kata lain sumber kepuasan hidup lelaki telah berubah daripada tahun 1990
ke tahun 2001.
65 46.96 6.9302
42 57.39 4.1271
13 15.65 0.4487
25 43.04 7.5614
68 52.61 4.5020
17 14.35 0.4894
Jumlah : 24.0588
Latihan
Seramai 164 orang siswazah telah ditemubual. Maklumat dikumpul berdasarkan
kelas ijazah yang diperolehi dan kategori pekerjaannya. Jadual kontigensi
diberikan seperti di bawah :
Kategori
Kelas Ijazah yang diperolehi
1 2 3 Jumlah
Jurutera 32 14 17 63
Akauntan 9 17 8 34
Programer 13 11 18 42
Guru 11 6 8 25
Jumlah 65 48 51 164
Uji sama ada wujud hubungan di antara kategori pekerjaan dengan kelas ijazah
yang diperolehi pada aras keertian 5% .
Tindakan yang perlu diambil jika E < 5
1) Gabung baris atau lajur yang bersesuaian
2) Buang baris atau lajur yang bersesuaian
3) Tambah saiz sampel
Contoh
Berikut adalah data 487 pemilik harta bagi Negeri
Z dan status perkahwinan mereka. Kaji sama ada
nilai harta (RM 000) dan status perkahwinan
adalah bersandar bagi pemilik harta di Negeri Z.
(Guna o = 0.05)
Berkahwin Bujang Janda/
Duda
Jumlah
baris
50 - < 200
227 54 63 344
200 - < 500
60 15 22 97
500 - <
1,000
20 4 7 31
> 1,000
10 2 3 15
Jumlah lajur
317 75 95 Jum: 487
Penyelesaian :
1) H
0
: Nilai harta dan status perkahwinan pemilik harta adalah tidak
bersandar
H
1
: Nilai harta dan status perkahwinan pemilik harta adalah bersandar
2) Kekerapan jangkaan,
sampel saiz
lajur) lah baris)(Jum (Jumlah
E
ij
=
Contohnya untuk sel pemilik harta yang berkahwin dan mempunyai nilai
harta 50 - < 200 (dalam ribu ringgit ),
E
11
= (344 x 317) / 487 = 223.92
Berkahwin
Bujang
Janda/
Duda
Jumlah baris
50 - < 200
O
11
= 227
E
11
=223.9
O
12
= 54
E
12
=53.0
O
13
= 63
E
13
=67.1
344
200 - < 500
O
21
= 60
E
21
=63.1
O
22
= 15
E
22
=14.9
O
23
= 22
E
23
=18.9
97
500
< 1,000
O
31
= 20
E
31
=20.2
O
32
= 4
E
32
=4.8
O
33
= 7
E
33
=6.0
31
>1,000
O
41
= 10
E
41
=9.8
O
42
= 2
E
42
=2.3
O
43
= 3
E
43
=2.9
15
Jumlah lajur
317
75
95
Jum = 487
Didapati nilai E
32
, E
42
dan E
43
adalah kurang drpd 5
Langkah yang diambil ialah :
Gabungkan nilai harta 500 - < 1,000 dan > 1,000.
Berkahwin
Bujang
Janda/
Duda
Jumlah baris
50 - < 200
O
11
= 227
E
11
=223.9
O
12
= 54
E
12
=53.0
O
13
= 63
E
13
=67.1
344
200 - <500
O
21
= 60
E
21
=63.1
O
22
= 15
E
22
=14.9
O
23
= 22
E
23
=18.9
97
> 500
O
31
= 30
E
31
=29.9
O
32
= 6
E
32
=7.1
O
33
= 10
E
33
=9.0
46
Jumlah lajur
317
75
95
Jum = 487
3) Aras keertian = 0.05 dan darjah kebebasan ialah
dk = (B-1)(L-1) = (3-1)(3-1) = 4.
Oleh itu berdasarkan jadual _
2
, nilai kritikal ialah 9.488. Ini bermakna H
0
akan ditolak jika nilai statistik ujian yang dikira adalah lebih besar drpd 9.488.
4) Statistik Ujian :
( )
=
ij
2
ij ij
2
E
E O
= (227-223.9)
2
/ 223.9 + (54-53)
2
/ 53
+ (63-67.1)
2
/ 67.1 + (60-63.1)
2
/ 63.1
+(15-14.9)
2
/ 14.9 + (22-18.9)
2
/ 18.9
+ (30-29.9)
2
/ 29.9 + (6-7.1)
2
/ 7.1
+ (10-9.0)
2
/ 9.0
= 1.256