Anda di halaman 1dari 47

Ujian Hipotesis bagi

Khi Kuasa Dua


a) Prosedur Umum bagi Ujian
Ujian Kebagusan Penyesuaian
Ujian ini hanya menguji satu pembolehubah
populasi sahaja (univariate).
Tujuan ujian ini ialah untuk menguji sama ada
taburan yang dicerap mengikut taburan
tertentu (taburan jangkaan) atau sesuai dengan
suatu set data.

Andaian
Data dipilih secara rawak.
Data tertabur normal
Data sampel mengandungi jumlah
kekerapan untuk setiap kategori
Nilai frekuensi yang dijangka (E)
mestilah sekurang-kurangnya 5
(E > 5)


Ujian Kebagusan Penyesuaian

O Mewakili frekuensi tercerap
E Mewakili frekuensi jangkaan, E = np
k Mewakili bilangan kategori
n Mewakili jumlah bilangan cubaan
Di dalam ujian kebagusan penyesuaian
Dk = (k-1)
k = bilangan kategori
Kawasan penolakan hanyalah di hujung
kanan taburan khi-kuasadua


( )


=
j
2
j j
2
E
E O

Statistik Ujian
Prosedur Menjalankan Ujian Kebagusan
Penyesuaian
1. Tentukan hipotesis
H
0
: Populasi mengikut taburan tertentu.
(Atau H
0
: p
1
=p
2
==p
k
)
H
1
: Populasi tidak mengikut taburan tertentu
(Atau H
1
: sekurang-kurangnya terdapat
satu kebarangkalian berbeza )
2. Dapatkan frekuensi jangkaan E
j
= np
j
bagi
setiap kategori pembolehubah kajian,
(pastikan memenuhi E > 5 )
Di mana n = bilangan sampel dan
p
j
= kebarangkalian kategori menurut H
0




3. Tentukan aras keertian o dan tentukan
kawasan kritikal di hujung kanan taburan
Nilai kritikal = dengan dk = k 1
dan k = bilangan kategori pembolehubah
kajian.

2

2
dk ,

4. Dapatkan statistik ujian


5. Keputusan dan Kesimpulan
Sebagai contoh katalah kita baling sebiji dadu enam segi yang
sekata sebanyak 60 kali dan memperolehi hasil seperti di bawah
ini :
Outcome 1 2 3 4 5 6
Observed
frequency
4 7 16 8 8 17
Outcome 1 2 3 4 5 6
Expected
frequency
10 10 10 10 10 10
Outcome, 0 4 7 16 8 8 17
Observed
frequency, E
10 10 10 10 10 10
Difference,
O-E
-6 -3 4 -2 -2 7
Semakin besar magnitud perbezaan (abaikan
tanda negatif), semakin banyak data O (data
dari hasil pemerhatian) berbeza dari data E
(data jangkaan dari dadu segi enam yang
sekata)
Jika tadi dadu dibaling 60 kali, bagaimana pula
hasil pemerhatian dadu enam segi sekata
dibaling 660 kali?
Seolah-olahnya kali ini nilai O dan E
jelas rapat, bagaimanapun nilai O-E
masih sama seperti sebelumnya :
bukan sahaja saiz O-E bahkan juga saiz
secara relatif kepada frekuensi
jangkaan,
Outcome, 0 104 107 116 108 108 117
Observed
frequency, E
110 110 110 110 110 110
Difference, O-E -6 -3 6 -2 -2 7
E
E O
Dengan menggabungkan ide bahawa
`perbezaan dan `saiz relatif ,



Oleh itu penyesuaian terbaik untuk hasil i ialah





E
E O
E O

) (
i
i
E
E O i ) (
2
Semakin kecil kuantiti ini, penyesuaian terbaiknya
lebih bagus. Pengukuran agregat bagi penyesuaian
terbaik dinyatakan oleh

( )

=
m
i 1
j
2
j j
2
E
E O

Dimana m adalah bilangan hasil yang berbeza. Signifikannya besar nilai X, mencadangkan
penyesuaian terbaik yang kurang
Taburan Khi Kuasa Dua
Taburan yang selanjar dan berinteger positif,
berparameter V ( new), yang menentukan
bentuk taburannya.
X tidak boleh bernilai positif, parameter v
dikenali sebagai darjah kebebasan (degree of
freedom) taburan khi kuasa dua berdarjah
kebebasan v

2
v

Jadual Taburan KhiKuasa Dua


Sebuah jadual yang terdiri daripada baris yang
mewakili nilai-nilai berbeza pada v dan lajur
mewakili poin-poin peratusan.
Rujuk Jadual taburan khi kuasa dua
Jika X mempunyai taburan X, nilai nilai x pada
jadual ialah P(X<x) = p%. Oleh itu
P(X<2.706) = 0.900
P(X>20.52) = 0.001


Latihan
1) Cari




)
2
96 . 1
2
1
P( v)
) 635 . 6
2
1
P( )
) 84 . 12
2
3
P( iii)
) 07 . 11
2
5
P( )
) 14 . 11
2
4
P( )
>
<
>
<
>
iv
ii
i
2. Cari ;
) 210 . 9
2
2
P(7.378 iii)
) 75 . 16
2
5
11.07 P( )
) 28 . 13
2
4
7.779 P( )
> <
< <
< <
ii
i
3. Cari C dimana
975 . 0 )
2
3
P( v)
995 . 0 )
2
1
P( )
100 . 0 )
2
1
P( )
025 . 0 )
2
5
P( )
005 . 0 )
2
4
P( )
= <
= <
= >
= >
= >
c
c iv
c iii
c ii
c i
Soalan 4
Verify that the upper percentage points of
given in the table above, are ( except for
rounding errors ) the squares of the
corresponding two-tail percentage points of
N (0,1)
2
1

Penerangan Penyesuaian Terbaik


bagi dadu segi enam sekata.
( )

=
m
i 1
i
2
i i
2
E
E O

Oi = Frekuensi yang diamati


Ei = frekuensi yang dijangkakan
m = bilangan kategori yang dibandingkan
Ho = merujuk kebarangkalian bagi kategori pelbagai dan jangkaan
frekuensi adalah bergantung kepada hasil saiz samel dan kebarangkalian-
kebarangkalian ini.
Hipotesis alternatif (lain) = Ho adalah tidak benar
Menganggap Ho, X adalah anggaran pemerhatianndari taburan khi kuasa
dua dengan darjah kebebasaan m-1
)
2
1 - m
(
Pengiraan
Untuk balingan dadu enam segi sebanyak 60 kali
dengan Ho bahawa dadu adalah sekata,
seimbang atau sesuai dan pada aras signifikan
2.5

2

Oi Ei Oi-Ei (Oi-Ei)/Ei
4 10 -6 3.6
7 10 -3 0.9
16 10 6 3.6
8 10 -2 0.4
8 10 -2 0.4
17 10 7 4.9
60 60 0 13.8
Dalam kes ini, m=6 dan taburan X mempunyai 5
darjah kebebasan. Taburan bagi di atas
aras signifikan 2.5% adalah 12.83, dimana ia
adalah kurang dari nilai yang diperolehi dari
pengiraan iaitu 13.80 . Oleh itu Ho ditolak
(tidak sesuai, tidak seimbang)

2
5

Contoh 2 :
Satu kajian telah dibuat berkaitan
kemalangan di kilang W. Data yang
diperolehi telah diringkaskan di dalam
jadual di bawah. Uji dakwaan bahawa
kemungkinan berlaku kemalangan
setiap hari bekerja adalah sama

Hari Isnin Selasa Rabu Kha Jum
Bil.
kemalangan
31 42 18 25 31
Penyelesaian
1. H
0
: p
1
= p
2
= p
3
= p
4
= p
5
= 1/5
H
1
: sekurang-kurangnya satu
kebarangkalian adalah tak sama dgn 1/5.
3. Tentukan o = 0.05 , darjah kebebasan=4
Nilai kritikal = _
2
0.05,4
= 9.488
2. Frekuansi jangkaan untuk setiap hari
ialah E = 147 * (1/5) = 29.4 > 5



Pengiraan:
Hari O E (O-E)
2
/E
Isn 31 29.4 0.0871
Sel 42 29.4 5.4
Rabu 18 29.4 4.4204
Kha 25 29.4 0.6585
Jum 31 29.4 0.0871
_
2
= 10.6531


5. Keputusan dan Kesimpulan :
Tolak Ho kerana 10.6531 > 9.488.
Berdasarkan sampel yg diambil, terdapat cukup
bukti untuk membuat kesimpulan bahawa kadar
kemalangan berlaku setiap hari adalah tidak sama
utk o = 0.05

4. Statistik ujian _
2
= E[( O
j
E
j
)
2
/E
j
]

Kaedah Nilai-p
Rujuk jadual taburan _
2
untuk
mendapatkan nilap-p .Iaitu nilai-p untuk
statistik

ujian _
2
=

10.6531 dengan dk = 4
terletak antara 9.488 dan 11.143.
9.488 < 10.6531 < 11.143
0.025 < nilai-p < 0.05
Oleh kerana nilai-p < 0.05 , tolak H
0

Buat kesimpulan seperti sebelum ini.
Contoh 3
Tahap pendidikan yang dimiliki oleh wanita daripada
sebuah kawasan luar bandar dibahagikan kepada
tiga kategori: mempunyai sijil SPM; diploma; ijazah.
Seorang pakar demografi menganggar bahawa 28%
daripada mereka mempunyai sijil SPM, 61%
mempunyai diploma dan 11% mempunyai ijazah.
Untuk membuktikan peratusan ini, sampel rawak
n=100 wanita telah dipilih dari kawasan tersebut dan
tahap pendidikan mereka dicatat. Bilangan wanita
bagi setiap tahap pendidikan ditunjukkan di dalam
jadual berikut. Guna o = .05. Uji untuk menentukan
sama ada data sampel tidak bersetuju dengan
peratusan yang dianggar oleh pakar demografi.
Tahap pendidikan

Sijil SPM

Diploma Ijazah

Jumlah

22

64

14

100

Penyelesaian
H
0
: Kebarangkalian bagi setiap
kategori p
1
= .28, p
2
= .61, p
3
= .11
H
1
: Sekurang-kurangnya dua daripada
p
1
, p
2
, p
3
, berbeza daripada nilai yang
dinyatakan di dalam hipotesis nol.



Tahap pendidikan





Sijil SPM

Diploma

Ijazah

Total

Frekuensi dicerap
Frekuensi
dijangka
22
(100)(.28)=
(28)

64
(100)(61)=
(61)

14
(100)(.11)=
(11)

100
100

Kira frekuensi jangkaan
Statistik ujian
Nilai kritikal _
2
0.05,2
= 5.991. Kita akan
tolak H
0
jika _
2
> 5.991
Oleh kerana nilai statistik ujian _
2
= 2.26 adalah kurang
daripada 5.991, maka kita gagal tolak H
0
. Tidak terdapat
cukup maklumat untuk menunjukkan data sampel tidak
bersetuju dengan peratusan yang dianggar oleh pakar
demografi.

Latihan
Satu kajian telah dijalankan untuk menentukan sama ada
kegemaran surirumah untuk berbelanja di pasaraya pada setiap
hari adalah berbeza. Untuk tujuan ini 300 pelanggan pasaraya
dipilih secara rawak dan ditanya hari kegemaran mereka dalam
seminggu untuk berbelanja. Keputusannya adalah seperti berikut
Hari Isnin Sel Rabu Kha Jum Sab Ahad
Bil. pelanggan 10 20 40 40 80 60 50
Adakah data ini boleh mengesahkan bahwa kegemaran surirumah berbelanja
adalah berbeza-beza mengikut hari. (o = 0.05)
Latihan
Satu sampel rawak bersaiz, n = 500 diperuntukkan kepada k=5 kategori seperti
di jadual. Andaikan kita mahu menguji hipotesis nul bahawa kebarangkalian
bagi setiap kategori ialah p
1
=.1, p
2
=.1, p
3
=.5, p
4
=.1, dan p
5
=.2.

Kategori
Jumlah
1

2

3

4

5

27

62

241

69

101

500

Adakah data yang ada cukup untuk membuktikan bahawa
hipotesis nol adalah salah?
c) Ujian Perkaitan
(Test of association)
Ujian Hipotesis bagi
Khi Kuasa Dua
Jadual kontigensi
Jadual Kontingensi atau jadual kekerapan dua hala ialah
jadual yang menunjukkan kekerapan yang menepati ciri
kepada dua pembolehubah. Pembolehubah pertama
digunakan untuk kategorikan baris dan pembolehubah kedua
digunakan untuk kategorikan lajur .
Tujuan analisis jadual kontigensi adalah untuk menentukan
sama ada kebersandaran wujud di antara dua pembolehubah
kualitatif.


Sepenuh masa

Separuh masa

Jumlah baris

Pelajar
Lelaki

393

248

641

Pelajar
Perempuan

411

368

779

Jumlah lajur

804

616

1420

Contoh Jadual Kontingensi
Ujian ketaksandaran
Tujuan ujian ini ialah untuk menguji sama
ada wujud hubungan (bersandar) di antara
dua pembolehubah (bivariate) bagi satu
populasi
Contohnya kita hendak menguji sama ada
sumber kepuasan kehidupan kaum lelaki
bergantung kepada tahun kajian dilakukan
Pembolehubah ini perlu diklasifikasikan
kepada beberapa kategori diskret dan saling
menyisihkan (mutually exclusive).
Prosedur Menjalankan Ujian Ketaksandaran
1. Tentukan hipotesis
H
0
: pembolehubah I tidak bersandar kepada
pembolehubah II
H
1
: pembolehubah I bersandar kepada
pembolehubah II

2. Dapatkan frekuansi jangkaan E
ij
bagi
setiap kategori pembolehubah kajian,
(pastikan memenuhi E
ij
> 5 )
sampel saiz
lajur) lah baris)(Jum (Jumlah
E
ij
=
3. Tentukan aras keertian o dan tentukan kawasan kritikal di hujung
kanan taburan

Nilai kritikal = dengan dk = (B-1)(L-1) di mana
B = bil. baris dlm. jadual kontigensi
L = bil. lajur dlm. jadual kontigensi
2

2
dk ,

4. Dapatkan statistik ujian


5. Keputusan dan Kesimpulan
( )


=
ij
2
ij ij
2
E
E O

O
ij
= kekerapan yg dicerap utk baris ke i , lajur ke j
E
ij
= kekerapan yg dijangka utk baris ke i , lajur ke j

Contoh :




Lelaki 1990

Lelaki 2001



Pekerjaan

65

25



Keluarga

42

68



Lain lain

13

17



Jumlah

120

110

Jumlah

90

110

30

230

Sumber Kepuasan Hidup
Satu kajian pada tahun 1990 telah dijalankan terhadap 120 lelaki berkahwin dan
berumur 30-45 thn mengenai sumber kepuasan hidup mereka. Kajian yg sama
dijalankan pula terhadap 110 lelaki berkahwin pada tahun 2001. Maklumat yg
diperolehi diringkaskan di dlm jadual kontigensi di bawah. Uji sama ada sumber
kepuasan kehidupan lelaki telah berubah atau sebaliknya. (guna o = 0.05)
Penyelesaian
1. H
0
: Sumber kepuasan hidup lelaki tidak bersandar
kepada tahun kajian
H
1
:Sumber kepuasan hidup lelaki bersandar kepada
tahun kajian



Lelaki 1990



Pekerjaan

O
11
= 65
E
11
= 46.96



Keluarga

O
12
= 42
E
12
= 57.39



Lain-lain

O
13
= 13
E
13
=15.65



Jumlah

120

Lelaki 2001

O
21
= 25
E
21
= 43.04

O
22
= 68
E
22
= 52.61

O
23
= 17
E
23
=14.35

110

Jumlah

90

110

30

Jum = 230

Sumber Kepuasan Hidup
2. Frekuensi jangkaan
3. Aras keertian o = 0.05
nilai kritikal _
2
0.
05,2

= 5.991
di mana dk = ( B 1)(L 1)
= ( 2 1) (3 1) = 2
4. Statistik ujian _
2 =
E [ ( O
ij
E
ij
)
2
/ E
ij
]

Pengiraan:
O E (O-E)
2
/E
5. Kesimpulan :
Tolak Ho kerana 24.0588 > 5.991. Oleh itu, berdasarkan sampel yg diambil,
terdapat cukup bukti untuk membuat kesimpulan bahawa taburan sumber kepuasan
hidup lelaki bersandar kepada tahun kajian yang dibuat pada aras keertian 0.05.
Dengan kata lain sumber kepuasan hidup lelaki telah berubah daripada tahun 1990
ke tahun 2001.
65 46.96 6.9302
42 57.39 4.1271
13 15.65 0.4487
25 43.04 7.5614
68 52.61 4.5020
17 14.35 0.4894

Jumlah : 24.0588

Latihan
Seramai 164 orang siswazah telah ditemubual. Maklumat dikumpul berdasarkan
kelas ijazah yang diperolehi dan kategori pekerjaannya. Jadual kontigensi
diberikan seperti di bawah :

Kategori
Kelas Ijazah yang diperolehi
1 2 3 Jumlah
Jurutera 32 14 17 63
Akauntan 9 17 8 34
Programer 13 11 18 42
Guru 11 6 8 25
Jumlah 65 48 51 164
Uji sama ada wujud hubungan di antara kategori pekerjaan dengan kelas ijazah
yang diperolehi pada aras keertian 5% .
Tindakan yang perlu diambil jika E < 5
1) Gabung baris atau lajur yang bersesuaian
2) Buang baris atau lajur yang bersesuaian
3) Tambah saiz sampel
Contoh
Berikut adalah data 487 pemilik harta bagi Negeri
Z dan status perkahwinan mereka. Kaji sama ada
nilai harta (RM 000) dan status perkahwinan
adalah bersandar bagi pemilik harta di Negeri Z.
(Guna o = 0.05)


Berkahwin Bujang Janda/
Duda
Jumlah
baris
50 - < 200
227 54 63 344
200 - < 500
60 15 22 97
500 - <
1,000
20 4 7 31
> 1,000
10 2 3 15
Jumlah lajur
317 75 95 Jum: 487
Penyelesaian :
1) H
0
: Nilai harta dan status perkahwinan pemilik harta adalah tidak
bersandar
H
1
: Nilai harta dan status perkahwinan pemilik harta adalah bersandar
2) Kekerapan jangkaan,
sampel saiz
lajur) lah baris)(Jum (Jumlah
E
ij
=


Contohnya untuk sel pemilik harta yang berkahwin dan mempunyai nilai
harta 50 - < 200 (dalam ribu ringgit ),
E
11
= (344 x 317) / 487 = 223.92



Berkahwin

Bujang

Janda/
Duda

Jumlah baris

50 - < 200

O
11
= 227
E
11
=223.9

O
12
= 54
E
12
=53.0

O
13
= 63
E
13
=67.1

344

200 - < 500

O
21
= 60
E
21
=63.1

O
22
= 15
E
22
=14.9

O
23
= 22
E
23
=18.9

97

500
< 1,000

O
31
= 20
E
31
=20.2

O
32
= 4
E
32
=4.8

O
33
= 7
E
33
=6.0

31

>1,000

O
41
= 10
E
41
=9.8

O
42
= 2
E
42
=2.3

O
43
= 3
E
43
=2.9

15

Jumlah lajur

317

75

95

Jum = 487

Didapati nilai E
32
, E
42
dan E
43
adalah kurang drpd 5
Langkah yang diambil ialah :
Gabungkan nilai harta 500 - < 1,000 dan > 1,000.




Berkahwin

Bujang

Janda/
Duda

Jumlah baris

50 - < 200

O
11
= 227
E
11
=223.9

O
12
= 54
E
12
=53.0

O
13
= 63
E
13
=67.1

344

200 - <500

O
21
= 60
E
21
=63.1

O
22
= 15
E
22
=14.9

O
23
= 22
E
23
=18.9

97

> 500

O
31
= 30
E
31
=29.9

O
32
= 6
E
32
=7.1

O
33
= 10
E
33
=9.0

46

Jumlah lajur

317

75

95

Jum = 487

3) Aras keertian = 0.05 dan darjah kebebasan ialah
dk = (B-1)(L-1) = (3-1)(3-1) = 4.
Oleh itu berdasarkan jadual _
2
, nilai kritikal ialah 9.488. Ini bermakna H
0

akan ditolak jika nilai statistik ujian yang dikira adalah lebih besar drpd 9.488.
4) Statistik Ujian :
( )


=
ij
2
ij ij
2
E
E O

= (227-223.9)
2
/ 223.9 + (54-53)
2
/ 53
+ (63-67.1)
2
/ 67.1 + (60-63.1)
2
/ 63.1
+(15-14.9)
2
/ 14.9 + (22-18.9)
2
/ 18.9
+ (30-29.9)
2
/ 29.9 + (6-7.1)
2
/ 7.1
+ (10-9.0)
2
/ 9.0
= 1.256

Anda mungkin juga menyukai