Anda di halaman 1dari 47

Analisis

Varian
(ANOVA)
1

Definisi
Analisis Varian (ANOVA)

Analisis Varian adalah suatu ujian statistik


untuk membandingkan min bagi lebih dua
kumpulan dalam satu atau lebih
pembolehubah tak bersandar ( faktor).
Analisis varians kadang-kadang disebut
sebagai Ujian F (F-Test) .

Definisi
Analisis Varian (ANOVA)

Dalam ujian ANOVA setiap data mestilah


mempunyai sekurang-kurangnya dua skor iaitu
skor untuk faktor dan skor untuk pembolehubah
bersandar.(dependent variable).

Faktor membahagikan individu kepada dua atau

lebih aras, manakala pembolehubah bersandar


akan membezakan individu dalam satu dimensi
tertentu.

contoh
Untuk menentukan keberkesanan tiga kaedah

mengajar sains.
Kaedah mengajar sains pemboleh ubah tak
bersandar ( faktor).
Ketiga tiga kaedah mengajar sains dipanggil
aras atau rawatan. (treatment).
Skor selepas ujian pembolehubah bersandar

Kaedah 1 Kaedah 2 Kaedah 3


Pelajar 1

skor

skor

skor

Pelajar 2

skor

skor

skor

Apa yang ANOVA terangkan pada


kita?

Hipotesis Nol:

- Seperti ujian -T, ANOVA menguji hipotesis

nol iaitu min bagi beberapa kumpulan adalah


sama.
Hipotesis alternatif:
- Sekurang-kurangnya satu min adalah berbeza.

Kaedah ANOVA menggunakan


taburan-F.
1. Taburan-F tidak bersimetri; ia
condong (skewed) ke kanan.
2.Nilai nilai bagi F boleh jadi 0 atau
positif, ia tidak boleh negatif.
3.Terdapat perbezaan bentuk graf
taburan-F bergantung kepada darjah
kebebasan bagi pengangka dan penyebut.

Konsep Hala dalam ANOVA


ANOVA sehala kajian yang menggunakan

satu faktor sahaja atau satu pembolehubah


tak bersandar.
ANOVA dua hala kajian yang menggunakan
dua faktor tak bersandar .
ANOVA tiga hala kajian yang mempunyai
tiga faktor untuk dikaji bagi mencari
perbezaan minnya.

ANOVA SATU HALA-Andaian


Pemerhatian adalah diambil dari

populasi bertaburan normal.


Pemerhatian mewakili sampel rawak
dari populasi.
Varian populasi adalah normal.
Sampel berbeza diambil dari populasi
yang dikategorikan sebagai satu hala.

ANOVA - Hipotesis
H0: 1 = 2 = 3 = = k
(min bagi beberapa kumpulan adalah sama)

H1: Sekurang-kurangnya satu min

adalah berbeza dari yang lain.

Peraturan ujian
Tolak H0 jika Fkira > Fjadual
(jika menggunakan taburan-F)

(Jika menggunakan nilai p ):


Jika nilai P , tolak hipotesis nol.
Jika nilai P > , Tidak menolak hipotesis
nol.

Menguji hipotesis menggunakan ANOVA


satu hala adalah dilakukan dengan
memisahkan jumlah varian bagi data
kepada dua varian berikut:
1. Varian yang dihasilkan oleh rawatan (lajur)
SS(Treatment)(SSB)- jumlah kuasa dua
rawatan
2. Ralat varian, atau bahagian dari jumlah
varian yang tidak dapat diterangkan oleh
rawatan. SSE (SSW)- jumlah kuasa dua
ralat

ANOVA Formula Pengiraan


Ujian statistik bagi ANOVA satu hala

F =

varian antara sampel ( SSB )/ DF


varian dalam sampel(SSW)/DF

Nilai kritikal bagi F


Darjah kebebasan bagi bilangan

dengan saiz sampel n yang sama.


Pengangka ( numerator)
penyebut(denominator)

k sampel

df = k -1

df

k(n

-1)

Pengiraan menggunakan saiz sampel yang


berbeza
2
ni(xi - x)

F=

Varian antara sampel


Varian dalam sampel

Di mana x = min keseluruhan

k -1
(ni - 1)s2i
(ni - 1)

k = bilangan paras rawatan


ni = bilangan pemerhatian di dalam paras rawatan
xi = min kumpulan dalam paras rawatan
si = nilai varian dalam paras rawatan.
2

Komponen utama bagi kaedah


ANOVA
Dalam ANOVA satu hala,SS(treatment) ialah jumlah
kuasa dua rawatan di kenali juga sebagai SS(factor).
Oleh kerana ia adalah ukuran variasi antara min sampel ia
juga di sebut sebagai SST atau SSB

SST/SS= n1(x1 - x)2 + n2(x2 - x)2 + .. nk(xk - x)2


2

= ni(xi - x)

Komponen utama bagi kaedah


ANOVA
SS(error) atau jumlah kuasa dua ralat adalah variasi di dalam sampel bagi suatu
populasi.Ia dikenali sebagai SSW atau SSE
SSE/SSW = (n1 -1)s1 + (n2 -1)s2 + (n3 -1)s3 . . . nk(xk -1)si
= (ni - 1)si

2
2

Komponen utama bagi kaedah


ANOVA
SS(total) = SS(treatment) + SS(error)
Jumlah kuasa dua = Jumlah kuasadua rawatan
+
Jumlah kuasa dua ralat

SS(total) = SST + SSE


atau
SS(total) = SSB + SSW

Komponen utama bagi kaedah


ANOVA
SS(Total) X
SSB

Di mana :

N
2
X
N

SS W SS ( Total ) SS B

N - Jumlah keseluruhan pemerhatian .


Ti - Jumlah pemerhatian pada setiap paras rawatan.
n - bilangan pemerhatian pada setiap paras rawatan.

Kuasadua min (MS)


MST adalah kuasadua min bagi
rawatan , didapati seperti berikut:

MST =

SST
k - 1

Kuasadua min (MS)


MSE

adalah kuasadua min bagi ralat


diperolehi menggunkan rumus:

MSE

SSE
N - k

SS (total)
MS (total) =
N - 1

Ujian Statistik bagi ANOVA dengan


saiz sampel berbeza.

F=

MST
MSE

Pengangka /Numerator
Penyebut/Denominator

df = k -1
df = N - k

Jadual ANOVA
Source of

Sum Of

Degree of

Variation

Squares

Freedom

k 1

MST = SST/(k-1)

SSE

N k

MSE =SSE/(N-k)

Treatments SST

Error
Total

SS(Total) N-1

Mean

Squares

Contoh 1

Jadual ini menunjukkan jumlah tahunan yang dibelanjakan untuk


membaca (dalam $) bagi sampel rawak daripada pelanggan Amerika dari
empat daerah. Pada = 0.10, bolehkah anda membuat kesimpulan
bahawa purata tahunan yang dibelanjakan adalah berbeza?

Northeast
308
58
141
109
220
144
316

Midwest
246
169
246
158
167
76

South
103
143
164
119
99
214
108

West
223
184
221
269
199
171
204

1. Tuliskan hipotesis nol dan hipotesis alternatif

H0: 1 = 2 = 3 = 4 ( semua min populasi adalah sama.)


H1: Sekurang-kurangnya satu daripada min adalah
berbeza.

2. Nyatakan paras keertian

= 0.10
3.
3.Tentukan
Tentukantaburan
taburanbagi
bagisampel
sampel
Taburan F dengan

d.f.N = k 1= 4 1= 3,
d.f.D = N k = 27 - 4 =23

4. Carikan nilai genting


(find the critical value)

3,23

= 2.53

6.
6. Kirakan
Kirakan statistik
statistik ujian
ujian..
Northeast
308
58
141
109
220
144
316

Midwest
246
169
246
158
167
76

MST
MSE

South
103
143
164
119
99
214
108

Kirakan min dan varian bagi setiap sampel.


x 185.14
177.00
135.71

s2

1741.24
9839.48
4049.6
Kirakan x min keseluruhan.
4779
x
177
27

West
223
184
221
269
199
171
204
210.14
1020.81

SST ni xi x
min

1
2
3
4

185.14
177.00
135.71
210.14

7
6
7
7

66.26
0.00
1704.86
1098.26

ni xi x

463.8
0.0
11934.0
7687.8
20086

SST

20086
MST

6695.33
k 1
3

SSE ni 1 s

2
i

n
1
2
3
4

s2
7
6
7
7

9839.48
4049.60
1741.24
1020.81

ni

1 si2

59036.9
20248.0
10447.4
6124.9
95823.2

SSE
95823.2
MSE

N k
27 4
4166.23

6955.33
F
1.669
4166.23

0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0

0.10
0

2.53
7. Nyatakan keputusan anda

Disebabkan Fcalc= 1.669 lebih kecil dpd F table = 2.53,


atau tidak terletak pada rantau tolakkan,
gagal untuk menolak hipotesis nol..
8. Tafsirkan jawapan anda
Tidak cukup bukti untuk menyatakan min adalah
berbeza.Perbelanjaan untuk membaca bagi keempat
empat daerah adalah sama.

Output minitab
Analisis varian satu hala
Analysis of Variance
Source
DF
SS
MS
Factor
3
20085 6695
Error
23
95857 4168
Total
26
115942

F
1.61

P
0.215

Using the P value method, fail to reject the null


hypothesis since 0.215 > 0.10.

Contoh 2
Jadual ini menunjukkan jumlah jualan
mingguan jus mangga di empat buah negeri.
Pada = 0.05, bolehkah anda membuat
kesimpulan bahawa purata jualan mingguan
berbeza mengikut kemudahan,kualiti ,rasa
dan harga mangga ?

H0: 1 = 2 = 3 = 4
H1 :sekurang-kurangnya
satu min adalah berbeza
dari yang lain.
DfN = k 1 = 4 1 = 3
DfD = N k = 32 - 4 = 28

F0.05,3, 28 2.95

Xi

Xi

X1

X2

X3

X4

SST ni xi x

X
2

= 8[ (17.63 16.59)2 + (13.75 16.59)2


+ (16.50 16.59)2 + (18.50 16.59)2]
= (8.508 + 64.695 + 0.070 + 29.070)
= 102.344

SSE ni 1 s

2
i

SSE

X
ni

i 1 j1

ij

- Xj

SSE= [(15 17.63)2 + (17 17.63)2 + (19 17.63)2


+ (10 13.75)2 + 12 13.75)2 + + (16 13.75)2
+ (13 16.50)2 + (19 16.50)2 + + (18 16.50)2
+ (20 18.50)2 + (18 18.50)2 + + (23 18.50)2 ]
=

169.375

SST 102.344
MST

34.115
dfN
3
SSE
169.375
MSE

6.049
dfD
28

MST
34.115
F

5.604
MSE
6.049
SS(Total) = SST + SSE
= 102.344 + 169.375
= 271.719

Jadual ANOVA

Jadual F untuk = 0.05


F0.05,3, 28 2.95

ANOVA: langkah penyelesaian


Jika Fcal > Ftable 2.95, tolak Ho.

Oleh kerana F = 5.604 > Ftable 2.95,


tolak Ho.

Kesimpulan : purata jualan mingguan


berbeza mengikut kemudahan,kualiti ,rasa
dan harga .

Output Excel
Anova: Single Factor
SUMMARY
Groups
Johor Bahru
Melaka
Ipoh
Kuantan

Count
8
8
8
8

ANOVA
Source of Variation
SS
Between Groups
102.3438
Within Groups
169.375
Total

271.7188

Sum
Average Variance
141
17.625
7.125
110
13.750
5.643
132
16.500
3.714
148
18.500
7.714

df
3
28
31

MS
34.115
6.049

F
P-value
5.640
0.004

F crit
2.947

Contoh 3
Sebuah rantaian pasaraya sedang mempertimbangkan
untuk membina pasaraya baru pada empat kawasan
perumahan yang berbeza. Salah satu daripada
faktor yang penting didalam membuat keputusan
ialah purata pendapatan tahunan penduduk empat
kawasan tersebut. Katakan, didalam kajian awal
beberapa isirumah telah disoal apakah jumlah
pendapatan tahunan mereka. Keputusan daripada
survei tersebut ditunjukkan didalam jadual dibawah.
Adakah terdapat bukti yang mencukupi untuk
menyatakan ujudnya perbezaan didalam purata
pendapatan tahunan penduduk diantara empat
kawasan tersebut? Gunakan = 0.01.

Kawasan 1 Kawasan 2 Kawasan 3 Kawasan 4


25
27
31
17
29
30

32
35
30
46
32
22
19
51
27

27
32
48
25
20
12
18

18
23
29
26
42

Jawapan:
Hipotesis

H0: 1 = 2 = 3
H1: Sekurang-kurangnya satu min adalah berbeza dari
yang lain.

Ujian statistik

SST
MST
dfN

SSE
MSE
dfD

MST
F
MSE

Nilai

= 0.01

Peraturan Keputusan

Rawatan (numerator, dfN) = 4 1 = 3


Ralat (denominator, dfD) = 27 4 = 23

Tolak Ho jika Fcalc > Ftable = 4.76

F0.01,3, 23 4.76
Nilai Ujian statistik

T1 = 159

T2 = 294

T3 = 182

T4 = 138

T = 773

n1 = 6

n2 = 9

n3 = 7

n4 = 5

N = 27

X1 26.500

X 2 32.667

X 3 26.000

X 4 27.600 X 28.630

SST = 6(256.500-28.630)2 + 9(32.667-28.630) 2 + 7(26.00028.630) 2 + 5(27.600-28.630) 2


= 27.212 + 146.679 + 48.405 + 5.301 = 227.596
SSE = (25.000-26.500) 2 + (27.000-26.500) 2 + + (30.000
26.500) 2+ (32.000 32.667) 2 +(15.000 32.667) 2 + + (27.000
32.667) 2 + (27.000 26.000) 2 + (32.000 26.000) 2 + + (18.000
26.000) 2 + (18.000 28.630) 2 + (23.000 28.630) 2 + + (42.000
28.630) 2 = 2134.700

SS(Total) = SST + SSE

= 227.596 + 2134.700

= 2362.296

Kesimpulan
Keputusannya ialah tidak dapat menolak hipotesis nol
kerana nilai F yang dikira lebih kecil daripada nilai jadual
kritikal F= 4.76.
Oleh itu, tidak terdapat bukti yang
mencukupi untuk menyatakan purata pendapatan tahunan
berbeza diantara empat kawasan. Pengurus rantaian pasaraya
dinasihatkan supaya tidak mempertimbangkan pendapatan isi
rumah sebagai faktor untuk membuat keputusan berkaitan
lokasi pasaraya baru.

Output Komputer Excel

Tutorial

Anda mungkin juga menyukai