Anda di halaman 1dari 17

MODUL

ANOVA

INSTITUT TEKNOLOGI SEPULUH NOPEMBER


SURABAYA
2017
A. Pendahuluan
Sering dalam praktek kita dihadapkan untuk membandingkan rata-rata lebih dua
kelompok populasi. Analysis varian berguna untuk mengetahui ada tidaknya perbedaan
antara dua atau lebih kelompok populasi. Sebagai ilustrasi awal perhatikan contoh kasus
sebagai berikut :
Dalam suatu percobaan seorang peneliti ingin menyelidiki bagaimana rata-rata
penyerapan uap air dalam beton berubah diantara lima adukan beton yang berbeda. Adukan
beton tersebut berbeda dalam prosentase berat komponen penting tertentu. Sampel dibiarkan
kena uap air selama 48 jam. Dari tiap adukan diambil 6 sampel untuk diuji penyerapan uap
airnya, sehingga total sampel ada 30. Data penyerapan uap air yang diperoleh adalah sebagai
berikut :
Jenis Adukan beton (% berat)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 511 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679

Jika rata-rata penyerapan uap air masing-masing jenis adukan beton dinotasikan dengan 1,
2 , 3 , 4 , dan 5 maka hipotesis yang ingin diuji adalah :

Ho : 1= 2 = 3 = 4 = 5 (tidak ada perbedaan rata-rata)


H1 : paling sedikit dua diantaranya tidak sama

Sebagai analisis tambahan, jika Ho ditolak mungkin saja kelima rata-rata populasi perlu
dibandingkan satu persatu. Rancangan percobaan seperti contoh diatas disebut rancangan
percobaan satu arah (one-way) dan analisisnya disebut one-way anova.

2
B. Analisis Varian Satu Arah / Rancangan Acak Lengkap

Sampel-sampel acak ukuran n1, n2, ... , nk diambil masing-masing dari k populasi
yang berbeda. Ke k populasi yang berbeda tersebut diklasifikasikan menurut perlakuan atau
grup. Ke k populasi tersebut diasumsikan saling bebas dan berdistribusi normal dengan rata-
rata 1, 2 , ... , k dan varansi yang sama 2. Ukuran sampel n1, n2, ... , nk bisa saja
besarnya sama. Bentuk data adalah :

Perlakuan
1 2 ... I ... k
y11 y21 ... yi1 ... yk1
y12 y22 yi2 ... yk2
. . ... . .
. . . .
. . . .
y1 n1 y2 n2 ... yi ni ... yk nk
Jumlah T1 . T2 . ... Ti . Tk . T. .
Rata-rata y1 . y2 . ... y i. yk . y..

Model :
i = 1,2, , k
yij = + i + ij
j = 1,2, , ni

dimana ij ~ IIDN(0,2)
IIDN : Identik Independen dan berdistribusi Normal (0,2).
yij : pengamatan ke-j dari perlakuan ke-i
: rata-rata umum
i : efek/pengaruh perlakukan ke-i
ij : kesalahan/ residual acak

Tabel ANOVA :
Source of Sum of Degrees of Mean Square Fhitung
Variation Squares Freedom
Between SSTr k1 MSTr = SSTr / (k-1) MS Tr
treatments MS E
Error (Within SSE Nk MSE = SSE / (N-k)
treatments)
Total SST N1

k
perhatikan bahwa N = ni
i =1

3
ni ni
k k
T..2
SST = ( y ij =
y.. ) ( y ij)
2 2

i =1 j =1 i =1 j =1 N
k
Ti .2 T..2
SSTr =
i =1 n i

N
dan SSE = SST - SSTr

Hipotesis :
H0 : 1= 2 = ... = k (tidak ada perbedaan rata-rata)
H1 : paling sedikit dua diantaranya tidak sama

MS Tr
Statistik uji : Fhitung =
MS E
Daerah penolakan pada tingkat signifikansi adalah : Tolak H0 jika F0 > F ( k 1, N k )
atau p-value <

Contoh 1.
Untuk data penyerapan uap air 5 jenis beton ujilah hipotesis : 1= 2 = 3 = 4 = 5 pada
tingkat signifikansi 0.05.

Jawab :
Analisis dengan minitab:
langkah 1: Masukkan data dalam 2 kolom seperti berikut:

4
Langkah 2:

Stat > Anova > One -Way ...

Langkah 3: Isikan seperti berikut

Klik Ok, maka akan diperoleh output sebagai berikut:

5
One-way ANOVA: serap air versus adukan

Source DF SS MS F P
adukan 4 85356 21339 4.30 0.009
Error 25 124020 4961
Total 29 209377

S = 70.43 R-Sq = 40.77% R-Sq(adj) = 31.29%

Individual 95% CIs For Mean Based on


Pooled StDev
Level N Mean StDev --+---------+---------+---------+-------
1 6 553.33 110.15 (-------*--------)
2 6 569.33 47.99 (-------*--------)
3 6 610.50 59.95 (-------*--------)
4 6 465.17 57.61 (-------*--------)
5 6 610.67 58.78 (-------*--------)
--+---------+---------+---------+-------
420 490 560 630

Pooled StDev = 70.43

Hipotesis :
H0 : 1= 2 = ... = k (tidak ada perbedaan rata-rata)
H1 : paling sedikit dua diantaranya tidak sama

Karena p-value pada tabel anova : 0.009 < = 0.05 maka menolak H0, jadi paling sedikit ada
dua diantara 5 metode adukan yang rata-rata penyerapan airnya berbeda.

Chek Asumsi Residul (harus IIDN: Identik, Independen, Distribusi Normal)

1. Kenormalan distribusi residual

6
maka akan ditampilkan residual pada C3 seperti berikut:

Klik Stat> Basic Statistics> Normality Test

7
Maka Outputnya adalah:

Probability Plot of RESI1


Normal
99
Mean 2.273737E-14
StDev 65.40
95 N 30
AD 0.260
90
P-Value 0.686
80
70

Percent
60
50
40
30
20

10

1
-200 -100 0 100 200
RESI1

Hipotesis :
H0 : Residual berdistribusi Normal
H1 : Residual tidak berdistribusi Normal

Asumsi kenormalan residual dipenuhi karena p-value uji kenormalan (Anderson-Darling) =


0.686 > = 0.05 yang berarti residual dapat dianggap berdistribusi normal.

2. Uji Identik (Kesamaan Varian antar Treatment)

8
Outputnya:
Test for Equal Variances: serap air versus adukan

95% Bonferroni confidence intervals for standard deviations

adukan N Lower StDev Upper


1 6 60.1842 110.154 383.859
2 6 26.2179 47.986 167.220
3 6 32.7523 59.946 208.897
4 6 31.4744 57.607 200.746
5 6 32.1171 58.783 204.845

Bartlett's Test (Normal Distribution)


Test statistic = 4.44, p-value = 0.350

Levene's Test (Any Continuous Distribution)


Test statistic = 1.17, p-value = 0.349

Test for Equal Variances: serap air versus adukan

Test for Equal Variances for Y

Bartlett's Test
1 Test Statistic 4,44
P-Value 0,350
Lev ene's Test

2 Test Statistic 1,17


P-Value 0,349
Faktor

0 100 200 300 400


95% Bonferroni Confidence Intervals for StDevs

Petunjuk:

Minitab calculates and displays a test statistic and p-value for both Bartlett's test and
Levene's test where the null hypothesis is of equal variances versus the alternative of not
all variances being equal. If there are only two levels, an F-test is performed in place of
Bartlett's test.

Use Bartlett's test when the data come from normal distributions; Bartlett's test is not
robust to departures from normality.

9
Use Levene's test when the data come from continuous, but not necessarily normal,
distributions. This method considers the distances of the observations from their sample
median rather than their sample mean, makes the test more robust for smaller samples.

Hipotesis :
H0 : Varian antar Treatment sama (Identik)
H1 : Varian antar Treatment tidak sama (tidak Identik)

Karena untuk Bartlett's test, p-value= 0.35 > 0.05 maka varian antar treatmen sama.
3. Uji Independen:

Outputnya:

Autocorrelation Function for RESI1


(with 5% significance limits for the autocorrelations)

1.0
0.8
0.6
0.4
Autocorrelation

0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0

2 4 6 8 10 12 14 16 18 20 22 24 26 28
Lag

10
Karena tidak ada autocorelasi yang keluar batas atas dan bawah (garis putus-putus merah),
maka asumsi residual independen dipenuhi.

UJI PERBANDINGAN GANDA


Jika pada uji ANOVA ternyata H0 ditolak maka dapat dilanjutkan ke Uji Perbandingan
Ganda untuk mengetahui perbedaan berpasangan. Untuk contoh adukan diatas ternyata H0
ditolak, maka selanjutnya untuk mengetahui metode adukan mana yang berbeda digunakan
uji perbandingan Ganda.

Uji Perbandingan Ganda yang dapat digunakan bisa bermacam-macam tergantung


kepada kebutuhan. Beberapa uji lanjut yang biasa digunakan antara lain uji
Tukey, uji duncan (khusus jika ada treatment sebagai kontrol), uji Fisher, dan
sebagainya.

Metode Tukey (Honest Significance Diference/HSD )


Metode Tukey berdasarkan distribusi rentangan distudentkan. Titik persentil yang
sesua merupakan fungsi dari , k dan v. k adalah jumlah treatment dan v adalah derajat
kebebasan s2. Table dari titik persentil untuk = 0.05 disajikan pada table dibawah ini.

Jadi metode perbandingan berpasangan oleh Tukey adalah berbeda signifikan antara rata-rata
1
treatment ke-i dan ke-j dengan membandingkan q[, k dan v] s .
n

Diketahui dan urutkan:


Rata-rata 4 : 465.17
Rata-rata 1 : 553.33
Rata-rata 2 : 569.33
Rata-rata 3 : 610.50
Rata-rata 5 : 610.67

s2 4.961
q[, k dan v] = q[0.05, 5 dan 25]
n 5

4.961
= 4.17 =
5

Bandingkan dengan selisih rata-rata :

5 dan 1 : jika > , maka signifikan

5 dan 2 :

5 dan 3 :

5 dan 4 :

11
4 dan 1

4 dan 2

4 dan 3

3 dan 1

3 dan 2

2 dan 1

Nilai kritis dari metode Tukey (HSD) dapat dirumuskan sebagai berikut:

HSD = q ; p ;dbg S Y
S Y = MSE / r
Dimana q;p;dbg nilai tabel Tukey pada taraf nyata , jumlah perlakuan p dan derajat bebas
galat sebesar dbg. Dari rumusan diatas terlihat bahwa ulangan setiap perlakuan harus sama,
tetapi jika tidak sama maka nilai r bisa didekati dengan rataan harmonik dari semua ulangan
perlakuan. Rataan harmonik (rh) dari ulangan perlakuan dapat dihitung sebagai berikut:
t

rh =
t atau 1 / r = 1 / r
i =1
i

t h

1 / r
t
i
i =1

Confident intervals 100x(1-)% untuk i - j adalah:

Y i . - Y j . HSD

Contoh untuk data sebelumnya:

12
95% Confidence
interval secara
bersama-sama
(simultan)

Tukey 95% Simultaneous Confidence Intervals


All Pairwise Comparisons among Levels of adukan

Individual confidence level = 99.29%

adukan = 1 subtracted from:

adukan Lower Center Upper --------+---------+---------+---------+-


2 -103.33 16.00 135.33 (-------*-------)
3 -62.16 57.17 176.50 (-------*-------)
4 -207.50 -88.17 31.16 (-------*-------)
5 -62.00 57.33 176.66 (-------*-------)
--------+---------+---------+---------+-
-150 0 150 300
adukan = 2 subtracted from:

adukan Lower Center Upper --------+---------+---------+---------+-


3 -78.16 41.17 160.50 (-------*-------)
4 -223.50 -104.17 15.16 (-------*-------)
5 -78.00 41.33 160.66 (-------*-------)
--------+---------+---------+---------+-
-150 0 150 300
adukan = 3 subtracted from:

adukan Lower Center Upper --------+---------+---------+---------+-


4 -264.66 -145.33 -26.00 (-------*-------)
5 -119.16 0.17 119.50 (-------*-------)
--------+---------+---------+---------+-
-150 0 150 300

adukan = 4 subtracted from:

adukan Lower Center Upper --------+---------+---------+---------+-


5 26.17 145.50 264.83 (-------*-------)
--------+---------+---------+---------+-
-150 0 150 300

Adukan 4 berbeda terhadap lainnya kecuali terhadap adukan 1, dan cenderung hasil adukan 4
lebih kecil dari adukan lainnya.

13
Dengan metode Fisher adukan 4 dianggap berbeda dengan adukan 1 sedangkan dengan
metode Tukey adukan 4 dianggap sama dengan adukan 1. Metode Tukey lebih dapat
dipercaya karena mempertahankan uji secara simultan (bersama-sama) paling tidak (1-)
100%.

Metode Fisher (Least Significance Difference/LSD)


Uji Fisher menguji perlakuan secara berpasang-pasangan sebagai contoh jika terdapat 4
perlakuan/kelompok yang akan dibandingkan berarti terdapat C24=6 pasangan pengujian
dimana setiap pasangan memiliki peluang kesalahan jenis I sebesar . Hal ini berarti
semakin banyak jumlah perlakuan yang akan dibandingkan akan mengakibatkan
kesalahan yang harus ditanggung juga semakin besar. Hal ini tentunya akan mengurangi
tingkat keterandalan pengujian perlakuan yang dilakukan. Oleh karena itu metode Fisher
akan sangat sensitif terhadap perbedaan yang muncul dalam perlakuan karena kriteria
pemisahan perlakuan tidak terlalu ketat.
Hipotesis dari perbandingan dengan metode Fisher ini adalah sebagai berikut:

H0: i=i vs H1: ii

Nilai kritis LSD:

LSD = t / 2 ;dbg S Yi Yi'

1 1
S Yi Yi' = MSE +
ri ri'
MSE : Mean Square Error

Jika masing-masing perlakuan memiliki ulangan yang sama maka untuk semua
pasangan perlakuan kita hanya memerlukan satu nilai LSD sedangkan jika ulangan setiap
perlakuan tidak sama maka setiap pasangan perlakuan membutuhkan satu nilai LSD
sebagai pembanding.

Kriteria pengambilan keputusannya adalah sebagai berikut:

Jika beda absolut dari dua perlakuan lebih besar dari nilai LSD (|Yi-Yi| > LSD) maka dapat
disimpulkan kedua perlakuan tersebut berbeda nyata pada taraf .

Confident intervals 100x(1-)% untuk i - j adalah:

Y i . - Y j . LSD
Contoh untuk data adukan : (klik Comparison) pada Stat>Anova>One-Way

14
95% Confidence
Interval
perbandingan
berpasangan
secara Individu

Fisher 95% Individual Confidence Intervals


All Pairwise Comparisons among Levels of adukan

Simultaneous confidence level = 73.15%

adukan = 1 subtracted from:

adukan Lower Center Upper ---------+---------+---------+---------+


2 -67.75 16.00 99.75 (------*------)
3 -26.58 57.17 140.92 (------*------)
4 -171.92 -88.17 -4.42 (------*------)
5 -26.42 57.33 141.08 (------*------)
---------+---------+---------+---------+
-120 0 120 240

adukan = 2 subtracted from:

adukan Lower Center Upper ---------+---------+---------+---------+


3 -42.58 41.17 124.92 (------*------)
4 -187.92 -104.17 -20.42 (------*------)
5 -42.42 41.33 125.08 (------*------)
---------+---------+---------+---------+
-120 0 120 240

adukan = 3 subtracted from:

adukan Lower Center Upper ---------+---------+---------+---------+


4 -229.08 -145.33 -61.58 (------*------)
5 -83.58 0.17 83.92 (------*------)
---------+---------+---------+---------+
-120 0 120 240

adukan = 4 subtracted from:

adukan Lower Center Upper ---------+---------+---------+---------+


5 61.75 145.50 229.25 (------*------)
---------+---------+---------+---------+
-120 0 120 240

Interval (Lower s/d Upper) yang sama tandanya berarti ada perbedaan, sedang yang
berlainan tanda berarti tidak ada perbedaan. Sehingga untuk hasil diatas menunjukkan bahwa

15
adukan 4 berbeda terhadap lainnya, dan cenderung hasil adukan 4 lebih kecil dari adukan
lainnya. Jadi berdasarkan Fisher adukan 4 adalah adukan yang terbaik.

SOAL LATIHAN.
1. Data nilai ujian statistik selama tiga tahun dari dosen yang sama diberikan sebagai
berikut :
tahun1 tahun2 tahun3
49 43 54 63 59 68
31 34 48 45 51 47
41 54 36 59 58 64
26 28 53 39 45 32
22 48 45 50 53 55
39 40 31 33 41 50
46 22 49 47 50 42
40 32 42 43 44 62
37 35 46 57 38 36
58 45 44 27 56 49
41 37
51 40

a. Apakah data tersebut menunjukkan cukup bukti bahwa rata-rata nilai statistik dari
tahun ketahun berbeda ? Jika berbeda bagaimana perbedaan tersebut ?
Gunakan = 0.05
b. Ujilah asumsi yang diperlukan.

2. Five brands of paints are compared on their ability to resist damage due to extreme
weather conditions. Data is % damage after paints were subjected to extreme stress.

Rep Sherwin Fuller Frazee Pratt SanLuis

1 13 15 28 16 33
2 19 19 22 10 41
3 9 27 25 20 29

16
Analysis this data.

3. Data hasil penjualan produk X di tiga daerah berbeda tercatat seperti berikut eperti pada
tabel berikut :

Daerah sales Daerah sales Daerah sales


Jakarta 25 Jawa Barat 30 Jawa Tengah 60
Jakarta 26 Jawa Barat 31 Jawa Tengah 65
Jakarta 23 Jawa Barat 35 Jawa Tengah 60
Jakarta 22 Jawa Barat 35 Jawa Tengah 54
Jakarta 22 Jawa Barat 22 Jawa Tengah 58
Jakarta 22 Jawa Barat 39 Jawa Tengah 53
Jakarta 24 Jawa Barat 36 Jawa Tengah 51
Jakarta 25 Jawa Barat 30 Jawa Tengah 52
Jakarta 29 Jawa Barat 38 Jawa Tengah 55
Jakarta 23 Jawa Barat 39 Jawa Tengah 60
Jakarta 26 Jawa Barat 30 Jawa Tengah 65
Jakarta 22 Jawa Barat 37 Jawa Tengah 64
Jakarta 21 Jawa Barat 36 Jawa Tengah 66
Jakarta 26 Jawa Barat 35 Jawa Tengah 54
Jakarta 30 Jawa Barat 38

a. Apakah data tersebut menunjukkan cukup bukti bahwa rata-rata penjualan di tiga
daerah berbeda ? Jika berbeda bagaimana perbedaan tersebut ? Gunakan = 0.05
b. Ujilah asumsi yang diperlukan.

17