http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju
wiwiek@statistika.its.ac.id
(Yˆ
i 1
i Y )(Yi Yˆi ) b1 ( X i X ){(Yi Y ) b1 ( X i X )}
i 1
n n
Yi
Yi Yˆi
(Yˆ
i 1
i Y )(Yi Yˆi ) b1 ( X i X ){(Yi Y ) b1 ( X i X )}
i 1
Yˆi n
{b1 ( X i X )(Yi Y ) b12 ( X i X ) 2 }
Y Yˆi Y
i 1
Y
Yˆ b0 b1 X
n n
b1 ( X i X )(Yi Y ) b12 ( X i X ) 2
i 1 i 1
n n
Gambar 1. Kedudukan Titik Pengamatan Dan Dugaan b1 ( X i X )(Yi Y ) b12 ( X i X ) 2
Model Regresi i 1 i 1
b1 S XY b S XX b1b1 S XX b12 S XX 0
2
Berdasarkan kedudukan titik pengamatan dan duga- 1
i 1 i 1 i 1 n
Sum of Square Total, SST
(Yˆ Y )
i 1
i
2
: Jumlah Kuadrat Karena Regresi
(Y
i 1
i Yˆi ) 2 : Jumlah Kuadrat Sekitar Regresi,
Tabel ANOVA
Kuadrat
Derajat Jumlah
Sumber tengah
Bebas Kuadrat
Variasi (KT) =
(db) (JK)
(Source) JK/db
(df) (SS)
(MS)
n
Regresi 1 (Yˆ Y )
i 1
i
2
KTRegresi
1
n JK 1
(Yi Yˆi ) 2 s2 n
Error atau
Residual
n-2
i 1
n2
(Yi Y ) 2
= 2
rX2 ,Y b12 i 1 b1
n
(Xi X )
n
Total,
(Y Y ) 2 2
n-1
terkoreksi i 1
i i
i 1
Keterangan : Judul yang ditulis miring, yaitu : Source, df,
n 2
( X i X )
SS, dan MS, merupakan istilah yang lazim
digunakan pada program MINITAB. i 1
n
(Yi Y ) 2
Koefisien Determinasi, R2 i 1
Koefisien ini dinyatakan dalam %, yang menyata-
kan kontribusi regresi, secara fisik adalah akibat n n
prediktor, terhadap variasi total variabel respon, yai-
tu Y. Makin besar nilai R2, makin besar pula kontri-
(Yˆ
i 1
i Y )2 (bi 1
0 b1 X i Y ) 2
busi atau peranan prediktor terhadap variasi respon. R2 n
n
Biasanya model regresi dengan nilai R2 sebesar 70% (Yi Y ) 2 (Y i Y )2
atau lebih dianggap cukup baik, meskipun tidak se- i 1 i 1
lalu. Rumus koefisien determinasi adalah sebagai n
berikut : (Y b X b X
i 1
1 1 i Y )2
n
JK Regresi (Yˆi Y )2 (Y
n
Y )2
R 2
i 1
n i 1
i
JK Total
(Yi Y )2 n n
i 1 (b1 ( X i X )) 2
i 1
b
i 1
1
2
(X i X )2
n
n
Hubungan antara prediktor X dengan respon Y, sela-
in dapat dinyatakan oleh koefisien regresi, yaitu b1, (Y
i 1
i Y )2 (Y
i 1
i Y )2
dapat pula dinyatakan dengan koefisien korelasi,
n n
yang dinotasikan rX,Y. Bedanya, koefisien regresi
dapat digunakan untuk memprediksi nilai respon,
b 1
2
(X i X) 2
(X i X )2
sedang pada koefisien korelasi tidak dapat. Persa- R2 i 1
n
b12 i 1
n
maan yang menyatakan hubungan ini adalah : (Y Y )
i 1
i
2
(Y Y )
i 1
i
2
1/ 2
n
2
(Yi Y )
b1 = ni 1 rX ,Y
n
i 1 rYˆ ,Y i 1
n n
Buktikanlah ! (Yˆi Yˆ )2
i 1
(Y Y )
i 1
i
2
r 2
R r 2 2 (Yˆi Yˆ )2
i 1
(Y Y )
i 1
i
2
X ,Y Y , Yˆ
n
Bukti : (Y b X b X
i 1
1 1 i Y )(Yi Y )
1 / 2
= n n
n
(Yi Y ) 2
(Yˆi Yˆ )2
i 1
(Y Y )
i 1
i
2
rX ,Y = b1 ni 1
(Xi X ) 2 n
i 1 b (X
i 1
1 i Y )(Yi Y )
= n n
b (X
i 1
1
2
i Y )2 (Y Y )
i 1
i
2
2
lack of fit artinya pengujian untuk mendeteksi apa-
n kah model linier order pertama tepat. Bila lack of fit
b1 ( X i Y )(Yi Y ) tidak bermakna maka model linier order pertama te-
i 1
rX ,Y pat, sedang bila lack of fit bermakna maka model li-
= n n nier order pertama tidak tepat, perlu dikembangkan
b1 (X
i 1
i Y ) 2
(Y Y )
i 1
i
2
menjadi model linier kuadratik atau model nonlini-
er. Pengujian lack of fit ini diperlukan bila terdapat
pengamatan berulang, yaitu satu nilai prediktor a-
tau satu kombinasi nilai prediktor (bila digunakan
rY ,Yˆ rX ,Y , maka rY2,Yˆ rX2 ,Y R 2 beberapa prediktor) yang berpasangan dengan bebe-
rapa nilai respon.
Berikut ini akan ditampilkan organisasi data hasil
Lack of Fit pengamatan berulang pada eksperimen dengan satu
dan dua prediktor.
Lack of fit artinya penyimpangan atau ketidak tepat-
an terhadap model linier order pertama. Pengujian
nm
Ym (Y
u 1
mu Ym ) 2 =
Xm Y11 , Y12 , . . . , Ynnm nn nm
nm – 1
Y
u 1
2
mu nmYm2
Total Jumlah Kuadrat Penyimpang-
an Terhadap Mean Respon, disebut:
Error Murni, Galat Murni, Pure Error
Contoh 1:
Berikut ini data hasil eksperimen :
3
5 2,2 2,7 13 5,4 4,7 21 3,2 6
6 3,8 3,3 14 3,2 4,7 22 3 6
7 1,8 3,3 15 1,9 4,7 23 3 6,3
8 3,7 3,7 16 1,8 5 24 5,9 6,3
Sumber : Applied Regression Analysis, Second Edition, Norman Draper dan Harry Smith, halaman 38.
12,470 11
Pengujian kemaknaan lack of fit dilakukan dengan Error 11 12,470 1,134 KTerror murni)
cara memecah Jumlah Kuadrat Error menjadi dua, Murni
Total,
yaitu Jumlah Kuadrat Error Murni dan Jumlah Kua- terkoreksi
23 27,518
drat Lack of Fit. Perhitungan jumlah kuadrat error Keterangan : L of F = Lack of Fit
murni dilakukan seperti yang ditampilan pada tabel
di atas, sedang Jumlah Kuadrat Lack of Fit merupa- Penggunaan Tabel Anova ada dua, pertama untuk
kan selisih antara Jumlah Kuadrat Error dengan menguji kemaknaan pengaruh variabel bebas (Tabel
Jumlah Kuadrat Error Murni. Tabel ANOVA men- ANOVA 1), dan ke dua untuk menguji kemaknaan
jadi seperti berikut : Lack of Fit (Tabel ANOVA 2). Statistik uji yang
Tabel ANOVA 1
digunakan adalah F.
Sumber Derajat Jumlah Kuadrat
Variasi Bebas Kuadrat tengah F
Pengujian secara cepat, yaitu dengan memanfaatkan
(db) (JK) (KT) = JK/db KT Reg / hasil atau keluaran MINITAB. Tabel ANOVA yang
KT Error memuat Lack of Fit ditampilkan dengan cara meng-
(Source) (df) (SS) (MS) klik Pure Error pada Window Option.
Regresi 1 6,326 6,326 6,569
Tabel ANOVA 2
Kuadrat
Data pada contoh 1 bila diolah menggunakan MINI-
Sumber Derajat Jumlah tengah TAB tanpa memperhatikan lack of fit menghasilkan
Variasi Bebas Kuadrat (KT) = Tabel ANOVA 1 berikut :
(db) (JK) JK/db F
Analysis of Variance 1
(Source) (df) (SS) (MS) Source DF SS MS F P
Regression 1 6,3247 6,3247 6,57 0,018
Regresi 1 6,326 6,326 6,569 Residual Error 22 21,1937 0,9633
(KTRegresi Total 23 27,5183
Error atau 22 21,192 s 2 0,963 dibagi
Residual KTerror) Apabila pengolahan dilakukan dengan memperhati-
Lack of 11 8,722 0,793
kan lack of fit, didapatkan hasil keluaran berikut :
0,699
Fit (KTL of F Analysis of Variance 2
dibagi
4
0,718 83,6 -0,04137 0,759367
Source DF SS MS F P
Regression 1 6,3247 6,3247 6,57 0,018 0,642 99,5 -0,0712 0,713201
Residual Error 22 21,1937 0,9633 0,658 111,2 -0,02123 0,67923
Lack of Fit 11 8,7237 0,7931 0,70 0,718
Pure Error 11 12,4700 1,1336
Total 23 27,5183 Sebagai langkah awal adalah memplot Y terhadap
X. Dihasilkan plot berikut :
Cara cepat menyimpulkan hasil pengujian, yaitu
Scatterplot of Y vs X
dengan memanfaatkan hasil MINITAB dapat dila-
1,0
kukan dengan melihat nilai P. Nilai P sebesar
0,018, yang kurang dari 0,05 pada Analysis Vari-
0,9
ansi 1, menandakan prediktor berpengaruh pada res-
pon. Pada Analysis Variansi 2, didapatkan nilai P
Lack of Fit sebesar 0,718 yang lebih dari 0,05, 0,8
Y
sehingga disimpulkan Lack of Fit tidak bermakna;
ini berarti model linier order pertama sudah sesuai. 0,7
Data Display
Y X RESI1 FITS1 n n
0,971
0,979
3
4,7
-0,02239
-0,00945
0,99339
0,988454
Xi
i 1
= K1 = 1244,50 Y
i 1
i
2
= K4 =
5
Kesimpulannya model cukup baik, berdasarkan Probability Plot of C1
pada : Normal - 95% CI
99
- Plot Y terhadap X menunjukkan model Mean
StDev
-1,47059E-07
0,03873
90
N
AD
34
0,390
P-Value 0,364
- Variabel bebas berbeda dengan nol se- 80
Percent
60
berpenga-ruh pada Y.
30
20
wah ini.
50 0
-1
10
-2
1
-2 -1 0 1
Standardized Residual
2 0,7 0,8
Fitted Value
0,9 1,0 Data ulangan hampiran berdasarkan data soal K:
Histogram of the Residuals Residuals Versus the Order of the Data
X = 9,3 9,9
10,0 2 X = 12,3 12,5 12,6
Standardized Residual
7,5 1
X = 18,8 18,8 18,9
Frequency
0
5,0
-1
X = 21,7 21,9
2,5
0,0
-2 X = 46,8 46,8
-2 -1 0 1
Standardized Residual
2 1 5 10 15 20
Observation Order
25 30
X = 70,6 71,1 71,3
X = 83,2 83,6
Lengkapilah perhitungan dan isikan pada tabel di atas. Selanjutnya, lengkapilah pula tabel ANOVA berikut :
Analysis of Variance
Source DF SS MS F P
Regression 1 0,23915 0,23915 154,62 0,000
Residual Error 32 0,04949 0,00155
Lakukanlah evaluasi, apakah lack of fit bermakna ? Lakukan analisis kebaikan model.
6
Statistik Matematika Pada ANOVA
variansi mean setiap perlakuan ter-
Yang akan diuraikan pada topik Statistik Matema- hadap mean keseluruhan.
tika pada ANOVA ini adalah :
- Distribusi setiap komponen Tabel Ana- Bila dinyatakan dengan persamaan:
lisis Variansi k ni k ni k ni
(Source)
(db) (JK)
JK/db
~ 12 , maka ~ 2k
(df) (SS) i 1 j 1 ni
(MS) i 1
n 2
Yij Y
(Yˆi Y ) 2
k ni k ni
~ 2k 2
Regresi 1
i 1
KTRegresi
, Yij Y
ni 1 i 1 j 1
~ 2k
ni 1
2
i 1 j 1
i 1 i 1
n JK
Error atau n-2 (Yi Yˆi ) 2
i 1
s2
n2
Didapatkan hasil :
Residual
Y
k ni 2
n
Y ~ 2k 2
Total,
terkoreksi
n-1 (Yi Yi )
i 1
2
i 1 j 1
ij
ni 1
i 1
y1 y2 yk y
1 ni n y i i
yi. yij y i
k
ni j 1
n i
i
7
ni
Y ~ N ( , 2 ), E (Y ), 2 var(Y )
Y Yi ~ 2k
k
2
ij 2 Y E (Y ) Y
i 1 j 1 ni k ~ N (0,1)
i 1
(var(Y ))1/ 2
Penalaran suku 3,
2 Yi .
Yi . ~ N ( , ), 1/ 2
~ N (0,1) Kembali ke Regresi
ni 2
n n
(Yˆ Y )
i 2
Penalaran distribusi i ,
(Yi . ) 2 k (Yi . ) 2
i 1
~ 12 ~ k2
2
i 1 2
n i ni
k n (Y ) 2 k
ni (Yi. Y ) 2
i 1
i i.
2
~ k2
i 1 2
~ k21
Hasil Keseluruhan :
Y
k ni
2
ij Y ~ 2k 2
i 1 j 1 ni 1
i 1
ni
Y Yi ~ 2k
k
2
ij
i 1 j 1 ni k
i 1
k ni k
Perlu diingat :
8
9