Pokok Bahasan :
Sisaan
Sisaan adalah menyimpangnya nilai amatan yi
terhadap dugaan nilai harapannya
)
)
)
E [Y | x i ] E [Y | x i ] = yi = b 0 + b1x i
(
yi y i ) ei
=
=
s( yi y i )
)
ei = yi yi
1 + ( xi x )2
ei
, hii = nn
ri =
2
s (1 hii )
(
)
x
x
k
k =1
10
11
12
13
10.98
11.13
12.51
8.4
9.27
8.73
6.36
8.5
7.82
9.14
8.24
12.19
11.88
X1
20
20
23
20
21
22
11
23
21
20
20
21
21
14
15
16
17
18
19
20
21
22
23
24
25
9.57
10.94
9.58
10
8.11
6.83
8.88
7.7
8.47
8.86
10.4
11.08
19
23
20
22
22
11
23
20
21
20
20
22
Y
X1
Scatterplot of Y vs X1
13
12
11
10
Y
9
8
7
6
10
12
14
16
18
X1
20
22
24
10
11
12
13
10.98
11.13
12.51
8.40
9.27
8.73
6.36
8.50
7.82
9.14
8.24
12.19
11.88
y_duga
9.35
9.35
10.22
9.35
9.64
9.93
6.75
10.22
9.64
9.35
9.35
9.64
9.64
sisaan
1.63
1.78
2.29
-0.95
-0.37
-1.20
-0.39
-1.72
-1.82
-0.21
-1.11
2.55
2.24
14
15
16
17
18
19
20
21
22
23
24
25
9.57
10.94
9.58
10.09
8.11
6.83
8.88
7.68
8.47
8.86
10.36
11.08
y_duga
9.06
10.22
9.35
9.93
9.93
6.75
10.22
9.35
9.64
9.35
9.35
9.93
sisaan
0.51
0.72
0.23
0.16
-1.82
0.08
-1.34
-1.67
-1.17
-0.49
1.01
1.15
Y = 0 + 1x +
E [ Y | xi ]
Acak
Bentuk sebaran Y =
bentuk sebaran eror
Memeriksa bentuk
sebaran Y = memeriksa
bentuk sebaran eror
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Fix
Acak
H is to g r a m S is a a n
Norm al
4
Frekuensi
-3
-2
-1
0
S is a a n
HASIL
DIAGNOSA :
Sebaran
sisaan agak
menjulur ke
kanan
95
Peluang normal
90
80
70
60
50
40
30
Hasil Diagnosa :
bisa dianggap lurus
menyebar Normal
20
10
5
-4
-3
-2
-1
0
1
Sisaan
40
30
20
sisaan
10
0
-10
-20
-30
-40
0
50
100
y_duga
150
200
sisaan
-1
-2
7.0
7.5
8.0
8.5
y_duga
9.0
9.5
Kondisi Gauss-Markov
10.0
10.5
1. E[ i ] = 0
terpenuhi
3. E[ i j ] = 0, i j terpenuhi
terhadap Y
i
Pola tebaran sisaan memenuhi asumsi MKT:
berpusat di NOL, lebar pita sama, tidak berpola
Pola tebaran sisaan yang tidak memenuhi asumsi MKT:
Ragam tidak homogen (perlu analisis kuadrat terkecil terboboti; atau transformasi
thdp Y)
Penyimpangan terhadap persamaan
regresi bersifat sistematis; atau karena
tdk disertakannya 0 kedalam model
Model tidak pas (perlu suku-suku lain
dalam model atau transformasi thdp Y)
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
Transformasi untuk :
Menghomogenkan Ragam
Transformasi terhadap peubah respon Y
Anggap : 2 = a b
1
Y
1
b = 3 Y* =
Y
b = 2 Y* = ln Y
jika b = 4 Y* =
b = 1 Y* = Y
Plot Sisaan vs
(response is Y)
(response is akar Y)
1,0
10
0,5
Residual
Residual
0,0
-0,5
-5
-1,0
-10
-1,5
5
10
15
FittedValue
20
25
2,5
3,0
3,5
4,0
Fitted Value
4,5
5,0
RESI1
-1
-2
0
6
urutan
10
12
Hasil Diagnosa :
Tebaran tidak membentuk
pola
Sisaan saling bebas
Perhatikan :
lebar pita sama/tidak
berpola/tidak
RESI1
Hasil Diagnosa :
-1
-2
0
6
urutan
10
12
Sisaan Terstandardkan
(Sisaan Terbakukan)
SISAAN TERBAKUKAN : ri
(
yi y i ) ei
=
=
s( yi y i )
1 + ( x i x )2
ei
, hii = n
ri =
2
(
)
x
x
s (1 hii )
k
ei = sisaan amatan ke-i
n = banyaknya pengamatan
s2 = dugaan bagi ragam Yi KTsisaan
hii = unsur diagonal ke-i matriks H = X(XX)-1X
(response is ln(y))
2
1,0
1
0,5
SRES1
Residual
0
0,0
-1
-2
-0,5
-3
-1,0
-4
1,0
1,2
1,4
1,6
1,8
2,0
Fitted Value
2,2
2,4
2,6
2,8
1,0
1,2
1,4
1,6
1,8
2,0
FITS1
2,2
2,4
2,6
2,8
Nilai PRESS
PRESS = Prediction Sum of Squares, adalah prosedur
yang merupakan kombinasi dari: semua kemungkinan regresi, analisis sisaan, dan teknik validasi.
Digunakan untuk mengukur validitas model.
PRESS = ( yi y i , i )
= (ei,-i )
yi
ei R2PRED=1 PRESS
=
2
1 h
( yi y)
i =1
ii
n
Nilai PRESS
PROSEDUR PRESS
(lanjutan)
7. Pilih model yang relatif memiliki nilai PRESS terkecil, dan melibatkan
peubah penjelas sedikit.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
ramalan Yi
tnp amatan
ke-i
ei,-i
i,-i
7,46
10
8,06
-0,6
0,36
6,77
7,026
-0,256
0,06553
12,74
13
8,495
4,245
18,02003
7,11
7,54
-0,43
0,18490
7,81
11
8,604
-0,794
0,63043
8,84
14
10,538
-1,698
2,88320
6,08
5,982
0,098
0,00960
5,39
4,824
0,566
0,32035
8,15
12
9,176
-1,026
1,05267
6,42
6,516
-0,096
0,00921
5,73
5,435
0,295
0,08703
kuadrat
Total = PRESS =
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
23,6229
Nilai PRESS
(lanjutan)
Output Minitab untuk data contoh tsb Hasil PRESS melalui proses
The regression equation is
Y = 3,00 + 0,500 X
Predictor
Constant
X
Coef
SE Coef
3,002
1,124
0,4997 0,1179
T
2,67
4,24
P
0,026
0,002
MS
F
P
27,470 17,97 0,002
1,528
= hasil Minitab
Untuk k=1 hanya ada 1 model
Amatan ke-3 memberikan
simpangan ramalan terbesar
Amatan ke-3 dapat dipandang
sebagai amatan berpengaruh
Dugaan parameter regresi
tanpa amatan ke-3 sangat
berbeda dg lainnya dugaan
yg ini relatif yg benar/baik
Nilai PRESS
Output Minitab data lengkap
The regression equation is
Y = 3,00 + 0,500 X
Predictor
Constant
X
(lanjutan)
Coef
SE Coef
3,002 1,124
0,4997 0,1179
T
P
2,67 0,026
4,24 0,002
Predictor
Coef
SE Coef
T
Constant 4,00619 0,00221 1811,78
X tnp 3
0,345334 0,000237 1454,74
P
0,000
0,000
Analysis of Variance
Source
DF
SS
Regression
1 27,470
Residual Error 9 13,756
Total
10 41,226
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 20,161 20,161 2116264,34 0,000
Residual Error 15
0,000 0,000
Total
16 20,161
MS
F
P
27,470 17,97 0,002
1,528
Nilai PRESS
(lanjutan)
Dugaan garis regresi dg data lengkap Dugaan garis regresi tanpa amatan ke-3
PRESS = 23,6210
R-Sq(pred) = 42,70%
PRESS = 0,000174853
R-Sq(pred) = 100,0%
Y = 3,002 +0,4997 X
13
12
11
Y tnp 3
10
Y
9
8
6
5
4
5
5,0
7,5
10,0
X
12,5
15,0
5,0
7,5
10,0
X tnp 3
12,5
Semakin kecil nilai PRESS-nya model semakin valid semakin baik untuk
memprediksi. Setiap 1 model regresi thdp 1 set data memiliki 1 nilai PRESS
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
15,0
Pencilan
Pencilan adalah pengamatan yang nilai mutlak sisaannya jauh lebih besar daripada sisaan-sisaan lainnya
Pencilan
(lanjutan)
Plot antara Sisaan ei vs dugaan Yi
2
sisaan2
Sisaan baku-2
-1
-1
5
8
dugaan-Y2
10
8
dugaan-Y2
10
Pencilan
(lanjutan)
MENDETEKSI PENCILAN
Hitung nilai
dengan
ei
ri =
s (1 hii )
hii =
1
n
( x i x )2
n
(xk x )
i =1
Yi
Xi
ri
7.46
10 -0.46018
6.77
8 -0.19633
12.74
13
2.99999
7.11
9 -0.33085
7.81
11 -0.59695
8.84
14 -1.13497
6.08
0.07042
5.39
0.3807
8.15
12 -0.75518
6.42
7 -0.06974
5.73
0.21188
Pencilan (lanjutan)
DATA LENGKAP
12
12
11
11
10
10
Y tnp pclan
Y-3
9
8
9
8
6
5
5
5,0
7,5
10,0
12,5
15,0
5,0
7,5
X-3
Coef
3.002
0.4997
S = 1.23631
SE Coef
1.124
0.1179
12,5
Y = 4.01 + 0.345 X
Y = 3.00 + 0.500 X
Predictor
Constant
X
10,0
X tnp pclan
T
P
2.67 0.026
4.24 0.002
R-Sq = 66.6%
Predictor
Constant
X
Coef
4.00565
0.345390
S = 0.00308168
SE Coef
0.00292
0.000321
P
0.000
0.000
R-Sq = 100.0%
15,0
Pencilan (lanjutan)
Plot sisaan baku (ri) vs dugaan Y
Data Lengkap
3
1.5
1.0
s baku tnp pcl
sisaan2
0.5
0.0
-0.5
-1.0
-1
-1.5
5
dugaan-Y2
10
7
dugaan tnppcl
Tebaran tidak berpola, menyebar di sekitar nilai nol, lebar pita relatif sama
Amatan Berpengaruh
AMATAN BERPENGARUH :
berkaitan dengan besarnya perubahan yang terjadi pada
dugaan parameter regresi jika pengamatan tersebut disisihkan
X1
1,2 1,2 1,2 1,3 1,3 1,3 1,4 1,4 1,4 1,5 1,5 1,5 1,6 1,6 1,6
4,0
Y1 2,11 1,39 0,78 2,02 2,46 3,67 2,56 1,74 1,88 5,15 2,41 2,00 3,56 3,09 0,78 4,29 3,33 3,10 15,00
Unusual Observations
Scatterplot of Y1 vs X1
16
14
Obs X1
Y1
Fit
10 1,40 5,147 2,895
15 1,50 0,776 3,345
19 4,00 15,000 14,576
12
Y1
10
8
6
SE Fit
0,244
0,243
1,009
Residual
2,252
-2,569
0,424
St Resid
2,19 R
-2,50 R
1,34 X
4
2
0
1,0
1,5
2,0
2,5
X1
3,0
3,5
4,0
Amatan Berpengaruh
(lanjutan)
OUTPUT MINITAB
The regression equation is
Y1 = - 3,39 + 4,49 X1
S = 1,05749 R-Sq = 88,8% R-Sq(adj) = 88,1%
Analysis of Variance
Source
DF
SS
Regression
1
150,10
Residual Error 17
19,01
Total
18 169,11
Unusual Observations
Obs X1
Y1
Fit
10
1,40 5,147 2,895
15
1,50 0,776 3,345
19
4,00 15,000 14,576
MS
150,10
1,12
SE Fit
0,244
0,243
1,009
F
P
134,22 0,000
Residual
2,252
-2,569
0,424
St Resid
2,19 R
-2,50 R
1,34 X
Amatan Berpengaruh
(lanjutan)
Y1 = - 3,39 + 4,49 X1
Y1 = - 1,26 + 2,88 X1
Analysis of Variance
Source
DF
SS
Regression
1 150,10
Residual Error 17 19,01
Total
18 169,11
Analysis of Variance
Source
DF
SS
Regression
1
5,797
Residual Error 16 16,996
Total
17 22,793
MS
150,10
1,12
F
P
134,22 0,000
Unusual Observations
Obs X1
Y1
Fit
SE Fit Resid St Resid
10 1,40 5,147 2,895 0,244 2,252 2,19 R
15 1,50 0,776 3,345 0,243 -2,569 -2,50 R
19 4,00 15,000 14,576 1,009 0,424 1,34 X
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
MS
F
P
5,797 5,46 0,033
1,062
Unusual Observations
Obs
X1
Y1
Fit SE Fit Resid St Resid
10 1,40 5,147 2,764 0,256 2,383
2,39 R
15 1,50 0,776 3,052 0,318 -2,276 -2,32 R
Amatan Berpengaruh
(lanjutan)
Dugaan Garis Regresi Data Lengkap
Y1 = - 3,394 + 4,493 X1
14
14
12
12
Y1 tnp amatan 19
16
Y1
10
8
6
4
10
8
6
4
0
1,0
1,5
2,0
2,5
X1
3,0
3,5
4,0
1,0
1,5
2,0
2,5
X1 tnp amatan 19
3,0
3,5
4,0
Amatan Berpengaruh
(lanjutan)
ei
Di =
1
2
(
)
1
s
h
ii
hii 1
1 hii p
Keterangan:
s2 = dugaan bagi ragam Yi = KTsisaan
hii = unsur diagonal ke-i matriks H = X(XX)-1X
Nilai Di dibandingkan dengan F (p,n-p; 1-). Dengan n = banyaknya
pengamatan dan p = banyaknya parameter
Di > F (p,n-p;1-). menandakan bahwa amatan ke-i berpengaruh.
Itasia & Y Angraini Dep. Statistika FMIPA-IPB
X (i)
Y (i)
e (i)
r (i)
D (i)
2,11
1,01
1,00
0,30
1,39
0,30
0,29
0,09
0,78
-0,32
-0,32
-0,09
1,2
2,02
0,02
0,02
0,01
1,2
2,46
0,46
0,45
0,11
1,2
3,67
1,68
1,64
0,45
1,3
2,56
0,11
0,11
0,03
1,3
1,74
-0,71
-0,69
-0,17
1,3
1,88
-0,56
-0,55
-0,13
1,4
5,15
2,25
2,19
0,59
1,4
2,41
-0,49
-0,47
-0,11
1,4
2,00
-0,90
-0,87
-0,21
1,5
3,56
0,21
0,21
0,05
1,5
3,09
-0,26
-0,25
-0,06
1,5
0,78
-2,57
-2,50
-0,72
1,6
4,29
0,50
0,49
0,11
1,6
3,33
-0,47
-0,45
-0,11
1,6
3,10
-0,70
-0,68
-0,16
15,00
0,42
1,34
4,40
Amatan Berpengaruh
CONTOH PENGGUNAAN Di
(lanjutan)
Amatan Berpengaruh
(lanjutan)