Tugas Anreg (g14080004)
Tugas Anreg (g14080004)
G1480004
1. a. Dari hasil Output model tersebut dapat ketiga peubah bebas (VM, FC,TS) tidak
berpengaruh nyata terhadap CGV dimana dapat kita lihat nilai p-value dari ke tiganya
lebih besar dari alpha. Sedangkan dua peubah bebas sisanya ( IM, ASH)
berpengaruh nyata terhadap CGV dimana dapat dilihat nilai p-value kedua peubah
tersebut lebih kecil dari nilai alpha. Terjadi multikolinearitas pada model tersebut
dimana dapat dilihat nilai VIF peubah bebas IM dan VM lebih besar dari 10.
b. Dari plot tersebut dapat disimpulkan terjadi pelanggaran asumsi kehomogenan
ragam. Hal ini dapat dilihat pada plot data sisaan yang membentuk corong serta
sisaan yang berpola.
c. Dapat dilakukan transformasi data atau menggunakan MKT terboboti.
d. Response is CGV
A
Mallows
ISVFT
Vars R-Sq R-Sq(adj)
C-p
S MHMCS
1 84,7
84,2 39,4 112,47
X
1 60,2
58,8 144,8 181,71 X
2 92,6
92,1
7,6 79,639 X X
2 92,0
91,4 10,3 82,958
XX
3 94,3
93,6
2,4 71,325 X X X
3 93,4
92,6
6,4 76,892 X X X
4 94,4
93,5
4,1 72,242 X X X X
4 94,3
93,4
4,3 72,467 X X X X
5 94,4
93,2
6,0 73,565 X X X X X
Dari output diatas, diperoleh model regresi terbaik dengan 3 peubah bebas, yaitu
peubah IM, ASH, dan VM. Hal tersebut dapat ditunjukkan nilai c-p mallows nya
rendah, yaitu 2,4 dan nilai R squarenya sudah cukup tinggi.
e. Stepwise Regression: CGV versus IM; ASH; VM; FC; TS
Alpha-to-Enter: 0,25 Alpha-to-Remove: 0,25
1
82,64
123,7
12,47
0,000
2
3
4
-399,41 329,34
100,6
11,58
0,000
91,8
8,87
0,000
5
4079,70 4618,85
45,0 39,5
2,33 2,77
0,028 0,010
38,9
34,2
5,5
4,95
4,12
0,43
0,000
0,000
0,669
IM
T-Value
P-Value
-10,7
-45,6 -50,7
-1,48
-3,21 -6,42
0,150
0,004 0,000
ASH
T-Value
P-Value
-40,8 -46,0
-2,76 -5,45
0,011 0,000
S
112
83,0
81,2
72,5 71,3
R-Sq
84,75
92,00
92,62
94,35 94,30
R-Sq(adj)
84,20
91,40
91,77
93,44 93,65
Mallows C-p
39,4
10,3
9,7
4,3
2,4
PRESS
391864 256902 245775 7740361 198535
R-Sq(pred)
83,12
88,94
89,42
0,00 91,45
Best alternatives:
Variable
T-Value
P-Value
Variable
T-Value
P-Value
Variable
T-Value
P-Value
Variable
T-Value
P-Value
IM
-6,51
0,000
FC
5,54
0,000
ASH
-3,55
0,001
TS
0,68
0,502
IM
-2,60
0,015
TS
-1,13
0,268
ASH
-0,98
0,337
TS
TS
-0,22
-0,78
0,828
0,444
ASH
0,20
0,845
f. Forward selection
Stepwise Regression: CGV versus IM; ASH; VM; FC; TS
Forward selection. Alpha-to-Enter: 0,25
Step
Constant
VM
T-Value
P-Value
FC
T-Value
P-Value
IM
T-Value
1
82,64
2
3
4
-399,41 329,34
123,7
100,6
12,47
11,58
0,000
0,000
4079,70
91,8
45,0
8,87
2,33
0,000
0,028
38,9
34,2
5,5
4,95
4,12
0,43
0,000
0,000
0,669
-10,7
-45,6
-1,48
-3,21
P-Value
0,150
ASH
T-Value
P-Value
0,004
-41
-2,76
0,011
S
112
83,0
81,2
72,5
R-Sq
84,75
92,00
92,62
94,35
R-Sq(adj)
84,20
91,40
91,77
93,44
Mallows C-p
39,4
10,3
9,7
4,3
PRESS
391864 256902 245775 7740361
R-Sq(pred)
83,12
88,94
89,42
0,00
Best alternatives:
Variable
T-Value
P-Value
Variable
T-Value
P-Value
Variable
T-Value
P-Value
Variable
T-Value
P-Value
IM
-6,51
0,000
FC
5,54
0,000
ASH
-3,55
0,001
TS
0,68
0,502
IM
-2,60
0,015
TS
-1,13
0,268
ASH
-0,98
0,337
TS
TS
-0,22
-0,78
0,828
0,444
ASH
0,20
0,845
Backward selection
Stepwise Regression: CGV versus IM; ASH; VM; FC; TS
Backward elimination. Alpha-to-Remove: 0,25
Step
Constant
1
2
3
4384 4831
4619
IM
T-Value
P-Value
ASH
T-Value
P-Value
VM
T-Value
P-Value
40
35
39
1,78 2,11 2,77
0,088 0,045 0,010
FC
T-Value
P-Value
0,33
0,744
TS
T-Value
P-Value
52
58
0,51 0,59
0,615 0,563
S
73,6 72,2 71,3
R-Sq
94,41 94,38 94,30
R-Sq(adj)
93,24 93,48 93,65
Mallows C-p
6,0 4,1 2,4
PRESS
7722195 223230 198535
R-Sq(pred)
0,00 90,39 91,45
Hasil yang diperoleh dari forward selection dan backward selection adalah sama,
yaitu peubah terbaik yang berpengaruh nyata pada model adalah peubah VM, IM,
dan ASH. Hal tersebut terlihat pada p-value masing masing yang ketiganya bernilai
lebih kecil dari nilai alpha (0.05).
g. Regression Analysis: CGV versus IM; ASH; VM
The regression equation is
CGV = 4619 - 50,7 IM - 46,0 ASH + 39,5 VM
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
3 2189680 729893 143,48 0,000
Residual Error 26 132268 5087
Total
29 2321948
Source DF Seq SS
IM
1 1397423
ASH
1 753282
VM
1 38975
Unusual Observations
Obs
IM
CGV
60,2
29,4
46,2
153,0
1,21 X
2,35R
99
100
Residual
Percent
90
50
10
1
-200
-100
-100
0
Residual
100
200
4000
Histogram of t he Residuals
4400
4800
Fitted Value
5200
4,5
Residual
Frequency
6,0
3,0
1,5
0,0
-100
-100
-50
0
50
Residual
100
150
8 10 12 14 16 18 20 22 24 26 28 30
Observation Order
Setelah model baru diregresikan, didapat nilai VIF sudah lebih kecil dari 10, artinya
sudah tidak terdapat multikolinearitas. Tetapi tebaran sisaan masih membentuk
corong masih tidak homogen ragamnya.
Regresi dengan membuang pengamatan ke 2 dan 5
Regression Analysis: CGV versus IM; ASH; VM
The regression equation is
CGV = 3969 - 41,8 IM - 48,9 ASH + 51,5 VM
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
3 1541332 513777 127,52 0,000
Residual Error 24 96698 4029
Total
27 1638030
Source DF Seq SS
IM
1 1224736
ASH
1 256770
VM
1 59826
Residual Plots for CGV
Normal Probability Plot of the Residuals
99
100
Residual
Percent
90
50
10
-100
0
Residual
100
4400
4600
4800
5000
Fitted Value
5200
8
6
Residual
Frequency
0
-50
-100
4
2
0
50
50
0
-50
-100
-100
-50
0
Residual
50
100
8 10 12 14 16 18 20 22 24 26 28
Observation Order
Sudah tidak ada pelanggaran asumsi lagi, jadi model sudah tepat.
Mallows
R-Sq(adj)
81,5 -0,6
81,5 -0,6
80,2
1,1
80,0
1,1
77,1
3,0
76,9
3,1
72,6
5,0
XXXX
Cp
S 1234
0,19408 X
0,19422
X
0,20100 X X
0,20213 X X
0,21626 X X X
0,21708 X X X
0,23656 X X X X
Dari output diatas, diperoleh model regresi terbaik dengan 1 peubah bebas, yaitu
peubah X2. Hal tersebut dapat ditunjukkan nilai c-p mallows nya rendah, yaitu -0,6
dan nilai R squarenya sudah cukup tinggi.
Source DF Seq SS
X1
1 0,51900
X2
1 1,03100
X3
1 0,00123
X4
1 0,00496
Versus Fits
99
0,2
Residual
Percent
90
50
0,0
-0,2
10
1
-0,50
-0,25
0,00
Residual
0,25
-0,4
0,50
3,00
3,25
3,50
Fitted Value
0,2
0,0
1
0
-0,4
-0,3
-0,2
-0,1
0,0
Residual
4,00
Versus Order
Residual
Frequency
Histogram
3,75
0,1
0,2
-0,2
-0,4
4
5
6
7
Observation Order
10
Dari output minitab diatas dapat disimpulkan bahwa semua peubah bebas tidak
berpengaruh nyata terhadap peubah respon. Hal itu dibuktikan bahwa nilai p-value
dari semua peubah tersebut lebih besar dari nilai alpha.
Kemudian terdapat multikolinearitas antar peubah bebasnya. Hal itu ditunjukkan oleh
nilai VIF semua peubah bebas lebih besar dari 10.
Terjadi pelanggaran asumsi sisaan yang ditunjukkan oleh gambar output di atas,
yaitu asumsi kehomogenan ragam dimana terlihat bahwa plot data sisaan
membentuk pola yang berarti ragam dari sisaan tersebut tidak homogen. Selain itu,
tebaran data tersebut membentuk pola, sehingga bisa dikatakan terjadi autokorelasi.
Jadi analisis regresi berganda tidak tepat digunakan dalam kasus ini.
c. Stepwise Regression: Y versus X1; X2; X3; X4
Forward selection. Alpha-to-Enter: 0,05
Response is Y on 4 predictors, with N = 10
Step
Constant
X2
T-Value
P-Value
1
0,09058
0,622
6,38
0,000
S
0,194
R-Sq
83,59
R-Sq(adj)
81,53
Mallows Cp
-0,6
PRESS
0,449329
R-Sq(pred)
75,53
Best alternatives:
Variable
T-Value
P-Value
Variable
T-Value
P-Value
Variable
T-Value
P-Value
X3
-6,38
0,000
X4
-1,82
0,107
X1
-1,78
0,114
Dari output diatas dapat dilihat bahwa model yang dihasilkan adalah sama.
d. Regression Analysis: Y versus X2
The regression equation is
Y = 0,091 + 0,622 X2
Analysis of Variance
Source
DF
SS
MS
F
P
Regression
1 1,5346 1,5346 40,74 0,000
Residual Error 8 0,3014 0,0377
Total
9 1,8360
Unusual Observations
Obs X2
Y Fit SE Fit Residual St Resid
3 5,50 3,1000 3,5106 0,0647 -0,4106 -2,24R
R denotes an observation with a large standardized residual.
Residual Plots for Y
Normal Probabilit y Plot
Versus Fit s
99
Residual
Percent
90
50
0,00
-0,25
10
1
-0,50
-0,25
0,00
Residual
0,25
-0,50
0,50
3,00
Hist ogram
3,25
3,50
Fitted Value
3,75
4,00
Versus Order
3,6
Residual
Frequency
4,8
2,4
0,00
-0,25
1,2
0,0
-0,4
-0,3
-0,2
-0,1
0,0
Residual
0,1
0,2
-0,50
4
5
6
7
Observation Order
10
Dari output minitab diatas dapat disimpulkan bahwa peubah bebas X2 berpengaruh
nyata terhadap Y dimana dapat dilihat nilai p-value dari peubah X2 lebih kecil dari
nilai alpha. Kemudian dapat dilihat tidak ada multikolinearitas karena nilai VIFnya
lebih kecil dari 10.
Terjadi pelanggaran asumsi kehomogenan ragam dimana terlihat dari plot data
sisaan membentuk pola yang berarti ragam dari sisaan tersebut tidak homogen.
Selain itu, tebaran data tersebut membentuk pola, sehingga terjadi autokorelasi.
1
2
3
4
0,52306 0,64307 0,78546 0,09058
X1
T-Value
P-Value
0,04
0,12
0,909
X2
T-Value
P-Value
X3
T-Value
P-Value
-0,13 -0,10
-0,23 -0,22
0,828 0,836
X4
T-Value
P-Value
S
0,237 0,216 0,201 0,194
R-Sq
84,76 84,72 84,60 83,59
R-Sq(adj) 72,57 77,07 80,20 81,53
Mallows Cp
5,0
3,0
1,1
-0,6
PRESS
1,69126 0,860298 0,580567 0,449329
R-Sq(pred) 7,88 53,14 68,38 75,53
Kedua prosedur baik forward selection dan backward selection mengasilkan hal yg
sama yaitu peubah terbaik yang berpengaruh nyata pada model adalah peubah X2.
Hal tersebut terlihat pada p-value bernilai lebih kecil dari nilai alpha (0.05.