Regresi Dummy
Regresi Dummy
http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju, wiwiek@statistika.its.ac.id
9,2
342
Contoh 1
>
>
>
>
Coef
-161,90
54,294
90,00
27,17
S = 19,0464
SE Coef
37,43
4,755
11,05
11,01
R-Sq = 94,0%
T
-4,32
11,42
8,14
2,47
P
0,001
0,000
0,000
0,027
R-Sq(adj) = 92,8%
Analysis of Variance
dengan :
C14 adalah kolom yang memuat variabel
dummy,
pada contoh soal ini adalah Polymer.
C15 C17 menyatakan asal Polymer, yang
kemudian dinamai Z1, Z2, dan Z3; Z1 bernilai 1
menunjukkan eksperimen menggunakan
Polymer 1, begitu pula dengan Z2 dan Z3.
Hasil eksperimen beserta nilai-nilai variabel dummy
di-tampilkan pada tabel berikut:
pH
(X)
Suspended
Solid
(Y)
Polymer
Z
1
Z
2
Z3
6,5
6,9
7,8
8,4
8,8
9,2
6,7
6,9
7,5
7,9
8,7
9,2
6,5
7
7,2
7,6
8,7
292
329
352
378
392
410
198
227
277
297
364
375
167
225
247
268
288
1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
Source
Regression
Residual Error
Total
Source
pH
Z1
Z2
DF
1
1
1
DF
3
14
17
SS
80182
5079
85260
MS
26727
363
F
73,68
P
0,000
Seq SS
54856
23118
2208
1z X 1i Z1i + i
ii. = 0,05
F=
R ( 2 , 3 | 0 , 1 ) 25326
=
= 69,77
MSE
363
450
Variable
Y Polimer1
Y Polimer2
Y Polimer3
400
350
Coef
-158,27
53,824
197,69
-108,74
-13,561
17,394
SE Coef
48,52
6,253
68,79
71,05
8,737
9,090
T
-3,26
8,61
2,87
-1,53
-1,55
1,91
P
0,007
0,000
0,014
0,152
0,147
0,080
300
S = 14,5850
R-Sq = 97,0%
R-Sq(adj) = 95,8%
250
Analysis of Variance
200
6,5
7,0
7,5
8,0
pH
8,5
9,0
9,5
Model pada Polymer 2 didapat dengan cara mensubstitusikan nilai Z1=0 dan Z2=1 pada model regresi hasil
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 27,2
Suspended Solid = - 134,8 + 54,3 pH
Source
Regression
Residual Error
Total
Source
pH
Z1
Z2
pH,Z1
pH,Z2
DF
1
1
1
1
1
DF
5
12
17
SS
82708
2553
85260
MS
16542
213
F
77,76
P
0,000
Seq SS
54856
23118
2208
1747
779
F=
R ( 1z1 , 1z2 | 0 , 1 , 2 , 3 )
MSE
1747 + 779
= 11,86
213
8
9
10
11
12
33328
36151
35448
32988
20437
0
0
0
0
0
Scatterplot of Y vs D
4000
3500
3757
3821
3291
3429
2533
3000
2500
2000
0.0
1z X 1i Z1i + i
0.2
0.4
0.6
0.8
1.0
400
Predictor
Constant
D
350
Suspended Solid
300
Coef
3176,8
-503,2
SE Coef
233,0
329,6
250
S = 570,840
200
Analysis of Variance
6,5
7,0
7,5
8,0
pH
8,5
9,0
9,5
R-Sq = 18,9%
Source
Regression
Residual Error
Total
T
13,63
-1,53
P
0,000
0,158
R-Sq(adj) = 10,8%
DF
SS
MS
F
P
1 759530 759530 2,33 0,158
10 3258588 325859
11 4018118
Scatterplot of Y vs X
4000
D
0
1
3500
Pengamatan
ke
1
2
3
4
5
6
7
Pengeluaran
untuk
makanan
Y
($)
1983
2987
2993
3156
2706
2217
2230
Contoh 2
3000
2500
2000
10000
Pendapatan
Bersih
X
($)
11557
29387
31463
29554
25137
14952
11589
Jenis
Kelamin
D
1
1
1
1
1
1
0
15000
20000
25000
X
30000
35000
Variable
Belanja Makanan W * Pendapatan W
Belanja Makanan P * Pendapatan P
Y-Data
3500
3000
2500
2000
10000
15000
20000 25000
X-Data
30000
35000
Variable
Belanja Makanan oleh Wanita
Belanja Makanan oleh Pria
3600
3400
3200
3000
2800
2600
2400
2200
2000
10000
15000
35000