Anda di halaman 1dari 3

Regresi Dummy

http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju, wiwiek@statistika.its.ac.id
Nama lain Regresi Dummy adalah Regresi Kategori. Regresi ini menggunakan prediktor kualitatif (yang bukan
dummy dinamai prediktor kuantitatif). Pembahasan pada
regresi ini hanya untuk satu macam variabel dummy dan
dikhususkan pada penaksiran parameter dan kemaknaan
pengaruh prediktor. Pembahasan akan dilakukan dengan
menggunakan berbagai contoh.

Regression Analysis: Suspended Solid versus pH; Z1; Z2;


Z3
* Z3 is highly correlated with other X variables
* Z3 has been removed from the equation.
The regression equation is
Suspended Solid = - 162 + 54,3 pH + 90,0 Z1 +
27,2 Z2

Contoh 1
Suatu penelitian bertujuan memodelkan hubungan antara
kandungan Suspended Solids dengan pH pada air yang
keluar dari outlet sistim pembersihan batubara. Sistim
menggunakan tiga macam Polymer. Model dugaan adalah :
Yi = 0 + 1X1i + 2Z1i + 3Z2i + i , i = 1, 2, ... , 18.
Polimer sebagai variabel dummy yang terdiri dari tiga level, yaitu 1, 2, dan 3, dinyatakan oleh tiga variabel, yaitu
Z1, Z2, dan Z3. Command untuk mendapatkan nilai-nilai
variabel dummy dengan MINITAB adalah :
MTB
MTB
MTB
MTB

MTB > Regress 'Suspended Solid' 4 'pH' 'Z1' 'Z2'


'Z3';
SUBC>
Constant;
SUBC>
Brief 2.

>
>
>
>

INDICATOR C14 C15 C16 C17


name C15 Z1
name C16 Z2
name C17 Z3

dengan :
C14 adalah kolom yang memuat variabel dummy,
pada contoh soal ini adalah Polymer.
C15 C17 menyatakan asal Polymer, yang kemudian dinamai Z1, Z2, dan Z3; Z1 bernilai 1
menunjukkan eksperimen menggunakan
Polymer 1, begitu pula dengan Z2 dan Z3.
Hasil eksperimen beserta nilai-nilai variabel dummy ditampilkan pada tabel berikut:
pH
(X)

Suspended
Solid
(Y)

Polymer

Z
1

Z
2

Z3

6,5
6,9
7,8
8,4
8,8
9,2
6,7
6,9
7,5
7,9
8,7
9,2
6,5
7
7,2
7,6
8,7
9,2

292
329
352
378
392
410
198
227
277
297
364
375
167
225
247
268
288
342

1
1
1
1
1
1
2
2
2
2
2
2
3
3
3
3
3
3

1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0

0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0

0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1

Sumber : Classical And Modern Regression, Second


Edition, oleh Raymond H Myers, 1990, halaman 143.
Keluaran pengolahan data adalah sebagai berikut :

Predictor
Constant
pH
Z1
Z2

Coef
-161,90
54,294
90,00
27,17

S = 19,0464

SE Coef
37,43
4,755
11,05
11,01

R-Sq = 94,0%

T
-4,32
11,42
8,14
2,47

P
0,001
0,000
0,000
0,027

R-Sq(adj) = 92,8%

Analysis of Variance
Source
Regression
Residual Error
Total

Source
pH
Z1
Z2

DF
1
1
1

DF
3
14
17

SS
80182
5079
85260

MS
26727
363

F
73,68

P
0,000

Seq SS
54856
23118
2208

Munculnya peringatan : * Z3 is highly correlated with other X variables, dan * Z3 has


been removed from the equation, menunjukkan

bahwa hanya diperlukan Z1 dan Z2; berarti untuk satu


prediktor dummy dengan tiga level (pada kasus ini
Polymer terdiri dari level 1, 2, dan 3) cukup dinyatakan
oleh dua variabel dummy, Z1 dan Z2. Dengan demikian,
pada pengolahan data yang digunakan sebagai prediktor
kualitatif adalah Z1 dan Z2, bukan Polymer.
Kemaknaan pengaruh Polymer dideteksi melalui Jumlah
Kuadrat Regresi kontribusi Z1 dan Z2, yang dinotasikan
R ( 2 , 3 | 0 , 1 ) , dan didapatkan dengan menjumlahkan SS Sequential Z1 dengan Z2, yaitu :

R ( 2 , 3 | 0 , 1 ) = 23118 + 2208 = 25326


Proses pengujian hipotesis secara lengkap adalah sebagai
berikut :
i. Perumusan hipotesis,
H0 : 2 = 0 dan 3 = 0 , berarti pengaruh Polyner terhadap kandungan Suspended
Solid tidak bermakna,
H1 : 2 atau 3 tidak nol.
ii. = 0,05
iii. Statistik Uji :

F=

R ( 2 , 3 | 0 , 1 ) 25326
=
= 69,77
MSE
363

iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis adalah F2,14, 0,05 = 3,74.
v. Kesimpulan : tolak H0, karena statistik uji F >

F2,14, 0,05 , sehingga Polymer berpengaruh pada kandungan SS.


Kesimpulan ini berdasarkan pada anggapan bahwa pengaruh prediktor pH dan Polymer bersifat aditif, bukan
interaktif. Ciri aditif ialah kemiringan garis regresi sama
atau garis regresi ke tiga Polymer sejajar, seperti yang ditampilkan pada Plot berikut ini.
Plot Suspended Solid Pada Polimer1 , Polimer2 , Polimer3 terhadap pH

Kandungan Suspended Solid

450

Variable
Y Polimer1
Y Polimer2
Y Polimer3

400

Predictor
Constant
pH
Z1
Z2
pH,Z1
pH,Z2

Coef
-158,27
53,824
197,69
-108,74
-13,561
17,394

S = 14,5850

SE Coef
48,52
6,253
68,79
71,05
8,737
9,090

R-Sq = 97,0%

T
-3,26
8,61
2,87
-1,53
-1,55
1,91

P
0,007
0,000
0,014
0,152
0,147
0,080

R-Sq(adj) = 95,8%

Analysis of Variance
Source
Regression
Residual Error
Total

DF
5
12
17

SS
82708
2553
85260

MS
16542
213

F
77,76

P
0,000

350

Source
pH
Z1
Z2
pH,Z1
pH,Z2

300

250

200
6,5

7,0

7,5

8,0
pH

8,5

9,0

9,5

Model dugaan untuk Polymer 1, Polymer 2, dan Polymer


3 masing-masing adalah sebagai berikut :
Model pada Polymer 1 didapat dengan cara mensubstitusikan nilai Z1=1 dan Z2=0 pada model regresi hasil
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 90,0
Suspended Solid = - 72 + 54,3 pH

Model pada Polymer 2 didapat dengan cara mensubstitusikan nilai Z1=0 dan Z2=1 pada model regresi hasil
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 27,2
Suspended Solid = - 134,8 + 54,3 pH

DF
1
1
1
1
1

Seq SS
54856
23118
2208
1747
779

Pengujian hipotesis secara lengkap adalah sebagai berikut :


i. Perumusan hipotesis,
H0 : 1z1 = 0 dan 1z 2 = 0 , berarti pengaruh
interaksi
pH dengan Polymer tidak
bermakna.
H1 : 1z1 atau 1z 2 tidak nol
ii. = 0,05
iii. Statistik Uji :

F=

R ( 1z1 , 1z2 | 0 , 1 , 2 , 3 )
MSE

1747 + 779
= 11,86
213

Model pada Polymer 3, Z1=0 dan Z2=1,


Suspended Solid = - 162 + 54,3 pH

Selanjutya ingin diketahui pula kemaknaan pengaruh interaksi antara pH dengan Polymer. Dengan demikian
terdapat tambahan dua prediktor, yaitu interaksi antara
pH dengan masing-masing Z1 dan Z2, dinotasikan X1Z1
dan X1Z2 . Model dugaan menjadi :

Yi = 0 + 1i X 1i + 2 Z1i + 3 Z 2i + 1z1 X 1i Z1i +

1z X 1i Z1i + i
2

Pengolahan data dilakukan dengan menuliskan serangkaian command berikut :


MTB > let c25=pH*Z1
MTB > name c25 'pH,Z1'
MTB > let c26=pH*Z2
MTB > name c26 'pH,Z2'
MTB > Regress 'Suspended Solid' 5 'pH'
'Z1' 'Z2' 'pH,Z1' 'pH,Z2';
SUBC>
Constant;
SUBC>
Brief 2.

Didapatkan keluaran sebagai berikut :

Regression Analysis: Suspended Solid


versus pH; Z1; Z2; pH,Z1; pH,Z2
The regression equation is
Suspended Solid = - 158 + 53,8 pH + 198 Z1
- 109 Z2 - 13,6 pH,Z1 + 17,4 pH,Z2

iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis adalah F2,12, 0,05 = 3,89.
v. Kesimpulan : tolak H0, karena statistik uji F >
F2,12, 0,05 , sehingga pengaruh interaksi pH dengan Polymer bermakna. Ini berarti pengaruh pH pada setiap
Polymer berbeda.
Kesimpulan ini menunjukkan bahwa model sebelumnya,
dengan anggapan pengaruh prediktor pH dan Polymer
bersifat aditif, yaitu : Yi = 0 + 1X1i + 2Z1i + 3Z2i + i
kurang sesuai. Model terakhir, yaitu model yang
melibatkan efek interaksi,

Yi = 0 + 1i X 1i + 2 Z1i + 3 Z 2i + 1z1 X 1i Z1i +

1z X 1i Z1i + i
2

lebih sesuai. Hal ini diperkuat oleh Plot berikut ini :

Plot Suspended Solid terhadap pH


Polymer
1
2
3

400

Suspended Solid

350

300

Analysis of Variance

Source
Regression
Residual Error
Total

DF
SS
MS
F
P
1 759530 759530 2,33 0,158
10 3258588 325859
11 4018118

250

Scatterplot of Y vs X

200
4000
7,0

7,5

8,0
pH

8,5

9,0

9,5
3500

Tampak garis yang menggambarkan model setiap Polymer tidak sejajar; ini berarti kemiringan (slope), yang
menggambarkan pengaruh pH pada kandungan Suspended Solid berbeda, tergantung pada jenis Polymer.

6,5

D
0
1

3000

2500

2000
10000

Contoh 2
Berikut ini adalah data Pengeluaran Untuk Makanan dan
Pendapatan Bersih para Pria dan Wanita lajang. Jenis Kelamin merupakan variabel kategori, dengan Pria diberi
nilai 0 dan Wanita diberi nilai 1. Datanya sebagai berikut:

15000

20000

25000
X

30000

35000

Scatterplot of Belanja Maka vs Pendapatan W, Belanja Maka vs Pendapata


4000

Variable
Belanja Makanan W * Pendapatan W
Belanja Makanan P * Pendapatan P

1
2
3
4
5
6
7
8
9
10
11
12

Pendapatan
Bersih
X
($)
11557
29387
31463
29554
25137
14952
11589
33328
36151
35448
32988
20437

Jenis
Kelamin
D
1
1
1
1
1
1
0
0
0
0
0
0

Scatterplot of Y vs D
4000

3000

2500

2000
10000

15000

20000 25000
X- Dat a

30000

35000

Plot Belanja Makanan terhadap Pendapatan


3800

Variable
Belanja Makanan oleh Wanita
Belanja Makanan oleh Pria

3600
3400
Belanja untuk Makanan

Pengamatan
ke

Y- Dat a

3500

Pengeluaran
untuk
makanan
Y
($)
1983
2987
2993
3156
2706
2217
2230
3757
3821
3291
3429
2533

3200
3000
2800
2600
2400
2200
2000

3500

10000

15000

20000 25000 30000


Pendapat an

35000

3000

Jelaskan cara mendapatkan berbagai Plot di atas.


Lakukan analitis seperti pada contoh 1.

2500

2000
0.0

0.2

0.4

0.6

0.8

1.0

Regression Analysis: Y versus D


The regression equation is
Y = 3177 - 503 D
Predictor
Constant
D
S = 570,840

Coef
3176,8
-503,2

SE Coef
233,0
329,6

R-Sq = 18,9%

T
13,63
-1,53

P
0,000
0,158

R-Sq(adj) = 10,8%

Anda mungkin juga menyukai