Anda di halaman 1dari 3

Regresi Dummy

http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju, wiwiek@statistika.its.ac.id

MTB > Regress 'Suspended Solid' 4 'pH' 'Z1' 'Z2'


Nama lain Regresi Dummy adalah Regresi Kategori. Re- 'Z3';
SUBC> Constant;
gresi ini menggunakan prediktor kualitatif (yang bukan SUBC> Brief 2.
dummy dinamai prediktor kuantitatif). Pembahasan pada
regresi ini hanya untuk satu macam variabel dummy dan Regression Analysis: Suspended Solid versus pH; Z1; Z2;
dikhususkan pada penaksiran parameter dan kemaknaan Z3
pengaruh prediktor. Pembahasan akan dilakukan dengan * Z3 is highly correlated with other X variables
menggunakan berbagai contoh. * Z3 has been removed from the equation.

The regression equation is


Suspended Solid = - 162 + 54,3 pH + 90,0 Z1 +
Contoh 1 27,2 Z2
Suatu penelitian bertujuan memodelkan hubungan antara Predictor Coef SE Coef T P
kandungan Suspended Solids dengan pH pada air yang Constant -161,90 37,43 -4,32 0,001
keluar dari outlet sistim pembersihan batubara. Sistim pH 54,294 4,755 11,42 0,000
Z1 90,00 11,05 8,14 0,000
menggunakan tiga macam Polymer. Model dugaan ada- Z2 27,17 11,01 2,47 0,027
lah :
Yi = β 0 + β 1X1i + β 2Z1i + β 3Z2i + ε i , i = 1, 2, ... , 18. S = 19,0464 R-Sq = 94,0% R-Sq(adj) = 92,8%

Analysis of Variance
Polimer sebagai variabel dummy yang terdiri dari tiga le-
vel, yaitu 1, 2, dan 3, dinyatakan oleh tiga variabel, yaitu Source DF SS MS F P
Z1, Z2, dan Z3. Command untuk mendapatkan nilai-nilai Regression 3 80182 26727 73,68 0,000
Residual Error 14 5079 363
variabel dummy dengan MINITAB adalah : Total 17 85260
MTB > INDICATOR C14 C15 C16 C17
MTB > name C15 ‘Z1’ Source DF Seq SS
MTB > name C16 ‘Z2’ pH 1 54856
MTB > name C17 ‘Z3’ Z1 1 23118
Z2 1 2208
dengan :
C14 adalah kolom yang memuat variabel dummy,
Munculnya peringatan : * Z3 is highly corre-
pada contoh soal ini adalah Polymer. lated with other X variables, dan * Z3 has
C15 – C17 menyatakan asal Polymer, yang kemu-
been removed from the equation, menunjukkan
dian dinamai Z1, Z2, dan Z3; Z1 bernilai 1
bahwa hanya diperlukan Z1 dan Z2; berarti untuk satu
menunjukkan eksperimen menggunakan
prediktor dummy dengan tiga level (pada kasus ini
Polymer 1, begitu pula dengan Z2 dan Z3.
Polymer terdiri dari level 1, 2, dan 3) cukup dinyatakan
Hasil eksperimen beserta nilai-nilai variabel dummy di- oleh dua variabel dummy, Z1 dan Z2. Dengan demikian,
tampilkan pada tabel berikut: pada pengolahan data yang digunakan sebagai prediktor
kualitatif adalah Z1 dan Z2, bukan Polymer.
pH Suspended
Z Z
(X) Solid Polymer Z3 Kemaknaan pengaruh Polymer dideteksi melalui Jumlah
1 2
(Y) Kuadrat Regresi kontribusi Z1 dan Z2, yang dinotasikan
6,5 292 1 1 0 0 R ( β2 , β3 | β0 , β1 ) , dan didapatkan dengan menjum-
6,9 329 1 1 0 0 lahkan SS Sequential Z1 dengan Z2, yaitu :
7,8 352 1 1 0 0
8,4 378 1 1 0 0 R ( β2 , β3 | β0 , β1 ) = 23118 + 2208 = 25326
8,8 392 1 1 0 0
9,2 410 1 1 0 0 Proses pengujian hipotesis secara lengkap adalah sebagai
6,7 198 2 0 1 0 berikut :
6,9 227 2 0 1 0
i. Perumusan hipotesis,
7,5 277 2 0 1 0
H0 : β 2 = 0 dan β 3 = 0 , berarti pengaruh Polyner ter-
7,9 297 2 0 1 0
hadap kandungan Suspended
8,7 364 2 0 1 0 Solid tidak bermakna,
9,2 375 2 0 1 0 H1 : β 2 atau β 3 tidak nol.
6,5 167 3 0 0 1
7 225 3 0 0 1 ii. α = 0,05
7,2 247 3 0 0 1
7,6 268 3 0 0 1 iii. Statistik Uji :
8,7 288 3 0 0 1
9,2 342 3 0 0 1 R( β 2 , β3 | β0 , β1 ) 25326
F= = = 69,77
Sumber : Classical And Modern Regression, Second MSE 363
Edition, oleh Raymond H Myers, 1990, ha- iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis ada-
laman 143. lah F2,14, 0,05 = 3,74.

Keluaran pengolahan data adalah sebagai berikut : v. Kesimpulan : tolak H0, karena statistik uji F >
F2,14, 0,05 , sehingga Polymer berpengaruh pada kan- Predictor Coef SE Coef T P
dungan SS. Constant -158,27 48,52 -3,26 0,007
pH 53,824 6,253 8,61 0,000
Kesimpulan ini berdasarkan pada anggapan bahwa pe- Z1 197,69 68,79 2,87 0,014
ngaruh prediktor pH dan Polymer bersifat aditif, bukan Z2 -108,74 71,05 -1,53 0,152
pH,Z1 -13,561 8,737 -1,55 0,147
interaktif. Ciri aditif ialah kemiringan garis regresi sama pH,Z2 17,394 9,090 1,91 0,080
atau garis regresi ke tiga Polymer sejajar, seperti yang di-
tampilkan pada Plot berikut ini. S = 14,5850 R-Sq = 97,0% R-Sq(adj) = 95,8%

Analysis of Variance
Plot Suspended Solid Pada Polimer1, Polimer2, Polimer3 terhadap pH
450 Variable
Y Polimer1
Source DF SS MS F P
Y Polimer2 Regression 5 82708 16542 77,76 0,000
Y Polimer3
400 Residual Error 12 2553 213
Kandungan Suspended Solid

Total 17 85260
350

Source DF Seq SS
300 pH 1 54856
Z1 1 23118
250 Z2 1 2208
pH,Z1 1 1747
200 pH,Z2 1 779
6,5 7,0 7,5 8,0 8,5 9,0 9,5
pH Pengujian hipotesis secara lengkap adalah sebagai beri-
kut :
Model dugaan untuk Polymer 1, Polymer 2, dan Polymer i. Perumusan hipotesis,
3 masing-masing adalah sebagai berikut :
H0 : β1z1 = 0 dan β1z2 = 0 , berarti pengaruh
Model pada Polymer 1 didapat dengan cara mensubsti- interaksi
tusikan nilai Z1=1 dan Z2=0 pada model regresi hasil pH dengan Polymer tidak
pengolahan data, bermakna.
H1 : β1z1 atau β1z2 tidak nol
Suspended Solid = - 162 + 54,3 pH + 90,0
Suspended Solid = - 72 + 54,3 pH
ii. α = 0,05
Model pada Polymer 2 didapat dengan cara mensubsti-
tusikan nilai Z1=0 dan Z2=1 pada model regresi hasil iii. Statistik Uji :
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 27,2 R( β1z1 , β1z2 | β0 , β1 , β 2 , β3 ) 1747 + 779
Suspended Solid = - 134,8 + 54,3 pH F= = = 11,86
MSE 213
Model pada Polymer 3, Z1=0 dan Z2=1,
Suspended Solid = - 162 + 54,3 pH iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis ada-
lah F2,12, 0,05 = 3,89.
Selanjutya ingin diketahui pula kemaknaan pengaruh in-
teraksi antara pH dengan Polymer. Dengan demikian
v. Kesimpulan : tolak H0, karena statistik uji F >
terdapat tambahan dua prediktor, yaitu interaksi antara
F2,12, 0,05 , sehingga pengaruh interaksi pH dengan Po-
pH dengan masing-masing Z1 dan Z2, dinotasikan X1Z1
lymer bermakna. Ini berarti pengaruh pH pada setiap
dan X1Z2 . Model dugaan menjadi :
Polymer berbeda.
Yi = β0 + β1i X 1i + β2 Z1i + β3 Z 2 i + β1 z1 X 1i Z1i + Kesimpulan ini menunjukkan bahwa model sebelumnya,
β1z X 1i Z1i + ε i dengan anggapan pengaruh prediktor pH dan Polymer
2
bersifat aditif, yaitu : Yi = β 0 + β 1X1i + β 2Z1i + β 3Z2i
+ ε i kurang sesuai. Model terakhir, yaitu model yang
Pengolahan data dilakukan dengan menuliskan serang-
melibatkan efek interaksi,
kaian command berikut :
Yi = β0 + β1i X 1i + β2 Z1i + β3 Z 2i + β1z1 X 1i Z1i +
MTB > let c25=pH*Z1
MTB > name c25 'pH,Z1'
β1z X 1i Z1i + ε i
2

MTB > let c26=pH*Z2 lebih sesuai. Hal ini diperkuat oleh Plot berikut ini :
MTB > name c26 'pH,Z2'
MTB > Regress 'Suspended Solid' 5 'pH'
'Z1' 'Z2' 'pH,Z1' 'pH,Z2';
SUBC> Constant;
SUBC> Brief 2.

Didapatkan keluaran sebagai berikut :


Regression Analysis: Suspended Solid
versus pH; Z1; Z2; pH,Z1; pH,Z2

The regression equation is


Suspended Solid = - 158 + 53,8 pH + 198 Z1
- 109 Z2 - 13,6 pH,Z1 + 17,4 pH,Z2
Plot Suspended Solid terhadap pH
Polymer
Analysis of Variance
400 1

Source DF SS MS F P
2
3

350 Regression 1 759530 759530 2,33 0,158


Suspended Solid

Residual Error 10 3258588 325859


300
Total 11 4018118
250

200 Scatterplot of Y vs X
4000 D
0
1
6,5 7,0 7,5 8,0 8,5 9,0 9,5
pH
3500

Tampak garis yang menggambarkan model setiap Poly- 3000

Y
mer tidak sejajar; ini berarti kemiringan (slope), yang
menggambarkan pengaruh pH pada kandungan Suspen- 2500
ded Solid berbeda, tergantung pada jenis Polymer.
2000

10000 15000 20000 25000 30000 35000


Contoh 2 X

Berikut ini adalah data Pengeluaran Untuk Makanan dan


Pendapatan Bersih para Pria dan Wanita lajang. Jenis Ke-
lamin merupakan variabel kategori, dengan Pria diberi Scatterplot of Belanja Maka vs Pendapatan W, Belanja Maka vs Pendapata
4000
nilai 0 dan Wanita diberi nilai 1. Datanya sebagai beri- Variable
Belanja Makanan W * Pendapatan W
Belanja Makanan P * Pendapatan P
kut:
3500

Pengeluaran
untuk Pendapatan Jenis
Y-Data

3000
Pengamatan Bersih
makanan Kelamin
ke X
Y D 2500
($) ($)
1 1983 11557 1
2000
2 2987 29387 1
10000 15000 20000 25000 30000 35000
3 2993 31463 1 X-Data
4 3156 29554 1
5 2706 25137 1
6 2217 14952 1
7 2230 11589 0 Plot Belanja Makanan terhadap Pendapatan
8 3757 33328 0 3800 Variable
Belanja Makanan oleh Wanita
9 3821 36151 0 3600 Belanja Makanan oleh Pria

10 3291 35448 0 3400


Belanja untuk Makanan

11 3429 32988 0 3200

12 2533 20437 0 3000

2800

2600
Scatterplot of Y vs D 2400
4000
2200

2000

3500
10000 15000 20000 25000 30000 35000
Pendapatan

3000
Y

Jelaskan cara mendapatkan berbagai Plot di atas.


2500 Lakukan analitis seperti pada contoh 1.

2000

0.0 0.2 0.4 0.6 0.8 1.0


D

Regression Analysis: Y versus D

The regression equation is


Y = 3177 - 503 D

Predictor Coef SE Coef T P


Constant 3176,8 233,0 13,63 0,000
D -503,2 329,6 -1,53 0,158

S = 570,840 R-Sq = 18,9% R-Sq(adj) = 10,8%