Anda di halaman 1dari 3

Regresi Dummy

http://oc.its.ac.id/jurusan.php?fid=1&jid=3
Wiwiek Setya Winahju, wiwiek@statistika.its.ac.id

MTB > Regress 'Suspended Solid' 4 'pH' 'Z1' 'Z2'


Nama lain Regresi Dummy adalah Regresi Kategori. Re- 'Z3';
SUBC> Constant;
gresi ini menggunakan prediktor kualitatif (yang bukan SUBC> Brief 2.
dummy dinamai prediktor kuantitatif). Pembahasan pada
regresi ini hanya untuk satu macam variabel dummy dan Regression Analysis: Suspended Solid versus pH; Z1; Z2;
dikhususkan pada penaksiran parameter dan kemaknaan Z3
pengaruh prediktor. Pembahasan akan dilakukan dengan * Z3 is highly correlated with other X variables
menggunakan berbagai contoh. * Z3 has been removed from the equation.

The regression equation is


Suspended Solid = - 162 + 54,3 pH + 90,0 Z1 +
Contoh 1 27,2 Z2
Suatu penelitian bertujuan memodelkan hubungan antara
Predictor Coef SE Coef T P
kandungan Suspended Solids dengan pH pada air yang Constant -161,90 37,43 -4,32 0,001
keluar dari outlet sistim pembersihan batubara. Sistim pH 54,294 4,755 11,42 0,000
menggunakan tiga macam Polymer. Model dugaan ada- Z1 90,00 11,05 8,14 0,000
Z2 27,17 11,01 2,47 0,027
lah :
Yi = 0 + 1X1i + 2Z1i + 3Z2i + i , i = 1, 2, ... , 18. S = 19,0464 R-Sq = 94,0% R-Sq(adj) = 92,8%

Polimer sebagai variabel dummy yang terdiri dari tiga le- Analysis of Variance
vel, yaitu 1, 2, dan 3, dinyatakan oleh tiga variabel, yaitu Source DF SS MS F P
Z1, Z2, dan Z3. Command untuk mendapatkan nilai-nilai Regression 3 80182 26727 73,68 0,000
variabel dummy dengan MINITAB adalah : Residual Error 14 5079 363
Total 17 85260
MTB > INDICATOR C14 C15 C16 C17
MTB > name C15 ‘Z1’ Source DF Seq SS
MTB > name C16 ‘Z2’ pH 1 54856
MTB > name C17 ‘Z3’ Z1 1 23118
dengan : Z2 1 2208
C14 adalah kolom yang memuat variabel dummy,
pada contoh soal ini adalah Polymer. Munculnya peringatan : * Z3 is highly corre-
C15 – C17 menyatakan asal Polymer, yang kemu- lated with other X variables, dan * Z3 has
dian dinamai Z1, Z2, dan Z3; Z1 bernilai 1 been removed from the equation, menunjukkan
menunjukkan eksperimen menggunakan bahwa hanya diperlukan Z1 dan Z2; berarti untuk satu
Polymer 1, begitu pula dengan Z2 dan Z3. prediktor dummy dengan tiga level (pada kasus ini
Polymer terdiri dari level 1, 2, dan 3) cukup dinyatakan
Hasil eksperimen beserta nilai-nilai variabel dummy di- oleh dua variabel dummy, Z 1 dan Z2. Dengan demikian,
tampilkan pada tabel berikut: pada pengolahan data yang digunakan sebagai prediktor
kualitatif adalah Z1 dan Z2, bukan Polymer.
pH Suspended
Z Z
(X) Solid Polymer Z3 Kemaknaan pengaruh Polymer dideteksi melalui Jumlah
1 2
(Y) Kuadrat Regresi kontribusi Z1 dan Z2, yang dinotasikan
6,5 292 1 1 0 0 R (  2 ,  3 |  0 , 1 ) , dan didapatkan dengan menjum-
6,9 329 1 1 0 0 lahkan SS Sequential Z1 dengan Z2, yaitu :
7,8 352 1 1 0 0
8,4 378 1 1 0 0 R (  2 ,  3 |  0 , 1 ) = 23118 + 2208 = 25326
8,8 392 1 1 0 0
9,2 410 1 1 0 0 Proses pengujian hipotesis secara lengkap adalah sebagai
6,7 198 2 0 1 0 berikut :
6,9 227 2 0 1 0
i. Perumusan hipotesis,
7,5 277 2 0 1 0
H0 : 2 = 0 dan 3 = 0 , berarti pengaruh Polyner ter-
7,9 297 2 0 1 0
hadap kandungan Suspended
8,7 364 2 0 1 0 Solid tidak bermakna,
9,2 375 2 0 1 0 H1 : 2 atau 3 tidak nol.
6,5 167 3 0 0 1
7 225 3 0 0 1 ii.  = 0,05
7,2 247 3 0 0 1
7,6 268 3 0 0 1 iii. Statistik Uji :
8,7 288 3 0 0 1
9,2 342 3 0 0 1 R (  2 ,  3 |  0 , 1 ) 25326
F   69,77
Sumber : Classical And Modern Regression, Second MSE 363
Edition, oleh Raymond H Myers, 1990, ha- iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis ada-
laman 143. lah F2,14, 0,05 = 3,74.

Keluaran pengolahan data adalah sebagai berikut : v. Kesimpulan : tolak H0, karena statistik uji F >
F2,14, 0,05 , sehingga Polymer berpengaruh pada kan-
dungan SS. Constant -158,27 48,52 -3,26 0,007
pH 53,824 6,253 8,61 0,000
Kesimpulan ini berdasarkan pada anggapan bahwa pe- Z1 197,69 68,79 2,87 0,014
ngaruh prediktor pH dan Polymer bersifat aditif, bukan Z2 -108,74 71,05 -1,53 0,152
interaktif. Ciri aditif ialah kemiringan garis regresi sama pH,Z1 -13,561 8,737 -1,55 0,147
pH,Z2 17,394 9,090 1,91 0,080
atau garis regresi ke tiga Polymer sejajar, seperti yang di-
tampilkan pada Plot berikut ini. S = 14,5850 R-Sq = 97,0% R-Sq(adj) = 95,8%

Plot Suspended Solid Pada Polimer1, Polimer2, Polimer3 terhadap pH


Analysis of Variance
450 Variable
Y Polimer1 Source DF SS MS F P
Y Polimer2
Y Polimer3
Regression 5 82708 16542 77,76 0,000
400
Residual Error 12 2553 213
Kandungan Suspended Solid

Total 17 85260
350

Source DF Seq SS
300 pH 1 54856
Z1 1 23118
250 Z2 1 2208
pH,Z1 1 1747
200 pH,Z2 1 779
6,5 7,0 7,5 8,0 8,5 9,0 9,5
pH
Pengujian hipotesis secara lengkap adalah sebagai beri-
kut :
Model dugaan untuk Polymer 1, Polymer 2, dan Polymer
i. Perumusan hipotesis,
3 masing-masing adalah sebagai berikut :
H0 : 1z1 = 0 dan 1z 2 = 0 , berarti pengaruh
Model pada Polymer 1 didapat dengan cara mensubsti- interaksi
tusikan nilai Z1=1 dan Z2=0 pada model regresi hasil pH dengan Polymer tidak
pengolahan data, bermakna.
Suspended Solid = - 162 + 54,3 pH + 90,0
 
H1 : 1z1 atau 1z 2 tidak nol
Suspended Solid = - 72 + 54,3 pH
ii.  = 0,05
Model pada Polymer 2 didapat dengan cara mensubsti-
tusikan nilai Z1=0 dan Z2=1 pada model regresi hasil
iii. Statistik Uji :
pengolahan data,
Suspended Solid = - 162 + 54,3 pH + 27,2 R ( 1z1 , 1z2 |  0 , 1 ,  2 ,  3 ) 1747  779
Suspended Solid = - 134,8 + 54,3 pH F   11,86
MSE 213
Model pada Polymer 3, Z1=0 dan Z2=1,
Suspended Solid = - 162 + 54,3 pH
iv. Bila H0 benar maka F~ F2,14, sehingga titik kritis ada-
lah F2,12, 0,05 = 3,89.
Selanjutya ingin diketahui pula kemaknaan pengaruh in-
teraksi antara pH dengan Polymer. Dengan demikian
v. Kesimpulan : tolak H0, karena statistik uji F >
terdapat tambahan dua prediktor, yaitu interaksi antara
F2,12, 0,05 , sehingga pengaruh interaksi pH dengan Po-
pH dengan masing-masing Z1 dan Z2, dinotasikan X1Z1
lymer bermakna. Ini berarti pengaruh pH pada setiap
dan X1Z2 . Model dugaan menjadi :
Polymer berbeda.
Yi   0  1i X 1i   2 Z1i   3 Z 2i  1 z1 X 1i Z1i  Kesimpulan ini menunjukkan bahwa model sebelumnya,
1z2 X 1i Z1i   i dengan anggapan pengaruh prediktor pH dan Polymer
bersifat aditif, yaitu : Yi = 0 + 1X1i + 2Z1i + 3Z2i + i
kurang sesuai. Model terakhir, yaitu model yang
Pengolahan data dilakukan dengan menuliskan serang- melibatkan efek interaksi,
kaian command berikut : Yi   0  1i X 1i   2 Z1i   3 Z 2i  1 z1 X 1i Z1i 
MTB > let c25=pH*Z1 1z2 X 1i Z1i   i
MTB > name c25 'pH,Z1'
MTB > let c26=pH*Z2 lebih sesuai. Hal ini diperkuat oleh Plot berikut ini :
MTB > name c26 'pH,Z2'
MTB > Regress 'Suspended Solid' 5 'pH'
Plot Suspended Solid terhadap pH
'Z1' 'Z2' 'pH,Z1' 'pH,Z2';
Poly mer
SUBC> Constant; 400 1

SUBC> Brief 2. 2
3

350
Didapatkan keluaran sebagai berikut :
Suspended Solid

Regression Analysis: Suspended Solid 300

versus pH; Z1; Z2; pH,Z1; pH,Z2


250

The regression equation is


200
Suspended Solid = - 158 + 53,8 pH + 198 Z1
- 109 Z2 - 13,6 pH,Z1 + 17,4 pH,Z2
6,5 7,0 7,5 8,0 8,5 9,0 9,5
pH
Predictor Coef SE Coef T P
Scatterplot of Y vs X
Tampak garis yang menggambarkan model setiap Poly- 4000 D

mer tidak sejajar; ini berarti kemiringan (slope), yang 0


1

menggambarkan pengaruh pH pada kandungan Suspen- 3500


ded Solid berbeda, tergantung pada jenis Polymer.
3000

Y
Contoh 2
2500
Berikut ini adalah data Pengeluaran Untuk Makanan dan
Pendapatan Bersih para Pria dan Wanita lajang. Jenis Ke-
lamin merupakan variabel kategori, dengan Pria diberi 2000

nilai 0 dan Wanita diberi nilai 1. Datanya sebagai beri- 10000 15000 20000 25000 30000 35000
X
kut:

Pengeluaran Scatterplot of Belanja Maka vs Pendapatan W, Belanja Maka vs Pendapata


untuk Pendapatan Jenis
Pengamatan Bersih
4000 Variable

makanan Kelamin Belanja Makanan W * Pendapatan W

ke X
Belanja Makanan P * Pendapatan P

Y D
3500
($) ($)
1 1983 11557 1

Y-Data
2 2987 29387 1 3000

3 2993 31463 1
4 3156 29554 1 2500

5 2706 25137 1
6 2217 14952 1 2000

7 2230 11589 0 10000 15000 20000 25000 30000 35000


X-Data
8 3757 33328 0
9 3821 36151 0
10 3291 35448 0
11 3429 32988 0
Plot Belanja Makanan terhadap Pendapatan
12 2533 20437 0
3800 Variable
Belanja Mak anan oleh Wanita
3600 Belanja Mak anan oleh Pria

Scatterplot of Y vs D 3400
4000
Belanja untuk Makanan

3200

3000

3500 2800

2600

2400
3000
Y

2200

2000
2500
10000 15000 20000 25000 30000 35000
Pendapatan

2000

0.0 0.2 0.4 0.6 0.8 1.0


D Jelaskan cara mendapatkan berbagai Plot di atas.
Lakukan analitis seperti pada contoh 1.

Regression Analysis: Y versus D

The regression equation is


Y = 3177 - 503 D

Predictor Coef SE Coef T P


Constant 3176,8 233,0 13,63 0,000
D -503,2 329,6 -1,53 0,158

S = 570,840 R-Sq = 18,9% R-Sq(adj) = 10,8%

Analysis of Variance

Source DF SS MS F P
Regression 1 759530 759530 2,33 0,158
Residual Error 10 3258588 325859
Total 11 4018118

Anda mungkin juga menyukai