TUJUAN
MENJELASKAN PRINSIP, MANFAAT
ANALISIS REGRESI GANDA
DAN INTERPRETASI HASIL
MRA ekstensi regresi garis lurus situasi
lebih dari satu independen variabel
dilibatkan dalam model.
Beberapa hal yang harus diperhatikan:
1.Sering sulit menentukan ‘the best model’
karena ada bbrp kemungkinan model;
2.Sulit me-visualisasikan ‘the fitted model’
tidak bisa mem plot data dalam 1 grafik;
3.Sering sulit menginterpretasikan ‘arti’ ‘the
best-fitting model’ dalam kehidupan;
4.Penghitungan MRA harus menggunakan
komputer dengan program yg sudah diuji.
Model Regresi Ganda
Data tekanan darah sistolik (TDS), Konsumsi
garam sehari (KGS) dan Berat Badan (BB)
TDS dipengaruhi oleh KGS dan BB modelnya
TDS = b0+b1KGS+b2BB+E atau
Y=b0+b1X1+b2X2+E bentuk umum model
regresi ganda dengan k-independen variabel
Y=b0+b1X1+b2X2+ ……… +bkXk+E dimana
b0, b1, b2, ……, bk adalah ‘koefisien regresi’
yang harus di estimasi. Independen variabel
X1, X2, ……., Xk merupakan variabel dasar
namun dapat merupakan fungsi dari variabel
dasar
Andai kita ingin mempelajari variasi berat badan
(WGT) terhadap tinggi (HGT) dan umur (AGE) anak2.
Variabel dependent Y=WGT, dua independent adalah
X1=HGT dan X2=AGE. Datanya:
n 2 n 2
Y
i 1
ˆ
Y
i
i Y ˆ
b
i 1
i 0 ˆ X bˆ X
b1 1i 2 2i
ˆ ˆ ˆ
b 0 darib 0 , b1darib1danb 2 darib 2
Gambar2 berikut adalah scatter diagram data
Hubungan (+) HGT dan WGT (r1Y = 0.814) dan
AGE dan WGT (r2Y=0.77)
Bila kita analisa secara terpisah, kita memper-
oleh hubungan (+) antara WGT dan HGT, dan
WGT dan AGE
Pertanyaan: Apakah kedua model tsb memberi-
kan ‘the best fitting model?’ Bgmn kalau kedua
IV (HGT dan AGE) dimasukkan dlm 1 model?
Jawabannya cukup sulit utk dipastikan krn
scatter diagram HGT & AGE juga ber korelasi
(+) (r12=0.614). Hal-hal seperti ini harus
diperhatikan dalam membuat model multiple
regression
Asumsi Multiple regression
1. Existence, setiap kombinasi nilai independen
variabel X1, X2,……., Xk, nilai Y adl random dgn
distribusi probabilitas dgn nilai means dan variance
tertentu,
2. Independence, setiap nilai Y adl independen satu
sama lainnya;
3. Linearity, nilai rata2 Y utk setiap kombinasi spesifik
X1, X2, ……, Xk adl fungsi linear dr X1, X2, …., Xk
artinya
Y X1, X 2 ,...., X k b0 b1 X1 b2 X 2 ,......,bk X k
Atau
Y b 0 b1 X 1 b 2 X 2 ........., b k X k E
Komponen E merupakan komponen error yang
merefleksikan perbedaan nilai2 Y dengan rata2 nilai
Y X , X 1 2 ,........, Xk
4. Homoscedasticity, nilai varians Y adl sama untuk
setiap kombinasi nilai X1, X2, ….. Xk yaitu
2
Y X 1 , X 2 ,....., X k
Var Y X 1 , X 2 ,....., X k 2
X1,X2, ….., Xk, variabel Y terdistribusi secara normal
Y N Y X1 , X 2 ,....... X k , 2
Menentukan ‘the best estimate’ dari ‘multiple
regression analysis’
Dua pendekatan:
a.‘Least Square’
b.‘The minimum variance’
keduanya memberikan hasil yang sama
n n 2
ˆ ˆ ˆ X bˆ X .......... bˆ X
2
Y Y i Y b i 0 b 1 1 2 2 k k
i 1 i 1
Pemecahan ‘Least Square’ melibatkan nilai2
bˆ0 , bˆ1 ,.......,bˆ k dan jumlahnya minimum
Y
n
i 1
i Y
2
Y
n
i 1
ˆ Yˆ
i
2
Maka
Source df SS MS F R2
i 1
adalah total sum of squares merupakan total
variabilitas dr nilai2 observasi Yi sebelum
memperhitungkan efek bersama (joint effect)
variabel2 HGT, AGE dan AGE2
n
SSE Yi Yˆ
2
159.19
i 1
adalah residual sum of squares atau sum of squares
due to error merupakan jumlah nilai2 Y yg ber-
variasi tanpa bisa dijelaskan setelah IV digunakan
untuk memprediksi Y
n 2
SSY SSE
r
2
SSY
Latihan