BESRAL
Departemen BIOSTATISTIKA
Fakultas Kesehatan Masyarakat
UNIVERSITAS INDONESIA
2009
1
Pengertian Regresi Linier Ganda
Persamaan garis lurus (regresi linier) untuk
memprediksi variabel dependen (numerik) dari
beberapa variabel independen (numerik dan/atau
kategorik)
Syarat untuk model regresi linier ganda:
& Satu variabel dependen yang bersifat numerik
& Satu atau lebih variabel independen bersifat numerik
dapat disertai dg variabel yang bersifat kategori
Model Regresi linier ganda:
Y = α + β1 x1 + β 2 x2 + .... + β n xn
2. Asumsi Bivariate:
A. Korelasi antara variabel dependen dengan
independent dapat dideteksi dengan melakukan uji
korelasi Pearson atau regresi linier sederhana,
Variabel dengan nilai-p < 0.15 (0.25 atau 0.10)
merupakan kandidat model
B. Korelasi antar variabel independent perlu juga
diketahui untuk mewaspadai adanya gejala
kolinearitas (nilai r > 0.8)
Biostatistika, FKM UI, 2003 Page 3
Asumsi Regresi Linier Ganda
3. Asumsi Model Multivariate:
1) Liniearity: Apakah variabel Y merupakan fungsi linier
dari gabungan x1, x2, …xn (Anova)
2) Multivariate Normality: Apakah variabel Y
berdistribusi normal untuk gabungan x1, x2,…xn (plot
residual)
3) Existency:Apakah variabel Y merupakan variabel
random (acak) yang punya mean dan SD (meanResidu=0)
4) Homocedasticity: Apakah varian nilai Y sama
(homogen) untuk setiap nilai x1, x2, …xn (Zresid-Dep)
atau (Zresid-Spred)
5) Independency: Apakah variabel Y mempunyai nilai
yang saling bebas (no autocorr.) satu dengan lainnya
(Durbin-Watson –2/+2)
6) Colinearity: Apakah tidak terdapat korelasi antar
variabel independen (VIF colinearity <10)
Biostatistika, FKM UI, 2003 Page 4
Aplikasi Regresi Linier Ganda
Variabel apa saja yang dapat digunakan untuk
memprediksi tingkat/skor STRES seseorang?
- ROKOK : Status merokok (1=ya, 0=Tdk)
- SERAT : Proporsi serat dalam makanan (%)
- AKTFISIK : Skor aktifitas fisik
- INCOME : Income (ribu rupiah)
- IMT : Index massa tubuh
- RLPP : Rasio lingkar pinggang panggul
- TCHOL : Total cholesterol (gr%)
Sum of
Model Squares df Mean Square F Sig.
1 Regression 978.093 5 195.619 8.994 .000a
Residual 2696.984 124 21.750
Total 3675.077 129
a. Predictors: (Constant), RLPP, SERAT, INCOME, ROKOK, AKTFISIK
b. Dependent Variable: STRESS
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 23.490 5.533 4.245 .000
ROKOK 3.887 1.142 .279 3.403 .001
SERAT .209 .094 .171 2.216 .029
AKTFISIK .889 .401 .183 2.214 .029
INCOME 7.293E-03 .003 .213 2.714 .008
RLPP 8.311 5.985 .111 1.389 .167
a. Dependent Variable: STRESS
ANOVAb
Sum of
Model
1 Regression
Squares
936.151
df
4
Mean Square
234.038
F
10.681
Sig.
.000a p=0.000 -> Model Linier
Residual
Total
2738.926
3675.077
125
129
21.911
Jika p>0.05 maka asumsi linier
a. Predictors: (Constant), INCOME, ROKOK, SERAT, AKTFISIK
b. Dependent Variable: STRESS
tidak terpenuhi
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
.75
10
-1
-2
-3
-2 -1 0 1 2 3 4
Coefficientsa
Standardi
zed
Unstandardized Coefficien
Coefficients ts Collinearity Statistics
Model B Std. Error Beta Sig. Tolerance VIF
1 (Constant) 30.207 2.698 .000
ROKOK 4.111 1.135 .295 .000 .898 1.114
SERAT .216 .095 .177 .024 .991 1.009
AKTFISIK .967 .399 .199 .017 .883 1.133
INCOME 6.891E-03 .003 .201 .011 .973 1.027
a. Dependent Variable: STRESS
Biostatistika, FKM UI, 2003 Page 18
Interpretasi Regresi Linier Ganda
A. Persamaan garis linier: Diambil dari Unstandardized
Coefficients-B, garis prediksi skor stress adalah
Stress = 30.2 + 4.1( rokok ) + 0.216( serat ) + 0.967( AktFisik ) + 0.00689(income)
Merokok dapat meningkatkan skor stress sebesar 4.1 point
Setiap kenaikan 1% kadar serat dalam makanan akan meningkatkan skor
stress sebesar 0.2 point
Setiap kenaikan income 1000 rupiah akan meningkatkan skor stress
sebesar 0.00689 point
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
(Constant) 30.207 2.698 11.197 .000
ROKOK 4.111 1.135 .295 3.621 .000
SERAT .216 .095 .177 2.278 .024
AKTFISIK .967 .399 .199 2.423 .017
INCOME 6.891E-03 .003 .201 2.570 .011
a. Dependent Variable: STRESS
Biostatistika, FKM UI, 2003 Page 19
Interpretasi Regresi Linier Ganda
B. Variabel yang paling berperan dalam memprediksi
stress: Dilihat nilai Standardized Coefficients-Beta yg paling
tinggi atau nilai Partial correlation paling tinggi
Coefficientsa
Unstandar Standar
dized dized Correlations
Model B Beta Sig. Zero-order Partial Part
1 (Constant) 30.207 .000
ROKOK 4.111 .295 .000 .373 .308 .280
SERAT .216 .177 .024 .196 .200 .176
AKTFISIK .967 .199 .017 .325 .212 .187
INCOME 6.891E-03 .201 .011 .225 .224 .198
a. Dependent Variable: STRESS