Anda di halaman 1dari 20

Regresi Linier Ganda

(Multivariate Linier Regression)

BESRAL
Departemen BIOSTATISTIKA
Fakultas Kesehatan Masyarakat
UNIVERSITAS INDONESIA
2009
1
Pengertian Regresi Linier Ganda
„ Persamaan garis lurus (regresi linier) untuk
memprediksi variabel dependen (numerik) dari
beberapa variabel independen (numerik dan/atau
kategorik)
„ Syarat untuk model regresi linier ganda:
„ & Satu variabel dependen yang bersifat numerik
„ & Satu atau lebih variabel independen bersifat numerik
dapat disertai dg variabel yang bersifat kategori
„ Model Regresi linier ganda:

Y = α + β1 x1 + β 2 x2 + .... + β n xn

Biostatistika, FKM UI, 2003 Page 2


Asumsi Regresi Linier Ganda
1. Asumsi Univariate:
Variabel numerik harus berdistribusi NORMAL
(terutama var dep), agar dapat dianalisa dengan uji
statistik parametrik

2. Asumsi Bivariate:
A. Korelasi antara variabel dependen dengan
independent dapat dideteksi dengan melakukan uji
korelasi Pearson atau regresi linier sederhana,
Variabel dengan nilai-p < 0.15 (0.25 atau 0.10)
merupakan kandidat model
B. Korelasi antar variabel independent perlu juga
diketahui untuk mewaspadai adanya gejala
kolinearitas (nilai r > 0.8)
Biostatistika, FKM UI, 2003 Page 3
Asumsi Regresi Linier Ganda
3. Asumsi Model Multivariate:
1) Liniearity: Apakah variabel Y merupakan fungsi linier
dari gabungan x1, x2, …xn (Anova)
2) Multivariate Normality: Apakah variabel Y
berdistribusi normal untuk gabungan x1, x2,…xn (plot
residual)
3) Existency:Apakah variabel Y merupakan variabel
random (acak) yang punya mean dan SD (meanResidu=0)
4) Homocedasticity: Apakah varian nilai Y sama
(homogen) untuk setiap nilai x1, x2, …xn (Zresid-Dep)
atau (Zresid-Spred)
5) Independency: Apakah variabel Y mempunyai nilai
yang saling bebas (no autocorr.) satu dengan lainnya
(Durbin-Watson –2/+2)
6) Colinearity: Apakah tidak terdapat korelasi antar
variabel independen (VIF colinearity <10)
Biostatistika, FKM UI, 2003 Page 4
Aplikasi Regresi Linier Ganda
„ Variabel apa saja yang dapat digunakan untuk
memprediksi tingkat/skor STRES seseorang?
- ROKOK : Status merokok (1=ya, 0=Tdk)
- SERAT : Proporsi serat dalam makanan (%)
- AKTFISIK : Skor aktifitas fisik
- INCOME : Income (ribu rupiah)
- IMT : Index massa tubuh
- RLPP : Rasio lingkar pinggang panggul
- TCHOL : Total cholesterol (gr%)

Biostatistika, FKM UI, 2003 Page 5


Asumsi Univariate Normality
„ Variabel numerik harus berdistribusi NORMAL
„ Dengan Uji (KS) Kolmogorov Smirnov-1-sampel: SPSS Windows
Analyze ‣Nonparametric Test ‣ 1-sampel-KS..
One-Sample Kolmogorov-Smirnov Test

STRESS SERAT AKTFISIK INCOME


N 130 130 130 130
a,b
Normal Parameters Mean 41.77 9.56 6.2473 396.75
Std. Deviation 5.34 4.37 1.0996 155.79
Most Extreme Absolute .078 .105 .047 .067
Differences Positive .078 .105 .042 .067
Negative -.078 -.052 -.047 -.034
Kolmogorov-Smirnov Z .890 1.192 .537 .768
Asymp. Sig. (2-tailed) .407 .117 .935 .598
a. Test distribution is Normal.
b. Calculated from data.

„ Semua variabel mempunyai nilai-p KS > 0.05 berarti asumsi


distribusi normal variabel numerik sudah terpenuhi
Biostatistika, FKM UI, 2003 Page 6
Asumsi Korelasi Bivariate
„ Untuk menyeleksi variabel independen yang jadi kandidat
model [nilai-p < 0.15 (<0.25 atau < 0.10)] dilakukan
KORELASI BIVARITE Analyze ‣Correlate ‣ Bivariate..
Correlations

STRESS SERAT AKTFISIK INCOME RLPP IMT TCHOL


STRES Pearson Correlation 1.000 .196* .325** .225** .190* .093 .011
S Sig. (2-tailed) . .025 .000 .010 .030 .295 .899
N 130 130 130 130 130 130 130
Pearson Correlation *
Pearson Correlation ** *
Pearson Correlation **
Pearson Correlation * * **
Pearson Correlation **
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).

„ Variabel IMT (p=0.295) dan TCHOL (p=0.899) tidak diikutkan


dalam analisis selanjutnya
Biostatistika, FKM UI, 2003 Page 7
Asumsi Korelasi Bivariate
„ Untuk mendeteksi adanya korelasi antar variabel
independen (kolinearitas) [r > 0.8] dilakukan KORELASI
BIVARITE Analyze ‣Correlate ‣ Bivariate..
Correlations

ROKOK SERAT AKTFISIK INCOME RLPP


ROKOK Pearson Correlation 1.000 .080 .309** .010 .193*
Sig. (2-tailed) . .365 .000 .914 .028
N 130 130 130 130 130
SERAT Pearson Correlation .080 1.000 .027 -.048 .068
Sig. (2-tailed) .365 . .759 .585 .440
N 130 130 130 130 130
AKTFISIK Pearson Correlation .309** .027 1.000 .150 .175*
Sig. (2-tailed) .000 .759 . .088 .046
N 130 130 130 130 130
INCOME Pearson Correlation .010 -.048 .150 1.000 -.085
Sig. (2-tailed) .914 .585 .088 . .335
N 130 130 130 130 130
RLPP Pearson Correlation .193* .068 .175* -.085 1.000
Sig. (2-tailed) .028 .440 .046 .335 .
N 130 130 130 130 130
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

„ Tidak ada korelasi yang lebih dari 0.8, sehingga kolinearitas


bukan masalah serius
Biostatistika, FKM UI, 2003 Page 8
Pemodelan Regresi Linier Ganda
„ Untuk membuat model regresi linier ganda ada beberapa
metode yang tersedia a.l.:
- ENTER - STEPWISE - BACKWARD -FORWARD
„ Contoh berikut adalah Metode ENTER:
Analyze ‣Regression ‣ Linier..

Biostatistika, FKM UI, 2003 Page 9


Pemodelan Regresi Linier Ganda
„ Contoh output computer metode ENTER:
Model Summary

Adjusted R Std. Error of the


Model R R Square Square Estimate
1 .516a .266 .237 4.66
a. Predictors: (Constant), RLPP, SERAT, INCOME, ROKOK, AKTFISIK

1. Nilai Koef. Korelasi r =0.516 (korelasi sedang)


2. Koef. Determinasi r2 =0.266 dan r2adj =0.237 (variasi stress
yang dapat dijelaskan oleh variabel independen = 26.6%)
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 978.093 5 195.619 8.994 .000a
Residual 2696.984 124 21.750
Total 3675.077 129
a. Predictors: (Constant), RLPP, SERAT, INCOME, ROKOK, AKTFISIK
b. Dependent Variable: STRESS

3. Nilai-p ANOVA = 0.000 (Asumsi linier sudah terpenuhi)


Jika p>0.05 keluarkan variabel xi satu persatu sampai p<0.05
Biostatistika, FKM UI, 2003 Page 10
Pemodelan Regresi Linier Ganda
„ Contoh output computer metode ENTER:
Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.
1 (Constant) 23.490 5.533 4.245 .000
ROKOK 3.887 1.142 .279 3.403 .001
SERAT .209 .094 .171 2.216 .029
AKTFISIK .889 .401 .183 2.214 .029
INCOME 7.293E-03 .003 .213 2.714 .008
RLPP 8.311 5.985 .111 1.389 .167
a. Dependent Variable: STRESS

4. Nilai-p koef. RLPP = 0.167 (tidak bermakna, sehingga harus


dikeluarkan agar didapat model yang parsimony)

Biostatistika, FKM UI, 2003 Page 11


Pemodelan Regresi Linier Ganda
„ Output computer metode ENTER, jika RLPP dikeluarkan:
Model Summary

Adjusted R Std. Error of


Model R R Square Square the Estimate
1 .505a .255 .231
a. Predictors: (Constant), INCOME, ROKOK, SERAT, AKTFISIK
4.68 r=0.505 r2 =0.255 dan r2adj =0.231

ANOVAb

Sum of
Model
1 Regression
Squares
936.151
df
4
Mean Square
234.038
F
10.681
Sig.
.000a p=0.000 -> Model Linier
Residual
Total
2738.926
3675.077
125
129
21.911
Jika p>0.05 maka asumsi linier
a. Predictors: (Constant), INCOME, ROKOK, SERAT, AKTFISIK
b. Dependent Variable: STRESS
tidak terpenuhi
Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts
Model B Std. Error Beta t Sig.

Semua variabel mempunyai


1 (Constant) 30.207 2.698 11.197 .000
ROKOK 4.111 1.135 .295 3.621 .000
SERAT .216 .095 .177 2.278 .024 p<0.05 -->
AKTFISIK
Bermakna secara statistik
.967 .399 .199 2.423 .017
INCOME 6.891E-03 .003 .201 2.570 .011
a. Dependent Variable: STRESS

Biostatistika, FKM UI, 2003 Page 12


Uji Asumsi Regresi Linier Ganda
„ Setelah didapatkan model yang parsimony, maka harus
dilakukan pengujian terhadap asumsi regresi linier ganda.
1) Liniearity: Bila nilai-p ANOVA < 0.05 berarti asumsi linieritas
sudah terpenuhi
2) Multivariate Normality: Diuji dengan melihat nilai
RESIDUAL (PLOTS: histogram & Normal Probability plot)
3) Existency: Bila nilai mean RESIDUAL = 0.0

Biostatistika, FKM UI, 2003 Page 13


Uji Asumsi Regresi Linier Ganda
2) Multivariate Normality:

Histogram Normal P-P Plot of Regression Stand

Dependent Variable: STRESS Dependent Variable: STRESS


20 1.00

.75

10

Expected Cum Prob


.50
Frequency

Std. Dev = .98 .25


Mean = 0.00
0 N = 130.00
0.00
2. 5
-2
-2 5
-1 00
-1 5
-1 0
-1 25
-.7 0
-.5
-.2
0. 5
.2 0
.5
.7
1.
1.
1. 5
1. 0
2. 5
2.
0
5
0
5
00
2
5
7
00
2
50
.2
.
.7
.5
.
.0
5
0

0.00 .25 .50 .75 1.00

Regression Standardized Residual Observed Cum Prob

„ Histogram memperlihatkan distribusi normal & pada p-plot nilai residual


berhimpit (mendekati) garis diagonal
Kedua grafik tersebut menggambarkan asumsi Normalitas terpenuhi

Biostatistika, FKM UI, 2003 Page 14


Uji Asumsi Regresi Linier Ganda
3) Existency:
Residuals Statisticsa

Minimum Maximum Mean Std. Deviation N


Predicted Value 36.56 49.93 41.77 2.69 130
Residual -11.10 12.23 4.43E-15 4.61 130
Std. Predicted Value -1.935 3.029 .000 1.000 130
Std. Residual -2.372 2.612 .000 .984 130
a. Dependent Variable: STRESS

„ Nilai mean residual adalah nol (4.43 x 10-15=0.000) berarti


asumsi existensi terpenuhi

Biostatistika, FKM UI, 2003 Page 15


Uji Asumsi Regresi Linier Ganda
4) Homocedasticity: Analisa scatter-plot antara Nilai
prediksi standar (ZPRED) dengan nilai residu standar
(ZRESID) atau residu student (SRESID)
Scatterplot
Dependent Variable: STRESS
3

Regression Studentized Residual


2

-1

-2

-3
-2 -1 0 1 2 3 4

Regression Standardized Predicted Value

„ Scatter plot tidak membentuk pola tertentu Æ


berarti asumsi homosiditas terpenuhi
Biostatistika, FKM UI, 2003 Page 16
Uji Asumsi Regresi Linier Ganda
5) Independency : Apabila nilai Durbin-Watson
berkisar antara –2 s.d. +2 berarti asumsi
independensi terpenuhi
b
Model Summary

Model R R Square Durbin-Watson


1 .505 a .255 1.888
a. Predictors: INCOME, ROKOK, SERAT, AKTFI
b. Dependent Variable: STRESS

„ Nilai Durbin-Watson = 1.88 Æ berarti independensi


bukan suatu masalah serius
Biostatistika, FKM UI, 2003 Page 17
Uji Asumsi Regresi Linier Ganda
6) Collinearity: Apabila nilai VIF dari Collinearity
diagnostic <10 dan pada korelasi bivariate antar
independent variabel r < 0.8 berarti tidak ada gejala
collinearitas

Coefficientsa

Standardi
zed
Unstandardized Coefficien
Coefficients ts Collinearity Statistics
Model B Std. Error Beta Sig. Tolerance VIF
1 (Constant) 30.207 2.698 .000
ROKOK 4.111 1.135 .295 .000 .898 1.114
SERAT .216 .095 .177 .024 .991 1.009
AKTFISIK .967 .399 .199 .017 .883 1.133
INCOME 6.891E-03 .003 .201 .011 .973 1.027
a. Dependent Variable: STRESS
Biostatistika, FKM UI, 2003 Page 18
Interpretasi Regresi Linier Ganda
A. Persamaan garis linier: Diambil dari Unstandardized
Coefficients-B, garis prediksi skor stress adalah
Stress = 30.2 + 4.1( rokok ) + 0.216( serat ) + 0.967( AktFisik ) + 0.00689(income)
„ Merokok dapat meningkatkan skor stress sebesar 4.1 point
„ Setiap kenaikan 1% kadar serat dalam makanan akan meningkatkan skor
stress sebesar 0.2 point
„ Setiap kenaikan income 1000 rupiah akan meningkatkan skor stress
sebesar 0.00689 point
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
(Constant) 30.207 2.698 11.197 .000
ROKOK 4.111 1.135 .295 3.621 .000
SERAT .216 .095 .177 2.278 .024
AKTFISIK .967 .399 .199 2.423 .017
INCOME 6.891E-03 .003 .201 2.570 .011
a. Dependent Variable: STRESS
Biostatistika, FKM UI, 2003 Page 19
Interpretasi Regresi Linier Ganda
B. Variabel yang paling berperan dalam memprediksi
stress: Dilihat nilai Standardized Coefficients-Beta yg paling
tinggi atau nilai Partial correlation paling tinggi

Coefficientsa

Unstandar Standar
dized dized Correlations
Model B Beta Sig. Zero-order Partial Part
1 (Constant) 30.207 .000
ROKOK 4.111 .295 .000 .373 .308 .280
SERAT .216 .177 .024 .196 .200 .176
AKTFISIK .967 .199 .017 .325 .212 .187
INCOME 6.891E-03 .201 .011 .225 .224 .198
a. Dependent Variable: STRESS

„ Merokok adalah variabel yang paling berperan dalam


memprediksi
Biostatistika, FKM UI, 2003stress, diikuti oleh variabel income Page 20

Anda mungkin juga menyukai