Anda di halaman 1dari 48

Regresi Linier Ganda

Pokok Bahasan;
 Pengenalan regresi linier ganda

 Menyeleksi variabel

 Melakukan uji asumsi

 Menetapkan persamaan garis regresi

 Interpretasi persamaan garis


Memahami Konsep
&
Memahami Prosedur
Regresi Linier Ganda
 Regresi Linier ganda (multiple linier regression) bertujuan untuk
memprediksi variabel dependen (y) kontinu dengan beberapa variabel
independen (x) kontinu dan kategorik.

 Kenapa diperlukan lebih dari 1 variabel indenden ???


 Karena suatu kejadian sering tidak disebabkan oleh 1 faktor saja
(penyebab tunggal) bisa disebabkan oleh beberapa faktor.

 Regresi linier ganda termasuk dalam tahapan analisis multivariat


perbedaan penyebutan istilah ada yang menyebutnya juga sebagai
multivariable (karena var. Independen lebih dari satu).
Contoh:
a) Tekanan darah tidak hanya berhubungan dengan usia namun juga

dapat dipengaruhi oleh tingkat aktivitas fisik (Physical Activity Level).

b) Berat badan bayi baru lahir tidak hanya berhubungan dengan usia ibu
namun ada variabel lain yang mempengaruhi misalnya berat badan ibu
(saat menstruasi terakhir), riwayat hipertensi, jumlah kunjungan ke
tenaga kesehatan dan varibel lain yang secara substansi memiliki
keterkaitan dengan variabel dependen (berat badan bayi baru lahir).
• Persamaan garis Regresi Linier ganda (multiple linier regression), yaitu;

Keterangan:
y = variabel dependen
a = konstanta
b = koefisien regresi
x = variabel independen
SELEKSI
VARIABEL INDEPENDEN
Regresi Linier Ganda
Dalam menentukan variabel independen untuk dapat masuk
dalam suatu persamaan garis linier ganda yang perlu
diperhatikan 2 hal yaitu;

a) Memiliki landasan teori yang kuat (substansi).


b) Memiliki nilai statistik yang baik (diketahui melalui
tahapan seleksi variabel).

Berapa banyak variabel independen yang digunakan pada


persamaan garis regresi ???
Regresi Linier Ganda

Persamaan garis yang baik adalah yang


“PARSIMONI”
yaitu persamaan garis regresi dengan jumlah variabel
independen sesedikit mungkin namun dapat dengan baik
menjelaskan variabel dependen
Regresi Linier Ganda
Tahapan seleksi variabel independen;

1). Seleksi
bivariat.
 Uji statistik yang sesuai dengan jenis data.

 Variabel yang masuk ke tahap berikutnya adalah yang memiliki p-value < 0,25.

 Catatan apabila variabel independen tersebut secara substansi memiliki

hubungan dengan variabel independen maka apabila nilai p-value > 0,25 tetap
dicoba dimasukkan ke tahap berikutnya.

Note: sebelum melakukan seleksi variabel seluruh data yang kontinu harus
memenuhi distribusi normal, terutama variabel independen.
Ditunjukkan oleh nilai p-value Kolmogorov Smirnov > 0,05
Regresi Linier Ganda
Seleksi multivariat.
2)
 Lakukan uji regresi linier secara bersamaan seluruh variabel independen yang telah

terseleksi di atas (bivariat) dengan variabel dependen.

 Variabel yang memenuhi syarat untuk ketahap berikutnya yaitu variabel dependen
dengan nilai p-value kurang dari 0,05.

 Variabel dengan nilai p-value lebih besar dari 0,05 dikeluarkan satu per satu dari
kandidat variabel independen, dimulai dengan variabel independen yang memiliki p-
value yang paling besar.

 Pehatikan perubahan nilai koefisien variabel ketika mengeluarkan variabel independen


tesebut, apabila koefisien berubah lebih dari 10% maka varibel terebut tidak
dikeluarkan dikarenakan variabel tersebut merupakan variabel confounding.
Regresi Linier Ganda
Melakukan diagnostik regresi linier
3)

a. Uji asumsi, “HEIL – GAUSS”


Homoscedasticity;
Varian nilai variabel Y sama untuk semua variabel X.
Plot residual membentuk tebaran merata di atas dan di bawah garis nol.

Eksistensi;
Variabel dependen Y merupakan variabel random pada setiap variabel X.
Sampel diambil secara random, asumsi ini terpenuhi bila residual menunjukan
nilai mean 0 dan memiliki nilai standar deviasi.
Regresi Linier Ganda
Independensi;
Masing-masing variabel Y bebas satu sama lain, tidak boleh diukur 2 kali. Asumsi terpenuhi bila angka
Durbin Watson antara -2 s.d +2

Liniearitas;
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3 dst terletak pada garis linier yang
dibentuk oleh persamaan garis regresi. Asumsi ini terpenuhi apabila hasil uji Anova regresi signifikan.

Gauss/Normalitas
Varibel Y berdistribusi normal untuk setiap pengamatan variabel X. Asumsi ini terpenuhi bila grafik
normal P-P plot residual titik tebarannya menyebar di sekitar garis diagonal.
Regresi Linier Ganda
b. Menguji adanya multicollinearity antar variabel independen.
Multicollinearity adalah untuk mengetahui apakah antar variabel independen
memiliki korelasi yang kuat, yaitu bila nilai r>= 0,8 atau nilai Vif > 10.

Analisis interaksi
4)

Kondisi hubungan variabel indepeden dengan variabel dependen berbeda menurut


tingkat variabel independen yang lain.

Reliabilitas model
5)

Sampel dibagai menjadi 2, apabila kedua sampel menghasilkan model yang sama
maka model (persamaan garis) regresi reliabel.
CONTOH SOAL
Regresi Linier Ganda

Suatu penelitian dilakukan dengan tujuan untuk


memprediksi berat badan bayi lahir melalui
beberapa variabel independen yaitu; berat badan
ibu (menstruasi terakhir, pounds), umur ibu
(tahun), status merokok ibu, dan riwayat hipertensi.
Tentukan persamaan garis regresi.
Regresi Linier Ganda
1.Seleksi Bivariat
Sesuai dengan jenis data Analisis bivariat
Data kontinu apa yang
• Berat badan ibu
digunakan ???
• Umur ibu Berat Badan Bayi

Data kategorik
Analisis bivariat
• Status merokok Berat Badan Bayi
apa yang
• Riwayat hipertensi
digunakan ???
Status merokok :0= tidak merokok
1= merokok
Riwayat hipertensi: 0= tiak ada riwayat hipertensi
1 = ada riwayat hipertensi
Regresi Linier Ganda
Bivariat 1 -- Analisis Korelasi (r)
Lakukan analisis korelasi antara variabel independen
berat badan ibu dan umur ibu terhadap berat badan bayi,
dengan langkah sebagai berikut;
Analyze >> Correlate >> Bivariat

Hasil output SPSS seperti di bawah ini


Interpretasi:
Nilai p-value berat badan ibu dan umur ibu < 0,25 maka dapat lanjut ke tahap
multivariat
Regresi Linier Ganda
Bivariat 2 – Independent t-test
Lakukan uji statistik independent t-test antara variabel status merokok
dan riwyat hipertensi terhadap berat badan bayi adalah sebagai
berikut;
Analyze >> compare means >> independent sample t-test

Masukkan variabel berat badan bayi ke kolom test variable


Kemudian variabel status merokok ke grouping variable
Define groups>> use spercified values >> group 1 isi 0, group 2 isi 1.

Hasil output SPSS seperti di bawah ini .


Birvariat: Independent t-test antara variabel independen status merokok dengan
variabel dependen berat badan bayi

Birvariat: Independent t-test antara variabel independen riwayat hipertensi dengan


variabel dependen berat badan bayi

Interpretasi:Nilai p-value status merokok dan riwayat hipertensi terhadap berat badan
bayi <0,25 maka dapat dimasukkan ke analisis berikutnya.
Regresi Linier Ganda
2. Seleksi Multivariat
Lakukan analisis regresi antara seluruh variabel independen
(terseleksi) terhadap variabel dependen berat badan bayi dengan
nilai p-value < 0,05 langkahnya adalah sebagai berikut;
Analyze >> Regression >> Linier
variabel berat badan bayi  Dependent
variabel independen  independent(s)

Hasil ouptput SPSS adalah sebagai berikut.


Multivariat: Output Regersi dengan SPSS Perhatikan
R²= 10,5%

Interpretasi: p-value dengan nilai lebih dari 0,05 dikeluarkan 1 per 1 dimulai dari p-
value dengan nilai terbesar dengan memperhatikan perubahan koefisien sebelum dan
setelah variabel tersebut dikeluarkan. Pada output ini hanya 1 umur ibu dikeluarkan.
Output setelah variabel umur ibu
Perhatikan perubahan
dikeluarkan R²=10,4%

Interpretasi: Setelah umur ibu dikeluarkan nilai p-value tidak ada yang lebih
dari 0,05, cek perubahan koefisien variabel untuk mengetahui apakah age
confounding...
Regresi Linier Ganda
Apakah umur ibu confounding, cek koefisien masing-masing
variabel.
No. Variabel Sebelum Setelah Perubahan
keluar keluar
1 Berat badan ibu 5,168 5,352 -3,56%
2 Status merokok -260,924 -263,009 -0,79%
3 Riwayat hipertensi -579,453 -586,722 -1,25%

Tidak ada koefisien yang berubah lebih dari 10%, maka umur ibu
tetap dikeluarkan, sehingga model regresi terakhir memuat 3
variabel independen yaitu berat badan ibu, status merokok
dan riwayat hipertensi.
UJI ASUMSI
Regresi Linier Ganda
Dengan menggunakan SPSS, langkah-langkahnya adalah;
Analyze >> regression >> linier
Masukkan berat badan bayi ke var. Dependen
Masukkan berat badan ibu, status merokok dan riwayat hipertensi
ke var. Independen
Klik tombol statistic>> estimates>> covariance matrix>> model fit
>> collinearity diagnostics>> Durbin watson
Klik tombol plot>> masukkan sresid ke kotak Y dan zpred ke
kotak ke kotak X klik histogram dan normal probability plot.

Hasil output SPSS adalah sebagai berikut;


Asumsi Homoscedascity

Varian nilai variabel


Y sama untuk semua
nilai variabel X.
Titik tebaran tidak
berpola tertentu dan
menyebar merata
disekitar garis titik
nol, maka varian
homogen. Asumsi ini
terpenuhi.
Asumsi Eksistensi

Untuk setiap nilai dari variabel X (independen) dan Y (dependen) adalah


variabel random ditunjukkan dengan angka residual 0,00 0 dan standar
deviasi 690,134
Asumsi Independensi

Masing-masing nilai Y bebas satu sama lain . Nilai dari


tiap-tiap individu saling berdiri sendiri. Nilai Durbin
Watson antara -2 s.d +2 berarti asumsi ini terpenuhi.
Asumsi Liniearitas

Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3..... Terletak
pada garis linier yang dibentuk oleh persamaan regresi. P-value signifikan
model berbentuk linier.
Asumsi Normalitas
Deteksi Multicollinearity

Antar variabel independen tidak boleh memiliki korelasi yang kuat


VIF (Variance Inflation Factor) kurang dari 10 maka tidak terjadi
multicollinearity antar sesama variabel independen.

Seluruh asumsi telah terpenuhi


Regresi Linier Ganda
Persamaan Garis Regresi menjadi:
Berat badan bayi = 2390,105 + 5,352*(Berat badan ibu)
-263,009*(Status merokok ibu)
– 586,722*(Riwayat hipertensi)
Pertanyaan:
Apa beda interpretasi regresi linier sederhana dengan
interpretasi pada regresi linier berganda ???

Lakukan interpretasi pada intercept dan masing-masing


koefisien regresi variabel independen !!!
Regresi Linier Ganda
Interpretasi persamaan garis regresi:
Intercept (2390,105)
Ibu dengan berat badan nol, tidak merokok dan tidak memiliki
riwayat hipertensi akan memiliki bayi dengan rata-rata berat badan
2390,105 gram.

Koefisien b1=5,352*(Berat badan ibu)


Setiap pertambahan 1 pounds berat badan ibu akan menambah 5,352
gram rata-rata berat badan bayi setelah dikontrol variabel status
merokok dan riwayat hipertensi.
Regresi Linier Ganda

Koefisien b2= -263,009*(Status merokok ibu)


Pada ibu yang merokok rata-rata berat badan bayi akan lebih rendah
sebesar 263,009 gram jika dibandingkan dengan ibu yang tidak merokok,
setelah dikontrol variabel berat badan ibu dan riwayat hipertensi ibu.

Koefisien b3= - 586,722*(Riwayat hipertensi)


Pada ibu yang memiliki riwayat hipertensi akan memiliki rata-rata berat
badan bayi 586,722 gram lebih rendah jika dibandingkan dengan ibu
yang tidak memiliki riwayat hipertensi, setelah dikontrol variabel berat
badan ibu dan status merokok ibu.
Regresi Linier Ganda

Variabel berat badan ibu dan riwayat hipertensi dapat


menjelaskan 10,4% variasi variabel berat badan bayi ,
sisanya dijelaskan oleh variabel lain yang tidak diteliti.
MEMAHAMI INTERPETASI
REGRESI LINIER GANDA
Regresi Linier Ganda
Contoh:
Suatu penelitian bertujuan ingin memprediksi berat badan bayi lahir melalui
variabel status merokok ibu dan riwayat hipertensi ibu.

KERANGKA KONSEP
- STATUS MEROKOK IBU
Berat Badan Bayi Lahir
- RIWAYAT HIPERTENSI
IBU

Keterangan Koding: Status Merokok Ibu Riwayat hipertensi ibu


0 = tidak ada riwayat hipertensi 0 = tidak merokok
1 =ada riwayat hipertensi 1 = merokok
Regresi Linier Ganda
Dilakukan regresi linier ganda dengan software statitsik
Stata 12 diperoleh output sebagai berikut;
. reg bwt smoke ht

Source SS df MS Number of obs = 189


F( 2, 186) = 5.58
Model 5652412.36 2 2826206.18 Prob > F = 0.0044
Residual 94262886.2 186 506789.711 R-squared = 0.0566
Adj R-squared = 0.0464
Total 99915298.6 188 531464.354 Root MSE = 711.89

bwt Coef. Std. Err. t P>|t| [95% Conf. Interval]

smoke -279.7948 106.1009 -2.64 0.009 -489.1106 -70.47892


ht -427.6566 212.3766 -2.01 0.045 -846.6331 -8.680141
_cons 3080.988 67.63122 45.56 0.000 2947.565 3214.411
Regresi Linier Ganda
Melalui hasil output stata di atas dapat diketahui persamaan garis regresi linier
ganda yaitu;

Bwt= 3080,988 -279,7948*(smoke) - 427,6566*(ht)

Interpretasikan nilai ;
a. Intercept
b. Koefisien variabel smoke
c.Koefisien variabel hipertensi
Bwt= 3080,988 -279,7948*(smoke) - 427,6566*(ht)

Isi kolom yang kosong dengan menggunakan persamaan garis


regeresi!!
RIWAYAT STATUS MEROKOK IBU Beda
HIPERTENSI Merokok (1) Tidak Merokok (0) Rata-rata
IBU .......

Hipertensi (1) 3080,988 – 279,7948*(1)- ....... .....


427,6566*(1)
= 2373,5366
Tidak hipertensi ...... ..... .......
(0)
Beda rata-rata .... ......
......
Bwt= 3080,988 -279,7948*(smoke) - 427,6566*(ht)
RIWAYAT STATUS MEROKOK IBU Beda
HIPERTENSI Merokok Tidak Merokok Rata-rata
IBU .......

Hipertensi 3080,988 – 279,7948*(1)- 3080,988 – 279,7948*(0)- -279,7948


427,6566*(1) 427,6566*(1)
= 2373,5366 = 2653,3314

Tidak hipertensi 3080,988 – 279,7948*(1)- 3080,988 – 279,7948*(0)- -279,7948


427,6566*(0) 427,6566*(0)
= 2801,1932 = 3080,988

Beda rata-rata - 427,656 - 427,656


......
Regresi Linier Ganda

Bwt= 3080,988 -279,7948*(smoke) - 427,6566*(ht)


Interpretasikan nilai ;
a. Intercept (3080,988)
Rata-rata berat badan bayi lahir pada ibu yang tidak merokok dan tidak
memiliki riwayat hipertensi adalah 3080,988 gram.

b. Koefisien variabel smoke (-279,7948)


Perbedaan rata-rata berat badan bayi lahir antara ibu yang merokok dengan
yang tidak merokok pada ibu dengan riwayat hipertensi yang sama.
Pertanyaan: Interpretasi lainnya .....???
Regresi Linier Ganda

Bwt= 3080,988 -279,7948*(smoke) - 427,6566*(ht)


Interpretasikan nilai ;
c. Koefisien variabel hipertensi (- 427,6566)
Perbedaan rata-rata berat badan bayi lahir antara ibu yang memiliki
riwayat hipertensi dengan yang tidak memiliki riwayat hipertensi pada
ibu dengan status merokok yang sama
Atau
Ibu dengan riwayat hipetensi akan memiliki bayi dengan rata-rata
berat badan ketika lahir lebih kecil 427,6566 gram jika dibandingkan
dengan ibu yang tidak memiliki riwayat hipetensi setelah dikontrol
variabel status merokok.
Regresi Linier Ganda
Regresi sebenarnya adalah beda rata-rata (t-test independent) perhatikan output
stata di bawah ini.
T-test
. ttest bwt, by(smoke)

Two-sample t test with equal variances

Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]

0 115 3054.957 70.1625 752.409 2915.965 3193.948


1 74 2772.297 76.70106 659.8075 2619.432 2925.162

combined 189 2944.286 53.02811 729.016 2839.679 3048.892

diff 282.6592 106.9544 71.66693 493.6515

diff = mean(0) - mean(1) t = 2.6428


Ho: diff = 0 degrees of freedom = 187

Ha: diff < 0 Ha: diff != 0 Ha: diff > 0


Pr(T < t) = 0.9955 Pr(|T| > |t|) = 0.0089 Pr(T > t) = 0.0045
Regresi Linier Ganda
Regresi
. reg bwt smoke

Source SS df MS Number of obs = 189


F( 1, 187) = 6.98
Model 3597444.33 1 3597444.33 Prob > F = 0.0089
Residual 96317854.2 187 515068.739 R-squared = 0.0360
Adj R-squared = 0.0308
Total 99915298.6 188 531464.354 Root MSE = 717.68

bwt Coef. Std. Err. t P>|t| [95% Conf. Interval]

smoke -282.6592 106.9544 -2.64 0.009 -493.6515 -71.66693


_cons 3054.957 66.92428 45.65 0.000 2922.933 3186.98
. reg bwt 0.smoke

Source SS df MS Number of obs = 189


F( 1, 187) = 6.98
Model 3597444.33 1 3597444.33 Prob > F = 0.0089
Residual 96317854.2 187 515068.739 R-squared = 0.0360
Adj R-squared = 0.0308
Total 99915298.6 188 531464.354 Root MSE = 717.68

bwt Coef. Std. Err. t P>|t| [95% Conf. Interval]

0.smoke 282.6592 106.9544 2.64 0.009 71.66693 493.6515


_cons 2772.297 83.42894 33.23 0.000 2607.714 2936.88
Regresi Linier Ganda

Pertanyaan:
Jika bisa dengan t-test mengapa perlu
dilkuakan regresi ???

Anda mungkin juga menyukai