Anda di halaman 1dari 35

MULTIPLE REGRESI

LINIER

NIA WATRI WAHYUNI (2106776930)


PENGERTIAN

multiple regression linear : analisis hubungan antara beberapa


variabel independen dengan satu variabel dependen.

variabel dependen harus numerik.


variabel independen boleh semuanya numerik, boleh campuran
numerik dan kategorik.
Model Persamaan

Regresi linier sederhana


Y = a + bx

Regresi linier ganda


Y = a +b1x1 + b2x2 + …. + bkxk + e
TUJUAN

analisis regresi bertujuan untuk membuat


perkiraan (prediksi) nilai suatu variabel
(variabel dependen) melalui variabel lain
(variabel independen).
Eksistensi Independensi
Asumsi / persyaratan

setiap melakukan analisis regresi linier ganda,


Linieritas Homoscedasticity harus memenuhi asumsi / persyaratan yang
ditetapkan.

Normalitas
a. Asumsi Eksistensi
Variabel Dependen Y merupakan variabel random pada setiap nilai variabel independen X. Sampel diambil
random, asumsi ini terpenuhi bila residual menunjukan nilai : mean menghasilkan nilai 0

b. Asumsi Independensi
Masing-masing variabel Y bebas satu sama lain, tidak boleh diukur dua kali. Asumsi terpenuhi: angka
Durbin Watson antara -2 s/d 2

c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, dst terletak pada garis linier yang dibentuk
persamaan regresi
Asumsi terpenuhi: hasil Uji Anova regresi hasilnya signifikan (p < 0,05)
d. Asumsi Homoscedasticity
Varian nilai variabel Y sama untuk semua nilai variabel X
Homoscedasticity : Plot residual membentuk tebaran merata diatas dan dibawah garis tengah nol
Heteroscedasticity: tebaran residual mengelompok dibawah/diatas garis tengah nol

e. Asumsi Normalitas
Variabel Y berdistrubusi normal untuk setiap pengamatan variabel X. Asumsi terpenuhi bila Grafik
Normal P-P plot residual, titik tebarannya menyebar sekitar garis diagonal. Sebaliknya bila tebaran
data menjauhi garis diagonal maka asumsi tidak terpenuhi
Kegunaan Tujuan analisis regresi linier ganda adalah untuk
menemukan model regresi yang paling sesuai
Analisis Regresi menggambarkan faktor-faktor yang berhubungan dengan
Ganda variabel dependen.

01 Prediksi Estimasi
02
memperkirakan var. dependen dengan menggunakan menguantifikasi hubungan var. independen dengan var.
informasi yang ada pada variabel independen. ex: dependen. yaitu untuk mengetahui var. indenpenden apa
saja yang berhubungan dengan var. dependen. dan
analisis var. independen umur, BB, dan sex
seberapa besar hubungan masing2 var. independen
dihubungkan dg var. dependen tekanan darah. dari
terhadap var. independen lainnya.
hasil regresi, seseorang dapat diperkirakan tekanan
darahnya pada umur, BB, dan jenis kelamin tertentu
Pemodelan Multiple
Linier Regression

Melakukan
analisis bivariat
Melakukan
untuk
Lakukan analisis diagnostik regresi Melakukan
menentukan
secara bersamaan linier analisis interaksi
variabel yang
multivariabel
menjadi kandidat
model.
1. Melakukan
analisis bivariat

• Melakukan analisis bivariat untuk menentukan variabel yang


menjadi kandidat model. Masing-masing variabel independen
dihubungkan dengan variabel dependen (bivariat), bila hasil uji
bivariat mempunyai nilai p<0,25, maka variabel tersebut masuk
dalam model multivariat. Untuk variabel yang p valuenya >0,25
namun secara substansi penting, maka variabel tersebut dapat
masuk ke multivariat.
2. Melakukan analisis
secara bersamaan
• Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk dalam model. Ketika kita

sudah masuk dalam analisis multivariat, maka variabel yang masuk dalam model multivariat adalah

variabel ang mempunyai p value ≤0,05. Untuk variabel yang p valuenya >0,05 dilakukan pengeluaran dari

model satu per satu, dimulai dari variabel yang p valuenya paling besar. Bila variabel tersebut setelah

dikeluarkan dari model mengakibatkan koefisien dari variabel yang masih dalam model berubah besar

(mengubah koefisien lebih dari 10%) maka variabel tersebut tidak jadi dikeluarkan, tapi dimasukkan

kembali dalam model karena dianggap sebagai variabel konfounding


3. Melakukan diagnostik
regresi linier
Melakukan diagnostik regresi linier multivariabel
a) Melakukan pengujian terhadap kelima asumsi.
b) Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antarvariabel
independen terjadi saling hubungana yang kuat. Untuk mengetahui adanya
kolinearitas dapat dilihat dari nilai koefisien korelasi R2, bila nilai r lebih tinggi
dari 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui dari nilai VIF atau
tolerance, bila nilai VIF > 10, atau tolerance sekitar 1 (satu) maka model terjadi
kolinearitas.
4. Melakukan analisis
interaksi

Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah


selanjutnya adalah memeriksa adanya interaksi antar variabel independen. Interaksi
merupakan keadaan dimana hubungan antara satu variabel independen dengan
dependen berbeda menurut tingkat variabel independen yang lain.
Contoh kasus regresi
linier ganda

Kita akan melakukan analisis penelitian


“Faktor-Faktor Yang Berhubungan Dengan
Berat Badan Bayi Di Depok Tahun 2023”.

Berat bayi (numerik), Umur Ibu (numerik), Berat badan Ibu


(numerik), Merokok (kategorik), Prematur (numerik krn isi data
adalah berapa kali pernah mengalami prematur), Hipertensi
(kategorik), frekuensi Anc (numerik krn isi data adalah berapa kali
melakukan periksa hamil)
Langkah pertama pemodelan :
seleksi bivariat

Seleksi bivariat masing-masing variabel independen dengan variabel dependen. Bila hasil uji bivariat
mempunyai nilai p < 0,25, maka variabel tersebut masuk dalam model multivariat. Untuk variabel yang p
valuenya > 0,25 namun secara substansi penting, maka variabel tersebut dapat masuk ke multivariat. Uji
yang digunakan pada analisis bivariat tergantung dari variabel yang digunakan, bila variabel
independennya numerik  uji korelasi, bila independennya kategorik  uji t atau uji anova.
Bivariat uji korelasi

melakukan analisis bivariat untuk


variabel independen umur ibu, berat
badan ibu, frekuensi anc, frekuensi
prematur.
Bivariat uji t
(merokok)
melakukan analisis
bivariat untuk variabel
independen berjenis
kategorik : merokok dan
riwayat hipertensi

Hasil analisis hubungan merokok dengan berat bayi menghasilkan p


value = 0,009, dengan demikian p value yang dihasilkan < 0,25,
maka variabel merokok dapat lanjut ke multivariat.
Bivariat uji t
(hipertensi)

Hasil analisis hubungan riwayat hipertensi dengan berat bayi


menghasilkan p value = 0,045, dengan demikian p value yang dihasilkan <
0,25, maka variabel riwayat hipertensi dapat lanjut ke multivariat.
Pemodelan Multivariat

VARIABEL P VALUE KETERANGAN


UMUR 0,219 KE MULTIVARIAT
BERAT IBU 0,010 KE MULTIVARIAT
MEROKOK 0,009 KE MULTIVARIAT
PREMATUR 0,034 KE MULTIVARIAT
HIPERTENSI 0,045 KE MULTIVARIAT
ANC 0,426 KE MULTIVARIAT *

Hasil seleksi bivariat semua variabel mempunyai p value <


0,25, kecuali Variabel ANC yang p value > 0,25. Namun karena
secara substansi ANC berhubungan sangat penting dengan
berat bayi, maka ANC diikutkan ke proses Multivariat
Langkah kedua : pemodelan
multivariat

Tahap berikutnya, evaluasi


seleksi variabel dengan batas p
value < 0,05
Dari nilai p disamping, variabel
umur, prematur, anc memiliki p
value > 0,05
Dari ketiga variabel tsb, var anc
mempunyai p value yg tertinggi,
maka var anc
ikeluarkan dari model terlebih
dahulu (pengeluaran variabel
secara bertahap)
Mengeluarkan variabel anc

Setelah anc keluar terlihat R


square tdk berubah, dan Coef B
Untuk masing-masing juga tidak
berubah besar ( > 10 %)
Mengeluarkan variabel umur

Setelah umur keluar, ternyata R Square


berubah sedikit, menjadi 0,113.
Perubahan koef b setelah variabel umur
keluar
Mengeluarkan variabel prematur

R square turun menjadi 0,104. koef B


pada variabel berat badan ibu berubah
sebesar 12,3 % dengan demikian
variabel dimasukkan kembali dan tetap
dipertahankan dalam model multivariat.
Dalam hal ini, bisa dikatakan juga bahwa
variabel riwayat prematur merupakan
konfounding.
Pemodelan Terakhir
Langkah ketiga :
diagnostik regresi linier
1. Asumsi independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap
individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur
dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara
mengeluarkan uji Durbin Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi
terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi.

Dari hasil uji didapatkan koefisien Durbin Watson


0,222, berarti asumsi independensi terpenuhi.
Langkah ketiga :
diagnostik regresi linier
2. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak pada garis/bidang
linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat
diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value < 0,05) maka model
berbentuk linier.

Dari output disamping menghasilkan uji


anova 0,0001, berarti asumsi linearitas
terpenuhi.
Langkah ketiga :
diagnostik regresi linier
3. Asumsi Eksistensi

Hasil dari output disamping menunjukkan


angka residual dengan mean= 0,000.
Dengan demikian asumsi Eksistensi
terpenuhi
Langkah ketiga :
diagnostik regresi linier
4. Asumsi Normalitas

Dari grafik histogram dan grafik normal P-P plot


terbukti bahwa bentuk distribusinya normal, berarti
asumsi normality terpenuhi.
Langkah ketiga :
diagnostik regresi linier
5. Asumsi Homoscedascity

Dari hasil plot disamping terlihat tebaran


titik mempunyai pola yang sama antara titik-
titik diatas dan dibawah garis diagonal 0.
Dengan demikian asumsi homoscedasity
terpenuhi.
Langkah ketiga :
diagnostik regresi linier
Diagostik Multicollinearity

Dari hasil uji collinearity didapatkan nilai VIF tidak ada yg lebih dari 10, dengan
demikian tidak ada Multicollinearity antara sesama variabel indepeden.
Model Akhir
Dari hasil uji asumsi dan
uji kolinearitas ternyata
semua asumsi terpenuhi
sehingga model dapat
digunakan untuk
memprediksi berat badan
bayi.

Berat bayi = 2449,1 + 5,035 bb -236,42 merokok -582,56 hipertensi – 145,41 prematur
Interpretasi
Berat bayi = 2449,1 + 5,035 bb -236,42 merokok -582,56 hipertensi – 145,41 prematur

Hasil analisis multivariat regresi linier diperoleh bahwa variabel yang


berhubungan signifikan dengan berat badan bayi adalah badan badan ibu,
merokok dan riwayat hipertensi. Variabel premature tidak berhubungan signifikan
dengan berat bayi, merupakan variabel confounding. R Square =0,094 artinya
variable berat badan ibu, merokok, hipertensi dan premature mempengaruhi
berat bayi sebesar 9,4 %, sedang sisanya 90,6% dipengaruhi faktor lain yang tidak
diteliti. Hasil analisis multivariat diperoleh bahwa variabel berat badan ibu
merupakan variabel yang paling dominan berhubungan dengan berat bayi (nilai
beta tertinggi yaitu 0,211)
Berat bayi = 2449,1 + 5,035 bb -236,42 merokok -582,56 hipertensi – 145,41 prematur

Dari nilai koefisien B masing2 variable dapat dijelaskan sbb:


• Berat badan b=5,0 artinya Setiap kenaikan berat badan ibu sebesar 1 ponds, maka
berat badan bayi akan naik sebesar 5,0 gram setelah dikontrol variabel merokok,
hipertensi dan premature.
• Merokok b= - 236,4 artinya Pada ibu yang merokok berat bayinya akan lebih rendah
sebesar 236,4 gram setelah dikontrol variabel berat badan, hipertensi dan prematur.
• Hipertensi b= -582,5 artinya Pada ibu yang menderita hipertensi,berat bayinya akan
lebih rendah sebesar 582,5 gram setelah dikontrol variabel berat badan ibu,merokok
dan prematur.
THANK
YOU

Anda mungkin juga menyukai