Pokok Bahasan;
Pengenalan regresi linier ganda
Menyeleksi variabel
b) Berat badan bayi baru lahir tidak hanya berhubungan dengan usia ibu
namun ada variabel lain yang mempengaruhi misalnya berat badan ibu
(saat menstruasi terakhir), riwayat hipertensi, jumlah kunjungan ke
tenaga kesehatan dan varibel lain yang secara substansi memiliki
keterkaitan dengan variabel dependen (berat badan bayi baru lahir).
• Persamaan garis Regresi Linier ganda (multiple linier regression), yaitu;
Keterangan:
y = variabel dependen
a = konstanta
b = koefisien regresi
x = variabel independen
SELEKSI
VARIABEL INDEPENDEN
Regresi Linier Ganda
Dalam menentukan variabel independen untuk dapat masuk
dalam suatu persamaan garis linier ganda yang perlu
diperhatikan 2 hal yaitu;
1). Seleksi
bivariat.
Uji statistik yang sesuai dengan jenis data.
Variabel yang masuk ke tahap berikutnya adalah yang memiliki p-value < 0,25.
hubungan dengan variabel independen maka apabila nilai p-value > 0,25 tetap
dicoba dimasukkan ke tahap berikutnya.
Note: sebelum melakukan seleksi variabel seluruh data yang kontinu harus
memenuhi distribusi normal, terutama variabel independen.
Ditunjukkan oleh nilai p-value Kolmogorov Smirnov > 0,05
Regresi Linier Ganda
Seleksi multivariat.
2)
Lakukan uji regresi linier secara bersamaan seluruh variabel independen yang telah
Variabel yang memenuhi syarat untuk ketahap berikutnya yaitu variabel dependen
dengan nilai p-value kurang dari 0,05.
Variabel dengan nilai p-value lebih besar dari 0,05 dikeluarkan satu per satu dari
kandidat variabel independen, dimulai dengan variabel independen yang memiliki p-
value yang paling besar.
Eksistensi;
Variabel dependen Y merupakan variabel random pada setiap variabel X.
Sampel diambil secara random, asumsi ini terpenuhi bila residual menunjukan
nilai mean 0 dan memiliki nilai standar deviasi.
Regresi Linier Ganda
Independensi;
Masing-masing variabel Y bebas satu sama lain, tidak boleh diukur 2 kali. Asumsi terpenuhi bila angka
Durbin Watson antara -2 s.d +2
Liniearitas;
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3 dst terletak pada garis linier yang
dibentuk oleh persamaan garis regresi. Asumsi ini terpenuhi apabila hasil uji Anova regresi signifikan.
Gauss/Normalitas
Varibel Y berdistribusi normal untuk setiap pengamatan variabel X. Asumsi ini terpenuhi bila grafik
normal P-P plot residual titik tebarannya menyebar di sekitar garis diagonal.
Regresi Linier Ganda
b. Menguji adanya multicollinearity antar variabel independen.
Multicollinearity adalah untuk mengetahui apakah antar variabel independen
memiliki korelasi yang kuat, yaitu bila nilai r>= 0,8 atau nilai Vif > 10.
Analisis interaksi
4)
Reliabilitas model
5)
Sampel dibagai menjadi 2, apabila kedua sampel menghasilkan model yang sama
maka model (persamaan garis) regresi reliabel.
CONTOH SOAL
Regresi Linier Ganda
Data kategorik
Analisis bivariat
• Status merokok Berat Badan Bayi
apa yang
• Riwayat hipertensi
digunakan ???
Status merokok :0= tidak merokok
1= merokok
Riwayat hipertensi: 0= tiak ada riwayat hipertensi
1 = ada riwayat hipertensi
Regresi Linier Ganda
Bivariat 1 -- Analisis Korelasi (r)
Lakukan analisis korelasi antara variabel independen
berat badan ibu dan umur ibu terhadap berat badan bayi,
dengan langkah sebagai berikut;
Analyze >> Correlate >> Bivariat
Interpretasi:Nilai p-value status merokok dan riwayat hipertensi terhadap berat badan
bayi <0,25 maka dapat dimasukkan ke analisis berikutnya.
Regresi Linier Ganda
2. Seleksi Multivariat
Lakukan analisis regresi antara seluruh variabel independen
(terseleksi) terhadap variabel dependen berat badan bayi dengan
nilai p-value < 0,05 langkahnya adalah sebagai berikut;
Analyze >> Regression >> Linier
variabel berat badan bayi Dependent
variabel independen independent(s)
Interpretasi: p-value dengan nilai lebih dari 0,05 dikeluarkan 1 per 1 dimulai dari p-
value dengan nilai terbesar dengan memperhatikan perubahan koefisien sebelum dan
setelah variabel tersebut dikeluarkan. Pada output ini hanya 1 umur ibu dikeluarkan.
Output setelah variabel umur ibu
Perhatikan perubahan
dikeluarkan R²=10,4%
Interpretasi: Setelah umur ibu dikeluarkan nilai p-value tidak ada yang lebih
dari 0,05, cek perubahan koefisien variabel untuk mengetahui apakah age
confounding...
Regresi Linier Ganda
Apakah umur ibu confounding, cek koefisien masing-masing
variabel.
No. Variabel Sebelum Setelah Perubahan
keluar keluar
1 Berat badan ibu 5,168 5,352 -3,56%
2 Status merokok -260,924 -263,009 -0,79%
3 Riwayat hipertensi -579,453 -586,722 -1,25%
Tidak ada koefisien yang berubah lebih dari 10%, maka umur ibu
tetap dikeluarkan, sehingga model regresi terakhir memuat 3
variabel independen yaitu berat badan ibu, status merokok
dan riwayat hipertensi.
UJI ASUMSI
Regresi Linier Ganda
Dengan menggunakan SPSS, langkah-langkahnya adalah;
Analyze >> regression >> linier
Masukkan berat badan bayi ke var. Dependen
Masukkan berat badan ibu, status merokok dan riwayat hipertensi
ke var. Independen
Klik tombol statistic>> estimates>> covariance matrix>> model fit
>> collinearity diagnostics>> Durbin watson
Klik tombol plot>> masukkan sresid ke kotak Y dan zpred ke
kotak ke kotak X klik histogram dan normal probability plot.
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3..... Terletak
pada garis linier yang dibentuk oleh persamaan regresi. P-value signifikan
model berbentuk linier.
Asumsi Normalitas
Deteksi Multicollinearity
KERANGKA KONSEP
- STATUS MEROKOK IBU
Berat Badan Bayi Lahir
- RIWAYAT HIPERTENSI
IBU
Interpretasikan nilai ;
a. Intercept
b. Koefisien variabel smoke
c.Koefisien variabel hipertensi
Bwt= 3080,988 -279,7948*(smoke) - 427,6566*(ht)
Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
Pertanyaan:
Jika bisa dengan t-test mengapa perlu
dilkuakan regresi ???