Regresi Linier
(BIVARIAT & Multivariat)
Besral
Fakultas Kesehatan Masyarakat
1 Universitas Indonesia 1
besral@yahoo.com , besral@ui.ac.id Hal-1
Jenis uji statistik yang sering dipakai
Page
2
2
Jenis uji statistik
..
Page
3
3
Korelasi
Menilai hubungan 2 variabel numerik
Contoh:
1. Apakah ada hubungan antara umur
dengan tekanan darah sistolik
2. Apakah ada hubungan antara income
keluarga dengan IP mhs
3. Apakah ada hubungan antara umur
pasien dengan lama hari rawat
4. Apakah ada hubungan antara tinggi badan
(TB) dengan FEV1
500
400
300
200
2. Non-Linier:
- Parabolik 6
- Exponensial
Korelasi
Menilai kekuatan hubungan 2 var numerik:
Pearson’s Coefisien Correlation (r) : Parametrik
Spearman’s Coefisien Correlation (r) : Non-par
Dari nilai r kita dapat menentukan:
a. Kekuatan hubungan (0 s.d 1)
b. Arah hubungan: (+/-)
Kisaran nilai r antara 0 s.d 1:
0,0 = Tidak ada hubungan linier
1,0 = Hubungan linier sempurna
Arah hubungan:
+ (positif) = Hubungan direct:semakin besar nilai X
semakin besar nilai Y
- (negatif) = Hubungan inverse:semakin besar nilai X
Page semakin kecil nilai Y 7
7
INTERPRETASI KOEF.
KORELASI
Kekuatan hubungan: (Subjektif)
r < 0.25 : Sangat lemah
0.25 <= r < 0.5 : Lemah
0.5 <= r <0.75 : Sedang
r >= 0.75 : Kuat
Korelasi tidak selalu berarti hubungan sebab akibat
(causality)
Korelasi yang lemah tidak selalu berarti tidak
adanya hubungan
Korelasi yang kuat tidak selalu berarti adanya garis
lurus
Page
8
8
Korelasi
ASUMSI
Pearson’s Coef. Correlation hanya valid jika asumsi berikut
terpenuhi:
1. Untuk setiap nilai X, Nilai Y terdistribusi
secara normal
2. Untuk setiap nilai Y, Nilai X terdistribusi
secara normal
3. Perkalian antara nilai X dan Y terdistribusi
secara normal (bivariate normal distr.)
10
Regresi Linier
Persamaan Garis Lurus Hubungan var numerik:
Metoda Least Square (Persamaan garis dibuat sedemikian
rupa sehingga jumlah kuadrat dari selisih nilai observasi
dengan nilai pada garis adalah minimum)
Persamaan garis regresi linier:
Yi = a + b1Xi +
500
400
300
200
Page
14
14
Tugas (dari ouput SPSS):
Hubungan TB (cm) dengan Volume Kapasitas Paru
19
ANALISIS MULTIVARIAT
Definisi= Menghubungkan beberapa var independen dng
satu var dependen
Kenapa Perlu Multivariat ?
Pada bidang kesmas:
● outcome/akibat --- tak mungkin penyebab tunggal
● outcome/akibat ---multi faktor
Mis: agent, host & lingk
Untuk menghitung kontribusi murni masing-masing faktor,
setelah mempertimbangkan faktor laindigunakan analis
multivariat
Kegunaan multivariat:
1.Mengetahui pengaruh murni/efek bersih masing-masing variabel
2.Mengetahui faktor yang paling dominan
3. Membuat prediksi (prediksi akurat jika R2>60%)
20
ANALISIS MULTIVARIAT
Untuk mengetahui pengaruh murni/efek bersih :
a. Rancangan Eksperimen: variabel lain dikontrol
(misal: subjeknya tikus dari induk yg sama)
b. Rancangan studi: responden dipilih dengan cara
Matching
(misal: subjeknya dari umur yg sama, sex sama, pendidikan sama,
pekerjaan sama, ekonomi sama, tempat tinggal sama)
c. Pengontrol pada tahap analisis statistik
ANALISIS MULTIVARIAT
2. Metode Interdependensi
: tidak ada var independen dan dependen
: pemetaan/pengelompokan variabel
- numerik : cluster, faktor analisis
- katagorik : Multi dimensional scaling
ANALISIS
MULTIVARIAT
1. Regresi linier Ganda
var dependen = numerik
var independen = numerik dan kategorik
2. Regresi logistik Ganda
var dependen = kategorik
var independen = kategorik dan numerik
3. Regresi Cox Ganda
var dependen = time (survival)
var independen = kategorik dan numerik
23
REGRESI LINIER
Regresi linier
bivariat/sederhana:
Y = a + bx
Regresi linier
multivariat/ganda:
24 Y = a +b1x1 + b2x2 + …. + bnxn
FUNGSI REGRESI LINIER
GANDA
1. Menetapkan model matematik yang paling baik utk
menggambarkan hubungan var. indep dan var dep. Sig <
0,05
2. Menggambarkan hubungan kuantitatif antara var. indep (x)
dng var dep (y) setelah dikontrol var. lain coef.B
3. Mengetahui variabel X yang dominan dlm memprediksi var.
dep Standardized Beta
4. Mengetahui adanya interaksi pada dua atau lebih var.
independen thd variabel dependen
5. Memprediksi var dep (Y) dari beberapa var indep (X)
R2 harus > 60% untuk prediksi yang akurat
25 Asumsi harus terpenuhi
ASUMSI REGRESI LINIER
GANDA
1.HOMOSCEDASTICITY
Varian nilai variabel Y sama untuk semua nilai var. X
Homoscedasticity : Plot residual membentuk tebaran
merata diatas dan dibawah garis tengah nol (tidak ada
pola)
Heteroscedasticity: tebaran residual mengelompok
dibawah/diatas garis tengah nol
2. EKSISTENSI
Var. dep. Y merupakan variabel random pada setiap nilai
var. independen X. Sampel diambil random, asumsi ini
terpenuhi bila residual menunjukan nilai : mean = 0.0
26
ASUMSI REGRESI LINIER
GANDA
3. INDEPENDENSI
Masing-masing var X & Y bebas satu sama lain, tidak boleh
diukur dua kali. Asumsi terpenuhi: angka Durbin Watson
antara -2 s/d 2
4. LINEARITAS
Nilai mean dari var. Y untuk suatu kombinasi X1, X2, dst
terletak pada grs linier yg dibentuk persamaan regresi
Asumsi terpenuhi: hasil Uji Anova regresi hasilnya
signifikan
5. NORMALITAS
Var. Y berdistribusi normal utk setiap pengamatan
27
variabel X. Asumsi terpenuhi bila Grafik Normal P-P plot
residual, titik tebarannya menyebar sekitar garis diagonal.
PEMODELAN REGRESI LINIER
GANDA
“memasukan sebanyak mungkin variabel indep ?”
Banyak variabel hanya aspek statistik
Banyak variabel overfitting, Std.Error terlalu
besar
Lalu ?
Memasukan variabel– ada aspek substansi dan
statistik
Sebaiknya variabel yg masuk sedikit, namun cukup
baik utk menjelaskan hubungannya dng var.
dependen
28
Model yg baik ?
PEMODELAN REGRESI LINIER
GANDA
Langkah :
1. Melakukan seleksi bivariat: bila p value < 0,25 dapat lanjut ke
multivariat. Namun kalau ada var yang secara substansi
penting walaupun p valuenya > 0,25 variabel tsb dapat masuk
ke multivariat (bisa dipaksa masuk jika penting menurut
substansi)
(Metode terkini: Tidak perlu seleksi bivariat)
4. Uji interaksi
Hubungan antara var. indep dan var. dep, berbeda menurut tingkat
var indep yg lain. Penentuan var interaksi pertimbangan
substansi
5. Reliabilitas Model
Sampel di bagi dua, bila kedua sampel menghasil model yg sama,
maka model regresi sudah reliabel
30
Regresi Linier Model
prediksi
Suatu penelitian ingin mengetahui determinan berat bayi (gram) dari variable
UMUR IBU (age) , RAS (race), HIPERTENSI (ht), ADA KELAINAN UTERUS (ui),
ANC (ftv),merokok (smoke), prematur (ptl)
X1 Y
X2
X3
(𝑌 )=𝑎 +𝑏1 𝑥 1 +....+𝑏𝑘 𝑥 𝑘
Misalnya pada penelitian yang bertujuan untuk:
Mengetahui faktor-faktor yang berhubungan dengan
Berat Bayi Lahir (gram) di Kab X tahun 2021
Jenis Pemodelan Regresi Linier
2. Regresi Linier Model FAKTOR RISIKO/Asosiasi
x1 Y
X2
X3
X4
Mis judul penelitian:
Analisis hubungan Rokok dengan Berat Badan bayi lahir di Kab X th 2021
bivariat)
P-value Data LBW.189.SAV
0.219 1. Age-Umur (..th)
0.010 2. lwt-Berat badan (..pound)
0.009 3. smoke-Merokok (Y/N)
0.034 4. ptl-Prematur (…kali)
Berat bayi
0.045 5. ht-Hipertensi (Y/N)
(gram)
0.426 6. ftv-anc (…kali)
0.008 7. Race (White, black, other)
0.000 8. ui-Uterine irritability (Y/N)
1. Model matematis
2.Hubungan kuantitatif
35 3.Paling dominan
SELEKSI VARIABEL :
Analisis`Bivariat dengan Korelasi
Umur = 0,219,
berat ibu=0,010,
anc=0,425,
prematur =0,034.
Variabel anc p
value > 0,25
namun krn secara
substansi penting,
maka variabel anc
lanjut ke
multivariat
36
Bivariat dng uji t
37
Bivariat uji t
38
Pemodelan Multivariat
1. Umur (..th)
2. Berat badan
(..pound)
3. Merokok (Y/N)
4. Prematur (…kali)
5. Hipertensi (Y/N)
6. anc (…kali)
39
Pemodelan Model Summ ary
Adjusted Std. E
Multivariat Model
1
R
.340a
R Square
.116
R Square
.086
a. Predictors: (Constant), No physician visits in fir
the Es
6
trimester,a
Smoking status, History of hypertens
Coefficients
History of premature labor, Age of mother, Weig
mother (pounds)
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2315.862 299.442 7.734 .000
Age of mother 7.162 10.022 .052 .715 .476
Weight of mother
4.793 1.777 .201 2.698 .008
(pounds)
Smoking status -232.253 105.928 -.156 -2.193 .030
History of premature labor -154.002 106.574 -.104 -1.445 .150
History of hypertension -574.230 215.481 -.193 -2.665 .008
No physician visits in first
-2.847 49.705 -.004 -.057 .954
trimester
a. Dependent Variable: Birth weight (gram)
Tahap berikutnya, evaluasi seleksi variabel dengan batas p value < 0,05
Dari nilai p diatas, variabel umur, prematur, anc memiliki p value > 0,05
shg harus keluar dari model.
ANC memiliki P-value yg tertinggi, maka dikeluarkan terlebih dahulu
40
Pemodelan Model Summary
Multivariat Model
1
R
.336a
R Square
.113
R Square
.094
the Estima
694.0
a. Predictors: (Constant), History of hypertension,
Smoking status, History of premature labor, Weight
mother (pounds)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026
History of premature labor -145.412 105.417 -.098 -1.379 .169
History of hypertension -582.566 213.148 -.195 -2.733 .007
a. Dependent Variable: Birth weight (gram)
44
Model Summary
Model Adjusted Std. Error
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2390.105 230.391 10.374 .000
Weight of mother
5.352 1.710 .224 3.130 .002
(pounds)
Smoking status -263.009 103.812 -.177 -2.534 .012
History of hypertension -586.722 213.646 -.197 -2.746 .007
a. Dependent Variable: Birth weight (gram)
Dari hasil analisis ternyata tidak ada lagi yang p value-nya > 0,05 dengan
demikian proses pencarian variabel yang masuk dalam model telah selesai
dan model yang terakhir adalah sbb, setelah prematur dimasukkan kembali:
46
Model
Model Summaryb
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
1. Model matematis
2.Hubungan kuantitatif
47 3.Paling dominan
Model Coefficientsa Model Summaryb
Unstandardized Coeffi
hypertension, Smoking status, Weight of mother (pounds) Collinearity
Mo b.Coefficients cients
Dependent Variable: Birth weight (gram)
Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
1. Model matematis
Birth weight (gr) = .2449.1 + 5.03*BB_ibu (pound) – 236*Merokok –
582*Hipertensi
Unstandardized Coeffi
hypertension, Smoking status, Weight of mother (pounds) Collinearity
Mo b.Coefficients cients
Dependent Variable: Birth weight (gram)
Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Untuk mengetahui asumsi ini dilakukan uji Durbin Watson, bila nilai
Durbin berkisar –2 s.d +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Dari hasil uji didapatkan koefisien Durbin Watson 1,452, berarti asumsi independensi terpenuhi.
52
3. Asumsi liniearitas
Nilai mean dari variabel Y untuk suatu kombinasi X 1, X2, X3, …, Xk
terletak pada garis/bidang linier yang dibentuk dari persamaan regresi.
Untuk mengetahui asumsi linieritas dapat
diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value<alpha) maka
moodel berbentuk linier. Hasil uji asumsi :
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 11291987 4 2822996.778 5.861 .000a
Residual 88625066 184 481657.965
Total 99917053 188
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking
status, Weight of mother (pounds)
b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,000, berarti asumsi linearitas terpenuhi
53
4. Asumsi homoscedascity
Analisa scatter-plot antara Nilai prediksi
standar (ZPRED) dengan nilai residu
standar (ZRESID) Scatterplot
R e g r e s s io n S t u d e n t iz e d R e s id u a l
-1
-2
-3
-4
-3 -2 -1 0 1 2 3
Histogram memperlihatkan distribusi normal & pada P-P plot nilai residual
berhimpit dengan garis diagonal
55 Kedua grafik tersebut menggambarkan asumsi Normalitas terpenuhi
6. Diagostik Multicollinearity
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan
demikian tidak ada Multicollinearity antara sesama variabel indepeden
Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi
sehingga model dapat digunakan untuk memprediksi berat badan bayi.
56
Model Summaryb
Berat
BeratBayi
Bayi==2449,1+5,0
2449,1+5,0Lwt
Lwt––236,4
236,4smoke
smoke--582Hi
582Hi––145,4
145,4Ptl
Ptl
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi ,
57
namun model ini hanya dapat menjelaskan 11,3% variasi pada berat bayi, 88,7%
lagi ditentukan oleh variabel lain yang tidak diteliti
Interpretasi
Berat
BeratBayi
Bayi==2449,1+5,0
2449,1+5,0Lwt
Lwt––236,4
236,4smoke
smoke--582Hi
582Hi––145,4
145,4Ptl
Ptl
- Setiap kenaikan berat badan ibu sebesar 1 pound, maka berat badan bayi akan naik
sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi dan prematur
- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4 gram setelah
dikontrol variabel berat badan, hipertensi dan prematur.
- Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah sebesar 582,5
gram setelah dikontrol variabel berat badan ibu,merokok dan prematur.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar
peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat badan bayi).
Semakin besar nilai beta semakin besar pengaruh nya terhadap variabel
dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya
terhadap berat badan bayi adalah berat badan ibu..
58
TUGAS: REGRESI LINIER
1. Age-Umur (..th)
2. lwt-Berat badan (..pound)
3. smoke-Merokok (Y/N)
4. ptl-Prematur (…kali) Berat bayi
5. ht-Hipertensi (Y/N) (gram)
6. ftv-anc (…kali)
7. Race (White, black, other)
8. ui-Uterine irritability (Y/N)
60
61
Besral
Departemen Biostatistika dan Kependudukan
Fakultas Kesehatan Masyarakat , Universitas Indonesia
Telp: 0812.8257.5200, Email: besral@yahoo.com , besral@ui.ac.id
Hal-61