Anda di halaman 1dari 61

Korelasi &

Regresi Linier
(BIVARIAT & Multivariat)

 Besral
 Fakultas Kesehatan Masyarakat
1 Universitas Indonesia 1
 besral@yahoo.com , besral@ui.ac.id Hal-1
Jenis uji statistik yang sering dipakai

Page
2
2
Jenis uji statistik
..

Berat badan sebelum (kg)  Berat sesudah (kg) T-test paired/dependen


.

Page
3
3
Korelasi
Menilai hubungan 2 variabel numerik
Contoh:
1. Apakah ada hubungan antara umur
dengan tekanan darah sistolik
2. Apakah ada hubungan antara income
keluarga dengan IP mhs
3. Apakah ada hubungan antara umur
pasien dengan lama hari rawat
4. Apakah ada hubungan antara tinggi badan
(TB) dengan FEV1

Diagram tebar (scatter-plot)


Sumbu X  Variabel Independen
Page
Sumbu Y  Variabel Dependen
4
4
Diagram tebar & garis regresi
Diagram tinggi badan dan kapasitas paru (FEV1)
600
Force expiratoty volume in 1 min (ml)

500

400

300

200

Yi  719,14  6,43 X i


100
140 150 160 170 180 190 200

Page height (cm) 5


5
Korelasi
 Pola hubungan antara 2
variabel numerik
1. Linier:
- Positif
- Negatif

2. Non-Linier:
- Parabolik 6
- Exponensial
Korelasi
Menilai kekuatan hubungan 2 var numerik:
 Pearson’s Coefisien Correlation (r) : Parametrik
 Spearman’s Coefisien Correlation (r) : Non-par
Dari nilai r kita dapat menentukan:
a. Kekuatan hubungan (0 s.d 1)
b. Arah hubungan: (+/-)
Kisaran nilai r antara 0 s.d 1:
0,0 = Tidak ada hubungan linier
1,0 = Hubungan linier sempurna
Arah hubungan:
+ (positif) = Hubungan direct:semakin besar nilai X
semakin besar nilai Y
 - (negatif) = Hubungan inverse:semakin besar nilai X
Page semakin kecil nilai Y 7
7
INTERPRETASI KOEF.
KORELASI
Kekuatan hubungan: (Subjektif)
r < 0.25 : Sangat lemah
0.25 <= r < 0.5 : Lemah
0.5 <= r <0.75 : Sedang
r >= 0.75 : Kuat
Korelasi tidak selalu berarti hubungan sebab akibat
(causality)
Korelasi yang lemah tidak selalu berarti tidak
adanya hubungan
Korelasi yang kuat tidak selalu berarti adanya garis
lurus
Page
8
8
Korelasi
ASUMSI
Pearson’s Coef. Correlation hanya valid jika asumsi berikut
terpenuhi:
1. Untuk setiap nilai X, Nilai Y terdistribusi
secara normal
2. Untuk setiap nilai Y, Nilai X terdistribusi
secara normal
3. Perkalian antara nilai X dan Y terdistribusi
secara normal (bivariate normal distr.)

Koefisien Determinasi (r2):


Melihat besarnya variasi variabel Y (dalam persen) yang
dapat dijelaskan oleh variabel X.
Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi nilai Y
Page
9
dapat dijelaskan oleh variabel X 9
Korelasi vs Regresi
Korelasi = Kekuatan Hubungan
r < 0.25 : Sangat lemah
0.25 <= r < 0.5 : Lemah
0.5 <= r <0.75 : Sedang
r >= 0.75 : Kuat
Regresi (Linier) = Persamaan Garis (lurus)
Y = a + b*X (bivariat)

Y = a + b1*X1 + b2*X2 +… (multivariat)

10
Regresi Linier
Persamaan Garis Lurus Hubungan var numerik:
 Metoda Least Square (Persamaan garis dibuat sedemikian
rupa sehingga jumlah kuadrat dari selisih nilai observasi
dengan nilai pada garis adalah minimum)
Persamaan garis regresi linier:
Yi = a + b1Xi + 

Yi adalah nilai Y yang diprediksi


a adalah intercept dan b1 adalah slope
a adalah posisi dimana garis regresi memotong sumbu y
b1 mengukur kemiringan garis = koefisien regresi
Nilai Y meningkat sebesar b1 unit untuk setiap kenaikan nilai
X sebesar 1 unit 11
Regresi Linier
Memprediksi nilai Y dari X:
1. Berapa tekanan darah sistolik, jika umur = 50 th
2. Berapa lama hari rawat, jika pasien berumur 40 th
3. Berapa level FEV1 pada orang dengan TB=170 cm

Asumsi pada regresi linier:


1. Nilai mean dari Y adalah fungsi garis lurus (linierity) dari X
 Yi = a + b1Xi + 
2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X
(normality)
3. Varian Y adalah sama untuk setiap nilai X (homoscedasticity)
4. Nilai X dan Y adalah tidak saling berkait (independency)
5.Var. Y merupakan variabel random pada setiap nilai var. X
(existency)
12
Diagram tebar & garis regresi
Diagram tinggi badan dan kapasitas paru (FEV1)
600
Force expiratoty volume in 1 min (ml)

500

400

300

200

Yi  719,14  6,43 X i


100
140 150 160 170 180 190 200

Page height (cm) 13


13
Ouput SPSS: Hubungan TB (cm) dengan
Volume Kapasitas Paru

Page
14
14
Tugas (dari ouput SPSS):
Hubungan TB (cm) dengan Volume Kapasitas Paru

1. Berapa Koef.Korelasi? – Interpretasikan?


2. Berapa Koef.Determinasi? –
Interpretasikan?
3. Buat persamaan Regresi Liniernya
4. Berapa Koef.Regresi? Interpretasikan?
5. Hitunglah berapa kapasitas parunya, jika:
a. Seseorang memiliki TB 145cm.
b. Seseorang memiliki TB 175cm. 15
Jawaban-Tugas (dari ouput SPSS):
Hubungan TB (cm) dengan Volume Kapasitas Paru

1. Berapa Koef.Korelasi? (0.739)– Korelasi Sedang


2. Berapa Koef.Determinasi? (54.6%)– Tinggi badan
dapat menjelaskan 54,6% variasi FEV (kapasitas
paru)
3. Buat persamaan Regresi Linier: Y = -719.13 +
6.43*(TB)
4. Koef.Regresi? (6.43) – Setiap penambahan 1 cm TB
akan meningkatkan 6,43 ml kapasitas paru
5. Hitunglah berapa kapasitas parunya, jika:
a. Seseorang memiliki TB 145cm = - 719.13 +
6.43(145) 16
Regresi Linier
Multivariat
17 17
Hal-17
Uji Statistik Bivariat:
 Uji statistik bivariat hanya akurat bila
subjek yang ingin dibandingkan adalah
homogen, yaitu pada studi eksperimen di
laboratorium, dimana variabel perancu
tidak ada lagi.
 Misalnya: subjek adalah tikus satu-ibu satu-
bapak. Subjek sudah homogen. Yang berbeda
hanyalah: satu kelompok dapat perlakuan
(intervensi), yang satu lagi tidak dapat
perlakukan (kontrol)
18
Uji Statistik Multivariat:
 Pada penelitian survei di masyarakat, tidak mungkin
subjeknya homogen (umurnya sama, pendidikan sama,
pengetahuan sama, pekerjaan sama, sosek sama, jumlah anak
sama, status gizi sama, penyakitnya sama), yang berbeda
hanyalah variabel yang ingin kita uji (misalnya ANEMIA
dan TIDAK Anemia), untuk mengetahui efeknya
terhadap BBLR.
 Karena tidak homogen, maka kita harus mengontrol

(pada saat disain studi atau saat analisis data)


semua variabel yang berpengaruh melalui
analisis multivariat

19
ANALISIS MULTIVARIAT
Definisi= Menghubungkan beberapa var independen dng
satu var dependen
Kenapa Perlu Multivariat ?
Pada bidang kesmas:
● outcome/akibat --- tak mungkin penyebab tunggal
● outcome/akibat ---multi faktor
Mis: agent, host & lingk
Untuk menghitung kontribusi murni masing-masing faktor,
setelah mempertimbangkan faktor laindigunakan analis
multivariat
Kegunaan multivariat:
1.Mengetahui pengaruh murni/efek bersih masing-masing variabel
2.Mengetahui faktor yang paling dominan
3. Membuat prediksi (prediksi akurat jika R2>60%)

20
ANALISIS MULTIVARIAT
Untuk mengetahui pengaruh murni/efek bersih :
a. Rancangan Eksperimen: variabel lain dikontrol
(misal: subjeknya tikus dari induk yg sama)
b. Rancangan studi: responden dipilih dengan cara
Matching
(misal: subjeknya dari umur yg sama, sex sama, pendidikan sama,
pekerjaan sama, ekonomi sama, tempat tinggal sama)
c. Pengontrol pada tahap analisis statistik 
ANALISIS MULTIVARIAT

Syarat kecukupan sampel pd analisis multivariat:


Satu variabel = 15 kejadian
Jika ada 10 variabel  150 kejadian/kasus + 150 control =
300
21
Jenis Analisis Multivariat
1. Metode Dependensi: (independen  dependen)
A. dependen satu variabel
- numerik : regresi linier ganda
- katagorik : regresi Logistik ganda
B. dependen beberapa variabel
- numerik : Manova, GLM-repeated
- kategorik : Kanonikal

2. Metode Interdependensi
: tidak ada var independen dan dependen
: pemetaan/pengelompokan variabel
- numerik : cluster, faktor analisis
- katagorik : Multi dimensional scaling
ANALISIS
MULTIVARIAT
1. Regresi linier Ganda
var dependen = numerik
var independen = numerik dan kategorik
2. Regresi logistik Ganda
var dependen = kategorik
var independen = kategorik dan numerik
3. Regresi Cox Ganda
var dependen = time (survival)
var independen = kategorik dan numerik

23
REGRESI LINIER
Regresi linier
bivariat/sederhana:
Y = a + bx

Regresi linier
multivariat/ganda:
24 Y = a +b1x1 + b2x2 + …. + bnxn
FUNGSI REGRESI LINIER
GANDA
1. Menetapkan model matematik yang paling baik utk
menggambarkan hubungan var. indep dan var dep.  Sig <
0,05
2. Menggambarkan hubungan kuantitatif antara var. indep (x)
dng var dep (y) setelah dikontrol var. lain  coef.B
3. Mengetahui variabel X yang dominan dlm memprediksi var.
dep  Standardized Beta
4. Mengetahui adanya interaksi pada dua atau lebih var.
independen thd variabel dependen
5. Memprediksi var dep (Y) dari beberapa var indep (X)
 R2 harus > 60% untuk prediksi yang akurat
25  Asumsi harus terpenuhi
ASUMSI REGRESI LINIER
GANDA
1.HOMOSCEDASTICITY
Varian nilai variabel Y sama untuk semua nilai var. X
Homoscedasticity : Plot residual membentuk tebaran
merata diatas dan dibawah garis tengah nol (tidak ada
pola)
Heteroscedasticity: tebaran residual mengelompok
dibawah/diatas garis tengah nol

2. EKSISTENSI
Var. dep. Y merupakan variabel random pada setiap nilai
var. independen X. Sampel diambil random, asumsi ini
terpenuhi bila residual menunjukan nilai : mean = 0.0
26
ASUMSI REGRESI LINIER
GANDA
3. INDEPENDENSI
Masing-masing var X & Y bebas satu sama lain, tidak boleh
diukur dua kali. Asumsi terpenuhi: angka Durbin Watson
antara -2 s/d 2
4. LINEARITAS
Nilai mean dari var. Y untuk suatu kombinasi X1, X2, dst
terletak pada grs linier yg dibentuk persamaan regresi
Asumsi terpenuhi: hasil Uji Anova regresi hasilnya
signifikan
5. NORMALITAS
Var. Y berdistribusi normal utk setiap pengamatan
27
variabel X. Asumsi terpenuhi bila Grafik Normal P-P plot
residual, titik tebarannya menyebar sekitar garis diagonal.
PEMODELAN REGRESI LINIER
GANDA
“memasukan sebanyak mungkin variabel indep ?”
 Banyak variabel  hanya aspek statistik
 Banyak variabel  overfitting, Std.Error terlalu
besar

Lalu ?
 Memasukan variabel– ada aspek substansi dan
statistik
 Sebaiknya variabel yg masuk sedikit, namun cukup
baik utk menjelaskan hubungannya dng var.
dependen
28
Model yg baik ?
PEMODELAN REGRESI LINIER
GANDA
Langkah :
1. Melakukan seleksi bivariat: bila p value < 0,25 dapat lanjut ke
multivariat. Namun kalau ada var yang secara substansi
penting walaupun p valuenya > 0,25 variabel tsb dapat masuk
ke multivariat (bisa dipaksa masuk jika penting menurut
substansi)
(Metode terkini: Tidak perlu seleksi bivariat)

2. Melakukan pemodelan multivariat: Memasukkan secara


bersamaan seluruh var indep ke model multivariat. Variabel
yang p valuenya besar dikeluarkan dari model multivariat satu
per satu.
Ketentuannya:
- Variabel yg p valuenya < 0,05 tetap dalam model.
- Variabel yg p valuenya > 0,05 dikeluarkan dari model satu
persatu, dimulai dari variabel yg p valuenya terbesar. (untuk
var dg kategori lebih dari satu, lihat p value terkecil)
29 - Bila var yg dikeluarkan tsb mengakibatkan perubahan besar
PEMODELAN REGRESI LINIER
GANDA
3.Melakukan uji Diagnostik pemenuhan asumsi regresi linier
a. Pengujian asumsi, termasuk
b. Pengujian Kolinearitas, antar independen terjadi hub yg
sangat kuat : r ≥ 0,8. Atau nilai VIF > 10

4. Uji interaksi
Hubungan antara var. indep dan var. dep, berbeda menurut tingkat
var indep yg lain. Penentuan var interaksi  pertimbangan
substansi

5. Reliabilitas Model
Sampel di bagi dua, bila kedua sampel menghasil model yg sama,
maka model regresi sudah reliabel
30
Regresi Linier Model
prediksi
Suatu penelitian ingin mengetahui determinan berat bayi (gram) dari variable
UMUR IBU (age) , RAS (race), HIPERTENSI (ht), ADA KELAINAN UTERUS (ui),
ANC (ftv),merokok (smoke), prematur (ptl)

Umur (age) …..year


Berat (lwt) …..pound
Anc (ftv) …..times Berat bayi
Prematur (ptl) …..times (gram)
Ras (race) White,Black,Other
Hipertensi (ht): (Y/N)
Uterus (ui): (Y/N)
Merokok (smoke) (Y/N)
ANALISIS MULTIVARIAT
Jenis Pemodelan Regresi Linier
1. Regresi Linier Model Prediksi
Model yg terdiri beberapa variabel independen yg dianggap terbaik untuk
memprediksi kejadian variabel dependen

X1 Y
X2
X3  
(𝑌 )=𝑎 +𝑏1 𝑥 1 +....+𝑏𝑘 𝑥 𝑘
Misalnya pada penelitian yang bertujuan untuk:
Mengetahui faktor-faktor yang berhubungan dengan
Berat Bayi Lahir (gram) di Kab X tahun 2021
Jenis Pemodelan Regresi Linier
2. Regresi Linier Model FAKTOR RISIKO/Asosiasi

Model dng tujuan mengetahui hubungan satu variabel independen (X)


dengan kejadian variabel dependen (Y) dengan mengontrol beberapa
variabel confounding/covariat/perancu

x1 Y

X2
X3
X4
Mis judul penelitian:
Analisis hubungan Rokok dengan Berat Badan bayi lahir di Kab X th 2021
bivariat)
P-value Data LBW.189.SAV
0.219 1. Age-Umur (..th)
0.010 2. lwt-Berat badan (..pound)
0.009 3. smoke-Merokok (Y/N)
0.034 4. ptl-Prematur (…kali)
Berat bayi
0.045 5. ht-Hipertensi (Y/N)
(gram)
0.426 6. ftv-anc (…kali)
0.008 7. Race (White, black, other)
0.000 8. ui-Uterine irritability (Y/N)
1. Model matematis
2.Hubungan kuantitatif
35 3.Paling dominan
SELEKSI VARIABEL :
Analisis`Bivariat dengan Korelasi

Umur = 0,219,
berat ibu=0,010,
anc=0,425,
prematur =0,034.

Variabel anc p
value > 0,25
namun krn secara
substansi penting,
maka variabel anc
lanjut ke
multivariat

36
Bivariat dng uji t

Hasil p value merokok = 0,009, p value < 0,25 berarti


masuk ke multivariat

37
Bivariat uji t

P value hipertensi = 0,045, p value < 0,25 maka lanjut


ke multivariat

38
Pemodelan Multivariat

1. Umur (..th)
2. Berat badan
(..pound)
3. Merokok (Y/N)
4. Prematur (…kali)
5. Hipertensi (Y/N)
6. anc (…kali)

39
Pemodelan Model Summ ary

Adjusted Std. E

Multivariat Model
1
R
.340a
R Square
.116
R Square
.086
a. Predictors: (Constant), No physician visits in fir
the Es
6

trimester,a
Smoking status, History of hypertens
Coefficients
History of premature labor, Age of mother, Weig
mother (pounds)
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2315.862 299.442 7.734 .000
Age of mother 7.162 10.022 .052 .715 .476
Weight of mother
4.793 1.777 .201 2.698 .008
(pounds)
Smoking status -232.253 105.928 -.156 -2.193 .030
History of premature labor -154.002 106.574 -.104 -1.445 .150
History of hypertension -574.230 215.481 -.193 -2.665 .008
No physician visits in first
-2.847 49.705 -.004 -.057 .954
trimester
a. Dependent Variable: Birth weight (gram)

Tahap berikutnya, evaluasi seleksi variabel dengan batas p value < 0,05
Dari nilai p diatas, variabel umur, prematur, anc memiliki p value > 0,05
shg harus keluar dari model.
ANC memiliki P-value yg tertinggi, maka dikeluarkan terlebih dahulu
40
Pemodelan Model Summary

Multivariat Model R R Square


Adjusted
R Square
Std. Error of
the Estimate
1 .340a .116 .091 694.929
a. Predictors: (Constant), History of hypertension,
Smokinga status, Age of mother, History of premature
Coefficients
labor, Weight of mother (pounds)
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
(Constant) 2317.608 297.074 7.801 .000
Age of mother 7.051 9.807 .051 .719 .473
Weight of mother
4.781 1.759 .201 2.718 .007
(pounds)
Smoking status -232.224 105.638 -.156 -2.198 .029
History of premature labor -153.747 106.191 -.104 -1.448 .149
History of hypertension -573.011 213.841 -.192 -2.680 .008
pendent Variable: Birth weight (gram)

Setelah anc keluar terlihat R square tdk berubah,


dan Coef B Untuk variabel lain juga tak berubah ( > 10 %)
41
Perubahan coef. B
Variabel Anc msih Anc perubahan
ada dikeluarkan Coef. B
Age 7,1 7,0 1,4 %
bwt 4,7 4,7 0%
smoke -232,2 -232,2 0%
ptl -154,0 153,7 0,1 %
hi -574,2 573,0 0,1 %
ftv -2,8 -

Koefisien B tidak ada yang berubah > 10 %


sehingga variabel anc dikeluarkan dari model

Tahap selanjutnya variabel umur dikeluarkan dari model


42
Pemodelan Model Summary

Adjusted Std. Error

Multivariat Model
1
R
.336a
R Square
.113
R Square
.094
the Estima
694.0
a. Predictors: (Constant), History of hypertension,
Smoking status, History of premature labor, Weight
mother (pounds)
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026
History of premature labor -145.412 105.417 -.098 -1.379 .169
History of hypertension -582.566 213.148 -.195 -2.733 .007
a. Dependent Variable: Birth weight (gram)

Setelah umur keluar, ternyata R Square berubah sedikit, dari


0,116 menjadi 0,113.
43
Untuk koefisien B perubahannya sbb:
Perubahan nilai coef. B
Variabel Masih umur perubahan Coef.
lengkap dikeluarkan
Age 7,1 - -
bwt 4,7 5,0 6,3 %
smoke -232,2 -236,4 1,8 %
ptl -154,0 145,4 5,6 %
hi -574,2 582,5 1,5 %
ftv -2,847 -

Dari hasil perhitungan perubahan coef.B


Ternyata tidak ada yang lebih dari 10 %, dengan
demikian variabel umur dikeluarkan dari model.

Langkah selanjutnya mengeluarkan riwayat prematur

44
Model Summary
Model Adjusted Std. Error

tanpa prematur Model


1
R
.322a
R Square
.104
R Square
.089
the Estima
695.70
a. Predictors: (Constant), History of hypertension,
Smoking status, Weight of mother (pounds)

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2390.105 230.391 10.374 .000
Weight of mother
5.352 1.710 .224 3.130 .002
(pounds)
Smoking status -263.009 103.812 -.177 -2.534 .012
History of hypertension -586.722 213.646 -.197 -2.746 .007
a. Dependent Variable: Birth weight (gram)

R square berubah dari 0,113 menjadi 0,104.

Sedangkan untuk koef B perubahannya sbb:


45
Variabel Masih Prematur perubahan
lengkap keluar Coef.B
Age 7,1 - -
Perubahan bwt 4,7 5,3 11,7 %
smoke -232,2 -236,4 13,2 %
nilai coef. ptl -154,0 - -
hi -574,2 582,5 2,2 %
ftv -2,847 -

Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coef.B


pada variabel berat ibu (bwt) berubah sebesar 11,7 % dan smoke berubah
13,2%, dengan demikian riwayat prematur mempengaruhi hubungan antara
Berat ibu dg berat bayi, dan hubungan antara smoke dg berat bayi.
Riwayat prematur merupakan KONFOUNDING, harus masuk
kembali ke dalam model

Dari hasil analisis ternyata tidak ada lagi yang p value-nya > 0,05 dengan
demikian proses pencarian variabel yang masuk dalam model telah selesai
dan model yang terakhir adalah sbb, setelah prematur dimasukkan kembali:
46
Model
Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
Akhir 1 .336a .113 .094 694.016
a. Predictors: (Constant), History of premature labor, History of
.222

hypertension, Smoking status, Weight of mother (pounds)


b. Dependent Variable: Birth weight (gram)

Coefficientsa

Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
1. Model matematis
2.Hubungan kuantitatif
47 3.Paling dominan
Model Coefficientsa Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square
Stand R Square the Estimate Watson
Akhir 1 .336 a .113
ardize
a. Predictors: (Constant), History
d
.094 694.016
of premature labor, History of
.222

Unstandardized Coeffi
hypertension, Smoking status, Weight of mother (pounds) Collinearity
Mo b.Coefficients cients
Dependent Variable: Birth weight (gram)
Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)

1. Model matematis
Birth weight (gr) = .2449.1 + 5.03*BB_ibu (pound) – 236*Merokok –
582*Hipertensi

2.a Hubungan kuantitatif (BB_ibu)


Kenaikan BB_ibu (1-pound) akan meningkatkan BB-bayi 5.03 gram
Model Coefficientsa Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square
Stand R Square the Estimate Watson
Akhir 1 .336 a .113
ardize
a. Predictors: (Constant), History
d
.094 694.016
of premature labor, History of
.222

Unstandardized Coeffi
hypertension, Smoking status, Weight of mother (pounds) Collinearity
Mo b.Coefficients cients
Dependent Variable: Birth weight (gram)
Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)

2.b Hubungan kuantitatif (Smoking, 0=Tdk, 1=Ya)


Pada ibu perokok, rerata BB_bayinya lebih rendah 236 gram dibanding
ibu tidak perokok

2.c Hubungan kuantitatif (Hipertensi, 0=Tdk, 1=Ya)


Pada ibu hiptertensi, rerata BB_bayinya lebih rendah 582 gram
dibanding ibu tidak hipertensi
Model
Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
Akhir 1 .336a .113 .094 694.016
a. Predictors: (Constant), History of premature labor, History of
.222

hypertension, Smoking status, Weight of mother (pounds)


b. Dependent Variable: Birth weight (gram)

Coefficientsa

Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)

3.Paling dominan berhubungan dengan B-bayi adalah BB-ibu


50
Uji asumsi
Setelah didapatkan model yang parsimony, maka
1. Eksistensi harus dilakukan pengujian terhadap asumsi regresi
linier ganda

Hasil dari output diatas menunjukkan angka residual


dengan mean 0,000 Dengan demikian asumsi Eksistensi
terpenuhi
51
2. Asumsi Independensi

Suatu keadaan dimana


masing-masing nilai Y
bebas satu sama lain.

Untuk mengetahui asumsi ini dilakukan uji Durbin Watson, bila nilai
Durbin berkisar –2 s.d +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi

Dari hasil uji didapatkan koefisien Durbin Watson 1,452, berarti asumsi independensi terpenuhi.
52
3. Asumsi liniearitas
Nilai mean dari variabel Y untuk suatu kombinasi X 1, X2, X3, …, Xk
terletak pada garis/bidang linier yang dibentuk dari persamaan regresi.
Untuk mengetahui asumsi linieritas dapat
diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value<alpha) maka
moodel berbentuk linier. Hasil uji asumsi :

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 11291987 4 2822996.778 5.861 .000a
Residual 88625066 184 481657.965
Total 99917053 188
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking
status, Weight of mother (pounds)
b. Dependent Variable: Birth weight (gram)

Dari output diatas menghasilkan uji anova 0,000, berarti asumsi linearitas terpenuhi
53
4. Asumsi homoscedascity
Analisa scatter-plot antara Nilai prediksi
standar (ZPRED) dengan nilai residu
standar (ZRESID) Scatterplot
R e g r e s s io n S t u d e n t iz e d R e s id u a l

Dependent Variable: Birth weight (gram)

-1

-2

-3

-4

-3 -2 -1 0 1 2 3

Regression Standardized Predicted Value

Dari hasil plot diatas terlihat tebaran titik mempunyai pola


tertentu, titik-titik menyebar diatas dan dibawah titik 0,0.
54 Dengan demikian asumsi homoscedasity terpenuhi
5. Multivariat
normalitas

Histogram memperlihatkan distribusi normal & pada P-P plot nilai residual
berhimpit dengan garis diagonal
55 Kedua grafik tersebut menggambarkan asumsi Normalitas terpenuhi
6. Diagostik Multicollinearity

Coefficientsa

Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan
demikian tidak ada Multicollinearity antara sesama variabel indepeden

Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi
sehingga model dapat digunakan untuk memprediksi berat badan bayi.
56
Model Summaryb

Model Akhir Model Summaryb


Model
1
R
.336a
R Square
.113
Adjusted
R Square
.094
Std. Error of
the Estimate
694.016
Durbin-
Watson
.222
Adjusted Std. Error of a. Predictors: (Constant), History
Durbin- of premature labor, History of
Model R R Square R Square the Estimate Watson hypertension, Smoking status, Weight of mother (pounds)
1 .336a .113 .094 694.016 .222
a. Predictors: (Constant), History of premature labor, History of b. Dependent Variable: Birth weight (gram)
hypertension, Smoking status, Weight of mother (pounds)
b. Dependent Variable: Birth weight (gram)
Coefficientsa

Berat
BeratBayi
Bayi==2449,1+5,0
2449,1+5,0Lwt
Lwt––236,4
236,4smoke
smoke--582Hi
582Hi––145,4
145,4Ptl
Ptl
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)

Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi ,
57
namun model ini hanya dapat menjelaskan 11,3% variasi pada berat bayi, 88,7%
lagi ditentukan oleh variabel lain yang tidak diteliti
Interpretasi
Berat
BeratBayi
Bayi==2449,1+5,0
2449,1+5,0Lwt
Lwt––236,4
236,4smoke
smoke--582Hi
582Hi––145,4
145,4Ptl
Ptl

- Setiap kenaikan berat badan ibu sebesar 1 pound, maka berat badan bayi akan naik
sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi dan prematur
- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4 gram setelah
dikontrol variabel berat badan, hipertensi dan prematur.
- Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah sebesar 582,5
gram setelah dikontrol variabel berat badan ibu,merokok dan prematur.

Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar
peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat badan bayi).
Semakin besar nilai beta semakin besar pengaruh nya terhadap variabel
dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya
terhadap berat badan bayi adalah berat badan ibu..

58
TUGAS: REGRESI LINIER
1. Age-Umur (..th)
2. lwt-Berat badan (..pound)
3. smoke-Merokok (Y/N)
4. ptl-Prematur (…kali) Berat bayi
5. ht-Hipertensi (Y/N) (gram)
6. ftv-anc (…kali)
7. Race (White, black, other)
8. ui-Uterine irritability (Y/N)

Dari data LBW.189.SAV


1. Buat model determinan berat bayi lahir (gram)
59 2. Tentukan variabel paling berpengaruh
TUGAS: REGRESI LINIER
GANDA
1. Cari jurnal yang melakukan analisis regresi
linier ganda (misalnya http://journal.fkm.ui.ac.id/kesmas)
2. Identifikasi variable  dependen (satuan & Skala)

3. Identifikasi variable  independent (satuan & Skala:


Numerik, Kategorik: 2-kategori, Kategorik >2-kategori)

4. Identifikasi variable  signifikan di multivariat


 Interpretasikan
5. Tentukan koef.korelasi & koef.determinasi
 Interpretasikan
6. Identifikasi variable  paling besar perannya

60
61

Besral
Departemen Biostatistika dan Kependudukan
Fakultas Kesehatan Masyarakat , Universitas Indonesia
Telp: 0812.8257.5200, Email: besral@yahoo.com , besral@ui.ac.id
Hal-61

Anda mungkin juga menyukai