Anda di halaman 1dari 39

Korelasi dan Regresi Linier

BESRAL
Departemen Biostatistika
Fakultas Kesehatan Masyarakat
Universitas Indonesia
2020
1
Jenis uji statistik yang sering dipakai

Page 2
Jenis uji statistik

Jur. Biostatistika, FKM UI, 2001 Page 3


Korelasi

4
Korelasi
 Menilai hubungan 2 variabel numerik
 Contoh:
1. Apakah ada hubungan antara umur
dengan tekanan darah sistolik
2. Apakah ada hubungan antara pendapatan
keluarga dengan Berat bayi
3. Apakah ada hubungan antara umur
pasien dengan lama hari rawat
4. Apakah ada hubungan antara tinggi badan
(TB) dengan kapasitas paru (FEV1)

 Gunakan Diagram tebar (scatter-plot) untuk menilai hubungan 2


var numerik
Sumbu X  Variabel Independen
Sumbu Y  Variabel Dependen

Page 5
Diagram tebar & garis regresi
Diagram tinggi badan dan kapasitas paru (FEV1)
600
Force expiratoty volume in 1 min (ml)

500

400

300

200

Yi  719,14  6,43 X i


100
140 150 160 170 180 190 200

height (cm)
Page 6
Diagram tebar & garis regresi
Diagram tinggi badan dan berat badan

Yˆi  79,4  5,5 X i

Page 7
Diagram tebar & garis regresi
Diagram Cakupan Imunisasi dan
Angka Kematian Bayi

Yˆi  79,4  5,5 X i

Page 8
Korelasi
 Pola hubungan antara 2
variabel numerik
1. Linier:
- Positif Korelasi positif
- Negatif Korelasi negatif

2. Non-Linier:
- Parabolik
- Exponensial

Page 9
Korelasi
 Menilai kekuatan hubungan 2 var numerik:
 Pearson’s Coefisien Correlation (r) : Parametrik
 Spearman’s Coefisien Correlation (r) : Non-par
 Dari nilai r kita dapat menentukan:
a. Kekuatan hubungan (0 s.d 1)
b. Arah hubungan: (+/-)
 Kisaran nilai r antara 0 s.d 1:
0,0 = Tidak ada hubungan linier
1,0 = Hubungan linier sempurna
 Arah hubungan:
+ (positif) = Hubungan direct:semakin besar nilai X
semakin besar nilai Y
 - (negatif) = Hubungan inverse:semakin besar nilai X
semakin kecil nilai Y

Page 10
INTERPRETASI KOEF. KORELASI

 Kekuatan hubungan: (Subjektif)


r < 0.4 : Lemah
0.4< r <0.8 : Sedang
r > 0.8 : Kuat
 Korelasi tidak selalu berarti hubungan sebab akibat
(causality)
 Korelasi yang lemah tidak selalu berarti tidak adanya
hubungan
 Korelasi yang kuat tidak selalu berarti adanya garis lurus

Page 11
Interpretasi Koefisien Korelasi
Colton (1974)

0.0 s/d 0.25 atau -0.25 s/d 0.0 korelasi


sangat lemah
0.25 s/d 0.50 atau -0.25 s/d -0.50 korelasi
lemah
0.50 s/d 0.75 atau -0.50 s/d -0.75 korelasi
sedang
>0.75 atau <-0.75 korelasi
kuat
Koef.Korelasi & Koef.Determinasi
ASUMSI
 Pearson’s Coef. Correlation hanya valid jika asumsi berikut terpenuhi:
1. Untuk setiap nilai X, Nilai Y terdistribusi normal
2. Untuk setiap nilai Y, Nilai X terdistribusi normal
3. Perkalian antara nilai X dan Y terdistribusi normal
(bivariate normal distr.)

 Koefisien Determinasi (r2):


Melihat besarnya variasi variabel Y (dalam persen) yang dapat dijelaskan
oleh variabel X.

 Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi nilai Y dapat dijelaskan
oleh variabel X, sisanya dijelaskan oleh variabel lain yang tidak diteliti
(sisanya = error)

Page 13
Perhitungan
Koef.Korelasi

14
Korelasi: Data Lay-out dan perhitungan r
Subjek X X2 Y Y2 X.Y
1 X1 X12 Y1 Y12 XY1
. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn
(X) = … (X2) … (Y)… (Y2)… (XY) = …
(  X ). (  Y )
( X Y ) 
r n
 2
  X  2
  2
  Y  2

(  X )  . (  Y )  
 n   n 

r
 xy * n   x y
 x * n   x *  y * n   y  
2 2 2 2

Page 15
CONTOH perhitungan KORELASI:
Subjek (X) Usia (X2) (Y) Lama hari rawat (Y2) X.Y
1 20 400 5 25
100
2 30 900 6 36
180
3 25 625 5 25
125
4 35 1.225 7 49
245
5 40 1.600 8 64
320

r (X) = 970
150 * 5  150 * 31
(Y) = 31  0,97(XY) = 970
[4750
(X2) *
=54750 
 (150) 2 ] * 199
(Y (31) 2
*25) = 199 
Koef.Korelasi Pearson 0,97. Ada hubungan POSITIF yang KUAT
antara usia (th) dengan lama rawat (hari)
Koef.Determinasi (0,972= 0,94. Variabel UMUR dapat
menjelaskan 94% variasi variabel LAMA RAWAT, sisanya 6%
dijelaskan oleh var lain yang tidak diteliti
Page 16
CONTOH perhitungan KORELASI:
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5
100
2 30 6
180
3 25 5
125
4 35 7
245
5 40 8
320
(X) nilai
Contoh lain perhitungan = 150 koef. Korelasi: (Y) = 31 (XY) = 970
(X2) = 4750 (Y2) = 199
(  X ). (  Y ) ( 1 5 0 ). ( 3 1)
( X Y )  (970) 
r n  5  0 .9 7
 2
X   
2
2
Y  
2
 1 5 0   
2
 3 1 
2

(  X )  . (  Y )   ( 4 7 5 0 )   .  (1 9 9 )  
 n   n   5   5 
Page 17
Uji Statistik
Koef. Korelasi
Untuk memastikan apakah nilai koef.Korelasi
(r) bermakna secara statistik atau tidak,
gunakan Uji-T, dengan rumus sbb:

Dengan DF = n-2

18
Uji statistik Koef. Korelasi (r):
 1. Ho:  = 0 (Tidak ada hubungan/korelasi)
Ha:   0 (Ada hubungan/korelasi)
2. Uji statistik:
n 2 5 2
t  r. 2
 0 .9 7 2
 6 .9 1
1r 1  0 .97
3. Critical Region: Ho ditolak jika,
|t (hitung) |>t (tabel: /2, df=n-2)
> 3.182 p<0.005
atau p-value <  (5%)
4. Keputusan: Ho ditolak
5. Kesimpulan:Koef. Korelasi populasi () tidak
sama dengan nol
Ada korelasi bermakna secara statistik
antara umur dg lama rawat
Page 19
Output Komputer

 Koef.Korelasi Pearson
(R): 0,97
 Koef.Determinasi (R2):
0.941

Page 20
Regresi
Linier
Persamaan garis lurus antara 2 variabel numerik
Y = a + bX

21
Regresi Linier
 Memprediksi nilai Y dari X:
1. Berapa tekanan darah sistolik, jika umur = 30 th
2. Berapa IP mhs, jika income keluarga = Rp 2 juta
3. Berapa lama hari rawat, jika pasien berumur 40 th
4. Berapa level FEV1, pada orang dengan TB=170 cm

 Asumsi Regresi Linier:


1. Nilai mean dari Y adalah fungsi garis lurus (linierity) dari X  Yi =  +
1Xi + 
2. Nilai Y terdistribusi Normal untuk setiap nilai X
(normality)
3. Varian Y adalah sama untuk setiap nilai X
(homoscedasticity)
4. Nilai X dan Y adalah tidak saling berkait
(independency)

Page 22
Regresi Linier
 Mencari garis terbaik regresi linier:
 Metoda Least Square (Persamaan garis dibuat sedemikian rupa sehingga jumlah
kuadrat dari selisih nilai observasi dengan nilai pada garis adalah minimum)
 Persamaan garis regresi linier:
Yi =  + 1Xi + 
Yi adalah nilai Y yang diprediksi
 adalah intercept dan 1 adalah slope
 adalah posisi dimana garis regresi memotong sumbu y
1 mengukur kemiringan garis = koefisien regresi
Nilai Y meningkat sebesar 1 unit untuk setiap kenaikan nilai X sebesar 1 unit
 adalah error dari model dalam memprediksi rata-rata Y

Page 23
Regresi Linier: Data Lay-out
Subjek X Y X.Y
1 X1 X12 Y1 Y12 XY1
. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn
(X) = … (X2) … (Y)… (Y2)… (XY) = …
• Persamaan garis regresi linier:
• Yi =  + 1Xi  Y X
(  X ). (  Y ) Y 31
( X Y ) 
 xy * n   x *  y
Y  mean _ Y    6.2
 n n 5
b   2

 x * n   x  X
2 2
( X 2 )  X
n X  mean _ X 
n
Page 24
CONTOH REGRESI
Subjek (X) Usia (X2) (Y) Lama hari rawat (Y2) X.Y
1 20 400 5 25
100
2 30 900 6 36
180
3 25 625 5 25
125
4 35 1.225 7 49
245
5 40 1.600 8 64
320

b
  =x150
xy * n(X)  y 970 * 5(Y)
 150=*31
31 (XY) = 970
(X ) = 4750  (Y ) = 199  0,16
 x * n   x  4750 * 5  (150) Y  mean _ Y  Y  31  6.2
2 2
2 2 2

n 5

  Y   X  6.2  0.16 * (30)  1.4 X  mean _ X 


X 150
  30
n 5
Page 26
Regresi Linier
 Persamaan garis regresi linier:
(  X ). (  Y ) ( 1 50 ). ( 31)
( X Y )  ( 9 70 ) 
 n  5  0 .1 6
2
X  2
1 50  2

( X )  ( 4 7 50 ) 
n 5

  Y   X  6 .2  0 .1 6 . ( 3 0 )  1.4
Persamaan garis regresi linier:
Lama hari rawat (Y) =  + 1Xi
Lama hari rawat = 1.4 + 0.16 (Usia)

Page 27
Regresi Linier
 Komputer Out-put:
Model Summaryb

Std. Error
Adjusted of the
Model R R Square R Square Estimate
1 .970a .941 .922 .3651
a. Predictors: (Constant), USIA
b. Dependent Variable: LAMA_RWT
 Koef.Korelasi Pearson
0,97
ANOVAb  Koef.Determinasi 0.941
Sum of Mean
Model Squares df Square F Sig.
1 Regression 6.400 1 6.400 48.000 .006a
Residual .400 3 .133
Total 6.800 4
a. Predictors: (Constant), USIA
b. Dependent Variable: LAMA_RWT
Page 28
Out-put Komputer
Coefficientsa

Standardi
zed
Unstandardized Coefficien 95% Confidence
Coefficients ts Interval for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 1.400 .712 1.967 .144 -.865 3.665
USIA .160 .023 .970 6.928 .006 .087 .233
a. Dependent Variable: LAMA_RWT

Lama hari rawat (Y) =  + 1Xi


Lama hari rawat = 1.4 + 0.16 (Usia)
Hitung perkiraan Lama hari rawat, jika:
a.Seseorang berumur 40 tahun = 7.8 hari
b.Seseorang berumur 80 tahun = 14.2 hari Page 29
Koefisien determinasi
 Koefisien determinasi mengukur proporsi
varians Y yang dapat diterangkan oleh X:
SY 2
R2 
SY 2
 Nilai R2 berkisar antara 0 (tidak ada varians Y
yang dijelaskan) sampai 1 (seluruh varians Y
dapat dijelaskan)
 Untuk data FEV1, nilai R2 = 0,546 berarti
persamaan linier antara FEV1 dengan tinggi
badan dapat menjelaskan 54,6% varians
FEV1. Jadi sisa varians 45,4% tidak dapat
dijelaskan (45,6% adalah residual).
Page 30
Prosedur regresi linier sederhana
pada SPSS/Windows
Statistics > Regression >Linear

Page 31
Ouput SPSS: Hubungan TB (cm) dengan Volume
Kapasitas Paru
Model Summary

Adjusted R
Model R R Square 1. BerapaStd.
Square
Error of
Koef.Korelasi?
the Estimate (0.739)– I
.739 a
1 .546
2. Apakah .544
koef.korelasi
54.19
bermakna seca
a. Predictors: (Constant), height (cm)
ANOVA b
3. Berapa Koef.Determinasi? (54.6%
Sum of 4. Buat persamaan Regresi Liniernya: Y
Model Squares df Mean Square F Sig.

5. Berapa Koef.Regresi? (6.43) – In


a
1 Regression 1050779.234 1 1050779.234 357.779 .000
Residual 875210.046 298 2936.946
Total 1925989.280 299 Hitunglah
6. Coefficients a berapa kapasitas parunya
a. Seseorang memiliki TB 145cm =
a. Predictors: (Constant), height (cm)
b. Dependent Variable: Force expiratoty volume in 1 min (ml)

b. Seseorang Standardizedmemiliki TB 175cm =


Unstandardized Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -719.135 56.785 -12.664 .000
height (cm) 6.434 .340 .739 18.915 .000
a. Dependent Variable: Force expiratoty volume in 1 min (ml)
Page 32
Ouput SPSS: Hubungan TB (cm) dengan Volume
Kapasitas Paru

1. Berapa Koef.Korelasi? – Interpretasikan?


2. Apakah Koef.Korelasi bermakna?
3. Berapa Koef.Determinasi? – Interpretasikan?
4. Buat persamaan Regresi Liniernya
5. Berapa Koef.Regresi? – Interpretasikan?
6. Hitunglah berapa kapasitas parunya, jika:
a. Seseorang memiliki TB 145cm.
b. Seseorang memiliki TB 175cm.

Page 33
Ouput SPSS: Hubungan TB (cm) dengan Volume
Kapasitas Paru

1. Berapa Koef.Korelasi? (0.739)– Interpretasikan…


2. Apakah koef.korelasi bermakna secara statistic?
3. Berapa Koef.Determinasi? (54.6%)– Interpretasikan..
4. Buat persamaan Regresi Liniernya: Y = -719.13 +
6.43*(TB)
5. Berapa Koef.Regresi? (6.43) – Interpretasikan..
6. Hitunglah berapa kapasitas parunya, jika:
a. Seseorang memiliki TB 145cm
= - 719.13 + 6.43(145) = 213 ml
b. Seseorang memiliki TB 175cm
= - 719.13 + 6.43(175) = 400 ml

Page 34
Diagram tebar & garis regresi
Diagram tebar Hubungan Cakupan
Imunisasi (%) dengan Mortality Rate

Yˆi  79,4  5,5 X i

Page 35
Output computer Hubungan Cakupan
Imunisasi (%) dengan Mortality Rate

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .829a .687 .670 .03939
a. Predictors: (Constant), Imunisasi DPT
ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression .061 1 .061 39.575 .000a
Residual .028 18 .002
Total .089 19
a. Predictors: (Constant), Imunisasi DPT
b. Dependent Variable: Mortality Rate
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) .278 .035 7.848 .000
Imunisasi DPT -.283 .045 -.829 -6.291 .000
a. Dependent Variable: Mortality Rate

Jur. Biostatistika, FKM UI, 2001 Page 36


Tugas (Ouput SPSS)
Hubungan Cakupan Imunisasi (%)
dengan Mortality Rate
1. Berapa Koef.Korelasi? – Interpretasikan?
2. Apkah Koef.Korelasi bermakna secara statistic?
3. Berapa Koef.Determinasi? – Interpretasikan?
4. Buat persamaan Regresi Liniernya
5. Berapa Koef.Regresi? - Interpretasikan
6. Hitunglah berapa Mortality Rate, jika:
a. Cakupan imunisasi 50%.
b. Cakupan imunisasi 90%.

Page 37
BONUS TUGAS Regresi Linier Ganda
Output computer Hubungan TB (cm) dan Sex
(1=Pr,2=Lk)
Model Summary dengan BB (kg)
Adjusted Std. Error of
Model R R Square R Square the Estimate
1 .518a .268 .250 10.69182
a. Predictors: (Constant), Sex, TB
Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -21.718 43.968 -.494 .623
TB .604 .239 .331 2.532 .013
Sex -7.409 4.190 -.231 -1.768 .081
a. Dependent Variable: BB

Interpretasikan:
1.Koef regresi B dari TB 0.604
2.Koef regresi B dari Sex -7.409
3.Koef Korelasi R=0.518 (gabungan kedua variabel)
4.Koef Determinasi R2=0.268 (gabungan kedua variabel) Page 38
BONUS TUGAS Regresi Linier Ganda
Berat Bayi = 2449,1+5,0*Berat
Coefficients ibu – 236,4*Rokok –a

582*Hipertensi – 145,4*Riwayat Stand


prematur
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)

Interpretasikan Koef. B dari setiap variabel hasil analisis


regresi linier tersebut
Weight of mother = Numerik (pound)
Smoking status = 0:No, 1:Yes
Hystory of hypertension= 0:No, 1:Yes
Hystory of premature= 0:No, 1:Yes
4
0

TERIMA KASIH

Selamat Berlatih….

Anda mungkin juga menyukai