Anda di halaman 1dari 4

Korelasi

 Menilai hubungan 2 variabel numerik


 Contoh:
1. Apakah ada hubungan antara umur
Korelasi dan Regresi Linier dengan tekanan darah sistolik
2. Apakah ada hubungan antara income
keluarga dengan IP mhs
3. Apakah ada hubungan antara umur
pasien dengan lama hari rawat
Jurusan BIOSTATISTIKA 4. Apakah ada hubungan antara tinggi badan
Fakultas Kesehatan Masyarakat (TB) dengan FEV1

Universitas Indonesia  Diagram tebar (scatter-plot)


Sumbu X  Variabel Independen
Sumbu Y  Variabel Dependen
1 Jur. Biostatistika, FKM UI, 2001 Page 2

Diagram tebar & garis regresi


Korelasi
Contoh Garis regresi FEV1 dengan tinggi badan
600
 Pola hubungan antara
2 variabel numerik
Force expiratoty volume in 1 min (ml)

500
1. Linier:
- Positif
400 - Negatif

300

Yi  719,14  6,43 X i

200 2. Non-Linier:
- Parabolik
100 - Exponensial
140 150 160 170 180 190 200

height (cm)
Jur. Biostatistika, FKM UI, 2001 Page 3 Jur. Biostatistika, FKM UI, 2001 Page 4

Korelasi Korelasi
 Menilai kekuatan hubungan linier 2 var ASUMSI
numerik:  Pearson’s Coef. Correlation hanya valid jika asumsi
 Pearson’s Coefisien Correlation (r) berikut terpenuhi:
 Dari nilai r kita dapat menentukan: 1. Untuk setiap nilai X, Nilai Y terdistribusi
a. Kekuatan hubungan(0 s.d 1) secara normal
b. Arah hubungan: (+/-) 2. Untuk setiap nilai Y, Nilai X terdistribusi
secara normal
 Kisaran nilai r antara 0 s.d 1: 3. Perkalian antara nilai X dan Y terdistribusi
0 = Tidak ada hubungan linier secara normal (bivariate normal distr.)
1 = Ada hubungan linier sempurna
 Arah hubungan:  Koefisien Determinasi (r2):
+ = Hubungan direct:semakin besar nilai X Melihat besarnya variasi variabel Y (dalam persen)
semakin besar nilai Y
yang dapat dijelaskan oleh variabel X.
 - = Hubungan inverse:semakin besar nilai X Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi
semakin kecil nilai Y nilai Y dapat dijelaskan oleh variabel X
Jur. Biostatistika, FKM UI, 2001 Page 5 Jur. Biostatistika, FKM UI, 2001 Page 6
Korelasi: Data Lay-out dan perhitungan r Korelasi
Subjek X X2 Y Y2 X.Y INFERENSI KOEF. KORELASI
1 X1 X 12 Y1 Y 12 XY1  Estimasi Interval Koef. Korelasi (r)
. X. X. 2 Y. Y. 2 XY.
CI (r ) 
Exp[2. Zf ]  1 1  1  r  Z( / 2 )
. X. X. 2 Y. Y. 2 XY. Zf  . Ln  
n Xn Xn2 Yn Yn2 XYn
Exp[2. Zf ]  1 2  1  r  n 3
(X) = … (X2) … (Y)… (Y2)… (XY) = …  Uji hipotesis Koef. Korelasi (r):
- Ho:  = 0
(  X ).(  Y ) - Ha:   0 n2
(  XY )  - Uji statistik: t  r.
r n 2
1 r
 2
  X 2   2
  Y 2 
( X )  . ( Y )  
 n   n  - Critical Region: Ho ditolak jika,
 xy * n   x y |t (hitung) |>t (tabel: /2, df=n-2)
r
 x * n   x *  y * n   y  
2 2 2 2

Jur. Biostatistika, FKM UI, 2001 Page 7 Jur. Biostatistika, FKM UI, 2001 Page 8

Korelasi Korelasi
INTERPRETASI KOEF. KORELASI CONTOH KORELASI:
 Kekuatan hubungan: (Subjektif) Subjek (X) Usia (Y) Lama hari rawat X.Y
r < 0.4 : Lemah 1 20 5
0.4< r <0.8 : Sedang 2 30 6
r > 0.8 : Kuat 3 25 5
4 35 7
 Korelasi tidak selalu berarti hubungan sebab
5 40 8
akibat (causality)
(X) = 150 (X) = 31 (XY) = 970
 Korelasi yang lemah tidak selalu berarti tidak (X2) = 4750 (Y2) = 199
adanya hubungan
 Korelasi yang kuat tidak selalu berarti adanya ( X ).(  Y )
(  XY )  (970) 
(150).(31)
n 5
garis lurus r
 X   2
  Y2 

 150 2    31 2 
 0.97
2 2
 ( X )   .  ( Y )    ( 4750)   .  (199)  
 n   n   5   5 
Jur. Biostatistika, FKM UI, 2001 Page 9 Jur. Biostatistika, FKM UI, 2001 Page 10

Korelasi Korelasi
 Estimasi Interval Koef. Korelasi (r)  Uji hipotesis Koef. Korelasi (r):
95% confidence interval r adalah: 1. Ho:  = 0
Ha:   0
Zf 
1  1  r  Z(  / 2 )
. Ln 
1  1  0.97 
 . Ln 
196
.
 [0.7064   3.4782]
2. Uji statistik: t  r . n  2  0.97 5  2  6.91
2  1  r  n 3 2  1  0.97  5 3 1 r2 1  0.97 2
 Batas bawah r: 3. Critical Region: Ho ditolak jika,
Exp[ 2. Zf ]  1 Exp[2( 0.7064)]  1 | t(hitung) | ≥ t (tabel: /2, df=n-2) atau p-value < 
CI (r )    0.61 ≥ 3.182 p<0.005
Exp[ 2. Zf ]  1 Exp[2( 0.7064)]  1
 Batas atas r: 4. Keputusan: Ho ditolak
CI (r ) 
Exp[ 2. Zf ]  1 Exp[ 2(3.4782)]  1
  0.99
5. Kesimpulan:Koef. Korelasi populasi () tidak
Exp[ 2. Zf ]  1 Exp[ 2(3.4782)]  1 sama dengan nol
Ada korelasi antara umur dg lama hr rawat
Jur. Biostatistika, FKM UI, 2001 Page 11 Jur. Biostatistika, FKM UI, 2001 Page 12
Regresi Linier Regresi Linier
 Memprediksi nilai Y dari X:  Mencari garis terbaik regresi linier:
1. Berapa tekanan darah sistolik, jika umur = 30 th  Metoda Least Square (Persamaan garis dibuat
2. Berapa IP mhs, jika income keluarga = Rp 2 juta sedemikian rupa sehingga jumlah kuadrat dari selisih
3. Berapa lama hari rawat, jika pasien berumur 40 th nilai observasi dengan nilai pada garis adalah minimum)
4. Berapa level FEV1, pada orang dengan TB=170 cm  Persamaan garis regresi linier:
Yi =  + 1Xi + 
 Asumsi pada regresi linier:
1. Nilai mean dari Y adalah fungsi garis lurus Yi adalah nilai Y yang diprediksi
(linierity) dari X  Yi =  + 1Xi +   adalah intercept dan 1 adalah slope
2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X  adalah posisi dimana garis regresi memotong sumbu y
(normality) 1 mengukur kemiringan garis
3. Varian Y adalah sama untuk setiap nilai X Nilai Y meningkat sebesar 1 unit untuk setiap kenaikan
(homoscedasticity) nilai X sebesar 1 unit
4. Nilai X dan Y adalah tidak saling berkait
(independency)  adalah error dari model dalam memprediksi rata-rata Y
Jur. Biostatistika, FKM UI, 2001 Page 13 Jur. Biostatistika, FKM UI, 2001 Page 14

Regresi Linier: Data Lay-out Inferensi Koef. Regresi


Subjek X Y X.Y
 Estimasi Interva Koef. Regresi:
1 X1 X 12 Y1 Y 12 XY1
. X. X. 2 Y. Y. 2 XY.
CI     Z ( / 2 ) . SE 
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn  ( n  1)
Varian S2x=… S2y=…
SE 

 2
 2 2
( n  1) . S y  (  . S x ) 
(X) = … (X2) … (Y)… (Y2)… (XY) = … ( n  1). S 2 x
• Persamaan garis
regresi linier:  YX
• Y i =  +  1X i S 2 y  Varian X  mean _ X 
X
(  X ).(  Y ) Y n
(  XY )  Y  mean _ Y 
n n
 
  X 2 X
S 2 x  VarianX
2 X  mean _ X 
( X )  n
n
Jur. Biostatistika, FKM UI, 2001 Page 15 Jur. Biostatistika, FKM UI, 2001 Page 16

Inferensi Koef. Regresi Regresi


 Uji Hipotesis Koef. Regresi: CONTOH REGRESI:
- Ho:  = 0 Subjek (X) Usia (Y) Lama hari rawat X.Y
- Ha:   0
1 20 5
- Uji statistik: 
t 2 30 6
SE 3 25 5
4 35 7
 (n  1)
 
 2 2 2
( n  2) . S y  (  . S x )  5 40 8
SE  S2x=62.5 S2y=1.7
( n  1). S 2 x (X) = 150 (Y) = 31 (XY) = 970
(X2) = 4750 (Y2) = 199
- Critical Region: Ho ditolak jika,

|t (hitung) |>t (tabel: /2, df=n-2)

Jur. Biostatistika, FKM UI, 2001 Page 17 Jur. Biostatistika, FKM UI, 2001 Page 18
Regresi Linier Regresi Linier
 Persamaan garis regresi linier:  Estimasi Interval Koef. Regresi ()
(  X ).(  Y ) (150).( 31) 95% confidence interval  adalah
(  XY )  ( 970)   ( n  1) . S 2 y  (  2 . S 2 x )  (5  1)
 n  5  0.16  ( n  2)    
. 17
(5  2) 
. ) 2 (62.5))
.  ( 016 
2 SE    0.00863
2
  X  150 2 ( n  1). S 2
x ( 5  1)62.5
( X )  ( 4750) 
n 5
95% CI     Z( / 2 ) . SE
  Y   X  6.2  0.16.(30)  14
. 95% CI   016
.  1.96(0.00863)  [ 014
.   017
. ]

Lama hari rawat (Y) =  + 1Xi


Lama hari rawat = 1.4 + 0.16 (Usia) SE 
MS E
2
  Xi  X 

Jur. Biostatistika, FKM UI, 2001 Page 19 Jur. Biostatistika, FKM UI, 2001 Page 20

Regresi Linier Regresi Linier


 Uji hipotesis Koef. Regresi ( ):  Komputer Out-put:
- Ho:  = 0 Model Summaryb
- Ha:   0  016
. Std. Error
- Uji statistik: t    18.54 Adjusted of the
SE  0.00863 Model
1
R
.970a
R Square
.941
R Square
.922
Estimate
.3651
a. Predictors: (Constant), USIA
- Critical Region: Ho ditolak jika, b. Dependent Variable: LAMA_RWT

| t (hitung) | > t (tabel: /2, df=n-2)


ANOVAb
> 3.182
Sum of Mean
Model Squares df Square F Sig.
1 Regression .006 a
- Keputusan: Ho ditolak Residual
6.400
.400
1
3
6.400
.133
48.000

- Kesimpulan: Koef. Beta tidak sama dengan nol Total 6.800 4


a. Predictors: (Constant), USIA
b. Dependent Variable: LAMA_RWT

Jur. Biostatistika, FKM UI, 2001 Page 21 Jur. Biostatistika, FKM UI, 2001 Page 22

Regresi Linier
 Komputer Out-put:
a
Coefficients

Standardi
zed
Unstandardized Coefficien 95% Confidence
Coefficients ts Interval for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 1.400 .712 1.967 .144 -.865 3.665
USIA .160 .023 .970 6.928 .006 .087 .233
a. Dependent Variable: LAMA_RWT

Jur. Biostatistika, FKM UI, 2001 Page 23

Anda mungkin juga menyukai