Korelasiregresi 2
Korelasiregresi 2
500
1. Linier:
- Positif
400 - Negatif
300
200 2. Non-Linier:
- Parabolik
100 - Exponensial
140 150 160 170 180 190 200
height (cm)
Jur. Biostatistika, FKM UI, 2001 Page 3 Jur. Biostatistika, FKM UI, 2001 Page 4
Korelasi Korelasi
Menilai kekuatan hubungan linier 2 var ASUMSI
numerik: Pearson’s Coef. Correlation hanya valid jika asumsi
Pearson’s Coefisien Correlation (r) berikut terpenuhi:
Dari nilai r kita dapat menentukan: 1. Untuk setiap nilai X, Nilai Y terdistribusi
a. Kekuatan hubungan(0 s.d 1) secara normal
b. Arah hubungan: (+/-) 2. Untuk setiap nilai Y, Nilai X terdistribusi
secara normal
Kisaran nilai r antara 0 s.d 1: 3. Perkalian antara nilai X dan Y terdistribusi
0 = Tidak ada hubungan linier secara normal (bivariate normal distr.)
1 = Ada hubungan linier sempurna
Arah hubungan: Koefisien Determinasi (r2):
+ = Hubungan direct:semakin besar nilai X Melihat besarnya variasi variabel Y (dalam persen)
semakin besar nilai Y
yang dapat dijelaskan oleh variabel X.
- = Hubungan inverse:semakin besar nilai X Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi
semakin kecil nilai Y nilai Y dapat dijelaskan oleh variabel X
Jur. Biostatistika, FKM UI, 2001 Page 5 Jur. Biostatistika, FKM UI, 2001 Page 6
Korelasi: Data Lay-out dan perhitungan r Korelasi
Subjek X X2 Y Y2 X.Y INFERENSI KOEF. KORELASI
1 X1 X 12 Y1 Y 12 XY1 Estimasi Interval Koef. Korelasi (r)
. X. X. 2 Y. Y. 2 XY.
CI (r )
Exp[2. Zf ] 1 1 1 r Z( / 2 )
. X. X. 2 Y. Y. 2 XY. Zf . Ln
n Xn Xn2 Yn Yn2 XYn
Exp[2. Zf ] 1 2 1 r n 3
(X) = … (X2) … (Y)… (Y2)… (XY) = … Uji hipotesis Koef. Korelasi (r):
- Ho: = 0
( X ).( Y ) - Ha: 0 n2
( XY ) - Uji statistik: t r.
r n 2
1 r
2
X 2 2
Y 2
( X ) . ( Y )
n n - Critical Region: Ho ditolak jika,
xy * n x y |t (hitung) |>t (tabel: /2, df=n-2)
r
x * n x * y * n y
2 2 2 2
Jur. Biostatistika, FKM UI, 2001 Page 7 Jur. Biostatistika, FKM UI, 2001 Page 8
Korelasi Korelasi
INTERPRETASI KOEF. KORELASI CONTOH KORELASI:
Kekuatan hubungan: (Subjektif) Subjek (X) Usia (Y) Lama hari rawat X.Y
r < 0.4 : Lemah 1 20 5
0.4< r <0.8 : Sedang 2 30 6
r > 0.8 : Kuat 3 25 5
4 35 7
Korelasi tidak selalu berarti hubungan sebab
5 40 8
akibat (causality)
(X) = 150 (X) = 31 (XY) = 970
Korelasi yang lemah tidak selalu berarti tidak (X2) = 4750 (Y2) = 199
adanya hubungan
Korelasi yang kuat tidak selalu berarti adanya ( X ).( Y )
( XY ) (970)
(150).(31)
n 5
garis lurus r
X 2
Y2
150 2 31 2
0.97
2 2
( X ) . ( Y ) ( 4750) . (199)
n n 5 5
Jur. Biostatistika, FKM UI, 2001 Page 9 Jur. Biostatistika, FKM UI, 2001 Page 10
Korelasi Korelasi
Estimasi Interval Koef. Korelasi (r) Uji hipotesis Koef. Korelasi (r):
95% confidence interval r adalah: 1. Ho: = 0
Ha: 0
Zf
1 1 r Z( / 2 )
. Ln
1 1 0.97
. Ln
196
.
[0.7064 3.4782]
2. Uji statistik: t r . n 2 0.97 5 2 6.91
2 1 r n 3 2 1 0.97 5 3 1 r2 1 0.97 2
Batas bawah r: 3. Critical Region: Ho ditolak jika,
Exp[ 2. Zf ] 1 Exp[2( 0.7064)] 1 | t(hitung) | ≥ t (tabel: /2, df=n-2) atau p-value <
CI (r ) 0.61 ≥ 3.182 p<0.005
Exp[ 2. Zf ] 1 Exp[2( 0.7064)] 1
Batas atas r: 4. Keputusan: Ho ditolak
CI (r )
Exp[ 2. Zf ] 1 Exp[ 2(3.4782)] 1
0.99
5. Kesimpulan:Koef. Korelasi populasi () tidak
Exp[ 2. Zf ] 1 Exp[ 2(3.4782)] 1 sama dengan nol
Ada korelasi antara umur dg lama hr rawat
Jur. Biostatistika, FKM UI, 2001 Page 11 Jur. Biostatistika, FKM UI, 2001 Page 12
Regresi Linier Regresi Linier
Memprediksi nilai Y dari X: Mencari garis terbaik regresi linier:
1. Berapa tekanan darah sistolik, jika umur = 30 th Metoda Least Square (Persamaan garis dibuat
2. Berapa IP mhs, jika income keluarga = Rp 2 juta sedemikian rupa sehingga jumlah kuadrat dari selisih
3. Berapa lama hari rawat, jika pasien berumur 40 th nilai observasi dengan nilai pada garis adalah minimum)
4. Berapa level FEV1, pada orang dengan TB=170 cm Persamaan garis regresi linier:
Yi = + 1Xi +
Asumsi pada regresi linier:
1. Nilai mean dari Y adalah fungsi garis lurus Yi adalah nilai Y yang diprediksi
(linierity) dari X Yi = + 1Xi + adalah intercept dan 1 adalah slope
2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X adalah posisi dimana garis regresi memotong sumbu y
(normality) 1 mengukur kemiringan garis
3. Varian Y adalah sama untuk setiap nilai X Nilai Y meningkat sebesar 1 unit untuk setiap kenaikan
(homoscedasticity) nilai X sebesar 1 unit
4. Nilai X dan Y adalah tidak saling berkait
(independency) adalah error dari model dalam memprediksi rata-rata Y
Jur. Biostatistika, FKM UI, 2001 Page 13 Jur. Biostatistika, FKM UI, 2001 Page 14
Jur. Biostatistika, FKM UI, 2001 Page 17 Jur. Biostatistika, FKM UI, 2001 Page 18
Regresi Linier Regresi Linier
Persamaan garis regresi linier: Estimasi Interval Koef. Regresi ()
( X ).( Y ) (150).( 31) 95% confidence interval adalah
( XY ) ( 970) ( n 1) . S 2 y ( 2 . S 2 x ) (5 1)
n 5 0.16 ( n 2)
. 17
(5 2)
. ) 2 (62.5))
. ( 016
2 SE 0.00863
2
X 150 2 ( n 1). S 2
x ( 5 1)62.5
( X ) ( 4750)
n 5
95% CI Z( / 2 ) . SE
Y X 6.2 0.16.(30) 14
. 95% CI 016
. 1.96(0.00863) [ 014
. 017
. ]
Jur. Biostatistika, FKM UI, 2001 Page 19 Jur. Biostatistika, FKM UI, 2001 Page 20
Jur. Biostatistika, FKM UI, 2001 Page 21 Jur. Biostatistika, FKM UI, 2001 Page 22
Regresi Linier
Komputer Out-put:
a
Coefficients
Standardi
zed
Unstandardized Coefficien 95% Confidence
Coefficients ts Interval for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 1.400 .712 1.967 .144 -.865 3.665
USIA .160 .023 .970 6.928 .006 .087 .233
a. Dependent Variable: LAMA_RWT