Anda di halaman 1dari 26

Korelasi/Regresi Linier

Luknis Sabri
Korelasi
• Menilai Hubungan antara 2 variabel
numerik,
• Contoh:
– Apakah ada hubungan antara umur dan
tekanan darah
– Hubungan TPA dengan IPK mahasiswa
– Hubungan antara tinggi badan dan
FEV1(Force Expiratory Volume 1 dalam
menit)
Cara sederhana
• Memakai Diagram Tebar ( Scatter
Diagram)
Y
V. Dependen x x

x
x
+x
x
x+

V. Independen
Contoh diagram tebar antara TB
FEV1
600

500

400

300

200

100
140 150 160 170 180 190 200

height (cm)
Ukuran Hubungan 2 Var
• Pearson’s Correlation Coefficient ( r )
• Kekuatan hubungan
– Berkisar antara 0 dan 1
– 0= tidak ada hubungan linier antara Var x dg
VarY
– 1= hubungan kedua variabel linier sempurna
– Yang sering berada antara 0 dan 1
Kekuatan hubungan
• Dapat dilihat dari scatter plot
Y Y
x x
x x x
x x x
x x
x
x x
x

X
X
Arah hubungan
• Ditandai oleh + dan –
• + = Hubungan direct: korelasi positif yang
berarti semakin besar nilai X semakin
besar juga nilai Y
• - = Hubungan terbalik ( inverse): korelasi
negatif berarti kenaikan variabel X diikuti
penurunan var Y atau sebaliknya
Arah hubungan

• Scatter Y
Y x x
x
x
x
x x
x
x
x

X X

Hubungan positif (+) Hubungan negatif (-)


Hubungan Non linier
• Scatter
Y Y

x
x
x
x x x x
x x x
x
x xx x
x
x x x x
x x

X X
-Parabolik Tidak jelas polanya
-Bisa juga hub Exponensial (Tidak ada hub linier)
Interpretasi Koef Korelasi
• Kekuatan hub (subjektif)
– r<0,4 : Hub lemah
– 0,4 < r < 0,8 : Sedang
– r > 0,8 : Kuat
• Korelasi tidak selalu berarti hubungan
sebab akibat( Causality)
• Korelasi yang lemah atau mendekati 0
berarti tidak ada hub linier, mungkin hub
parabol atau exponensial
Korelasi: Data Lay-out dan
perhitungan r
Subjek X X2 Y Y2 X.Y

1 X1 X12 Y1 Y12 XY1


. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn
(X) = … (X2) … (Y)… (Y2)… (XY) = …

(  X ).(  Y )
(  XY ) 
r n
   X  2
    Y  2

 ( X )   .  ( Y )  
2 2

 n   n 
CONTOH KORELASI
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5 100
2 30 6 180
3 25 5 125
4 35 7 245
5 40 8 320
(X) = 150 (X) = 31 (XY) = 970

(X2) = 4750 (Y2) = 199

(  X ).(  Y ) (150).(31)
(  XY )  (970) 
r n  5  0.97
  X    2  Y 
2 2
 150  
2
 31 
2

 ( X )   .  ( Y )    (4750)   .  (199)  
2

 n  n   5  5 
Koefisien Determinasi (r2)
• Koefisien determinasi mengukur proporsi
varians Y yang dapat diterangkan oleh X
2
S 

2 y
r 2
S
• Nilair2 berkisarantara 0 ( tidak ada varians
y

Y yang dijelaskan) sampai 1 ( seluruh


varians Y dapat dijelaskan)
• Dari contoh didapat
r=0,97…..r2=0,94…artinya 94 % lama hari
rawat dijelaskan umur
Regresi Linier
• Mencari garis terbaik
– Adabeberapa cara mencari garis regresi
antara lain: Free Hand
Metode Ordinary Least Square
• Metode OLS persamaan garis yang dibuat
sedemikian rupa sehingga kuadrat selisih
nilai observasi ke nilai di garis regresi
adalah minimum
• Persamaan y’=a + bx+e
Y’= a + bX +e
• Y’= nilai Y yang di prediksi
• a = intercept…nilai y pada saat x=0…titik
potong garis regresi dengan sumbu Y
• b= slope kemiringan garis…perubahan
variabel y pada saat var x berubah satu
unit
• e = Error dari model dalam memprediksi
nilai Y
Garis regresi
• y’=a+bx
Y
+
Y’=a+bX
+ +
b
+
+

X
a= intercept
Koef Reg
b= slope
Fungsi Pers Regresi
• Untuk memprediksi nilai y kalau x
diketahui
• Contoh:
– Berapa tek sistolik jika umur 50 tahun
– Berapa IPK mahasiswa kalau TPA nya 500
– Berapa lama hari rawat kalau pasien berumur
40 tahun
– Berapa level FEV1 pada orang dengan tinggi
badan 170 cm
Asumsi pada Regresi Linier
1. Nilai mean dari Y adalah fungsi garis
lurus (Linierity) X……….. Y’= a+ bX+e
2. Nilai Y terdistribusi normal untuk
setiapnilai X (normality)
3. Varian Y adalah sama untuk setiap nilai
X (homoscedasticity)
4. Nilai X dan Y tidak saling berkaitan
(independency)
Persamaan Regresi
• Y’=α+β X
( X ) * ( Y )
(XY ) 
 n
(  X ) 2
( X 2 ) 
n
Y= rata-rata Y
X=rata-rata X

  Y  X
Subjek (X) Usia (Y) Lama hari rawat X.Y

1 20 5 100
2 30 6 180
3 25 5 125
4 35 7 245
5 40 8 320
(X) = 150 (X) = 31 (XY) = 970

(X2) = 4750 (Y2) = 199


S2Y=62.5 S2X=1.7
• Persamaan garis regresi linier:
(  X ).(  Y ) (150).(31)
(  XY )  (970) 
 n  5  016
.
• X  2
150 2

( X ) 
2
(4750) 
n 5

  Y   X  6.2  016
. .(30)  14
.
Lama hari rawat (Y) = a + b1Xi
• Y’ = 1.4 + 0.16 (Usia)
INFERENSI KOEF KORELASI
• Estimasi r
Exp[2. Zf ]  1 1  1  r  Z(  / 2 )
CI (r )  Zf  . Ln   
Exp[2. Zf ]  1 2  1 r  n  3
• Dari contoh r=0,97pada CI 95%
1  1  r  Z(  / 2 ) 1  1  0.97  196
.
Zf  . Ln     . Ln     [0.7064   3.4782]
2  1  r  n 3 2  1  0.97  5 3

• Batas bawah r
Exp[2. Zf ]  1 Exp[2(0.7064)]  1
CI (r )    0.61
Exp[2. Zf ]  1 Exp[2(0.7064)]  1

• Batas atas r
Exp[2. Zf ]  1 Exp[2(3.4782)]  1
CI (r )    0.99
Exp[2. Zf ]  1 Exp[2(3.4782)]  1
Uji hipotesis r
• Ho Γ=0 Ha Γ≠0
• α=0,05
• Uji stat Uji t
n2 5 2
t  r.  0.97  6.91
1 r 2
1  0.97 2

• t=6,91df n-2….pv ,0,005


• Ho ditolak
Inferens Koef Reg β
Lama hari rawat (Y) =  + 1Xi
Yi = 1.4 + 0.16 (Usia)
CI =95
• 95% CI

SE 
(n  1)
 (n  2) 
. S 2 y  ( 2 . S 2 x )
  (5  1) (5  2).17.  (016. ) (62.5))  0.00863
2

(n  1). S 2 x (5  1)62.5

95%CI     Z( / 2) . SE


95%CI   016
.  196
. (0.00863)  [014
.   017
. ]
UJi hipotesis β
• Ho β=0 Ha: β≠0
• a=0,05
• Uji Hipotesis:
 016
.
t    18.54
SE 0.00863
• t=18,54 df=n-2 pv < 0,005
• Keputusan uji Ho ditolak
• Kesimpulan koef β tidaknsama dengan 0