KORELASI
Statistika dan Probabilitas
Kurva
Regresi
2
Pemakaian regresi
Apabila data menunjukkan tingkat kesalahan yang cukup signifikan atau
menunjukkan adanya noise
Untuk mencari satu kurva tunggal yang mewakili pola umum perilaku
data
Kurva yang dicari tidak perlu melewati setiap titik data
Kurva
Regresi
4
Interpolasi
Diketahui bahwa data sangat akurat
Untuk mencari satu atau serangkaian kurva yang melewati setiap titik data
Untuk memperkirakan nilai-nilai di antara titik-titik data
Extrapolasi
Mirip dengan interpolasi, tetapi untuk memperkirakan nilai-nilai di luar
range titik-titik data
Kurva Regresi terhadap Data Pengukuran
5
1
y n y i
fre
k
Distribusi Normal
salah satu distribusi/sebaran data
yang sering dijumpai adalah
distribusi normal
X
8 Regresi
Regresi linear: metode kuadrat terkecil
Regresi hubungan tak-linear yang dilinearkan
Regresi: Metode Kuadrat
Terkecil
9
Mencari satu kurva atau satu fungsi (pendekatan) yang sesuai dengan pola
umum yang ditunjukkan oleh data
Datanya menunjukkan kesalahan yang cukup signifikan
Kurva tidak perlu memotong setiap titik data
Regresi linear
Regresi persamaan-persamaan tak-linear yang dilinearkan
Regresi tak-linear
Regresi: Metode Kuadrat
Terkecil
10
Bagaimana caranya?
Program komputer
Spreadsheet (Microsoft Excel)
Program aplikasi: Matlab, Octave, Scilab
Regresi
Linear
11
yreg = a0 + a1x
a0 : intercept
a1 : slope,
gradien
Microsoft Excel
INTERCEPT(y1:yn;x1:
xn)
SLOPE(y1:yn;x1:xn)
Regresi
Linear
12
e y yreg y a0 a1x
e 2
min S r y i a 0 a 1
2
i i
min min x
Regresi
Linear
13
a0 dan a1
a1 n
x y x
i
n x x
i i 2
2
i i
a0 yyai 1x
dalam hal ini, y dan x masing-masing adalah nilai y rata-rata x rata-rata
Contoh Regresi
Linear
15
y = f(x)
4
2 3 2 3
3 4 4 2
4 5 3.5 1
5 6 6 0
0 1 2 3 4 5 6 7
6 7 5.5 X
Hitungan Regresi
Linear
16
i xi y i xy i i
xi2
yreg (yi−yreg)2 (yi−ymean)2
0 1 0.5 0.5 1 0.910714 0.168686 8.576531
1 2 2.5 5 4 1.75 0.5625 0.862245
2 3 2.0 6 9 2.589286 0.347258 2.040816
3 4 4.0 16 16 3.428571 0.326531 0.326531
4 5 3.5 17.5 25 4.267857 0.589605 0.005102
5 6 6.0 36 36 5.107143 0.797194 6.612245
6 7 5.5 38.5 49 5.946429 0.199298 4.290816
∑= 28 24.0 119.5 140 ∑= 2.991071 22.71429
Hitungan Regresi
Linear
17
7 119.5 2824
a n
x y x
i
2 0.839286
n x x
i
7 140
1 i 2
2
i i
y 28
24
i
y 7 3.4
28
x 74
a0 3.4 0.8392864 0.071429
Hitungan Regresi
Linear
18
7
6
5
4
Y
3 data
y reg a 0 a1x
2 regresi
1
0
0 1 2 3 4 5 6 7 8
X
Regresi
Linear
19
Kuantifikasi
kesalahan
Kesalahan standar
Sr 2
sy x
n Sr yi a0 a1 ix
2
Perhatikan kemiripannya dengan simpangan baku
St S y y
sy
n 1 t
2
i
Regresi
Linear
20
Sr koefisien determinasi
St
r
2
St (coefficient of
determination)
r x y
n xi y i i i
koefisien korelasi
(correlation
n y y
n xi2 x i
2 2
i
2
i coefficient)
−1 ≤ r ≤ +1
Hitungan regresi
linear
21
2
Sr y i a0 a1xi 2.991071
2
St y i y 22.71429
Sr 22.71429 2.991071
S 0.868318
r2 t S 22.71429
t
r 0.931836
−1 ≤ r ≤ +1
22 Regresi
Linearisasi persamaan tak-linear
Regresi
Linear
23
y ln
y ln y lna1 b1
x
y a1 e b1x b1
1
ln a1
x x
Linearisasi Persamaan Tak-
Linear
25
y a2 x b 2 b2
1
x log x
logb2
Linearisasi Persamaan Tak-
Linear
26
1/y 1 b3 x 1 b3 1
y
y a3 x a3 a3 x
x b3 a3
ya
3 3 x 1
b 1 a3
x 1/x
27 Korelasi
Korelasi
Korelasi serial (auto
korelasi)
Koefisien
Korelasi
28
Sr 1 Sr St S r
S
r2 t S r koefisien
St St 1
t korelasi
Sr
S y y y y
2
reg
r
i
1 St
t y y
2 2
i i
2
Sr yi a a
0 1i 2
y a0 a12xi
y
x r 1 y
i
Koefisien
Korelasi
29
x y
2
y i a 0 a 1xi r n xi y i
r 1 2
i i
y y n y y
n xi2 x i
2 2
i
i
2
i
Koefisien
Korelasi
30
r n xi y i x y
i i
n xi2 x i n y
2 2
2
y
i
i
2 2
s XY ,
X X Y Y
i i
sX X X
i
sY Y Y
i
n1 n1 n1
kovarian X dan Y
simpangan baku X
simpangan baku Y
Koefisien
Korelasi
31
COVARIANCE.
sX ,Y rX ,
r rX , s s S(X,Y)
Y X Y Y
STDEV . S(X) MS
STDEV . S(Y) Excel
CORREL(X ,Y
rX ,Y
)
Uji hipotesis
H0: ρX,Y = 0
H1: ρX,Y ≠ 0
12
⎡n 2 ⎤
statistik Tr⎢ 2 T t1 2,n2
H0 ditolak
uji ⎣⎥1 r
⎦
Inferensi terhadap ρ
36
Uji hipotesis
H0: ρX,Y = ρ* (ρ* konstanta) ukuran sampel n > 25
H1: ρX,Y ≠ ρ*
Z z1 2 H0 ditolak
statistik uji Z W
W 21 ln⎢⎡1 r 1 1
2 ln1
⎥⎤1 narctanh
3
12
r
arctanh
⎣r
⎦ z z
Rentang keyakinan l tanh
W 1 2 1 2 u tanh
W 1 2 1 2
ρ: n
n
3 3
Korelasi
Serial
37
nk nk
nk
r(k)
i1 xi xik
i1x i x ik n xi Xi X i
i1 1 2 2 1 2
2
nk
nk xik Xik Xik
i2
n
2
nk xik
k
n
x
ik
x
nk xi
i1 i1 k
i1 i1 k
sX ,X
r(k) r i ik
COVARIANCE. S X I ,
X i ,Xik sX s r k
STDEV. SIX STDEV. ik
i Xik
X ik
r k CORREL X I ,
SX
Korelasi
Serial
41
r(0) = 1 korelasi suatu elemen data dengan dirinya sendiri adalah sama
dengan satu
semakin besar k, jumlah pasangan data untuk menghitung r(k)
semakin sedikit; r(k) adalah nilai estimasi ρ(k)
oleh karena itu, k << n
jika ρ(k) = 0 untuk semua k, maka proses atau peristiwa atau populasi
tersebut bersifat random murni
42 Regresi
Regresi linear ganda (multiple linear
regression)
Regresi Linear Ganda
43
y a0 a1x1 a2x2
Koefisien a0, a1, a2 pada persamaan di atas dapat ditemukan dengan metode
kuadrat terkecil kesalahan (error)
n
i1
Regresi Linear Ganda
44
a1 1
2
1i 0 1i 1 1i 2i 2 1i i
i1 1i 2 i1
x a x a i1
x x a i1
x y
2i
S rr 2x y a a x a xx
n n
i1 n
2i i 0 1 1i 2 2i
n n
⎢ x 1i x 2
1i
x 1i x2i ⎥⎨ a ⎪
0⎥ 1
⎬ ⎨ 1i i
⎬
⎪
⎪
⎢ i1 i1 i1
⎪
⎥⎪ a2 ⎪⎪ x⎪ yn
n n i1
⎢ ⎩
⎢ x x1i x 2i
x
n 2
2
⎪
⎥
⎥ ⎪
⎪
⎪
⎪
⎣ i1 2i i1 ⎭
⎦ i1 x 2i y i
i1 ⎭
⎩
Conto
h Temukanlah persamaan linear
46
x1 x2 y
yang mewakili pola sebaran 0 0 5
data dalam tabel di samping ini. 2 1 10
Jawab 2.5 2 9
y 5 4x1 3x2 1 3 0
4 6 3
r 1
2
7 2 27