Anda di halaman 1dari 47

REGRESI DAN

KORELASI
Statistika dan Probabilitas
Kurva
Regresi
2

Mencari garis/kurva yang mewakili serangkaian titik data


 Ada dua cara untuk melakukannya, yaitu
 Regresi
 Interpolasi
 Aplikasi di bidang enjiniring
 Pola perilaku data (trend analysis)
 Uji hipotesis (hypothesis testing)
Kurva
Regresi
3

Pemakaian regresi
 Apabila data menunjukkan tingkat kesalahan yang cukup signifikan atau
menunjukkan adanya noise
 Untuk mencari satu kurva tunggal yang mewakili pola umum perilaku
data
 Kurva yang dicari tidak perlu melewati setiap titik data
Kurva
Regresi
4

Interpolasi
 Diketahui bahwa data sangat akurat
 Untuk mencari satu atau serangkaian kurva yang melewati setiap titik data
 Untuk memperkirakan nilai-nilai di antara titik-titik data
 Extrapolasi
 Mirip dengan interpolasi, tetapi untuk memperkirakan nilai-nilai di luar
range titik-titik data
Kurva Regresi terhadap Data Pengukuran
5

 Analisis pola perilaku data


 Pemanfaatan pola data (pengukuran, eksperimen) untuk melakukan perkiraan
 Apabila data persis (akurat): interpolasi
 Apabila data tak persis (tak akurat): regresi
 Uji hipotesis
 Pembandingan antara hasil teori atau hasil hitungan dengan hasil pengukuran
Beberapa Parameter Statistik
6

 Rata-rata aritmatik, mean


merepresentasikan sebaran data

1
y  n y i

 Deviasi standar, simpangan St 2


baku, standard deviation sy 
n St  y i  y
1
 Varian (‘ragam’), sy 2  t
S 
variance n
s1
 Coefficient of y
c 
variation v
y
100%
Distribusi
Probabilitas
7

fre
k
Distribusi Normal
salah satu distribusi/sebaran data
yang sering dijumpai adalah
distribusi normal

X
8 Regresi
Regresi linear: metode kuadrat terkecil
Regresi hubungan tak-linear yang dilinearkan
Regresi: Metode Kuadrat
Terkecil
9

Mencari satu kurva atau satu fungsi (pendekatan) yang sesuai dengan pola
umum yang ditunjukkan oleh data
 Datanya menunjukkan kesalahan yang cukup signifikan
 Kurva tidak perlu memotong setiap titik data
 Regresi linear
 Regresi persamaan-persamaan tak-linear yang dilinearkan
 Regresi tak-linear
Regresi: Metode Kuadrat
Terkecil
10

Bagaimana caranya?
 Program komputer
 Spreadsheet (Microsoft Excel)
 Program aplikasi: Matlab, Octave, Scilab
Regresi
Linear
11

Mencari suatu kurva lurus yang cocok menggambarkan pola serangkaian


titik data: (x1,y1), (x2,y2) … (xn,yn)

yreg = a0 + a1x
a0 : intercept
a1 : slope,
gradien
 Microsoft Excel
 INTERCEPT(y1:yn;x1:
xn)
 SLOPE(y1:yn;x1:xn)
Regresi
Linear
12

Kesalahan atau residu (e) adalah perbedaan antara nilai y sesungguhnya


(data y) dan y nilai pendekatan (yreg) menurut persamaan linear a0 + a1x.

e  y  yreg  y  a0  a1x

 Meminimumkan jumlah kuadrat residu tersebut

 e 2  
min S r  y i a 0  a 1
2
 i  i

min min  x

Regresi
Linear
13

Bagaimana cara mencari


koefisien a0 dan a1?
 Diferensialkan persamaan
tersebut dua kali, masing- Sr
terhadap
masing a0 dan a1. a0  2y i  a0  a1xi  
 Samakan kedua persamaan hasil Sr 0
diferensiasi tersebut dengan nol. a1  2y i  a0  a1xi xi  0
Regresi
Linear
14

Selesaikan persamaan yang didapat untuk mencari


a0 dan a1

a1  n
 x y  x
i

n x  x
i i 2
2
i i

a0  yyai 1x 

dalam hal ini, y dan x masing-masing adalah nilai y rata-rata x rata-rata
Contoh Regresi
Linear
15

Tabel data Grafik/kurva data


i xi yi = f(xi) 7
6
0 1 0.5
5
1 2 2.5

y = f(x)
4
2 3 2 3
3 4 4 2
4 5 3.5 1
5 6 6 0
0 1 2 3 4 5 6 7
6 7 5.5 X
Hitungan Regresi
Linear
16

i xi y i xy i i
xi2
yreg (yi−yreg)2 (yi−ymean)2
0 1 0.5 0.5 1 0.910714 0.168686 8.576531
1 2 2.5 5 4 1.75 0.5625 0.862245
2 3 2.0 6 9 2.589286 0.347258 2.040816
3 4 4.0 16 16 3.428571 0.326531 0.326531
4 5 3.5 17.5 25 4.267857 0.589605 0.005102
5 6 6.0 36 36 5.107143 0.797194 6.612245
6 7 5.5 38.5 49 5.946429 0.199298 4.290816
∑= 28 24.0 119.5 140 ∑= 2.991071 22.71429
Hitungan Regresi
Linear
17

7 119.5  2824
a  n
 x y  x
i
 2  0.839286
n x  x
i
7 140 
1 i 2
2
i i

y 28
24
i

y  7  3.4

28
x 74
a0  3.4  0.8392864  0.071429
Hitungan Regresi
Linear
18

7
6
5
4
Y

3 data
y reg  a 0  a1x
2 regresi
1
0
0 1 2 3 4 5 6 7 8
X
Regresi
Linear
19

Kuantifikasi
kesalahan
 Kesalahan standar
Sr 2
sy x 
n Sr   yi  a0  a1 ix 
2
 Perhatikan kemiripannya dengan simpangan baku

St S   y  y
sy 
n 1 t
2
i
Regresi
Linear
20

Beda antara kedua kesalahan tersebut menunjukkan perbaikan atau


pengurangan kesalahan

 Sr koefisien determinasi
St
r 
2
St (coefficient of
determination)
r  x  y
n  xi y i  i i
koefisien korelasi
(correlation
  n y y
n xi2  x i
2 2
 i
2
i coefficient)
 
 −1 ≤ r ≤ +1
Hitungan regresi
linear
21

2
Sr  y i  a0  a1xi   2.991071
2
St  y i  y   22.71429

 Sr 22.71429  2.991071
S   0.868318
r2  t S 22.71429
t

r  0.931836

−1 ≤ r ≤ +1
22 Regresi
Linearisasi persamaan tak-linear
Regresi
Linear
23

Linearisasi persamaan-persamaan tak-linear


 Logaritmik menjadi linear
 Eksponensial menjadi linear
 Pangkat (polinomial tingkat n > 1) menjadi linear (polinomial tingkat
1)
 Dll.
Linearisasi Persamaan Tak-
Linear
24

y ln
y ln y  lna1  b1
x
y  a1 e b1x b1
1

ln a1
x x
Linearisasi Persamaan Tak-
Linear
25

y log y logy  loga2  b2 log x

y  a2 x b 2 b2
1

x log x
logb2
Linearisasi Persamaan Tak-
Linear
26

1/y 1 b3  x 1 b3 1
y   
y a3 x a3 a3 x
x b3 a3
ya
3 3  x 1
b 1 a3

x 1/x
27 Korelasi
Korelasi
Korelasi serial (auto
korelasi)
Koefisien
Korelasi
28

 Sr  1 Sr St  S r
S
r2  t S r   koefisien
St St 1
t   korelasi
Sr
S   y  y   y y
2
reg
r
i
1 St
t y  y
2 2

i i


2

Sr   yi  a  a
0 1i 2

 y a0  a12xi 
y
x r 1 y
i


Koefisien
Korelasi
29

  x  y
2
y i  a 0 a 1xi r n  xi y i 
r  1  2
i i

 y y    n y y
n xi2  x i
2 2
i
 i
2
i
 

Koefisien
Korelasi
30

r n  xi y i   x  y
i i

 
n xi2  x i n  y 
2 2
 2

 y
i
 i


2 2

s XY , 
X  X Y Y
i i
sX   X  X
i
sY  Y Y
i
n1 n1 n1

kovarian X dan Y 
simpangan baku X 
simpangan baku Y
Koefisien
Korelasi
31

 COVARIANCE.
sX ,Y rX , 
r  rX ,  s s S(X,Y)
Y X Y Y
 STDEV . S(X)  MS
STDEV . S(Y) Excel
  CORREL(X ,Y
rX ,Y
)

 koefisien korelasi antara variabel random X dan Y


Koefisien
Korelasi
32

Pengertian koefisien korelasi


 Koefisien korelasi menunjukkan tingkat keeratan hubungan linear antara
suatu variabel random Y dan suatu variabel kedua yang merupakan fungsi linear
dari satu atau lebih variabel(-variabel) X
 Setiap variabel X dapat berupa variabel random atau bukan variabel random
Koefisien
Korelasi
33

Nilai koefisien korelasi adalah −1 < r X,Y <1


 rX,Y = ±1 menunjukkan hubungan linear sempurna antara X dan Y
 rX,Y = 0 menunjukkan independensi (ketidak-bergantungan)
linear, namun dapat saja keduanya memiliki hubungan
(kebergantungan) yang lain, yang tidak linear
 Jika X dan Y tidak saling bergantung (independent), maka rX,Y = 0
 Koefisien korelasi sampel dan populasi
 rX,Y
koefisien korelasi sampel
koefisien korelasi
 ρX,Y
populasi
Inferensi terhadap Koefisien Korelasi
Populasi
34

 Dua variabel random


 tak berkorelasi, ρX,Y = 0
 berkorelasi, ρX,Y ≠ 0
 Situasi
 Sampel yang diperoleh dari variabel random yang tidak berkorelasi

 jarang menunjukkan nilai rX,Y = 0


 koefisien korelasi sering rX,Y ≠ 0, karena kebetulan
 Oleh karena itu perlu pengujian
 untuk mengetahui penyimpangan koefisien korelasi dari nol tersebut disebabkan oleh
kebetulan, atau
 penyimpangan tersebut terlalu besar untuk dikatakan sebagai akibat kebetulan
Inferensi terhadap ρ
35

 Uji hipotesis
 H0: ρX,Y = 0
 H1: ρX,Y ≠ 0
12
⎡n 2 ⎤
statistik Tr⎢ 2 T  t1 2,n2
H0 ditolak
uji ⎣⎥1 r

Inferensi terhadap ρ
36

 Uji hipotesis
 H0: ρX,Y = ρ* (ρ* konstanta) ukuran sampel n > 25
 H1: ρX,Y ≠ ρ*

Z  z1 2 H0 ditolak
statistik uji Z  W  
W  21 ln⎢⎡1 r 1  1 

  2 ln1 
⎥⎤1 narctanh
3
12
r
arctanh
⎣r
   
⎦ z z
 Rentang keyakinan l  tanh
W 1 2 1 2  u  tanh
W 1 2 1 2 
ρ:   n   
n 
 3   3 
Korelasi
Serial
37

Korelasi serial (serial correlation)


 dikenal pula sebagai autokorelasi (autocorrelation)
 yaitu korelasi antara data hasil pengukuran pada suatu waktu dengan data
hasil pengukuran pada waktu sebelumnya
 elemen dalam sampel yang memiliki korelasi serial bukan elemen
random (ingat definisi variabel random)
Korelasi
Serial
38

Pada korelasi serial, dengan demikian


 sampel berukuran n yang memiliki korelasi serial akan memberikan
informasi yang lebih sedikit dibandingkan dengan informasi yang dimiliki
oleh sampel random berukuran n
 sebagian informasi pada sampel yang memiliki korelasi serial dapat diperoleh
dari atau telah diketahui dalam data hasil pengukuran pada waktu sebelumnya
Korelasi
Serial
39

Korelasi serial (serial correlation)


 Dapat pula dijumpai antara suatu pengukuran pada waktu tertentu dengan
pengukuran pada waktu k periode waktu sebelumnya (terdahulu), k = 1,2, …
 Asumsi
 Selang waktu antar pengukuran adalah sama (seragam)
 Sifat-sifat statistis proses atau peristiwa yang diukur tidak berubah terhadap waktu
(bersifat permanen)
 ρ(k koefisien korelasi serial
) populasi koefisien korelasi
r(k) serial sampel
Korelasi
Serial
40

nk nk
nk

r(k) 
i1 xi xik  
i1x i  x ik n xi  Xi  X i
i1 1 2 2 1 2
  2
nk
nk xik  Xik  Xik
 i2 
   
 n  
 
2
nk xik 
k 
 n
x 
ik
  x 
nk xi   
 i1  i1 k  
  i1  i1 k   

sX ,X
r(k)  r  i ik
 COVARIANCE. S X I ,
X i ,Xik sX s r k
 STDEV. SIX  STDEV. ik 

i Xik
X ik 
r k    CORREL X I ,
SX
Korelasi
Serial
41

r(0) = 1 korelasi suatu elemen data dengan dirinya sendiri adalah sama
dengan satu
 semakin besar k, jumlah pasangan data untuk menghitung r(k)
semakin sedikit; r(k) adalah nilai estimasi ρ(k)
 oleh karena itu, k << n
 jika ρ(k) = 0 untuk semua k, maka proses atau peristiwa atau populasi
tersebut bersifat random murni
42 Regresi
Regresi linear ganda (multiple linear
regression)
Regresi Linear Ganda
43

 Misal variabel y adalah fungsi linear dua variabel bebas x1 dan x2

y  a0  a1x1  a2x2

 Koefisien a0, a1, a2 pada persamaan di atas dapat ditemukan dengan metode
kuadrat terkecil kesalahan (error)
n

Sr  y i  a0  a1x1i  a2 x2i 


2

i1
Regresi Linear Ganda
44

 Diferensial parsial persamaan  Samakan persamaan diferensial


tersebut terhadap masing-masing tsb dengan nol dan atur suku-
koefisien adalah sbb. suku dalam persamaan
S n
i 0 n n n
1
a0 1i 2
na0   x 1i a1   x2i a2   yi

i1 2i i1 i1
S n 1i i 0 n i1 n n n

a1  1
   
2
  

1i 0 1i 1 1i 2i 2 1i i
i1 1i 2 i1
x a x a i1
x x a i1
x y
2i
S rr  2x y  a  a x  a xx
n n
i1 n

  2i i 0 1 1i 2 2i
n n

a2 2 i1  x 2i a0   x1i x2i a1 



2
x
x 2i a2  i1 2i
yi

i1 i1
i1
Regresi Linear Ganda
45

 Persamaan-persamaan linear tersebut dapat dituliskan dalam bentuk


persamaan matriks sbb.
⎡ n n ⎤ ⎧ n ⎫
⎢ n  x1i  x 2i ⎥ ⎪  yi ⎪
⎢ i1 i1 ⎥⎧ ⎫ ⎪ i1 ⎪
⎢ a ⎪
n n n
⎥⎪ ⎪ n

⎢  x 1i x 2
1i
 x 1i x2i ⎥⎨ a ⎪
0⎥ 1
⎬  ⎨ 1i i



⎢ i1 i1 i1

⎥⎪ a2 ⎪⎪ x⎪ yn

n n i1
⎢ ⎩
⎢ x  x1i x 2i
x
n 2
2


⎥ ⎪ 



⎣ i1 2i i1 ⎭
⎦ i1 x 2i y i
i1 ⎭

Conto
h Temukanlah persamaan linear
46

 x1 x2 y
yang mewakili pola sebaran 0 0 5
data dalam tabel di samping ini. 2 1 10
 Jawab 2.5 2 9

y  5 4x1  3x2 1 3 0
4 6 3
r 1
2
7 2 27

Anda mungkin juga menyukai