Anda di halaman 1dari 47

Universitas Gadjah Mada

Fakultas Teknik
Departemen Teknik Sipil dan Lingkungan

REGRESI DAN KORELASI


Statistika dan Probabilitas
Kurva Regresi
2

q Mencari garis/kurva yang mewakili serangkaian titik data


q Ada dua cara untuk melakukannya, yaitu
q Regresi
q Interpolasi
q Aplikasi di bidang enjiniring
q Pola perilaku data (trend analysis)
q Uji hipotesis (hypothesis testing)

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Kurva Regresi
3

q Pemakaian regresi
q Apabila data menunjukkan tingkat kesalahan yang cukup signifikan atau
menunjukkan adanya noise
q Untuk mencari satu kurva tunggal yang mewakili pola umum perilaku data
q Kurva yang dicari tidak perlu melewati setiap titik data

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Kurva Regresi
4

q Interpolasi
q Diketahui bahwa data sangat akurat
q Untuk mencari satu atau serangkaian kurva yang melewati setiap titik data
q Untuk memperkirakan nilai-nilai di antara titik-titik data
q Extrapolasi
q Mirip dengan interpolasi, tetapi untuk memperkirakan nilai-nilai di luar range
titik-titik data

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Kurva Regresi terhadap Data Pengukuran
5

q Analisis pola perilaku data


q Pemanfaatan pola data (pengukuran, eksperimen) untuk melakukan perkiraan
q Apabila data persis (akurat): interpolasi
q Apabila data tak persis (tak akurat): regresi
q Uji hipotesis
q Pembandingan antara hasil teori atau hasil hitungan dengan hasil pengukuran

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Beberapa Parameter Statistik
6
merepresentasikan sebaran data

Rata-rata aritmatik, mean 1


q y=
n
∑ yi

q Deviasi standar, simpangan St 2


baku, standard deviation sy = St = ∑ ( y i − y )
n −1

q Varian (‘ragam’), variance St


sy 2 =
n −1
q Coefficient of variation s
cv = y 100%
y
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17
Distribusi Probabilitas
7

frek
Distribusi Normal
salah satu distribusi/sebaran data
yang sering dijumpai adalah
distribusi normal

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


8 Regresi
Regresi linear: metode kuadrat terkecil
Regresi hubungan tak-linear yang dilinearkan

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi: Metode Kuadrat Terkecil
9

q Mencari satu kurva atau satu fungsi (pendekatan) yang sesuai dengan pola
umum yang ditunjukkan oleh data
q Datanya menunjukkan kesalahan yang cukup signifikan
q Kurva tidak perlu memotong setiap titik data
q Regresi linear
q Regresi persamaan-persamaan tak-linear yang dilinearkan
q Regresi tak-linear

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi: Metode Kuadrat Terkecil
10

q Bagaimana caranya?
q Program komputer
q Spreadsheet (Microsoft Excel)
q Program aplikasi: Matlab, Octave, Scilab

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
11

q Mencari suatu kurva lurus yang cocok menggambarkan pola serangkaian titik
data: (x1,y1), (x2,y2) … (xn,yn)

yreg = a0 + a1x
a0 : intercept
a1 : slope, gradien

q Microsoft Excel
q INTERCEPT(y1:yn;x1:xn)
q SLOPE(y1:yn;x1:xn)

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
12

q Kesalahan atau residu (e) adalah perbedaan antara nilai y sesungguhnya


(data y) dan y nilai pendekatan (yreg) menurut persamaan linear a0 + a1x.

e = y − y reg = y − a0 − a1x

q Meminimumkan jumlah kuadrat residu tersebut

min !" Sr #$ = min !" ∑ ei 2 #$ = min !' ∑ ( y i − a0 − a1xi ) #(


2

" $

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
13

q Bagaimana cara mencari


koefisien a0 dan a1?
q Diferensialkan persamaan
tersebut dua kali, masing-masing ∂Sr
= −2∑ ( y i − a0 − a1xi ) = 0
terhadap a0 dan a1. ∂a0
q Samakan kedua persamaan hasil ∂Sr
diferensiasi tersebut dengan nol. = −2∑ ( y i − a0 − a1xi ) xi = 0
∂a1

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
14

q Selesaikan persamaan yang didapat untuk mencari


a0 dan a1

n∑ xi y i − ∑ xi ∑ y i
a1 = 2
n∑ xi − 2
(∑ x )
i

a0 = y − a1x

q dalam hal ini, y dan x masing-masing adalah nilai y rata-rata x rata-rata

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Contoh Regresi Linear
15

Tabel data Grafik/kurva data


i xi yi = f(xi) 7
6
0 1 0.5
5
1 2 2.5

y = f(x)
4
2 3 2 3
3 4 4 2
4 5 3.5 1
5 6 6 0
0 1 2 3 4 5 6 7
6 7 5.5 X
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17
Hitungan Regresi Linear
16

i xi yi xi yi xi2 yreg (yi−yreg)2 (yi−ymean)2


0 1 0.5 0.5 1 0.910714 0.168686 8.576531
1 2 2.5 5 4 1.75 0.5625 0.862245
2 3 2.0 6 9 2.589286 0.347258 2.040816
3 4 4.0 16 16 3.428571 0.326531 0.326531
4 5 3.5 17.5 25 4.267857 0.589605 0.005102
5 6 6.0 36 36 5.107143 0.797194 6.612245
6 7 5.5 38.5 49 5.946429 0.199298 4.290816
∑= 28 24.0 119.5 140 ∑= 2.991071 22.71429

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Hitungan Regresi Linear
17

n∑ xi y i − ∑ xi ∑ y i 7 (119.5) − 28 (24)
a1 = 2
= 2
= 0.839286
n∑ xi − 2
(∑ x ) i
7 (140) − (28)

24
y= = 3.4
7
28
x= =4
7
a0 = 3.4 − 0.839286 ( 4) = 0.071429

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Hitungan Regresi Linear
18

7
6
5
4
Y

3 data
y reg = a0 + a1x
2 regresi
1
0
0 1 2 3 4 5 6 7 8
X

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
19

q Kuantifikasi kesalahan
q Kesalahan standar

Sr
Sr = å (yi - a0 - a1xi )
2
sy x =
n -2

q Perhatikan kemiripannya dengan simpangan baku

St
St = å (y i - y )
2
sy =
n -1

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
20

q Beda antara kedua kesalahan tersebut menunjukkan perbaikan atau


pengurangan kesalahan
St − S r koefisien determinasi
r2 =
St (coefficient of determination)

r=
(∑ x ) (∑ y )
n∑ xi y i − i i koefisien korelasi
2 2 (correlation coefficient)
n∑ x − (∑ x ) n∑ y − (∑ y )
i
2
i i
2
i

−1 ≤ r ≤ +1

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Hitungan regresi linear
21

2
Sr = ∑ ( y i − a0 − a1xi ) = 2.991071
2
St = ∑ ( y i − y ) = 22.71429

St − Sr 22.71429 − 2.991071
r2 = = = 0.868318
St 22.71429
r = 0.931836

−1 ≤ r ≤ +1

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


22 Regresi
Linearisasi persamaan tak-linear

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Regresi Linear
23

q Linearisasi persamaan-persamaan tak-linear


q Logaritmik menjadi linear
q Eksponensial menjadi linear
q Pangkat (polinomial tingkat n > 1) menjadi linear (polinomial tingkat 1)
q Dll.

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Linearisasi Persamaan Tak-Linear
24

y ln y
ln y = ln a1 + b1 x

y = a1 eb1x b1
1

ln a1
x x

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Linearisasi Persamaan Tak-Linear
25

y log y log y = log a2 + b2 log x

y = a2 xb2 b2
1

x log x
logb2

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Linearisasi Persamaan Tak-Linear
26

1 b3 + x 1 b3 1
y 1/y = = +
y a3 x a3 a3 x

x b3 a3
y = a3
b3 + x 1 a3 1

x 1/x

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


27 Korelasi
Korelasi
Korelasi serial (auto korelasi)

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Koefisien Korelasi
28

St − S r S St − S r Sr
r2 = = 1− r r= = 1− q koefisien korelasi
St St St St
2

St = å (y i - y ) ∑ (y − y )
2
i reg
r = 1− 2
∑ (y − y )
i

Sr = å (yi - a0 - a1xi )
2
2

r = 1−
∑ (y − a − a x )
i 0 1 i
2
∑ (y − y )
i

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Koefisien Korelasi
29

∑ (y i − a0 − a1xi )
2
r=
(∑ x ) (∑ y )
n∑ xi y i − i i
r = 1− 2 2 2
∑ (y − y )
i n∑ x − (∑ x ) n∑ y − (∑ y )
i
2
i i
2
i

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Koefisien Korelasi
30

r=
(∑ x ) (∑ y )
n∑ xi y i − i i
2 2
n∑ x − (∑ x ) n∑ y − (∑ y )
i
2
i i
2
i

2 2

sX ,Y =
∑ ( )(
X i − X Yi −Y ) sX =
∑( Xi − X ) sY =
∑( Yi −Y )
! n−1 n−1 n−1

kovarian X dan Y simpangan baku X simpangan baku Y

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Koefisien Korelasi
31

sX ,Y = COVARIANCE. S(X,Y)
r = rX ,Y = rX ,Y ←
sX sY = STDEV . S(X) × STDEV . S(Y)
! MS Excel

r ← = CORREL(X ,Y )
! X ,Y

q koefisien korelasi antara variabel random X dan Y

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Koefisien Korelasi
32

q Pengertian koefisien korelasi


q Koefisien korelasi menunjukkan tingkat keeratan hubungan linear antara suatu
variabel random Y dan suatu variabel kedua yang merupakan fungsi linear dari
satu atau lebih variabel(-variabel) X
n Setiap variabel X dapat berupa variabel random atau bukan variabel random

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Koefisien Korelasi
33

q Nilai koefisien korelasi adalah −1 < rX,Y < 1


q rX,Y = ±1 menunjukkan hubungan linear sempurna antara X dan Y
q rX,Y = 0 menunjukkan independensi (ketidak-gantungan) linear,
namun dapat saja keduanya memiliki hubungan
(kebergantungan) yang lain, yang tidak linear
q Jika X dan Y tidak saling bergantung (independent), maka rX,Y = 0
q Koefisien korelasi sampel dan populasi
q rX,Y koefisien korelasi sampel
q ρX,Y koefisien korelasi populasi

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Inferensi terhadap Koefisien Korelasi Populasi
34

q Dua variabel random


q tak berkorelasi, ρX,Y = 0

q berkorelasi, ρX,Y ≠ 0

q Situasi
q Sampel yang diperoleh dari variabel random yang tidak berkorelasi

n jarang menunjukkan nilai rX,Y = 0


n koefisien korelasi sering rX,Y ≠ 0, karena kebetulan
q Oleh karena itu perlu pengujian
n untuk mengetahui penyimpangan koefisien korelasi dari nol tersebut benar disebabkan oleh
kebetulan, atau
n penyimpangan tersebut terlalu besar untuk dikatakan sebagai akibat kebetulan

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Inferensi terhadap ρ
35

q Uji hipotesis
q H0: ρX,Y = 0
q H1: ρX,Y ≠ 0
12
⎡n−2⎤
statistik uji T =r⎢ 2⎥
T > t1−α 2,n−2
H0 ditolak
⎣ 1− r ⎦

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Inferensi terhadap ρ
36

q Uji hipotesis
q H0: ρX,Y = ρ* (ρ* konstanta) ukuran sampel n > 25
q H1: ρX,Y ≠ ρ*

( )( )
12
statistik uji Z = W −ω n−3 Z > z1−α 2 H0 ditolak
⎡ 1+ r ⎤ $ 1+ρ '
W = ln⎢ 1
2
⎥ = arctanh r ω = ln&1
2 ) = arctanhρ
⎣1− r ⎦ ! %1−ρ (
# & # &
z z
q Rentang keyakinan ρ: l = tanh%%W − 1−α 21 2 (( u = tanh%%W + 1−α 21 2 ((
!
%$ n−3 ('( )!
%$ n−3 (' ( )
http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17
Korelasi Serial
37

q Korelasi serial (serial correlation)


q dikenal pula sebagai autokorelasi (autocorrelation)
q yaitu korelasi antara data hasil pengukuran pada suatu waktu dengan data
hasil pengukuran pada waktu sebelumnya
q elemen dalam sampel yang memiliki korelasi serial bukan elemen random
(ingat definisi variabel random)

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Korelasi Serial
38

q Pada korelasi serial, dengan demikian


q sampel berukuran n yang memiliki korelasi serial akan memberikan informasi
yang lebih sedikit dibandingkan dengan informasi yang dimiliki oleh sampel
random berukuran n
q sebagian informasi pada sampel yang memiliki korelasi serial dapat diperoleh
dari atau telah diketahui dalam data hasil pengukuran pada waktu sebelumnya

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Korelasi Serial
39

q Korelasi serial (serial correlation)


q Dapat pula dijumpai antara suatu pengukuran pada waktu tertentu dengan
pengukuran pada waktu k periode waktu sebelumnya (terdahulu), k = 1,2, …
q Asumsi
n Selang waktu antar pengukuran adalah sama (seragam)
n Sifat-sifat statistis proses atau peristiwa yang diukur tidak berubah terhadap waktu
(bersifat permanen)
n ρ(k) koefisien korelasi serial populasi
r(k) koefisien korelasi serial sampel

http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17


Korelasi Serial
40

n−k n−k n−k

∑x x i i+k
− ∑ xi ∑ xi+k (n−k ) xi = X i − X i
r(k) = i=1 i=1
12
i=1
12
) n−k # n−k &
2 , ) n−k # n−k &
2 , x = X i+k − X i+k
+ x 2 −% x ( ! i+k
( n−k .
) + x 2 −% x (
( n−k .
)
+∑ i %∑ i (
$ i=1 ' . +∑ i+k %∑ i+k (
$ i=1 ' .
! * i=1 - * i=1 -

sX ,X = COVARIANCE. S (X I , X i+k )
r(k) = rX ,X = i i+k
r (k) ←
i i+k
sX sX = STDEV . S (X I ) × STDEV . S (X i+k )
! i i+k

r ( k ) ← = CORREL (X I , X I+K )

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


Korelasi Serial
41

q r(0) = 1 korelasi suatu elemen data dengan dirinya sendiri adalah sama
dengan satu
q semakin besar k, jumlah pasangan data untuk menghitung r(k) semakin
sedikit; r(k) adalah nilai estimasi ρ(k)
q oleh karena itu, k << n
q jika ρ(k) = 0 untuk semua k, maka proses atau peristiwa atau populasi
tersebut bersifat random murni

http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17


42 Regresi
Regresi linear ganda (multiple linear regression)

10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Regresi Linear Ganda
43

q Misal variabel y adalah fungsi linear dua variabel bebas x1 dan x2

y = a0 + a1x1 + a2x2

q Koefisien a0, a1, a2 pada persamaan di atas dapat ditemukan dengan metode
kuadrat terkecil kesalahan (error)
n
2
Sr = ∑ ( y i − a0 − a1x1i − a2x2i )
i=1

10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Regresi Linear Ganda
44

q Diferensial parsial persamaan q Samakan persamaan diferensial


tersebut terhadap masing-masing tsb dengan nol dan atur suku-suku
koefisien adalah sbb. dalam persamaan
n
∂Sr n n n

∂a0
(
= −2∑ yi −a0 −a1 x1i −a2 x2i ) na0 + ∑ x1i a1 + ∑ x2i a2 = ∑ yi
i=1 i=1 i=1 i=1
n n n n n
∂Sr
∂a1
(
= −2∑ x1i yi −a0 −a1 x1i −a2 x2i ) ∑x 1i
2
a0 + ∑ x1i a1 + ∑ x1i x2i a2 = ∑ x1i yi
i=1 i=1 i=1 i=1 i=1
n n n n n
∂Sr
∂a2
(
= −2∑ x2i yi −a0 −a1 x1i −a2 x2i ) x a + x x a + x 2
∑ 2i 0 ∑ 1i 2i 1 ∑ 2i a2 = ∑ x2i yi
i=1
! i=1 i=1 i=1 i=1
10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Regresi Linear Ganda
45

q Persamaan-persamaan linear tersebut dapat dituliskan dalam bentuk


persamaan matriks sbb.
⎡ n n ⎤ ⎧ n ⎫
⎢ n ∑x 1i ∑x 2i
⎥ ⎪ ∑ yi ⎪⎪
⎢ ⎥⎧ ⎫ ⎪

i=1 i=1
a
⎥⎪ 0 ⎪ ⎪
i=1
⎪⎪
n n n n
⎢ ∑x ∑x 2
∑x x2i ⎥⎪⎨ a ⎪⎬ = ⎪⎨ ∑ x1i yi ⎬
⎢ 1i 1i 1i ⎥⎪ 1 ⎪ ⎪
i=1 i=1 i=1 i=1 ⎪
⎢ n n n
⎥⎪⎩ a2 ⎪⎭ ⎪ n ⎪
⎢ 2 ⎥
⎢ ∑x 2i ∑x 1i
x2i ∑x 2 ⎥

⎪⎩
∑ x2i yi ⎪⎪
⎣ i=1 i=1 i=1 ⎦ i=1 ⎭
10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Contoh
46

q Temukanlah persamaan linear x1 x2 y


yang mewakili pola sebaran 0 0 5
data dalam tabel di samping ini. 2 1 10
q Jawab 2.5 2 9
y = 5+ 4x1 − 3x2 1 3 0
4 6 3
r2 = 1
7 2 27

10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
47 http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17

Anda mungkin juga menyukai