Fakultas Teknik
Departemen Teknik Sipil dan Lingkungan
q Pemakaian regresi
q Apabila data menunjukkan tingkat kesalahan yang cukup signifikan atau
menunjukkan adanya noise
q Untuk mencari satu kurva tunggal yang mewakili pola umum perilaku data
q Kurva yang dicari tidak perlu melewati setiap titik data
q Interpolasi
q Diketahui bahwa data sangat akurat
q Untuk mencari satu atau serangkaian kurva yang melewati setiap titik data
q Untuk memperkirakan nilai-nilai di antara titik-titik data
q Extrapolasi
q Mirip dengan interpolasi, tetapi untuk memperkirakan nilai-nilai di luar range
titik-titik data
frek
Distribusi Normal
salah satu distribusi/sebaran data
yang sering dijumpai adalah
distribusi normal
q Mencari satu kurva atau satu fungsi (pendekatan) yang sesuai dengan pola
umum yang ditunjukkan oleh data
q Datanya menunjukkan kesalahan yang cukup signifikan
q Kurva tidak perlu memotong setiap titik data
q Regresi linear
q Regresi persamaan-persamaan tak-linear yang dilinearkan
q Regresi tak-linear
q Bagaimana caranya?
q Program komputer
q Spreadsheet (Microsoft Excel)
q Program aplikasi: Matlab, Octave, Scilab
q Mencari suatu kurva lurus yang cocok menggambarkan pola serangkaian titik
data: (x1,y1), (x2,y2) … (xn,yn)
yreg = a0 + a1x
a0 : intercept
a1 : slope, gradien
q Microsoft Excel
q INTERCEPT(y1:yn;x1:xn)
q SLOPE(y1:yn;x1:xn)
e = y − y reg = y − a0 − a1x
" $
n∑ xi y i − ∑ xi ∑ y i
a1 = 2
n∑ xi − 2
(∑ x )
i
a0 = y − a1x
y = f(x)
4
2 3 2 3
3 4 4 2
4 5 3.5 1
5 6 6 0
0 1 2 3 4 5 6 7
6 7 5.5 X
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17
Hitungan Regresi Linear
16
n∑ xi y i − ∑ xi ∑ y i 7 (119.5) − 28 (24)
a1 = 2
= 2
= 0.839286
n∑ xi − 2
(∑ x ) i
7 (140) − (28)
24
y= = 3.4
7
28
x= =4
7
a0 = 3.4 − 0.839286 ( 4) = 0.071429
7
6
5
4
Y
3 data
y reg = a0 + a1x
2 regresi
1
0
0 1 2 3 4 5 6 7 8
X
q Kuantifikasi kesalahan
q Kesalahan standar
Sr
Sr = å (yi - a0 - a1xi )
2
sy x =
n -2
St
St = å (y i - y )
2
sy =
n -1
r=
(∑ x ) (∑ y )
n∑ xi y i − i i koefisien korelasi
2 2 (correlation coefficient)
n∑ x − (∑ x ) n∑ y − (∑ y )
i
2
i i
2
i
−1 ≤ r ≤ +1
2
Sr = ∑ ( y i − a0 − a1xi ) = 2.991071
2
St = ∑ ( y i − y ) = 22.71429
St − Sr 22.71429 − 2.991071
r2 = = = 0.868318
St 22.71429
r = 0.931836
−1 ≤ r ≤ +1
y ln y
ln y = ln a1 + b1 x
y = a1 eb1x b1
1
ln a1
x x
y = a2 xb2 b2
1
x log x
logb2
1 b3 + x 1 b3 1
y 1/y = = +
y a3 x a3 a3 x
x b3 a3
y = a3
b3 + x 1 a3 1
x 1/x
St − S r S St − S r Sr
r2 = = 1− r r= = 1− q koefisien korelasi
St St St St
2
St = å (y i - y ) ∑ (y − y )
2
i reg
r = 1− 2
∑ (y − y )
i
Sr = å (yi - a0 - a1xi )
2
2
r = 1−
∑ (y − a − a x )
i 0 1 i
2
∑ (y − y )
i
∑ (y i − a0 − a1xi )
2
r=
(∑ x ) (∑ y )
n∑ xi y i − i i
r = 1− 2 2 2
∑ (y − y )
i n∑ x − (∑ x ) n∑ y − (∑ y )
i
2
i i
2
i
r=
(∑ x ) (∑ y )
n∑ xi y i − i i
2 2
n∑ x − (∑ x ) n∑ y − (∑ y )
i
2
i i
2
i
2 2
sX ,Y =
∑ ( )(
X i − X Yi −Y ) sX =
∑( Xi − X ) sY =
∑( Yi −Y )
! n−1 n−1 n−1
sX ,Y = COVARIANCE. S(X,Y)
r = rX ,Y = rX ,Y ←
sX sY = STDEV . S(X) × STDEV . S(Y)
! MS Excel
r ← = CORREL(X ,Y )
! X ,Y
q berkorelasi, ρX,Y ≠ 0
q Situasi
q Sampel yang diperoleh dari variabel random yang tidak berkorelasi
q Uji hipotesis
q H0: ρX,Y = 0
q H1: ρX,Y ≠ 0
12
⎡n−2⎤
statistik uji T =r⎢ 2⎥
T > t1−α 2,n−2
H0 ditolak
⎣ 1− r ⎦
q Uji hipotesis
q H0: ρX,Y = ρ* (ρ* konstanta) ukuran sampel n > 25
q H1: ρX,Y ≠ ρ*
( )( )
12
statistik uji Z = W −ω n−3 Z > z1−α 2 H0 ditolak
⎡ 1+ r ⎤ $ 1+ρ '
W = ln⎢ 1
2
⎥ = arctanh r ω = ln&1
2 ) = arctanhρ
⎣1− r ⎦ ! %1−ρ (
# & # &
z z
q Rentang keyakinan ρ: l = tanh%%W − 1−α 21 2 (( u = tanh%%W + 1−α 21 2 ((
!
%$ n−3 ('( )!
%$ n−3 (' ( )
http://istiarto.staff.ugm.ac.id http://istiarto.staff.ugm.ac.id 10-Nov-17
Korelasi Serial
37
∑x x i i+k
− ∑ xi ∑ xi+k (n−k ) xi = X i − X i
r(k) = i=1 i=1
12
i=1
12
) n−k # n−k &
2 , ) n−k # n−k &
2 , x = X i+k − X i+k
+ x 2 −% x ( ! i+k
( n−k .
) + x 2 −% x (
( n−k .
)
+∑ i %∑ i (
$ i=1 ' . +∑ i+k %∑ i+k (
$ i=1 ' .
! * i=1 - * i=1 -
sX ,X = COVARIANCE. S (X I , X i+k )
r(k) = rX ,X = i i+k
r (k) ←
i i+k
sX sX = STDEV . S (X I ) × STDEV . S (X i+k )
! i i+k
r ( k ) ← = CORREL (X I , X I+K )
q r(0) = 1 korelasi suatu elemen data dengan dirinya sendiri adalah sama
dengan satu
q semakin besar k, jumlah pasangan data untuk menghitung r(k) semakin
sedikit; r(k) adalah nilai estimasi ρ(k)
q oleh karena itu, k << n
q jika ρ(k) = 0 untuk semua k, maka proses atau peristiwa atau populasi
tersebut bersifat random murni
10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Regresi Linear Ganda
43
y = a0 + a1x1 + a2x2
q Koefisien a0, a1, a2 pada persamaan di atas dapat ditemukan dengan metode
kuadrat terkecil kesalahan (error)
n
2
Sr = ∑ ( y i − a0 − a1x1i − a2x2i )
i=1
10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Regresi Linear Ganda
44
∂a0
(
= −2∑ yi −a0 −a1 x1i −a2 x2i ) na0 + ∑ x1i a1 + ∑ x2i a2 = ∑ yi
i=1 i=1 i=1 i=1
n n n n n
∂Sr
∂a1
(
= −2∑ x1i yi −a0 −a1 x1i −a2 x2i ) ∑x 1i
2
a0 + ∑ x1i a1 + ∑ x1i x2i a2 = ∑ x1i yi
i=1 i=1 i=1 i=1 i=1
n n n n n
∂Sr
∂a2
(
= −2∑ x2i yi −a0 −a1 x1i −a2 x2i ) x a + x x a + x 2
∑ 2i 0 ∑ 1i 2i 1 ∑ 2i a2 = ∑ x2i yi
i=1
! i=1 i=1 i=1 i=1
10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
Regresi Linear Ganda
45
10-marras-
http://istiarto.staff.ugm.ac.id Regresi dan Korelasi
17
47 http://istiarto.staff.ugm.ac.id Regresi dan Korelasi 10-Nov-17