6822 Bab 5
6822 Bab 5
BAB 5
ANALISIS REGRESI
Dalam analisis data sering dilakukan pembuatan suatu kurve yang dapat mewakili suatu
rangkaian data yang diberikan dalam suatu sistem koordinat x-y. Data tersebut dapat
berupa hasil percobaan di laboratorium atau pengamatan di lapangan. Karena adanya
kesalahan-kesalahan atau ketidakpastian dalam pengujian, pengukuran atau variasi
perubahan data dari waktu ke waktu, maka titik-titik data tersebar dalam koordinat x-y.
Dalam analisis regresi akan dibuat kurve atau fungsi berdasarkan sebaran titik data. Kurve
yang terbentuk diharapkan dapat mewakili titik-titik data tersebut. Seringkali, setelah kurve
terbentuk, dilakukan pula ekstrapolasi untuk mendapatkan nilai y yang berkaitan dengan
nilai x yang berada di luar rangkaian data yang ada.
Metode yang akan digunakan untuk membuat kurve tersebut adalah metode kuadrat
terkecil (least square method). Metode tersebut memungkinkan untuk membuat kurve yang
paling mendekati titik-titik data.
Gambar 5.1, adalah penyebaran titik-titik data hasil dari suatu percobaan pada sistem
koordinat x-y. Penetapan bentuk kurve, apakah linier (garis lurus) atau lengkung
(logaritmik atau berpangkat), tergantung dari kecenderungan (trend) dari penyebaran titik
data, seperti pada Gambar 5.1a. dan 5.1b. Seringkali dijumpai adanya beberapa data yang
mempunyai kesalahan sangat besar seperti titik A dan titik B pada Gambar 5.1. Pembuatan
kurve dengan menggunakan titik A dan B pada gambar akan menghasilkan nilai yang juga
mempunyai kesalahan, oleh karena itu data A dan B dapat dihilangkan.
54
2)
Titik-titik percobaan digambar pada suatu sistem koordinat. Dari gambar sebaran
titik data tersebut dapat diketahui trend (pola) secara umum dari kumpulan titik
data, sehingga dapat ditentukan apakah kurve yang mewakili berupa garis lurus
(linier) atau lengkung.
Dipilih suatu fungsi g (x) yang dianggap bisa mewakili f (x) yang mempunyai
bentuk umum berikut ini:
g (x) = a0 + a1 x + a2 x2 + + ar xr
(5.1)
4)
Ditentukan parameter a0, a1, , ar sedemikian rupa sehingga g (xi ; a0, a1, , ar)
melalui sedekat mungkin titik-titik data. Bentuk g (xi ; a0, a1, , ar) mempunyai arti
fungsi g (xi) dengan parameter a0, a1, , ar.
Apabila koordinat dari titik-titik percobaan adalah M (xi , yi), dengan nilai i = 1, 2,
, n maka selisih ordinat antara titik-titik tersebut dengan fungsi g (xi ; a0, a1, ,
ar) adalah:
Ei = Mi Gi = yi g (xi ; a0, a1, , ar)
= yi (a0 + a1 xi + a2 xi 2 + a3 xi 3 + + ar xi r)
5)
Dipilih suatu fungsi g (x) yang mempunyai kesalahan Ei terkecil. Dalam metode ini
jumlah kuadrat dari kesalahan adalah terkecil.
n
D 2 Ei { yi g ( xi )}2
i 1
6)
i 1
(5.2)
55
D2
0
a1
2
D
0
ar
7)
(5.3)
Penyelesaian dari persamaan (5.3) akan memberikan hasil parameter a0, a1, , ar.
Dengan demikian persamaan kurve terbaik yang mewakili titik-titik data telah
diperoleh.
(5.4)
D 2 Ei { yi a b xi }2
i 1
i 1
(5.5)
Agar nilai D2 adalah minimum, maka persamaan (5.5) diturunkan terhadap parameter a
dan b, kemudian disama-dengankan nol.
Turunan pertama terhadap parameter a adalah:
D2
0
a
n
( yi a b xi ) 2 0
a i 1
n
2 ( yi a b xi ) 0
i 1
yi a b xi 0
(5.6)
n
( yi a b xi ) 2 0
b i 1
n
2 [ ( yi a b xi ) xi ] 0
i 1
yi xi a xi b xi 0
(5.7)
Penjumlahan masing-masing suku persamaan (5.6) dan (5.7) adalah dari 1 hingga n.
Persamaan (5.6) dan (5.7) dapat ditulis dalam bentuk:
n a xi b y i
(5.8)
56
xi a xi b xi y i
(5.9)
dengan a = n a
Selanjutnya persamaan (5.8) dapat ditulis menjadi:
n a = yi xi b
a=
1
( yi xi b )
n
a=
1
1
yi
xi b
n
n
a=
y bx
(5.10)
atau
(5.11)
1
2
( yi xi b ) xi b xi y i
n
2
2
x i yi ( xi ) b n xi b n xi yi
2
b [ n xi ( xi ) 2 ] n xi y i xi yi
atau
n xi yi xi yi
2
n xi ( xi ) 2
(5.12)
Dt D 2
2
Dt
(5.13)
dengan r adalah koefisien korelasi, sedang D2 dan Dt2 diberikan oleh bentuk:
2
Dt ( yi y ) 2
i 1
D 2 ( yi a0 a1 x ) 2
i 1
Nilai r bervariasi antara 0 dan 1, untuk perkiraan yang sempurna nilai r = 1, bila r = 0
perkiraan suatu fungsi sangat jelek. Koefisien korelasi ini juga dapat digunakan untuk
Jurusan Teknik Elektro ISTA Yogyakarta
57
memilih suatu persamaan dari beberapa alternatif yang ada, terutama di dalam regresi
garis tidak lurus. Kurve lengkung dapat didekati dengan beberapa tipe persamaan,
misalnya bentuk y = a xb; y = a eb; y = a0 + a1 x + a2 x2, atau persamaan lain. Dari
beberapa alternatif tersebut dipilih persamaan yang mempunyai nilai koefisien korelasi
terbesar (paling mendekati 1).
Contoh soal:
Tentukan persamaan garis yang mewakili data berikut.
x
10
14
16
20
22
24
28
30
18
22
28
14
22
16
20
Penyelesaian
Penggambaran titik-titik data pada sistem koordinat x-y diberikan dalam Gambar 5.3,
yang dapat diwakili oleh garis lurus. Penyelesaian dilakukan dengan menggunakan
Tabel 5.1.
15,2
n
10
y 186
y
18,6
n
10
xi
4
6
8
10
14
16
20
22
yi
30
18
22
28
14
22
16
8
xi yi
120
108
176
280
196
352
320
176
xi2
16
36
64
100
196
256
400
484
58
9
10
dengan:
24
28
152
20
8
186
480
224
2432
576
784
2912
n xi y i xi y i
2
n ( x i ) ( x i ) 2
(10 2432) (152 186)
3952
0,6569
2
6016
(10 2912) (152)
y a2 x b 2
(5.14)
Gambar 5.4. Titik data didekati dengan garis lurus dan lengkung
Persamaan tersebut dapat dilinier-kan dengan menggunakan fungsi logaritmik
sehingga didapat:
log y = b2 log x + log a2
(5.15)
59
yang merupakan hubungan log-log antara log y dan log x. Persamaan tersebut
mempunyai bentuk garis lurus dengan kemiringan b2 dan memotong sumbu log y
pada log a2. Gambar 5.5, menunjukkan transformasi dari fungsi asli menjadi fungsi
logaritmik.
2) Fungsi exponensial
Contoh lain dari kurve tak linier adalah fungsi eksponensial seperti diberikan oleh
bentuk berikut:
(5.16)
y a1 e b1 x
dengan a1 dan b1 adalah konstanta.
Persamaan tersebut dapat dilinier-kan dengan menggunakan logaritma natural
sehingga menjadi:
ln y = ln a1 + b1x ln e
Karena ln e = 1, maka:
ln y = ln a1 + b1x
(5.17)
0,5
1,7
3,4
5,7
8,4
Penyelesaian:
Jurusan Teknik Elektro ISTA Yogyakarta
60
Gambar 5.7, menunjukkan sebaran titik data pada sistem koordinat x-y, untuk
mencari kurve dengan menggunakan dua bentuk transformasi, yaitu transformasi
log dan ln.
B=b
A = log a
q = log x
=A+B
Hitungan dilakukan dengan menggunakan Tabel 5.2, dari hitungan dalam Tabel
5.2, didapat beberapa parameter berikut ini.
q
log xi 2,0791
0,4158
n
5
log yi 2,1411
0,42822
n
5
Tabel 5.2. Hitungan regresi linier dengan transformasi log
No
1
2
3
4
5
xi
1
2
3
4
5
15
yi
0,5
1,7
3,4
5,7
8,4
19,7
qi = log xi
0
0,3010
0,4771
0,6020
0,6990
2,0791
pi = log yi
-0,3010
0,2304
0,5315
0,7559
0,9243
2,1411
qi pi
0
0,0693
0,2536
0,4550
0,6461
1,4240
qi2
0
0,0906
0,2276
0,3624
0,4886
1,1692
61
n qi pi qi pi
2
n qi ( qi ) 2
5(1,4240) ( 2,0791)(2,1411)
2,6684
1,7517
(5 1,1692) ( 2,0791 2,0791) 1,5233
Mengingat:
A = log a
0,3001 = log a
B=b
b = 1,7517
a = 0,5011
A = ln a
q=x
B=b
qi 15
3
n
5
pi 4,93
0,986
n
5
Tabel 5.3 Hitungan regresi linier dengan trasnformasi ln
No
xi = qi
yi
qi2 = xi2
pi = ln yi
qi pi
62
1
1
0,5
1
-0,6931
-0,6931
2
2
1,7
4
0,5306
1,0612
3
3
3,4
9
1,2238
3,6714
4
4
5,7
16
1,7405
6,962
5
5
8,4
25
2,1282
10,641
15
19,7
55
4,93
21,6425
n q i p i q i pi
2
n ( q i ) ( q i ) 2
(5 21,6425) (15 4,93) 34,2625
0,68525
50
(5 55) (15) 2
1,06975 = ln a
B=b
b = 0,68525
a = 0,3431
D 2 ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 2
i 1
Persamaan diatas diturunkan terhadap tiap koefisien dari polinomial dan kemudian
disama-dengankan nol, sehingga diperoleh:
n
D2
2
r
2 ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
i 1
a0
n
D2
2
r
2 xi ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
i 1
a1
63
(5.18)
D
r
2
r
2 xi ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
i 1
ar
2
xi
xi
xi
xi
xi
xi
xi
xi
xi
xi
r
xi
xi
xi
r2
r 1
xi
r2
xi
rr
yi
a1
a
2 =
ar
a0
r 1
xi yi
x2 y
i
i
xi yi
(5.19)
Dengan semua penjumlahan adalah dari i = 1 sampai n. Dari r + 1 persamaan tersebut
akan dicari bilangan tak diketahui a0, a1, a2, , ar dengan metode yang telah
dibicarakan dalam pembahasan sistem persamaan linier. Koefisien matriks dari
persamaan tersebut biasanya sangat padat (sangat sedikit koefisien nol) dan masingmasing koefisien sangat berbeda. Namun demikian biasanya nilai r adalah kecil
sehingga sistem persamaan tersebut masih mudah diselesaikan.
Contoh soal: Cari persamaan kurve polinomial order dua yang mewakili data berikut:
xi
yi
2,1
7,7
13,6
27,2
40,9
61,1
Penyelesaian:
Persamaan polinomial dari order 2 mempunyai bentuk:
g (x) = a0 + a1 x + a2 x2
(c.1)
Ei = yi g (x)
Ei2 = ( yi a0 a1 x a2 x2 )2
D2 = Ei 2
Untuk polinomial order dua, diferensial dari D2 terhadap tiap koefisien dari polinomial
dan kemudian disama-dengankan nol menghasilkan bentuk:
xi
xi
xi
xi
xi
2
xi a 0 yi
3
xi a1 = xi yi
2
4
xi a 2 xi yi
(c.2)
64
6 a0 + 15 a1 + 55 a2 = 152,6
15 a0 + 55 a1 + 225 a2 = 585,6
(c.3)
D 2 ( y i ( a0 a1 x1,i a 2 x 2,i )) 2
i 1
Persamaan diatas diturunkan terhadap tiap koefisien dari polinomial, dan kemudian
disama-dengankan nol, sehingga diperoleh:
n
D2
2 ( yi a0 a1 x1,i a2 x2 ,i ) 0
i 1
a0
n
D2
2 x1,i ( yi a0 a1 x1,i a2 x2 ,i ) 0
i 1
a1
(5.20)
n
D2
2 x2 ,i ( yi a0 a1 x1,i a2 x2,i ) 0
i 1
a2
+ x1,i a1
+ x2,i a2
= yi
65
x1,i a0 + x1,i2 a1
= x2,i yi
x 2 ,i
x1,i
a0
x1,i
x1,i x2,i
x1,i
2
x
x1,i x2 ,i x2,i
2 ,i
yi
a1 = x1,i yi
x y
a
2 ,i
i
2
(5.21)
Sistem persamaan (5.21) dapat diselesaikan dengan menggunakan metode pada sistem
persamaan linier untuk mendapatkan koefisien a0, a1, dan a2.
Secara umum persamaan regresi linier dengan m variabel mempunyai bentuk berikut:
y = a0 + a1 x1 + a2 x2 + + am xm
di mana koefisien a0, a1, a2 sampai am dapat dihitung dari sistem persamaan berikut:
x1,i
x1,i
x
2 ,i
x1,i
x2 , i
x2 ,i
xm , i
x1,i xm ,i
x2 , i xm ,i
2
xm ,i
x2,i x1,i
x2,i x1,i
xm ,i xm ,i x1,i xm ,i x2,i
a0
yi
x1,i yi
a 2 = x2 , i yi
2
am
xm ,i
a1
(5.22)
2,5
x2
10
27
Penyelesaian:
Penyelesaian dilakukan dengan menggunakan Tabel 5.5.
Tabel 5.5. Hitungan regresi linier dengan banyak variabel
y
5
10
9
0
3
27
54
x1
0
2
2,5
1
4
7
16,5
x2
0
1
2
3
6
2
14
x12
0
4
6,25
1
16
49
76,25
x22
0
1
4
9
36
4
54
x1x2
0
2
5
3
24
14
48
x1 y
0
20
22,5
0
12
189
243,5
x2 y
0
10
18
0
18
54
100
Nilai-nilai yang diperoleh dalam Tabel 5.5, dimasukkan dalam sistem persamaan
(5.21), sehingga diperoleh:
Jurusan Teknik Elektro ISTA Yogyakarta
66
16,5
14
a0
16,5
14
76,25
48
a1 = 243,5
100
a
48
54
54
(c.1)
67