BAB 5
ANALISIS REGRESI
Dalam analisis data sering dilakukan pembuatan suatu kurve yang dapat mewakili suatu
rangkaian data yang diberikan dalam suatu sistem koordinat x-y. Data tersebut dapat
berupa hasil percobaan di laboratorium atau pengamatan di lapangan. Karena adanya
kesalahan-kesalahan atau ketidakpastian dalam pengujian, pengukuran atau variasi
perubahan data dari waktu ke waktu, maka titik-titik data tersebar dalam koordinat x-y.
Dalam analisis regresi akan dibuat kurve atau fungsi berdasarkan sebaran titik data. Kurve
yang terbentuk diharapkan dapat mewakili titik-titik data tersebut. Seringkali, setelah kurve
terbentuk, dilakukan pula ekstrapolasi untuk mendapatkan nilai y yang berkaitan dengan
nilai x yang berada di luar rangkaian data yang ada.
Metode yang akan digunakan untuk membuat kurve tersebut adalah metode kuadrat
terkecil (least square method). Metode tersebut memungkinkan untuk membuat kurve yang
paling mendekati titik-titik data.
Gambar 5.1, adalah penyebaran titik-titik data hasil dari suatu percobaan pada sistem
koordinat x-y. Penetapan bentuk kurve, apakah linier (garis lurus) atau lengkung
(logaritmik atau berpangkat), tergantung dari kecenderungan (trend) dari penyebaran titik
data, seperti pada Gambar 5.1a. dan 5.1b. Seringkali dijumpai adanya beberapa data yang
mempunyai kesalahan sangat besar seperti titik A dan titik B pada Gambar 5.1. Pembuatan
kurve dengan menggunakan titik A dan B pada gambar akan menghasilkan nilai yang juga
mempunyai kesalahan, oleh karena itu data A dan B dapat dihilangkan.
2) Dipilih suatu fungsi g (x) yang dianggap bisa mewakili f (x) yang mempunyai
bentuk umum berikut ini:
g (x) = a0 + a1 x + a2 x2 + + ar xr (5.1)
Fungsi tersebut tergantung pada parameter a0, a1, , ar.
3) Ditentukan parameter a0, a1, , ar sedemikian rupa sehingga g (xi ; a0, a1, , ar)
melalui sedekat mungkin titik-titik data. Bentuk g (xi ; a0, a1, , ar) mempunyai arti
fungsi g (xi) dengan parameter a0, a1, , ar.
4) Apabila koordinat dari titik-titik percobaan adalah M (xi , yi), dengan nilai i = 1, 2,
, n maka selisih ordinat antara titik-titik tersebut dengan fungsi g (xi ; a0, a1, ,
ar) adalah:
n n
2
D 2 Ei { yi g ( xi )}2 (5.2)
i 1 i 1
D2
0
a0
D2
0
a1
(5.3)
D 2
0
ar
7) Penyelesaian dari persamaan (5.3) akan memberikan hasil parameter a0, a1, , ar.
Dengan demikian persamaan kurve terbaik yang mewakili titik-titik data telah
diperoleh.
g (x) = a + bx (5.4)
Dalam hal ini, a0 = a dan a1 = b.
Jumlah kuadrat dari kesalahan dihitung dengan persamaan (5.2):
n n
2
D 2 Ei { yi a b xi }2 (5.5)
i 1 i 1
Agar nilai D2 adalah minimum, maka persamaan (5.5) diturunkan terhadap parameter a
dan b, kemudian disama-dengankan nol.
Turunan pertama terhadap parameter a adalah:
D2
0
a
n
( yi a b xi ) 2 0
a i 1
n
2 ( yi a b xi ) 0
i 1
yi a b xi 0 (5.6)
Turunan pertama terhadap parameter b adalah:
D2
0
b
n
( yi a b xi ) 2 0
b i 1
n
2 [ ( yi a b xi ) xi ] 0
i 1
2
yi xi a xi b xi 0 (5.7)
Penjumlahan masing-masing suku persamaan (5.6) dan (5.7) adalah dari 1 hingga n.
Persamaan (5.6) dan (5.7) dapat ditulis dalam bentuk:
n a xi b y i (5.8)
2
xi a xi b x i y i (5.9)
dengan a = n a
Selanjutnya persamaan (5.8) dapat ditulis menjadi:
n a = yi xi b
1
a= ( yi xi b ) (5.10)
n
1 1
a= yi xi b
n n
atau
a= y bx (5.11)
Interpolasi persamaan (5.10) ke dalam persamaan (5.9),
1 2
xi ( yi xi b ) xi b xi y i
n
2
x i yi ( xi ) b n xi b n xi yi
2
2
b [ n xi ( xi ) 2 ] n xi y i xi yi
atau
n xi yi xi yi
b 2 (5.12)
n xi ( xi ) 2
Dengan menggunakan persamaan (5.11) dan persamaan (5.12) untuk menghitung
koefisien a dan b, maka fungsi g (x) dapat dicari.
Persamaan garis lain, selain persamaan (5.4) memberikan jumlah kuadrat kesalahan
yang lebih besar, namun persamaan (5.4) adalah perkiraan terbaik dari data. Untuk
mengetahui derajat kesesuaian dari persamaan yang didapat, dihitung nilai koefisien
korelasi yang berbentuk:
2
Dt D 2
r 2
(5.13)
Dt
dengan r adalah koefisien korelasi, sedang D2 dan Dt2 diberikan oleh bentuk:
n
2
Dt ( yi y ) 2
i 1
n
D 2 ( yi a0 a1 x ) 2
i 1
Nilai r bervariasi antara 0 dan 1, untuk perkiraan yang sempurna nilai r = 1, bila r = 0
perkiraan suatu fungsi sangat jelek. Koefisien korelasi ini juga dapat digunakan untuk
memilih suatu persamaan dari beberapa alternatif yang ada, terutama di dalam regresi
garis tidak lurus. Kurve lengkung dapat didekati dengan beberapa tipe persamaan,
misalnya bentuk y = a xb; y = a eb; y = a0 + a1 x + a2 x2, atau persamaan lain. Dari
beberapa alternatif tersebut dipilih persamaan yang mempunyai nilai koefisien korelasi
terbesar (paling mendekati 1).
Contoh soal:
Tentukan persamaan garis yang mewakili data berikut.
x 4 6 8 10 14 16 20 22 24 28
y 30 18 22 28 14 22 16 8 20 8
Penyelesaian
Penggambaran titik-titik data pada sistem koordinat x-y diberikan dalam Gambar 5.3,
yang dapat diwakili oleh garis lurus. Penyelesaian dilakukan dengan menggunakan
Tabel 5.1.
9 24 20 480 576
10 28 8 224 784
152 186 2432 2912
dengan:
n xi y i xi y i
b 2
n ( x i ) ( x i ) 2
(10 2432) (152 186) 3952
0,6569
(10 2912) (152) 2
6016
1) Persamaan berpangkat
Persamaan berpangkat diberikan oleh bentuk berikut ini.
y a2 x b 2 (5.14)
dengan a2 dan b2 adalah koefisien konstan.
Gambar 5.4. Titik data didekati dengan garis lurus dan lengkung
yang merupakan hubungan log-log antara log y dan log x. Persamaan tersebut
mempunyai bentuk garis lurus dengan kemiringan b2 dan memotong sumbu log y
pada log a2. Gambar 5.5, menunjukkan transformasi dari fungsi asli menjadi fungsi
logaritmik.
2) Fungsi exponensial
Contoh lain dari kurve tak linier adalah fungsi eksponensial seperti diberikan oleh
bentuk berikut:
y a1 e b1 x (5.16)
dengan a1 dan b1 adalah konstanta.
Persamaan tersebut dapat dilinier-kan dengan menggunakan logaritma natural
sehingga menjadi:
ln y = ln a1 + b1x ln e
Karena ln e = 1, maka:
ln y = ln a1 + b1x (5.17)
Persamaan (5.15) merupakan hubungan semi logaritmik antara ln y dan x.
Persamaan tersebut mempunyai bentuk garis lurus dengan kemiringan b1 dan
memotong sumbu ln y pada ln a1. Gambar 5.6, menunjukkan transformasi dari
fungsi asli menjadi fungsi logaritmik.
Contoh soal:
Tentukan persamaan kurve lengkung yang mewakili data berikut ini.
x 1 2 3 4 5
Penyelesaian:
Gambar 5.7, menunjukkan sebaran titik data pada sistem koordinat x-y, untuk
mencari kurve dengan menggunakan dua bentuk transformasi, yaitu transformasi
log dan ln.
Hitungan dilakukan dengan menggunakan Tabel 5.2, dari hitungan dalam Tabel
5.2, didapat beberapa parameter berikut ini.
log xi 2,0791
q 0,4158
n 5
log yi 2,1411
p 0,42822
n 5
Tabel 5.2. Hitungan regresi linier dengan transformasi log
No xi yi qi = log xi pi = log yi qi pi qi2
1 1 0,5 0 -0,3010 0 0
2 2 1,7 0,3010 0,2304 0,0693 0,0906
3 3 3,4 0,4771 0,5315 0,2536 0,2276
4 4 5,7 0,6020 0,7559 0,4550 0,3624
5 5 8,4 0,6990 0,9243 0,6461 0,4886
15 19,7 2,0791 2,1411 1,4240 1,1692
n qi pi qi pi
B 2
n qi ( qi ) 2
5(1,4240) ( 2,0791)( 2,1411) 2,6684
1,7517
(5 1,1692) ( 2,0791 2,0791) 1,5233
Mengingat:
A = log a 0,3001 = log a a = 0,5011
B=b b = 1,7517
maka persamaan yang dicari adalah:
y = 0,5011 x1,7517
b). Transformasi In
Misalkan persamaan kurve mempunyai bentuk:
y = a ebx
Transformasi dengan menggunakan fungsi ln, sehingga persamaan diatas
menjadi:
ln y = ln a ebx = ln a + ln ebx
ln y = ln a + bx
Dilakukan transformasi berikut:
p = ln y A = ln a
q=x B=b
Sehingga persamaan diatas dapat ditulis dalam bentuk:
p=A+Bq
Hitungan dilakukan dengan menggunakan Tabel 5.3.
Dari hitungan Tabel 5.3, didapat beberapa parameter berikut ini:
qi 15
q 3
n 5
pi 4,93
p 0,986
n 5
Tabel 5.3 Hitungan regresi linier dengan trasnformasi ln
No xi = qi yi qi2 = xi2 pi = ln yi qi pi
Persamaan diatas diturunkan terhadap tiap koefisien dari polinomial dan kemudian
disama-dengankan nol, sehingga diperoleh:
D2 n
2 r
2 ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
a0 i 1
D2 n
2 r
2 xi ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
a1 i 1
D2 n
2 2 r
2 xi ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
a2 i 1
(5.18)
D 2
r
n
2 r
2 xi ( y i ( a 0 a1 xi a 2 xi ... a r xi )) 0
ar i 1
Contoh soal: Cari persamaan kurve polinomial order dua yang mewakili data berikut:
xi 0 1 2 3 4 5
yi 2,1 7,7 13,6 27,2 40,9 61,1
Penyelesaian:
Persamaan polinomial dari order 2 mempunyai bentuk:
g (x) = a0 + a1 x + a2 x2 (c.1)
Ei = yi g (x)
Ei2 = ( yi a0 a1 x a2 x2 )2
D2 = Ei 2
Untuk polinomial order dua, diferensial dari D2 terhadap tiap koefisien dari polinomial
dan kemudian disama-dengankan nol menghasilkan bentuk:
n xi xi a 0
2
yi
2 3
i x xi xi a1 = xi yi (c.2)
2 3 4 a x 2 y
2
xi xi xi i i
6 a0 + 15 a1 + 55 a2 = 152,6
15 a0 + 55 a1 + 225 a2 = 585,6 (c.3)
55 a0 + 225 a1 + 979 a2 = 2488,8
Dengan menggunakan sistem persamaan linier, maka penyelesaian dari persamaan
diatas adalah a2 = 1,860714; a1 = 2,359286; dan a0 = 2,478571.
Dengan demikian persamaan kurve adalah:
y = 2,478571 + 2,359286 x + 1,860714 x2
5.5 Regresi Linier Dengan Banyak Variabel
Metode regresi linier dapat dikembangkan untuk kasus dimana y adalah fungsi linier
dari dua atau lebih variabel. Misalnya, y merupakan fungsi linier terhadap x1 dan x2
dalam bentuk:
y = a0 + a1 x1 + a2 x2
Persamaan tersebut dapat digunakan untuk mempresentasikan data pengamatan dimana
variabel yang dipelajari merupakan fungsi dari dua variabel.
Nilai terbaik dari koefisien a0, a1, dan a2 diperoleh dengan mencari kuadrat dari
kesalahan yang dihitung dengan persamaan berikut:
n
D 2 ( yi ( a0 a1 x1,i a 2 x 2,i )) 2
i 1
Persamaan diatas diturunkan terhadap tiap koefisien dari polinomial, dan kemudian
disama-dengankan nol, sehingga diperoleh:
D2 n
2 ( yi a0 a1 x1,i a2 x2,i ) 0
a0 i 1
D2 n
2 x1,i ( yi a0 a1 x1,i a2 x2,i ) 0 (5.20)
a1 i 1
D2 n
2 x2 ,i ( yi a0 a1 x1,i a2 x2 ,i ) 0
a2 i 1
n x1,i x2 , i a0 yi
2
x1,i x1,i x1,i x2,i a1 = x1,i yi (5.21)
x 2 a x y
2,i x1,i x2,i x2,i 2 2 ,i i
Sistem persamaan (5.21) dapat diselesaikan dengan menggunakan metode pada sistem
persamaan linier untuk mendapatkan koefisien a0, a1, dan a2.
Secara umum persamaan regresi linier dengan m variabel mempunyai bentuk berikut:
y = a0 + a1 x1 + a2 x2 + + am xm
di mana koefisien a0, a1, a2 sampai am dapat dihitung dari sistem persamaan berikut:
n x1,i x2 ,i xm ,i a
0 yi
x1,i xm ,i a1
2
x1,i x1,i x2,i x1,i
x1,i yi
x x2,i x1,i x2 ,i
2
x2 ,i xm ,i a 2 = x y
2 ,i 2 ,i i (5.22)
a 2
xm ,i xm ,i x1,i xm ,i x2,i xm ,i m
2
xm ,i
Penyelesaian:
Penyelesaian dilakukan dengan menggunakan Tabel 5.5.
Tabel 5.5. Hitungan regresi linier dengan banyak variabel
y x1 x2 x12 x22 x1x2 x1 y x2 y
5 0 0 0 0 0 0 0
10 2 1 4 1 2 20 10
9 2,5 2 6,25 4 5 22,5 18
0 1 3 1 9 3 0 0
3 4 6 16 36 24 12 18
27 7 2 49 4 14 189 54
54 16,5 14 76,25 54 48 243,5 100
Nilai-nilai yang diperoleh dalam Tabel 5.5, dimasukkan dalam sistem persamaan
(5.21), sehingga diperoleh:
6 16,5 14 a0 54
16,5 76,25 48 a1 = 243,5 (c.1)
14 48 54 a 100
2