Anda di halaman 1dari 14

31

IV. Analisa Regresi

Dalam praktek sering dijumpai data yang diberikan dalam bentuk tabel

(diskret), ada 2 hal yang diharapkan dalam data diskret tersebut.

1. mencari bentuk kurva yg dpt mewakili data diskret tesebut.

2. mengestimasi nilai data pd titik-titik diantara nilai-nilai yang diketahui.

Kedua aplikasi tersebut diatas dikenal sebagai curve fitting.

Regresi kuadrat terkecil

Curve fitting

Interpolasi

Regresi kuadrat terkecil

Adalah dilakukan bila data menunjukkan adanya kssalahan cukup besar.

Contoh dibawah ini merupakan hasil pengukuran dua titik A dan B yang

kemungkinaan kesalahan yang sangat besar, karena tidak mengikuti pola

penyebaran titik-titik lainnya.

.A .. . .
f(x)
. . . . . . ..

. . . .

. . .B

. . .

. . . x
Gambar 4.1. Plot data pengukuran

Interpolasi

Bila data diketahui sangat besar maka pendekatan yang dilakukan adalah

membuat kurva atau sejumlah kurva yang melalui setiap titik.

Gambar dibawah menunjukkan sket kurva yang dibuat dari data yang sama

dengan cara regresi kuadrat terkecil (gbr. 4.2.a) dan interpolasi (4.2.b dan c)

f(x) f(x) f(x)


. . . . . .

. . . . . .

x x x
a b c
32

. . .

a. Tidak melalui semua titik pengukuran, tetapi hanya mengikuti trend dari

data menurut garis lurus.

b. Menggunakan segmen garis lurus/inetrpolasi linier untuk

menghubungkan titik-titik data.

c. Menggunakan kurva untuk menghubungkan titik-titik data.

Dalam bab ini akan dibahas lebih mendalam regresi kuadrat terkecil,

sedangkan penjelasan mengenai interpolasi akan dibahas dalam bab

berikutnya.

Regresi kuadrat terkecil banyak menggunakan beberapa notasi dan terori

statistik, oleh karena itu sebelum mempelajari regresi kuadrat terkecil lebih

mendalam dalam sub bab berikut akan diingat kembali beberapa prinsip

statistik.

4.1. Prinsip statistik

Contoh pada tabel dibawah adalah hasil pengukuran debit rerata tahunan

sungai selama 15 th berturut-turut.

Tabel 4.1. Debit Sungai


Tahun yi(debit) yi - y (yi - y)2
1971 8.52 1.486 2.208
1972 3.33 -3.704 13.720
1973 7.85 0.816 0.666
1974 7.65 0.616 0.379
1975 10.91 3.876 15.023
1976 4.17 -2.864 8.202
1977 3.40 -3.634 13.206
1978 8.00 0.966 0.933
1979 13.40 6.366 40.526
1980 5.40 -1.634 2.670
1981 8.87 1.836 3.371
1982 4.73 -2.304 5.308
1983 7.40 0.366 0.134
1984 6.88 -0.154 0.024
1985 5.00 -2.034 4.137
105.51 110.507
33

_
Nilai rerata data ( y ) adalah jumlah nilai data dibagi dengan cacah data (n)


y
y i

dengan penjumlahan (  ) adalah dari i = 1 sampai n dari data dalam tabel 4.1

tersebut nilai rerata adalah


n

 y i
y i 1

n
15

 y i
y i 1

15
 105.51
y  7.034
15

Penyebaran data dapat diukur dengan menggunakan deviasi standar ( )

terhadap nilai rerata .


_

σ
D2

 (y i  y) 2
n 1 n 1

dengan D2 adalah jumlah dari kuadrat residu antara data dan nilai rerata.

Penyebaran juga dapat dipresentasikan oleh kuadrat dari deviasi standar, yang

disebut Varians.
_

σ2 
D2

 (y i  y) 2
n 1 n 1

dari tabel tersebut dapat dihitung nilai standar deviasi dan varians.

- Standar deviasi
_

σ
 (y i  y) 2

110.507
 2.810
n 1 15  1

- Varians
_

σ 2

 (y i  y) 2

110.507
 7.893
n 1 15  1

4.2. Metode kuadrat terkecil

Gambar 4.3 adalah titik-titik percobaan dari hasil pengukuran, akan

dicari suatu kurva g(x) yang akan mewakili titik percobaan tersebut. Cara

termudah adalah membuat kurva secara visual (dengan perasaan) yang


34

merupakan fungsi terbaik g(x) yang digambarkan oleh titik percobaan, tetapi

cara ini tidak memuaskan terutama bila penyebarannya titik-titik cukup banyak

sehingga diperlukan metode yang lebih pasti untuk mendapatkan kurva

tersebut yaitu meminimumkan perbedaan (selisih) antara titik-titik data dan

kurva . Teknik untuk mendapatkan kurva tersebut dikenal dengan regresi

kuadrat terkecil .

. .
f(x)
.. . . g(x)
yi Mi
. . . . . . ..
g(xi)
. . . . Gi

. .

. . .

x
Gambar 4.3. kurva mewakili titik-titk data

Teknik tersebut dilakukan dengan prosedur berikut :

1. Titik-titik percobaan diplot ke dlm suatu system koordinat. Dari gambar

plot titik data tersebut dapat diketahui pola secara umum dari kumpulan

titik data tersebut, sehingga dapat ditentukan apakah kurva yang

mewakili berupa garis lurus (linier) atau lengkung.

2. Dipilih suatu fungsi g(x) yang dianggap bias mewakili f(x) yang

mempunyai bentuk umum sbb:

g(x) = ao + a1x + a2x2 + … + ar xr 4.1.

3. Ditentukan parameter ao , a1 , . … ar sedemikian hingga g(xi : ao , a1 , …

ar ) melalui sedekat mungkin titik-titik percobaan. Bentuk g(x i : ao , a1 , …

ar ) mempunyai arti fungsi g(xi ) dengan parameter ao , a1 , … ar

4. Apabila koordinat dari titik-titik percobaan adalah M(xi,yi) dengan i = 1,

2, 3,…..n maka selisih ordinat antara titik-titik tersebut dengan fungsi

g(xi : ao , a1 , … ar) adalah :

Ei = MiGi = yi – g(xi : ao , a1 , … ar )
35

= yi – (ao + a1xi + a2xi2 + … + ar xir )

5. Dipilih suatu fungsi g(x) yang mempunyai kesalahan Ei terkecil. Dalam

metode ini jumlah kuadrat dari kesalahan adalah terkecil.


n n

 E i   y i  g(x i )
2 2
D2 = 4.2
i 1 i 1

6. Dicari parameter ao , a1 , … ar sedemikian sehingga D2 adalah minimum.

Nilai D2 akan minimum bila turunan pertamanya thd : ao , a1 , ….ar adalah

nol

D 2
0
a o

D 2 D 2
a 1
0 . . . . . .
a r
0 4.3.

7. Penyelesaian dari persamaan diatas akan memberikan hasil parameter a o ,

a1 , a2….ar dengan demikian persamaan kurva terbaik yang memiliki titik

data telah diperoleh.

4.3. Metode kuadrat terkecil untuk kurva linier.

Bentuk paling sederhana dari regresi kuadrat terkecil adalah bila kurva

yang mewakili titik-titik percobaan merupakan garis lurus, sehingga persamaan

adalah : g(x) = a + bx

dalam hal ini a0 = a dan a1 = b

jumlah kuadrat dari kesalahan dihitung dengan persamaan :


n n
D2 =  E i   y i  a  b(x i )
2 2
4.5
i 1 i 1

Agar supaya nilai D2 adalah minimum, maka persamaan diatas diturunkan

terhadap parameter a dan b, dan kemudian disamadengankan nol

- turunan pertama terhadap parameter a

D 2
0
a

 n
  y i  a  b(x i ) 2  0
a i 1
n
 2  y i  a  b(x i )  0
i 1
36

yi -  a - bxi = 0 4.6

- turunan pertama dari parameter b

D 2
0
b

 n
  y i  a  b(x i ) 2  0
b i 1
n
 2  (y i  a  bx i )x i   0
i 1

yixi -  axi - bxi2 = 0 4.7

Penjumlahan masing-masing suku pada persm. 4.6 dan 4.7 adalah dari i

sampai n

Persamaan 4.6 dan 4.7 dapat ditulis sbb.

na +  xib =yi 4.8

xia +  xi2b =xiyi 4.9

dengan a = na

selanjutnya pers 4.8 dapat ditulis menjadi :

na = yi - xib

1
a= (yi - xib) 4.10
n

1 1
a=( yi - xib)
n n

atau,

4.11
_ _
a  y  bx

Subtitusi persamaan 4.10 ke dalam persamaan 4.9 :

1
xi (yi - xib) + xi2b = xiyi
n

xi yi – (xi)2b + nxi2b = nxiyi

b[nxi2 – (xi)2] = nxiyi - xiyi

atau,

n x i yi   x i  yi
b= 4.12
n  x i  ( x i ) 2
2

Dengan menggunakan persmaan. 4.11 dan 4.12 untuk menghitung koefisien a

dan b, maka fungsi g(x) dapat dicari.


37

Untuk mengetahui derajat kesesuaian dari persamaan yang didapat, dihitung

nilai koefisien korelasi yang berbentuk :

Dt 2  D 2
r= 4.13
Dt 2

dengan

r : koefisien korelasi
n _ n
Dt 2   (y i  y) 2 dan D 2   (y i  a  bx) 2
i 1 i 1

Untuk perkiraan yang sempurna nilai r = 1, apabila r = 0 perkiraan suatu fungsi

sangat jelek. Koefisien korelasi ini juga dapat digunakan untuk memilih suatu

persamaan. dari beberapa alternatif yang ada, terutama dalam regresi garis

tidak lurus. Kurva lengkung dapat didekati dengan beberapa tipe persamaan,

misalnya bentuk y = axb, y = aeb, y = a0 + a1x + a2x2 atau persamaan lain. Dari

beberapa alternatif tersebut dipilih persamaan yang mempunyai nilai koefisien

korelasi terbesar (paling mendekati 1)

Contoh .

Tentukan persm grs yg mewakili data berikut :

X 4 6 8 10 14 16 20 22 24 28

Y 30 18 22 28 14 22 16 8 20 8

Penyelesaian :

Penggambaran titik-titik data pada system koordinat x – y diberikan dlm

gambar 4.4, yang dapat diwakili oleh garis lurus. Penyelesaian dilakukan

dengan menggunakan tabel berikut ini

No xi yi (xi . yi) (xi)2


1 4 30 120 16
2 6 18 108 36
3 8 22 176 64
4 10 28 280 100
5 14 14 196 196
6 16 22 352 256
7 20 16 320 400
8 22 8 176 484
9 24 20 480 576
38

10 28 8 224 784
 152 186 2432 2912

y .
30 . . .
-
20 . . .

. . .
10
.

0 . x
10 20 30

Gambar 4.4. Ploting titik-titik data pada system koordinat


Nilai rerata dari x dan y adalah :


x
x i

152
 15,2
n 10

y
y i

186
 18,6
n 10

persamaan garis yang mewakili titik-titik data adalah :

y = a + bx

dengan,

n x i y i   x i  y i (10 x 2432)  (152 x 186) 3952


b=    0,6569
n  x i  ( x i ) (10 x 2912)  (152)
2 2
2
6016

= 18,6 + (0,6569 x 15,2) = 28,5849


_ _
a  y  bx

jadi persamaan garisnya adalah :

y = 28,5849 – 0,6569 x

4.5. linierisasi kurva tidak linier

Gambar dibawah menunjukkan ploting data pada system koordinat yang

didekati dengan garis lurus dan kurva lengkung.


39

. .
y . .
y . .

. . . .. . . . .

. . . . . .

x x
Tampak bahwa pendekatan dengan garis lurus menimbulkan kesalahan

yang sangat berarti. Berikut ini diberikan beberapa fungsi pendekatan dari data

yang biasa digunakan .

1. Fungsi eksponensial

Fungsi eksponensial diberikan dalam bentuk sbb :

y = a1eb1x 4.14

dengan a1 dan b1 adalah konstanta.

Persamaan tersebut dapat dilinierkan dengan menggunakan logaritma natural

sehingga menjadi : ln y = ln a1 + b1x ln e, oleh karena ln e = 1, maka :

ln y = ln a1 + b1x 4.15

yang merupakan hubungan semi logaritmik antara ln y dan x. Persamaan

tersebut mempunyai bentuk garis lurus dengan kemiringan b1 dan memotong

sumbu ln y pada ln a 1. Gambar 4.6 menunjukkan transformasi dari fungsi asli

menjadi fungsi logaritmik.


y ln y

y=a1eb1x b1
1
ln a1
x x

Gambar 4.6. transformasi fungsi

2. Persamaan berpangkat

Contoh lain dari kurva tak linier adalah persamaan berpangkat seperti

diberikan oleh bentuk berikut :

y = a2xb2 4.16

dengan a2 dan b2 adalah koefisien konstan


40

Persamaan tersebut dapat dilinierkan dengan fungsi logaritmik sehingga


didapat
log y = b2 log x + log a2 4.17

yang merupakan hubungan log-log anatara log y dan log x. Persamaan

tersebut mempunyai bentuk garis lurus dengan kemiringan b2 dan

memotong sumbu log y pada log a2. Gambar 4.7 bibawah menunjukkan

transformasi dari fungsi asli menjadi fungsi logaritmik.

y=a2xb2 log y
y

b1
1
x
Log x
log a2

Gambar 4.7. transformasi fungsi

Contoh 2.

Tentukan persamaan kurva lengkung yang mewakili data berikut ini

x 1 2 3 4 5

y 0.5 1.7 3.4 5.7 8.4

Penyelesaian

Dicoba untuk mencari kurva dengan menggunakan dua bentuk transformasi,

yaitu trasformasi log dan ln.

f(x)
5 o o

x
0 5
a. Transformasi log.
41

Misalkan persamaan kurva yang dicari adalah y = axb


Transformasi dengan menggunakan fungsi log,
log y = log axb, log y = log a + b log x
dilakukan transformasi berikut :
p = log y B=b
A = log a q = log x
Sehingga persamaan diatas dapat ditulis dalam bentuk
p = A + Bq

Hitungan dilakukan dengan menggunkan tabel berikut :

No xi yi qi=log xi pi=log yi qipi qi2


1 1 0.5 0 -0.3010 0 0
2 2 1.7 0.3010 0.2304 0.0694 0.0906
3 3 3.4 0.4771 0.5315 0.2536 0.2276
4 4 5.7 0.6021 0.7559 0.4551 0.3625
5 5 8.4 0.6990 0.9243 0.6460 0.4886
 2.0792 2.1411 1.4241 1.1693

Dari hitungan dalam tabel diatas di dapat parameter berikut ini :

_
q
 log x i

2,0791
 0,4158
n 5
_
p
 log y i

2,1411
 0,4282
n 5

koefisien A dan b dihitung dengan persamaan 4.11 dan 4.12

n q i p i   q i  p i
B
n  q i  ( q i ) 2
2

5(1,4240)  2,0791(2,1411) 2,6684


=   1,7572
5(1,1692)  2,0791(2,0791) 1,5233

setelah nilai B didapat kemudian dicari nilai A,

A= = 0,4282 – 1,7572x0,4158 = - 0,3024


_ _
p  Bq

Dengan demikian persamaan trasformasi adalah :

p = -0,3024 + 1,7572 q

mengigat :

A =log a, -0,3024, a = 0,4984

B = b, b = 1,7572

Maka persamaan yang dicari adalah ;


42

y = 0,4984 x1,7572

b. Transformasi ln

Misalkan persamaan mempunyai bentuk ;

y = a ebx

Transformasi dengan menggunakan fungsi ln,

ln y = ln aebx = ln a + ln ebx

ln y = ln a + bx

dilakukan transformasi berikut :

p = ln y A = ln a

q=x B=b

Sehingga persamaan diatas dapat ditulis dalam bentuk

p = A + Bq

Hitungan dilakukan dengan menggunkan tabel berikut :

No xi=qi yi qi2= xi2 pi=ln yi qipi


1 1 0.5 1 -0.6931 -0.6931
2 2 1.7 4 0.5306 1.0613
3 3 3.4 9 1.2238 3.6713
4 4 5.7 16 1.7405 6.9619
5 5 8.4 25 2.1282 10.6412
15 19.7 55 4.93 21.6425

Dari hitungan dalam tabel diatas didapat parameter berikut ini :

_
y
y i

19,7
 3,94
n 5
_
q
q i

15
3
n 5
_
p
p i

4,93
 0,99
n 5

koefisien A dan B dihitung dengan persamaan 4.11 dan 4.12

n q i p i   q i  p i
B
n  q i  ( q i ) 2
2

5( 21,6425)  15(4,93) 34,2625


=   0,68525
5(55)  (15) 2 50
43

setelah nilai B didapat kemudian dicari nilai A,

A= = 0,99 – 0,68525 x 3 = - 1,06575


_ _
p  Bq

Dengan demikian persamaan trasformasi adalah :

p = -1,0657 + 0,68525 q

mengingat :

A =ln a, -1,06575=ln a, a = 0,34447

B = b, b = 0,68525

Maka persamaan yang dicari adalah ;

y = 0,34447 e0,68525x

Untuk memilih salah satu dari kedua hasil terbaik, dihitung nilai koefisien

korelasi. Koefisien korelasi dihitung dengan menggunakan persamaan

4.13

Dt 2  D 2
r
Dt 2

dengan
n 
Dt2 =  (yi  y) 2
i 1

n
D2 =  (yi  y ( x))
i 1
2

Hitungan dilakukan dengan menggunakan tabel dibawah.

Nilai r untuk transformasi log :

Dt 2  D 2 40.132  0..00238
r 
Dt 2 40.132

r = 0,99997

Nilai r untuk transformasi ln :

Dt 2  D 2 40.132  5.60746
r 
Dt 2 40.132

r = 0,92751

Dari kedua nilai tersebut diatas, terlihat bahwa koefisien korelasi r untuk

transformasi log adalah lebih besar dari transformasi ln, sehingga dapat
44

disimpulkan bahwa persamaan yang didapat dari transformasi log adalah lebih

baik.

Anda mungkin juga menyukai