Anda di halaman 1dari 7

Regressi Linear

ARIANA
email: ari_fujiwara@yahoo.com
UNIVERSITAS SRIWIJAYA

Bidang keteknikan banyak menghasilkan data - data dari pengukuran maupun data - data yang dihasilkan dari berbagai
percobaan, seringkali diminta untuk menganalisa data - data tersebut, analisa yang dilakukan dapat berupa penentuan
suatu koefisien atau suatu konstanta atau bahkan menentukan fungsi ( yang lebih sederhana ) dari suatu fungsi yang
sebelumnya telah dimodelkan.Biasanya data - data baik dari hasil pengukuran maupun suatu percobaan memiliki sejumlah
eror atau kesalahan, baik itu kesalahan dalam pembacaan alat ( paralaks ), ketidaktelitian alat ukur ( instrument ) ataupun
karena kelakuan sistem yang diukur1
Penganalisaan data - data tersebut dapat dilakukan dengan metode yang disebut dengan Pencocokan Kurva, ada dua
pendekatan yang dapat dilakukan dalam mencocokan data - data bila dilihat dari tingkat kesalahan data yang dihasilkan yaitu
:
1. Bila data tersebut memiliki banyak noise ( dimana tingkat kesalahan cukup tinggi ) , maka cara terbaik adalah dengan
membuat sebuah kurva ( persamaan ) tunggal dimana kurva tersebut dapat menyatakan kecenderungan data - data,
kurva yang dibuat tidak harus melewati semua titik data , melainkan cukup dengan mengikuti pola - pola dari titik - titk
data yang ada.
2. Bila data tersebut berketelitian tinggi, maka cara terbaik adalah mengikuti semua titik data secara langsung.
Pendekatan dengan cara pertama di atas dikenal juga dengan istilah Regressi Kuadrat Terkecil ( least- square regression ).
Bagi sebagian mahasiswa tingkat atas tentunya sudah tidak asing lagi dengan metode ini, dimana metode ini diajarkan pada
mata kuliah statistika maupun pada analisa numerik. Apa manfaat yang dapat diperoleh dari mempelajari regressi ini ?

Dapat menentukan nilai - nilai yang terletak diantara data - data yang diberikan ( interpolasi )
Dapat menentukan nilai - nilai yang tertelatak diluar data ( ekstrapolasi )
jika data tersebut memiliki ketepatan yang tinggi dan memiliki persamaan yang cukup rumit, maka dapat dbuat
persamaan baru yang lebih sederhana, persamaan yang lebih sederhana tersebut dapat dibuat dari regressi linear
ataupun regressi polinomial dengan orde yang lebih tinggi lagi ( misal orde 2 ke atas )

Manfaat pencocokan kurva lainnya adalah1 :

Bagi ahli sains / engineering : mengembangkan formula empirik untuk sistem yang diteliti
Bagi ahli ekonomi : menentukan kurva kecenderungan ekonomi " untuk meramalkan" kecenderungan masa depan.

Secara umum jenis regressi dapat dibagi menjadi :

Regressi linear
Regressi polinomial
Regressi nonlinear
Regressi ganda

Regressi Linear
Misalkan kita memiliki data ( x1, y1 ), ( x2, y2 ) ...( xn, yn ), kemudian kita akan membuat suatu kurva hampiran yaitu berupa

kurva linear ( garis lurus ) yang dapat dijabarkan sebagai berikut :


y = f(x) = ao + a1x + E
Dimana ao dan a1 adalah koefisien - koefisien perpotongan dan kemiringan serta E adalah galat ( kesalahan ) atau selisih (
residual ), dengan demikian E dapat kita jabarkan dengan :
E = y - ao - a1x
Jika kita perhatikan E dapat didefinisikan sebagai perbadaan antara nilai y yang sebenarnya ( dari data pengukuran atau
percobaan ) dengan nilai yang diprediksikan oleh persamaan regressi ( ao + a1 ), sehingga dengan demikian usahda yang
terbaik dalam membuat suatu persamaan regressi yang baik yaitu dengan meminimalkan jumlah kuadrat residual Sr,
Sr = `sum_(i=1)^n E_i^2` = `sum_(1=1)^n` ( yi - ao - a1xi )2
Bagaimanakah ao dan a1 ditentukan ?
Untuk menentukan harga ao dan a1 maka persamaan diatas dibuatkan turunan pertama ( ingat toeri maksimum minimum
dari suatu kurva atau persaman ) terhadap masing - masing koefisien ,
`(delSr)/(delao)` = -2 `sum` ( yi - ao - a1xi )
`(delSr)/(delao)` = -2 `sum` (( yi - ao - a1xi )xi)
Dengan membuat turunan tersebut mejdi nol akan dihasilkan Sr yang minimal, sehingga
0 = `sum` yi - `sum` ao - `sum` a1xi
0 = `sum` yixi - `sum` aoxi - `sum` a1xi2
`sum` ao = nao, sehingga persamaan di atas dapat dibuat menjadi :
nao + `sum` xia1 = `sum` y
`sum` xiao + `sum` xi2a1 = `sum`xiyi
Dengan mengutak - atik persamaan diatas untuk maka didapatkan lah :
a1 = `(n sum x_iy_i - sum x_i sum y_i)/(n sum x_i^2 - (sum x_i)^2)`
ao = y - a1x
Dengan x dan y adalah nilai rata - rata
Lalu bagaimanakah kriteria suatu persamaan Regressi itu dapat di katakan Baik ?
Beberapa parameter berikut ini dapat menentukan apakah suatu persamaan regressi itu dapat di katakan baik yaitu :

Standar Deviasi, Sy
Standar Deviasi digunakan untuk mengukur penyebaran suatu data atau sampel terhadap nilai rata - rata, jika data yang
diberikan tersebar secara luas disekitar rata - rata maka Sy akan besar, sebaliknya jika data yang diberikan rapat secara
berkelompok maka Sy akan kecil.
Sy = `sqrt((St)/(n-1))`
Dengan St = `sum ( y_i - Ry)^2`
Dimana Ry adalah nilai rata - rata dari y
Penyebaran data tersebut dapat juga dinyatakan dalam variasi yaitu kuadrat dari standar deviasi
Sy2 = `sqrt((St)/(n-1))`
Kesalahan Standar Taksiran, Sy/x
Sy/x mengkuantifikasikan penyebaran data disekitas garis regressi, hal in berbeda dengan Sy dimana Sy mengukur
penyebaran data di sekitar nilai rata -rata, Sy/x dapat dijabarkan dengan :
Sy/x = `sqrt((Sr)/(n-2))`
Dengan Sr = `sum_(i=1)^n` ( yi - ao - a1xi )2
Kita lihat rumusan antara Sr dan St ada kesamaan, namun berbeda pengertiannya, St didefenisika sebagai kuadrat
perbedaan antara data dan suatu harga taksiran tungal dari ukuran tendensi pusat - rata rata, sedangkan Sr menyatakan
kuadrat jarak vertikal antara data dan ukuran tendensi pusat lainnya.
Koefisien determinasi dan Korelasi
Koefisien determinasi dapat dijabarkan sebagai berikut :
r2 = `(St - Sr)/(St)`
St ( jumlah total kuadrat ) ,dapat juga menyatakan penyebaran data variable dependent yang terjadi sebelum regressi,
sedangkan Sr adalah jumlah kuadrat residual disekitar persamaan regressi, Untuk suatu regressi yang baik atau sempurna
adalah Sr = 0 dan r2 =1, jika semakin besar variasi Sr mengakibatkan persamaan regressi yang dibuat semakin tidak
mewakili atau semakin tidak menggambarkan kecenderungan data.
Koefisien Korelasi dijabarkan sebagai berikut:
r = `sqrt((St - Sr)/(St))`
Namun begitu, walaupun nilai r2 memperlihatkan hasil yang baik ( misal r2 = 1 ) kita harus tetap berhati - hati agar tidak
memberikan arti yang lebih terhadap persamaan regressi tersebut karena bisa saja persamaan regerssi tersebut akan
memberikan hasil nilai - nilai yang relatif tinggi ( nilai yang terlalu tinggi ) dari kecenderungan data yang ada, cara yang
terbaik adalah dengan selalu melakukan pengecekan secara visualiasasi dari data yang diberikan terhadap persamaan
regressi yang ada .

Regressi Linear tersebut dapat kita buat penyelesiannya dengan menggunakan Fortran ataupun Excel, untuk fortran dapat
kodenya sebagai berikut :
C PROGRAM SLOPE INTERSEP DENGAN DATA BANYAK
C BY SAI
C 2005
C-------------------------------------------------------------REAL X,Y,XY,X2,SUMX,SUMY,SUMXY,SUMX2,SLOPE,INTERSEP
OPEN(UNIT=6,FILE='REGRESI.OUT',STATUS='NEW')
WRITE(6,*)'
PROGRAM REGRESI LINIER
'
WRITE(6,*)'------------------------------------------------------'
WRITE(6,*)'
X
Y
XY
X2 '
WRITE(6,*)'------------------------------------------------------'
WRITE(*,1)
1 FORMAT(1X,'BERAPA DATA ?'\)
READ(*,*)N
DO 2 I=1,N
WRITE(*,3)I,I
3 FORMAT(1X,'DATA X (',I2,') DAN Y (',I2,') ='\)
READ(*,*)X,Y
XY=X*Y
X2=X**2
SUMX=SUMX+X
SUMY=SUMY+Y
SUMXY=SUMXY+XY
SUMX2=SUMX2+X2
WRITE(6,7)X,Y,XY,X2
7 FORMAT(1X,2F11.5,F15.7,F16.8)
2 CONTINUE
WRITE(6,*)'------------------------------------------------------'
WRITE(6,8)SUMX,SUMY,SUMXY,SUMX2
8 FORMAT(1X,2F11.5,F15.7,F16.8)
WRITE(6,*)'------------------------------------------------------'
SLOPE=((N*SUMXY)-(SUMX*SUMY))/((N*SUMX2)-(SUMX**2))
INTERSEP=((SUMX2*SUMY)-(SUMXY*SUMX))/((N*SUMX2)-(SUMX**2))
WRITE(6,9)SLOPE,INTERSEP
9 FORMAT(1X,'SLOPE =',F10.5,/,1X,'INTERSEP =',F10.5/)
WRITE(6,*)'DATA UNTUK PLOT'
WRITE(6,*)'----------------------'
WRITE(6,*)' X
F(x) '
WRITE(6,*)'----------------------'
DO 4 J=-4,5
FX=(SLOPE*J)+INTERSEP
WRITE(6,10)J,FX
10 FORMAT(3X,I2,2X,F12.5)
4 CONTINUE
WRITE(6,*)'----------------------'
END
Soal 1
Kita ambil Soal pada buku Metode Numerik untuk Teknik, Contoh 10.1, diminta untuk menghitung koefisien slope ( a1 ) dan
intersep ( a0 ) untuk data

0.5

2.5

2.0

4.0

3.5

6.0

3.5

Penyelesaian
dengan menggunakan kode program diatas maka didapatkan :
PROGRAM REGRESI LINIER
-----------------------------------------------------X
Y
XY
X2
-----------------------------------------------------1.00000 .50000
.5000000
1.00000000
2.00000 2.50000
5.0000000
4.00000000
3.00000 2.00000
6.0000000
9.00000000
4.00000 4.00000 16.0000000 16.00000000
5.00000 3.50000 17.5000000 25.00000000
6.00000 6.00000 36.0000000 36.00000000
7.00000 5.50000 38.5000000 49.00000000
-----------------------------------------------------28.00000 24.00000 119.5000000 140.00000000
-----------------------------------------------------SLOPE = .83929
INTERSEP = .07143
DATA UNTUK PLOT
---------------------X
F(x)
----------------------4
-3.28571
-3
-2.44643
-2
-1.60714
-1
-.76786
0
.07143
1
.91071
2
1.75000
3
2.58929
4
3.42857
5
4.26786
---------------------Atau jika menggunakan Polymath akan didapatkan hasil sebagai berikut :
POLYMATH Results
04-06-2009
Linear Regression Report
Model: y = a0 + a1*x
Variable
Value
95% confidence
a0
0.0714286
1.6806081
a1
0.8392857
0.3757954
General

Regression including free parameter


Number of observations = 7
Statistics
R^2 =
0.8683176
R^2adj =
0.8419811
Rmsd =
0.2470673
Variance =
0.5982143

Soal 2
Kita ambil lagi contoh soal 10.2 pada buku Metode Numerik untuk Teknik, diminta untuk menentukan standar deviasi,
kesalahan taksiran standar, koefisien determinasi dan korelasi dengan menggunakan data di atas.
Penyeleasian
Untuk penyelesaian soal ini , kita dapat menggunakan Excel , dan dibuat tabel sebagai berikut:

xi

yi

(yi-Ry)2

(y-ao-a1xi)2

1.0

0.5

8.577

0.169

2.0

2.5

0.862

0.562

3.0

2.0

2.041

0.347

4.0

4.0

0.327

0.327

5.0

3.5

0.005

0.590

6.0

6.0

6.612

0.797

7.0

5.5

4.291

0.199

Total

24.0

22.714

2.991

Ry = `24/7` = 3.2485
Standar Deviasi
Sy = `sqrt((St)/(n-1))` = `sqrt(22.714/(7-1))` = 1.9456
Standar Kesalahan
Sy/x = `sqrt((Sr)/(n-2))` = `sqrt(2.991/(7-2))` = 0.7734
Koefisien determinasi
r2 = `(St - Sr)/(St)` = `(22.714-2.991)/22.714` = 0.868
Koefisien Korelasi

r = `sqrt(0.868)` = 0.932
Sumber :
1. Rinaldi Munir, Metode Numerik, 2003, Informatika Bandung
2. Steven C.Chapra dan Raymond P.Canale, Metode Numerik Untuk Teknik, 1991, UI Press,

Anda mungkin juga menyukai