Anda di halaman 1dari 6

MODUL I

ANALISIS REGRESI (KUADRAT TERKECIL)


Arie Antasari Kushadiwijayanto, (arie.antasari.k@fmipa.untan.ac.id)

Dalam kehidupan sehari-hari, kita biasa menghubungkan satu fakta dengan fakta lain.
Cara menghubungkannya pun bermacam-macam. Intinya, hubungan itu dapat diamati
dari pola beberapa fakta tersebut. Di disiplin ilmu alam, fakta ini biasa dinyatakan
sebagai besaran seperti tinggi, berat, suhu, dan lain-lain. Upaya untuk
mencari/mengetahui hubungan dari dua atau lebih besaran sehingga dapat dibentuk model
matematik dari besaran-besaran tersebut dikenal sebagai Analisis Regersi.

Regresi juga dapat diartikan sebagai cara untuk menentukan hubungan yang kuat antara
variabel bebas terhadap variabel terikat (Investopedia, 2016). Contoh sederhana dan telah
dikenal secara luas adalah hubungan variabel bebas x terhadap variabel terikat y. Teknik
ini masih menjadi andalan dalam analisis data geofisika seperti yang dilakukan oleh
Hayashi (2004) ketika mengaitkan pengukuran konduktifitas listrik terhadap air tawar dan
air asin. Beberapa tahun lalu McDonald dkk. (2011) juga menggunakan teknik ini untuk
mencari hubungan antara Anomali Ionisasi di ekuator terhadap kecepatan prereversal E ×
B drift.

Pada bab ini anda akan mempelajari analisis regersi menggunakan metode kuadrat
terkecil. Konsep kuadrat terkecil sangat populer digunakan dalam analisis regresi. Lalu
apakah konsep kuadrat terkecil? Inti dari konsep ini adalah mencari selisih (kesalahan)
kuadratik minimum dari suatu fungsi objektif (sebenarnya) terhadap fungsi buatan
(Grandis, 2009). Kesalahan minimum dapat ditulis sebagai berikut:

e2    f ( x)  g ( x) 
2
(1)
Dimana e2 adalah kesalahan kuadratik (kuadratik ditandai dengan indeks angka 2),
f (x) adalah fungsi objektif, dan g (x) adalah fungsi buatan/tiruan.

Gambar 1. Regresi garis lurus pada data x dan y yang menggunakan kriteria kesalahan
minimum degan pangkat yang berbeda.
Konsep ini berasumsi bahwa data terdistribusi sempurna. Akibatnya konsep ini cendrung
mewakili sifat umum dari suatu fungsi dan mengabaikan anomali dari funsi tersebut.
Gambar 1. memperlihatkan pengaruh anomali data pada beberapa konsep kesalahan
minimum yang ada dalam analisis regresi.

Suatu fungsi objektif dapat diwakili oleh sebuah fungsi tiruan/buatan sebagaimana
dituliskan berikut ini:

f ( x)  g ( x)  E (2)

f (x) adalah fungsi objektif yang biasanya sering dituliskan sebagai y , dan E adalah
selisih/kesalahan antara fungsi objektif terhadap fungsi tiruan. Apabila fungsi tiruan
merupakan deret seperti pada pers (3):

g ( x)  a0  a1 x  a2 x  ...  an x (3)

Maka pers (2) menjadi:

f ( x)  a0  a1 x  a2 x  ...  an x   E (4)

Dari pers (3) dan (4) dapat disimpulkan bahwa fungsi tiruan akan semakin bagus apabila
nilai error/kesalahan/selisih terhadap fungsi asli semakin kecil. Error yang terkecil bisa
diperoleh apabila turunan pertama dari pers (1) terhadap masing-masing konstanta ai
( i  1,2 ,3,..., n ) adalah nol. Berdasarkan konsep kuadrat maka turunan pertama pers (1)
dapat dituliskan sebagai berikut:

e2 

a0 a0
 ( f ( x)  g ( x)) 2
0


  f ( x)  a  a1 x  a2 x  ...  an x   0
2
0
a0
 2  f ( x)  a0  a1 x1  a2 x2  ...  an xn   0
 f ( x)  a   a x   a x
0 1 1 2 2  ...   an xn  0

e2
 2 x1. f ( x)  a0  a1 x1  a2 x2  ...  an xn   0
a1
 f ( x).x  a .x   a x   a x .x
1 0 1
2
1 1 2 2 1  ...   an xn .x1  0
e2
 2 x2 . f ( x)  a0  a1 x1  a2 x2  ...  an xn   0
a2
 f ( x).x  a .x   a x .x   a x
2 0 2 1 1 2
2
2 2  ...   an xn .x2  0
 (5)
e2
 2 xn . f ( x)  a0  a1 x1  a2 x2  ...  an xn   0
an
 f ( x).x  a .x   a x .x   a x .x
n 0 n 1 1 n 2 2 n  ...   an xnn  0

Pers (5) merupakan sistem persamaan linier (SPL) sehingga dapat diubah dalam bentuk
matrik menjadi:
 n

x x 1 2   x 
 a0    f ( x ) 
n
 a   f ( x).x 
  x1 x x x x x 
 1  
2
1 1 2 
1 n 1
  x2 x x x
2 1
2
2 
2 n
 a x x 
2
    f ( x ). x 2
 (6)
    
    
   a3    
 x 2    
 n  n1  n2  n   4  
x x x x 
x a  f ( x ). x n

Selanjutnya pers (6) dapat diselesaikan menggunakan metode-metode untuk penyelesaian


SPL. Namun apabila yang ditinjau hanya 2 konstanta yaitu a0 dan a1 maka dapat
menggunakan pers (8) dan (9) yang akan dibahas berikutnya.

Metode kuadrat terkecil dengan satu variabel (untuk fungsi linier)

Didapatkan data seperti pada Tabel 1. Jika kedua data tersebut memiliki hubungan yang
erat satu sama lain, maka tentukan model matematik sederhana dari hubungan kedua data
tersebut.

Tabel 1. Data
x 2 6 8 10 14 16 20 22 24 28
y 30 18 22 28 14 22 16 8 20 8
Sumber soal: Triatmodjo (2002)

Penyelesaian:
Model matematik yang dapat digunakan untuk menggambarkan hubungan keduanya
dapat diselesaikan menggunakan metode kuadar terkecil. Pers (6) dengan dua konstanta
dapat diselesaikan dengan metode subtitusi sehingga didapatkan pers (8) dan (9):
y  a0  a1 x (7)
Dimana
a0  y  a1 x (8)
n x. y   x  y
a1  (9)
n x 2   x 
2

Untuk menghitung koefisien a dan b dapat menggunakan bantuan tabel berikut:


Tabel 2. Tabulasi perhitungan regresi linier
No. x y x2 xy
1 4 30 16 120
2 6 18 36 108
3 8 22 64 176
4 10 28 100 280
5 14 14 196 196
6 16 22 256 352
7 20 16 400 320
8 22 8 484 176
9 24 20 576 480
10 28 8 784 224
 152 186 2912 2432

Sehingga nilai:
10  2432  152  186 3952
a1    0,6569
10  2912  152 
2
6016
a0  18,6  (0,6569)  15,2  28,5849
Berdasarkan pers. (1) maka model matematik yang menghubungkan variabel x dan y
adalah:
y  28,5849  0,6569 x

Flow Chart

Gambar 1. Flow chart program regresi linier dengan metode kuadrat terkecil.
Program Regresi Linier Kuadrat Terkecil
Berikut adalah program matlab untuk perhitungan regresi linier dangan metode kuadrat
terkecil:

clear all; clc;

%Tahap 1
x=[4 7 8 9 14 16 23 22 24 25];
y=[30 18 22 28 14 22 16 8 20 8];

%Tahap 2
figure (1)
plot (x,y,'*k')
title ('x Vs y')
xlabel('x')
ylabel('y')

%Tahap 3
n=length(x);
sigma_x= sum(x);
sigma_y= sum(y);
sigma_xy= sum(x.*y);
sigma_x2= sum(x.^2);
x_bar= mean(x);
y_bar= mean(y);

%Tahap 4
b=(n*sigma_xy-sigma_x*sigma_y)/(n*sigma_x2-sigma_x^2);
a=y_bar-b*x_bar;

%Tahap 5
disp( 'Persamaan liniernya adalah :');
disp(sprintf('y= (%.3f)+ (%.3f)x',a,b))
Y=a+b*x;

%Tahap 6
hold on
plot (x,Y,'-k')
hold off

Metode kuadrat terkecil untuk banyak variabel

Daftar Pustaka
Grandis, H. (2009), Pengantar pemodelan inversi geofisika. Himpunan Ahli Geofisika
Indonesia (HAGI). Jakarta.
Hayashi, M. (2004), Temperature-electrical conductivity relation ofwater for
environmental monitoring and geophysical data inversion, Environmental
Monitoring and Assessment, 90, 119-128.
Investopedia. 2006 [diakses pada 26 Februari 2016, 16:48 WIB]. Regression.
http://www.investopedia.com/terms/r/regression.asp
McDonald, S. E., C. Coker, K. F. Dymond, D. N. Anderson, and E. A. Araujo‐Pradere
(2011), A study of the strong linear relationship between the equatorial ionization
anomaly and the prereversal E × B drift velocity at solar minimum, Radio Sci., 46,
RS6004, doi:10.1029/2011RS004702.
Triatmodjo, B. (2002), Metode numerik -dilengkapi dengan program komputer. Beta.
Yogyakarta.

Anda mungkin juga menyukai