Dalam kehidupan sehari-hari, kita biasa menghubungkan satu fakta dengan fakta lain.
Cara menghubungkannya pun bermacam-macam. Intinya, hubungan itu dapat diamati
dari pola beberapa fakta tersebut. Di disiplin ilmu alam, fakta ini biasa dinyatakan
sebagai besaran seperti tinggi, berat, suhu, dan lain-lain. Upaya untuk
mencari/mengetahui hubungan dari dua atau lebih besaran sehingga dapat dibentuk model
matematik dari besaran-besaran tersebut dikenal sebagai Analisis Regersi.
Regresi juga dapat diartikan sebagai cara untuk menentukan hubungan yang kuat antara
variabel bebas terhadap variabel terikat (Investopedia, 2016). Contoh sederhana dan telah
dikenal secara luas adalah hubungan variabel bebas x terhadap variabel terikat y. Teknik
ini masih menjadi andalan dalam analisis data geofisika seperti yang dilakukan oleh
Hayashi (2004) ketika mengaitkan pengukuran konduktifitas listrik terhadap air tawar dan
air asin. Beberapa tahun lalu McDonald dkk. (2011) juga menggunakan teknik ini untuk
mencari hubungan antara Anomali Ionisasi di ekuator terhadap kecepatan prereversal E ×
B drift.
Pada bab ini anda akan mempelajari analisis regersi menggunakan metode kuadrat
terkecil. Konsep kuadrat terkecil sangat populer digunakan dalam analisis regresi. Lalu
apakah konsep kuadrat terkecil? Inti dari konsep ini adalah mencari selisih (kesalahan)
kuadratik minimum dari suatu fungsi objektif (sebenarnya) terhadap fungsi buatan
(Grandis, 2009). Kesalahan minimum dapat ditulis sebagai berikut:
e2 f ( x) g ( x)
2
(1)
Dimana e2 adalah kesalahan kuadratik (kuadratik ditandai dengan indeks angka 2),
f (x) adalah fungsi objektif, dan g (x) adalah fungsi buatan/tiruan.
Gambar 1. Regresi garis lurus pada data x dan y yang menggunakan kriteria kesalahan
minimum degan pangkat yang berbeda.
Konsep ini berasumsi bahwa data terdistribusi sempurna. Akibatnya konsep ini cendrung
mewakili sifat umum dari suatu fungsi dan mengabaikan anomali dari funsi tersebut.
Gambar 1. memperlihatkan pengaruh anomali data pada beberapa konsep kesalahan
minimum yang ada dalam analisis regresi.
Suatu fungsi objektif dapat diwakili oleh sebuah fungsi tiruan/buatan sebagaimana
dituliskan berikut ini:
f ( x) g ( x) E (2)
f (x) adalah fungsi objektif yang biasanya sering dituliskan sebagai y , dan E adalah
selisih/kesalahan antara fungsi objektif terhadap fungsi tiruan. Apabila fungsi tiruan
merupakan deret seperti pada pers (3):
g ( x) a0 a1 x a2 x ... an x (3)
Dari pers (3) dan (4) dapat disimpulkan bahwa fungsi tiruan akan semakin bagus apabila
nilai error/kesalahan/selisih terhadap fungsi asli semakin kecil. Error yang terkecil bisa
diperoleh apabila turunan pertama dari pers (1) terhadap masing-masing konstanta ai
( i 1,2 ,3,..., n ) adalah nol. Berdasarkan konsep kuadrat maka turunan pertama pers (1)
dapat dituliskan sebagai berikut:
e2
a0 a0
( f ( x) g ( x)) 2
0
f ( x) a a1 x a2 x ... an x 0
2
0
a0
2 f ( x) a0 a1 x1 a2 x2 ... an xn 0
f ( x) a a x a x
0 1 1 2 2 ... an xn 0
e2
2 x1. f ( x) a0 a1 x1 a2 x2 ... an xn 0
a1
f ( x).x a .x a x a x .x
1 0 1
2
1 1 2 2 1 ... an xn .x1 0
e2
2 x2 . f ( x) a0 a1 x1 a2 x2 ... an xn 0
a2
f ( x).x a .x a x .x a x
2 0 2 1 1 2
2
2 2 ... an xn .x2 0
(5)
e2
2 xn . f ( x) a0 a1 x1 a2 x2 ... an xn 0
an
f ( x).x a .x a x .x a x .x
n 0 n 1 1 n 2 2 n ... an xnn 0
Pers (5) merupakan sistem persamaan linier (SPL) sehingga dapat diubah dalam bentuk
matrik menjadi:
n
x x 1 2 x
a0 f ( x )
n
a f ( x).x
x1 x x x x x
1
2
1 1 2
1 n 1
x2 x x x
2 1
2
2
2 n
a x x
2
f ( x ). x 2
(6)
a3
x 2
n n1 n2 n 4
x x x x
x a f ( x ). x n
Didapatkan data seperti pada Tabel 1. Jika kedua data tersebut memiliki hubungan yang
erat satu sama lain, maka tentukan model matematik sederhana dari hubungan kedua data
tersebut.
Tabel 1. Data
x 2 6 8 10 14 16 20 22 24 28
y 30 18 22 28 14 22 16 8 20 8
Sumber soal: Triatmodjo (2002)
Penyelesaian:
Model matematik yang dapat digunakan untuk menggambarkan hubungan keduanya
dapat diselesaikan menggunakan metode kuadar terkecil. Pers (6) dengan dua konstanta
dapat diselesaikan dengan metode subtitusi sehingga didapatkan pers (8) dan (9):
y a0 a1 x (7)
Dimana
a0 y a1 x (8)
n x. y x y
a1 (9)
n x 2 x
2
Sehingga nilai:
10 2432 152 186 3952
a1 0,6569
10 2912 152
2
6016
a0 18,6 (0,6569) 15,2 28,5849
Berdasarkan pers. (1) maka model matematik yang menghubungkan variabel x dan y
adalah:
y 28,5849 0,6569 x
Flow Chart
Gambar 1. Flow chart program regresi linier dengan metode kuadrat terkecil.
Program Regresi Linier Kuadrat Terkecil
Berikut adalah program matlab untuk perhitungan regresi linier dangan metode kuadrat
terkecil:
%Tahap 1
x=[4 7 8 9 14 16 23 22 24 25];
y=[30 18 22 28 14 22 16 8 20 8];
%Tahap 2
figure (1)
plot (x,y,'*k')
title ('x Vs y')
xlabel('x')
ylabel('y')
%Tahap 3
n=length(x);
sigma_x= sum(x);
sigma_y= sum(y);
sigma_xy= sum(x.*y);
sigma_x2= sum(x.^2);
x_bar= mean(x);
y_bar= mean(y);
%Tahap 4
b=(n*sigma_xy-sigma_x*sigma_y)/(n*sigma_x2-sigma_x^2);
a=y_bar-b*x_bar;
%Tahap 5
disp( 'Persamaan liniernya adalah :');
disp(sprintf('y= (%.3f)+ (%.3f)x',a,b))
Y=a+b*x;
%Tahap 6
hold on
plot (x,Y,'-k')
hold off
Daftar Pustaka
Grandis, H. (2009), Pengantar pemodelan inversi geofisika. Himpunan Ahli Geofisika
Indonesia (HAGI). Jakarta.
Hayashi, M. (2004), Temperature-electrical conductivity relation ofwater for
environmental monitoring and geophysical data inversion, Environmental
Monitoring and Assessment, 90, 119-128.
Investopedia. 2006 [diakses pada 26 Februari 2016, 16:48 WIB]. Regression.
http://www.investopedia.com/terms/r/regression.asp
McDonald, S. E., C. Coker, K. F. Dymond, D. N. Anderson, and E. A. Araujo‐Pradere
(2011), A study of the strong linear relationship between the equatorial ionization
anomaly and the prereversal E × B drift velocity at solar minimum, Radio Sci., 46,
RS6004, doi:10.1029/2011RS004702.
Triatmodjo, B. (2002), Metode numerik -dilengkapi dengan program komputer. Beta.
Yogyakarta.