NIM :
MODUL 5
REGRESI LINIER
A. Tujuan Praktikum
Pada modul kelima ini anda akan menyelesaikan salah satu perhitungan yang menjadi konsep
dasar dalam pemodelan geofisika, step-by-step perhitungan regresi linier tersebut akan
diubah ke dalam bentuk source dengan menerapkan teknik-teknik pemrograman yang telah
dipelajari pada praktikum pertama hingga ketiga. Dalam praktikum ini terdapat beberapa
tujuan yang ingin dicapai yaitu :
1. Mengembangkan source code regresi linier tunggal dalam bahasa pemrograman
MATLAB.
2. Menerapkan konsep top-down design dalam desain algoritma regresi linier tunggal.
B. Konsep Dasar
1. Pengantar Regresi
Regresi linier merupakan suatu metode yang mempelajari hubungan antara dua atau lebih
variabel kuantitatif sehingga satu variabel dapat diramalkan (predicted) dari variabel lainnya.
Hubungan antara dua variabel dapat dinyatakan secara matematis; jika x variabel bebas
(indenpendent variable) dan y variabel tak bebas atau terikat (dependent variable), hubungan
fungsional ditulis dalam bentuk seperti di bawah ini dan jika diketahui nilai x tertentu, fungsi
f akan memberkan nilai y yang bersesuaian.
𝑦 = 𝑓(𝑥)
Kita sering menghadapi masalah estimasi parameter atau variable yang mirip dengan
fenomena variasi temperatur terhadap kedalaman, jika temperatur bervariasi secara linier
terhadap kedalaman maka persamaan matematik yang merepresentasikan fenomena
tersebut adalah persamaan garis lurus T (temperatur) sebagai fungsi z (kedalaman), yaitu T =
a + bz. Permasalahan tersebut umumnya dibahas sebagai permasalahan regresi garis lurus
biasa yang sering pula disebut sebagai regresi linier.
Sumber kesalahan diantaranya adalah kesalhan alat, kesalahan pengukuran, dan sebainya.
Namun demikian untuk penyederhanaan masalah semua kesalahan terakumulasi sebagai
selisih antara data pengamatan dengan data perhitungan dapat dianggap sebagai noise atau
error yang harus diminimumkan. Model terbaik atau model optimum diperoleh jika kesalahan
tersebut minimum. Agar model terbaik yang diperoleh berasosiasi dengan kesalahan
minimum untuk semua data maka dalam menentukan atau mencari parameter a dan b,
perhitungan kesalahan tersebut harus melibatkan semua data. Hal tersebut diperoleh dengan
cara menjumlahkan semua selisih antara data perhitungan dan data pengamatan, sehingga
error function dapat dirumuskan sebagai :
𝑁 𝑁
dimana pengkuadratan selisih antara Tcal dan Tobs dimaksudkan untuk tidak membedakan
selisih posistif atau negatif (Tcal > Tobs atau sebaliknya Tcal < Tobs). Pencarian parameter a
dan b dengan kriteria kesalahan (atau selisih) kuadrat minum dikenal sebagai metode kuadrat
terkecil (least-square method).
𝑦 = 𝑎 + 𝑏𝑥
Dimana a merupakan intercept atau titik perpotongan antara grafik dan sumbu y, b
merupakan gradien, y merupakan variable terikat, dan x merupakan variable bebas.
Nilai a dan b dapat dihitung dengan persamaan berikut :
𝑦̅Ʃ𝑥𝑖2 − 𝑥̅ Ʃ𝑥𝑖 𝑦𝑖
𝑎=
Ʃ𝑥𝑖2 − 𝑛𝑥̅ 2
b. Step-By-Step Perhitungan
Salah satu contoh sederhana yang bisa kita angkat adalah mengenai perubahan temperatur
terhadap kedalaman. Secara logika semakin dalam, suhu di bawah permukaan bumi juga akan
semakin meningkat karena semakin dekat dengan inti bumi. Jika dinyatakan dalam suatu
persamaan linier maka persamaannya adalah
𝑇 = 𝑎 + 𝑏𝑧
𝑦 = 𝑎 + 𝑏𝑥
Dimana temperatur (T) merupakan variable terikat atau (y) dan kedalaman (z) merupakan
variable bebas (x). Dengan mencari parameter a dan b, maka kita dapat memprediksi suhu
pada kedalaman tertentu (secara kasarnya). Kenyataan kasus perubahan temperatur
terhadap kedalaman tersebut sangat cocok dengan konsep regresi linier, dimana regresi linier
ini cukup baik bekerja pada suatu keadaan yang linier seperti kasus variasi temperatur
terhadap kedalaman. Kami telah menyajikan data temperatur dan kedalaman di bawah ini.
Kita akan mencoba mencari parameter a dan b untuk kemudian memprediksi temperatur
pada beberapa kedalaman.
z (m) T (°C)
0.5 28.5
1 26.9
1.5 29.4
2 28.8
2.5 30.3
3 28.7
3.5 31.2
4 30.6
Step-by-step perhitungan regresi linier untuk data temperatur terhadap kedalaman adalah
sebagai berkut :
• Mendefinisikan bahwa temperatur (T) adalah variable terikat atau (y) dan
kedalaman (z) adalah variable bebas atau (x)
x (m) y (°C)
0.5 28.5
1 26.9
1.5 29.4
2 28.8
2.5 30.3
3 28.7
3.5 31.2
4 30.6
4.5 32.1
5 30.5
• Sesuai dengan konsep top-down design yang telah dipelajari pada praktikum
ketiga kita dapat memecah variable-variable yang ada pada persamaan untuk
mencari parameter a dan b pada regresi linier menjadi beberapa bagian.
𝑦̅Ʃ𝑥𝑖2 − 𝑥̅ Ʃ𝑥𝑖 𝑦𝑖
𝑎=
Ʃ𝑥𝑖2 − 𝑛𝑥̅ 2
Ʃ𝑥𝑖 𝑦𝑖 − 𝑛𝑥̅ 𝑦̅
𝑏=
Ʃ𝑥𝑖2 − 𝑛𝑥̅ 2
𝑐 = 𝑦̅ 𝑑 = 𝑥̅
𝑐𝑒 − 𝑑𝑓
𝑎=
𝑒 − 𝑛𝑑 2
𝑓 − 𝑛𝑐𝑑
𝑏=
𝑒 − 𝑛𝑑 2
𝑑 = 𝑥̅
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1
1
𝑥̅ = (0,5 + 1 + 1,5 + ⋯ + 5)
10
1
𝑥̅ = (27,5)
10
𝑥̅ = 2,75
𝑐 = 𝑦̅
1
𝑦̅ = (28,5 + 29,4 + 26,9 + ⋯ + 30,5)
10
1
𝑦̅ = (297)
10
𝑦̅ = 29,7
𝑒 = Ʃ𝑥𝑖2
𝑒 = 0.52 + 12 + 1.52 + ⋯ + 52
𝑒 = 2,5 + 1 + 2.25 + ⋯ + 25
𝑒 = 96,25
𝑓 = Ʃ𝑥𝑖 𝑦𝑖
𝑓 = 833,25
(2858,625) − (2291,4375)
𝑎=
96,25 − (75,625)
567,1875
𝑎=
20,625
𝑎 = 27.5
𝑓 − 𝑛𝑐𝑑
𝑏=
𝑒 − 𝑛𝑑 2
(833,25) − (816,75)
𝑏=
96,25 − (75,625)
16.5
𝑏=
20,625
𝑦 = 𝑎 + 𝑏𝑥
𝑦 = (27,5) + 0,8𝑥
𝑦 = (27,5) + 0,8(10)
𝑦 = (27,5) + 8
𝑦 = 28.3
C. Problem Sheet
1. Suatu survey seismik refleksi dilakukan untuk mengetahui kedalaman reflektor
mendatar sebagaimana pada gambar. Waktu tempuh gelombang yang bergerak
sesuai dengan lintasan berwarna merah , memenuh model matematika berikut :
4𝑧 2 1 2
2
+ 2 𝑥 = 𝑡2
𝑣 𝑣
4𝑧 2
𝑎=
𝑣2
1
𝑏=
𝑣2
𝑥 = 𝑥2
𝑦 = 𝑡2
𝑦 = 𝑎 + 𝑏𝑥
2. Berikut merupakan data rata-rata anomali temperatur bumi setiap tahun. Jika
diasumsikan perubahan anomali temperatur merupakan fungsi linier terhadap waktu
:
𝑇𝑖 = 𝑎 + 𝑏𝑡𝑖
Dimana Ti merupakan temperatur bumi pada tahun ke-I, ti merupakan tahun ke-I dan
a serta b merupakan parameter yang akan dicari menggunakan regresi linier.