MODUL KE – 4
CURVE FITTING DAN OPTIMALISASI
Oleh:
Johannes Kevin Simanjuntak 119120045
Asisten :
Nugroho Prasetyo, S.T.
Rizki Wulandari, S.T.
Wisnu Prayudha, S.T.
Irma G Pangaribuan 118120119
Muhammad Ichsan 12117143
Adapun tujuan dari praktikum ini ialah Mahasiswa mengerti dan mampu
menggunakan regresi linear dan regresi data geofisika dan geologi menggunakan
bahasa python.
BAB II
DASAR TEORI
y=a0 +a1 x
y i=a0 +a1 xi + ei
dimana e i disebut error, residual, atau sering juga disebut misfit atau
kesalahan prediksi (prediction error). Garis regresi tidak akan berhimpit dengan
setiap data observasi dan biasanya untuk kasus inversi seperti ini selalu
overdetermined. Secara umum, tipe masalah inversi seperti ini diselesaikan
dengan metode least squares. Dengan metode least squares, kita mencoba
meminimalkan error, e i , dengan cara menentukan nilai a 0 dan a 1 sedemikian rupa
sehingga diperoleh jumlah-kuadrat-error, (S), yang minimal.
P ( x i) =a 1 x i+ a0
rupa. Dengan kata lain, sebisa mungkin y i sampa dengan P ( x i) atau dapat
diformulasikan sebagai
m
∑ yi −¿ P ( x i ) =0 ¿
i=1
∑ yi −¿ ( a1 xi + a0 )=0¿
i=1
Suku yang berada disebelah kiri dinamakan fungsi error (error function),
yaitu
m
E ( a 0 , a1 ) =∑ y i−¿ ( a1 x i +a0 ) ¿
i=1
m
E ( a 0 , a1 ) =∑ ¿ ¿
i=1
Agar fungsi error bisa mencapai nilai minimum, maka syarat yang harus
dipenuhi adalah:
∂ E ( a0 , a1 )
=0
∂ a1
dimana i = 0 dan 1, karena dalam kasus ini memang cuma ada a 0a0 dan a 1.
Maka mesti ada dua buah turunan yaitu:
∂ E ( a0 , a1 ) ∂
m
∂ a0
= ∑ ¿¿
∂ a0 i=1
m
2 ∑ ( y ¿ ¿ i−¿ a1 x i−a 0)(−1)=0¿ ¿
i=1
m m
a 0 m+a1 ∑ x i=∑ y i
i=1 i=1
Dan
∂ E ( a0 , a 1 ) ∂
m
∂ a1
= ∑¿¿
∂ a1 i=1
m
2 ∑ ( y ¿ ¿ i−¿ a1 x i−a 0)(−x i )=0 ¿ ¿
i=1
m m m
2
a 0 ∑ x i +a1 ∑ x i =∑ x i y i
i=1 i=1 i=1
m (∑ ) (∑ )
i=1
xi2 −
i=1
xi
m m m
m ∑ x i y i−∑ xi ∑ y i
i=1 i=1 i=1
a 1= m m 2
m ( )( )
∑ xi2 −
i=1
∑ xi
i=1
m=G−1 d
Akan tetapi, pada kenyataannya semua data pengukuran pasti memiliki error
yang besarnya relatif bervariasi. Karenanya, data observasi tak akan pernah fit
secara sempurna dengan model. Itu artinya keberadaan misfit tidak pernah bisa
dihindari. Konsekuensinya, misfit (baca: error) tersebut mesti disertakan pada d =
Gm
d=Gm+ e i
dan selanjutnya, solusi regresi linear diupayakan dengan cara meminimalkan
jumlah kuadrat dari error, e i . Cara ini tak lain berupaya untuk memperoleh misfit
terkecil yaitu jarak perbedaan terkecil antara data survei dan model. Dalam
formulasi matematika, kuadrat error tersebut dinyatakan dengan
T T T T T T
∂ q ∂ [ d d−d Gm−m G d+ m G Gm ]
=
∂ mj ∂m j
Sehingga
Akhirnya diperoleh
2 G T Gm=2 G T d
GT Gm=GT d
−1
m=[ G T G ] G T d
MENGINPUT DATA X
Deklarasikan x = [].
Kita gunakan perulangan for terhadap i dengan range sebesar n.
Deklarasi data_x sebagai tipe data float (data bilangan desimal), lalu input
“masukkan data x ke-%d” data x yang diinput sesuai dengan jumlah data
yang diinput.
Lalu ketik x.append(data_x), maksudnya kita menambahkan item terakhir
dari daftar x setara dengan nilai data_x yang diinput.
MENGINPUT DATA Y
REGRESI POLINOM
mulai
Ouput hasil
linear fitting
Ouput
kurva fitiing
selesai
REGRESI POLINOM
mulai
Ouput persamaan
polinom fitting
Ouput
kurva fitiing
selesai
BAB IV
HASIL DAN PEMBAHASAN
Dalam kenyataannya, tidak semua data observasi berhimpit dengan satu garis
lurus. Jika kita mencoba fitting terhadap semua titik data observasi kepada suatu
garis, maka garis tersebut dapat disebut sebagai regresi.
Kita sering menghadapi masalah estimasi parameter atau variabel yang mirip
dengan fenomena variasi temperatur terhadap kedalaman. Jika temperatur
bervariasi secara linier terhadap kedalaman maka persamaan matematik yang
merepresentasikan fenomena tersebut adalah persamaan garis lurus. T
(temperatur) sebagai fungsi z (kedalaman), yaitu T = a + b z. Namun,
permasalahan tersebur umumnya dibahas dalam permasalahan regresi garis lurus
ataupun regresi polinom.
Kedalaman Temperatur
5 35,4
16 50,1
25 77,3
40 92,3
50 137,6
60 147
70 180,8
80 182,7
90 188,5
100 223,2
Dari pemograman yang telah dilakukan, maka didapatkan data hasil fitting
linear yaitu sebagai berikut:
Dari hasil kurva fitting di atas, menyatakan bahwa tidak semua hasil
perhitungan atau prediksi temperature cocok (fit) seluruhnya dengan hasil
pengukuran (data) dari lapangan karena adanya error (kesalahan) atau noise.
Namun demikian untuk penyederhanaan masalah semua kesalahan terakumulasi
sebagai selisih antara data pengamatan dengan data perhitungan dapat dianggap
sebagai noise atau error yang harus diminimumkan. Model terbaik atau model
optimum diperoleh jika kesalahan tersebut minimum. Dapat kita lihat dari data
temperature lapangan dan hasil fitting pemograman yang memiliki selisih yang
sangat minimum. Misalnya saja pada data temperature pertama, pada data
lapangan bernilai 35.4, sedangkan pada data fitting pemograman bernilai
35.18766763. dari sini didapat selisih dari kedua nilai adalah hanya 0.2123323.
dari dapat kita lihat bahwa selisih kedua data sangat minimum atau errornya
sangat minimum, sehingga dapat dibentuk garis lurus atau linier.
Dari pemograman ini juga, telah didapatkan nilai parameter model a dan b,
dimana nilai a = 25.280020266482737 dan nilai b = 1.9815294726402481. dari
sini dapat kita bentuk fungsi linear fitting T = a + bz dengan T =
25.280020266482737 + 1.9815294726402481z.
Regresi polinom masih termasuk sebagai regresi linier karena hubungan
antara data dengan parameter model masih linear. Bentuk umum kurva fitting
polinomial adalah sebegai berikut
j
f ( x )=a0 +a1 x+ a2 x 2 +…+ a j x j=a0 + ∑ a k x k
k=1
m m m m
∑ xi2 ∑ y i−∑ x i y i ∑ x i
a= i=1 i=1 i=1 i=1
m m 2
m (∑ ) (∑ )
i=1
xi2 −
i=1
xi
m m m
m ∑ x i y i −∑ x i ∑ y i
i=1 i=1 i=1
b= m m 2
m (∑ ) (∑ )
i=1
2
xi −
i=1
xi
T = 25.280020266482737 + 1.9815294726402481z.
References
grandis, h. (2009). Pengantar pemodelan Inversi Geofisika. Bandung: Himpunan Ahli
Geofisika Indonesia.
Supriyanto. (2007). Analisis Data Geofisika. Depok: Departemen Fisika Fmipa Universitas
Indonesia.