MODUL KE – 7
ESTIMASI DATA GEOFISIKA DENGAN MACHINE LEARNING
Oleh:
Johannnes Kevin Simanjuntak 119120045
Asisten :
Lestari Sukma Apriliana 12117009
Mustika 12117025
Santo Tri Prabowo 12117041
Agastya Pramadya 12117094
Michael Febrian Mardongan 12117128
Didian Noveni Waruwu 12117131
Muhammad Ichsan 12117143
Fira Pratiwi Darsono 12117151
Lalu, dari analisis data di atas, kita ubah nama data log 1 menjadi data
training data log 2 menjadi data prediksi. Data training digunakan nantinya untuk
melatih algoritma untuk mencari solusi model yang cocok. Sedangkan data prediksi
digunakan nantinya untuk mengetes dan mengetahui performa model yang
didapatkan pada tahapan prediksi.
Berikut adalah hasil dari histogram dan korelasi dari data-data tersebut.
Lalu kita hapus outliers pada data-data tersebut, sehingga di dapat hasil
sebagai berikut.
Dapat dilihat bahwasanya setelah dilakukan penghapusan outliers, jumlah
outlier pada setiap metode semakin berkurang. Penyajian data disajikan dalam
bentuk boxplot. Diagram boxplot menunjukkan letak kuartil 0 (minimum/batas
bawah), kuartil 1, kuartil 2 (median), kuartil 3, kuartil 4 (maksimum/batas atas),
pada data, serta adanya outliers pada data. Berikut hasil penyajiannya.
Dari penyajiannya ini, dapat dilihat bahwa metode one-class SVM dan
metode standart deviation filter memiliki outliers yang paling sedikit, namun one-
class SVM jauh memiliki hasil yang lebih halus lagi. Berikut merupakan hasil
plotting setelah outlier dihapus.
Dari hasil plotting di atas, didapat bahwa hasil data jauh lebih baik dari
sebelumnya dan juga tidak ada lagi outliers pada plotting data. Lalu kita regresi
datanya untuk mendapatkan nilai RMSE. Di sini kita menggunakan Gradien
Boosting Regressor. Gradient Boosting adalah algoritma machine learning yang
menggunkan ensamble dari decision tree untuk memprediksi suatu nilai. Berikut
hasil RMSE dai data tersebut.
https://colab.research.google.com/drive/16-nl9RSx7mkz-
lfx21Wpk3LHgV8dNGyh?usp=sharing
LAMPIRAN