MODUL KE – 7
ESTIMASI DATA GEOFISIKA MENGGUNAKAN MACHINE
LEARNING
Oleh:
Rahmat Reska Ramadhani 119120100
Asisten :
Lestari Sukma Apriliana 12117009
Mustika 12117025
Santo Tri Prabowo 12117041
Agastya Pramadya 12117094
Michael Febrian Mardongan 12117128
Didian Noveni Waruwu 12117131
Muhammad Ichsan 12117143
Fira Pratiwi Darsono 12117151
Tujuan dari praktikum Analisis Data Geofisika modul 7 mengenai “Estimasi Data
Geofisika menggunakan Machine Learning” sebagai berikut :
a. Machine Learning
1. Supervised Learning
Teknik supervised learning merupakan teknik yang bisa diterapkan pada
pembelajaran mesin yang bisa menerima informasi yang sudah ada pada
data dengan memberikan label tertentu.
2. Unsupervised Learning
Teknik unsupervised learning merupakan teknik yang bisa diterapkan pada
machine learning yang digunakan pada data yang tidak memiliki informasi
yang bisa diterapkan secara langsung. (Julio, 2020)
3. Reinforcement Learning
Reinforcement learning berasal dari teori belajar hewan. Pembelajaran ini
tidak memerlukan pengetahuan sebelumnya, dapat secara mandiri
mendapatkan kebijakan opsional dengan pengetahuan yang diperoleh
melalui coba-coba dan terus berinteraksi dengan lingkungan yang dinamis
(Qiang & Zhongli, 2011). Masalah reinforcement learningdiselesaikan
dengan mempelajari pengalaman baru melalui trial-and-error. Algoritma
reinforcement learning terkait dengan algoritma pemrograman dinamis
yang sering digunakan untuk menyelesaikan masalah optimisasi (Mitchell,
1997)
Cara kerja machine learning berbeda-beda sesuai dengan teknik atau metode yang
digunakan. Namun pada dasarnya prinsip cara kerjanya masih seperti mesin pada
biasanya yaitu meliputi pengumpulan data, eksplorasi data, pemilihan model atau
teknik, memberikan pelatihan terhadap model yang dipilih dan mengevaluasi hasil
dari machine learning. (Julio, 2020)
Peran machine learning banyak membantu manusia dalam berbagai bidang. Bahkan
saat ini penerapan machine learning dapat dengan mudah ditemukan dalam
kehidupa sehari-hari. Pada bidang geofisika teknologi machine learning digunakan
dalam berbagai contoh kegiatan antara lain digunakan untuk mengintegrasikan dan
menginterpretasikan data-data berbentuk angka untuk diakukan pengolahan agar
mendapatkan hasil dalam bentuk gambar 2D atau 3D, interpretasi geofisika yang
konsisten terhadap data-data operasional dan property formasi, yang kemudian
diikuti dengan aplikasi data analytics untuk kegiatan-kegiatan operasional seperti
kegiatan pemboran, komplesi, serta akuisisi data yang lebih efektif dan efisien.
Selain itu, metode berbasis data juga diimplementasikan dalam evaluasi formasi
untuk kebutuhan rekontruksi database, noise filtering, dan pendeteksian anomali.
(Jobe, T & Khalif, 2018)
1. Linier Regression
2. Random forest Regressor
3. Xgboost.XGB Regressor
4. lgb.LGBM Regressor
5. Gradient Boosting Regressor (Montgomery, 1992).
c. Well Logging
(Novrianti, 2016)
d. Yj johnson
A. Langkah-langkah
1. Bukalah google colab pada pc/komputer anda.
2. Pilih menu new notbook untuk memulai pekerjaan baru pada colab.
3. Terdapat 8 tahap dalam menyelesaikan script
4. Tahap pertama
• setelah membuat new notbook maka lakukan import libraries
dengan menuliskan import numpy as np dan numpy matloplip as
plt. Untuk penggunaan as artinya yaitu untuk menggantikan
pemanggilan numpy dengan prefix np untuk proses berikutnya.
• Tambahkan libary baru dengan cara menulis perintah pip install
(nama_package), kemudian import library yang sudah diinstall.
5. Tahap kedua
• Memuat dan menampilkan kumpulan data sumur (load and
display the well log dataset) yang nantinya akan digunakan
untuk menampilkan :
✓ Informasi deskripsi statistic dari data sumur 1 dan data
sumur 2
✓ Plot dari data log sumur 1 dan sumur 2
✓ Menampilkan jumlah data yang tidak memiliki nilai
✓ Mengganti data yang tidak memiliki nilai dengan NaN
serta menampilkan kembali jumlah data yang memiliki
nilai
✓ Analisis deskripsi pada masing-masing sumur,
6. Tahap ketiga
• Proses persiapan data (data preparation) berdasarkan nilai
minimum dan maksimum dari tiap data sumur dengan
melakukan limitasi pada batas bawah dan atas untuk
mendapatkan data yang telah difilter yang akan di proses pada
tahap berikutnya.
7. Tahap keempat
• Proses analisis data eksplorasi (exploratory data analysis) yang
dilihat dari proses berikut :
✓ Hasil crossplot, histogram, dan korelasi antara 2 data
sumur
✓ Hasil heatmap dari data rasio
8. Tahap kelima
• Proses normalisasi dilakukan agar rentang nilai pada tiap data
log konstan. Adapun metode yang digunakan yaitu yeo-
jonhson.
• Kemudian dilakukan kembali untuk mendapatkan crossplot
antar dua atribut dan histogram pada masing-masing data log
sebagai perbandingan antara data sebelum dan sesudah
normalisasi.
9. Tahap keenam
• Proses menghapus pencilan (removing outliers) ,Pada tahap ini
data yang semula memiliki beberapa pencilan dapat dihapus
sehingga memberikan dampak terhadap trend data log. Hal
tersebut dapat dibuktikan dari perbandingan crossplot antar dua
atribut dan histogram pada masing-masing data log antara data
sebelum dan sesudah removing outliers. Terdapat 5 metode
removing outliers yang digunakan yaitu:
✓ Standard Deviation Method
✓ Isolation Forest
✓ Minimum Covariance Determinant
✓ Local Outlier Factor
✓ One-class SVM
• Dari proses diatas kita akan memilih salah satu metode yang
terbaik dari ke-5 metode yang digunakan.
10. Tahap ketujuh
• Proses memprediksi percobaan pertama ( Prediction first attempt
) yang dilakukan dengan pembuatan model regresi. Model
regresi yang kita gunakan pada praktikum kali ini adalah :
✓ Linear Regression
✓ Random forest Regressor
✓ Xgboost.XGB Regressor
✓ lgb.LGBM Regressor
✓ Gradient Boosting Regressor
11. Tahap kedelapan
Proses prediksi akhir ( Final prediction), Tahap ini dilakukan setelah
model telah dibangun dengan memasukan nilai X_test dan y_test
berdasarkan atribut pada data test yaitu sumur 15_9-F-11B. Hasil
prediksi ditampilkan dalam bentuk grafik dan disimpan dengan format
nama file 15_9-F-11B_Predicted_DT.csv.
12. Setelah tahap proses pembuatan script selesai maka RUN script tersebut
untuk melihat output yang dihasilkan dari data sumur 1 dan 2.
13. Screnshoot hasil output dan masukkan kedalam laporan yang nantinya
akan dianalisis.
14. Selesai
B. Diagram Alir
START
New notbook
Import library
Proses Normalisasi
next
next
END
IV. HASIL DAN PEMBAHASAN
a. Hasil
1. Import Libraries
Well 1
Well 2
Well 1
Well 2
c. Train data Well
a. Sebelum
b. Sesudah
4. Exploratory data Analysis
5. Normalisasi
6. Removing Outliers
Pada hasil trend data dan test data pada well 1 menampilkan hasil data well
log pada parameter NPHI, RHOB, GR, RT, PEF, CALI, dan DT sedangkan pada
data well 2 menampilkan nilai parameter yang sama kecuali nilai DT. Pada
praktikum kali ini data well log digunakan untuk pengukuran parameter fisika
dalam sumur bor terhadap kedalamannya. Hasil dari analisis well log digunakan
untuk mengetahui karakteristik reservoir (segi porositas, saturasi air, dan
permeabilitas). Dari hasil yang diketahui dapat dilihat well log pada setiap
parameter semiliki nilai yang bervariasi dimana data well log pada data sumur 2
memiliki kedalam yang lebih besar dari data sumur 1.
Pada tahap persiapan data (Data preparation) akan dilakukan proses limitasi
batas atas dan batas bawah, dimana terdapat 7 parameter yang diketahui yaitu
DEPTH, NPHI, RHOB, GR, RT, PEF,CALI. Jumlah data yang dihasilkan pada
proses ini adalah 15169 baris x 7 kolom .
Pada tahap terakhir yaitu tahap prediksi akhir , dimana pada tahap ini akan
menampilkan well log pada data log DT dan well log pada data 15/9-F-118. Yang
nantinya disimpan dengan format nama file 15_9-F-11B_Predicted_DT.csv.
V. KESIMPULAN
1. Nilai yang telah melalui tahap removing outliers dan normalisasi akan
menghasilkan nilai yang lebih bagus dari sebelumnya.
2. Dari kelima model regresi yang digunakan, model Random Forest
Regressor merupakan model yang memiliki nilai RMSE terkecil yaitu
bernilai 0.1450
3. Semakin kecil nilai RMSE maka data yang dihasilkan semakin akurat.
4. Pada model ini konsep machine learning dapat diterapkan dengan membagi
data menjadi data trend dan data test
5. Nilai R-squared berbanding terbalik dengan nilai RMSE-nya, semakin
tinggi nilai R-squared maka semakin rendah nilai RMSE nya.
DAFTAR PUSTAKA
Brownlee, J. (2020, Mei). How to Use Power Transforms for Machine Learning.
Retrieved fromhttps://machinelearningmastery.com/author/jasonb/:
https://machinelearningmastery.com/power-transforms-with-scikit-learn/
Jobe, T, & Khalif, M. (2018). Geological feature prediction using image-based
machine learning. Society of Petrophysicists and Well-Log Analysts.
Julio, A. (2020, Agustus 19). Apa itu machine learning? beserta pengertian dan
cara kerjanya. Retrieved from Apa itu machine learning? beserta pengertian
dan cara kerjanya: https://www.dicoding.com/blog/machine-learning-
adalah/
Mitchell, M. T. (1997). Machine Learning. In McGraw Hill Series in Computer
Science.
Montgomery, D. (1992). Introduction to Linier Regression Analysis. (Willey, Ed.)
Novrianti. (2016). Teknik Pemboran Minyak dan Gas. Journal of Earth Energy
Engineering.
Qiang, W., & Zhongli, Z. (2011). Reinforcement learning model, algoritms and its
application. International Conference on Mechatronic Science, Electric
Enginering and Computer (MEC), 1143-1146.
Rezkia, S. M. (2020, September). Apa itu Machine Learning. Retrieved from
Belajar data science di rumah: https://www.dqlab.id/pahami-machine-
learning-untuk-hadapi-industri-data-sebenarnya
LAMPIRAN
Link Colaboration
https://colab.research.google.com/drive/1iAp601ia-NWBa0Hdifvt9-
wH0GIZeHwi?usp=sharing
Awal
Pertengahan
Akhir