SKRIPSI
Diajukan oleh
RANGGA HERLAMBANG
18/431111/TK/47704
Kepada
DEPARTEMEN TEKNIK NUKLIR DAN TEKNIK FISIKA
FAKULTAS TEKNIK
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2022
i
HALAMAN PENGESAHAN
SKRIPSI
iv
…“Succes is a journey, not a destination. It requires constant effort, vigilance and
reevaluation”….
-Mark Twain
v
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada Allah, Tuhan Yang Maha
Kuasa yang senantiasa melimpahkan rahmat serta karunia-Nya, sehingga penulis
dapat menyelesaikan skripsi dengan judul “Soft Sensor Berbasis Adaptive
Boosting Untuk Prediksi Nilai Kandungan Oksigen Dalam Flue Gas Pada
Boiler PT. Pertamina RU V Balikpapan” dengan baik. Skripsi ini merupakan
salah satu syarat untuk memperoleh Derajat S-1, Program Studi Teknik Fisika,
Departemen Teknik Nuklir dan Teknik Fisika, Fakultas Teknik, Universitas Gadjah
Mada.
1. Allah SWT, yang selalu memberikan hamba kesehatan serta kelancaran dalam
menulis skripsi ini, sehingga dapat terselesaikan dengan baik.
2. Kedua orang tua penulis, yang telah mendidik, mendoakan, memberikan
semangat, serta memberikan bekal di perantauan hingga saat ini.
3. Bapak Dr. Ir. Alexander Agung, S.T., M.Sc. selaku Ketua Departemen Teknik
Nuklir dan Teknik Fisika Fakultas Teknik Universitas Gadjah Mada atas
kesempatan dan persetujuan yang telah diberikan kepada penulis untuk
melaksanakan penelitian dan penulisan skripsi.
4. Bapak Ir. Nazrul Effendy,S.T., M.T., Ph.D., IPM. dan Bapak Ir. Agus Arif,
M.T., selaku pembimbing penulis yang selalu memberikan saran dan waktunya
kepada penulis dalam menyelesaikan skripsi ini.
5. PT. Paragon Technology and Innovation, selaku pemberi beasiswa Paragon
Pemberdayaan, yang telah memberikan penulis beasiswa sebagai penunjang
perkuliahan hingga lulus.
vi
6. Bapak/Ibu dosen atas ilmu yang diberikan selama penulis melaksanakan
perkuliahan di Departemen Teknik Nuklir dan Teknik Fisika
7. Bapak/Ibu staf pengajaran Departemen Teknik Nuklir dan Teknik Fisika atas
bantuan yang diberikan kepada penulis selama ini.
8. Dany Yudha Putra Haque sebagai teman satu program studi di Departemen
Teknik Nuklir dan Teknik Fisika sekaligus teman satu kos, yang membantu
saya dalam mencari ide untuk penulisan skripsi khususnya di bagian machine
learning.
9. Rekan mahasiswa lainnya di Departemen Teknik Nuklir dan Teknik Fisika.
10. Seluruh pihak yang tidak dapat disebutkan satu per satu.
Akhir kata, dalam penulisan skripsi ini masih banyak kekurangan dan
kesalahan, karena itu segala kritik dan saran yang membangun akan
menyempurnakan penulisan skripsi ini serta bermanfaat bagi penulis dan para
pembaca.
Rangga Herlambang
vii
DAFTAR ISI
DAFTAR ISI
viii
III.3.3 Masalah Pengukuran Sensor Zirkonia ............................................... 33
III.4. Soft Sensor Analyzer ................................................................................ 34
III.5. Machine Learning .................................................................................... 35
III.5.1. Underfitting dan Overfitting.............................................................. 37
III.6. Ensemble Learning................................................................................... 38
III.7 Decision Tree ............................................................................................ 39
III.8. Random Forest ......................................................................................... 40
III.9. Adaptive Boosting .................................................................................... 41
III.9.1 Hyperparameters AdaBoost............................................................... 43
III.10. Korelasi Pearson.................................................................................... 44
III.11. Hyperparameters tuning ........................................................................ 46
III.11.1. Cross Validation ............................................................................. 47
III.11.2. Grid Search CV dan Randomized Search CV ................................. 48
III.12. Metrik Evaluasi ...................................................................................... 49
PELAKSANAAN PENELITIAN .......................................................... 52
Alat dan Bahan Penelitian........................................................................ 52
IV.1.1. Alat Penelitian ................................................................................... 52
IV.1.2. Bahan Penelitian ............................................................................... 53
Tata Laksana Penelitian ........................................................................... 54
IV.2.1. Studi Literatur ................................................................................... 56
IV.2.2. Pengolahan Awal Data ...................................................................... 56
IV.2.2.1 Penanganan Data Yang Hilang ....................................................... 56
IV.2.2.2 Pemisahan Data ............................................................................... 57
IV.2.3. Perancangan Model ........................................................................... 58
IV.2.4. Pembangunan Model ........................................................................ 59
IV.2.4.1 Kondisi Default ............................................................................... 59
IV.2.4.2 Seleksi Fitur .................................................................................... 60
IV.2.4.3 Penyesuaian Hyperparameters ....................................................... 60
IV.2.5. Evaluasi Hasil Pembangunan Model ................................................ 61
IV.2.6. Penulisan Laporan............................................................................. 62
HASIL DAN PEMBAHASAN................................................................ 63
Hasil Pengolahan Awal Data..................................................................... 63
ix
V.1.1. Hasil penanganan data yang hilang .................................................... 63
V.1.2. Hasil Pemisahan Data ........................................................................ 66
V.1.2.1 Hasil Pemisahan Fitur dan Target .................................................... 66
V.1.2.2 Hasil Pemisahan Data Latih dan Data Uji ........................................ 67
Hasil Pembangunan Model ....................................................................... 68
V.2.1. Hasil Kondisi Default ......................................................................... 68
V.2.2. Hasil Seleksi Fitur .............................................................................. 69
V.2.2.1 Nilai Rata-rata dan Standar Metrik Evaluasi.................................... 72
V.2.3. Hasil Penyesuaian Hyperparameters ................................................. 76
KESIMPULAN DAN SARAN .............................................................. 79
Kesimpulan .............................................................................................. 79
Saran ........................................................................................................ 79
DAFTAR PUSTAKA ........................................................................................... 81
LAMPIRAN A ...................................................................................................... 86
x
xi
DAFTAR TABEL
DAFTAR TABEL
DAFTAR GAMBAR
Gambar 2.1. Perbandingan nilai metrik evaluasi menggunakan ANN dan random
forest................................................................................................. 14
Gambar 3.1. Fire tube boiler................................................................................. 19
Gambar 3.2. Water tube boiler.............................................................................. 20
Gambar 3.3. Boiler dan komponennya ................................................................. 22
Gambar 3.4. Skema deaerator drum ..................................................................... 23
Gambar 3.5. Alur pembakaran pada boiler ........................................................... 24
Gambar 3.6. Grafik excess air vs penurunan efisiensi .......................................... 28
Gambar 3.7. Tiga struktur kristal zirkonia ............................................................ 29
Gambar 3.8. Penginstalan sensor zirkonia pada bagian stack ............................... 30
Gambar 3.9. Skema pengukuran sistem amperometrik ........................................ 31
Gambar 3.10. Skema pengukuran sistem potensiometrik ..................................... 32
Gambar 3.11. Skema ensemble learning .............................................................. 38
Gambar 3.12. Ilustrasi pohon keputusan ............................................................... 39
Gambar 3.13. Ilustrasi random forest ................................................................... 40
Gambar 3.14. Algoritma AdaBoost ....................................................................... 43
Gambar 3.15. Grafik korelasi pearson pada berbagai nilai r................................. 46
Gambar 3.16. Validasi silang ................................................................................ 48
Gambar 4.1. Diagram alir penelitian. .................................................................... 55
Gambar 4.2. Soft sensor untuk memprediksi nilai kandungan oksigen dalam flue
gas pada boiler menggunakan AdaBoost. ........................................ 59
Gambar 4.3. Diagram alir pembuatan model soft sensor AdaBoost ..................... 61
Gambar 5.1. Grafik kolom nilai rata-rata MAE pada kondisi default .................. 75
Gambar 5.2. Grafik kolom nilai rata-rata MSE pada kondisi default ................... 76
Gambar 5.3. Perbandingan nilai metrik evaluasi pada setiap kondisi................... 78
xiii
Lambang Romawi
Lambang Kuantitas Satuan
T Temperatur absolut K
𝑥̅ Rata-rata nilai x -
𝑦̅ Rata-rata nilai y -
Superskrip
Lambang Deskripsi
k Indeks cross validation
i Urutan dari sampel data
Singkatan
FD Forced Draft
GA Genetic Algorithm
ID Induced Draft
RU Refinery Unit
Oleh
Rangga Herlambang
18/431111/TK/47704
Diajukan kepada Departemen Teknik Nuklir dan Teknik Fisika Fakultas Teknik
Universitas Gadjah Mada pada tanggal 18 Mei 2022
untuk memenuhi sebagian persyaratan untuk memperoleh derajat
Sarjana Program Studi Teknik Fisika
INTISARI
Pada sistem gas buang (flue gas) dari suatu pembangkit listrik, kandungan
oksigen merupakan salah satu faktor penting yang mempengaruhi efisiensi boiler.
Pengukuran oksigen yang akurat juga memainkan peran penting dalam menilai
keekonomian operasi boiler. Pada kilang minyak PT. Pertamina RU V Balikpapan,
piranti zirkonia oxygen analyzer digunakan sebagai instrumen pengukur oksigen,
namun hal itu belum memadai dalam menentukan kinerja operasi boiler.
Kekurangan dari instrumen tersebut adalah presisi pengukuran yang rendah,
tingginya biaya pemeliharaan dan masa pakai yang singkat, yang pada
kenyataannya tidak mendukung untuk pemantauan waktu nyata jangka panjang dan
tidak menjamin boiler beroperasi pada kondisi pembakaran sempurna.
Salah satu alternatif yang dapat digunakan sebagai pengganti pengukuran
nilai kandungan oksigen adalah dengan menggunakan soft sensor. Namun
perancangan soft sensor ini tidak mudah, karena proses pembakaran dalam boiler
tergolong kompleks dan terdapat banyak faktor yang mempengaruhi nilai
kandungan oksigen.
Pada penelitian ini dikembangkan suatu soft sensor untuk memprediksi nilai
kandungan oksigen pada boiler dengan menggunakan metode adaptive boosting
(AdaBoost). Dataset yang digunakan dalam penelitian ini berasal dari data historis
Distributed Control System (DCS) boiler PT. Pertamina RU V Balikpapan. Hasil
penelitian menunjukkan bahwa model AdaBoost setelah mengalami optimasi
hyperparameters memberikan hasil terbaiknya menggunakan 10 fitur dengan nilai
mean absolute error (MAE) sebesar 0,16815 dan nilai mean squared error (MSE)
sebesar 0,04258.
xvi
Kata kunci: kandungan oksigen, boiler, oxygen analyzer, AdaBoost
Pembimbing Utama : Ir. Nazrul Effendy, S.T., M.T., Ph.D., IPM.
Pembimbing Pendamping : Ir. Agus Arif, M.T.
xvii
ABSTRACT
ABSTRACT
In the flue gas system of a power plant, the oxygen content is one of the
critical factors affecting boiler efficiency. Accurate oxygen measurement also plays
a vital role in assessing the economics of boiler operation. At the PT. Pertamina RU
V Balikpapan, zirconia oxygen analyzer are used as oxygen measuring instruments,
but it is not sufficient for determining boiler operating performance. Disadvantages
of such instruments are low measurement precision, high maintenance costs and
short service life, which in fact does not support a long-term real-time monitoring
and does not guarantee the boiler is operating at complete combustion conditions.
One alternative that can be used as a substitute for measuring oxygen
content's value is a soft sensor. However, the design of this soft sensor is not easy
because the boiler's combustion process is complex, and many factors affect the
value of the oxygen content.
In this study, a soft sensor was developed to predict the value of the oxygen
content in the boiler using the adaptive boosting (AdaBoost) method. The dataset
used in this research come from historical data of Distributed Control System
(DCS) boiler PT. Pertamina RU V Balikpapan. The results showed that the
AdaBoost model, after hyperparameters optimization, gave the best results using
ten features with an mean absolute error (MAE) value of 0.16815 and an mean
squared error (MSE) value of 0.04258.
xviii
PENDAHULUAN
Latar Belakang
Pada industri proses, khususnya pengolahan minyak dan gas, boiler (ketel
uap) adalah salah satu komponen yang begitu penting. Boiler adalah perangkat
berbentuk bejana baja tertutup yang dirancang untuk menghasilkan uap. Uap
dihasilkan dengan memanaskan bejana berisi air dengan bahan bakar. Bahan bakar
yang digunakan biasanya berupa bahan bakar cair (residu, solar), padatan (batu
bara), atau gas. Karena pembakaran bahan bakar dapat menghasilkan kalor, maka
terjadi perpindahan kalor dari sumber panas ke air, yang menyebabkan air memanas
atau berubah menjadi uap [1]. Air tersebut mendapatkan energi kalor untuk
penguapan yang diperoleh dari proses pembakaran di dalam furnace [2].
Salah satu parameter boiler yang penting adalah nilai kandungan oksigen
pada gas buang. Bahan bakar di dalam furnace membutuhkan udara dalam jumlah
tertentu untuk menciptakan proses pembakaran yang ideal. Proses pembakaran
yang ideal ini merupakan “theoretical air” yaitu kondisi di mana bahan bakar
dibakar seluruhnya oleh udara. Namun, karena kondisi ideal sulit dicapai, maka
dibutuhkan udara yang jumlahnya lebih besar dari theoretical air untuk menjamin
terjadinya proses pembakaran yang ideal. Jumlah udara lebih inilah yang disebut
“excess air” [3]. Boiler paling efisien ketika asupan udara pembakaran hanya
sedikit lebih tinggi dari nilai minimum yang dibutuhkan untuk pembakaran.
Mempertahankan tingkat udara berlebih yang tidak terlalu tinggi pada semua laju
pembakaran menghasilkan penghematan bahan bakar dan biaya yang signifikan [4].
Pada kilang minyak PT. Pertamina RU V Balikpapan terdapat pembangkit
listrik dengan enam unit boiler yang fungsinya untuk membangkitkan steam
sebagai umpan menuju steam turbine generator. Enam unit boiler ini memiliki tipe
water tube boiler, yang cara kerjanya adalah mengedarkan feedwater melalui pipa
dan memanaskannya oleh nyala api dan gas panas dari luar susunan pipa [1]. Sensor
yang digunakan untuk mengukur kandungan oksigen pada boiler adalah piranti
zirconia oxygen analyzer. Fungsi dari zirconia oxygen analyzer adalah untuk
1
2
memonitor nilai kandungan oksigen dalam flue gas, yang berhubungan dengan nilai
excess air. Dengan demikian apabila nilai excess air tidak sesuai dengan standar
yang ditetapkan, maka sensor zirkonia akan mengirimkan sinyal masukan ke
control valve untuk menyesuaikan pasokan udara yang masuk ke furnace.
Kelebihan dari sensor ini di antaranya adalah mudah dipasang pada stack, respon
lebih cepat, dan tidak membutuhkan pengambilan sampel. Kekurangan dari sensor
ini di antaranya adalah presisi pengukuran rendah, tingginya bianya pemeliharaan
dan masa pakai yang singkat, yang pada kenyataannya tidak mendukung untuk
pemantauan waktu nyata jangka panjang, dan tidak menjamin boiler beroperasi di
bawah pembakaran terbaik [5]. Karena alasan tersebut, maka sensor tersebut dapat
rusak sewaktu-waktu atau mengalami penurunan kinerja, yang mengakibatkan
error pada pengukuran kandungan oksigen.
Beberapa tahun terakhir, ditemukan cara baru untuk memonitor peralatan
industri secara otomatis, khususnya sensor yaitu predictive maintenance. Predictive
maintenance adalah pekerjaan untuk mencari pola ketika sistem diduga gagal dalam
waktu dekat [6].
Pada penelitian ini, komponen sistem yang dicegah kegagalannya adalah
error sensor zirkonia dalam memprediksi nilai kandungan oksigen. Sensor zirkonia
yang mengalami kegagalan dapat berakibat tidak mampu mempertahankan excess
air pada nilai yang diinginkan. Kegagalan dapat diprediksi dengan menggunakan
berbagai alat, contohnya model berbasis data. Model berbasis data dapat dilakukan
dengan mengumpulkan data historis dari berbagai macam parameter proses untuk
membuat suatu model prediksi [6]. Predictive maintenance yang menggunakan
data historis dari berbagai macam parameter proses untuk membuat model prediksi
berbasis machine learning itu disebut soft sensor.
Pada penelitian ini dikembangkan suatu soft sensor untuk memprediksi nilai
kandungan oksigen pada boiler menggunakan metode adaptive boosting
(AdaBoost). Adaptive boosting adalah teknik dalam machine learning yang
menggunakan ensemble methods. Ensemble methods adalah suatu metode di mana
suatu algoritma melatih data menggunakan beberapa kombinasi model dan
3
Perumusan Masalah
Seperti yang telah diketahui, kekurangan yang ada pada pada sensor
zirkonia oxygen analyzer adalah presisi pengukuran rendah, tingginya bianya
pemeliharaan dan masa pakai yang singkat, yang pada kenyataannya tidak
mendukung untuk pemantauan waktu nyata jangka panjang, dan tidak menjamin
boiler beroperasi dengan pembakaran terbaik [4]. Selain itu jika sensor oksigen ini
rusak, tidak adanya alat redundansi sebagai cadangan pengukuran menjadi kendala
utama karena tidak adanya yang mem-back up kerja sensor oksigen tersebut. Salah
satu metode yang dapat digunakan untuk mengukur kandungan oksigen dalam flue
gas adalah dengan menggunakan soft sensor, khususnya dengan algoritma adaptive
boosting. Karena alasan tersebut, perumusan masalahnya adalah sebagai berikut:
1. Bagaimana merancang model perangkat soft sensor berbasis AdaBoost pada
Python untuk memprediksi nilai kandungan oksigen dalam flue gas pada
boiler?
4
Tujuan Penelitian
Tujuan dari penelitian ini adalah mengembangkan model perangkat soft
sensor berbasis AdaBoost pada Python untuk memprediksi nilai kandungan
oksigen dalam flue gas pada boiler.
Manfaat Penelitian
Manfaat dari penelitian ini adalah :
1. Hasil penelitian ini diharapkan dapat memberikan kontribusi bagi kemajuan
ilmu pengetahuan.
2. Hasil penelitian ini dapat digunakan sebagai pedoman untuk penelitian
selanjutnya.
3. Hasil penelitian ini dapat dijadikan acuan untuk pengembangan predictive
maintenance dengan soft sensor pada industri minyak & gas.
4. Hasil penelitian ini dapat dijadikan bahan pertimbangan bagi PT. Pertamina
RU V Balikpapan dalam menerapkan metode adaptive boosting untuk
memprediksi nilai kandungan oksigen dalam flue gas pada boiler.
TINJAUAN PUSTAKA
Pada tahun 2012, Sun Lingfang dan Wang Yechi melakukan penelitian
mengenai penerapan support vector regression (SVR) untuk memprediksi
kandungan oksigen di dalam flue gas pada Pembangkit Listrik Tenaga Uap Batu
Bara (PLTU – Bahan bakar) [9]. Dataset yang digunakan berasal dari data historis
DCS pada Maret 2010, interval waktunya 30 detik, masing-masing input memiliki
jumlah data 1565, dan dibagi menjadi 500 sebagai data latih dan 1065 sebagai data
uji, dengan jumlah parameter input mencapai 19. Namun, karena jumlah input yang
terlalu banyak dapat menurunkan akurasi model, digunakan metode principal
component analysis (PCA) untuk mereduksi jumlah dimensi input, sehingga
didapatkan hanya 7 parameter input yang dapat mengoptimalkan keakuratan
prediksi model. Selain itu, dengan mempertimbangkan beberapa faktor interferensi
seperti penuaan boiler atau sensor, hasil output (kandungan oksigen dalam gas
buang) menggunakan metode empirical mode decomposition (EMD) untuk
menghilangkan pengaruh yang disebabkan oleh gangguan frekuensi tinggi.
Sebelum data latih input dimodelkan ke dalam SVR, terlebih dahulu data
dinormalisasi agar rentang data yang berbeda menjadi sama dan konsisten. Setelah
data model terbentuk, model dikalibrasi menggunakan metode K-fold cross
validation (K-CV) untuk mendapatkan parameter g (fungsi kernel RBF) dan
koefisien penalti C, hasilnya menunjukkan bahwa nilai g = 0,027 dan nilai C = 28
adalah optimasi terbaik. Setelah model diprediksi, didapatkan nilai mean square
error (MSE) adalah 0,4045.
Pada tahun 2015, Shihe Chen, Zhang Xi, Weiwu Yan, dan Dandan Zhang
melakukan penelitian mengenai penerapan metode gaussian process regression
(GPR) untuk memprediksi kandungan oksigen dalam flue gas pada pembangkit
listrik 1000 MW Ultra Supercritical di Provinsi Guangdong, China [10]. Dataset
yang digunakan berasal dari data historis DCS dengan jumlah 1200 data untuk
5
6
masing-masing parameter input, di mana 600 data digunakan sebagai data latih, 400
data sebagai data validasi, dan 200 data sebagai data uji. Ada 15 parameter input
yang digunakan yaitu steam pressure, steam temperature, flue-gas temperature of
draft fan, actuator position of draft fan, supply water flow After the selection, outlet
flue gas temperature, supply air volume, hearth negative pressure, amount of fuel,
total air volume, generator power, actuator position of pressure fan, the current of
pressure fan, the current of draft fan dan water flow. Untuk mengevaluasi performa
model, beberapa parameter seperti root mean squared error (RMSE), average log-
density error (ALDE), dan relative variance tracking precision (RVTP) digunakan.
RMSE merefleksikan akurasi model, ALDE adalah ketidakpastian model, dan
RVTP adalah kinerja model dalam memperkirakan tren yang berbeda dari nilai
sebenarnya. Setelah dilakukan prediksi, didapatkan nilai kinerja model seperti yang
ditunjukkan pada Tabel 2.1.
Pada tahun 2017, Zhenhao Tang, Haiyang Zhang, dan Hui Yang melakukan
penelitian mengenai penerapan artificial neural networks (ANN) untuk
memprediksi kandungan oksigen di dalam flue gas pada power plant [13]. Model
pada ANN ini dilatih menggunakan algoritma backpropagation neural network
(BPNN) dan optimasinya menggunakan genetic algorithm (GA). Dataset yang
digunakan dalam penelitian ini berasal dari sistem DCS power plant. Namun, data
tersebut masih memiliki noise, sehingga digunakan aturan 3𝜎 untuk menemukan
7
data yang error dan menghapusnya, kemudian diisi dengan data baru dan dihitung
dengan metode interpolasi. Awalnya, dipilih 20 data parameter operasional boiler
sebagai input model. Namun, hal itu akan berakibat pada kurangnya akurasi model.
Untuk itu, dilakukan pengurangan jumlah variabel input menggunakan metode
partial least square (PLS). Metode PLS ini adalah gabungan dari metode principal
component analysis (PCA), canonical correlation analysis (CCA), dan multiple
linear regression (MLR). Setelah menggunakan metode PLS, didapatkan 8
parameter input untuk dilatih pada model. Kedepalan parameter itu adalah main
steam flow, reheater pressure, fuel quanlity, electricity of blower, air delivery,
furnace negative pressure, desuperheating water flow dan boiler steam rate.
Masing-masing input tersebut terdiri dari 5500 set data yang dibagi kedalam 5
bagian. Setiap bagian memuat 1000 data latih dan 100 data uji. Setelah dilakukan
prediksi, didapatkan hasil seperti nilai seperti sum of absolute relative error (SRE),
lower deviation, dan upper deviation model GABP seperti yang ditunjukkan pada
Tabel 2.2.
Pada Tahun 2020, Zhenhao Tang, Yanyan Li, dan Andrew Kusiak
melakukan penelitian mengenai penerapan nonlinear combined deep belief network
(NCDBN) untuk memprediksi kandungan oksigen dalam flue gas pada boiler [14].
Dataset yang digunakan berasal dari data historis DCS pembangkit listrik Guodian
Taizhou 1000MW. Sebelum data dimodelkan, terlebih dahulu data dinormalisasi
menggunakan distribusi normal untuk mengurangi rentang variasi parameter,
kemudian data dipisah menjadi control variable dan state variables. Selanjutnya,
dalam memilih input variabel yang memiliki pengaruh signifikan, digunakan
metode algoritma least absolute shrinkage and selection operator (LASSO) untuk
8
mereduksi dimensi input dan meningkatkan akurasi model. Setelah itu, didapatkan
7 control variables dan 7 state variables yang dapat dilihat pada Tabel 2.3.
NCDBN model
Error With Lasso Without Lasso
Metrics
MAE 0,0146 0,0377
MRE 0,5151 1,3741
MSE 0,0005 0,0023
Time (s) 25,8 40,1
Dari Tabel 2.6 dapat dilihat bahwa dengan menggunakan algoritma LASSO
pada model NCDBN dapat mengurangi waktu latih sebesar 14,3 detik dan
meningkatkan efisiensi dan akurasi pada model.
9
10
validasi, dan 1144 data sebagai data uji. Pada awalnya, peneliti menggunakan 18
parameter sebagai input, kecuali kandungan oksigen karena digunakan sebagai
output seperti yang ditunjukkan pada Tabel 2.5.
Namun karena jumlah input yang terlalu banyak dapat menurunkan akurasi
model, digunakan metode random forest feature importance untuk mereduksi
jumlah dimensi input, sehingga didapatkan hanya 14 parameter input yang dapat
mengoptimalkan keakuratan prediksi model. Setelah dibuat model dengan 14
parameter tersebut, digunakan pula hyperparameter tuning agar hasil prediksi lebih
akurat lagi, dan didapatkan nilai mean absolute error (MAE) sebesar 0,04369 dan
nilai root of mean squared error (RMSE) sebesar 0,06338.
11
Namun karena jumlah input yang terlalu banyak dapat menurunkan akurasi
model, digunakan metode principal component analysis (PCA) untuk mereduksi
dimensi input, dan didapatkan ada 4 parameter input yang memiliki korelasi yang
tinggi dengan output. Berdasarkan hasil prediksi, performa model terbaik diperoleh
ketika sistem menggunakan 25 hidden nodes dan mendapatkan nilai mean squared
error (MSE) 2,16 x 10-3 dengan standar deviasi 2,42 x 10-4.
Gambar 2.1. perbandingan nilai metrik evaluasi menggunakan ANN dan random
forest [15]
(bersambung)
16
DASAR TEORI
Boiler
Boiler adalah bejana baja tertutup yang berfungsi memindahkan panas yang
dihasilkan pembakaran bahan bakar ke air yang pada akhirnya akan menghasilkan
uap dan digunakan untuk proses di luar boiler itu sendiri. Uap ini kemudian dapat
digunakan untuk mentransfer panas ke suatu proses, seperti untuk memutar turbin
generator pada pembangkit listrik [1].
Sedangkan pada water tube boiler, feedwater diedarkan melalui pipa dan
dipanaskan oleh nyala api dan gas panas dari luar susunan pipa. Kontruksi pipa
dapat berbentuk lurus ataupun bengkok tergantung jenis dari jenis boiler. Steam
yang dihasilkan dikeluarkan melalui steam outlet yang terdapat pada header.
Tekanan steam juga biasanya di atas 250 psi dan kapasitas di atas 12 ton/jam [1].
Gambar skema water tube boiler dapat dilihat pada Gambar 3.2.
Berikut adalah gambar komponen boiler beserta alur kerjanya yang dapat dilihat
pada Gambar 3.3.
22
tubes boiler yang digunakan untuk memanaskan air menjadi high high pressure
(HHP) steam. HHP steam merupakan uap air yang dipanaskan hingga mencapai
temperatur 500°C dan tekanan 101-109 Bar. Boiler yang menjadi kajian dalam
penelitian ini adalah boiler 6, yang memanfaatkan gas alam sebagai bahan bakar di
dalam furnace untuk memanaskan feedwater hingga menghasilkan steam
bertekanan tinggi yang akan menggerakan generator turbin.
Fluida kerja yang ditampung di deaerator akan mengalir melalui dua pipa
yang berbeda, pipa pertama menuju superheater spray dan pipa kedua menuju
firunace. Superheater spray bekerja sebagai alat yang mengontrol temperatur uap
bertekanan tinggi setelah melewati superheater pada boiler. Fluida yang masuk ke
furnace akan dipanaskan dengan dua cara yaitu radiasi dan konveksi. Pada
pemanasan secara radiasi, aliran air pada pipa dipanaskan dari sumber api
pembakaran, sedangkan pada konveksi pemanasan air dilakukan dengan aliran gas
panas hasil pembakaran yang akan dialirkan menuju stack. Setelah melakukan
proses pemanasan, fluida akan dipisahkan menurut bentuknya, yaitu fase uap dan
24
fase cair. Fluida cair akan dipanaskan dengan economizer sebelum masuk ke steam
drum, sedangkan fluida uap akan masuk ke steam header untuk menggerakkan
generator turbin. Fluida cair yang berada di steam drum selanjutnya akan dialirkan
kembali ke furnace untuk pemanasan kembali [16].
furnace, tekanan gas bahan bakar di belakang control valve, laju aliran udara
pembakaran, tekanan udara burner box, temperatur keluaran flue gas boiler,
tekanan windbox, serta temperatur udara pembakaran.
Pada udara, komposisinya terdiri dari oksigen, nitrogen, argon, dan gas
lainnya [21]. Tabel 3.2 menunjukkan persentase mol dari komposisi udara.
26
Namun karena sangat jarang didapati proses pembakaran yang sempurna, gas buang
pada pembakaran biasanya akan ada bahan bakar dan O2 yang tidak terbakar, sisa-
sisa pembakaran ini mengalir keluar lewat cerobong (stack).
Di mana:
m = massa (kg)
N = jumlah mol
M = massa molar
Dari Persamaan (3.2) diketahui bahwa untuk pembakaran ideal dibutuhkan 17,2 kg
udara untuk membakar 1 kg metana.
Dari grafik diketahui bahwa 15% excess air, yang setara dengan 3%
oksigen, adalah kadar yang tepat untuk memaksimalkan efisiensi pembakaran.
Dapat dilihat pada kadar ini penurunan efisiensi adalah 0.
Ketika seluruh sel dipanaskan hingga suhu optimum 650 °C, oksigen
dengan ion bermuatan negatif di dalam zirkonia menjadi sangat mobile dan dengan
cepat bermigrasi melintasi dinding sel untuk menjaga keseimbangan dengan
tekanan parsial oksigen pada kedua permukaan sel. Seperti yang ditunjukkan di
atas, jika tekanan oksigen berbeda, ini menciptakan ketidakseimbangan muatan
(atau gradien muatan) melintasi dinding sel [25]. Tegangan yang dihasilkan antara
elektroda kemudian dikaitkan dengan kandungan oksigen (atau tekanan parsial)
dari gas pengukuran yang tidak diketahui menggunakan persamaan Nernst yang
ditunjukkan pada Persamaan (3.3).
Di mana:
Persamaan di atas menunjukkan bahwa selama suhu sensor (T) tetap dan
diketahui, dan gas referensi juga tetap dan diketahui, maka EMF yang dihasilkan
selalu sebanding dengan log alami (ln) dari tekanan parsial oksigen dari gas
pengukuran yang tidak diketahui. Oleh karena itu, sensor zirkonia diilustrasikan
sebagai sensor potensiometrik logaritmik. Dapat juga diperhatikan bahwa jika
kedua gas referensi dan gas sampel nilainya tetap dan diketahui (tetapi tidak sama,
karena suku logaritmik di sebelah kanan T akan menjadi nol), maka sensor akan
bertindak sebagai termokopel dan pengukuran tegangan akan sebanding dengan
suhu (T). Oleh karena itu, pengukuran suhu sel yang akurat sama pentingnya
dengan pengukuran gas itu sendiri.
1. Gas yang mengandung halogen seperti fluor, klorin, dan bromin akan
menyebabkan kerusakan pada sensor. Kandungan lain seperti SOx dan H2S
juga dapat mempersingkat masa pakai sensor. Hal ini disebabkan karena
paparan gas-gas ini dapat mengurangi efek katalitik dari elektroda platinum
[29].
2. Kesalahan pengukuran disebabkan jika suhu atau kelembaban gas referensi
(udara) bervariasi secara signifikan antara kalibrasi dan pengukuran [30].
3. Kebocoran adalah salah satu faktor yang membuat sensor tidak akurat. Jika
gas proses (gas terukur) bercampur dengan gas referensi karena kebocoran,
maka akan terjadi peningkatan konsentrasi oksigen dalam gas proses, yang
mengakibatkan perbedaan konsentrasi oksigen di anoda dan di sel katoda
semakin mengecil sehingga nilai kandungan oksigen yang ditampilkan
menunjukkan hasil yang tinggi [31].
data yang hilang, data outlier, dan sebagainya. Akibatnya, data tidak langsung
berlaku untuk pemodelan sensor lunak [32]. Namun, membangun sensor lunak jauh
lebih murah daripada menambahkan sensor redundansi, sehingga penggunaan soft
sensor sebagai cadangan sensor utama mulai banyak digunakan di industri proses.
Implementasinya dapat digunakan bersama dengan sensor utama sehingga ketika
sensor utama mengalami masalah atau dalam perawatan, soft sensor dapat menjadi
backup dalam jangka waktu tertentu.
1. Supervised Learning
Algoritma supervised learning digunakan untuk memecahkan berbagai
masalah yang berkaitan dengan:
• Classification (klasifikasi)
• Regression (regresi)
𝑦 = 𝑓(𝑥) (3.5)
Ketika proses training selesai, terbentuklah model. Model ini harus diuji
ulang dengan dataset yang berbeda, bukan dataset yang digunakan selama
training, yang disebut data uji (test set). Hal ini menunjukkan apakah fase
training dinilai berhasil atau gagal. Beberapa algoritma yang termasuk
supervised learning di antaranya adalah SVM, regresi linier, logistik linier,
decision trees, dan sebagainya.
2. Unsupervised Learning
Algoritma unsupervised learning digunakan untuk memecahkan berbagai
masalah yang berkaitan dengan:
• Association (asosiasi)
• Clustering (kluster)
Pada unsupervised learning, komputer hanya akan menerima variabel input
dari dataset, dan melakukan proses training tanpa ada variabel output. Jadi,
komputer dituntut untuk belajar sendiri memahami pola dataset yang
37
𝐷 = [𝑋0 , 𝑋1 , … … , 𝑋𝑛 ] (3.6)
3. Reinforecement Learning
Algoritma reinforecement learning perlu memungkinkan komputer untuk
belajar secara mandiri dari lingkungan. Oleh karena itu, komputer
melakukan pencariannya sendiri dengan berinteraksi dengan lingkungan.
Selama proses pelatihan, komputer dipandu oleh algoritma untuk
melakukan trial and error. Setiap kali trial and error dilakukan, ada
feedback ke komputer. Feedback dari tindakan sebelumnya akan digunakan
sebagai panduan dan peta untuk tindakan selanjutnya. Algoritma
reinforecement learning memilih berbagai opsi dan berbagai metode untuk
mengamati dan mengevaluasi setiap kinerja. Reinforecement learning dapat
belajar dari pengalaman. Aplikasi dari algoritma banyak digunakan pada
perangkat permainan seperti Sega, Nintendo, Playstation, Xbox, game
komputer, dan sebagainya. Beberapa algoritma yang termasuk
reinforecement learning di antaranya adalah deep q network (DQN), actor-
critic, monte carlo tree search (MCTS), dan sebagainya.
Ada dua tahap yang digunakan dalam proses ensemble learning. Pada tahap
pertama sekumpulan base learners diperoleh dari training data, kemudian pada
tahap kedua base learners yang diperoleh pada tahap pertama digabungkan untuk
menghasilkan model prediksi terpadu. Dengan demikian, beberapa prediksi
39
berdasarkan base learners yang berbeda dibangun dan digabungkan menjadi model
yang lebih akurat [36].
Bagging Boosting
partisi data menjadi Acak Memberikan kinerja
himpunan bagian yang lebih tinggi untuk
sampel weak learners.
Tujuan Mengurangi variance Mengurangi bias
Metode yang digunakan Subruang acak Penurunan gradien
𝑀
1. Diberikan dataset Dx dengan training samples {(𝑥𝑗 , 𝑦𝑗 )𝑗=1.
1
2. Tetapkan bobot distribusi yang sama {𝑝𝑖𝑗 = l 𝑖 = 1,2, . . 𝐾; 𝑗 =
𝐿
memulai loop.
𝑀
3. Pada iterasi ke-i, latihlah sampel data M dari {(𝑥𝑗 , 𝑦𝑗 )𝑗=1 dengan
𝐿̅ = ∑ 𝑝𝑖𝑗 𝐿𝑗
𝑗=1
1. Kedua variabel tersebut harus diukur pada skala interval atau rasio.
2. Terdapat hubungan linier antara kedua variabel.
3. Tidak ada outlier yang signifikan. Outlier adalah titik data tunggal dalam
data yang tidak mengikuti pola.
4. Data harus terdistribusi normal atau mendekati.
1 (3.9)
∑ 𝑥𝑦 − 𝑥̅ 𝑦̅
𝑟= 𝑁
√( 1 ∑ 𝑥 2 − 𝑥̅ 2 ) √( 1 ∑ 𝑥 2 − 𝑦̅ 2 )
𝑁 𝑁
Di mana:
𝑥̅ = rata-rata nilai x
𝑦̅ = rata-rata nilai y
46
K-Fold adalah salah satu teknik validasi silang yang paling umum
digunakan pada pemodelan machine learning. Dalam K-fold cross validation,
parameter K menunjukkan jumlah lipatan atau bagian yang dibagi menjadi
kumpulan data tertentu. Salah satu lipatan dipertahankan sebagai kumpulan validasi
dan model machine learning dilatih menggunakan lipatan K-1 yang tersisa. Setiap
lipatan K-Fold digunakan sebagai set validasi di beberapa titik, dengan skor K
(akurasi) yang diberikan sebagai hasilnya [45]. Akhirnya, dibuatlah rata-rata model
terhadap masing-masing lipatan untuk mendapatkan skor akhir untuk model, seperti
yang ditunjukkan pada Gambar 3.16.
48
mendekati nol menunjukkan model memiliki kinerja yang baik. MAE dihitung
dengan menggunakan Persamaan (3.10) seperti berikut.
𝑁 (3.10)
1
𝑀𝐴𝐸 = ∑|𝑦𝑖 − 𝑦̂|
𝑖
𝑁
𝑖=1
Di mana:
N = Jumlah data
𝑦𝑖 = Nilai aktual
𝑁 (3.11)
1 2
𝑀𝑆𝐸 = ∑(𝑦𝑖 − 𝑦̂)
𝑖
𝑁
𝑖=1
Root mean squared error (RMSE) atau akar rata-rata kesalahan kuadrat
mengambil nilai akar kuadrat dari MSE seperti yang ditunjukkan pada Persamaan
(3.12) berikut.
51
𝑁
(3.11)
1 2
𝑀𝑆𝐸 = √ ∑(𝑦𝑖 − 𝑦̂)
𝑖
𝑁
𝑖=1
Semakin besar nilai RMSE, itu menunjukkan bahwa model memiliki kinerja yang
buruk, begitu juga sebaliknya, nilai RMSE yang mendekati nol menunjukkan model
memiliki kinerja yang baik.
Nilai RMSE juga bisa dianggap sebagai simpangan baku dari error yang
dihasilkan oleh model machine learning. Nilai simpangan baku ini
mengilustrasikan seberapa dekat nilai error berpusat di sekitar 0.
52
PELAKSANAAN PENELITIAN
a. Python
Python adalah bahasa pemrograman yang digunakan untuk
membersihkan data, membuat visualisasi, dan membangun model.
Bahasa pemrograman yang open source, bisa ditafsirkan, dan
merupakan bahasa tingkat tinggi ini memungkinkan pendekatan yang
lebih baik untuk pemrograman berorientasi objek. Pada penelitian ini,
digunakan Python versi 3.10. Peneliti menggunakan Python agar dapat
menjalankan algoritma AdaBoost dan program prediksi nilai kandungan
oksigen boiler.
53
b. Jupyter Notebook
Jupyter notebook adalah aplikasi berbasis web open source yang
dapat digunakan untuk membuat dan membagikan dokumen. Dokumen
ini berisi kode, persamaan matematika, visualisasi maupun text. Jupyter
notebook juga merupakan tool yang popular untuk mengolah data
Python.
c. Microsoft Office 365
Microsoft Office 365 ini terdiri dari Microsoft Word dan Microsoft
Excel yang dilanggan UGM. Software ini digunakan untuk membuat
laporan hasil penelitian dan melihat dataset pada tabel.
karena algoritma machine learning tidak mendukung data yang hilang dan dapat
menggangu model berlatih dengan data.
1. Pemisahan data menjadi variabel input (X) dan output (Y). Variabel input
atau disebut sebagai fitur adalah data masukan yang digunakan untuk
prediksi nilai output. Sedangkan variabel output atau disebut sebagai target
merupakan data yang nilainya merupakan hasil keluaran dari input. Variabel
input dan output ini digunakan untuk pelatihan dan pengujian model.
2. Pemisahan data pada fitur menjadi data latih dan data uji. Data latih (X_train)
digunakan oleh model untuk proses pelatihan model, yaitu membangun
algoritma prediksi dan menyesuaikan nilai bobot pada model AdaBoost.
Sedangkan data uji (X_test) digunakan untuk menguji dan mengevaluasi
58
kinerja model. Dari keseluruhan data, akan dibagi secara acak menjadi 80%
untuk data latih dan 20% untuk data uji.
3. Pemisahan data pada target menjadi data latih dan data uji. Data latih
(Y_train) dan data uji (Y_test) ini dipisahkan dalam proses pelatihan dan
pengujian model. Pembagian data sama seperti pada fitur yaitu 80% untuk
data latih dan 20% untuk data uji.
4. Pemisahan data latih menjadi data latih dan data validasi. Tujuan pemisahan
data ini dilakukan untuk meningkatkan performa model dengan
menggunakan cross validation. Pembagian data pada (X_train) menjadi
80% menjadi untuk data latih dan 20% untuk data validasi, begitu pula
untuk (Y_train) menjadi 80% menjadi untuk data latih dan 20% untuk data
validasi.
Gambar 4.2. Soft sensor untuk memprediksi nilai kandungan oksigen dalam flue
gas pada boiler menggunakan AdaBoost
63
64
Fuel
CombustionAir AirBurner MainSteam FlueGas
Gas
Flow Box Temperature Furnace
BehindCV
0 0,205 90227,571 191,486 465,016 126,163
1 0,205 90541,088 194,214 465,010 125,342
2 0,205 90766,579 191,069 465,013 127,68
3 0,205 90967,691 193.447 464,998 122,609
4 0,205 91530,159 191,624 464,991 121,592
(bersambung)
Boiler6
Steam WindBox Combustion Boiler6
FlueGas
Boiler Pressure Air SteamDrum
Outlet
0 380,297 60,604 164,638 41,696 35,146
1 380,502 60,544 164,495 39,827 35,072
2 380,569 60,517 164,05 40,087 35,036
3 381,001 60,554 164,333 39,799 35,048
4 380,955 60,477 164,524 39,352 34,972
(bersambung)
65
Berdasarkan Tabel 5.5, dapat diketahui bahwa semua parameter proses yang
terdapat dalam dataset memiliki jumlah missing value 0. Itu artinya dataset sudah
siap untuk diproses lebih lanjut dalam proses pengolahan awal data ini.
Hasil keluaran dari potongan kode sumber tersebut adalah semua parameter
proses selain ”O2Content“ menjadi fitur (X), sedangkan “O2Content“ sendiri
menjadi target (y).
Hyperparameters Default
n_estimators 50
learning_rate 1,0
loss Linear
Dari tabel 5.9, dapat diketahui bahwa nilai rata-rata MAE dan MSE dari 5
kali percobaan adalah 0,197 dan 0,057. Diketahui juga bahwa nilai standar deviasi
dari MAE dan MSE cukup rendah mendekati nol. Hal ini menunjukkan bahwa nilai
sebaran data setiap percobaan tidak jauh berbeda dari nilai rata-rata.
Koefisien
No Parameter Proses (Fitur)
Korelasi (r)
1 Level Deaerator -0,048
2 Laju Aliran Umpan Water boiler ke Superheater -0,642
3 Temperatur Steam Desuperheater Lanjutan 0,123
4 Laju Aliran Umpan Air -0,924
5 Laju Aliran Masukan Gas Utama ke Furnace -0,888
6 Tekanan Gas Bahan Bakar di Belakang Katup Kontrol -0,871
7 Laju Aliran Udara Pembakaran 0,263
8 Tekanan Udara Burner Box 0,127
9 Temperatur Steam Utama -0,202
10 Tekanan Gas Buang Furnace -0,037
11 Temperatur keluaran Flue Gas Boiler -0,716
12 Tekanan Steam Boiler -0,763
13 Tekanan Wind Box 0,089
14 Temperatur udara Pembakaran -0,116
15 Level Boiler Steam Drum 0,198
16 Main Steam Header -0,924
17 Temperatur Masukan Water Economizer 0,099
18 Temperatur Keluaran Water Economizer 0,934
Dari Tabel 5.10 tersebut terlihat adanya koefisien korelasi yang bernilai
positif dan bernilai negatif. Dari Tabel 5.10, fitur yang memiliki korelasi paling
tinggi dengan kandungan oksigen adalah temperatur keluaran water economizer
dengan nilai 0,934 sedangkan fitur yang memiliki korelasi paling rendah adalah
71
tekanan gas buang furnace dengan nilai -0,037. Tabel 5.11 menunjukkan urutan
fitur yang memiliki korelasi paling rendah sampai paling tinggi dengan kandungan
oksigen.
Tabel 5.11. Urutan fitur yang memiliki nilai korelasi terendah sampai
tertinggi dengan kandungan oksigen
Koefisien
Parameter Proses (Fitur) Korelasi
(r)
Tekanan gas buang furnace -0,037
Level deaerator -0,048
Korelasi rendah
Nilai MAE
Jumlah Percoba Percoba Percoba Percoba Percoba Rata- Standar
Fitur an 1 an 2 an 3 an 4 an 5 rata Deviasi
18 fitur 0,194 0,197 0,195 0,189 0,205 0,196 0,006
17 fitur 0,194 0,202 0,198 0,189 0,192 0,195 0,005
16 fitur 0,203 0,203 0,192 0,188 0,198 0,197 0,007
15 fitur 0,194 0,211 0,198 0,193 0,194 0,198 0,008
14 fitur 0,202 0,19 0,201 0,191 0,192 0,195 0,006
13 fitur 0,202 0,196 0,188 0,171 0,197 0,191 0,012
12 fitur 0,203 0,203 0,189 0,197 0,183 0,195 0,009
11 fitur 0,193 0,199 0,188 0,193 0,19 0,193 0,004
10 fitur 0,19 0,199 0,192 0,178 0,193 0,19 0,007
9 fitur 0,192 0,199 0,2 0,185 0,207 0,197 0,008
8 fitur 0,192 0,212 0,204 0,188 0,199 0,199 0,01
7 fitur 0,206 0,2 0,201 0,191 0,206 0,201 0,006
6 fitur 0,199 0,204 0,204 0,193 0,202 0,2 0,004
(bersambung)
74
Tabel 5.13. Variasi nilai MAE pada berbagai jumlah fitur (sambungan)
Nilai MAE
Jumlah Percoba Percoba Percoba Percoba Percoba Rata- Standar
Fitur an 1 an 2 an 3 an 4 an 5 rata Deviasi
5 fitur 0,202 0,195 0,198 0,204 0,212 0,202 0,006
4 fitur 0,208 0,196 0,2 0,192 0,208 0,201 0,007
3 fitur 0,187 0,231 0,213 0,18 0,202 0,197 0,013
2 fitur 0,202 0,203 0,19 0,184 0,187 0,193 0,009
1 fitur 0,332 0,328 0,351 0,356 0,363 0,346 0,015
Selain itu, Tabel 5.14 juga memperlihatkan variasi nilai MSE pada berbagai
jumlah fitur.
Nilai MSE
Jumlah Percoba Percoba Percoba Percoba Percoba Rata- Standar
Fitur an 1 an 2 an 3 an 4 an 5 rata Deviasi
18 fitur 0,056 0,055 0,057 0,05 0,062 0,056 0,004
17 fitur 0,055 0,06 0,059 0,052 0,054 0,056 0,003
16 fitur 0,059 0,061 0,054 0,051 0,056 0,056 0,004
15 fitur 0,056 0,066 0,058 0,053 0,056 0,058 0,005
14 fitur 0,059 0,054 0,06 0,053 0,054 0,056 0,003
13 fitur 0,059 0,056 0,052 0,043 0,057 0,054 0,006
12 fitur 0,06 0,06 0,053 0,057 0,048 0,056 0,005
11 fitur 0,054 0,058 0,052 0,054 0,054 0,054 0,002
10 fitur 0,052 0,059 0,053 0,047 0,056 0,053 0,005
9 fitur 0,054 0,058 0,059 0,05 0,063 0,057 0,005
8 fitur 0,053 0,066 0,059 0,049 0,056 0,057 0,007
(bersambung)
75
Tabel 5.15. Variasi nilai MSE pada berbagai jumlah fitur (sambungan)
Nilai MSE
Jumlah Percoba Percoba Percoba Percoba Percoba Rata- Standar
Fitur an 1 an 2 an 3 an 4 an 5 rata Deviasi
7 fitur 0,062 0,057 0,059 0,053 0,062 0,058 0,004
6 fitur 0,057 0,061 0,06 0,053 0,058 0,058 0,003
5 fitur 0,059 0,056 0,057 0,058 0,064 0,059 0,003
4 fitur 0,063 0,056 0,059 0,052 0,063 0,059 0,005
3 fitur 0,05 0,061 0,066 0,047 0,059 0,057 0,008
2 fitur 0,061 0,061 0,053 0,049 0,05 0,055 0,006
1 fitur 0,183 0,177 0,194 0,203 0,209 0,193 0,013
Gambar 5.1 dan 5.2 menunjukkan grafik kolom nilai rata-rata MAE dan
MSE pada kondisi default.
0,201
0,199
0,198
0,197
0,197
0,197
0,196
0,195
0,195
0,195
0,193
0,193
0,191
0,19
0,2
Gambar 5.1. Grafik kolom nilai rata-rata MAE pada kondisi default
76
0,193
0,059
0,059
0,058
0,058
0,058
0,057
0,057
0,057
0,056
0,056
0,056
0,056
0,056
0,055
0,054
0,054
0,053
Gambar 5.2. Grafik kolom nilai rata-rata MSE pada kondisi default
Dari rata-rata nilai MAE dan MSE pada berbagai fitur, diketahui bahwa
jumlah fitur yang diperlukan untuk mendapatkan nilai metrik evaluasi terbaik
adalah 10 fitur dengan rata-rata nilai MAE 0,19 dengan standar deviasi 0,007, juga
rata-rata nilai MSE 0,053 dengan standar deviasi 0,005. Nilai standar deviasi yang
cukup kecil ini menandakan bahwa nilai sebaran data pada tiap percobaan tidak
jauh berbeda dengan nilai rata-rata.
Tabel 5.17. Perbandingan nilai MAE dan MSE sebelum dan sesudah
dilakukan penyesuaian hyperparameters.
terbukti bahwa penyesuaian nilai hyperparameters dapat membuat nilai galat pada
model menjadi turun.
0,197 0,19
0,2
0,168
0,15
0,1
0,057 0,053
0,043
0,05
0
Default Seleksi Fitur (10 fitur) Penyesuaian
Hyperparameters
MAE MSE
Kesimpulan
Berdasarkan hasil dan analisis pada penelitian ini, dapat disimpulkan
sebagai berikut:
1. Telah berhasil dilakukan pembangunan model dengan metode adaptive
boosting yang mampu melakukan prediksi nilai kandungan oksigen dalam
flue gas pada boiler di PT. Pertamina RU V Balikpapan.
2. Model terbaik adalah dengan nilai hyperparameters default yaitu
menggunakan 10 fitur dengan rata-rata nilai MAE adalah 0,19 dengan
standar deviasi adalah 0,007. Kemudian rata-rata nilai MSE adalah 0,053
dan standar deviasi adalah 0,005.
3. Penyesuaian nilai hyperparameters dengan randomized search cv pada
model dengan 10 fitur dapat menurunkan nilai MAE sebesar ≈11,58% atau
menjadi 0,168 dan dapat menurunkan nilai MSE sebesar ≈18,87% atau
menjadi 0,043.
Saran
Berdasarkan hasil dan analisis pada penelitian ini, maka saran untuk
penelitian berikutnya adalah sebagai berikut:
a. Saran untuk meningkatkan performa model.
1. Menambahkan data hasil pengukuran pada fitur agar lebih mengetahui pola
dalam pembangunan model, sehingga dapat lebih akurat dalam
memprediksi nilai target (kandungan oksigen).
2. Melakukan pembangunan model machine learning dengan algoritma
lainnya. Harapannya, performa model dengan algoritma yang lain menjadi
lebih baik daripada dengan AdaBoost.
79
80
[4] K. Carpenter and C. Schmidt, “Common Boiler Excess Air Trends and
Strategies to Optimize Efficiency,” ACEEE Summer Study on Energy
Efficiency in Buildings, pp. 52–63, 2008.
[10] S. Chen, Z. Xi, W. Yan, and D. Zhang, “Soft sensor modeling for oxygen-
content in flue gasses in 1000MW ultra-superficial units,” 2015
81
82
[11] Z. Tang, H. Zhang, and H. Yang, “Artificial Neural Networks model for
predicting oxygen content in flue gas of power plant,” 2017 29th Chinese
Control And Decision Conference (CCDC), pp. 1379–1382, 2017.
[12] Z. Tang, Y. Li, and A. Kusiak, “A deep learning model for measuring
oxygen content of boiler flue gas,” IEEE Access, vol. 8, pp. 12268–12278,
2020.
[13] Adi Riyanto, “Penerapan random forest regression untuk prediksi nilai
kandungan oksigen dalam flue gas pada furnace PT. Pertamina RU-IV
Cicalap”, 2021.
[19] 2006. Combustion and Flue Gas Analysis. [Ebook] Euro Instrument, pp.1-
3. Available at:
http://www.eurotron.co.kr/bbs/data/skill/Combustion_Theory.pdf
[23] Nurpadmi and L. Khafidzni, “Pengontrolan Rasio Udara dan Bahan Bakar
pada Boiler PPSDM Migas Menggunakan DCS,” vol. 8, pp. 37–42, 2018.
[30] Model ZR22G, ZR402G Direct in-situ Separate Type Zirconia Oxygen
Analyzers (Hardware Edition), 1st ed. Tokyo, Japan: Yokogowa Electric,
2010.
[32] Y. Jiang, S. Yin, J. Dong, and O. Kaynak, “A review on soft sensors for
monitoring, control, and optimization of Industrial Processes,” IEEE
Sensors Journal, vol. 21, no. 11, pp. 12868–12881, 2021.
[43] Rozy, F., Rangkuti, S., Fauzi, M. A., Sari, Y. A., Dewi, E., & Sari, L,
"Analisis Sentimen Opini Film Menggunakan Metode Naïve Bayes dengan
Ensemble Feature dan Seleksi Fitur Pearson Correlation Coefficient,"
Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK)
Universitas Brawijaya, 6354–6361.
[47] Ichi Pro, "Metrik Evaluasi Umum Untuk Analisis Regresi," Available:
https://ichi.pro/id/metrik-evaluasi-umum-untuk-analisis-regresi-
82886198762157.
import pandas as pd
import numpy as np
#mengimpor dataset dengan format csv ke dalam jupyter notebook
data_boiler = pd.read_csv(”databoilerpertamina.csv“)
data_boiler.head()
86
87
#mendefinisikan data latih dan data uji juga membaginya menjadi 80% untuk
data latih dan 20% data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 0)
score_AdaB18.transpose()
88
#memanggil variabel
feature_importances
Dokumen ini telah melalui proses approval secara daring sebelum QR Code dibubuhkan.
Scan QR Code yang ada di setiap halaman dokumen ini untuk verifikasi.