Test Skripsi

HALAMAN JUDUL
SOFT SENSOR BERBASIS ADAPTIVE BOOSTING UNTUK PREDIKSI

NILAI KANDUNGAN OKSIGEN DALAM FLUE GAS PADA BOILER
PT. PERTAMINA RU V BALIKPAPAN
SKRIPSI
untuk memenuhi sebagian persyaratan

untuk memperoleh derajat Sarjana S-1
Program Studi Teknik Fisika
Diajukan oleh
RANGGA HERLAMBANG
18/431111/TK/47704
Kepada
DEPARTEMEN TEKNIK NUKLIR DAN TEKNIK FISIKA
FAKULTAS TEKNIK
UNIVERSITAS GADJAH MADA
YOGYAKARTA
2022
i
HALAMAN PENGESAHAN
SKRIPSI

Nama Mahasiswa : Rangga Herlambang
Nomor Mahasiswa : 18/431111/TK/47704
Pembimbing Utama : Ir. Nazrul Effendy, ST., MT., Ph.D., IPM.
Pembimbing Pendamping : Ir. Agus Arif, MT.
Skripsi ini telah dipertahankan di depan Tim Penguji

pada tanggal 22 September 2022
Ketua Sidang : Ir. Nazrul Effendy, ST., MT., Ph.D., IPM.
Penguji Utama : Dr. Faridah, S.T., M.Sc.
Anggota Penguji : Fadli Kasim, S.T., M.Sc.
Skripsi ini telah diterima dan dinyatakan memenuhi

syarat kelulusan pada tanggal 25 Oktober 2022
Ketua Departemen Teknik Nuklir dan Teknik Fisika

Fakultas Teknik UGM
Dr. Ir. Alexander Agung, S.T., M.Sc.

NIP. 19720916 199803 1002
iii
… Karya ini kupersembahkan untuk diriku sendiri, orang-orang yang
mendukungku, dan almamater…
iv
…“Succes is a journey, not a destination. It requires constant effort, vigilance and
reevaluation”….
-Mark Twain
v
KATA PENGANTAR
Segala puji dan syukur penulis panjatkan kepada Allah, Tuhan Yang Maha
Kuasa yang senantiasa melimpahkan rahmat serta karunia-Nya, sehingga penulis
dapat menyelesaikan skripsi dengan judul “Soft Sensor Berbasis Adaptive
Boosting Untuk Prediksi Nilai Kandungan Oksigen Dalam Flue Gas Pada
Boiler PT. Pertamina RU V Balikpapan” dengan baik. Skripsi ini merupakan
salah satu syarat untuk memperoleh Derajat S-1, Program Studi Teknik Fisika,
Departemen Teknik Nuklir dan Teknik Fisika, Fakultas Teknik, Universitas Gadjah
Mada.
Penulis menyadari bahwa skripsi ini tidak mungkin dapat terselesaikan

tanpa adanya dukungan, bantuan, bimbingan dan nasihat dari berbagai pihak selama
penyusunan skripsi ini. Oleh sebab itu penulis ingin menyampaikan terima kasih
yang sebesar-besarnya kepada semua pihak yang telah membantu penulis,
terkhusus kepada:
1. Allah SWT, yang selalu memberikan hamba kesehatan serta kelancaran dalam
menulis skripsi ini, sehingga dapat terselesaikan dengan baik.
2. Kedua orang tua penulis, yang telah mendidik, mendoakan, memberikan
semangat, serta memberikan bekal di perantauan hingga saat ini.
3. Bapak Dr. Ir. Alexander Agung, S.T., M.Sc. selaku Ketua Departemen Teknik
Nuklir dan Teknik Fisika Fakultas Teknik Universitas Gadjah Mada atas
kesempatan dan persetujuan yang telah diberikan kepada penulis untuk
melaksanakan penelitian dan penulisan skripsi.
4. Bapak Ir. Nazrul Effendy,S.T., M.T., Ph.D., IPM. dan Bapak Ir. Agus Arif,
M.T., selaku pembimbing penulis yang selalu memberikan saran dan waktunya
kepada penulis dalam menyelesaikan skripsi ini.
5. PT. Paragon Technology and Innovation, selaku pemberi beasiswa Paragon
Pemberdayaan, yang telah memberikan penulis beasiswa sebagai penunjang
perkuliahan hingga lulus.
vi
6. Bapak/Ibu dosen atas ilmu yang diberikan selama penulis melaksanakan
perkuliahan di Departemen Teknik Nuklir dan Teknik Fisika
7. Bapak/Ibu staf pengajaran Departemen Teknik Nuklir dan Teknik Fisika atas
bantuan yang diberikan kepada penulis selama ini.
8. Dany Yudha Putra Haque sebagai teman satu program studi di Departemen
Teknik Nuklir dan Teknik Fisika sekaligus teman satu kos, yang membantu
saya dalam mencari ide untuk penulisan skripsi khususnya di bagian machine
learning.
9. Rekan mahasiswa lainnya di Departemen Teknik Nuklir dan Teknik Fisika.
10. Seluruh pihak yang tidak dapat disebutkan satu per satu.
Akhir kata, dalam penulisan skripsi ini masih banyak kekurangan dan
kesalahan, karena itu segala kritik dan saran yang membangun akan
menyempurnakan penulisan skripsi ini serta bermanfaat bagi penulis dan para
pembaca.
Yogyakarta, 20 September 2022
Rangga Herlambang
vii
DAFTAR ISI
DAFTAR ISI
HALAMAN JUDUL ................................................................................................ i

PERNYATAAN BEBAS PLAGIARISME ............................................................ ii
HALAMAN PENGESAHAN ................................................................................ iii
KATA PENGANTAR ........................................................................................... vi
DAFTAR ISI ........................................................................................................ viii
DAFTAR TABEL .................................................................................................. xi
DAFTAR GAMBAR ............................................................................................ xii
DAFTAR LAMBANG DAN SINGKATAN ...................................................... xiii
INTISARI............................................................................................................. xvi
ABSTRACT ....................................................................................................... xviii
PENDAHULUAN ....................................................................................... 1
Latar Belakang .............................................................................................. 1
Perumusan Masalah ...................................................................................... 3
I.2.1. Batasan Masalah .................................................................................... 4
Tujuan Penelitian .......................................................................................... 4
Manfaat Penelitian ........................................................................................ 4
TINJAUAN PUSTAKA............................................................................. 5
DASAR TEORI ...................................................................................... 19
Boiler ........................................................................................................ 19
III.1.1. Tipe dan Komponen Boiler ............................................................... 19
III.1.2. Boiler pada PT. Pertamina RU V Balikpapan ................................... 22
III.1.2.1. Alur Kerja Fluida ........................................................................... 23
III.1.2.2. Alur Kerja Pembakaran .................................................................. 24
III.2. Pembakaran Bahan Bakar ........................................................................ 25
III.2.1. Air/fuel ratio ...................................................................................... 26
III.2.2. Excess Air .......................................................................................... 27
III.3. Aplikasi Sensor Zirkonia Pada Boiler ...................................................... 28
III.3.1 Morfologi Zirkonia............................................................................. 28
III.3.2 Cara Kerja Sensor Zirkonia ................................................................ 29
viii
III.3.3 Masalah Pengukuran Sensor Zirkonia ............................................... 33
III.4. Soft Sensor Analyzer ................................................................................ 34
III.5. Machine Learning .................................................................................... 35
III.5.1. Underfitting dan Overfitting.............................................................. 37
III.6. Ensemble Learning................................................................................... 38
III.7 Decision Tree ............................................................................................ 39
III.8. Random Forest ......................................................................................... 40
III.9. Adaptive Boosting .................................................................................... 41
III.9.1 Hyperparameters AdaBoost............................................................... 43
III.10. Korelasi Pearson.................................................................................... 44
III.11. Hyperparameters tuning ........................................................................ 46
III.11.1. Cross Validation ............................................................................. 47
III.11.2. Grid Search CV dan Randomized Search CV ................................. 48
III.12. Metrik Evaluasi ...................................................................................... 49
PELAKSANAAN PENELITIAN .......................................................... 52
Alat dan Bahan Penelitian........................................................................ 52
IV.1.1. Alat Penelitian ................................................................................... 52
IV.1.2. Bahan Penelitian ............................................................................... 53
Tata Laksana Penelitian ........................................................................... 54
IV.2.1. Studi Literatur ................................................................................... 56
IV.2.2. Pengolahan Awal Data ...................................................................... 56
IV.2.2.1 Penanganan Data Yang Hilang ....................................................... 56
IV.2.2.2 Pemisahan Data ............................................................................... 57
IV.2.3. Perancangan Model ........................................................................... 58
IV.2.4. Pembangunan Model ........................................................................ 59
IV.2.4.1 Kondisi Default ............................................................................... 59
IV.2.4.2 Seleksi Fitur .................................................................................... 60
IV.2.4.3 Penyesuaian Hyperparameters ....................................................... 60
IV.2.5. Evaluasi Hasil Pembangunan Model ................................................ 61
IV.2.6. Penulisan Laporan............................................................................. 62
HASIL DAN PEMBAHASAN................................................................ 63
Hasil Pengolahan Awal Data..................................................................... 63
ix
V.1.1. Hasil penanganan data yang hilang .................................................... 63
V.1.2. Hasil Pemisahan Data ........................................................................ 66
V.1.2.1 Hasil Pemisahan Fitur dan Target .................................................... 66
V.1.2.2 Hasil Pemisahan Data Latih dan Data Uji ........................................ 67
Hasil Pembangunan Model ....................................................................... 68
V.2.1. Hasil Kondisi Default ......................................................................... 68
V.2.2. Hasil Seleksi Fitur .............................................................................. 69
V.2.2.1 Nilai Rata-rata dan Standar Metrik Evaluasi.................................... 72
V.2.3. Hasil Penyesuaian Hyperparameters ................................................. 76
KESIMPULAN DAN SARAN .............................................................. 79
Kesimpulan .............................................................................................. 79
Saran ........................................................................................................ 79
DAFTAR PUSTAKA ........................................................................................... 81
LAMPIRAN A ...................................................................................................... 86
x
xi
DAFTAR TABEL
DAFTAR TABEL
Tabel 2.1. Hasil kinerja model berbasis GPR ......................................................... 6

Tabel 2.2. Error relatif absolut GABP .................................................................... 7
Tabel 2.3. Variabel proses....................................................................................... 8
Tabel 2.4. Hasil seleksi fitur ................................................................................... 9
Tabel 2.5. Parameter proses DCS Balikpapan ...................................................... 10
Tabel 2.6. Parameter proses DCS Cilacap ............................................................ 11
Tabel 2.7. Parameter proses DCS Cilacap ............................................................ 12
Tabel 2.8. Parameter proses ................................................................................. 13
Tabel 2.9. Rangkuman studi literatur dan posisi penelitian .................................. 15
Tabel 3.1. Komposisi gas alam ............................................................................. 25
Tabel 3.2. Komposisi udara .................................................................................. 26
Tabel 3.3. Perbedaan bagging dan boosting ......................................................... 41
Tabel 3.4. Hyperparameters AdaBoost regressor ................................................ 44
Tabel 4.1. Data parameter proses di boiler 6 PT. Pertamina RU V Balikpapan ... 54
Tabel 4.2. Variasi parameter optimasi .................................................................. 60
Tabel 5.1. Output dari potongan kode sumber ...................................................... 63
Tabel 5.5. Jumlah missing value dalam setiap parameter proses .......................... 65
Tabel 5.7. Pemisahan Data Latih dan Data uji ...................................................... 67
Tabel 5.8. Nilai hyperparameters pada kondisi default ........................................ 68
Tabel 5.9. Hasil metrik evaluasi model default..................................................... 69
Tabel 5.10. Nilai r masing-masing fitur terhadap kandungan oksigen ................ 70
Tabel 5.11. Urutan fitur yang memiliki nilai korelasi terendah sampai tertinggi
dengan kandungan oksigen .............................................................. 71
Tabel 5.12. Variasi nilai MAE pada berbagai jumlah fitur .................................. 73
Tabel 5.16. Hasil penyesuian hyperparameters untuk 10 fitur ............................ 77
Tabel 5.11. Perbandingan nilai MAE dan MSE sebelum dan setelah dilakukan
penyesuaian hyperparameters .......................................................... 77
xii
DAFTAR GAMBAR
Gambar 2.1. Perbandingan nilai metrik evaluasi menggunakan ANN dan random
forest................................................................................................. 14
Gambar 3.1. Fire tube boiler................................................................................. 19
Gambar 3.2. Water tube boiler.............................................................................. 20
Gambar 3.3. Boiler dan komponennya ................................................................. 22
Gambar 3.4. Skema deaerator drum ..................................................................... 23
Gambar 3.5. Alur pembakaran pada boiler ........................................................... 24
Gambar 3.6. Grafik excess air vs penurunan efisiensi .......................................... 28
Gambar 3.7. Tiga struktur kristal zirkonia ............................................................ 29
Gambar 3.8. Penginstalan sensor zirkonia pada bagian stack ............................... 30
Gambar 3.9. Skema pengukuran sistem amperometrik ........................................ 31
Gambar 3.10. Skema pengukuran sistem potensiometrik ..................................... 32
Gambar 3.11. Skema ensemble learning .............................................................. 38
Gambar 3.12. Ilustrasi pohon keputusan ............................................................... 39
Gambar 3.13. Ilustrasi random forest ................................................................... 40
Gambar 3.14. Algoritma AdaBoost ....................................................................... 43
Gambar 3.15. Grafik korelasi pearson pada berbagai nilai r................................. 46
Gambar 3.16. Validasi silang ................................................................................ 48
Gambar 4.1. Diagram alir penelitian. .................................................................... 55
Gambar 4.2. Soft sensor untuk memprediksi nilai kandungan oksigen dalam flue
gas pada boiler menggunakan AdaBoost. ........................................ 59
Gambar 4.3. Diagram alir pembuatan model soft sensor AdaBoost ..................... 61
Gambar 5.1. Grafik kolom nilai rata-rata MAE pada kondisi default .................. 75
Gambar 5.2. Grafik kolom nilai rata-rata MSE pada kondisi default ................... 76
Gambar 5.3. Perbandingan nilai metrik evaluasi pada setiap kondisi................... 78
xiii
DAFTAR LAMBANG DAN SINGKATAN
Lambang Romawi
Lambang Kuantitas Satuan
EMF Gaya gerak listrik V
R Konstanta gas molar J.mol-1.K-1
T Temperatur absolut K
z Jumlah unit muatan yang ditransfer -
F Konstanta Faraday C.mol-1
pO2 Tekanan parsial oksigen dalam udara %

(referensi) referensi
PO2 Tekanan parsial oksigen gas pengukuran %
(pengukuran)
r Koefisien korelasi pearson -
N Jumlah sampel data -
𝑥̅ Rata-rata nilai x -
𝑦̅ Rata-rata nilai y -
𝑦𝑖 Nilai aktual pada data ke-i -
𝑦̂𝑖 Nilai Prediksi pada data ke-i -

xiv
Superskrip
Lambang Deskripsi
k Indeks cross validation
i Urutan dari sampel data
Singkatan
ALDE Average Log-Density Error
ANN Artificial Neural Networks
AdaBoost Adaptive Boosting
BFW Boiler Feed Water
BPNN Backpropagation Neural Network
CCA Canonical Correlation Analysis
DCS Distributed Control System
DQN Deep Q Network
EMD Empirical Mode Decomposition
FD Forced Draft
GA Genetic Algorithm
GPR Gaussian Process Regression
ID Induced Draft
K-CV K-Fold Cross Validation
LASSO Least Absolute Shrinkage and Selection Operator

xv
LSSVM Least Squares Support Vector Machines
MAE Mean Absolute Error
MRE Mean Relative Error
MSE Mean Square Error
MLR Multiple Linear Regression
MCTS Monte Carlo Tree Search
NCDBN Nonlinear Combined Deep Belief Network
PCA Principal Component Analysis
PLS Partial Least Square
RBFN Radial Basis Function Network
RMSE Root Mean Squared Error
RU Refinery Unit
RVTP Relative Variance Tracking Precision
SLA Service Level Agreement
SRE Sum of Absolute Relatif Error
SVR Support Vector Machine
XGBoost Xtreme Gradient Boosting

Oleh
Rangga Herlambang
18/431111/TK/47704
Diajukan kepada Departemen Teknik Nuklir dan Teknik Fisika Fakultas Teknik
Universitas Gadjah Mada pada tanggal 18 Mei 2022
untuk memenuhi sebagian persyaratan untuk memperoleh derajat
Sarjana Program Studi Teknik Fisika
INTISARI
Pada sistem gas buang (flue gas) dari suatu pembangkit listrik, kandungan
oksigen merupakan salah satu faktor penting yang mempengaruhi efisiensi boiler.
Pengukuran oksigen yang akurat juga memainkan peran penting dalam menilai
keekonomian operasi boiler. Pada kilang minyak PT. Pertamina RU V Balikpapan,
piranti zirkonia oxygen analyzer digunakan sebagai instrumen pengukur oksigen,
namun hal itu belum memadai dalam menentukan kinerja operasi boiler.
Kekurangan dari instrumen tersebut adalah presisi pengukuran yang rendah,
tingginya biaya pemeliharaan dan masa pakai yang singkat, yang pada
kenyataannya tidak mendukung untuk pemantauan waktu nyata jangka panjang dan
tidak menjamin boiler beroperasi pada kondisi pembakaran sempurna.
Salah satu alternatif yang dapat digunakan sebagai pengganti pengukuran
nilai kandungan oksigen adalah dengan menggunakan soft sensor. Namun
perancangan soft sensor ini tidak mudah, karena proses pembakaran dalam boiler
tergolong kompleks dan terdapat banyak faktor yang mempengaruhi nilai
kandungan oksigen.
Pada penelitian ini dikembangkan suatu soft sensor untuk memprediksi nilai
kandungan oksigen pada boiler dengan menggunakan metode adaptive boosting
(AdaBoost). Dataset yang digunakan dalam penelitian ini berasal dari data historis
Distributed Control System (DCS) boiler PT. Pertamina RU V Balikpapan. Hasil
penelitian menunjukkan bahwa model AdaBoost setelah mengalami optimasi
hyperparameters memberikan hasil terbaiknya menggunakan 10 fitur dengan nilai
mean absolute error (MAE) sebesar 0,16815 dan nilai mean squared error (MSE)
sebesar 0,04258.
xvi
Kata kunci: kandungan oksigen, boiler, oxygen analyzer, AdaBoost
Pembimbing Utama : Ir. Nazrul Effendy, S.T., M.T., Ph.D., IPM.
Pembimbing Pendamping : Ir. Agus Arif, M.T.
xvii
ABSTRACT
SOFT SENSOR BASED ON ADAPTIVE BOOSTING FOR PREDICTING

OXYGEN CONTENT IN THE FLUE GAS OF BOILER AT
by
Rangga Herlambang
18/431111/TK/47704
Submitted to the Department of Nuclear Engineering and Engineering Physics

Faculty of Engineering Universitas Gadjah Mada on May 18, 2022
in partial fulfillment of the requirement for the Degree of
Bachelor of Engineering in Engineering Physics
ABSTRACT
In the flue gas system of a power plant, the oxygen content is one of the
critical factors affecting boiler efficiency. Accurate oxygen measurement also plays
a vital role in assessing the economics of boiler operation. At the PT. Pertamina RU
V Balikpapan, zirconia oxygen analyzer are used as oxygen measuring instruments,
but it is not sufficient for determining boiler operating performance. Disadvantages
of such instruments are low measurement precision, high maintenance costs and
short service life, which in fact does not support a long-term real-time monitoring
and does not guarantee the boiler is operating at complete combustion conditions.
One alternative that can be used as a substitute for measuring oxygen
content's value is a soft sensor. However, the design of this soft sensor is not easy
because the boiler's combustion process is complex, and many factors affect the
value of the oxygen content.
In this study, a soft sensor was developed to predict the value of the oxygen
content in the boiler using the adaptive boosting (AdaBoost) method. The dataset
used in this research come from historical data of Distributed Control System
(DCS) boiler PT. Pertamina RU V Balikpapan. The results showed that the
AdaBoost model, after hyperparameters optimization, gave the best results using
ten features with an mean absolute error (MAE) value of 0.16815 and an mean
squared error (MSE) value of 0.04258.
Keywords: oxygen content, boiler, oxygen analyzer, AdaBoost.

Supervisor : Ir. Nazrul Effendy, S.T., M.T., Ph.D., IPM.
Co-supevisor : Ir. Agus Arif, M.T.
xviii
PENDAHULUAN
Latar Belakang
Pada industri proses, khususnya pengolahan minyak dan gas, boiler (ketel
uap) adalah salah satu komponen yang begitu penting. Boiler adalah perangkat
berbentuk bejana baja tertutup yang dirancang untuk menghasilkan uap. Uap
dihasilkan dengan memanaskan bejana berisi air dengan bahan bakar. Bahan bakar
yang digunakan biasanya berupa bahan bakar cair (residu, solar), padatan (batu
bara), atau gas. Karena pembakaran bahan bakar dapat menghasilkan kalor, maka
terjadi perpindahan kalor dari sumber panas ke air, yang menyebabkan air memanas
atau berubah menjadi uap [1]. Air tersebut mendapatkan energi kalor untuk
penguapan yang diperoleh dari proses pembakaran di dalam furnace [2].
Salah satu parameter boiler yang penting adalah nilai kandungan oksigen
pada gas buang. Bahan bakar di dalam furnace membutuhkan udara dalam jumlah
tertentu untuk menciptakan proses pembakaran yang ideal. Proses pembakaran
yang ideal ini merupakan “theoretical air” yaitu kondisi di mana bahan bakar
dibakar seluruhnya oleh udara. Namun, karena kondisi ideal sulit dicapai, maka
dibutuhkan udara yang jumlahnya lebih besar dari theoretical air untuk menjamin
terjadinya proses pembakaran yang ideal. Jumlah udara lebih inilah yang disebut
“excess air” [3]. Boiler paling efisien ketika asupan udara pembakaran hanya
sedikit lebih tinggi dari nilai minimum yang dibutuhkan untuk pembakaran.
Mempertahankan tingkat udara berlebih yang tidak terlalu tinggi pada semua laju
pembakaran menghasilkan penghematan bahan bakar dan biaya yang signifikan [4].
Pada kilang minyak PT. Pertamina RU V Balikpapan terdapat pembangkit
listrik dengan enam unit boiler yang fungsinya untuk membangkitkan steam
sebagai umpan menuju steam turbine generator. Enam unit boiler ini memiliki tipe
water tube boiler, yang cara kerjanya adalah mengedarkan feedwater melalui pipa
dan memanaskannya oleh nyala api dan gas panas dari luar susunan pipa [1]. Sensor
yang digunakan untuk mengukur kandungan oksigen pada boiler adalah piranti
zirconia oxygen analyzer. Fungsi dari zirconia oxygen analyzer adalah untuk
1
2
memonitor nilai kandungan oksigen dalam flue gas, yang berhubungan dengan nilai
excess air. Dengan demikian apabila nilai excess air tidak sesuai dengan standar
yang ditetapkan, maka sensor zirkonia akan mengirimkan sinyal masukan ke
control valve untuk menyesuaikan pasokan udara yang masuk ke furnace.
Kelebihan dari sensor ini di antaranya adalah mudah dipasang pada stack, respon
lebih cepat, dan tidak membutuhkan pengambilan sampel. Kekurangan dari sensor
ini di antaranya adalah presisi pengukuran rendah, tingginya bianya pemeliharaan
dan masa pakai yang singkat, yang pada kenyataannya tidak mendukung untuk
pemantauan waktu nyata jangka panjang, dan tidak menjamin boiler beroperasi di
bawah pembakaran terbaik [5]. Karena alasan tersebut, maka sensor tersebut dapat
rusak sewaktu-waktu atau mengalami penurunan kinerja, yang mengakibatkan
error pada pengukuran kandungan oksigen.
Beberapa tahun terakhir, ditemukan cara baru untuk memonitor peralatan
industri secara otomatis, khususnya sensor yaitu predictive maintenance. Predictive
maintenance adalah pekerjaan untuk mencari pola ketika sistem diduga gagal dalam
waktu dekat [6].
Pada penelitian ini, komponen sistem yang dicegah kegagalannya adalah
error sensor zirkonia dalam memprediksi nilai kandungan oksigen. Sensor zirkonia
yang mengalami kegagalan dapat berakibat tidak mampu mempertahankan excess
air pada nilai yang diinginkan. Kegagalan dapat diprediksi dengan menggunakan
berbagai alat, contohnya model berbasis data. Model berbasis data dapat dilakukan
dengan mengumpulkan data historis dari berbagai macam parameter proses untuk
membuat suatu model prediksi [6]. Predictive maintenance yang menggunakan
data historis dari berbagai macam parameter proses untuk membuat model prediksi
berbasis machine learning itu disebut soft sensor.
Pada penelitian ini dikembangkan suatu soft sensor untuk memprediksi nilai
kandungan oksigen pada boiler menggunakan metode adaptive boosting
(AdaBoost). Adaptive boosting adalah teknik dalam machine learning yang
menggunakan ensemble methods. Ensemble methods adalah suatu metode di mana
suatu algoritma melatih data menggunakan beberapa kombinasi model dan
3
memperoleh keluaran dengan akurasi yang lebih tinggi daripada hanya

menggunakan satu model [7].
Tools yang digunakan pada metode AdaBoost ini adalah Python. Python
adalah bahasa pemrograman interpretatif lintas platform dengan filosofi desain
yang berfokus pada keterbacaan kode dan merupakan salah satu bahasa paling
populer yang terkait dengan data science, machine learning, dan internet of things
(IoT). Keunggulan Python yang sifatnya interpretatif juga banyak digunakan untuk
pembuatan prototipe, pemrograman berbasis object oriented programming (OOP),
dan membangun situs web skala besar [8].
Model adaptive boosting pada penelitian ini dilatih menggunakan data
parameter boiler yang berasal dari PT. Pertamina RU V Balikpapan. Model tersebut
kemudian diverifikasi dengan memprediksi data baru di luar data latih model.
Diharapkan soft sensor dari hasil penelitian ini dapat digunakan sebagai cadangan
dan validasi dari hasil pengukuran nilai kandungan oksigen dengan zirconia oxygen
analyzer di PT. Pertamina RU V Balikpapan.
Perumusan Masalah
Seperti yang telah diketahui, kekurangan yang ada pada pada sensor
zirkonia oxygen analyzer adalah presisi pengukuran rendah, tingginya bianya
pemeliharaan dan masa pakai yang singkat, yang pada kenyataannya tidak
mendukung untuk pemantauan waktu nyata jangka panjang, dan tidak menjamin
boiler beroperasi dengan pembakaran terbaik [4]. Selain itu jika sensor oksigen ini
rusak, tidak adanya alat redundansi sebagai cadangan pengukuran menjadi kendala
utama karena tidak adanya yang mem-back up kerja sensor oksigen tersebut. Salah
satu metode yang dapat digunakan untuk mengukur kandungan oksigen dalam flue
gas adalah dengan menggunakan soft sensor, khususnya dengan algoritma adaptive
boosting. Karena alasan tersebut, perumusan masalahnya adalah sebagai berikut:
1. Bagaimana merancang model perangkat soft sensor berbasis AdaBoost pada
Python untuk memprediksi nilai kandungan oksigen dalam flue gas pada
boiler?
4
2. Berapa jumlah parameter yang dibutuhkan untuk mendapatkan model

dengan nilai metrik evaluasi terbaik?
3. Metode optimasi apa yang dipakai untuk lebih memaksimalkan keakuratan
model?
I.2.1. Batasan Masalah

Berikut batasan masalah yang digunakan dalam penelitian ini:
1. Pemodelan machine learning untuk pembuatan soft sensor oksigen ini
menggunakan algoritma adaptive boosting.
2. Tipe boiler yang diteliti merupakan water tubes boiler yang sesuai dengan
kondisi boiler PT Pertamina RU V Balikpapan.
Tujuan Penelitian
Tujuan dari penelitian ini adalah mengembangkan model perangkat soft
sensor berbasis AdaBoost pada Python untuk memprediksi nilai kandungan
oksigen dalam flue gas pada boiler.
Manfaat Penelitian
Manfaat dari penelitian ini adalah :
1. Hasil penelitian ini diharapkan dapat memberikan kontribusi bagi kemajuan
ilmu pengetahuan.
2. Hasil penelitian ini dapat digunakan sebagai pedoman untuk penelitian
selanjutnya.
3. Hasil penelitian ini dapat dijadikan acuan untuk pengembangan predictive
maintenance dengan soft sensor pada industri minyak & gas.
4. Hasil penelitian ini dapat dijadikan bahan pertimbangan bagi PT. Pertamina
RU V Balikpapan dalam menerapkan metode adaptive boosting untuk
memprediksi nilai kandungan oksigen dalam flue gas pada boiler.
TINJAUAN PUSTAKA
Pada tahun 2012, Sun Lingfang dan Wang Yechi melakukan penelitian
mengenai penerapan support vector regression (SVR) untuk memprediksi
kandungan oksigen di dalam flue gas pada Pembangkit Listrik Tenaga Uap Batu
Bara (PLTU – Bahan bakar) [9]. Dataset yang digunakan berasal dari data historis
DCS pada Maret 2010, interval waktunya 30 detik, masing-masing input memiliki
jumlah data 1565, dan dibagi menjadi 500 sebagai data latih dan 1065 sebagai data
uji, dengan jumlah parameter input mencapai 19. Namun, karena jumlah input yang
terlalu banyak dapat menurunkan akurasi model, digunakan metode principal
component analysis (PCA) untuk mereduksi jumlah dimensi input, sehingga
didapatkan hanya 7 parameter input yang dapat mengoptimalkan keakuratan
prediksi model. Selain itu, dengan mempertimbangkan beberapa faktor interferensi
seperti penuaan boiler atau sensor, hasil output (kandungan oksigen dalam gas
buang) menggunakan metode empirical mode decomposition (EMD) untuk
menghilangkan pengaruh yang disebabkan oleh gangguan frekuensi tinggi.
Sebelum data latih input dimodelkan ke dalam SVR, terlebih dahulu data
dinormalisasi agar rentang data yang berbeda menjadi sama dan konsisten. Setelah
data model terbentuk, model dikalibrasi menggunakan metode K-fold cross
validation (K-CV) untuk mendapatkan parameter g (fungsi kernel RBF) dan
koefisien penalti C, hasilnya menunjukkan bahwa nilai g = 0,027 dan nilai C = 28
adalah optimasi terbaik. Setelah model diprediksi, didapatkan nilai mean square
error (MSE) adalah 0,4045.
Pada tahun 2015, Shihe Chen, Zhang Xi, Weiwu Yan, dan Dandan Zhang
melakukan penelitian mengenai penerapan metode gaussian process regression
(GPR) untuk memprediksi kandungan oksigen dalam flue gas pada pembangkit
listrik 1000 MW Ultra Supercritical di Provinsi Guangdong, China [10]. Dataset
yang digunakan berasal dari data historis DCS dengan jumlah 1200 data untuk
5
6
masing-masing parameter input, di mana 600 data digunakan sebagai data latih, 400
data sebagai data validasi, dan 200 data sebagai data uji. Ada 15 parameter input
yang digunakan yaitu steam pressure, steam temperature, flue-gas temperature of
draft fan, actuator position of draft fan, supply water flow After the selection, outlet
flue gas temperature, supply air volume, hearth negative pressure, amount of fuel,
total air volume, generator power, actuator position of pressure fan, the current of
pressure fan, the current of draft fan dan water flow. Untuk mengevaluasi performa
model, beberapa parameter seperti root mean squared error (RMSE), average log-
density error (ALDE), dan relative variance tracking precision (RVTP) digunakan.
RMSE merefleksikan akurasi model, ALDE adalah ketidakpastian model, dan
RVTP adalah kinerja model dalam memperkirakan tren yang berbeda dari nilai
sebenarnya. Setelah dilakukan prediksi, didapatkan nilai kinerja model seperti yang
ditunjukkan pada Tabel 2.1.
Tabel 2.1. Hasil kinerja model berbasis GPR [10]
Pada tahun 2017, Zhenhao Tang, Haiyang Zhang, dan Hui Yang melakukan
penelitian mengenai penerapan artificial neural networks (ANN) untuk
memprediksi kandungan oksigen di dalam flue gas pada power plant [13]. Model
pada ANN ini dilatih menggunakan algoritma backpropagation neural network
(BPNN) dan optimasinya menggunakan genetic algorithm (GA). Dataset yang
digunakan dalam penelitian ini berasal dari sistem DCS power plant. Namun, data
tersebut masih memiliki noise, sehingga digunakan aturan 3𝜎 untuk menemukan
7
data yang error dan menghapusnya, kemudian diisi dengan data baru dan dihitung
dengan metode interpolasi. Awalnya, dipilih 20 data parameter operasional boiler
sebagai input model. Namun, hal itu akan berakibat pada kurangnya akurasi model.
Untuk itu, dilakukan pengurangan jumlah variabel input menggunakan metode
partial least square (PLS). Metode PLS ini adalah gabungan dari metode principal
component analysis (PCA), canonical correlation analysis (CCA), dan multiple
linear regression (MLR). Setelah menggunakan metode PLS, didapatkan 8
parameter input untuk dilatih pada model. Kedepalan parameter itu adalah main
steam flow, reheater pressure, fuel quanlity, electricity of blower, air delivery,
furnace negative pressure, desuperheating water flow dan boiler steam rate.
Masing-masing input tersebut terdiri dari 5500 set data yang dibagi kedalam 5
bagian. Setiap bagian memuat 1000 data latih dan 100 data uji. Setelah dilakukan
prediksi, didapatkan hasil seperti nilai seperti sum of absolute relative error (SRE),
lower deviation, dan upper deviation model GABP seperti yang ditunjukkan pada
Tabel 2.2.
Tabel 2.2. Error relatif absolut GABP [13]

Model SRE Lower deviation Upper deviation
GABP 0,4614 -0,0466 0,0357
Pada Tahun 2020, Zhenhao Tang, Yanyan Li, dan Andrew Kusiak
melakukan penelitian mengenai penerapan nonlinear combined deep belief network
(NCDBN) untuk memprediksi kandungan oksigen dalam flue gas pada boiler [14].
Dataset yang digunakan berasal dari data historis DCS pembangkit listrik Guodian
Taizhou 1000MW. Sebelum data dimodelkan, terlebih dahulu data dinormalisasi
menggunakan distribusi normal untuk mengurangi rentang variasi parameter,
kemudian data dipisah menjadi control variable dan state variables. Selanjutnya,
dalam memilih input variabel yang memiliki pengaruh signifikan, digunakan
metode algoritma least absolute shrinkage and selection operator (LASSO) untuk
8
mereduksi dimensi input dan meningkatkan akurasi model. Setelah itu, didapatkan
7 control variables dan 7 state variables yang dapat dilihat pada Tabel 2.3.
Tabel 2.3. Variabel proses [14]

Masing-masing parameter input pada Tabel 2.5 ini kemudian dilatih
menggunakan metode deep belief network (DBN), yang berfungsi untuk
menghasilkan output model prediksi control dan model prediksi state. Untuk
membuat model prediksi gabungan akhir, kombinasi nonlinear diperlukan yang
mencerminkan pengaruh parameter operasi yang berbeda pada kandungan oksigen
gas buang, dan memungkinkan model prediksi yang lebih akurat. Kombinasi
nonlinear ini dibangun menggunakan least squares support vector machines
(LSSVM) untuk membuat model prediksi NCDBN. Setelah dilakukan prediksi,
diperoleh nilai mean square error (MSE), mean relative error (MRE), dan mean
absolute error (MAE) yang dapat dilihat pada Tabel 2.4. Nilai error ini juga
membandingkan jika menggunakan algoritma LASSO dan tidak.
Tabel 2.4. Hasil seleksi fitur [14]
NCDBN model
Error With Lasso Without Lasso
Metrics
MAE 0,0146 0,0377
MRE 0,5151 1,3741
MSE 0,0005 0,0023
Time (s) 25,8 40,1
Dari Tabel 2.6 dapat dilihat bahwa dengan menggunakan algoritma LASSO
pada model NCDBN dapat mengurangi waktu latih sebesar 14,3 detik dan
meningkatkan efisiensi dan akurasi pada model.
Pada tahun 2021, Eko David Kurniawan melakukan penelitian mengenai

penerapan xtreme gradient boosting (XGBoost) untuk memprediksi kandungan
oksigen dalam flue gas pada boiler PT. Pertamina RU V Balikpapan [2]. Dataset
yang digunakan berasal dari data historis DCS pada periode 01 Januari 2019 hingga
28 Agustus 2019 dengan dengan jumlah 5717 data untuk masing-masing parameter
input, di mana 3659 data digunakan sebagai data latih, 914 data sebagai data
9
10
validasi, dan 1144 data sebagai data uji. Pada awalnya, peneliti menggunakan 18
parameter sebagai input, kecuali kandungan oksigen karena digunakan sebagai
output seperti yang ditunjukkan pada Tabel 2.5.
Tabel 2.5. Parameter proses DCS Balikpapan [2]
Namun karena jumlah input yang terlalu banyak dapat menurunkan akurasi
model, digunakan metode random forest feature importance untuk mereduksi
jumlah dimensi input, sehingga didapatkan hanya 14 parameter input yang dapat
mengoptimalkan keakuratan prediksi model. Setelah dibuat model dengan 14
parameter tersebut, digunakan pula hyperparameter tuning agar hasil prediksi lebih
akurat lagi, dan didapatkan nilai mean absolute error (MAE) sebesar 0,04369 dan
nilai root of mean squared error (RMSE) sebesar 0,06338.
11
Pada tahun 2021, Adi Riyanto melakukan penelitan mengenai penerapan

metode random forest regression untuk prediksi nilai kandungan oksigen dalam
flue gas pada furnace di PT. Pertamina RU-IV Cilacap [13]. Dataset yang
digunakan berasal dari data historis DCS yang diambil pada rentang waktu tertentu.
Data ini memiliki 13 parameter input (fitur) dan 1 parameter output (target) yaitu
kandungan oksigen seperti yang dapat dilihat pada Tabel 2.6.
Tabel 2.6. Parameter proses DCS Cilacap [13]

No Parameter Proses Satuan
1 Fuel gas flow m3/jam
2 Fuel gas pressure bar
o
3 Coil inlet temperature C
o
4 Coil outlut temperature C
o
5 TST#1 (Tube skin temperature) C
o
o
o
8 (BWT) Bridge wall temperature C
o
9 Stack temperature C
10 Feed flow #1 m3/jam
14 O2 content %
Namun karena 13 fitur tersebut belum tentu dapat menghasilkan kinerja

model yang baik, maka dilakukan seleksi fitur menggunakan feature importance.
Feature importance akan memberikan tingkat kepentingan fitur dalam
memprediksi target. Hasilnya menunjukkan bahwa BWT adalah fitur yang paling
berpengaruh, sedangkan feed flow #4 merupakan fitur yang paling kecil
pengaruhnya. Berdasarkan hasil prediksi, didapatkan nilai MAE sebesar 0,188, nilai
MSE sebesar 0,131, dan nilai RMSE sebesar 0,362.
12
Pada tahun 2022, Shafanda Nabil Sembodo, Nazrul Effendy, Kenny

Dwiantoro, dan Nidlom Muddin melakukan penelitian mengenai penerapan radial
basis function network (RBFN) untuk memprediksi kandungan oksigen dalam flue
gas pada boiler PT. Pertamina RU IV Cilacap [14]. Dataset yang digunakan berasal
dari data historis DCS yang diambil dari tanggal 1 Januari hingga 20 Juli. Data ini
memiliki 8 parameter input dan 1 parameter ouput yaitu kandungan oksigen seperti
yang dapat dilihat pada Tabel 2.7.
Tabel 2.7. Parameter proses DCS Cilacap [14]
Namun karena jumlah input yang terlalu banyak dapat menurunkan akurasi
model, digunakan metode principal component analysis (PCA) untuk mereduksi
dimensi input, dan didapatkan ada 4 parameter input yang memiliki korelasi yang
tinggi dengan output. Berdasarkan hasil prediksi, performa model terbaik diperoleh
ketika sistem menggunakan 25 hidden nodes dan mendapatkan nilai mean squared
error (MSE) 2,16 x 10-3 dengan standar deviasi 2,42 x 10-4.
Pada tahun 2022, Nazrul Effendy, Eko David Kurniawan, Kenny

Dwiantoro, Agus Arif, dan Nidlom Muddin melakukan penelitian mengenai
penerapan artificial neural networks (ANN) dan random forest untuk memprediksi
kandungan oksigen dalam flue gas pada boiler pembangkit listrik 32 MW di unit
kilang minyak, Indonesia [15]. Dataset yang digunakan berasal dari data historis
yang diambil dari tanggal 1 Januari sampai 28 Agustus. Data ini memiliki 19
parameter termasuk kandungan oksigen, yang dapat dilihat pada Tabel 2.8.
13
Tabel 2.8. Parameter proses DCS kilang minyak [15]
Setelah data di pre-processing, kemudian data dilatih dan diuji

menggunakan ANN dan random forest. Tujuan dari pemodelan menggunakan
ANN dan random forest ini untuk membandingkan nilai MAE, MSE, RMSE, dan
deviasi standar pada kedua metode.
Setelah data model ANN dilatih menggunakan 1000 epoch, performa dari
model ANN kemudian diuji. Dari hasil pengujian didapatkan bahwa 60 neuron pada
hidden layer merupakan model ANN terbaik. Dari model ANN ini juga didapatkan
nilai MAE 0,0715, MSE 0,0087, RMSE 0,0935, dan standar deviasi 0,0935.
Sementara dari hasil pelatihan dan pengujian model random forest didapatkan nilai
MAE 0,0486, MSE 0,0052, RMSE 0,0718, dan standar deviasi 0,0719. Gambar 2.1
menunjukkan perbandingan nilai metrik evaluasi menggunakan ANN dan random
forest. Kesimpulan dari perbandingan nilai metrik evaluasi antara dua model adalah
bahwa model random forest memiliki performa yang lebih baik dibandingkan
ANN.
14
Gambar 2.1. perbandingan nilai metrik evaluasi menggunakan ANN dan random
forest [15]
Pada penelitian ini akan dilakukan prediksi terhadap kandungan oksigen

dalam flue gas pada boiler PT. Pertamina RU V Balikpapan menggunakan
AdaBoost untuk membangun model prediksinya. Dataset yang digunakan berasal
dari data historis DCS untuk data latih dan data uji. Tabel 2.9 menunjukkan
rangkuman studi literatur dan posisi penelitian.
15
Tabel 2.9. Rangkuman studi literatur dan posisi penelitian

Tahun Peneliti Judul Penelitian Metode Hasil
2012 Sun Soft-sensing of Support vector MSE = 0,4045

Lingfang oxygen content machine (SVR)
dan Wang of flue gas based
Yechi on mixed model
2015 Shihe Chen, Soft sensor Gaussian RMSE = 0,9376
Zhang Xi, modeling for process
Weiwu oxygen-content regression
Yan, dan in flue gasses in (GPR)
Dandan 1000MW ultra-
Zhang superficial units
2017 Zhenhao Artificial Neural Backpropagation SRE = 0,4614

Tang, Networks model neural network
Haiyang for predicting (BPNN)
Zhang, dan oxygen content
Hui Yang in flue gas of
power plant
(bersambung)
16
Tabel 2.10. Rangkuman studi literatur dan posisi penelitian (sambungan)

Tahun Peneliti Judul Metode Hasil
Penelitian
2020 Zhenhao A deep Nonlinear Dengan LASSO
Tang, learning combined deep MAE = 0,0146
Yanyan Li, model for belief network MRE = 0,5151
dan Andrew measuring (NCDBN) MSE = 0,0005
Kusiak oxygen
content of Tanpa LASSO
boiler flue MAE = 0,0377
gas MRE = 1,3741
MSE = 0,0023
2021 Eko David Soft sensor Xtreme MAE = 0,04369
Kurniawan berbasis gradient
RMSE = 0,06338
xtreme boosting
gradient (XGBoost)
boosting
untuk
prediksi
nilai
kandungan
oksigen
dalam flue
gas pada
boiler PT.
Pertamina
RU V
Balikpapan
(bersambung)
17

Tahun Peneliti Judul Metode Pemilihan Fitur
Penelitian
2021 Adi Riyanto Penerapan Random MAE = 0,188

metode forest RMSE = 0,362
random forest regression
regression
untuk prediksi
nilai
kandungan
oksigen dalam
flue gas pada
furnace di PT.
Pertamina
RU-IV
Cilacap
2022 Shafanda Radial basis Radial basis MSE = 2,16 x

Nabil network function 10-3
Sembodo, estimator of network
Nazrul oxygen (RBFN)
Effendy, content in the
Kenny flue gas of
Dwiantoro, debutanizer
dan Nidlom reboiler
Muddin
(bersambung)
18

Tahun Peneliti Judul Metode Pemilihan Fitur
Penelitian
2022 Nazrul The Artificial ANN:

MAE = 0,0715
Effendy, Eko prediction of neural
MSE = 0,0087
David the oxygen network
RMSE = 0,0935
Kurniawan, content of the (ANN) dan
Kenny flue gas in a random forest
Dwiantoro, gas-fired Random forest:
MAE = 0,0486
Agus Arif, boiler system
RMSE = 0,0718
dan Nidlom using neural
Muddin networks and
random forest
2022 Rangga Soft sensor Adaptive
Herlambang, berbasis boosting
Nazrul adaptive (AdaBoost)
Effendy, dan boosting
Agus Arif untuk prediksi
nilai
kandungan ?
oksigen
dalam flue gas
pada boiler
PT. Pertamina
RU V
Balikpapan
19
DASAR TEORI
Boiler
Boiler adalah bejana baja tertutup yang berfungsi memindahkan panas yang
dihasilkan pembakaran bahan bakar ke air yang pada akhirnya akan menghasilkan
uap dan digunakan untuk proses di luar boiler itu sendiri. Uap ini kemudian dapat
digunakan untuk mentransfer panas ke suatu proses, seperti untuk memutar turbin
generator pada pembangkit listrik [1].
III.1.1. Tipe dan Komponen Boiler

Tipe pada boiler terdiri dari dua macam yaitu fire tube boiler dan water tube
boiler. Fungsi Fire tube boiler yaitu mengubah feedwater yang terdapat dalam
tempurung boiler menjadi steam akibat gas panas yang melewati pipa, yang
pipanya juga dipasang di dalam tempurung boiler. Gas panas ini dihasilkan dari
pembakaran bahan bakar. Steam yang dihasilkan memiliki tekanan maksimal 250
psi dan kapasitas maksimal 12 ton/jam [1]. Gambar skema fire tube boiler dapat
dilihat pada Gambar 3.1.
Gambar 3.1. Fire tube boiler [1]

20
Sedangkan pada water tube boiler, feedwater diedarkan melalui pipa dan
dipanaskan oleh nyala api dan gas panas dari luar susunan pipa. Kontruksi pipa
dapat berbentuk lurus ataupun bengkok tergantung jenis dari jenis boiler. Steam
yang dihasilkan dikeluarkan melalui steam outlet yang terdapat pada header.
Tekanan steam juga biasanya di atas 250 psi dan kapasitas di atas 12 ton/jam [1].
Gambar skema water tube boiler dapat dilihat pada Gambar 3.2.
Gambar 3.2. Water tubes boiler [1]
Menurut Kamus Besar Bahasa Indonesia (KBBI), komponen adalah bagian

dari keseluruhan suatu objek. Pada boiler, komponen merupakan bagian-bagian
unit proses yang mempunyai tugasnya masing-masing untuk mencapai tujuan yaitu
pemanasan fluida sampai menjadi steam. Dengan memahami fungsi masing-
masing bagian boiler, maka dapat mengetahui prinsip pengoperasian boiler secara
lebih detail. Di bawah ini adalah beberapa komponen umum yang membentuk
boiler di pembangkit listrik dan deskripsinya [16]:
1. Furnace atau tungku pembakaran adalah ruangan boiler tempat

berlangsungnya reaksi pembakaran. Reaksi pembakaran dalam tungku
memiliki tiga komponen utama: bahan bakar, udara pembakaran dan
21
pemantik (ignitor). Proses pembakaran pada furnace sangat mempengaruhi

efisiensi boiler.
2. Fan atau kipas juga merupakan komponen penting dari boiler. Biasanya,
boiler menggunakan dua kipas, yaitu FD (forced draft) dan ID (induced
draft) fan. FD fan digunakan untuk memasok udara pembakaran dengan
memaksa udara masuk ke furnace dari luar. Sedangkan ID fan digunakan
untuk memaksa udara hasil pembakaran untuk keluar dari furnace, hal ini
membuat tekanan di dalam furnace menjadi negatif.
3. Windbox berfungsi untuk mendistribusikan udara yang masuk ke furnace
agar pembakaran terjadi secara merata.
4. Air preheater (pemanas udara awal) digunakan untuk menaikkan
temperatur udara pembakaran menggunakan flue gas (udara hasil
pembakaran) sebelum bercampur dengan bahan bakar.
5. Economizer berfungsi menaikkan temperatur feedwater (umpan air) guna
meningkatkan efisiensi boiler dan mengurangi heat loss (kehilangan energi
panas). Meningkatkan suhu feedwater dapat mengurangi bahan bakar dan
udara pembakaran yang dibutuhkan untuk boiler.
6. Superheater digunakan untuk menghilangkan kelembapan dengan
memberikan tambahan kalor pada steam. Faktor kelembaban menentukan
kualitas uap. Artinya, jika steam tidak mengandung air, kualitasnya 100%.
7. Boiler drums merupakan bejana bertekanan tempat menampung fluida
proses pada boiler. Ada dua jenis boiler drum yaitu steam drum dan mud
drum. Steam drum berfungsi untuk memisahkan steam dan air setelah
feedwater melewati economizer. Mud drum berfungsi untuk memisahkan
padatan yang masih terkandung dalam feedwater. Padatan itu kemudian
dikeluarkan melalui drum blowdown.
Berikut adalah gambar komponen boiler beserta alur kerjanya yang dapat dilihat
pada Gambar 3.3.
22
Gambar 3.3. Komponen boiler beserta alur kerjanya [16]
III.1.2. Boiler pada PT. Pertamina RU V Balikpapan

Pertamina Refinery Unit (RU) V Balikpapan merupakan salah satu divisi
dari otoritas kilang Pertamina yang produknya didistribusikan ke Indonesia bagian
timur sebesar 2/3 dari NKRI, dan sebagian produk didistribusikan ke Indonesia
bagian barat serta diekspor. Sejak dibangun, Pertamina RU V telah mengalami
beberapa kali renovasi untuk meningkatkan profitabilitas dan kapasitas produksi.
Produk yang memenuhi Service Level Agreement (SLA) antara lain Minyak/BBM
(Premium, Kero, Diesel, Pertadex, dan Pertamax), Non Bahan Bakar
Minyak/NBBM (smooth fluid 05) dan LPG. Seluruh produk manufaktur digunakan
untuk memenuhi kebutuhan dalam negeri, khususnya di Indonesia bagian timur.
Pertamina RU V memiliki kapasitas penyulingan minyak mentah 260 juta barel per
hari, setara dengan 25% dari kapasitas pemasukan nasional, dan pangsa pasar bahan
bakarnya adalah 15,6% secara nasional [17].
Pembangkit listrik pada Pertamina RU V memiliki enam boiler dengan total

kapasitas 32 MW (megawatt). Boiler pada pembangkit listrik ini adalah jenis water
23
tubes boiler yang digunakan untuk memanaskan air menjadi high high pressure
(HHP) steam. HHP steam merupakan uap air yang dipanaskan hingga mencapai
temperatur 500°C dan tekanan 101-109 Bar. Boiler yang menjadi kajian dalam
penelitian ini adalah boiler 6, yang memanfaatkan gas alam sebagai bahan bakar di
dalam furnace untuk memanaskan feedwater hingga menghasilkan steam
bertekanan tinggi yang akan menggerakan generator turbin.
III.1.2.1. Alur Kerja Fluida

Aliran fluida kerja dimulai dari fluida di dalam tangki boiler feed water
(BFW) yang dipompakan ke deaerator drum. . Gambar 3.4 menunjukkan skema
deaerator drum.
Gambar 3.4. Skema deaerator drum [18]
Fluida kerja yang ditampung di deaerator akan mengalir melalui dua pipa
yang berbeda, pipa pertama menuju superheater spray dan pipa kedua menuju
firunace. Superheater spray bekerja sebagai alat yang mengontrol temperatur uap
bertekanan tinggi setelah melewati superheater pada boiler. Fluida yang masuk ke
furnace akan dipanaskan dengan dua cara yaitu radiasi dan konveksi. Pada
pemanasan secara radiasi, aliran air pada pipa dipanaskan dari sumber api
pembakaran, sedangkan pada konveksi pemanasan air dilakukan dengan aliran gas
panas hasil pembakaran yang akan dialirkan menuju stack. Setelah melakukan
proses pemanasan, fluida akan dipisahkan menurut bentuknya, yaitu fase uap dan
24
fase cair. Fluida cair akan dipanaskan dengan economizer sebelum masuk ke steam
drum, sedangkan fluida uap akan masuk ke steam header untuk menggerakkan
generator turbin. Fluida cair yang berada di steam drum selanjutnya akan dialirkan
kembali ke furnace untuk pemanasan kembali [16].
Pada boiler 6 PT Pertamina RU V Balikpapan, parameter penting yang

diukur dalam proses alur kerja fluida adalah level deaerator, laju aliran umpan air
boiler ke superheater, temperatur steam desuperheater lanjutan, laju aliran umpan
air, temperatur steam, tekanan steam boiler, level boiler steam drum, laju aliran
steam header, temperatur masukan dan keluaran air pada economizer.
III.1.2.2. Alur Kerja Pembakaran

Alur kerja pembakaran dimulai dengan menggunakan bahan bakar dan
udara luar untuk dimasukkan ke dalam furnace. Gambar 3.5 menunjukkan diagram
alur pembakaran pada boiler. Sebelum bahan bakar masuk ke furnace, terlebih
dahulu tekanannya diukur dan dikendalikan dengan control valve. Sementara itu,
udara dari luar disuplai dari FD fan dan dialirkan melalui pipa menuju furnace.
Pendistribusian udara pada furnace difasilitasi oleh windbox agar merata.
Pembakaran pada furnace akan menghasilkan energi kalor yang digunakan untuk
memanaskan fluida kerja. Sisa pembakaran pada furnace yang berupa flue gas akan
digunakan sebagai air preheater, kemudian dialirkan menuju stack menggunakan
ID fan untuk dibuang ke atmosfer [16].
Gambar 3.5. Alur pembakaran pada boiler [16]
Pada boiler 6 PT. Pertamina RU V Balikpapan parameter penting yang

diukur pada proses alur pembakaran adalah laju aliran masukan gas utama ke
25
furnace, tekanan gas bahan bakar di belakang control valve, laju aliran udara
pembakaran, tekanan udara burner box, temperatur keluaran flue gas boiler,
tekanan windbox, serta temperatur udara pembakaran.
III.2. Pembakaran Bahan Bakar

Pembakaran adalah proses kimia reaksi eksotermik antara zat (bahan bakar)
dan gas (oksidator), biasanya O2, untuk melepaskan energi panas, energi
elektromagnetik (cahaya), energi mekanik (kebisingan) dan energi listrik (ion dan
elektron bebas). Dalam reaksi pembakaran sempurna, suatu senyawa bereaksi
dengan unsur pengoksidasi, dan produknya adalah senyawa dari setiap unsur dalam
bahan bakar dengan unsur pengoksidasi [19].
Proses pembakaran membutuhkan gas alam, udara, dan energi aktivasi

untuk menghasilkan uap dan gas buang. Komposisi gas alam kebanyakan
mengandung metana sebagai bahan utamanya, selain itu ada juga karbon dioksida,
nitrogen, etana, propana, butana. Tabel 3.1 menunjukkan rentang komposisi gas
alam [20].
Tabel 3.1. Komposisi gas alam
Komponen Rentang kandungan (%)

Metana 87 - 98
Etana 1,5 - 9
Propana 0,1 – 1,5
Butana 0 – 0,3
Karbon dioksida 0,05 - 1
Nitrogen 0,2 – 5,5
Pada udara, komposisinya terdiri dari oksigen, nitrogen, argon, dan gas
lainnya [21]. Tabel 3.2 menunjukkan persentase mol dari komposisi udara.
26
Tabel 3.2. Komposisi udara
Komposisi kandungan (%)

Oksigen 20,95
Nitrogen 78,07
Argon 0,93
Gas lainnya 0,04
Proses pembakaran ideal di mana bahan bakar dibakar sepenuhnya dengan

udara disebut pembakaran teoretis, proses pembakaran ditunjukkan pada persamaan
stoikiometrik di bawah ini [22]:
CH4 + 2(O2 + 3,76N2) → CO2 + 2H2O + 7,52N2
Namun karena sangat jarang didapati proses pembakaran yang sempurna, gas buang
pada pembakaran biasanya akan ada bahan bakar dan O2 yang tidak terbakar, sisa-
sisa pembakaran ini mengalir keluar lewat cerobong (stack).
III.2.1. Air/fuel ratio

Dalam sistem pembakaran boiler, rasio udara/bahan bakar memegang
peranan penting. Terlalu sedikit udara akan menyebabkan kurangnya pembakaran
bahan bakar oleh oksigen, yang akibatnya akan menjadi pemborosan bahan bakar.
Terlalu banyak udara juga akan menyebabkan terserapnya energi panas dalam
pembakaran, sehingga sebagian energi yang dihasilkan akan terbuang [23].
Dari persamaan stoikiometri pada subbab sebelumnya, dapat dihitung

air/fuel ratio untuk proses pembakaran yang ideal. Jumlah pembakaran udara
adalah 2 mol oksigen ditambah 2 x 3,76 mol nitrogen, memberikan total 9,52 mol
udara per mol bahan bakar [22]. Persamaan air fuel ratio (AF) ditunjukkan pada
Persamaan (3.1).
27
𝑚𝑎𝑖𝑟 𝑁𝑎𝑖𝑟 . 𝑀𝑎𝑖𝑟 (3.1)

𝐴𝐹 = = 𝑑𝑖 𝑚𝑎𝑛𝑎 𝑀𝑎𝑖𝑟 = 28,97 𝑘𝑔/𝑘𝑚𝑜𝑙
𝑚𝑓𝑢𝑒𝑙 𝑁𝑓𝑢𝑒𝑙 . 𝑀𝑓𝑢𝑒𝑙
9,52 𝑥 28,97 (3.2)

𝐴𝐹 = = 17,2 𝑘𝑔 𝑎𝑖𝑟/ 𝑘𝑔 𝑓𝑢𝑒𝑙
1 𝑥 16,04
Di mana:
m = massa (kg)
N = jumlah mol
M = massa molar
Dari Persamaan (3.2) diketahui bahwa untuk pembakaran ideal dibutuhkan 17,2 kg
udara untuk membakar 1 kg metana.
III.2.2. Excess Air

Pada praktiknya, sangat sulit untuk mendapatkan kondisi pembakaran yang
ideal, oleh karena itu menghitung air/fuel ratio saja tidak cukup. Untuk kebutuhan
keselamatan dan pemeliharaan, udara tambahan di luar persamaan stoikiometri
perlu ditambahkan ke proses pembakaran, hal ini disebut excess air atau udara
berlebih. Secara umum, sebagian besar boiler cenderung meningkatkan kebutuhan
udara berlebih karena laju pembakaran boiler menurun, yang menyebabkan
efisiensi yang lebih rendah di ujung bawah rentang pembakaran [24]. Gambar 3.6
menunjukkan grafik excess air terhadap penurunan efisiensi pembakaran gas alam.
28
Gambar 3.6. Grafik excess air vs penurunan efisiensi [24]
Dari grafik diketahui bahwa 15% excess air, yang setara dengan 3%
oksigen, adalah kadar yang tepat untuk memaksimalkan efisiensi pembakaran.
Dapat dilihat pada kadar ini penurunan efisiensi adalah 0.
III.3. Aplikasi Sensor Zirkonia Pada Boiler
III.3.1 Morfologi Zirkonia

Zirkonia (ZrO2) adalah bahan keramik stabil yang setelah dibakar dalam
furnace menjadi bahan tahan api yang sangat stabil dan bahan kimia yang mampu
menahan suhu yang sangat tinggi. Beberapa jenis zirkonia dikenal sebagai
konduktor ionik oksigen dan oleh karena itu disebut sebagai bahan elektrolit tanah.
Ada tiga struktur kristal umum zirkonia yang diketahui; kristal zirkonia murni
monoklinik pada suhu kamar, kemudian berubah menjadi tetragonal dan akhirnya
bentuk kubik saat suhu naik lebih lanjut [25]. Gambar 3.7 menunjukkan perubahan
struktur kristal zirkonia pada berbagai suhu
29
Gambar 3.7. Tiga struktur kristal zirkonia [25]
Zirkonia monoklinik tidak menghantarkan ion oksigen ke tingkat yang

signifikan dan zirkonia kubik tidak terlalu kuat atau stabil. Sebagai gantinya,
zirkonia yang distabilkan sebagian (tetragonal) lebih disukai sebagai bahan
elektrolit padat yang digunakan untuk membuat sensor oksigen. Ini secara
struktural sangat kuat dan stabil secara kimia dan merupakan konduktor ion oksigen
yang sangat baik ketika dipanaskan di atas 300°C.
III.3.2 Cara Kerja Sensor Zirkonia

Sensor zirkonia merupakan oxygen analyzer yang menggunakan metode
analisis in-situ yaitu diinstalasi pada bagian stack. Skema instalasi dapat dilihat
pada Gambar 3.8.
30
Gambar 3.8. Penginstalan sensor zirkonia pada bagian stack [26]
Sensor zirkonia digunakan untuk mengukur kandungan oksigen yang di mana

menentukan nilai excess air yang berpengaruh besar terhadap efisiensi pembakaran.
Pengukuran kandungan oksigen dengan zirkonia dibagi menjadi dua prinsip

pengukuran, yaitu amperometrik dan potensiometrik. Sensor amperometrik terdiri
dari sel zirkonia yang tegangan tinggi diterapkan pada dua elektroda platinum.
Oksigen kemudian mengalir melalui lubang difusi dan bersentuhan dengan katoda
sel zirkonia yang dipanaskan, kemudian menciptakan arus. Arus terukur sebanding
dengan laju difusi gas sampel ke katoda. Arus keluaran ini linier terhadap
konsentrasi oksigen. Keuntungan dari sistem amperometrik jenis ini adalah dapat
mengukur konsentrasi oksigen dari ppm hingga persentase dan hanya
membutuhkan udara bersih untuk kalibrasi. Kerugiannya adalah gas yang mudah
terbakar dalam sampel gas menyebabkan kesalahan pengukuran dan debu
menyumbat lubang difusi gas sisi katoda [27]. Gambar 3.9 menunjukkan prinsip
pengukuran sistem amperometrik.
31
Gambar 3.9. Skema pengukuran sistem amperometrik [27]
Namun hingga saat ini, sistem pengukuran potensiometrik lebih banyak

digunakan di kalangan industri untuk mengukur kandungan oksigen dengan
zirconia oxygen analyzer, karena beroperasi dalam rentang tekanan parsial oksigen
yang sangat luas, sehingga rentang nilai kandungan oksigen yang diukur lebih luas
[28]. Gambar 3.10 menunjukkan skema sistem potensiometrik.
32
Gambar 3.10. Skema pengukuran sistem potensiometrik [25]
Ketika seluruh sel dipanaskan hingga suhu optimum 650 °C, oksigen
dengan ion bermuatan negatif di dalam zirkonia menjadi sangat mobile dan dengan
cepat bermigrasi melintasi dinding sel untuk menjaga keseimbangan dengan
tekanan parsial oksigen pada kedua permukaan sel. Seperti yang ditunjukkan di
atas, jika tekanan oksigen berbeda, ini menciptakan ketidakseimbangan muatan
(atau gradien muatan) melintasi dinding sel [25]. Tegangan yang dihasilkan antara
elektroda kemudian dikaitkan dengan kandungan oksigen (atau tekanan parsial)
dari gas pengukuran yang tidak diketahui menggunakan persamaan Nernst yang
ditunjukkan pada Persamaan (3.3).
𝑅𝑇 𝑝𝑂2 (𝑔𝑎𝑠 𝑟𝑒𝑓𝑒𝑟𝑒𝑛𝑠𝑖) (3.3)

𝐸𝑀𝐹 = 𝑙𝑛 [ ]
𝑧𝐹 𝑝𝑂2 (𝑔𝑎𝑠 𝑝𝑒𝑛𝑔𝑢𝑘𝑢𝑟𝑎𝑛)
33
Di mana:
EMF = Electro-motive force / gaya gerak listrik (V)
R = Konstanta gas molar (8,3144 J.mol-1.K-1)
T = Temperatur absolut (K)
z = Jumlah unit muatan yang ditransfer (z = 4 untuk oksigen)
F = Konstansta Faraday (9,6485 x 104 C.mol-1)
pO2 (referensi) = Tekanan parsial oksigen dalam udara referensi
PO2 (pengukuran) = Tekanan parsial oksigen gas pengukuran
Persamaan di atas menunjukkan bahwa selama suhu sensor (T) tetap dan
diketahui, dan gas referensi juga tetap dan diketahui, maka EMF yang dihasilkan
selalu sebanding dengan log alami (ln) dari tekanan parsial oksigen dari gas
pengukuran yang tidak diketahui. Oleh karena itu, sensor zirkonia diilustrasikan
sebagai sensor potensiometrik logaritmik. Dapat juga diperhatikan bahwa jika
kedua gas referensi dan gas sampel nilainya tetap dan diketahui (tetapi tidak sama,
karena suku logaritmik di sebelah kanan T akan menjadi nol), maka sensor akan
bertindak sebagai termokopel dan pengukuran tegangan akan sebanding dengan
suhu (T). Oleh karena itu, pengukuran suhu sel yang akurat sama pentingnya
dengan pengukuran gas itu sendiri.
III.3.3 Masalah Pengukuran Sensor Zirkonia

Pengukuran kandungan oksigen di dalam flue gas dengan sensor zirkonia
telah menemui banyak masalah teknis di industri. Beberapa masalah itu adalah
ketika sensor mengalami kerusakan, masa pemakaian tidak lama, dan
ketidakakuratan pengukuran. Berikut ini adalah beberapa faktor yang menyebabkan
masalah pada sensor:
34
1. Gas yang mengandung halogen seperti fluor, klorin, dan bromin akan
menyebabkan kerusakan pada sensor. Kandungan lain seperti SOx dan H2S
juga dapat mempersingkat masa pakai sensor. Hal ini disebabkan karena
paparan gas-gas ini dapat mengurangi efek katalitik dari elektroda platinum
[29].
2. Kesalahan pengukuran disebabkan jika suhu atau kelembaban gas referensi
(udara) bervariasi secara signifikan antara kalibrasi dan pengukuran [30].
3. Kebocoran adalah salah satu faktor yang membuat sensor tidak akurat. Jika
gas proses (gas terukur) bercampur dengan gas referensi karena kebocoran,
maka akan terjadi peningkatan konsentrasi oksigen dalam gas proses, yang
mengakibatkan perbedaan konsentrasi oksigen di anoda dan di sel katoda
semakin mengecil sehingga nilai kandungan oksigen yang ditampilkan
menunjukkan hasil yang tinggi [31].
III.4. Soft Sensor Analyzer

Perangkat sensor tradisional yang dirancang berdasarkan hukum fisika
membutuhkan dasar yang kuat dan pengetahuan dari ilmu alam. Sebelum
penerapannya dalam sistem rekayasa, transformasi sinyal (energi) dan pengambilan
sampel data biasanya diperlukan. Baru-baru ini, untuk meningkatkan interaksi
dengan pengguna dan untuk menyediakan sistem akuisisi data, sensor lunak (soft
sensor) dengan kemampuan komunikasi nirkabel dan pemrosesan fungsional secara
mandiri diperlukan. Seperti yang diamati dari praktik industri, banyak sensor dan
jaringan sensor dipasang di berbagai lokasi untuk mengumpulkan data variabel
proses [32]. Selain itu, keuntungan soft sensor dibanding sensor tradisional antara
lain adalah rendah biaya, fleksibilitas, serbaguna, dan juga ramah lingkungan
karena secara signifikan mengurangi jumlah peralatan dan tidak memerlukan
penggunaan [33].
Meskipun begitu, soft sensor juga memiliki kekurangan. Kualitas data

historis memiliki pengaruh langsung pada kinerja soft sensor. Akuisisi data dalam
proses industri terkadang mengalami masalah seperti waktu pengambilan sampel,
35
data yang hilang, data outlier, dan sebagainya. Akibatnya, data tidak langsung
berlaku untuk pemodelan sensor lunak [32]. Namun, membangun sensor lunak jauh
lebih murah daripada menambahkan sensor redundansi, sehingga penggunaan soft
sensor sebagai cadangan sensor utama mulai banyak digunakan di industri proses.
Implementasinya dapat digunakan bersama dengan sensor utama sehingga ketika
sensor utama mengalami masalah atau dalam perawatan, soft sensor dapat menjadi
backup dalam jangka waktu tertentu.
III.5. Machine Learning

Machine learning adalah bidang ilmu komputer yang menggunakan teknik
statistika untuk menyediakan sistem komputer kemampuan untuk belajar dari data,
tanpa diprogram secara eksplisit. Machine learning menggunakan berbagai jenis
algoritma yang berulang kali mengakali komputer agar belajar dari data. Sedangkan
algoritma akan menyesuaikan model sesuai dengan data yang diberikan. Sehingga
kemampuan berpikir menjadi meningkat, mampu memahami data dan juga
memprediksi hasilnya (output).
Manfaat dari machine learning adalah ia memiliki kemampuan untuk

mengotomatisasi tugas-tugas manual. Hal ini memungkinkan manusia untuk
melakukan tugas-tugas ini secara real time, tanpa perintah manusia, dengan cepat
dan mudah. Dengan data yang ada, machine learning dapat secara otomatis
memproses data yang ada. Umumnya machine learning terbagi dalam tiga kategori,
yang dijelaskan sebagai berikut [34]:
1. Supervised Learning
Algoritma supervised learning digunakan untuk memecahkan berbagai
masalah yang berkaitan dengan:
• Classification (klasifikasi)
• Regression (regresi)
Algoritma supervised learning memerlukan sekumpulan dataset yang

memiliki input dan output variabel. Dataset ini digunakan dalam proses
36
training untuk melatih komputer. Secara umum, kumpulan data yang

tersedia sangat besar, yang membuat evaluasi tanpa komputer menjadi
sangat sulit. Selama proses pelatihan, komputer belajar memahami dataset
untuk membuat model yang diharapkan. Definisi dataset (D) yang
digunakan oleh algoritma supervised learning dapat dilihat pada Persamaan
(3.4).
𝐷 = [(𝑋0 , 𝑌0 ), (𝑋1 , 𝑌1 ) … … . . , (𝑋𝑛 , 𝑌𝑛 )] (3.4)
Supervised learning menggunakan labeled traning data untuk mempelajari

cara melakukan pemetaan fungsi. Fungsi ini menghubungkan input (x)
dengan output (y). Hubungan antara keduanya dirumuskan pada Persamaan
(3.5).
𝑦 = 𝑓(𝑥) (3.5)
Ketika proses training selesai, terbentuklah model. Model ini harus diuji
ulang dengan dataset yang berbeda, bukan dataset yang digunakan selama
training, yang disebut data uji (test set). Hal ini menunjukkan apakah fase
training dinilai berhasil atau gagal. Beberapa algoritma yang termasuk
supervised learning di antaranya adalah SVM, regresi linier, logistik linier,
decision trees, dan sebagainya.
2. Unsupervised Learning
Algoritma unsupervised learning digunakan untuk memecahkan berbagai
masalah yang berkaitan dengan:
• Association (asosiasi)
• Clustering (kluster)
Pada unsupervised learning, komputer hanya akan menerima variabel input
dari dataset, dan melakukan proses training tanpa ada variabel output. Jadi,
komputer dituntut untuk belajar sendiri memahami pola dataset yang
37
diberikan kepadanya. Dataset (D) yang digunakan oleh algoritma

unsupervised learning dapat dilihat pada Persamaan (3.6).
𝐷 = [𝑋0 , 𝑋1 , … … , 𝑋𝑛 ] (3.6)
Beberapa algoritma yang termasuk unsupervised learning di antaranya

adalah k-means, hierarchical clustering, deep belief nets, dan sebagainya.
3. Reinforecement Learning
Algoritma reinforecement learning perlu memungkinkan komputer untuk
belajar secara mandiri dari lingkungan. Oleh karena itu, komputer
melakukan pencariannya sendiri dengan berinteraksi dengan lingkungan.
Selama proses pelatihan, komputer dipandu oleh algoritma untuk
melakukan trial and error. Setiap kali trial and error dilakukan, ada
feedback ke komputer. Feedback dari tindakan sebelumnya akan digunakan
sebagai panduan dan peta untuk tindakan selanjutnya. Algoritma
reinforecement learning memilih berbagai opsi dan berbagai metode untuk
mengamati dan mengevaluasi setiap kinerja. Reinforecement learning dapat
belajar dari pengalaman. Aplikasi dari algoritma banyak digunakan pada
perangkat permainan seperti Sega, Nintendo, Playstation, Xbox, game
komputer, dan sebagainya. Beberapa algoritma yang termasuk
reinforecement learning di antaranya adalah deep q network (DQN), actor-
critic, monte carlo tree search (MCTS), dan sebagainya.
III.5.1. Underfitting dan Overfitting

Evaluasi kinerja model pembelajaran mesin dapat diwakili dalam istilah
yang sesuai [35]. Fit mengacu pada istilah kualitatif untuk hubungan antara data
pelatihan dan model pembelajaran mesin. Ada 3 jenis fit yaitu Overfit, Underfit dan
Good Fit. Penjelasan dari 3 jenis kondisi tersebut adalah sebagai berikut:
38
1. Overfitting, yaitu kondisi di mana model machine learning dapat dengan

benar memasukkan nilai bobot ke dalam data latih. Kesalahan prediksi data
pelatihan cukup kecil. Tetapi kinerja validasi dan data uji buruk.
2. Underfitting, yaitu kondisi di mana model gagal melakukan pelatihan.
Kinerja data latih dan data uji buruk.
3. Goodfitting, yaitu kondisi di mana model memiliki keseimbangan antara
performansi pada data latih, data validasi, serta data uji.
III.6. Ensemble Learning

Ensemble learning adalah salah satu metode machine learning di mana
beberapa model weak learners dapat diubah menjadi model strong learners.
Gambar 3.11 menunjukkan skema ensemble learning.
Gambar 3.11. Skema ensemble learning [36]
Ada dua tahap yang digunakan dalam proses ensemble learning. Pada tahap
pertama sekumpulan base learners diperoleh dari training data, kemudian pada
tahap kedua base learners yang diperoleh pada tahap pertama digabungkan untuk
menghasilkan model prediksi terpadu. Dengan demikian, beberapa prediksi
39
berdasarkan base learners yang berbeda dibangun dan digabungkan menjadi model
yang lebih akurat [36].
III.7 Decision Tree

Decision tree atau pohon keputusan adalah model prediksi yang
menggunakan struktur seperti pohon (flowchart) untuk menemukan solusi dari
suatu masalah. Model ini membagi (split) data beberapa kali, sehingga membentuk
pohon keputusan biner (binary tree).
Selama proses pembagian (splitting), subset-subset dari dataset akan

dibentuk terus-menerus berulang kali hingga mencapai akhir. Subset terakhir
disebut terminal atau leaf node, sedangkan subset perantara disebut node internal
atau split node. Dalam kasus regresi, pohon keputusan dapat digunakan untuk
memprediksi keluaran pada setiap leaf node, yang merupakan nilai rata-rata dari
training data pada node tersebut.
Pohon keputusan dapat digunakan untuk menyelesaikan masalah klasifikasi

dan regresi. Dalam masalah regresi, pohon keputusan akan menghasilkan prediksi
(output). Sedangkan pada masalah klasifikasi, pohon keputusan akan
mengelompokkan data ke dalam kelas-kelas [29]. Ilustrasi dari pohon keputusan
dapat dilihat pada Gambar 3.12.
Gambar 3.12. Pohon keputusan [37]

40
III.8. Random Forest

Random forest merupakan salah satu metode yang digunakan untuk
klasifikasi dan regresi. Metode ini merupakan sebuah ensemble (kumpulan) metode
pembelajaran menggunakan decision tree sebagai base classifier yang dibangun
dan dikombinasikan [33]. Di awal pembentukan tree, random forest akan sama
dengan decision tree. Selanjutnya random forest akan mengelompokkan weak
learners bersama-sama untuk membentuk sebuah strong learner [34].
Struktur formal random forest regressor (RFR) diperlihatkan pada gambar

3.13. Secara konkret, RFR adalah prediktor yang terdiri dari kumpulan decision
tree. Decision tree ini dikombinasikan untuk membentuk perkiraan regresi agregat.
Estimasi diberikan dengan menggabungkan prediksi individu dari setiap tree.
Pohon-pohon ditanam dengan menerapkan bootstrap. Berdasarkan data pelatihan,
setiap pohon regresi tumbuh untuk setiap sampel bootstrap. Estimators diambil
sampelnya secara acak dan pemisahan terbaik dipilih pada setiap simpul [38].
Gambar 3.13. Ilustrasi random forest [38]

41
Boostrap adalah teknik resampling dengan melakukan penggantian dataset

original secara acak dengan data lain yang berukuran sama. Boostrap dapat
digunakan untuk mengestimasi ringkasan statistik: seperti mean, median,
correlation, standard deviation, dan sebagainya. Kumpulan setiap sampel boostrap
yang dijadikan sebagai boostrap training set untuk masing-masing learner
(decision tree) itu disebut sebagai bagging (boostrap agreggation). Sedangkan
boosting adalah teknik yang menggabungkan model lemah dan kuat untuk
membuat model sekuensial yang memaksimalkan akurasi model akhir [34].
Penjelasan lebih lengkap mengenai perbedaan teknik bagging dan boosting dapat
dilihat pada Tabel 3.3.
Tabel 3.3. Perbedaan bagging dan boosting [34]
Bagging Boosting
partisi data menjadi Acak Memberikan kinerja
himpunan bagian yang lebih tinggi untuk
sampel weak learners.
Tujuan Mengurangi variance Mengurangi bias
Metode yang digunakan Subruang acak Penurunan gradien
III.9. Adaptive Boosting

Adaptive boosting (AdaBoost) adalah salah satu jenis algoritma pada
metode boosting. AdaBoost digunakan untuk menyeimbangkan kelas dengan
memberikan bobot pada tingkat error klasifikasi yang dapat mengubah distribusi
data. Algoritma ini ditujukan untuk supervised learning yang memberikan nilai
atribut pada dataset yang digambarkan oleh koleksi atribut dan termasuk salah satu
dari serangkaian kelas yang saling berhubungan [39].
42
Algoritma AdaBoost telah banyak diterapkan pada berbagai bidang

(domain) karena dasar teorinya yang kuat, prediksi yang akurat, dan cukup
sederhana. Langkah-langkah pada algoritma AdaBoost adalah sebagai berikut [40]:
𝑀
1. Diberikan dataset Dx dengan training samples {(𝑥𝑗 , 𝑦𝑗 )𝑗=1.
1
2. Tetapkan bobot distribusi yang sama {𝑝𝑖𝑗 = l 𝑖 = 1,2, . . 𝐾; 𝑗 =
𝐿
1,2, … 𝑀} untuk masing-masing sampel pelatihan awalnya untuk i = 1 dan
memulai loop.
𝑀
3. Pada iterasi ke-i, latihlah sampel data M dari {(𝑥𝑗 , 𝑦𝑗 )𝑗=1 dengan
penggantian sesuai dengan distribusi bobot 𝑝𝑖𝑗 dan menggunakan data

sampel untuk melatih regressor 𝑔𝑖 (𝑥; 𝛽𝑖 ).
4. Hitung prediction loss 𝐿𝑗 = [𝑦𝑗 , 𝑔𝑖 (𝑥; 𝛽𝑖 )] untuk setiap anggota dari Dx, di
mana 𝐿𝑗 ∈ [0,1]. Dan selanjutnya hitung rata-rata bobot loss pada 𝐿̅.
𝐿[𝑦𝑗 , 𝑔𝑖 (𝑥; 𝛽𝑖 )]
𝐿𝑗 =
𝐷
𝑀
𝐿̅ = ∑ 𝑝𝑖𝑗 𝐿𝑗
𝑗=1
5. Hitung bobot regressor dengan rumus berikut:

𝐿̅
𝑤𝑖 =
1 − 𝐿̅
6. Jika i sama dengan jumlah iterasi maksimum K, berhentikan loop dan lanjut
ke langkah 8;
7. Jadikan i = i + 1, selanjutnya perbarui bobot distribusi untuk kumpulan data
Dx dengan persamaan pada langkah 5 dan buatlah loop:
̅
𝑝𝑖𝑗 𝑤𝑖1−𝐿
𝑝𝑖𝑗 =
𝑍𝑖
Di mana 𝑍𝑖 adalah faktor normalisasi yang dipilih sehingga 𝑝𝑖𝑗 akan
menjadi distribusi probabilitas.
8. Gabungkan regressor K yang diperoleh menjadi satu regressor tunggal
menurut bobot yang sesuai {𝑤𝑖 }𝐾
𝑖=1 dan didapatkan:
43
𝑔(𝑥; 𝛽𝑤𝑒𝑖𝑔ℎ𝑡 ) = ∑ 𝑤𝑖 𝑔𝑖 (𝑥; 𝛽𝑖 )

𝑖=1
Untuk memperjelas penjelasan langkah-langkah di atas, mekanisme kerja

utama modul AdaBoost divisualisasikan pada Gambar 3.14 Seperti yang
ditunjukkan pada diagram skematik,
Gambar 3.14. Algoritma AdaBoost [40]
III.9.1 Hyperparameters AdaBoost

AdaBoost mempunyai hyperparameters yang dapat disesuaikan untuk
mendapatkan model yang mempunyai performa sesuai dengan yang diinginkan.
Hyperparameters ini ditunjukkan pada Tabel 3.4. Dokumentasi hyperparameters
lebih lengkap dapat diakses pada link berikut: http://scikit-
learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostRegressor.html
44
Tabel 3.4. Hyperparameters AdaBoost regressor

Hyperparameters Default Rentang Pengertian Efek
n_estimators 50 [1,∞] Jumlah weak Semakin besar
learner untuk nilainya dapat
dilatih di meningkatkan
setiap iterasi keakuratan
model, namun
proses
pemodelan
menjadi
lambat
learning_rate 1,0 [0,1] Berkontribusi Semakin kecil
pada bobot nilainya dapat
weak learner mencegah
overfitting,
namun proses
training model
menjadi
lambat
loss Linear - Loss function Meminimalkan
yang kemungkinan
digunakan membuat
saat prediksi yang
memperbarui salah
bobot setiap
peningkatan
iterasi
III.10. Korelasi Pearson

Untuk mengoptimalkan kinerja dan keakuratan model, diperlukan suatu
analisis pemilihan fitur, salah satunya adalah korelasi pearson. Korelasi pearson
adalah ukuran kekuatan dan arah hubungan yang ada antara dua variabel yang
diukur setidaknya pada skala interval. Korelasi pearson mencoba menggambar
garis yang paling cocok melalui data dua variabel, dan nilai koefisiennya yaitu r,
menunjukkan seberapa jauh semua titik data ini dari garis optimalnya [41].
Keuntungan menggunakan korelasi pearson yaitu merupakan cara sederhana untuk
menilai hubungan antara dua variabel; apakah mereka berbagi varians, jika
hubungannya positif atau negatif, dan sejauh mana mereka berkorelasi. Kerugian
45
menggunakan korelasi pearson adalah tidak dapat mengidentifikasi hubungan yang

tidak linier, dan dapat menunjukkan korelasi nol ketika korelasi tersebut tidak linier.
Selain itu jenis variabel yang dapat dievaluasi terbatas [42].
Ketika menggunakan korelasi pearson, ada beberapa asumsi yang harus

diterapkan, yaitu sebagai berikut:
1. Kedua variabel tersebut harus diukur pada skala interval atau rasio.
2. Terdapat hubungan linier antara kedua variabel.
3. Tidak ada outlier yang signifikan. Outlier adalah titik data tunggal dalam
data yang tidak mengikuti pola.
4. Data harus terdistribusi normal atau mendekati.
Nilai koefisien korelasi pearson (r) berkisar di antara -1 hingga 1. Nilai -1

berarti korelasi negatif sempurna (karena satu variabel meningkat dan variabel
lainnya menurun), sedangkan +1 berarti korelasi positif sempurna. Jika 0, berarti
tidak ada korelasi linier antara kedua variabel tersebut [43]. Rumus untuk
menghitung nilai r dapat dilihat pada Persamaan (3.9) [40].
1 (3.9)
∑ 𝑥𝑦 − 𝑥̅ 𝑦̅
𝑟= 𝑁
√( 1 ∑ 𝑥 2 − 𝑥̅ 2 ) √( 1 ∑ 𝑥 2 − 𝑦̅ 2 )
𝑁 𝑁
Di mana:
r = Koefisien korelasi pearson
N = Jumlah pasangan nilai atau skor
∑ 𝑥𝑦 = Jumlah hasil kali x dan y
𝑥̅ = rata-rata nilai x
𝑦̅ = rata-rata nilai y
46
𝑥̅ 𝑦̅ = Produk dari nilai rata-rata (skor) dari x dan y
∑ 𝑥 2 = Jumlah kuadrat dari nilai x
∑ 𝑦 2 = Jumlah kuadrat dari nilai y
Gambar 3.15 menunjukkan grafik korelasi pearson antara variabel x dan y

pada berbagai nilai r.
Gambar 3.15. Grafik korelasi pearson pada berbagai nilai r [44]
III.11. Hyperparameters tuning

Dalam konteks machine learning, hyperparameters tuning adalah
parameter yang nilainya ditetapkan sebelum memulai proses pembelajaran dalam
algoritma machine learning apa pun, hyperparameters perlu diinisialisasi sebelum
model memulai pelatihan. Penyesuaian hyperparameters model akan
memaksimalkan kinerja model pada set validation. Di sisi lain, nilai parameter
model diturunkan melalui pelatihan data. Parameter model mengacu pada bobot
dan koefisien, yang diturunkan dari data oleh algoritma. Setiap algoritma memiliki
47
seperangkat hyperparameters yang ditentukan; misalnya untuk decision tree,

adalah depth parameter [45].
III.11.1. Cross Validation

Sebelum menjelaskan proses hyperparameters tuning lebih lanjut, penting
untuk menjelaskan proses yang disebut cross validation. Cross validation (CV) atau
validasi silang adalah metode statistik yang digunakan untuk memperkirakan
akurasi model machine learning. Setelah model dilatih, kita tidak dapat memastikan
seberapa baik model tersebut akan bekerja pada data yang belum pernah ditemui
sebelumnya. Diperlukan kepastian mengenai keakuratan kinerja prediksi model.
Untuk mengevaluasi kinerja model machine learning, beberapa data yang tidak
terlihat diperlukan untuk pengujian. Berdasarkan kinerja model pada data yang
tidak terlihat, kita dapat menentukan apakah model tersebut underfitting,
overfitting, atau digeneralisasikan dengan baik. Cross validation dianggap sebagai
teknik yang sangat membantu untuk menguji seberapa efektif model machine
learning ketika data yang ada terbatas. Untuk melakukan cross validation, sebagian
data harus disisihkan untuk pengujian dan validasi; subset ini tidak akan digunakan
untuk melatih model, melainkan disimpan untuk digunakan nanti [45].
K-Fold adalah salah satu teknik validasi silang yang paling umum
digunakan pada pemodelan machine learning. Dalam K-fold cross validation,
parameter K menunjukkan jumlah lipatan atau bagian yang dibagi menjadi
kumpulan data tertentu. Salah satu lipatan dipertahankan sebagai kumpulan validasi
dan model machine learning dilatih menggunakan lipatan K-1 yang tersisa. Setiap
lipatan K-Fold digunakan sebagai set validasi di beberapa titik, dengan skor K
(akurasi) yang diberikan sebagai hasilnya [45]. Akhirnya, dibuatlah rata-rata model
terhadap masing-masing lipatan untuk mendapatkan skor akhir untuk model, seperti
yang ditunjukkan pada Gambar 3.16.
48
Gambar 3.16. Cross validation [45]
Pentingnya hyperparameters terletak pada kemampuannya untuk secara

langsung mengontrol perilaku algoritma pelatihan. Memilih hyperparameters yang
tepat memainkan peran yang sangat penting dalam kinerja model yang dilatih.
Dengan demikian, hyperparameters tuning secara sederhana didefinisikan sebagai
proses mencari nilai hyperparameters terbaik dari suatu machine learning untuk
menghasilkan model terbaik [45].
III.11.2. Grid Search CV dan Randomized Search CV

Pada penyesuaian nilai hyperparameters tuning, dapat dilakukan dengan
cara manual dan otomatis. Cara manual membutuhkan waktu yang lama karena
harus mencoba satu-persatu kombinasi nilai hyperparameter, terlebih untuk model
yang memiliki hyperparameter cukup banyak. Oleh karena itu, diperkenalkan cara
otomatis dengan bantuan pustaka scikit-learn yaitu metode yaitu grid search cv dan
randomized search cv.
49
Grid search merupakan metode pencarian hyperparameters dengan cara

konvensional yaitu menjalankan semua kemungkinan dari kombinasi nilai
hyperparameters. Kelebihan dari metode ini adalah dapat menemukan nilai
hyperparameters yang paling optimal dan mendapatkan metrik evaluasi terbaik.
Kekurangangan dari metode ini adalah semakin besar jumlah hyperparameters
yang dioptimalkan, semakin lama pula waktu yang dibutuhkan dalam menjalankan
prosesnya, selain itu rentan mengalami overfitting. Oleh karena itu, metode grid
search lebih cocok diterapkan pada model yang memiliki dataset yang tidak terlalu
banyak [46].
Randomized search merupakan metode pencarian hyperparameters yang

sedikit berbeda dari grid search. Pada randomized search, hanya beberapa
kemungkinan kombinasi nilai hyperparameters yang dipilih. Kelebihannya adalah
proses pencarian nilai hyperparameters yang optimal cukup cepat, juga tidak rentan
mengalami overfitting. Kekurangannya adalah nilai hyperparameters yang
didapatkan tidak seakurat grid search. Oleh karena itu, metode randomized search
lebih cocok diterapkan pada model yang memiliki dataset yang cukup banyak [46].
III.12. Metrik Evaluasi

Pada model machine learning dengan kasus regresi, metrik evaluasi
digunakan untuk mengevaluasi apakah model memiliki performa yang baik.
Berbagai macam metrik evaluasi tersebut di antaranya adalah sebagai berikut [47]:
a. Mean Absolute Error (MAE)

Mean absolute error (MAE) atau kesalahan absolut rata-rata adalah jumlah
mutlak/positif error dari semua nilai pada dataset. Mekanismenya adalah
menentukan perbedaan antara nilai aktual dan nilai prediksi untuk semua nilai pada
dataset dan mengambil nilai positifnya. MAE mengukur seberapa dekat hasil
prediksi dengan hasil aktual. Semakin besar nilai MAE, itu menunjukkan bahwa
model memiliki kinerja yang buruk, begitu juga sebaliknya, nilai MAE yang
50
mendekati nol menunjukkan model memiliki kinerja yang baik. MAE dihitung
dengan menggunakan Persamaan (3.10) seperti berikut.
𝑁 (3.10)
1
𝑀𝐴𝐸 = ∑|𝑦𝑖 − 𝑦̂|
𝑖
𝑁
𝑖=1
Di mana:
N = Jumlah data
𝑦𝑖 = Nilai aktual
𝑦̂𝑖 = Nilai prediksi
b. Mean Squared Error (MSE)
Mean square error (MSE) atau kesalahan kuadrat rata-rata mekanismenya

mirip seperti MAE, yaitu menentukan perbedaan antara nilai aktual dan nilai
prediksi untuk semua nilai pada dataset. Hanya saja, pada MSE nilai kesalahannya
dikuadratkan bukan diabsolutkan. Oleh karena itu, setiap nilai kesalahan MSE akan
selalu lebih besar atau sama dengan nol. Semakin besar nilai MSE, itu menunjukkan
bahwa model memiliki kinerja yang buruk, begitu juga sebaliknya, nilai MSE yang
mendekati nol menunjukkan model memiliki kinerja yang baik. MSE dihitung
menggunakan Persamaan (3.11) seperti berikut.
𝑁 (3.11)
1 2
𝑀𝑆𝐸 = ∑(𝑦𝑖 − 𝑦̂)
𝑖
𝑁
𝑖=1
c. Root Mean Squared Error (RMSE)
Root mean squared error (RMSE) atau akar rata-rata kesalahan kuadrat
mengambil nilai akar kuadrat dari MSE seperti yang ditunjukkan pada Persamaan
(3.12) berikut.
51
𝑁
(3.11)
1 2
𝑀𝑆𝐸 = √ ∑(𝑦𝑖 − 𝑦̂)
𝑖
𝑁
𝑖=1
Semakin besar nilai RMSE, itu menunjukkan bahwa model memiliki kinerja yang
buruk, begitu juga sebaliknya, nilai RMSE yang mendekati nol menunjukkan model
memiliki kinerja yang baik.
Nilai RMSE juga bisa dianggap sebagai simpangan baku dari error yang
dihasilkan oleh model machine learning. Nilai simpangan baku ini
mengilustrasikan seberapa dekat nilai error berpusat di sekitar 0.
52
PELAKSANAAN PENELITIAN
Penelitian ini dilakukan untuk mendapatkan model machine learning

dengan menggunakan metode adaptive boosting yang mampu melakukan prediksi
nilai kandungan oksigen dalam flue gas pada furnace di PT. Pertamina RU V
Balikpapan. Prediksi dibuat dengan menggunakan beberapa variabel proses dari
furnace sebagai data latih dan uji untuk membuat model machine learning tersebut.
Alat dan Bahan Penelitian

IV.1.1. Alat Penelitian
Dalam penelitian ini peralatan yang digunakan terdiri dari perangkat keras
dan perangkat lunak sebagai berikut:
1. Perangkat keras berupa laptop dengan spesifikasi sebagai berikut:

a. Nama laptop : Asus X540LJ
b. Sistem operasi : Windows 10 Pro 64-bit
c. Prosesor : Intel® Core™ i3-5055U CPU @ 2.00 GHz
d. Ram : 8 GB
e. GPU : Nvidia Geforce 920M
2. Perangkat lunak, dengan rincian sebagai berikut:
a. Python
Python adalah bahasa pemrograman yang digunakan untuk
membersihkan data, membuat visualisasi, dan membangun model.
Bahasa pemrograman yang open source, bisa ditafsirkan, dan
merupakan bahasa tingkat tinggi ini memungkinkan pendekatan yang
lebih baik untuk pemrograman berorientasi objek. Pada penelitian ini,
digunakan Python versi 3.10. Peneliti menggunakan Python agar dapat
menjalankan algoritma AdaBoost dan program prediksi nilai kandungan
oksigen boiler.
53
b. Jupyter Notebook
Jupyter notebook adalah aplikasi berbasis web open source yang
dapat digunakan untuk membuat dan membagikan dokumen. Dokumen
ini berisi kode, persamaan matematika, visualisasi maupun text. Jupyter
notebook juga merupakan tool yang popular untuk mengolah data
Python.
c. Microsoft Office 365
Microsoft Office 365 ini terdiri dari Microsoft Word dan Microsoft
Excel yang dilanggan UGM. Software ini digunakan untuk membuat
laporan hasil penelitian dan melihat dataset pada tabel.
IV.1.2. Bahan Penelitian

Penelitian tugas akhir ini menggunakan bahan penelitian berupa data historis
parameter operasi pada boiler 6 PT. Pertamina RU V Balikpapan yang diambil dari
penyimpanan DCS (distrubuted control system) melalui perangkat lunak PI
Process-Book (dioperasikan oleh engineer). Data tersebut merupakan parameter
proses yang didapatkan penelitian sebelumnya ketika boiler beroperasi dari tanggal
1 Januari 2019 hingga 28 Agustus 2019. Proses pengambilan data dilakukan setiap
satu jam sekali. Terdapat total 5.717 sampel data dari 19 parameter operasi boiler
termasuk kandungan oksigen. Parameter tersebut merupakan variabel penting
berdasarkan proses alur fluida kerja dan alur pembakaran pada boiler yang telah
dijelaskan pada subbab III.1.2 sebelumnya. Data parameter proses yang digunakan
dapat dilihat pada Tabel 4.1 berikut
54
Tabel 4.1. Data parameter proses di boiler 6 PT. Pertamina RU V Balikpapan
No Parameter Proses Satuan

1 Deaerator level mm
2 Laju aliran umpan water boiler ke superheater ton/jam
o
3 Temperatur steam desuperheater lanjutan C
4 Laju aliran umpan air kg/jam
5 Laju aliran masukan gas utama ke furnace NM3/jam
6 Tekanan gas bahan bakar di belakang katup kontrol kg/cm2
7 Laju aliran udara pembakaran kg/jam
8 Tekanan udara burner box mmH2
o
9 Temperatur steam utama C
10 Tekanan gas buang furnace mmH2
o
11 Temperatur keluaran flue gas boiler C
12 Tekanan steam boiler kg/cm2
13 Tekanan wind box mmH2O
o
14 Temperatur udara pembakaran C
15 Level boiler steam drum %
16 Main steam header kg/jam
o
17 Temperatur masukan water economizer C
o
18 Temperatur keluaran water economizer C
19 Kandungan oksigen % O2
Tata Laksana Penelitian

Jenis penelitian ini termasuk penelitian eksperimental. Penelitian
eksperimental adalah penelitian yang berusaha mencari pengaruh variabel tertentu
terhadap variabel lain dengan kontrol yang ketat. Proses penelitian dilakukan
dengan tahap-tahap sesuai dengan alur yang digambarkan melalui diagram alir pada
Gambar 4.1.
55
Gambar 4.1. Diagram alir penelitian.

56
IV.2.1. Studi Literatur

Langkah pertama dari penelitian ini adalah studi literatur. Studi literatur ini
dilakukan untuk menambah pengetahuan dan pemahaman serta memberikan dasar
dalam melakukan penelitian ini. Adapun studi literatur yang dilakukan adalah
sebagai berikut:
1. Mempelajari dasar-dasar teori dari machine learning dan aplikasinya dalam

berbagai bidang kehidupan.
2. Mempelajari penelitian-penelitian terdahulu mengenai prediksi kandungan
oksigen dalam flue gas pada pembangkit listrik menggunakan machine
learning dan deep learning.
3. Mempelajari dasar-dasar teori dari metode adaptive boosting.
4. Mempelajari teori-teori terkait dengan boiler, furnace, dan flue gas.
5. Mempelajari cara penulisan kode (syntax) untuk bahasa pemrograman
Python yang akan digunakan pada penelitian ini.
IV.2.2. Pengolahan Awal Data

Pengolahan data awal (data preprocessing) dilakukan untuk mendapatkan
data yang berkualitas dan siap digunakan pada proses selanjutnya. Data awal harus
disiapkan sedemikian rupa agar tidak ada masalah dalam proses selanjutnya dan
dapat dihasilkan hasil yang optimal dalam proses pembangunan model. Pengolahan
data awal dilakukan sebagai berikut:
IV.2.2.1 Penanganan Data Yang Hilang

Pada sistem pengukuran dalam flue gas pada boiler di PT. Pertamina RU V
Balikpapan menggunakan sensor zirkonia, bisa jadi ada suatu peristiwa yang
mengakibatkan data variabel tidak terukur pada waktu yang ditentukan. Hal ini bisa
disebabkan oleh berbagai faktor, misalnya sensor zirkonia mengalami kerusakan,
ataupun kesalahan operator dalam perekaman data. Data yang hilang ini dapat
mengakibatkan proses pembangunan model memiliki kinerja yang kurang baik,
57
karena algoritma machine learning tidak mendukung data yang hilang dan dapat
menggangu model berlatih dengan data.
Untuk menghindari permasalahan model karena terdapat data yang hilang

selama proses pembangunan model, cara yang dapat dilakukan adalah dengan
meniadakan (drop) baris atau kolom data yang terdapat missing value. Metode
peniadaan ini membuat data sepenuhnya memiliki nilai, namun di sisi lain
informasi terkait data juga akan hilang bersama data yang dibuang. Metode lain
yang bisa dilakukan adalah metode imputasi, yaitu mengisi missing value dengan
memberikan nilai tertentu seperti mean, median, data sebelum dan sesudah missing
value, interpolasi dan seasonal data. Kelebihan metode imputasi adalah dapat
meminimilasir kehilangan informasi terkait data, namun prosesnya memakan
waktu untuk data yang besar dan dapat terjadi kebocoran data sehingga data uji
menjadi bias.
IV.2.2.2 Pemisahan Data

Setelah permasalahan missing value berhasil diatasi, Langkah selanjutnya
adalah melakukan pemisahan data dalam pembangunan model. Pemisahan data ini
bertujuan untuk membagi-bagi data menjadi beberapa variabel, seperti yang
dijelaskan berikut ini:
1. Pemisahan data menjadi variabel input (X) dan output (Y). Variabel input
atau disebut sebagai fitur adalah data masukan yang digunakan untuk
prediksi nilai output. Sedangkan variabel output atau disebut sebagai target
merupakan data yang nilainya merupakan hasil keluaran dari input. Variabel
input dan output ini digunakan untuk pelatihan dan pengujian model.
2. Pemisahan data pada fitur menjadi data latih dan data uji. Data latih (X_train)
digunakan oleh model untuk proses pelatihan model, yaitu membangun
algoritma prediksi dan menyesuaikan nilai bobot pada model AdaBoost.
Sedangkan data uji (X_test) digunakan untuk menguji dan mengevaluasi
58
kinerja model. Dari keseluruhan data, akan dibagi secara acak menjadi 80%
untuk data latih dan 20% untuk data uji.
3. Pemisahan data pada target menjadi data latih dan data uji. Data latih
(Y_train) dan data uji (Y_test) ini dipisahkan dalam proses pelatihan dan
pengujian model. Pembagian data sama seperti pada fitur yaitu 80% untuk
data latih dan 20% untuk data uji.
4. Pemisahan data latih menjadi data latih dan data validasi. Tujuan pemisahan
data ini dilakukan untuk meningkatkan performa model dengan
menggunakan cross validation. Pembagian data pada (X_train) menjadi
80% menjadi untuk data latih dan 20% untuk data validasi, begitu pula
untuk (Y_train) menjadi 80% menjadi untuk data latih dan 20% untuk data
validasi.
IV.2.3. Perancangan Model

Gambar 4.2 menunjukkan rancangan diagram soft sensor untuk
memprediksi nilai kandungan oksigen dalam flue gas pada boiler menggunakan
AdaBoost. Rancangan diagram ini adalah hasil modifikasi dari paper yang berjudul
Soft Sensor for the Prediction of Oxygen Content in Boiler Flue Gas Using Neural
Networks and Extreme Gradient Boosting, Neural Computing and Applications
[48]. Tools yang digunakan untuk membangun model tersebut adalah bahasa
pemrograman Python dan pustaka yang digunakan adalah scikit-learn, pandas,
numpy, dan matplotlib.
59
Gambar 4.2. Soft sensor untuk memprediksi nilai kandungan oksigen dalam flue
gas pada boiler menggunakan AdaBoost
IV.2.4. Pembangunan Model

Dalam membangun model, pertama-tama peneliti menggunakan kondisi
default. Selanjutnya, peneliti mengoptimasi model menggunakan seleksi fitur dan
penyesuaian hyperparameters untuk mendapatkan kinerja model yang lebih baik,
yang akan dijelaskan lebih lengkap berikut ini.
IV.2.4.1 Kondisi Default

Pembangunan model dengan kondisi default adalah kondisi di mana dataset
yang digunakan untuk pelatihan dan pengujian model menggunakan 18 fitur. Selain
itu, parameter AdaBoost yang digunakan juga dalam kondisi default. Setelah
dilakukan pelatihan pada model, selanjutnya model akan dilakukan pengujian
menggunakan data uji. Hasil model akhir akan diketahui kinerjanya apakah baik
atau buruk melalui nilai metrik evaluasi yaitu MAE dan MSE. Namun, hasil model
default ini biasanya belum memiliki kinerja yang optimal sehingga masih bisa
dilakukan optimasi performa model.
60
IV.2.4.2 Seleksi Fitur

Pada optimasi performa model, tahap pertama yang dilakukan oleh peneliti
adalah seleksi fitur. Dengan menggunakan korelasi pearson, dapat diketahui nilai-
nilai korelasi antara fitur dengan target, kemudian membuat peringkat dari fitur
yang paling tidak berkorelasi sampai yang paling berkorelasi. Pembangunan model
dilakukan dengan variasi jumlah fitur yang digunakan dengan diawali
menggunakan seluruh fitur kemudian fitur tersebut dikurangi satu per satu
berdasarkan fitur yang paling tidak berkorelasi hingga mencapai model dengan
menggunakan satu fitur. Model yang memiliki fitur dengan nilai metrik evaluasi
terbaik akan dipilih untuk dilakukan tahap optimasi kedua.
IV.2.4.3 Penyesuaian Hyperparameters

Tahap optimasi yang kedua adalah dengan melakukan penyesuaian
hyperparameters. Hyperparameters yang dipakai adalah parameter-parameter
AdaBoost yang terdapat pada subbab III.9.1. Dalam memilih nilai parameter
terbaik, dimanfaatkan modul yang disediakan oleh pustaka scikit-learn yaitu
randomized search CV. Alasan pemilihan randomized search CV karena waktu
komputasi yang dibutuhkan untuk mencari nilai parameter terbaik lebih cepat
dibandingkan dengan grid search CV. Variasi nilai parameter dapat dilihat pada
Tabel 4.2. Setelah mendapatkan parameter dengan nilai terbaik, selanjutnya nilai
itu diuji ke dalam model untuk mendapatkan performa yang lebih baik lagi.
Diagram alir pembuatan model soft sensor AdaBoost pada penelitian ini juga dapat
dilihat pada Gambar 4.3.
61
Tabel 4.2. Variasi parameter optimasi
Hyperparameters Default Rentang Variasi

n_estimators 50 [1,∞] [50-600] dengan
kelipatan 50
learning_rate 1,0 [0,1] [0.01, 0.1, 0.5,
1.0]
loss Linear - [linear, square,
exponential]
Gambar 4.3. Diagram alir pembuatan model soft sensor AdaBoost
IV.2.5. Evaluasi Hasil Pembangunan Model

Setelah didapatkan model yang telah dioptimasi, langkah selanjutnya adalah
mengevaluasi performa model. Evaluasi dilakukan dengan cara membandingkan
nilai metrik evaluasi (MAE dan MSE) sebelum dilakukan optimasi dan setelah
dioptimasi. Jika setelah dioptimasi nilai metrik evaluasi membaik, itu berarti
tahapan pembangunan model sudah selesai dilakukan.
62
IV.2.6. Penulisan Laporan

Semua tahapan penelitian yang dilakukan diimplementasikan dalam bentuk
laporan skripsidengan format dan aturan yang disesuaikan oleh Departemen Teknik
Nuklir dan Teknik Fisika, Fakultas Teknik, Universitas Gadjah Mada.
HASIL DAN PEMBAHASAN
Hasil Pengolahan Awal Data

V.1.1. Hasil penanganan data yang hilang
Pada pengolahan awal data, tahap awal yang dilakukan adalah menangani
dahulu data yang hilang. Tapi sebelum itu, dataset (dalam format .csv) yang
digunakan dalam penelitian ini perlu diimpor terlebih dahulu ke dalam jupyter
notebook. Dengan memanfaatkan pustaka pandas, daataset yang terdiri dari 5.717
baris dan 19 kolom data (18 independent variable dan 1 dependent variable) ini
dapat ditampilkan. Lampiran A.1 menunjukkan potongan kode sumber untuk
membuka dan menampilkan lima baris teratas dari dataset. Tabel 5.1.
memperlihatkan hasil keluaran dari kode sumber tersebut.
Tabel 5.1. Output dari potongan kode sumber
Deaerator BfwFlow Steam Boiler MainGas

6Level ToSuper Desuper Feed Inlet
heater heaterCont Water ToFurnace
0 73,833 2878,261 385,090 73480,631 4990,783
1 74,034 2915,723 384,941 73335,778 4993,541

2 74,265 2923,531 384,880 73254,207 4995,838
3 73,791 2929,040 385,137 73544,811 4993,857
4 73,817 2898,786 385,228 73397,359 4997,008

(bersambung)
63
64
Tabel 5.2. Output dari potongan kode sumber (sambungan)
Fuel
CombustionAir AirBurner MainSteam FlueGas
Gas
Flow Box Temperature Furnace
BehindCV
0 0,205 90227,571 191,486 465,016 126,163
1 0,205 90541,088 194,214 465,010 125,342
2 0,205 90766,579 191,069 465,013 127,68
3 0,205 90967,691 193.447 464,998 122,609
4 0,205 91530,159 191,624 464,991 121,592
(bersambung)
Tabel 5.3. Output dari potongan kode sumber
Boiler6
Steam WindBox Combustion Boiler6
FlueGas
Boiler Pressure Air SteamDrum
Outlet
0 380,297 60,604 164,638 41,696 35,146
1 380,502 60,544 164,495 39,827 35,072
2 380,569 60,517 164,05 40,087 35,036
3 381,001 60,554 164,333 39,799 35,048
4 380,955 60,477 164,524 39,352 34,972
(bersambung)
65
Tabel 5.4. Output dari potongan kode sumber (sambungan)
MainSteam Economizer Economizer O2

Header WaterInlet WaterOutlet Content
0 74531,619 127,566 204,434 2,819
1 74209,449 125,919 203,944 2,89
2 74216,972 125,275 203,372 2,897
3 74403,691 127,291 204,706 2,944
4 74470,674 127,716 205,071 2,942
Setelah dataset diimpor, kemudian dilakukan pemeriksaan nilai yang hilang

pada setiap parameter proses input maupun output. Lampiran A.2 menunjukkan
potongan kode sumber untuk memeriksa nilai yang hilang pada dataset. Hasil dari
potongan kode sumber tersebut dapat dilihat pada Tabel 5.5. Tabel tersebut
memperlihatkan ada berapa jumlah missing value dalam setiap parameter proses
input maupun output.
Tabel 5.5. Jumlah missing value dalam setiap parameter proses

No Parameter Proses Jumlah
missing
value
1 Deaerator level 0
2 Laju aliran umpan water boiler ke superheater 0
3 Temperatur steam desuperheater lanjutan 0
4 Laju aliran umpan air 0
5 Laju aliran masukan gas utama ke furnace 0
6 Tekanan gas bahan bakar di belakang katup kontrol 0
7 Laju aliran udara pembakaran 0
8 Tekanan udara burner box 0
9 Temperatur steam utama 0
(bersambung)
66
Tabel 5.6. Jumlah missing value dalam setiap parameter proses

(sambungan)
No Parameter Proses Jumlah
missing
value
10 Tekanan gas buang furnace 0
11 Temperatur keluaran flue gas boiler 0
12 Tekanan steam boiler 0
13 Tekanan wind box 0
14 Temperatur udara pembakaran 0
15 Level boiler steam drum 0
16 Main steam header 0
17 Temperatur masukan water economizer 0
18 Temperatur keluaran water economizer 0
19 Kandungan oksigen 0
Berdasarkan Tabel 5.5, dapat diketahui bahwa semua parameter proses yang
terdapat dalam dataset memiliki jumlah missing value 0. Itu artinya dataset sudah
siap untuk diproses lebih lanjut dalam proses pengolahan awal data ini.
V.1.2. Hasil Pemisahan Data

Tahapan selanjutnya dalam proses pengolahan awal data adalah pemisahan
data. Pemisahan dataset pada penelitian ini adalah sebagai berikut.
V.1.2.1 Hasil Pemisahan Fitur dan Target

Tujuan dari pemisahan ini adalah untuk mendefinisikan variabel mana yang
menjadi input (independent variable) atau juga disebut fitur dan output (dependent
variable) atau juga disebut target dalam parameter proses. Lampiran A.3
memperlihatkan potongan kode sumber untuk memisahkan fitur dan target berikut.
67
Hasil keluaran dari potongan kode sumber tersebut adalah semua parameter
proses selain ”O2Content“ menjadi fitur (X), sedangkan “O2Content“ sendiri
menjadi target (y).
V.1.2.2 Hasil Pemisahan Data Latih dan Data Uji

Setelah fitur dan target berhasil dipisahkan, selanjutnya adalah pemisahan
data latih dan data uji. Pemisahan ini dibagi dalam dua kondisi, yaitu kondisi model
default dan kondisi model setelah dilakukan penyesuaian hyperparameters
(optimasi). Untuk kondisi default pemisahan data hanya dibagi menjadi data latih
dan data uji, dengan porsi 80% untuk data latih dan 20% untuk data uji. Untuk
kondisi optimasi, pemisahan data juga dibagi menjadi data latih dan data uji, hanya
saja data latih ini dibagi kembali menjadi data latih yang baru dan data validasi.
Adanya data validasi dikarenakan penggunaan cross validation pada pelatihan
optimasi model. Oleh karena itu, pada kondisi optimasi terdapat 3 set data yaitu
data latih, data validasi, dan data uji. Lampiran A.4 menunjukkan potongan kode
sumber untuk memisahkan data latih dan data uji ini. Hasil pembagian data pada
kondisi default dan kondisi optimasi ditunjukkan pada Tabel 5.7.
Tabel 5.7. Pemisahan Data Latih dan Data uji
Model Cross Data Latih Data Data Uji

validation Validasi
Default - 4573 - 1144
Penyesuaian 5 365 914 1144
hyperparameters
68
Hasil Pembangunan Model

Setelah semua tahap pengolahan awal data selesai dilakukan, langkah
selanjutnya adalah pembangunan model. Metode yang digunakan dalam
pembangunan model adalah adaptive boosting yang bahasa pemrogramannya
mengggunakan Python. Pada penelitian ini, pembangunan model dilakukan dalam
kondisi yang berbeda-beda, kemudian membandingkan nilai metrik evaluasi untuk
selanjutnya dipilih model mana yang memiliki kondisi terbaik.
V.2.1. Hasil Kondisi Default

Pembangunan model yang pertama adalah pada kondisi default. Pada
kondisi default, nilai hyperparameters adaptive boosting memakai nilai yang sudah
ditetapkan oleh pustaka scikit-learn. Tujuan dari pembangunan model default ini
adalah untuk membangun model dasar agar mengetahui apakah algoritma adaptive
boosting dapat bekerja dengan dataset yang tersedia. Tabel 5.8 menunjukkan
hyperparameters yang dipakai dan nilai defaultnya.
Tabel 5.8. Nilai hyperparameters pada kondisi default
Hyperparameters Default
n_estimators 50
learning_rate 1,0
loss Linear
Pembangunan model ini dilakukan dengan pelatihan dan pengujian model.

Tujuan dari pelatihan adalah agar model bisa mendapatkan gambaran korelasi
antara 18 fitur dan target (kandungan oksigen). Setelah dilakukan pelatihan,
selanjutnya dilakukan pengujian model dengan menggunakan data uji untuk
mendapatkan nilai metrik evaluasi. Lampiran A.5 menunjukkan potongan kode
sumber untuk pembangunan model default. Dikarenakan setiap kali program
69
AdaBoost dijalankan ulang pada jupyter notebook, nilai metrik evaluasinya

berubah-ubah. Oleh karena itu, peneliti mencari nilai rata-rata dan standar deviasi
dari metrik evaluasi. Caranya adalah dengan menjalankan ulang program AdaBoost
sebanyak 5 kali. Hasil nilai MAE dan MSE dengan menggunakan 18 fitur
ditunjukkan pada Tabel 5.9.
Tabel 5.9. Hasil metrik evaluasi model default
Percobaan ke- MAE MSE

1 0,194 0,056
2 0,190 0,054
3 0,197 0,057
4 0,196 0,055
5 0,207 0,062
Rata-rata 0,197 0,057
Standar deviasi 0,006 0,003
Dari tabel 5.9, dapat diketahui bahwa nilai rata-rata MAE dan MSE dari 5
kali percobaan adalah 0,197 dan 0,057. Diketahui juga bahwa nilai standar deviasi
dari MAE dan MSE cukup rendah mendekati nol. Hal ini menunjukkan bahwa nilai
sebaran data setiap percobaan tidak jauh berbeda dari nilai rata-rata.
V.2.2. Hasil Seleksi Fitur

Langkah selanjutnya dalam pembangunan model adalah seleksi fitur.
Dalam penelitian ini, seleksi fitur dilakukan menggunakan korelasi pearson.
Tujuannya adalah untuk mendapatkan nilai koefisien (r) masing-masing fitur
terhadap kandungan oksigen. Setelah didapatkan nilai koefisien, selanjutnya
dilakukan pengurutan dari fitur yang paling berkorelasi sampai yang paling tidak
berkorelasi. Lampiran A.6 menunjukkan potongan kode sumber seleksi fitur
70
menggunakan korelasi pearson. Hasil koefisien korelasi masing-masing fitur

terhadap kandungan oksigen ditunjukkan pada Tabel 5.10.
Tabel 5.10. Nilai r masing-masing fitur terhadap kandungan oksigen
Koefisien
No Parameter Proses (Fitur)
Korelasi (r)
1 Level Deaerator -0,048
2 Laju Aliran Umpan Water boiler ke Superheater -0,642
3 Temperatur Steam Desuperheater Lanjutan 0,123
4 Laju Aliran Umpan Air -0,924
5 Laju Aliran Masukan Gas Utama ke Furnace -0,888
6 Tekanan Gas Bahan Bakar di Belakang Katup Kontrol -0,871
7 Laju Aliran Udara Pembakaran 0,263
8 Tekanan Udara Burner Box 0,127
9 Temperatur Steam Utama -0,202
10 Tekanan Gas Buang Furnace -0,037
11 Temperatur keluaran Flue Gas Boiler -0,716
12 Tekanan Steam Boiler -0,763
13 Tekanan Wind Box 0,089
14 Temperatur udara Pembakaran -0,116
15 Level Boiler Steam Drum 0,198
16 Main Steam Header -0,924
17 Temperatur Masukan Water Economizer 0,099
18 Temperatur Keluaran Water Economizer 0,934
Dari Tabel 5.10 tersebut terlihat adanya koefisien korelasi yang bernilai
positif dan bernilai negatif. Dari Tabel 5.10, fitur yang memiliki korelasi paling
tinggi dengan kandungan oksigen adalah temperatur keluaran water economizer
dengan nilai 0,934 sedangkan fitur yang memiliki korelasi paling rendah adalah
71
tekanan gas buang furnace dengan nilai -0,037. Tabel 5.11 menunjukkan urutan
fitur yang memiliki korelasi paling rendah sampai paling tinggi dengan kandungan
oksigen.
Tabel 5.11. Urutan fitur yang memiliki nilai korelasi terendah sampai
tertinggi dengan kandungan oksigen
Koefisien
Parameter Proses (Fitur) Korelasi
(r)
Tekanan gas buang furnace -0,037
Level deaerator -0,048
Korelasi rendah
Tekanan wind box 0,089

Temperatur masukan water economizer 0,099
Temperatur udara pembakaran -0,116
Temperatur steam desuperheater lanjutan 0,123
Tekanan udara burner box 0,127
Level boiler steam drum 0,198
Temperatur steam utama -0,202
Laju aliran udara pembakaran 0,263
Laju aliran umpan water boiler ke superheater -0,642
Temperatur keluaran flue gas boiler -0,716
Tekanan steam boiler -0,763
Tekanan gas bahan bakar di belakang katup kontrol -0,871
Korelasi tinggi
Laju aliran masukan gas utama ke furnace -0,888

Main steam header -0,924
Laju aliran umpan air -0,924
Temperatur keluaran water economizer 0,934
72
Setelah fitur diurutkan, selanjutnya dilakukan seleksi fitur yaitu membuang

satu per satu fitur dari korelasi terendah sampai tertinggi. Setiap fitur yang diseleksi
dilakukan pelatihan dan pengujian untuk mendapatkan nilai metrik evaluasi terbaik.
V.2.2.1 Nilai Rata-rata dan Standar Metrik Evaluasi

Setelah melakukan seleksi fitur dari 18 fitur hingga 1 fitur, didapatkan
berbagai nilai metrik evaluasi. Dari situ, peneliti bisa mengetahui berapa fitur yang
diperlukan untuk mendapatkan nilai error yang paling kecil. Dikarenakan karena
nilai metrik evaluasi berubah-ubah setiap kali program AdaBoost dijalankan, maka
peneliti mencari nilai rata-rata dan standar deviasi dari metrik evaluasi dengan cara
menjalankan ulang program AdaBoost sebanyak 5 kali, sehingga didapatkan 5
variasi nilai metrik evaluasi dari 18 fitur hingga 1 fitur. Potongan kode sumber dapat
dilihat pada link di Lampiran A.7. Tabel 5.12 menunjukkan variasi nilai MAE pada
berbagai jumlah fitur.
73
Tabel 5.12.Variasi nilai MAE pada berbagai jumlah fitur
Nilai MAE
Jumlah Percoba Percoba Percoba Percoba Percoba Rata- Standar
Fitur an 1 an 2 an 3 an 4 an 5 rata Deviasi
18 fitur 0,194 0,197 0,195 0,189 0,205 0,196 0,006
17 fitur 0,194 0,202 0,198 0,189 0,192 0,195 0,005
16 fitur 0,203 0,203 0,192 0,188 0,198 0,197 0,007
15 fitur 0,194 0,211 0,198 0,193 0,194 0,198 0,008
14 fitur 0,202 0,19 0,201 0,191 0,192 0,195 0,006
13 fitur 0,202 0,196 0,188 0,171 0,197 0,191 0,012
12 fitur 0,203 0,203 0,189 0,197 0,183 0,195 0,009
11 fitur 0,193 0,199 0,188 0,193 0,19 0,193 0,004
10 fitur 0,19 0,199 0,192 0,178 0,193 0,19 0,007
9 fitur 0,192 0,199 0,2 0,185 0,207 0,197 0,008
8 fitur 0,192 0,212 0,204 0,188 0,199 0,199 0,01
7 fitur 0,206 0,2 0,201 0,191 0,206 0,201 0,006
6 fitur 0,199 0,204 0,204 0,193 0,202 0,2 0,004
(bersambung)
74
Tabel 5.13. Variasi nilai MAE pada berbagai jumlah fitur (sambungan)
Nilai MAE
5 fitur 0,202 0,195 0,198 0,204 0,212 0,202 0,006
4 fitur 0,208 0,196 0,2 0,192 0,208 0,201 0,007
3 fitur 0,187 0,231 0,213 0,18 0,202 0,197 0,013
2 fitur 0,202 0,203 0,19 0,184 0,187 0,193 0,009
1 fitur 0,332 0,328 0,351 0,356 0,363 0,346 0,015
Selain itu, Tabel 5.14 juga memperlihatkan variasi nilai MSE pada berbagai
jumlah fitur.
Tabel 5.14. Variasi nilai MSE pada berbagai jumlah fitur
Nilai MSE
18 fitur 0,056 0,055 0,057 0,05 0,062 0,056 0,004
17 fitur 0,055 0,06 0,059 0,052 0,054 0,056 0,003
16 fitur 0,059 0,061 0,054 0,051 0,056 0,056 0,004
15 fitur 0,056 0,066 0,058 0,053 0,056 0,058 0,005
14 fitur 0,059 0,054 0,06 0,053 0,054 0,056 0,003
13 fitur 0,059 0,056 0,052 0,043 0,057 0,054 0,006
12 fitur 0,06 0,06 0,053 0,057 0,048 0,056 0,005
11 fitur 0,054 0,058 0,052 0,054 0,054 0,054 0,002
10 fitur 0,052 0,059 0,053 0,047 0,056 0,053 0,005
9 fitur 0,054 0,058 0,059 0,05 0,063 0,057 0,005
8 fitur 0,053 0,066 0,059 0,049 0,056 0,057 0,007
(bersambung)
75
Tabel 5.15. Variasi nilai MSE pada berbagai jumlah fitur (sambungan)
Nilai MSE
7 fitur 0,062 0,057 0,059 0,053 0,062 0,058 0,004
6 fitur 0,057 0,061 0,06 0,053 0,058 0,058 0,003
5 fitur 0,059 0,056 0,057 0,058 0,064 0,059 0,003
4 fitur 0,063 0,056 0,059 0,052 0,063 0,059 0,005
3 fitur 0,05 0,061 0,066 0,047 0,059 0,057 0,008
2 fitur 0,061 0,061 0,053 0,049 0,05 0,055 0,006
1 fitur 0,183 0,177 0,194 0,203 0,209 0,193 0,013
Gambar 5.1 dan 5.2 menunjukkan grafik kolom nilai rata-rata MAE dan
MSE pada kondisi default.
NILAI RATA-RATA MAE KONDISI DEFAULT

MAE 0,346
0,202
0,201
0,201
0,199
0,198
0,197
0,197
0,197
0,196
0,195
0,195
0,195
0,193
0,193
0,191
0,19
0,2
Gambar 5.1. Grafik kolom nilai rata-rata MAE pada kondisi default
76
NILAI RATA-RATA MSE PADA KONDISI

DEFAULT
MSE
0,193
0,059
0,059
0,058
0,058
0,058
0,057
0,057
0,057
0,056
0,056
0,056
0,056
0,056
0,055
0,054
0,054
0,053
Gambar 5.2. Grafik kolom nilai rata-rata MSE pada kondisi default
Dari rata-rata nilai MAE dan MSE pada berbagai fitur, diketahui bahwa
jumlah fitur yang diperlukan untuk mendapatkan nilai metrik evaluasi terbaik
adalah 10 fitur dengan rata-rata nilai MAE 0,19 dengan standar deviasi 0,007, juga
rata-rata nilai MSE 0,053 dengan standar deviasi 0,005. Nilai standar deviasi yang
cukup kecil ini menandakan bahwa nilai sebaran data pada tiap percobaan tidak
jauh berbeda dengan nilai rata-rata.
V.2.3. Hasil Penyesuaian Hyperparameters

Setelah diketahui bahwa penggunaan 10 fitur memiliki nilai metrik evaluasi
terbaik, selanjutnya dilakukan penyesuaian hyperparameters untuk mendapatkan
nilai metrik evaluasi yang lebih optimal. Lampiran A.8 menunjukkan potongan
kode sumber penyesuaian hyperparameters untuk 10 fitur. Tabel 5.16 menunjukkan
hasil penyesuaian hyperparameters yang optimal untuk 10 fitur.
77
Tabel 5.16. Hasil penyesuian hyperparameters untuk 10 fitur.
Hyperparameters Default Penyesuaian

Hyperparameters
n_estimators 50 600
learning_rate 1,0 1,0
loss Linear Square
Setelah didapatkan nilai hyperparameter yang optimal, kemudian model

yang menggunakan 10 fitur dilatih dan diuji kembali untuk mendapatkan nilai
metrik evaluasinya. Lampiran A.9 menunjukkan potongan kode sumber hasil
tuning. Mengetahui bahwa nilai standar deviasi dari 5 kali percobaan pada setiap
fitur nilainya cukup kecil, oleh karena itu dalam mencari nilai metrik evaluasi hasil
penyesuaian hyperparameters ini cukup dilakukan 1 kali percobaan saja karena
nilainya pasti tidak jauh dari rata-rata. Tabel 5.17 menunjukkan perbandingan nilai
metrik evaluasi model sebelum dan sesudah dilakukan penyesuaian
hyperparameters.
Tabel 5.17. Perbandingan nilai MAE dan MSE sebelum dan sesudah
dilakukan penyesuaian hyperparameters.
Metrik Evaluasi Model Dengan Penyesuaian

10 Fitur Hyperparameters
MAE 0,19 0,168
MSE 0,053 0,043
Dari Tabel 5.17 diketahui bahwa setelah dilakukan penyesuaian

hyperparameters, nilai dari MAE turun sebesar ≈11,58% atau menjadi 0,168,
sedangkan nilai dari MSE turun sebesar ≈18,87% atau menjadi 0,043. Dengan ini
78
terbukti bahwa penyesuaian nilai hyperparameters dapat membuat nilai galat pada
model menjadi turun.
Untuk memperjelas ilustrasi, Gambar 5.3 menunjukkan perbandingan nilai

metrik evaluasi pada kondisi default, seleksi fitur menggunakan 10 fitur, dan setelah
dilakukan penyesuaian hyperparameter.
Perbandingan nilai metrik evaluasi

0,25
0,197 0,19
0,2
0,168
0,15
0,1
0,057 0,053
0,043
0,05
0
Default Seleksi Fitur (10 fitur) Penyesuaian
Hyperparameters
MAE MSE
Gambar 5.3. Perbandingan nilai metrik evaluasi pada setiap kondisi

KESIMPULAN DAN SARAN
Kesimpulan
Berdasarkan hasil dan analisis pada penelitian ini, dapat disimpulkan
sebagai berikut:
1. Telah berhasil dilakukan pembangunan model dengan metode adaptive
boosting yang mampu melakukan prediksi nilai kandungan oksigen dalam
flue gas pada boiler di PT. Pertamina RU V Balikpapan.
2. Model terbaik adalah dengan nilai hyperparameters default yaitu
menggunakan 10 fitur dengan rata-rata nilai MAE adalah 0,19 dengan
standar deviasi adalah 0,007. Kemudian rata-rata nilai MSE adalah 0,053
dan standar deviasi adalah 0,005.
3. Penyesuaian nilai hyperparameters dengan randomized search cv pada
model dengan 10 fitur dapat menurunkan nilai MAE sebesar ≈11,58% atau
menjadi 0,168 dan dapat menurunkan nilai MSE sebesar ≈18,87% atau
menjadi 0,043.
Saran
Berdasarkan hasil dan analisis pada penelitian ini, maka saran untuk
penelitian berikutnya adalah sebagai berikut:
a. Saran untuk meningkatkan performa model.
1. Menambahkan data hasil pengukuran pada fitur agar lebih mengetahui pola
dalam pembangunan model, sehingga dapat lebih akurat dalam
memprediksi nilai target (kandungan oksigen).
2. Melakukan pembangunan model machine learning dengan algoritma
lainnya. Harapannya, performa model dengan algoritma yang lain menjadi
lebih baik daripada dengan AdaBoost.
79
80
b. Saran untuk mengaplikasikan model machine learning yang telah dibangun.

1. Membangun sistem berbasis internet yang dapat menghubungkan soft
sensor dengan parameter proses (fitur) di lapangan, sehingga dapat
mengukur nilai kandungan oksigen (target) secara waktu-nyata.
DAFTAR PUSTAKA
[1] A. Sugiharto, “Tinjauan Teknis Pengoperasian Dan Pemeliharaan boiler,”

Swara Patra : Majalah Ilmiah PPSDM Migas, 31-Dec-2016. [Online].
Available:
http://ejurnal.ppsdmmigas.esdm.go.id/sp/index.php/swarapatra/article/view
/128.
[2] E. D. Kurniawan, "Soft sensor berbasis xtreme gradient boosting untuk

prediksi nilai kandungan oksigen dalam flue gas pada boiler PT. Pertamina
RU V Balikpapan", 2021.
[3] A. Syarief, Y. B. Setiambodo, M. N. Ramadhan, and A. Sabitah, “Analisis

kebutuhan udara pembakaran Untuk Mengoptimalkan proses pembakaran
boiler pt. PLN (Persero) Sektor Pembangkitan asam asam unit 3 & unit 4,”
INFO-TEKNIK, vol. 21, no. 1, pp. 88–89, 2020.
[4] K. Carpenter and C. Schmidt, “Common Boiler Excess Air Trends and
Strategies to Optimize Efficiency,” ACEEE Summer Study on Energy
Efficiency in Buildings, pp. 52–63, 2008.
[5] M. Liangyu, W. Yongjun, and Z. Xiaotong, “Ann-based soft sensing of

oxygen content in boiler air-flue gas system,” 2019 Chinese Control And
Decision Conference (CCDC), pp. 3268–3272, 2019.
[6] A. Gorenstein and M. Kalech, “Predictive maintenance for critical

infrastructure,” Expert Systems with Applications, vol. 210, p. 118413,
2022.
[7] S. Hussein, “Ensemble learning dalam machine learning: Bagging Dan

Boosting,” GEOSPASIALIS, 02-Feb-2022. [Online]. Available:
https://geospasialis.com/ensemble-learning/.
[8] D. Indonesia, “Developer Academy: Memulai Pemrograman Dengan

python,” Dicoding. [Online]. Available:
https://www.dicoding.com/academies/86.
[9] S. Lingfang and W. Yechi, “Soft-sensing of oxygen content of flue gas

based on mixed model,” Energy Procedia, vol. 17, pp. 221–226, 2012.
[10] S. Chen, Z. Xi, W. Yan, and D. Zhang, “Soft sensor modeling for oxygen-
content in flue gasses in 1000MW ultra-superficial units,” 2015
81
82
International Conference on Industrial Informatics - Computing

Technology, Intelligent Technology, Industrial Information Integration, pp.
164–167, 2015.
[11] Z. Tang, H. Zhang, and H. Yang, “Artificial Neural Networks model for
predicting oxygen content in flue gas of power plant,” 2017 29th Chinese
Control And Decision Conference (CCDC), pp. 1379–1382, 2017.
[12] Z. Tang, Y. Li, and A. Kusiak, “A deep learning model for measuring
oxygen content of boiler flue gas,” IEEE Access, vol. 8, pp. 12268–12278,
2020.
[13] Adi Riyanto, “Penerapan random forest regression untuk prediksi nilai
kandungan oksigen dalam flue gas pada furnace PT. Pertamina RU-IV
Cicalap”, 2021.
[14] S. N. Sembodo, N. Effendy, K. Dwiantoro, and N. Muddin, “Radial basis

network estimator of oxygen content in the flue gas of debutanizer reboiler,”
International Journal of Electrical and Computer Engineering (IJECE),
vol. 12, no. 3, pp. 3044–3050, Jun. 2022.
[15] N. Effendy, E. D. Kurniawan, K. Dwiantoro, A. Arif, and N. Muddin, “The

prediction of the oxygen content of the flue gas in a gas-fired boiler system
using neural networks and random forest,” International Journal of
Artificial Intelligence (IJ-AI), vol. 11, no. 3, pp. 923–929, Sep. 2022.
[16] G. F. Gilman, Boiler Control Systems Engineering. Research Triangle Park,

NC: ISA-The Instrumentation, Systems, and Automation Society, 2005.
[17] “Refinery Unit V balikpapan,” Pertamina. [Online]. Available:

https://www.pertamina.com/id/refinery-unit-v-balikpapan.
[18] “Deaerator – purpose, principle, types, process control, advantages,”

Chemical Engineering Site. [Online]. Available:
https://chemicalengineeringsite.in/deaerator-principle-types-process-
control/.
[19] 2006. Combustion and Flue Gas Analysis. [Ebook] Euro Instrument, pp.1-
3. Available at:
http://www.eurotron.co.kr/bbs/data/skill/Combustion_Theory.pdf
[20] “Learn about natural gas,” 2017. [Online]. Available:

https://www.enbridgegas.com/about-enbridge-gas/learn-about-natural-gas.
[21] U. Jecht, Flue Gas Analysis in Industry. 2004, p. 10.

83
[22] M. Bahrami, “Chemical reactions definitions - simon fraser university.”

[Online]. Available:
https://www.sfu.ca/~mbahrami/ENSC%20461/Notes/Chemical%20Reacti
ons.pdf.
[23] Nurpadmi and L. Khafidzni, “Pengontrolan Rasio Udara dan Bahan Bakar
pada Boiler PPSDM Migas Menggunakan DCS,” vol. 8, pp. 37–42, 2018.
[24] “Excess air and Boiler Efficiency - Waterloo Manufacturing.” [Online].

Available: https://www.watmfg.com/watmfg23082016/wp-
content/uploads/2016/09/Excess-Air-and-Boiler-Efficiency.pdf. [Accessed:
01-Aug-2022].
[25] Swetnam, The Theory of Zirconia Oxygen Sensors. Cambridge Sensotec.
[26] D. Lindsley, Power Plant Control and Instrumentation: the control of

boilers and HRSG systems. The Institution of Engineering and Technology,
2000
[27] Yokogawa. O2 Learning Handbook: Zirconia Crystal Clear. Yokogawa,

Texas,
USA, 2013. 24, 25
[28] K. Dunst, G. Jasinski, and P. Jasinski, “Potentiometric oxygen sensor with

solid state reference electrode,” Metrology and Measurement Systems, vol.
21, no. 2, pp. 205–216, 2014.
[29] ZR400 Mini-Zirconia Oxide Sensor. Bacharach.
[30] Model ZR22G, ZR402G Direct in-situ Separate Type Zirconia Oxygen
Analyzers (Hardware Edition), 1st ed. Tokyo, Japan: Yokogowa Electric,
2010.
[31] K.Dwiantoro, "Penerapan Jaringan Saraf Tiruan Untuk Memprediksi

Kandungan Oksigen Di Dalam Flue Gas Pada Boiler PT. Pertamina RU V
Balikpapan", 2020.
[32] Y. Jiang, S. Yin, J. Dong, and O. Kaynak, “A review on soft sensors for
monitoring, control, and optimization of Industrial Processes,” IEEE
Sensors Journal, vol. 21, no. 11, pp. 12868–12881, 2021.
[33] O. Savytskyi, M. Tymoshenko, O. Hramm, and S. Romanov, “Application

of soft sensors in the automated process control of different industries,” E3S
Web of Conferences, vol. 166, pp. 1–8, 2020.
[34] B. Purnama, Pengantar Machine Learning. Informatika Bandung, 2019.

84
[35] W. M. van der Aalst, V. Rubin, H. M. Verbeek, B. F. van Dongen, E.

Kindler, and C. W. Günther, “Process mining: A two-step approach to
balance between underfitting and overfitting,” Software & Systems
Modeling, vol. 9, no. 1, pp. 87–111, 2008.
[36] F. Divina, A. Gilson, F. Goméz-Vela, M. García Torres, and J. Torres,

“Stacking Ensemble Learning for short-term electricity consumption
forecasting,” Energies, vol. 11, no. 4, p. 949, 2018.
[37] "Extremely Randomized Trees-Based Scheme for Stealthy Cyber-Attack

Detection in Smart Grid Networks". Scientific Figure on ResearchGate.
Available from: https://www.researchgate.net/figure/Illustration-of-a-
decision-tree_fig3_338780422 [accessed 30 Mar, 2022]
[38] V. Bikia, G. Rovas, S. Pagoulatou, and N. Stergiopulos, “Determination of

aortic characteristic impedance and total arterial compliance from regional
pulse wave velocities using Machine Learning: An in-silico study,”
Frontiers in Bioengineering and Biotechnology, vol. 9, pp. 1–15, 2021.
[39] Y. H. Agustin, K. ., and E. T. Luthfi, “Klasifikasi Penerimaan Mahasiswa

baru Menggunakan Algortima C4.5 Dan AdaBoost (Studi Kasus : STMIK
XYZ),” CSRID (Computer Science Research and Its Development Journal),
vol. 9, no. 1, pp. 1-11, 2017.
[40] H. Min and X. Luo, “Calibration of soft sensor by using just-in-time

modeling and ADABOOST Learning Method,” Chinese Journal of
Chemical Engineering, vol. 24, no. 8, pp. 1038–1046, 2016.
[41] E. I. Obilor and E. C. Amadi, “Test for Significance of Pearson’s Correlation

Coefficient (r),” International Journal of Innovative Mathematics, Statistics
& Energy Policies, pp. 11-23, 2018.
[42] J.Chee, “Pearson's Product-Moment Correlation: Sample Analysis,”

ResearchGate, pp. 1-15, 2013.
[43] Rozy, F., Rangkuti, S., Fauzi, M. A., Sari, Y. A., Dewi, E., & Sari, L,
"Analisis Sentimen Opini Film Menggunakan Metode Naïve Bayes dengan
Ensemble Feature dan Seleksi Fitur Pearson Correlation Coefficient,"
Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer (J-PTIIK)
Universitas Brawijaya, 6354–6361.
[44] P. Schober, C. Boer, and L. A. Schwarte, “Correlation coefficients,”

Anesthesia & Analgesia, vol. 126, no. 5, pp. 1763–1768, 2018.
85
[45] E. Elgeldawi, A. Sayed, A. R. Galal, and A. M. Zaki, “Hyperparameter

tuning for machine learning algorithms used for Arabic sentiment analysis,”
Informatics, vol. 8, no. 4, pp. 1–21, 2021.
[46] P. M. Kouate, “Machine learning: GRIDSEARCHCV &

RANDOMIZEDSEARCHCV,” Medium, 11-Sep-2020. [Online].
Available: https://towardsdatascience.com/machine-learning-gridsearchcv-
randomizedsearchcv-d36b89231b10.
[47] Ichi Pro, "Metrik Evaluasi Umum Untuk Analisis Regresi," Available:
https://ichi.pro/id/metrik-evaluasi-umum-untuk-analisis-regresi-
82886198762157.
[48] E. D. Kurniawan, N. Effendy, A. Arif, K. Dwiantoro, and N. Muddin, “Soft

sensor for the prediction of oxygen content in boiler flue gas using neural
networks and extreme gradient boosting,” Neural Computing and
Applications, 2022.
LAMPIRAN A
KODE SUMBER
A.1. Kode Sumber Mengimpor Dataset
import pandas as pd
import numpy as np
#mengimpor dataset dengan format csv ke dalam jupyter notebook
data_boiler = pd.read_csv(”databoilerpertamina.csv“)
data_boiler.head()
A.2. Kode Sumber memeriksa missing value
#memeriksa nilai yang hilang

data_boiler.isna().sum()
A.3. Kode Sumber memisahkan fitur dan target
#memisahkan variabel menjadi X untuk fitur dan y untuk target

X = data_boiler.drop(”O2Content“, axis=1)
y = data_boiler[”O2Content“]
86
87
A.4. Kode Sumber Memisahkan Data Latih dan Data Uji
from sklearn.model_selection import train_test_split
#mendefinisikan data latih dan data uji juga membaginya menjadi 80% untuk
data latih dan 20% data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,
random_state = 0)
#hasil pembagian data latih dan data uji pada fitur

X_train.shape, X_test.shape
A.5. Kode Sumber Pembangunan Model Kondisi Default

from sklearn.ensemble import AdaBoostRegressor
from sklearn import metrics
#masukan hyperparameter AdaBoost kondisi default

AdaB_reg = AdaBoostRegressor(n_estimator = 50, learning_rate = 1.0,
loss = ‘linear’, random_state = 0)
#pelatihan model menggunakan data latih

AdaB_reg.fit(X_train, y_train)
#pengujian model menggunakan data uji

y_AdaB = AdaB_reg.predict(X_test)
#mencari nilai metrik evaluasi menggunakan 18 fitur

score_AdaB18 = [metrics.mean_absolute_error(y_test, y_adaB),
metrics.mean_squared_error(y_test,y_AdaB),
np.sqrt(metrics.mean_squared_error(y_test,y_AdaB))]
#kolom metrik evaluasi

score_columns = [‘MAE’, ‘MSE’]
#hasil nilai metrik evaluasi

score_AdaB18 = pd.DataFrame(score_AdaB18, score_columns,
columns = [’18 feature’])
score_AdaB18.transpose()
88
A.6. Potongan Kode Sumber Seleksi Fitur Menggunakan Korelasi Pearson
import matplotlib.pyplot as plt
#seleksi fitur dataset menggunakan korelasi pearson

correlation = data_boiler.iloc[: , :].corr(method = ‘pearson’)
#tingkat kepentingan fitur terhadap kandungan oksigen

feature_importances = pd.DataFrame(correlation.O2Content)
#memanggil variabel
feature_importances
A.7. Potongan Kode Sumber Menghitung Nilai Metrik Evaluasi Pada

Berbagai Fitur
https://drive.google.com/drive/folders/1Oekze7zoVjXSKr1d3t6zPNJXoD8ZENA
c?usp=sharing
89
A.8. Potongan Kode Sumber Penyesuaian Hyperparameters Untuk 10 Fitur

from sklearn.model_selection import RandomizedSearchCV
#memasukkan nilai rentang hyperparameters untuk dicari nilai optimalnya
#rentang nilai estimator dari 50 sampai 600 dengan kelipatan 12

n_estimators = [int(x) for x in np.linspace(start = 50, stop = 600, num = 12)]
#bentuk grafik cost function

loss = [‘linear’, ‘square’, ‘exponential’]
#rentang nilai learning_rate dari 0,01 sampai 1,0

learning_rate = [0.01, 0.1, 0.5, 1.0]
#membuat random grid

random_grid = {‘n_estimators’: n_estimators, ‘loss’: loss,
‘learning_rate’: learning_rate}
#penyesuaian hyperparameters terbaik

AdaB_reg = AdaBoostRegressor()
AdaB_reg2 = RandomizedSearchCV(estimator = AdaB_reg,
param_distributions = random_grid,
n_iter = 50, cv = 5, verbose = 2,
n_jobs = 1)
#pelatihan model menggunakan 10 fitur
AdaB_reg2.fit(X_train10, y_train)
#menampilkan hyperparameters terbaik

AdaB_reg2.best_params_
90
A.9. Potongan Kode Sumber Hasil Tuning

#pelatihan model dengan hyperparameters terbaik
AdaB_reg2_terbaik = AdaBoostRegressor(n_estimators = 600, loss = ‘square’,
learning_rate = 1.0)
#pelatihan model menggunakan 10 fitur

AdaB_reg2_terbaik.fit(X_train10, y_train)
#pengujian model dengan hyperparameters terbaik

y_AdaB_reg2 = AdaB_reg2_terbaik.predict(X_test10)
score_2 = [metrics.mean_absolute_error(y_test, y_AdaB_reg2),
metrics.mean_squared_error(y_test, y_AdaB_reg2)]
score_columns = [‘MAE’, ‘MSE’]
score_AdaB_reg2 = pd.DataFrame(score_2, score_columns,
columns = [‘Hasil Tuning’])
score_AdaB_reg2
Lampiran: Histori alur persetujuan
No Jabatan Nama Jenis Tanggal Disetujui
Ir. Nazrul Effendy, S.T., M.T.,
1 Dosen Pembimbing Paraf Senin, 24 Oktober 2022 11:29
Ph.D., IPM
Ketua Program Studi Sarjana Dr.-Ing. Awang Noor Indra
2 Paraf Senin, 24 Oktober 2022 12:40
Teknik Fisika Wardana, S.T., M.T., M.Sc.
Ketua Departemen Teknik Nuklir Dr. Ir. Alexander Agung, S.T.,
3 Tanda Tangan Selasa, 25 Oktober 2022 08:42
dan Teknik Fisika M.Sc.
Diajukan oleh Triyanto
Dokumen ini telah melalui proses approval secara daring sebelum QR Code dibubuhkan.
Scan QR Code yang ada di setiap halaman dokumen ini untuk verifikasi.

Test Skripsi

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Test Skripsi

Diunggah oleh

Hak Cipta:

Format Tersedia

HALAMAN JUDUL

SOFT SENSOR BERBASIS ADAPTIVE BOOSTING UNTUK PREDIKSI

untuk memenuhi sebagian persyaratan

SOFT SENSOR BERBASIS ADAPTIVE BOOSTING UNTUK PREDIKSI

Nama Mahasiswa : Rangga Herlambang

Nomor Mahasiswa : 18/431111/TK/47704

Pembimbing Utama : Ir. Nazrul Effendy, ST., MT., Ph.D., IPM.

Pembimbing Pendamping : Ir. Agus Arif, MT.

Skripsi ini telah dipertahankan di depan Tim Penguji

Ketua Sidang : Ir. Nazrul Effendy, ST., MT., Ph.D., IPM.

Penguji Utama : Dr. Faridah, S.T., M.Sc.

Anggota Penguji : Fadli Kasim, S.T., M.Sc.

Skripsi ini telah diterima dan dinyatakan memenuhi

Ketua Departemen Teknik Nuklir dan Teknik Fisika

Dr. Ir. Alexander Agung, S.T., M.Sc.

Penulis menyadari bahwa skripsi ini tidak mungkin dapat terselesaikan

Yogyakarta, 20 September 2022

HALAMAN JUDUL ................................................................................................ i

Tabel 2.1. Hasil kinerja model berbasis GPR ......................................................... 6

DAFTAR LAMBANG DAN SINGKATAN

EMF Gaya gerak listrik V

R Konstanta gas molar J.mol-1.K-1

z Jumlah unit muatan yang ditransfer -

F Konstanta Faraday C.mol-1

pO2 Tekanan parsial oksigen dalam udara %

N Jumlah sampel data -

𝑦𝑖 Nilai aktual pada data ke-i -

𝑦̂𝑖 Nilai Prediksi pada data ke-i -

ALDE Average Log-Density Error

ANN Artificial Neural Networks

AdaBoost Adaptive Boosting

BFW Boiler Feed Water

BPNN Backpropagation Neural Network

CCA Canonical Correlation Analysis

DCS Distributed Control System

DQN Deep Q Network

EMD Empirical Mode Decomposition

GPR Gaussian Process Regression

K-CV K-Fold Cross Validation

LASSO Least Absolute Shrinkage and Selection Operator

LSSVM Least Squares Support Vector Machines

MAE Mean Absolute Error

MRE Mean Relative Error

MSE Mean Square Error

MLR Multiple Linear Regression

MCTS Monte Carlo Tree Search

NCDBN Nonlinear Combined Deep Belief Network

PCA Principal Component Analysis

PLS Partial Least Square

RBFN Radial Basis Function Network

RMSE Root Mean Squared Error

RVTP Relative Variance Tracking Precision

SLA Service Level Agreement

SRE Sum of Absolute Relatif Error

SVR Support Vector Machine

XGBoost Xtreme Gradient Boosting

SOFT SENSOR BASED ON ADAPTIVE BOOSTING FOR PREDICTING

Submitted to the Department of Nuclear Engineering and Engineering Physics

Keywords: oxygen content, boiler, oxygen analyzer, AdaBoost.

memperoleh keluaran dengan akurasi yang lebih tinggi daripada hanya

2. Berapa jumlah parameter yang dibutuhkan untuk mendapatkan model

I.2.1. Batasan Masalah

Tabel 2.1. Hasil kinerja model berbasis GPR [10]

Tabel 2.2. Error relatif absolut GABP [13]