Anda di halaman 1dari 12

OPSEARCH

https://doi.org/10.1007/s12597-019-00386-z

PASAL APLIKASI

Model regresi hybrid untuk prediksi kualitas air

Tanujit Chakraborty 1 · Ashis Kumar Chakraborty 1 · Zubia Mansoor 2

Diterima: 28 Mei 2019


© Masyarakat Riset Operasional India 2019

Abstrak
Dalam pekerjaan ini, kami mengusulkan model regresi hybrid untuk memecahkan masalah spesifik yang dihadapi oleh
perusahaan manufaktur kertas modern. Kualitas air masuk boiler merupakan perhatian utama untuk mesin kertas. Jika
instalasi pengolahan air tidak dapat menghasilkan air dengan kualitas yang diinginkan, maka akan mengakibatkan
kesehatan tabung air boiler yang buruk dan akibatnya mempengaruhi kualitas kertas. Variasi ini disebabkan oleh
beberapa parameter proses yang penting. Kami membangun model regresi hibrid berdasarkan pohon regresi dan
mendukung regresi vektor untuk prediksi kualitas air boiler dan menunjukkan kinerjanya yang sangat baik dibandingkan
dengan teknologi canggih lainnya.

Kata kunci Kualitas air · Pohon keputusan · Mendukung regresi vektor · Model hibrida

1. Perkenalan

Pekerjaan ini dilatarbelakangi oleh masalah tertentu dalam industri kertas modern yang menghasilkan kertas
untuk berbagai kegunaan. Mesin kertas memproduksi kertas dengan menggunakan pulp, fiber, filler, pelumas
kimia dan air dalam jumlah yang cukup banyak. Ketel menghasilkan uap untuk keperluan pembangkit listrik dan
juga membantu membuat bubur kertas untuk produksi kertas. Uap yang dihasilkan di ketel digunakan untuk
memasak serpihan kayu (bersama dengan bahan kimia memasak). Uap juga dikirim ke kaleng pengering untuk
menghilangkan air dari lembaran yang diproduksi oleh mesin kertas. Boiler menetapkan tingkat kualitas air yang
diinginkan untuk diterima dari instalasi pengolahan air. Di pabrik, proses demineralisasi (proses DM) diterapkan
untuk menghilangkan padatan terlarut oleh

* Tanujit Chakraborty
tanujit_r@isical.ac.in

Ashis Kumar Chakraborty


akchakraborty123@rediffmail.com

Zubia Mansoor
zubiamansoor56@gmail.com

1
Kontrol Kualitas Statistik dan Unit Riset Operasi, Institut Statistik India, 203, BT Road, Kolkata 700108,
India
2
Universitas Amity, Kolkata, India

Vol.:(012 1 345
6789)3
OPSEARCH

proses pertukaran ion (IEP) yang melibatkan dua tahap demineralisasi [ 3 ]. Pada tahap pertama, ini
menghilangkan kation dari air dengan proses pertukaran kation dan kemudian menghilangkan anion
dari air melalui proses pertukaran anion pada tahap kedua [ 15 ]. PH outlet proses DM kebetulan
menjadi indikator kinerja utama (KPI) dari instalasi pengolahan air. Diketahui bahwa pabrik tidak dapat
menghasilkan air dengan kualitas yang diinginkan yang ditentukan oleh boiler untuk disuplai ke mesin
kertas. Menemukan model prediksi kualitas air akan membantu kami untuk mengatasi masalah variasi
pH air outlet DM serta indikasi buruknya kesehatan tabung air boiler. Mengontrol pH air akan
meningkatkan kualitas air boiler, sehingga menghasilkan keuntungan moneter bagi perusahaan [ 23 , 25
]. Analisis data awal yang ekstensif dilakukan untuk menentukan satu set variabel penyebab yang
mungkin menjadi kunci variasi tingkat pH air.

Alat statistik dan pembelajaran mesin seperti teknik pengendalian proses statistik, pohon regresi (RT),
dukungan vektor regresi (SVR) dan jaringan saraf tiruan (JST), dll telah diterapkan untuk memecahkan beberapa
masalah dalam menganalisis kualitas air sungai [ 1 , 17 , 18 , 20 ] dan perencanaan air permukaan [ 2 , 5 , 13 ].
Ditemukan bahwa RT dan SVR dapat memodelkan batas keputusan sewenang-wenang untuk kumpulan data
terbatas. RT ditemukan lebih kuat dan memiliki mekanisme pemilihan fitur bawaan. Tapi pohon biasanya bersifat
rakus dan terkadang terlalu sesuai dengan kumpulan data [ 6 ], sedangkan SVR menerapkan kernel untuk
memberikan fleksibilitas substansial untuk batas keputusan, yang mengarah ke perilaku prediktif yang lebih baik.
Padahal, SVR memiliki kelemahan karena peka terhadap pilihan parameter kernel serta pilihan fitur penting dari
data. Memanfaatkan formulasi hybrid, kami mencoba memanfaatkan kekuatan model RT dan SVR dan mengatasi
kekurangannya. Formulasi hybrid yang kami usulkan dapat digunakan untuk memangkas RT menggunakan SVR
dan untuk melakukan tugas prediksi pemilihan fitur dalam pengaturan dimensi tinggi untuk kumpulan data
berukuran kecil dan menengah. Dalam literatur sebelumnya, ada banyak karya tentang hibridisasi RT dan SVR,
misalnya lihat [ 4 , 10 , 14 , 21 , 24 ]. Dalam makalah ini, kami mengusulkan model hibrida baru untuk memprediksi
kualitas air dari instalasi pengolahan. Model yang diusulkan memiliki keunggulan akurasi yang signifikan dan
interpretabilitas yang mudah dibandingkan dengan model pembelajaran mesin yang lebih "seperti kotak hitam".

Makalah ini disusun sebagai berikut. Bagian 2 menjelaskan masalah motivasi dan formulasinya. Serangga. 3 ,
kami memperkenalkan arsitektur dasar model RT dan SVR, diikuti dengan model hybrid yang diusulkan. Bagian 4
menganalisis data eksperimental dengan metode yang diusulkan dan membandingkannya dengan model
mutakhir. Akhirnya, komentar penutup dan ruang lingkup penelitian masa depan diberikan di Sect. 5 .

2 Contoh memotivasi

Pada bagian ini, kami menjelaskan masalah bisnis yang memotivasi dan rencana pengumpulan data
untuk penelitian kami. Data pH diambil secara teratur dari laboratorium boiler perusahaan pembuat
kertas. Namun, saat studi dilakukan, kami hanya mempertimbangkan data 12 bulan terakhir untuk
dianalisis. Pengukuran level pH air di lab boiler dilakukan melalui meteran digital yang dikalibrasi
sebulan sekali menggunakan larutan standar. PH outlet proses DM kebetulan menjadi

13
OPSEARCH

KPI instalasi pengolahan air yang memberikan air dengan kualitas yang diinginkan yang ditentukan oleh boiler.
Instalasi pengolahan air terdiri dari dua unit: pengolahan air tawar dan pengolahan air padat. Instalasi
pengolahan air tawar melibatkan penyaringan air tawar yang diperoleh dari sumur tabung diikuti dengan
pengolahan air dengan bahan kimia, sehingga air cocok untuk boiler dan turbin. Pengolahan kondensat
melibatkan filtrasi dan pengolahan air kondensat yang diperoleh dari mesin kertas. Kualitas kondensat yang
berasal dari mesin kertas merupakan kendala utama untuk masalah saat ini. Setelah penyaringan air atau
kondensasi selesai, mereka dikirim ke pabrik DM di mana air dibuat sesuai untuk penggunaan ketel [ 22 ].
Rincian singkat dari jenis peralatan yang digunakan dalam proses instalasi DM diberikan di bawah ini (juga
lihat Gambar. 1 ).

• Penukar kation asam kuat (SAC) mengekstraksi kation dari air dengan resin kation dan
mengubahnya menjadi asam mineral. Sebuah bejana juga disediakan untuk mengontrol laju aliran
air masuk dan keluar.
• Strong base anion (SBA) exchanger adalah alat penukar anion di mana kapal dilapisi dengan karet
untuk mencegah korosi. Kapal eksternal juga dilengkapi dengan katup yang dioperasikan secara
manual untuk mengontrol laju aliran air masuk dan keluar.

• Unit unggun campuran (MB) terdiri dari bejana tekan berlapis karet baja ringan. Secara eksternal,
unit dilengkapi dengan pipa dan katup untuk mengontrol aliran air selama layanan.

• Filter karbon aktif (ACF) digunakan untuk menghilangkan klorin dan bahan organik dari air.
Biasanya, ACF ditempatkan di hilir filter multi-grade dan perlu dicuci kembali secara teratur dengan
pembalikan aliran untuk menjaga permukaan partikel karbon tetap bersih.

Setelah air diolah, kemudian disimpan dalam tangki yang disebut tangki penyimpanan air DM (DMST).
Air dipompa dari DMST ke boiler melalui pompa transfer DM. Bahan kimia seperti HCl dan soda kaustik
digunakan untuk regenerasi resin di penukar SAC, SBA dan MB. Morfolin digunakan untuk penskalaan
pH Air DM. Air kondensat juga dikirim melalui MB exchanger untuk pengolahan air. Sangat penting untuk
menjaga pH air saluran keluar DM dalam kisaran 8,5–9,2 untuk kesehatan tabung air

Gambar 1 Diagram alir proses dari proses instalasi DM

13
OPSEARCH

dan mesin kertas. Diketahui bahwa variasi pH air DM signifikan sehingga menjaga pH air boiler merupakan
tugas penting bagi perusahaan. Satu set variabel penyebab yang mempengaruhi kualitas air boiler ditemukan
dengan bantuan ahli proses dan beberapa analisis data awal, yang akan dibahas di Bagian. 4 . Oleh karena itu
kami mengusulkan model regresi hibrida untuk prediksi kualitas air untuk membantu perusahaan manufaktur
kertas dalam proses peningkatan kualitasnya.

3 Perumusan model hybrid

Kami pertama kali membahas secara singkat tentang model tunggal yang akan digunakan dalam hibridisasi di bagian ini.

Selanjutnya kami menjelaskan metodologi hybrid yang diusulkan.

3.1 Pohon regresi

Regression Trees atau RT, singkatnya, dirancang untuk variabel dependen yang mengambil sejumlah nilai tak
berurutan, dengan kesalahan prediksi biasanya diukur dengan selisih kuadrat antara nilai yang diamati dan
diprediksi [ 16 ]. Dengan mempartisi ruang data secara rekursif dan menyesuaikan model prediksi dalam setiap
partisi, seseorang dapat membangun partisi seperti pohon hierarki dari ruang masukan [ 6 ]. Secara khusus,
ruang masukan dibagi menjadi wilayah lokal yang diidentifikasi dalam urutan pemisahan rekursif. Pohon terdiri
dari simpul keputusan internal dan daun terminal. Dengan adanya titik data uji, urutan pengujian di sepanjang
simpul keputusan mulai dari simpul akar akan menentukan jalur di sepanjang pohon hingga mencapai simpul
terminal. Pada node terminal, prediksi dibuat sesuai dengan model lokal yang terkait dengan node tersebut.
Untuk membangun pohon menggunakan set pelatihan, kita mulai dari simpul akar. Kami memilih variabel (dan
ambang batasnya) yang pemisahannya akan menghasilkan pengurangan terbesar dalam mean squared error
(MSE). Kami melanjutkan pemisahan ini secara rekursif, hingga MSE mencapai ambang batas yang dapat
diterima. Praktik tipikal adalah melakukan semacam pemangkasan untuk pohon, setelah dirancang.

3.2 Mendukung regresi vektor

Mendukung regresi vektor [ 19 ] adalah hasil dari teori pembelajaran statistik, ditemukan oleh Vapnik [ 12 ]. Sebagai
ilustrasi, pertimbangkan model linier yang prediksinya diberikan oleh
f (x) = w T x + b, dimana w adalah vektor bobot, b adalah bias dan x adalah fitur masukan
vektor. Misalkan kita diberikan satu set pelatihan ( x saya, y saya), i = 1, 2, …, n, maka fungsi kesalahan diberikan oleh

1 ∑n | y - f (x i) | .
J = || w || 2 + c saya
2
i=1

Istilah pertama dalam fungsi kesalahan adalah istilah yang menghukum kompleks model-

| yity.
sayaIstilah
- f (x i) | =kedua adalah
maks { 0, | y saya - fungsi
f (x i) | -}. kerugian -insensitif,
Itu tidak menghukum dapat dididefinisikan
kesalahan sebagai
bawah, memungkinkan

13
OPSEARCH

parameter untuk memvariasikan dan mengurangi kompleksitas model. Solusi yang meminimalkan
fungsi kesalahan dapat diberikan oleh ∑

f (x) = ( ∗ - saya) x T x + b
saya saya
i=1

dimana ∗ dan saya adalah pengganda Lagrange. Vektor pelatihan yang memberikan pengali Lagrange bukan nol
saya
disebut vektor dukungan, merupakan konsep kunci dalam teori SVR.
Vektor non-pendukung tidak berkontribusi langsung ke solusi, dan jumlah vektor dukungan
adalah ukuran kompleksitas model [ 11 ]. Model ini dapat diperluas ke kasus nonlinier melalui
konsep kernel K, memberikan solusi seperti ini:

∑n
f (x) = ( ∗ - saya) K (x T x) + b.
saya saya
i=1

Fungsi kernel yang sangat umum digunakan adalah kernel Gaussian.

3.3 Usulan model RT ‑ SVR hibrida

Kami mencoba membangun model hybrid yang dapat memanfaatkan sisi positif dari RT dan SVR dan mengatasi
kekurangannya. Dalam pekerjaan kami sebelumnya, kami mengusulkan teknik baru untuk model hibridisasi berdasarkan
pohon keputusan (DT) dan JST dan juga membuktikan konsistensi teoretisnya untuk tugas klasifikasi dan regresi [ 7 - 9 ]. Tetapi
dalam masalah prediksi kualitas air saat ini, kami memiliki kumpulan data yang sangat terbatas. Dengan demikian, terdapat
risiko overfitting yang tinggi jika seseorang menggunakan model JST. Jadi, alih-alih JST, kami mengusulkan untuk
menggunakan model SVR serbaguna dalam kerangka hibridisasi. Oleh karena itu, kami mengusulkan model hibrid
berdasarkan RT dan SVR menggunakan gagasan hibridisasi yang diusulkan dalam penelitian kami sebelumnya. Rumusan
model RT-SVR hybrid yang diusulkan adalah sebagai berikut.

Kami pertama kali membagi ruang fitur menjadi beberapa area dengan algoritma RT. Sebagian besar fitur
penting dipilih menggunakan RT dan fitur redundan dihilangkan. Selanjutnya dibangun model SVR dengan
menggunakan variabel-variabel penting yang diperoleh melalui algoritma RT beserta hasil prediksi yang dibuat
dengan metode RT yang digunakan sebagai informasi masukan lain pada ruang vektor masukan SVR.
Dimasukkannya keluaran RT sebagai fitur masukan meningkatkan dimensi fitur ruang dan juga akan
meningkatkan keterpisahan kelas [ 7 ]. Kekokohan model RT-SVR hybrid yang diusulkan terletak pada pemilihan
fitur-fitur penting dan menggunakan keluaran regresi model RT dalam model SVR. Alur kerja informal dari model
RT-SVR hybrid yang diusulkan, juga ditunjukkan pada Gambar. 2 , adalah sebagai berikut.

• Pertama, kami menerapkan algoritme pohon regresi untuk melatih dan membangun model pohon keputusan yang
menghitung fitur-fitur penting.
• Hasil prediksi algoritma RT digunakan sebagai fitur tambahan pada ruang fitur masukan
model SVR.

13
OPSEARCH

Gambar 2 Diagram alir model RT-SVR


hybrid yang diusulkan

• Kami menggunakan variabel masukan penting yang diperoleh dari RT bersama dengan variabel masukan tambahan

(keluaran RT) untuk mengembangkan model SVR yang sesuai.


• Untuk masalah regresi nonlinier, jalankan algoritma SVR dengan fungsi kernel gaussian dan
catat keluaran regresi.

Algoritma ini merupakan pendekatan pipeline dua langkah seperti pemilihan fitur menggunakan RT dan kemudian
menggunakan semua keluaran dari algoritma RT untuk dianalisis lebih lanjut menggunakan SVR untuk mendapatkan hasil
yang lebih baik dari segi performanya. Model yang kami usulkan dapat digunakan untuk mengidentifikasi fitur-fitur penting
yang akan memenuhi tujuan tertentu untuk memecahkan masalah kualitas air dan juga dapat digunakan untuk meramalkan
pH keluaran boiler dalam hal parameter proses penyebab yang penting. Meskipun model ini terutama dikembangkan untuk
memecahkan masalah kualitas air, tetapi juga dapat digunakan dalam masalah regresi kompleks lainnya.

4 Analisis eksperimental

4.1 Deskripsi data

Beberapa sesi brainstorming dilakukan dengan para ahli proses untuk mengidentifikasi parameter
penyebab yang menyebabkan variasi pH outlet air DM. Karena tidak semua parameter dapat
dikontrol oleh pengguna proses, daftar parameter yang dapat dikontrol disiapkan dan data
dikumpulkan untuk proses DMST-1 dan DMST-2 (juga lihat Gambar. 1 ). Kumpulan data yang
dikumpulkan dari proses selama satu tahun terdiri dari pengamatan dari variabel penyebab berikut:
Arus Masuk, Tekanan Air (tekanan masuk air ke penukar), Tekanan Udara, stroke MB dan

13
OPSEARCH

Tabel 1 Contoh kumpulan data untuk DMST-1 Sl. tidak.

Aliran masuk Tekanan air Tekanan udara MB stroke Jumlah Air DM


bahan kimia outlet pH

1 1980 5.8 5.0 70 9.96 9.276

2 2150 7.0 7.0 60 8.69 9.094

3 1780 6.0 5.0 45 7.73 8.594

4 2808 5.2 6.4 50 6.54 8.738

5 1590 6.2 5.7 40 5.56 8.592

6 2995 6.0 6.0 50 7.23 9.099

⋮ ⋮⋮ ⋮ ⋮⋮ ⋮

Meja 2 Contoh kumpulan data untuk DMST-2 Sl. tidak.

Aliran masuk Tekanan air Tekanan udara MB stroke Jumlah Air DM


bahan kimia outlet pH

1 1489 5.4 6.0 80 10.04 9.246

2 1139 5.8 5.0 65 10.66 9.033

3 1448 5.4 5.0 45 7.69 8.483

4 1703 6.2 5.8 40 7.54 8.594

5 1258 6.2 5.7 35 5.99 7.589

6 1139 6.0 5.2 50 6.97 9.021

⋮ ⋮⋮ ⋮ ⋮ ⋮ ⋮

Jumlah Dosis Morfolin / Kimia (Liter per jam). Nilai variabel respon (pH air DM) bervariasi antara 7 dan 10 (lihat
Gambar. 3 untuk ringkasan grafis). Contoh kumpulan data untuk DMST-1 dan DMST-2 diberikan dalam Tabel 1 dan
2 . Kumpulan data ini akan digunakan untuk pembuatan model lebih lanjut yang dapat membantu perusahaan
meramalkan tingkat pH air di masa mendatang dan mengambil tindakan yang diperlukan untuk mengurangi
variasi pH air.

4.2 Performa metrik

Metrik pemilihan model yang digunakan dalam penelitian ini adalah root mean square error (RMSE),
berarti absolu te persentase kesalahan (MAPE), koefisien determinasi berganda ( R 2)
dan disesuaikan R 2 ( AdjR 2):
1∑n ∑ n ] - sayay saya ̂
RMSE = ∑n (y-
i = 1 saya
̂ ŷ i);
2
MAPE = 1 i=1 ŷ y saya
[n ;
n - 1);
ŷ i);
2
AdjR 2 = 1 - ( 1 - R 2) (
R=1-
2 i = 1 saya
∑ nn(( yy saya
- ̂ - y) 2
i=1
n-p-1

dimana, y saya, y, ̂ ŷ saya menunjukkan nilai sebenarnya, nilai rata-rata dan nilai prediksi dari

variabel dependen, masing-masing untuk saya instan. Sini n dan p menunjukkan nomor-
ber poin data dan jumlah variabel input yang digunakan untuk evaluasi kinerja.

13
OPSEARCH

Gambar 3 Ringkasan statistik (di atas) dan diagram kendali (di bawah) untuk pH saluran keluar air DM

4.3 Analisis hasil

Kami memulai analisis data dengan uji normalitas Anderson-Darling pada pH outlet air DM dan ini
menegaskan bahwa variabel dependen tidak mengikuti distribusi normal (lihat Gambar. 3 ). Tidak
adanya normalitas pada data pH outlet air DM

13
OPSEARCH

sebenarnya menghilangkan kemungkinan penerapan metode regresi parametrik konvensional. Hal ini
membuat kita berpikir tentang pendekatan regresi nonparametrik. Stabilitas proses diperiksa menggunakan X
- R diagram kendali (lihat Gambar. 3 ). Dari
X - R Grafik, dapat dengan mudah disimpulkan bahwa pH outlet air DM memiliki variasi yang tinggi dan juga menunjukkan
adanya beberapa penyebab yang dapat ditentukan dalam proses tersebut. Kumpulan data hanya berisi fitur numerik tanpa
entri yang hilang, sehingga tidak ada tugas pembersihan data yang dilakukan.

Kami telah mengacak pengamatan kumpulan data pH air secara acak dan membaginya menjadi kumpulan
data pelatihan dan pengujian dengan rasio 70:30. Setiap eksperimen diulangi 5 kali dengan set pelatihan dan
pengujian yang ditetapkan secara acak dan kami akhirnya akan melaporkan rata-rata metrik kinerja yang
diamati selama 5 kali validasi di Tabel 3 . Model regresi nonparametrik tunggal seperti support vector regression
(SVR), Regression splines (B-splines), multiple adaptive regression spline (MARS), RT dan ANN dengan 2
hidden layer (ANN dengan 2HL) diterapkan pada kumpulan data dengan parameter default dan hasilnya
dicatat. Kemudian kami mulai bereksperimen dengan model hybrid yang diusulkan. Kami pertama kali
membangun RT menggunakan rpart implementasi dalam perangkat lunak statistik R. Kita telah menggunakan
aturan pemisahan “minplit” untuk menghentikan pohon yang menentukan jumlah minimum titik yang harus
dipertimbangkan untuk pemisahan. Dari pohon tersebut, kami mengekstrak kumpulan semua fitur yang paling
penting serta hasil prediksi dan menggunakannya untuk membangun model SVR berbasis kernel gaussian.
Kami telah menggunakan paket bawaan e1071 dalam paket statistik R untuk menyesuaikan model SVR kernel
gaussian. Kami telah menggunakan sebagian besar argumen default yang ada dalam paket ini. Waktu
pelatihan dan kebutuhan memori juga cukup rendah untuk model hybrid dibandingkan dengan model JST 2HL.
Di meja 3 , kami menyajikan hasil model regresi yang berbeda pada kumpulan data pH air dan hasil terbaik
ditampilkan dengan huruf tebal. Dari evaluasi eksperimental model regresi yang berbeda, dapat disimpulkan
bahwa model hybrid mengungguli model statistik dan pembelajaran mesin lainnya dengan margin yang
signifikan. Model hibrid yang diusulkan akan berguna untuk meramalkan nilai pH air di masa mendatang
berdasarkan nilai dari

Tabel 3 Pengukuran kuantitatif kinerja


Model regresi Himpunan data RMSE MAPE R2 Adj R 2
untuk model regresi yang berbeda pada
kumpulan data pengujian (nilai rata-rata
Kernel SVR DMST 1 4.06 4.50 75.66 70.29
metrik setelah validasi silang 5 kali lipat)
DMST 2 4.18 5.20 72.70 67.25

B-splines DMST 1 4.32 5.40 69.85 63.30

DMST 2 6.94 7.21 56.70 49.78

MARS DMST 1 4.29 5.26 65.95 58.90

DMST 2 6.74 7.93 57.53 47.05

RT DMST 1 3.44 4.12 80.52 75,56

DMST 2 3.89 4.78 76.56 71.23

ANN (dengan 2HL) DMST 1 3.86 4.80 76.95 70.03

DMST 2 4.12 5.91 70.10 64.73

Hibrida yang diusulkan DMST 1 3.05 3.40 85.40 82.50


Model RT-SVR DMST 2 3.20 3.75 83.50 80.00

13
OPSEARCH

Tabel 4 Rentang optimal variabel penyebab untuk mencapai tingkat pH yang diinginkan

Proses Rentang air Rentang untuk MB Rentang bahan kimia Rentang yang diharapkan untuk
tekanan stroke konsumsi Saluran keluar air DM
pH

DMST 1 5.0–6.0 45–55 6.5–7.5 8.5–9.1

DMST 2 5.0–6.0 40–50 7.5–8.5 8.5–9.2

variabel proses. Model ini juga akan membantu manajemen dan teknisi untuk mengambil tindakan
pencegahan lebih lanjut.
Namun, karena tujuan pekerjaan kami tidak hanya untuk mengembangkan model prediksi kompetitif untuk
tingkat pH air dalam proses DM tetapi juga untuk mengetahui tingkat parameter proses yang optimal (dengan
kata lain, variabel penyebab) menggunakan model. Untuk menjaga pH air DM dalam kisaran 8,5–9,2 seperti
yang ditentukan oleh manual boiler, rekomendasi model kami adalah untuk mempertahankan stroke MB,
tekanan air dan konsumsi bahan kimia dalam kisaran tertentu seperti yang ditunjukkan pada Tabel 4 . Aliran
masuk tidak dapat dikontrol oleh pengguna proses dan tekanan udara tidak perlu dikontrol sejauh rekomendasi
model yang diusulkan berjalan. Meja 4 memberikan kisaran optimum parameter terkontrol untuk DMST 1 dan
DMST 2 berdasarkan rekomendasi analisis regresi yang dilakukan oleh model hybrid optimal.

Meja 4 menggambarkan kisaran untuk semua variabel proses penting yang diharapkan pH saluran
keluar air DM akan berada dalam spesifikasi yang diperlukan, yaitu 8,5-9,2. Namun, untuk mengetahui nilai
pasti dari parameter proses dalam rentang yang ditentukan dalam Tabel 4 , desain eksperimen akan
diperlukan, yang selanjutnya dilakukan untuk menyelesaikan masalah. Meskipun kami hanya membahas
model yang diusulkan dan tingkat akurasinya, model kami juga membantu industri proses manufaktur untuk
meningkatkan tingkat kualitas air dan mendapatkan keuntungan moneter karena pengurangan konsumsi
bahan kimia.

5 Kata penutup

Makalah ini mengusulkan paradigma pembelajaran mesin hybrid untuk memecahkan masalah ramalan
kualitas air dalam industri manufaktur kertas. Tujuan dari artikel ini adalah untuk mengembangkan model untuk
memprediksi tingkat pH air dalam proses DM untuk industri pembuatan kertas. Kami mengusulkan model
hybrid berdasarkan RT dan SVR dan mendemonstrasikan kinerjanya pada masalah praktis prediksi kualitas air
dalam proses DM. Keuntungan utama model ini adalah kemudahan penafsirannya dibandingkan dengan
banyak model pembelajaran mesin "seperti kotak hitam". Model ini juga akan memiliki keunggulan saat bekerja
dengan kumpulan data terbatas di mana manfaat jaringan saraf lanjutan biasanya tidak dapat dieksploitasi,
tetapi dengan bias induktif spesifik dari pendekatan RT-SVR hibrid ini, hal itu menjadi mungkin. Makalah ini
mendemonstrasikan kekuatan metodologi hibrida pada masalah prediksi kualitas air. Pekerjaan masa depan
segera dari makalah ini adalah untuk memperluas pendekatan model yang diusulkan untuk masalah
klasifikasi.

13
OPSEARCH

Ucapan Terima Kasih Penulis berterima kasih kepada editor dan pengulas terkait atas komentar konstruktif mereka.

Referensi

1. Antanasijević, D., Pocajt, V., Perić-Grujić, A., Ristić, M .: Pemecahan multilevel dari data kualitas air dimensi tinggi
menggunakan jaringan saraf tiruan untuk prediksi oksigen terlarut di sungai Danube. Dalam: Komputasi dan Aplikasi
Neural, hlm. 1–10 (2019)
2. Avila, R., Horn, B., Moriarty, E., Hodson, R., Moltchanova, E .: Mengevaluasi kinerja model statistik dalam prediksi kualitas
air. J. Lingkungan. Manag. 206, 910–919 (2018)
3. Batchelder, GW: Proses demineralisasi air. Paten AS 3.171.799 (1965)
4. Bennett, KP, Blue, J .: Pendekatan mesin vektor dukungan untuk pohon keputusan. Dalam: Konferensi Bersama Internasional
IEEE 1998 tentang Prosiding Jaringan Saraf. Kongres Dunia IEEE tentang Kecerdasan Komputasi (Kat. No. 98CH36227), vol. 3,
hlm. 2396–2401. IEEE (1998)
5. Bhattacharya, B., Solomatine, DP: Jaringan saraf dan pohon model m5 dalam pemodelan hubungan level-debit air.
Neurocomputing 63, 381–396 (2005)
6. Breiman, L .: Pohon Klasifikasi dan Regresi. Routledge, London (2017)
7. Chakraborty, T., Chakraborty, AK, Chattopadhyay, S .: Sebuah model regresi hybrid bebas distribusi baru untuk peningkatan
efisiensi proses manufaktur. J. Comput. Appl. Matematika. (2019) ( Untuk
muncul)
8. Chakraborty, T., Chakraborty, AK, Murthy, C .: Pengklasifikasi biner ansambel nonparametrik dan properti statistiknya. Stat.
Probab. Lett. 149, 16–23 (2019)
9. Chakraborty, T., Chattopadhyay, S., Chakraborty, AK: Hibridisasi baru pohon klasifikasi dan jaringan saraf tiruan
untuk seleksi siswa di sekolah bisnis. Opsearch 55 ( 2), 434-446 (2018)

10. Chang, F., Liu, CC: Pohon keputusan sebagai akselerator untuk mesin vektor pendukung. Dalam: Ding, X. (ed.) Maju dalam
Pengenalan Karakter. IntechOpen, Rijeka (2012)
11. Cherkassky, V., Ma, Y .: Pemilihan praktis parameter SVM dan estimasi noise untuk regresi SVM. Jaringan Neural. 17
( 1), 113–126 (2004)
12. Cortes, C., Vapnik, V .: Jaringan pendukung-vektor. Mach. Belajar. 20 ( 3), 273-297 (1995)
13. Gmar, S., Helali, N., Boubakri, A., Sayadi, IBS, Tlili, M., Amor, MB: Electrodialytic desalina- tion air payau: penentuan
parameter eksperimental yang optimal menggunakan desain faktorial lengkap. Appl. Sci air. 7 ( 8), 4563–4572 (2017)

14. Kumar, MA, Gopal, M .: Pohon keputusan berbasis svm hibrida. Pengenalan Pola. 43 ( 12), 3977–3987 (2010)

15. Lhassani, A., Rumeau, M., Benjelloun, D., Pontie, M .: Demineralisasi selektif air dengan aplikasi nano-filtrasi
untuk defluorinasi air payau. Res air. 35 ( 13), 3260–3264 (2001) Loh, WY: Pohon klasifikasi dan regresi. Wiley
16. Interdiscip. Rev. Data Min. Knowl. Discov.
1 ( 1), 14-23 (2011)
17. Mahuli, S., Rhinehart, R., Riggs, J .: ph kontrol menggunakan teknik statistik untuk adaptasi model on-line terus menerus.
Comput. Chem. Eng. 17 ( 4), 309–317 (1993)
18. Ouyang, Y., Nkedi-Kizza, P., Wu, Q., Shinde, D., Huang, C .: Penilaian variasi musiman dalam kualitas air permukaan.
Res air. 40 ( 20), 3800–3810 (2006)
19. Schölkopf, B., Smola, AJ, Bach, F., dkk .: Belajar dengan Kernel: Mendukung Mesin Vektor, Regularisasi, Optimasi, dan
Selebihnya. MIT Press, Cambridge (2002)
20. Singh, KP, Basant, A., Malik, A., Jain, G .: Pemodelan jaringan saraf tiruan kualitas air sungai — studi kasus. Ecol.
Model. 220 ( 6), 888–895 (2009)
21. Sugumaran, V., Muralidharan, V., Ramachandran, K .: Pemilihan fitur menggunakan pohon keputusan dan klasifikasi melalui
mesin vektor pendukung proksimal untuk diagnosis kesalahan bantalan rol. Mech. Syst. Proses Sinyal. 21 ( 2), 930–942 (2007)

22. Vedelago, R., Millar, GJ: Evaluasi proses opsi pengolahan untuk air terkait lapisan batubara alkalinitas tinggi. J.
Proses Air Eng. 23, 195–206 (2018)
23. Wang, X., Zhou, Y., Zhao, Z., Wang, L., Xu, J., Yu, J .: Pemodelan mekanisme kualitas air yang baru dan metode
penilaian risiko eutrofikasi danau dan waduk. Nonlinear Dyn 96 ( 2), 1037– 1053 (2019). https://doi.org/10.1007/s11071-019-04837-6

13
OPSEARCH

24. Zhang, J .: Hc-dt / svm: pohon keputusan hibrida yang digabungkan erat dan algoritma mesin vektor pendukung dengan aplikasi untuk
deteksi perubahan tutupan lahan. Dalam: Prosiding Lokakarya Internasional ACM SIGSPATIAL 1 tentang Penambangan Data untuk
Geoinformatika, hlm. 9-18. ACM (2010)
25. Zhang, J., Li, Y., Zeng, X., Huang, G., Li, Y., Zhu, Y., Kong, F., Xi, M., Liu, J .: Perencanaan perdagangan limbah dan
penerapannya dalam pengelolaan kualitas air: perspektif interaksi faktor. Mengepung. Res. 168, 286–305 (2019)

Catatan Penerbit Springer Nature tetap netral sehubungan dengan klaim yurisdiksi dalam peta yang diterbitkan dan afiliasi
kelembagaan.

13

Anda mungkin juga menyukai