Anda di halaman 1dari 11

RANCANG BANGUN ALAT MONITORING &

KLASIFIKASI KUALITAS AIR SUNGAI


BERBASIS IoT
Andi Muhammad Rezky Akbar 1, Ahmad Fauzan Muhtar 2, Rio Mandala Nuryan Putra3, IG. Prasetya Dwi Wibawa, S.T.,
M.T.4, Dr. Meta Kalista S.Si., M.T5.
1
Telkom University Bandung
Jl. Telekomunikasi. 1, Terusan Buahbatu-Bojongsoang, Telkom university, Sukapura, Kec. Dayeuhkolot, Kabupaten
Bandung, Jawa Barat 40257
e-mail: ahmfauzan1005@gmail.com
Abstrak

Kualitas air Sungai Citarum di Jawa Barat masih belum memenuhi baku mutu air sepanjang tahun, terutama pada musim
kemarau. Sungai ini masih tercemar berat akibat tingginya pencemar yang berasal dari berbagai aktivitas manusia seperti pertanian,
peternakan, perikanan, industri, dan kegiatan domestik. Selain itu, sungai ini juga menjadi tempat pembuangan sampah rumah tangga,
meningkatkan risiko masukan bahan pencemar yang mempengaruhi kualitas air. Kondisi tersebut diindikasikan oleh kekeruhan fisik
sungai dan adanya pabrik limbah industri, pembuangan tinja perumahan, serta banyaknya sampah di aliran sungai. Monitoring kualitas
air telah dilakukan dengan menggunakan beberapa sensor, namun belum mencakup semua parameter standar Indonesia, seperti
kekeruhan, bau, pH, zat padat terlarut, dan suhu. Fokus utama dalam penelitian ini membahas tentang pemetaan kualitas air yang
kualitas air di beberapa titik aliran sungai citarum menggunakan metode k-Nearest Neighbour (KNN). Parameter yang digunakan
sebagai masukan dalam pembelajaran KNN seperti kekeruhan, pH, zat padat terlarut, dan suhu, diperoleh dengan instalasi sensor di
beberapa titik di sepanjang aliran sungai citarum dan komunikasi jarak jauh menggunakan IoT. Dataset untuk pelatihan model
pembelajaran KNN diperoleh dengan mengumpulkan beberapa sampel air dan telah melakukan pengukuran dengan alat ukur standar
untuk selanjutnya dilakukan proses kalibrasi dengan sensor yang digunakan. Hasil dari model pembelajaran KNN menunjukkan akurasi
sebesar 85%, dengan jumlah tetangga terdekat di k = 9 menggunakan 330 dataset. Hasil pengujian di beberapa titik sungai citarum
dalam beberapa kali percobaan menunjukkan variasi indeks kualitas aliran air sungai Citarum. Dari dua titik yang dipasang antara
hulu dan hilir terdapat dua hasil yang berbeda diantaranya hasil untuk hulu menunjukkan bahwa kualitas air yang berada di aliran
sungai daerah tersebut masih memenuhi IKA sedangkan untuk daerah hilir yang telah ditempati oleh penduduk disekitar DAS
mendapatkan hasil tercemar ringan. Kedua data tersebut dapat dilihat secara real time dengan menggunakan Internet of Thingking yang
berada di perangkat keras yang berada di titik yang telah di tentukan.

Kata kunci: monitoring kualitas air sungai, kNN, Iot, DAS, citarum

Abstract

The water quality of Citarum River in West Java, Indonesia does not meet the water quality standards throughout the year, especially
during the dry season. The river remains heavily polluted due to high levels of contaminants from various human activities such as agriculture,
livestock farming, fisheries, industries, and domestic activities. Additionally, the river is also used as a dumping ground for household waste,
further increasing the risk of pollutant input that affects water quality. These conditions are indicated by the physical turbidity of the river,
presence of industrial waste factories, residential sewage discharge, and the abundance of trash in the river stream. Water quality monitoring
has been conducted using several sensors, but it does not cover all the standard parameters set by Indonesia, such as turbidity, odor, pH, total
dissolved solids, and temperature. The main focus of this research is to discuss water quality mapping at several points along the Citarum
River using the k-Nearest Neighbour (KNN) method. The parameters used as inputs for KNN learning, such as turbidity, pH, total dissolved
solids, and temperature, are obtained through sensor installations at various points along the Citarum River and remote communication using
IoT. The dataset for training the KNN learning model is obtained by collecting several water samples and conducting measurements with
standard measuring instruments, followed by calibration with the sensors used. The results of the KNN learning model show an accuracy of
85% with the nearest neighbor count set at k = 9 using 330 datasets. The testing results at various points along the Citarum River in multiple
experiments show variations in the water quality index of the Citarum River flow. Two points installed between the upstream and downstream
sections show different results. The result for the upstream point indicates that the water quality in that area still meets the standards, while
the downstream area, which is occupied by the surrounding watershed population, shows a result of mild pollution. Both data can be viewed
in real-time using Internet of Things devices located at the designated points.waterproof and weather-resistant ABS material, reinforced with
iron poles or utilizing an RC boat for long-term stability and protection. Human operators will control the device using a remote control.

Keywords: river water quality monitoring, k-Nearest Neighbour (kNN), Internet of Things (IoT), watershed, Citarum
I. PENDAHULUAN melalui beberapa peraturan yang mencakup berbagai jenis
air limbah, termasuk air limbah domestik, air laut, air
Air merupakan kebutuhan yang paling penting bagi limbah tambang, dan air limbah industri. Peraturan ini
makhluk hidup khususnya manusia itu sendiri, salah satu menetapkan parameter-parameter kualitas air yang harus
sumber air tersebut adalah air sungai yang mengalir di dipenuhi untuk melindungi lingkungan dan kesehatan
sekitar kehidupan manusia. Sumber air tersebut tidak luput manusia. Beberapa studi telah dilakukan dalam monitoring
dari zat zat pengotor yang mencemari air tersebut [1]. kualitas air, seperti penelitian yang dilakukan oleh Ahmad
pengotor tersebut terbagi menjadi dua yaitu pengotor yang Sabiq, dkk. tentang Sistem Pemantauan Kadar pH, Suhu,
diatur maupun pengotor yang tidak diatur. Perbedaan antara dan Warna pada Air Sungai Melalui Jaringan Sensor
pengotor yang diatur dan tidak diatur terletak pada tingkat Nirkabel Berbasis Web [7]. Selain itu, Vennam
kontrol yang diberikan oleh pemerintah atau otoritas yang Madhavireddy, dkk melakukan monitoring kualitas air
berwenang. Pengotor yang diatur tunduk pada peraturan berbasis Internet of Things (IoT) dengan menggunakan
yang ketat untuk menjaga kualitas air, sementara pengotor modul Wi-Fi ESP8266 dalam penelitian berjudul Sistem
yang tidak diatur mungkin kurang terkontrol dan memiliki Pemantauan Kualitas Air Cerdas Menggunakan Teknologi
risiko yang kurang dipahami. Beberapa bahan yang tidak IoT [8]. Menurut Mohammad haikal penelitian di Sungai
berbahaya, seperti kekerasan dan kation/anion utama, sering Ciliwung, sungai terbesar di Jakarta, mengalami penurunan
kali dianggap sebagai nilai rata-rata untuk wilayah yang kualitas air. Pemantauan real-time dengan ONLIMO
luas. Contoh dari pengotor yang diatur seperti limbah menggunakan multiprobes sensor dilakukan di sungai ini
industri dari pabrik yang membuang limbah kimia, logam selama satu tahun (1 Januari - 31 Desember 2018) untuk
berat, dan limbah organik. Ada juga limbah rumah tangga memprediksi kualitas air. Hasilnya menunjukkan bahwa
seperti air cucian, dan limbah dari toilet. Pongotor yang model Jaringan Syaraf Tiruan (JST) dengan 5 Hidden Layer
tidak diatur merupakan sampah plastik, logam, kertas dan memiliki performa tertinggi dalam Confusion Matrix
bahan padat lainnya yang tidak terkelola baik dan berakhir (Akurasi, Recall, Presisi, Spesifikitas, dan F1 Score). Selain
di perairan dan mencemarinya [2]. kurangnya penelitian itu, Random Forest juga memiliki performa tinggi, diikuti
tentang distribusi rinci dari bahan-bahan ini menyebabkan oleh JST dengan 5 Hidden Layer, Naive Bayes, dan SVM.
keterbatasan pengetahuan tentang dampak dan Akurasi ketiga metode pertama tersebut mencapai lebih dari
persebarannya secara detail. laporan yang diterbitkan oleh 89%, menunjukkan keefektifan mereka dalam memprediksi
Organisasi Kesehatan Dunia (WHO), sekitar 1,8 miliar kualitas air Sungai Ciliwung[9]. Menurut penelitian
orang bergantung pada sumber air yang terkontaminasi. hardiana said dkk. Kualitas air yang aman untuk dikonsumsi
Polusi air saat ini merupakan ancaman ekologis yang paling sangat penting bagi kesehatan masyarakat, namun kualitas
serius di dunia [3]. Setiap negara memiliki memiliki indeks air semakin menurun di berbagai daerah, dapat
kualitas air yang berbeda dengan parameter dan metode menyebabkan penyakit serius. Penelitian ini menggunakan
penilaian yang berbeda. Jepang memakain Indeks Kualitas algoritma K-Nearest Neighbor untuk memprediksi kualitas
Air (Water Quality Index, WQI), WQI adalah indeks yang air berdasarkan data lingkungan. Dengan tingkat akurasi
digunakan untuk mengevaluasi kualitas air permukaan di tertinggi 85,52% pada k = 3[10]. Menurut dwi hartanti dkk.
berbagai lokasi. Indeks ini dikembangkan oleh Kementerian Air memiliki peran sangat penting dalam kehidupan
Lingkungan Hidup Jepang dan mempertimbangkan manusia karena menjadi sumber kehidupan dan sekitar 71%
parameter fisik dan kimia seperti oksigen terlarut, permukaan bumi adalah air. Setiap individu memiliki hak
kekeruhan, pH, nitrat, fosfat, bahan organik terlarut, logam fundamental untuk akses air bersih, yang menjadi landasan
berat, dan bahan organik total [4]. Indeks Kualitas Air bagi terwujudnya kehidupan yang layak dan bermartabat.
Kanada (Canadian Water Quality Index) juga Dalam dunia penambangan data, salah satu teknik yang
mempertimbangkan beberapa parameter fisik dan kimia digunakan adalah klasifikasi. Penelitian ini menggunakan
dalam menilai kualitas air permukaan. Indeks Kualitas Air data kualitas air dan menerapkan empat metode algoritma,
Kanada melibatkan parameter seperti oksigen terlarut, pH, yakni Pohon Keputusan, Regresi Logistik, SVM, dan ANN.
bahan organik terlarut, nitrat, fosfat, logam berat, dan Tujuannya adalah membandingkan metode mana yang
kehadiran mikroorganisme patogen. Mirip dengan Indeks memberikan tingkat akurasi maksimum dalam
Kualitas Air Jepang [5]. Indeks kualitas air di India hamper mengklasifikasikan kualitas air. Hasil akurasi yang
sama dengan indeks kualitas air di jepang. Indeks Kualitas diperoleh adalah sebagai berikut: metode Pohon Keputusan
Air (Water Quality Index, WQI) yang digunakan di Jepang sekitar 60,19%, metode Regresi Logistik sekitar 62,80%,
dan India memiliki perbedaan dalam parameter yang dinilai, metode SVM sekitar 68,59%, dan metode ANN sekitar
skala penilaian, dan pendekatan pengembangannya. Indeks 69,54%[11].
Kualitas Air Jepang mempertimbangkan parameter seperti
oksigen terlarut, kekeruhan, pH, nitrat, fosfat, logam berat, Pada penelitian ini kami menggunakan meotde k-NN .K-
dan bahan organik, sementara Indeks Kualitas Air India juga Nearest Neighbor merupakan salah satu algoritma yang
melibatkan parameter seperti pestisida dan kehadiran paling sederhana yang digunakan dalam machine learning
mikroorganisme patogen. Skala penilaian juga dapat untuk regresi dan klasifikasi [12]. Penelitian yang
berbeda antara kedua indeks tersebut. Kedua indeks menggunakan metode K-Nearest Neighbors (KNN) dapat
dikembangkan oleh lembaga lingkungan masing-masing mencakup berbagai bidang dan topik tergantung pada
negara dan mencerminkan kondisi dan kebutuhan konteksnya. Fitur-fitur seperti titik nyala, titik leleh,
lingkungan setempat [6]. Di Indonesia, standar kualitas air viskositas, dan kandungan air dalam minyak dapat
diatur oleh Kementerian Lingkungan Hidup dan Kehutanan digunakan sebagai input dalam KNN. KNN akan mencari
Penulis 1 dkk.: JUDUL NASKAH 3

tetangga terdekat untuk menentukan kualitas minyak, Setelah sampel air tiba di Tandon, sensor-sensor ini
seperti "baik", "memadai", atau "rusak". Penggunaan kNN bekerja dengan cermat untuk mengumpulkan data yang
yang mudah seperti alokasi memori yang tidak besar untuk akurat dan relevan dari sampel air tersebut. Data yang
menyimpan model pembelajaran, waktu pembelajaran dan terkumpul, seperti tingkat keasaman (pH), suhu air,
pengklasifikasian yang efisien, implementasi system yang kandungan padatan terlarut total (TDS), dan tingkat
sangat mudah di ubah ke dalam bahasa C dan terakhir kekeruhan, kemudian akan diolah dan dianalisis oleh
kecepatan komputasi relative cepat dalam melakukan algoritma klasifikasi yang menggunakan metode k-NN (k-
prediksi atau klasifikasi menjadikan penggunaan metode Nearest Neighbors). Metode ini digunakan untuk
kNN cocok dalam pembelajaran mesin di system pada mengklasifikasikan sampel air ke dalam salah satu dari
makalah ini [13]. K-Nearest Neighbors (KNN) adalah empat kategori, yaitu tercemar berat, tercemar sedang,
metode dalam pembelajaran mesin yang digunakan untuk tercemar ringan, atau memenuhi standar kualitas air.
klasifikasi dan regresi, Salah satu varian dari algoritma
KNN adalah penggunaan bobot fitur ( feature weight), yang Setelah data sampel air berhasil terklasifikasi, informasi
dapat memberikan tingkat pentingnya masing-masing fitur tersebut akan diunggah melalui jaringan Internet of Things
dalam menghitung jarak antara titik-titik data. Dalam kasus (IoT) ke platform Antarest. IoT memungkinkan alat ini
ini, bukan hanya jarak antara tetangga yang diperhitungkan, untuk terhubung secara real-time dengan jaringan,
tetapi juga bobot yang diberikan pada setiap fitur. memastikan bahwa informasi tentang kualitas air dapat
Penggunaan bobot fitur dalam KNN dapat memberikan diakses secara cepat dan efisien. Dari platform Antarest,
dampak pada bagaimana jarak dihitung antara titik-titik data akan diteruskan ke aplikasi MIT App Inventor, yang
data. Misalnya, jika suatu fitur dianggap lebih penting dirancang sebagai antarmuka yang user-friendly untuk
dalam mempengaruhi hasil, Anda dapat memberikan bobot pengguna akhir. Aplikasi ini memungkinkan pengguna
yang lebih besar pada fitur tersebut. Ini bisa membantu untuk memantau kualitas air secara real-time, menerima
algoritma KNN lebih sensitif terhadap variasi pada fitur laporan terkini, dan mengakses data historis yang relevan.
yang dianggap penting. Dalam konteks K-Nearest Dengan demikian, alat ini tidak hanya memberikan
Neighbors (KNN), telah dilakukan modifikasi yang sukses informasi penting tentang kualitas air, tetapi juga
meningkatkan akurasi, seperti Local Mean k-Nearest memungkinkan pengguna untuk mengambil tindakan yang
Neighbor (LMKNN) yang mengurangi pengaruh outlier diperlukan berdasarkan informasi yang diberikan.
dengan menggantikan sistem suara mayoritas, serta
Distance Weight K-Nearest Neighbor (DWKNN) yang
memberikan pengaruh lebih besar pada data mirip. Kedua
metode ini berhasil meningkatkan akurasi secara terpisah.
LMKNN dan DWKNN digabungkan dalam penelitian lain
untuk mengatasi kelemahan suara mayoritas dan masalah
kelas mayoritas ganda. Terdapat peluang lebih lanjut
dengan memberikan bobot pada setiap atribut (FWkNN),
berbeda dengan metode jarak yang memberikan pengaruh
sama pada setiap atribut. Penelitian lain juga menyarankan
pendekatan serupa dengan bobot yang diukur menggunakan
Gain Ratio, terbukti meningkatkan akurasi. Dalam
penelitian ini, penggabungan pendekatan pembobotan
atribut dengan local mean dilakukan untuk meningkatkan
metode KNN, yang sebelumnya telah berhasil
meningkatkan akurasi KNN konvensional. Dalam metode
"feature weight k-Nearest Neighbors" (fwkNN), bobot fitur Gambar 1. Kondisi titik sungai
dapat diterapkan dengan berbagai cara, seperti memberikan
bobot yang sama pada setiap fitur, berdasarkan jarak,
informasi, korelasi, atau informasi bersama dengan kelas II. METODE/DESAIN
target. Pendekatan juga melibatkan pengujian dan penilaian
performa model pada subset fitur, pembangunan bobot Penggunaan metode yang tepat tergantung pada
selama pembelajaran, serta teknik regulasi. Jenis parameter yang ingin diuji dan tujuan pengujian. Dalam
pembobotan ini memiliki keunggulan dan penerapan yang praktiknya, sering kali digunakan kombinasi metode
berbeda-beda, dan memilih pembobotan yang sesuai dapat fisik, kimia, dan biologi untuk mendapatkan gambaran
meningkatkan performa fwkNN dalam analisis data. yang lebih lengkap tentang kualitas air. Penting untuk
Rancang bangun alat kami dimulai dengan pengambilan mengikuti pedoman dan standar yang berlaku dalam
sampel air oleh alat yang tertanam, yang secara otomatis melakukan uji kualitas air untuk memastikan hasil yang
menggumpulkan sampel air dari lingkungan sekitarnya. akurat dan dapat diandalkan. Dalam penelitian uji
Sampel air ini kemudian dialirkan ke Tandon yang kualitas sungai air citarum sudah dilakukan penelitian
dilengkapi dengan empat sensor berkualitas tinggi, yaitu oleh beberapa intansi kampus dengan f dan cara yang
sensor pH, suhu, TDS (Total Dissolved Solids), dan berbeda beda. Studi pendahuluan yang dilakukan
turbiditas, yang mampu mengukur berbagai aspek kualitas beberapa penelitian yaitu mengambil sampel secara
air dengan akurasi tinggi. langsung di aliran sungai citarum lalu melakukan uji
sampel tersebut di laboratorium kesehatan daerah
Penulis 1 dkk.: JUDUL NASKAH 4

(Labkesda) untuk mentukan kualitas air dan pencemar dipasang dengan kondisi bermacam-macam karena tiang
dominan. sedangkan metode yang diangkat dalam akan ditanam ditanah menggunakan semen agar produk
penelitian ini Dalam konteks pengukuran kualitas air, tersebut kokoh, tahan dari longsor dan cuaca buruk.
metode machine learning menggunakan algoritma k-
Nearest Neighbors (k-NN) digunakan sebagai
pengklasifikasi untuk menentukan kualitas air
berdasarkan data yang diambil. Proses pembelajaran k-
NN dilakukan menggunakan data pelatihan yang
dikumpulkan dari pengukuran air sebelumnya. Setelah
pembelajaran, model k-NN dapat mengklasifikasikan
kualitas air secara otomatis berdasarkan data masukan
yang baru. Hasil klasifikasi tersebut langsung ditransfer
ke platform IoT, Antarest, yang memungkinkan
pembacaan data kualitas air dalam waktu nyata. Untuk
mengakses hasil pembacaan secara real-time, pengguna
dapat menggunakan aplikasi seluler yang terhubung ke Gambar 4. Skematik komponen.
Antarest. Aplikasi ini memberikan antarmuka yang
mudah digunakan untuk melihat dan memantau kualitas
air dengan cepat dan efisien. Dari permodelan perangkat keras tersebut kedua
sistem perangkat tersebut akan dilanjutkan ke sistem Iot
sehingga kedua perangkat akan saling terhubunh
memberikan informasi dari dua titik yang dilakukan
pengujian pembambilan sampel air.

B. Pelatihan model pembelajaran kNN


Klasifikasi menggunakan K-Nearest Neighbors (KNN)
adalah salah satu metode dalam machine learning yang
digunakan untuk mengklasifikasikan objek berdasarkan
atribut-atributnya dan kemiripan dengan objek-objek yang
Gambar 2. Skematik cara kerja sistem.
sudah ada dalam dataset. KNN merupakan metode
klasifikasi non-parametrik yang tidak memerlukan asumsi
tertentu tentang distribusi data.Idea dasar dari algoritma
A. Percancangan perangkat keras KNN adalah mencari K titik terdekat (neighbors) dari objek
Sistem terpilih memiliki konsep alat yang bisa monitoring yang akan diklasifikasikan berdasarkan jarak Euclidean atau
jarak jauh menggunakan IoT dengan titik daerah aliran yang metrik lainnya.
sinyal nya memadai, dan bisa mendeteksi 4 parameter yaitu
keasaman, kekeruhan, suhu dan zat padat terlarut, sistem
terpilih ini lebih kokoh dari sistem yang lain, karena
menggunakan bahan yang berkualitas tinggi dengan biaya
bahan cukup mahal, walaupun biaya cukup mahal, produk
ini bisa tahan dengan jangka panjang dan kuat dengan cuaca
yang bermacam-macam.

Gambar 5. Ilustrasi k-NN

Gambar 3. Ilustrasi pengambilan sampel air

Produk ini dapat mengukur kualitas air sungai dengan


mendeteksi kekeruhan, pH, zat padat terlarut, dan suhu
dengan menggunakan bahan kotak berbahan ABS dan
waterproof dan dilengkapi dengan tiang besi yang bisa
Penulis 1 dkk.: JUDUL NASKAH 5

Klasifikasi dilakukan dengan memeriksa mayoritas kelas kelas target. Fitur-fitur yang memiliki informasi bersama
dari tetangga-tetangga terdekat tersebut. Jika mayoritas yang lebih tinggi dengan kelas target diberi bobot lebih
tetangga termasuk dalam suatu kelas, maka objek yang akan tinggi.
diklasifikasikan juga diklasifikasikan ke dalam kelas
tersebut.

Secara umum untuk mengetahui rumus formula Euclidean


distance pada 1 – dimensional space seperti berikut.

Tetapi jika variabelnya tidak independent dan jumlah


varibel lebih dari satu maka rumus formula yang digunakan 6. Wrapper Approaches: Dalam pendekatan ini,
sebagai berikut. pembobotan fitur dinilai berdasarkan performa algoritma
pembelajaran mesin (seperti KNN) pada fitur-fitur tersebut.
Berbagai subset fitur diuji dan dinilai, dan bobot diberikan
berdasarkan hasil kinerja model.
7. Embedded Approaches: Pendekatan ini membangun
bobot fitur sebagai bagian dari proses pembelajaran
algoritma itu sendiri. Misalnya, algoritma KNN dapat
Kelebihan dari KNN adalah kemampuannya dalam diterapkan dengan mempertimbangkan bobot fitur yang
menangani data non-linear dan kemampuan adaptasinya dihasilkan selama iterasi pembelajaran.
terhadap perubahan pada dataset. Namun, KNN juga 8. Regularization: Pendekatan ini melibatkan
memiliki beberapa kelemahan, seperti ketergantungan penggunaan teknik regulasi untuk mengendalikan bobot
terhadap skala atribut, sensitivitas terhadap data yang tidak fitur, mencegah nilai-nilai bobot yang ekstrem.
relevan, dan biaya komputasi yang tinggi pada dataset Setiap jenis pembobotan ini memiliki pendekatan dan
besar.Dalam prakteknya, KNN digunakan dalam berbagai manfaatnya sendiri tergantung pada karakteristik dataset dan
aplikasi seperti klasifikasi data, pengenalan pola, tujuan analisis. Pilihan pembobotan yang tepat dapat
rekomendasi, dan sistem pengenalan suara. Penting untuk berkontribusi pada peningkatan performa fwkNN dalam
melakukan pemilihan nilai K yang optimal, normalisasi data, memproses data.
dan validasi model untuk mendapatkan hasil yang akurat dan
baik dalam klasifikasi menggunakan KNN. C. Integrasi perangkat dengan IoT
.Perbedaan dalam penggunaan FWkNN ada beberapa
bobot yang harus dipertimbangkan dalam melakukan setiap Dalam sistem ini, terjadi integrasi antara perangkat keras
metode klasifikasi. Dalam metode "feature weight k-Nearest yang menggunakan NodeMCU sebagai komponen utamanya
Neighbors" (fwkNN), pembobotan fitur digunakan untuk dengan platform IoT Antares. Data yang terkumpul dari
memberikan tingkat penting atau bobot yang berbeda pada perangkat keras, seperti sensor suhu dan kelembaban,
setiap fitur dalam perhitungan jarak antara titik-titik data. diambil dan dikirimkan secara otomatis ke platform IoT
Beberapa jenis pembobotan yang dapat digunakan dalam Antares melalui NodeMCU yang terhubung dengan jaringan
fwkNN meliputi: internet. Platform IoT Antares berperan sebagai middleware
1. Equal Weights: Setiap fitur diberi bobot yang sama yang mengelola data dan memberikan layanan untuk
dalam menghitung jarak. Ini adalah pendekatan paling memantau, mengumpulkan, dan menganalisis data kualitas
sederhana di mana semua fitur dianggap memiliki kontribusi air Sungai Citarum secara real-time. Setelah data terolah dan
yang setara terhadap hasil akhir. tersimpan di platform Antares, data tersebut kemudian
2. Distance-Based Weights: Bobot fitur diberikan diteruskan ke perangkat pintar pengguna. Di sini, aplikasi
berdasarkan nilai jarak atau kemiripan antara fitur-fitur. MIT App Inventor berperan sebagai antarmuka pengguna
Fitur-fitur yang memiliki jarak yang lebih kecil atau yang memungkinkan pengguna untuk mengakses data
kemiripan yang lebih tinggi diberi bobot lebih besar karena kualitas air Sungai Citarum dengan mudah. Aplikasi ini
dianggap lebih relevan. memungkinkan pengguna untuk menampilkan data suhu,
kelembaban, dan parameter kualitas air lainnya dalam
3. Information Gain Weighting: Bobot fitur dihitung bentuk yang intuitif, seperti grafik atau tabel, sehingga
berdasarkan seberapa baik fitur tersebut memisahkan kelas memudahkan pemahaman dan analisis data oleh pengguna.
dalam dataset. Fitur yang memiliki informasi yang lebih Selain itu, melalui aplikasi MIT App Inventor, pengguna
tinggi atau memberikan kontribusi lebih besar terhadap juga dapat menerima notifikasi atau pemberitahuan jika
pemisahan kelas diberi bobot lebih tinggi. terdeteksi adanya perubahan signifikan dalam kualitas air
4. Correlation-Based Weights: Bobot fitur dapat Sungai Citarum, misalnya jika kualitas air mencapai batas
dihitung berdasarkan korelasi antara fitur-fitur dan kelas yang tidak diinginkan atau jika ada indikasi adanya
target. Fitur-fitur yang memiliki korelasi yang lebih tinggi pencemaran. Dengan demikian, aplikasi MIT App Inventor
dengan kelas target diberi bobot lebih besar. memberikan fungsi kontrol dan monitoring yang efektif
5. Mutual Information Weighting: Ini adalah metode kepada pengguna untuk mengawasi dan mengambil tindakan
yang mengukur informasi yang dibagi antara fitur-fitur dan
Penulis 1 dkk.: JUDUL NASKAH 6

yang tepat terhadap perubahan kondisi kualitas air Sungai


Citarum secara real-time.

Gambar 6. Desain MIT App Inventor

Titik 1 Titik 2

Gambar 7. Lokasi titik pengambilan sampel air di DAS Citarum

Pengambilan sampel air sungai ada dua titik lokasi, titik


lokasi 1 berada di daerah jalan raya Bojongsoang Kec.
Bojongsoang Kab. Bandung dan titik lokasi 2 berada di
daerah Jayagiri, Kec. Lembang, Kabupaten Bandung Barat,
Jawa Barat Gambar 8. Pengujian alat ke titik sungai

III. HASIL DAN PEMBAHASAN


A. Hasil machine learning kNN
Dalam pengujian kualitas air, hasil yang keluar
Pengklasifikasian menggunakan algoritma KNN sangat
menunjukkan bahwa proses pengujian berjalan dengan baik.
penting dalam memproses dan mengklasifikasikan data
Terdapat perbedaan signifikan antara kualitas air yang diuji
dengan akurat. Persiapan data yang tepat, normalisasi data
di hulu dan hilir sungai. Pada bagian hulu sungai, kualitas
untuk menghilangkan bias, pembagian data menjadi data
air masih sesuai dengan standar baku mutu yang ditetapkan.
pelatihan dan pengujian, serta pemilihan parameter K yang
Namun, di bagian hilir sungai, terdapat tingkat pencemaran
optimal merupakan langkah awal yang krusial dalam proses
ringan yang dapat mempengaruhi kualitas air. Proses
ini. Selanjutnya, melatih model KNN dengan menggunakan
pengklasifikasian yang dilakukan berhasil dalam mendata
data pelatihan dan mengklasifikasikan data pengujian
kualitas air dan mengirimkan data
berdasarkan mayoritas label dari K tetangga terdekat
klasifikasi secara real-time antara kedua titik ke platform
memainkan peran penting dalam menentukan kelas
IoT bernama Antarest. Data tersebut kemudian diteruskan
klasifikasi. Dengan langkah-langkah yang tepat, model
ke aplikasi seluler sebagai antarmuka pemberitahuan dan
KNN dapat digunakan untuk mengklasifikasikan data baru
layar informasi kualitas air pada smartphone. Dengan
tanpa label dengan hasil yang dapat diandalkan
demikian, pengguna dapat menerima pemberitahuan dan
melihat informasi terkini mengenai kualitas air dengan
K yang terbaik karena nilai akurasinya tinggi dan rata-
menggunakan aplikasi tersebut.
rata matriks evaluasi tinggi diantara K yang lain, dan
berwarna merah juga adalah K yang ganjil tertinggi
nilainya.

JUMLAH DATASET

140
120
100
80
60
40
20
0
Tercemar Tercemar Tercemar Memenuhi
Berat sedang Ringan IKA
Grafik batang 1. Jumlah dataset
Penulis 1 dkk.: JUDUL NASKAH 7

Gambar 9. Table confusion matrix 80:20 dan 75:25

Dengan data di atas, kita dapat membentuk confusion


matrix untuk mengevaluasi performa model KNN dengan
perbandingan 80:20 k-9. Dengan menggunakan nilai TP, Gambar 10. Table matrix confusion 70:30
TN, FP, dan FN yang diperoleh, kita dapat menghitung
Dengan data di atas, kita dapat membentuk confusion
berbagai metrik evaluasi seperti akurasi, presisi, recall, dan
matrix untuk mengevaluasi performa model KNN dengan
F1-score untuk memahami sejauh mana model tersebut
data dan uji 70:30 k-9. Berdasarkan nilai TP, TN, FP, dan
berhasil dalam melakukan klasifikasi.
FN yang diperoleh, kita dapat menghitung berbagai metrik
evaluasi seperti akurasi, presisi, recall, dan F1-score untuk
memahami sejauh mana model tersebut berhasil dalam
melakukan klasifikasi pada data pengujian.

K ACURATION PRESISSION RECALL F1-SCORE


KNN FWkNN KNN FWkNN KNN FWkNN KNN FWkNN
K1 0,83 0,86 0,84 0,89 0,84 0,87 0,83 0,87
K2 0,81 0,83 0,82 0,84 0,83 0,85 0,81 0,83
K3 0,8 0,85 0,8 0,86 0,79 0,84 0,79 0,84
K4 0,76 0,86 0,77 0,87 0,76 0,87 0,75 0,86
K5 0,81 0,86 0,81 0,87 0,81 0,85 0,81 0,85
K6 0,78 0,85 0,77 0,85 0,78 0,85 0,77 0,84
K7 0,8 0,86 0,8 0,87 0,79 0,85 0,79 0,85
K8 0,81 0,83 0,82 0,84 0,82 0,82 0,81 0,82
K9 0,85 0,88 0,86 0,89 0,86 0,87 0,85 0,87
K10 0,85 0,85 0,86 0,86 0,86 0,84 0,85 0,84
K11 0,85 0,86 0,85 0,87 0,85 0,84 0,84 0,86
K12 0,81 0,85 0,82 0,86 0,82 0,84 0,81 0,84
K13 0,8 0,85 0,80 0,85 0,8 0,84 0,79 0,83
K14 0,81 0,85 0,82 0,85 0,81 0,84 0,80 0,83
K15 0,81 0,85 0,82 0,86 0,81 0,83 0,79 0,83
Tabel KNN VS FWkNN DENGAN RASIO DATA LATIH DAN UJI 80:20
Penulis 1 dkk.: JUDUL NASKAH 8

DISTRIBUSI JUMLAH DATA BERDASARKAN UJI


TEST PERBANDINGAN

KNN AND FWKNN WIT H 80: 20 T RAINING AND T ES T ING


DATA RAT IO
KNN FWkNN

0.9
0.88
0.86
ACCURATION

0.84
0.82
0.8
0.78
0.76
0.74
0.72
0.7
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K

Grafik 1. Akurasi

KNN AND FWKNN WIT H 80: 20 T RAINING AND T ES T ING


DATA RAT IO
KNN FWkNN

0.9
0.88
0.86
0.84
PRESISSION

0.82
0.8 Grafik 3. RECALL
0.78
0.76
0.74
0.72
0.7
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K

Grafik 2. Presisi
Penulis 1 dkk.: JUDUL NASKAH 9

KNN AND FWKNN WIT H 80: 20 T RAINING AND T ES T ING


DATA RAT IO
KNN FWkNN

0.88
0.86
0.84
0.82
F1-SCORE

0.8
0.78
0.76
0.74
0.72
0.7
0.68
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K

Grafik 3. F1-score

KNN AND FWKNN WIT H 80: 20 T RAINING AND T ES T ING


DATA RAT IO
KNN FWkNN

0.88
0.86
0.84
0.82
RECALL

0.8
0.78
0.76
0.74
0.72
0.7
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K

Grafik 4. Recall
Penulis 1 dkk.: JUDUL NASKAH 10

sedangkan False Negatives (FN) menggambarkan jumlah


data yang sebenarnya adalah positif tetapi salah
Dalam menentukan k terbaik dari grafik diatas diklasifikasikan sebagai negatif oleh model. Confusion
pembelajaran mesin menggunakan metode k-Nearest matrix memberikan informasi yang berguna dalam menilai
Neighbors (KNN), kita dapat menggunakan teknik validasi performa model secara lebih rinci, dan dengan nilai TP, TN,
silang (cross-validation). Dalam konteks ini, kita akan FP, dan FN, kita dapat menghitung berbagai metrik evaluasi
membagi dataset menjadi subset pelatihan dan pengujian, seperti akurasi, presisi, sensitivitas (recall), dan F1-score
dan mengulangi proses ini beberapa kali dengan untuk mendapatkan pemahaman yang lebih komprehensif
menggunakan nilai k yang berbeda untuk setiap literasi. tentang kinerja model klasifikasi.

Kode semu pembobotan fitur KNN (FWkNN)


berbasis koefisien korelasi

Diberikan dataset pelatihan (𝑋, 𝑌) dimana 𝑋 =


𝑥1 , … , 𝑥𝑁 adalah data masukan dengan jumlah
fitur masukan yaitu 𝑚, dan 𝑌 adalah kelas atau
label dengan jumlah data pelatihan sebanyak 𝑁.
1. Lakukan pembagian data latih dan data uji dari
dataset pelatihan.
2. Hitung koefisien korelasi, 𝐶, fitur masukan
terhadap label data pelatihan.
𝐶 = 𝑐𝑜𝑟𝑟(𝑋, 𝑌),
Gambar 11. Matriks Konfusi 3. Cari pembobotan fitur, 𝑤𝑖 , sebagai berikut.
Rumus untuk menghitung metrik evaluasi yang umum
𝑤𝑗 = 𝑒 𝛼𝐶 ,
digunakan dalam KNN adalah sebagai berikut: dimana 𝑗 = 1, … , 𝑚 dan 𝛼 adalah faktor skala.
4. 𝑑𝑖𝑠(𝑥 𝑡𝑟𝑎𝑖𝑛 , 𝑥 𝑡𝑒𝑠𝑡 ) =
 Akurasi (Accuracy):
2
Akurasi = (TP + TN) / (TP + TN + FP + FN) √∑𝑁 𝑚 𝑡𝑟𝑎𝑖𝑛
𝑖=1 ∑𝑗=1(𝑤𝑗 𝑥𝑖𝑗
𝑡𝑒𝑠𝑡
− 𝑤𝑗 𝑥𝑖𝑗 ) Cari jarak
 Presisi (Precision): Euclidean antara data latih, 𝑥 𝑡𝑟𝑎𝑖𝑛 , dan data uji,
Presisi = TP / (TP + FP)
𝑥 𝑡𝑒𝑠𝑡 .
 Sensitivitas atau Recall:
Sensitivitas = TP / (TP + FN) 5. Cari 𝑘-tetangga terdekat dengan jarak
Euclidean terpendek dan tentukan label
 F1-score:
prediksi atau hasil klasifikasinya.
F1-score = 2 * (Presisi * Sensitivitas) / (Presisi +
Sensitivitas)
s
Dalam validasi silang, kita menghitung metrik evaluasi B. Hasil integrasi perangkat Iot
untuk setiap nilai k pada setiap iterasi, dan akhirnya memilih Dalam pengujian software Arduino IDE sebagai
nilai k yang memberikan performa terbaik dalam hal metrik pengklasifikasi KNN, dilakukan pengiriman parameter
evaluasi yang diinginkan. Hal ini membantu kita klasifikasi yang telah disiapkan ke platform Antares.
menentukan k terbaik untuk model KNN dalam Setelah itu, data dari Antares dikirimkan ke aplikasi Mobile
pembelajaran mesin. Confusion matrix adalah tabel yang App yang dibuat menggunakan MIT App Inventor.
digunakan untuk membandingkan hasil prediksi model
dengan label yang sebenarnya pada data pengujian dalam Dalam tahap pengujian, Arduino IDE digunakan sebagai
evaluasi kinerja model klasifikasi. Dalam confusion matrix, pengklasifikasi KNN untuk melakukan pengambilan
terdapat empat istilah yang masing-masing memiliki arti keputusan berdasarkan atribut-atribut yang diukur. Setelah
dan peranan penting. True Positives (TP) mengacu pada proses pengklasifikasian selesai, hasilnya akan dikirimkan
jumlah data yang benar-benar diklasifikasikan dengan benar ke platform Antares melalui koneksi internet. Di platform
oleh model sebagai positif (kelas yang diinginkan). True Antares, data tersebut akan diproses dan diteruskan ke
Negatives (TN) adalah jumlah data yang benar-benar aplikasi Mobile App yang telah dibuat menggunakan MIT
diklasifikasikan dengan benar oleh model sebagai negatif App Inventor.
(kelas yang bukan diinginkan). Di sisi lain, False Positives
(FP) merujuk pada data yang sebenarnya adalah negatif
tetapi salah diklasifikasikan sebagai positif oleh model,
Penulis 1 dkk.: JUDUL NASKAH 11

bentuk yang mudah dipahami oleh pengguna. Selain itu,


dengan menerapkan metode machine learning KNN,
penelitian ini menghadirkan pendekatan cerdas untuk
mengklasifikasikan kualitas air berdasarkan data sensor.
Dengan menggunakan data historis dan pembelajaran mesin,
model KNN dapat memberikan hasil klasifikasi secara real-
time dan membantu dalam pemantauan dan pemahaman
yang lebih efektif tentang kualitas air sungai tersebut. Secara
keseluruhan, penelitian ini memiliki potensi besar untuk
meningkatkan pemantauan kualitas air Sungai Citarum
secara efisien dan akurat. Dengan penerapan teknologi IoT
Gambar 12. Antarest platform dan metode machine learning, diharapkan penelitian ini
dapat memberikan kontribusi yang signifikan dalam upaya
Dalam aplikasi Mobile App tersebut, data dari Antares pelestarian dan pengelolaan kualitas air di sungai ini.
akan diterima dan ditampilkan kepada pengguna dalam
bentuk yang lebih interaktif dan mudah dipahami. Aplikasi REFERENSI
ini dapat memberikan informasi hasil klasifikasi yang telah [1] "Impact of Industrial Wastewater on Water Quality: A Case Study of
dilakukan oleh Arduino IDE menggunakan metode KNN. XYZ River" - Jurnal: Water Research. Richard Helmer dan Ivanildo
Hespanhol "Water Pollution Control: A Guide to the Use of Water
Secara keseluruhan, pengujian software Arduino IDE Quality Management Principles” (2008).
sebagai pengklasifikasi KNN melibatkan pengiriman [2] Dinelli, E. et al. Major and trace elements in tap water from Italy. J.
parameter klasifikasi ke Antares dan mengirimkan data dari Geochem. Explor. 112, 54–75 (2012).
Antares ke aplikasi Mobile App yang dibuat menggunakan [3] T. Widodo, M. T. S. Budiastuti, dan K. Komariah, “Water Quality
MIT App Inventor. Hal ini memungkinkan pengguna untuk and Pollution Index in Grenjeng River, Boyolali Regency,
Indonesia,” Caraka Tani J. Sustain. Agric., vol. 34, no. 2, hal. 150,
mengakses dan melihat hasil klasifikasi dengan mudah 2019, doi: 10.20961/carakatani.v34i2.29186.
melalui aplikasi mobile yang intuitif. [4] "Development of a water quality index model for river systems: A
case study in Japan" oleh Y. Li et al.
[5] "Development of a water quality index for assessing surface water in
IV. KESIMPULAN Canadian rivers" oleh X. Zhang et al.
Penelitian ini menggunakan pendekatan inovatif [6] "Evaluation of a water quality index model for assessing surface
water quality in Indian rivers" oleh R. Sharma et al.
dengan mengintegrasikan teknologi Internet of Things (IoT)
untuk monitoring dan klasifikasi kualitas air Sungai Citarum. [7] A. W. Utami, “Kualitas Air Sungai Citarum,” Jur. Tek. Lingkung.,
hal. 1–6, 2019.
Metode penelitian ini menggabungkan 4 komponen sensor
[8] V. Madhavireddy and B. Koteswarrao, “Smart Water Quality
(PH, Suhu, TDS, dan turbidity) untuk mengukur parameter Monitoring System Using Iot Technology,” Int. J. Eng. Technol., pp.
kualitas air secara real-time. Hasil pengukuran dari sensor- 636–639.
sensor tersebut diklasifikasikan menggunakan algoritma [9] HAEKAL, M., & WIBOWO, W. C. (2023). Prediksi Kualitas Air
machine learning K-Nearest Neighbors (KNN). KNN Sungai Menggunakan Metode Pembelajaran Mesin: Studi Kasus
digunakan sebagai pengklasifikasi untuk menentukan Sungai Ciliwung: Prediction of River Water Quality Using Machine
kualitas air berdasarkan data yang diambil dari sensor-sensor Learning Methods: Ciliwung River Case Study . Jurnal Teknologi
tersebut. Proses pembelajaran KNN dilakukan dengan Lingkungan, 24(2), 273–282. https://doi.org/10.55981/jtl.2023.795.
menggunakan data pelatihan yang dikumpulkan dari [10] SAID, Hardiana; MATONDANG, Nur Hafifah; IRMANDA, Helena
Nurramdhani. Penerapan Algoritma K-Nearest Neighbor Untuk
pengukuran air sebelumnya, sehingga model KNN dapat Memprediksi Kualitas Air Yang Dapat Dikonsumsi. Techno.Com,
mengklasifikasikan kualitas air secara otomatis berdasarkan [S.l.], v. 21, n. 2, p. 256-267, may 2022. ISSN 2356-2579.
data masukan yang baru. Keunggulan penelitian ini terletak [11] D. Hartanti and A. I. Pradana, “Komparasi Algoritma Machine
pada pemanfaatan teknologi IoT yang memungkinkan Learning Dalam Identifikasi Kualitas Air”, SMARTICS, vol. 9, no. 1,
monitoring kualitas air Sungai Citarum secara real-time. pp. 1–6, Apr. 2023.
Dengan menggunakan sensor-sensor dan perangkat keras [12] T. Cover.,K-Nearest Neighbors - 25 years later" .
yang terhubung melalui jaringan internet, data kualitas air [13] H. Utomo et al, "Evaluation of Water Quality and Potential Human
dapat dikumpulkan secara kontinu dan disajikan dalam Health Risks in the Citarum River, Indonesia" (2018).

Anda mungkin juga menyukai