Kualitas air Sungai Citarum di Jawa Barat masih belum memenuhi baku mutu air sepanjang tahun, terutama pada musim
kemarau. Sungai ini masih tercemar berat akibat tingginya pencemar yang berasal dari berbagai aktivitas manusia seperti pertanian,
peternakan, perikanan, industri, dan kegiatan domestik. Selain itu, sungai ini juga menjadi tempat pembuangan sampah rumah tangga,
meningkatkan risiko masukan bahan pencemar yang mempengaruhi kualitas air. Kondisi tersebut diindikasikan oleh kekeruhan fisik
sungai dan adanya pabrik limbah industri, pembuangan tinja perumahan, serta banyaknya sampah di aliran sungai. Monitoring kualitas
air telah dilakukan dengan menggunakan beberapa sensor, namun belum mencakup semua parameter standar Indonesia, seperti
kekeruhan, bau, pH, zat padat terlarut, dan suhu. Fokus utama dalam penelitian ini membahas tentang pemetaan kualitas air yang
kualitas air di beberapa titik aliran sungai citarum menggunakan metode k-Nearest Neighbour (KNN). Parameter yang digunakan
sebagai masukan dalam pembelajaran KNN seperti kekeruhan, pH, zat padat terlarut, dan suhu, diperoleh dengan instalasi sensor di
beberapa titik di sepanjang aliran sungai citarum dan komunikasi jarak jauh menggunakan IoT. Dataset untuk pelatihan model
pembelajaran KNN diperoleh dengan mengumpulkan beberapa sampel air dan telah melakukan pengukuran dengan alat ukur standar
untuk selanjutnya dilakukan proses kalibrasi dengan sensor yang digunakan. Hasil dari model pembelajaran KNN menunjukkan akurasi
sebesar 85%, dengan jumlah tetangga terdekat di k = 9 menggunakan 330 dataset. Hasil pengujian di beberapa titik sungai citarum
dalam beberapa kali percobaan menunjukkan variasi indeks kualitas aliran air sungai Citarum. Dari dua titik yang dipasang antara
hulu dan hilir terdapat dua hasil yang berbeda diantaranya hasil untuk hulu menunjukkan bahwa kualitas air yang berada di aliran
sungai daerah tersebut masih memenuhi IKA sedangkan untuk daerah hilir yang telah ditempati oleh penduduk disekitar DAS
mendapatkan hasil tercemar ringan. Kedua data tersebut dapat dilihat secara real time dengan menggunakan Internet of Thingking yang
berada di perangkat keras yang berada di titik yang telah di tentukan.
Kata kunci: monitoring kualitas air sungai, kNN, Iot, DAS, citarum
Abstract
The water quality of Citarum River in West Java, Indonesia does not meet the water quality standards throughout the year, especially
during the dry season. The river remains heavily polluted due to high levels of contaminants from various human activities such as agriculture,
livestock farming, fisheries, industries, and domestic activities. Additionally, the river is also used as a dumping ground for household waste,
further increasing the risk of pollutant input that affects water quality. These conditions are indicated by the physical turbidity of the river,
presence of industrial waste factories, residential sewage discharge, and the abundance of trash in the river stream. Water quality monitoring
has been conducted using several sensors, but it does not cover all the standard parameters set by Indonesia, such as turbidity, odor, pH, total
dissolved solids, and temperature. The main focus of this research is to discuss water quality mapping at several points along the Citarum
River using the k-Nearest Neighbour (KNN) method. The parameters used as inputs for KNN learning, such as turbidity, pH, total dissolved
solids, and temperature, are obtained through sensor installations at various points along the Citarum River and remote communication using
IoT. The dataset for training the KNN learning model is obtained by collecting several water samples and conducting measurements with
standard measuring instruments, followed by calibration with the sensors used. The results of the KNN learning model show an accuracy of
85% with the nearest neighbor count set at k = 9 using 330 datasets. The testing results at various points along the Citarum River in multiple
experiments show variations in the water quality index of the Citarum River flow. Two points installed between the upstream and downstream
sections show different results. The result for the upstream point indicates that the water quality in that area still meets the standards, while
the downstream area, which is occupied by the surrounding watershed population, shows a result of mild pollution. Both data can be viewed
in real-time using Internet of Things devices located at the designated points.waterproof and weather-resistant ABS material, reinforced with
iron poles or utilizing an RC boat for long-term stability and protection. Human operators will control the device using a remote control.
Keywords: river water quality monitoring, k-Nearest Neighbour (kNN), Internet of Things (IoT), watershed, Citarum
I. PENDAHULUAN melalui beberapa peraturan yang mencakup berbagai jenis
air limbah, termasuk air limbah domestik, air laut, air
Air merupakan kebutuhan yang paling penting bagi limbah tambang, dan air limbah industri. Peraturan ini
makhluk hidup khususnya manusia itu sendiri, salah satu menetapkan parameter-parameter kualitas air yang harus
sumber air tersebut adalah air sungai yang mengalir di dipenuhi untuk melindungi lingkungan dan kesehatan
sekitar kehidupan manusia. Sumber air tersebut tidak luput manusia. Beberapa studi telah dilakukan dalam monitoring
dari zat zat pengotor yang mencemari air tersebut [1]. kualitas air, seperti penelitian yang dilakukan oleh Ahmad
pengotor tersebut terbagi menjadi dua yaitu pengotor yang Sabiq, dkk. tentang Sistem Pemantauan Kadar pH, Suhu,
diatur maupun pengotor yang tidak diatur. Perbedaan antara dan Warna pada Air Sungai Melalui Jaringan Sensor
pengotor yang diatur dan tidak diatur terletak pada tingkat Nirkabel Berbasis Web [7]. Selain itu, Vennam
kontrol yang diberikan oleh pemerintah atau otoritas yang Madhavireddy, dkk melakukan monitoring kualitas air
berwenang. Pengotor yang diatur tunduk pada peraturan berbasis Internet of Things (IoT) dengan menggunakan
yang ketat untuk menjaga kualitas air, sementara pengotor modul Wi-Fi ESP8266 dalam penelitian berjudul Sistem
yang tidak diatur mungkin kurang terkontrol dan memiliki Pemantauan Kualitas Air Cerdas Menggunakan Teknologi
risiko yang kurang dipahami. Beberapa bahan yang tidak IoT [8]. Menurut Mohammad haikal penelitian di Sungai
berbahaya, seperti kekerasan dan kation/anion utama, sering Ciliwung, sungai terbesar di Jakarta, mengalami penurunan
kali dianggap sebagai nilai rata-rata untuk wilayah yang kualitas air. Pemantauan real-time dengan ONLIMO
luas. Contoh dari pengotor yang diatur seperti limbah menggunakan multiprobes sensor dilakukan di sungai ini
industri dari pabrik yang membuang limbah kimia, logam selama satu tahun (1 Januari - 31 Desember 2018) untuk
berat, dan limbah organik. Ada juga limbah rumah tangga memprediksi kualitas air. Hasilnya menunjukkan bahwa
seperti air cucian, dan limbah dari toilet. Pongotor yang model Jaringan Syaraf Tiruan (JST) dengan 5 Hidden Layer
tidak diatur merupakan sampah plastik, logam, kertas dan memiliki performa tertinggi dalam Confusion Matrix
bahan padat lainnya yang tidak terkelola baik dan berakhir (Akurasi, Recall, Presisi, Spesifikitas, dan F1 Score). Selain
di perairan dan mencemarinya [2]. kurangnya penelitian itu, Random Forest juga memiliki performa tinggi, diikuti
tentang distribusi rinci dari bahan-bahan ini menyebabkan oleh JST dengan 5 Hidden Layer, Naive Bayes, dan SVM.
keterbatasan pengetahuan tentang dampak dan Akurasi ketiga metode pertama tersebut mencapai lebih dari
persebarannya secara detail. laporan yang diterbitkan oleh 89%, menunjukkan keefektifan mereka dalam memprediksi
Organisasi Kesehatan Dunia (WHO), sekitar 1,8 miliar kualitas air Sungai Ciliwung[9]. Menurut penelitian
orang bergantung pada sumber air yang terkontaminasi. hardiana said dkk. Kualitas air yang aman untuk dikonsumsi
Polusi air saat ini merupakan ancaman ekologis yang paling sangat penting bagi kesehatan masyarakat, namun kualitas
serius di dunia [3]. Setiap negara memiliki memiliki indeks air semakin menurun di berbagai daerah, dapat
kualitas air yang berbeda dengan parameter dan metode menyebabkan penyakit serius. Penelitian ini menggunakan
penilaian yang berbeda. Jepang memakain Indeks Kualitas algoritma K-Nearest Neighbor untuk memprediksi kualitas
Air (Water Quality Index, WQI), WQI adalah indeks yang air berdasarkan data lingkungan. Dengan tingkat akurasi
digunakan untuk mengevaluasi kualitas air permukaan di tertinggi 85,52% pada k = 3[10]. Menurut dwi hartanti dkk.
berbagai lokasi. Indeks ini dikembangkan oleh Kementerian Air memiliki peran sangat penting dalam kehidupan
Lingkungan Hidup Jepang dan mempertimbangkan manusia karena menjadi sumber kehidupan dan sekitar 71%
parameter fisik dan kimia seperti oksigen terlarut, permukaan bumi adalah air. Setiap individu memiliki hak
kekeruhan, pH, nitrat, fosfat, bahan organik terlarut, logam fundamental untuk akses air bersih, yang menjadi landasan
berat, dan bahan organik total [4]. Indeks Kualitas Air bagi terwujudnya kehidupan yang layak dan bermartabat.
Kanada (Canadian Water Quality Index) juga Dalam dunia penambangan data, salah satu teknik yang
mempertimbangkan beberapa parameter fisik dan kimia digunakan adalah klasifikasi. Penelitian ini menggunakan
dalam menilai kualitas air permukaan. Indeks Kualitas Air data kualitas air dan menerapkan empat metode algoritma,
Kanada melibatkan parameter seperti oksigen terlarut, pH, yakni Pohon Keputusan, Regresi Logistik, SVM, dan ANN.
bahan organik terlarut, nitrat, fosfat, logam berat, dan Tujuannya adalah membandingkan metode mana yang
kehadiran mikroorganisme patogen. Mirip dengan Indeks memberikan tingkat akurasi maksimum dalam
Kualitas Air Jepang [5]. Indeks kualitas air di India hamper mengklasifikasikan kualitas air. Hasil akurasi yang
sama dengan indeks kualitas air di jepang. Indeks Kualitas diperoleh adalah sebagai berikut: metode Pohon Keputusan
Air (Water Quality Index, WQI) yang digunakan di Jepang sekitar 60,19%, metode Regresi Logistik sekitar 62,80%,
dan India memiliki perbedaan dalam parameter yang dinilai, metode SVM sekitar 68,59%, dan metode ANN sekitar
skala penilaian, dan pendekatan pengembangannya. Indeks 69,54%[11].
Kualitas Air Jepang mempertimbangkan parameter seperti
oksigen terlarut, kekeruhan, pH, nitrat, fosfat, logam berat, Pada penelitian ini kami menggunakan meotde k-NN .K-
dan bahan organik, sementara Indeks Kualitas Air India juga Nearest Neighbor merupakan salah satu algoritma yang
melibatkan parameter seperti pestisida dan kehadiran paling sederhana yang digunakan dalam machine learning
mikroorganisme patogen. Skala penilaian juga dapat untuk regresi dan klasifikasi [12]. Penelitian yang
berbeda antara kedua indeks tersebut. Kedua indeks menggunakan metode K-Nearest Neighbors (KNN) dapat
dikembangkan oleh lembaga lingkungan masing-masing mencakup berbagai bidang dan topik tergantung pada
negara dan mencerminkan kondisi dan kebutuhan konteksnya. Fitur-fitur seperti titik nyala, titik leleh,
lingkungan setempat [6]. Di Indonesia, standar kualitas air viskositas, dan kandungan air dalam minyak dapat
diatur oleh Kementerian Lingkungan Hidup dan Kehutanan digunakan sebagai input dalam KNN. KNN akan mencari
Penulis 1 dkk.: JUDUL NASKAH 3
tetangga terdekat untuk menentukan kualitas minyak, Setelah sampel air tiba di Tandon, sensor-sensor ini
seperti "baik", "memadai", atau "rusak". Penggunaan kNN bekerja dengan cermat untuk mengumpulkan data yang
yang mudah seperti alokasi memori yang tidak besar untuk akurat dan relevan dari sampel air tersebut. Data yang
menyimpan model pembelajaran, waktu pembelajaran dan terkumpul, seperti tingkat keasaman (pH), suhu air,
pengklasifikasian yang efisien, implementasi system yang kandungan padatan terlarut total (TDS), dan tingkat
sangat mudah di ubah ke dalam bahasa C dan terakhir kekeruhan, kemudian akan diolah dan dianalisis oleh
kecepatan komputasi relative cepat dalam melakukan algoritma klasifikasi yang menggunakan metode k-NN (k-
prediksi atau klasifikasi menjadikan penggunaan metode Nearest Neighbors). Metode ini digunakan untuk
kNN cocok dalam pembelajaran mesin di system pada mengklasifikasikan sampel air ke dalam salah satu dari
makalah ini [13]. K-Nearest Neighbors (KNN) adalah empat kategori, yaitu tercemar berat, tercemar sedang,
metode dalam pembelajaran mesin yang digunakan untuk tercemar ringan, atau memenuhi standar kualitas air.
klasifikasi dan regresi, Salah satu varian dari algoritma
KNN adalah penggunaan bobot fitur ( feature weight), yang Setelah data sampel air berhasil terklasifikasi, informasi
dapat memberikan tingkat pentingnya masing-masing fitur tersebut akan diunggah melalui jaringan Internet of Things
dalam menghitung jarak antara titik-titik data. Dalam kasus (IoT) ke platform Antarest. IoT memungkinkan alat ini
ini, bukan hanya jarak antara tetangga yang diperhitungkan, untuk terhubung secara real-time dengan jaringan,
tetapi juga bobot yang diberikan pada setiap fitur. memastikan bahwa informasi tentang kualitas air dapat
Penggunaan bobot fitur dalam KNN dapat memberikan diakses secara cepat dan efisien. Dari platform Antarest,
dampak pada bagaimana jarak dihitung antara titik-titik data akan diteruskan ke aplikasi MIT App Inventor, yang
data. Misalnya, jika suatu fitur dianggap lebih penting dirancang sebagai antarmuka yang user-friendly untuk
dalam mempengaruhi hasil, Anda dapat memberikan bobot pengguna akhir. Aplikasi ini memungkinkan pengguna
yang lebih besar pada fitur tersebut. Ini bisa membantu untuk memantau kualitas air secara real-time, menerima
algoritma KNN lebih sensitif terhadap variasi pada fitur laporan terkini, dan mengakses data historis yang relevan.
yang dianggap penting. Dalam konteks K-Nearest Dengan demikian, alat ini tidak hanya memberikan
Neighbors (KNN), telah dilakukan modifikasi yang sukses informasi penting tentang kualitas air, tetapi juga
meningkatkan akurasi, seperti Local Mean k-Nearest memungkinkan pengguna untuk mengambil tindakan yang
Neighbor (LMKNN) yang mengurangi pengaruh outlier diperlukan berdasarkan informasi yang diberikan.
dengan menggantikan sistem suara mayoritas, serta
Distance Weight K-Nearest Neighbor (DWKNN) yang
memberikan pengaruh lebih besar pada data mirip. Kedua
metode ini berhasil meningkatkan akurasi secara terpisah.
LMKNN dan DWKNN digabungkan dalam penelitian lain
untuk mengatasi kelemahan suara mayoritas dan masalah
kelas mayoritas ganda. Terdapat peluang lebih lanjut
dengan memberikan bobot pada setiap atribut (FWkNN),
berbeda dengan metode jarak yang memberikan pengaruh
sama pada setiap atribut. Penelitian lain juga menyarankan
pendekatan serupa dengan bobot yang diukur menggunakan
Gain Ratio, terbukti meningkatkan akurasi. Dalam
penelitian ini, penggabungan pendekatan pembobotan
atribut dengan local mean dilakukan untuk meningkatkan
metode KNN, yang sebelumnya telah berhasil
meningkatkan akurasi KNN konvensional. Dalam metode
"feature weight k-Nearest Neighbors" (fwkNN), bobot fitur Gambar 1. Kondisi titik sungai
dapat diterapkan dengan berbagai cara, seperti memberikan
bobot yang sama pada setiap fitur, berdasarkan jarak,
informasi, korelasi, atau informasi bersama dengan kelas II. METODE/DESAIN
target. Pendekatan juga melibatkan pengujian dan penilaian
performa model pada subset fitur, pembangunan bobot Penggunaan metode yang tepat tergantung pada
selama pembelajaran, serta teknik regulasi. Jenis parameter yang ingin diuji dan tujuan pengujian. Dalam
pembobotan ini memiliki keunggulan dan penerapan yang praktiknya, sering kali digunakan kombinasi metode
berbeda-beda, dan memilih pembobotan yang sesuai dapat fisik, kimia, dan biologi untuk mendapatkan gambaran
meningkatkan performa fwkNN dalam analisis data. yang lebih lengkap tentang kualitas air. Penting untuk
Rancang bangun alat kami dimulai dengan pengambilan mengikuti pedoman dan standar yang berlaku dalam
sampel air oleh alat yang tertanam, yang secara otomatis melakukan uji kualitas air untuk memastikan hasil yang
menggumpulkan sampel air dari lingkungan sekitarnya. akurat dan dapat diandalkan. Dalam penelitian uji
Sampel air ini kemudian dialirkan ke Tandon yang kualitas sungai air citarum sudah dilakukan penelitian
dilengkapi dengan empat sensor berkualitas tinggi, yaitu oleh beberapa intansi kampus dengan f dan cara yang
sensor pH, suhu, TDS (Total Dissolved Solids), dan berbeda beda. Studi pendahuluan yang dilakukan
turbiditas, yang mampu mengukur berbagai aspek kualitas beberapa penelitian yaitu mengambil sampel secara
air dengan akurasi tinggi. langsung di aliran sungai citarum lalu melakukan uji
sampel tersebut di laboratorium kesehatan daerah
Penulis 1 dkk.: JUDUL NASKAH 4
(Labkesda) untuk mentukan kualitas air dan pencemar dipasang dengan kondisi bermacam-macam karena tiang
dominan. sedangkan metode yang diangkat dalam akan ditanam ditanah menggunakan semen agar produk
penelitian ini Dalam konteks pengukuran kualitas air, tersebut kokoh, tahan dari longsor dan cuaca buruk.
metode machine learning menggunakan algoritma k-
Nearest Neighbors (k-NN) digunakan sebagai
pengklasifikasi untuk menentukan kualitas air
berdasarkan data yang diambil. Proses pembelajaran k-
NN dilakukan menggunakan data pelatihan yang
dikumpulkan dari pengukuran air sebelumnya. Setelah
pembelajaran, model k-NN dapat mengklasifikasikan
kualitas air secara otomatis berdasarkan data masukan
yang baru. Hasil klasifikasi tersebut langsung ditransfer
ke platform IoT, Antarest, yang memungkinkan
pembacaan data kualitas air dalam waktu nyata. Untuk
mengakses hasil pembacaan secara real-time, pengguna
dapat menggunakan aplikasi seluler yang terhubung ke Gambar 4. Skematik komponen.
Antarest. Aplikasi ini memberikan antarmuka yang
mudah digunakan untuk melihat dan memantau kualitas
air dengan cepat dan efisien. Dari permodelan perangkat keras tersebut kedua
sistem perangkat tersebut akan dilanjutkan ke sistem Iot
sehingga kedua perangkat akan saling terhubunh
memberikan informasi dari dua titik yang dilakukan
pengujian pembambilan sampel air.
Klasifikasi dilakukan dengan memeriksa mayoritas kelas kelas target. Fitur-fitur yang memiliki informasi bersama
dari tetangga-tetangga terdekat tersebut. Jika mayoritas yang lebih tinggi dengan kelas target diberi bobot lebih
tetangga termasuk dalam suatu kelas, maka objek yang akan tinggi.
diklasifikasikan juga diklasifikasikan ke dalam kelas
tersebut.
Titik 1 Titik 2
JUMLAH DATASET
140
120
100
80
60
40
20
0
Tercemar Tercemar Tercemar Memenuhi
Berat sedang Ringan IKA
Grafik batang 1. Jumlah dataset
Penulis 1 dkk.: JUDUL NASKAH 7
0.9
0.88
0.86
ACCURATION
0.84
0.82
0.8
0.78
0.76
0.74
0.72
0.7
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K
Grafik 1. Akurasi
0.9
0.88
0.86
0.84
PRESISSION
0.82
0.8 Grafik 3. RECALL
0.78
0.76
0.74
0.72
0.7
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K
Grafik 2. Presisi
Penulis 1 dkk.: JUDUL NASKAH 9
0.88
0.86
0.84
0.82
F1-SCORE
0.8
0.78
0.76
0.74
0.72
0.7
0.68
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K
Grafik 3. F1-score
0.88
0.86
0.84
0.82
RECALL
0.8
0.78
0.76
0.74
0.72
0.7
K1 K2 K3 K4 K5 K6 K7 K8 K9 K10 K11 K12 K13 K14 K15
K
Grafik 4. Recall
Penulis 1 dkk.: JUDUL NASKAH 10