Abstrak
Sistem monitoring lingkungan air secara realtime merupakan hal yang harus dilakukan dalam upaya
menjaga ekosistem air dan penecemaran air di area industry. Dalam rangka mengintegrasikan sistem
monitoring dengan teknologi big data untuk analisa realtime, kami mambangun sebuah sistem yang
dinamakan SEMAR (Smart Environtment Monitoring and Analyttic in Realtime system), yang
merupakan platform IoT-Big data untuk monitoring lingkungan air. Akan tetapi, SEMAR belum
memiliki sistem analisa. Sehingga kami melakukan penelitian untuk membangun sistem analisa untuk
klasifikasi kualitas air menggunakan metode Indeks Pencemaran, yang mana akan menjadi ekstensi
buat sistem SEMAR. Hasil evaluasi menunjukkan algoritma Linear SVM dan Decision Tree yang
digunakan memiliki tingkat akurasi di atas 90% dan rata-rata MSE sebesar 0.019075. Sementara untuk
waktu pemrosesan sistem SEMAR hanya membutuhkan rata-rata 0.5 detik untuk memproses data
yang diterima hingga proses visualisasi.
.
Kata kunci: SEMAR, monitoring kualitas air, analisa realtime, IoT, Big Data, klasifikasi, machine learning
Abstract
Monitoring water conditions in real-time is a critical mission to preserve the water ecosystem in industry. To
integrate the water monitoring system into the big data technology for real-time analysis, we have engaged in the
ongoing project named SEMAR (Smart Environment Monitoring and Analytic in Real-time system), which
provides the IoT-Big Data platform for water monitoring. However, SEMAR does not have an analytical system
yet. This paper proposes the analytical system for water quality classification using Pollution Index method,
which is an extension of SEMAR. Besides, the communication protocol is updated from REST to MQTT.
Furthermore, the real-time user interface is implemented for visualisation. The evaluations confirmed that the
data analytic function adopting the linear SVM and Decision Tree algorithms achieves more than 90% for the
estimation accuracy with 0.019075 for the MSE. The processing time of the SEMAR system only takes an
average 0.5 seconds to process the data to be visualized.
Keywords: SEMAR, water condition monitoring, real-time analysis, IoT, big data, classification, machine
learning.
5. PENUTUP
Gambar 4.6. Desain infrastruktur serve
5.2 Kesimpulan
Ketiga server menggunakan IP Public sehingga
dapat diakses dari manapun, konfigurasi alamat IP Pada penelitian ini bertujuan untuk
pada ketiga server dapat dilihat pada tabel 4.4. membangun sistem klasifikasi realtime air
Throughput masing-masing node ke node lainnya sungai dengan menggunakan teknologi IoT dan
adalah sekitar 1 Gbps Big Data. Dimana dalam
Tabel 4.4. Konfigurasi alamat IP pengeimplementasiannya dikembangkan
sebuah platform IoT yang terdiri dari 7 lapisan
IoT dan diintegrasikan dengan teknologi Big
Data pada beberapa lapisan tersebut.
Penggunaan teknologi Big Data utamanya
berada pada sisi penyimpanan, analisa dengan
4. Pengembangan Big Data Framework
Dalam rangka memenuhi kebutuhan sistem akan klasifikasi, dan manajemen data dalam server.
teknologi Big Data, maka dilakukan pembangunan Hasil klasifikasi dengan menggunakan
Big Data Framework. Beberapa teknologi Big Data algoritma Linear SVM dan Decision Tree
yang digunakan adalah Apache Hadoop sebagai menunjukkan performa yang baik, dimana
komponen utama dalam manajemen data pada Big akurasinya berada pada level di atas 90%. Pada
Data yang terdiri dari HDFS, Yarn, dan dataset uji laboratorium algoritma Linear SVM
MapReduce. Apache Hive untuk memaksimalkan menunjukkan akurasi sebesar 0.935897
dan memudahkan penyimpanan data ke dalam sedangkan Decision Tree 0.994872. Sementara
Hadoop HDFS menggunakan SQL Query untuk dataset sensior live algoritma Linear
Language, Apache Spark sebagai tool machine
SVM menunjukkan akurasi sebesar 0.993634
learning yang handal, baik untuk analisa batch
maupun stream. Apache Kafka untuk proses sedangkan Decision Tree 0.999251. Hal ini
distribusi data antar lapisan pada Big Data. dapat disimpulkan bahwa algoritma Decision
Apache Hadoop merupakan salah satu distribusi Tree memiliki akurasi yang lebih baik
big data yang dikembangkan oleh Apache Software dibandingkan dengan algoritma Linear SVM.
Foundation. Apache Hadoop ini dibangun dengan Dimana algoritma Decision Tree memiliki rata-
lisensi free dan open source. Dalam penelitian ini rata tingkat akurasi sebesar 0.9970615 dan
digunakan Apache Hadoop sebagai framework algoritma Linear SVM sebesar 0.9647655.
untuk Big Data dengan versi 2.6.0. Instalasi dan Pengujian hasil validasi yang telah dilakukan
konfigurasi dilakukan pertama kali pada komputer pada dataset uji laboratorium maupun dataset
yang bertindak sebagai hadoop-master (single
sensor live berdasarkan grafik ROC dengan
node), untuk menjadikan multinode cluster akan
dilakukan synkronisasi dengan komputer slave dan nilai Area Under ROC menunjukkan di atas
dengan melakukan perubahan konfigurasi yang angka 0.9. Dengan demikian dapat dikatakan
minimal pada node. Secara garis besar tahapan bahwa unjuk kerja nilai Area Under ROC
instalasi dan konfigurasi Big Data Hadoop adalah menunjukkan kinerja ‘Excellent’. Sistem yang
sebagai berikut: dibangun hanya membutuhkan rata-rata 508
a. Persiapkan komputer baik yang akan dijadikan miliseconds dalam memproses data oleh server
sebagai node master dan node slave yang diterima dari node sensor. Hal ini
menunjukkan sistem platform IoT-Big Data
yang dibangun memiliki kinerja yang sangat [6] Menteri Kesehatan, Peraturan Menteri
baik. Kesehatan nomor
5.2 Saran 492/MENKES/PER/IV/2010 tentang
Berdasarkan hasil penelitian tesis desain dan Persyaratan Kualitas Air Minum,
implementasi IoT-Big Data analytic pada 2010.
Smart Environment Monitoring system maka [7] Nemerow, Nelson Leonard. Scientific
dapat disarankan: Stream Pollution Analysis.
a. Pengembangan sistem monitoring McGrawHill, 1974.
lingkungan yang tidak hanya dapat [8] Menteri Negara Lingkungan Hidup,
melakukan analisa teks, tapi juga dapat Keputusan Menteri Negara
melakukan analisa terhadap gambar secara Lingkungan Hidup Nomer 115 tahun
realtime. 2003 tentang Pedoman Penentuan
b. Pengembangan online classification pada Status Mutu Air, 2003.
sistem SEMAR. [9] Recommendation ITU-T Y.2060,
c. Pengembangan penelitian yang ditujukan Overview of Internet of Thing, 2012.
untuk peruntukan monitoring pada [10] Cisco, The Internet of Things
lingkungan lainnya, seperti udara. Reference Model. White Paper, 2014.
d. Pengembangan sistem analisa untuk
kebutuhan clustering ataupun regression
pada data lingkungan.
DAFTAR PUSTAKA
[1] Hapsari, Ratih Indri, and Mohammad
Zenurianto. View of flood disaster
management in Indonesia and the key
solutions. American Journal of
Engineering Research 5, no. 3 (2016):
140-151.
[2] Zulkarnain, Muhammad Rizki, Suwito,
Tasripan. Sistem Monitoring Kualitas
Air Sungai yang Dilengkapi dengan
Data Logger dan Komunikasi Wireless
sebagai Media Pengawasan
Pencemaran Limbah Cair. Institut
Teknologi Sepuluh Nopember
Surabaya, 2014.
[3] Republik Indonesia, Undang-Undang
Republik Indonesia nomor 7 tahun
2004 tentang Sumber Daya Air, 2004.
[4] Republik Indonesia, Peraturan
Pemerintah nomor 82 tahun 2001
tentang Pengelolaan Kualitas Air dan
Pengendalian Pencemaran Air, 2001.
[5] Provinsi Kalimantan Selatan, Peraturan
Daerah Provinsi Kalimantan Selatan r
nomor 2 tahun 2008 tentang
Pengelolaan Kualitas Air dan
Pengendalian Pencemaran Air Di
Provinsi Kalimantan Selatan, 2008. 7.
Kabupaten Kotabaru, Peraturan Daerah
Kabupaten Kotabaru a nomor 2 tahun
2004 tentang Pengelolaan Kualitas Air
dan Pengendalian Pencemaran Air,
2004.