Anda di halaman 1dari 9

DESAIN DAN IMPLEMENTASI IOT-BIG DATA ANALYTIC PADA SMART

ENVIRONMENT MONITORING SYSTEM


M. Ravendra Husien 1, Iwan Krisnadi2
1,2
Program Pasca Sarjana, Magister Teknik Elektro, Universitas Mercu Buana

Email: 1vendranusantara@gmail.com, 2iwan.krisnadi.dr@gmail.com

Abstrak

Sistem monitoring lingkungan air secara realtime merupakan hal yang harus dilakukan dalam upaya
menjaga ekosistem air dan penecemaran air di area industry. Dalam rangka mengintegrasikan sistem
monitoring dengan teknologi big data untuk analisa realtime, kami mambangun sebuah sistem yang
dinamakan SEMAR (Smart Environtment Monitoring and Analyttic in Realtime system), yang
merupakan platform IoT-Big data untuk monitoring lingkungan air. Akan tetapi, SEMAR belum
memiliki sistem analisa. Sehingga kami melakukan penelitian untuk membangun sistem analisa untuk
klasifikasi kualitas air menggunakan metode Indeks Pencemaran, yang mana akan menjadi ekstensi
buat sistem SEMAR. Hasil evaluasi menunjukkan algoritma Linear SVM dan Decision Tree yang
digunakan memiliki tingkat akurasi di atas 90% dan rata-rata MSE sebesar 0.019075. Sementara untuk
waktu pemrosesan sistem SEMAR hanya membutuhkan rata-rata 0.5 detik untuk memproses data
yang diterima hingga proses visualisasi.
.

Kata kunci: SEMAR, monitoring kualitas air, analisa realtime, IoT, Big Data, klasifikasi, machine learning

DESIGN OF ONLINE BASED IP CAMERA DETECTION SYSTEM USING


TEMPLATE MATCHING METHOD

Abstract

Monitoring water conditions in real-time is a critical mission to preserve the water ecosystem in industry. To
integrate the water monitoring system into the big data technology for real-time analysis, we have engaged in the
ongoing project named SEMAR (Smart Environment Monitoring and Analytic in Real-time system), which
provides the IoT-Big Data platform for water monitoring. However, SEMAR does not have an analytical system
yet. This paper proposes the analytical system for water quality classification using Pollution Index method,
which is an extension of SEMAR. Besides, the communication protocol is updated from REST to MQTT.
Furthermore, the real-time user interface is implemented for visualisation. The evaluations confirmed that the
data analytic function adopting the linear SVM and Decision Tree algorithms achieves more than 90% for the
estimation accuracy with 0.019075 for the MSE. The processing time of the SEMAR system only takes an
average 0.5 seconds to process the data to be visualized.

Keywords: SEMAR, water condition monitoring, real-time analysis, IoT, big data, classification, machine
learning.

1. PENDAHULUAN dengan kesadaran akan pentingnya menjaga


kelangsungan ekosistem laut. Eksploitasi yang tidak
Indonesia adalah negara maritim dan negara
bertanggung jawab dan cenderung merusak
kepulauan yang terbentang lebih dari 17.000 pulau
mengakibatkan hanya sekitar 5% dari terumbu
dari Sabang sampai Merauke. Secara persentase luas
karang di Indonesia yang masih terjaga [1].
laut Indonesia adalah 70% dari luas Indonesia
Sebagian besar sungai di Indonesia mengalami
secara keseluruhan. Kekayaan laut Indonesia tidak
kerusakan ekosistem akibat pencemaran.
dapat terbantahkan lagi dan posisinya sangat vital
Pencemaran tersebut diantaranya bersumber dari
untuk menunjang kelangsungan hidup banyak
limbah industri dan rumah tangga [2]. Pada salah
masyarakatnya. Namun hal tersebut tidak dilandasi
satu Kota yang ada di Kalimantan Selatan
1
pencemaran air sungainya berada pada level Dalam penelitian ini dibutuhkan beberapa teori
mengkhawatirkan. Sebanyak 62% pencemaran air penunjang yang digunakan sebagai landasan dalam
sungai berasal dari limbah rumah tangga dan mengeksplorasi topik penelitian yang dilakukan.
sisanya 38% berasal dari limbah industri [3]. Beberapa topik pembahasan yang digunakan dalam
Kurangnya kesadaran warga, lemahnya pengawasan penelitian ini meliputi: Sumber Daya Air, Parameter
pemerintah dan keengganan mereka untuk Mutu Air, Metode Indeks Pencemaran, Teknologi
melakukan penegakan hukum yang benar Internet of Things dan Big Data.
menjadikan masalah pencemaran sungai menjadi hal 2.1. Sumber Daya Air
yang semakin mengkhawatirkan. Air merupakan Berdasarkan Undang-Undang Republik Indonesia
kebutuhan hajat hidup orang banyak sehingga perlu mengenai Sumber Daya Air No.7 Tahun 2004
untuk dilindungi agar dapat bermanfaat. Perlu menyebutkan bahwa sumber daya air adalah air,
adanya upaya untuk melestarikan, mengendalikan, sumber air, dan daya air yang terkandung di
mengawasi, untuk menjaga kualitas air atau dalamnya. Air adalah semua air yang terdapat pada,
mencapai kualitas air agar tetap dapat dimanfaatkan di atas, ataupun di bawah permukaan tanah,
secara berkelanjutan. Salah satu cara menjaga termasuk dalam pengertian ini air permukaan, air
kualitas air dengan upaya memonitoring kondisi air tanah, air hujan dan air laut yang berada di darat.
secara terus menerus yang dapat digunakan oleh Sumber Air adalah tempat atau wadah air alami
pihak terkait untuk mendapatkan penanganan lebih dan/atau buatan yang terdapat pada, di atas, ataupun
lanjut. Dalam upaya untuk mengatasi permasalahan di bawah permukaan tanah. Daya air adalah potensi
tersebut, telah dibangun sistem SEMAR (Smart yang terkandung dalam air dan/atau pada sumber air
Environment Monitoring and Analytics in Real-time yang dapat memberikan manfaat ataupun kerugian
system) dimana sistem ini terdiri dari: bagi kehidupan dan penghidupan manusia serta
a. Sistem monitoring kualitas air menggunakan lingkungannya [4]. Beberapa sumber air dapat
ROV yang dilengkapi dengan sensor kualitas air diperoleh dari lokasi yang berbeda-beda dan untuk
untuk mengetahui kondisi air pada sungai. Sistem pemanfaatan yang berbeda pula seperti yang
ini mampu dikendalikan secara jarak jauh dan tertuang pada acuan Peraturan Pemerintah Republik
mampu mengirim data ke pusat data melalui Indonesia nomor 82 tentang Pengelolaan Kualitas
komunikasi kabel dan atau nirkabel. Air dan Pengendalian Pencemaran Air tahun 2001.
b. Jaringan nirkabel mesh yang diadopsi untuk 2.3 Parameter Mutu Air
memperluas jangkauan komunikasi antara sensor Dalam menjaga kualitasnya perlu dilakukan
dan server. pengelolaan kualitas air dengan tujuan untuk
c. Sistem monitoring kondisi air portabel dan menjamin kualitas air yang diinginkan sesuai
berbiaya murah. peruntukannya agar tetap dalam kondisi alamiahnya.
d. Sistem monitoring terumbu karang pada perairan Pengelolaan kualitas air adalah upaya pemeliharaan
dangkal. air sehingga tercapai kualitas air yang diinginkan
e. Pusat data yang menggunakan teknologi Big sesuai peruntukannya untuk menjamin agar kualitas
Data. air tetap dalam kondisi alamiahnya [5]. Kualitas air
Pada sistem SEMAR, digunakan teknologi Big Data dapat diketahui dengan melakukan pengujian
yang berfungsi sebagai pusat data yang berasal dari tertentu terhadap air tersebut. Pengujian yang dapat
sensor-sensor yang digunakan. Penggunaan dilakukan menggunakan beberapa parameter yaitu
teknologi Big Data digunakan untuk mendukung parameter fisika, parameter kimia, parameter
proses monitoring yang dilakukan secara terus mikrobiologi dan parameter radioaktivitas. Indikator
menerus dan realtime yang akan menghasilkan data yang sering kali digunakan dalam pemeriksaan
yang semakin lama semakin besar. Namun, hingga pencemaran air adalah pH atau konsentrasi ion
saat ini SEMAR belum memiliki sistem analisa. hidrogen, oksigen terlarut (Dissolved Oxygen, DO),
Dalam perkembangannya, SEMAR sebagai kebutuhan oksigen biokimia (Biochemiycal Oxygen
platform monitoring membutuhkan sebuah sistem Demand, BOD) serta kebutuhan oksigen kimiawi
yang dapat menganalisa data-data yang diterima (Chemical Oxygen Demand, COD). Namun pada
oleh server secara realtime sebelum disimpan ke penelitian yang digunakan penulis untuk
dalam Big Data. Sekaligus juga sebuah sistem yang pemeriksaan pencemaran air menggunakan
dapat digunakan untuk melakukan analisa terhadap beberapa parameter yang terdapat pada sensor air
data-data yang telah tersimpan di dalam Big Data. ‘Atlas Scientific’ yaitu potential of Hydrogen (pH),
Sehingga kami melakukan penelitian untuk Dissolved Oxygen (DO), Temperature, Electrical
membangun ekstensi SEMAR untuk melakukan Conductivity (EC), Oxidation Reduction Potential
analisa data secara realtime. Dengan adanya sistem (ORP). Sensor EC telah dikembangkan untuk dapat
analisa data air yang realtime, data air yang masuk mengkalkulasi nilai perkiraan dari Total Dissolved
tidak hanya akan sekedar disimpan pada Big Data, Solids (TDS), Salinity, dan Specific Gravity (SG).
namun juga dapat menghasilkan informasi baru Sebagai tambahan dalam penelitian ini, penulis
mengenai kondisi air terkini. menggunakan beberapa sumber data air baku
2. KAJIAN PUSTAKA PDAM, yaitu: Sensor air PDAM dengan masa
percobaan dari Maret hingga Agustus 2016, Data pencemaran dari sampel air/ data air yang diterima
laporan laboratorium PDAM mulai tahun Januari oleh sistem secara realtime. Implementasi skor,
2014 hingga Oktober 2016. Untuk sensor air PDAM keterangan dan label Indeks Pencemaran dapat
menggunakana area Ngagel dengan parameter input dilihat pada tabel 2.1. Kategori indeks pencemaran
yang digunakan yaitu temperature, Nephelometric yang terdiri dari 4 kategori ditranslasikan ke dalam
Turbidity Unit (NTU), Total Suspended Solids 4 label yang masing-masing diwakili oleh angka 0,
(TSS), pH, dan DO. Sedangkan data uji 1, 2 dan 3.
laboratorium PDAM mulai tahun Januari 2014 Tabel 2.1. Label Indeks Pencemaran
hingga Oktober 2016, menggunakan data Score Keterangan Label
laboratorium dengan hanya menggunakan 5 0 ≤ IP ≤ 1.0 memenuhi baku 0
parameter dari 20 parameter yang ada, yaitu suhu, mutu (kondisi baik)
NTU, TSS, pH, dan DO. 1.0 ≤ IP ≤ 5.0 tercemar ringan 1
2.3 Metode Indeks Pencemaran 5.0 ≤ IP ≤ 10.0 tercemar sedang 2
Indeks pencemaran (Pollution Index) IP ≥ 10.0 tercemar berat 3
digunakan untuk menentukan tingkat pencemaran Dari tabel 2.1 diperoleh empat label kelas yang
relatif terhadap parameter yang diijinkan [9]. Indeks memungkinkan pada dataset yang akan digunakan.
Pencemaran (IP) memiliki konsep yang berlainan Pada label digunakan data numerical untuk
dengan Indeks Kualitas Air (Water Quality Index). memudahkan proses learning. Label 0 untuk data
Indeks Pencemaran (IP) ditentukan untuk suatu yang memenuhi baku mutu, label 1 untuk data yang
peruntukan, kemudian dapat dikembangkan untuk tercemar ringan, label 2 untuk data yang tercemar
beberapa peruntukan bagi seluruh bagian badan air sedang, dan label 4 untuk data yang tercemar berat.
atau sebagian dari suatu sungai. Perhitungan Nantinya hasil klasifikasi realtime akan
penentuan status mutu air menggunakan metode ditranslasikan kembali ke data kategorikal sesuai
Indeks Pencemaran diatur pada Keputusan Menteri dengan keterangan status indeks pencemaran.
Negara Lingkungan Hidup No 115 Tahun 2003 2.4 Teknologi Internet of Things & Big Data
tentang Pedoman Penentuan Status Mutu Air [10]. Perkembangan Internet of Things (IoT), tidak
Pengelolaan kualitas air atas dasar Indeks lepas dari konsep dasarnya yaitu untuk
Pencemaran (IP) dapat memberikan masukan pada menghubungkan obyek yang satu dengan obyek
pengambil keputusan agar dapat menilai kualitas yang lainnya (Things) secara bersama-sama,
badan air untuk suatu peruntukan. Kemudian sehingga memungkinkan untuk saling
melakukan tindakan untuk memperbaiki kualitas berkomunikasi satu sama lain. Menurut definisi, IoT
jika terjadi penurunan kualitas akibat kehadiran digambarkan sebagai:
senyawa pencemar. Jika ij merupakan konsentrasi “a global insfrastructure for the information
parameter kualitas air yang dicantumkan dalam society, enabling advanced services by
baku peruntukan air (j), dan i dinyatakan sebagai interconnecting (physical and virtual) things based
konsentrasi parameter kualitas air (i) yang diperoleh on existing and evolving interoperable information
dari hasil analisis dari suatu lokasi pengambilan dari and communication technologies (ICT)”. [11]
suatu alur sungai, maka j adalah Indeks Pencemaran Melalui penerapan konsep teknologi IoT dengan
bagi peruntukan (j) yang merupakan fungsi dari dan interkoneksi antara dunia fisik dengan dunia maya,
ditentukan dari resultan nilai maksimum (M) dan baik melalui eksploitasi identifikasi, pengambilan
nilai rerata (R) rasio konsentrai perparamter data, pengolahan data, dan kemampuan dalam
terhadap nilai baku mutunya. Metode Indeks berkomunikasi, membuka peluang baru dalam
Pencemaran [10] dapat dihitung menggunakan dimensi IoT untuk mengakses apapun, setiap saat
formula 2.1. dan dari tempat manapun. Seperti yang
digambarkan pada Gambar 2.1 mengenai dimensi
√(c i )M2 +(c i )R2
Lij Lij
IoT menurut ITU-T Y.2060.
IPj = (2.1)
2
Evaluasi terhadap nilai j dapat menentukan kategori
kelas Indeks Pencemaran:
a. 0 ≤ IP ≤ 1.0, memenuhi baku mutu (kondisi baik)
b. 1.0 ≤ IP ≤ 5.0, tercemar ringan
c. 5.0 ≤ IP ≤ 10.0, tercemar sedang
d. IP ≥ 10.0, tercemar berat
Pada penelitian ini, penulis menggunakan
pembagian kelas berdasarkan pada hasil perhitungan
Indeks Pencemaran. Dari pembagian kelas Indeks
Pencemaran tersebut akan ditentukan label dari
masing-masing kelas. Pelabelan dibutuhkan dalam Sumber: Recommendation ITU-T Y.2060, 2012
proses learning dari dataset yang digunakan. [11] Gambar 2.1. Dimensi IoT menurut ITU-T
Dimana label akan menunjukkan kategori indeks Y.2060
Berikut adalah karakteristik dasar dari IoT, sampel air secara manual. Dan hasil dari sensor
yang memberikan gambaran yang lebih jelas dapat langsung dikirim ke server melalui
mengenai Internet of Things: a. Interkonektivitas, di internet; 2) Wireless Mesh Network [38], dalam
dalam IoT, apapun (things) bisa saling berhubungan SEMAR kami menggunakan teknologi wireless
dengan informasi global dan juga infrastruktur mesh untuk memperlebar jangkauan
komunikasi. b. Layanan yang berkaitan pada objek komunikasi antara sensor dan server; 3)
(things), dimana IoT mampu memberikan layanan Portable Water Quality Monitoring System
terkait dengan objek-objek yang saling berhubungan [39], kami mengembangkan sebuah alat
termasuk dalam hal keterbatasan seperti portable dan murah untuk pemantauan kualitas
perlindungan privasi maupun kosistensi semantik air yang hasilnya dapat langsung dikirm ke
baik teknologi informasi di dunia fisik maupun server; 4) Coral Reef Monitoring System [40],
dunia maya. c. Heterogenitas, meliputi interaksi sistem ini dibangun untuk melakukan
perangkat IoT yang heterogen karena berdasarkan monitoring terhadap kondisi karang pada
platform hardware yang berbeda dan jaringan yang perairan dangkal dengan menggunakan kamera
digunakan. d. Perubahan dinamis, dimana keadaan aktif dan datanya langsung dikirim ke server; 5)
perangkat berubah secara dinamis misalkan saat Big Data Storage Architecture [41], data dari
perangkat terhubung atau terputus maupun kondisi sensor dikumpulkan dan disimpan pada Hadoop
“sleep” serta kondisi “waking up”. Selain itu, dapat server dengan dukungan HDFS, Yarn, dan
ditinjau dari jumlah perangkat dapat berubah secara MapReduce.
dinamis. e. Skala “Enormous”: Jumlah perangkat b. Modaresi et. al. [42], telah melakukan studi
yang perlu dikelola dan berkomunikasi satu sama mengenai klasifikasi kualitas air menggunakan
lainnya dapat berkembang lebih besar dengan metode Indeks Kualitas Air CCME (Canadian
perangkat yang terhubung ke internet saat ini. Council of Minister of the Environment)
Bahkan yang lebih penting, pengelolaan data yang dengan 2 parameter yaitu Nitrate and Chloride.
dihasilkan dan interpretasi untuk tujuan aplikasi Dalam penelitian ini menggunakan 3 algoritma
[11]. yaitu Support Vector Machines, Probabilistic
3. METODE PENELITIAN Neural Networks, and K-Nearest Neighbor.
Metode yang digunakan dalam penelitian ini adalah Hasil penelitian tersebut menunjukkan
metode eksperimental. Metode ekperimen ini algoritma SVM menampilkan best performance
meliputi studi literatur dengan tidak ada error pada proses kalibrasi dan
3.1 Metode Pengumpulan Data validasi. Ladjal et al. [43], juga telah
Metode Pengumpulan Data Sebagai Berikut : melakukan studi mengenai klasifikasi kualitas
1. Metode Opservasi air menggunakan Dempster-Shafer Theory.
Pada tahapan ini penulis melakukan penelitian Dalam penelitian ini menggunakan 4 parameter
secara langsung untuk mengumpulkan data-data yaitu Temperature, pH, Conductivity, dan
dan objek yang dipakai dalam penelitian. Turbidity. Algoritma yang digunakan adalah
2. Perancangan dan Implementasi ANN dan SVM. Hasil dari penelitian ini
Pada penelitian ini sumber data-data didapatkan menunjukkan algoritma SVM memiliki
dari penelitian yang sebelumnya kemudian performa yang lebih baik dibandingkan
dibandingkan, agar saat implementasi dapat menggunakan ANN. Jaloree et al. [44], juga
terlaksana dengan baik. telah melakukan studi mengenai klasifikasi
3. Pengujian Alat kualitas air menggunakan algoritma Decision
Tahap akhir dalam penelitian ini adalah Tree. Parameter yang digunakan dalam
pengujian terhadap sistem pemantauan kualitas penentuan kualitas air adalah pH, DO, BOD,
mutu air yang ada di area pabrik sekitar. No3_N, dan NH3_N. Dimana hasil dari proses
3.4.2 Penelitian Terkait training menunjukkan tingkat akurasi
Berikut ini mengenai penelitian terkait yang 95.4545%. Saghebian et al. [45] telah
mencoba untuk menyelesaikan permasalahan dalam melakukan study tentang klasifikasi kualitas air
penelitian ini antara lain: menggunakan Decision Tree. Hasil study
a. SEMAR terdiri dari: 1) ROV Water Quality menunjukkan Decision Tree mampu
Monitoring System [37], ide tentang ROV memproses dataset yang digunakan. Hasil studi
Water Quality Monitoring System berdasarkan juga menunjukkan rata-rata CCI (Correctly
pada pengalaman Badan Lingkungan Classified Instances) dan Statistik Kappa untuk
pemerintah yang biasanya mengambil sampel prediksi kualitas air berada pada angka 0.88 dan
untuk memonitor kondisi air sungai. Pada 0.83%. Keempat penelitian di atas dalam
penelitian ini kami mengajukan cara yang pengaplikasiannya belum mendukung proses
berbeda dengan mengkombinasikan Remotely klasifikasi realtime dan belum terintegrasi
Operated Vehicle (ROV) atau robot air kecil dengan teknologi Big Data.
yang dapat dikontrol dengan sensor kualitas air. c. Fazio et al. [46], telah melakukan studi
Dengan alat ini, petugas tidak perlu mengambil mengenai implementasi big data sebagai media
penyimpanan untuk Smart Environment air yang tersebar di beberapa titik sepanjang sungai
Monitoring. Dalam penelitian tersebut yang mengaliri kota Surabaya. Sensor kualitas air
digambarkan secara umum mengenai System in yang digunakan pada penelitian ini adalah ‘Atlas
Cloud environment for Advanced Multi-risk Scientific’ kit sensor yang terdiri dari sensor
Management (SIGMA) yang merupakan bagian Potential of Hydrogen (pH), Oxidation Reduction
dari Italian National Operative Program (PON). Potential (ORP), Dissolved Oxygen (DO), Electrical
Project tersebut diharapkan dapat Conductivity (EC) dan Temperature.
mengakomodir segala macam data yang Untuk kontroler digunakan sistem benam jenis
bersumber dari berbagai environment. Dalam Raspberry Pi tipe 3. Sistem benam ini menggunakan
system tersebut belum terlihat gambaran adanya sistem operasi Raspbian, dimana sistem operasi ini
proses Big Data Analytic. berbasis Debian GNU/Linux yang telah
dimodifikasi untuk dapat berjalan pada sistem
4. PEMBAHASAN DAN HASIL benam Raspberry Pi. Dalam menghubungkan antara
4.1 DESAIN SISTEM sensor dan kontroller digunakan kabel USB-to-
Dalam penelitian ini digunakan teknologi Internet of serial. Pada penelitian ini terdapat 7 titik lokasi yang
Things dan Big Data dalam mengembangkan dan tersebar di sepanjang sungai kota Surabaya dan akan
mendesain sistem. Secara umum desain sistem mengambil data dari sensor air secara periodik yaitu
didasarkan pada tujuh lapisan pada teknologi tiap 5 detik. Pada sistem benam dibangun sebuah
Internet of Things yang dapat dilihat pada gambar aplikasi yang digunakan untuk melakukan
4.1. Pengadopsian teknologi Big Data akan penerimaan data dari sensor, pengiriman data ke
diintegrasikan ke dalam beberapa lapisan dari IoT. server, dan penyimpanan data ke penyimpanan lokal
sistem benam sebagai backup. Algoritma aplikasi
node sensor dapat dilihat pada gambar 4.4.

Gambar 4.3 Algoritma aplikasi pada node sensor


Dari gambar 4.3 terdapat beberapa proses yaitu
Gambar 4.1 Gambaran Umum Sistem
proses pengambilan info sensor berupa sensor ID,
Integrasi dari keseluruhan layer akan menghasilkan
latitude dan longitude dari lokasi node sensor.
sebuah platform yang digunakan untuk tujuan
Setelah itu dilakukan proses perulangan untuk
tertentu seperti platform untuk monitoring
melakukan pengambilan waktu sistem, pengambilan
lingkungan, kesehatan, lalu lintas, dll. Dalam
data sensor dengan menggunakan pySerial.
penelitian ini akan dihasilkan sebuah platform yang
Keseluruhan data kemudian dikirim menggunakan
dapat digunakan untuk monitoring lingkungan,
protokol MQTT dan selanjutnya disimpan secara
utamanya lingkungan air. Gambar 4.2 menunjukkan
lokal sebagai data backup. Data yang dikirim
detail desain sistem yang dibangun dalam penelitian
berbasis teks dengan data antar sensor dipisahkan
ini yang didasarkan pada tujuh lapisan Internet of
dengan koma dengan urutan: ID Sensor, Latitude,
Things. Desain sistem terdiri dari 7 tahapan sesuai
Longitude, Date, Time, ORP, pH, EC, TDS, Sal,
pada lapisan dari Internet of Things yang menjadi
SG, DO dan Temperature. Dalam protokol MQTT
dasar sistem dalam penelitian ini dibangun meliputi:
node sensor bertindak sebagai MQTT Publisher,
merupakan pihak yang mengirim data ke MQTT
Broker (server). Komunikasi MQTT menggunakan
port 1883. Pengiriman data menggunakan topik
‘watermonitoring’. Aplikasi pada node sensor ini
dibangun menggunakan bahasa pemrograman
Python.
2. Connectivity
Dalam penelitian ini sebagai media
komunikasi antara node sensor yang dipasang di
sepanjang sungai di Kabupaten Kotabaru dekat
industri dan server terpusat penerima data
Gambar 4.2 Desain Sensor Kualitas Air digunakan modem 4G. Modem 4G yang digunakan
1. Physical Devices & Controllers menggunakan protokol IEEE 802.11n. Sementara
Physical Devices & Controllers merupakan node- untuk konektivitas antara embedded system dengan
node yang telah dilengkapi dengan sensor kualitas modem menggunakan jaringan Wifi. Sistem
pengalamatan IP pada embedded system yang
digunakan, menggunakan DHCP (Dynamic Host proses ini terpisah dengan proses klasifikasi
Configuration Protocol) yang dikontrol melalui realtime. Hal ini untuk memangkas waktu proses
modem. Modem USB 4G bekerja sebagai router klasifikasi agar lebih cepat, dikarenakan pada proses
yang menghubungkan koneksi WAN dengan penyimpanan data ke Hadoop HDFS terdapat delay
menggunakan LTE dengan jaringan LAN yang waktu untuk proses MapReduce. Penggunaan Hive
terhubung melalui wireless LAN. Dalam pengujian untuk query penyimpanan data dengan
didapatkan throughput sekitar 20 Mbps. pertimbangan kemudahan dalam penggunaan karena
3. Edge Computing menggunakan query yang mirip dengan query SQL.
Bagian ini membahas proses penerimaan data Selain itu dalam sistem ini tidak terdapat kebutuhan
dari node sensor oleh server. Pada sisi server data akan akses realtime terhadap data yang disimpan.
diterima oleh MQTT Broker. Sesuai dengan skema Data-data hasil pengukuran air yang tersimpan pada
dari komunikasi MQTT yang menggunakan node Hadoop HDFS, selanjutnya jika dibutuhkan dapat
perantara (Broker). Pada penelitian ini digunakan diload secara batch dengan menggunakan query
‘Mosquitto’ sebagai MQTT Broker. Data yang Hive.
diterima oleh server memiliki basis yang sama 5. Data Abstraction
dengan data yang dikirim oleh node sensor dan Data Abstraction merupakan proses pengaksesan
disimpan pada topic ‘watermonitoing’. Nantinya data yang telah diterima oleh server. Pada tahap ini,
aplikasi yang membutuhkan data tersebut akan digunakan Kafka Broker untuk melakukan
melakukan consume/subscribe ke Broker melalui pengambilan data dari MQTT Broker (Mosquitto)
topik dan port yang sama. dan untuk diteruskan kepada lapisan di atasnya.
4. Data Accumulation Pendistribusian data yang dilakukan secara langsung
Data Accumulation merupakan proses dari Mosquitto bertujuan untuk memangkas waktu
penyimpanan data yang diterima dari node-node ke pemrosesan data. Selanjutnya data pada Kafka
Hadoop HDFS. Sebelum melakukan proses Broker akan disubscribe/di-consume oleh aplikasi
penyimpanan, data pada MQTT Broker (Mosquitto) yang membutuhkan, baik itu untuk proses analisa
didistribusikan ke Kafka Broker. Jadi pada sisi maupun untuk proses visualisasi. Dalam
server, proses selanjutnya MQTT Broker akan pengimplementasiannya, Kafka identik dengan
digantikan oleh Kafka Broker. Proses MQTT hanya berbeda pada penggunaan istilah.
pendistribusian data dari Mosquitto ke Kafka Pada Kafka aplikasi yang mengirim data disebut
Broker membutuhkan sebuah kode program, karena Kafka Producer, aplikasi yang menerima disebut
secara default keduanya belum saling mendukung Kafka Consumer, sementara perantara keduanya
satu sama lain. Kode yang digunakan yaitu disebut Kafka Broker. Data-data yang diterima juga
MQTTKafkaBridge [49], yang ditulis menggunakan disimpan dalam topik tertentu. Dalam penelitian ini
Bahasa pemrograman Java. Cara kerja dari data yang berasal dari node sensor diberi nama
MQTTKafkaBridge adalah mendistribusikan data ‘watermonitoring’, sementara data hasil analisa
secara lansgung data yang diterima oleh MQTT nantinya akan diberi nama ‘wateranalytic’. Data
Broker ke Kafka Broker dan disimpan pada topik pada lapisan ini yang akan di-concume oleh aplikasi
yang sama. Hal ini menyebabkan data pada Kafka analisa realtime.
Broker juga memiliki topik yang sama dengan data Lij merupakan konsentrasi parameter kualitas air
pada Mosquitto yaitu ‘watermonitoring’. Apache sesuai dengan nilai baku mutu yang digunakan pada
kafka digunakan untuk memudahkan air (j), and i merupakan konsentrasi parameter
pendistribusian dan manajemen data pada sistem kualitas air (i) yang diambil pada lokasi atau pada
yang sedang berjalan. Apache kafka juga aliran sungai tertentu, kemudian Ij adalah Pollution
mendukung stream processing untuk aplikasi yang Index untuk air (j) yang merupakan fungsi dari dan
membutuhkan ketersediaan data stream. Apache ditentukan dari resultan nilai maksim um (M) dan
kafka juga memiliki kapasitas cache yang lebih nilai rerata (R) dari tiap parameter terhadap nilai
besar dibanding Mosquitto, sehingga data yang baku mutunya. Selanjutnya nilai Ij dievaluasi dan
berasal dari sensor tidak akan hilang jika terjadi dapat ditentukan kategori Indeks Pencemaran
masalah pada aplikasi di server. Dengan sebagaimana pada tabel 3.2:
menggunakan Kafka juga akan memudahkan Tabel 4.1 Penentu Label Indeks Pencemaran
penyediaan data antar lapisan pada IoT saat Score Keterangan Label
dikombinasikan dengan Big Data. 0 ≤ IP ≤ 1.0 memenuhi baku 0
Data yang ada pada Kafka Broker selanjutnya mutu (kondisi baik)
secara stream dibaca oleh Spark dan menghasilkan 1.0 ≤ IP ≤ 5.0 tercemar ringan 1
tipe data RDD yang kemudian di-buffer selama 10 5.0 ≤ IP ≤ 10.0 tercemar sedang 2
detik. Setiap 10 detik, data yang di-buffer tersebut IP ≥ 10.0 tercemar berat 3
akan diload ke Hadoop HDFS menggunakan query
Hive. Query Hive dilakukan menggunakan Spark Adapun untuk standar kualitas air yang digunakan
SQL. Data tersebut disimpan ke dalam tabel sebagai pembanding dalam menentukan Indeks
‘watermonitoringku’. Aplikasi yang dibangun pada Pencemaran adalah Peraturan Pemerintah Nomor 82
tahun 2001 tentang penentuan standar kualitas air,
Peraturan Daerah Provinsi Jawa Timur nomor 2
tahun 2008 tentang Pengelolaan Kualitas Air dan
Pengendalian Pencemaran Air Di Provinsi Jawa
Timur, Peraturan Daerah Kota Surabaya nomor 02
tahun 2004 tentang Pengelolaan Kualitas Air dan
Pengendalian Pencemaran Air, dan peraturan
Menteri Kesehatan nomor
492/MENKES/PER/IV/2010 tentang Persyaratan
Kualitas Air Minum sebagaimana yang dapat dilihat
pada tabel 4.2
Tabel 4.2 Kategori Indeks Pencemaran
Score Keterangan Label
0 ≤ IP ≤ 1.0 memenuhi baku 0 Gambar 4.4 Dataset uji laboratorium setelah
mutu (kondisi baik) preprocessing
1.0 ≤ IP ≤ 5.0 tercemar ringan 1 Gambar 4.5 menunjukkan dataset live sensor setelah
5.0 ≤ IP ≤ 10.0 tercemar sedang 2 preprocessing, dimana data-data yang dihasilkan
IP ≥ 10.0 tercemar berat 3 sudah tidak memiliki missing/corrupt value,
Adapun untuk standar kualitas air yang digunakan inkonsistensi nilai, dll
sebagai pembanding dalam menentukan Indeks
Pencemaran adalah Peraturan Pemerintah Nomor 82
tahun 2001 tentang penentuan standar kualitas air,
Peraturan Daerah Provinsi Kalimantan Selatan
nomor 2 tahun 2008 tentang Pengelolaan Kualitas
Air dan Pengendalian Pencemaran Air Di
Kalimantan Selatan, Peraturan Daerah Kabupaten
Kotabatu nomor 02 tahun 2004 tentang Pengelolaan
Kualitas Air dan Pengendalian Pencemaran Air, dan
peraturan Menteri Kesehatan nomor
492/MENKES/PER/IV/2010 tentang Persyaratan
Kualitas Air Minum sebagaimana yang dapat dilihat
pada tabel 4.3
Tabel 4.3 Standar Kualitas Air Gambar 4.5 Dataset sensor live setelah
No Parameter Standar preprocessing
1 Turbidity 5
2 Tss 10 4.2 Desain Big Data Server
3 PH 6-9 Dalam membangun platform Big Data digunakan
4 DO Minimum 6 tiga buah komputer server untuk membangun server
5 Temperature 25°C ± 3°C Big Data dengan skema multi node cluster. Master
Data yang telah dilakukan preprocessing data, node akan berperan sebagai titik sentral, yang
selanjutnya dilakukan proses training dataset. Spark mengatur proses pendistribusian data, pengalokasian
MLlib telah memiliki dukungan terhadap beberapa cpu dan memory untuk job-job yang akan
algoritma klasifikasi, klastering dan regresi. dijalankan. Dengan implementasi multi node cluster
Sebagaimana dari penelitian yang telah dilakukan permasalahan akan terbatasnya ruang penyimpanan,
peneliti-peneliti sebelumnya, maka digunakan dua cpu, maupun memory dapat teratasi. Nantinya jika
algoritma klasifikasi yag kemudian hasilnya ketiga server masih kurang, dapat ditingkatkan
dibandingkan yaitu Support Vector Machine dan hanya dengan menambahkan node pada sisi slave
Decision Tree. Dataset uji laboratorium setelah sehingga tidak akan mengganggu sistem secara
preprocessing dapat dilihat pada gambar 4.4, dimana keseluruhan. Dengan impelementasi multi node
data yang dihasilkan sudah tidak memiliki missing/ cluster ini, kemungkinan akan adanya data yang
corrupt value, inkonsistensi nilai, dll. rusak dapat teratasi karena sifat dari Hadoop yang
melakukan replikasi data pada semua node.
Sementara Hadoop single-node diimplementasikan
pada satu mesin. Mesin tersebut didesain menjadi
master tetapi dapat bekerja juga sebagai slave dan
semua proses distribusi dilakukan dalam satu mesin
tersebut. Pada Hadoop terbagi menjadi dua layer
yaitu layer HDFS yang menjalankan Namenode dan
Datanode sedangkan layer MapReduce yang
menjalankan Jobtracker dan Tasktracker. Kedua
layer ini sangat penting terutama Namenode dan b. Install dan konfigurasi sistem Operasi (Debian 8)
Jobtracker, karena apabila dua bagian ini tidak c. Konfigurasi jaringan komputer.
berjalan maka kerja HDFS dan Mapreduce tidak d. Install Java Development Kit (JDK), OpenSSH-
bisa dijalankan. Pada mesin single node, Datanode Server, Rsync
dan Tasktracker hanya ada satu, jika memiliki mesin e. Buat user dan group untuk hadoop
yang banyak maka kedua bagian ini terbentuk pada f. Mapping node-node yang ada.
setiap mesin (multinode). Gambar 3.16 g. Konfigurasi SSH agar mendukung autologin baik
menunjukkan desain infrastruktur server dengan pada master maupun slave.
skema multinode cluster h. Instalasi Hadoop dan konfigurasi Hadoop
Environment pada node master dan slave.
Untuk dapat menggunakan Hadoop sesuai
kebutuhan maka ada beberapa property dasar yang
perlu diatur. Diantaranya adalah yarn-site.xml, core-
site.xml, hdfs-site.xml, mapred-site.xml dan file
bashrc pada user home.

5. PENUTUP
Gambar 4.6. Desain infrastruktur serve
5.2 Kesimpulan
Ketiga server menggunakan IP Public sehingga
dapat diakses dari manapun, konfigurasi alamat IP Pada penelitian ini bertujuan untuk
pada ketiga server dapat dilihat pada tabel 4.4. membangun sistem klasifikasi realtime air
Throughput masing-masing node ke node lainnya sungai dengan menggunakan teknologi IoT dan
adalah sekitar 1 Gbps Big Data. Dimana dalam
Tabel 4.4. Konfigurasi alamat IP pengeimplementasiannya dikembangkan
sebuah platform IoT yang terdiri dari 7 lapisan
IoT dan diintegrasikan dengan teknologi Big
Data pada beberapa lapisan tersebut.
Penggunaan teknologi Big Data utamanya
berada pada sisi penyimpanan, analisa dengan
4. Pengembangan Big Data Framework
Dalam rangka memenuhi kebutuhan sistem akan klasifikasi, dan manajemen data dalam server.
teknologi Big Data, maka dilakukan pembangunan Hasil klasifikasi dengan menggunakan
Big Data Framework. Beberapa teknologi Big Data algoritma Linear SVM dan Decision Tree
yang digunakan adalah Apache Hadoop sebagai menunjukkan performa yang baik, dimana
komponen utama dalam manajemen data pada Big akurasinya berada pada level di atas 90%. Pada
Data yang terdiri dari HDFS, Yarn, dan dataset uji laboratorium algoritma Linear SVM
MapReduce. Apache Hive untuk memaksimalkan menunjukkan akurasi sebesar 0.935897
dan memudahkan penyimpanan data ke dalam sedangkan Decision Tree 0.994872. Sementara
Hadoop HDFS menggunakan SQL Query untuk dataset sensior live algoritma Linear
Language, Apache Spark sebagai tool machine
SVM menunjukkan akurasi sebesar 0.993634
learning yang handal, baik untuk analisa batch
maupun stream. Apache Kafka untuk proses sedangkan Decision Tree 0.999251. Hal ini
distribusi data antar lapisan pada Big Data. dapat disimpulkan bahwa algoritma Decision
Apache Hadoop merupakan salah satu distribusi Tree memiliki akurasi yang lebih baik
big data yang dikembangkan oleh Apache Software dibandingkan dengan algoritma Linear SVM.
Foundation. Apache Hadoop ini dibangun dengan Dimana algoritma Decision Tree memiliki rata-
lisensi free dan open source. Dalam penelitian ini rata tingkat akurasi sebesar 0.9970615 dan
digunakan Apache Hadoop sebagai framework algoritma Linear SVM sebesar 0.9647655.
untuk Big Data dengan versi 2.6.0. Instalasi dan Pengujian hasil validasi yang telah dilakukan
konfigurasi dilakukan pertama kali pada komputer pada dataset uji laboratorium maupun dataset
yang bertindak sebagai hadoop-master (single
sensor live berdasarkan grafik ROC dengan
node), untuk menjadikan multinode cluster akan
dilakukan synkronisasi dengan komputer slave dan nilai Area Under ROC menunjukkan di atas
dengan melakukan perubahan konfigurasi yang angka 0.9. Dengan demikian dapat dikatakan
minimal pada node. Secara garis besar tahapan bahwa unjuk kerja nilai Area Under ROC
instalasi dan konfigurasi Big Data Hadoop adalah menunjukkan kinerja ‘Excellent’. Sistem yang
sebagai berikut: dibangun hanya membutuhkan rata-rata 508
a. Persiapkan komputer baik yang akan dijadikan miliseconds dalam memproses data oleh server
sebagai node master dan node slave yang diterima dari node sensor. Hal ini
menunjukkan sistem platform IoT-Big Data
yang dibangun memiliki kinerja yang sangat [6] Menteri Kesehatan, Peraturan Menteri
baik. Kesehatan nomor
5.2 Saran 492/MENKES/PER/IV/2010 tentang
Berdasarkan hasil penelitian tesis desain dan Persyaratan Kualitas Air Minum,
implementasi IoT-Big Data analytic pada 2010.
Smart Environment Monitoring system maka [7] Nemerow, Nelson Leonard. Scientific
dapat disarankan: Stream Pollution Analysis.
a. Pengembangan sistem monitoring McGrawHill, 1974.
lingkungan yang tidak hanya dapat [8] Menteri Negara Lingkungan Hidup,
melakukan analisa teks, tapi juga dapat Keputusan Menteri Negara
melakukan analisa terhadap gambar secara Lingkungan Hidup Nomer 115 tahun
realtime. 2003 tentang Pedoman Penentuan
b. Pengembangan online classification pada Status Mutu Air, 2003.
sistem SEMAR. [9] Recommendation ITU-T Y.2060,
c. Pengembangan penelitian yang ditujukan Overview of Internet of Thing, 2012.
untuk peruntukan monitoring pada [10] Cisco, The Internet of Things
lingkungan lainnya, seperti udara. Reference Model. White Paper, 2014.
d. Pengembangan sistem analisa untuk
kebutuhan clustering ataupun regression
pada data lingkungan.

DAFTAR PUSTAKA
[1] Hapsari, Ratih Indri, and Mohammad
Zenurianto. View of flood disaster
management in Indonesia and the key
solutions. American Journal of
Engineering Research 5, no. 3 (2016):
140-151.
[2] Zulkarnain, Muhammad Rizki, Suwito,
Tasripan. Sistem Monitoring Kualitas
Air Sungai yang Dilengkapi dengan
Data Logger dan Komunikasi Wireless
sebagai Media Pengawasan
Pencemaran Limbah Cair. Institut
Teknologi Sepuluh Nopember
Surabaya, 2014.
[3] Republik Indonesia, Undang-Undang
Republik Indonesia nomor 7 tahun
2004 tentang Sumber Daya Air, 2004.
[4] Republik Indonesia, Peraturan
Pemerintah nomor 82 tahun 2001
tentang Pengelolaan Kualitas Air dan
Pengendalian Pencemaran Air, 2001.
[5] Provinsi Kalimantan Selatan, Peraturan
Daerah Provinsi Kalimantan Selatan r
nomor 2 tahun 2008 tentang
Pengelolaan Kualitas Air dan
Pengendalian Pencemaran Air Di
Provinsi Kalimantan Selatan, 2008. 7.
Kabupaten Kotabaru, Peraturan Daerah
Kabupaten Kotabaru a nomor 2 tahun
2004 tentang Pengelolaan Kualitas Air
dan Pengendalian Pencemaran Air,
2004.

Anda mungkin juga menyukai