Abstract
Clustering is one of the methods that can be used to manage data
by grouping the data into a particular cluster. K-Means algorithm is used
to classify objects based on attribute into K cluster, where K is a positive
integer. The type of data used to cluster in this research is spatial data.
Spatial data will be normalized to Cartesian form and then processed by
clustering. Once the data processed, they will be displayed in a visual
form using Heatmap. Heatmap uses red to display objects with a maxi-
mum level of intensity and blue for the minimum. As a case study, this
research is applied to mineral potential in the Province of West Papua.
1. Pendahuluan
Data merupakan sekumpulan informasi atau nilai yang diperoleh melalui
observasi terhadap suatu obyek. Data dapat berupa angka, lambang atau sifat [1].
Pertumbuhan data yang makin pesat setiap harinya jika tidak dimanfaatkan dengan
baik akan tertimbun sia-sia. Oleh karena itu, data perlu dikelola dengan baik melalui
berbagai cara agar dapat menjadi informasi yang berguna.
Terdapat beberapa metode yang dapat digunakan untuk mengelola data, salah
satunya adalah clustering. Clustering merupakan kegiatan mengelompokkan objek
ke dalam suatu cluster, sehingga objek pada suatu cluster memiliki kemiripan yang
besar dengan objek lain pada cluster yang sama dan berbeda dengan objek pada
cluster lainnya. Beberapa metode yang dapat digunakan dalam mengembangkan
metode clustering antara lain metode parsial dan metode hirarki. Metode parsial
mengorganisir sejumlah data tertentu ke dalam kelompok yang lebih spesifik atau
cluster, sedangkan metode hirarki clustering mengelompokkan objek data ke dalam
sebuah hirarki atau pohon cluster [2].
Papua Barat sebagai salah satu Provinsi di Indonesia yang berpotensi
menghasilkan bahan tambang menjadi wilayah yang diminati oleh para investor untuk
menanam sahamnya. Setiap bahan tambang mempunyai karakteristik yang berbeda.
Seringkali hal ini menjadi kendala bagi investor untuk mengambil keputusan dalam
menentukan daerah yang akan digunakan sebagai wilayah usahanya di Provinsi
tersebut. Oleh karena itu, perlu adanya clustering mengenai data tersebut agar
101
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
dapat digunakan sebagai acuan dalam melakukan analisis untuk membantu dalam
menentukan pengambilan keputusan kedepannya.
Dalam penelitian ini, akan dilakukan clustering data menggunakan metode
parsial. Algoritma yang digunakan untuk melakukan proses clustering adalah
Algoritma K-Means. Data yang akan dikelompokkan dalam penelitian ini adalah
data potensi hasil tambang di Provinsi Papua Barat. Data yang digunakan dalam
proses clustering berupa data spasial dan kemudian akan dinormalisasi dalam bentuk
Kartesius. Setelah dinormalisasi, data tersebut dikelompokkan melalui clustering
kemudian dikembalikan dalam bentuk spasial dan disajikan secara visual berbasis
Heatmap. Provinsi Papua Barat sebagai daerah berkembang memerlukan media
yang dapat digunakan untuk mengenalkan kekayaan alam yang dimiliki. Salah satu
media yang dapat digunakan serta dapat diakses oleh banyak pihak adalah web.
Oleh rena itu, clustering yang dilakukan akan ditampilkan dalam sebuah aplikasi
web. Daerah yang berpotensi untuk menghasilkan hasil tambang yang banyak akan
ditampilkan Heatmap dengan warna merah dan yang kurang akan dengan warna
biru.
2. Kajian Pustaka
102
Perancangan Clustering Data (Tulus dan Hendry)
aplikasi sebagai alat bantu untuk menampilkan data terdistribusi dalam bentuk visual
sehingga lebih menarik dan mudah dibaca. Adapun aplikasi ini dibuat dengan tujuan
mempermudah pengguna dalam mencari data dalam basis data XML serta mudah
dalam mengambil kesimpulan dan atau keputusan manajerial [5].
Mengacu pada penelitian terdahulu, maka akan dilakukan penelitian yang
berjudul Perancangan dan Implementasi Clustering Data Menggunakan Algoritma
K-Means Berbasis Heatmap. Dalam penelitian ini, data yang akan dikelompokkan
adalah data spasial dari peta sebaran potensi bahan tambang di Provinsi Papua
Barat kemudian disajikan dalam sebuah aplikasi web menggunakan Heatmap.
Clustering merupakan salah satu teknik dalam data mining. Clustering
membagi objek ke dalam kelompok atau cluster tertentu, sehingga objek dalam
suatu cluster memiliki kemiripan dengan objek lain dalam cluster yang sama dan
berbeda dengan objek pada cluster yang lain. Kemiripan objek umumnya
didefinisikan berdasarkan jarak kedekatan antar objek yang ditentukan melalui fungsi
jarak [2].
103
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
104
Perancangan Clustering Data (Tulus dan Hendry)
Pada penelitian ini, dilakukan beberapa tahapan yang saling berkaitan antara
satu tahap dengan tahap lainnya. Flowchart tahapan penelitian yang dilakukan dapat
dilihat pada Gambar 3 [10].
105
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
Data yang dihasilkan dari pengumpulan data tersebut berupa peta sebaran potensi
tambang di Provinsi Papua Barat. Data tersebut kemudian diolah melalui tahap
pengujian pada sistem yang akan dibangun.
Adapun metode perancangan sistem yang digunakan dalam penelitian ini adalah
model Waterfall. Pendekatan model ini sistematis dan dan urut mulai dari level
kebutuhan sistem lalu menuju ke tahap analisis, desain, coding, testing / verification,
dan maintenance. Secara umum tahapan pada model Waterfall ditunjukkan pada
Gambar 4 [11].
Seperti yang terlihat pada Gambar 4, tahapan pertama yang dilakukan dalam
model Waterfall adalah analisis kebutuhan sistem. Pada tahap ini dilakukan identifikasi
kebutuhan data yang akan dibutuhkan sistetm yaitu data spasial. Data tersebut
diperoleh melalui tahap pengumpulan data dari tahapan penelitian yang dilakukan.
Tahapan kedua dari model Waterfall adalah desain sistem. Pada tahap ini
dilakukan perancangan sistem serta perancangan user interface dari aplikasi yang
akan dibangun. Perancangan dibuat menggunakan Unified Modeling Language
(UML). Adapun diagram yang dibuat adalah Use Case Diagram dan Activity
Diagram. Use Case Diagram menggambarkan interaksi yang terjadi antara aktor
dengan sistem. Use Case Diagram dari sistem yang akan dibangun dapat dilihat
pada Gambar 5.
Pada Gambar 5 terlihat bahwa terdapat satu aktor yaitu user dan beberapa
interaksi yang dapat dilakukan oleh aktor tersebut. Interaksi yang dapat dilakukan
oleh aktor adalah mengunduh file yang disediakan sistem sebagai contoh file yang
106
Perancangan Clustering Data (Tulus dan Hendry)
107
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
Pada Gambar 7, terlihat bahwa terdapat beberapa sub menu dari menu
utama Beranda yaitu Clustering, Algoritma K-Means dan Heatmap. Masing-masing
sub menu tersebut berisi definisi dari tiap sub menu itu sendiri. Selain Beranda,
terdapat juga menu utama Clustering dengan tampilan seperti pada Gambar 8.
108
Perancangan Clustering Data (Tulus dan Hendry)
Ketika user memilih sub menu Proses clustering melalui menu utama
Clustering, user akan diarahkan ke halaman dengan user interface seperti pada
Gambar 9. Pada Gambar 8 terdapat sebuah form yang harus dilengkapi oleh user
untuk melakukan proses clustering. User harus memasukkan jumlah cluster yang
diinginkan dalam proses clustering dengan jumlah cluster tersebut harus lebih dari
nol dan bernilai positif. Kemudian user juga harus mengunggah file yang datanya
akan diambil untuk proses clustering dengan menekan tombol UNGGAH. Setelah
file berhasil diunggah, user dapat menekan tombol PROSES untuk melakukan
clustering. Selanjutnya, ketika proses clustering berhasil dilakukan user akan
diarahkan pada halaman dengan user interface seperti pada Gambar 10.
109
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
110
Perancangan Clustering Data (Tulus dan Hendry)
yang dilakukan melalui proses pengujian akan digunakan dalam tahap penyimpulan
hasil sebagai kesimpulan dari penelitian.
Tahap terakhir dari model Waterfall adalah perawatan program. Pada tahap
ini dilakukan pemeliharaan terhadap aplikasi yang dibuat. Bentuk pemeliharaan yang
dapat dilakukan adalah dengan memperbaharui aplikasi atau membuat versi yang
baru untuk aplikasi ini.
Pada bagian hasil dan pembahasan akan dibahas penerapan dari tiap
perancangan yang sudah dibangun. Adapun hasil penerapan yang akan dibahas antara
lain proses melakukan clustering dan bagaimana menampilkan hasil clustering
tersebut menggunakan Heatmap dengan PHP dan Javascript.
Seperti yang telah dijelaskan sebelumnya mengenai clustering dan Algoritma
K-Means, maka yang dibutuhkan untuk melakukan clustering adalah nilai K sebagai
jumlah cluster serta data yang akan dikelompokkan. Data yang digunakan dalam
penelitian ini adalah data potensi hasil tambang di Provinsi Papua Barat berupa data
spasial dari peta sebaran potensi hasil tambang tersebut. Sebelum melakukan
clustering, data tersebut harus dinormalisasi terlebih dulu. Proses normalisasi data
spasial tersebut dapat dilihat pada Kode Program 1.
Pada baris satu dapat dilihat program memanggil fungsi normalisasi dengan
parameter nama database yang digunakan serta kolom yang berisi data latitude
dan longitude. Nilai yang dikembalikan dari fungsi tersebut adalah nilai terkecil dan
terbesar dari data yang akan dinormalisasi serta range yang diinginkan untuk proses
normalisasi tersebut. Pengkodean untuk normalisasi data terdapat pada baris 8 dan
baris 9 dari Kode Program 1.
Setelah melakukan proses normalisasi, proses selanjutnya adalah clustering.
Proses clustering dilakukan menggunakan Algoritma K-Means. Pengkodean untuk
proses clustering dapat dilakukan dengan memanggil beberapa fungsi pada program,
111
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
namun pada bagian ini hanya akan dibahas dua fungsi yaitu fungsi untuk menghitung
jarak berdasarkan rumus Euclidean Distance yang dapat dilihat dalam Kode
Program 2 dan fungsi untuk mengelompokkan data ke dalam cluster pada Kode
Program 3.
Pada Kode Program 2 terdapat fungsi jarak dengan parameter obj yaitu data
objek yang akan dikelompokkan serta cent sebagai centroid yang akan digunakan
untuk menghitung jarak. Fungsi jarak melakukan perhitungan jarak antara masing-
masing objek data ke centroid yang sudah ditentukan. Sesuai dengan penjelasan
mengenai Algoritma K-Means, maka langkah selanjutnya adalah mengelompokkan
tiap data ke dalam cluster.
112
Perancangan Clustering Data (Tulus dan Hendry)
Data yang dimasukkan oleh user adalah data mengenai potensi bahan
tambang di Provinsi Papua Barat dengan jumlah titik sebanyak 79 titik. Berdasarkan
hasil clustering pada Gambar 13, dapat dilihat bahwa nilai K yang dimasukkan
oleh user adalah dua sehingga jumlah cluster yang dibuat juga sebanyak dua cluster.
Selain itu, juga terdapat link Lihat Peta yang dapat digunakan untuk melihat peta
dari hasil clustering yang sudah dilakukan. Namun sebelum menampilkan peta,
data yang sudah dinormalisasi sebelumnya harus dikembalikan terlebih dahulu ke
dalam bentuk spasial. Data spasial tersebut kemudian ditampilkan dengan Heatmap.
Pengkodean untuk mengembalikan data dalam bentuk spasial dapat dilihat pada
Kode Program 4 dan untuk menampilkan data dengan Heatmap dapat dilihat pada
Kode Program 5.
113
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
1. downloadUrl(../Skripsi/fungsi/
map_xml.php?namadb=+namadb, function(data) {
2. var xml = data.responseXML;
3. var markers = xml.documentElement.getElementsByTagName
(marker);
4. for (var i = 0; i < markers.length; i++) {
5. var nama = markers[i].getAttribute(nama);
6. var cluster = markers[i].getAttribute(cluster);
7. var point = new google.maps.LatLng(
parseFloat(markers[i].getAttribute(lat)),
parseFloat(markers[i].getAttribute(lng)));
8. disk_points.push(point);
9. var html = <b> + nama + </b><br>Anggota <i>cluster</
i> + cluster;
10. var marker = new google.maps.Marker({position:
point});
bindInfoWindow(marker, map, infoWindow, html);
marker_array.push(marker);
11. }
12. });
13. pointArray = new google.maps.MVCArray(disk_points);
14. heatmap = new
google.maps.visualization.HeatmapLayer({
15. data: pointArray
16. });
17. heatmap.set(radius, 25);
18. heatmap.set(gradient, gradient);
19. heatmap.setMap(map);
114
Perancangan Clustering Data (Tulus dan Hendry)
115
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
116
Perancangan Clustering Data (Tulus dan Hendry)
Pada Tabel 2 dapat dilihat bahwa semakin besar nilai K yang diberikan tidak
mempengaruhi durasi clustering. Hal ini terlihat dari durasi clustering yang terus
berubah-ubah untuk tiap nilai K. Jika dilakukan proses clustering dengan nilai K
satu sampai sepuluh, maka durasi yang dihasilkan akan berbeda dengan hasil yang
terdapat pada Tabel 2. Berdasarkan hasil tersebut, dapat dikatakan bahwa durasi
clustering tidak bergantung pada nilai K yang diberikan dari pengujian penelitian
yaitu mendapatkan daerah yang paling berpotensi menghasilkan bahan tambang.
Hasil tersebut dapat dilihat pada Gambar 16.
117
Jurnal Teknologi Informasi-Aiti, Vol. 11. No.2, Agustus 2014 : 101 - 202
5. Simpulan
Berdasarkan hasil dan pembahasan dari penelitian yang dilakukan, maka dapat
diambil kesimpulan bahwa aplikasi clustering data dapat digunakan untuk
mengelompokkan data spasial melalui proses normalisasi terlebih dahulu dan
kemudian dikelompokkan menggunakan Algoritma K-Means. Data dikelompokkan
berdasarkan jarak terdekat objek bukan berdasarkan karakteristik objek. Dari hasil
pengujian yang dilakukan juga dapat diambil kesimpulan bahwa daerah yang
berpotensi menghasilkan bahan tambang untuk nilai K atau jumlah cluster empat
adalah daerah cluster tiga. Hal ini dapat menjadi informasi bagi investor atau
pengusaha di bidang pertambangan untuk menemukan wilayah yang berpotensi
menghasilkan tambang. Selain itu, aplikasi juga dapat menampilkan data yang sudah
dikelompokkan secara visual dengan menggunakan Heatmap.
6. Daftar Pustaka
[1] Situmorang, S. H., Muda. I., Dalimunthe, D. M. J., Fadli, Syarief, F., 2010,
Analisis Data : Untuk Riset Manajemen dan Bisnis, Medan : USU Press.
[2] Han, J., Kamber M., Pei, J., 2011, Data Mining : Technique and Concepts
3rd ed., San Fransisco, CA, USA : Morgan Kaufmann.
[3] Suryana, Nana, 2010, Penentuan Wilayah Usaha Pertambangan Menggunakan
Metode Fuzzy K-Mean Clustering Berbasis Sistem Informasi Geografi, Jurnal
Teknologi Mineral dan Batubara, 6 (4):204-215, http://
www.tekmira.esdm.go.id/newtek2/e-jurnal/Jurnal%20tekMIRA%20-
118
Perancangan Clustering Data (Tulus dan Hendry)
119