Anda di halaman 1dari 9

Tugas Manajemen Basis Data

Dosen : Dr. Achmad Solichin, M.T.I.

Makalah Data Mining

disusun oleh :

Nama : Muammad Rizky Hasan


NIM : 1811601309
KELAS : XB

PROGRAM MAGISTER ILMU KOMPUTER


UNIVERSITAS BUDI LUHUR
JAKARTA
2019
Implementasi Aplikasi Clustering untuk
Data Parkir pada Device Parkir menggunakan
Algoritma K- Means
Muhammad Rizky Hasan
Magister Ilmu Komputer, Universitas Budi Luhur
DKI Jakarta 12260, Indonesia
Email: harizflame@gmail.com

Abstract— Sistem parkir masih Kata Kunci : NFC, Parkir, Clustering,


banyak yang menggunakan sistem K-means
manual. Sistem yang berjalan adalah
seperti memberikan tiket oleh penjaga BAB I. Pendahuluan
parkir kepada pengunjung kemudian Klasifikasi dan kategorisasi (clustering)
pengunjung akan memberikan lagi merupakan masalah tradisional dalam
tiketnya kepada penjaga parkir ketika content mining. Dalam bidang content
ingin keluar. Sistem seperti ini mining, dua jenis metodologi digunakan,
memiliki keamanan yang rentan maka pertama adalah supervised dan kedua
dari itu dibuatlah device parking adalah unsupervised. Dalam metode
arduino menggunakan NFC pada penambangan teks unsupervised, data
penelitian sebelumnya di CV Made In dianalisis menggunakan algoritma tanpa
Bandung. Record dari mesin tersebut
pengawasan dari pertambangan. Proses
tersimpan di database dan memiliki
jumlah yang banyak. Dari data yang ini disebut sebagai analisis Cluster
banyak tersebut, tidak mudah dalam (Rathore, 2015). Analisis Clustering
membuat sebuah log tentang aktifitas adalah proses yang mengelompokkan
parkir. Paper ini bertujuan untuk himpunan objek fisik atau abstrak ke
membahas implementasi salah satu dalam beberapa kelas yang terdiri dari
metode data mining yaitu clustering objek serupa, ini adalah metode untuk
untuk mengelompokkan data record membedakan klasifikasi hal-hal, dan ini
parkir dengan penerapan clustering K- juga merupakan bidang penelitian penting
means. tentang pembelajaran mesin dan
Implementasi clustering yang telah pengenalan pola (Shi, 2013).
dirancang dalam paper ini
menggunakan metode clustering K- Device parkir dibuat dengan
means yang dapat mengelompokan menggunakan sistem NFC di CV Made In
data record parkir. Hasil dari Bandung. Record data NFC disimpan
penelitian ini menunjukkan bahwa dalam database dan ada record yang
aplikasi clustering dapat tersimpan berjumlah sangat besar. Bukan
mempermudah CV Made In Bandung tugas yang mudah untuk membuat log
dalam mengelompokan data record tentang aktivitas parkir dari data tersebut.
parkir agar dapat membentuk sebuah Dari penjelasan di atas, clustering akan
log aktifitas parkir. digunakan untuk mengklasifikasikan
record data parkir. Terdapat penelitian
tentang penggunaan K-Means dalam dari sekolah. Untuk mengelompokkan
pengelompokan penerima beasiswa siswa siswa ini, metode yang digunakan adalah
berdasarkan kriteria tertentu yang telah K-Means Clustering. Algoritma K-
ditentukan (Rohmawati, 2015). K-Means Means dipilih karena memiliki ketelitian
juga digunakan untuk mengklasifikasikan yang cukup tinggi terhadap ukuran objek,
kemampuan siswa dalam mata pelajaran sehingga algoritma ini relatif lebih
di universitas (Poerwanto, 2016). Dalam terukur dan efisien untuk pengolahan
penelitian lain, K-Means digunakan objek dalam jumlah besar. Hasil
dalam pengelompokan data kamus penelitian tersebut dapat disimpulkan
batubara (Awangga, 2018). bahwa algoritma KMeans clustering
Penelitian ini akan mengklasifikasikan dapat digunakan untuk mengelompokkan
record parkir dengan penerapan data siswa sebagai pendukung keputusan
clustering K-Means. Dalam penelitian ini, penentuan penjurusan siswa
solusi untuk pengumpulan data dari SMA(Purnamaningsih, 2014).
perangkat parkir menggunakan algoritma Penelitian lain yaitu tentang
clusteirng K-Means. pengelompokan data kamus batu bara di
Puslitbang tekMIRA. Pada penelitian
BAB II. Tinjauan Pustaka tersebut disebutkan bahwa kamus batu
Penggunaan metode tertentu untuk bara memiliki ribuan istilah. Butuh waktu
pemecahan suatu masalah sudah menjadi sekitar tiga sampai lima menit hanya
hal yang umum. Banyak penelitian untuk mencari istilah di kamus tersebut.
tentang kegunaan dari metode clustering Untuk melakukan pengelompokan data
K-means dan berikut beberapa penelitian kamus batu bara tersebut, dipilih metode
yang pernah dilakukan : Penelitian pada clustering K-means dan Meanshift
tahun 2016 tentang pengelompokan Algorithm dalam penelitian ini. K-means
kemampuan mahasiswa pada mata kuliah digunakan untuk mendapatkan nilai
statistika di program studi teknik cluster pada karakter dan kriteria kata.
informatika Universitas Cokroaminoto Kalkulasi dari perhitungan iterasi terakhir
Palopo (UNCP). Metode clustering K- pada K-means digabungkan dengan
means diusulkan dalam penelitian ini. algritma Meanshift. Hasil dari penelitian
Hasil dari penelitian tersebut adalah tersebut adalah menunjukkan centroid
didapatnya kelempok kelas yang yang berbeda untuk menemukan nilai
memiliki nilai dengan rata-rata tertinggi yang optimal(Awangga, 2018).
dan kelas yang memiliki nilai dengan
BAB III Metode Penelitian
rata-rata terendah (Poerwanto, 2016).
K-Means
Penelitian pada tahun 2014 tentang
K-Means adalah metode
penentuan penjurusan siswa SMA.
pengelompokan data non-hierarkis yang
Penentuan penjurusan siswa SMA
mencoba untuk mempartisi data yang ada
dilakukan berdasarkan kriteria nilai
menjadi satu atau lebih kelompok /
akademik yang menjadi ciri dari masing-
cluster. Metode ini mempartisi data
masing jurusan IPA dan IPS, dengan
menjadi kelompok / cluster sehingga data
demikian dapat diketemukan banyak
yang memiliki karakteristik yang sama
kemungkinan seorang siswa memenuhi
dikelompokkan ke dalam kelompok yang
semua atau sebagian kriteria penjurusan
sama (Purnamaningsih, 2014).
Langkah-langkah pengelompokan K- 7 802814894 MASUK 28/03/2018 12:48
Means adalah sebagai berikut: 8 802814894 KELUAR 28/03/2018 12:50
9 1246877121 MASUK 29/03/2018 10:41
1. Tentukan jumlah cluster k.
2. Tentukan secara acak nilai pusat 10 1246877121 KELUAR 03/04/2018 8:34
cluster. 11 1246877121 MASUK 03/04/2018 8:36
3. Hitung jarak antara setiap data 12 1246877121 KELUAR 03/04/2018 15:02
dengan setiap pusat cluster yang 13 1246877121 MASUK 03/04/2018 15:24
telah ditentukan menggunakan 14 1246877121 KELUAR 03/04/2018 15:26
rumus jarak (Eucledian Distance): 15 1246877121 MASUK 03/04/2018 15:49
2
𝑑𝑖𝑘 √∑𝑚
𝑗=1(𝑐𝑖𝑗 − 𝑐𝑘𝑗 ) …………… 16 1246877121 KELUAR 03/04/2018 15:50
17 1246877121 MASUK 03/04/2018 15:53
…..(1)
18 1246877121 KELUAR 03/04/2018 15:59
4. Mengelompokkan data berdasarkan
jarak terkecil dengan pusat cluster. 19 802814894 MASUK 09/04/2018 13:13
5. Tentukan nilai baru pusat cluster 20 802814894 KELUAR 09/04/2018 13:27
dengan menghitung rata-rata data 21 802814894 MASUK 09/04/2018 13:30
dalam cluster menggunakan rumus: 22 1246877121 KELUAR 09/04/2018 13:30
𝑐𝑘𝑗 = 23 1246877121 MASUK 09/04/2018 13:34
𝑝
∑𝑖=1 𝑥𝑖𝑗 24 1246877121 KELUAR 09/04/2018 13:41
.......................................(2)
𝑝
25 1246877121 MASUK 09/04/2018 13:41
6. Ulangi langkah 3 hingga 5 hingga
26 1246877121 KELUAR 09/04/2018 13:42
anggota setiap cluster tidak
berubah. 27 802814894 KELUAR 09/04/2018 13:42
28 802814894 MASUK 09/04/2018 13:43
BAB IV. Hasil dan Pembahasan 29 802814894 KELUAR 09/04/2018 14:28
30 802814894 MASUK 09/04/2018 14:34
Dalam penelitian ini eksperimen yang
dilakukan menggunakan data dari 31 802814894 KELUAR 09/04/2018 15:35
pemindaian tag atau kartu parkir pada 32 802814894 MASUK 09/04/2018 15:43
sistem parkir berbasis NFC yang 33 1246877121 MASUK 09/04/2018 15:44
sebelumnya dibuat di CV Made In 34 802814897 KELUAR 09/04/2018 18:42
Bandung. Data dikirim ke database di 35 802814897 MASUK 09/04/2018 18:42
server yang dimiliki oleh peneliti. Data- 36 802814895 KELUAR 10/04/2018 10:21
data ini adalah sebagai berikut:
37 802814895 MASUK 10/04/2018 10:21
TABLE I
RECORD DATA PARKIR 38 802814895 KELUAR 10/04/2018 10:22
no. Id status waktu
1 1246877121 MASUK 28/03/2018 10:17
Setelah mendapatkan data, proses
pengelompokan K-Means akan dilakukan
2 1246877121 KELUAR 28/03/2018 10:21
dengan langkah-langkah berikut:
3 1246877121 MASUK 28/03/2018 10:26 1. Normalisasi data.
4 1246877121 KELUAR 28/03/2018 10:30 2. Tentukan cluster dan centroid.
5 802814894 MASUK 28/03/2018 11:48 3. Perhitungan jarak pusat cluster
6 802814894 KELUAR 28/03/2018 12:46 4. Clustering.
A. Normalisasi Data 21 100 1 13
Proses normalisasi adalah proses 22 1000 0 13
mentransformasikan nilai dari data non- 23 1000 1 13
numerik menjadi data yang dihitung. 24 1000 0 13
Proses perhitungan ini diperlukan dalam 25 1000 1 13
mengimplementasikan algoritma k-mean 26 1000 0 13
untuk proses pengelompokan data. Untuk 27 100 0 13
atribut dengan dua kategori, setiap 28 100 1 13
kategori diatur dengan biner 1 atau 0 29 100 0 14
sesuai dengan nilai atribut. Contoh: untuk 30 100 1 14
atribut status yang memiliki kategori 31 100 0 15
"MASUK" dan "KELUAR", maka nilai 32 100 1 15
atribut tersebut adalah 0 (nol) untuk 33 1000 1 15
"KELUAR" dan 1 (satu) untuk 34 10 0 18
"MASUK". Untuk atribut dengan lebih 35 10 1 18
dari dua kategori, nilai atribut akan 36 1 0 10
menjadi biner dengan jumlah digit biner 37 1 1 10
yang sesuai dengan jumlah kategori 38 1 0 10
dalam atribut. Dan pengaturan akan
sesuai dengan kondisi sebenarnya dari B. Menentukan Clusters dan Centroids
setiap kategori atribut. Berikut ini adalah Setelah proses normalisasi dilakukan
data yang dihasilkan dari normalisasi. dan menghasilkan data yang
dinormalisasi, data kriteria untuk
TABLE II pengambilan sampel diperoleh. Setelah
HASIL NORMALISASI DATA itu akan ada partisi / clustering data pada
no. id status waktu data di atas sebanyak 2 (dua) partisi /
1 1000 1 10 cluster. Kemudian secara acak tentukan
2 1000 0 10 centroid untuk cluster. Para peneliti
3 1000 1 10 memilih centeroid pada data 19, 20 dan
4 1000 0 10 21, yaitu (100, 0, 13), (100, 1, 13) dan
5 100 1 11 (1000, 0, 13). Jadi, centroid pertama (c1)
6 100 0 12 adalah (100, 0, 13), centroid kedua (c2)
7 100 1 12 adalah (100, 1, 13) dan centroid ketiga
8 100 0 12 (c3) adalah (1000, 0, 13).
9 1000 1 10
10 1000 0 8 C. Perhitungan Jarak Pusat Cluster
11 1000 1 8 Untuk mengukur jarak pusat cluster
12 1000 0 15 atau centroid, Euclidean Distance (1)
13 1000 1 15 digunakan, maka matriks jarak dc1, dc2
14 1000 0 15 dan dc3 akan diperoleh.
15 1000 1 15 Hasil penghitungan matriks jarak dc1
16 1000 0 15 pada baris data pertama:
17 1000 1 15 𝑑𝑐11
18 1000 0 15 = √(1000 − 100)2 + (1 − 0)2 + (10 − 13)2 =
19 100 1 13
900,0055555.................... (1)
20 100 0 13
22 900 900,0005556 0
Hasil penghitungan matriks jarak dc2 23 900,0005556 900 1
pada baris data pertama: 24 900 900,0005556 0
𝑑𝑐21 25 900,0005556 900 1
= √(1000 − 100)2 + (1 − 1)2 + (10 − 13)2 = 26 900 900,0005556 0
900,005 ............................ (1) 27 0 1 900
28 1 0 900,0005556
Hasil penghitungan matriks jarak dc3
29 1 1,414213562 900,0005556
pada baris data pertama:
𝑑𝑐31 30 1,414213562 1 900,0011111

= √(1000 − 1000)2 + (1 − 0)2 + (10 − 13)2 =31 2 2,236067977 900,0022222


3,16227766 ..................... (1) 32 2,236067977 2 900,0027778
33 900,0027778 900,0022222 2,236067977
Selanjutnya, hitung jarak pada setiap 34 90,13878189 90,14432872 990,0126262
baris data, hasilnya seperti yang 35 90,14432872 90,13878189 990,0131312
ditunjukkan pada tabel di bawah ini: 36 99,04544412 99,05049217 999,0045045
37 99,05049217 99,04544412 999,005005
TABLE III
DATA PERHITUNGAN JARAN 38 99,04544412 99,05049217 999,0045045
CENTROID
no. dc1 dc2 dc3 D. Clustering
1 900,0055555 900,005 3,16227766 Hasil perhitungan jarak akan
2 900,005 900,0055555 3 dibandingkan. Data terpendek akan
3 900,0055555 900,005 3,16227766
dipilih karena menunjukkan bahwa data
berada dalam satu partisi / cluster dengan
4 900,005 900,0055555 3
pusat cluster / centroid. Contoh: pada data
5 2,236067977 2 900,0027778 baris pertama, dc3 lebih kecil dari dc1
6 1 1,414213562 900,0005556 dan dc2 (3,16227766 <900,0055555;
7 1,414213562 1 900,0011111 3,16227766 <900,005) kemudian dc3
8 1 1,414213562 900,0005556 masuk ke cluster 3.
9 900,0055555 900,005 3,16227766
TABLE IV
10 900,0138888 900,0144443 5
DATA CLUSTERING
11 900,0144443 900,0138888 5,099019514 no. dc1 dc2 dc3 Cluster1 Cluster2 Cluster3
12 900,0022222 900,0027778 2 1 900,0055555 900,005 3,16227766 - - OK
13 900,0027778 900,0022222 2,236067977 2 900,005 900,0055555 3 - - OK
14 900,0022222 900,0027778 2 3 900,0055555 900,005 3,16227766 - - OK
15 900,0027778 900,0022222 2,236067977 4 900,005 900,0055555 3 - - OK
16 900,0022222 900,0027778 2 5 2,236067977 2 900,0027778 - OK -
17 900,0027778 900,0022222 2,236067977 6 1 1,414213562 900,0005556 OK - -
18 900,0022222 900,0027778 2 7 1,414213562 1 900,0011111 - OK -
19 1 0 900,0005556 8 1 1,414213562 900,0005556 OK - -
20 0 1 900 9 900,0055555 900,005 3,16227766 - - OK
21 1 0 900,0005556
10 900,0138888 900,0144443 5 - - OK Jadi, centroid baru pertama (c1) adalah
11 900,0144443 900,0138888 5,099019514 - - OK (68; 0; 13), centroid baru kedua (c2)
12 900,0022222 900,0027778 2 - - OK
adalah (79; 1; 13,22222) dan centroid
13 900,0027778 900,0022222 2,236067977 - - OK
ketiga adalah baru (1000; 0,5; 11, 8).
Setelah itu akan diulang dalam
14 900,0022222 900,0027778 2 - - OK
perhitungan jarak centroid dan
15 900,0027778 900,0022222 2,236067977 - - OK
perbandingannya kembali. Proses ini akan
16 900,0022222 900,0027778 2 - - OK berlanjut sampai tidak ada anggota cluster
17 900,0027778 900,0022222 2,236067977 - - OK yang bergerak.
18 900,0022222 900,0027778 2 - - OK

19 1 0 900,0005556 - OK -
E. Hasil
20 0 1 900 OK - -
Dari percobaan yang dilakukan,
terbentuk kelompok atau klaster dalam
21 1 0 900,0005556 - OK -
data ini. Data dalam satu kelompok
22 900 900,0005556 0 - - OK
memiliki kesamaan atau tingkat
23 900,0005556 900 1 - - OK kesamaan yang tinggi.
24 900 900,0005556 0 - - OK

25 900,0005556 900 1 - - OK TABLE V


26 900 900,0005556 0 - - OK
DATA GROUP 1
id status waktu
27 0 1 900 OK - -
1246877121 MASUK 28/03/2018 10:17
28 1 0 900,0005556 - OK -
1246877121 KELUAR 28/03/2018 10:21
29 1 1,414213562 900,0005556 OK - -
1246877121 MASUK 28/03/2018 10:26
30 1,414213562 1 900,0011111 - OK -
1246877121 KELUAR 28/03/2018 10:30
31 2 2,236067977 900,0022222 OK - -
1246877121 MASUK 29/03/2018 10:41
32 2,236067977 2 900,0027778 - OK -
1246877121 KELUAR 03/04/2018 8:34
33 900,0027778 900,0022222 2,236067977 - - OK
1246877121 MASUK 03/04/2018 8:36
34 90,13878189 90,14432872 990,0126262 OK - -
1246877121 KELUAR 03/04/2018 15:02
35 90,14432872 90,13878189 990,0131312 - OK -
1246877121 MASUK 03/04/2018 15:24
36 99,04544412 99,05049217 999,0045045 OK - -
1246877121 KELUAR 03/04/2018 15:26
37 99,05049217 99,04544412 999,005005 - OK -
1246877121 MASUK 03/04/2018 15:49
38 99,04544412 99,05049217 999,0045045 OK - -

1246877121 KELUAR 03/04/2018 15:50


Setelah anggota masing-masing cluster 1246877121 MASUK 03/04/2018 15:53
diketahui, hitung pusat cluster atau centroid 1246877121 KELUAR 03/04/2018 15:59
baru menggunakan rumus (2). 1246877121 KELUAR 09/04/2018 13:30
Hasil dari perhitungan untuk menemukan
1246877121 MASUK 09/04/2018 13:34
centroid baru:
612 0 117 1246877121 KELUAR 09/04/2018 13:41
𝑐1 = ( 9 ; 9 ; 9 ) = (68; 0; 13) ........................ (2)
1246877121 MASUK 09/04/2018 13:41
711 9 119
𝑐2 = ( ; ; ) = (79; 1; 13,22222) ............. (2)1246877121 KELUAR 09/04/2018 13:42
9 9 9
20000 10 236 1246877121 MASUK 09/04/2018 15:44
𝑐3 = ( 20 ; 20 ; 20 ) =
(1000; 0,5; 11,8) ...................................................... (2)
TABLE VI BAB V. Kesimpulan dan Saran
DATA GROUP 2 Berdasarkan hasil percobaan
id status waktu menggunakan metode K-Means
802814894 MASUK 28/03/2018 11:48 Clustering dimana catatan sebelumnya
802814894 KELUAR 28/03/2018 12:46 data parkir masih disimpan secara acak.
802814894 MASUK 28/03/2018 12:48
Kemudian metode K-Means Clustering
akan mengelompokkan data sehingga 3
802814894 KELUAR 28/03/2018 12:50
kelompok data dihasilkan.
802814894 MASUK 09/04/2018 13:13
Kesimpulan dari metode yang telah
802814894 KELUAR 09/04/2018 13:27 dilakukan dalam penelitian ini adalah
802814894 MASUK 09/04/2018 13:30 penerapan metode K-Means Clustering
802814894 KELUAR 09/04/2018 13:42 dapat mengelompokkan rekaman data
802814894 MASUK 09/04/2018 13:43 parkir yang sebelumnya disimpan secara
802814894 KELUAR 09/04/2018 14:28 acak untuk membentuk log aktivitas
802814894 MASUK 09/04/2018 14:34
parkir di kantor CV Made In Bandung.
802814894 KELUAR 09/04/2018 15:35
802814894 MASUK 09/04/2018 15:43 DAFTAR PUSTAKA
[1] Rathore, P., Shukla, D., 2015. 2015
TABLE VII
International Conference on
DATA GROUP 3
Id Status waktu
Communication Networks (ICCN).
802814897 KELUAR 09/04/2018 18:42
Analysis and performance
802814897 MASUK 09/04/2018 18:42
improvement of K-means clustering in
big data environment, 43-46.
802814895 KELUAR 10/04/2018 10:21
[2] Shi, G., Gao, B., Zhang, L., 2013.
802814895 MASUK 10/04/2018 10:21
Proceedings of 2013 2nd International
802814895 KELUAR 10/04/2018 10:22
Conference on Measurement,
Information and Control. The
F. Implementation
optimized K-means algorithms for
Berikut ini sekilas hasil data clustering
improving randomly-initialed
yang telah berhasil diimplementasikan
midpoints, vol. 2, pp. 1212-1216,.
pada aplikasi clustering data parkir pada
[3] Rohmawati, N., Defiyanti, S., Jajuli ,
Figure 1.
M., 2015. Jurnal Ilmiah Teknologi
Informasi Terapan. Implementasi
Algoritma K-Means Dalam
Pengklasteran Mahasiswa Pelamar
Beasiswa, vol. 1, no 2.
[4] Poerwanto, B., Fa’rifah, R.Y., 2016.
Scientific Pinisi. Analisis Cluster K-
Means Dalam Pengelompokan
Kemampuan Mahasiswa, vol. 2, pp.
Figure. 1. Hasil Clustering 92-96.
[5] Awangga, R.M., Pane, S.F., Tunnisa,
K., Suwardi, I.S., 2018. Telkomnika
(Telecommunication Computing
Electronics and Control). K-means
clustering and meanshift analysis for
grouping the data of coal term in
puslitbang tekMIRA, vol. 16, no. 3,
pp. 1351-1357.
[6] Purnamaningsih, C., Saptono, R.,
Aziz, A. 2014. JURNAL ITSMART.
Pemanfaatan Metode K-Means
Clustering dalam Penentuan
Penjurusan Siswa SMA, vol 3, no. 1.
[7] Abdurasyid, M., Indriati, Perdana ,
R., 2018. Jurnal Pengembangan
Teknologi Informasi dan Ilmu
Komputer. Implementasi Metode
Improved K-Means Untuk
Mengelompokkan Dokumen Jurnal
Pengembangan Teknologi Informasi
Dan Ilmu Komputer, vol. 2, no. 10,
pp. 3939-3947.
[8] Eka, N.P., Merliana, A., Ernawati,
Santoso, A.J., Seminar Nasional Multi
Disiplin Dan Call For Papers.
Penentuan Jumlah Cluster Terbaik
Pada Metode K-Means Clustering
[9] Xiong, C., Hua, Z., Lv, K., Li, X.,
2016. 7th International Conference on
Cloud Computing and Big Data. An
Improved K-means text clustering
algorithm By Optimizing initial cluster
centers, pp. 265-268.

Anda mungkin juga menyukai