Anda di halaman 1dari 36

DBSCAN (Density-Based Spatial Clustering of Applications with Noise)

DBSCAN adalah salah satu algoritma clustering density-based, algoritma ini pertama kali
dikenalkan oleh Ester, dkk [Ester 1996] di dalam Adriano Moreira, dkk University of Minho
Portugal. Dalam satu daerah dengan kepadatan titik yang tinggi menggambarkan keberadaan cluster
sedangkan daerah dengan kepadatan titik rendah disebut dengan Noise. Algoritma ini terutama
cocok untuk menangani data yang besar, dengan noise, dan mampu mengidentifikasi cluster dengan
berbagai ukuran dan bentuk.

Ide Utama Dari Algoritma DBSCAN


DBSCAN menentukan sendiri jumlah cluster yang akan dihasilkan sehingga kita tidak perlu lagi
untuk menentukan jumlah cluster yang diinginkan, tapi memerlukan 2 input lain, yaitu:
 MinPts: minimal banyak items dalam suatu cluster
 Eps: nilai untuk jarak antar-items yang menjadi dasar pembentukan
neighborhood dari suatu titik item.

Ide dasar dari density-based clustering berkaitan dengan beberapa definisi baru
1. Neighborhood dengan radius Eps dari suatu obyek disebut Eps-neighborhood dari
suatu obyek tersebut.
2. Jika Eps-neighborhood dari suatu obyek mengandung titik sekurang-kurangnya
jumlah minimum, MinPts, maka suatu obyek tersebut dinamakan core object
3. Diberikan set obyek D, obyek p dikatakan directly density-reachable (kepadatan
terjangkau langsung) dari obyek q jika p termasuk dalam Eps-neighborhood dari q
dan q adalah core objek.
Ilustrasi directly density-reachable (kepadatan terjangkau langsung)

Gambar 1 directly density-reachable


4. Sebuah obyek p adalah density-reachable dari obyek q dengan
memperhatikan Eps dan MinPts dalam suatu set objek , D, jika
terdapat serangkaian obyek p1,…,pn, p1=q dan pn=p dimana pi+1
adalah directly density-reachable dari pi dengan memperhatikan Eps
dan MinPts, untuk 1 <= i <= n, pi elemen D. Konsep density-
reachable di-ilustrasikan pada Gambar dibawah ini :

Gambar 2 density-reachable
5. Sebuah obyek p adalah density-connected terhadap obyek q dengan
memperhatikan Eps dan MinPts dalam set obyek D, jika ada sebuah
obyek o elemen D sehingga p dan q keduanya density-reachable dari o
dengan memperhatikan Eps dan MinPts. Gambar di bawah ini
merupakan ilustrasi dari konsep density-connected.

Gambar 3 density-connected

ii
Algoritma DBSCAN
Kunci dari algoritma DBSCAN adalah bahwa untuk setiap titik dari
sebuah cluster, neighborhood dari radius yang diberikan harus mengandung
setidaknya jumlah minimum poin, yaitu, kepadatan neighborhood harus melebihi
beberapa threshold ditetapkan (Ye, Gao and Zeng, 2003). Algoritma ini
membutuhkan dua parameter masukan untuk bisa melakukan clustering yaitu
MinPts dan Eps

Adapun urutan algoritma dari DBSCAN secara umum memiliki 6 langkah


yaitu:
1. Arbitrary select a point p (Pilih point p awal secara acak)
2. Retrieve all points density-reachable from p wrt Eps and MinPts
(Ambil semua point yang density reachable terhadap titik p)
3. If p is a core point, a cluster is formed(Jika p adalah core point maka
cluster terbentuk)
4. If p is a border point, no points are density-reachable from p and
DBSCAN visits the next point of the database (Jika p adalah border
point, tidak ada yang merupakan hubungan density-reachable dari p
dan DBSCAN akan mengunjungi point selanjutnya dari database)
5. Continue the process until all of the points have been
processed(Lanjutkan proses sampai semua point telah diproses). Result
is independent of the order of processing the points (Hasil yang
didapatkan tidak terhantung dari urutan dari proses point yang diambil)

2
Contoh Soal
Diketahui data spasial dengan atribut koordinat x dan y yang
direpresentasikan sebagai titik, dimana titik tersebut sebagai berikut:
Tabel 1: Data spasial

Titik X Y
A 2 2
B 2 3
C 4 3
D 1 4
E 6 4
F 3 5
G 4 6
H 2 8
I 4 7
J 5 9
K 3 9
L 1 10
M 3 11
N 2 12
O 5 13
P 3 14
Q 4 15
R 3 16
S 14 1
T 14 3
U 15 2
V 16 3

W 15 4
X 18 9
Y 19 10
Z 20 11

3
Jika digambarkan melalui grafik sebaran titik dapat dilihat itu sebagai berikut.

17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
K J X
9
H
8
I
7
G
6 F
5 D E W
4 B C T V
3 A U
2 S
1
0 0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 4 Sebaran data titik

Dimana nantinya data diatas akan diolah dengan menggunakan Metoda


desity-based yaitu DBSCAN (Density-Based Spatial Clustering of Applications
with Noise). Dengan parameter input :
a. MinPts : 5
b. Eps 4
Untuk menghitung jarak titik core point dengan point yang lain pada DBSCAN
bisa dengan menggunakan rumus jarak biasa yaitu Euclidean Distance:
Jarak= √(𝑥 − 𝑥𝑝)2 + (𝑦 − 𝑦𝑝)2
Dimana :
x : koordinat sumbu x titik tujuan
y : koodinat sumbu y titik tujuan

4
xp : koordinat pusat sumbu x
yp : koordinat pusat sumbu y
Sesuai dengan algoritma DBSCAN langkah pertama adalah memilih titik
pusat awal secara acak sesuai dengan keiinginan. Contoh disini akan memakai
titik B sebagai titik pusat awal untuk iterasi 1.

Iterasi I
Iterasi I adalah dengan mengitung jarak masing masing point atau titik
terhadap titik pusat B
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi pertama, pada soal diatas dengan menggunakan rumus jarak diatas:
a. MinPts : 5
b. Eps 4
c. Pusat titik B ; xp=2 ;
yp=3 Perhitungannya

AB = √(2 − 2)2 + (2 − 3)2 = 1

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan perhitungan
jarak untuk iterasi I sebagai berikut

Tabel 2: Hasil Jarak Iterasi I

Jarak Hasil
AB 1 OB 10,44031
BB 0 PB 11,04536
CB 2 QB 12,16553
DB 1,414214 RB 13,0384
EB 4,123106 SB 12,16553
FB 2,236068 TB 12
GB 3,605551 UB 13,0384
HB 5 VB 14
IB 4,472136 WB 13,0384
JB 6,708204 XB 17,08801
KB 6,082763 YB 18,38478
LB 7,071068 ZB 19,69772
MB 8,062258
NB 9

5
Diatas merupakan hasil perhitungan jarak iterasi pertama untuk xp=2
;yp=3. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua yaitu
Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah
Tabel 3 Titik yang memenuhi syarat iterasi I

titik X Y
A 2 2
B 2 3
C 4 3
D 1 4
F 3 5
G 4 6

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 6. Jumlah ini
sudah memenuhi untuk terbentuknya neighborhood core object karena jumlah
objek e- neighborhood sudah memenuhi jumlah MinPts=5 dimana syarat
terbentuknya neighborhood core object adalah sebuah objek berisi setidaknya
jumlah minimal, MinPts. Sehingga grafik titik bisa digambarkan sebagai berikut
untuk memberikan tanda dari hasil dari iterasi I

6
17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 5 Sebaran data titik iterasi I

Dari gambar di atas tanda gelang merah merupakan hasil iterasi I yang
merupakan neighborhood core object dengan inti object adalah B sehingga
langkah 3 dari algoritma DBSCAN dilakukan.
Untuk menentukan core point(titik pusat) pada iterasi selanjutnya,
dengan cara memilih titik yang memiliki jarak terjauh yang masih termasuk dalam
dari core object pada iterasi pertama.
Tabel 4 Titik terpilih dengan masing-masing jarak iterasi I

titik X Y Jarak Ke titik B


1
A 2 2
0
B 2 3
2
C 4 3
1,414213562
D 1 4
2,236067977
F 3 5
3,605551275
G 4 6

7
Dari tabel di atas titik G terpilih sebagai titik pusat untuk iterasi II
dengan koordinat x=4, y=6 menjadi titik pusatnya.

Iterasi II
Iterasi II sama dengan iterasi sebelumnya yaitu mengitung jarak masing
masing point atau titik terhadap titik pusat G.
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi kedua, pada soal diatas dengan menggunakan rumus jarak diatas:
a. MinPts : 5
b. Eps 4
c. Pusat titik G ; xp=4 ;
yp=6 Perhitungannya

AG = √(2 − 4)2 + (2 − 6)2 = 4,472136

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan
perhitungan jarak untuk iterasi II sebagai berikut

Tabel 5 Hasil Jarak Iterasi II

Jarak Hasil
AG 4,472136
BG 3,605551
CG 3
DG 3,605551
EG 2,828427
FG 1,414214
GG 0
HG 2,828427
IG 1
JG 3,162278
KG 3,162278
LG 5
MG 5,09902
NG 6,324555
OG 7,071068
PG 8,062258
QG 9
RG 10,04988

8
SG 11,18034
TG 10,44031
UG 11,7047
VG 12,36932
WG 11,18034
XG 14,31782
YG 15,52417
ZG 16,76305

Diatas merupakan hasil perhitungan jarak iterasi kedua untuk xp=4


;yp=6. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua yaitu
Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah Tabel 6 Titik yang memenuhi syarat iterasi II
titik X Y
B 2 3

C 4 3

D 1 4

E 6 4

F 3 5

G 4 6

H 2 8

I 4 7

J 5 9

K 3 9

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 10. Jumlah ini
sudah memenuhi untuk terbentuknya neighborhood core object karena jumlah
objek e-neighborhood sudah memenuhi jumlah MinPts=5 dimana syarat

9
terbentuknya neighborhood core object adalah sebuah objek berisi setidaknya
jumlah minimal, MinPts. Sehingga grafik titik bisa digambarkan sebagai berikut
untuk memberikan tanda dari hasil dari iterasi II

17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 6 Sebaran data titik iterasi II

Dari gambar di atas tanda gelang kuning merupakan hasil iterasi II yang
merupakan neighborhood core object dengan inti object adalah G sehingga
langkah 3 dari algoritma DBSCAN dilakukan.
Untuk menentukan core point(titik pusat) pada iterasi selanjutnya,
dengan cara memilih titik yang memiliki jarak terjauh yang masih termasuk dalam
dari core object pada iterasi kedua.

10
Tabel 7 Titik terpilih dengan masing-masing jarak iterasi II

titik X Y Jarak Ke titik G


B 2 3 3,605551275

C 4 3 3

D 1 4 3,605551275

E 6 4 2,828427125

F 3 5 1,414213562

G 4 6 0

H 2 8 2,828427125

I 4 7 1

J 5 9 3,16227766

K 3 9 3,16227766

Dari tabel di atas titik B dan D adalah titik yang memiliki jarak terjauh
dari G namun selain persyaratan titik yang terjauh juga harus diperhatikan apakah
titik tersebut tidak termasuk border point di core object yang lain di proses
sebelumnya, sehingga dengan persyaratan ini titik D dan B tidak memenuhi
persyaratan untuk menjadi core point pada iterasi selanjutnya.
Sehingga dicari titik terjauh yang dan yang termasuk border point di
core object yang lain di proses sebelumnya yaitu didapatkan J atau K. Disini kita
bebas memilih titik mana yang akan dijadikan core point pada iterasi selanjutnya.
Disini ditetapkan titik K terpilih sebagai titik pusat untuk iterasi III
dengan koordinat x=3, y=9 menjadi titik pusatnya.

Iterasi III
Iterasi III sama dengan iterasi sebelumnya yaitu mengitung jarak masing
masing point atau titik terhadap titik pusat K.
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi ketiga, pada soal diatas dengan menggunakan rumus jarak diatas:

11
a. MinPts : 5
b. Eps 4
c. Pusat titik K ; xp=3 ;
yp=9 Perhitungannya

AK = √(2 − 3)2 + (2 − 9)2 = 7,071068

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan
perhitungan jarak untuk iterasi III sebagai berikut

Tabel 8 Hasil Jarak Iterasi III

Jarak Hasil
AK 7,071068
BK 6,082763
CK 6,082763
DK 5,385165
EK 5,830952
FK 4
GK 3,162278
HK 1,414214
IK 2,236068
JK 2
KK 0
LK 2,236068
MK 2
NK 3,162278
OK 4,472136
PK 5
QK 6,082763
RK 7
SK 13,60147
TK 12,52996
UK 13,89244
VK 14,31782
WK 13
XK 15
YK 16,03122
ZK 17,11724

12
Diatas merupakan hasil perhitungan jarak iterasi ketiga untuk xp=3
;yp=9. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua yaitu
Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah Tabel 9 Titik yang memenuhi syarat iterasi III
titik X Y
F 3 5

G 4 6

H 2 8

I 4 7

J 5 9

K 3 9

L 1 10

M 3 11

N 2 12

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 9. Jumlah ini
sudah memenuhi untuk terbentuknya neighborhood core object karena jumlah
objek e- neighborhood sudah memenuhi jumlah MinPts=5 dimana syarat
terbentuknya neighborhood core object adalah sebuah objek berisi setidaknya
jumlah minimal, MinPts. Sehingga grafik titik bisa digambarkan sebagai berikut
untuk memberikan tanda dari hasil dari iterasi III

13
17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 7 Sebaran data titik iterasi III

Dari gambar di atas tanda gelang hijau merupakan hasil iterasi III yang
merupakan neighborhood core object dengan inti object adalah K sehingga
langkah 3 dari algoritma DBSCAN dilakukan.
Untuk menentukan core point (titik pusat) pada iterasi selanjutnya,
dengan cara memilih titik yang memiliki jarak terjauh yang masih termasuk dalam
dari core object pada iterasi ketiga.
Tabel 10 Titik terpilih dengan masing-masing jarak iterasi III

titik X Y Jarak Ke titik K


F 3 5 4

G 4 6 3,16227766

H 2 8 1,414213562

I 4 7 2,236067977

J 5 9 2

K 3 9 0

14
L 1 10 2,236067977

M 3 11 2

N 2 12 3,16227766

Dari tabel di atas dapat dilihat titik F adalah titik yang memiliki jarak
terjauh dari K namun selain persyaratan titik yang terjauh juga harus diperhatikan
apakah titik tersebut tidak termasuk border point di core object yang lain di proses
sebelumnya dan selain itu ada juga titik G yang mendekati terjauh sudah pernah
menjadi titik core point di iterasi sebelumnya, sehingga dengan persyaratan ini G
dan F tidak memenuhi persyaratan untuk menjadi core point pada iterasi
selanjutnya.
Sehingga dicari titik terjauh yang dan yang termasuk border point di
core object yang lain di proses sebelumnya yaitu didapatkan N.
Disini ditetapkan titik N terpilih sebagai titik pusat untuk iterasi IV
dengan koordinat x=2, y=12 menjadi titik pusatnya.

Iterasi IV
Iterasi IV sama dengan iterasi sebelumnya yaitu mengitung jarak masing
masing point atau titik terhadap titik pusat N.
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi keempat, pada soal diatas dengan menggunakan rumus jarak diatas:
a. MinPts : 5
b. Eps 4
c. Pusat titik N ; xp=2;
yp=12 Perhitungannya

AN = √(2 − 2)2 + (2 − 12)2 = 10

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan
perhitungan jarak untuk iterasi IV sebagai berikut

15
Tabel 11 Hasil Jarak Iterasi IV

Jarak Hasil
AN 10
BN 9
CN 9,219544
DN 8,062258
EN 8,944272
FN 7,071068
GN 6,324555
HN 4
IN 5,385165
JN 4,242641
KN 3,162278
LN 2,236068
MN 1,414214
NN 0
ON 3,162278
PN 2,236068
QN 3,605551
RN 4,123106
SN 16,27882
TN 15
UN 16,40122
VN 16,64332
WN 15,26434
XN 16,27882
YN 17,11724
ZN 18,02776

Diatas merupakan hasil perhitungan jarak iterasi keempat untuk


xp=2;yp=12. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua
yaitu Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah

16
Tabel 12 Titik yang memenuhi syarat iterasi IV

titik X Y
H 2 8

K 3 9

L 1 10

M 3 11

N 2 12

O 5 13

P 3 14

Q 4 15

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 8. Jumlah ini
sudah memenuhi untuk terbentuknya neighborhood core object karena jumlah
objek e- neighborhood sudah memenuhi jumlah MinPts=5 dimana syarat
terbentuknya neighborhood core object adalah sebuah objek berisi setidaknya
jumlah minimal, MinPts. Sehingga grafik titik bisa digambarkan sebagai berikut
untuk memberikan tanda dari hasil dari iterasi IV

17
17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 8 Sebaran data titik iterasi IV

Dari gambar di atas tanda gelang biru merupakan hasil iterasi IV yang
merupakan neighborhood core object dengan inti object adalah N sehingga
langkah 3 dari algoritma DBSCAN dilakukan.
Untuk menentukan core point (titik pusat) pada iterasi selanjutnya,
dengan cara memilih titik yang memiliki jarak terjauh yang masih termasuk dalam
dari core object pada iterasi keempat.
Tabel 13 Titik terpilih dengan masing-masing jarak iterasi IV

titik X Y Jarak Ke titik N


H 2 8 4

K 3 9 3,16227766

L 1 10 2,236067977

M 3 11 1,414213562

N 2 12 0

O 5 13 3,16227766

18
P 3 14 2,236067977

Q 4 15 3,605551275

Dari tabel di atas dapat dilihat titik H adalah titik yang memiliki jarak
terjauh dari N namun selain persyaratan titik yang terjauh juga harus diperhatikan
apakah titik tersebut tidak termasuk border point di core object yang lain di proses
sebelumnya, sehingga dengan persyaratan ini H tidak memenuhi persyaratan
untuk menjadi core point pada iterasi selanjutnya.
Sehingga dicari titik terjauh yang dan yang termasuk border point di
core object yang lain di proses sebelumnya yaitu didapatkan Q.
Disini ditetapkan titik Q terpilih sebagai titik pusat untuk iterasi V
dengan koordinat x=4, y=15 menjadi titik pusatnya.

Iterasi V
Iterasi Q sama dengan iterasi sebelumnya yaitu mengitung jarak masing
masing point atau titik terhadap titik pusat Q.
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi kelima, pada soal diatas dengan menggunakan rumus jarak diatas:
a. MinPts : 5
b. Eps 4
c. Pusat titik Q ; xp=4;
yp=15 Perhitungannya

AQ = √(2 − 4)2 + (2 − 15)2 = 13,15295

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan
perhitungan jarak untuk iterasi V sebagai berikut

19
Tabel 14 Hasil Jarak Iterasi V

Jarak Hasil
AQ 13,15295
BQ 12,16553
CQ 12
DQ 11,40175
EQ 11,18034
FQ 10,04988
GQ 9
HQ 7,28011
IQ 8
JQ 6,082763
KQ 6,082763
LQ 5,830952
MQ 4,123106
NQ 3,605551
OQ 2,236068
PQ 1,414214
QQ 0
RQ 1,414214
SQ 17,20465
TQ 15,6205
UQ 17,02939
VQ 16,97056
WQ 15,55635
XQ 15,23155
YQ 15,81139
ZQ 16,49242

Diatas merupakan hasil perhitungan jarak iterasi kelima untuk


xp=4;yp=15. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua
yaitu Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah

20
Tabel 15 Titik yang memenuhi syarat iterasi V

titik X Y
N 2 12

O 5 13

P 3 14

Q 4 15

R 3 16

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 5. Jumlah ini
sudah memenuhi untuk terbentuknya neighborhood core object karena jumlah
objek e- neighborhood sudah memenuhi jumlah MinPts=5 dimana syarat
terbentuknya neighborhood core object adalah sebuah objek berisi setidaknya
jumlah minimal, MinPts. Sehingga grafik titik bisa digambarkan sebagai berikut
untuk memberikan tanda dari hasil dari iterasi V

21
17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 9 Sebaran data titik iterasi V

Dari gambar di atas tanda gelang merah muda merupakan hasil iterasi V
yang merupakan neighborhood core object dengan inti object adalah Q sehingga
langkah 3 dari algoritma DBSCAN dilakukan.
Untuk menentukan core point (titik pusat) pada iterasi selanjutnya,
dengan cara memilih titik yang memiliki jarak terjauh yang masih termasuk dalam
dari core object pada iterasi kelima.
Tabel 16 Titik terpilih dengan masing-masing jarak iterasi V

titik X Y Jarak Ke titik Q


N 2 12 3,605551275

O 5 13 2,236067977

P 3 14 1,414213562

Q 4 15 0

22
R 3 16 1,414213562

Dari tabel di atas dapat dilihat titik N adalah titik yang memiliki jarak
terjauh dari Q namun selain persyaratan titik yang terjauh juga harus diperhatikan
apakah titik tersebut tidak termasuk border point di core object yang lain di proses
sebelumnya, selain itu ada juga titik N yang mendekati terjauh sudah pernah
menjadi titik core point di iterasi sebelumnya sehingga dengan persyaratan ini N
tidak memenuhi persyaratan untuk menjadi core point pada iterasi selanjutnya.
Hal yang sama juga terjadi di titik O,P R sehingga dengan persyaratan itu
tidak ada lagi titik yang bisa dijadikan pusat atau core point. Sehingga kita
lakukan proses langkah 4 pada algoritma DBSCAN yaitu Jika p adalah border
point, tidak ada yang merupakan hubungan density-reachable dari p dan
DBSCAN akan mengunjungi point selanjutnya dari database, yang artinya kita
menentukan core point selanjutnya ke data titik yang belum sama sekali menjadi
border point di neighborhood. Sehingga DBSCAN menelusuri ke titik S yang
masih bebas.
Disini ditetapkan titik S terpilih sebagai titik pusat untuk iterasi VI
dengan koordinat x=14, y=1 menjadi titik pusatnya.

Iterasi VI
Iterasi S sama dengan iterasi sebelumnya yaitu mengitung jarak masing
masing point atau titik terhadap titik pusat S.
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi keenam, pada soal diatas dengan menggunakan rumus jarak diatas:
a. MinPts : 5
b. Eps 4
c. Pusat titik S ; xp=14;
yp=1 Perhitungannya

AS = √(2 − 14)2 + (2 − 1)2 = 12,04159

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan
perhitungan jarak untuk iterasi VI sebagai berikut

23
Tabel 17 Hasil Jarak Iterasi VI

Jarak Hasil
AS 12,04159
BS 12,16553
CS 10,19804
DS 13,34166
ES 8,544004
FS 11,7047
GS 11,18034
HS 13,89244
IS 11,6619
JS 12,04159
KS 13,60147
LS 15,81139
MS 14,86607
NS 16,27882
OS 15
PS 17,02939
QS 17,20465
RS 18,60108
SS 0
TS 2
US 1,414214
VS 2,828427
WS 3,162278
XS 8,944272
YS 10,29563
ZS 11,6619

Diatas merupakan hasil perhitungan jarak iterasi keenam untuk


xp=14;yp=1. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua
yaitu Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah

24
Tabel 18 Titik yang memenuhi syarat iterasi VI

titik X Y
S 14 1

T 14 3

U 15 2

V 16 3

W 15 4

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 5. Jumlah ini
sudah memenuhi untuk terbentuknya neighborhood core object karena jumlah
objek e- neighborhood sudah memenuhi jumlah MinPts=5 dimana syarat
terbentuknya neighborhood core object adalah sebuah objek berisi setidaknya
jumlah minimal, MinPts. Sehingga grafik titik bisa digambarkan sebagai berikut
untuk memberikan tanda dari hasil dari iterasi VI

25
1
7 R
1 Q
6 P
1 O
5 N
M Z
1
L Y
4
K J X
1
H
3
I
1
G
2 F
1 D E W
1 B C T V
1 A U
0 S
9
0123456789 10 11 12 13 14 15 16 17 18 19 20 21
8
7
6
5 Gambar 10 Sebaran data titik iterasi VI
4
3
2 Dari gambar di atas tanda gelang merah maroon merupakan hasil iterasi
VI1 yang merupakan neighborhood core object dengan inti object adalah S
0
sehingga langkah 3 dari algoritma DBSCAN dilakukan.
Untuk menentukan core point (titik pusat) pada iterasi selanjutnya,
dengan cara memilih titik yang memiliki jarak terjauh yang masih termasuk dalam
dari core object pada iterasi keenam.
Tabel 19 Titik terpilih dengan masing-masing jarak iterasi VI
titik X Y Jarak Ke titik S
S 14 1 0

T 14 3 2

U 15 2 1,414213562

V 16 3 2,828427125

W 15 4 3,16227766

26
Dari tabel di atas dapat dilihat titik T,U V dan W sehingga dengan
persyaratan itu tidak ada lagi titik yang bisa dijadikan pusat atau core point.
Sehingga kita kembali lakukan proses langkah 4 pada algoritma DBSCAN yaitu
Jika p adalah border point, tidak ada yang merupakan hubungan density-
reachable dari p dan DBSCAN akan mengunjungi point selanjutnya dari database,
yang artinya kita menentukan core point selanjutnya ke data titik yang belum
sama sekali menjadi border point di neighborhood . Sehingga DBSCAN
menelusuri ke titik X yang masih bebas.
Disini ditetapkan titik X terpilih sebagai titik pusat untuk iterasi VII
dengan koordinat x=18, y=9 menjadi titik pusatnya.

Iterasi VII
Iterasi VII sama dengan iterasi sebelumnya yaitu mengitung jarak masing
masing point atau titik terhadap titik pusat X.
Berikut adalah perhitungan jarak masing-masing titik dengan core point
untuk iterasi ketujuh, pada soal diatas dengan menggunakan rumus jarak diatas:
d. MinPts : 5
e. Eps 4
f. Pusat titik X ; xp=18;
yp=9 Perhitungannya

AX = √(2 − 18)2 + (2 − 9)2 = 17,46425

Dilakukan hal yang sama untuk titik yang lain, sehingga didapatkan
perhitungan jarak untuk iterasi VII sebagai berikut

27
Tabel 20 Hasil Jarak Iterasi VII

Jarak Hasil
AX 17,46425
BX 17,08801
CX 15,23155
DX 17,72005
EX 13
FX 15,52417
GX 14,31782
HX 16,03122
IX 14,14214
JX 13
KX 15
LX 17,02939
MX 15,13275
NX 16,27882
OX 13,60147
PX 15,81139
QX 15,23155
RX 16,55295
SX 8,944272
TX 7,211103
UX 7,615773
VX 6,324555
WX 5,830952
XX 0
YX 1,414214
ZX 2,828427

Diatas merupakan hasil perhitungan jarak iterasi ketujuh untuk


xp=18;yp=9. Dari hasil tersebut kemudian kita ikuti langkah algoritma kedua
yaitu Ambil semua point yang density reachable terhadap titik pusatnya. Dimana
density reachable didapat dari sekumpulan titik item directly density-reachable
dengan syarat titik pusat dengan titik lainnya memiliki jarak tidak lebih atau sam
dengan dari nilai Eps yang ditentukan. Karena Eps=4 maka nilai titik yang
memenuhi syarat adalah

28
Tabel 21 Titik yang memenuhi syarat iterasi VII

titik X Y
X 18 9

Y 19 10

Z 20 11

Dari jumlah titik yang terpilih tersebut yaitu berjumlah 3. Jumlah TIDAK
memenuhi untuk terbentuknya neighborhood core object karena jumlah objek e-
neighborhood kurang dari jumlah MinPts=5 dimana syarat terbentuknya
neighborhood core object adalah sebuah objek berisi setidaknya jumlah minimal,
MinPts maka dari itu ke tiga data ini disebut noise. Grafik titik bisa digambarkan
sebagai berikut untuk memberikan tanda dari hasil dari iterasi VII

17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 11 Sebaran data titik iterasi VII

29
Dari gambar di atas tanda gelang orange merupakan hasil iterasi VII yang
merupakan noise sehingga langkah 5 dari algoritma DBSCAN sudah tidak bisa
diproses lagi dikarenakan data sudah semua diclusterkan. Sehingga proses iterasi
berhenti.
Langkah selanjutnya adalah memberikan definisi hubungan antar core
object untuk bisa menjadikan sekumpulan neighborhood menjadi satu cluster
dengan syarat core point awal dengan akhir harus saling berhubungan density-
connected. Berikut ini gambaran density-connected dimana B density-connected
terhadap Q dimana telah melalui density reachable terhadap titik G,K dan N.
Sedangkan jika ditinjau hubungan G dengan K merupakan hubungan directly
density-reachable

17
16 R
15 Q
14 P
13 O
12 N
11 M Z
10 L Y
9 K J X
8 H
7 I
6 G
5 F
4 D E W
3 B C T V
2 A U
1 S
0
0123456789 10 11 12 13 14 15 16 17 18 19 20 21

Gambar 12 Hubungan antar titik

30
Dari pendefinisian hubungan tersebut sehingga didapatkan gambaran
cluster yang umum sebagai berikut

Gambar 13 Cluster dan noise data

DBSCAN dengan parameter input Eps=4; MinPts=5 mendapatkan 2


cluster yang dilambangkan dengan shape garis warna merah dan 3 buah data yang
dianggap sebagai noise yang dilambangkan dengan shape garis warna biru dengan
proses iterasi sebanyak 7 kali iterasi.

4. Kesimpulan
Dari penjabaran materi di atas dapat disimpulkan sebagai berikut:
1. Algoritma clustering tugas menarik yaitu identifikasi kelas dalam database
spasial. Namun, algoritma yang dikenal memiliki kekurangan yang besar bila
diterapkan pada besar spasial database. Dalam tulisan ini, kita disajikan
clustering algoritma DBSCAN yang bergantung pada konsep berbasis
kepadatan cluster. Ini hanya membutuhkan satu parameter input dan
mendukung pengguna dalam menentukan nilai yang sesuai untuk itu. Kami
melakukan evaluasi kinerja pada data sintetik

31
2. DBSCAN (Density Spasial Berbasis Clustering Aplikasi dengan Noise)
adalah algoritma clustering berbasis kepadatan.
3. Menemukan cluster-cluster dalam bentuk yang sembarang dalam suatu
database spatial yang memuat noise.
4. Cluster sebagai himpunan maksimum dari titik-titik kepadatan yang
terkoneksi(density-connected)
5. Semua objek yang tidak masuk ke dalam cluster manapun dianggap sebagai
noise.
Selain itu algoritma DBSCAN juga masi terdapat kelemahan yaitu
a. Untuk membedakan setiap cluster dibutuhkan perbedaan jarak dan
kepadatan yang sangat tinggi.
b. User kesulitan untuk menentukan nilai parameter agar memperoleh cluster
yang dapat diterima (acceptable clusters). Parameter tersebut sulit
ditentukan terutama jika berhadapan dengan data berdimensi banyak

DAFTAR PUSTAKA

I Made Suwija.2018. Algoritma DBSCAN (Density Based Spatial Clustering


of Applications With Noise) dan contoh perhitungannya. Universitas Udayana
Ade Winarni. Modul Data Mining. STT Indonesia Tanjungpinang.

32
Latihan.
Tentukan Cluster yang terbentuk dari data berikut menggunakan DBSCAN. Gunakan
parameter berikut sebagai iterasi awal

Minpts 4  
Eps 4  
Titik Pusat A 4 4

No Titik X Y
1 A 4 4
2 B 2 3
3 C 5 3
4 D 6 5
5 E 16 5
6 F 2 6
7 G 4 7
8 H 16 7
9 I 18 7
10 J 121 7
11 K 2 8
12 L 8 8
13 M 17 8
14 N 19 8
15 O 6 9
16 P 20 10
17 Q 6 11
18 R 19 11
19 S 5 12
20 T 7 12
21 U 20 12
22 V 21 13
23 W 6 14
24 X 15 19
25 Y 13 21
26 Z 15 21

33
34
35

Anda mungkin juga menyukai