Anda di halaman 1dari 16

Teknik Clustering Hirarki

Kelompok 1

Nama Kelompok:
Oka

Angga Pramana

Krisna
IB

Masyuda

Wahyu Sastra Dipa

Parangkan

Nurtantio Quidar

(1204505013)
(1204505022)
(1204505050)
(1204505067)

Pengertian

Clustering adalah metode penganalisaan data, merupakan salah satu


metode Data Mining, yang tujuannya adalah untuk mengelompokkan
data dengan karakteristik yang sama ke suatu wilayah yang sama
dan data dengan karakteristik yang berbeda ke wilayah yang lain.

Ada beberapa pendekatan yang digunakan dalam mengembangkan


metode clustering. Dua pendekatan utama adalah clustering dengan
pendekatan partisi dan clustering dengan pendekatan hirarki.

Hierarchical Clustering

Clustering dengan pendekatan hirarki atau sering disebut


dengan hierarchical clustering, mengelompokkan data dengan
membuat suatu hirarki berupa dendogram dimana data yang
mirip akan ditempatkan pada hirarki yang berdekatan dan
yang tidak pada hirarki yang berjauhan.

Ada dua metode yang sering diterapkan yaitu agglomerative


hieararchical clustering dan divisive hierarchical clustering.

Algoritma Hirarki Aglomeratif

Berikut ini adalah cara kerja algoritma hirarki aglomeratif.


Diberikan sekumpulan N item yang akan diklaster, dan sebuah
matrik N*N yang menyatakan jarak antar item pada N, proses
utama dari klasterisasi hirarki antara lain:

1. Mulai dengan membuat klaster sebanyak N, masing-masing


klaster mempunyai sebuah item. Misalnya jarak antar
klaster sama dengan jarak antar item yang dikandungnya.

2. Cari sepasang klaster yang jaraknya terdekat, dan jadikan


sebuah klaster baru. Jadi sekarang kita mempunyai N-1

klaster.

3. Hitung jarak antara klaster yang baru dengan masing-masing


klaster yang lainnya
4. Ulangi langkah 2 dan 3 sampai semua item menjadi sebuah
klaster dengan N item. Tentunya tidak ada gunanya
item yang dikelompokkan menjadi satu klaster

mempunyai N

besar.

Langkah 3 dapat dilakukan dengan tiga(3) cara yaitu singlelinkage, complete-linkage, dan average-linkage.

Pada klasterisasi single-linkage (atau metode minimum), jarak antara


satu klaster dengan klaster lainnya sama dengan jarak terdekat antara
sebuah item yang terdapat dalam satu klaster dengan item dari
klaster lainnya.

Pada klasterisasi complete-linkage (disebut juga metode maksimum)


jarak antara satu klaster dengan klaster lainnya sama dengan jarak
terjauh antara sebuah item yang terdapat dalam satu klaster
dengan item dari klaster lainnya.

Pada klasterisasi average-linkage, jarak antara satu klaster dengan


klaster lainnya sama dengan jarak rata-rata antara sebuah item
yang terdapat dalam satu klaster dengan item dari klaster lainnya.

Single-Linkage Clustering

Single

Linkage

Agglomerative

Clustering
Hierarchical

merupakan

contoh

Clustering.

dari

Prinsip

algoritma

kerja

dari

pengelompokan Hierarchical Clustering dilakukan secara bertahap.


Dan

disetiap

iterasi

atau

perulangan

dari

pengelompokan

Hierarchical Clustering hanya ada satu pemilihan penggabungan


suatu dokumen terhadap dokumen lainnya.

Algoritma Single-Linkage Clustering


Langkah-langkah dari metode Single Linkage Clustering adalah sebagai
berikut:

Menentukan k sebagai jumlah cluster yang ingin dibentuk.

Menghitung jarak / similarity / dissimilarity antar cluster.

Cari dua cluster misal U dan V yang mempunyai jarak terkecil antar
cluster dan gabungkan. sehingga jumlah cluster menjadi berkurang.

Hitung jarak antara cluster yang baru dengan yang lama.

Ulangi langkah 3 dan 4 hingga mendapatkan cluster dengan jumlah


yang sedikit.

Contoh Perhitungan

Untuk menggambarkan algoritma linkage kita lihat jarak-jarak


hipotetis antara 5 objek berikut ini

1 |0

2 |9

D = {dik} = 3 |3

5
|

0
7

|
0

4 |6

5 |11

10

0|

Karena min(dik) = d53 = 2

Objek 5 dan 3 digabung untuk membentuk cluster (35). Untuk


memperoleh

tingkat

pengklasteran

berikutnya,

kita

memerlukan jarak-jarak antara cluster (35) dan objek objek


yang lain yang tersisa yaitu 1, 2 dan 4.
Jarak

jarak yang berdekatan adalah:

(35)1 = min {d31, d51} = min {3, 11} = 3

(35)2 = min {d32, d52} = min {7, 10} = 7

(35)4 = min {d34, d54} = min { 9, 8} = 8

Dengan menghapus baris-baris dan kolom-kolom dari D


yang bersesuaian dengan objek 3 dan 5 dan ading baris
dan kolom untuk cluster (35), kita dapatkan matrik jarak
yang baru
35

35 |0

1 |3

2 |7

4 |8

0|

Jarak terkecil antara pasangan-pasangan cluster sekarang


adalah d (35)1 = 3 dan kita gabung cluster (1) dengan
cluster (35) untuk mendapatkan cluster berikutnya.

Dengan menghitung

d (135)2 = min {d(35)2, d12} = min {7, 9} = 7

d (135)4 = min {d(35)4, d14} = min {8, 6} = 6

kita mendapatkan bahwa matrik jarak untuk tingkat


pengklasteran berikutnya adalah

135

135

|0

4
|

|7

|6

0|

Jarak terdekat yang paling kecil antara pasangan cluster


adalah d 42 = 5, dan kita gabung objek 4 dan 2 untuk
mendapatkan cluster (24).

Pada saat ini kita punya 2 cluster yang berlainan, (135) dan
(24). Jarak terdekat mereka adalah
d (135)24 = min {d (135)2 , d (135 )4 } = min {7, 6} = 6

Matriks jarak yang terakhir menjadi

135

24

135

|0

24

|6

0|

Jadi cluster (135) dan (24) digabung membentuk cluster


tunggal dari semua 5 objek, (12345), sewaktu jarak
terdekat mencapai 6.

Dendrogram yang menggambarkan pengklasteran hirarki (pengelompokan dan tingkattingkat jarak yang diperoleh). digambarkan pada gambar berikut.

J
a 4
r
a
k
2

0
1

3
Objek

52

Anda mungkin juga menyukai