Ch 5. Hierarchical Clustering
Hierarchical Clustering
Merupakan
proses pengelompokan data ke dalam cluster
yang membentuk hirarki.
2
Konsep Dasar
Pada hierarchical clustering terdapat dua pendekatan:
Divisive
: Divisive Analysis Clustering
(DIANA).
5
Single Linkage Clustering
Algoritma :
Dst..
LABEL A B C D
Jika dilihat pada table jarak, maka kita peroleh jarak pasangan terkecil adalah A
dan C dengan jarak sebesar 7.28011. sehingga A dan C akan digabungkan ke
cluster baru dengan nama cluster AC, sehingga cluster sementara C = {AC, B,
D}.
Single Linkage Clustering
Clustering selanjutnya dilanjutkan dengan mencari Kembali pasangan cluster yang
terdekat.
Daritable jarak diatas diperoleh jarak terdekat adalah antara cluster AC dan cluster
D yaitu sebesar 10.19804 sehingga cluster AC dan cluster D akan digabungkan
menjadi cluster ACD, sehingga cluster sementara yang diperoleh, C = {ACD, B}
Single Linkage Clustering
Dikeranakan jumlah cluster saat ini yang tersisa adalah dua
cluster sesuai dengan yang di-inginkan, maka proses
berhenti dengan cluster yang terbentuk yaitu :
C1 = {A, C, D}
C2 = {B}
‘
Complete Linkage Clustering
Complete
Linkage Clustering memiliki tahapan yang
sama dengan Single Linkage Clustering, hanya saja
dibandingkan dengan menggunakan jarak minimal,
Complete Linkage Clustering menggunakan jarak
maksimal dari jarak antar anggota cluster.
Single Linkage :
Complete Linkage :
Average Linkage Clustering
Average
Linkage Clustering memiliki tahapan yang
sama dengan Single Linkage Clustering, hanya saja
dibandingkan dengan menggunakan jarak minimal,
Average Linkage Clustering menggunakan jarak
rata-rata (mean) dari jarak antar anggota cluster.
Single Linkage :
Average Linkage :
Divisive Analysis Clustering
Divisive Analysis Clustering merupakan clustering
yang kebalikan dari agglomerative clustering dimana
proses clustering dimulai dari satu cluster besar
menjadi beberapa cluster (top-down).
‘
Algoritma Divisive
1. Anggap semua data berada dalam sebuah cluster awal.
2. Hitung jarak antar anggota yang terdapat pada cluster.
3. Hitung rata – rata jarak antar anggota.
4. Anggota dengan jarak rata-rata terbesar akan menjadi pembatas
(splinter group).
5. Anggota sisanya kemudian akan menghitung rata – rata jarak dengan
anggota lainnya. (Average Dissimiliarity to Remain Object).
7. Jika hasil selisih bernilai positif, maka objek tersebut akan bergabung
dengan splinter group untuk membentuk cluster baru.
8. Ulangi Langkah 2 untuk pemecahan cluster pada iterasi berikutnya.
Latihan
Lakukan clustering pada data berikut menggunakan
Complete dan Average Linkage Clustering.