Anda di halaman 1dari 12

Algoritma Clustering

Hierarki Baru
Review artikel “A New Hierarchical Clustering Algorithm”
Whika Cahyo Saputro
NRP : 6025202009
Definisi

• Clustering adalah Pengelompokan


secara otomatis membentuk kelompok
sampel yang semuanya terkait erat
Struktur1.Baris data
2.Algoritma Clustering
3.Hasil dari kluster data
Agglomerative Clustering
Hierarki Clustering
K-Means Partitioning Clustering
Algoritma Hierarki Pengelompokan Baru
1) Cari tetangga terdekat untuk setiap titik data untuk membuat pasangan, dengan menghitung jarak
Euclidean antara semua data
2) Gabungkan pasangan yang memiliki titik yang sama untuk membuat cluster utama
3) Hitung mean (μ) untuk setiap cluster primer
4) Hitung jarak antara mean (μ) dan semua data titik dari satu cluster
5) Tentukan nilai maksimum (d) di setiap cluster dan beri nama D
6) Hitung nilai jarak antar titik data cluster yang berbeda, jika terdapat dua titik (titik 1 dari cluster 1
dan titik 2 dari cluster 2) dari cluster berbeda yang jaraknya <= (D cluster 1) atau (D cluster 2), lalu
gabungkan kedua cluster ini
• Pasangan = {(1, 2) (3, 7) (4, 2) (5, 2 ) (6, 7) (8, 4) (9, 4) (10, 8) (11,13) (12, 14) (15, 13) (16, 12) (17,
11) (18, 16 ) (19, 16)}.
• Langkah kedua adalah menemukan pasangan yang memiliki poin yang sama.
• 1) Pencarian untuk (1 atau 2)
• Hasil: [(4, 2) (5, 2)]
• 2) Pencarian untuk (1 atau 2 atau 4 atau 5)
• Hasil: [(2, 1) (4, 2) ( 5, 2) (8, 4) (9, 4)]
• 3) Cari (1 atau 2 atau 4 atau 5 atau 8 atau 9)
• Hasil: [(2, 1) (4, 2) (5, 2) (8, 4) (9, 4) (10, 8)]
• 4) Cari (1 atau 2 atau 4 atau 5 atau 8 atau 9 atau 10)
• Hasil: [(2, 1) (4, 2) (5 , 2) (8, 4) (9, 4) (10, 8)]
• 5) Berhenti jika hasil saat ini sama dengan hasil sebelumnya (tidak ada perubahan).
• Hasil: Cluster 1 = {(2, 1) (4, 2) (5, 2) (8, 4) (9, 4) (10, 8)}
• Setelah mencari semua pair, kita akan mendapatkan cluster
utama seperti di 
• Kluster 1 = {(2, 1) (4, 2) (5, 2) (8, 4) (9, 4) (10, 8)}
• Kluster 2 = {( 3, 7) (6, 7)}
• Kluster 3 = {(11, 13) (15, 13) (17, 11)}
• Kluster 4 = {(12, 14) (16, 12) (18, 16) ( 19, 16)}
Gambar Proses Algoritma Pengelompokan Baru
Kesimpulan Percobaan 1

Pertama menggunakan dua


dataset buatan dimensi. Dataset ini berisi
lima puluh data
Titik dalam tiga kategori
Kesimpulan Percobaan 2

Menggunakan dataset fMRI (Syaraf) dimensi tinggi. Data


ini
diperoleh oleh sistem Verio (Siemens, Jerman) dengan
kumparan matriks kepala 12 saluran standar yang
beroperasi pada 3 Tesla di
Institut Penelitian Kansei Fukushi, Universitas Tohoku
Fukushi,
Sendai, Jepang
Kesimpulan, Kelemahan dan Saran
• Kesimpulan : Metode Clustering Baru ini memiliki akurasi yang lebih tinggi dari
K-Means dan Agglomerative Clustering

• Kelemahan : Waktu komputasi lebih tinggi terutama dengan dimensi yang lebih
tinggi

• Saran : Mengurangi waktu komputasi untuk data dengan dimensi yang lebih
tinggi dan membandingkannya dengan metode lainnya

Anda mungkin juga menyukai