Anda di halaman 1dari 2

Double Linkage Clustering: Mencari 2 PASANG titik yang terdekat antar cluster, lalu di rata-rata jaraknya Referensi: Principles

and Theory for Data Mining and Machine Learning, Bertrand Salem Clarke
Diketahui: No KTP Umur Tabungan Normalisasi dengan Min Max Normalization, Range yg diinginkan antara 0-1 No KTP Umur Tabungan 0.544776 0 0 1 0.333333 0.038462 0.179104 0.2 0.205128 0.328358 0.533333 0.032051 0 1 1

128 189 79 99 55
No KTP 189 55

25 30 28 33 40
Umur 40 25

20000000 50000000 180000000 45000000 800000000


Tabungan 800000000 20000000

Max Min

Hitunglah jarak antar Centroid, ambil yang terkecil lalu di merge C1 C2 C3 C4 C5 C1 0 0.56552558 0.464536 0.576462 1.515513 C2 0 0.848189 0.700817 1.539156 C3 0 0.404158 1.141884 C4 0 1.12362 C5 0 C1 C1 C2 C34 C5 C134 C134 C2 C5 C2 C34 C5 0 0.56552558 0.464536 1.515513 0 0.700817 1.539156 0 1.12362 0 C2 C5 0 0.46453561 1.12362 0 1.539156 0

Cara menghitung jarak antara C1 dengan C34 1. Cari yang mana yang lebih dekat C1 dengan C3, atau C1 dengan C4 --> lebih dekat C1 dengan C3 (Di sini belum terlihat karakteristik Double Linkage nya)

Jadi terbentuklah 2 cluster, yaitu C1234 dan C5

Contoh Ilustrasi Double Linkage Clustering (tidak ada hubungan dgn soal sebelumnya)
Misal: C123 C123 C456 C789 0 C456 C789 1.5 ? 0? 0

Mencari Jarak Antara C123 dengan C456 adalah dengan mencari 2 Pasang Titik dgn Jarak terdekat sebagai berikut: Jarak C1 dgn C4 1 Maka 2 pasang terdekat adalah C1 dgn C4 dan C1 dgn C5 C1 dgn C5 2 Maka jarak C123 dengan C456 adalah rata-rata jarak kedua pasang tersebut yaitu (1+2)/2=1.5 C1 dgn C6 3 C2 dgn C4 4 C2 dgn C5 5 C2 dgn C6 6 C3 dgn C4 7 C3 dgn C5 8 C3 dgn C6 9

Anda mungkin juga menyukai