√
p
d ( P ,Q )= ∑ ¿¿¿
j=1
√
n
D ( a , b) = ∑ ¿¿¿
k=1
Di mana :
n adalah jumlah dimensi (atribut).
a k dan b k adalah atribut ke-k dari objek data p dan q.
PASIEN A B
1 1 1
2 2 1
3 4 3
4 5 4
1. Hitung jumlah datanya, yang mana pada data tersebut jumlah datanya
adalah 4.
2. Kemudian, tentukan jumlah k clusternya, yang mana pada jumlah cluster
ini tidak boleh lebih dari jumlah data. Pada soal ini dimisalkan clusternya
berjumlah 2, maka k = 2.
3. Tentukan centroid awal yang dilakukan secara acak. Misalnya diambil
data pasien 1 dan 2 saja sebagai centroid awalnya, yang dapat dituliskan :
- Centroid cluster 1 (CC-1) = {1,1}
- Centroid cluster 2 (CC-2) = {2,1}
4. Hitung jarak data dengan centroid
CENTROID A B
1 1 1
d ( p1 , c1 ) =√ ¿¿
Maka didapatkan :
d ( p1 , c1 ) =√ ¿¿
d ( p2 , c1 ) =√ ¿ ¿
d ( p3 , c1 ) =√ ¿ ¿
d ( p4 , c 1 )= √ ¿ ¿
CENTROID A B
2 2 1
d ( p1 , c2 ) =√ ¿ ¿
d ( p1 , c2 ) =√ ¿ ¿
d ( p2 , c2 ) =√ ¿ ¿
d ( p3 , c2 ) =√ ¿ ¿
d ( p4 , c 2 )= √ ¿ ¿
Hasil perhitungan tersebut dapat diringkas sesuai pada tabel di bawah ini :
2 2 1 1 0
3 4 3 3,61 2,83
4 5 4 5 4,24
2 2 1 1 0 V
3 4 3 3,61 2,83 V
4 5 4 5 4,24 V
6. Hitung centroid berikutnya, yang mana pada kali ini centroid dihitung pada
nilai rata-rata dari hasil penjumlahan data pada masing-masing cluster.
(Iterasi II)
PASIEN A B
1 1 1
2 2 1
3 4 3
4 5 4
- Pada cluster-1 terdapat 1 data pasien-1, maka nilai rata-rata pada cluster-1
adalah :
Average(P1A) = Average (1) = 1, dan Average(P1B) = Average (1) = 1
- Pada cluster-2 terdapat 3 data pasien (Pasien 2, 3, dan 4), maka nilai rata-
rata pada cluster-2 adalah :
CENTROID A B
1 1 1
2 3,67 2,67
Seperti :
d ( p1 , c1 ) =√ ¿¿
d ( p1 , c1 ) =√ ¿¿
d ( p1 , c2 ) =√ ¿ ¿
Begitu seterusnya
2 2 1 1 2,36
3 4 3 3,61 0,47
4 5 4 5 1,89
2 2 1 1 2,36 V
3 4 3 3,61 0,47 V
4 5 4 5 1,89 V
Dari hasil tabel di atas didapatkan bahwa pasien 2 berpindah ke cluster 2.
CENTROID A B
1 1,5 1
2 4,5 3,5
10. Ulangi lagi langkah-langkah menghitung jarak antara data dengan centroid,
sehingga didapatkan :
2 2 1 0,5 3,54
3 4 3 3,20 0,71
4 5 4 4,61 0,71
2 2 1 0,5 3,54 V
3 4 3 3,20 0,71 V
4 5 4 4,61 0,71 V
Dari hasil tabel di atas, cluster tidak ada lagi data yang pindah, maka
proses clustering dapat dihentikan. Centroid pada iterasi III sama dengan
centroid pada iterasi II (tetap atau tidak perubahan). Maka iterasi
dihentikan dan proses clustering menghasilkan :
- Cluster-1 berisi : Pasien 1 dan Pasien 2.
- Cluster-2 berisi : Pasien 3 dan Pasien 4.