Anda di halaman 1dari 6

Nama : Suci Ayu Lestari

NPM 197025008
Mata Kuliah : Statistika Multivariat
Dosen Pengampu : Ir. Nazruddin, MT.
Ph.D

Tugas 2
Cluster K-Means
Soal :
Anda diminta mencluster 8 point berikut: A1(2;10), A2(2; 5), A3(8;4), B1(5;8), B2(7;5), B3(6;4), C1(1;2), C2(4;9). gunakan K-Means dengan
euclidean distance. Asumsikan A2, B2 dan C2 sebagai inisial cluster untuk cluster A, B dan C. Tampilkan perhitungan dan isi cluster (termasuk
centroid cluster yang dihitung dengan rata-rata).

Penyelesaian :
 A1(2; 10), A2(2; 5), A3(8; 4), B1(5; 8), B2(7; 5), B3(6; 4), C1(1; 2), C2(4; 9).
 Jarak antara setiap titik dengan setiap
cluster. Cluster A, centroid: (2;5)
Cluster B, centroid: (7;5)
Cluster C, centroid: (4;9)
 Perhitungan jarak setiap data ke pusat cluster
a. Untuk cluster A
𝑑(A1, A) = √|2 − 2|2 + |10 − 5|2 = 5
𝑑(A2, A) = √|2 − 2|2 + |5 − 5|2 = 0
𝑑(A3, A) = √|8 − 2|2 + |4 − 5|2 = 6,083
𝑑(B1, A) = √|5 − 2|2 + |8 − 5|2 = 4,243
𝑑(B2, A) = √|7 − 2|2 + |5 − 5|2 = 5
𝑑(B3, A) = √|6 − 2|2 + |4 − 5|2 = 4,123
𝑑(C1, A) = √|1 − 2|2 + |2 − 5|2 = 3,162
𝑑(C2, A) = √|4 − 2|2 + |9 − 5|2 = 4,472

b. Cluster B
𝑑(A1, B) = √|5 − 7|2 + |10 − 5|2 = 7,071
𝑑(A2, B) = √|2 − 7|2 + |5 − 5|2 = 5
𝑑(A3, B) = √|8 − 7|2 + |4 − 5|2 = 1,414
𝑑(B1, B) = √|5 − 7|2 + |8 − 5|2 = 3,606
𝑑(B2, B) = √|7 − 7|2 + |5 − 5|2 = 0
𝑑(B3, B) = √|6 − 7|2 + |4 − 5|2 = 1,414
𝑑(C1, B) = √|1 − 7|2 + |2 − 5|2 = 6,708
𝑑(C2, B) = √|4 − 7|2 + |9 − 5|2 = 5

c. Cluster C
𝑑(A1, C) = √|2 − 4|2 + |10 − 9|2 = 2,236
𝑑(A2, C) = √|2 − 4|2 + |5 − 9|2 = 4,472
𝑑(A3, C) = √|8 − 4|2 + |4 − 9|2 = 6,4036
𝑑(B1, C) = √|5 − 4|2 + |8 − 9|2 = 1,414
𝑑(B2, C) = √|7 − 4|2 + |5 − 9|2 = 5
𝑑(B3, C) = √|6 − 4|2 + |4 − 9|2 = 5,385
𝑑(C1, C) = √|1 − 4|2 + |2 − 9|2 = 7,616
𝑑(C2, C) = √|4 − 4|2 + |9 − 9|2 = 0

 Pengelompokkan data kedalam cluster dengan jarak terpendek


Point X Y 𝑑A 𝑑B 𝑑C A B C
A1 2 10 5 7,071068 2,236068 0 0 1
A2 2 5 0 5 4,472136 1 0 0
A3 8 4 6,082763 1,414214 6,403124 0 1 0
B1 5 8 4,242641 3,605551 1,414214 0 0 1
B2 7 5 5 0 5 0 1 0
B3 6 4 4,123106 1,414214 5,385165 0 1 0
C1 1 2 3,162278 6,708204 7,615773 1 0 0
C2 4 9 4,472136 5 0 0 0 1

 Perhitungan pusat cluster baru


2+1 5+2
a) Cluster A : ( ; ) = (1,5;3,5)
2 2
8+7+6 4+5+4)
b) Cluster B : ( ; ) = (5,333;4,333)
3 3
82+5+4 10+8+9
c) Cluster C : ( ;
3 3
) = (3,667; 9)

 Pengulangan 2 : Perhitungan jarak setiap data ke pusat cluster baru


a. Cluster A

𝑑(A1, A) = √|2 − 1,5|2 + |10 − 3,5|2 = 6,519


𝑑(A2, A) = √|2 − 1,5|2 + |5 − 3,5|2 = 1,581

𝑑(A3, A) = √|8 − 1,5|2 + |4 − 3,5|2 = 6,519

𝑑(B1, A) = √|5 − 1,5|2 + |8 − 3,5|2 = 5,701

𝑑(B2, A) = √|7 − 1,5|2 + |5 − 3,5|2 = 5,701

𝑑(B3, A) = √|6 − 1,5|2 + |4 − 3,5|2 = 4,528

𝑑(C1, A) = √|1 − 1,5|2 + |2 − 3,5|2 = 1,581

𝑑(C2, A) = √|4 − 1,5|2 + |9 − 3,5|2 = 6,041


b. Cluster B

𝑑(A1, B) = √|5 − 5,333|2 + |10 − 4,333|2 = 6,574

𝑑(A2, B) = √|2 − 5,333|2 + |5 − 4,333|2 = 3,399

𝑑(A3, B) = √|8 − 5,333|2 + |4 − 4,333|2 = 2,688

𝑑(B1, B) = √|5 − 5,333|2 + |8 − 4,333|2 = 3,682

𝑑(B2, B) = √|7 − 5,333|2 + |5 − 4,333|2 = 1,795

𝑑(B3, B) = √|6 − 5,333|2 + |4 − 4,333|2 = 0,745

𝑑(C1, B) = √|1 − 5,333|2 + |2 − 4,333|2 = 4,921

𝑑(C2, B) = √|4 − 5,333|2 + |9 − 4,333|2 = 4,853


c. Cluster C

𝑑(A1, C) = √|2 − 3,667|2 + |10 − 9|2 = 1,944

𝑑(A2, C) = √|2 − 3,667|2 + |5 − 9|2 = 4,333


𝑑(A3, C) = √|8 − 3,667|2 + |4 − 9|2 = 6,616

𝑑(B1, C) = √|5 − 3,667|2 + |8 − 9|2 = 1,666

𝑑(B2, C) = √|7 − 3,667|2 + |5 − 9|2 = 5,201

𝑑(B3, C) = √|6 − 3,667|2 + |4 − 9|2 = 5,517

𝑑(C1, C) = √|1 − 3,667|2 + |2 − 9|2 = 7,491

𝑑(C2, C) = √|4 − 3,667|2 + |9 − 9|2 = 0,333


 Pengelompokkan data kedalam cluster dengan jarak terpendek
Point X Y dA dB dC A B C
A1 2 10 6,519202 6,574479 1,943936 0 0 1
A2 2 5 1,581139 3,399085 4,333462 1 0 0
A3 8 4 6,519202 2,687709 6,616259 0 1 0
B1 5 8 5,700877 3,682089 1,6664 0 0 1
B2 7 5 5,700877 1,795488 5,20662 0 1 0
B3 6 4 4,527693 0,745505 5,517507 0 1 0
C1 1 2 1,581139 4,921156 7,490854 1 0 0
C2 4 9 6,041523 4,853636 0,333 0 0 1

 Perhitungan pusat cluster baru


2+1 5+2
Cluster A: ( ; ) = (1,5;3,5)
2 2
8+7+6
Cluster B : ( 4+5+4) ) = (5,333;4,333)
3 ; 3

Cluster C : 82+5+4 10+8+9


( ) = (3,667; 9)
; 3
3
Kesimpulan :
Karena centroid tidak mengalami perubahan (sama dengan centroid sebelumnya) maka proses clustering selesai. Dengan centroid sebagai
berikut:
Cluster A : (1,5;3,5)
Cluster B : (5,333;4,333)
Cluster C : (3,667; 9)

Anda mungkin juga menyukai