NPM 197025008
Mata Kuliah : Statistika Multivariat
Dosen Pengampu : Ir. Nazruddin, MT.
Ph.D
Tugas 2
Cluster K-Means
Soal :
Anda diminta mencluster 8 point berikut: A1(2;10), A2(2; 5), A3(8;4), B1(5;8), B2(7;5), B3(6;4), C1(1;2), C2(4;9). gunakan K-Means dengan
euclidean distance. Asumsikan A2, B2 dan C2 sebagai inisial cluster untuk cluster A, B dan C. Tampilkan perhitungan dan isi cluster (termasuk
centroid cluster yang dihitung dengan rata-rata).
Penyelesaian :
A1(2; 10), A2(2; 5), A3(8; 4), B1(5; 8), B2(7; 5), B3(6; 4), C1(1; 2), C2(4; 9).
Jarak antara setiap titik dengan setiap
cluster. Cluster A, centroid: (2;5)
Cluster B, centroid: (7;5)
Cluster C, centroid: (4;9)
Perhitungan jarak setiap data ke pusat cluster
a. Untuk cluster A
𝑑(A1, A) = √|2 − 2|2 + |10 − 5|2 = 5
𝑑(A2, A) = √|2 − 2|2 + |5 − 5|2 = 0
𝑑(A3, A) = √|8 − 2|2 + |4 − 5|2 = 6,083
𝑑(B1, A) = √|5 − 2|2 + |8 − 5|2 = 4,243
𝑑(B2, A) = √|7 − 2|2 + |5 − 5|2 = 5
𝑑(B3, A) = √|6 − 2|2 + |4 − 5|2 = 4,123
𝑑(C1, A) = √|1 − 2|2 + |2 − 5|2 = 3,162
𝑑(C2, A) = √|4 − 2|2 + |9 − 5|2 = 4,472
b. Cluster B
𝑑(A1, B) = √|5 − 7|2 + |10 − 5|2 = 7,071
𝑑(A2, B) = √|2 − 7|2 + |5 − 5|2 = 5
𝑑(A3, B) = √|8 − 7|2 + |4 − 5|2 = 1,414
𝑑(B1, B) = √|5 − 7|2 + |8 − 5|2 = 3,606
𝑑(B2, B) = √|7 − 7|2 + |5 − 5|2 = 0
𝑑(B3, B) = √|6 − 7|2 + |4 − 5|2 = 1,414
𝑑(C1, B) = √|1 − 7|2 + |2 − 5|2 = 6,708
𝑑(C2, B) = √|4 − 7|2 + |9 − 5|2 = 5
c. Cluster C
𝑑(A1, C) = √|2 − 4|2 + |10 − 9|2 = 2,236
𝑑(A2, C) = √|2 − 4|2 + |5 − 9|2 = 4,472
𝑑(A3, C) = √|8 − 4|2 + |4 − 9|2 = 6,4036
𝑑(B1, C) = √|5 − 4|2 + |8 − 9|2 = 1,414
𝑑(B2, C) = √|7 − 4|2 + |5 − 9|2 = 5
𝑑(B3, C) = √|6 − 4|2 + |4 − 9|2 = 5,385
𝑑(C1, C) = √|1 − 4|2 + |2 − 9|2 = 7,616
𝑑(C2, C) = √|4 − 4|2 + |9 − 9|2 = 0