Belajar Mudah Algoritma Data Mining K-Means
Belajar Mudah Algoritma Data Mining K-Means
com
Data Mining
http://ilmubiner.blogspot.com
Page 1 of 5
ilmubiner@gmail.com
Data Mining
http://ilmubiner.blogspot.com
a
1
2
4
5
b
1
1
3
4
c1
c2
a
1
2
b
1
1
Untuk pengulangan berikutnya (pengulangan ke-1 sampai selesai), centroid baru dihitung
dengan menghitung nilai rata-rata data pada setiap cluster. Jika centroid baru berbeda
dengan centroid sebelumnya, maka proses dilanjutkan ke langkah berikutnya. Namun
jika centroid yang baru dihitung sama dengan centroid sebelumnya, maka proses
clustering selesai.
3. Hitung jarak data dengan centroid. Rumus-rumus untuk menghitung jarak antara lain :
a. Euclidean.
b. Manhattan / City Block.
c. Minkowski.
Rumus yang digunakan di sini adalah rumus Euclidean Distance :
Page 2 of 5
ilmubiner@gmail.com
=
=
=
=
=
Data Mining
http://ilmubiner.blogspot.com
) = (
( +,
) = (
( ,
( ,
) = (
) = (
%
+
) +(
) +(
) +(
) +(
%
+
!)
(1 1) + (1 1) = 0
!)
(5 1) + (4 1) = 5
!)
!)
=
=
(2 1) + (1 1) = 1
(4 1) + (3 1) = 3.605551
) = (
( +,
) = (
( ,
( ,
) = (
) = (
%
+
) +(
) +(
) +(
) +(
%
+
!)
(1 2) + (1 1) = 1
!)
(5 2) + (4 1) = 4.242641
!)
!)
=
=
(2 2) + (1 1) = 0
(4 2) + (3 1) = 2.828427
Untuk seterusnya, hitung jarak pada setiap baris data, dan hasilnya seperti pada Tabel 3.
Tabel 3. Hasil Perhitungan Jarak
n
1
2
3
4
a
1
2
4
5
b
1
1
3
4
dc1
dc2
0
1
1
0
3.605551 2.828427
5
4.242641
4. Kelompokkan data sesuai dengan cluster-nya, yaitu data yang memiliki jarak terpendek.
Contoh; karena ( , ) < ( , ) maka
masuk ke dalam cluster 1. Pada Tabel 4,
data n = 1 masuk ke dalam cluster 1 karena dc1 < dc2, sedangkan data n = 2, 3, 4 masuk
ke dalam cluster 2 karena dc2 < dc1.
Page 3 of 5
ilmubiner@gmail.com
Data Mining
http://ilmubiner.blogspot.com
a
1
2
4
5
b
1
1
3
4
dc1
dc2
0
1
1
0
3.605551 2.828427
5
4.242641
c1
Ok
c2
Ok
Ok
Ok
a
1
2
4
5
b
1
1
3
4
c1
c2
a
1
2
b
1
1
n
1
2
3
4
a
1
2
4
5
b
1
1
3
4
dc1
dc2
0
1
1
0
3.605551 2.828427
5
4.242641
c1
Ok
c2
Ok
Ok
Ok
Pengulangan ke-1
c1
c2
n
1
2
3
4
a
b
Nilai pada sel diperoleh dari menghitung
1
1
rata-rata pada tabel di atasnya sesuai
3.666667 2.666667 dengan warna sel
a
1
2
4
5
b
1
1
3
4
dc1
dc2
0
3.14466
1
2.357023
3.605551 0.471405
5
1.885618
Page 4 of 5
c1
Ok
Ok
c2
Ok
Ok
ilmubiner@gmail.com
Data Mining
http://ilmubiner.blogspot.com
Pengulangan ke-2
c1
c2
a
1.5
4.5
b
1
3.5
n
1
2
3
4
a
1
2
4
5
b
1
1
3
4
a
1.5
4.5
b
1
3.5
dc1
0.5
0.5
3.201562
4.609772
dc2
4.301163
2.357023
0.471405
1.885618
c1
Ok
Ok
Pengulangan ke-3
c1
c2
[EoF]
Page 5 of 5
c2
Ok
Ok