merupakan salah satu metode pada penambangan data. Tujuan
utama dari metode clustering ialah mengelompokkan sejumlah objek data ke
dalam sebuah cluster atau grup. Sebuah objek pada sebuah cluster memiliki
kemiripan yang sama dengan objek lain dan sebuah objek memiliki perbedaan dengan objek pada
cluster lain. Clustering menggunakan teknik unsupervised
kelompok tertentu tanpa adanya label cluster sebelumnya. Teknik ini baik
digunakan pada koleksi data yang tidak memiliki label sebelumnya. Sedangkan
untuk data yang memiliki label, teknik ini dapat dijadikan sebagai pembanding
kemiripan antar objek ialah dengan menghitung jarak terpendek. Salah satu
metode untuk menghitung jarak terpendek ialah Euclidean Distance.
Dalam matematika, Euclidean Distance adalah jarak antara dua titik yang
dapat diukur menggunakan formula pythagoras. Euclidean Distance sering disebut
dikalikan dengan bilangan real dan lainlain (Prasetya, 2013).
Jarak antar vektor atau panjang vektor dapat didefinisikan sebagai berikut
‖A‖=√ X 12+Y 12
2.1.2.1 KMeans