Anda di halaman 1dari 1

Clustering 

merupakan salah satu metode pada penambangan data. Tujuan
utama   dari   metode  clustering  ialah   mengelompokkan sejumlah   objek   data   ke
dalam   sebuah cluster atau   grup.   Sebuah   objek   pada sebuah  cluster memiliki
kemiripan yang sama dengan objek lain dan sebuah objek memiliki perbedaan dengan  objek  pada
cluster  lain.  Clustering  menggunakan teknik  unsupervised

learning yang   digunakan   untuk   mengelompokkan   data   atau   objek   ke   dalam

kelompok   tertentu   tanpa   adanya   label  cluster sebelumnya.   Teknik   ini   baik

digunakan pada koleksi data yang tidak memiliki label sebelumnya. Sedangkan

untuk data yang memiliki label, teknik ini dapat dijadikan sebagai pembanding

antara   hasil  clustering  dengan   label   sebenarnya.   Sehingga   diketahui   tingkat

akurasi pada metode  clustering  tersebut. Teknik yang membutuhkan data label

disebut  supervised   learning.   Metode   yang   digunakan   dalam   menentukan

kemiripan   antar   objek   ialah   dengan   menghitung   jarak   terpendek.   Salah   satu

metode untuk menghitung jarak terpendek ialah Euclidean Distance.

Dalam matematika, Euclidean Distance adalah jarak antara dua titik yang

dapat diukur menggunakan formula pythagoras. Euclidean Distance sering disebut

sebagai  dengan  vector  geometri  yang memiliki  panjang  (magnitude)  dan  arah

(direction).   Sedangkan   ruang   vektor   adalah   sebuah   struktur   matematika   yang

dibentuk   oleh   sekumpulan   vektor.   Vektorvektor   tersebut   dapat   ditambahkan

dikalikan dengan bilangan real dan lainlain (Prasetya, 2013).

Jarak antar vektor atau panjang vektor dapat didefinisikan sebagai berikut

‖A‖=√ X 12+Y 12

dan  ‖B‖=√ X 22+Y 22

Sedangkan  untuk menghitung  kedua jarak  antara  kedua  vektor tersebut

ialah sebagai berikut: d ( ¯A, ¯B)=√(X 1−X2)2+(Y 1−Y 2)2

2.1.2.1 KMeans

KMeans   merupakan   salah   satu   algoritma   penambangan

Anda mungkin juga menyukai