Anda di halaman 1dari 7

METODE ELBOW

Menentukan Nilai K dalam K Means


HO 09 (2)
Erna B Nababan
Pendahuluan

 K Means clustering merupakan algortihma pembelajaran unsupervised, artinya digunakan


untuk dataset yang tidak mempunyai label.
 Metode ini digunakan untuk mengelompokkan data berdasarkan kesamaan (similarity)
 Dari pengelompokan ini, dinyatakan dalam k-cluster, kita dapat menemukan pola
(patterns) dari data tersebut
 Cluster merupakan titik-titik data teragregasi yang bergabung berdasarkan similarity nya
 Objektif dari K Means clustering adalah meminimalkan Euclidean Distance dari setiap
point terhadap titik centroid pada tiap cluster.
Pendahuluan

  Dalam algoritma K-Means, menunjukkan jumlah dari centroid


 Means dalam K-Means merupakan nilai rata-dara dari data.
 Bagaimana menentukan nilai dalam algoritma K-Means?
METODA ELBOW

 Merupakan metode yang popular digunakan untuk menentukan jumlah cluster terbaik
dengan cara melihat persentase hasil perbandingan antara jumlah cluster yang akan
membentuk siku pada suatu titik.
 Ide dari metode Elbow adalah menjalankan K-means pada data set untuk rentang nilai k
(misalnya dari 1 hingga 10), dan untuk setiap nilai k hitung Sum of Squared Errors (SSE)
 Jadi memilih nilai cluster dan kemudian menambah nilai cluster tersebut untuk dijadikan
model data dalam penentuan cluster terbaik.
 Selain itu persentase perhitungan yang dihasilkan menjadi pembanding antara jumlah
cluster yang ditambah .
 Hasil persentase yang berbeda dari setiap nilai cluster dapat ditunjukan dengan
menggunakan grafik sebagai sumber informasinya. Jika nilai cluster pertama dengan nilai
cluster kedua memberikan sudut dalam grafik atau nilainya mengalami penurunan paling
besar maka nilai cluster tersebut yang terbaik
 Untuk mendapatkan perbandingannya adalah dengan menghitung SSE (Sum of Square
Error) dari masing-masing nilai cluster. Karena semakin besar jumlah cluster K maka nilai
SSE akan semakin kecil.
SUM SQUARE OF ERROR

  
Sum of square Error (SSE) adalah perbedaan nilai yang diobservasi dan nilai yang
diprediksi :

SSE =

Biasanya nilai error yang diinginkan adalah nilai yang minimum

Anda mungkin juga menyukai