Anda di halaman 1dari 23

K-MEANS ALGORITMA

 K-Means clustering merupakan salah satu metode cluster analysis


non hirarki yang berusaha untuk mempartisi objek yang ada
kedalam satu atau lebih cluster atau kelompok objek berdasarkan
karakteristiknya, sehingga objek yang mempunyai karakteristik
yang sama dikelompokkan dalam satu cluster yang sama dan
K-MEANS obejek yang mempunyai karakteristik yang berbeda
dikelompokkan dalam cluster yang lain.
 Kelemahan K-Means

1. Bila jumlah data tidak terlalu banyak, mudah untuk menentukan cluster
awal.

2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan


perhitungan.

K-MEANS 3. Tidak pernah mengetahui real cluster dengan menggunakan data yang
sama, namun jika dimasukkan dengan cara yang berbeda mungkin dapat
memproduksi cluster yang berbeda jika jumlah datanya sedikit.

4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena


dianggap bahwa setiap atribut memiliki bobot yang sama.
 Kelemahan K-Means

1. Bila jumlah data tidak terlalu banyak, mudah untuk menentukan cluster
awal.

2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan


perhitungan.

K-MEANS 3. Tidak pernah mengetahui real cluster dengan menggunakan data yang
sama, namun jika dimasukkan dengan cara yang berbeda mungkin dapat
memproduksi cluster yang berbeda jika jumlah datanya sedikit.

4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena


dianggap bahwa setiap atribut memiliki bobot yang sama.
 Kelemahan K-Means

1. Bila jumlah data tidak terlalu banyak, mudah untuk menentukan cluster
awal.

2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan


perhitungan.

K-MEANS 3. Tidak pernah mengetahui real cluster dengan menggunakan data yang
sama, namun jika dimasukkan dengan cara yang berbeda mungkin dapat
memproduksi cluster yang berbeda jika jumlah datanya sedikit.

4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena


dianggap bahwa setiap atribut memiliki bobot yang sama.
 ALGORITMA K-MEANS

1. Menentukan jumlah cluster

2. Menentukan nilai centroid

Dalam menentukan nilai centroid untuk awal iterasi , nilai awal

K-MEANS centroid dilakukan secara acak. Sedangkan jika menentukan nilai


centroid yang merupakan tahap dari iterasi, maka digunakan rumus
sebagai berikut:
3. Menghitung jarak antara titik centroid dengan titik tiap objek.

4. Pengelompokan object untuk menentukan anggota cluster adalah

K-MEANS dengan memperhitungkan jarak minimum objek.

5. Kembali ke tahap 2, lakukan perulangan hingga nilai centroid yang


dihasilkan tetap dan anggota cluster tidak berpindah ke cluster lain.
 Metode K-Means Clustering hanya bisa mengolah data dalam
bentuk angka, maka untuk data yang berbentuk nominal harus di
inisialisasikan terlebih dahulu dalam bentuk angka. Langkahnya
adalah:

 Urutkan data berdasarkan frekuensi kemunculannya.


K-MEANS
 Inisialisasikan data tersebut mulai dari data tertinggi dengan nilai
1, kemudian data selanjutnya 2, 3, dan seterusnya.
K-MEANS
Diberikan data nilai dari 12 siswa sebagai berikut, kemudian
jadikan data tersebut menjadi 2 kluster.

CONTOH
KASUS
Diketahui:
• Jumlah cluster = 2
• Jumlah data = 12
Langkah penyelesaian
1. Tentukan pusat awal cluster “centroid”
CONTOH Untuk penentuan awal diasumsikan :
KASUS  Diambil data ke-2 sebagai pusat cluster ke-1:
84, 76, 79, 77, 76, 77, 75, 81
 Diambil data ke-5 sebagai pusat cluster ke-2:
82, 82, 81, 91, 90, 82, 79, 91
2. Perhitungan jarak pusat cluster

a. Perhitungan jarak dari data ke-1 terhadap pusat cluster

CONTOH
KASUS
b. Perhitungan jarak dari data ke-2 terhadap pusat cluster

CONTOH
KASUS
c. Perhitungan jarak dari data ke-3 terhadap pusat cluster

CONTOH
KASUS
Lakukan perhitungan seterusnya sampai jarak dari data ke 12
terhadap pusat cluster, sehingga hasil perhitungan jarak
selengkapnya adalah:
Data C1 C2
1 10,4 21,7
2 0 24,02
3 24,1 14,5
CONTOH 4 14,1 26,03
KASUS 5 24,02 0
6 15,6 28,8
7 16,4 22,1
8 11,8 26,2
9 11,1 22,4
10 6,8 27,09
11 12,2 25,8
12 6,5 22,9
3. Pengelompokan data, misalkan G1
Data C1 C2 Cluster
1 10,4 21,7 C1
2 0 24,02 C1
3 24,1 14,5 C2
4 14,1 26,03 C1
CONTOH 5 24,02 0 C2
KASUS 6 15,6 28,8 C1
7 16,4 22,1 C1
8 11,8 26,2 C1
9 11,1 22,4 C1
10 6,8 27,09 C1
11 12,2 25,8 C1
12 6,5 22,9 C1
4. Penentuan Pusat Cluster Baru

CONTOH
KASUS
4. Penentuan Pusat Cluster Baru

CONTOH
KASUS
5. Pengulangan langkah ke-2 hingga posisi data tidak mengalami
perubahan
a. Perhitungan jarak dari data ke-1 terhadap pusat cluster

CONTOH
KASUS
b. Perhitungan jarak dari data ke-2 terhadap pusat cluster

CONTOH
KASUS
c. Perhitungan seterusnya sampai jarak dari data ke-12 terhadap
pusat cluster
Data C1 C2
Sehingga hasil 1 5,5 20,5
perhitungan jarak 2 7,9 22,9

selengkapnya adalah: 3 21,1 7,2


4 14,08 23,12
CONTOH 5 23,3 7,2
KASUS 6 9 26,6
7 10,6 19,5
8 6,7 23,3
9 5,1 22,4
10 5,6 27,09
11 10 25,8
12 3,4 22,9
6. Lakukan pengelompokan data kembali, misalkan G2
Data C1 C2 Cluster
1 5,5 20,5 C1
2 7,9 22,9 C1
3 21,1 7,2 C2
4 14,08 23,12 C1
CONTOH 5 23,3 7,2 C2
KASUS 6 9 26,6 C1
7 10,6 19,5 C1
8 6,7 23,3 C1
9 5,1 22,4 C1
10 5,6 27,09 C1
11 10 25,8 C1
12 3,4 22,9 C1
7. Karena G1 = G2 dimana anggota sama, maka tidak perlu
dilakukan iterasi / perulangan lagi. Dan sampai disini hasil
clustering sudah mencapai stabil dan konvergen.

8. Kesimpulan
Hasil Clustering adalah
CONTOH
Cluster 1 : siswa 1, 2, 4, 6, 7, 8, 9, 10, 11, 12
KASUS
Cluster 2 : Siswa 3 dan 5

Anda mungkin juga menyukai