Pertemuan Ke 9

K-MEANS ALGORITMA
 K-Means clustering merupakan salah satu metode cluster analysis

non hirarki yang berusaha untuk mempartisi objek yang ada
kedalam satu atau lebih cluster atau kelompok objek berdasarkan
karakteristiknya, sehingga objek yang mempunyai karakteristik
yang sama dikelompokkan dalam satu cluster yang sama dan
K-MEANS obejek yang mempunyai karakteristik yang berbeda
dikelompokkan dalam cluster yang lain.
 Kelemahan K-Means
1. Bila jumlah data tidak terlalu banyak, mudah untuk menentukan cluster
awal.
2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan

perhitungan.
K-MEANS 3. Tidak pernah mengetahui real cluster dengan menggunakan data yang
sama, namun jika dimasukkan dengan cara yang berbeda mungkin dapat
memproduksi cluster yang berbeda jika jumlah datanya sedikit.
4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena

dianggap bahwa setiap atribut memiliki bobot yang sama.
awal.

perhitungan.

awal.

perhitungan.

 ALGORITMA K-MEANS
1. Menentukan jumlah cluster
2. Menentukan nilai centroid
Dalam menentukan nilai centroid untuk awal iterasi , nilai awal
K-MEANS centroid dilakukan secara acak. Sedangkan jika menentukan nilai

centroid yang merupakan tahap dari iterasi, maka digunakan rumus
sebagai berikut:
3. Menghitung jarak antara titik centroid dengan titik tiap objek.
4. Pengelompokan object untuk menentukan anggota cluster adalah
K-MEANS dengan memperhitungkan jarak minimum objek.
5. Kembali ke tahap 2, lakukan perulangan hingga nilai centroid yang

dihasilkan tetap dan anggota cluster tidak berpindah ke cluster lain.
 Metode K-Means Clustering hanya bisa mengolah data dalam
bentuk angka, maka untuk data yang berbentuk nominal harus di
inisialisasikan terlebih dahulu dalam bentuk angka. Langkahnya
adalah:
 Urutkan data berdasarkan frekuensi kemunculannya.

K-MEANS
 Inisialisasikan data tersebut mulai dari data tertinggi dengan nilai
1, kemudian data selanjutnya 2, 3, dan seterusnya.
K-MEANS
Diberikan data nilai dari 12 siswa sebagai berikut, kemudian
jadikan data tersebut menjadi 2 kluster.
CONTOH
KASUS
Diketahui:
• Jumlah cluster = 2
• Jumlah data = 12
Langkah penyelesaian
1. Tentukan pusat awal cluster “centroid”
CONTOH Untuk penentuan awal diasumsikan :
KASUS  Diambil data ke-2 sebagai pusat cluster ke-1:
84, 76, 79, 77, 76, 77, 75, 81
 Diambil data ke-5 sebagai pusat cluster ke-2:
82, 82, 81, 91, 90, 82, 79, 91
2. Perhitungan jarak pusat cluster
a. Perhitungan jarak dari data ke-1 terhadap pusat cluster
CONTOH
KASUS
b. Perhitungan jarak dari data ke-2 terhadap pusat cluster
CONTOH
KASUS
c. Perhitungan jarak dari data ke-3 terhadap pusat cluster
CONTOH
KASUS
Lakukan perhitungan seterusnya sampai jarak dari data ke 12
terhadap pusat cluster, sehingga hasil perhitungan jarak
selengkapnya adalah:
Data C1 C2
1 10,4 21,7
2 0 24,02
3 24,1 14,5
CONTOH 4 14,1 26,03
KASUS 5 24,02 0
6 15,6 28,8
7 16,4 22,1
8 11,8 26,2
9 11,1 22,4
10 6,8 27,09
11 12,2 25,8
12 6,5 22,9
3. Pengelompokan data, misalkan G1
Data C1 C2 Cluster
1 10,4 21,7 C1
2 0 24,02 C1
3 24,1 14,5 C2
4 14,1 26,03 C1
CONTOH 5 24,02 0 C2
KASUS 6 15,6 28,8 C1
7 16,4 22,1 C1
8 11,8 26,2 C1
9 11,1 22,4 C1
10 6,8 27,09 C1
11 12,2 25,8 C1
12 6,5 22,9 C1
4. Penentuan Pusat Cluster Baru
CONTOH
KASUS
4. Penentuan Pusat Cluster Baru
CONTOH
KASUS
5. Pengulangan langkah ke-2 hingga posisi data tidak mengalami
perubahan
a. Perhitungan jarak dari data ke-1 terhadap pusat cluster
CONTOH
KASUS
b. Perhitungan jarak dari data ke-2 terhadap pusat cluster
CONTOH
KASUS
c. Perhitungan seterusnya sampai jarak dari data ke-12 terhadap
pusat cluster
Data C1 C2
Sehingga hasil 1 5,5 20,5
perhitungan jarak 2 7,9 22,9
selengkapnya adalah: 3 21,1 7,2

4 14,08 23,12
CONTOH 5 23,3 7,2
KASUS 6 9 26,6
7 10,6 19,5
8 6,7 23,3
9 5,1 22,4
10 5,6 27,09
11 10 25,8
12 3,4 22,9
6. Lakukan pengelompokan data kembali, misalkan G2
Data C1 C2 Cluster
1 5,5 20,5 C1
2 7,9 22,9 C1
3 21,1 7,2 C2
4 14,08 23,12 C1
CONTOH 5 23,3 7,2 C2
KASUS 6 9 26,6 C1
7 10,6 19,5 C1
8 6,7 23,3 C1
9 5,1 22,4 C1
10 5,6 27,09 C1
11 10 25,8 C1
12 3,4 22,9 C1
7. Karena G1 = G2 dimana anggota sama, maka tidak perlu
dilakukan iterasi / perulangan lagi. Dan sampai disini hasil
clustering sudah mencapai stabil dan konvergen.
8. Kesimpulan
Hasil Clustering adalah
CONTOH
Cluster 1 : siswa 1, 2, 4, 6, 7, 8, 9, 10, 11, 12
KASUS
Cluster 2 : Siswa 3 dan 5

Pertemuan Ke 9

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Pertemuan Ke 9

Diunggah oleh

Hak Cipta:

Format Tersedia

K-MEANS ALGORITMA

 K-Means clustering merupakan salah satu metode cluster analysis

2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan

4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena

2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan

4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena

2. Jumlah cluster, sebanyak K, harus ditentukan sebelum dilakukan

4. Tidak tahu kontribusi dari atribut dalam proses pengelompokkan karena

1. Menentukan jumlah cluster

2. Menentukan nilai centroid

Dalam menentukan nilai centroid untuk awal iterasi , nilai awal

K-MEANS centroid dilakukan secara acak. Sedangkan jika menentukan nilai

4. Pengelompokan object untuk menentukan anggota cluster adalah

K-MEANS dengan memperhitungkan jarak minimum objek.

5. Kembali ke tahap 2, lakukan perulangan hingga nilai centroid yang

 Urutkan data berdasarkan frekuensi kemunculannya.

a. Perhitungan jarak dari data ke-1 terhadap pusat cluster

selengkapnya adalah: 3 21,1 7,2

Anda mungkin juga menyukai