Anda di halaman 1dari 13

Universitas Putra Indonesia YPTK Padang

Fakulas Ilmu Komputer
Program Studi Teknik Informatika

By : Eka Praja Wiyata Mandala, S.Kom, M.Kom

K-Means mampu meminimalkan rata-rata jarak setiap data ke cluster-nya.Algoritma K-Means K-means merupakan metode clustering secara partitioning yang memisahkan data ke dalam kelompok yang berbeda Dengan partitioning secara iteratif. .

Kelompokkan setiap data berdasarkan jarak terdekat antara data dengan centroidnya. 3.Dasar algoritma K-means adalah sebagai berikut : 1.Tentukan nilai k sebagai jumlah klaster yang ingin dibentuk. 2. .Hitung jarak setiap data ke masing-masing centroid menggunakan rumus korelasi antar dua objek yaitu Euclidean Distance 4.Bangkitkan k centroid (titik pusat klaster) awal secara random.

6. Kembali ke langkah 3 jika posisi centroid baru dengan centroid lama tidak sama.5. Dimana nk adalah jumlah dokumen dalam cluster k dan di adalah dokumen dalam cluster k. Tentukan posisi centroid baru (Ck ) dengan cara menghitung nilai rata-rata dari data-data yang ada pada centroid yang sama. .

M4 = ( 6.8). 3. temukan grup terbaik dari dua cluster berikut : M1 = ( 2 . M3 = ( 5 . M7 = ( 4 .5) .5). 5. M6 = ( 3. 4.0). M5 = ( 7 . 2.5 .2).3). M2 = ( 2 . 5.5 .5). 3.Contoh : Dengan menggunakan Algoritma K-Means. 4.

Jawab : .

4).Asumsi: Semua data akan dikelompokkan ke dalam dua kelas Center points dari kedua cluster adalah C1( 3 . 4) . C2( 6 .

26 .88 √1.48 √0. Menghitung Euclidean Distance dari semua data ke tiap titik pusat pertama √15.52 √16.Iterasi 1 a.

18. D24 = 1.06 .86. D23 = 1. D25 = 1. D22 = 4.27.62.12. D26 = 2.Dengan cara yang sama hitung jarak tiap titik ke titik pusat ke-2 dan kita akan mendapatkan D21 = 4.22. D27 = 2.

12 4.06 0.06 {M1 . kita dapat membandingkan: M1 M2 M3 M4 M5 M6 M7 jarak ke C1 1. M6 .94 4. M7 } anggota C1 dan {M3 .18 1.86 1.94 1. M2 .06 3. M5 } anggota C2 .12 C2 4.b.80 2.22 2.62 2.41 1. Dari penghitungan Euclidean distance. M4 .27 1.

Hitung titik pusat baru .c.

63 .62 4.31 C2 4.65 4.76 0.22 2.88 3.86 1. Hitung Euclidean distance dari tiap data ke titik pusat yang baru Dengan cara yang sama dengan iterasi pertama kita akan mendapatkan perbandingan sebagai berikut: M1 M2 M3 M4 M5 M6 M7 Jarak ke C1 0.27 0.96 2.54 0.86 0.Iterasi ke 2 a.62 4.76 1.

b. M6 . M4 . M2 . M5 } anggota C2 c. Dari perbandingan tersebut kita tahu bahwa {M1 . M4 . M2 . M5 } anggota C2 . M6 . M7 } anggota C1 dan {M3 . Karena anggota kelompok tidak ada yang berubah maka titik pusat pun tidak akan berubah. M7 } anggota C1 dan {M3 . Kesimpulan {M1 .