K-MEANS CLUSTERING
ALGORITHM
1
K-Means Clustering Algorithm
Konsep Clustering
2
K-Means Clustering Algorithm
Konsep Clustering
o Pengelompokkan sejumlah data atau objek ke dalam klaster (group)
sehingga dalam setiap klaster akan berisi data yang semirip mungkin
o Termasuk unsupervised learning
o Data pada teknik pengklasteran tidak diketahui keluarannya (outputnya
atau labelnya)
o Metode untuk mengukur kualitas klaster : jumlah dari kesalahan kuadrat
(sum of squared-error, SSE) :
k 2
SSE d p, m
i 1 pCi
i
3
K-Means Clustering Algorithm
5
K-Means Clustering Algorithm
6
K-Means Clustering Algorithm
Contoh 1
Tabel 1 Data point 1. Tentukan jumlah klaster k=2
Instances X Y 2. Tentukan centroid awal secara acak
misal dari data disamping m1 =(1,1),
A 1 3
m2=(2,1)
B 3 3
3. Tempatkan tiap objek ke klaster
C 4 3 terdekat berdasarkan nilai centroid
D 5 3 yang paling dekat
E 1 2
selisihnya(jaraknya). Pada tabel
2.Didapatkan hasil: anggota cluster1
F 4 2
= {A,E,G}, cluster2={B,C,D,F,H}. Nilai
G 1 1 SSE yaitu :
H 2 1
k 2
SSE d p, mi
tampilan data awal i 1 pCi
7
K-Means Clustering Algorithm
Contoh 1
Tabel 2
4. Menghitung nilai centroid yang baru :
m1 1 1 1 / 3, 3 2 1 / 3 1,2
m2 3 4 5 4 2 / 5, 3 3 3 2 1 / 5 3,6;2,4
Clusters dan
centroid setelah
tahap pertama
8
K-Means Clustering Algorithm
Contoh 1
Tabel 3
• Terdapat perubahan anggota
cluster yaitu cluster1={A,E,G,H},
cluster2={B,C,D,F}, maka cari
lagi nilai centroid yang baru
yaitu : m1=(1,25;1,75) dan
m2=(4;2,75)
• Tugaskan lagi setiap objek
dengan memakai pusat klaster
yang baru. Pada tabel 4. Nilai
Clusters dan SSE yang baru :
centroid
setelah tahap
kedua.
9
K-Means Clustering Algorithm
Contoh 1
Tabel 4
11
K-Means Clustering Algorithm
12
K-Means Clustering Algorithm
Latihan 1
Tabel berikut adalah dataset dari 15 mahasiswa yang memprogramkan mata kuliah
Data mining. Dari 15 mahasiswa tersebut akan dikelompokkan menjadi 3 bagian yaitu
kelompok pintar, sedang dan kurang. Hitung pula nilai SSE nya.
NO NAMA UTS TUGAS UAS
MAHASISWA
1 Roy 89 90 75
2 Sintia 90 71 95
3 Iqbal 70 75 80
4 Dilan 45 65 59
5 Ratna 65 75 53
6 Merry 80 70 75
7 Rudi 90 85 81
8 Hafiz 70 70 73
9 Gede 96 93 85
10 Christian 60 55 48
11 Justin 45 60 58
12 Jesika 60 70 72
13 Ayu 85 90 88
14 Siska 52 68 55
15 Reitama 40 60 7
13
K-Means Clustering Algorithm
Latihan 2
Lakukan proses clustering terhadap data berikut. Lakukan pula beberapa eksperimen
untuk menentukan k (jumlah klaster) yang paling optimal berdasarkan nilai SSE yang
paling minimal. Implementasikan proses clustering tersebut dengan menggunakan
MATLAB. Gambarkan pula grafik scatter pada setiap nilai k.
14
K-Means Clustering Algorithm
Latihan 2
Transformasi Data Agar data di atas dapat diolah dengan menggunakan
metode k-means clustering, maka data yang berjenis data nominal seperti
kota asal dan jurusan harus diinisialisasikan terlebih dahulu dalam bentuk
angka
15
K-Means Clustering Algorithm
Soal UAS
Lakukan proses clustering terhadap Dataset Ekspresi Wajah (JAFFE Database)
dataset ekspresi wajah yang terdapat
di database JAFFE yang berjumlah
213 data dengan menggunakan
Algoritma K-Means Clustering.
Lakukan pula beberapa eksperimen
untuk menentukan nilai k (jumlah
klaster) yang paling optimal
berdasarkan nilai SSE yang paling
minimal. Implementasikan proses
clustering tersebut dengan Ketentuan :
menggunakan MATLAB. Gambarkan Tugas dikerjakan secara berkelompok
pula grafik scatter pada setiap nilai k. sesuai dengan data kelompok yang
sudah ada. Hasinya dipresentasikan
sesuai dengan jadwal UAS matakuliah
Sistem Cerdas Kel. E13701.
16