◉ Clustering
◉ K-Means Concept
◉ K-Means Step
◉ Case Studi
2
What is Clustering?
3
What is a natural grouping among these objects ?
4
Two Types of Clustering?
Partitional algorithms : Membuat beberapa partisi dan
mengelompokkan objek berdasarkan kriteria tertentu.
Hierarchical algorithm : Membuatk dekomposisi
pengelompokan objek berdasarkan kriteria tertentu. Misal = tua-
muda, tua-muda (merokok-tidak merokok)..
5
K-Means Clustering
6
K= 2 Menentukan Pusat Cluster
Initial Dataset
Data
Science
7
Algoritma K-Means
• Tentukan jumlah cluster (K), serta tetapkan pusat cluster sembarang
1.
• Kelompokkan data ke dalam cluster dengan jarak paling pendek atau terdekat
3.
Jumkah Cluster K
Tidak
◉Untuk
melakukan perhitungan jara data ke-i () pada pusat cluster
ke-k (), diberi nama (), dapat digunakan formula seperti berikut:
10
11
CASE STUDI
“
Contoh Soal 1
12
Tabel 1. CDR dan CBR tahun 1994
(sumber: ESCAP Population Data Sheet 1996)
PEMBAHASAN
“
STEP 1
C1 = (20, 5);
C2 = (25,4);
dan C3 = (30,10)
15
STEP 2
◉
2. Hitung jarak setiap data terhadap setiap pusat cluster. Misalkan untuk
menghitung
jarak data pertama (Brunei Darusalam) dengan pusat cluster
pertama adalah:
16
STEP 2
◉
jarak data kedua (Kamboja) dengan pusat cluster pertama adalah:
17
STEP 2
18
Suatu data akan menjadi anggota dari suatu cluster yang memiliki jarak terkecil
dari pusat clusternya.
Negara Jarak Anggota Cluster
No Negara
CBR CDR C1 C2 C3 C1 C2 C3
Brunei
1 27 3 7,2801 2,2361 7,6158 *
Darusalam
2 Kamboja 38 14 20,1246 16,4012 8,9443 *
3 Indonesia 24 8 5,0000 4,1231 6,3246 *
4 Laos 43 15 25,0799 21,0950 13,9284 *
5 Malaysia 28 5 8,0000 3,1623 5,3852 *
6 Myanmar 32 11 13,4164 9,8995 2,2361 *
7 Filipina 30 7 10,1980 5,8310 3,0000 *
8 Singapura 17 5 3,0000 8,0623 13,9284 *
9 Thailand 20 6 1,0000 5,3852 10,7703 *
10 Vietnam 29 8 9,4868 5,6569 2,2361 *
19
STEP 3
◉
Hitung pusat cluster baru. Untuk cluster pertama (C1), ada 2 data yaitu
data ke-8 dan data ke-9, sehingga:
Sehingga ;
C1 = (18.5 , 5.5 )
20
STEP 3
◉
Untuk cluster kedua, ada 3 data yaitu data ke-1, data ke-3 dan data ke-5,
sehingga:
Sehingga ;
C2 = (26.33 , 5.33 )
21
STEP 3
◉
Untuk cluster ketiga, ada 5 data yaitu data ke-2, data ke-4, data ke-
6, data ke-7 dandata ke-10, sehingga:
Sehingga ;
C3 = (34.3 , 11 )
22
STEP 3
C1 = (18.5 , 5.5 )
C2 = (26.33 , 5.33 )
C3 = (34.3 , 11 )
23
STEP 2
◉
Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang
baru . Misalkan untuk menghitung
jarak data pertama (Brunei Darusalam) dengan pusat cluster baru
pertama adalah:
24
STEP 2
◉
jarak data kedua (Kamboja) dengan pusat cluster pertama adalah:
25
STEP 2
26
Ulangi menghitung jarak setiap data terhadap setiap pusat cluster yang baru. Hasil
Perhitungan jarak setiap data dengan pusat cluster baru
Anggota Cluster Anggota
Negara Jarak
No Negara Lama Cluster Baru
CBR CDR C1 C2 C3 C1 C2 C3 C1 C2 C3
Brunei
1
Darusalam
27 3 8,8600 2,4244 10,8301 * *
30
Thanks!
Any questions ?
You can find me at
◉ @username
◉ user@mail.me
31