Anda di halaman 1dari 20

Clustering

PENGERTIAN CLUSTERING

 Clustering adalah salah satu teknik unsupervised learning, dimana kita tidak
perlu melakukan pelatihan terhadap data terlebih dahulu. Atau dengan kata
lain tidak melakukan fase learning.
 Analisis kelompok (cluster analisys) adalah mengelompokkan data objek yang
didasarkan hanya pada informasi yang ditemukan dalam data yang
menggambarkan objek tersebut dan ubungan diantaranya. Tan 2006.
 Tujuan utamanya adalah pengelompokkan sejumlah data/objek kedalam
kluster (group) sehingga dalam setiap kluster akan berisi data yang semirip
mungkin.
Kemiripan dan ketidakmiripan

 Untuk menggabungkan dua atau lebih objek menjadi satu kluster, biasanya
digunakan ukuran kemiripan atau ketidakmiripan. Semakin mirip dua objek
semakin tinggi peluang untuk dikelompokkan dalam 1 kluster.
 Semakin tidak mirip semakin rendah peluang untuk dikelompokkan dalam 1
kluster.
 Untuk mengukur kemiripan (similarity) dan ketidakmiripan (dissimilarity)
diantara data objek bisa dipakai beberapa ukuran.
 Untuk kemiripan bisa menggunakan cosinus, kovarian dan korelasi.
cosinus

 Cosinus antara dua titik x dan y :

 dimana didefinisikan sebagai


Kovarian

 Covarian antara 2 data


 )
 Dimana x adalah data pertama dan y adalah data ke 2.

 Jadi :
 Cov (data1, data2)=
Koefisien korelasi

𝑐𝑜𝑣 (𝑥, 𝑦)
𝑟 (𝑥 , 𝑦 )=
𝜎 𝑥𝜎 𝑦
Metode K-mean

 Konsep :
 Pengelompokkan K-mean merupakan metode analisis kelompok yang
mengarah pada pemartisian N objek pengamatan kedalam K. kelmpok
(cluster)dimana setiap objek pengamatan dimiliki oleh sebuah kelompok
dengan mean (rata-rata) terdekat.
 Merupakan salah satu pengelompokkan data non hierarki (sekatan) yang
berusaha mempartisi data yang ada ke dalam bentuk 2 atau lebih kelompok.
 Tujuan pengelompokkan adalah untuk meminimalkan fungsi objektif yang
diset dalam proses pengelompokkan, yang pada umumnya berusaha
meminimalkan variasi di dalam suatu kelompok dan memaksimalkan variasi
antar kelompok.
Algoritma K-mean

1. Tentukan Jumlah kelompok


2. Alokasikan data ke dalam kelompok secara acak
3. Hitung pusat kelompok (sentroid/rata-rata terdekat)
4. Kembali ke langkah 3, apabila masih ada data yang pindah kelompok, atau
apabila perubahan nilai pada fungsi objektif yang digunakan masih diatas nilai
ambang yang ditentukan.
Contoh :
Lakukan pengelompokkan terhadap 10 data pada set pengelompokkan dua
dimensi.nilai data dapat dilihat pada table. Pengukuran jarak gunakan Euclidien.
Jumlah kelompok (k) adalah 3 dan ambang batas (threshold)= 0.1. dimana kondisi
awal dari data adalah sebagai berikut:

Langkah-langkah yang dilakukan:


1. Inisialisasi Data
a. Alokasikan semua data pada satu kelompok secara acak, masing-masing data akan
bergabung ke dalam sebuah kelompok.
Langkah-langkah yang dilakukan:
1. Inisialisasi Data
a. Alokasikan semua data pada satu kelompok secara acak, masing-masing data akan
bergabung ke dalam sebuah kelompok.

b. Menghitung centroid (pusat kelompok). Titik centroid dihitung dengan rata-rata semua data
yang bergabung dalam setiap kelompok.
2. Iterasi 1
3. Iterasi 2
4. Iterasi 3
5. Iterasi 4
Algoritma K-Mean

 Dataset:
Langkah-langkah :

 Tentukan julah cluster yang diinginkan, cluster yang diinginkan.


1.  Cluster 1 (C1) = Pintar
2. Cluster 2 (C2) = Sedang
3. Cluster 3 (C3) = Kurang
 Menetapkan titik pusat cluster awal secara random:
 Menghitung data /objek ke dalam kluster terdekat. Dengan menggunakan
rumus:
Hasilnya:
Tentukan kembali titik pusat cluster yang baru
berdasarkan rata-rata

Cluster baru tersebut didapat dari rumus


= nilai hasil /banyak hasil

Kluster 1 (UTS)=(89+90+90+90+85)/5=90
Kluster 1 (Tugas)=(90+71+85+93+90)/5=85,8
Kluster 1 (UAS)=(75+95+81+85+88)/5=84,8
Lakukan, perhitungan tersebu tuntuk kluster 2 dan
3, sehingga didapat nilai cluster baru antara lain :
  Lakukan kembali langkah 4 hingga titik pusat dari setiap cluster tidak
berubah
 Hasil dari tahapan yang pertama dan kedua tidak berubah, maka hasil sudah
sesuai dengan pengelompokkan kluster. Berikut adalah hasil dari
pengelompokkan tersebut
Terimakasih

Anda mungkin juga menyukai