PENGERTIAN CLUSTERING
Clustering adalah salah satu teknik unsupervised learning, dimana kita tidak
perlu melakukan pelatihan terhadap data terlebih dahulu. Atau dengan kata
lain tidak melakukan fase learning.
Analisis kelompok (cluster analisys) adalah mengelompokkan data objek yang
didasarkan hanya pada informasi yang ditemukan dalam data yang
menggambarkan objek tersebut dan ubungan diantaranya. Tan 2006.
Tujuan utamanya adalah pengelompokkan sejumlah data/objek kedalam
kluster (group) sehingga dalam setiap kluster akan berisi data yang semirip
mungkin.
Kemiripan dan ketidakmiripan
Untuk menggabungkan dua atau lebih objek menjadi satu kluster, biasanya
digunakan ukuran kemiripan atau ketidakmiripan. Semakin mirip dua objek
semakin tinggi peluang untuk dikelompokkan dalam 1 kluster.
Semakin tidak mirip semakin rendah peluang untuk dikelompokkan dalam 1
kluster.
Untuk mengukur kemiripan (similarity) dan ketidakmiripan (dissimilarity)
diantara data objek bisa dipakai beberapa ukuran.
Untuk kemiripan bisa menggunakan cosinus, kovarian dan korelasi.
cosinus
Jadi :
Cov (data1, data2)=
Koefisien korelasi
𝑐𝑜𝑣 (𝑥, 𝑦)
𝑟 (𝑥 , 𝑦 )=
𝜎 𝑥𝜎 𝑦
Metode K-mean
Konsep :
Pengelompokkan K-mean merupakan metode analisis kelompok yang
mengarah pada pemartisian N objek pengamatan kedalam K. kelmpok
(cluster)dimana setiap objek pengamatan dimiliki oleh sebuah kelompok
dengan mean (rata-rata) terdekat.
Merupakan salah satu pengelompokkan data non hierarki (sekatan) yang
berusaha mempartisi data yang ada ke dalam bentuk 2 atau lebih kelompok.
Tujuan pengelompokkan adalah untuk meminimalkan fungsi objektif yang
diset dalam proses pengelompokkan, yang pada umumnya berusaha
meminimalkan variasi di dalam suatu kelompok dan memaksimalkan variasi
antar kelompok.
Algoritma K-mean
b. Menghitung centroid (pusat kelompok). Titik centroid dihitung dengan rata-rata semua data
yang bergabung dalam setiap kelompok.
2. Iterasi 1
3. Iterasi 2
4. Iterasi 3
5. Iterasi 4
Algoritma K-Mean
Dataset:
Langkah-langkah :
Kluster 1 (UTS)=(89+90+90+90+85)/5=90
Kluster 1 (Tugas)=(90+71+85+93+90)/5=85,8
Kluster 1 (UAS)=(75+95+81+85+88)/5=84,8
Lakukan, perhitungan tersebu tuntuk kluster 2 dan
3, sehingga didapat nilai cluster baru antara lain :
Lakukan kembali langkah 4 hingga titik pusat dari setiap cluster tidak
berubah
Hasil dari tahapan yang pertama dan kedua tidak berubah, maka hasil sudah
sesuai dengan pengelompokkan kluster. Berikut adalah hasil dari
pengelompokkan tersebut
Terimakasih