Pengertian CLUSTERING
Proses pengelompokkan sejumlah obyek berdasarkan
informasi yang diperoleh dari data yang menjelaskan
hubungan antar obyek dengan prinsip untuk
memaksimalkan kesamaan antar anggota satu cluster
dan meminimumkan kesamaan antar cluster.
Manfaat
Tujuan Clustering
Clustering
Tujuan utama dari
Untuk mengidentifikasi
clustering adalah
obyek-obyek
mengelompokkan obyek-
(Recognition), untuk
obyek berdasarkan
mendukung sistem
karakteristik yang dimiliki
pendukung keputusan dan
masing-masing obyek
data mining.
(Candiasa, 2011:77).
Macam-Macam Metode CLUSTERING
1) Berbasis Metode Statistik
Terdapat dua metode clustering yang menggunakan
metode statistik sebagai basisnya, yaitu :
Metode Hirarki
Metode Non-Hirarki
Linkage
2) Berbasis Logika Fuzzy
Terdapat beberapa metode clustering berbasis fuzzy yang paling sering
digunakan: metode Fuzzy C-Means dan Fuzzy Subtractive Clustering.
4) Metode clustering lain yang digunakan untuk optimasi centroid atau lebar
cluster, yaitu metode Genetik Algoritma (GA).
Analisis Cluster Berbasis Metode Statistik
Asumsi yang Harus Dipenuhi
Representatif
• Sampel yang diambil benar-benar bisa
mewakili populasi yang ada.
Multikolinearitas
• Kemungkinan adanya korelasi antar objek.
Proses Analisis Cluster
Memilih Ukuran Melakukan Proses
Jarak Standarisasi Data Jika
Diperlukan
Melakukan
Interpretasi Terhadap
Cluster yang Memilih Prosedur
Terbentuk Pengclusteran
a. Jarak Euclid
• Jarak berupa akar jumlah kuadrat perbedaan nilai
untuk tiap variabel.
1. Memilih Ukuran Jarak
d. Jarak Chebychev
1
Tentukan jumlah cluster (k) yang
5 ingin dibentuk.
2
Lakukan kembali langkah 3
Tetapkan k pusat cluster awal
hingga titik pusat dari setiap
secara random.
cluster tidak berubah
4
3
Tentukan kembali titik pusat
Alokasikan semua data/obyek ke
cluster yang baru berdasarkan
dalam cluster terdekat
rata-rata
(1). Tentukan jumlah cluster (k) yang ingin
dibentuk.
Dalam makalah ini data-data yang ada akan dikelompokkan menjadi
tiga cluster.
(2). Tetapkan k pusat cluster awal secara
random
(3). Alokasikan semua data/obyek ke dalam
cluster terdekat
(4). Tentukan kembali titik pusat cluster yang
baru berdasarkan rata-rata
(5). Lakukan kembali langkah 3 hingga titik
pusat dari setiap cluster tidak berubah
ketiga pusat cluster dikelompokkan menjadi 3
dengan karakteristik sebagai berikut: