Anda di halaman 1dari 6

FUZZY CLUSTERING

1. Definisi :
Clustering adalah suatu metode pengelompokan berdasarkan ukuran kedekatan(kemiripan).Clustering
beda dengan group, kalau group berarti kelompok yang sama,kondisinya kalau tidak ya pasti bukan
kelompoknya.Tetapi kalau cluster tidak harus sama akan tetapi pengelompokannya berdasarkan pada
kedekatan dari suatu karakteristik sample yang ada, salah satunya dengan menggunakan rumus jarak
ecluidean.Aplikasinya cluster ini sangat banyak, karena hamper dalam mengidentifikasi permasalahan
atau pengambilan keputusan selalu tidak sama persis akan tetapi cenderung memiliki kemiripan saja.
2.Manfaat
Identifikasi obyek (Recognition) :
Dalam bidang mage Processing , Computer Vision atau robot vision
Decission Support System dan data mining
Segmentasi pasar, pemetaan wilayah, Manajemen marketing dll.

3. Prinsip dasar :
Similarity Measures (ukuran kedekatan)
Distances dan Similarity Coeficients untuk beberapa sepasang dari item
Ecluidean Distance:

Atau :
4. Metode Clustering pada dasarnya mengoptimumkan pusat cluster(centroid) atau mengoptimalkan lebar
antar cluster.
Macam-macam metode clustering :
Berbasis Metode Statistikk
a. Hirarchical clustering method : pada kasus untuk jumlah kelompok belum ditentukan terlebih dulu,
contoh data-data hasil survey kuisioner
Macam-metode jenis ini: Single Lingkage,Complete Linkage,Average Linkage dll.
b. Non Hirarchical clustering method: Jumlah kelompok telah ditentukan terlebih dulu.Metode yang
digunakan : K-Means.
Berbasis Fuzzy : Fuzzy C-Means
Berbasis Neural Network : Kohonen SOM, LVQ
Metode lain untuk optimasi centroid atau lebar cluster : Genetik Algoritma (GA)

Gambar : Salah contoh 3 cluster yang terbentuk

5. Pembahasan Metode Cluster


Pertama akan kita bahas dulu metode cluster secara statistic untuk non hirachical method yaitu: K-Means
Clustering
Algoritma:
1. Partisi item menjadi K initial cluster
2. Lakukan proses perhitungan dari daftar item, tandai item untuk kelompok yang mana berdasarkan
pusat(mean) yang terdekat (dengan menggunakan distance dapat digunakan Euclidean distance).Hitung
kembali pusat centroid untuk item baru yang diterima pada cluster tersebut dari cluster yang kehilangan
item.
3. Ulangi step 2 hingga tidak ada lagi tempat yang akan ditandai sebagai cluster baru.
Contoh :
Dikethui data sebagai berikut:
Item Observasi
X1 X2
A53
B -1 1
C 1 -2
D -3 -2
Ditanya: Lakukan cluster menjadi 2 kelompok (K=2).

Langkah pertama:
Cluster Koordinate dari Centroid

(AB)

(CD)

Langkah kedua :
Lakukan perhitungan jarak dengan eclidean dari masing-masing item dari centroid(pusat) cluster dan
tandai kembali setiap item berdasarkan kedekatan group.Jika item bergerak dari initial configuration,
Centroid(pusat/means) cluster harus diupdate sebelum diproses.Kita hitung kwadrat jarak(squared
distance) sbb:

Sejak A dekat pada cluster (AB) dibandingkan pada cluster (CD), maka tidak perlu ditandai.Lanjutkab
perhitungan :

Sehingga B akan ditandi kembali menjadi anggota baru pada cluster (CD), sehingga membentuk cluster
baru (BCD) maka koordinat dari pusat cluster terupdate sebagai berikut :
Cluster Koordinate dari Centroid

A53
(BCD) -1 -1

Selanjutnya lakukn chek untuk setiap item untuk ditandai kembali. Perhitungan kwadrat jarak(squared
distances) dibarikan sbb:
Cluster Koordinate dari Centroid
ABCD
A 0 40 41 89
(BCD) 52 4 5 5
Kita lihat setiap item yang baru telah ditandai untuk cluster berdasarkan centroid(pusat) terdekat maka
proses telah dihentikan.Sehingga dengan K=2 cluster maka terbentuk cluster sebagai berikut : A dan
(BCD).
* FUZZY KEDUA*
Fuzzy clustering adalah salah satu teknik untuk menentukan cluster optimal dalam suatu ruang vektor
yang didasarkan pada bentuk normal euclidian untuk jarak antar vektor. Fuzzy clustering sangat
berguna bagi pemodelan fuzzy terutama dalam mengindentifikasi aturan-aturan fuzzy. Metode
clustering merupakan pengelompokan data beserta parameternya dalam kelompok kelompok sesuai
kecenderungan sifat dari masing-masing data tersebut (kesamaan sifat).
Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means. Fuzzy C-Means
adalah suatu teknik peng-cluster-an yang mana keberadaannya tiap-tiap titik data dalam suatu cluster
ditentukan oleh derajat keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada
tahun 1981.
Konsep dari Fuzzy C-Means pertama kali adalah menentukan pusat cluster, yang akan menandai lokasi
rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini masih belum akurat. Tiap-tiap
titik data memiliki derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbaiki pusat cluster
dan derajat keanggotaan tiap-tiap titik data secara berulang, maka akan dapat dilihat bahwa pusat
cluster akan bergerak menuju lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi
obyektif yang menggambarkan jarak dari titik data yang diberikan kepusat cluster yang terbobot oleh
derajat keanggotaan titik data tersebut.
Output dari Fuzzy C-Means merupakan deretan pusat cluster dan beberapa derajat keanggotaan untuk
tiap-tiap titik data. Informasi ini dapat digunakan untuk membangun suatu fuzzy inference system.
Fuzzy C-Means diperkenalkan pertama kali oleh JIM BEZDEK pada tahun 1981. Fuzzy CMeans adalah suatu teknik clustering data dimana tiap data dalam suatu cluster ditentukan
oleh derajat keanggotaannya.
Terdapat beberapa perbedaan yang mendasar antara teknik clustering klasik dengan teknik
clustering fuzzy yaitu pada partisi clustering yang bersifat klasik, suatu data hanya menjadi
anggota pada satu cluster saja, sedangkan pada partisi fuzzy suatu data bisa menjadi
anggota pada dua cluster yang berbeda. Hal ini disebabkan karena nilai keanggotaan suatu
data pada partisi fuzzy terletak pada interval 0 sampai dengan 1.

Konsep Fuzzy C-Means :


1. Penentuan pusat cluster yang menandai lokasi rata-rata untuk tiap cluster, dengan
kondisi awal tidak akurat.
2. Tiap data memiliki derajat keanggotaan untuk masing-masing cluster.
3. Dengan perulangan yang didasarkan pada minimisasi fungsi obyektif, pusat cluster dan
nilai kenaggotaan diperbaiki. Sehingga lokasi cluster bisa berada pada posisi yang benar.
Rumus Fuzzy C-Means :
1. Buat matriks partisi awal secara acak, dengan ketentuan jumlah setiap kolom pada
matrik harus sama dengan 1

2. Hitung Pusat Cluster, dg persamaan :

Ket : V = Pusat ClusterW = pangkat atau pembobot ( W > 1 )


3. Perbaiki derajat keanggotaan setiap anggota

dengan mencari jarak (d) antara pusat dan data

4. Tentukan nilai kriteria berhenti.

Nilai kriteria berhenti merupakan perubahan yang terjadi pada matrik partisi pada iterasi sekarang dengan iterasi
sebelumnya.
Jika nilai kriteria berhenti lebih besar atau sama dengan selisihnya maka hentikan proses, tetapi jika tidak kembali ke
PERUMUSAN 2 (hitung pusat cluster).