Fuzzy Clustering

1.
Pendahuluan
Pada dasarnya clustering merupakan suatu metode untuk mencari dan

mengelompokkan data yang memiliki kemiripan karakteristik (similarity) antara satu data
dengan data yang lain. Tujuan utama dari metode clustering adalah pengelompokan sejumlah
data/obyek ke dalam cluster (group) sehingga dalam setiap cluster akan berisi data yang
semirip mungkin (Santoso, 2007).
Clustering melakukan pengelompokan data yangdidasarkan pada kesamaan antar

objek, oleh karena itu klasterisasi digolongkan sebagai metode unsupervisedlearning.
Karakteristik terpenting dari hasil clustering yang baik adalah suatu instance data dalam suatu
cluster lebih “mirip” dengan instance yang lain di dalam cluster tersebut daripada dengan
instance di luar dari cluster itu. Ukuran kemiripan (similarity measure) tersebut bisa
bermacam – macam dan mempengaruhi perhitungan dalam menentukan anggota suatu
cluster. Jadi tipe data yang akan di-cluster juga menentukan ukuran apa yang tepat untuk
digunakan dalam suatu algoritma.
Fuzzy clustering adalah salah satu teknik untuk menentukan cluster optimal dalam
suatu ruang vektor yang didasarkan pada bentuk normal Euclidian untuk jarak antar vektor.
Ada beberapa algoritma clustering data, salah satu diantaranya adalah Fuzzy C-Means
(FCM). Fuzzy C-Means (FCM) adalah suatu teknik pengclusteran data yang mana
keberadaan tiap – tiap titik data dalam suatu cluster yang ditentukan oleh derajat
keanggotaan. Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981.
Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang akan
menandai lokasi rata – rata untuk tiap – tiap cluster. Pada kondisi awal, pusat cluster ini
masih belum akurat. Tiap – tiap titik data memiliki derajat keanggotaan untuk tiap – tiap
cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap – tiap titik data
secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi
yang tepat.
Perulangan ini didasarkan pada minimisasi fungsi obyektif yang menggambarkan

jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan
titik data tersebut.Teori himpunan fuzzy akan memberikan jawaban terhadap suatu masalah
yang mengandung ketidakpastian. Pertanyaan pertama akan melahirkan konsep ukuran fuzzy
(Fuzzy Measurement) dan pertanyaan kedua akan melahirkan konsep ukuran persamaan
(Similiarity Measurement).
Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik data
secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak menuju lokasi
yang tepat. Perulangan ini didasarkan pada minimisasi fungsi obyektif yang menggambarkan
jarak dari titik data yang diberikan ke pusat cluster yang terbobot oleh derajat keanggotaan
titik data tersebut.
Algoritma Fuzzy C-Means
Fuzzy C-Means Clustering (FCM), atau dikenal juga sebagai fuzzy Isodata
merupakan salah satu metode clustering yang merupakan bagian dari metode Hard K-Means.
FCM menggunakan model pengelompokan fuzzy sehingga data dapat menjadi anggota dari
semua kelas atau cluster terbentuk dengan derajat atau tingkat keanggotaan yang berbeda
antara 0 hingga 1. Tingkat keberadaan data dalam suatu kelas atau cluster ditentukan oleh
derajat keanggotaannya.
Algoritma yang digunakan pada metode Fuzzy C-means adalah sebagai berikut:
1) Input data yang akan di-cluster, �, berupa matriks berukuran 𝑛 × 𝑚 (𝑛= jumlah sampel
data, 𝑚= atribut setiap data). �𝑖𝑗 data sampel ke-𝑖 (𝑖=1,2,⋯,𝑛), atribut ke-𝑗 (𝑗=1,2,⋯,𝑚).
2) Tentukan:
- Jumlah cluster =𝑐
- Pangkat =𝑤
- Maksimum iterasi = Maxlter
- Error terkecil yang diharapkan = 𝜉
- Fungsi objektif awal =�0=0
- Iterasi awal =𝑡=1
3) Bangkitkan bilangan random �𝑖�, 𝑖=1,2,⋯,𝑛; �=1,2,⋯,𝑐; sebagai elemen-elemen matriks
partisi awal �.
4) Hitung pusat cluster ke-�, ��𝑗 dengan �=1,2,⋯,𝑐 dan 𝑗=1,2,⋯,𝑚

5) Hitung fungsi objektif pada iterasi ke-𝑡, �𝑡
6) Hitung perubahan matriks partisi , dengan: 𝑖=1,2,⋯,𝑛 dan � = 1,2,⋯,𝑐
7) Cek kondisi berhenti

- Jika: (|�𝑡 – �𝑡−1|< 𝜉) atau (𝑡 > Maxlter) maka berhenti;
- Jika tidak: 𝑡 = 𝑡+1, ulangi langkah ke-4.
2. Pembahasan
Berikut perhitungan FCM pada contoh kasus nilai mata ujian, dengan data yang
digunakan sebagai sampel perhitungan, yaitu :
Tabel 2. 1 Data Nilai Ujian
Berdasarkan data dari tabel 2.1 ditentukan beberapa komponen perhitungan yang
ditunjukkan dalam tabel 2.2 sebagai berikut.
Tabel 2. 2 Komponen Perhitungan
Tabel 2.3 merupakan tahap selanjutnya yaitu melakukan perhitungan manual fuzzy c-
means. Bangkitkan matriks Uik dengan komponen i = banyaknya data; k = banyak cluster.
Ditentukan secara acak dengan syarat jumlah nilai elemen matriks dari kolom dalam setiap
baris harus 1.
Tabel 2. 3 Perhitungan Manual (Bangkitkan nilai random)
Kemudian langkah selanjutnya adalah Matriks � yang sudah terbentuk akan

digunakan untuk menghitung pusat cluster seperti pada algoritma yang ditunjukkan pada
tabel 2.4 - 2.6 berikut.
Tabel 2. 4 Perhitungan Manual (Hitung Pusat cluster - 1)

Pada tabel 2.4 – 2.6 ditunjukkan bagaimana cara mendapatkan pusat cluster dengan
menggunakan algoritma ke-d. Dimana angka acak dipangkatkan dua, kemudian hasil dari
angka acak yang telah diberi pembobot dua di kalikan dengan data yang di-cluster.
Masing – masing kolom kemudian di jumlahkan untuk menentukan pusat cluster yang
baru. Pusat cluster yang baru ditunjukkan pada tabel 2.7 berikut.
Tabel 2. 7 Perhitungan Manual (Hasil pusat Cluster iterasi 1)
Langkah berikutnya adalah menghitung fungsi objektif dengan menggunakan

algoritma ke-5. Seperti ditunjukkan pada tabel 2.8 berikut.
Tabel 2. 8 Perhitungan Manual (Hitung fungsi objektif (cluster 1))
Tabel 2. 9 Perhitungan Manual (Hitung nilai Total L1, L2, L3)
Langkah berikutnya ialah memperbaharui nilai U atau atau memperbaharui nilai

matriks dengan hitung pada algoritma ke-6 yang ditunjukkan pada tabel 2.10 berikut.
Tabel 2. 10 Perhitungan Manual (Memperbaharui Matriks Partisi)
Tabel diatas merupakan data yang nantinya akan menentukan hasil cluster. Jika
perhitungan pada algoritma terakhir atau menghitung kondisi berhenti dengan membagi
antara LT dan jumlah total masing – masing cluster sudah didapat maka akan dilakukan
pembulatan dua angka dibelakang decimal. Berikut hasil clustering ditunjukkan pada tabel
2.12.
di bulatkan
Maka diperoleh matriks U dengan derajat keanggotaan baru setelah dibulatkan pada
tabel 2. 12 Hasil akhir perhitungan fuzzy c-means.
Pada langkah terakhir akan diperiksa kondisi berhenti dimana nilai dari |�𝑡 – �𝑡−1| <
𝜉 error terkecil yang diharapkan. Karena |�1 – �0| > 𝜉 yaitu 2694.462 dimana nilainya
lebih besar dari maka lanjut ke iterasi 2 dan seterusnya sampai pada iterasi terakhir
dimana kondisi telah berhenti dengan menggunakan matriks � baru yang sudah diperoleh
pada langkah sebelumnya.
Berikut adalah hasil pengelompokan berdasarkan derajat keanggotaan pada iterasi

terakhir yaitu iterasi ke-20 dengan nilai |�20–�19| yaitu
3. Kesimpulan
Pada kasus ini perhitungan terhenti pada ITERASI KE-20. Karena hasil sudah menunjukkan
nilainya stabil dengan error terkecil yang diharapkan. |�20 – �19 < 𝜉 yaitu 0.000874275. Dan
didapat nilai partisi nya:
0.05728191 0.886721718 0.05599637

0.3252072 0.581429409 0.093363393
0.0516355 0.104035567 0.844328937
0.19181004 0.666366752 0.141823205
0.1156202 0.354826201 0.529553595
0.89944521 0.057922035 0.042632751
0.04521418 0.917558839 0.037226984
0.04811077 0.067788588 0.884100644
0.24322939 0.441050662 0.315719946
U= 0.11381079 0.536523147 0.349666066
0.02019187 0.033597427 0.9462107
0.29201101 0.21018018 0.497808806
0.89603363 0.069481182 0.034485186
0.13570635 0.256919446 0.6073742
0.11940602 0.746193232 0.134400746
PUSAT CLUSTER PADA ITERASI 20
V= 81.69964091 63.16111078 53.96987

85.79217184 75.80092448 77.38727
62.11830277 85.7676459 74.82134
Derajat keanggotaan tiap data pada setiap cluster dengan FCM
Derajat keanggotaan () data pada Cluster ke- Data Cenderung Masuk ke
Data Ke Cluster dengan Derajat
keangotaan
1 2 3
1 0.057281911 0.886721718 0.05599637 0.886721718
2 0.325207198 0.581429409 0.093363393 0.581429409
3 0.051635496 0.104035567 0.844328937 0.844328937
4 0.191810043 0.666366752 0.141823205 0.666366752
5 0.115620204 0.354826201 0.529553595 0.529553595
6 0.899445215 0.057922035 0.042632751 0.899445215
7 0.045214177 0.917558839 0.037226984 0.917558839
8 0.048110768 0.067788588 0.884100644 0.884100644
9 0.243229392 0.441050662 0.315719946 0.441050662
10 0.113810787 0.536523147 0.349666066 0.536523147
11 0.020191873 0.033597427 0.9462107 0.9462107
12 0.292011015 0.21018018 0.497808806 0.497808806
13 0.896033632 0.069481182 0.034485186 0.896033632
14 0.135706354 0.256919446 0.6073742 0.6073742
15 0.119406023 0.746193232 0.134400746 0.746193232

Fuzzy Clustering

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Fuzzy Clustering

Diunggah oleh

Hak Cipta:

Format Tersedia

1.

Pada dasarnya clustering merupakan suatu metode untuk mencari dan

Clustering melakukan pengelompokan data yangdidasarkan pada kesamaan antar

Perulangan ini didasarkan pada minimisasi fungsi obyektif yang menggambarkan

Algoritma Fuzzy C-Means

4) Hitung pusat cluster ke-�, ��𝑗 dengan �=1,2,⋯,𝑐 dan 𝑗=1,2,⋯,𝑚

6) Hitung perubahan matriks partisi , dengan: 𝑖=1,2,⋯,𝑛 dan � = 1,2,⋯,𝑐

7) Cek kondisi berhenti

Tabel 2. 2 Komponen Perhitungan

Tabel 2. 3 Perhitungan Manual (Bangkitkan nilai random)

Kemudian langkah selanjutnya adalah Matriks � yang sudah terbentuk akan

Tabel 2. 5 Perhitungan Manual (Hitung Pusat cluster - 2)

Tabel 2. 7 Perhitungan Manual (Hasil pusat Cluster iterasi 1)

Langkah berikutnya adalah menghitung fungsi objektif dengan menggunakan

Tabel 2. 9 Perhitungan Manual (Hitung nilai Total L1, L2, L3)

Langkah berikutnya ialah memperbaharui nilai U atau atau memperbaharui nilai

Berikut adalah hasil pengelompokan berdasarkan derajat keanggotaan pada iterasi

0.05728191 0.886721718 0.05599637

PUSAT CLUSTER PADA ITERASI 20

V= 81.69964091 63.16111078 53.96987

Anda mungkin juga menyukai