Anda di halaman 1dari 7

FUZZY CLUSTERING

A.

UKURAN FUZZY

Menunjukkan seberapa besar derajat kekaburan suatu himpunan fuzzy


(Fuzzy Measurement)

Ukuran kekaburan ditulis f:P(x) R dimana x adalah himpunan semua


subset dari x atau f(A) R.

Dalam mengukur nilai kekaburan fuzzy, F harus mengikuti hal-hal


sebagai berikut :
1.
f(A)=0, jika dan hanya jika A crisp
2.
Jika A < B maka f(A) < f(B). A < B berarti B lebih kabur atau
A lebih tajam dari B

A[x] B[x], jika B[x] 0.5

A[x] B[x], jika B[x] 0.5


3.
f(A) akan mencapai maksimum jika dan hanya jika A benarbenar kabur secara maksimum. Nilai fuzzy maksimum A=0.5

Index kekaburan adalah jarak antara suatu himpunan fuzzy A dengan


himpunan crisp yang terdekat.
1.
Jika A[x] 0.5, maka C[x]=0
2.
Jika A[x] 0.5, maka C[x]=1

Ada 3 cara untuk mencari indeks kekaburan


1.
Hamming Distance
a.
f(A) = | A[x] - C[x] |
b.
f(A) = min (A[x], 1 - A[x])
2.
Eucledian Distance
f(A) = { ( A[x]- C[x])2}1/2
3.
Minskowski Distance
f(A) = { ( A[x]- C[x])w}1/w , dengan w = [1, ]

B.

FUZZY CLUSTERING
Studi kasus hal. 155 : jumlah balita, pendapatan per bulan dan jumlah konsumsi
susu
Daerah
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.

Jumlah
Balita
20
20
23
56
45
15
22
40
75
13
25
70
18
15
68
27
80
13
17
72

Pendapatan
250
700
625
250
300
150
1000
450
300
800
400
750
350
750
625
208
880
150
202
1250

Konsumsi
Susu
102
170
160
148
115
80
198
120
167
192
125
177
108
175
178
118
189
102
114
185

Daerah
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.

Jumlah
Balita
80
57
60
52
92
57
14
21
62
65
15
22
18
21
76
74
22
17
91
11

Pendap
atan
300
400
200
400
900
815
825
702
800
211
300
925
311
113
705
800
311
810
825
725

Konsumsi
Susu
167
142
144
119
201
192
167
182
176
161
117
162
105
102
178
181
117
181
185
151

Data-data tersebut akan diclusterkan. Tapi karena ruang penggambarannya hanya 2


dimensi maka penggambaran clusternya akan dibagi 2 bagian, yaitu :
1. Cluster jumlah balita vs konsusmsi susu
2. Konsumsi susu vs pendapatan/bulan
Cluster dikatakan fuzzy jika tiap-tipa objek dihubungkan dengan menggunakan
derajat keanggotaan (bukan dengan keanggotaan crisp). Sebagai contoh, suatu daerah
akan masuk cluster P tergantung pada seberapa derajat keanggotaannya terhadap
jumlah balita dan konsumsi susu. Pada prakteknya, biasanya perlu dilakukan
preprocessing terlebih dahulu. Akan lebih menguntungkan apabila data yang akan
diolah dalam keadaan normal, misalkan berada pada interval [0 1]. Dengan demikian
perlu dilakukan normalisasi dengan mencari :

Mean
m
=
1 N
Ui
N i 1

Variansi
v

1 N
(Ui m)
N 1 i 1

Standar Deviasi
Koefisien Korelasi
N

(x
i 1

(x
i 1

m1 )( y i m 2 )

m1 )

, m1=mean x, m2=mean y

(y
i 1

m2 )

Dalam matlab, maka sintaks perintahnya


1. Buat data tentang ketiga variabel yang akan dicluster yaitu Jml Balita, Jml
Konsumsi Susu, dan Jml Rata2 Pendapatan/Bln di notepad
2. Simpan dengan nama susu.data
3. Dalam worksheet M-file, ketikkan perintah pengclusteran data berikut :
x = load(susu.dat);
Inp = x( :,1);
Out = x( :,3);
Plot(inp, out, bo);
Title (Jml Balita vs Konsumsi Susu);
Xlabel (Jml Balita);
Ylabel (Konsumsi susu);
Pause.
x = load(susu.dat);
Inp = x( :,2);
Out = x( :,3);
Plot(inp, out, bo);
Title (Konsumsi Susu vs Pendapatan/bln);
Xlabel (Pendapatan/bln);
Ylabel (Konsumsi susu);

Hasil preprocessing untuk menentukan koefisien korelasi dengan matlab


1. Menentukan nilai min, max, mean, var, std dari jumlah balita (sintaks
matlabnya)
X=load(susu.dat)
Min(x( ;,1))
Max(x( :,1))

Mean(x( :,1))
Var(x( :,1))
STD(x( :,1))

2. Untuk pendapatan dan konsumsi susu sintaksnya sama seperti no.1


3. Masukkan hasilnya pada tabel berikut
Jml Balita
(X)

Pendapatan
(Y)

Konsumsi Susu
(Z)

Nilai Min
Nilai Max
Mean
Variansi
STDEV
4. Hitung koefisien korelasi dengan rumus yang sudah ditentukan diatas
kemuadian masukkan pada tabel berikut
Koefisien Korelasi
XY
XZ
Y-Z

C.

FUZZY C-MEAN

Fuzzy C-Means (FCM) adalah suatu teknik pengclusteran data yang mana
keberadaan tiap-tiap titik data dalam suatu cluster ditentukan oleh derajat keanggotaan.
Teknik ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 1981.
Konsep dasar FCM, pertama kali adalah menentukan pusat cluster, yang akan
menandai lokasi rata-rata untuk tiap-tiap cluster. Pada kondisi awal, pusat cluster ini
masih belum akurat. Tiap-tiap titik data memiliki derajat keanggotaan untuk tiap-tiap
cluster. Dengan cara memperbaiki pusat cluster dan derajat keanggotaan tiap-tiap titik
data secara berulang, maka akan dapat dilihat bahwa pusat cluster akan bergerak
menuju lokasi yang tepat. Perulangan ini didasrkan pada minimisasi fungsi obyektif
yang menggambarkan jarak dari titik data yang diberikan ke pusat cluster yang terbobot
oleh derajat keanggotaan titik data tersebut.
Output dari FCM bukan merupakan fuzzy inference system, namun merupakan
deretan pusat cluster dan beberapa derajat keanggotaan untuk tiap-tiap titik data.
Informasi ini dapat digunakan untuk membangun suatu fuzzy inference system.
ALGORITMA FCM
1.

Input data yang akan dicluster X, berupa matriks berukuran n x m (n =


jumlah sampel data, m = atribut setiap data). Xij = data sampel ke-i
(i=1,2,...,n), atribut ke-j (j=1,2,...,m).
2.
Tentukan:
Jumlah cluster
=
c;
Pangkat =
w;
Maksimum iterasi
=
MaxIter;

Error terkecil yang diharapkan =


.
Fungsi obyektif awal
=
P0 = 0;
Iterasi awal
=
t = 1;
3.
Bangkitkan bilangan random ik, i=1,2,...,n;
elemen-elemen matriks partisi awal U.

Hitung jumlah setiap kolom:

k=1,2,...,c;

sebagai

Qi ik
k 1

dengan j=1,2,...,n.
Hitung ik ternormalisasi:

ik
Qi

ik
4.

Hitung pusat cluster ke-k: Vkj, dengan k=1,2,...,c; dan j=1,2,...,m.

(
n

Vkj

i 1

ik

) w * X ij

(
i 1

5.

ik

)w

Hitung fungsi obyektif pada iterasi ke-t, Pt:


n
c
Pt

i 1 k 1

6.

X
m

j 1

ij

2
w
Vkj ik

Hitung perubahan matriks partisi:

ik

X
m

j 1

k 1

j 1

1
w 1

Vkj

ij

1
w 1

ij

Vkj

dengan: i = 1,2,...,n; dan k = 1,2,...,c.


7.

Cek kondisi berhenti:


Jika: ( |Pt Pt-1| < ) atau (t > MaxIter) maka berhenti;
Jika tidak: t = t+1, ulangi langkah ke-4.

Contoh :
1. Input data yang akan dicluster berupa matriks
Tabel 1

Ke/ Data
1
2
3
4

A
3
7
10
14

2. Tentukan :

Jumlah cluster
Pangkat (w)

=2
= 2, w>1

B
5
6
11
15

C
6
9
12
16

Atribut Input

Maksimum iterasi
=5
Error terkecil yang diharapkan = 0.0001
Fungsi obyektif awal (P0)
= 0;
Iterasi awal (t)
=1

3. Bangkitkan bilangan random ik sebagai elemen-elemen partisi awal


Tabel 2

Data/Kuster
i1
i2
i3
i4

k1
0.4
0.2
0.1
0.3

k2
0.7
0.5
0.8
0.4

Hitung jumlah setiap kolom


c

Qi ik
k 1

Tabel 3

Data/Kluster
i1
i2
i3
i4

k1
0.4
0.2
0.1
0.3

k2 Qj=k1+k2
0.7
1.1
0.5
0.7
0.8
0.9
0.4
0.7

Hitung ik ternormalisasi

ik ik
Qi
Data/Kluster
i1
i2
i3
i4

k1

k2

0.4
0.2
0.1
0.3

0.7
0.5
0.8
0.4

Qj=k1+k2 k1 ternormalisasi
k2 ternormalisasi
0.4/1.1=0.36
0.7/1.1=0.64
1.1
0.2/0.7=0.29
0.5/1.1=0.71
0.7
0.1/0.9=0.11
0.8/1.1=0.89
0.9
0.3/0.7=0.43
0.4/1.1=0.57
0.7

Maka elemen matriks partisi yang baru (ik baru) adalah


Tabel 4

Data/Kluster
i1
i2
i3
i4

k1

k2

0.36
0.29
0.11
0.43

0.64
0.71
0.89
0.57

4. Hitung pusat cluster ke-k yaitu Vkj dengan k=1,2

(
n

Vkj

i 1

ik

) w * X ij

(ik ) w

, dengan ik adalah ik yg sudah ternormalisasi (Tabel 4)


dengan Xij adalah input data yg akan dicluster (Tabel 1)

i 1

Hitung dulu (ik)w , dengan w=2. maka


Tabel 5

Data/Kluster k1

k2

0.1296 0.4096
i1
0.0841 0.5041
i2
0.0121 0.7921
i3
0.1849 0.3249
i4
Hitung Vkj dengan k = jml cluster = 1,2 dan j = elemen atribut input = A,
B, C dengan data ke i dari 1 sd 4

Untuk cluster k = 1
Untuk elemen atribut input A dengan j = 1,2,3,4
( ) w * A1 ( 21 ) w * A2 ( 31 ) w * A3 ( 41 ) w * A4
V1 A V11 11
( 11 ) w ( 21 ) w ( 31 ) w ( 41 ) w

Untuk elemen atribut input B dengan j = 1,2,3,4


( ) w * B1 ( 21 ) w * B2 ( 31 ) w * B3 ( 41 ) w * B4
V1B V12 11
( 11 ) w ( 21 ) w ( 31 ) w ( 41 ) w
Untuk elemen atribut input C dengan j = 1,2,3,4
( ) w * C1 ( 1 ) w * C2 ( 13 ) w * C3 ( 14 ) w * C4
V1C V11 11
( 11 ) w ( 12 ) w ( 13 ) w ( 14 ) w

Untuk cluster k = 2
Untuk elemen atribut input A dengan j = 1,2,3,4
( ) w * A1 ( 22 ) w * A2 ( 32 ) w * A3 ( 42 ) w * A4
V2 A V21 12
( 12 ) w ( 22 ) w ( 32 ) w ( 42 ) w
Untuk elemen atribut input B dengan j = 1,2,3,4
( 12 ) w * B1 ( 22 ) w * B2 ( 32 ) w * B3 ( 42 ) w * B4
V2 A V21
( 12 ) w ( 22 ) w ( 32 ) w ( 42 ) w
Untuk elemen atribut input C dengan j = 1,2,3,4
( 12 ) w * C1 ( 22 ) w * C2 ( 32 ) w * C3 ( 42 ) w * C4
V2 A V21
( 12 ) w ( 22 ) w ( 32 ) w ( 42 ) w

Sehingga diperoleh matriks V sebagai berikut


V=

3.66

17.26

4.21

19.7

4.62

21.73

Untuk mencari pusat clusternya, maka dicari nilai yg max dari setiap kolom,
V=

3.66

17.26

4.21

19.7

4.62

21.73

Pusat cluster 1

Pusat cluster 2

Anda mungkin juga menyukai