Clustering
Clustering
kedekatan(kemiripan).Clustering beda dengan group, kalau group berarti kelompok yang sama,kondisinya kalau tidak ya pasti bukan kelompoknya.Tetapi kalau cluster tidak harus sama akan tetapi pengelompokannya berdasarkan pada kedekatan dari suatu karakteristik sample yang ada, salah satunya dengan menggunakan rumus jarak ecluidean.Aplikasinya cluster ini sangat banyak, karena hamper dalam mengidentifikasi permasalahan atau pengambilan keputusan selalu tidak sama persis akan tetapi cenderung memiliki kemiripan saja.
2.Manfaat Identifikasi obyek (Recognition) !alam bidang mage "rocessing , Computer #ision atau robot $ision !ecission %upport %ystem dan data mining %egmentasi pasar, pemetaan &ilayah, 'anajemen marketing dll.
3. Prinsip dasar : %imilarity 'easures (ukuran kedekatan) !istances dan %imilarity Coeficients untuk beberapa sepasang dari item (cluidean !istance
d ( x, y ) = ( x1 y1 ) 2 + ( x2 y 2 ) 2 +... + ( x p y p ) 2
Atau
p d ( x, y ) = | xi yi i =1 |
2 1/ 2
4. Metode Clustering
pada
dasarnya
mengoptimumkan
pusat
cluster(centroid) atau mengoptimalkan le ar antar cluster. 'acam)macam metode clustering *erbasis 'etode %tatistikk a. +irarchical clustering method pada kasus untuk jumlah kelompok
belum ditentukan terlebih dulu, contoh data)data hasil sur$ey kuisioner 'acam)metode jenis ini ,inkage dll. %ingle ,ingkage,Complete ,inkage,A$erage
b. -on +irarchical clustering method .umlah kelompok telah ditentukan terlebih dulu.'etode yang digunakan /)'eans. *erbasis 0u11y 0u11y C)'eans *erbasis -eural -et&ork /ohonen %2', ,#3
'etode lain untuk optimasi centroid atau lebar cluster 4enetik Algoritma (4A)
Algoritma
6. "artisi item menjadi / initial cluster 7. ,akukan proses perhitungan dari daftar item, tandai item untuk kelompok yang mana berdasarkan pusat(mean) yang terdekat (dengan
menggunakan distance dapat digunakan (uclidean distance).+itung kembali pusat centroid untuk item baru yang diterima pada cluster
tersebut dari cluster yang kehilangan item. 5. 8langi step 7 hingga tidak ada lagi tempat yang akan ditandai sebagai cluster baru.
X1
5 + ( 1) =2 2 1 + (3) = 1 2
X2
3 +1 =2 2 2 + (2) = 2 2
,angkah kedua
,akukan perhitungan jarak dengan eclidean dari masing)masing item dari centroid(pusat) cluster dan tandai kembali setiap item berdasarkan kedekatan group..ika item bergerak dari initial configuration,
Centroid(pusat<means) cluster harus diupdate sebelum diproses./ita hitung k&adrat jarak(s=uared distance) sbb
d 2 ( A, ( AB )) = (5 2) 2 + (3 2) 2 = 10 d 2 ( A, (CD )) = (5 +1) 2 + (3 + 2) 2 = 61
%ejak A dekat pada cluster (A*) dibandingkan pada cluster (C!), maka tidak perlu ditandai.,anjutkab perhitungan
%ehingga * akan ditandi kembali menjadi anggota baru pada cluster (C!), sehingga membentuk cluster baru (*C!) maka koordinat dari pusat cluster terupdate sebagai berikut
Cluster A (*C!)
X1 : )6
X2 5 )6
5
%elanjutnya lakukn chek untuk setiap item untuk ditandai kembali. "erhitungan k&adrat jarak(s=uared distances) dibarikan sbb
! @A :
/ita lihat setiap item yang baru telah ditandai untuk cluster berdasarkan centroid(pusat) terdekat maka proses telah dihentikan.%ehingga dengan /;7 cluster maka terbentuk cluster sebagai berikut A dan (*C!).
*ila memungkinkan