Anda di halaman 1dari 6

1.

Definisi : Clustering adalah suatu metode pengelompokan berdasarkan ukuran

kedekatan(kemiripan).Clustering beda dengan group, kalau group berarti kelompok yang sama,kondisinya kalau tidak ya pasti bukan kelompoknya.Tetapi kalau cluster tidak harus sama akan tetapi pengelompokannya berdasarkan pada kedekatan dari suatu karakteristik sample yang ada, salah satunya dengan menggunakan rumus jarak ecluidean.Aplikasinya cluster ini sangat banyak, karena hamper dalam mengidentifikasi permasalahan atau pengambilan keputusan selalu tidak sama persis akan tetapi cenderung memiliki kemiripan saja.

2.Manfaat Identifikasi obyek (Recognition) !alam bidang mage "rocessing , Computer #ision atau robot $ision !ecission %upport %ystem dan data mining %egmentasi pasar, pemetaan &ilayah, 'anajemen marketing dll.

Sebuah catatan ringkas aplikasi statistic (Clustering) Edi Satriyanto

3. Prinsip dasar : %imilarity 'easures (ukuran kedekatan) !istances dan %imilarity Coeficients untuk beberapa sepasang dari item (cluidean !istance

d ( x, y ) = ( x1 y1 ) 2 + ( x2 y 2 ) 2 +... + ( x p y p ) 2

Atau
p d ( x, y ) = | xi yi i =1 |
2 1/ 2

4. Metode Clustering

pada

dasarnya

mengoptimumkan

pusat

cluster(centroid) atau mengoptimalkan le ar antar cluster. 'acam)macam metode clustering *erbasis 'etode %tatistikk a. +irarchical clustering method pada kasus untuk jumlah kelompok

belum ditentukan terlebih dulu, contoh data)data hasil sur$ey kuisioner 'acam)metode jenis ini ,inkage dll. %ingle ,ingkage,Complete ,inkage,A$erage

b. -on +irarchical clustering method .umlah kelompok telah ditentukan terlebih dulu.'etode yang digunakan /)'eans. *erbasis 0u11y 0u11y C)'eans *erbasis -eural -et&ork /ohonen %2', ,#3

Sebuah catatan ringkas aplikasi statistic (Clustering) Edi Satriyanto

'etode lain untuk optimasi centroid atau lebar cluster 4enetik Algoritma (4A)

4ambar %alah contoh 5 cluster yang terbentuk

!. Pem a"asan Metode Cluster


"ertama akan kita bahas dulu metode cluster secara statistic untuk non hirachical method yaitu /)'eans Clustering

Algoritma

Sebuah catatan ringkas aplikasi statistic (Clustering) Edi Satriyanto

6. "artisi item menjadi / initial cluster 7. ,akukan proses perhitungan dari daftar item, tandai item untuk kelompok yang mana berdasarkan pusat(mean) yang terdekat (dengan

menggunakan distance dapat digunakan (uclidean distance).+itung kembali pusat centroid untuk item baru yang diterima pada cluster

tersebut dari cluster yang kehilangan item. 5. 8langi step 7 hingga tidak ada lagi tempat yang akan ditandai sebagai cluster baru.

Contoh !ikethui data sebagai berikut Item A * C ! 96 : )6 6 )5 2bser$asi 97 5 6 )7 )7

!itanya ,akukan cluster menjadi 7 kelompok (/;7).

,angkah pertama Cluster (A*) (C!) /oordinate dari Centroid

X1
5 + ( 1) =2 2 1 + (3) = 1 2

X2
3 +1 =2 2 2 + (2) = 2 2

Sebuah catatan ringkas aplikasi statistic (Clustering) Edi Satriyanto

,angkah kedua

,akukan perhitungan jarak dengan eclidean dari masing)masing item dari centroid(pusat) cluster dan tandai kembali setiap item berdasarkan kedekatan group..ika item bergerak dari initial configuration,

Centroid(pusat<means) cluster harus diupdate sebelum diproses./ita hitung k&adrat jarak(s=uared distance) sbb

d 2 ( A, ( AB )) = (5 2) 2 + (3 2) 2 = 10 d 2 ( A, (CD )) = (5 +1) 2 + (3 + 2) 2 = 61

%ejak A dekat pada cluster (A*) dibandingkan pada cluster (C!), maka tidak perlu ditandai.,anjutkab perhitungan

d 2 ( B, ( AB )) = ( 1 + 2) 2 + (112) 2 =10 d 2 ( B, (CD )) = ( 1 +1) 2 + (1 + 2) 2 = 9

%ehingga * akan ditandi kembali menjadi anggota baru pada cluster (C!), sehingga membentuk cluster baru (*C!) maka koordinat dari pusat cluster terupdate sebagai berikut

Cluster A (*C!)

/oordinate dari Centroid

X1 : )6

X2 5 )6
5

Sebuah catatan ringkas aplikasi statistic (Clustering) Edi Satriyanto

%elanjutnya lakukn chek untuk setiap item untuk ditandai kembali. "erhitungan k&adrat jarak(s=uared distances) dibarikan sbb

Cluster /oordinate dari Centroid A * C A > ?> ?6 (*C!) :7 ? :

! @A :

/ita lihat setiap item yang baru telah ditandai untuk cluster berdasarkan centroid(pusat) terdekat maka proses telah dihentikan.%ehingga dengan /;7 cluster maka terbentuk cluster sebagai berikut A dan (*C!).

*ila memungkinkan

Sebuah catatan ringkas aplikasi statistic (Clustering) Edi Satriyanto

Anda mungkin juga menyukai