Definisi
Analisis cluster adalah analisis yang dilakukan untuk mengelompokkan objek-objek berdasarkan kesamaan karakteristik di antara objek objek tersebut. Diharapkan dengan terbentuknya kelompok-kelompok tersebut akan lebih mudah dalam menganalisa dan lebih tepat pengambilan keputusan yang sehubungan dengan masalah tersebut. Perbedaan analisis cluster dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan objek sedangkan analisis faktor terfokus pada kelompok variabel.
CLUSTER ANALYSIS
(1) Ukuran kemiripan Ukuran jarak yang sering digunakan adalah jarak euclidean (d)
Contoh
Klaster 3
D ( X ik X jk )
2 ij k 1
Nonhirarkikal
K-means
Langkah 2: lakukan pengelompokkan dg memilih dua titik data yg jaraknya paling dekat. Dalam hal ini kita memilih obyek 1 dan 2 sbb
Langkah 3: Lakukan lagi penggabungan antara obyek 3 dan 4 (yang memiliki jarak terdekat)
Langkah 4, dst: ulang terus langkah pengelompokkan sesuai jarak terdekat tsb. Sehingga akhirnya mendapatkan tabel ini.
Akhirnya kita bisa membuat 3 kelompok. Tapi sebetulnya masih bisa dilanjutkan terus (lihat dendrogram)
Ingat..bila dikehendaki kita masih bisa terus membuat pengelompokkan. Oleh sebab itu perlu dipikirkan: kapan kita berhenti mengelompokkan
Metode WARD
Sering dianggap sebagai metode terbaik Dalam metode Ward kita memakai ESS (error sum square) menunjukkan homoginitas dalam klaster Dalam metode Ward kita ingin memaksimalkan homoginitas dlm klaster ESS hanya dapat diukur jika ada > 1 item
ESS ( X i X ) 2
i 1 k
Metode seperti nearest neighbor sensitif terhadap outliers. Oleh sebab itu perlu dicek dulu dan bila ada harus dihilangkan.
Hasil output dari analisis cluster terdapat beberapa tabel. Yaitu Case Processing Summary, matrix priority, average linkage between group, Cluster membership, dan bagan dendogram. Dari masing masing tabel dapat ditarik kesimpulannya sesuai dengan jenis analisisnya. Setelah itu diambil keputusannya berdasarkan ketentuan yang digunakan. Dengan tabel-tabel hasil output, maka didapatkan cluster cluster yang telah memiliki anggota masing-masing sesuai dengan kesamaan karakteristiknya. Dari output analisis yang dilakukan dapat dilihat pembagian clusternya, ada yang terbagi menjadi 2, terbagi menjad 3 atau terbagi menjadi 4. Masing-masing data salon telah menjadi anggota dari cluster -cluster yang terbentuk. Hasil output analisis pun didapat sebuah dendogram. Dengan dendogram ini, dapat diketahui juga kelompok kelompok atau cluster cluster yang terbentuk. Hanya, pada dendogram bentuknya berupa garis garis, agar lebih mudah memahami. Dari data yang didapat dari dendogram, maka tampak bahwa dari data data yang dianalisis akan tergabung menajdi satu cluster.