Anda di halaman 1dari 2

RESUME MULTIVARIAT ELOK DEWI TANJUNG SARI 08.

5624/ 4SE4 Ringkasan Analisis Cluster Teknik Hierarki Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang tinggi. Tipe dasar dalam metode hierarki ini adalah aglomerasi dan divisive (pemecahan). Dalam metode aglomerasi tiap observasi pada mulanya dianggap sebagai cluster tersendiri sehingga terdapat cluster sebyak jumlah observasi. Kemudian dua cluster yang terdekat kesamaannya digabung menjadi suatu cluster baru, sehingga jumlah cluster berkurang satu pada tiap tahap. Sebaliknya pada metode pemecahan dimulai dari satu cluster besar yang mengandung seluruh observasi, selanjutnya observasi-observasi yang paling tidak sama dipisah dan dibentuk cluster-cluster yang lebih kecil. Proses ini dilakukan hingga tiap observasi menjadi cluster sendiri-sendiri. Hal penting dalam metode hirarkhi adalah bahwa hasil pada tahap sebelumnya selalu bersarang di dalam hasil pada tahap berikutnya, membentuk sebuah pohon. Sumber error dan variasi tidak resmi dianggap dalam prosedur hirarkis. Ini berarti bahwa metode pengelompokan akan sensitif terhadap outlier. Dalam clustering hirarkis, tidak ada ketentuan untuk realokasi benda yang mungkin telah salah dikelompokkan pada tahap awal. Akibatnya, konfigurasi akhir cluster harus selalu hati-hati diperiksa untuk melihat apakah itu masuk akal. Untuk masalah tertentu, terdapat ide yang baik untuk mencoba beberapa metode pengelompokan, dalam metode yang diberikan terdapat beberapa cara yang berbeda dalam menetapkan kesamaan jarak. Jika hasil dari beberapa metode konsisten satu sama lain, mungkin sebuah kasus untuk pengelompokan alami itu merupakan suatu kemajuan. Stabilitas solusi hirarkis kadang-kadang bisa dapat diperiksa dengan menerapkan algoritma clustering sebelum dan sesudah kesalahan-kesalahan kecil (gangguan) yang telah ditambahkan ke unit data. Jika kelompok cukup baik dibedakan, antara clustering sebelum dan sesudah maka gangguan-gangguan tersebut tidak berpengaruh. Beberapa set data dan metode pengelompokan

hirarki dapat menghasilkan inversi. Inversi terjadi ketika suatu objek bergabung dengan sebuah cluster yang ada pada jarak yang lebih kecil (kesamaan yang lebih besar) daripada konsolidasi sebelumnya. Inversi dapat terjadi jika tidak ada struktur cluster yang jelas dan umumnya terkait dengan dua algoritma clustering hirarkis, dikenal sebagai metode centroid dan metode median. Centroid cluster adalah nilai tengah observasi pada variabel dalam suatu set variabel cluster. Keuntungannya adalah outlier hanya sedikit berpengaruh jika dibandingkan dengan metode lain. Ringkasan Analisis Cluster Teknik Non-Hierarki Ada argumen kuat untuk tidak memperbaiki jumlah cluster, K sebagai berikut: 1. Jika dua atau lebih titik secara tidak sengaja terletak dalam cluster, cluster yang dihasilkan mereka akan sulit dibedakan. 2. Keberadaan sebuah outlier bisa menghasilkan setidaknya satu kelompok dengan item sangat menyebar. 3. Bahkan jika populasi diketahui terdiri dari kelompok K, metode sampling yang memungkinkan seperti data dari kelompok paling langka tidak muncul dalam sampel. Memaksa data ke dalam kelompok K akan menyebabkan cluster tidak masuk akal. Perbedaan Metode Hierarki dan Non-Hierarki Keuntungan metode heirarki adalah cepat dalam proses pengolahan sehingga menghemat waktu, namun kelemahannya metode ini dapat menimbulkan kesalahan. Selain itu tidak baik diterapkan untuk menganalisis sampel dengan ukuran besar. Metode Non Hirarkhi memiliki keuntungan lebih daripada metode hirarkhi. Hasilnya memiliki sedikit kelemahan pada data outlier, ukuran jarak yang digunakan, dan termasuk variabel tak relevan atau variabel yang tidak tepat. Keuntungannya hanya dengan menggunakan titik bakal non random, penggunaan metode non hirarkhi untuk titik bakal random secara nyata lebih buruk dari pada metode hirarkhi.