Anda di halaman 1dari 3

CLUSTER ANALYSIS

CHAPTER I
A. Definisi
Analisis Cluster termasuk dalam teknik analisis multivariate metode
interdependen. Teknik ini bertujuan untuk mengatur informasi / meringkas
data dengan cara mengelompokkan objek-objek berdasarkan kesamaan
karakteristik tertentu. Dengan demikian, Cluster analisis atau clustering
memiliki tujuan untuk mengelompokkan data dari serangkaian pengamatan
ke subset (disebut cluster).
B. Sejarah Singkat
Analisis cluster panjang (pertama kali digunakan oleh Tryon, 1939) meliputi
beberapa algoritma yang berbeda dan metode untuk mengelompokkan
benda serupa ke dalam kategori masing-masing. Sebuah pertanyaan umum
yang dihadapi peneliti di banyak bidang penelitian adalah bagaimana
mengorganisasi data yang diamati ke dalam struktur yang bermakna, yaitu,
untuk mengembangkan taksonomi.Analisis cluster dapat digunakan untuk
menemukan struktur data tanpa memberikan penjelasan / penafsiran.
Dengan kata lain, analisis cluster hanya menemukan struktur data tanpa
menjelaskan mengapa mereka ada. (ref 1)
C. Cara Kerja Analisisi Cluster
Tujuan utama analisis cluster adalah menentukan struktur data dengan cara
meletakkan observasi yang mirip dalam satu kelompok. Pengelompokan hasil
observasi yang mirip ke dalam satu kelompok didasarkan pada korelasi antar
objek atau dapat juga dengan mengukur proximity pada ruang dua dimensi
sehingga jarak antara dua observasi menunjukkan kesamaan. Langkah
berikutnya adalah menentukan bagaimana membentuk cluster dan berapa
jumlah cluster yang akan dibentuk (Imam Ghozali, 2009 : 312)
D. Metode Analisis Cluster (ref 1)
Single linkage (tetangga terdekat). Dalam metode ini jarak antara dua
cluster ditentukan oleh jarak dari dua obyek terdekat (tetangga terdekat)
dalam cluster yang berbeda.

Complete linkage (furthest neighbor). Dalam metode ini, jarak antara


cluster ditentukan oleh jarak terbesar antara dua obyek dalam cluster yang
berbeda (yaitu, oleh tetangga jauh). Metode ini biasanya melakukan cukup
baik dalam kasus-kasus ketika obyek benar-benar terbentuk secara alami
berbeda. Jika cluster cenderung memanjang entah bagaimana atau yang
bersifat tipe rantai, maka metode ini adalah kurang baik dilakukan.
Unweighted pair-group average. Dalam metode ini, jarak antara dua
cluster dihitung sebagai jarak rata-rata antara semua pasangan obyek dalam
dua kelompok yang berbeda. Metode ini juga sangat efisien ketika objek
bentuk alami yang berbeda.
Weighted pair-group average. Metode ini identik dengan metode rata-rata
kelompok pasangan unweighted, kecuali bahwa dalam perhitungan, ukuran
cluster masing-masing (yaitu, jumlah objek yang terkandung di dalamnya)
digunakan sebagai pemberat. Sneath dan Sokal (1973) memperkenalkan
WPGMA untuk menyebut metode ini sebagai pasangan kelompok tertimbang
metode menggunakan rata-rata aritmatika.
E. Analisis Cluster dalam beberapa bidang keilmuan
Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk (a)
mengetahui segmentasi dan menentukan target pasar yang dituju; (b)
mengetahui positioning produk dan menentukan pengembangan produk
baru; (c) Memilih pasar yang akan dipilih untuk produk baru perusahaan.
Dalam pencitraan medis, seperti PET scan (Positron emission tomography),
analisis cluster dapat digunakan untuk membedakan antara berbagai jenis
jaringan dan darah dalam gambar tiga dimensi. Dalam aplikasi ini, posisi
sebenarnya tidak masalah, namun intensitas voxel dianggap sebagai vektor,
dengan dimensi untuk setiap gambar yang diambil dari waktu ke waktu.
Teknik ini memungkinkan, misalnya, pengukuran akurat dari tingkat pelacak
radioaktif dikirim ke daerah yang menarik, tanpa pengambilan sampel
terpisah dari darah arteri, teknik mengganggu yang paling umum saat ini.
(ref 2)
Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa
data siswa, orang tua, jenis kelamin atau nilai ujian. Clustering merupakan
metode penting untuk memahami dan utilitas dari cluster dalam penelitian
pendidikan.

Cluster analisis dalam penelitian pendidikan dapat digunakan untuk data


eksplorasi, cluster konfirmasi dan pengujian hipotesis. Data eksplorasi
digunakan ketika ada sedikit informasi tentang sekolah atau siswa yang akan
dikelompokkan bersama-sama. Ini. bertujuan untuk menemukan setiap
cluster yang berarti unit berdasarkan langkah-langkah pada satu set variabel
respon. Konfirmasi cluster digunakan untuk mengkonfirmasikan hasil cluster
yang dilaporkan sebelumnya pengujian Hipotesis yang digunakan untuk
mengatur struktur cluster.(3)
Beberapa istilah Analisis Cluster antara lain :
Aggomerration schedule : merupakan jadwal yang akan memberikan
informasi tentang ibjek atau kasus yang akan dikelompokkan pada setiap
tahap pada suatu proses analisis cluster yang hierarkis.
Cluster centroid : merupakan nilai rata-rata variabel dari semua objek/kasus
atau observasi dalam cluster tertentu
Cluster centers, adalah titik awal dimulainya pengelompokan di dalam cluster
nonhierarki.
Cluster membership merupakan keanggotaan yang menunjukkan cluster.
Dendogram merupakan visualisasi cluster. Garis vertical (Y) menunjukkan
cluster yang digabung bersama. Posisi garis pada skala X menunjukkan jarak
(distance) dimana cluster digabung.
Distance between cluster center adalah jarak yang menunjukkan bagaimana
terpisahnya pasangan individu cluster.
Dua metode analisis Cluster adalah Hierarchical Cluster dan K-means Cluster.
Hierarchical Cluster disarankan untuk data dengan sampel kecil, sedangan Kmeans cluster disarankan untuk sampel bersa (lebih dari 100)

Anda mungkin juga menyukai