DISUSUN OLEH :
JURUSAN MATEMATIKA
2020
DAFTAR ISI
DAFTAR ISI ……………………………………………………………………...... i
PENUTUP
A. Kesimpulan ……………………………………………………………... 21
B. Saran ……………………………………………………………………. 21
Analisis cluster adalah suatu analisis statistik yang bertujuan memisahkan obyek
kedalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu
dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogeny antar anggota
dalam kelompok atau variasi obyek dalam kelompok yang terbentuk sekecil mungkin.
Beberapa manfaa tdari analisis cluster adalah: eksplorasi data peubah ganda,
reduksi data, stratifikasi sampling, prediksi keadaan obyek. Hasil dari analisis cluster
dipengaruhi oleh: obyek yang diclusterkan, peubah yang diamati, ukuran kemiripan
(jarak) yang dipakai, skala ukuran yang dipakai, serta metode pengclusteran yang
digunakan.
Ketika kita ingin mengelompokkan data sedemikian sehingga data yang berada
dalam kelompok yang sama mempunyai sifat yang relatif homogen daripada data yang
berada dalam kelompok yang berbeda, sehingga lebih mudah lebih mudah menganalisa
dan lebih tepat pengambilan keputusan sehubungan dengan masalah tersebut
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satudengan cluster yang
lainnya (between-cluster).
E. Asumsi
Asumsinya adalah:
1. Sample yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample)
2. Multikolinieritas
1. Hirarkis
Metode ini memulai pengelompokan dengan dengan dua atau lebih objek yang
mempunyai kesamaan paling dekat. Kemudian proses diteruskan ke objek lain yang
mempunyai kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk
semacam “pohon”, di mana ada hirarki (tingkatan) yang jelas antar objek, dari yang
paling mirip sampai paling tidak mirip. Secara logika semua objek pada akhirnya akan
membentuk sebuah cluster. Dendogram biasanya digunakan untuk membantu
memperjelas proses hirarki tersebut.
Dalam metode hirarki cluster terdapat dua tipe dasar yaitu agglomerative
(pemusatan) dan divisive (penyebaran). Dalam metode agglomerative, setiap obyek
atau observasi dianggap sebagai sebuah cluster tersendiri. Dalam tahap selanjutnya,
dua cluster yang mempunyai kemiripan digabungkan menjadi sebuah cluster baru
demikian seterusnya. Sebaliknya, dalam metode divisive kita beranjak dari sebuah
cluster besar yang terdiri dari semua obyek atau observasi. Selanjutnya, obyek atau
observasi yang paling tinggi nilai ketidakmiripannya kita pisahkan demikian
seterusnya.
2. Non Hirarkis
Metode ini dimulai dengan menentukan terlebih dahulu jumlah cluster yang
diinginkan dua, tiga , atau yang lain) Setelah jumlah cluster ditentukan, maka proses
cluster dilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut “K-
Means Cluster”
Kebalikan dari metode hirarki, metode nonhirarki tidak meliputi proses “treelike
construction“. Justru menempatkan objek-objek ke dalam cluster sekaligus sehingga
terbentuk sejumlah cluster tertentu. Langkah pertama adalah memilih sebuah cluster
sebagai inisial cluster pusat, dan semua objek dalam jarak tertentu ditempatkan pada
cluster yang terbentuk. Kemudian memilih cluster selanjutnya dan penempatan
dilanjutkan sampai semua objek ditempatkan. Objek-objek bisa ditempatkan lagi jika
jaraknya lebih dekat pada cluster lain daripada cluster asalnya.
Metode nonhirarki cluster berkaitan dengan K-means custering, dan ada tiga
pendekatan yang digunakan untuk menempatkan masing-masing observasi pada satu
cluste
Optimization
Tahap 1:
Mengukur kesamaan antar objek (similarity). Sesuai prinsip analisis cluster yang
mengelompokkan objek yang mempunyai kemiripan, proses pertama adalah mengukur
seberapa jauh ada kesamaan antar objek. Metode yang digunakan:
Tahap 2:
Membuat cluster. Metode dalam membuat cluster ada banyak sekali, seperti yang
digambarkan dalam diagram di bawah ini:
Diagram Analisis Cluster
Kemudian klik button Plots. Aktifkan pilihan Dendogram, kemudian pada bagian
Icicle pilih None. Selanjutnya klik Continue untuk kembali ke menu utama.
Kemudian klik button Method. Pada bagian Cluster Method pilih Nearest
Neighbor. Pada Measure pilih Euclidean distance dan pada Transform Values
pilih Z-score. Lalu tekan tombol Continue untuk kembali ke menu utama. Dari
tampilan menu utama, tekan tombol OK. Pada Cluster Methodakan digunakan
beberapa metode.
Hasil Output Dengan Menggunakan Metode Single Linkage
Cluster Membership
3
Case 5 Clusters 4 Clusters Clusters 2 Clusters
1:Banyuwangi 1 1 1 1
2:Cianjur 1 1 1 1
3:Jember 2 2 2 2
4:Jepara 3 3 3 2
5:Jombang 1 1 1 1
6:Kediri 2 2 2 2
7:Kudus 2 2 2 2
8:Kulonprogo 3 3 3 2
9:Lumajang 1 1 1 1
10:Majalengka 4 1 1 1
11:Pacitan 1 1 1 1
12:Pamekasan 1 1 1 1
13:Pasuruan 5 4 3 2
14:Pati 3 3 3 2
15:Probolinggo 3 3 3 2
16:Rembang 3 3 3 2
17:Serang 3 3 3 2
18:Sleman 2 2 2 2
19:Sukabumi 1 1 1 1
Buka Aplikasi SPSS, setelah itu buat variabel dan tipe datanya,
I. Interpretasi
Setelah cluster terbentuk, entah dengan metode hirarki atau non-hirarki, langkah
selanjutnya adalah melakukan interprestasi terhadap cluster yang terbentuk, yang pada
intinya member nama spesifik untuk menggambarkan isi cluster. Misalnya, kelompok
konsumen yang memperhatikan lingkungan sekitar sebelum membeli sebuah rumah bias
dinamai “cluster lingkungan”
PENUTUP
A. Kesimpulan
Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan
kesamaan karakteristik di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu
cluster yang baik yaitu mepunyai :
Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu
cluster.
Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu
dengan cluster yang lain.
Analisis cluster terbagi menjadi dua, yaitu analisis cluster hierarki dan analisis
cluster non hierarki. Metode Hierarki memulai pengelompokan dengan dua atau lebih
obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang
lain dan seterusnya hingga cluster akan membentuk semacam ‘ p o h o n ’ dimana
terdapat tingkatan (hierarki) yang jelas antar obyek, dari yang paling mirip hingga yang
paling tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut “
dendogram” . Sedangkan Metode Non-Hirarkis dimulai dengan menentukan terlebih
dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster
ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses hirarki.
Metode ini biasa disebut “ K-Means Cluster” .
B. Saran
DAFTAR PUSTAKA