Anda di halaman 1dari 20

LAPORAN

METODE ANALISIS CLUSTER

Mata Kuliah Analisis Multivariat

Dosen: Admi Salma, S.Pd., M.Si

DISUSUN OLEH :

17030006 Dewi Safitri

17030042 Elvingky Agustiani

17030087 Andini Hasni

17030096 Febbyola Hendrayanti

JURUSAN MATEMATIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI PADANG

2020

DAFTAR ISI
DAFTAR ISI ……………………………………………………………………...... i

METODE ANALISIS CLUSTER

A. Pengertian Metode Analisis Cluster……………………………………….1


B. Kapan Analisis Cluster Digunakan ……………………………………….. 1
C. Kenapa Harus Menggunakan Analisis Cluster ……………………………. 1
D. Tujuan Analisis Cluster................................................................................2
E. Asumsi-Asumsi Analisis Cluster.................................................................2
F. Metode Pengelompokan Analisis Cluster....................................................3
G. Prosedur dalam Menggunakan Analisis Cluster...........................4
H. Studi Kasus.................................................................................................4
I. Interpretasi Hasil Analisis.........................................................................19

PENUTUP

A. Kesimpulan ……………………………………………………………... 21
B. Saran ……………………………………………………………………. 21

DAFTAR PUSTAKA ..………………………………………………………22


ANALISIS CLUSTER

A. Pengertian Analisis Cluster

Analisis cluster adalah suatu analisis statistik yang bertujuan memisahkan obyek
kedalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu
dengan yang lain. Dalam analisis ini tiap-tiap kelompok bersifat homogeny antar anggota
dalam kelompok atau variasi obyek dalam kelompok yang terbentuk sekecil mungkin.

Analisis Cluster sering juga disebut sebagai Q-analysis, Typologi Construction,


Classification Analysis, dan juga Numerical Taxonomy. Banyaknya versi nama ini
tentunya ada tujuannya, yaitu untuk pengelompokkan metode berdasarkan disiplin ilmu
antara lain seperti psikologi, biologi, ekonomi, sosial, teknik dan bisnis. Meskipun
berbeda nama dan berbeda disiplin ilmu, semuanya masih menggunakan metode dan
pendekatan yang sama.

Beberapa manfaa tdari analisis cluster adalah: eksplorasi data peubah ganda,
reduksi data, stratifikasi sampling, prediksi keadaan obyek.  Hasil dari analisis cluster
dipengaruhi oleh: obyek yang diclusterkan, peubah yang diamati, ukuran kemiripan
(jarak) yang dipakai, skala ukuran yang dipakai, serta metode pengclusteran yang
digunakan.

B. Kapan Analisis Cluster Digunakan

Ketika kita ingin mengelompokkan data sedemikian sehingga data yang berada
dalam kelompok yang sama mempunyai sifat yang relatif homogen daripada data yang
berada dalam kelompok yang berbeda, sehingga lebih mudah lebih mudah menganalisa
dan lebih tepat pengambilan keputusan sehubungan dengan masalah tersebut

C. Kenapa Harus Menggunakan Analisis Cluster

Karena Analisis Cluster dapat :

a. menerapkan dasar – dasar pengelompokan dengan lebih konsisten.


b. mengembangkan suatu metode generalisasi secara induktif, yaitu pengambilan
kesimpulan secara umum dengan berdasarkan fakta – fakta khusus.
c. Menemukan tipologi yang cocok dengan karakter obyek yang diteliti.
d. Mendeskripsikan sifat – sifat atau karakteristik dari masing – masing kelompok
(cluster).

D. Tujuan Analisis Cluster

Tujuan utama analisis cluster adalah mengelompokkan objek-objek berdasarkan


kesamaan karakteristik di antara objek-objek tersebut. Objek bias berupa produk (barang
dan jasa), benda (tumbuhan atau lainnya), serta orang (responden, konsumen atau yang
lain). Objek tersebut akan diklasifikasikan kedalam satu atau lebih cluster (kelompok)
sehingga objek-objek yang berada dalam satu cluster akan mempunyai kemiripan satu
dengan yang lain.
Tujuan analisis cluster :
1. Mengelompokkan objek-objek berdasarkan kesamaan karakteristik di antara obejk-
objek tertentu berdasarkan pada suatu set variabel yang dipertimbangkan untuk
diteliti.
2. Suatu objek dapat berupa produk, benda, perusahaan, orang, atau kesempatan
pertumbuhan.
3. Objek tersebut akan di klasifikasi kedalam satu atau lebih claster sehingga objek-
objek yang berada dalam suatu klaster akan mempunyai kemiripan satudengan yang
lain.

Dengan demikian, ciri-ciri suatu cluster yang baik mempunyai:

Secara logika, cluster yang baik adalah cluster yang mempunyai:

1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster


(withincluster).

2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satudengan cluster yang
lainnya (between-cluster).

E. Asumsi

Asumsinya adalah:
1. Sample yang diambil benar-benar dapat mewakili populasi yang ada
(representativeness of the sample)
2. Multikolinieritas

F. Metode Pengelompokan Analisis Cluster

Metode pengelompokan analisis cluster:

1. Hirarkis

Metode ini memulai pengelompokan dengan dengan dua atau lebih objek yang
mempunyai kesamaan paling dekat. Kemudian proses diteruskan ke objek lain yang
mempunyai kedekatan kedua. Demikian seterusnya sehingga cluster akan membentuk
semacam “pohon”, di mana  ada hirarki (tingkatan) yang jelas antar objek, dari yang
paling mirip sampai paling tidak mirip. Secara logika semua objek pada akhirnya akan
membentuk sebuah cluster. Dendogram biasanya digunakan untuk membantu
memperjelas proses hirarki tersebut.

Dalam metode hirarki cluster terdapat dua tipe dasar yaitu agglomerative
(pemusatan) dan divisive (penyebaran).  Dalam metode agglomerative, setiap obyek
atau observasi dianggap sebagai sebuah cluster tersendiri. Dalam tahap selanjutnya,
dua cluster yang mempunyai kemiripan digabungkan menjadi sebuah cluster baru
demikian seterusnya. Sebaliknya, dalam metode divisive kita beranjak dari sebuah
cluster besar yang terdiri dari semua obyek atau observasi. Selanjutnya, obyek atau
observasi yang paling tinggi nilai ketidakmiripannya kita pisahkan demikian
seterusnya.

Manfaat Analisis Kluster Hirarki

Keuntungan penggunaan metode hierarki dalam analisis Cluster adalah


mempercepat pengolahan dan menghemat waktu karena data yang diinputkan akan
membentuk hierarki atau membentuk tingkatan tersendiri sehingga mempermudah
dalam penafsiran, namun kelemahan dari metode ini adalah seringnya terdapat
kesalahan pada data outlier, perbedaan ukuran jarak yang digunakan, dan terdapatnya
variabel yang tidak relevan. Sedang metode non-hierarki memiliki keuntungan dapat
melakukan analisis sampel dalam ukuran yang lebih besar dengan lebih efisien. Selain
itu, hanya memiliki sedikit kelemahan pada data outlier, ukuran jarak yang digunakan,
dan variabel tak relevan atau variabel yang tidak tepat. Sedangkan kelemahannya
adalah untuk titik bakal random lebih buruk dari pada metode hirarkhi.

2. Non Hirarkis
Metode ini dimulai dengan menentukan terlebih dahulu jumlah cluster yang
diinginkan dua, tiga , atau yang lain) Setelah jumlah cluster ditentukan, maka proses
cluster dilakukan dengan tanpa mengikuti proses hirarki. Metode ini biasa disebut “K-
Means Cluster”
Kebalikan dari metode hirarki, metode nonhirarki tidak meliputi proses “treelike
construction“. Justru menempatkan objek-objek ke dalam cluster sekaligus sehingga
terbentuk sejumlah cluster tertentu. Langkah pertama adalah memilih sebuah cluster
sebagai inisial cluster pusat, dan semua objek dalam jarak tertentu ditempatkan pada
cluster yang terbentuk. Kemudian memilih cluster selanjutnya dan penempatan
dilanjutkan sampai semua objek ditempatkan. Objek-objek bisa ditempatkan lagi jika
jaraknya lebih dekat pada cluster lain daripada cluster asalnya.

Pendekatan Metode non hirarki cluster

Metode nonhirarki cluster berkaitan dengan K-means custering, dan ada tiga
pendekatan yang digunakan untuk menempatkan masing-masing observasi pada satu
cluste

 Sequential Threshold, Metode Sequential Threshold

Sequential Threshold, Metode Sequential Threshold memulai dengan


pemilihan satu cluster dan menempatkan semua objek yang berada pada jarak
tertentu ke dalamnya. Jika semua objek yang berada pada jarak tertentu telah
dimasukkan, kemudian cluster yang kedua dipilih dan menempatkan semua
objek yang berjarak tertentu ke dalamnya. Kemudian cluster ketiga dipilih
dan proses dilanjutkan seperti yang sebelumnya.
 Parallel Threshold, Metode Parallel Threshold

Parallel Threshold, Metode Parallel Threshold merupakan kebalikan dari


pendekatan yang pertama yaitu dengan memilih sejumlah cluster secara
bersamaan dan menempatkan objek-objek kedalam cluster yang memiliki
jarak antar muka terdekat. Pada saat proses berlangsung, jarak antar muka
dapat ditentukan untuk memasukkan beberapa objek ke dalam cluster-cluster.
Juga beberapa variasi pada metode ini, yaitu sisa objek-objek tidak
dikelompokkan jika berada di luar jarak tertentu dari sejumlah cluster.

 Optimization

Optimization, Metode ketiga adalah serupa dengan kedua metode


sebelumnya kecuali bahwa metode ini memungkinkan untuk menempatkan
kembali objek-objek ke dalam cluster yang lebih dekat.

G. Prosedur Analisis Cluster

Untuk menganalisis cluster, anda perlu melakukan proses sebagai berikut:

Tahap 1:

Mengukur kesamaan antar objek (similarity). Sesuai prinsip analisis cluster yang
mengelompokkan objek yang mempunyai kemiripan, proses pertama adalah mengukur
seberapa jauh ada kesamaan antar objek. Metode yang digunakan:

 Mengukur korelasi antar sepasang objek pada beberapa variable


 Mengukur jarak (distance) antara dua objek. Pengukuran ada bermacam-macam,
yang paling popular adalah metode Euclidian distance.

Tahap 2:

Membuat cluster. Metode dalam membuat cluster ada banyak sekali, seperti yang
digambarkan dalam diagram di bawah ini:
Diagram Analisis Cluster

H. Contoh Kasus Dan Penyelesaian


 METODE BERHIRARKI DENGAN MENGGUNAKAN PROGRAM SPSS
 Buka Aplikasi SPSS, setelah itu buat variabel dantipe datanya, seperti gambar di
bawah ini

 Lakukan entri data sesuai dengan studi kasus di atas

 Lakukan Transformasi atau standardisasi data tersebut. Klik menu Analyzeà


Descriptives Statisticsà Descriptives. Masukkan Seluruh variabel instrument penilai
(dalam hal ini variabel kabupaten tidak dimasukkan karena data bertipe string).
Kemudian berikan centang pada “Save standardized values asvariables“.
Kemudian klik OK.
 Sehingga muncul output deskriptif statistik. Kemudian pada data view akan terlihat
juga hasil dari perhitungan z-score dan hasil z-score inilah yang akan dipakai
sebagai dasar analisis cluster. Namun apabila data yang terkumpul tidak mempunyai
variabilitas satuan, maka proses analisis cluster dapat langsung dilakukan tanpa
terlebih dahulu melakukan transformasi atau standardisasi.
 Selanjutnya, klik menu AnalyzeàClassifyàHierarchical Cluster. Kemudian
masukkan seluruh variabel yang telah distandardisasikan tadi (Z-score) ke dalam
kotak Variable(s). pada bagian Label Cases by isi degan variabel Kabupaten
sedangkan untuk bagian Cluster pilih Cases, pada bagian Display pilih keduanya
yaitu Statistics dan Plots.
 Kemudian klik button Statistics, berikan centang pada Agglomeration Schdule dan
Proximity matrix. Kemudian tekan tombol Continue untuk kembali ke menu
utama.

 Kemudian klik button Plots. Aktifkan pilihan Dendogram, kemudian pada bagian
Icicle pilih None. Selanjutnya klik Continue untuk kembali ke menu utama.
 Kemudian klik button Method. Pada bagian Cluster Method pilih Nearest
Neighbor. Pada Measure pilih Euclidean distance dan pada Transform Values
pilih Z-score. Lalu tekan tombol Continue untuk kembali ke menu utama. Dari
tampilan menu utama, tekan tombol OK. Pada Cluster Methodakan digunakan
beberapa metode.
Hasil Output Dengan Menggunakan Metode Single Linkage

Cluster Membership
3
Case 5 Clusters 4 Clusters Clusters 2 Clusters
1:Banyuwangi 1 1 1 1
2:Cianjur 1 1 1 1
3:Jember 2 2 2 2
4:Jepara 3 3 3 2
5:Jombang 1 1 1 1
6:Kediri 2 2 2 2
7:Kudus 2 2 2 2
8:Kulonprogo 3 3 3 2
9:Lumajang 1 1 1 1
10:Majalengka 4 1 1 1
11:Pacitan 1 1 1 1
12:Pamekasan 1 1 1 1
13:Pasuruan 5 4 3 2
14:Pati 3 3 3 2
15:Probolinggo 3 3 3 2
16:Rembang 3 3 3 2
17:Serang 3 3 3 2
18:Sleman 2 2 2 2
19:Sukabumi 1 1 1 1

Hasil output di atas menunjukkan pengelompokkan objek pengamatan terhadap 5


cluster yang telah diset di awal. Tidak ada alasan khusus mengapa memilih 5 cluster. Hal
ini dilakukan agar hasil lebih terpusat pada 2, 3, 4, atau 5 cluster sehingga mudah dibaca.
Misalkan jika digunakan 2 cluster maka Banyuwangi, Cianjur, Jombang, Lumajang,
Majalengka, Pacitan, Pamekasan, dan Sukabumi berada pada cluster 1 sedangkan
kabupaten lainnya dikelompokkan pada cluster 2. Begitu pula untuk jumlah cluster
sebanyak 3, 4 atau 5.

Untuk 5 cluster, diperoleh pengelompokkan yaitu cluster 1 terdiri dari Banyuwangi,


Cianjur, Jombang, Lumajang, Pacitan, Pamekasan, dan Sukabumi. Cluster 2 terdiri dari
Jember, Kediri, Kudus, dan Sleman. Cluster 3 terdiri dari Jepara, Kulonprogo, Pati,
Probolinggo, Rembang, dan Serang. Cluster 4 yaitu Majalengka. Cluster 5 : Pasuruan.
Hasil output di atas merupakan dendogram hasil analisis cluster dengan metode
single linkage. Dimana, semakin banyak cluster yang dipilih maka jarak nya semakin kecil.
Dari dendogram di atas dengan jarak lebih dari 25 maka diperoleh 1 cluster (tidak terjadi
pengelompokkan), sedangkan jika jaraknya 25 maka didapat 2 cluster yaitu cluster 1 terdiri
dari Cianjur, Sukabumi, Banyuwangi, Pacitan, Jombang, Lumajang, Pamekasan, dan
Majalengka sedangkan kabupaten lainnya masuk ke cluster 2. Hasil ini serupa dengan tabel
output sebelumnya (tabel cluster membership) jika yang dipilih adalah 2 cluster. Begitu
pula jika kita mengambil jaraknya adalah 20 maka terdapat 3 cluster, dimana cluster 1
terdiri dari Jember, Kediri, Kudus, dan Sleman, cluster 2 terdiri dari Cianjur, Sukabumi,
Banyuwangi, Pacitan, Jombang, Lumajang, Pamekasan, dan Majalengka, sedangkan
kabupaten sisanya masuk ke cluster 3. Begitu pula untuk jarak lainnya yang menghasilnya
jumlah cluster yang kemungkinan berbeda satu sama lain. Semakin banyak cluster yang
terbentuk maka jaraknya semakin kecil. Artinya, semakin memiliki kemiripan yang besar
di dalam cluster dan memiliki ketidakmiripan antarcluster.

Dalam pengolahan analisis cluster dengan menggunakan spss, dapat dijadikan


sebagai catatan bahwa hasil dendogram pada metode hirarki tidak ditentukan jumlah
clusternya. Hasil atau output dendogram dengan jumlah cluster tertentu ditentukan oleh
jaraknya sampai hanya terbentuk 2 cluster. Pada dendogram di atas, jarak maksimumnya
adalah 25 (yaitu hingga hanya terbentuk 2 cluster). Berbeda dengan metode non-hirarki
seperti K-Means yang terlebih dahulu sudah ditentukan jumlah clusternya.

 METODE TAK BERHIRARKI Dengan Menggunakan Program SPSS

 Buka Aplikasi SPSS, setelah itu buat variabel dan tipe datanya,

 Lakukan entri data sesuai dengan studi kasus di atas,

 Lakukan Transformasi atau standardisasi data tersebut. Klik menu


AnalyzeàDescriptives StatisticsàDescriptives. Masukkan Seluruh variabel
instrument penilai (dalam hal ini variabel kabupaten tidak dimasukkan karena data
bertipe string). Kemudian berikan centang pada “Save standardized values
asvariables“. Kemudian klik OK.

 Selanjutnya, klik menu AnalyzeàClassifyàK-Means Cluster. Kemudian masukkan


seluruh variabel yang telah distandardisasi ke dalam kotak Variable(s). pada bagian
Label Cases by isi degan variabel Kabupaten sedangkan untuk bagian Number of
Clusters masukkan angka 2 sesuai dengan perintah dari soal. Klik pilihan SAVE,
beri tanda ceklist pada “Cluster Membership”. Selanjuitnya pilih OK.

Hasil Output analisis cluster dengan Menggunakan SPSS


Seperti yang telah dijelaskan sebelumnya, maka metode non-hirarki adalah
metode clustering dimana jumlah cluster nya diketahui. Pada kasus ini jumlah cluster
ditentukan sebanyak 2 cluster. Dari output di atas terlihat bahwa banyaknya objek di
cluster pertama sebanyak 8 kabupaten sedangkan sisanya (11 kabupaten) dikelompokkan
ke cluster 2.

Output Pada Data View :

Dari hasil di atas dapat dilihat bahwa :

Cluster 1 : Banyuwangi, Cianjur, Jombang, Lumajang, Majalengka, Pacitan, Pamekasan,


dan Sukabumi.

Cluster 2 : Jember, Jepara, Kediri, Kudus, Kulonprogo, Pasuruan, Pati, Probolinggo,


Rembang, Serang, dan Sleman.

I. Interpretasi

Setelah cluster terbentuk, entah dengan metode hirarki atau non-hirarki, langkah
selanjutnya adalah melakukan interprestasi terhadap cluster yang terbentuk, yang pada
intinya member nama spesifik untuk menggambarkan isi cluster. Misalnya, kelompok
konsumen yang memperhatikan lingkungan sekitar sebelum membeli sebuah rumah bias
dinamai “cluster lingkungan”
PENUTUP

A. Kesimpulan
Tujuan dari Analisis Cluster adalah mengelompokkan obyek berdasarkan
kesamaan karakteristik di antara obyek-obyek tersebut. Dengan demikian, ciri-ciri suatu
cluster yang baik yaitu mepunyai :

 Homogenitas internal (within cluster); yaitu kesamaan antar anggota dalam satu
cluster.

 Heterogenitas external (between cluster); yaitu perbedaan antara cluster yang satu
dengan cluster yang lain.

Analisis cluster terbagi menjadi dua, yaitu analisis cluster hierarki dan analisis
cluster non hierarki. Metode Hierarki memulai pengelompokan dengan dua atau lebih
obyek yang mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang
lain dan seterusnya hingga cluster akan membentuk semacam ‘ p o h o n ’ dimana
terdapat tingkatan (hierarki) yang jelas antar obyek, dari yang paling mirip hingga yang
paling tidak mirip. Alat yang membantu untuk memperjelas proses hierarki ini disebut “
dendogram” . Sedangkan Metode Non-Hirarkis dimulai dengan menentukan terlebih
dahulu jumlah cluster yang diinginkan (dua, tiga, atau yang lain). Setelah jumlah cluster
ditentukan, maka proses cluster dilakukan dengan tanpa mengikuti proses hirarki.
Metode ini biasa disebut “ K-Means Cluster” .

B. Saran
DAFTAR PUSTAKA

Swanstatistic. 7 September 2018. Analisis Cluster Dengan Menggunakan Spss.


https://swanstatistics.com/analisis-cluster-dengan-menggunakan-spss/ 26 maret 2020

Hidayat, Anwar. 26 Maret 2014. Penjelasan Lengkap Tentang Analisis Cluster.


https://www.statistikian.com/2014/03/analisis-cluster.html 23 Maret 2020

Nuratnamukti. 2012. Analisis Cluster.


http://inungpunyamimpi.blogspot.com/2012/04/analisis-cluster.html. 23 Maret 2020

Anda mungkin juga menyukai