Disusun oleh :
Nony Fahdila
D1091141006
D1091141038
BAB I
PENDAHULUAN
1.1 Latar Belakang
Analisis kelompok (cluster analysis) merupakan salah satu teknik dalam
analisis multivariat yang mempunyai tujuan utama untuk mengelompokkan objekobjek pengamatan menjadi beberapa kelompok berdasarkan karakteristik yang
dimilikinya. Analisis kelompok mengelompokkan objek-objek sehingga setiap objek
yang paling dekat kesamaannya dengan objek lain berada dalam kelompok yang
sama, serta mempunyai kemiripan satu dengan yang lain. Kelompok-kelompok yang
akan terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal
yang tinggi. Banyak bidang yang telah menerapkan analisis kelompok ini, antara lain
bidang sosial, kewilayahan, kesehatan , serta marketing. Secara umum dalam metode
analisis kelompok, terdapat dua metode pengelompokkan, yaitu metode hierarki
(Hierarchical Methods) dan metode tak berhierarki (Nonhierarchical Methods).
Metode hierarki dapat dibedakan menjadi dua bagian, yaitu metode penggabungan
(agglomerative) dan metode pemecahan (devisive). Pembentukan kelompok dalam
metode hierarki, menggunakan beberapa cara, antara lain pautan tunggal (single
linkage), pautan lengkap (complete linkage), dan pautan rata-rata (average linkage).
Pembentukan kelompok dengan metode tak berhierarki yang sering digunakan adalah
metode cmeans cluster. Salah satu metode nonhierarki yang paling banyak
digunakan adalah c-means cluster, bertujuan membagi n observasi ke dalam c
kelompok dimana tiap observasi menjadi anggota dari kelompok dengan nilai ratarata terdekat, melalui proses perulangan (iterasi) hingga pengelompokkan tersebut
konvergen. c-means cluster dapat digolongkan sebagai hard clustering, dimana setiap
elemen menjadi anggota secara eksklusif dari suatu kelompok tertentu dengan batasan
yang jelas. Hal ini merupakan kelemahan c-means jika sifat pengelompokkan sulit
untuk dideskripsikan secara pasti.
makan lauk pauk berprotein tinggi kurang dari 4 kali dalam seminggu
Dari variabel diatas yaitu menggunakan analisis cluster karena untuk mengetahui
pengelompokan objek-objek berdasarkan karakter yang dimilikinya.
1.2 Rumusan Masalah
Adapun rumusan masalah dari latar belakang diatas adalah:
a. Apa pengertian dari Analisis Cluster
b. Apa manfaat Analisis Cluster
c. Bagaimana langkah-langkah Analisis Cluster
d. Bagaimana contoh aplikasi penggunaan Analisis Cluster
1.3 Tujuan Permasalahan
Adapun tujuan dari penyusunan makalah ini adalah untuk :
a. Mengetahui pengertian dari Analisis Cluster
b. Mengetahui manfaat Analisis Cluster
c. Mengetahui langkah-langkah Analisis Cluster
d. Mengetahui contoh aplikasi penggunaan Analisis Cluster
BAB II
PEMBAHASAN
2.1.Pengertian Analisis Cluster
Analisis cluster merupakan teknik multivariat yang mempunyai tujuan utama
untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya.
Analisis cluster mengklasifikasi objek sehingga setiap objek yang paling dekat
kesamaannya dengan objek lain berada dalam cluster yang sama. Cluster-cluster yang
terbentuk memiliki homogenitas internal yang tinggi dan heterogenitas eksternal yang
tinggi. Berbeda dengan teknik multivariat lainnya, analisis ini tidak mengestimasi set
vaiabel secara empiris sebaliknya menggunakan setvariabel yang ditentukan oleh
peneliti itu sendiri. Fokus dari analisis cluster adalah membandingkan objek
berdasarkan set variabel, hal inilah yang menyebabkan para ahli mendefinisikan set
variabel sebagai tahap kritis dalam analisis cluster. Set variabel cluster adalah suatu
set variabel yang merpresentasikan karakteristik yang dipakai objek-objek. Bedanya
dengan analisis faktor adalah bahwa analisis cluster terfokus pada pengelompokan
objek sedangkan analisis faktor terfokus pada kelompok variabel.
Solusi analisis cluster bersifat tidak unik, anggota cluster untuk tiap
penyelesaian/solusi tergantung pada beberapa elemen prosedur dan beberapa solusi
yang berbeda dapat diperoleh dengan mengubah satu elemen atau lebih. Solusi cluster
secara keseluruhan bergantung pada variabel-variaabel yang digunakan sebagai dasar
untuk menilai kesamaan. Penambahan atau pengurangan variabel-variabel yang
relevan dapat mempengaruhi substansi hasi analisisi cluster.
2.2 Manfaat Analisis Cluster
Analisis cluster merupakan alat analisis data di berbagai situasi berbeda. Sebagai
contoh peneliti yang mengumpulkan data dengan cara kuesioner mungkin
menghadapibanyak observasi yang tidak bermakna sebelum diklasifikasikan secara
Misalnya dalam analisis pemasaran, maka dapat digunakan untuk mengetahui target
pasar, mengetahui pengembangan produk baru, dan sebagainya.
Selanjutnya adalah dalam bidang pendidikan. Sebagai contoh dalam pendidikan.
Analisis ini dapat digunakan untuk mengelompokan data mahasiswa. Misalnya data
berupa siswa, orang tua, jenis kelamin, atau nilai IPK. Sehingga dapat dikelompokan
mahasiswa-mahasiswa yang memiliki nilai IPK tinggi, sedang dan rendah.
Begitu juga dalam bidang perencanaan wilayah dan kota. Analisis cluster ini
dapat digunakan dalam mengelompokkan fasilitas fasilitas umum dari sudut
pandang pemakai atau masyarakat. Sebagai contoh, mengelompokkan fasilitas
prasarana transportasi seperti terminal. Dengan menganalisis data data yang ada,
maka dapat dikelompokkan terminal yang pelayanannya sudah baik, sedang atau
terminal yang tidak baik kualitasnya. Maka terminal terminal yang memiliki
karakteristik yang sama (ditandai dengan nilai yang selisihnya tidak jauh berbeda)
akan ditempatkan pada satu kelompok atau cluster.
Metode Hirarkis; memulai pengelompokan dengan dua atau lebih obyek yang
mempunyai kesamaan paling dekat. Kemudian diteruskan pada obyek yang
lain dan seterusnya hingga cluster akan membentuk semacam pohon dimana
terdapat tingkatan (hirarki) yang jelas antar obyek, dari yang paling mirip
hingga yang paling tidak mirip. Alat yang membantu untuk memperjelas
proses hirarki ini disebut dendogram.
Multikolinieritas.
makan lauk pauk berprotein tinggi kurang dari 4 kali dalam seminggu
Provinsi
makan
makan lauk
tidak
makanan
pauk
pernah
tidak
mempunyai bila
sekolah 21kali
/ tamat dalam
dalam
sakit
pakaian
SD
seminggu seminggu
< 4 stel
tidur
diobati
63,13
38,67
35,7
16,79
2,48
3,33
barat
57,48
48,23
17,48
20,6
0,9
4,05
Riau
67,72
50,59
18,43
9,95
1,58
3,34
Jambi
75,99
44,1
29,77
27,94
1,76
2,55
selatan
65,69
58,39
27,9
24,67
5,57
5,18
Bengkulu
71,37
52,02
35,6
30,64
2,17
4,29
Lampung
80,64
35,59
41,56
34,15
1,48
2,78
DKI Jakarta
37,8
56,38
12,28
87,24
1,45
6,78
jawa barat
70,84
70,48
31,37
17,17
1,82
5,32
jawa tengah
79,3
35,99
16,25
19,36
1,89
3,97
76,05
46,27
11,35
17,45
1,17
4,72
sumatera
utara
sumatera
sumatera
DI
Yogyakarta
jawa timur
82,76
30,86
15,13
30,77
2,01
3,55
Bali
77,96
42,28
6,28
25,74
0,34
4,87
NTB
86,92
33,09
23,48
48,28
3,2
4,64
NTT
87,36
56,75
58,67
49,77
1,42
9,31
83,48
54,34
38,6
29,46
3,87
7,51
60,37
50,29
18,78
28,13
6,69
2,68
76,93
38,72
16,65
29,37
2,77
7,07
73,43
52,45
18,18
12,72
1,11
1,01
51,3
58,14
25,58
11,08
1,84
2,89
66,01
54,47
16,29
32,81
2,47
8,66
77,62
58,74
10,93
24,03
3,7
6,89
tenggara
74,65
72,91
3,19
17,78
1,07
8,78
irian jaya
52,32
70,04
30,37
16,84
6,58
18,62
kalimantan
barat
kalimantan
timur
kalimantan
selatan
kalimantan
tengah
sulawesi
utara
Sulawesi
tengah
sulawesi
selatan
sulawesi
2.4.1 Standardisasi/Transformasi
Mengingat data yang terkumpul mempunyai variabilitassatuan, maka perlu
dilakukan langkah standardisasi atautransformasi terhadap variabel yang relevan ke
bentuk zscore, sebagai berikut:
1. Setelah keseluruhan data yang dikumpulkan tersebutdiatas dientry dalam
program SPSS, selanjutnya klik menu analyze dan pilih sub menu
Descriptives Statistics lalu Descriptives hingga muncul tampilan berikut
ini:
Namun, deskripsi tersebut diatas digunakan sebagai dasar perhitungan z-score yang
diperoleh. Selanjutnya buka tampilan data view dari tabel data. Hal yang akan
dijumpai sebagai berikut:
Untuk selanjutnya, hasil z-score inilah yang akan dipakai dasar analisis
cluster. Namun apabila data yang terkumpul tidak mempunyai variabilitas satuan,
maka proses analisis cluster dapat langsung dilakukan tanpa terlebih dahulu
melakukan transformasi atau standardisasi.
2.4.2 Analisis ClusterMetode K-Means Cluster (Non-Hirarkis)
Sebagaimana telah dijelaskan sebelumnya bahwa metode KMeans Cluster ini
jumlah cluster ditentukan sendiri. Olehkarena itu, berikut ini langkah-langkah yang
harus dilakukan dalam menggunakan metode K-Means Cluster dalam aplikasi
program SPSS. Perlu diingat bahwa bahan analisis bukan lagi data asli, namun data
hasil transformasi/standardisasi.
1. Dari tampilan data yang tertera (hasil standardisasi/transformasi), buka menu
Analyze, lalu pilih sub menu Classify dan pilih K-Means Cluster
hingga tampak pada layar sebagai berikut:
Clusters dalam hal ini diisi menurut jumlah cluster yang akan dibentuk dalam
penelitian yang dimaksud. Dalam hal ini diisi 3, berarti diharapkan akan
dibentuknya 3 cluster.
3. Kemudian klik mouse pada kotak Save hingga muncul tampilan seperti
berikut ini:
Output Final Cluster Centers tersebut diatas masih terkait dengan proses
standardisasi data sebelumnya, yang mengacu pada z-score dengan ketentuan
sebagai berikut :
Dimana :
X
: rata-rata populasi
: nilai standardisasi
: standar deviasi
Sebagai contoh, apabila ingin diketahui rata-rata jumlah yang tidak
Rumus nilai F :
F = MS Between/ MS
Within
Semakin besar nilai F dan (sig < 0,05), maka semakin besar perbedaan
variabel pada cluster yang terbentuk.
dengan satu atau lebih obyek yang paling mirip lainnya. Proses clustering ini pada
akhirnya akan menggumpal menjadi satu cluster besar yang mencakup semua
obyek. Metode ini disebut juga sebagai metode aglomerativ yang digambarkan
dengan dendogram.
Contoh kasus di atas akan dicoba untuk diselesaikan pula dengan metode
aglomerativ. Untuk itu, langkah-langkah yang harus dilakukan dalam aplikasi
program SPSS sebagai berikut :
1)
2)
3)
Selanjutnya klik mouse pada kotak Plots hingga muncul tampilan seperti
berikut ini :
5)
Tabel diatas menunjukkan matrik jarak antara variabel satu dengan variabel yang
lain. Semakin kecil jarak Euclidean, maka semakin mirip kedua variabel
tersebut sehingga akanmembentuk kelompok (cluster).
Cluster-1
Dalam cluster-1 ini berisikan Provinsi yang mempunyai jumlah lansia
yang tidak pernah sekolah dan memakan lauk pauk berprotein tinggi yang
lebih dari rata-rata populasi Provinsi yang diteliti. Hal ini terbukti dari
nilai positif. Dengan demikian, dapat diduga sekumpulan Provinsi yang
mempunyai Permasalahan Lansia terendah berada pada cluster-1
Cluster-2
Karakteristik Provinsi yang masuk dalam pengelompokan cluster-2 yaitu
Cluster-3
Sedangkan karakteristik Provinsi yang mengelompok pada cluster-3 adalah
keseluruhan instrumen penilai berada pada posisi diatas rata-rata populasi
Provinsi yang diteliti. Sehingga dapat diduga bahwa cluster-3 merupakan
pengelompokan Provinsi yang mempunyai Permasalahan Lansia tertinggi
Keenam variabel memiliki rata-rata lebih kecil dibanding cluster yang lain.
Anggotanya yaitu Provinsi Provinsi Sumatera utara, Sumatera barat, riau,
jambi, Sumatera selatan, bengkulu, lampung, jawa barat, jawa tengah, DI
BAB III
PENUTUP
3.1 Kesimpulan
Dari Studi Kasus penelitian untuk mengetahui pengelompokkan Pembentuk
Wilayah Pembinaan Untuk Permasalahan Lansia berdasarkan 6 variabel
menggunakan Metode Analisis Cluster, diketahui bahwa dari 24 Provinsi dapat
diklasifikasikan menjadi Provinsi yang mempunyai Permasalahan Lansia tertinggi
menengah, dan terendah. Dalam bidang Perencanaan Wilayah dan Kota,
klasifikasi pengelompokan Provinsi tersebut berfungsi Untuk merumuskan
Pembentuk Wilayah Pembinaan yang sesuai dengan karakteristik masing- masing
klasifikasi Provinsi. Salah satu hal yang penting untuk dilakukan dalam
merumuskan yaitu harus mengetahui karakteristik dari masing-masing klasifikasi
Provinsi. Setiap Provinsi memiliki permasalahannya sendiri, belum tentu
permasalahan antara satu Provinsi dengan Provinsi yang lain sama.
DAFTAR PUSTAKA
Dinda.
2015.
Penerapan
Analisis
Cluster
Dengan
Software.