“ANALISIS GEROMBOL”
OLEH :
KELOMPOK 3
JURUSAN MATEMATIKA
2019
ANALISIS GEROMBOL
A. Pengertian
Analisis gerombol adalah salah satu teknik analisis data yang digunakan untuk
mengelompokkan objek dalam satu gerombol sehingga diperoleh gerombol yang
memiliki objek objek dengan karakteristik yang sama sedangkan dengan
gerombol lain memiliki karakteristik yang berbeda.
Cluster atau ‘gerombol’ dapat diartikan ‘kelompok’ dengan demikian, pada
dasarnya analisis gerombol akan menghasilkan sejumlah gerombol (kelompok).
Analisis ini diawali dengan pemahaman bahwa sejumlah data tertentu
sebenarnya mempunyai kemiripan di antara anggotanya; karena itu,
dimungkinkan untuk mengelompokkan anggota-anggota yang ‘mirip’ atau
mempunyai karakteristik yang serupa tersebut dalam satu atau lebih dari satu
gerombol .
Analisis gerombol adalah analisis statistik peubah ganda yang digunakan
apabila ada n buah individu atau objek yang mempunyai p peubah dan n objek
tersebut ingin dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang
diamati sehingga individu atau objek yang terletak dalam satu gerombol
memiliki kemiripan sifat yang lebih besar dibandingkan dengan individu yang
terletak dalam gerombol lain . Oleh karena itu, homogenitas yang tinggi antar
anggota dalam gerombol dan heterogenitas (perbedaan) yang tinggi antar
gerombol yang satu dengan yang lainnya merupakan dua hal yang harus dimiliki
sebuah gerombol .
Penggerombolan ini memberikan manfaat, antara lain untuk eksplorasi data,
reduksi data, dan pelapisan data. Eksplorasi data dilakukan untuk memperoleh
gambaran tentang informasi yang ada dalam himpunan data tersebut sampai pada
pembangkitan hipotesis untuk struktur populasinya. Reduksi data akan dapat
mewakili seluruh anggota gerombol dengan suatu ringkasan gerombol tertentu,
sedangkan pelapisan data akan berguna dalam penarikan sampel atau
penggolongan tipe objek.
Analisis gerombol telah dipergunakan dalam pemasaran, seperti pembentukan
segmen berdasarkan data demografi, psychographic profiles, mengenali test
market cities, menentukan pasar yang mirip di berbagai negara dan mencari
kelompok yang mirip dari pembaca majalah untuk membantu di dalam pemilihan
media/majalah.
B. Tujuan dan Manfaat Analisis Gerombol
Tujuan analisis gerombol adalah:
1. Mengetahui ada tidaknya perbedaan yang nyata (significant) antar kelompok
yang terbentuk, dalam hal ini gerombol yang dihasilkan.
2. Melihat profil serta kecenderungan-kecenderungan dari masing-masing
gerombol yang terbentuk
3. Menggabungkan beberapa objek ke dalam Kelompok berdasarkan sifat
kemiripan atau sifat ketidakmiripan antar objek
4. Melihat jarak antar gerombol yang terbentuk
No Kota X1 X2 X3 X4 X5 X6
1. Membakukan data
Karena data sudah memiliki satuan yang sama maka tidak perlu dibakukan
lagi
2. Uji Multikolinearitas
Asumsi yang harus dipenuhi yaitu tidak terjadi multikolinieritas.
Multikolinearitas dapat dilihat dari korelasi antar peubah.
Jika P-value < α=0,05 maka keputusan tolak 𝐻0 yang artinya ada korelasi.
Jika P-value > α=0,05 maka keputusan terima 𝐻0 yang artinya tidak ada
korelasi.
Stat => basic statistics => correlation
Lalu muncul gambar seperti berikut:
Lalu diperoleh:
X1 X2 X3 X4 X5
X2 0,145
0,437
X3 0,513 0,204
0,003 0,271
Interpretasi :
Dari hasil otput minitab dapat dilihat bahwa, pada variabel X1 dengan X3 nilai
P-valuenya < α (0,05) menunjukkan bahwa terdapat korelasi antar peubah. Dengan
diketahui data tersebut bersifat multikolinearitas antar peubah. Maka dilakukan
analisis komponen utama terhadap data dengan tujuan untuk memperoleh data
yang tidak saling berkorelasi dengan tidak mengubah data asal.
3. Analisis Komponen Utama
Principal Component Analysis: X1; X2; X3; X4; X5; X6
Interpretasi :
Dengan melihat nilai eigennya dapat ditentukan komponen utamanya yaitu
jika nilai eigennya besar dari 1. Atau bisa juga dilihat nilai comulativenya yaitu
jika nilai comulativenya lebih besar dari 80%. Komponen utama yang memenuhi
yaitu PC1, PC2, PC3 dan PC4. Berarti PC1-PC4 mampu mewakili total kergaman
data. Jadi hanya 4 score komponen utama yang digunakan dalam analisis
selanjutnya yaitu score1-score4.
4. Penggerombolan
Selanjutnya penggerombol dengan metode hierarki. Dalam hal ini, digunakan
software minitab untuk menemukan analisis gerombol tersebut. Untuk
mempermudah dalam penggerombolan kabupaten/kota berdasarkan dimensi
kualitas kesehatan dan ekonomi di Jawa Tengah masing-masing kabupaten/kota
dikodekan dengan angka-angka berurut seperti berikut:
No Kota
1 Padang
2 Payakumbuh
3 Pariaman
4 Palembang
5 Jakarta
6 Bogor
7 Bandung
8 Bekasi
9 Bali
10 Medan
11 Maluku
12 Riau
13 Pekanbaru
14 Jambi
15 Aceh
16 Makassar
17 Malang
18 Banten
19 Manado
20 Banjarmasin
21 Surabaya
22 Surakarta
23 Tegal
24 Batam
25 Pontianak
26 Samarinda
27 Pare
28 Palu
29 Brebes
30 Lombok
31 Monokwari
Cluster Analysis of Observations: SCORE1; SCORE2; SCORE3; SCORE4
Number
of obs.
Number of Similarity Distance Clusters New in new
Step clusters level level joined cluster cluster
1 30 91,6217 0,51787 2 22 2 2
2 29 90,3840 0,59437 4 5 4 2
3 28 88,9806 0,68112 14 26 14 2
4 27 86,7409 0,81956 19 25 19 2
5 26 85,4821 0,89737 4 6 4 3
6 25 85,0188 0,92600 2 13 2 3
7 24 85,0093 0,92659 12 17 12 2
8 23 84,5683 0,95385 14 19 14 4
9 22 82,2927 1,09451 4 21 4 4
10 21 80,9080 1,18010 2 24 2 4
11 20 80,9044 1,18032 12 14 12 6
12 19 80,5840 1,20013 4 23 4 5
13 18 79,9010 1,24234 4 15 4 6
14 17 79,5099 1,26651 4 16 4 7
15 16 79,0550 1,29463 4 12 4 13
16 15 78,8010 1,31033 11 20 11 2
17 14 78,5872 1,32355 4 31 4 14
18 13 77,6666 1,38045 1 2 1 5
19 12 76,4425 1,45611 4 11 4 16
20 11 76,2438 1,46840 4 28 4 17
21 10 75,6289 1,50640 9 10 9 2
22 9 75,1271 1,53742 4 7 4 18
23 8 74,1478 1,59795 3 4 3 19
24 7 73,2791 1,65165 1 29 1 6
25 6 73,1468 1,65982 1 8 1 7
26 5 71,9761 1,73219 1 3 1 26
27 4 70,0143 1,85345 1 18 1 27
28 3 68,6825 1,93577 1 9 1 29
29 2 67,5255 2,00729 1 27 1 30
30 1 62,8972 2,29336 1 30 1 31
Final Partition
Number of clusters: 1
Average Maximum
Within distance distance
Number of cluster sum from from
observations of squares centroid centroid
Cluster1 31 148,950 2,09206 4,16622
Interpretasi :
Dari hasil output dapat dilihat tahap penggerombolan pertama jumlah
gerombol adalah 30. Dua objek yang dipasangkan pertama kali adalah objek 2 dan
22 karena pasangan ini memiliki koefisisen jarak paling kecil 0,51787 , dan nama
cluster barunya adalah 2. Pada tahap kedua objek yang memiliki koefisisen jarak
paling kecil kedua yaitu 0,59437 adalah objek 4 dan 5 dengan nama cluster
barunya 4. Demikian seterusnya, pada setiap klaster berkurang satu cluster
sehingga pada tahap terakhir semua objek menjadi satu claster.
Hasil dari tahap-tahap pembentukan gerombol di atas dapat disajikan dengan
Dendogramnya, seperti :
Dendrogram
Single Linkage; Euclidean Distance
2.29
1.53
Distance
0.76
0.00
1 2 22 13 24 29 8 3 4 5 6 21 23 15 16 12 17 14 26 19 25 31 11 20 28 7 18 9 10 27 30
Observations
Interpretasi :
Menggunakan Metode Hirearki dengan single linkage .Metode ini
mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu.Dari
hasil output diatas dapat dilihat bahwa dua objek yang dipasangkan pertama kali
adalah objek 2 dan 22. Objek kedua yang digabungkan adalah objek 4 dan 5
demikian seterusnya, sama dengan hasil cluster diatas. Bila kita ingin membagi
menjadi 4 gerombol maka diperoleh :
Gerombol I adalah objek 1, 2, 22, 13, 24, 29, 8, 3, 4, 5, 6, 21, 23, 15, 16, 12,
17, 14, 26, 19, 25, 31, 11, 20, 28, 7, 18 yang mempunyai jarak terdekat atau
memiliki karakteristik yang sama artinya Tingkat kemiskinan berdasarkan dimensi
kualitas kesehatan dan ekonomi di Kota tersebut memiliki kemiripan yang sama.
Gerombol II adalah objek 9 dan 10 yang mempunyai jarak terdekat atau
memiliki karakteristik yang sama artinya Tingkat kemiskinan berdasarkan dimensi
kualitas kesehatan dan ekonomi di Kota tersebut memiliki kemiripan yang sama.
Gerombol III adalah objek 27, artinya pemalang tidak memiliki kemiripan
dengan kota lainnya.
Gerombol IV adalah objek 30 yaitu Kota Lombok, artinya Kota Lombok tidak
memiliki kemiripan dengan kota lainnya.
Dari hasil penggerombolan tersebut terlihat bahwa ada 2 data yaitu (Kota Pare
dan Kota Lombok) yang tidak dapat dijadikan satu kelompok dengan data
manapun. Dengan kata lain Kota Pare dan Kota Lombok merupakan data oulier.