Yuli Rochmawati
175090501111003 (05)
Perolehan Data
• Data didapat pada plattform website Badan Pusat Statistik
(BPS) Jawa Timur, sumber: https:/jatim.bps.go.id/
• Terdiri dari 3 variabel yang berkaitan dengan Indeks
Pembangunan Manusia (IPM) pada 38 kota/kabupaten di
Jawa Timur pada tahun 2017.
Peubah keterangan Satuan Skala
Output
pada
Console
• Selanjutnya, mengukur multikolinieritas (salah satu
asumsi dalam analisis cluster) dan jarak pada data.
multikol=cor(DATA_NEW)
multikol
jarak=dist(DATA_NEW)
jarak
Perhitunagan jarak antar objek pada perintah R, default memakai jarak euclidean
Plot Dendogram
Gambar tersebut
merupakan output dari plot
dendogram yang menunjukkan
bahwa terdapat
3 cluster dilihat dari jarak yang
terdekat antar objek. Dari plot
dendogramnya didapatkan
hasil cluster 1 terdapat 3
wilayah dan cluster 2 terdapat
2 wilayah serta cluster 3
terdapat 33 wilayah.
Hasil Penggelompokan
Wilayah
Fviz.cluster: perintah untuk plot cluster yang terbentu pada metode k-means
Hasil pengclusteran
Hasil Penggelompokan Wilayah
Pada k=3
banyak
Metode Non - Hierarki anggota dan
karateristik
tiap cluster
berbeda
K: banyak cluster
Kesimpulan
• Dari penggunaan 2 metode yaitu metode hierarki menggunakan
jarak euclidean pada metode average linkage dan non-hierarki
degan metode k-means, didapatkan hasil yang berbeda yaitu pada
anggota cluster dan karateristik cluster dengan banyak cluster
sebesar 3.
• Pada pendekatan hierarki terdapat 2 kota/kabupaten dengan IPM
yang tinggi/kota maju sedangkan metode non-hierarki terdapat 6
kota/kabupaten dengan IPM yang tinggi.
• Pada pendekatan hierarki karateristik cluster dengan anggota IPM
tinggi hanya memiliki 2 variabel (X2 & X3) dengan rata-rata
berkategori tinggi sedangkan pendekatan non-hierarki karateristik
cluster dengan anggota IPM tinggi, seluruh variabel (X1, X2 & X3)
memiliki rata-rata berkategori tinggi.
Daftar Pustaka
Everitt, B., & Hothorn, T. 2011. An introduction to applied multivariate analysis with R.
Berlin: Springer (Science & Business Media).
Härdle, W., & Simar, L. 2011. Applied multivariate statistical analysis. Berlin: Springer
(Science & Business Media).
Kassambara, A. 2017. Practical guide to cluster analysis in R: Unsupervised machine
learning (Vol. 1). Publikasi oleh: STHDA
Mattjik, A. A., Sumertajaya, I., Wibawa, G. N. A., & Hadi, A. F. .2011. Sidik peubah ganda
dengan menggunakan SAS. Bogor: IPB Press