Laprak 7 SMT C - Syinta Nuri Mashita - 16611128

Kelas C
LAPORAN PRAKTIKUM
Statistika Multivariat Terapan
Modul 7 : Analisis Cluster Non Hierarki
Nomor Tanggal Tanda Tangan

Nama Praktikan Praktikan
Mahasiswa Kumpul
Syinta Nuri Mashita 16611128 08/05/2019
Tanggal Tanda tangan

Nama Penilai Nilai
Koreksi Asisten Dosen
Emma Aulia Dewi
Nestria Agista
Muhammad Muhajir
S.Si., M.Sc
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS ISLAM INDONESIA
YOGYAKARTA
2019
i
Daftar Isi
Halaman sampul ....................................................................................................... i

Daftar Tabel ........................................................................................................... iii
Daftar Gambar ........................................................................................................ iii
1 Pendahuluan ......................................................................................................... 1
1.1 Analisis Cluster ........................................................................................ 1
1.2 Definisi Analisis Cluster ............................................................................... 1
1.3 Metode Analisis Cluster................................................................................ 1
1.4 Algoritma K-Means Clustering ..................................................................... 2
2 Deskripsi Kerja ..................................................................................................... 4
2.1 Studi Kasus ............................................................................................... 4
2.2 Langkah Kerja .......................................................................................... 6
3 Pembahasan .......................................................................................................... 9
3.1 Data Frame ............................................................................................... 9
3.2 Statisik Deskriptif ................................................................................... 10
3.3 K-Means Clustering K=3 ....................................................................... 10
3.4 Klaster Kelompok Optimal .................................................................... 15
3.5 Rekomendasi Hasil Analisis ................................................................... 17
4 Penutup ............................................................................................................... 20
5 Daftar Pustaka .................................................................................................... 21
ii
Daftar Tabel
Tabel 2.1. Data Kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan

Kualitas Ekonomi di Jawa Tengah Tahun 2015 ............................................. 4
Tabel 3.1. Hasil cluster K=3 ................................................................................. 14
Tabel 3.3. Tabel hasil Cluster ............................................................................... 18
Daftar Gambar
Gambar 3.1 Data Frame......................................................................................... 9

Gambar 3.2 Summary data .................................................................................. 10
Gambar 3.3 Output Scaliing Data ....................................................................... 10
Gambar 3.4. Output distance ............................................................................... 11
Gambar 3.5 Output plot distance ......................................................................... 11
Gambar 3.6 Output klaster................................................................................... 12
Gambar 3.7 Output klaster means ....................................................................... 12
Gambar 3.8 Output komponen klaster................................................................. 13
Gambar 3.9 Hasil Klaster .................................................................................... 13
Gambar 3.10 Output visualisai kelompok ........................................................... 14
Gambar 3.11 Output metode wss ........................................................................ 15
Gambar 3.12 Output metode silhouette ............................................................... 16
Gambar 3.13 Output metode gap_stat................................................................. 16
Gambar 3.14 Profilisasi kategori ......................................................................... 17
iii
1 Pendahuluan
1.1 Analisis Cluster
Sama dengan analisis factor, analisis cluster (cluster analysis) termasuk

pada Interdependes Techniques. Namun ada perbedaan mendasar di antara kedua
alat analisis multivariate ini. Jika analisis factor (R factor analysis) bertujuan
mereduksi variabel, analisis cluster (Q factor analysis) lebih bertujuan
mengelompokkan isi variabel, walaupun bisa juga disertai dengan pengelompokan
variabel. (Hidayat, 2014)
1.2 Definisi Analisis Cluster

Analisis cluster adalah teknik multivariat yang mempunyai tujuan utama
untuk mengelompokkan objek-objek/cases berdasarkan karakteristik yang
dimilikinya. Analisis cluster mengklasifikasi objek sehingga setiap objek yang
memiliki sifat yang mirip (paling dekat kesamaannya) akan mengelompok
kedalam satu cluster (kelompok) yang sama.
Secara logika, cluster yang baik adalah cluster yang mempunyai:
1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster

(within-cluster).
2. Heterogenitas (perbedaan) yang tinggi antar cluster yang satu dengan cluster
yang lainnya (between-cluster).
1.3 Metode Analisis Cluster
1. Hirarchial Methode
Metode ini memulai pengelompokan dengan dengan dua atau lebih objek
yang mempunyai kesamaan paling dekat. Kemudian proses diteruskan ke
objek lain yang mempunyai kedekatan kedua. Demikian seterusnya sehingga
cluster akan membentuk semacam “pohon”, di mana ada hirarki (tingkatan)
1
yang jelas antar objek, dari yang paling mirip sampai paling tidak mirip.
Secara logika semua objek pada akhirnya akan membentuk sebuah
cluster. Dendogram biasanya digunakan untuk membantu memperjelas
proses hirarki tersebut.
2. Non-Hirarchial Methode
Berbeda dengan metode hirarki, metode ini justru dimulai dengan terlebih
dahulu jumlah cluster yang diinginkan (dua cluster, tiga cluster atau yang
lain). Setelah jumlah cluster diketahui, baru proses cluster dilakukan tanpa
mengikuti proses hirarki. Metode ini biasa disebut dengan K-Means Cluster.
1.4 Algoritma K-Means Clustering
K-means merupakan salah satu metode clustering non hirarki yang berusaha
mempartisi data yang ada ke dalam bentuk satu atau lebih cluster. Metode ini
mempartisi data ke dalam cluster sehingga data yang memiliki karakteristik yang
sama dikelompokkan ke dalam satu cluster yang sama dan data yang mempunyai
karateristik yang berbeda di kelompokan ke dalam cluster yang lain. Secara umum
algoritma dasar dari K-Means Clustering adalah sebagai berikut : (Mauliadinata,
2013).
1. Tentukan jumlah cluster
2. Alokasikan data ke dalam cluster secara random
3. Hitung centroid/rata-rata dari data yang ada di masing-masing cluster
4. Alokasikan masing-masing data ke centroid/rata-rata terdekat
5. Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau
apabila perubahan nilai centroid, ada yang di atas nilai threshold yang
ditentukan atau apabila perubahan nilai pada objective function yang
digunakan di atas nilai threshold yang ditentukan
Distance space digunakan untuk menghitung jarak antara data dan centroid.
Adapun persamaan yang dapat digunakan salah satunya yaitu Euclidean Distance
Space. Euclidean distance space sering digunakan dalam perhitungan jarak, hal ini
2
dikarenakan hasil yang diperoleh merupakan jarak terpendek antara dua titik yang
diperhitungkan. Adapun persamaannya adalah sebagai berikut :
2
𝑑𝑖𝑗 = √∑𝑝𝑘=1{𝑥𝑖𝑘 − 𝑥𝑗𝑘 } …………………………………… (1.1)
Dimana :
dij = Jarak objek antara objek i dan j
P = Dimensi data
Xik = Koordinat dari obyek i pada dimensi k
Xjk = Koordinat dari obyek j pada dimensi k.
3
2 Deskripsi Kerja
2.1 Studi Kasus
Pada laporan ini, praktikan akan melakukan analisis dengan menggunakan

software R untuk menyelesaikan studi kasus di bawah ini:
1. Buatlah pengelompokan Kabupaten/Kota di Provinsi Jawa Tengah
berdasarkan kemiskinan menurut dimensi kualitas kesehatan dan kualitas
ekonomi ke dalam 3 kelompok, serta deskripsikan hasilnya!
2. Sebagai seorang statistisi, berapa banyak kelompok yang akan saudara
bentuk terhadap Kabupaten/Kota di Provinsi Jawa Tengah berdasarkan data
Kemiskinan menurut dimensi kualitas kesehatan dan kualitas ekonomi
tersebut ? Jelaskan alasannya!
3. Berikan rekomendasi terhadap Pemerintah Provinsi Jawa Tengah terutama
Dinas Sosial Provinsi Jawa Tengah berasarkan hasil analisis saudara!
Tabel 2.1. Data Kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan

Kualitas Ekonomi di Jawa Tengah Tahun 2015
No Kabupaten X1 X2 X3 X4 X5 X6
1 Cilacap 43.63 28.67 82.2 1.53 2.74 62.51
2 Banyumas 34.95 17.71 95.7 2.5 1.92 49.08
3 Purbalingga 35.95 17.35 52.7 2.7 5.54 54.94
4 Banjarnegara 24.49 14.48 44.9 1.5 4.62 59.18
5 Kebumen 22.47 23.37 52.5 1.35 4.51 60.59
6 Purworejo 25.91 46.05 48.2 1.87 2.54 48.79
7 Wonosobo 16.79 29.84 36.6 2.9 3.77 55.71
8 Magelang 35.82 63.66 70 2.76 1.65 61.02
9 Boyolali 37.47 66.6 67.4 2.3 6.98 44.71
10 Klaten 43.94 78.1 52.1 1.98 5.83 57.82
11 Sukoharjo 43.31 23.45 42.4 1.8 1.7 64.21
12 Wonogiri 26.57 22.06 50.3 0.98 2.54 67.49
13 Karanganyar 46.54 27.1 56.9 2.55 2.4 44.89
14 Sragen 25.82 15.82 65.2 0.65 2.7 54.03
4
15 Grobogan 27.99 43.14 51.6 1.84 6.12 57.62
16 Blora 18.11 32.19 43.4 1.54 5.62 48.94
17 Rembang 20 23.8 42.2 0.75 0.87 67.33
18 Pati 39.66 36.78 79 0.78 5.43 43.41
19 Kudus 26.39 20.01 52.7 0.45 2.67 42.76
20 Jepara 37.22 15.82 64.1 0.88 0.89 64.11
21 Demak 26.77 18.57 34.9 0.65 6.01 68.83
22 Semarang 48.71 37.57 70.9 2.6 1.65 47.66
23 Temanggung 21.43 18.06 34.7 1.95 1.99 43.05
24 Kendal 46.23 21.68 72.8 1.5 2.35 49.1
25 Batang 20.93 31.57 41 0.78 1.83 44.14
26 Pekalongan 28.34 36.62 42.2 0.58 1.55 53.61
27 Pemalang 20.35 62.76 56 0.48 6.02 58.74
28 Tegal 20.81 68.49 63.4 0.98 0.39 69.66
29 Brebes 54.5 38.51 65.4 0.47 1.45 40.23
30 Surakarta 37.8 77.36 88 0.23 0.41 77.46
31 Salatiga 38.71 57.7 36.2 0.53 0.55 60.86
Terdiri dari 6 aspek pengukuran sebagai berikut :

 X1 (presentase tumah tangga miskin yang luas lantai bangunan tempat
tinggalnya kurang dari 32 m2),
 X2 (Presentase rumah tangga miskin yang jenis lantai bangunan tempat
tinggalnya terbuat dari tanah/kayu berkualitas rendah per kecamatan),
 X3 (Presentase rumah tangga miskin yang sumber air minumnya berasal
dari sumur/mata air tidak terlindung/sungai per kecamatan),
 X4 (Presentase rumah tangga miskin yang tidak mempunyai jenis atap
dari genteng per kecamatan),
 X5 (Presentase rumah tangga miskin yang tidak sanggup membayar
biaya pengobatan di puskesmas per kecamatan),
 X6 (Presentase rumah tangga miskin yang menggunakan bahan bakar
untuk memasak sehari-hari adalah kayu bakar per kecamatan).
5
2.2 Langkah Kerja
Adapun langkah-langkah dalam menyelesaikan diatas dengan menggunakan
software RStudio yaitu sebagai berikut:
1. Membuka aplikasi RStudio pada desktop.
2. Pada laporan ini, praktikan akan melakukan input data ke dalam aplikasi
RStudio dengan
datasyinta<-read.delim("lipboard")
datasyinta
3. Pada laporan ini, praktikan akan melakukan input data ke dalam aplikasi
RStudio dengan menggunakan syntax read delim. Adapun data yang
digunakan merupakan data data Kemiskinan berdasarkan Dimensi
Kualitas Kesehatan dan Kualitas Ekonomi di Jawa Tengah Tahun 2015,
dengan menggunakan syntax berikut:
datasyinta<-read.delim("clipboard")
datasyinta
4. Melakukan eksplorasi atau analisis statistika deskriptif untuk mengetahui

apakah ada data yang hilang (missing) atau tidak dengan menggunakan
summary pada R dengan syntax:
summary(datasyinta)
5. Kemudiann praktikan memulai melakukan scalling data dengan syntax

seperti berikut:
#scalling data
sapply(datasyinta,var)
rge<-sapply(datasyinta,function(x) diff(range(x)))
data1<-sweep(datasyinta,2,rge,FUN="/")
sapply(data1,var)return(structure(list(statistic=chis
q, parameter=df, p.value=p.value, method=method,
data.name=data.name), class="htest"))}
6
6. Selanjutnya praktikan ingin menghitung nilai korelasi jarak yang
sebelumnya harus menjalankan package factoextra terlebih dahulu
dengan syntax seperti berikut.
library(factoextra)
distance<-get_dist(data1)
distance
7. Setelah itu praktikan akan membuat plot dari korelasi jarak yang
diperoleh dengan syntax seperti berikut.
fviz_dist(distance, gradient = list(low="white",

mid="green", high="red"))
8. Selanjutnya praktikan melakuakn analisis K-means clustering dengan

menggunakan K atau centers yaitu 3, berikut ini adalah syntaxnya.
klaster<-kmeans(data1,centers = 3,nstart = 25)

klaster
klaster$cluster
klaster$centers
klaster$totss
klaster$withinss
klaster$tot.withinss
klaster$betweenss
klaster$size
k=data.frame(klaster$cluster)
k
View(k)
9. Selanjutnya membuat plot kluster dari mesin kluster dengan k=3 dengan
syntax sebagai berikut.
k3<-kmeans(data1, centers = 3, nstart = 25)
k3
p2<-fviz_cluster(k3,geom = "point", data =
data1)+ggtitle("k = 3")
p2
10. Kemudian membuat syntax determining optimal cluster untuk

menyelesaikan soal nomor 2 pada studi kasus.
7
library(gridExtra)
grid.arrange(p1,p2,p3,nrow=2)
fviz_nbclust(data1,kmeans,method = "wss")
fviz_nbclust(data1,kmeans,method =
"silhouette")
fviz_nbclust(data1,kmeans,method =
"gap_stat")<-kmeans(data1, centers = 3,
nstart = 25)
11. Setelah semua syntax dijalankan maka akan muncul output pada jendela
console RStudio yang kan dibahas lebih mendalam pada bab pembahasan.
8
3 Pembahasan
3.1 Data Frame

Pada praktikum kali ini data yang digunakan adalah data data Kemiskinan
berdasarkan Dimensi Kualitas Kesehatan dan Kualitas Ekonomi di Jawa Tengah
Tahun 2015. Terdapat 31 kabupaten pada data tersebut dengan 6 variabel yaitu X1
(presentase tumah tangga miskin yang luas lantai bangunan tempat tinggalnya
kurang dari 32 m2), X2 (Presentase rumah tangga miskin yang jenis lantai bangunan
tempat tinggalnya terbuat dari tanah/kayu berkualitas rendah per kecamatan), X3
(Presentase rumah tangga miskin yang sumber air minumnya berasal dari
sumur/mata air tidak terlindung/sungai per kecamatan), X4 (Presentase rumah
tangga miskin yang tidak mempunyai jenis atap dari genteng per kecamatan), X5
(Presentase rumah tangga miskin yang tidak sanggup membayar biaya pengobatan
di puskesmas per kecamatan), X6 (Presentase rumah tangga miskin yang
menggunakan bahan bakar untuk memasak sehari-hari adalah kayu bakar per
kecamatan). Berikut ini adalah data yang akan dilakukan analisis kelompok.
Gambar 3.1 Data Frame

9
3.2 Statisik Deskriptif
Sebelum melakukan analisis lebih jauh, alangkah lebih baiknya praktikan

terlebih dulu mengetahui gambaran umum dari data yang akan dianalisis, dengan
menggunakan salah satu metode statistika yaitu statitika deskriptif. Dari statistika
deskriptif tersebut kita juga dapat mengetahui apakah terdapat nilai missing pada
data tersebut. Berikut ini adalah statistika deskriptif dari data tersebut.
Gambar 3.2 Summary data
Gambar 3.2 di atas merupakan summary data yang berisi tentang mean (rata-
rata) dan ukuran persebaran diketahui informasi nilai terendah data (min), nilai
quartil pertama (1st Qu), Nilai Median atau nilai tengah, nilai rata-rata (mean), nilai
kuartil ketiga (3rd Qu), nilai maksimum (max), dan informasi NA’S. Dari gambar
di atas tidak terdapat keterangan NA yang artinya data yang diperoleh praktikan
tidak mengandung NA atau data missing.
3.3 K-Means Clustering K=3
Sebelum melakukan analisis clusternya praktikan melakukan scalling data

terlebih dahulu. Berikut ini adalah outputnya.
Gambar 3.3 Output Scaliing Data

Fungsi dari scalling data yaitu untuk menurunkan nilai variansi dari setiap
objek. Berdasarkan output di atas dapat dilihat bahwa variansi awal dari setiap
objek sangat tinggi yang kemudian setelah dilakukan scalling maka variansi dari
setiap objek menjadi kecil yaitu untuk X1 adalah 0.07597697, X2 adalah
0.09471107, X3 adalah 0.07013856, X4 adalah 0.09429351, X5 adalah
10
0.09187595, dan X6 adalah 0.06624633. Kemudian berikut ini adalah output dari
jarak korelasi untuk setiap objek,
Gambar 3.4. Output distance

Berdasarkan gambar diatas (gambar 3.4) merupakan hasil korelasi jarak.
Perhitungan jarak pada cluster non hierarki berbeda dengan perhitungan korelasi.
Apabila jarak obyek wilayah bertemu dengan wilayah itu sendiri maka hasil
perhitungan jaraknya adalah 0. Berdasarkan hasil output diatas dapat diketahui
bahwa jarak antara kabupaten ke 2 yaitu Banyumas ke kabupaten ke-1 yaitu Cilacap
adalah 0,6397124 dan seterusnya. Setelah didapatkan korelasi jarak daris setiap
objek maka hasil tesebut dapat dibuat plot dengan output sebagai berikut.
Gambar 3.5 Output plot distance

11
Berdasarkan gambar diatas merupakan hasil plot korelasi jarak. Plot diatas
merupakan visualisasi data yang disajikan untuk menghitung jarak. Berdasarkan
plot diatas dapat diketahui bahwa untuk skala nilai jarak dibedakan berdasarkan
warna yaitu dengan nilai 0 , 0.5 , 1.00 , dan 1.5. Jarak yang bernilai 0 yaitu berwarna
putih yang maksudnya yaitu jarak antara objek dengan objeknya sendiri ada pada
skala 0 atau tidak mempunyai jarak.
Kemudian membuat cluster dengan K-Means. Menggunakan k atau cluster
sebanyak 3 dan iterasi sebanyak 25. Berikut ini adalah output-outputnya.
Gambar 3.6 Output klaster
Gambar 3.7 Output klaster means

Berdasarkan gambar diatas (gambar 3.5) merupakan hasil rata-rata cluster.
Berdasarkan hasil output diatas dapat diketahui bahwa output diatas merupakan
hasil dari rata-rata setiap cluster. Pada cluster 1 rata-rata X1 yang dihasilkan yaitu
0.8602493, rata-rata X2 adalah1.0664885, rata-rata X3 adalah 1.0251366, rata-rata
X4 adalah 0.2172285 , rata-rata X5 adalah 0.06828528, dan rata-rata X6
adalah1.86211. Pada cluster 2 rata-rata X1 yang dihasilkan yaitu 0.6752617, rata-
rata X2 adalah 0.4416018, rata-rata X3 adalah 0.7742527, rata-rata X4 adalah
0.4615554, rata-rata X5 adalah 0.49941980, dan rata-rata X6 adalah 1.515429, dan
sama halnya dengan cluster yang ketiga.
12
Gambar 3.8 Output komponen klaster
Berdasarkan gambar diatas yang merupakan hasil analisis K-Means
Clustering. Berdasarkan hasil output diatas dapat diketahui withinss yang nilai
withinss adalah jarak obyek didalam cluster yaitu pada cluster 1 jaraknya
0.6915699, cluster 2 jaraknya 4.6874782, dan cluster 3 jaraknya 4.0842544, jarak
obyek didalam cluster harus berdekatan agar membentuk anggota cluster yang
berkarakteristik hampir sama. Sedangkan nilai betweens sebesar 456131676 adalah
jarak obyek antar cluster atau jarak obyek diluar claster. Nilai betweens sebaiknya
jauh agar membentuk cluster-cluster yang tidak saling tumpang tindih. Size
merupakan jumlah objek dalam suatu klaster, klaster pertama ada 3 objek, klaster
kedua ada 17 objek dan klaster ketiga ada 11 objek. Berikut adalah hasil
pengelompokkan anggota cluster.
Gambar 3.9 Hasil Klaster

13
Gambar 3.10 Output visualisai kelompok
Tabel 3.1. Hasil cluster K=3
Kabupaten Kelompok Klaster

Tegal 1
Surakarta 1
Salatiga 1
Banjarnegara 2
Kebumen 2
Purworejo 2
Wonosobo 2
Sukoharjo 2
Wonogiri 2
Sragen 2
Grobogan 2
Blora 2
Rembang 2
Kudus 2
Jepara 2
Demak 2
Temanggung 2
Batang 2
Pekalongan 2
Pemalang 2
Cilacap 3
Banyumas 3
14
Purbalingga 3
Magelang 3
Boyolali 3
Klaten 3
Karanganyar 3
Pati 3
Semarang 3
Kendal 3
Brebes 3
3.4 Klaster Kelompok Optimal

Selanjutnya praktikan akan melakukan analisis untuk menentukan nilai “k”
optimal dengan menggunakan tiga metode yang berbeda, yaitu metode wss,
silhoutten, dan gap_stat. dimana sebelumnya praktikann sudah menentukan nilai
“k” nya terlebih dahulu karena metode k-means merupakan metode klatering non
hirarki yang mana metode non hirarki penentuan nilai k nya tererah kepada
praktikan/peneliti. Berikut output ketiga metode nya :
Gambar 3.11 Output metode wss

Dari gambar 3.11, untuk penentuan nilai “k” dengan metode wss dengan
melihat grafik yang pergerakannya landai pertama setelah curam. Dari gambar
dapat dilihat baha grafik yang pergerakannya landai pertama yaitu pada angka 6-7,
berarti nilai “k” menurut metode wss adalah 6. Total nilai k nya yaitu 10.
15
Kemudian praktikan menganalisis dengan metode silhouette, didapatkan
hasil seperti berikut.
Gambar 3.12 Output metode silhouette

Pada metode silhouette, penentuan nilai “k” nya dilihat dari garis tertinggi
atau melihatnya dengan melihat garis yang paling optimum, dari gambar 3.10
silhoutte k yang optimum adalah 6. Sehingga untuk metode silhouette nilai “k” nya
yaitu 3.
Kemudian praktikan menganalisis dengan metode gap_stat, didapatkan hasil
seperti berikut :
Gambar 3.13 Output metode gap_stat
16
Pada gambar 3.12 dapat diketahui output metode gap_stat, dimana dengan
metode ini penentuan nilai “k” nya dilihat dari garis yang dihubungkan dengan garis
putus-putus. Garis yang dimaksud pada hasil metode gap_stat menunjukkan di
angka 1, hal ini berarti bahwa dengan menggunakan metode gap_stat nilai “k” nya
yaitu 1.
Setelah didapatkan nilai “k” dari tiga metode yang telah dilakukan,
menunjukkan baha metode wss dan metode silhouette nilai “k” nya 6, sedangkan
untuk metode gap_stat nilai “k” nya yaitu 1. Karena hasilnya 2:1 maka digunakan
nilai “k” nya yaitu 6. Sehingga akan dibentuk 6 kelompok dari data data
Kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan Kualitas Ekonomi di
Jawa Tengah Tahun 2015.
3.5 Rekomendasi Hasil Analisis

Setelah diketahui seluruh kelompok maka selanjutnya adalah membuat
profilisasi dari setiap metode. Profilisasi merupakan penggambaran karakteristik
masing-masing cluster untuk menjelaskan bagaimana mereka bisa berbeda secara
relevan pada tiap dimensi. Berikut ini adalah profilisasi dari kedua metode
Gambar 3.14 Profilisasi kategori

Berdasarkan hasil profilisasi di atas didapatkan tiga kategori kelompok
tingkat kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan Kualitas
Ekonomi di Jawa Tengah Tahun 2015 yaitu kelompok 1 yang menjadi kategori
sedang yaitu Kabupaten, Tegal, Surakarta dan Salatiga. Kelompok 2 menjadi
kelompok dengan kategori tingkat kemiskinan rendah yaitu Kabupaten
Banjarnegara, Kebumen, Purworejo, Wonosobo, Sukoharjo, Wonogiri, Sragen,
17
Grobogan, Blora, Rembang, Kudus, Jepara, Demak, Temanggung, Batang,
Pekalongan, dan Pemalang. Kelompok 3 menjadi kelompok dengan kategori
tingkat kemiskinan tinggi yaitu Kabupaten Cilacap, Banyumas, Purbalingga,
Magelang, Boyolali, Klaten, Karanganyar, Pati, Semarang, Kendal, dan Brebes.
Tabel 3.2. Tabel hasil Cluster
Cluster Kategori Kabupaten
1 Sedang Tegal
Surakarta
Salatiga
2 Rendah Banjarnegara
Kebumen
Purworejo
Wonosobo
Sukoharjo
Wonogiri
Sragen
Grobogan
Blora
Rembang
Kudus
Jepara
Demak
Temanggung
Batang
Pekalongan
Pemalang
3 Tinggi Cilacap
Banyumas
Purbalingga
Magelang
Boyolali
Klaten
Karanganyar
Pati
Semarang
Kendal
Brebes
18
Dari hasil pengkategorian berdasarkan hasil profilisasi rata-rata setiap
variabel maka Pemerintah Daerah dapat melihat bagaimana setiap kabupaten
berada pada kategori tingkat kemiskinan rendah, sedang, dan tinggi. Pada
kelompok kabupaten dengan tingkat kemiskinan tinggi, pemerintah dapat
memprioritaskan kabupaten-kabupaten tersebut agar turunnya tingkat kemiskinan
pada daerah tersebut dengan cara memberikan lapangan kerja, bantuan untuk rakyat
miskin, modal bagi UMKM, dan masih banyak lagi agar dapat terwujudnya
kesejahteraan yang merata di seluruh kabupaten di Jawa Tengah.
19
4 Penutup
Berdasarkan pembahasan yang sudah di bahas pada bab sebelumnya, maka

didapatkan kesimpulan sebagai berikut :
1. Perbandingan nilai “k” dari tiga metode yang telah dilakukan,
menunjukkan baha metode wss dan metode silhouette nilai “k” nya 6,
sedangkan untuk metode gap_stat nilai “k” nya yaitu 1. Karena hasilnya
2:1 maka digunakan nilai “k” nya yaitu 6. Sehingga akan dibentuk 6
kelompok dari data data Kemiskinan berdasarkan Dimensi Kualitas
Kesehatan dan Kualitas Ekonomi di Jawa Tengah Tahun 2015.
2. Berdasarkan hasil profilisasi di atas didapatkan tiga kategori kelompok
tingkat kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan Kualitas
Ekonomi di Jawa Tengah Tahun 2015 yaitu kelompok 1 yang menjadi
kategori sedang yaitu Kabupaten, Tegal, Surakarta dan Salatiga. Kelompok
2 menjadi kelompok dengan kategori tingkat kemiskinan rendah yaitu
Kabupaten Banjarnegara, Kebumen, Purworejo, Wonosobo, Sukoharjo,
Wonogiri, Sragen, Grobogan, Blora, Rembang, Kudus, Jepara, Demak,
Temanggung, Batang, Pekalongan, dan Pemalang. Kelompok 3 menjadi
kelompok dengan kategori tingkat kemiskinan tinggi yaitu Kabupaten
Cilacap, Banyumas, Purbalingga, Magelang, Boyolali, Klaten,
Karanganyar, Pati, Semarang, Kendal, dan Brebes.
3. Dari hasil pengkategorian berdasarkan hasil profilisasi rata-rata setiap
variabel maka Pemerintah Daerah dapat melihat bagaimana setiap
kabupaten berada pada kategori tingkat kemiskinan rendah, sedang, dan
tinggi. Pada kelompok kabupaten dengan tingkat kemiskinan tinggi,
pemerintah dapat memprioritaskan kabupaten-kabupaten tersebut agar
turunnya tingkat kemiskinan pada daerah tersebut dengan cara memberikan
lapangan kerja, bantuan untuk rakyat miskin, modal bagi UMKM, dan
masih banyak lagi agar dapat terwujudnya kesejahteraan yang merata di
seluruh kabupaten di Jawa Tengah.
20
5 Daftar Pustaka
Hidayat, A. (2014). Penjelasan Lengkap Tentang Analisis Cluster.

https://www.statistikian.com/2014/03/analisis-cluster.html.
Mauliadinata, S. (2013). Algoritma K-Means Clustering.
http://sharewy.blogspot.co.id/2013/04/algoritma-k-means-clustering.html.
Muhajir, K. d. (2018). Modul Praktikum Statistika Multivariat Terapan.
Yogyakarta.
21

Laprak 7 SMT C - Syinta Nuri Mashita - 16611128

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Laprak 7 SMT C - Syinta Nuri Mashita - 16611128

Diunggah oleh

Hak Cipta:

Format Tersedia

Kelas C

Nomor Tanggal Tanda Tangan

Syinta Nuri Mashita 16611128 08/05/2019

Tanggal Tanda tangan

Halaman sampul ....................................................................................................... i

Tabel 2.1. Data Kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan

Gambar 3.1 Data Frame......................................................................................... 9

1.1 Analisis Cluster

Sama dengan analisis factor, analisis cluster (cluster analysis) termasuk

1.2 Definisi Analisis Cluster

Secara logika, cluster yang baik adalah cluster yang mempunyai:

1. Homogenitas (kesamaan) yang tinggi antar anggota dalam satu cluster

1.3 Metode Analisis Cluster

1.4 Algoritma K-Means Clustering

2.1 Studi Kasus

Pada laporan ini, praktikan akan melakukan analisis dengan menggunakan

Tabel 2.1. Data Kemiskinan berdasarkan Dimensi Kualitas Kesehatan dan

Terdiri dari 6 aspek pengukuran sebagai berikut :

4. Melakukan eksplorasi atau analisis statistika deskriptif untuk mengetahui

5. Kemudiann praktikan memulai melakukan scalling data dengan syntax

fviz_dist(distance, gradient = list(low="white",

8. Selanjutnya praktikan melakuakn analisis K-means clustering dengan

klaster<-kmeans(data1,centers = 3,nstart = 25)

10. Kemudian membuat syntax determining optimal cluster untuk

3.1 Data Frame

Gambar 3.1 Data Frame

Sebelum melakukan analisis lebih jauh, alangkah lebih baiknya praktikan

Gambar 3.2 Summary data

3.3 K-Means Clustering K=3

Sebelum melakukan analisis clusternya praktikan melakukan scalling data

Gambar 3.3 Output Scaliing Data

Gambar 3.4. Output distance

Gambar 3.5 Output plot distance

Gambar 3.6 Output klaster

Gambar 3.7 Output klaster means

Gambar 3.9 Hasil Klaster

Kabupaten Kelompok Klaster

3.4 Klaster Kelompok Optimal

Gambar 3.11 Output metode wss

Gambar 3.12 Output metode silhouette

Gambar 3.13 Output metode gap_stat

3.5 Rekomendasi Hasil Analisis

Gambar 3.14 Profilisasi kategori

Berdasarkan pembahasan yang sudah di bahas pada bab sebelumnya, maka

Hidayat, A. (2014). Penjelasan Lengkap Tentang Analisis Cluster.

Anda mungkin juga menyukai