Anda di halaman 1dari 13

LAPORAN ANALISIS CLUSTER

Mata Kuliah Metode Analisa Perencanaan 1

Dosen Pengampu
Widiyanto Hari Subagyo Widodo, ST., M. Sc

Disusun oleh :
Ester Parmanes / 2224034

PROGRAM STUDI PERENCANAAN WILAYAH DAN KOTA


FAKULTAS TEKNIK SIPIL DAN PERENCANAAN
INSTITUT TEKNOLOGI NASIONAL MALANG
2023
BAB I
PENDAHULUAN

1.1 Analisis Cluster


Robert Tryon Tahun 1939 merupakan salah satu pionir dalam penggunaan metode
clustering di bidang psikologi. Ia mengembangkan pendekatan untuk mengelompokkan individu
berdasarkan kesamaan karakteristik tertentu. Sedangkan J. A. Hartigan tahun 1975
mengembangkan algoritma partisi yang dikenal sebagai K-means clustering. Metode ini membagi
data menjadi sejumlah k kelompok di mana setiap individu termasuk ke dalam kelompok dengan
rata-rata terdekat.Analisis Cluster adalah suatu teknik dalam analisis statistik yang digunakan
untuk mengelompokkan objek atau individu berdasarkan kesamaan karakteristik tertentu.
Tujuannya adalah untuk membentuk kelompok atau cluster yang memiliki kesamaan yang tinggi
di antara anggotanya, sementara perbedaan antar kelompok sebisa mungkin besar. Hal ini
memungkinkan untuk mengidentifikasi pola atau struktur yang ada dalam data dan membantu
dalam pengambilan keputusan atau interpretasi lebih lanjut terkait dengan objek yang diteliti.
Metode analisis cluster dapat digunakan dalam berbagai bidang, termasuk ilmu sosial, ekonomi,
biologi, dan lain sebagainya. Analisis cluster adalah teknik yang digunakan untuk
mengelompokkan elemen yang memiliki kesamaan sebagai obyek penelitian ke dalam kelompok
(cluster) yang berbeda dan saling eksklusif. Analisis cluster merupakan bagian dari analisis
statistik multivariat yang termasuk dalam metode interdependen. Oleh karena itu, tujuan dari
analisis cluster bukanlah untuk menghubungkan atau membedakan dengan sampel atau variabel
lain. Analisis cluster terdiri dari dua metode, yaitu:
1.2 Metode Hirarki
Metode ini memulai pengelompokan dengan mengelompokkan dua atau lebih objek yang
memiliki kesamaan paling dekat. Proses kemudian dilanjutkan ke objek lain yang memiliki
tingkat kesamaan berikutnya. Hasil akhirnya adalah struktur hirarkis berupa "pohon" yang
menunjukkan tingkat kesamaan antar objek, dari yang paling mirip hingga yang paling tidak
mirip. Pohon ini membantu memvisualisasikan hierarki yang terbentuk. Dalam metode hirarki,
terdapat dua tipe dasar: agglomerative (pemusatan) dan divisive (penyebaran). Metode
agglomerative memulai dengan menganggap setiap objek sebagai cluster terpisah, dan kemudian
menggabungkan dua cluster yang memiliki kesamaan tertinggi. Di sisi lain, metode divisive
dimulai dengan satu cluster besar yang berisi semua objek, dan kemudian memisahkan objek
berdasarkan tingkat ketidakmiripannya.
Ada lima metode agglomerative yang terkenal, yaitu Single Linkage, Complete Linkage,
Average Linkage, Ward’s Method, dan Centroid Method. Masing-masing metode memiliki
karakteristiknya sendiri, seperti mengukur jarak berdasarkan jarak terdekat atau terjauh antara dua
objek.
1.3 Metode Non-Hirarki
Berbeda dengan metode hirarki, metode non-hirarki dimulai dengan menentukan terlebih
dahulu jumlah cluster yang diinginkan. Setelah jumlah cluster ditentukan, proses pengelompokan
dilakukan tanpa mengikuti proses hirarki. Metode non-hirarki yang umum digunakan adalah K-
Means Cluster. Dalam metode non-hirarki, ada tiga pendekatan yang digunakan untuk
menempatkan observasi pada cluster, yaitu Sequential Threshold, Parallel Threshold, dan
Optimization. Masing-masing pendekatan memiliki cara tersendiri dalam menempatkan objek ke
dalam cluster yang sesuai dengan jarak tertentu.
Keuntungan dari penggunaan metode hierarki adalah memungkinkan pengorganisasian
data ke dalam kelompok-kelompok berdasarkan kesamaannya, yang dapat memudahkan
pemahaman dan interpretasi data. Namun, ada kemungkinan terjadi kesalahan atau
ketidakcocokan data, dan sulit untuk mengukur perbedaan di antara berbagai hal dengan
akurat. Di sisi lain, metode non-hirarki memungkinkan analisis sampel yang lebih besar, tetapi
mungkin tidak efektif dengan data yang tidak biasa atau informasi yang tidak relevan. Jika
melibatkan titik acak, metode hierarki lebih disarankan.Pada metode hirarki, dimulai dengan
mengelompokkan dua atau lebih objek yang memiliki kesamaan yang paling dekat. Proses ini
dilanjutkan dengan menggabungkan objek lain yang memiliki kesamaan kedua terdekat, dan
seterusnya. Hal ini menghasilkan suatu struktur hierarkis yang menggambarkan tingkatan
kesamaan antar objek, mulai dari yang paling mirip hingga yang paling berbeda. Dendrogram
sering digunakan untuk membantu memvisualisasikan hierarki tersebut. Sementara itu, pada
metode non-hirarki, jarak Euclidean digunakan untuk menentukan tingkat kedekatan antara
objek. Cluster pertama terdiri dari observasi pertama dalam dataset. Cluster berikutnya adalah
observasi selanjutnya yang memiliki jarak minimum khusus dari cluster sebelumnya.
1.4 Ciri-ciri dari cluster (kelompok)
Ciri – ciri dari Cluster (Kelompok), antara lain :

a. Tingkat kesamaan yang tinggi antar anggota dalam satu cluster (homogenitas).
b. Tingkat perbedaan yang tinggi antara satu cluster dengan cluster lainnya
(heterogenitas).
1.5 Tujuan Analisis Cluster
Tujuan utama dari analisis cluster adalah untuk menggolongkan objek-objek berdasarkan
kesamaan karakteristik tertentu di antara objek-objek yang diteliti. Tujuan dari Analisis Cluster
setelah mengelompokkan n objek pengamatan ke dalam m kelompok berdasarkan p variabel
adalah untuk mendapatkan kelompok objek yang memiliki nilai relatif serupa. Dengan demikian,
objek-objek dalam satu cluster memiliki kemungkinan tinggi untuk muncul bersamaan pada satu
individu.
1.6 Analisis MDS
Multidimensional Scaling (MDS) adalah suatu teknik analisis multivariat yang
menunjukkan hubungan antar objek dalam ruang multidimensional berdasarkan penilaian
responden terhadap tingkat kemiripan atau kedekatan antar objek. MDS metrik dan MDS non-
metrik. MDS metrik menggunakan data jarak yang bersifat rasio atau interval. Tujuannya adalah
menemukan himpunan titik dalam ruang dimensi n, di mana setiap titik mewakili satu objek.
MDS metrik mengatur titik-titik objek sedekat mungkin dengan input jarak yang diberikan.
Sementara itu, MDS non-metrik mengasumsikan data bersifat kualitatif (nominal dan ordinal).
Program MDS non-metrik menggunakan transformasi monoton pada data untuk dapat melakukan
operasi aritmatika terhadap nilai ketidaksamaannya. Hasil transformasi ini disebut sebagai
disparitas, yang digunakan untuk mengukur tingkat ketidaksesuaian konfigurasi objek dalam peta
multidimensional dengan data ketidaksamaannya. Untuk menggunakan MDS, terdapat beberapa
persyaratan yang harus dipenuhi. Model harus telah dijelaskan dengan tepat, menggunakan level
pengukuran yang sesuai, jumlah objek harus paling tidak sebanyak dimensi, dan skala yang
digunakan harus setara atau distandarisasi. Selain itu, objek yang diperbandingkan harus memiliki
kesamaan yang cukup berarti sehingga dapat dibandingkan. Beberapa istilah yang terkait dengan
MDS meliputi "Stress" yang merupakan ukuran ketidakcocokan antara data dengan pengukuran
MDS, "R Square" yang menunjukkan proporsi varian yang dijelaskan oleh prosedur penskalaan
multidimensional, dan "Peta Konfigurasi" yang menggambarkan hubungan geometris antara
objek dalam ruang koordinat multidimensional.
1.7 Tujuan Analisi MDS
Tujuan dari penggunaan MDS adalah untuk membantu peneliti melihat struktur data yang
diperoleh. Secara lebih spesifik, MDS digunakan untuk mempresentasikan tingkat kemiripan dan
ketidaksamaan data, menguji kriteria yang membedakan objek, menemukan dimensi yang
mendasari kesamaan atau ketidaksamaan objek, serta merepresentasikan informasi yang terdapat
dalam matriks korelasi.
BAB 2
TAHAPAN ANALISIS
1.1 Hirarki
Praktikum analisis cluster menggunakan metode hirarki dengan studi kasus yang
berkaitan langsung dengan bidang Perencanaan Wilayah Kota.
1.1.1 Studi Kasus
Dengan memiliki pendidikan yang berkualitas, seseorang dapat meningkatkan taraf hidupnya
menuju kesejahteraan di masa depan. Meningkatkan mutu pendidikan atau Sumber Daya Manusia
(SDM) di suatu daerah tidak dapat terjadi dengan mudah. Dibutuhkan kerja keras dari semua
pihak . Di Indonesia Nusa Tenggara Timur (NTT) dikenal sebagai salah satu provinsi dengan mutu
pendidikan terendah di Indonesia. Data Badan Pusat Statistik (BPS) menunjukkan, Indeks
Pembangunan Manusia (IPM) untuk NTT, yang antara lain salah satu indikatornya terkait
pendidikan, berada di urutan ke-32 dari total 34 provinsi atau hanya bisa mengungguli Provinsi
Papua dan Papua Barat. Dengan angka 63,13, IPM NTT terpaut cukup jauh di bawah angka rata-
rata nasional 70,18. Pada Studi kasus ini menggunakan Klaster Hirarki dan MDS untuk
mengetahui tercukupnya jumlah fasilitas Pendidikan di NTT Indonesia.

1. Cluster
Berikut merupakan data Case Processing untuk melihat data yang telah di
proses.
Dari semua data yang ada, memiliki tingkat validitas 100% atau yang berarti tidak ada
data yang hilang

2. Ward Linkage

● Pada tahap 1 (stage 1), kasus nomor 14 (Kab Malaka ) dan kasus nomor
18 (Kecamatan Kesugihan) adalah kasus yang paling mirip
karakteristiknya, sehingga mereka menjadi satu kelompok terlebih
dahulu. Kemudian dilihat dari kolom bagian next page pada stage 9,
yang merupakan kelanjutan stage untuk cluster. Terlihat stage 9 yang
berarti proses dilanjutkan dengan meloncat ke stage 9.

● Pada stage 9, perhatikan angka 13 ( Kab Kupang ) dan nomor 14


(Kabupaten Malaka). Hal ini berarti kecamatan Cimanggu masuk pada
kelompok pertama, yaitu kelompok yang beranggotakan Kab Sikka dan
Kab Timor tengah Selatan. Kemudian pada Next Stage pada stage 12.

● Pada stage 12, perhatikan angka 13 (Kab Kupang ) dan nomor 21 ( Kab
Sabu Raijua) satu kelompok dengan Kabupaten sebelumnya 21 dan 22
Kabupaten tersebut telah menjadi sekelompok,selanjutnya lompat next
stage yaitu stage 20.

● Pada stage 18, perhatikan nomor 3 (Kabupaten Sikka) dan nomor 13


(Kabupaten Manggarai) masuk kelompok Kabupaten sebelumnya
kemudian lanjut ke stage 19

● Pada stage 19, perhatikan nomor 3 (Kabupaten Sikka) dan nomor 11


(Kabupaten Sumba Timur). Lalu pada kolom next stage menuju stage
20.

● Pada stage 20, perhatikan nomor 3 (Kabupaten Sikka) dan nomor 20


(Kabupateen Sumba Barat ) masuk kelompok Kabupaten sebelumnya
kemudian lanjut ke stage 21.

● Pada stage 21, perhatikan nomor 1 (Kabupaten Timor Tengah Selatan)


dan nomor 3 (Kabupaten Sikka) dimana berarti masuk ke dalam
kelompok Kabupaten sebelumnya.
3. Cluster Membership

Seperti pada proses input cluster, akan dibuat 3 dan 4 cluster.


Tabel cluster membership secara praktis memberi informasi anggota
yang ada pada tiap cluster jika dibuat 3 dan 4 cluster.
4. Dendogram
2 cluster maka :

1) Anggota Cluster 1 Kabupaten Malaka, Kabupaten Rote-Ndao, Kota Kupang,


Kabupaten Belu, Kabupaten Sabu Rai Jua, Kabupaten Sumba Tengah , Kabupaten
Sikka, Kabupaten Manggarai, Kabupaten Flores Timur, Kabpaten Lembata,
Kabuapten Timor Tengah Utara, Kabupaten Manggarai Barat, Kaupaten Sumba
Barat Daya, Kabupaten Ende, Kabupaten Ngada, Kabupaten Nagekeo, Kabupaten
Sumba Timur, Kabupaten Sumba Barat

2) Cluster 2 beranggotakan, Kabupaten Alor, Kabupaten Manggarai Timur,


Kabupaten Timor Tengah Selatan, Kabupaten Kupang.
1.8 METODE MDS

Semua data (9 data) mengenai Sekolah Provinsi Nusa Tenggara Timur


yang dimasukkan/diproses tidak ada yang hilang/missing sehingga tingkat
kevalidannya 100%.

2. ALSCAL

Note # 14690
You cannot use an ALSCAL individual difference scaling model
(MODEL = INDSCAL or MODEL = GEMSCAL) with only one matrix. These
models require at least two matrices.
ALSCAL will continue the analysis using the Euclidean model (MODEL= EUCLID).

Raw (unscaled) Data for Subject 1

1 2 3 4 5 6 7 8 9 10
1 ,000
2 ,485 ,000
3 ,819 ,783 ,000
4 ,387 ,459 ,618 ,000
5 ,781 ,718 ,219 ,591 ,000
6 ,503 ,403 ,519 ,413 ,508 ,000
7 ,856 ,716 ,226 ,632 ,217 ,558 ,000
8 ,739 ,529 ,342 ,528 ,258 ,409 ,218 ,000
9 ,743 ,775 ,180 ,527 ,224 ,508 ,331 ,390 ,000

10 ,781 ,735 ,096 ,568 ,224 ,451 ,245 ,315 ,185 ,000
11 ,540 ,696 ,390 ,376 ,394 ,436 ,517 ,498 ,249 ,360

12 ,668 ,575 ,251 ,489 ,190 ,323 ,278 ,194 ,262 ,206

13 ,937 ,774 ,380 ,652 ,352 ,675 ,240 ,319 ,414 ,402

14 ,909 ,799 ,157 ,682 ,231 ,548 ,206 ,306 ,273 ,173

15 ,918 ,788 ,225 ,692 ,192 ,564 ,202 ,274 ,302 ,237

16 ,711 ,888 ,542 ,461 ,585 ,670 ,661 ,686 ,395 ,523

17 ,808 ,922 ,371 ,572 ,438 ,641 ,531 ,597 ,235 ,362

18 ,942 ,823 ,212 ,682 ,288 ,628 ,156 ,330 ,319 ,241

19 ,835 ,814 ,230 ,553 ,283 ,599 ,290 ,394 ,182 ,240

20 ,993 ,851 ,315 ,731 ,273 ,690 ,194 ,334 ,378 ,340
21 1,065 ,943 ,286 ,813 ,342 ,703 ,300 ,431 ,380
,314
22 1,037 ,938 ,268 ,791 ,288 ,704 ,276 ,420 ,342
,300
23 10,972 11,091 11,757 11,193 11,712 11,363 11,727 11,590
11,690 11,715

11 12 13 14 15 16 17 18 19 20

11 ,000
12 ,349 ,000
13 ,595 ,418 ,000
14 ,493 ,268 ,323 ,000
15 ,517 ,263 ,298 ,102 ,000
16 ,299 ,581 ,661 ,634 ,669 ,000
17 ,280 ,471 ,570 ,459 ,500 ,239 ,000
18 ,539 ,355 ,228 ,165 ,202 ,626 ,476 ,000
19 ,373 ,349 ,300 ,274 ,304 ,409 ,277 ,227 ,000

20 ,596 ,391 ,190 ,233 ,190 ,688 ,539 ,164 ,287 ,000

21 ,619 ,423 ,343 ,165 ,182 ,710 ,519 ,198 ,331 ,213

22 ,583 ,405 ,332 ,178 ,171 ,676 ,482 ,194 ,294 ,173
23 11,481 11,600 11,745 11,834 11,837 11,505 11,700 11,821
11,726 11,861

21 22 23

21 ,000
22 ,095 ,000
23 11,980 11,958 ,000

1.9 Interpretasi

Iterasi sejarah untuk solusi 2 dimensi (dalam jarak kuadrat), Rumus S-stress
Young 1 digunakan.
Iterasi S-stress Peningkatan 1,00149. Iterasi dihentikan karena S-stress kurang
dari ,005000. Stres dan korelasi kuadrat (RSQ) dalam jarak.
Nilai RSQ adalah proporsi varian dari data yang telah diukur ulang (disparitas) dalam
partisi (baris, matriks, atau seluruh data) yang diakui oleh jarak-jarak mereka yang
sesuai. Nilai Stres adalah rumus stres Kruskal 1.
Untuk matriks
Stres = ,02273 RSQ = ,99972

1.10 Derived Stimulus Configuration

Keterangan :
Var 1 : Sumba Barat
Var 2 : Sumba Timur
Var 3 : Kupang
Var 4 : Timor Tengah Selatan
Var 5 : Timor Tengah Utara
Var 6 : Belu
Var 7 : Alor
Var 8 : Lembata
Var 9 : Flores Timur
Var 10 : Sikka
Var 11 : Ende
Var 12 : Ngada
Var 14 : Manggarai
Var 15 : Rote Ndao
Var 16 : Manggarai Barat
Var 17 : Sumba Tengah
Var 18 : Sumba Barat Daya
Var 19 : Nagekeo
Var 20 : Manggarai Timur
Var 21 : Sabu Raijua
Var 22 : Malaka
Var 23 : Kota Kupang
Var 24 : Nusa Tenggara Timur

Berdasarkan hasil analisis Multidimensional Scaling dapat


dikelompokkan menjadi 4 tipe kelompok wilayah sebagai berikut :
1. Kelompok 1 Kurang (Kelompok 1 adalah wilayah-wilayah yang termasuk dalam
kuadran 1)
2. Kelompok 2 Sangat Kurang (Kelompok 2 wilayah-wilayah yang termasuk dalam
kuadran 2)
3. Kelompok Baik (Kelompok 3 wilayah-wilayah yang termasuk dalam kuadran 3)
4. Kelompok sangat baik ( Kelompok 4 wilayah-wilayah yang termasuk dalam kuadram
4)
Gambar diatas Merupakan uji keselarasan, semakin selaras pengisian
data, semakin lurus diagonal yang terbentuk oleh kumpulan data. Dengan
demikian berarti model diatas menggambarkan model terbagi menjadi 2
cluster, yang mana selaras pengisisan data saling berjauhan tidak membentuk
lurus diagonal. Data ini menunjukkan terdapat 2 cluster yang kurang baik.

Anda mungkin juga menyukai