Disusun oleh:
2021
HALAMAN PENGESAHAN
Disusun oleh:
NIM : 1808046016
Telah dilaksanakan dan dinilai oleh Dosen Pembimbing PKL pada tanggal 13 Agustus
2021 dan dinyatakan LULUS.
Mengetahui,
ii
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, atas limpahan rahmat, hidayah, dan karunia-Nya,
sehingga penulis dapat menyelesaikan laporan ini dengan tepat waktu. Sholawat serta salam
senantiasa tercurahkan kepada junjungan Nabi Muhammad SAW, yang dinantikan syafa’at-
Nya di hari akhir.
Penulisan laporan ini merupakan evaluasi dari pelaksanaan Praktik Kerja Lapangan
(PKL) yang dilaksanakan selama enam minggu dan bertujuan untuk menambah wawasan,
pengalaman, serta gambaran bagi penulis untuk mengaplikasikan teori yang diperoleh selama
perkuliahan dalam dunia kerja yang sesungguhnya. Penulis berkesempatan melakukan
pekerjaan dan pengamatan serta memperoleh data yang dibutuhkan untuk mini riset selama
melaksanakan Praktik Kerja Lapangan (PKL) di BPS Kota Semarang.
Dalam menyelesaikan Praktik Kerja Lapangan (PKL) hingga penyusunan laporan ini,
penulis mengucapkan banyak terima kasih kepada:
1. Ibu Hj. Emy Siswanah, M.Sc, selaku Ketua Program Studi Matematika;
2. Bapak M. Tafrikan, M.Si, selaku dosen pembimbing lapangan yang telah meluangkan
waktu untuk memberikan bimbingan dalam penyusunan laporan ini;
3. Ibu Rina Wulanjari, selaku pembimbing lapangan yang telah memberikan arahan dan
bimbingan dalam menyelesaikan laporan ini;
4. Pimpinan serta seluruh pegawai Badan Pusat Statistik (BPS) Kota Semarang yang telah
membantu dalam pelaksanaan Praktik Kerja Lapangan (PKL);
5. Bapak, Ibu, Mas Ulul dan Adik Zyla serta seluruh keluarga yang telah memberikan
dukungan dan doa yang tiada henti.
6. Seluruh kawan Matematika 2018 yang telah memberikan dukungan dalam penyelesaian
laporan ini.
Penulis
iii
DAFTAR ISI
HALAMAN PENGESAHAN………………………………………………………………ii
KATA PENGANTAR………………………………………………………………………iii
DAFTAR ISI……………...…………………………………………………………………iv
RINGKASAN………………………………………………………………………………..vi
BAB I PENDAHULUAN…………………………………………………………....1
iv
3.3 Objek PKL……………………………………………………………..12
3.4 Metode Pengumpulan Data…………………………………………….13
3.5 Instrumen PKL…………………………………………………………13
3.6 Teknik Analisis Data…………………………………………………..13
3.6.1 Statistik Deskriptif……………………………………………..14
3.6.2 Asumsi Analisis Cluster...........................................................14
3.6.3 Pemilihan Ukuran Jarak………………………………………..15
3.6.4 Standarisasi Data……………………………………………….15
3.6.5 Penentuan Cluster………………………………………………15
3.6.6 Interpretasi Cluster……………………………………………..16
A. Kesimpulan………………………………………………………….27
B. Saran ………………………………………………………………..27
DAFTAR PUSTAKA………………………………………………………………………28
LAMPIRAN………………………………………………………………………………...29
v
RINGKASAN LAPORAN
NIM : 1808046016
Tujuan dari penelitian ini adalah untuk melakukan pengelompokan Kelurahan dan
interpretasi hasil pengelompokan dengan menggunakan metode K-means. Objek penelitian
ini adalah pendataan potensi desa (Podes) tahun 2020 yang dilakukan oleh BPS Kota
Semarang. Variabel yang digunakan pada penelitian ini sebanyak 20 variabel yang mencakup
administrasi Kelurahan di Kota Semarang. Sebelum melakukan analisis, variabel-variabel
tersebut di uji terlebih dahulu untuk mengetahui kelayakannya.
Berdasarkan hasil analisis uji KMO dan Multikolinieritas, 20 variabel yang digunakan
dalam penelitian ini mewakili populasi dan variabel dapat dipakai untuk analisis lebih lanjut.
Analisis selanjutnya adalah mengelompokan Kelurahan dengan menggunakan K-means.
Diperoleh hasil pengelompokan dengan menggunakan metode Elbow sebanyak 2 cluster.
Untuk memperoleh cluster yang optimal, dilakukan uji performa yaitu uji performa SSE
(Sum Square of Error) dan clVAlid.
Pada uji performa menggunakan SSE diketahui selisih SSE yang mengalami penurunan
drastis berada di titik 2. Sedangkan pada uji performa menggunakan clValid, dilihat pada
Connectivity dan Sillhouette menghasilkan 2 cluster. Oleh karena itu, cluster yang optimal
sebanyak 2 cluster, dimana cluster 1 beranggotakan 137 Kelurahan yang memiliki potensi
rendah sedangkan cluster 2 beranggotakan 40 Kelurahan yang memiliki potensi tinggi.
vi
BAB I
PENDAHULUAN
1
Suatu wilayah mempunyai karakter tertentu yakni meliputi aspek fisik dan aspek
non fisik. Aspek- aspek tersebut merupakan salah satu cara untuk menerangkan
keragaman antar wilayah, salah satunya wilayah Kelurahan. Potensi desa menyediakan
data tentang keberadaan, ketersediaan, dan perkembangan potensi yang dimiliki setiap
wilayah administrasi pemerintahan. Untuk mengetahui wilayah Kelurahan yang
memiliki karakteristik yang sama, maka dapat dilakukan pengelompokan Kelurahan
berdasarkan potensi masing-masing Kelurahan.
Analisis Cluster merupakan salah satu metode statistika yang dapat digunakan
untuk melakukan proses pengelompokan. Analisis ini mengelompokkan suatu data
menjadi beberapa kelompok atau cluster sehingga data dalam cluster memiliki
karakteristik sama sedangkan data setiap cluster memiliki karakteristik yang berbeda.
Salah satu metode cluster yang digunakan dalam penelitian ini adalah metode K-means
Berdasarkan uraian di atas, penulis akan melakukan proses pengelompokan Kelurahan
di Kota Semarang berdasarkan potensi desa tahun 2020.
1.2 Rumusan Masalah
Rumusan masalah pada laporan Praktik Kerja Lapangan (PKL) ini adalah:
1. Bagaimana melakukan pengelompokan data banyak Kelurahan menggunakan
metode cluster K-means?
2. Bagaimana interpretasi dari hasil pengelompokan data dengan menggunakan
metode cluster K-means?
1.3 Batasan Masalah
Pembatasan masalah pada Laporan Praktik Kerja Lapangan (PKL) ini adalah:
1. Data yang digunakan dalam penelitian ini adalah data sekunder hasil pendataan
Potensi Desa (Podes) tahun 2020 yang dilaksanakan oleh BPS Kota Semarang.
2. Dalam analisis ini hanya menggunakan 20 variabel yang menggambarkan
administrasi setingkat Kelurahan.
3. Metode analisis cluster yang digunakan adalah cluster non-hirarki dengan
menggunakan metode K-means.
1.4 Tujuan PKL
Kegiatan Praktik Kerja Lapangan (PKL) ini bermaksud untuk memberikan gambaran
serta pengalaman bagi mahasiswa dalam mengimplementasikan ilmu pengetahuan yang
diperoleh selama kuliah dengan melakukan praktik secara langsung. Selain itu kegiatan ini
juga bertujuan sebagai berikut:
2
1. Memperluas wawasan berpikir mahasiswa terhadap permasalahan yang terdapat di
dunia nyata.
2. Sebagai wahana untuk mengaplikasikan teori dan ketrampilan praktis yang diperoleh
selama mengikuti perkuliahan.
3. Untuk dijadikan bekal dalam mempersiapkan diri ke dalam masyarakat dan dunia usaha
yang sesungguhnya.
4. Meningkatkan proses pembelajaran dan ilmu yang diperoleh pada perkuliahan dengan
tambahan latihan praktik kerja yang berkualitas serta profesional pada kondisi yang
terdapat di lingkungan kerja.
5. Menumbuhkan dan mengembangkan pendidikan karakter keahlian kerja serta
membentuk pribadi yang terampil, mandiri, dan percaya diri.
6. Terwujudnya kerjasama antara perguruan tinggi dengan pengguna lulusannya.
7. Untuk mengetahui dan memahami sistem dunia kerja secara utuh.
8. Untuk memenuhi beban SKS yang harus ditempuh sebagai persyaratan akademik
Program Studi S1 Matematika Universitas Islam Negeri Semarang.
1.5 Manfaat PKL
Praktek Kerja Lapangan/ PKL mempunyai manfaat yang besar bagi mahasiswa,
perguruan tinggi, perusahaan dan masyarakat, adapun manfaat PKL tersebut antara lain:
3
BAB II
KAJIAN PUSTAKA
4
cluster membentuk “pohon”, dimana terdapat hirarki (tingkatan) yang jelas
antar objek. Dalam metode hirarki terdapat dua tipe dasar yaitu agglomerative
(pemusatan) dan divise (penyebaran).
Pada metode agglomerative dimulai dengan setiap objek berada
dalam n cluster yang berbeda. Cluster dibentuk dengan menggabungkan dua
cluster yang paling dekat lalu menentukan kembali kedekatan antar n−1
cluster yang baru. Dua cluster terdekat digabung lagi, begitu seterusnya
sampai didapat satu cluster yang memuat seluruh objek.
Metode agglomerative terdiri dari:
a. Linkage Method (Metode Linkage)
Metode ini dibagi lagi menjadi tiga metode yaitu:
1. Single Linkage
Metode ini didasarkan pada jarak terkecil. Jika dua objek terpisah oleh
jarak yang pendek sehingga objek tersebut akan digabung menjadi satu
cluster dan demikian seterusnya.
2. Complete Linkage
Metode ini hampir sama dengan single linkage hanya saja pada metode
ini menggunakan jarak yang paling jauh antara dua cluster yang
berbeda.
3. Average Linkage
Metode ini menggunakan rata-rata jarak antara semua pasangan objek
sebagai jarak antara dua cluster.
b. Ward Method (Metode Ward)
Metode ini berbeda dengan metode single linkage dan complete
linkage. Jika di dalam kedua metode hirarki tersebut menggunakan data jarak
Euclidean kuadrat sebagai pertimbangan, sedangkan dalam metode Ward yang
digunakan adalah error sum of square (ESS). Tujuan metode ini yaitu
memaksimalkan ukuran homogenitas dalam cluster. ESS cluster yang hanya
memiliki satu item adalah nol. Rumusnya adalah sebagai berikut:
k
ESS=∑ ( X i−X )2
i=1
dimana X adalah rata-rata (mean) nilai item dalam sebuah cluster, k adalah
jumlah anggota cluster.
c. Centroid Method (Metode Centroid)
5
Jarak antara dua cluster didefinisikan sebagai jarak Euclidean antar
kedua rataan (centroid) cluster. Jika x r dan x s adalah vector rataan (centroid)
cluster Br dan Bs , maka jarak antar dua cluster didefinisikan sebagai
h ( Br , B s )=d (x r , x s ). Centroid cluster baru yang terbentuk didapat dengan
rumus:
nr x r +n s x s
n r +n s
nr dan ns adalah banyaknya anggota cluster Br dan Bs .
6
2.2 Desa
2.2.1 Pengertian Desa
Secara etimologi, desa berasal dari bahasa Sanskerta, yaitu “dhesi” yang
artinya tanah kelahiran. Sementara dalam Kamus Bahasa Indonesia, desa berarti
sekelompok rumah di luar kota yang merupakan kesatuan, kampung atau dusun.
Pengertian desa menurut para ahli diungkapkan secara berbeda-beda. Menurut Bintaro
(1984), desa merupakan perwujudan atau kesatuan geografi, sosial, ekonomi, politik,
serta kultural yang terdapat di suatu daerah dalam hubungan dan pengaruhnya secara
timbal balik dengan daerah lain. Sutarjo Kartohadikusumo (2002) mendefinisikan desa
sebagai kesatuan hukum tempat tinggal suatu masyarakat yang berhak
menyelenggarakan rumah tangganya sendiri yang merupakan pemerintahan terendah di
bawah camat.
Definisi desa menurut Undang-Undang Nomor 6 Tahun 2014 adalah kesatuan
masyarakat hukum yang mempunyai batas wilayah yang berwenang untuk mengatur
dan mengurus urusan pemerintahan, kepentingan masyarakat setempat yang didasarkan
pada prakarsa masyarakat, hak asal usul, dan/atau hak tradisional yang diakui dan
dihormati dalam sistem pemerintahan Negara Kesatuan Republik Indonesia.
Definisi desa secara lengkap diungkapkan oleh Landis (1948), yang
menyebutkan bahwa desa merupakan suatu wilayah yang jumlah penduduknya kurang
dari 2.500 jiwa dengan ciri-ciri sebagai berikut:
a. Memiliki pergaulan hhidup yang saling mengenal antarribuan jiwa;
b. Ada pertalian perasaan yang sama tentang kesukuan terhadap kebiasaan;
c. Cara berusaha (ekonomi) yang paling umum dilakukan adalah agraris atau
pertanian, yang sangat dipengaruhi oleh kondisi alam sekitar, seperti iklim,
keadaan alam, kekayaan alam, sedangkan pekerjaan yang bukan agraris adalah
bersifat sambilan.
2.2.2 Unsur Desa
Unsur desa merupakan satu kesatuan hidup atau living unit yang berpengaruh
terhadap kemajuan desa yang didukung oleh faktor usaha manusia atau human efforts
dan tata geografi atau geographical setting. Dilihat dari definisinya, desa mempunyai
tiga unsur utama, yaitu wilayah, penduduk, dan tata kehidupan.
a. Daerah/wilayah, yang terdiri atas lokasi atau letak, batas-batas wilayah, jenis tanah,
keadaan lahan, luas, juga pola pemanfaatannya.
7
b. Penduduk, yang meliputi tingkat kelahiran, jumlah penduduk, tingkat kematian,
kepadatan, pertumbuhan penduduk, persebaran, serta mata pencaharian penduduk.
c. Tata Kehidupan, yang terdiri atas pola tata pergaulan, serta ikatan pergaulan, adat
istiadat juga norma-norma yang berlaku di daerah tersebut.
2.2.3 Ciri-Ciri Desa
Menurut Rouceck dan Warren (1984) mengemukakan ciri-ciri masyarakat
pedesaan secara spesifik, antara lain:
a. Kelompok penduduk ang bermata pencaharian utama di daerah tertentu dan
memiliki peran yang cukup besar.
b. Dari segi kebudayaan, komunikasi keluarga terjalin secara langsung, mendalam,
dan informal.
c. Masyarakat desa merupakan suatu kelompok yang dibentuk berdasarkan faktor
geografis.
d. Hubungan masyarakat desa masih sangat bersifat kekeluargaan.
e. Dalam hal mobilitas penduduk, ada pada tingkatan yang rendah, baik mobilitas
yang bersifat horizontal (perpindahan tempat) maupun mobilitas sosial (status
sosial).
f. Keluarga di pedesaan yang masih tradisional memiliki banyak fungsi, khususnya
sebagai unit ekonomi.
2.2.4 Fungsi Desa
Desa memiliki kontribusi terhadap perkembangan daerah sekitarnya. Adapun
fungsi desa diantaranya adalah sebagai berikut:
a. Desa berfungsi sebagai pendukung (hinterland) atau daerah penyupalai bahan
makanan pokok.
b. Desa berfungsi sebagai penyumbang bahan mentah (raw material) sumber alam
mineral, hasil hutan, perkebunan dan tenaga kerja (man power) yang memiliki nilai
ekonomi.
c. Desa berfungsi sebagai desa agraris, desa manufaktur, desa industri, dan desa
nelayan sebagai daerh untuk kegiatan kerja (occupation).
2.2.5 Faktor Penentu Kemajuan Desa
Faktor-faktor yang menentukan kemajuan desa diantaranya sebagai berikut:
a. Potensi desa, mencakup sumber daya alam dan sumber daya manusia.
b. Interaksi dengan daerah lain
8
Interaksi dapat terjadi antara desa dengan desa, serta desa dengan kota.
Perkembangan komunikasi dan transportasi memudahkan interaksi desa dengan
daerah lain sehingga desa semakin maju.
c. Lokasi desa
Lokasi desa berkaitan dengan letak desa terhadap daerah di sekitarnya. Desa akan
lebih berkembang apabila lokasinya berdekatan dengan daerah yang lebih maju.
2.3 Potensi Desa
Potensi adalah segala sesuatu yang dimiliki tetapi belum dimanfaatkan. Potensi desa
merupakan segala sumber daya alam maupun sumber daya manusia yang terdapat, serta
tersimpan di desa. Semua sumber daya tersebut dapat dimanfaatkan bagi kelangsungan dan
perkembangan desa. Potensi desa terbagi menjadi dua, yaitu potensi fisik dan potensi
nonfisik.
2.3.1 Potensi Fisik
Potensi fisik desa merupakan potensi yang berhubungan dengan sumber daya
alam yang ada pada desa tersebut. Sumber daya yang termasuk potensi fisik adalah
sebagai berikut:
a. Potensi tanah/lahan
Lahan/ tanah memiliki potensi sebagai sumber tambang dan mineral, lahan untuk
tumbuhnya tanaman, pembangunan infrastruktur, rumah, jalan, dan sebagainya.
b. Potensi Air
Air memberikan potensi sebagai sumber air yang dapat digunakan untuk energi,
sumber air minum, irigasi, pertanian, dan kebutuhan hidup sehari-hari.
c. Potensi Iklim
Iklim memiliki potensi memberikan peran penting bagi desa yang bersift agraris.
Iklim dipengaruhi oleh ketinggian tempat. Desa dengan ketinggian tertentu
memiliki potensi untuk maju karena kecocokan iklimnya bagi pengembangan
tanaman dan pemanfaatan tertentu, seperti perkebunan buah, tempat rekreasi dan
tempat peristirahatan.
d. Potensi Flora dan Fauna
Potensi ini dapat dikembangkan untuk usaha di bidang pertanian. Beragam
tanaman pangan dan hewan ternak dihasilkan dari perdesaan. Hal itu merupakan
potensi untuk pemenuhan kebutuhan pangan di daerah perdesaan maupun di
perkotaan.
9
e. Potensi Manusia
Manusia merupakan potensi sumber tenaga kerja (potential man power), baik
sebagai pengolah tanah, produsen dalam bidang pertanian, maupun tenaga kerja
industri di kota.
2.3.2 Potensi Non Fisik
Potensi non fisik yang ada di desa adalah segenap potensi sumber daya sosial
dan budaya yang terdapat di desa yang bersangkutan. Sumber daya yang termasuk
potensi nonfisik, yaitu sebagai berikut:
a. Potensi masyarakat desa, yang hidup secara bergotong-royong menjadi kekuatan
produksi, serta pembangunan desa.
b. Potensi aparatur desa atau pamong desa, yang bekerja secara maksimal untuk
menjaga ketertiban dan kelancaran pemerintahan desa.
c. Potensi lembaga sosial desa, sebagai pendorong partisipasi warga desa dalam
kegiatan pembangunan desa secara aktif.
2.4 Kerangka Berpikir Teoritis
Badan Pusat Statistik (BPS) merupakan Lembaga Pemerintah Non Kementrian yang
berada dibawah dan bertanggung jawab langsung kepada Presiden. BPS mempunyai
perwakilan wilayah di Daerah sampai tingkat Kabupaten/Kota yang merupakan instansi
vertikal. Salah satu kegiatan yang dilakukan BPS adalah pendataan potensi desa. Potensi
Desa menyediakan data tentang keberadaan, ketersediaan, dan perkembangan potensi yang
dimiliki setiap wilayah administrasi pemerintahan. Tujuan dilakukan pendataan Podes adalah
untuk mengetahui perkembangan setiap wilayah baik dalam aspek fisik maupun aspek non
fisik. Untuk mengetahui setiap wilayah yang memiliki karakteristik sama, maka penulis
mengelompokkan Kelurahan berdasarkan variabel-variabel yang telah diuji.
Penelitian ini dimulai dengan pemilihan data, dimana data yang dipilih penulis adalah
data potensi desa tahun 2020 di Kota Semarang. Kemudian memilih variabel mana yang
dianggap penting dan dapat digunakan dalam penelitian ini, sedangkan variabel yang tidak
diolah maka tidak digunakan. Setelah variabel terpilih, selanjutnya dilakukan analisis
deskriptif untuk melihat gambaran umum potensi desa tahun 2020 di Kota Semarang.
Kemudian, melakukan uji asumsi cluster dengan uji multikolinieritas dan uji KMO. Setelah
itu melakukan standarisasi data untuk menyamakan satuan variabel yang berbeda dan
melakukan perhitungan jarak. Kemudian dilanjutkan proses pengklasteran dengan
menggunakan metode K-means, dimana kelompok atau cluster yang terbentuk sesuai dengan
karakteristik yang sama pada suatu wilayah.
10
Dasar kerangka teoritis dalam penelitian ini disajikan dalam bagan berikut ini:
Mulai
Data Potensi
Desa 2020
Analisis Deskriptif
Asumsi-Asumsi Cluster
Apakah
asumsi YA Standarisasi Data
terpenuhi
TIDAK
Penentuan K-means Cluster
Ubah Variabel Hapus
Penentuan Karakteristik
Selesai
11
BAB III
METODOLOGI
12
tersebut menghasilkan data berbasis kewilayahan yang mampu menggambarkan potensi yang
dimiliki oleh suatu wilayah setingkat desa.
3.4 Metode Pengumpulan Data
Dalam pengumpulan data penulis menggunakan beberapa metode antara lain:
a. Observasi
Observasi atau pengamatan merupakan teknik pengumpulan data dengan
melakukan pengamatan dan pencatatan secara sistematik terhadap gejala atau
fenomena yang ada pada objek penelitian. Dalam hal ini pengumpulan data
dilakukan secara tidak langsung atau data diperoleh dari pihak lain yaitu Badan
Pusat Statistik (BPS) Kota Semarang.
b. Dokumentasi
Dokumentasi merupakan teknik pengumpulan data dengan melakukan
pencarian data atau informasi yang berasal dari buku-buku, catatan-catatan,
transkip, surat kabar, majalah, prasasti, notulen rapat, agenda dan sebagainya.
Pengumpulan data yang didapatkan berupa data potensi desa tahun 2020 yang
berkaitan dengan penelitian.
3.5 Instrumen PKL
Dalam melaksanakan Praktik Kegiatan Lapangan (PKL), alat-alat yang biasa digunakan
adalah sebagai berikut:
a. Komputer
b. Pena
c. Printer
d. Scanner
e. Kertas A4
f. Pelubang kertas
3.6 Teknik Analisis Data
Menurut Sugiyono, yang dimaksud teknik analisis data adalah proses mencari data,
menyusun secara sistematis data yang diperoleh dari hasil wawancara, catatan lapangan, dan
dokumentasi, dengan cara mengorganisasikan data ke dalam kategori, menjabarkan ke dalam
unit, menyusun ke dalam pola, dan membuat kesimpulan sehingga mudah dipahami diri
sendiri maupun orang lain. Dalam penelitian ini perangkat lunak yang digunakan penulis
adalah SPPS 16.0 dan RStudio versi 4.0.5. Teknik analisis data yang dilakukan adalah
sebagai berikut:
13
3.6.1 Statistik Deskriptif
Statistik deskriptif adalah metode-metode yang berkaitan dengan pengumpulan
dan penyajian suatu data sehingga memberikan informasi yang berguna. Statistika
deskriptif berfungsi untuk mendeskripsikan atau memberi gambaran terhadap objek
yang diteliti melalui sampel atau populasi. Data yang disajikan dalam statistik
deskriptif biasanya dalam bentuk ukuran pemusatan data. Salah satu ukuran pemusatan
data yang digunakan adalah mean.
Selain itu, statistika deskriptif juga memberikan gambaran atau deskripsi suatu
data yang dilihat dari rata-rata (mean), standar deviasi, nilai maksimum, nilai minimum,
sum, range, kurtosis. Statistik deskriptif dalam penelitian juga menjadi proses
transformasi data dalam bentuk tabulasi. Tabulasi menyajikan ringkasan, pengaturan
dan penyusunan data dalam bentuk tabel numerik dan grafik.
3.6.2 Asumsi Analisis Cluster
a. Sampel yang Mewakili (Sample Representative)
Uji Kaiser-Mayer-Olkin (KMO) banyak digunakan untuk melihat syarat
kecukupan suatu sampel. Jika nilai KMO berkisar 0,5 sampai 1mka sampel dapat
dikatakan mewakili populasi atau sampel representatif. Rumus KMO adalah
sebagai berikt:
p p
∑ ∑ rX
2
j Xk
j=1 k=1, k ≠ j
KMO= p p p p
∑∑r 2
X jXk +∑ ∑ ρ
2
X j X k Xl
j=1 k ≠ j j=1 k ≠ j
Dimana:
p : banyaknya variabel
rX j Xk : korelasi antar variabel X j dan X k
Xj : rata-rata variabel X j
Xk : rata-rata variabel X k
n : banyaknya observasi (objek)
ρX j Xk Xl : korelasi parsial antara variabel X j dan X k dengan X l
14
atau tidak terdapat multikolinieritas adalah menghitung nilai Varians Inflation
Factor (VIF) dengan rumus sebagai berikut:
1
VIF=
1−R2
Dengan R2 adalah nilai koefisien determinasi variabel dependen dengan variabel
independen. Multikolinieritas terindeksi apabila nilai VIF > 10. Salah satu yang
dapat dilakukan bila terjadi multikolinieritas adalah dengan mengeluarkan
variabel yang berkorelasi dalam model.
3.6.3 Pemilihan Ukuran Jarak
Tujuan analisis cluster adalah mengelompokkan objek yang mirip ke dalam
cluster yang sama. Oleh karena itu, memerlukan beberapa ukuran untuk mengetahui
seberapa mirip atau berbeda objek-objek tersebut. Pendekatan yang biasa digunakan
adalah mengukur kemiripan yang dinyatakan dalam jarak (distance) antara pasangan
objek. Jarak Squared Euclidean adalah jumlah kuadrat perbedaan deviasi di dalam nilai
untuk setiap variabel. Salah satu ukuran jarak ialah jarak squared euclidean. Jarak
Squared Euclidean antara kelompok objek ke-I dan kelompok objek ke-j dari p variabel
yang didefinisikan sebagai berikut:
p
d ij =∑ ( X ik −X jk )2
k=1
Dimana:
p : banyaknya variabel
d ij : jarak antara objek ke-i dan objek ke-j
X ik : data dari objek ke-i pada variabel ke-k
X jk : data dari objek ke-j pada variabel ke-k
3.6.4 Standarisasi Data
Proses standarisasi dilakukan apabila diantara variabel-variabel yang diteliti
terdapat perbedaan ukuran satuan yang besar. Perbedaan satuan yang mencolok dapat
mengakibatkan perhitungan pada analisis cluster menjadi tidak valid. Untuk itu, perlu
dilakukan proses standarisasi dengan melakukan transformasi (standarisasi data
sebelum dianalisis lebih lanjut). Transformasi dilakukan terhadap variabel yang relevan
ke dalam bentuk Z-skor.
3.6.5 Penentuan Cluster
Setelah data yang dianggap mempunyai satuan yang berbeda diseragamkan,
langkah selanjutnya adalah menentukan jumlah cluster. Penentuan jumlah cluster
15
dalam penelitian ini menggunakan K-means dengan metode elbow. Metode elbow
merupakan suatu metode yang digunakan untuk menghasilkan informasi dalam
menentukan jumlah cluster terbaik dengan cara melihat persentase hasil perbandingan
antara jumlah cluster yang akan membentuk siku pada suatu titik. Hasil persentase yang
berbeda dari setiap cluster dapat ditunjukkan dengan menggunakan grafik. Jika nilai
cluster pertama dengan nilai cluster kedua memberikan sudut dalam grafik atau
nilainya mengalami penurunan paling besar maka nilai cluster tersebut yang terbaik.
Untuk mendapatkan perbandingannya dengan menghitung SSE (Sum of Square Error)
dari masing-masing nilai cluster. Karena semakin besar jumlah cluster K maka nilai
SSE akan semakin kecil. Rumus SSE pada K-means adalah sebagai berikut:
K
SSE= ∑ ∑ ‖x i−c k‖
2
K=1 xi ∈S i
Dimana:
Si : kelompok data dalam cluster k
ck : rata-rata cluster k
16
BAB IV
17
Senin, 12 Juli 2021 – WFH (Work From Home)
Jum’at, 16 Juli 2021
WFH (Work From Home)
Senin, 19 Juli 2021 –
Membuat leaflet SAKERNAS (Survei Angkatan Kerja
Jum’at, 23 Juli 2021
Nasional)
WFH (Work From Home)
Senin, 26 Juli 2021 –
Membuat infographis status perkawinan
Sabtu, 31 Juli 2021
Pelepasan mahasiswa PKL
18
Jumlah posyandu 177 1 35 8.98 5.695
Pada tabel di atas, kolom N menyatakan jumlah data yang terisi dari setiap variabel
yang ada dimana besarnya tergantung jumlah data yang hilang. Seluruh variabel memiliki
nilai N sebanyak 177, artinya semua variabel untuk setiap data terisi. Kolom minimum
menyatakan jumlah data terendah dari setiap variabel. Kolom maximum menyatakan jumlah
data tertinggi dari setiap variabel. Dapat dilihat bahwa pada variabel jumlah TK/RA tertinggi
sebanyak 18 bangunan, jumlah posyandu tertinggi sebanyak 35, dan jumlah keluarga
pengguna listrik PLN tertinggi sebanyak 7658 jiwa dimiliki oleh kelurahan Sendangmulyo.
Pada variabel jumlah SD/MI tertinggi sebanyak 10 dimiliki oleh kelurahan Kalicari dan
Tlogosari Kulon. Pada variabel jumlah SMP/MTs tertinggi sebanyak 6 dimiliki oleh
kelurahan Wonolopo. Pada variabel jumlah SMA/SMK/MA tertinggi sebanyak 5 dimiliki
oleh kelurahan Srondol Wetan, Jatingaleh, Gayamsari, dan Wonolopo. Pada variabel jumlah
apotek tertinggi sebanyak 11 bangunan, jumlah tempat praktik dokter tertinggi sebanyak 15,
jumlah puskesmas tertinggi sebanyak 3, jumlah toko tertinggi sebanyak 360 bangunan
dimiliki oleh kelurahan Tlogosari Kulon.
19
Pada variabel jarak desa ke kecamatan terjauh sebesar 15 km yang berada di kelurahan
Sadeng. Pada variabel jarak desa ke kabupaten terjauh sebesar 22 km yang berada di
kelurahan Bubakan. Pada variabel jumlah keluarga berlangganan telepon kabel tertinggi
sebanyak 2547 keluarga yang berada di kelurahan Sendangguwo. Pada variabel jumlah
Menara telepon seluler tertinggi sebanyak 16 menara dimiliki oleh kelurahan Sekaran. Pada
variabel jumlah operator layanan komunikasi tertinggi sebanyak 7 dan jumlah tempat ibadah
tertinggi sebanyak 75 tempat berada di kelurahan Wonosari. Pada variabel jumlah IMK
tertinggi sebanyak 121 yang berada di kelurahan Krobokan.
Pada variabel sarana layanan keuangan tertinggi sebanyak 20 yang berada di kelurahan
Kranggan. Pada variabel jumlah koperasi tertinggi sebanyak 8 dimiliki oleh kelurahan
Pudakpayung. Pada variabel jumlah pasar terbanyak berada di kelurahan Kauman sebanyak 5
bangunan. Selain itu, pada kolom mean dan standar deviation merupakan nilai statistik dasar
untuk setiap variabel yang dihitung dari jumlah data yang valid (tidak missing).
4.4 Asumsi Analisis Cluster
a. Asumsi Sampel yang Mewakili
Asumsi ini dinyatakan dalam nilai Kaiser-Meyer-Olkin (KMO) Measure of
Sampling Adequacy. Berikut ialah hasil pengujian KMO keseluruhan variabel:
Tabel 4. Nilai KMO
df 190
Sig. .000
Variabel VIF
X1 3.771
X2 2.014
X3 2.457
20
X4 2.423
X5 4.649
X6 3.022
X7 2.832
X8 1.326
X9 1.483
X10 1.953
X11 1.38
X12 1.366
X13 1.15
X14 1.855
X15 1.496
X16 1.479
X17 1.766
X18 1.343
X19 3.936
X20 2.399
Berdasarkan tabel 5, diketahui bahwa nilai VIF pada tiap variabel bernilai kurang
dari 10. Maka dapat disimpulkan bahwa tidak terjadi multikolinieritas antar
variabel-variabel tersebut.
4.5 Proses Pengklasteran
Pengelompokan K-means merupakan metode untuk penyusunan sub kelompok
pengamatan berdasarkan jarak suatu set data, sehingga seluruh kelurahan di Kota Semarang
akan dibentuk kelompok berdasarkan kedekatan nilai variabel. Untuk mengurangi bias karena
ukuran antar variabel berbeda, maka setiap variabel distandarkan nilainya terlebih dahulu.
Berdasarkan nilai-nilai variabel dapat dilihat masing-masing jarak antara keluharan seperti
pada Gambar 1.
Gambar 1. Jarak Nilai Variabel antar Kelurahan
21
Pada gambar 1. Jarak antar kelurahan berkisar antara 0 sampai 15. Semakin jauh jarak
antar kelurahan ditunjukkan oleh warna grafik yang semakin merah tua. Untuk perhitungan
jarak Euclid diperoleh dengan menggunakan bantuan software RStudio dan dapat dilihat pada
Tabel 6.
Tabel 6. Hasil Perhitungan Jarak Euclidean
No 1 2 3 4 5 6 …. 177
1 0 …
2 1.7346008 0 …
3 3.4787302 3.0196418 0 …
4 3.6065171 2.9340609 3.8828368 0 …
5 2.9159709 2.312769 2.6282687 3.1501151 0 …
6 3.0368941 2.9285627 2.6756031 4.12049 3.1619001 0 …
7 4.8683464 5.6120196 6.4797874 6.4018943 5.9076678 5.5491456 0
… … … … … … … …
177
22
Berdasarkan Gambar 2. Dapat dilihat bahwa nilai K optimum berada pada titik dua,
dimana titik tersebut merupakan titik siku. Sehingga jumlah cluster menurut metode Elbow
yaitu sebanyak 2 cluster.
Tabel 7. Uji Performa menggunakan SSE
Hasil uji SSE pada Tabel 7 diketahui penurunan drastis terlihat pada titik 2 cluster.
Pada titik tersebut mengalami penurunan yang besar dibandingkan dengan yang lain. Setelah
itu, titik berikutnya penurunan cenderung stabil. Maka nilai K yang digunakan adalah 2.
Selain melakukan uji performa menggunakan SSE, untuk menghasilkan nilai K yang
tepat optimal maka dilakukan uji performa lainnya yaitu menggunakan clValid. Berikut
disajikan Tabel 8.
Tabel 8. Uji Performa menggunakan clValid
Pada Tabel 8 dihasilkan nilai Connectivity memiliki jumlah cluster sebanyak 2 segmen
karena memiliki nilai terendah dari yang lain yaitu 58,3075 yang menunjuk pada cluser 2.
Hasil dari Dunn memiliki nilai tertinggi diantara yang lain sebesar 0,2122 yang menunjuk
pada cluster 7. Sedangkan hasil Sillhouette memilik jumlah cluster sebanyak 2 segmen
karena memiliki nilai tertinggi diantara yang lain yaitu sebesar 0,2581. Sehingg dari data
tersebut didapatkan hasil yang sama pada uji Connectivity dan Sillhouette dimana nilai K
sama dengan 2 yang berarti jumlah cluster sebanyak 2 adalah yang optimal.
23
4.6 Eksekusi K-means
Hasil uji menggunakan metode Elbow menunjukkan bahwa pembagian Kelurahan
berdasarkan potensi desa sebanyak 2 cluster. Dimana jumlah anggota cluster 1 sebanyak 137
Kelurahan dan cluster 2 sebanyak 40 Kelurahan.
Cluster Kelurahan
Cangkiran, Bubakan, Karangmalang, Polaman, Purwosari, Tambangan,
Mijen, Jatibarang, Kedungpani, Pesantren, Ngadirgo, Wonoplumbon,
Plalangan, Sumurejo, Pakintelan, Mangunsari, Patemon, Ngijo,
Nongkosawit, Cepoko, Jatirejo, Kandri, Pungangan, Kalisegoro, Sekaran,
Sukorejo, Sadeng, Gedawang, Jabungan, Banyumanik, Sumurboto, Srondol
Kulon Tinjomoyo, Bendan Duwur, Karang Rejo, Gajahmungkur, Bendan
Ngisor, Petompon, Bendungan, Lempongsari, Bulustalan, Barusari,
Randusari, Mugassari, Pleburan, Peterongan, Lamper Kidul, Lamper Lor,
Lamper Tengah, Jatingaleh, Karanganyar Gunung, Candi, Kaliwuru,
Wonotingal, Tegalsari, Rowosari, Kramas, Tembalang, Bulusan,
Mangunharjo, Jangli, Kedungmundu, Penggaron Kidul, Pedurungan Lor,
Tlogomulyo, Muktiharjo Kidul, Gebangsari, Bangetayu Wetan,
1 Sembungharjo, Penggaron Lor, Kudu, Karangroto, Trimulyo, Terboyo
Wetan, Terboyo Kulon, Pandean Lamper, Sambirejo, Sawahbesar,
Kaligawe, Tambakrejo, Karangturi, Karangtempel, Rejosari, Sarirejo,
Kebonagung, Bugangan, Mlatiharjo, Mlatibaru, Rejomulyo, Kemijen, Bulu
Lor, Plombokan, Panggung Kidul, Panggung Lor, Kuningan, Purwosari,
Dadapsari, Bandarharjo, Pekunden, Karangkidul, Jagalan, Brumbungan,
Miroto, Gabahan, Kranggan, Purwodinatan, Kauman, Bangunharjo,
Kembangsari, Pandansari, Sekayu, Pendrikan Kidul, Pendrikan Lor,
Ngemplaksimongan, Bongsari, Bojongsalaman, Cabean,
Salamanmloyo,Kalibanteng Kidul, Kalibanteng Kulon, Krapyak, Tambak
Harjo, Tawangsari, Karang Ayu, Tawangmas, Jerakah, Tugurejo,
Karanganyar, Randu Garut, Mangkang Wetan, Mangunharjo, Mangkang
Kulon, Podorejo, Wates, Ngaliyan, Bambankerep, dan Gondoriyo
2 Jatisari, Wonolopo, Gunungpati, Pudakpayung, Padangsari, Srondol Wetan,
Pedalangan, Ngesrep, Sampangan, Wonodri, Jomblang, Meteseh, Sendang
24
Mulyo, Sambiroto, Tandang, Sendangguwo, Gemah, Pedurungan Kidul,
Plamongan Sari, Pedurungan Tengah, Palebon, Kalicari, Tlogosari Kulon,
Tlogosari Wetan, Muktiharjo Lor, Genuksari, Bangetayu Kulon,
Banjardowo, Gayamsari, Siwalan, Tanjungmas, Kembangarum, Manyaran,
Gisikdrono, Krobokan, Bringin, Kalipancur, Purwoyoso, Tambakaji, dan
Wonosari
Pada Gambar 3 adalah hasil visualisasi Metode Elbow yang memperlihatkan suatu
kelompok atau cluster Kelurahan yaitu anggota cluster 1 sebanyak 137 Kelurahan berwarna
merah dan anggota cluster 2 sebanyak 40 Kelurahan berwarna biru.
Cluster
Variabel
1 2
X1 mean 3.47 8.6
X2 mean 2.87 5.15
X3 mean 1.05 1.98
X4 mean 0.869 1.75
X5 mean 6.93 16
X6 mean 1.28 3.55
25
X7 mean 2.35 5.28
X8 mean 0.314 0.75
X9 mean 3.17 3.3
X10 mean 8.5 9.55
X11 mean 238 712
X12 mean 2.18 3.6
X13 mean 5 5.18
X14 mean 16.8 44.9
X15 mean 1.84 3.7
X16 mean 0.745 1.8
X17 mean 45.6 113
X18 mean 0.467 0.8
X19 mean 18.4 36.2
X20 mean 2340 5535
Berdasarkan Tabel 8, maka dapat dilakukan profilisasi tiap kelompok yang terbentuk.
Pada cluster 1 menunjukkan nilai rata-rata masing-masing variabel rendah dibandingkan
cluster 1. Sehingga dapat disimpulkan bahwa cluster 1 adalah cluster yang memiliki potensi
tinggi. Sedangkan cluster 2 adalah cluster yang memiliki potensi rendah.
BAB V
26
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil dari pengolahan data dan analisis yang telah dilakukan terhadap 177
data potensi desa tahun 2020 di Kota Semarang diperoleh kesimpulan sebagai berikut:
1. Cluster yang terbentuk pada pengelompokan potensi Kelurahan di Kota Semarang
dengan menggunakan cluster K-means metode Elbow sebanyak 2 cluster yaitu cluster 1
yang beranggotakan 137 Kelurahan dan cluster 2 beranggotakan 40 Kelurahan.
2. Hasil analisis menunjukkan nilai SSE (Sum Square of Error) mengalami penurunan
yang signifikan pada titik 2 yaitu memiliki selisih sebesar 640,143 dimana lebih besar
dari selisih titik yang lain. Hasil analisis dengan uji performa clValid menunjukkan
cluster optimal adalah 2 karena nilai Connectivity terkecil yaitu sebesar 58,3075 dan
nilai Sillhouette sebesar 0,2581 lebih kecil dari titik yang lain.
3. Profilisasi tiap kelompok menunjukkan bahwa pada cluster 1 memiliki nilai rata-rata
setiap variabel potensi Kelurahan rendah. Sedangkan pada cluster 2 memiliki nilai rata-
rata setiap variabel potensi Kelurahan tinggi. Sehingga dapat dikatakan cluster 1
berpotensi rendah dan cluster 2 berpotensi tinggi.
5.2 Saran
Pada penelitian ini penulis hanya menggunakan metode non-hirarki yaitu metode
cluster K-means berdasarkan data potensi desa. Oleh karena itu, untuk penelitian selanjutnya
dapat menggunakan metode yang lain, mengingat cakupan analisis cluster yang cukup
banyak serta dapat dikembangkan dengan mengaplikasikan pada bidang ilmu lainnya.
Diharapkan hasil penelitian ini dapat menjadi informasi bagi pemerintah agar kebijakannya
tepat sasaran.
DAFTAR PUSTAKA
27
Bawono, Icuk Rangga dan Erwin Setyadi. 2019. Optimalisasi Potensi Desa di Indonesia.
Jakarta: PT Grasindo
Nugroho, Sigit. 2008. Statistika Multivariat Terapan. Bengkulu: UNIB Press
Fathia, N. A. & Rahmawati, R. & Tarno. (2016). Analisis Klaster Kecamatan di Kabupaten
Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage.
Jurnal Gaussian. 5(4): 801-810.
Shofiani, Nabilah. 2017. Segmentasi Supplier Menggunakan Metode K-Means Clustering
(Studi Kasus: PTPN X PG MERITJAN). Tugas Akhir. Tidak Diterbitkan. Fakultas
Teknologi Informasi. Institut Teknologi Sepuluh Nopember: Surabaya.
Imantika, D. & Bachtiar, F. A. & Rokhmawati, R. I. 2019. Penerapan Metode K-Means
Clustering dan Analytical Hierarchy Process (AHP) untuk Pengelompokan Kinerja
Guru dan Karyawan pada SMA Brawijaya Smart School. Jurnal Pengembangan
Teknologi Informasi dan Ilmu Komputer. 3(8): 7382-7390.
Alatubir, Desky A. V. 2017. Penerapan Algoritma K-Means untuk Pengelompokan Sekolah
Menengah Atas di Provinsi Daerah Istimewa Yogyakarta Berdasarkan Nilai Daya
Serap Ujian Nasional Bahasa Indonesia. Skripsi. Tidak Diterbitkan. Fakultas Sains dan
Teknologi. Universitas Sanata Dharma: Yogyakarta.
Izzadin, Fata. M. 2020. Optimalisasi Jumlah Cluster K-Means dengan Metode Elbow dan
Sillhouette pada Produktivitas Tanaman Pangan di Provinsi Jawa Tengah Tahun 2020.
Tugas Akhir. Tidak Diterbitkan. Fakultas Matematika dan Ilmu Pengetahuan Alam.
Universitas Islam Indonesia: Yogyakarta.
Tambunan, Amy. 2008. Analisis Potensi Desa Provinsi Lampung dalam Penyediaan
Layanan Telekomunikasi USO (Universal Service Obligation) oleh BTIP dengan
Statistika Multivariat. Skripsi. Tidak Diterbitkan. Fakultas Teknik. Universitas
Indonesia: Depok.
Ardra.biz. Pengertian Desa: Unsur Fungsi Ciri Potensi Non Fisik Struktur Pola Swadaya
Swakarsa Swasembada. Diakses pada 3 Agustus 2021 dari
https://ardra.biz/topik/pengertian-potensi-desa/
LAMPIRAN
28
Lampiran 1: Data Potensi Desa Tahun 2020 Kota Semarang
Lampiran 1: (Lanjutan)
29
Variabel Keterangan
Jumlah TK/RA
X1
Jumlah SD/MI
X2
Jumlah SMP/MTs
X3
Jumlah SMA/SMK/MA
X4
Jumlah posyandu
X5
Jumlah apotek
X6
Jumlah tempat praktik dokter
X7
Jumlah puskesmas
X8
Jarak desa ke kecamatan (km)
X9
Jarak desa ke kabupaten (km)
X10
Jumlah keluarga yang berlangganan telepon kabel
X11
Jumlah menara telepon seluler
X12
Jumlah operator layanan komunikasi
X13
Jumlah industri mikro dan kecil
X14
Jumlah sarana layanan keuangan
X15
Jumlah koperasi
X16
Jumlah toko
X17
Jumlah pasar
X18
Jumlah tempat ibadah
X19
Jumlah keluarga pengguna listrik PLN
X20
30
31
32