Laporan

LAPORAN
PRAKTIK KERJA LAPANGAN (PKL)
ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE K-MEANS

DALAM PENGELOMPOKAN KELURAHAN DI KOTA SEMARANG
BERDASARKAN POTENSI DESA TAHUN 2020
Disusun oleh:
Hilda Affa Maghfiroh (1808046016)
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI WALISONGO SEMARANG
2021
HALAMAN PENGESAHAN
LAPORAN PRAKTIK KERJA LAPANGAN
Dengan ini menyatakan bahwa kegiatan Praktik Kerja Lapangan mahasiswa

Fakultas Sains dan Teknologi Program Studi Matematika UIN Walisongo Semarang
dengan judul:
“ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE K-MEANS
DALAM PENGELOMPOKAN KELURAHAN DI KOTA SEMARANG
BERDASARKAN POTENSI DESA TAHUN 2020”
Disusun oleh:
Nama : Hilda Affa Maghfiroh
NIM : 1808046016
Telah dilaksanakan dan dinilai oleh Dosen Pembimbing PKL pada tanggal 13 Agustus
2021 dan dinyatakan LULUS.
Dosen Pembimbing Lapangan Pembimbing Lapangan
M. Tafrikan, M.Si Rina Wulanjari

NIP. NIP. 196901201994012001
Mengetahui,
Ketua Program Studi
Hj. Emy Siswanah, M.Sc

NIP. 198702022011012014
ii
KATA PENGANTAR
Puji syukur kehadirat Allah SWT, atas limpahan rahmat, hidayah, dan karunia-Nya,
sehingga penulis dapat menyelesaikan laporan ini dengan tepat waktu. Sholawat serta salam
senantiasa tercurahkan kepada junjungan Nabi Muhammad SAW, yang dinantikan syafa’at-
Nya di hari akhir.
Penulisan laporan ini merupakan evaluasi dari pelaksanaan Praktik Kerja Lapangan
(PKL) yang dilaksanakan selama enam minggu dan bertujuan untuk menambah wawasan,
pengalaman, serta gambaran bagi penulis untuk mengaplikasikan teori yang diperoleh selama
perkuliahan dalam dunia kerja yang sesungguhnya. Penulis berkesempatan melakukan
pekerjaan dan pengamatan serta memperoleh data yang dibutuhkan untuk mini riset selama
melaksanakan Praktik Kerja Lapangan (PKL) di BPS Kota Semarang.
Dalam menyelesaikan Praktik Kerja Lapangan (PKL) hingga penyusunan laporan ini,
penulis mengucapkan banyak terima kasih kepada:
1. Ibu Hj. Emy Siswanah, M.Sc, selaku Ketua Program Studi Matematika;
2. Bapak M. Tafrikan, M.Si, selaku dosen pembimbing lapangan yang telah meluangkan
waktu untuk memberikan bimbingan dalam penyusunan laporan ini;
3. Ibu Rina Wulanjari, selaku pembimbing lapangan yang telah memberikan arahan dan
bimbingan dalam menyelesaikan laporan ini;
4. Pimpinan serta seluruh pegawai Badan Pusat Statistik (BPS) Kota Semarang yang telah
membantu dalam pelaksanaan Praktik Kerja Lapangan (PKL);
5. Bapak, Ibu, Mas Ulul dan Adik Zyla serta seluruh keluarga yang telah memberikan
dukungan dan doa yang tiada henti.
6. Seluruh kawan Matematika 2018 yang telah memberikan dukungan dalam penyelesaian
laporan ini.
Dengan segala keterbatasan pengetahuan serta kemampuan, penulis menyadari bahwa

laporan ini masih jauh dari kata sempurna. Oleh karena itu, penulis mengharapkan saran dan
kritik demi kesempurnaan laporan ini, sehingga laporan ini dapat bermanfaat bagi pembaca.
Rembang, 5 Agustus 2021
Penulis
iii
DAFTAR ISI
HALAMAN PENGESAHAN………………………………………………………………ii
KATA PENGANTAR………………………………………………………………………iii
DAFTAR ISI……………...…………………………………………………………………iv
RINGKASAN………………………………………………………………………………..vi
BAB I PENDAHULUAN…………………………………………………………....1
1.1 Latar Belakang…………………………………………………............1

1.2 Rumusan Masalah………………………………………………………2
1.3 Batasan Masalah………………………………………………………..2
1.4 Tujuan PKL..……………………………………………………………2
1.5 Manfaat PKL……………………………………………………………3
BAB II KAJIAN PUSTAKA………………………………………………………....4
2.1 Analisis Cluster…………………………………………………..........4

2.1.1 Pengertian Analisis Cluster…………………………………….4
2.1.2 Tujuan Analisis Cluster…………………………………………4
2.1.3 Metode Analisis Cluster………………………………………..4
2.2 Desa…………………………………………………………………….7
2.2.1 Pengertian Desa…………………………………………………7
2.2.2 Unsur Desa……………………………………………………...7
2.2.3 Ciri-Ciri Desa……………………………………………………8
2.2.4 Fungsi Desa……………………………………………...………8
2.2.5 Faktor Penentu Kemajuan Desa…………………………………8
2.3 Potensi Desa…………………………………………………………….9
2.3.1 Potensi Fisik…………………………………………………….9
2.3.2 Potensi Non Fisik………………………………………………10
2.4 Kerangka Berpikir Teoritis…………………………………………….10
BAB III METODOLOGI………..…………………………………………………...12
3.1 Lokasi PKL……………………………………..…………………......12

3.2 Rancangan PKL………………………………………………………..12
iv
3.3 Objek PKL……………………………………………………………..12
3.4 Metode Pengumpulan Data…………………………………………….13
3.5 Instrumen PKL…………………………………………………………13
3.6 Teknik Analisis Data…………………………………………………..13
3.6.1 Statistik Deskriptif……………………………………………..14
3.6.2 Asumsi Analisis Cluster...........................................................14
3.6.3 Pemilihan Ukuran Jarak………………………………………..15
3.6.4 Standarisasi Data……………………………………………….15
3.6.5 Penentuan Cluster………………………………………………15
3.6.6 Interpretasi Cluster……………………………………………..16
BAB IV HASIL DAN PEMBAHASAN……………………………………………..17
4.1 Deskripsi dan JadwalKegiatan PKL………………..………………..17

4.2 Deskripsi Data………………………………………………………..18
4.3 Statistik Deskriptif……………………………………………………18
4.4 Asumsi Analisis Cluster……………………………………...………20
4.5 Proses Pengklasteran…………………………………………………21
4.6 Eksekusi K-means……………………………………………………24
BAB V KESIMPULAN DAN SARAN………………………………………........27
A. Kesimpulan………………………………………………………….27
B. Saran ………………………………………………………………..27
DAFTAR PUSTAKA………………………………………………………………………28
LAMPIRAN………………………………………………………………………………...29
v
RINGKASAN LAPORAN
Nama : Hilda Affa Maghfiroh
NIM : 1808046016
Program Studi : Matematika
Fakultas : Sains dan Teknologi
Judul Laporan : Analisis Cluster dengan Menggunakan Metode K-means

dalam Pengelompokan Kelurahan di Kota Semarang
Berdasarkan Potensi Desa Tahun 2020
Dosen Pembimbing : M. Tafrikan, M.Si
Pembimbing Lapangan : Rina Wulanjari
Tujuan dari penelitian ini adalah untuk melakukan pengelompokan Kelurahan dan
interpretasi hasil pengelompokan dengan menggunakan metode K-means. Objek penelitian
ini adalah pendataan potensi desa (Podes) tahun 2020 yang dilakukan oleh BPS Kota
Semarang. Variabel yang digunakan pada penelitian ini sebanyak 20 variabel yang mencakup
administrasi Kelurahan di Kota Semarang. Sebelum melakukan analisis, variabel-variabel
tersebut di uji terlebih dahulu untuk mengetahui kelayakannya.
Berdasarkan hasil analisis uji KMO dan Multikolinieritas, 20 variabel yang digunakan
dalam penelitian ini mewakili populasi dan variabel dapat dipakai untuk analisis lebih lanjut.
Analisis selanjutnya adalah mengelompokan Kelurahan dengan menggunakan K-means.
Diperoleh hasil pengelompokan dengan menggunakan metode Elbow sebanyak 2 cluster.
Untuk memperoleh cluster yang optimal, dilakukan uji performa yaitu uji performa SSE
(Sum Square of Error) dan clVAlid.
Pada uji performa menggunakan SSE diketahui selisih SSE yang mengalami penurunan
drastis berada di titik 2. Sedangkan pada uji performa menggunakan clValid, dilihat pada
Connectivity dan Sillhouette menghasilkan 2 cluster. Oleh karena itu, cluster yang optimal
sebanyak 2 cluster, dimana cluster 1 beranggotakan 137 Kelurahan yang memiliki potensi
rendah sedangkan cluster 2 beranggotakan 40 Kelurahan yang memiliki potensi tinggi.
vi
BAB I
PENDAHULUAN
1.1 Latar Belakang

Kota Semarang merupakan salah satu dari kabupaten/kota besar yang menjadi
bagian wilayah Provinsi Jawa Tengah. Secara adminisratif, Kota Semarang terbagi atas
16 wilayah Kecamatan dan 177 Kelurahan. Luas wilayah Kota Semarang tercatat
373,70 km2 yang berada pada ketinggian antara 0 sampai dengan 348,00 meter dpl (di
atas permukaan air lait).
Di dalam proses perkembangannya, Kota Semarang sangat dipengaruhi oleh
keadaan alam yang membentuk suatu kota mempunyai ciri khas yang unik yaitu terdiri
dari daerah pantai, dataran rendah dan perbukitan, sehingga memiliki wilayah yang
disebut sebagai Kota Bawah dan Kota Atas. Pada wilayah Kota Bawah sebagian besar
pemanfaatan lahan digunakan untuk jalan, permukiman atau perumahan, bangunan,
halaman, kawasan industri, tambak, empang, dan persawahan. Kota Bawah dijadikan
sebagai pusat kegiatan pemerintahan, perdagangan, perindustrian, pendidikan dan
kebudayaan, angkutan atau transportasi dan perikanan. Berbeda dengan daerah
perbukitan atau Kota Atas yang merupakan kawasan hulu dari sungai-sungai besar yang
mengalir di Kota Semarang. Kota Atas meliputi Kecamatan Gajahmungkur, Candisari,
Banyumanik, Tembalang, Gunungpati, Ngaliyan dan Mijen.
Kota Semarang tergolong memiliki aneka objek wisata yang menarik dan terkenal
antara lain Lawang Sewu, Wonderia, Klenteng Sam Poo Kong, Pantai Marina,
Maerokoco, Goa Kreo, Museum Mandala Bhakti, Kota Tua Semarang. Sarana prasana
yang mendukung, sangat mendorong pertumbuhan dan minat investasi pada wilayah
tersebut.
Potensi sumber daya alam Kota Semarang tergolong melimpah sehingga
memiliki banyak lokasi pariwisata yang ramai dikunjungi wisatawan. Baik wisatawan
asing maupun dalam negeri. Selain sebagai pusat pemerintahan, Kota Semarang juga
merupakan pusat perdagangan dan bisnis yang termasuk dalam kawasan strategis
nasional (KSN). Pertumbuhan ekonomi di Kota Semarang cukup tinggi yang ditandai
dengan meningkatnya jumlah migrasi masuk, penurunan angka pengangguran, dan
meningkatnya pembangunan infrastruktur. Potensi sumber daya alam, pariwisata, dan
perekonomian tersebut tersebar di beberapa wilayah Kota Semarang.
1
Suatu wilayah mempunyai karakter tertentu yakni meliputi aspek fisik dan aspek
non fisik. Aspek- aspek tersebut merupakan salah satu cara untuk menerangkan
keragaman antar wilayah, salah satunya wilayah Kelurahan. Potensi desa menyediakan
data tentang keberadaan, ketersediaan, dan perkembangan potensi yang dimiliki setiap
wilayah administrasi pemerintahan. Untuk mengetahui wilayah Kelurahan yang
memiliki karakteristik yang sama, maka dapat dilakukan pengelompokan Kelurahan
berdasarkan potensi masing-masing Kelurahan.
Analisis Cluster merupakan salah satu metode statistika yang dapat digunakan
untuk melakukan proses pengelompokan. Analisis ini mengelompokkan suatu data
menjadi beberapa kelompok atau cluster sehingga data dalam cluster memiliki
karakteristik sama sedangkan data setiap cluster memiliki karakteristik yang berbeda.
Salah satu metode cluster yang digunakan dalam penelitian ini adalah metode K-means
Berdasarkan uraian di atas, penulis akan melakukan proses pengelompokan Kelurahan
di Kota Semarang berdasarkan potensi desa tahun 2020.
1.2 Rumusan Masalah
Rumusan masalah pada laporan Praktik Kerja Lapangan (PKL) ini adalah:
1. Bagaimana melakukan pengelompokan data banyak Kelurahan menggunakan
metode cluster K-means?
2. Bagaimana interpretasi dari hasil pengelompokan data dengan menggunakan
metode cluster K-means?
1.3 Batasan Masalah
Pembatasan masalah pada Laporan Praktik Kerja Lapangan (PKL) ini adalah:
1. Data yang digunakan dalam penelitian ini adalah data sekunder hasil pendataan
Potensi Desa (Podes) tahun 2020 yang dilaksanakan oleh BPS Kota Semarang.
2. Dalam analisis ini hanya menggunakan 20 variabel yang menggambarkan
administrasi setingkat Kelurahan.
3. Metode analisis cluster yang digunakan adalah cluster non-hirarki dengan
menggunakan metode K-means.
1.4 Tujuan PKL
Kegiatan Praktik Kerja Lapangan (PKL) ini bermaksud untuk memberikan gambaran
serta pengalaman bagi mahasiswa dalam mengimplementasikan ilmu pengetahuan yang
diperoleh selama kuliah dengan melakukan praktik secara langsung. Selain itu kegiatan ini
juga bertujuan sebagai berikut:
2
1. Memperluas wawasan berpikir mahasiswa terhadap permasalahan yang terdapat di
dunia nyata.
2. Sebagai wahana untuk mengaplikasikan teori dan ketrampilan praktis yang diperoleh
selama mengikuti perkuliahan.
3. Untuk dijadikan bekal dalam mempersiapkan diri ke dalam masyarakat dan dunia usaha
yang sesungguhnya.
4. Meningkatkan proses pembelajaran dan ilmu yang diperoleh pada perkuliahan dengan
tambahan latihan praktik kerja yang berkualitas serta profesional pada kondisi yang
terdapat di lingkungan kerja.
5. Menumbuhkan dan mengembangkan pendidikan karakter keahlian kerja serta
membentuk pribadi yang terampil, mandiri, dan percaya diri.
6. Terwujudnya kerjasama antara perguruan tinggi dengan pengguna lulusannya.
7. Untuk mengetahui dan memahami sistem dunia kerja secara utuh.
8. Untuk memenuhi beban SKS yang harus ditempuh sebagai persyaratan akademik
Program Studi S1 Matematika Universitas Islam Negeri Semarang.
1.5 Manfaat PKL
Praktek Kerja Lapangan/ PKL mempunyai manfaat yang besar bagi mahasiswa,
perguruan tinggi, perusahaan dan masyarakat, adapun manfaat PKL tersebut antara lain:
a. Manfaat bagi mahasiswa

1. Mahasiswa dapat mengaplikasikan dan meningkatkan ilmu yang diperoleh di
bangku perkuliahan.
2. Menambah wawasan mahasiswa mengenai dunia kerja.
3. Menambah dan meningkatkan keterampilan serta keahlian di bidang praktik.
b. Manfaat bagi perguruan tinggi
1. Terjalinnya kerjasama “bilateral” antara universitas dan instansi.
2. Universitas akan meningkatkan kualitas lulusannya melalui pengalaman kerja
selama Praktik Kerja Lapangan (PKL).
c. Manfaat bagi instansi
1. Membina hubungan baik dengan lembaga pendidikan atau perguruan tinggi.
2. Dapat membantu meringankan tugas-tugas pegawai instansi.
3. Dapat bertukar ilmu dengan mahasiswa yang melakukan Praktik Kerja Lapangan
(PKL).
3
BAB II
KAJIAN PUSTAKA
2.1 Analisis Cluster

2.1.1 Definisi Analisis Cluster
Analisis cluster adalah salah satu analisis multivariat yang termasuk dalam
metode interdependensi yaitu variabel bebas x atau faktor penyebab tidak dibedakan
dengan variabel terikat y atau respon. Analisis cluster adalah suatu metode statistik
yang mengidentifikasi kelompok sampel berdasarkan karakteristik serupa. Analisis
cluster mengelompokkan elemen mirip sebagai objek penelitian yang mempunyai
tingkat homogenitas yang tinggi antar objek menjadi cluster yang berbeda dengan
tingkat heterogenitas objek yang tinggi antar cluster. Pengklasteran ini didasarkan pada
gugus variabel yang dipertimbangkan untuk diteliti.
Analisis cluster harus memenuhi asumsi berikut:
a. Sampel yang diambil harus benar-benar dapat mewakili populasi.
b. Multikolinieritas yaitu korelasi antar objek. Sebaiknya tidak ada, bila ada maka
besar multikolinieritas tidaklah tinggi ( < 0,5)
2.1.2 Tujuan Analisis Cluster
Tujuan analisis cluster adalah mereduksi jumlah objek dengan
mengklasifikasikan objek (kasus atau elemen) ke dalam cluster yang relatif homogen.
Objek-objek di dalam satu cluster lebih mirip dibandingkan antar objek pada cluster
lain. Untuk menentukan kedua objek dikatakan mirip, perlu didefinisikan ukuran
kemiripan antar dua objek. Hal ini dilakukan untuk memperoleh matrik proximity yaitu
matriks persegi dan simetri dengan jumlah objek yang sama pada baris dan kolom.
Matriks ini menunjukkan kemiripan atau ketakmiripan antar objek.
2.1.3 Metode Analisis Cluster
Metode analisis cluster ada dua yaitu metode hirarki dan metode non hirarki
(pengklasteran K-means). Pengklasteran yang ideal adalah pengklasteran yang tiap
objek hanya masuk atau menjadi anggota dari salah satu cluster sehingga tidak terjadi
tumpang tindih atau overlapping.
2.1.3.1 Metode Hirarki
Metode ini memulai pengelompokan dengan dua atau lebih objek
yang mempunyai kesamaan paling dekat. Kemudian proses diteruskan ke
objek lain yang mempunyai kedekatan kedua. Demikian seterusnya sehingga
4
cluster membentuk “pohon”, dimana terdapat hirarki (tingkatan) yang jelas
antar objek. Dalam metode hirarki terdapat dua tipe dasar yaitu agglomerative
(pemusatan) dan divise (penyebaran).
Pada metode agglomerative dimulai dengan setiap objek berada
dalam n cluster yang berbeda. Cluster dibentuk dengan menggabungkan dua
cluster yang paling dekat lalu menentukan kembali kedekatan antar n−1
cluster yang baru. Dua cluster terdekat digabung lagi, begitu seterusnya
sampai didapat satu cluster yang memuat seluruh objek.
Metode agglomerative terdiri dari:
a. Linkage Method (Metode Linkage)
Metode ini dibagi lagi menjadi tiga metode yaitu:
1. Single Linkage
Metode ini didasarkan pada jarak terkecil. Jika dua objek terpisah oleh
jarak yang pendek sehingga objek tersebut akan digabung menjadi satu
cluster dan demikian seterusnya.
2. Complete Linkage
Metode ini hampir sama dengan single linkage hanya saja pada metode
ini menggunakan jarak yang paling jauh antara dua cluster yang
berbeda.
3. Average Linkage
Metode ini menggunakan rata-rata jarak antara semua pasangan objek
sebagai jarak antara dua cluster.
b. Ward Method (Metode Ward)
Metode ini berbeda dengan metode single linkage dan complete
linkage. Jika di dalam kedua metode hirarki tersebut menggunakan data jarak
Euclidean kuadrat sebagai pertimbangan, sedangkan dalam metode Ward yang
digunakan adalah error sum of square (ESS). Tujuan metode ini yaitu
memaksimalkan ukuran homogenitas dalam cluster. ESS cluster yang hanya
memiliki satu item adalah nol. Rumusnya adalah sebagai berikut:
k
ESS=∑ ( X i−X )2
i=1
dimana X adalah rata-rata (mean) nilai item dalam sebuah cluster, k adalah
jumlah anggota cluster.
c. Centroid Method (Metode Centroid)
5
Jarak antara dua cluster didefinisikan sebagai jarak Euclidean antar
kedua rataan (centroid) cluster. Jika x r dan x s adalah vector rataan (centroid)
cluster Br dan Bs , maka jarak antar dua cluster didefinisikan sebagai
h ( Br , B s )=d (x r , x s ). Centroid cluster baru yang terbentuk didapat dengan
rumus:
nr x r +n s x s
n r +n s
nr dan ns adalah banyaknya anggota cluster Br dan Bs .
2.1.3.2 Metode Non-Hirarki

Berbeda dengan metode hirarki, metode ini justru dimulai dengan
menentukan terlebih dahulu jumlah cluster yang diinginkan dan centroid di
tiap cluster. Metode K-means merupakan salah satu metode analisis non
hirarki yang mengelompokkan data dalam satu atau lebih cluster atau
kelompok. Metode K-means pada dasarnya adalah metode partisi yang
digunakan untuk menganalisis data dan memperlakukan pengamatan data
sebagai objek berdasarkan lokasi dan jarak antara tiap data. Data-data yang
memiliki karakteristik sama dikelompokkan dalam satu cluster atau kelompok
lain sehingga data yang berada dalam satu cluster memiliki tingkat variansi
yang kecil.
Metode ini digunakan untuk data dengan ukuran yang besar karena
memiliki kecepatan yang lebih tinggi dibandingkan metode hirarki. Menurut
Sitepu, dkk, proses pengelompokan dengan metode K-means sebagai berikut:
a. Menentukan besarnya nilai K, yaitu banyaknya cluster dan menentukan
centroid (pusat) di setiap cluster.
b. Menghitung jarak tiap objek dengan setiap centroidi.
c. Menghitung kembali rataan untuk cluster yang baru terbentuk.
d. Mengulang langkah kedua sampai tidak ada lagi pemindahan objek antar
cluster.
6
2.2 Desa
2.2.1 Pengertian Desa
Secara etimologi, desa berasal dari bahasa Sanskerta, yaitu “dhesi” yang
artinya tanah kelahiran. Sementara dalam Kamus Bahasa Indonesia, desa berarti
sekelompok rumah di luar kota yang merupakan kesatuan, kampung atau dusun.
Pengertian desa menurut para ahli diungkapkan secara berbeda-beda. Menurut Bintaro
(1984), desa merupakan perwujudan atau kesatuan geografi, sosial, ekonomi, politik,
serta kultural yang terdapat di suatu daerah dalam hubungan dan pengaruhnya secara
timbal balik dengan daerah lain. Sutarjo Kartohadikusumo (2002) mendefinisikan desa
sebagai kesatuan hukum tempat tinggal suatu masyarakat yang berhak
menyelenggarakan rumah tangganya sendiri yang merupakan pemerintahan terendah di
bawah camat.
Definisi desa menurut Undang-Undang Nomor 6 Tahun 2014 adalah kesatuan
masyarakat hukum yang mempunyai batas wilayah yang berwenang untuk mengatur
dan mengurus urusan pemerintahan, kepentingan masyarakat setempat yang didasarkan
pada prakarsa masyarakat, hak asal usul, dan/atau hak tradisional yang diakui dan
dihormati dalam sistem pemerintahan Negara Kesatuan Republik Indonesia.
Definisi desa secara lengkap diungkapkan oleh Landis (1948), yang
menyebutkan bahwa desa merupakan suatu wilayah yang jumlah penduduknya kurang
dari 2.500 jiwa dengan ciri-ciri sebagai berikut:
a. Memiliki pergaulan hhidup yang saling mengenal antarribuan jiwa;
b. Ada pertalian perasaan yang sama tentang kesukuan terhadap kebiasaan;
c. Cara berusaha (ekonomi) yang paling umum dilakukan adalah agraris atau
pertanian, yang sangat dipengaruhi oleh kondisi alam sekitar, seperti iklim,
keadaan alam, kekayaan alam, sedangkan pekerjaan yang bukan agraris adalah
bersifat sambilan.
2.2.2 Unsur Desa
Unsur desa merupakan satu kesatuan hidup atau living unit yang berpengaruh
terhadap kemajuan desa yang didukung oleh faktor usaha manusia atau human efforts
dan tata geografi atau geographical setting. Dilihat dari definisinya, desa mempunyai
tiga unsur utama, yaitu wilayah, penduduk, dan tata kehidupan.
a. Daerah/wilayah, yang terdiri atas lokasi atau letak, batas-batas wilayah, jenis tanah,
keadaan lahan, luas, juga pola pemanfaatannya.
7
b. Penduduk, yang meliputi tingkat kelahiran, jumlah penduduk, tingkat kematian,
kepadatan, pertumbuhan penduduk, persebaran, serta mata pencaharian penduduk.
c. Tata Kehidupan, yang terdiri atas pola tata pergaulan, serta ikatan pergaulan, adat
istiadat juga norma-norma yang berlaku di daerah tersebut.
2.2.3 Ciri-Ciri Desa
Menurut Rouceck dan Warren (1984) mengemukakan ciri-ciri masyarakat
pedesaan secara spesifik, antara lain:
a. Kelompok penduduk ang bermata pencaharian utama di daerah tertentu dan
memiliki peran yang cukup besar.
b. Dari segi kebudayaan, komunikasi keluarga terjalin secara langsung, mendalam,
dan informal.
c. Masyarakat desa merupakan suatu kelompok yang dibentuk berdasarkan faktor
geografis.
d. Hubungan masyarakat desa masih sangat bersifat kekeluargaan.
e. Dalam hal mobilitas penduduk, ada pada tingkatan yang rendah, baik mobilitas
yang bersifat horizontal (perpindahan tempat) maupun mobilitas sosial (status
sosial).
f. Keluarga di pedesaan yang masih tradisional memiliki banyak fungsi, khususnya
sebagai unit ekonomi.
2.2.4 Fungsi Desa
Desa memiliki kontribusi terhadap perkembangan daerah sekitarnya. Adapun
fungsi desa diantaranya adalah sebagai berikut:
a. Desa berfungsi sebagai pendukung (hinterland) atau daerah penyupalai bahan
makanan pokok.
b. Desa berfungsi sebagai penyumbang bahan mentah (raw material) sumber alam
mineral, hasil hutan, perkebunan dan tenaga kerja (man power) yang memiliki nilai
ekonomi.
c. Desa berfungsi sebagai desa agraris, desa manufaktur, desa industri, dan desa
nelayan sebagai daerh untuk kegiatan kerja (occupation).
2.2.5 Faktor Penentu Kemajuan Desa
Faktor-faktor yang menentukan kemajuan desa diantaranya sebagai berikut:
a. Potensi desa, mencakup sumber daya alam dan sumber daya manusia.
b. Interaksi dengan daerah lain
8
Interaksi dapat terjadi antara desa dengan desa, serta desa dengan kota.
Perkembangan komunikasi dan transportasi memudahkan interaksi desa dengan
daerah lain sehingga desa semakin maju.
c. Lokasi desa
Lokasi desa berkaitan dengan letak desa terhadap daerah di sekitarnya. Desa akan
lebih berkembang apabila lokasinya berdekatan dengan daerah yang lebih maju.
2.3 Potensi Desa
Potensi adalah segala sesuatu yang dimiliki tetapi belum dimanfaatkan. Potensi desa
merupakan segala sumber daya alam maupun sumber daya manusia yang terdapat, serta
tersimpan di desa. Semua sumber daya tersebut dapat dimanfaatkan bagi kelangsungan dan
perkembangan desa. Potensi desa terbagi menjadi dua, yaitu potensi fisik dan potensi
nonfisik.
2.3.1 Potensi Fisik
Potensi fisik desa merupakan potensi yang berhubungan dengan sumber daya
alam yang ada pada desa tersebut. Sumber daya yang termasuk potensi fisik adalah
sebagai berikut:
a. Potensi tanah/lahan
Lahan/ tanah memiliki potensi sebagai sumber tambang dan mineral, lahan untuk
tumbuhnya tanaman, pembangunan infrastruktur, rumah, jalan, dan sebagainya.
b. Potensi Air
Air memberikan potensi sebagai sumber air yang dapat digunakan untuk energi,
sumber air minum, irigasi, pertanian, dan kebutuhan hidup sehari-hari.
c. Potensi Iklim
Iklim memiliki potensi memberikan peran penting bagi desa yang bersift agraris.
Iklim dipengaruhi oleh ketinggian tempat. Desa dengan ketinggian tertentu
memiliki potensi untuk maju karena kecocokan iklimnya bagi pengembangan
tanaman dan pemanfaatan tertentu, seperti perkebunan buah, tempat rekreasi dan
tempat peristirahatan.
d. Potensi Flora dan Fauna
Potensi ini dapat dikembangkan untuk usaha di bidang pertanian. Beragam
tanaman pangan dan hewan ternak dihasilkan dari perdesaan. Hal itu merupakan
potensi untuk pemenuhan kebutuhan pangan di daerah perdesaan maupun di
perkotaan.
9
e. Potensi Manusia
Manusia merupakan potensi sumber tenaga kerja (potential man power), baik
sebagai pengolah tanah, produsen dalam bidang pertanian, maupun tenaga kerja
industri di kota.
2.3.2 Potensi Non Fisik
Potensi non fisik yang ada di desa adalah segenap potensi sumber daya sosial
dan budaya yang terdapat di desa yang bersangkutan. Sumber daya yang termasuk
potensi nonfisik, yaitu sebagai berikut:
a. Potensi masyarakat desa, yang hidup secara bergotong-royong menjadi kekuatan
produksi, serta pembangunan desa.
b. Potensi aparatur desa atau pamong desa, yang bekerja secara maksimal untuk
menjaga ketertiban dan kelancaran pemerintahan desa.
c. Potensi lembaga sosial desa, sebagai pendorong partisipasi warga desa dalam
kegiatan pembangunan desa secara aktif.
2.4 Kerangka Berpikir Teoritis
Badan Pusat Statistik (BPS) merupakan Lembaga Pemerintah Non Kementrian yang
berada dibawah dan bertanggung jawab langsung kepada Presiden. BPS mempunyai
perwakilan wilayah di Daerah sampai tingkat Kabupaten/Kota yang merupakan instansi
vertikal. Salah satu kegiatan yang dilakukan BPS adalah pendataan potensi desa. Potensi
Desa menyediakan data tentang keberadaan, ketersediaan, dan perkembangan potensi yang
dimiliki setiap wilayah administrasi pemerintahan. Tujuan dilakukan pendataan Podes adalah
untuk mengetahui perkembangan setiap wilayah baik dalam aspek fisik maupun aspek non
fisik. Untuk mengetahui setiap wilayah yang memiliki karakteristik sama, maka penulis
mengelompokkan Kelurahan berdasarkan variabel-variabel yang telah diuji.
Penelitian ini dimulai dengan pemilihan data, dimana data yang dipilih penulis adalah
data potensi desa tahun 2020 di Kota Semarang. Kemudian memilih variabel mana yang
dianggap penting dan dapat digunakan dalam penelitian ini, sedangkan variabel yang tidak
diolah maka tidak digunakan. Setelah variabel terpilih, selanjutnya dilakukan analisis
deskriptif untuk melihat gambaran umum potensi desa tahun 2020 di Kota Semarang.
Kemudian, melakukan uji asumsi cluster dengan uji multikolinieritas dan uji KMO. Setelah
itu melakukan standarisasi data untuk menyamakan satuan variabel yang berbeda dan
melakukan perhitungan jarak. Kemudian dilanjutkan proses pengklasteran dengan
menggunakan metode K-means, dimana kelompok atau cluster yang terbentuk sesuai dengan
karakteristik yang sama pada suatu wilayah.
10
Dasar kerangka teoritis dalam penelitian ini disajikan dalam bagan berikut ini:
Bagan 1. Alur Penelitian
Mulai
Data Potensi
Desa 2020
Analisis Deskriptif
Asumsi-Asumsi Cluster
Apakah
asumsi YA Standarisasi Data
terpenuhi
Perhitungan Jarak Euclidean
TIDAK
Penentuan K-means Cluster
Ubah Variabel Hapus
Uji Performa clValid Uji Performa SSE
Hasil Cluster K-means
Penentuan Karakteristik
Selesai
11
BAB III
METODOLOGI
3.1 Lokasi PKL

Praktik Kerja Lapangan (PKL) dilaksanakan di:
Nama Instansi : Badan Pusat Statistik (BPS) Kota Semarang
Alamat : Jl. Inspeksi Kali Semarang No.1, Sekayu, Kec. Semarang Tengah,
Kota Semarang, Jawa Tengah 50132.
Telp : (024) 3546413
Email : bps3374@bps.go.id
Website : semarangkota.bps.go.id
3.2 Rancangan PKL
Kegiatan Praktik Kerja Lapangan (PKL) merupakan kegiatan intrakulikuler terstruktur
sebagai wahana mahasiswa untuk memahami berbagai macam kegiatan dan situasi nyata
dalam dunia kerja. Untuk mencapai tujuan tersebut disusun rancangan kegiatan Praktik Kerja
Lapangan (PKL) sebagai berikut:
1. Melaksanakan observasi dan menentukan tempat Praktik Kerja Lapangan (PKL).
2. Menyususn proposal Praktik Kerja Lapangan (PKL) serta mengajukan surat
permohonan izin PKL dari Fakultas Sains dan Teknologi Universitas Islam Walisongo
Semarang.
3. Penyerahan proposal PKL serta surat pengantar PKL dari Fakultas Sains dan Teknologi
kepada Pimpinan BPS Kota Semarang.
4. Pembekalan PKL oleh ketua program studi Matematika kepada mahasiswa.
5. Penyerahan mahasiswa PKL oleh DPL prodi Matematika kepada Pimpinan BPS Kota
Semarang.
6. Pelaksanaan kegiatan PKL selama 6 minggu dimulai pada tanggal 21 Juni 2021 – 31
Juli 2021.
7. Penarikan mahasiswa PKL oleh DPL prodi Matematika.
8. Penyusunan laporan Praktik Kerja Lapangan (PKL).
9. Pengumpulan laporan Praktik Kerja Lapangan (PKL) kepada DPL.
10. Mempresentasikan Laporan Praktik Kegiatan Lapangan (PKL).
3.3 Objek PKL
Objek Praktik Kerja Lapangan (PKL) di Badan Pusat Statistik (BPS) Kota Semarang
adalah pengolahan data potensi desa tahun 2020 yang dikelola BPS Kota Semarang. Data
12
tersebut menghasilkan data berbasis kewilayahan yang mampu menggambarkan potensi yang
dimiliki oleh suatu wilayah setingkat desa.
3.4 Metode Pengumpulan Data
Dalam pengumpulan data penulis menggunakan beberapa metode antara lain:
a. Observasi
Observasi atau pengamatan merupakan teknik pengumpulan data dengan
melakukan pengamatan dan pencatatan secara sistematik terhadap gejala atau
fenomena yang ada pada objek penelitian. Dalam hal ini pengumpulan data
dilakukan secara tidak langsung atau data diperoleh dari pihak lain yaitu Badan
Pusat Statistik (BPS) Kota Semarang.
b. Dokumentasi
Dokumentasi merupakan teknik pengumpulan data dengan melakukan
pencarian data atau informasi yang berasal dari buku-buku, catatan-catatan,
transkip, surat kabar, majalah, prasasti, notulen rapat, agenda dan sebagainya.
Pengumpulan data yang didapatkan berupa data potensi desa tahun 2020 yang
berkaitan dengan penelitian.
3.5 Instrumen PKL
Dalam melaksanakan Praktik Kegiatan Lapangan (PKL), alat-alat yang biasa digunakan
adalah sebagai berikut:
a. Komputer
b. Pena
c. Printer
d. Scanner
e. Kertas A4
f. Pelubang kertas
3.6 Teknik Analisis Data
Menurut Sugiyono, yang dimaksud teknik analisis data adalah proses mencari data,
menyusun secara sistematis data yang diperoleh dari hasil wawancara, catatan lapangan, dan
dokumentasi, dengan cara mengorganisasikan data ke dalam kategori, menjabarkan ke dalam
unit, menyusun ke dalam pola, dan membuat kesimpulan sehingga mudah dipahami diri
sendiri maupun orang lain. Dalam penelitian ini perangkat lunak yang digunakan penulis
adalah SPPS 16.0 dan RStudio versi 4.0.5. Teknik analisis data yang dilakukan adalah
sebagai berikut:
13
3.6.1 Statistik Deskriptif
Statistik deskriptif adalah metode-metode yang berkaitan dengan pengumpulan
dan penyajian suatu data sehingga memberikan informasi yang berguna. Statistika
deskriptif berfungsi untuk mendeskripsikan atau memberi gambaran terhadap objek
yang diteliti melalui sampel atau populasi. Data yang disajikan dalam statistik
deskriptif biasanya dalam bentuk ukuran pemusatan data. Salah satu ukuran pemusatan
data yang digunakan adalah mean.
Selain itu, statistika deskriptif juga memberikan gambaran atau deskripsi suatu
data yang dilihat dari rata-rata (mean), standar deviasi, nilai maksimum, nilai minimum,
sum, range, kurtosis. Statistik deskriptif dalam penelitian juga menjadi proses
transformasi data dalam bentuk tabulasi. Tabulasi menyajikan ringkasan, pengaturan
dan penyusunan data dalam bentuk tabel numerik dan grafik.
3.6.2 Asumsi Analisis Cluster
a. Sampel yang Mewakili (Sample Representative)
Uji Kaiser-Mayer-Olkin (KMO) banyak digunakan untuk melihat syarat
kecukupan suatu sampel. Jika nilai KMO berkisar 0,5 sampai 1mka sampel dapat
dikatakan mewakili populasi atau sampel representatif. Rumus KMO adalah
sebagai berikt:
p p
∑ ∑ rX
2
j Xk
j=1 k=1, k ≠ j
KMO= p p p p
∑∑r 2
X jXk +∑ ∑ ρ
2
X j X k Xl
j=1 k ≠ j j=1 k ≠ j
Dimana:
p : banyaknya variabel
rX j Xk : korelasi antar variabel X j dan X k
Xj : rata-rata variabel X j
Xk : rata-rata variabel X k
n : banyaknya observasi (objek)
ρX j Xk Xl : korelasi parsial antara variabel X j dan X k dengan X l
b. Tidak Terdapat Multikolinieritas

Multikolinieritas adalah adanya hubungan linier yang sempurna atau pasti di
antara beberapa atau semua variabel. Sebaiknya multikolinieritas ini tidak terjadi
14
atau tidak terdapat multikolinieritas adalah menghitung nilai Varians Inflation
Factor (VIF) dengan rumus sebagai berikut:
1
VIF=
1−R2
Dengan R2 adalah nilai koefisien determinasi variabel dependen dengan variabel
independen. Multikolinieritas terindeksi apabila nilai VIF > 10. Salah satu yang
dapat dilakukan bila terjadi multikolinieritas adalah dengan mengeluarkan
variabel yang berkorelasi dalam model.
3.6.3 Pemilihan Ukuran Jarak
Tujuan analisis cluster adalah mengelompokkan objek yang mirip ke dalam
cluster yang sama. Oleh karena itu, memerlukan beberapa ukuran untuk mengetahui
seberapa mirip atau berbeda objek-objek tersebut. Pendekatan yang biasa digunakan
adalah mengukur kemiripan yang dinyatakan dalam jarak (distance) antara pasangan
objek. Jarak Squared Euclidean adalah jumlah kuadrat perbedaan deviasi di dalam nilai
untuk setiap variabel. Salah satu ukuran jarak ialah jarak squared euclidean. Jarak
Squared Euclidean antara kelompok objek ke-I dan kelompok objek ke-j dari p variabel
yang didefinisikan sebagai berikut:
p
d ij =∑ ( X ik −X jk )2
k=1
Dimana:
p : banyaknya variabel
d ij : jarak antara objek ke-i dan objek ke-j
X ik : data dari objek ke-i pada variabel ke-k
X jk : data dari objek ke-j pada variabel ke-k
3.6.4 Standarisasi Data
Proses standarisasi dilakukan apabila diantara variabel-variabel yang diteliti
terdapat perbedaan ukuran satuan yang besar. Perbedaan satuan yang mencolok dapat
mengakibatkan perhitungan pada analisis cluster menjadi tidak valid. Untuk itu, perlu
dilakukan proses standarisasi dengan melakukan transformasi (standarisasi data
sebelum dianalisis lebih lanjut). Transformasi dilakukan terhadap variabel yang relevan
ke dalam bentuk Z-skor.
3.6.5 Penentuan Cluster
Setelah data yang dianggap mempunyai satuan yang berbeda diseragamkan,
langkah selanjutnya adalah menentukan jumlah cluster. Penentuan jumlah cluster
15
dalam penelitian ini menggunakan K-means dengan metode elbow. Metode elbow
merupakan suatu metode yang digunakan untuk menghasilkan informasi dalam
menentukan jumlah cluster terbaik dengan cara melihat persentase hasil perbandingan
antara jumlah cluster yang akan membentuk siku pada suatu titik. Hasil persentase yang
berbeda dari setiap cluster dapat ditunjukkan dengan menggunakan grafik. Jika nilai
cluster pertama dengan nilai cluster kedua memberikan sudut dalam grafik atau
nilainya mengalami penurunan paling besar maka nilai cluster tersebut yang terbaik.
Untuk mendapatkan perbandingannya dengan menghitung SSE (Sum of Square Error)
dari masing-masing nilai cluster. Karena semakin besar jumlah cluster K maka nilai
SSE akan semakin kecil. Rumus SSE pada K-means adalah sebagai berikut:
K
SSE= ∑ ∑ ‖x i−c k‖
2
K=1 xi ∈S i
Dimana:
Si : kelompok data dalam cluster k
ck : rata-rata cluster k
3.6.6 Interpretasi Cluster

Setelah jumlah cluster terbentuk dengan menggunakan metode K-means, langkah
selanjutnya adalah melakukan interpretasi terhadap cluster yang telah terbentuk. Yang
pada intinya memberi nama spesifik untuk menggambarkan isi cluster tersebut. tahap
interpretasi meliputi pengujian tiap cluster dalam terminology untuk menamai dan
menandai dengan suatu label secara akurat dapat menjelaskan kealamian cluster. Proses
ini dimulai dengan suatu ukuran yang sering digunakan yaitu Centroid cluster.
Membuat profil dan interpretasi cluster tidak hanya untuk memperoleh suatu gambaran
saja, melainkan untuk menyediakan rata-rata untuk menilai korespondensi pada cluster
yang terbentuk serta profil cluster memberikan arahan bagi signifikasi praktis.
16
BAB IV
HASIL DAN PEMBAHASAN
4.1 Deskripsi Jadwal dan Kegiatan PKL

Penulis melaksanakan kegiatan Praktik Kerja Lapangan (PKL) pada tanggal 21 Juni
2021 – 31 Juli 2021. Adapun jadwal dan kegiatan Praktik Kerja Lapangan adalah sebagai
berikut:
Tabel 1. Jadwal Praktik Kerja Lapangan (PKL)
Hari Waktu Keterangan

07.30 -12.00 Jam kerja
12.00 – 13.00 Istirahat
Senin - Kamis
13.00 – 16.00 Jam kerja
16.00 Pulang
07.15 – 11.30 Jam kerja
11.30 – 13.00 Istirahat
Jum’at
13.00 – 16.30 Jam kerja
16.30 Pulang
Tabel 2. Kegiatan Praktik Kerja Lapangan (PKL)
Hari/ Tanggal Uraian Kegiatan

Penyerahan mahasiswa PKL
Perkenalan mahasiswa PKL dengan pegawai BPS Kota
Semarang
Senin, 21 Juni 2021 – Mengentry data LK Pemeriksaan STPIM-II A 2021
Jum’at, 25 Juni 2021 Membantu menyecan data
Mengelompokkan laporan kependudukan Kota
Semarang sesuai kecamatan
Mengentry data potensi desa 2021
Senin, 28 Juni 2021 – Mengentry data potensi desa 2021
Jum’at, 2 Juli 2021 Mengentry laporan kependudukan Kota Semarang
Senin, 5 Juli 2021 – WFH (Work From Home)
Jum’at, 9 Juli 2021 Mengentry laporan kependudukan Kota Semarang
17
Senin, 12 Juli 2021 – WFH (Work From Home)
Jum’at, 16 Juli 2021
WFH (Work From Home)
Senin, 19 Juli 2021 –
Membuat leaflet SAKERNAS (Survei Angkatan Kerja
Jum’at, 23 Juli 2021
Nasional)
WFH (Work From Home)
Senin, 26 Juli 2021 –
Membuat infographis status perkawinan
Sabtu, 31 Juli 2021
Pelepasan mahasiswa PKL
4.2 Deskripsi Data

Data awal dalam penelitian ini adalah data sekunder yang diperoleh dari Badan Pusat
Statistik (BPS) Kota Semarang. Data yang digunakan merupakan data potensi desa tahun
2020 di Kota Semarang. Kota Semarang memiliki 177 wilayah administrasi pemerintah
setingkat Kelurahan yang tersebar di 16 Kecamatan. Penulis melakukan penelitian ini dengan
menggunakan variabel-variabel yang terdiri dari: Jumlah TK/RA (X1), Jumlah SD/MI (X2),
Jumlah SMP/MTs (X3), Jumlah SMA/SMK/MA (X4), Jumlah posyandu (X5), Jumlah
apotek (X6), Jumlah tempat praktik dokter (X7), Jumlah puskesmas (X8), Jarak desa ke
kecamatan (km) (X9), Jarak desa ke kabupaten (km) (X10), Jumlah keluarga yang
berlangganan telepon kabel (X11), Jumlah menara telepon seluler (X12), Jumlah operator
layanan komunikasi (X13), Jumlah industry mikro dan kecil (X14), Jumlah sarana layanan
keuangan (X15), Jumlah koperasi (X16), Jumlah toko (X17), Jumlah pasar (X18), Jumlah
tempat ibadah (X19), dan Jumlah keluarga pengguna listrik PLN (X20).
4.3 Statistik Deskriptif
Data potensi desa merupakan data tentang keberadaan, ketersediaan, dan perkembangan
potensi yang dimiliki setiap wilayah administrasi pemerintahan. Dari data tersebut ingin
diketahui pengelompokan kondisi karakteristik wilayah di 177 Kelurahan pada Kota
Semarang menurut data potensi desa. Statistik deskriptif dapat dilihat sebagai berikut.
Tabel 3. Statistik Deskriptif Variabel Potensi Desa 2020 di Kota Semarang
Variabel N Minimum Maximum Mean Std. Deviation
Jumlah TK/RA 177 0 18 4.63 3.083
Jumlah SD/MI 177 0 10 3.38 1.904
Jumlah SMP/MTs 177 0 6 1.26 1.197
Jumlah SMA/SMK/MA 177 0 5 1.07 1.250
18
Jumlah posyandu 177 1 35 8.98 5.695
Jumlah apotek 177 0 11 1.79 1.842
Jumlah tempat praktik dokter 177 0 15 3.01 2.818
Jumlah puskesmas 177 0 3 .41 .548
Jarak desa ke kecamatan 177 1 15 3.20 2.301
Jarak desa ke kabupaten 177 1 22 8.74 5.629
Jumlah keluarga yang

177 0 2547 345.24 486.915
berlangganan telp kabel
Jumlah menara telp seluler 177 0 16 2.50 2.419
Jumlah operator layanan

177 3 7 5.04 .375
komunikasi
Jumlah IMK 177 0 121 23.14 23.226
Jumlah sarana layanan keuangan 177 0 20 2.26 3.443
Jumlah koperasi 177 0 8 .98 1.412
Jumlah toko 177 0 360 60.90 58.382
Jumlah pasar 177 0 5 .54 .805
Jumlah tempat ibadah 177 4 75 22.42 13.277
Jumlah keluarga pengguna listrik

177 201 7658 2839.07 1676.843
PLN
Valid N (listwise) 177
Pada tabel di atas, kolom N menyatakan jumlah data yang terisi dari setiap variabel
yang ada dimana besarnya tergantung jumlah data yang hilang. Seluruh variabel memiliki
nilai N sebanyak 177, artinya semua variabel untuk setiap data terisi. Kolom minimum
menyatakan jumlah data terendah dari setiap variabel. Kolom maximum menyatakan jumlah
data tertinggi dari setiap variabel. Dapat dilihat bahwa pada variabel jumlah TK/RA tertinggi
sebanyak 18 bangunan, jumlah posyandu tertinggi sebanyak 35, dan jumlah keluarga
pengguna listrik PLN tertinggi sebanyak 7658 jiwa dimiliki oleh kelurahan Sendangmulyo.
Pada variabel jumlah SD/MI tertinggi sebanyak 10 dimiliki oleh kelurahan Kalicari dan
Tlogosari Kulon. Pada variabel jumlah SMP/MTs tertinggi sebanyak 6 dimiliki oleh
kelurahan Wonolopo. Pada variabel jumlah SMA/SMK/MA tertinggi sebanyak 5 dimiliki
oleh kelurahan Srondol Wetan, Jatingaleh, Gayamsari, dan Wonolopo. Pada variabel jumlah
apotek tertinggi sebanyak 11 bangunan, jumlah tempat praktik dokter tertinggi sebanyak 15,
jumlah puskesmas tertinggi sebanyak 3, jumlah toko tertinggi sebanyak 360 bangunan
dimiliki oleh kelurahan Tlogosari Kulon.
19
Pada variabel jarak desa ke kecamatan terjauh sebesar 15 km yang berada di kelurahan
Sadeng. Pada variabel jarak desa ke kabupaten terjauh sebesar 22 km yang berada di
kelurahan Bubakan. Pada variabel jumlah keluarga berlangganan telepon kabel tertinggi
sebanyak 2547 keluarga yang berada di kelurahan Sendangguwo. Pada variabel jumlah
Menara telepon seluler tertinggi sebanyak 16 menara dimiliki oleh kelurahan Sekaran. Pada
variabel jumlah operator layanan komunikasi tertinggi sebanyak 7 dan jumlah tempat ibadah
tertinggi sebanyak 75 tempat berada di kelurahan Wonosari. Pada variabel jumlah IMK
tertinggi sebanyak 121 yang berada di kelurahan Krobokan.
Pada variabel sarana layanan keuangan tertinggi sebanyak 20 yang berada di kelurahan
Kranggan. Pada variabel jumlah koperasi tertinggi sebanyak 8 dimiliki oleh kelurahan
Pudakpayung. Pada variabel jumlah pasar terbanyak berada di kelurahan Kauman sebanyak 5
bangunan. Selain itu, pada kolom mean dan standar deviation merupakan nilai statistik dasar
untuk setiap variabel yang dihitung dari jumlah data yang valid (tidak missing).
4.4 Asumsi Analisis Cluster
a. Asumsi Sampel yang Mewakili
Asumsi ini dinyatakan dalam nilai Kaiser-Meyer-Olkin (KMO) Measure of
Sampling Adequacy. Berikut ialah hasil pengujian KMO keseluruhan variabel:
Tabel 4. Nilai KMO
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .816
Bartlett's Test of Sphericity Approx. Chi-Square 1.504E3
df 190
Sig. .000
Tabel di atas menunjukkan bahwa nilai Kaiser-Meyer-Olkin (KMO) Measure of

Sampling Adequacy keseluruhan sebesar 0,816 artinya sampel dapat mewakili
populasi dan korelasi antar variabel dapat dipakai untuk dianalisis lebih lanjut.
b. Asumsi Multikolinieritas
Hasil dari pengolahan uji asumsi multikolinieritas adalah sebagai berikut:
Tabel 5. Nilai VIF masing-masing variabel
Variabel VIF
X1 3.771
X2 2.014
X3 2.457
20
X4 2.423
X5 4.649
X6 3.022
X7 2.832
X8 1.326
X9 1.483
X10 1.953
X11 1.38
X12 1.366
X13 1.15
X14 1.855
X15 1.496
X16 1.479
X17 1.766
X18 1.343
X19 3.936
X20 2.399
Berdasarkan tabel 5, diketahui bahwa nilai VIF pada tiap variabel bernilai kurang
dari 10. Maka dapat disimpulkan bahwa tidak terjadi multikolinieritas antar
variabel-variabel tersebut.
4.5 Proses Pengklasteran
Pengelompokan K-means merupakan metode untuk penyusunan sub kelompok
pengamatan berdasarkan jarak suatu set data, sehingga seluruh kelurahan di Kota Semarang
akan dibentuk kelompok berdasarkan kedekatan nilai variabel. Untuk mengurangi bias karena
ukuran antar variabel berbeda, maka setiap variabel distandarkan nilainya terlebih dahulu.
Berdasarkan nilai-nilai variabel dapat dilihat masing-masing jarak antara keluharan seperti
pada Gambar 1.
Gambar 1. Jarak Nilai Variabel antar Kelurahan
21
Pada gambar 1. Jarak antar kelurahan berkisar antara 0 sampai 15. Semakin jauh jarak
antar kelurahan ditunjukkan oleh warna grafik yang semakin merah tua. Untuk perhitungan
jarak Euclid diperoleh dengan menggunakan bantuan software RStudio dan dapat dilihat pada
Tabel 6.
Tabel 6. Hasil Perhitungan Jarak Euclidean
No 1 2 3 4 5 6 …. 177
1 0 …
2 1.7346008 0 …
3 3.4787302 3.0196418 0 …
4 3.6065171 2.9340609 3.8828368 0 …
5 2.9159709 2.312769 2.6282687 3.1501151 0 …
6 3.0368941 2.9285627 2.6756031 4.12049 3.1619001 0 …
7 4.8683464 5.6120196 6.4797874 6.4018943 5.9076678 5.5491456 0
… … … … … … … …
177
Berdasarkan hasil perhitungan jarak Euclidean antara kelurahan Cangkiran dan

Bubakan memiliki jarak terdekat sebesar 1,7346008 sedangkan jarak Euclidean antara
kelurahan Cangkiran dengan Karangmalang sebesar 3,4787302. Semakin rendah nilai jarak,
semakin dekat objek-objek yang dipasangkan. Hal ini menunjukkan bahwa jarak Euclidean
antara kelurahan Cangkiran dan Bubakan memiliki karakteristik yang lebih mirip
dibandingkan dengan kelurahan Cangkiran dan Karangmalang. Demikian pula untuk
penafsiran objek lainnya.
Setelah melakukan perhitungan jarak Euclidean berdasarkan kemiripan karakteristik,
selanjutnya melakukan proses urutan algoritma K-means. Proses algoritma K-means
menggunakan sistem yang telah dibangun dimana percobaan input nilai K=1 sampai K=10.
Setelah itu, hasil cluster dianalisa dan dievaluasi untuk mencari jumlah K yang optimal
dengan menggunakan metode Elbow. Metode Elbow menghitung nilai selisih penurunan nilai
Sum of Square (SSE) yang paling besar dan berbentuk siku. Berikut disajikan dalam bentuk
grafik pada Gambar 2 dan Tabel 5 untuk nilai perbandingan SSE serta selisih SSE data total.
Gambar 2. Hasil Metode Elbow
22
Berdasarkan Gambar 2. Dapat dilihat bahwa nilai K optimum berada pada titik dua,
dimana titik tersebut merupakan titik siku. Sehingga jumlah cluster menurut metode Elbow
yaitu sebanyak 2 cluster.
Tabel 7. Uji Performa menggunakan SSE
Nilai K Besar SSE Selisih SSE

1 3520 0
2 2879.857 640.143
3 2600.668 279.189
4 2379.401 221.267
5 2242.524 136.877
6 2147.026 95.498
7 2060.974 86.052
8 1988.325 72.649
9 1902.73 85.595
10 1843.279 59.451
Hasil uji SSE pada Tabel 7 diketahui penurunan drastis terlihat pada titik 2 cluster.
Pada titik tersebut mengalami penurunan yang besar dibandingkan dengan yang lain. Setelah
itu, titik berikutnya penurunan cenderung stabil. Maka nilai K yang digunakan adalah 2.
Selain melakukan uji performa menggunakan SSE, untuk menghasilkan nilai K yang
tepat optimal maka dilakukan uji performa lainnya yaitu menggunakan clValid. Berikut
disajikan Tabel 8.
Tabel 8. Uji Performa menggunakan clValid
Score Method Clusters

Connectivity 58.3075 kmeans 2
Dunn 0.2122 kmeans 7
Silhouette 0.2581 kmeans 2
Pada Tabel 8 dihasilkan nilai Connectivity memiliki jumlah cluster sebanyak 2 segmen
karena memiliki nilai terendah dari yang lain yaitu 58,3075 yang menunjuk pada cluser 2.
Hasil dari Dunn memiliki nilai tertinggi diantara yang lain sebesar 0,2122 yang menunjuk
pada cluster 7. Sedangkan hasil Sillhouette memilik jumlah cluster sebanyak 2 segmen
karena memiliki nilai tertinggi diantara yang lain yaitu sebesar 0,2581. Sehingg dari data
tersebut didapatkan hasil yang sama pada uji Connectivity dan Sillhouette dimana nilai K
sama dengan 2 yang berarti jumlah cluster sebanyak 2 adalah yang optimal.
23
4.6 Eksekusi K-means
Hasil uji menggunakan metode Elbow menunjukkan bahwa pembagian Kelurahan
berdasarkan potensi desa sebanyak 2 cluster. Dimana jumlah anggota cluster 1 sebanyak 137
Kelurahan dan cluster 2 sebanyak 40 Kelurahan.
Tabel 9. Hasil Clustering Metode Elbow
Cluster Kelurahan
Cangkiran, Bubakan, Karangmalang, Polaman, Purwosari, Tambangan,
Mijen, Jatibarang, Kedungpani, Pesantren, Ngadirgo, Wonoplumbon,
Plalangan, Sumurejo, Pakintelan, Mangunsari, Patemon, Ngijo,
Nongkosawit, Cepoko, Jatirejo, Kandri, Pungangan, Kalisegoro, Sekaran,
Sukorejo, Sadeng, Gedawang, Jabungan, Banyumanik, Sumurboto, Srondol
Kulon Tinjomoyo, Bendan Duwur, Karang Rejo, Gajahmungkur, Bendan
Ngisor, Petompon, Bendungan, Lempongsari, Bulustalan, Barusari,
Randusari, Mugassari, Pleburan, Peterongan, Lamper Kidul, Lamper Lor,
Lamper Tengah, Jatingaleh, Karanganyar Gunung, Candi, Kaliwuru,
Wonotingal, Tegalsari, Rowosari, Kramas, Tembalang, Bulusan,
Mangunharjo, Jangli, Kedungmundu, Penggaron Kidul, Pedurungan Lor,
Tlogomulyo, Muktiharjo Kidul, Gebangsari, Bangetayu Wetan,
1 Sembungharjo, Penggaron Lor, Kudu, Karangroto, Trimulyo, Terboyo
Wetan, Terboyo Kulon, Pandean Lamper, Sambirejo, Sawahbesar,
Kaligawe, Tambakrejo, Karangturi, Karangtempel, Rejosari, Sarirejo,
Kebonagung, Bugangan, Mlatiharjo, Mlatibaru, Rejomulyo, Kemijen, Bulu
Lor, Plombokan, Panggung Kidul, Panggung Lor, Kuningan, Purwosari,
Dadapsari, Bandarharjo, Pekunden, Karangkidul, Jagalan, Brumbungan,
Miroto, Gabahan, Kranggan, Purwodinatan, Kauman, Bangunharjo,
Kembangsari, Pandansari, Sekayu, Pendrikan Kidul, Pendrikan Lor,
Ngemplaksimongan, Bongsari, Bojongsalaman, Cabean,
Salamanmloyo,Kalibanteng Kidul, Kalibanteng Kulon, Krapyak, Tambak
Harjo, Tawangsari, Karang Ayu, Tawangmas, Jerakah, Tugurejo,
Karanganyar, Randu Garut, Mangkang Wetan, Mangunharjo, Mangkang
Kulon, Podorejo, Wates, Ngaliyan, Bambankerep, dan Gondoriyo
2 Jatisari, Wonolopo, Gunungpati, Pudakpayung, Padangsari, Srondol Wetan,
Pedalangan, Ngesrep, Sampangan, Wonodri, Jomblang, Meteseh, Sendang
24
Mulyo, Sambiroto, Tandang, Sendangguwo, Gemah, Pedurungan Kidul,
Plamongan Sari, Pedurungan Tengah, Palebon, Kalicari, Tlogosari Kulon,
Tlogosari Wetan, Muktiharjo Lor, Genuksari, Bangetayu Kulon,
Banjardowo, Gayamsari, Siwalan, Tanjungmas, Kembangarum, Manyaran,
Gisikdrono, Krobokan, Bringin, Kalipancur, Purwoyoso, Tambakaji, dan
Wonosari
Gambar 3. Visualisasi Metode Elbow
Pada Gambar 3 adalah hasil visualisasi Metode Elbow yang memperlihatkan suatu
kelompok atau cluster Kelurahan yaitu anggota cluster 1 sebanyak 137 Kelurahan berwarna
merah dan anggota cluster 2 sebanyak 40 Kelurahan berwarna biru.
Tabel 10. Cluster Means Metode Elbow
Cluster
Variabel
1 2
X1 mean 3.47 8.6
X2 mean 2.87 5.15
X3 mean 1.05 1.98
X4 mean 0.869 1.75
X5 mean 6.93 16
X6 mean 1.28 3.55
25
X7 mean 2.35 5.28
X8 mean 0.314 0.75
X9 mean 3.17 3.3
X10 mean 8.5 9.55
X11 mean 238 712
X12 mean 2.18 3.6
X13 mean 5 5.18
X14 mean 16.8 44.9
X15 mean 1.84 3.7
X16 mean 0.745 1.8
X17 mean 45.6 113
X18 mean 0.467 0.8
X19 mean 18.4 36.2
X20 mean 2340 5535
Berdasarkan Tabel 8, maka dapat dilakukan profilisasi tiap kelompok yang terbentuk.
Pada cluster 1 menunjukkan nilai rata-rata masing-masing variabel rendah dibandingkan
cluster 1. Sehingga dapat disimpulkan bahwa cluster 1 adalah cluster yang memiliki potensi
tinggi. Sedangkan cluster 2 adalah cluster yang memiliki potensi rendah.
BAB V
26
PENUTUP
5.1 Kesimpulan
Berdasarkan hasil dari pengolahan data dan analisis yang telah dilakukan terhadap 177
data potensi desa tahun 2020 di Kota Semarang diperoleh kesimpulan sebagai berikut:
1. Cluster yang terbentuk pada pengelompokan potensi Kelurahan di Kota Semarang
dengan menggunakan cluster K-means metode Elbow sebanyak 2 cluster yaitu cluster 1
yang beranggotakan 137 Kelurahan dan cluster 2 beranggotakan 40 Kelurahan.
2. Hasil analisis menunjukkan nilai SSE (Sum Square of Error) mengalami penurunan
yang signifikan pada titik 2 yaitu memiliki selisih sebesar 640,143 dimana lebih besar
dari selisih titik yang lain. Hasil analisis dengan uji performa clValid menunjukkan
cluster optimal adalah 2 karena nilai Connectivity terkecil yaitu sebesar 58,3075 dan
nilai Sillhouette sebesar 0,2581 lebih kecil dari titik yang lain.
3. Profilisasi tiap kelompok menunjukkan bahwa pada cluster 1 memiliki nilai rata-rata
setiap variabel potensi Kelurahan rendah. Sedangkan pada cluster 2 memiliki nilai rata-
rata setiap variabel potensi Kelurahan tinggi. Sehingga dapat dikatakan cluster 1
berpotensi rendah dan cluster 2 berpotensi tinggi.
5.2 Saran
Pada penelitian ini penulis hanya menggunakan metode non-hirarki yaitu metode
cluster K-means berdasarkan data potensi desa. Oleh karena itu, untuk penelitian selanjutnya
dapat menggunakan metode yang lain, mengingat cakupan analisis cluster yang cukup
banyak serta dapat dikembangkan dengan mengaplikasikan pada bidang ilmu lainnya.
Diharapkan hasil penelitian ini dapat menjadi informasi bagi pemerintah agar kebijakannya
tepat sasaran.
DAFTAR PUSTAKA
27
Bawono, Icuk Rangga dan Erwin Setyadi. 2019. Optimalisasi Potensi Desa di Indonesia.
Jakarta: PT Grasindo
Nugroho, Sigit. 2008. Statistika Multivariat Terapan. Bengkulu: UNIB Press
Fathia, N. A. & Rahmawati, R. & Tarno. (2016). Analisis Klaster Kecamatan di Kabupaten
Semarang Berdasarkan Potensi Desa Menggunakan Metode Ward dan Single Linkage.
Jurnal Gaussian. 5(4): 801-810.
Shofiani, Nabilah. 2017. Segmentasi Supplier Menggunakan Metode K-Means Clustering
(Studi Kasus: PTPN X PG MERITJAN). Tugas Akhir. Tidak Diterbitkan. Fakultas
Teknologi Informasi. Institut Teknologi Sepuluh Nopember: Surabaya.
Imantika, D. & Bachtiar, F. A. & Rokhmawati, R. I. 2019. Penerapan Metode K-Means
Clustering dan Analytical Hierarchy Process (AHP) untuk Pengelompokan Kinerja
Guru dan Karyawan pada SMA Brawijaya Smart School. Jurnal Pengembangan
Teknologi Informasi dan Ilmu Komputer. 3(8): 7382-7390.
Alatubir, Desky A. V. 2017. Penerapan Algoritma K-Means untuk Pengelompokan Sekolah
Menengah Atas di Provinsi Daerah Istimewa Yogyakarta Berdasarkan Nilai Daya
Serap Ujian Nasional Bahasa Indonesia. Skripsi. Tidak Diterbitkan. Fakultas Sains dan
Teknologi. Universitas Sanata Dharma: Yogyakarta.
Izzadin, Fata. M. 2020. Optimalisasi Jumlah Cluster K-Means dengan Metode Elbow dan
Sillhouette pada Produktivitas Tanaman Pangan di Provinsi Jawa Tengah Tahun 2020.
Tugas Akhir. Tidak Diterbitkan. Fakultas Matematika dan Ilmu Pengetahuan Alam.
Universitas Islam Indonesia: Yogyakarta.
Tambunan, Amy. 2008. Analisis Potensi Desa Provinsi Lampung dalam Penyediaan
Layanan Telekomunikasi USO (Universal Service Obligation) oleh BTIP dengan
Statistika Multivariat. Skripsi. Tidak Diterbitkan. Fakultas Teknik. Universitas
Indonesia: Depok.
Ardra.biz. Pengertian Desa: Unsur Fungsi Ciri Potensi Non Fisik Struktur Pola Swadaya
Swakarsa Swasembada. Diakses pada 3 Agustus 2021 dari
https://ardra.biz/topik/pengertian-potensi-desa/
LAMPIRAN
28
Lampiran 1: Data Potensi Desa Tahun 2020 Kota Semarang
Lampiran 1: (Lanjutan)
29
Variabel Keterangan
Jumlah TK/RA
X1
Jumlah SD/MI
X2
Jumlah SMP/MTs
X3
Jumlah SMA/SMK/MA
X4
Jumlah posyandu
X5
Jumlah apotek
X6
Jumlah tempat praktik dokter
X7
Jumlah puskesmas
X8
Jarak desa ke kecamatan (km)
X9
Jarak desa ke kabupaten (km)
X10
Jumlah keluarga yang berlangganan telepon kabel
X11
Jumlah menara telepon seluler
X12
Jumlah operator layanan komunikasi
X13
Jumlah industri mikro dan kecil
X14
Jumlah sarana layanan keuangan
X15
Jumlah koperasi
X16
Jumlah toko
X17
Jumlah pasar
X18
Jumlah tempat ibadah
X19
Jumlah keluarga pengguna listrik PLN
X20
Lampiran 8: Foto-Foto Kegiatan
30
31
32

Laporan

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Laporan

Diunggah oleh

Hak Cipta:

Format Tersedia

LAPORAN

PRAKTIK KERJA LAPANGAN (PKL)

ANALISIS CLUSTER DENGAN MENGGUNAKAN METODE K-MEANS

Hilda Affa Maghfiroh (1808046016)

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI WALISONGO SEMARANG

LAPORAN PRAKTIK KERJA LAPANGAN

Dengan ini menyatakan bahwa kegiatan Praktik Kerja Lapangan mahasiswa

Nama : Hilda Affa Maghfiroh

Dosen Pembimbing Lapangan Pembimbing Lapangan

M. Tafrikan, M.Si Rina Wulanjari

Ketua Program Studi

Hj. Emy Siswanah, M.Sc

Dengan segala keterbatasan pengetahuan serta kemampuan, penulis menyadari bahwa

Rembang, 5 Agustus 2021

1.1 Latar Belakang…………………………………………………............1

BAB II KAJIAN PUSTAKA………………………………………………………....4

2.1 Analisis Cluster…………………………………………………..........4

BAB III METODOLOGI………..…………………………………………………...12

3.1 Lokasi PKL……………………………………..…………………......12

BAB IV HASIL DAN PEMBAHASAN……………………………………………..17

4.1 Deskripsi dan JadwalKegiatan PKL………………..………………..17

BAB V KESIMPULAN DAN SARAN………………………………………........27

Nama : Hilda Affa Maghfiroh

Program Studi : Matematika

Fakultas : Sains dan Teknologi

Judul Laporan : Analisis Cluster dengan Menggunakan Metode K-means

Dosen Pembimbing : M. Tafrikan, M.Si

Pembimbing Lapangan : Rina Wulanjari

1.1 Latar Belakang

a. Manfaat bagi mahasiswa

2.1 Analisis Cluster

2.1.3.2 Metode Non-Hirarki

Bagan 1. Alur Penelitian

Perhitungan Jarak Euclidean

Uji Performa clValid Uji Performa SSE

Hasil Cluster K-means

3.1 Lokasi PKL

b. Tidak Terdapat Multikolinieritas

3.6.6 Interpretasi Cluster

HASIL DAN PEMBAHASAN

4.1 Deskripsi Jadwal dan Kegiatan PKL

Hari Waktu Keterangan

Tabel 2. Kegiatan Praktik Kerja Lapangan (PKL)

Hari/ Tanggal Uraian Kegiatan

4.2 Deskripsi Data

Tabel 3. Statistik Deskriptif Variabel Potensi Desa 2020 di Kota Semarang

Variabel N Minimum Maximum Mean Std. Deviation

Jumlah TK/RA 177 0 18 4.63 3.083

Jumlah SD/MI 177 0 10 3.38 1.904

Jumlah SMP/MTs 177 0 6 1.26 1.197

Jumlah SMA/SMK/MA 177 0 5 1.07 1.250

Jumlah apotek 177 0 11 1.79 1.842

Jumlah tempat praktik dokter 177 0 15 3.01 2.818

Jumlah puskesmas 177 0 3 .41 .548

Jarak desa ke kecamatan 177 1 15 3.20 2.301

Jarak desa ke kabupaten 177 1 22 8.74 5.629

Jumlah keluarga yang

Jumlah menara telp seluler 177 0 16 2.50 2.419

Jumlah operator layanan

Jumlah IMK 177 0 121 23.14 23.226

Jumlah sarana layanan keuangan 177 0 20 2.26 3.443

Jumlah koperasi 177 0 8 .98 1.412