Tugas Uas Sistem Informasi Data Warehouse Dan Business Inteligence Compress

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN INDIKATOR
TINGKAT PENGANGGURAN MENGGUNAKAN
ALGORITMA K-MEANS CLUSTERING
(Studi Kasus: Provinsi Jawa Tengah)
Diajukan untuk memenuhi salah satu tugas komponen penilaian Mata Kuliah
Data Warehouse dan Bussiness Inteligence
Disusun oleh:
1. Rizkia Meisela 19221114
2. Maylani Azzahra 19221147
3. Tina Kurnianingsih 19221508
Program Studi Sistem Informasi Kampus Kota Sukabumi
Fakultas Teknik dan Informatika
Universitas Bina Sarana Informatika
2022
0 0
KATA PENGANTAR
Puji syukur alhamdulillah, penulis panjatkan kehadirat Allah SWT yang telah
melimpahkan rahmat dan karunia-Nya berupa kesempatan dan pengetahuan,
sehingga pada akhirnya penulis dapat menyelesaikan tugas ini dengan baik dan
selesai tepat waktu. Judul yang terkait “Pengelompokan Kabupaten/Kota
Berdasarkan Indikator Tingkat Pengangguran Menggunakan Algoritma K-
Means clustering (Studi Kasus: Provinsi Jawa Tengah)” .
Tujuan Penulisan penelitian ini dibuat sebagai salah satu tugas UAS di
Universitas Bina Sarana Informatika Kota Sukabumi. Sebagai bahan penulisan
diambil berdasarkan hasil penelitian, observasi dan beberapa sumber literatur yang
mendukung penulisan ini. Penulis menyadari bahwa tanpa adanya bimbingan dan
dorongan dari semua pihak, maka penulisan tugas ini tidak akan lancar. Oleh karena
itu pada kesempatan ini, izinkanlah penulis menyampaikan ucapan terima kasih
kepada:
1. Direktur Universitas BSI Kampus Kota Sukabumi
2. Ketua Program Studi Sistem Informasi Universitas BSI Kampus Kota Sukabumi
3. Bapak Taufik Hidayatuloh, M. Kom selaku Dosen Pengampu Mata Kuliah Data
Warehouse and Business Inteligency
4. Orang tua tercinta yang tekah memberikan dukungan moral maupun spiritual
5. Seluruh rekan-rekan di Unibersitas BSI Kota Sukabumi khususnya rekan-rekan
kelas Sistem Informasi yang telah memberikan kritik dan saran kepada penulis
6. Sahabat dan teman dekat yang tidak bisa disebutkan satu persatu yang telah
memberi semangat selama penyelesaian tugas ini.
0 0
Akhir kata, semoga Allah SWT senantiasa melimpahkan karunianya dan
membalas segala amal budi serta kebaikan pihak pihak yang telah membantu penulis
dalam penyusunan laporan tugas unu dan semoga laporan ini bermanfaat dan dapat
memperluas wawasan bagi para pembaca. Penulis menyadari bahwa laporan ini
masih belum sempurna. Oleh karena itu, penulis mengharapkan kritik dan saran yang
membangun demi perbaikan dan kesempurnaan laporan ini.
Sukabumi, November 2022
Penulis
0 0
DAFTAR ISI
Halaman
Lembar Judul ................................................................................................................i
Kata Pengantar..............................................................................................................ii
Daftar Isi......................................................................................................................vi
BAB I PENDAHULUAN...........................................................................................1
1.1. Latar Belakang Penulisan......................................................................1
1.2. Masalah Penelitian................................................................................3
1.2.1. Identifikasi Masalah......................................................................3
1.2.2. Batasan Masalah............................................................................3
1.2.3. Rumusan Masalah..........................................................................4
1.3. Tujuan Penelitian...................................................................................4
1.3.1. Tujuan Penelitian...........................................................................4
1.3.2. Manfaat Penelitian.........................................................................4
BAB II LANDASAN TEORI....................................................................................6
2.1. Konsep Dasar Data Mining...................................................................6
2.1.1.Definisi Data Mining......................................................................6
2.1.2. Tahap – Tahap Data Mining..........................................................7
2.2. Algoritma K-Means…….......................................................................9
2.2.1.Pengertian Algoritma K-Means......................................................9
2.3.Rapid Miner.........................................................................................10
2.4. Badan Pusat Statistik (BPS)................................................................10
2.4.1.Pengertian Badan Pusat Statistik (BPS).......................................10
2.5. Tahapan Penelitian..............................................................................10
2.6. Instrumen Penelitian............................................................................12
2.7. Metode Pengumpulan Data.................................................................13
2.8. Variabel Data.......................................................................................13
2.9. Penelitian Terkait.................................................................................13
BAB III PEMBAHASAN DAN HASIL..................................................................21
3.1. Pengolahan Data Awal.........................................................................21
3.2. Preprocessing……..............................................................................22
3.3. Perhitungan K-Means …….................................................................24
0 0
3.4. Langkah – langkah implementasi Rapidminer....................................28
3.5. Pembahasan…….................................................................................32
BAB IV PENUTUP...................................................................................................35
4.1. Kesimpulan.........................................................................................35
4.2. Saran....................................................................................................36
DAFTAR PUSTAKA................................................................................................37
0 0
BAB I
PENDAHULUAN
1.1. Latar Belakang Penulisan
Indonesia dianggap sebagai negara. Indonesia merupakan salah satu
negara dengan potensi paling besar dalam hal ketersediaan tenaga kerja, dan
itu harus menjadi sumber kekuatan pendorong dalam perekonomia. Namun,
kesulitan di Indonesia adalah bahwa populasi dan tenaga kerja di negara
berkembang menjadi suatu beban bagi pembangunan negara daripada asset
potensial yang dapat digunakan untuk mendorong ekonomi. Besarnya
pengangguran berdampak pada laju keberhasilan pembangunan ekonomi
(Prawira & Syurifto, 2018) . Pengangguran merupakan masalah utama di
negara non-industri seperti Indonesia, dengan pertumbuhan penduduk yang
sangat tinggi, akses pekerjaan yang tidak merata, penduduk dengan usia kerja
yang tidak dapat mengikuti perkembangan teknologi yang pesat, perubahan
ekonomi, tingkat Pendidikan, dll. Struktur dan ukuran upah yang disebabkan
oleh berbagai macam factor (Putrie & Sanjaya, 2021).
Jawa Tengah, salah satu Provinsi di Indonesia, masuk dalam kategori
pengangguran yang jumlahnya sering menurun, namun masih cukup tinggi.
Jumlah pengangguran dapat meningkat setiap tahunnya. Tingkat
pengangguran di Jawa tengah pada tahun 2019 sebesar 4,44%, tingkat
pengangguran terbuka di Jawa Tengah pada tahun 2020 meningkat menjadi
6,48%, dan menurun menjadi 5,95% pada tahun 2021 (Purboningtyas et al.,
2020) .Pengangguran yang tinggi sangat mempengaruhi mempengaruhi
0 0
2
tingkat kemiskinan di beberapa daerah (Bintang & Woyanti, 2018).
Akibatnya adalah salah satu penentu utama tingkat kemiskinan, penelitian
yang lebih mendalam tentang pengangguran dan indikator yang sangat
mempengaruhi tingkat pengangguran perlu dilakukan. Dengan memanfaatkan
metode pengelompokan salah satunya.
clustering adalah salah satu Teknik Analisa data mining (Sanjaya &
Fitriyani, 2019) , clustering adalah teknik untuk membagi dataset menjadi
kelompok-kelompok atau cluster berdasarkan suatu kesamaan yang telah
ditentukan (Setiawan, 2017). Metode K-Means merupakan metode
pengelompokan yang mengelompokan suaty data berdasarkan dengan pusat
cluster (cetroid) yang paling dekat dengan data tersebut (Talakua et al., 2017).
K-Means bertujuan untuk mengorganisasikan data dengan meningkatkan
kesamaan data dalam kelompok dan mengurangi kesamaan data antar cluster
(Fitriyani & Sanjaya, 2018).
Kelebihan Algoritma K-Means diantaranya dalah mampu
mengelompokan objek besar dan pencilan obyek dengan sangat cepat
sehingga mempercepat proses pengelompokan. Kekurangan Algoritma K-
Means yaitu sangat sensitive pada pembangkitan titik pusat awal secara
random, hasil pengelompokan bersifat tidak unik (selalu berubah-ubah) dan
proses pengerjaannya cepat tetapi keakuratannya tidak dijamin (Bastian et al.,
2018).
Pada penelitian yang telah dilakukan sebelumnya, yaitu tentang
pengelompokan tingkat pengangguran di Sulawesi Selatan dengan indikator
TPT, UMK, dan IPM, penelitian ini kemudian akan memanfaatkan indikator
jumlah penduduk dan upah minimum Kabupaten/Kota disamping jumlah
0 0
3
pengangguran sebagai acuan utama. Data yang digunakan pada penelitian ini
adalah data Badan Pusat Statistik (BPS) Jawa Tengah Tahun 2019-2021.
Hasil pengelompokan yang diperoleh nantinya dapat digunakan untuk
menjelaskan bagaimana pemerintah daerah melakukan penanganan masalah
pengangguran dengan mengkaji factor-faktor yang mempengaruhi
pengangguran, seperti jumlah penduduk dan upah.
Berdasarkan latar belakang tersebut, maka penelitian ini mengambil
judul “Pengelompokan Kabupaten/Kota Berdasarkan Indikator Tingkat
Pengangguran Menggunakan Algoritma K-Means clustering (Studi
Kasus: Provinsi Jawa Tengah)”
1.2. Masalah Penelitian
1.2.1. Identifikasi Masalah
Berdasarkan latar belakang yang telah diuraikan terdapat
permasalahan yang terjadi, yaitu masalah pengangguran yang selalu muncul
setiap tahuannya. Pengelompokan daerah pengangguran berdasarkan
indikator tingkat pengangguran sangat penting karena keberhasilan
pengelompokan tingkat pengangguran dapat digunakan untuk menjelaskan
bagaimana pemerintah daerah menangani masalah pengangguran.
Pengelompokan jumlah pengangguran tidak mudah diramalkan secara linier.
Sehingga diperlukan metode yang bisa mendapatkan hasil untuk
mengidentifikasi pengelompokan daerah pengangguran berdasarkan indikator
tingkat pengangguran dengan akurat untuk membantu pemerintah dalam
menangani masalah tersebut.
0 0
4
1.2.2. Batasan Masalah
Sejumlah permasalahan yang dibahas dalam usulan penelitian ini akan
dibatasi ruang lingkup pembahasannya, antara lain:
a. Data-data masukan berupa data pengangguran terbuka , jumlah penduduk
dan upah minimum periode 2019-2021, dari website resmi Badan Pusat
Statistik (BPS) Jawa Tengah.Apakah algoritma K-Means clustering dapat
digunakan sebagai metode pengambilan keputusan pemecahan masalah
untuk mengidentifikasi pengelompokan daerah pengangguran sesuai
dengan indikator pengangguran di Jawa Tengah?
1.2.3. Rumusan Masalah
Rumusan masalah dalam penelitian ini adalah Bagaimana menerapkan
algoritma K-Means clustering sebagai metode untuk mengidentifikasi
pengelompokan daerah pengangguran di Jawa Tengah.
1.3. Tujuan Penelitian
1.3.1. Tujuan Penelitian
Tujuan dari penelitian ini adalah untuk mendapatkan hasil
pengelompokan Kabupaten/Kota di Provinsi Jawa Tengah berdasarkan
indikator tingkat pengangguran.
1.3.2. Manfaat Penelitian
a. Manfaat Praktis
Menghasilkan keluaran berupa metode yang digunakan untuk
menentukan keakuratan pengelompokan daerah pengangguran sesuai
0 0
5
dengan indikator tingkat penganguran di Jawa Tengah. Dan dapat
digunakan untuk menjelaskan bagaimana pemerintah daerah menangani
masalah pengangguran.
b. Manfaat Teoritis
Hasil dari penelitian ini merupakan bukti empiris dari hasil suatu
percobaan penggunaan metode K-Means clustering sebagai metode
pengambilan keputusan pemecahan masalah dalam keakuratan
mengidentifikasi pengelompokan daerah pengangguran berdasarkan
indikator tingkat pengangguran.
0 0
BAB II
LANDASAN TEORI
2.1. Konsep Dasar Data Mining
2.1.1. Definisi Data Mining
Data Mining merupalan bidang dari beberapa bidang keilmuan yang
menyatukan Teknik dari pembelajaran mesin, pengenalan pola, statistik,
database, dan visualisasi untuk pengenalan permasalahan pengambilan
informasi dari database yang besar (Setiawan, 2017).
Data mining juga dapat dijelaskan sebagai pengolahan untuk
memperoleh informasi dengan menggunakan Teknik matematika, statistic,
machine learning dan artificial intelligence untuk mengidentifikasi
pengetahuan yang bermanfaat serta terikat dari bermacam data warehouse
atau database yang besar (R et al., 2022).
Tugas data mining bisa dikelompokan ke dalam enam kelompok
berikut ini: (Manurung & Hasugian, 2019)
1. Klasifikasi (classification): men-generalisasi susunan yang diketahui
untuk diaplikasikan pada data-data terbaru. Misalkan, klasifikasi penyakit
kedalam sejumlah jenis, klasifikasi email ke dalam spam atau bukan.
2. Klasterisasi (clustering): mengklasifikasikan data, yang tidak diketahui
label kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan
ukuran kemiripannya.
3. Regresi (regression): menemukan suatu fungsi yang memodelkan data
dengan kesalahan prediksi sekecil mungkin.
0 0
7
4. Deteksi anomaly (anomaly detection): mengidentifikasikan data yang
tidak biasa, bisa berupa outler (pencilan), perubahan atau deviasi yang
mungkin sangat penting dan perlu investigasi lebih lanjut.
5. Pembelajaran atauran asosiasi (association rule learning) atau
permodelan kebergantungan (dependency modeling): mencari relasi antar
variable
6. Perangkuman (summarization): menyediakan representasi data yang
lebih sederhana, meliputi visualisasi dan pembuatan laporan.
2.1.2. Tahap – Tahap Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi
beberapa tahap proses yang di ilustrasikan pada gambar 1. Tahap – tahap
tersebut bersifat interaktif, pemakai terlohat langsung atau dengan perantara
knowledge base.
Gambar 1. Tahap - tahap Data Mining (Han & Kaufmann, 2006)
0 0
8
Tahap – tahap Data Mining adalah sebagai berikut : (Ridwan et al., 2018)
1. Pembersihan data (data cleaning)
Pembersihan data merupakan proses menghilang-kan noise dan data
yang tidak konsisten atau data tidak relevan.
2. Integrasi data (data integration)
Integrasi data merupakan penggabungan data dari berbagai database
ke dalam satu database baru.
3. Seleksi data (data selection)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai untuk dianalisis yang akan diambil
dari database.
4. Tranformasi data (data transformation)
Data diubah atau digabung ke dalam format yang sesuai untuk
diproses dalam data mining.
5. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk
menemukan pengetahuan berharga dan tersembunyi dari data.
Beberapa metode yang dapat digunakan berdasarkan pengelompokan
data mining dapat dilihat pada Gambar 2.
0 0
9
Gambar 2. Beberapa Metode Data Mining
6. Evaluasi pola (pattern evaluation)
Untuk mengidentifikasi pola – pola menarik ke dalam knowledge
based yang ditemukan.
7. Presentasi pengetahuan (knowledge presentation)
Merupakan visualisasi dan penyajian pengetahuan mengenai metode
yang digunakan untuk memperoleh pengetahuan yang diperoleh
pengguna.
2.2. Algoritma K-Means
2.2.1. Pengertian Algoritma K-Means
Algoritma K-means merupakan salah satu algoritma dengan
partitional, karena K-means didasarkan pada penentuan jumlah awal
kelompok dengan mengidentifikasikan nilai centroid awalnya. Algoritma K-
means menggunakan proses secara berulang – ulang untuk mendapatkan
basis data cluster. Dibutuhkan jumlah cluster awal yang diinginkan sebagai
0 0
10
masukan dan menghasilkan titik centroid akhir sebagai output (R. A.
Indraputra & Fitriana, 2020).
Algoritma K-Means memiliki kelebihan yaitu algoritmanya
sederhana, mudah di implementasikan. Dan merupakan salah satu metode
yang cukup efisien dalam hal komplektisitas nya O (nkt). Sedangkan untuk
kekurangannya yaitu mempunyai masalah sensitifitas terhadap penentuan
partisi awal jumlah cluster (k) dan solusi akhir menyatu pada local minima.
Penentuan partisi
2.3. RapidMiner
Rapidminer merupakan software/perangkat lunak untuk pengolahan
data. Dengan menggunakan prinsip dan algoritma data mining, Rapidminer
mengekstrak pola-pola dari dataset yang besar dengan mengkombinasikan
metode statistika, kecerdasan buatan dan database (C.T.I et al., 2017).
2.4. Badan Pusat Statistik (BPS)
2.4.1. Pengertian Badan Pusat Statistik (BPS)
Badan Pusat Statistik (BPS) adalah lembaga pemerintahan non-
departemen di Indonesia yang mempunyai fungsi pokok sebagai penyedia data
dan informasi statistic, baik untuk pemerintah maupun untuk masyarakat
umum, secara nasional maupun regional (Bacsafra et al., 2022).
2.5. Tahapan Penelitian
Tahap ini, akan menjelaskan gambaran metode penelitian yang
digunakan. Gambar 1 menggambarkan langkah-langkah yang diambil pada
penelitian ini.
0 0
11
Gambar 2. 1. Desain Penelitian
1. Identifikasi Masalah
Bagaimana menerapkan algoritma K-Means clustering untuk
mengidentifikasi pengelompokan daerah pengangguran sesuai dengan
indikator pengangguran yang digunakan.
2. Pengumpulan Data
Penulis menggunakan website resmi Badan Pusat Statistik (BPS) Jawa
Tengah https://jateng.bps.go.id/ untuk melakukan pengamatan langsung
terhadap apa yang sedang diteliti. Data yang diperoleh adalah pengangguran,
jumlah penduduk dan upah minimum periode 2019-2021.
3. Pemodelan K-Means clustering
Pemodelan yang digunakan terhadap objek penelitian yaitu menentukan
jumlah cluster dalam data, kemudian menentukan nilai pusat atau centroid,
dan terakhir menggunakan jarak Euclidean Distance untuk menghitung jarak
terdekat ke centroid untuk mendapatkan kelompok terbaik
0 0
12
4. Evaluasi dan Validasi
Langkah selanjutnya adalah evaluasi cluster yang dihasilkan berdasarkan
jumlah dan kedekatan antar data hasil cluster. Proses evaluasi disini
menggunakan Davies-Bouldin Index (DBI).
5. Hasil
Hasil analis data yang diproses sebelumnya akan diuji pada tahap ini. Adapun
mekanisme pengujian hasil adalah sebagai berikut:
a. Dataset pertama akan dikumpulkan berupa statistik pengangguran,
jumlah penduduk dan upah minimum di wilayah/kota Jawa Tengah dari
tahun 2019 hingga 2021. Data berikut dievaluasi menggunakan algoritma
K-Means.
b. Data yang telah dievaluasi, dimasukan menggunakan kriteria pada
metode K-Means dan dihitung secara manual.
c. Data yang di analisis kemudian akan di proses dan diperiksa
menggunakan aplikasi Rapidminer (alat pengukuran pengujian, tingkat
kesalahan/akurasi)
d. Hasil yang didapat dari perhitungan data secara manual menggunakan
kriteria metode K-Means, kemudian dibandingkan dengan perhitungan
data yang dilakukan menggunakan program Rapidminer.
2.6. Instrument Penelitian
berdasarkan permasalahan yang dijelaskan sebelumnya, maka bahan
dan peralatan yang dibutuhkan untuk penelitian ini adalah:
a. Dataset
0 0
13
Terdapat 35 data dalam dataset yang digunakan dalam penelitian ini, antara
lain pengangguran, jumlah penduduk dan Upah Minimum Kabupaten/Kota
tahun 2019-2021 sebanyak 315 data. Data tersebut di dapatkan dari hasil
riset website resmi Badan Pusat Statistik (BPS) Jawa Tengah.
b. Peralatan
Dibawah ini merupakan kebutuhan dari penelitian diantaranya:
1) Microsoft office excel professional 2021, aplikasi ini digunakan penulis
sebagai media penulisan dan hitung manual dari dataset yang diperoleh.
2) Rapidminer versi 9.10 merupakan aplikasi yang digunakan untuk
menguji keakuratan dalam pengelompokkan pengangguran pada provinsi
Jawa Tengah memanfaatkan teknik data mining yaitu metode K-Means
clustering terhadap dataset.
2.7. Metode Pengumpulan Data
Data penelitian ini dikumpulan menggunakan teknik pengamatan
(observasi) di situs resmi Badan Pusat Statistik (BPS) Jawa Tengah.
2.8. Variabel Data
Pengangguran, jumlah penduduk, dan upah minimum di 35
Kabupaten/Kota tahun 2019- 2021 di Provinsi Jawa Tengah merupakan
variabel data yang diperoleh untuk penelitian ini.
2.9. Penelitian Terkait
Penelitian mengenai pengelompokan tingkat pengangguran telah
banyak dilakukan, kajian terhadap penelitian tersebut juga sangat bervariasi
0 0
14
dengan berbagai macam metode. Selain itu penggunaan algoritma k-Means
clustering juga telah banyak diterapkan di berbagai macam penelitian.
Beberapa penelitian sejenis yang telah dilakukan terdahulu antara lain yaitu:
1. Penelitian oleh Anggia Arifiani Putrie dan Rangga Sanjaya yang berjudul
“Pengelompokan Kabupaten/Kota Berdasarkan Indikator Pengangguran
Menggunakan Algoritma K-Means clustering (Studi Kasus: Provinsi Jawa
Barat)” dilakukan di Provinsi Jawa Barat. Dengan menggunakan metode
K-Means clustering didapatkan hasil yaitu diperoleh 4 cluster, yaitu
cluster 0 menunjukan daerah dengan tingkat pengangguran paling rendah
terdapat 18 kabupaten/kota cluster 1 menunjukan daerah dengan tingkat
pengangguran rendah terdapat 2 kabupaten/kota. cluster 2 menunjukan
daerah dengan pengangguran tinggi terdapat 1 kabupaten, dan cluster 3
menunjukan daerah dengan tingkat pengangguran sedang terdapat 2 kota.
Pada tahap hasil evaluasi menggunakan metode Davies Bouldin Index
pada rapid miner menghasilkan Davies Bouldin sebesar 0.328 artinya
hasilnya baik karena hasilnya 0 (non-negatif) (Putrie & Sanjaya, 2021).
2. Penelitian oleh Ari Eko Wardoyo dan Nigati Tripuspita yang berjudul
“Penentuan cluster Optimum pada Tingkat Pengangguran dan Tingkat
Kemiskinan di Jawa Timur Menggunakan Algoritma Fuzzy C-Means”
dilakukan di Jawa Timur. Dengan menggunakan metode Fuzzy C-Means
dan juga penentuan cluster optimum didapatkan hasil pada 2 cluster
dengan nilai DBI 0.8737. cluster optimum terdapat pada 4 cluster yang
ditandai dengan nilai DBI yang paling kecil (Wardoyo & Tripuspita,
2021).
0 0
15
3. Penelitian oleh Rijalul Fikri, Aswin Mushardiyanto, Mochamad Naufal
Laudza Banin, Kristiana Maureen, dan Harry Patria yang berjudul
“Pengelompokan Kabupaten/Kota di Indonesia Berdasarkan Informasi
Kemiskinan Tahun 2020 Menggunakan Metode K-Means clustering
Analysis”. Dengan menggunakan metode K-Means clustering Analysis
didapatkan hasil empat kelompok / cluster, dengan jumlah enggota cluster
1 sebanyak 117 Kabupaten/Kota, cluster 2 sebanyak 154 Kabupaten/Kota,
cluster 3 sebanyak 173 Kabupaten/Kota dan cluster 4 sebanyak 70
Kabupaten/Kota (Fikri et al., 2021).
4. Penelitian oleh Nanda Try Luchia, Hani Handayani, Fathan Surya Hamdi,
Dwi Erlangga, dan Sania Fitri Octavia yang berjudul “Perbandingan K-
Means dan K-Medoids Pada Pengelompokan Data Miskin di Indonesia”.
Dengan menggunakan metode K-Means dan K-Medoids didapatkan hasil
bahwa algoritma K-Means lebih baik jika dibandingkan dengan K-
Medoids dalam mengklasterisasikan data miskin yang ada di Indonesia.
Dibuktikan dengan nilai terbaik DBI K-Means sebesar 0.041 dengan
percobaan K=8 (Luchia et al., 2022).
5. Penelitian oleh Pradini Nurul Safitri, Rafika Aristawidya, dan Shafa Bunga
Faradilla yang berjudul “Klasterisasi Faktor-faktor kemiskinan di Provinsi
Jawa Barat Menggunakan K-Medoids clustering” dilakukan di Jawa Barat.
Dengan menggunakan metode K-Medoids clustering didapatkan hasil
yaitu diperoleh tiga kelompok, dengan kelompok satu memiliki anggota
sebanyak delapan wilayah, kelompok dua memiliki anggota sebanyak
yaitu 15 wilayah, dan kelompok tiga memiliki anggota sebanyak empat
wilayah (Safitri et al., 2021).
0 0
16
6. Penelitian oleh Sarbaini, Windylia Saputri, Nazarudin, dan Fitriani
Muttakin yang berjudul “ cluster Analysis Menggunakan Algoritma Fuzzy
K-Means Untuk Tingkat Pengangguran di Provinsi Riau” dilakukan di
Provinsi Riau. Dengan menggunakan Fuzzy K-Means didapatkan hasil dari
12 kabupaten/kota di provinsi Riau terbagi menjadi dua cluster tingkat
pengangguran tinggi dan cluster tingkat pengangguran rendah, cluster
dengan tingkat pengangguran tinggi terdapat 6 wilayah dan tingkat
pengangguran rendah terdapat 6 wilayah (Sarbaini et al., 2022).
7. Penelitian oleh Nabila Nur Fransiska R, Dwi Suci Anggraeni, dan Ultach
Enri yang berjudul “Pengelompokan Data Kemiskinan Provinsi Jawa Barat
Menggunakan Algoritma K-Means dengan Silhouette Coefficient West
Java Province Poverty Data Grouping Using the K-Means Algorithm with
Silhouette Coefficient” dilakukan di Jawa Barat. Hasil yang diperoleh
sebanyak 2 cluster dengan cluster 0 tingkat kemiskinan tinggi sebanyak 15
wilayah dan cluster 1 tingkat kemiskinan rendah sebanyak 13 wilayah.
Berdasarkan pengujian, Algoritma K-Means memperoleh hasil Silhoutte
Coefficient yaitu 0.576 dan masuk ke dalam kategori medium structure (R
et al., 2022).
8. Penelitian oleh Edy Widodo, Putri Ermayani, Latifah Nur Laila, dan Asdan
Tri Madani yang berjudul “Pengelompokan Provinsi di Indonesia
Berdasarkan Tingkat Kemiskinan Menggunakan Analisa Hierarchical
Agglomerative clustering”. Hasil yang diperoleh 3 cluster tingkat
kemiskinan yaitu cluster 1 merupakan tingkat rendah dengan anggota 25
provinsi, cluster 2 atau tingkat sedang sebanyak 7 provinsi, dan cluster 3
dengan tingkat tinggi sebanyak 2 anggota (Widodo et al., 2021).
0 0
17
9. Penelitian oleh Elvhira Rosiana Tirayo yang berjudul “Pengelompokan
Kabupaten/Kota di Sulawesi Tengah Menurut Indikator Sosial Ekonomi
Menggunakan K-Medoids clustering” dilakukan di Sulawesi Tengah.
Dengan menggunakan K-Medoids clustering hasil yang diperoleh adalah
cluster yang terbentuk membagi kabupaten/kota di Sulawesi Tengah
menjadi dua kelompok yaitu wilayah yang memiliki indikator social
ekonomi tinggi dan rendah (Tirayo, 2019).
10. Penelitian oleh Shela Yulfia Hadist dan Agung Priyo Utomo yang berjudul
“Pengelompokan Kabupaten/Kota di Pulai Jawa Berdasarkan Kondisi
Sosial Ekonomi Sebelum dan Setelah Memasuki Pandemi COVID-19
Penerapan Metode cluster Ensemble” dilakukan di pulau jawa. Dengan
menggunakan metode cluster Ensemble didapatkan hasil yaitu
menunjukan bahwa rata-rata terjadi penurunan pertumbuhan ekonomi dan
jumlah sector unggulan, serta peningkatan TPT, Jumlah Angkatan kerja,
penduduk miskin, dan pengeluaran per kapita di Pulau Jawa setelah
memasuki pandemic COVID-19. Dari 3 klaster yang terbentuk pada tahun
2019 dan 5 klaster pada tahun 2020, didapat bahwa secara umum
pengelompokan tiap klister tidak jauh berbeda, namun terdapat beberapa
perbedaan karakteristik dan anggota klister (Hadist & Utomo, 2021).
Perbedaan penelitian yang dilakukan dengan penelitian – penelitian
yang sebelumnya sebagai berikut:
1. Terhadap penelitian oleh Anggia Arifiani Putrie dan Rangga Sanjaya,
penelitian sama-sama menggunakan metode K-Means clustering tetapi
terdapat perbedaan yaitu ada di lokasi penelitiannya. Penelitian yang
0 0
18
sekarang dilakukan di Jawa Tengah sedangkan Anggia Arifiani Putrie
dan Rangga Sanjaya melakukan penelitian di Jawa Barat.
2. Terhadap penelitian oleh Ari Eko Wardoyo dan Nigati Tripuspita,
penelitian yang sekarang mempunyai perbedaan yaitu menggunakan
algoritma K-Means clustering. Sedangkan penelitian yang dilakukan
oleh Ari Eko Wardoyo dan Nigati Tripuspita menggunakan Algoritma
Fuzzy K-Means. Dan objek penelitiannya pun berbeda.
3. Terhadap penelitian oleh Rijalul Fikri, Aswin Mushardiyanto,
Mochamad Naufal Laudza Banin, Kristiana Maureen, dan Harry
Patria, penelitian sama-sama menggunakan metode K-Means
clustering tetapi terdapat perbedaan yaitu ada di objek penelitiannya.
4. Terhadap penelitian oleh Nanda Try Luchia, Hani Handayani, Fathan
Surya Hamdi, Dwi Erlangga, dan Sania Fitri Octavia, penelitian yang
sekarang mempunyai perbedaan yaitu hanya menggunakan algoritma
K-Means clustering. Sedangkan Nanda Try Luchia, Hani Handayani,
Fathan Surya Hamdi, Dwi Erlangga, dan Sania Fitri Octavia meneliti
obyek dengan menggunakan algoritma K-Means dan K-Medoids
untuk dibandingkan hasil dari kedua algoritma tersebut. Dan objek
penelitiannya pun berbeda.
5. Terhadap penelitian oleh Pradini Nurul Safitri, Rafika Aristawidya,
dan Shafa Bunga Faradilla, penelitian yang sekarang mempunyai
perbedaan yaitu menggunakan algoritma K-Means clustering.
Sedangkan penelitian yang dilakukan oleh Pradini Nurul Safitri,
Rafika Aristawidya, dan Shafa Bunga Faradilla menggunakan
0 0
19
Algoritma K-Medoids clustering. Dan objek penelitiannya pun
berbeda.
6. Terhadap penelitian oleh Sarbaini, Windylia Saputri, Nazarudin, dan
Fitriani Muttakin, penelitian yang sekarang mempunyai perbedaan
yaitu menggunakan algoritma K-Means clustering. Sedangkan
penelitian yang dilakukan oleh Sarbaini, Windylia Saputri, Nazarudin,
dan Fitriani Muttakin menggunakan Algoritma Fuzzy K-Means. Dan
objek penelitiannya pun berbeda.
7. Terhadap Penelitian oleh Nabila Nur Fransiska R, Dwi Suci
Anggraeni, dan Ultach Enri, penelitian sama-sama menggunakan
metode K-Means clustering tetapi terdapat perbedaan yaitu ada di
objek penelitiannya.
8. Terhadap penelitian oleh Edy Widodo, Putri Ermayani, Latifah Nur
Laila, dan Asdan Tri Madani, penelitian yang sekarang mempunyai
perbedaan yaitu menggunakan algoritma K-Means clustering.
Sedangkan penelitian yang dilakukan oleh Edy Widodo, Putri
Ermayani, Latifah Nur Laila, dan Asdan Tri Madani menggunakan
Analisa Hierarchical Agglomerative clustering. Dan objek
penelitiannya pun berbeda.
9. Terhadap penelitian oleh Elvhira Rosiana Tirayo, penelitian yang
sekarang mempunyai perbedaan yaitu menggunakan algoritma K-
Means clustering. Sedangkan penelitian yang dilakukan oleh Elvhira
Rosiana Tirayo menggunakan K-Medoids clustering. Dan objek
penelitiannya pun berbeda. Penelitian yang sekarang dilakukan yaitu
berdasarkan indikator pengangguran studi kasus di Jawa Tengah,
0 0
20
sedangkan penelitian yang dilakukan oleh Elvhira Rosiana Tirayo
yaitu berdasarkan indikator social ekonomi studi kasus Sulawesi
tengah.
10. Terhadap penelitian oleh Shela Yulfia Hadist dan Agung Priyo Utomo,
penelitian yang sekarang mempunyai perbedaan yaitu menggunakan
algoritma K-Means clustering. Sedangkan penelitian yang dilakukan
oleh Shela Yulfia Hadist dan Agung Priyo Utomo menggunakan
Metode cluster Ensemble. Dan objek penelitiannya pun berbeda
0 0
BAB III
HASIL DAN PEMBAHASAN
3.1. Pengolahan Awal Data
Di dalam bab ini akan membahas tentang data yang akan digunakan
dalam penelitian, jumlah data yang diperoleh dari data public yaitu dari situs
resmi Badan Pusat Statistik, Provinsi Jawa Tengah mengenai pengangguran yang
masih mengalami naik turun. Tingkat pengangguran di Jawa Tengah sebesar 4,44
persen pada tahun 2019, 6,48 persen pada tahun 2020 dan 5,95 persen pada tahun
2021. Dengan peningkatan yang cukup besar sebesar 6,48 persen pada tahun
2020 dan 5,95 pada tahun 2021. Pemerintah menghadapi tugas berat dalam
mengurangi pengangguran di setiap kabupaten/kota di Provinsi Jawa Tengah.
Pada penelitian ini yaitu mengumpulkan data pengangguran, jumlah
penduduk, dan upah minimum kab/kota Provinsi Jawa Tengah. Nilai rata-rata
setiap atribut yang digunakan menjadi focus pada penelitian ini.
Tabel 1. Rata-rata Pengangguran, Jumlah Penduduk, dan Upah minimum Kab/Kota
Penganggura Jumlah
Kabupaten / Kota UMK
n Penduduk
Kabupaten Cilacap 165939 1727098 1989058
Kabupaten Banyumas 95162 1693006 1750000
Kabupaten Purbalingga 55354 933989 1788500
Kabupaten Banjarnegara 53602 923192 1610000
Kabupaten Kebumen 73427 1197982 1686000
Kabupaten Purworejo 26593 718316 1700000
Kabupaten Wonosobo 40320 790504 1712500
21
0 0
22
Kabupaten Magelang 53597 1290591 1882000

Kabupaten Boyolali 47006 984807 1790000
Kabupaten Klaten 59955 1174986 1795061
Kabupaten Sukoharjo 41132 891912 1783500
Kabupaten Wonogiri 31503 959492 1655000
Kabupaten Karanganyar 46167 886519 1833000
Kabupaten Sragen 40931 890518 1673500
Kabupaten Grobogan 59390 1377788 1685500
Kabupaten Blora 36683 865013 1690000
Kabupaten Rembang 25972 638188 1660000
Kabupaten Pati 56614 1259590 1742000
Kabupaten Kudus 37402 871311 2044468
Kabupaten Jepara 55465 1257912 1879031
Kabupaten Demak 71682 1162805 2240000
Kabupaten Semarang 42699 1053786 2055000
Kabupaten Temanggung 24747 772018 1682027
Kabupaten Kendal 71726 971086 2084393
Kabupaten Batang 46750 768583 1900000
Kabupaten Pekalongan 49457 897711 1859885
Kabupaten Pemalang 98681 1302813 1718000
Kabupaten Tegal 144729 1440698 1747000
Kabupaten Brebes 174363 1809096 1665850
Kota Magelang 8797 122111 1707000
Kota Surakarta 34673 519587 1802700
Kota Salatiga 12254 194084 1875325
Kota Semarang 132638 1814110 2498588
Kota Pekalongan 20205 307097 1906922
Kota Tegal 21982 249905 1762000
3.2. Preprocessing
Berikut adalah tahapan data preprocessing pada Mining:
1. Pembersihan data (Cleaning data)
0 0
23
Pembersihan data akan dilakukan dan data yang hilang akan diisi
menggunakan operator yang diberikan oleh rapidminer versi 9.10, yaitu
mengganti nilai yang hilang.Namun proses ini tidak dilakukan karena ada
data yang hilang.
2. Transformasi Data
Dengan mengkonversi data ke format yang dapat diproses kedalam data
mining, karena data tersebut sesuai untuk di proses maka tidak akan
dilakukan transformasi
3. Data mining
a. Jenis data yang digunakan dalam penelitian ini adalah clustering yang
digunakan untuk mengelompokan pengangguran berdasarkan jumlah
penduduk dan upah minimum di setiap Kabupaten/Kota di Provinsi
Jawa Tengah selama 3 tahun
b. Penelitian ini menggunakan teknik clustering K-Means untuk
mengklasifikasikan pengangguran pada berbagai tingkatan
berdasarkan jumlah penduduk dan upah minimum Jawa Tengah.
c. penggunaan algoritma data mining yaitu dengan menerapkan
algoritma yang telah ditentukan sebelumnya.
- Menentukan jumlah cluster (k) pada dataset, tahap ini akan dibuat
sebanyak 5 cluster yaitu tingkat sangat tinggi, tinggi, sedang,
rendah, dan sangat rendah.
- Menentukan titik pusat (centroid) awal secara acak
0 0
24
4. Evaluasi, pada langkah ini, kelompok atau cluster yang ada di evaluasi
dengan memanfaatkan pendekatan davies bouldin index (DBI) untuk
menentukan jarak terdekat antara data hasil cluster
5. Discovered Knowledge (Visualization dan Integration), Pada fase ini,
teknik clustering K-Means digunakan untuk mengelompokkan data
pengangguran terhadap kelompok kabupaten/kota Jawa Tengah
berdasarkan jumlah penduduk kabupaten/kota tahun 2019-2021 dan upah
minimum. Mengelompokkan kategori sangat tinggi, tinggi, sedang,
rendah, dan sangat rendah.
3.3. Perhitungan K-Means
1. Perhitungan pengelompokan K-Means cluster ing adalah menentukan cluster
(k) dalam dataset, tahap terdiri dari 5 cluster yaitu cluster C0, C1, C2, C3,
C4.
2. Menentukan titik pusat (centroid) awal secara acak kemudian menghitung
centroid cluster k-1:
Tabel 2 centroid Awal
Attribute C0 C1 C2 C3 C4
Pengangguran 132638 53597 47006 40931 26593
Jumlah
1814110 1290591 984807 890518 718316
Penduduk
UMK 2498588 1882000 1790000 1673500 1700000
Setelah menentukan centroid awal, cluster ditentukan dengan
menggunakan rumus jarak Eulidean Distance untuk menghitung jarak setiap
0 0
25
data yang ada ke centroid terdekat. Berikut rumus perhitungannya dan
diimplementasi menggunakan Ms. Excel.
Kemudian melakukan perhitungan yang sama dari data selanjutnya sampai
data ke 35 dan mencari jarak terpendeknya atau nilai terkecil . Setelah melakukan
pengelompokkan hasil dari iterasi 1 didapatkan hasil centroid baru untuk melakukan
iterasi berikutnya.
Attribute C1 C2 C3 C4 C5
Pengangguran 132638 92417 48868 40680 26229
Jumlah Penduduk 1814110 1391197 936390 909554 508039

177084
UMK 2498588 1814958 1904843 1657125
7
Lakukan perhitungan Euclidean Distance dengan centroid baru sampai
menghasilkan pola yang sama dari iterasi sebelumnya dengan yang terakhir.
Pada proses k-means dikatakan bahwa iterasi berhenti dan dianggap stabil jika
hasil iterasi baru sama dengan hasil iterasi sebelumnya.
 cluster 0
Rata-rata setiap variabel (centroid) cluster 0
Pengangguran 40241,201
Jumlah Penduduk 852805
Upah Minimum 1758825,327
Rata-rataa seluruh variabel cluster 0 883957,1316
0 0
26
Berdasarkan rata-rata pada cluster 0, nilai centroid untuk pengangguran
yaitu sebesar 40241,201, sedangkan untuk jumlah penduduk yaitu sebesar
852805 , dan untuk upah minimum Kab/Kota yaitu sebesar 1758825,327. Maka
rata-rata cluster yang diperoleh dari seluruh variabel di cluster 0 yaitu sebesar
883957,1316. Anggota cluster 0 antara lain Kabupaten Purbalingga, Kabupaten
Banjarnegara, Kabupaten Purworejo, Kabupaten Wonosobo, Kabupaten
Boyolali, Kabupaten Sukoharjo, Kabupaten Wonogiri, Kabupaten Karanganyar,
Kabupaten Sragen, Kabupaten Blora, Kabupaten Rembang, Kabupaten Kudus,
Kabupaten Temanggung, Kabupaten Batang, Kabupaten Pekalongan.
 cluster 1
1743067, dan untuk upah minimum Kab/Kota yaitu sebesar 1801636,027. Maka
1229952,452. Anggota cluster 1 antara lain Kabupaten Cilacap, Kabupaten
Banyumas, Kabupaten Brebes.
 cluster 2
0 0
27

1814110 , dan untuk upah minimum Kab/Kota yaitu sebesar 2498587,530.
Maka rata-rata cluster yang diperoleh dari seluruh variabel di cluster 2 yaitu
sebesar 1481778,444. Anggota cluster 2 antara lain Kota Semarang.
 cluster 3
278557 dan untuk upah minimum Kab/Kota yaitu sebesar 1810789,542 . Maka
702976,2532. Anggota cluster 3 antara lain Kota Magelang, Kota Surakarta,
Kota Salatiga, Kota Pekalongan, Kota Tegal.
 cluster 4
0 0
28
1204934, dan untuk upah minimum Kab/Kota yaitu sebesar 1876698,591. Maka
1048652,033. Anggota cluster 0 antara lain Kabupaten Kebumen, Kabupaten
Magelang, Kabupaten Klaten, Kabupaten Grobogan, Kabupaten Pati, Kabupaten
Jepara, Kabupaten Demak, Kabupaten Semarang, Kabupaten Kendal, Kabupaten
Pemalang.
3.4. Langkah-langkah Implementasi Rapidminer
1. Desain
Setelah kita mempunyai data yang akan di analisa menggunakan
aplikasi Rapidminer, kita membuat desain sesuai dengan metode penghitungan
yang dibutuhkan, pada menu Operators yaitu clustering, dan menambah
Operators cluster Distance Perfomance untuk menganalisa jumlah cluster yang
mampu mengelompokan data dengan baik.
0 0
29
2. Proses Penerapan Algoritma K-Means Clustering
Berikut merupakan Proses Algoritma k-means clustering untuk
mengetahui hasil pengclusteran.
3. Menentukan jumlah k pada Operators clustering
0 0
30
Dalam mencari jumlah cluster terbaik dalam penelitian ini, kita uji dari
k=2 sampai dengan k=5
4. Menganalisa Nilai Davies Bouldin Index
Berdasarkan validasi hasil pada aplikasi Rapidminer menggunakan
Davies Bouldin Index, terbentuk 5 cluster yang dianggap mampu
mengelompokan data dengan baik. Berikut yang menggambarkan Performance
vector, yang merupakan hasil evaluasi dari cluster yang dibuat sebanyak 5
cluster dan memiliki nilai 0,601
Tabel 2. Hasil Pengujian DBI k=2 sampai k=5 menggunakan aplikasi Rapidminer
cluste Nilai Davies
r Bouldin
K=2 0.820
K=3 0.806
K=4 0.602
K=5 0.601
0 0
31
5. cluster Model clustering
Untuk mengetahui jumlah anggota cluster kita melihat pada cluster
Model (clustering).
6. centroid Tabel
Pada tabel centroid, kita dapat mengetahui rata-rata setiap attribut pada
masing-masing cluster. Dari sini kita dapat menentukan kriteria atau kategori
dari setiap cluster.
0 0
32
7. Data Anggota cluster
Untuk mengetahui kabupaten/kota yang merupakan anggota cluster kita
dapat melihat pada Data di ExampleSet (clustering).
8. Visualisasi
Berikut merupakan bentuk visualisasi dari hasil perhitungan data
menggunakan metode K-Means clustering.
0 0
33
3.5. Pembahasan
Menurut hasil pengelompokan K-Means menggunakan aplikasi
Rapidminer, cluster 0 adalah cluster dengan nilai rata-rata rendah dari semua
variabel. Maka cluster 0 termasuk dalam kategori kelompok pengangguran
rendah, yang di dalamnya terdapat 15 Kabupaten/Kota dengan nilai rata-rata
sebesar 883957,1316. cluster 1 termasuk dalam kategori kelompok pengangguran
tinggi yang di dalamnya terdapat 3 Kabupaten/Kota dengan rata-rata sebesar
1229952,452. cluster 2 termasuk dalam kelompok pengangguran paling tinggi
yaitu terdapat 1 Kabupaten dengan rata-rata sebesar 1481778,444. cluster 3
termasuk dalam kategori kelompok paling rendah yang di dalamnya terdapat 5
Kota dengan rata-rata sebesar 702976,2532. Dan cluster 4 termasuk kategori
kelompok sedang yang di dalamnya terdapat 11 Kabupaten/Kota dengan nilai
rata-rata 1048652,033.
Tabel 3. Hasil Cluster dari Rapidminer
RATA" PER WILAYAH cluster

925947,604
Kabupaten Purbalingga cluster_0
2
862264,579
Kabupaten Banjarnegara cluster_0
8
814969,550
Kabupaten Purworejo cluster_0
8
847774,565
Kabupaten Wonosobo cluster_0
5
940604,261
Kabupaten Boyolali cluster_0
7
905514,757
Kabupaten Sukoharjo cluster_0
3
881998,277
Kabupaten Wonogiri cluster_0
7
921895,242
Kabupaten Karanganyar cluster_0
1
868316,186 Kabupaten Sragen cluster_0
0 0
34
9
863898,731
Kabupaten Blora cluster_0
2
774720,151
Kabupaten Rembang cluster_0
6
984393,671
Kabupaten Kudus cluster_0
6
826264,054
Kabupaten Temanggung cluster_0
9
905110,919
Kabupaten Batang cluster_0
6
935684,419
Kabupaten Pekalongan cluster_0
3
883957,131
RATA" CLUSTER 0
6
1294031,70
Kabupaten Cilacap cluster_1
8
1179389,33
Kabupaten Banyumas cluster_1
8
1216436,31
Kabupaten Brebes cluster_1
1
1229952,45
RATA" CLUSTER 1
2
1481778,44
Kota Semarang cluster_2
4
1481778,44
RATA" CLUSTER 2
4
612636,098
Kota Magelang cluster_3
6
785653,466
Kota Surakarta cluster_3
2
693887,803
Kota Salatiga cluster_3
2
744741,613
Kota Pekalongan cluster_3
9
677962,284
Kota Tegal cluster_3
1
702976,253
RATA" CLUSTER 3
2
985802,921
Kabupaten Kebumen cluster_4
8
1075396,15
Kabupaten Magelang cluster_4
3
1010000,77 Kabupaten Klaten cluster_4
1040892,51
Kabupaten Grobogan cluster_4
1
1019401,20
Kabupaten Pati cluster_4
1
1064136,16 Kabupaten Jepara cluster_4
0 0
35
1
1158162,41
Kabupaten Demak cluster_4
3
1050494,97 Kabupaten Semarang cluster_4
1042401,82
Kabupaten Kendal cluster_4
4
1039831,40
Kabupaten Pemalang cluster_4
2
1048652,03
RATA" CLUSTER 4
3
Dari 5 cluster tersebut cluster 2 yang harus paling diberi perhatian lebih
oleh pemerintah karena cluster tersebut memiliki nilai rata-rata paling tertinggi
di Provinsi Jawa Tengah. Dan perlu adanya evaluasi tambahan pada anggota
cluster 1 karena cluster inipun mempunyai nilai rata-rata yang tinggi. Metode
untuk menurunkan tingkat pengangguran pada cluster ini diantaranya
pemerintah melakukan evaluasi upah minimum kab/kota pekerja sehingga dapat
menetapkan kebijakan yang berdampak pada peningkatan kesejahteraan dan
taraf hidup layak pekerja, pemerintah juga dapat menciptakan lapangan kerja
yang dibutuhkan dan menyerap sejumlah besar pekerja untuk mengurangi
tingkat pengangguran saat ini.
0 0
BAB IV
PENUTUP
4.1. Kesimpulan
Maka dengan menggunakan Algoritma K-Means Clustering,
kesimpulannya yang dapat ditarik mengenai pengelompokan pengangguran
berdasarkan jumlah penduduk dan Upah Minimum di Kabupaten/Kota
Provinsi Jawa Tengah Tahun 2019 – 2021 yaitu:
1. Hasil pengolahan pengangguran menurut indikator pengangguran, yaitu
jumlah penduduk dan upah Minimum Kabupaten/Kota dengan
menggunakan algoritma K-Means Clustering dapat menghasilkan
informasi, kelompok daerah mana saja yang memerlukan perhatian khusus
dari pemerintah dalam menciptakan dan meratakan lapangan kerja,
mengevaluasi Upah Minimum Kabupaten/Kota dan memperlambat laju
pertumbuhan penduduk di Kabupaten/Kota dengan tingkat pengangguran
yang tinggi.
2. Hasil clustering pada Rapidminer diperoleh Cluster 0 (pertama) terdapat
15 Kabupaten/Kota dengan rata-rata pengangguran rendah, cluster 1
(kedua) terdapat 3 Kabupaten/Kota dengan rata-rata pengangguran paling
rendah, cluster 2 (ketiga) terdapat 1 Kabupaten/Kota dengan rata-rata
pengangguran paling tinggi, cluster 3 (keempat) terdiri dari 5
Kabupaten/Kota Kota dengan rata-rata pengangguran tinggi dan Cluster 4
(kelima) terdiri dari 11 Kabupaten/Kota dengan rata-rata pengangguran
sedang.
35
0 0
36
3. Berdasarkan evaluasi Davies Bouldin Index (DBI) pembentukan 5 cluster
telah dinilai baik, karena dengan uji validasi pembentukan jumlah k
(cluster) 2-5 k (cluster), cluster 5 memiliki nilai yang paling dekat dengan
0, yaitu 0.601.
4.2. Saran
Dari hasil yang telah dilaksanakan, terdapat beberapa hal yang ingin
disarankan untuk pengembangan penelitian ini selanjutnya, yaitu:
1. Aspek Sistem
Aplikasi diharapkan dapat dikembangkan selanjutnya dengan menambah
variable atau atribut pada data training. Seperti hal menambah variabel –
variabel data agar data lebih spesifik.
2. Aspek Manajerial
Dapat dijadikan sarana informasi mengenai akurasi yang dihasilkan,
sehingga dapat membantu pemerintah dalam penanganan pengangguran di
Jawa Tengah.
3. Aspek Penelitian Lanjutan
Mengenai penelitian tentang “Pengelompokan Kabupaten/Kota
Berdasarkan Indikator Tingkat Pengangguran Menggunakan Algoritma K-
Means clustering (Studi Kasus: Provinsi Jawa Tengah), sebaiknya
pengujian selanjutnya dapat dilakukan dengan metode algoritma lain
sebagai pembanding untuk melihat metode mana yang tingkat
keakuratannya lebih tinggi untuk mendapatkan hasil yang optimal sesuai
kebutuhan.
0 0
37
DAFTAR PUSTAKA
Bacsafra, M. A., Kusumarawdani, D. M., & Darmansah. (2022). Pengembangan

Sistem Informasi Badan Pusat Statistik Kabupaten Kuningan Berbasis Android
Dengan Metode Prototype. Jurnal Sains Komputer & Informatika (J-SAKTI,
6(1), 379–390.
Bastian, A., Sujadi, H., & Febrianto, G. (2018). Penerapan Algoritma K-Means
clusteringAnalysis Pada Penyakit Menular Manusia (Studi Kasus Kabupaten
Majalengka). Jurnal Sistem Informasi, 14(1), 26–32.
https://jsi.cs.ui.ac.id/index.php/jsi/article/view/566
Bintang, A. B. M., & Woyanti, N. (2018). Pengaruh PDRB, Pendidikan, Kesehatan,

Dan Pengangguran Terhadap Tingkat Kemiskinan Di Jawa Tengah (2011-2015).
Jurnal Media Elektronika Dan Manajemen, 33, 20–28.
http://jurnal.untagsmg.ac.id/index.php/fe/article/view/563
C.T.I, B. R., Gafar, A. A., Fajriani, N., Ramadani, U., Uyun, F. R., Purnamasari, Y., &
Ransi, N. (2017). Implemetasi k-means clustering pada rapidminer untuk
analisis daerah rawan kecelakaan. April, 58–62.
Fikri, R., Mushardiyanto, A., Banin, M. N. L., Maureen, K., & Patria, H. (2021).
Pengelompokan Kabupaten/Kota di Indonesia Berdasarkan Informasi
Kemiskinan Tahun 2020 Menggunakan Metode K-Means clustering Analysis.
Seminar Nasional Teknik Dan Manajemen Industri, 1(1), 190–199.
https://doi.org/10.28932/sentekmi2021.v1i1.76
Fitriyani, & Sanjaya, R. (2018). Komparasi Algoritma Lr, K-Nn Dan Svm Untuk
Estimasi Area Kebakaran Hutan. Jurnal Teknologi Informasi Dan Elektronika,
3(2), 103–110. http://183.91.79.105/index.php/infotronik/article/view/109
Hadist, S. Y., & Utomo, A. P. (2021). Pengelompokan Kabupaten/Kota di Pulau Jawa

Berdasarkan Kondisi Sosial Ekonomi Sebelum dan Setelah Memasuki Pandemi
COVID-19 Penerapan Metode cluster Ensemble. Seminar Nasional Official
Statistics, 19(2020), 322–332.
Han, J., & Kaufmann, M. K. M. (2006). Data Mining : Concepts and Techniques
( 2nd edition ) Bibliographic Notes for Chapter 6 Classification and Prediction.
0 0
38
Luchia, N. T., Handayani, H., Hamdi, F. S., Erlangga, D., & Octavia, S. F. (2022). …
K-Means dan K-Medoids Pada Pengelompokan Data Miskin di Indonesia:
Comparison of K-Means and K-Medoids on Poor Data clustering in Indonesia.
… Indonesian Journal of …, 2(October), 35–41.
https://journal.irpi.or.id/index.php/malcom/article/view/422
Manurung, E., & Hasugian, P. S. (2019). Data Mining Tingkat Pesanan Inventaris
Kantor Menggunakan Algoritma Apriori pada Kepolisian Daerah Sumatera
Utara. Journal Of Informatic Pelita Nusantara, 4(2), 8–13.
Prawira, & Syurifto. (2018). Pengaruh Pertumbuhan Ekonomi, Upah Minimum

Provinsi, Dan Tingkat Pendidikan Terhadap Pengangguran Terbuka Di
Indonesia. Jurnal Ecogen, 1, 162–168.
http://ejournal.unp.ac.id/students/index.php/pek/article/view/4735/2647
Purboningtyas, I., Sari, I. R., Guretno, T., Dirgantara, A., Agustina, D., & Haris, M.
Al. (2020). Analisis Pengaruh Tingkat Pengangguran Terbuka Dan Indeks
Pembangunan Manusia Terhadap Kemiskinan Di Provinsi Jawa Tengah. Jurnal
Saintika Unpam, 3, 81–88.
http://openjournal.unpam.ac.id/index.php/jsmu/article/view/5640
Putrie, A. A., & Sanjaya, R. (2021). Pengelompokan Kabupaten/Kota Berdasarkan

Indikator Tingkat Pengangguran Menggunakan Algoritma K-Means clustering
(Studi Kasus: Provinsi Jawa Barat). EProsiding Sistem Informasi (POTENSI), 2,
111–121. http://eprosiding.ars.ac.id/index.php/psi/article/view/595
R. A. Indraputra, & Fitriana, R. (2020). K-Means clustering Data COVID-19. Jurnal

Teknik Industri, 10(3), 275–282.
https://www.trijurnal.lemlit.trisakti.ac.id/index.php/tekin/article/view/8428/6033
R, N. N. F., Anggraeni, D. S., & Enri, U. (2022). Pengelompokkan Data Kemiskinan

Provinsi Jawa Barat Menggunakan Algoritma K-Means dengan Silhouette
Coefficient. TEMATIK (Jurnal Teknologi Informasi Komunikasi), 9(1), 29–35.
https://doi.org/10.38204/tematik.v9i1.921
Ridwan, M., Suyono, H., & Sarosa, M. (2018). Implementasi Data Mining untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes
Classifier. Creative Information Technology Journal, 4(2), 151.
https://doi.org/10.24076/citec.2017v4i2.106
Safitri, P. N., Aristawidya, R., & Faradilla, S. B. (2021). Klasterisasi Faktor-Faktor

Kemiskinan Di Provinsi Jawa Barat Menggunakan K-Medoids clustering.
0 0
39
Journal of Mathematics Education and Science, 4(2), 75–80.

https://doi.org/10.32665/james.v4i2.242
Sanjaya, R., & Fitriyani. (2019). Prediksi Bedah Toraks Menggunakan Seleksi Fitur
Forward Selection dan K-Nearest Neighbor. Jurnal Jepin, 5, 316–320.
https://jurnal.untan.ac.id/index.php/jepin/article/view/35324
Sarbaini, Saputri, W., Nazarudin, & Muttakin, F. (2022). cluster Analysis

Menggunakan Algoritma Fuzzy K-Means Untuk Tingkat Pengangguran Di
Provinsi Riau. Jurnal Teknologi Dan Manajemen Industri Terapan, 1(II), 78–84.
http://jurnal-tmit.com/index.php/home/article/view/30
Setiawan, R. (2017). Penerapan Data Mining Menggunakan Algoritma K-Means

clustering Untuk Menentukan Strategi Promosi Mahasiswa Baru (Studi Kasus :
Politeknik Lp3i Jakarta). Jurnal Lentera ICT, 3, 76–92.
http://plj.ac.id/ojs/index.php/jrict/article/view/27
Talakua, M. W., Leleury, Z. A., & A. W. Tallut. (2017). Analisis cluster Dengan
Menggunakan Metode K-Means Untuk Pengelompokkan Kabupaten/Kota Di
Provinsi Maluku Berdasarkan Indikator Indeks Pembangunan Manusia Tahun
2014. Jurnal Ilmu Matematika Dan Terapan, 11, 119–128.
https://ojs3.unpatti.ac.id/index.php/barekeng/article/view/353
Tirayo, E. R. (2019). Pengelompokan Kabupaten / Kota di Sulawesi Tengah Menurut

Indikator Sosial Ekonomi Menggunakan K-Medoids clustering. 2019(Sns Viii).
Wardoyo, A. E., & Tripuspita, N. (2021). Penentuan cluster Optimum pada Tingkat
Pengangguran dan Tingkat Kemiskinan di Jawa Timur Menggunakan Algoritma
Fuzzy C-Means. BIOS : Jurnal Teknologi Informasi Dan Rekayasa Komputer,
1(2), 40–47. https://doi.org/10.37148/bios.v1i2.10
Widodo, E., Ermayani, P., Laila, L. N., & Madani, A. T. (2021). Pengelompokkan
Provinsi di Indonesia Berdasarkan Tingkat Kemiskinan Menggunakan Analisis
Hierarchical Agglomerative clustering. Seminar Nasional Official Statistics,
2021(1), 557–566. https://doi.org/10.34123/semnasoffstat.v2021i1.971
0 0

Tugas Uas Sistem Informasi Data Warehouse Dan Business Inteligence Compress

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Tugas Uas Sistem Informasi Data Warehouse Dan Business Inteligence Compress

Diunggah oleh

Hak Cipta:

Format Tersedia

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN INDIKATOR

TINGKAT PENGANGGURAN MENGGUNAKAN

ALGORITMA K-MEANS CLUSTERING

(Studi Kasus: Provinsi Jawa Tengah)

Data Warehouse dan Bussiness Inteligence

1. Rizkia Meisela 19221114

2. Maylani Azzahra 19221147

3. Tina Kurnianingsih 19221508

Program Studi Sistem Informasi Kampus Kota Sukabumi

Fakultas Teknik dan Informatika

Universitas Bina Sarana Informatika

melimpahkan rahmat dan karunia-Nya berupa kesempatan dan pengetahuan,

selesai tepat waktu. Judul yang terkait “Pengelompokan Kabupaten/Kota

Berdasarkan Indikator Tingkat Pengangguran Menggunakan Algoritma K-

Means clustering (Studi Kasus: Provinsi Jawa Tengah)” .

Universitas Bina Sarana Informatika Kota Sukabumi. Sebagai bahan penulisan

1. Direktur Universitas BSI Kampus Kota Sukabumi

Warehouse and Business Inteligency

5. Seluruh rekan-rekan di Unibersitas BSI Kota Sukabumi khususnya rekan-rekan

memberi semangat selama penyelesaian tugas ini.

membangun demi perbaikan dan kesempurnaan laporan ini.

Sukabumi, November 2022

1.1. Latar Belakang Penulisan

Indonesia dianggap sebagai negara. Indonesia merupakan salah satu

itu harus menjadi sumber kekuatan pendorong dalam perekonomia. Namun,

kesulitan di Indonesia adalah bahwa populasi dan tenaga kerja di negara

berkembang menjadi suatu beban bagi pembangunan negara daripada asset

potensial yang dapat digunakan untuk mendorong ekonomi. Besarnya

pengangguran berdampak pada laju keberhasilan pembangunan ekonomi

(Prawira & Syurifto, 2018) . Pengangguran merupakan masalah utama di

negara non-industri seperti Indonesia, dengan pertumbuhan penduduk yang

yang tidak dapat mengikuti perkembangan teknologi yang pesat, perubahan

oleh berbagai macam factor (Putrie & Sanjaya, 2021).

Jawa Tengah, salah satu Provinsi di Indonesia, masuk dalam kategori

pengangguran yang jumlahnya sering menurun, namun masih cukup tinggi.

Jumlah pengangguran dapat meningkat setiap tahunnya. Tingkat

pengangguran di Jawa tengah pada tahun 2019 sebesar 4,44%, tingkat

pengangguran terbuka di Jawa Tengah pada tahun 2020 meningkat menjadi

2020) .Pengangguran yang tinggi sangat mempengaruhi mempengaruhi

tingkat kemiskinan di beberapa daerah (Bintang & Woyanti, 2018).

Akibatnya adalah salah satu penentu utama tingkat kemiskinan, penelitian

yang lebih mendalam tentang pengangguran dan indikator yang sangat

mempengaruhi tingkat pengangguran perlu dilakukan. Dengan memanfaatkan

metode pengelompokan salah satunya.

Fitriyani, 2019) , clustering adalah teknik untuk membagi dataset menjadi

kelompok-kelompok atau cluster berdasarkan suatu kesamaan yang telah

ditentukan (Setiawan, 2017). Metode K-Means merupakan metode

pengelompokan yang mengelompokan suaty data berdasarkan dengan pusat

K-Means bertujuan untuk mengorganisasikan data dengan meningkatkan

(Fitriyani & Sanjaya, 2018).

Kelebihan Algoritma K-Means diantaranya dalah mampu

mengelompokan objek besar dan pencilan obyek dengan sangat cepat

sehingga mempercepat proses pengelompokan. Kekurangan Algoritma K-

random, hasil pengelompokan bersifat tidak unik (selalu berubah-ubah) dan

proses pengerjaannya cepat tetapi keakuratannya tidak dijamin (Bastian et al.,

Pada penelitian yang telah dilakukan sebelumnya, yaitu tentang

pengelompokan tingkat pengangguran di Sulawesi Selatan dengan indikator

jumlah penduduk dan upah minimum Kabupaten/Kota disamping jumlah

Hasil pengelompokan yang diperoleh nantinya dapat digunakan untuk

menjelaskan bagaimana pemerintah daerah melakukan penanganan masalah

pengangguran dengan mengkaji factor-faktor yang mempengaruhi

pengangguran, seperti jumlah penduduk dan upah.

Berdasarkan latar belakang tersebut, maka penelitian ini mengambil

judul “Pengelompokan Kabupaten/Kota Berdasarkan Indikator Tingkat