Anda di halaman 1dari 45

PENGELOMPOKAN KABUPATEN/KOTA BERDASARKAN INDIKATOR

TINGKAT PENGANGGURAN MENGGUNAKAN

ALGORITMA K-MEANS CLUSTERING

(Studi Kasus: Provinsi Jawa Tengah)

Diajukan untuk memenuhi salah satu tugas komponen penilaian Mata Kuliah

Data Warehouse dan Bussiness Inteligence

Disusun oleh:

1. Rizkia Meisela 19221114

2. Maylani Azzahra 19221147

3. Tina Kurnianingsih 19221508

Program Studi Sistem Informasi Kampus Kota Sukabumi

Fakultas Teknik dan Informatika

Universitas Bina Sarana Informatika

2022

0 0
KATA PENGANTAR

Puji syukur alhamdulillah, penulis panjatkan kehadirat Allah SWT yang telah

melimpahkan rahmat dan karunia-Nya berupa kesempatan dan pengetahuan,

sehingga pada akhirnya penulis dapat menyelesaikan tugas ini dengan baik dan

selesai tepat waktu. Judul yang terkait “Pengelompokan Kabupaten/Kota

Berdasarkan Indikator Tingkat Pengangguran Menggunakan Algoritma K-

Means clustering (Studi Kasus: Provinsi Jawa Tengah)” .

Tujuan Penulisan penelitian ini dibuat sebagai salah satu tugas UAS di

Universitas Bina Sarana Informatika Kota Sukabumi. Sebagai bahan penulisan

diambil berdasarkan hasil penelitian, observasi dan beberapa sumber literatur yang

mendukung penulisan ini. Penulis menyadari bahwa tanpa adanya bimbingan dan

dorongan dari semua pihak, maka penulisan tugas ini tidak akan lancar. Oleh karena

itu pada kesempatan ini, izinkanlah penulis menyampaikan ucapan terima kasih

kepada:

1. Direktur Universitas BSI Kampus Kota Sukabumi

2. Ketua Program Studi Sistem Informasi Universitas BSI Kampus Kota Sukabumi

3. Bapak Taufik Hidayatuloh, M. Kom selaku Dosen Pengampu Mata Kuliah Data

Warehouse and Business Inteligency

4. Orang tua tercinta yang tekah memberikan dukungan moral maupun spiritual

5. Seluruh rekan-rekan di Unibersitas BSI Kota Sukabumi khususnya rekan-rekan

kelas Sistem Informasi yang telah memberikan kritik dan saran kepada penulis

6. Sahabat dan teman dekat yang tidak bisa disebutkan satu persatu yang telah

memberi semangat selama penyelesaian tugas ini.

0 0
Akhir kata, semoga Allah SWT senantiasa melimpahkan karunianya dan

membalas segala amal budi serta kebaikan pihak pihak yang telah membantu penulis

dalam penyusunan laporan tugas unu dan semoga laporan ini bermanfaat dan dapat

memperluas wawasan bagi para pembaca. Penulis menyadari bahwa laporan ini

masih belum sempurna. Oleh karena itu, penulis mengharapkan kritik dan saran yang

membangun demi perbaikan dan kesempurnaan laporan ini.

Sukabumi, November 2022

Penulis

0 0
DAFTAR ISI

Halaman
Lembar Judul ................................................................................................................i
Kata Pengantar..............................................................................................................ii
Daftar Isi......................................................................................................................vi
BAB I PENDAHULUAN...........................................................................................1
1.1. Latar Belakang Penulisan......................................................................1
1.2. Masalah Penelitian................................................................................3
1.2.1. Identifikasi Masalah......................................................................3
1.2.2. Batasan Masalah............................................................................3
1.2.3. Rumusan Masalah..........................................................................4
1.3. Tujuan Penelitian...................................................................................4
1.3.1. Tujuan Penelitian...........................................................................4
1.3.2. Manfaat Penelitian.........................................................................4
BAB II LANDASAN TEORI....................................................................................6
2.1. Konsep Dasar Data Mining...................................................................6
2.1.1.Definisi Data Mining......................................................................6
2.1.2. Tahap – Tahap Data Mining..........................................................7
2.2. Algoritma K-Means…….......................................................................9
2.2.1.Pengertian Algoritma K-Means......................................................9
2.3.Rapid Miner.........................................................................................10
2.4. Badan Pusat Statistik (BPS)................................................................10
2.4.1.Pengertian Badan Pusat Statistik (BPS).......................................10
2.5. Tahapan Penelitian..............................................................................10
2.6. Instrumen Penelitian............................................................................12
2.7. Metode Pengumpulan Data.................................................................13
2.8. Variabel Data.......................................................................................13
2.9. Penelitian Terkait.................................................................................13
BAB III PEMBAHASAN DAN HASIL..................................................................21
3.1. Pengolahan Data Awal.........................................................................21
3.2. Preprocessing……..............................................................................22
3.3. Perhitungan K-Means …….................................................................24

0 0
3.4. Langkah – langkah implementasi Rapidminer....................................28
3.5. Pembahasan…….................................................................................32
BAB IV PENUTUP...................................................................................................35
4.1. Kesimpulan.........................................................................................35
4.2. Saran....................................................................................................36
DAFTAR PUSTAKA................................................................................................37

0 0
BAB I

PENDAHULUAN

1.1. Latar Belakang Penulisan

Indonesia dianggap sebagai negara. Indonesia merupakan salah satu

negara dengan potensi paling besar dalam hal ketersediaan tenaga kerja, dan

itu harus menjadi sumber kekuatan pendorong dalam perekonomia. Namun,

kesulitan di Indonesia adalah bahwa populasi dan tenaga kerja di negara

berkembang menjadi suatu beban bagi pembangunan negara daripada asset

potensial yang dapat digunakan untuk mendorong ekonomi. Besarnya

pengangguran berdampak pada laju keberhasilan pembangunan ekonomi

(Prawira & Syurifto, 2018) . Pengangguran merupakan masalah utama di

negara non-industri seperti Indonesia, dengan pertumbuhan penduduk yang

sangat tinggi, akses pekerjaan yang tidak merata, penduduk dengan usia kerja

yang tidak dapat mengikuti perkembangan teknologi yang pesat, perubahan

ekonomi, tingkat Pendidikan, dll. Struktur dan ukuran upah yang disebabkan

oleh berbagai macam factor (Putrie & Sanjaya, 2021).

Jawa Tengah, salah satu Provinsi di Indonesia, masuk dalam kategori

pengangguran yang jumlahnya sering menurun, namun masih cukup tinggi.

Jumlah pengangguran dapat meningkat setiap tahunnya. Tingkat

pengangguran di Jawa tengah pada tahun 2019 sebesar 4,44%, tingkat

pengangguran terbuka di Jawa Tengah pada tahun 2020 meningkat menjadi

6,48%, dan menurun menjadi 5,95% pada tahun 2021 (Purboningtyas et al.,

2020) .Pengangguran yang tinggi sangat mempengaruhi mempengaruhi

0 0
2

tingkat kemiskinan di beberapa daerah (Bintang & Woyanti, 2018).

Akibatnya adalah salah satu penentu utama tingkat kemiskinan, penelitian

yang lebih mendalam tentang pengangguran dan indikator yang sangat

mempengaruhi tingkat pengangguran perlu dilakukan. Dengan memanfaatkan

metode pengelompokan salah satunya.

clustering adalah salah satu Teknik Analisa data mining (Sanjaya &

Fitriyani, 2019) , clustering adalah teknik untuk membagi dataset menjadi

kelompok-kelompok atau cluster berdasarkan suatu kesamaan yang telah

ditentukan (Setiawan, 2017). Metode K-Means merupakan metode

pengelompokan yang mengelompokan suaty data berdasarkan dengan pusat

cluster (cetroid) yang paling dekat dengan data tersebut (Talakua et al., 2017).

K-Means bertujuan untuk mengorganisasikan data dengan meningkatkan

kesamaan data dalam kelompok dan mengurangi kesamaan data antar cluster

(Fitriyani & Sanjaya, 2018).

Kelebihan Algoritma K-Means diantaranya dalah mampu

mengelompokan objek besar dan pencilan obyek dengan sangat cepat

sehingga mempercepat proses pengelompokan. Kekurangan Algoritma K-

Means yaitu sangat sensitive pada pembangkitan titik pusat awal secara

random, hasil pengelompokan bersifat tidak unik (selalu berubah-ubah) dan

proses pengerjaannya cepat tetapi keakuratannya tidak dijamin (Bastian et al.,

2018).

Pada penelitian yang telah dilakukan sebelumnya, yaitu tentang

pengelompokan tingkat pengangguran di Sulawesi Selatan dengan indikator

TPT, UMK, dan IPM, penelitian ini kemudian akan memanfaatkan indikator

jumlah penduduk dan upah minimum Kabupaten/Kota disamping jumlah

0 0
3

pengangguran sebagai acuan utama. Data yang digunakan pada penelitian ini

adalah data Badan Pusat Statistik (BPS) Jawa Tengah Tahun 2019-2021.

Hasil pengelompokan yang diperoleh nantinya dapat digunakan untuk

menjelaskan bagaimana pemerintah daerah melakukan penanganan masalah

pengangguran dengan mengkaji factor-faktor yang mempengaruhi

pengangguran, seperti jumlah penduduk dan upah.

Berdasarkan latar belakang tersebut, maka penelitian ini mengambil

judul “Pengelompokan Kabupaten/Kota Berdasarkan Indikator Tingkat

Pengangguran Menggunakan Algoritma K-Means clustering (Studi

Kasus: Provinsi Jawa Tengah)”

1.2. Masalah Penelitian

1.2.1. Identifikasi Masalah

Berdasarkan latar belakang yang telah diuraikan terdapat

permasalahan yang terjadi, yaitu masalah pengangguran yang selalu muncul

setiap tahuannya. Pengelompokan daerah pengangguran berdasarkan

indikator tingkat pengangguran sangat penting karena keberhasilan

pengelompokan tingkat pengangguran dapat digunakan untuk menjelaskan

bagaimana pemerintah daerah menangani masalah pengangguran.

Pengelompokan jumlah pengangguran tidak mudah diramalkan secara linier.

Sehingga diperlukan metode yang bisa mendapatkan hasil untuk

mengidentifikasi pengelompokan daerah pengangguran berdasarkan indikator

tingkat pengangguran dengan akurat untuk membantu pemerintah dalam

menangani masalah tersebut.

0 0
4

1.2.2. Batasan Masalah

Sejumlah permasalahan yang dibahas dalam usulan penelitian ini akan

dibatasi ruang lingkup pembahasannya, antara lain:

a. Data-data masukan berupa data pengangguran terbuka , jumlah penduduk

dan upah minimum periode 2019-2021, dari website resmi Badan Pusat

Statistik (BPS) Jawa Tengah.Apakah algoritma K-Means clustering dapat

digunakan sebagai metode pengambilan keputusan pemecahan masalah

untuk mengidentifikasi pengelompokan daerah pengangguran sesuai

dengan indikator pengangguran di Jawa Tengah?

1.2.3. Rumusan Masalah

Rumusan masalah dalam penelitian ini adalah Bagaimana menerapkan

algoritma K-Means clustering sebagai metode untuk mengidentifikasi

pengelompokan daerah pengangguran di Jawa Tengah.

1.3. Tujuan Penelitian

1.3.1. Tujuan Penelitian

Tujuan dari penelitian ini adalah untuk mendapatkan hasil

pengelompokan Kabupaten/Kota di Provinsi Jawa Tengah berdasarkan

indikator tingkat pengangguran.

1.3.2. Manfaat Penelitian

a. Manfaat Praktis

Menghasilkan keluaran berupa metode yang digunakan untuk

menentukan keakuratan pengelompokan daerah pengangguran sesuai

0 0
5

dengan indikator tingkat penganguran di Jawa Tengah. Dan dapat

digunakan untuk menjelaskan bagaimana pemerintah daerah menangani

masalah pengangguran.

b. Manfaat Teoritis

Hasil dari penelitian ini merupakan bukti empiris dari hasil suatu

percobaan penggunaan metode K-Means clustering sebagai metode

pengambilan keputusan pemecahan masalah dalam keakuratan

mengidentifikasi pengelompokan daerah pengangguran berdasarkan

indikator tingkat pengangguran.

0 0
BAB II

LANDASAN TEORI

2.1. Konsep Dasar Data Mining

2.1.1. Definisi Data Mining

Data Mining merupalan bidang dari beberapa bidang keilmuan yang

menyatukan Teknik dari pembelajaran mesin, pengenalan pola, statistik,

database, dan visualisasi untuk pengenalan permasalahan pengambilan

informasi dari database yang besar (Setiawan, 2017).

Data mining juga dapat dijelaskan sebagai pengolahan untuk

memperoleh informasi dengan menggunakan Teknik matematika, statistic,

machine learning dan artificial intelligence untuk mengidentifikasi

pengetahuan yang bermanfaat serta terikat dari bermacam data warehouse

atau database yang besar (R et al., 2022).

Tugas data mining bisa dikelompokan ke dalam enam kelompok

berikut ini: (Manurung & Hasugian, 2019)

1. Klasifikasi (classification): men-generalisasi susunan yang diketahui

untuk diaplikasikan pada data-data terbaru. Misalkan, klasifikasi penyakit

kedalam sejumlah jenis, klasifikasi email ke dalam spam atau bukan.

2. Klasterisasi (clustering): mengklasifikasikan data, yang tidak diketahui

label kelasnya, ke dalam sejumlah kelompok tertentu sesuai dengan

ukuran kemiripannya.

3. Regresi (regression): menemukan suatu fungsi yang memodelkan data

dengan kesalahan prediksi sekecil mungkin.

0 0
7

4. Deteksi anomaly (anomaly detection): mengidentifikasikan data yang

tidak biasa, bisa berupa outler (pencilan), perubahan atau deviasi yang

mungkin sangat penting dan perlu investigasi lebih lanjut.

5. Pembelajaran atauran asosiasi (association rule learning) atau

permodelan kebergantungan (dependency modeling): mencari relasi antar

variable

6. Perangkuman (summarization): menyediakan representasi data yang

lebih sederhana, meliputi visualisasi dan pembuatan laporan.

2.1.2. Tahap – Tahap Data Mining

Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi

beberapa tahap proses yang di ilustrasikan pada gambar 1. Tahap – tahap

tersebut bersifat interaktif, pemakai terlohat langsung atau dengan perantara

knowledge base.

Gambar 1. Tahap - tahap Data Mining (Han & Kaufmann, 2006)

0 0
8

Tahap – tahap Data Mining adalah sebagai berikut : (Ridwan et al., 2018)

1. Pembersihan data (data cleaning)

Pembersihan data merupakan proses menghilang-kan noise dan data

yang tidak konsisten atau data tidak relevan.

2. Integrasi data (data integration)

Integrasi data merupakan penggabungan data dari berbagai database

ke dalam satu database baru.

3. Seleksi data (data selection)

Data yang ada pada database sering kali tidak semuanya dipakai, oleh

karena itu hanya data yang sesuai untuk dianalisis yang akan diambil

dari database.

4. Tranformasi data (data transformation)

Data diubah atau digabung ke dalam format yang sesuai untuk

diproses dalam data mining.

5. Proses mining

Merupakan suatu proses utama saat metode diterapkan untuk

menemukan pengetahuan berharga dan tersembunyi dari data.

Beberapa metode yang dapat digunakan berdasarkan pengelompokan

data mining dapat dilihat pada Gambar 2.

0 0
9

Gambar 2. Beberapa Metode Data Mining

6. Evaluasi pola (pattern evaluation)

Untuk mengidentifikasi pola – pola menarik ke dalam knowledge

based yang ditemukan.

7. Presentasi pengetahuan (knowledge presentation)

Merupakan visualisasi dan penyajian pengetahuan mengenai metode

yang digunakan untuk memperoleh pengetahuan yang diperoleh

pengguna.

2.2. Algoritma K-Means

2.2.1. Pengertian Algoritma K-Means

Algoritma K-means merupakan salah satu algoritma dengan

partitional, karena K-means didasarkan pada penentuan jumlah awal

kelompok dengan mengidentifikasikan nilai centroid awalnya. Algoritma K-

means menggunakan proses secara berulang – ulang untuk mendapatkan

basis data cluster. Dibutuhkan jumlah cluster awal yang diinginkan sebagai

0 0
10

masukan dan menghasilkan titik centroid akhir sebagai output (R. A.

Indraputra & Fitriana, 2020).

Algoritma K-Means memiliki kelebihan yaitu algoritmanya

sederhana, mudah di implementasikan. Dan merupakan salah satu metode

yang cukup efisien dalam hal komplektisitas nya O (nkt). Sedangkan untuk

kekurangannya yaitu mempunyai masalah sensitifitas terhadap penentuan

partisi awal jumlah cluster (k) dan solusi akhir menyatu pada local minima.

Penentuan partisi

2.3. RapidMiner

Rapidminer merupakan software/perangkat lunak untuk pengolahan

data. Dengan menggunakan prinsip dan algoritma data mining, Rapidminer

mengekstrak pola-pola dari dataset yang besar dengan mengkombinasikan

metode statistika, kecerdasan buatan dan database (C.T.I et al., 2017).

2.4. Badan Pusat Statistik (BPS)

2.4.1. Pengertian Badan Pusat Statistik (BPS)

Badan Pusat Statistik (BPS) adalah lembaga pemerintahan non-

departemen di Indonesia yang mempunyai fungsi pokok sebagai penyedia data

dan informasi statistic, baik untuk pemerintah maupun untuk masyarakat

umum, secara nasional maupun regional (Bacsafra et al., 2022).

2.5. Tahapan Penelitian

Tahap ini, akan menjelaskan gambaran metode penelitian yang

digunakan. Gambar 1 menggambarkan langkah-langkah yang diambil pada

penelitian ini.

0 0
11

Gambar 2. 1. Desain Penelitian

1. Identifikasi Masalah

Bagaimana menerapkan algoritma K-Means clustering untuk

mengidentifikasi pengelompokan daerah pengangguran sesuai dengan

indikator pengangguran yang digunakan.

2. Pengumpulan Data

Penulis menggunakan website resmi Badan Pusat Statistik (BPS) Jawa

Tengah https://jateng.bps.go.id/ untuk melakukan pengamatan langsung

terhadap apa yang sedang diteliti. Data yang diperoleh adalah pengangguran,

jumlah penduduk dan upah minimum periode 2019-2021.

3. Pemodelan K-Means clustering

Pemodelan yang digunakan terhadap objek penelitian yaitu menentukan

jumlah cluster dalam data, kemudian menentukan nilai pusat atau centroid,

dan terakhir menggunakan jarak Euclidean Distance untuk menghitung jarak

terdekat ke centroid untuk mendapatkan kelompok terbaik

0 0
12

4. Evaluasi dan Validasi

Langkah selanjutnya adalah evaluasi cluster yang dihasilkan berdasarkan

jumlah dan kedekatan antar data hasil cluster. Proses evaluasi disini

menggunakan Davies-Bouldin Index (DBI).

5. Hasil

Hasil analis data yang diproses sebelumnya akan diuji pada tahap ini. Adapun

mekanisme pengujian hasil adalah sebagai berikut:

a. Dataset pertama akan dikumpulkan berupa statistik pengangguran,

jumlah penduduk dan upah minimum di wilayah/kota Jawa Tengah dari

tahun 2019 hingga 2021. Data berikut dievaluasi menggunakan algoritma

K-Means.

b. Data yang telah dievaluasi, dimasukan menggunakan kriteria pada

metode K-Means dan dihitung secara manual.

c. Data yang di analisis kemudian akan di proses dan diperiksa

menggunakan aplikasi Rapidminer (alat pengukuran pengujian, tingkat

kesalahan/akurasi)

d. Hasil yang didapat dari perhitungan data secara manual menggunakan

kriteria metode K-Means, kemudian dibandingkan dengan perhitungan

data yang dilakukan menggunakan program Rapidminer.

2.6. Instrument Penelitian

berdasarkan permasalahan yang dijelaskan sebelumnya, maka bahan

dan peralatan yang dibutuhkan untuk penelitian ini adalah:

a. Dataset

0 0
13

Terdapat 35 data dalam dataset yang digunakan dalam penelitian ini, antara

lain pengangguran, jumlah penduduk dan Upah Minimum Kabupaten/Kota

tahun 2019-2021 sebanyak 315 data. Data tersebut di dapatkan dari hasil

riset website resmi Badan Pusat Statistik (BPS) Jawa Tengah.

b. Peralatan

Dibawah ini merupakan kebutuhan dari penelitian diantaranya:

1) Microsoft office excel professional 2021, aplikasi ini digunakan penulis

sebagai media penulisan dan hitung manual dari dataset yang diperoleh.

2) Rapidminer versi 9.10 merupakan aplikasi yang digunakan untuk

menguji keakuratan dalam pengelompokkan pengangguran pada provinsi

Jawa Tengah memanfaatkan teknik data mining yaitu metode K-Means

clustering terhadap dataset.

2.7. Metode Pengumpulan Data

Data penelitian ini dikumpulan menggunakan teknik pengamatan

(observasi) di situs resmi Badan Pusat Statistik (BPS) Jawa Tengah.

2.8. Variabel Data

Pengangguran, jumlah penduduk, dan upah minimum di 35

Kabupaten/Kota tahun 2019- 2021 di Provinsi Jawa Tengah merupakan

variabel data yang diperoleh untuk penelitian ini.

2.9. Penelitian Terkait

Penelitian mengenai pengelompokan tingkat pengangguran telah

banyak dilakukan, kajian terhadap penelitian tersebut juga sangat bervariasi

0 0
14

dengan berbagai macam metode. Selain itu penggunaan algoritma k-Means

clustering juga telah banyak diterapkan di berbagai macam penelitian.

Beberapa penelitian sejenis yang telah dilakukan terdahulu antara lain yaitu:

1. Penelitian oleh Anggia Arifiani Putrie dan Rangga Sanjaya yang berjudul

“Pengelompokan Kabupaten/Kota Berdasarkan Indikator Pengangguran

Menggunakan Algoritma K-Means clustering (Studi Kasus: Provinsi Jawa

Barat)” dilakukan di Provinsi Jawa Barat. Dengan menggunakan metode

K-Means clustering didapatkan hasil yaitu diperoleh 4 cluster, yaitu

cluster 0 menunjukan daerah dengan tingkat pengangguran paling rendah

terdapat 18 kabupaten/kota cluster 1 menunjukan daerah dengan tingkat

pengangguran rendah terdapat 2 kabupaten/kota. cluster 2 menunjukan

daerah dengan pengangguran tinggi terdapat 1 kabupaten, dan cluster 3

menunjukan daerah dengan tingkat pengangguran sedang terdapat 2 kota.

Pada tahap hasil evaluasi menggunakan metode Davies Bouldin Index

pada rapid miner menghasilkan Davies Bouldin sebesar 0.328 artinya

hasilnya baik karena hasilnya 0 (non-negatif) (Putrie & Sanjaya, 2021).

2. Penelitian oleh Ari Eko Wardoyo dan Nigati Tripuspita yang berjudul

“Penentuan cluster Optimum pada Tingkat Pengangguran dan Tingkat

Kemiskinan di Jawa Timur Menggunakan Algoritma Fuzzy C-Means”

dilakukan di Jawa Timur. Dengan menggunakan metode Fuzzy C-Means

dan juga penentuan cluster optimum didapatkan hasil pada 2 cluster

dengan nilai DBI 0.8737. cluster optimum terdapat pada 4 cluster yang

ditandai dengan nilai DBI yang paling kecil (Wardoyo & Tripuspita,

2021).

0 0
15

3. Penelitian oleh Rijalul Fikri, Aswin Mushardiyanto, Mochamad Naufal

Laudza Banin, Kristiana Maureen, dan Harry Patria yang berjudul

“Pengelompokan Kabupaten/Kota di Indonesia Berdasarkan Informasi

Kemiskinan Tahun 2020 Menggunakan Metode K-Means clustering

Analysis”. Dengan menggunakan metode K-Means clustering Analysis

didapatkan hasil empat kelompok / cluster, dengan jumlah enggota cluster

1 sebanyak 117 Kabupaten/Kota, cluster 2 sebanyak 154 Kabupaten/Kota,

cluster 3 sebanyak 173 Kabupaten/Kota dan cluster 4 sebanyak 70

Kabupaten/Kota (Fikri et al., 2021).

4. Penelitian oleh Nanda Try Luchia, Hani Handayani, Fathan Surya Hamdi,

Dwi Erlangga, dan Sania Fitri Octavia yang berjudul “Perbandingan K-

Means dan K-Medoids Pada Pengelompokan Data Miskin di Indonesia”.

Dengan menggunakan metode K-Means dan K-Medoids didapatkan hasil

bahwa algoritma K-Means lebih baik jika dibandingkan dengan K-

Medoids dalam mengklasterisasikan data miskin yang ada di Indonesia.

Dibuktikan dengan nilai terbaik DBI K-Means sebesar 0.041 dengan

percobaan K=8 (Luchia et al., 2022).

5. Penelitian oleh Pradini Nurul Safitri, Rafika Aristawidya, dan Shafa Bunga

Faradilla yang berjudul “Klasterisasi Faktor-faktor kemiskinan di Provinsi

Jawa Barat Menggunakan K-Medoids clustering” dilakukan di Jawa Barat.

Dengan menggunakan metode K-Medoids clustering didapatkan hasil

yaitu diperoleh tiga kelompok, dengan kelompok satu memiliki anggota

sebanyak delapan wilayah, kelompok dua memiliki anggota sebanyak

yaitu 15 wilayah, dan kelompok tiga memiliki anggota sebanyak empat

wilayah (Safitri et al., 2021).

0 0
16

6. Penelitian oleh Sarbaini, Windylia Saputri, Nazarudin, dan Fitriani

Muttakin yang berjudul “ cluster Analysis Menggunakan Algoritma Fuzzy

K-Means Untuk Tingkat Pengangguran di Provinsi Riau” dilakukan di

Provinsi Riau. Dengan menggunakan Fuzzy K-Means didapatkan hasil dari

12 kabupaten/kota di provinsi Riau terbagi menjadi dua cluster tingkat

pengangguran tinggi dan cluster tingkat pengangguran rendah, cluster

dengan tingkat pengangguran tinggi terdapat 6 wilayah dan tingkat

pengangguran rendah terdapat 6 wilayah (Sarbaini et al., 2022).

7. Penelitian oleh Nabila Nur Fransiska R, Dwi Suci Anggraeni, dan Ultach

Enri yang berjudul “Pengelompokan Data Kemiskinan Provinsi Jawa Barat

Menggunakan Algoritma K-Means dengan Silhouette Coefficient West

Java Province Poverty Data Grouping Using the K-Means Algorithm with

Silhouette Coefficient” dilakukan di Jawa Barat. Hasil yang diperoleh

sebanyak 2 cluster dengan cluster 0 tingkat kemiskinan tinggi sebanyak 15

wilayah dan cluster 1 tingkat kemiskinan rendah sebanyak 13 wilayah.

Berdasarkan pengujian, Algoritma K-Means memperoleh hasil Silhoutte

Coefficient yaitu 0.576 dan masuk ke dalam kategori medium structure (R

et al., 2022).

8. Penelitian oleh Edy Widodo, Putri Ermayani, Latifah Nur Laila, dan Asdan

Tri Madani yang berjudul “Pengelompokan Provinsi di Indonesia

Berdasarkan Tingkat Kemiskinan Menggunakan Analisa Hierarchical

Agglomerative clustering”. Hasil yang diperoleh 3 cluster tingkat

kemiskinan yaitu cluster 1 merupakan tingkat rendah dengan anggota 25

provinsi, cluster 2 atau tingkat sedang sebanyak 7 provinsi, dan cluster 3

dengan tingkat tinggi sebanyak 2 anggota (Widodo et al., 2021).

0 0
17

9. Penelitian oleh Elvhira Rosiana Tirayo yang berjudul “Pengelompokan

Kabupaten/Kota di Sulawesi Tengah Menurut Indikator Sosial Ekonomi

Menggunakan K-Medoids clustering” dilakukan di Sulawesi Tengah.

Dengan menggunakan K-Medoids clustering hasil yang diperoleh adalah

cluster yang terbentuk membagi kabupaten/kota di Sulawesi Tengah

menjadi dua kelompok yaitu wilayah yang memiliki indikator social

ekonomi tinggi dan rendah (Tirayo, 2019).

10. Penelitian oleh Shela Yulfia Hadist dan Agung Priyo Utomo yang berjudul

“Pengelompokan Kabupaten/Kota di Pulai Jawa Berdasarkan Kondisi

Sosial Ekonomi Sebelum dan Setelah Memasuki Pandemi COVID-19

Penerapan Metode cluster Ensemble” dilakukan di pulau jawa. Dengan

menggunakan metode cluster Ensemble didapatkan hasil yaitu

menunjukan bahwa rata-rata terjadi penurunan pertumbuhan ekonomi dan

jumlah sector unggulan, serta peningkatan TPT, Jumlah Angkatan kerja,

penduduk miskin, dan pengeluaran per kapita di Pulau Jawa setelah

memasuki pandemic COVID-19. Dari 3 klaster yang terbentuk pada tahun

2019 dan 5 klaster pada tahun 2020, didapat bahwa secara umum

pengelompokan tiap klister tidak jauh berbeda, namun terdapat beberapa

perbedaan karakteristik dan anggota klister (Hadist & Utomo, 2021).

Perbedaan penelitian yang dilakukan dengan penelitian – penelitian

yang sebelumnya sebagai berikut:

1. Terhadap penelitian oleh Anggia Arifiani Putrie dan Rangga Sanjaya,

penelitian sama-sama menggunakan metode K-Means clustering tetapi

terdapat perbedaan yaitu ada di lokasi penelitiannya. Penelitian yang

0 0
18

sekarang dilakukan di Jawa Tengah sedangkan Anggia Arifiani Putrie

dan Rangga Sanjaya melakukan penelitian di Jawa Barat.

2. Terhadap penelitian oleh Ari Eko Wardoyo dan Nigati Tripuspita,

penelitian yang sekarang mempunyai perbedaan yaitu menggunakan

algoritma K-Means clustering. Sedangkan penelitian yang dilakukan

oleh Ari Eko Wardoyo dan Nigati Tripuspita menggunakan Algoritma

Fuzzy K-Means. Dan objek penelitiannya pun berbeda.

3. Terhadap penelitian oleh Rijalul Fikri, Aswin Mushardiyanto,

Mochamad Naufal Laudza Banin, Kristiana Maureen, dan Harry

Patria, penelitian sama-sama menggunakan metode K-Means

clustering tetapi terdapat perbedaan yaitu ada di objek penelitiannya.

4. Terhadap penelitian oleh Nanda Try Luchia, Hani Handayani, Fathan

Surya Hamdi, Dwi Erlangga, dan Sania Fitri Octavia, penelitian yang

sekarang mempunyai perbedaan yaitu hanya menggunakan algoritma

K-Means clustering. Sedangkan Nanda Try Luchia, Hani Handayani,

Fathan Surya Hamdi, Dwi Erlangga, dan Sania Fitri Octavia meneliti

obyek dengan menggunakan algoritma K-Means dan K-Medoids

untuk dibandingkan hasil dari kedua algoritma tersebut. Dan objek

penelitiannya pun berbeda.

5. Terhadap penelitian oleh Pradini Nurul Safitri, Rafika Aristawidya,

dan Shafa Bunga Faradilla, penelitian yang sekarang mempunyai

perbedaan yaitu menggunakan algoritma K-Means clustering.

Sedangkan penelitian yang dilakukan oleh Pradini Nurul Safitri,

Rafika Aristawidya, dan Shafa Bunga Faradilla menggunakan

0 0
19

Algoritma K-Medoids clustering. Dan objek penelitiannya pun

berbeda.

6. Terhadap penelitian oleh Sarbaini, Windylia Saputri, Nazarudin, dan

Fitriani Muttakin, penelitian yang sekarang mempunyai perbedaan

yaitu menggunakan algoritma K-Means clustering. Sedangkan

penelitian yang dilakukan oleh Sarbaini, Windylia Saputri, Nazarudin,

dan Fitriani Muttakin menggunakan Algoritma Fuzzy K-Means. Dan

objek penelitiannya pun berbeda.

7. Terhadap Penelitian oleh Nabila Nur Fransiska R, Dwi Suci

Anggraeni, dan Ultach Enri, penelitian sama-sama menggunakan

metode K-Means clustering tetapi terdapat perbedaan yaitu ada di

objek penelitiannya.

8. Terhadap penelitian oleh Edy Widodo, Putri Ermayani, Latifah Nur

Laila, dan Asdan Tri Madani, penelitian yang sekarang mempunyai

perbedaan yaitu menggunakan algoritma K-Means clustering.

Sedangkan penelitian yang dilakukan oleh Edy Widodo, Putri

Ermayani, Latifah Nur Laila, dan Asdan Tri Madani menggunakan

Analisa Hierarchical Agglomerative clustering. Dan objek

penelitiannya pun berbeda.

9. Terhadap penelitian oleh Elvhira Rosiana Tirayo, penelitian yang

sekarang mempunyai perbedaan yaitu menggunakan algoritma K-

Means clustering. Sedangkan penelitian yang dilakukan oleh Elvhira

Rosiana Tirayo menggunakan K-Medoids clustering. Dan objek

penelitiannya pun berbeda. Penelitian yang sekarang dilakukan yaitu

berdasarkan indikator pengangguran studi kasus di Jawa Tengah,

0 0
20

sedangkan penelitian yang dilakukan oleh Elvhira Rosiana Tirayo

yaitu berdasarkan indikator social ekonomi studi kasus Sulawesi

tengah.

10. Terhadap penelitian oleh Shela Yulfia Hadist dan Agung Priyo Utomo,

penelitian yang sekarang mempunyai perbedaan yaitu menggunakan

algoritma K-Means clustering. Sedangkan penelitian yang dilakukan

oleh Shela Yulfia Hadist dan Agung Priyo Utomo menggunakan

Metode cluster Ensemble. Dan objek penelitiannya pun berbeda

0 0
BAB III

HASIL DAN PEMBAHASAN

3.1. Pengolahan Awal Data

Di dalam bab ini akan membahas tentang data yang akan digunakan

dalam penelitian, jumlah data yang diperoleh dari data public yaitu dari situs

resmi Badan Pusat Statistik, Provinsi Jawa Tengah mengenai pengangguran yang

masih mengalami naik turun. Tingkat pengangguran di Jawa Tengah sebesar 4,44

persen pada tahun 2019, 6,48 persen pada tahun 2020 dan 5,95 persen pada tahun

2021. Dengan peningkatan yang cukup besar sebesar 6,48 persen pada tahun

2020 dan 5,95 pada tahun 2021. Pemerintah menghadapi tugas berat dalam

mengurangi pengangguran di setiap kabupaten/kota di Provinsi Jawa Tengah.

Pada penelitian ini yaitu mengumpulkan data pengangguran, jumlah

penduduk, dan upah minimum kab/kota Provinsi Jawa Tengah. Nilai rata-rata

setiap atribut yang digunakan menjadi focus pada penelitian ini.

Tabel 1. Rata-rata Pengangguran, Jumlah Penduduk, dan Upah minimum Kab/Kota

Penganggura Jumlah
Kabupaten / Kota UMK
n Penduduk
Kabupaten Cilacap 165939 1727098 1989058
Kabupaten Banyumas 95162 1693006 1750000
Kabupaten Purbalingga 55354 933989 1788500
Kabupaten Banjarnegara 53602 923192 1610000
Kabupaten Kebumen 73427 1197982 1686000
Kabupaten Purworejo 26593 718316 1700000
Kabupaten Wonosobo 40320 790504 1712500

21

0 0
22

Kabupaten Magelang 53597 1290591 1882000


Kabupaten Boyolali 47006 984807 1790000
Kabupaten Klaten 59955 1174986 1795061
Kabupaten Sukoharjo 41132 891912 1783500
Kabupaten Wonogiri 31503 959492 1655000
Kabupaten Karanganyar 46167 886519 1833000
Kabupaten Sragen 40931 890518 1673500
Kabupaten Grobogan 59390 1377788 1685500
Kabupaten Blora 36683 865013 1690000
Kabupaten Rembang 25972 638188 1660000
Kabupaten Pati 56614 1259590 1742000
Kabupaten Kudus 37402 871311 2044468
Kabupaten Jepara 55465 1257912 1879031
Kabupaten Demak 71682 1162805 2240000
Kabupaten Semarang 42699 1053786 2055000
Kabupaten Temanggung 24747 772018 1682027
Kabupaten Kendal 71726 971086 2084393
Kabupaten Batang 46750 768583 1900000
Kabupaten Pekalongan 49457 897711 1859885
Kabupaten Pemalang 98681 1302813 1718000
Kabupaten Tegal 144729 1440698 1747000
Kabupaten Brebes 174363 1809096 1665850
Kota Magelang 8797 122111 1707000
Kota Surakarta 34673 519587 1802700
Kota Salatiga 12254 194084 1875325
Kota Semarang 132638 1814110 2498588
Kota Pekalongan 20205 307097 1906922
Kota Tegal 21982 249905 1762000

3.2. Preprocessing

Berikut adalah tahapan data preprocessing pada Mining:

1. Pembersihan data (Cleaning data)

0 0
23

Pembersihan data akan dilakukan dan data yang hilang akan diisi

menggunakan operator yang diberikan oleh rapidminer versi 9.10, yaitu

mengganti nilai yang hilang.Namun proses ini tidak dilakukan karena ada

data yang hilang.

2. Transformasi Data

Dengan mengkonversi data ke format yang dapat diproses kedalam data

mining, karena data tersebut sesuai untuk di proses maka tidak akan

dilakukan transformasi

3. Data mining

a. Jenis data yang digunakan dalam penelitian ini adalah clustering yang

digunakan untuk mengelompokan pengangguran berdasarkan jumlah

penduduk dan upah minimum di setiap Kabupaten/Kota di Provinsi

Jawa Tengah selama 3 tahun

b. Penelitian ini menggunakan teknik clustering K-Means untuk

mengklasifikasikan pengangguran pada berbagai tingkatan

berdasarkan jumlah penduduk dan upah minimum Jawa Tengah.

c. penggunaan algoritma data mining yaitu dengan menerapkan

algoritma yang telah ditentukan sebelumnya.

- Menentukan jumlah cluster (k) pada dataset, tahap ini akan dibuat

sebanyak 5 cluster yaitu tingkat sangat tinggi, tinggi, sedang,

rendah, dan sangat rendah.

- Menentukan titik pusat (centroid) awal secara acak

0 0
24

4. Evaluasi, pada langkah ini, kelompok atau cluster yang ada di evaluasi

dengan memanfaatkan pendekatan davies bouldin index (DBI) untuk

menentukan jarak terdekat antara data hasil cluster

5. Discovered Knowledge (Visualization dan Integration), Pada fase ini,

teknik clustering K-Means digunakan untuk mengelompokkan data

pengangguran terhadap kelompok kabupaten/kota Jawa Tengah

berdasarkan jumlah penduduk kabupaten/kota tahun 2019-2021 dan upah

minimum. Mengelompokkan kategori sangat tinggi, tinggi, sedang,

rendah, dan sangat rendah.

3.3. Perhitungan K-Means

1. Perhitungan pengelompokan K-Means cluster ing adalah menentukan cluster

(k) dalam dataset, tahap terdiri dari 5 cluster yaitu cluster C0, C1, C2, C3,

C4.

2. Menentukan titik pusat (centroid) awal secara acak kemudian menghitung

centroid cluster k-1:

Tabel 2 centroid Awal

Attribute C0 C1 C2 C3 C4
Pengangguran 132638 53597 47006 40931 26593
Jumlah
1814110 1290591 984807 890518 718316
Penduduk
UMK 2498588 1882000 1790000 1673500 1700000

Setelah menentukan centroid awal, cluster ditentukan dengan

menggunakan rumus jarak Eulidean Distance untuk menghitung jarak setiap

0 0
25

data yang ada ke centroid terdekat. Berikut rumus perhitungannya dan

diimplementasi menggunakan Ms. Excel.

Kemudian melakukan perhitungan yang sama dari data selanjutnya sampai

data ke 35 dan mencari jarak terpendeknya atau nilai terkecil . Setelah melakukan

pengelompokkan hasil dari iterasi 1 didapatkan hasil centroid baru untuk melakukan

iterasi berikutnya.

Attribute C1 C2 C3 C4 C5

Pengangguran 132638 92417 48868 40680 26229

Jumlah Penduduk 1814110 1391197 936390 909554 508039


177084
UMK 2498588 1814958 1904843 1657125
7

Lakukan perhitungan Euclidean Distance dengan centroid baru sampai

menghasilkan pola yang sama dari iterasi sebelumnya dengan yang terakhir.

Pada proses k-means dikatakan bahwa iterasi berhenti dan dianggap stabil jika

hasil iterasi baru sama dengan hasil iterasi sebelumnya.

 cluster 0
Rata-rata setiap variabel (centroid) cluster 0

Pengangguran 40241,201
Jumlah Penduduk 852805
Upah Minimum 1758825,327
Rata-rataa seluruh variabel cluster 0 883957,1316

0 0
26

Berdasarkan rata-rata pada cluster 0, nilai centroid untuk pengangguran

yaitu sebesar 40241,201, sedangkan untuk jumlah penduduk yaitu sebesar

852805 , dan untuk upah minimum Kab/Kota yaitu sebesar 1758825,327. Maka

rata-rata cluster yang diperoleh dari seluruh variabel di cluster 0 yaitu sebesar

883957,1316. Anggota cluster 0 antara lain Kabupaten Purbalingga, Kabupaten

Banjarnegara, Kabupaten Purworejo, Kabupaten Wonosobo, Kabupaten

Boyolali, Kabupaten Sukoharjo, Kabupaten Wonogiri, Kabupaten Karanganyar,

Kabupaten Sragen, Kabupaten Blora, Kabupaten Rembang, Kabupaten Kudus,

Kabupaten Temanggung, Kabupaten Batang, Kabupaten Pekalongan.

 cluster 1
Rata-rata setiap variabel (centroid) cluster 1

Pengangguran 145154,664
Jumlah Penduduk 1743067
Upah Minimum 1801636,027
Rata-rataa seluruh variabel cluster 1 1229952,452

Berdasarkan rata-rata pada cluster 1, nilai centroid untuk pengangguran

yaitu sebesar 145154,664, sedangkan untuk jumlah penduduk yaitu sebesar

1743067, dan untuk upah minimum Kab/Kota yaitu sebesar 1801636,027. Maka

rata-rata cluster yang diperoleh dari seluruh variabel di cluster 1 yaitu sebesar

1229952,452. Anggota cluster 1 antara lain Kabupaten Cilacap, Kabupaten

Banyumas, Kabupaten Brebes.

 cluster 2
Rata-rata setiap variabel (centroid) cluster 2

Pengangguran 132637,801
Jumlah Penduduk 1814110

0 0
27

Upah Minimum 2498587,530


Rata-rataa seluruh variabel cluster 2 1481778,444

Berdasarkan rata-rata pada cluster 2, nilai centroid untuk pengangguran

yaitu sebesar 132637,801, sedangkan untuk jumlah penduduk yaitu sebesar

1814110 , dan untuk upah minimum Kab/Kota yaitu sebesar 2498587,530.

Maka rata-rata cluster yang diperoleh dari seluruh variabel di cluster 2 yaitu

sebesar 1481778,444. Anggota cluster 2 antara lain Kota Semarang.

 cluster 3
Rata-rata setiap variabel (centroid) cluster 3
Pengangguran 19582,418
Jumlah Penduduk 278557
Upah Minimum 1810789,542
Rata-rataa seluruh variabel cluster 3 702976,2532

Berdasarkan rata-rata pada cluster 3, nilai centroid untuk pengangguran

yaitu sebesar 19582,418, sedangkan untuk jumlah penduduk yaitu sebesar

278557 dan untuk upah minimum Kab/Kota yaitu sebesar 1810789,542 . Maka

rata-rata cluster yang diperoleh dari seluruh variabel di cluster 3 yaitu sebesar

702976,2532. Anggota cluster 3 antara lain Kota Magelang, Kota Surakarta,

Kota Salatiga, Kota Pekalongan, Kota Tegal.

 cluster 4
Rata-rata setiap variabel (centroid) cluster 4
Pengangguran 64323,607
Jumlah Penduduk 1204934
Upah Minimum 1876698,591
Rata-rataa seluruh variabel cluster 4 1048652,033

0 0
28

Berdasarkan rata-rata pada cluster 0, nilai centroid untuk pengangguran

yaitu sebesar 64323,607, sedangkan untuk jumlah penduduk yaitu sebesar

1204934, dan untuk upah minimum Kab/Kota yaitu sebesar 1876698,591. Maka

rata-rata cluster yang diperoleh dari seluruh variabel di cluster 0 yaitu sebesar

1048652,033. Anggota cluster 0 antara lain Kabupaten Kebumen, Kabupaten

Magelang, Kabupaten Klaten, Kabupaten Grobogan, Kabupaten Pati, Kabupaten

Jepara, Kabupaten Demak, Kabupaten Semarang, Kabupaten Kendal, Kabupaten

Pemalang.

3.4. Langkah-langkah Implementasi Rapidminer

1. Desain

Setelah kita mempunyai data yang akan di analisa menggunakan

aplikasi Rapidminer, kita membuat desain sesuai dengan metode penghitungan

yang dibutuhkan, pada menu Operators yaitu clustering, dan menambah

Operators cluster Distance Perfomance untuk menganalisa jumlah cluster yang

mampu mengelompokan data dengan baik.

0 0
29

2. Proses Penerapan Algoritma K-Means Clustering

Berikut merupakan Proses Algoritma k-means clustering untuk

mengetahui hasil pengclusteran.

3. Menentukan jumlah k pada Operators clustering

0 0
30

Dalam mencari jumlah cluster terbaik dalam penelitian ini, kita uji dari

k=2 sampai dengan k=5

4. Menganalisa Nilai Davies Bouldin Index

Berdasarkan validasi hasil pada aplikasi Rapidminer menggunakan

Davies Bouldin Index, terbentuk 5 cluster yang dianggap mampu

mengelompokan data dengan baik. Berikut yang menggambarkan Performance

vector, yang merupakan hasil evaluasi dari cluster yang dibuat sebanyak 5

cluster dan memiliki nilai 0,601

Tabel 2. Hasil Pengujian DBI k=2 sampai k=5 menggunakan aplikasi Rapidminer
cluste Nilai Davies
r Bouldin
K=2 0.820
K=3 0.806
K=4 0.602
K=5 0.601

0 0
31

5. cluster Model clustering

Untuk mengetahui jumlah anggota cluster kita melihat pada cluster

Model (clustering).

6. centroid Tabel

Pada tabel centroid, kita dapat mengetahui rata-rata setiap attribut pada

masing-masing cluster. Dari sini kita dapat menentukan kriteria atau kategori

dari setiap cluster.

0 0
32

7. Data Anggota cluster

Untuk mengetahui kabupaten/kota yang merupakan anggota cluster kita

dapat melihat pada Data di ExampleSet (clustering).

8. Visualisasi

Berikut merupakan bentuk visualisasi dari hasil perhitungan data

menggunakan metode K-Means clustering.

0 0
33

3.5. Pembahasan

Menurut hasil pengelompokan K-Means menggunakan aplikasi

Rapidminer, cluster 0 adalah cluster dengan nilai rata-rata rendah dari semua

variabel. Maka cluster 0 termasuk dalam kategori kelompok pengangguran

rendah, yang di dalamnya terdapat 15 Kabupaten/Kota dengan nilai rata-rata

sebesar 883957,1316. cluster 1 termasuk dalam kategori kelompok pengangguran

tinggi yang di dalamnya terdapat 3 Kabupaten/Kota dengan rata-rata sebesar

1229952,452. cluster 2 termasuk dalam kelompok pengangguran paling tinggi

yaitu terdapat 1 Kabupaten dengan rata-rata sebesar 1481778,444. cluster 3

termasuk dalam kategori kelompok paling rendah yang di dalamnya terdapat 5

Kota dengan rata-rata sebesar 702976,2532. Dan cluster 4 termasuk kategori

kelompok sedang yang di dalamnya terdapat 11 Kabupaten/Kota dengan nilai

rata-rata 1048652,033.

Tabel 3. Hasil Cluster dari Rapidminer

RATA" PER WILAYAH cluster


925947,604
Kabupaten Purbalingga cluster_0
2
862264,579
Kabupaten Banjarnegara cluster_0
8
814969,550
Kabupaten Purworejo cluster_0
8
847774,565
Kabupaten Wonosobo cluster_0
5
940604,261
Kabupaten Boyolali cluster_0
7
905514,757
Kabupaten Sukoharjo cluster_0
3
881998,277
Kabupaten Wonogiri cluster_0
7
921895,242
Kabupaten Karanganyar cluster_0
1
868316,186 Kabupaten Sragen cluster_0

0 0
34

9
863898,731
Kabupaten Blora cluster_0
2
774720,151
Kabupaten Rembang cluster_0
6
984393,671
Kabupaten Kudus cluster_0
6
826264,054
Kabupaten Temanggung cluster_0
9
905110,919
Kabupaten Batang cluster_0
6
935684,419
Kabupaten Pekalongan cluster_0
3
883957,131
RATA" CLUSTER 0
6
1294031,70
Kabupaten Cilacap cluster_1
8
1179389,33
Kabupaten Banyumas cluster_1
8
1216436,31
Kabupaten Brebes cluster_1
1
1229952,45
RATA" CLUSTER 1
2
1481778,44
Kota Semarang cluster_2
4
1481778,44
RATA" CLUSTER 2
4
612636,098
Kota Magelang cluster_3
6
785653,466
Kota Surakarta cluster_3
2
693887,803
Kota Salatiga cluster_3
2
744741,613
Kota Pekalongan cluster_3
9
677962,284
Kota Tegal cluster_3
1
702976,253
RATA" CLUSTER 3
2
985802,921
Kabupaten Kebumen cluster_4
8
1075396,15
Kabupaten Magelang cluster_4
3
1010000,77 Kabupaten Klaten cluster_4
1040892,51
Kabupaten Grobogan cluster_4
1
1019401,20
Kabupaten Pati cluster_4
1
1064136,16 Kabupaten Jepara cluster_4

0 0
35

1
1158162,41
Kabupaten Demak cluster_4
3
1050494,97 Kabupaten Semarang cluster_4
1042401,82
Kabupaten Kendal cluster_4
4
1039831,40
Kabupaten Pemalang cluster_4
2
1048652,03
RATA" CLUSTER 4
3

Dari 5 cluster tersebut cluster 2 yang harus paling diberi perhatian lebih

oleh pemerintah karena cluster tersebut memiliki nilai rata-rata paling tertinggi

di Provinsi Jawa Tengah. Dan perlu adanya evaluasi tambahan pada anggota

cluster 1 karena cluster inipun mempunyai nilai rata-rata yang tinggi. Metode

untuk menurunkan tingkat pengangguran pada cluster ini diantaranya

pemerintah melakukan evaluasi upah minimum kab/kota pekerja sehingga dapat

menetapkan kebijakan yang berdampak pada peningkatan kesejahteraan dan

taraf hidup layak pekerja, pemerintah juga dapat menciptakan lapangan kerja

yang dibutuhkan dan menyerap sejumlah besar pekerja untuk mengurangi

tingkat pengangguran saat ini.

0 0
BAB IV

PENUTUP

4.1. Kesimpulan

Maka dengan menggunakan Algoritma K-Means Clustering,

kesimpulannya yang dapat ditarik mengenai pengelompokan pengangguran

berdasarkan jumlah penduduk dan Upah Minimum di Kabupaten/Kota

Provinsi Jawa Tengah Tahun 2019 – 2021 yaitu:

1. Hasil pengolahan pengangguran menurut indikator pengangguran, yaitu

jumlah penduduk dan upah Minimum Kabupaten/Kota dengan

menggunakan algoritma K-Means Clustering dapat menghasilkan

informasi, kelompok daerah mana saja yang memerlukan perhatian khusus

dari pemerintah dalam menciptakan dan meratakan lapangan kerja,

mengevaluasi Upah Minimum Kabupaten/Kota dan memperlambat laju

pertumbuhan penduduk di Kabupaten/Kota dengan tingkat pengangguran

yang tinggi.

2. Hasil clustering pada Rapidminer diperoleh Cluster 0 (pertama) terdapat

15 Kabupaten/Kota dengan rata-rata pengangguran rendah, cluster 1

(kedua) terdapat 3 Kabupaten/Kota dengan rata-rata pengangguran paling

rendah, cluster 2 (ketiga) terdapat 1 Kabupaten/Kota dengan rata-rata

pengangguran paling tinggi, cluster 3 (keempat) terdiri dari 5

Kabupaten/Kota Kota dengan rata-rata pengangguran tinggi dan Cluster 4

(kelima) terdiri dari 11 Kabupaten/Kota dengan rata-rata pengangguran

sedang.

35

0 0
36

3. Berdasarkan evaluasi Davies Bouldin Index (DBI) pembentukan 5 cluster

telah dinilai baik, karena dengan uji validasi pembentukan jumlah k

(cluster) 2-5 k (cluster), cluster 5 memiliki nilai yang paling dekat dengan

0, yaitu 0.601.

4.2. Saran

Dari hasil yang telah dilaksanakan, terdapat beberapa hal yang ingin

disarankan untuk pengembangan penelitian ini selanjutnya, yaitu:

1. Aspek Sistem

Aplikasi diharapkan dapat dikembangkan selanjutnya dengan menambah

variable atau atribut pada data training. Seperti hal menambah variabel –

variabel data agar data lebih spesifik.

2. Aspek Manajerial

Dapat dijadikan sarana informasi mengenai akurasi yang dihasilkan,

sehingga dapat membantu pemerintah dalam penanganan pengangguran di

Jawa Tengah.

3. Aspek Penelitian Lanjutan

Mengenai penelitian tentang “Pengelompokan Kabupaten/Kota

Berdasarkan Indikator Tingkat Pengangguran Menggunakan Algoritma K-

Means clustering (Studi Kasus: Provinsi Jawa Tengah), sebaiknya

pengujian selanjutnya dapat dilakukan dengan metode algoritma lain

sebagai pembanding untuk melihat metode mana yang tingkat

keakuratannya lebih tinggi untuk mendapatkan hasil yang optimal sesuai

kebutuhan.

0 0
37

DAFTAR PUSTAKA

Bacsafra, M. A., Kusumarawdani, D. M., & Darmansah. (2022). Pengembangan


Sistem Informasi Badan Pusat Statistik Kabupaten Kuningan Berbasis Android
Dengan Metode Prototype. Jurnal Sains Komputer & Informatika (J-SAKTI,
6(1), 379–390.

Bastian, A., Sujadi, H., & Febrianto, G. (2018). Penerapan Algoritma K-Means
clusteringAnalysis Pada Penyakit Menular Manusia (Studi Kasus Kabupaten
Majalengka). Jurnal Sistem Informasi, 14(1), 26–32.
https://jsi.cs.ui.ac.id/index.php/jsi/article/view/566

Bintang, A. B. M., & Woyanti, N. (2018). Pengaruh PDRB, Pendidikan, Kesehatan,


Dan Pengangguran Terhadap Tingkat Kemiskinan Di Jawa Tengah (2011-2015).
Jurnal Media Elektronika Dan Manajemen, 33, 20–28.
http://jurnal.untagsmg.ac.id/index.php/fe/article/view/563

C.T.I, B. R., Gafar, A. A., Fajriani, N., Ramadani, U., Uyun, F. R., Purnamasari, Y., &
Ransi, N. (2017). Implemetasi k-means clustering pada rapidminer untuk
analisis daerah rawan kecelakaan. April, 58–62.

Fikri, R., Mushardiyanto, A., Banin, M. N. L., Maureen, K., & Patria, H. (2021).
Pengelompokan Kabupaten/Kota di Indonesia Berdasarkan Informasi
Kemiskinan Tahun 2020 Menggunakan Metode K-Means clustering Analysis.
Seminar Nasional Teknik Dan Manajemen Industri, 1(1), 190–199.
https://doi.org/10.28932/sentekmi2021.v1i1.76

Fitriyani, & Sanjaya, R. (2018). Komparasi Algoritma Lr, K-Nn Dan Svm Untuk
Estimasi Area Kebakaran Hutan. Jurnal Teknologi Informasi Dan Elektronika,
3(2), 103–110. http://183.91.79.105/index.php/infotronik/article/view/109

Hadist, S. Y., & Utomo, A. P. (2021). Pengelompokan Kabupaten/Kota di Pulau Jawa


Berdasarkan Kondisi Sosial Ekonomi Sebelum dan Setelah Memasuki Pandemi
COVID-19 Penerapan Metode cluster Ensemble. Seminar Nasional Official
Statistics, 19(2020), 322–332.

Han, J., & Kaufmann, M. K. M. (2006). Data Mining : Concepts and Techniques
( 2nd edition ) Bibliographic Notes for Chapter 6 Classification and Prediction.

0 0
38

Luchia, N. T., Handayani, H., Hamdi, F. S., Erlangga, D., & Octavia, S. F. (2022). …
K-Means dan K-Medoids Pada Pengelompokan Data Miskin di Indonesia:
Comparison of K-Means and K-Medoids on Poor Data clustering in Indonesia.
… Indonesian Journal of …, 2(October), 35–41.
https://journal.irpi.or.id/index.php/malcom/article/view/422

Manurung, E., & Hasugian, P. S. (2019). Data Mining Tingkat Pesanan Inventaris
Kantor Menggunakan Algoritma Apriori pada Kepolisian Daerah Sumatera
Utara. Journal Of Informatic Pelita Nusantara, 4(2), 8–13.

Prawira, & Syurifto. (2018). Pengaruh Pertumbuhan Ekonomi, Upah Minimum


Provinsi, Dan Tingkat Pendidikan Terhadap Pengangguran Terbuka Di
Indonesia. Jurnal Ecogen, 1, 162–168.
http://ejournal.unp.ac.id/students/index.php/pek/article/view/4735/2647

Purboningtyas, I., Sari, I. R., Guretno, T., Dirgantara, A., Agustina, D., & Haris, M.
Al. (2020). Analisis Pengaruh Tingkat Pengangguran Terbuka Dan Indeks
Pembangunan Manusia Terhadap Kemiskinan Di Provinsi Jawa Tengah. Jurnal
Saintika Unpam, 3, 81–88.
http://openjournal.unpam.ac.id/index.php/jsmu/article/view/5640

Putrie, A. A., & Sanjaya, R. (2021). Pengelompokan Kabupaten/Kota Berdasarkan


Indikator Tingkat Pengangguran Menggunakan Algoritma K-Means clustering
(Studi Kasus: Provinsi Jawa Barat). EProsiding Sistem Informasi (POTENSI), 2,
111–121. http://eprosiding.ars.ac.id/index.php/psi/article/view/595

R. A. Indraputra, & Fitriana, R. (2020). K-Means clustering Data COVID-19. Jurnal


Teknik Industri, 10(3), 275–282.
https://www.trijurnal.lemlit.trisakti.ac.id/index.php/tekin/article/view/8428/6033

R, N. N. F., Anggraeni, D. S., & Enri, U. (2022). Pengelompokkan Data Kemiskinan


Provinsi Jawa Barat Menggunakan Algoritma K-Means dengan Silhouette
Coefficient. TEMATIK (Jurnal Teknologi Informasi Komunikasi), 9(1), 29–35.
https://doi.org/10.38204/tematik.v9i1.921

Ridwan, M., Suyono, H., & Sarosa, M. (2018). Implementasi Data Mining untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes
Classifier. Creative Information Technology Journal, 4(2), 151.
https://doi.org/10.24076/citec.2017v4i2.106

Safitri, P. N., Aristawidya, R., & Faradilla, S. B. (2021). Klasterisasi Faktor-Faktor


Kemiskinan Di Provinsi Jawa Barat Menggunakan K-Medoids clustering.

0 0
39

Journal of Mathematics Education and Science, 4(2), 75–80.


https://doi.org/10.32665/james.v4i2.242

Sanjaya, R., & Fitriyani. (2019). Prediksi Bedah Toraks Menggunakan Seleksi Fitur
Forward Selection dan K-Nearest Neighbor. Jurnal Jepin, 5, 316–320.
https://jurnal.untan.ac.id/index.php/jepin/article/view/35324

Sarbaini, Saputri, W., Nazarudin, & Muttakin, F. (2022). cluster Analysis


Menggunakan Algoritma Fuzzy K-Means Untuk Tingkat Pengangguran Di
Provinsi Riau. Jurnal Teknologi Dan Manajemen Industri Terapan, 1(II), 78–84.
http://jurnal-tmit.com/index.php/home/article/view/30

Setiawan, R. (2017). Penerapan Data Mining Menggunakan Algoritma K-Means


clustering Untuk Menentukan Strategi Promosi Mahasiswa Baru (Studi Kasus :
Politeknik Lp3i Jakarta). Jurnal Lentera ICT, 3, 76–92.
http://plj.ac.id/ojs/index.php/jrict/article/view/27

Talakua, M. W., Leleury, Z. A., & A. W. Tallut. (2017). Analisis cluster Dengan
Menggunakan Metode K-Means Untuk Pengelompokkan Kabupaten/Kota Di
Provinsi Maluku Berdasarkan Indikator Indeks Pembangunan Manusia Tahun
2014. Jurnal Ilmu Matematika Dan Terapan, 11, 119–128.
https://ojs3.unpatti.ac.id/index.php/barekeng/article/view/353

Tirayo, E. R. (2019). Pengelompokan Kabupaten / Kota di Sulawesi Tengah Menurut


Indikator Sosial Ekonomi Menggunakan K-Medoids clustering. 2019(Sns Viii).

Wardoyo, A. E., & Tripuspita, N. (2021). Penentuan cluster Optimum pada Tingkat
Pengangguran dan Tingkat Kemiskinan di Jawa Timur Menggunakan Algoritma
Fuzzy C-Means. BIOS : Jurnal Teknologi Informasi Dan Rekayasa Komputer,
1(2), 40–47. https://doi.org/10.37148/bios.v1i2.10

Widodo, E., Ermayani, P., Laila, L. N., & Madani, A. T. (2021). Pengelompokkan
Provinsi di Indonesia Berdasarkan Tingkat Kemiskinan Menggunakan Analisis
Hierarchical Agglomerative clustering. Seminar Nasional Official Statistics,
2021(1), 557–566. https://doi.org/10.34123/semnasoffstat.v2021i1.971

0 0

Anda mungkin juga menyukai