Anda di halaman 1dari 8

PENERAPAN ALGORITMA K-MEANS UNTUK CLUSTERING

DATA PENGANGGURAN DI PROVINSI JAWA BARAT

PROPOSAL SKRIPSI

Disusun sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer
Dari Fakultas Ilmu Komputer Universitas Singaperbangsa Karawang

Oleh :
TASYIFA NAFSIAH MUTHMAINNAH
2010631250023

PROGRAM STUDI SISTEM INFORMASI


FAKULTAS ILMU KOMPUTER
UNIVERSITAS SINGAPERBANGSA KARAWANG
KARAWANG
2023
BAB I

PENDAHULUAN

1.1 Latar Belakang


Pengangguran Terbuka adalah situasi kondisi dimana seseorang yang
termasuk dalam golongan kelas pekerja juga dapat disebut dengan seorang yang
mempunyai keinginan untuk mendapatkan sebuah pekerjaan akan tetapi sama
sekali belum bisa mencapainya. Pengangguran merupakan keadaan seseorang
yang dimana seseorang ingin bekerja, tetapi tidak bisa mendapatkan pekerjaan
yang sesuai dengan bidangnya (Tanjung, Windarto, and Fauzan 2021). Hal ini
disebabkan oleh kurangnya kesempatan kerja meskipun mereka telah berusaha
untuk mendapatkannya, atau karena kurangnya motivasi untuk mencari atau
bekerja. Pengangguran menjadi masalah serius di negara kita (Wahyudi and
Pujiastuti 2020).
Meningkatkan kualitas dan produktivitas sumber daya manusia (SDM)
sangat penting dalam upaya mengurangi tingkat pengangguran. Pendidikan
dianggap sebagai sarana yang efektif untuk meningkatkan kualitas SDM karena
mampu menghasilkan tenaga kerja yang berkualitas, memiliki pola pikir yang
baik, dan memiliki sikap yang positif. Oleh karena itu, pendidikan sebagai salah
satu metode yang efektif dalam meningkatkan kualitas SDM (Allo et al. 2022).
Salah satu faktor yang mempengaruhi tingkat pengangguran adalah
tingkat pendidikan. Pendidikan tinggi dapat mempengaruhi banyak sektor salah
satunya adalah tingkat pengangguran. Pendidikan diposisikan sebagai sarana
untuk peningkatan kesejahteraan melalui pemanfaatan kesempatan kerja yang
ada dan mencerminkan kecerdasan dan pencapaian pendidikan formal
penduduk karena semakin tinggi pula kemampuan kerja atau produktivitas
seseorang dalam bekerja(Fina, Walewangko, and Tumangkeng 2021).
Berikut ini adalah grafik tingkat pengangguran terbuka berdasarkan
pendidikan di provinsi Jawa Barat dapat dilihat pada gambar 1.1.
Gambar 1.1 Data Pengangguran Terbuka Berdasarkan Pendidikan
(Badan Pusat Statistik Provinsi Jawa Barat)
Dari Gambar 1.1 menurut Data Badan Pusat Statistik Provinsi Jawa Barat
Tingkat Pengangguran Terbuka berdasarkan Pendidikan dari tahun 2011 sampai
2022 . Dari grafik tersebut dapat diketahui bahwa pendidikan SMP yang memiliki
tingkat pengangguran terbuka tertinggi pada tahun 2020 sebanyak 1.272.366 jiwa.
Dan yang memiliki tingkat pengangguran terendah pada tahun 2015 sebanyak
9054 jiwa.
Tingginya tingkat pengangguran di provinsi jawa barat, sehingga perlu
adanya upaya untuk mengatasi masalah pengangguran di daerah tersebut. Data
Tingkat Pengangguran Terbuka di jawa barat tidak hanya berisi informasi angka-
angka yang menunjukkan tingkat pengangguran berdasarkan pendidikan. Banyak
pengetahuan yang dapat ditambang (mining) dari data tingkat pengangguran
tersebut. Metode dalam pengelompokkan data ini menggunakan metode data
mining dengan algoritma K-Means untuk melakukan clustering data (Dan 2022).
Data mining sebenarnya bukan topik penelitian baru. Data mining
digunakan meningkatkan teknik sebelumnya untuk mengatasi masalah umum
ditemukan. Dalam penelitian ini, clustering dapat digunakan untuk
mengidentifikasi suatu wilayah dengan mencari pola yang berbeda untuk
menemukan hubungan yang menarik antar atribut data. yang dapat digunakan
untuk mengelompokkan data.
Algoritma k-means clustering adalah salah satu dari metode
pengelompokkan data non-hirarki. Algoritma k-means mengelompokkan objek
dengan terlebih dahulu mengindentifikasi data yang akan di kelompokkan. K-
means adalah algoritma sederhana dapat diterapkan pada data dalam jumlah kecil
dan besar. Pada literasi pertama, titik utama setiap cluster ditetapkan secara bebas.
Kemudian dihitung antar jarak data dengan tiap titik utama pada cluster (Dan
2022).
Beberapa penelitian sebelumnya yang menggunakan algoritma K-Means
untuk analisis clustering yaitu (Nasution, Windarto, and Fauzan 2020), penelitian
tersebut menggunakan algoritma K-Means dengan pengujian data dengan tools
rapidminer untuk mengelompokkan data penduduk miskin menurut provinsi,
diperoleh 2 cluster berdasarkan pengelompokkan data penduduk miskin yaitu
jumlah penduduk miskin tinggi dan rendah. Penelitian selanjutnya dilakukan oleh
(Febianto and Palasara 2019), dengan menggunakan algoritma K-Means. Hasil
dari penelitian tersebut diperoleh 5 cluster yang dihasilkan dengan pemetaan
karakteristik dari setiap kelompok yang terbentuk.
Berdasarkan permasalahan diatas maka diperlukan sebuah metode untuk
mengelompokkan data pengangguran terbuka berdasarkan pendidikan agar
pemerintah dapat mengetahui pendidikan berada di cluster tinggi tingkat
penganggurannya dan tingkat pendidikan mana yang berada di cluster rendah.
Untuk mengelompokkan data pengangguran terbuka di Jawa Barat berdasarkan
pendidikan di perlukan sebuah teknik data mining menggunakan algoritma k-
means sebagai metodenya.

1.2 Rumusan Masalah


Dari penjelasan latar belakang diatas, maka beberapa rumusan masalah
yang akan dibahas yaitu sebagai berikut :
1. Bagaimana menerapkan clustering dalam mengelompokkan kasus
pengangguran terbuka di provinsi Jawa Barat berdasarkan penddidikan
dengan menggunakan metode algoritma K-Means ?
2. Bagaimana cara melakukan evaluasi terhadap performa algoritma K-Means
dalam mengelompokkan kasus Pengangguran Terbuka di provinsi Jawa
Barat ?
1.3 Batasan Masalah
1. Penelitian ini menggunakan data kasus Pengangguran Terbuka berdasarkan
Pendidikan di provinsi Jawa Barat dari tahun 2011–2022 yang berasal dari
Data Badan Pusat Statistik Provinsi Jawa Barat.
2. Penelitian ini menggunakan metode Algoritma K-Means.

1.4 Tujuan Penelitian


1. Menerapkan teknik clustering untuk mengelompokkan kasus pengangguran
terbuka di Jawa Barat.
2. Melakukan evaluasi terhadap performa algoritma K-Means dalam
pengelompokkan kasus pengangguran terbuka berdasarkan pendidikan di
Provinsi Jawa Barat.

1.5 Manfaat Penelitian


Manfaat penelitian dapat dibagi menjadi 2, yaitu manfaat Teoritis dan
manfaat Praktis :

1.5.1 Manfaat Teoritis


Manfaat Teoritis pada penelitian ini adalah dapat meningkatkan
pemahaman dan pengetahuan tentang penerapan teknik clustering data dengan
menggunakan metode algoritma k-means pada kasus pengangguran terbuka di
Provinsi Jawa Barat.

1.5.2 Manfaat Praktis


Manfaat praktis pada penelitian ini adalah dapat memberikan informasi
dan dapat mengcluster terhadap kasus pengangguran terbuka yang ada di Provinsi
Jawa Barat.

1.6 Metodologi Penelitian


Metodologi yang digunakan pada penelitian ini adalah KDD (Knowledge
Discovery in Database). Adapun proses tahapannya yaitu :
1. Data Selection
2. Data Preprocessing
3. Data Transformation
4. Data Mining
5. Evaluation

1.7 Sistematika Penulisan


Sistematika penulisan ini menjelaskan secara umum tahapan-tahapan yang
akan dilakukan dalam penelitian. Berikut adalah Sistematika Penulisan yang
terdiri dari 3 bab yang dijelaskan sebagai berikut :
BAB 1: PENDAHULUAN
Bab 1 pendahuluan yang berisi latar belakang, rumusan masalah, batasan
masalah, tujuan penelitian, manfaat penelitian, metodologi penelitian, sistematika
penulisan, jadwal penelitian.
BAB 2: LANDASAN TEORI
Bab 2 landasan teori yang berisi teori-teori yang dapat digunakan dalam
menjawab permasalahan-permasalahan yang ada yaitu konsep dasar data mining,
metode algoritma K-Means, dan penelitian sebelumya.
BAB 3: METODOLOGI PENELITIAN
Bab 3 berisi tentang pembahasan mengenai objek penelitian dan
metodologi penelitian yang digunakan agar penelitian lebih ternilai dan terkonsep.
BAB 4: HASIL DAN PEMBAHASAN
Bab 4 berisi tentang hasil dan pembahasan penelitian yang telah dilakukan
dan sekaligus untuk menjawab rumusan masalah penelitian.
BAB 5: KESIMPULAN DAN SARAN
Bab 5 berisi tetntang kesimpulan dari keseluruhan isi pada bab-bab
sebelumnya dalam penelitian ini dan berisi saran yang membuat untuk penelitian
selanjutnya.
1.8 Jadwal Penelitian
Kegiatan penelitian ini direncanakan berlangsung selama tujuh bulan
dengan alokasi waktu seperti tercantum dalam tabel dibawah ini:

No Bulan
Kegiatan
Sep Okt Nov Des Jan Feb Mar
1 Tahap Persiapan Penelitian
a. Penyusunan dan pengajuan
judul
b. Pengajuan Proposal

c. Perijinan Penelitian

2 Tahap Pelaksanaan
a. Pengumpulan Data

b. Analisis Data

Tahap Penyusunan Laporan


3

Anda mungkin juga menyukai