Diajukan untuk memenuhi salah satu tugas komponen penilaian Mata Kuliah
Disusun oleh:
2022
0 0
KATA PENGANTAR
Puji syukur alhamdulillah, penulis panjatkan kehadirat Allah SWT yang telah
sehingga pada akhirnya penulis dapat menyelesaikan tugas ini dengan baik dan
Tujuan Penulisan penelitian ini dibuat sebagai salah satu tugas UAS di
diambil berdasarkan hasil penelitian, observasi dan beberapa sumber literatur yang
mendukung penulisan ini. Penulis menyadari bahwa tanpa adanya bimbingan dan
dorongan dari semua pihak, maka penulisan tugas ini tidak akan lancar. Oleh karena
itu pada kesempatan ini, izinkanlah penulis menyampaikan ucapan terima kasih
kepada:
2. Ketua Program Studi Sistem Informasi Universitas BSI Kampus Kota Sukabumi
3. Bapak Taufik Hidayatuloh, M. Kom selaku Dosen Pengampu Mata Kuliah Data
4. Orang tua tercinta yang tekah memberikan dukungan moral maupun spiritual
kelas Sistem Informasi yang telah memberikan kritik dan saran kepada penulis
6. Sahabat dan teman dekat yang tidak bisa disebutkan satu persatu yang telah
0 0
Akhir kata, semoga Allah SWT senantiasa melimpahkan karunianya dan
membalas segala amal budi serta kebaikan pihak pihak yang telah membantu penulis
dalam penyusunan laporan tugas unu dan semoga laporan ini bermanfaat dan dapat
memperluas wawasan bagi para pembaca. Penulis menyadari bahwa laporan ini
masih belum sempurna. Oleh karena itu, penulis mengharapkan kritik dan saran yang
Penulis
0 0
DAFTAR ISI
Halaman
Lembar Judul ................................................................................................................i
Kata Pengantar..............................................................................................................ii
Daftar Isi......................................................................................................................vi
BAB I PENDAHULUAN...........................................................................................1
1.1. Latar Belakang Penulisan......................................................................1
1.2. Masalah Penelitian................................................................................3
1.2.1. Identifikasi Masalah......................................................................3
1.2.2. Batasan Masalah............................................................................3
1.2.3. Rumusan Masalah..........................................................................4
1.3. Tujuan Penelitian...................................................................................4
1.3.1. Tujuan Penelitian...........................................................................4
1.3.2. Manfaat Penelitian.........................................................................4
BAB II LANDASAN TEORI....................................................................................6
2.1. Konsep Dasar Data Mining...................................................................6
2.1.1.Definisi Data Mining......................................................................6
2.1.2. Tahap – Tahap Data Mining..........................................................7
2.2. Algoritma K-Means…….......................................................................9
2.2.1.Pengertian Algoritma K-Means......................................................9
2.3.Rapid Miner.........................................................................................10
2.4. Badan Pusat Statistik (BPS)................................................................10
2.4.1.Pengertian Badan Pusat Statistik (BPS).......................................10
2.5. Tahapan Penelitian..............................................................................10
2.6. Instrumen Penelitian............................................................................12
2.7. Metode Pengumpulan Data.................................................................13
2.8. Variabel Data.......................................................................................13
2.9. Penelitian Terkait.................................................................................13
BAB III PEMBAHASAN DAN HASIL..................................................................21
3.1. Pengolahan Data Awal.........................................................................21
3.2. Preprocessing……..............................................................................22
3.3. Perhitungan K-Means …….................................................................24
0 0
3.4. Langkah – langkah implementasi Rapidminer....................................28
3.5. Pembahasan…….................................................................................32
BAB IV PENUTUP...................................................................................................35
4.1. Kesimpulan.........................................................................................35
4.2. Saran....................................................................................................36
DAFTAR PUSTAKA................................................................................................37
0 0
BAB I
PENDAHULUAN
negara dengan potensi paling besar dalam hal ketersediaan tenaga kerja, dan
sangat tinggi, akses pekerjaan yang tidak merata, penduduk dengan usia kerja
ekonomi, tingkat Pendidikan, dll. Struktur dan ukuran upah yang disebabkan
6,48%, dan menurun menjadi 5,95% pada tahun 2021 (Purboningtyas et al.,
0 0
2
clustering adalah salah satu Teknik Analisa data mining (Sanjaya &
cluster (cetroid) yang paling dekat dengan data tersebut (Talakua et al., 2017).
kesamaan data dalam kelompok dan mengurangi kesamaan data antar cluster
Means yaitu sangat sensitive pada pembangkitan titik pusat awal secara
2018).
TPT, UMK, dan IPM, penelitian ini kemudian akan memanfaatkan indikator
0 0
3
pengangguran sebagai acuan utama. Data yang digunakan pada penelitian ini
adalah data Badan Pusat Statistik (BPS) Jawa Tengah Tahun 2019-2021.
0 0
4
dan upah minimum periode 2019-2021, dari website resmi Badan Pusat
a. Manfaat Praktis
0 0
5
masalah pengangguran.
b. Manfaat Teoritis
Hasil dari penelitian ini merupakan bukti empiris dari hasil suatu
0 0
BAB II
LANDASAN TEORI
ukuran kemiripannya.
0 0
7
tidak biasa, bisa berupa outler (pencilan), perubahan atau deviasi yang
variable
knowledge base.
0 0
8
Tahap – tahap Data Mining adalah sebagai berikut : (Ridwan et al., 2018)
Data yang ada pada database sering kali tidak semuanya dipakai, oleh
karena itu hanya data yang sesuai untuk dianalisis yang akan diambil
dari database.
5. Proses mining
0 0
9
pengguna.
basis data cluster. Dibutuhkan jumlah cluster awal yang diinginkan sebagai
0 0
10
yang cukup efisien dalam hal komplektisitas nya O (nkt). Sedangkan untuk
partisi awal jumlah cluster (k) dan solusi akhir menyatu pada local minima.
Penentuan partisi
2.3. RapidMiner
penelitian ini.
0 0
11
1. Identifikasi Masalah
2. Pengumpulan Data
terhadap apa yang sedang diteliti. Data yang diperoleh adalah pengangguran,
jumlah cluster dalam data, kemudian menentukan nilai pusat atau centroid,
0 0
12
jumlah dan kedekatan antar data hasil cluster. Proses evaluasi disini
5. Hasil
Hasil analis data yang diproses sebelumnya akan diuji pada tahap ini. Adapun
K-Means.
kesalahan/akurasi)
a. Dataset
0 0
13
Terdapat 35 data dalam dataset yang digunakan dalam penelitian ini, antara
tahun 2019-2021 sebanyak 315 data. Data tersebut di dapatkan dari hasil
b. Peralatan
sebagai media penulisan dan hitung manual dari dataset yang diperoleh.
0 0
14
Beberapa penelitian sejenis yang telah dilakukan terdahulu antara lain yaitu:
1. Penelitian oleh Anggia Arifiani Putrie dan Rangga Sanjaya yang berjudul
2. Penelitian oleh Ari Eko Wardoyo dan Nigati Tripuspita yang berjudul
dengan nilai DBI 0.8737. cluster optimum terdapat pada 4 cluster yang
ditandai dengan nilai DBI yang paling kecil (Wardoyo & Tripuspita,
2021).
0 0
15
4. Penelitian oleh Nanda Try Luchia, Hani Handayani, Fathan Surya Hamdi,
5. Penelitian oleh Pradini Nurul Safitri, Rafika Aristawidya, dan Shafa Bunga
0 0
16
7. Penelitian oleh Nabila Nur Fransiska R, Dwi Suci Anggraeni, dan Ultach
Java Province Poverty Data Grouping Using the K-Means Algorithm with
et al., 2022).
8. Penelitian oleh Edy Widodo, Putri Ermayani, Latifah Nur Laila, dan Asdan
0 0
17
10. Penelitian oleh Shela Yulfia Hadist dan Agung Priyo Utomo yang berjudul
2019 dan 5 klaster pada tahun 2020, didapat bahwa secara umum
0 0
18
Surya Hamdi, Dwi Erlangga, dan Sania Fitri Octavia, penelitian yang
Fathan Surya Hamdi, Dwi Erlangga, dan Sania Fitri Octavia meneliti
0 0
19
berbeda.
objek penelitiannya.
0 0
20
tengah.
10. Terhadap penelitian oleh Shela Yulfia Hadist dan Agung Priyo Utomo,
0 0
BAB III
Di dalam bab ini akan membahas tentang data yang akan digunakan
dalam penelitian, jumlah data yang diperoleh dari data public yaitu dari situs
resmi Badan Pusat Statistik, Provinsi Jawa Tengah mengenai pengangguran yang
masih mengalami naik turun. Tingkat pengangguran di Jawa Tengah sebesar 4,44
persen pada tahun 2019, 6,48 persen pada tahun 2020 dan 5,95 persen pada tahun
2021. Dengan peningkatan yang cukup besar sebesar 6,48 persen pada tahun
2020 dan 5,95 pada tahun 2021. Pemerintah menghadapi tugas berat dalam
penduduk, dan upah minimum kab/kota Provinsi Jawa Tengah. Nilai rata-rata
Penganggura Jumlah
Kabupaten / Kota UMK
n Penduduk
Kabupaten Cilacap 165939 1727098 1989058
Kabupaten Banyumas 95162 1693006 1750000
Kabupaten Purbalingga 55354 933989 1788500
Kabupaten Banjarnegara 53602 923192 1610000
Kabupaten Kebumen 73427 1197982 1686000
Kabupaten Purworejo 26593 718316 1700000
Kabupaten Wonosobo 40320 790504 1712500
21
0 0
22
3.2. Preprocessing
0 0
23
Pembersihan data akan dilakukan dan data yang hilang akan diisi
mengganti nilai yang hilang.Namun proses ini tidak dilakukan karena ada
2. Transformasi Data
mining, karena data tersebut sesuai untuk di proses maka tidak akan
dilakukan transformasi
3. Data mining
a. Jenis data yang digunakan dalam penelitian ini adalah clustering yang
- Menentukan jumlah cluster (k) pada dataset, tahap ini akan dibuat
0 0
24
4. Evaluasi, pada langkah ini, kelompok atau cluster yang ada di evaluasi
(k) dalam dataset, tahap terdiri dari 5 cluster yaitu cluster C0, C1, C2, C3,
C4.
Attribute C0 C1 C2 C3 C4
Pengangguran 132638 53597 47006 40931 26593
Jumlah
1814110 1290591 984807 890518 718316
Penduduk
UMK 2498588 1882000 1790000 1673500 1700000
0 0
25
data ke 35 dan mencari jarak terpendeknya atau nilai terkecil . Setelah melakukan
pengelompokkan hasil dari iterasi 1 didapatkan hasil centroid baru untuk melakukan
iterasi berikutnya.
Attribute C1 C2 C3 C4 C5
menghasilkan pola yang sama dari iterasi sebelumnya dengan yang terakhir.
Pada proses k-means dikatakan bahwa iterasi berhenti dan dianggap stabil jika
cluster 0
Rata-rata setiap variabel (centroid) cluster 0
Pengangguran 40241,201
Jumlah Penduduk 852805
Upah Minimum 1758825,327
Rata-rataa seluruh variabel cluster 0 883957,1316
0 0
26
852805 , dan untuk upah minimum Kab/Kota yaitu sebesar 1758825,327. Maka
rata-rata cluster yang diperoleh dari seluruh variabel di cluster 0 yaitu sebesar
cluster 1
Rata-rata setiap variabel (centroid) cluster 1
Pengangguran 145154,664
Jumlah Penduduk 1743067
Upah Minimum 1801636,027
Rata-rataa seluruh variabel cluster 1 1229952,452
1743067, dan untuk upah minimum Kab/Kota yaitu sebesar 1801636,027. Maka
rata-rata cluster yang diperoleh dari seluruh variabel di cluster 1 yaitu sebesar
cluster 2
Rata-rata setiap variabel (centroid) cluster 2
Pengangguran 132637,801
Jumlah Penduduk 1814110
0 0
27
Maka rata-rata cluster yang diperoleh dari seluruh variabel di cluster 2 yaitu
cluster 3
Rata-rata setiap variabel (centroid) cluster 3
Pengangguran 19582,418
Jumlah Penduduk 278557
Upah Minimum 1810789,542
Rata-rataa seluruh variabel cluster 3 702976,2532
278557 dan untuk upah minimum Kab/Kota yaitu sebesar 1810789,542 . Maka
rata-rata cluster yang diperoleh dari seluruh variabel di cluster 3 yaitu sebesar
cluster 4
Rata-rata setiap variabel (centroid) cluster 4
Pengangguran 64323,607
Jumlah Penduduk 1204934
Upah Minimum 1876698,591
Rata-rataa seluruh variabel cluster 4 1048652,033
0 0
28
1204934, dan untuk upah minimum Kab/Kota yaitu sebesar 1876698,591. Maka
rata-rata cluster yang diperoleh dari seluruh variabel di cluster 0 yaitu sebesar
Pemalang.
1. Desain
0 0
29
0 0
30
Dalam mencari jumlah cluster terbaik dalam penelitian ini, kita uji dari
vector, yang merupakan hasil evaluasi dari cluster yang dibuat sebanyak 5
Tabel 2. Hasil Pengujian DBI k=2 sampai k=5 menggunakan aplikasi Rapidminer
cluste Nilai Davies
r Bouldin
K=2 0.820
K=3 0.806
K=4 0.602
K=5 0.601
0 0
31
Model (clustering).
6. centroid Tabel
Pada tabel centroid, kita dapat mengetahui rata-rata setiap attribut pada
masing-masing cluster. Dari sini kita dapat menentukan kriteria atau kategori
0 0
32
8. Visualisasi
0 0
33
3.5. Pembahasan
Rapidminer, cluster 0 adalah cluster dengan nilai rata-rata rendah dari semua
rata-rata 1048652,033.
0 0
34
9
863898,731
Kabupaten Blora cluster_0
2
774720,151
Kabupaten Rembang cluster_0
6
984393,671
Kabupaten Kudus cluster_0
6
826264,054
Kabupaten Temanggung cluster_0
9
905110,919
Kabupaten Batang cluster_0
6
935684,419
Kabupaten Pekalongan cluster_0
3
883957,131
RATA" CLUSTER 0
6
1294031,70
Kabupaten Cilacap cluster_1
8
1179389,33
Kabupaten Banyumas cluster_1
8
1216436,31
Kabupaten Brebes cluster_1
1
1229952,45
RATA" CLUSTER 1
2
1481778,44
Kota Semarang cluster_2
4
1481778,44
RATA" CLUSTER 2
4
612636,098
Kota Magelang cluster_3
6
785653,466
Kota Surakarta cluster_3
2
693887,803
Kota Salatiga cluster_3
2
744741,613
Kota Pekalongan cluster_3
9
677962,284
Kota Tegal cluster_3
1
702976,253
RATA" CLUSTER 3
2
985802,921
Kabupaten Kebumen cluster_4
8
1075396,15
Kabupaten Magelang cluster_4
3
1010000,77 Kabupaten Klaten cluster_4
1040892,51
Kabupaten Grobogan cluster_4
1
1019401,20
Kabupaten Pati cluster_4
1
1064136,16 Kabupaten Jepara cluster_4
0 0
35
1
1158162,41
Kabupaten Demak cluster_4
3
1050494,97 Kabupaten Semarang cluster_4
1042401,82
Kabupaten Kendal cluster_4
4
1039831,40
Kabupaten Pemalang cluster_4
2
1048652,03
RATA" CLUSTER 4
3
Dari 5 cluster tersebut cluster 2 yang harus paling diberi perhatian lebih
oleh pemerintah karena cluster tersebut memiliki nilai rata-rata paling tertinggi
di Provinsi Jawa Tengah. Dan perlu adanya evaluasi tambahan pada anggota
cluster 1 karena cluster inipun mempunyai nilai rata-rata yang tinggi. Metode
taraf hidup layak pekerja, pemerintah juga dapat menciptakan lapangan kerja
0 0
BAB IV
PENUTUP
4.1. Kesimpulan
yang tinggi.
sedang.
35
0 0
36
(cluster) 2-5 k (cluster), cluster 5 memiliki nilai yang paling dekat dengan
0, yaitu 0.601.
4.2. Saran
Dari hasil yang telah dilaksanakan, terdapat beberapa hal yang ingin
1. Aspek Sistem
variable atau atribut pada data training. Seperti hal menambah variabel –
2. Aspek Manajerial
Jawa Tengah.
kebutuhan.
0 0
37
DAFTAR PUSTAKA
Bastian, A., Sujadi, H., & Febrianto, G. (2018). Penerapan Algoritma K-Means
clusteringAnalysis Pada Penyakit Menular Manusia (Studi Kasus Kabupaten
Majalengka). Jurnal Sistem Informasi, 14(1), 26–32.
https://jsi.cs.ui.ac.id/index.php/jsi/article/view/566
C.T.I, B. R., Gafar, A. A., Fajriani, N., Ramadani, U., Uyun, F. R., Purnamasari, Y., &
Ransi, N. (2017). Implemetasi k-means clustering pada rapidminer untuk
analisis daerah rawan kecelakaan. April, 58–62.
Fikri, R., Mushardiyanto, A., Banin, M. N. L., Maureen, K., & Patria, H. (2021).
Pengelompokan Kabupaten/Kota di Indonesia Berdasarkan Informasi
Kemiskinan Tahun 2020 Menggunakan Metode K-Means clustering Analysis.
Seminar Nasional Teknik Dan Manajemen Industri, 1(1), 190–199.
https://doi.org/10.28932/sentekmi2021.v1i1.76
Fitriyani, & Sanjaya, R. (2018). Komparasi Algoritma Lr, K-Nn Dan Svm Untuk
Estimasi Area Kebakaran Hutan. Jurnal Teknologi Informasi Dan Elektronika,
3(2), 103–110. http://183.91.79.105/index.php/infotronik/article/view/109
Han, J., & Kaufmann, M. K. M. (2006). Data Mining : Concepts and Techniques
( 2nd edition ) Bibliographic Notes for Chapter 6 Classification and Prediction.
0 0
38
Luchia, N. T., Handayani, H., Hamdi, F. S., Erlangga, D., & Octavia, S. F. (2022). …
K-Means dan K-Medoids Pada Pengelompokan Data Miskin di Indonesia:
Comparison of K-Means and K-Medoids on Poor Data clustering in Indonesia.
… Indonesian Journal of …, 2(October), 35–41.
https://journal.irpi.or.id/index.php/malcom/article/view/422
Manurung, E., & Hasugian, P. S. (2019). Data Mining Tingkat Pesanan Inventaris
Kantor Menggunakan Algoritma Apriori pada Kepolisian Daerah Sumatera
Utara. Journal Of Informatic Pelita Nusantara, 4(2), 8–13.
Purboningtyas, I., Sari, I. R., Guretno, T., Dirgantara, A., Agustina, D., & Haris, M.
Al. (2020). Analisis Pengaruh Tingkat Pengangguran Terbuka Dan Indeks
Pembangunan Manusia Terhadap Kemiskinan Di Provinsi Jawa Tengah. Jurnal
Saintika Unpam, 3, 81–88.
http://openjournal.unpam.ac.id/index.php/jsmu/article/view/5640
Ridwan, M., Suyono, H., & Sarosa, M. (2018). Implementasi Data Mining untuk
Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naive Bayes
Classifier. Creative Information Technology Journal, 4(2), 151.
https://doi.org/10.24076/citec.2017v4i2.106
0 0
39
Sanjaya, R., & Fitriyani. (2019). Prediksi Bedah Toraks Menggunakan Seleksi Fitur
Forward Selection dan K-Nearest Neighbor. Jurnal Jepin, 5, 316–320.
https://jurnal.untan.ac.id/index.php/jepin/article/view/35324
Talakua, M. W., Leleury, Z. A., & A. W. Tallut. (2017). Analisis cluster Dengan
Menggunakan Metode K-Means Untuk Pengelompokkan Kabupaten/Kota Di
Provinsi Maluku Berdasarkan Indikator Indeks Pembangunan Manusia Tahun
2014. Jurnal Ilmu Matematika Dan Terapan, 11, 119–128.
https://ojs3.unpatti.ac.id/index.php/barekeng/article/view/353
Wardoyo, A. E., & Tripuspita, N. (2021). Penentuan cluster Optimum pada Tingkat
Pengangguran dan Tingkat Kemiskinan di Jawa Timur Menggunakan Algoritma
Fuzzy C-Means. BIOS : Jurnal Teknologi Informasi Dan Rekayasa Komputer,
1(2), 40–47. https://doi.org/10.37148/bios.v1i2.10
Widodo, E., Ermayani, P., Laila, L. N., & Madani, A. T. (2021). Pengelompokkan
Provinsi di Indonesia Berdasarkan Tingkat Kemiskinan Menggunakan Analisis
Hierarchical Agglomerative clustering. Seminar Nasional Official Statistics,
2021(1), 557–566. https://doi.org/10.34123/semnasoffstat.v2021i1.971
0 0