5762-Article Text-16724-1-10-20221116

JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 6 No.
2, September 2022
PENERAPAN ALGORITMA K-MEANS CLUSTERING DALAM

PENGELOMPOKAN ARSIP SKCK
Wahyu Ananda, Indyah Hartami Santi, Sabitul Kirom

Program Studi Teknik Informatika S1, Fakultas Teknologi Informasi
Universitas Islam Balitar, Jalan Majapahit No. 2-4, Kota Blitar, Indonesia
wahyuananda0408@gmail.com
ABSTRAK
Kepolisian pelayanan umum yang dilakukan oleh Polres maupun Polsek merupakan sebuah bentuk
pelayanan publik yang teah dilaksanakan oleh kepolisian dalam memenuhi kebutuhan masyarakat sesuai dengan
tuntunan dan harapan masyarakat maupun sesuai dengan perundang-undangan yang berlaku. Adapun tugas pokok
POLRI salah satunya ialah pelayanan pembuatan Surat Keterangan Catatan Kepolisian (SKCK), karena itu hampir
setiap hari masyarakat umum dari berbagai latar belakang datang ke Polsek untuk membuat SKCK. Untuk
mengelompokan kalangan masyarakat atau pemohon yang membuat SKCK di Polsek Lodoyo Barat menggunakan
metode clustering dengan algoritma K-Means yang diharapkan dapat membantu untuk mengetahui kalangan apa
yang mendominasi pembuatan SKCK. Penelitian ini menggunakan 416 data dengan jumlah cluster 3 cluster. Hasil
dari perhitungan untuk masing-masing cluster antara perhitungan manual dan hasil yang menggunakan software
tanagra menghasilkan nilai yang berbeda karena penentuan titik pusat atau inisiasi cluster dimulai dengan angka
yang berbeda.
Kata kunci: Algoritma K-Means, Clustering, Data Mining, SKCK, Tanagra
1. PENDAHULUAN teknologi informasi dan komunikasi yang dibuat dan

Informasi merupakan hal yang penting dalam diterima lembaga Negara, pemerintah daerah, lembaga
berbagai kegiatan yang dilakukan oleh manusia di era pendidikan, perusahaan, organisasi politik, organisasi
globalisasi saat ini. Berbagai macam dokumen dan kemasyarakatan, dan perseorangan dalam
media telah diciptakan untuk kemudahan dalam proses pelaksanaankehidupan bermasayarakat, berbangsa,
penyimpanan, mencarai, dan dalam penyebaran dan bernegara. Arsip dibedakanmenjadi menjadi dua,
informasi. Informasi setiap harinya terus berkembang. arsip dinamis dan arsip statis. Arsip dinamis adalah
Oleh karena itu diperlukan penyimpanan untuk arsip yang masih dipergunakan secara langsung dalam
informasu yang tersedia sehingga dapat dijadikan kegiatan perkantoran sehari-hari. Menurut Undang-
suatu bahan pengambilan keputusan ataupun Undang Republik Indonesia nomor 43 tahun 2009
pertimbangan serta menjadi suatu sejarah bagi tentang Kearsipan, arsip dinamis dibedakan lagi
organisasi dan Lembaga-lembaga nondepartemen menjadi dua, yaitu arsip aktif dan arsip inaktif, arsip
datau departemen. Sumber informasi yang dapat aktif adalah arsip yang frekuensi penggunaannya
dipertanggung jawabkan kebenarannya disebut tinggi dan terus menerus. Arsip inaktif adalah arsip
dengan arsip. yang frekuensi penggunaannya telah menurun. Arsip
Arsip merupakan otak sebuah organisasi karena statis adalah arsip yang sudah tidak dipergunakan
arsip merekam semua kegiatan atau aktivitas yang ada secara langsung dalam kegiatan perkantoran sehari-
dalam organisasi. Suatu organisasi tidak dapat hari. Arsip stasis disimpan di lembaga kearsipan,
dipisahkan dengan arsip karena catatan rekaman seperti arsip Nasional Republik Indonesia (ANRI),
kegiatan atau sumber informasi yang memiliki nilai arsip daerah provinsi, arsip daerah kabupaten atau
kegunaan dengan teratur dan terencana baik itu arsip kota, dan arsip perguruan tinggi.
yang dibuat maupun diterima, agar mudah ditemukan Lembaga Kepolisian merupakan salah satu
kembali jika diperlukan. Arsip juga merupakan naskah lembaga pemerintahan yang memiliki peranan penting
yang dibuat dan diterima oleh Satuan Organisasi di dalam Negara hukum. Dalam Negarahukum kehidupan
lingkungan lembaga lembaga departemen atau non- hukum sangat ditentukan oleh faktor struktur atau
departemen, badan swasta dan perseorangan dalam lembaga hukum, disamping faktor-faktor lain, seperti
bentuk apa pun, baik dalam keadaan tunggal maupun faktor substansi hukum, dan faktor kultur hukum.
berkelompok, adanya arsip di suatu organisasi juga Kepolisian Negara Republik Indonesia sudah tersebar
menunjukan informasisuatu organisasi tersebut, tanpa luas di Polres maupun Polsek di seluruh Indonesia
adanya arsip tidak mungkin sebuah organisasi sehingga dapat memudahkan masyarakat dalam
mengingat segala dokumen dan catatan yang begitu mengakses jasa pelayanan. Kepolisian Pelayanan
banyak terutama dalam pengelolaan administrasi [1]. umum yang dilakukan oleh Polres maupun Polsek
Menurut Undang-undang 43 tahun 2009 tentang merupakan sebuah bentuk pelayanan publik yang telah
Kearsipan, Pasal 1 ayat 2 pengertian arsip adalah dilaksanakan oleh Kepolisian dalam memenuhi
rekaman kegiatan atau peristiwa dalam berbagai kebutuhan masyarakat sesuai dengan tuntutan dan
bentuk dan media sesuai dengan perkembangan harapan masyarakat maupun sesuai dengan ketentuan
861
JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 6 No. 2, September 2022
perundang-undangan yang berlaku. Adapun tugas penelitian ini diharapkan dapat membantu pihak
pokok POLRI dalam memberikan perlindungan, instansi kepolisian khususnya di Sektor LodoyoBarat
pengayoman, dan bentuk pelayanan kepada dalam mengelompokan sebuah arsip SKCK.
masyarakat salah satunya ialah pelayanan pembuatan Berdasarkan latar belakang masalah di atas maka
Surat Keterangan Catatan Kepolisian (SKCK) [2]. peneliti mengambil judul “Analisis Clustering
Surat Keterangan Catatan Kepolisian (SKCK) Menggunakan Metode K-Means Dalam
sebelumnya dikenal sebagai surat keterangan kelakuan Pengelompokan Arsip SKCK”
baik (SKKB) adalah surat keterangan yang diterbitkan
oleh Kepolisian Republik Indonesia yang berisikan 2. TINJAUAN PUSTAKA
catatan kejahatan seseorang. SKCK diterbitkan 2.1. Data Mining
kepolisian melalui fungsi dari tugassatuan intelijen dan Data mining merupakan analisa terhadap data
keamanan (INTELKAM). Saat bernama SKKB surat untuk menemukan hubungan yang jelas serta untuk
ini hanyadapat diberikan yang tidak atau belum pernah membuat kesimpulan pada sata yang belum diketahui
tercatat melakukan tindakan kejahatan hingga tanggal sebelumnya dengan suatu metode terkini dan berguna
dikeluarkannya SKKB tersebut. Namun, saat ini bagi pemilik data [6].
SKCK juga dapat diberikan kepada mantan pidana Berikut ini merupakan tahapan proses data
atau masyarakat yang pernah terlibat kasus hukum mining Knowlegde Discoveryin Database (KDD).
dengan syarat yang telah ditentukan oleh pihak
kepolisian [3].
Pengarsipan SKCK di Polsek Lodoyo Barat
belum tertata dengan rapi dan masih bercampur. Jadi
anggota mengalami kesulitan dalam proses temu
kembali arsip. Pengarsipan SKCK juga belum pernah
dilakukan clustering. Berdasarkan uraian tersebut,
perlu dilakukan penelitian analisis clustering arsip
SKCK (Surat Keterangan Catatan Kepolisian) di
Institusi kepolisian. Pada penelitian ini yang menjadi
objek penelitian adalah arsip SKCK di Kepolisian Gambar 1. Tahapan KDD
Sektor Lodoyo Barat. Analisis clustering akan
digunakan untuk mengelompokkan arsip SKCK di Pada Gambar 1 terdapat beberapa tahapan yaitu:
polsek Lodoyo Barat. Pada penelitian ini, peneliti a. Data Selection
memutuskan untuk menggunakan algoritma K-means Menciptakan himpunan data target, pemilihan
untuk melakukan pengelompokan secara otomatis dan himpunan data, atau memfokuskan pada subset
untuk menentukan banyaknya pemohon yang variable atau sampel data.
mendominasi permohonan SKCK. K-means clustering b. Pre-processing/Cleaning
merupakan salah satu metode data clustering non- Pre-processing dan cleaning data merupakan
hirarki yang mengelompokkan data dalam bentuk satu operasi dasar yang dilakukan seperti
atau lebih cluster atau kelompok. Data-data yang penghapusan noise. Proses cleaning mencakup
memiliki karakteristik yang sama di kelompokkan antara lain membuang duplikasi data, memeriksa
dalam satu cluster atau kelompok dan data yang data yang inkonsisten, dan memperbaiki
memiliki karakteristik yang berbeda dikelompokan kesalahan pada data, seperti kesalahan cetak
dengan cluster atau kelompokyang lain sehingga data c. Transformation
yang berada dalam satu cluster atau kelompok Merupakan proses integrasi pada data yang telah
memiliki tingkat variasi yang kecil. Tahap pengujian dipilih, sehingga data sesuai untuk proses data
K-means Tools yang digunakan untuk menguji adalah mining.
software tanagra [4]. d. Data Mining
Tanagra merupakan salah satu software data Pemilihan tugas data mining merupakan
mining yang didalamnya disediakan beberapa metode pemilihan goal dari proses KDD misalnya
data mining mulai dari mengekplorasi analisis data, karakterisasi, klasifikasi, regresi, clustering,
pembelajaran statistik, pembelajaran mesin, dan data asosiasi, dan lain-lain.
mining kebanyakan. Tanagra suatu software berbasis e. Interpretation/Evaluation
open source dimana semua orang dapat mengakses Tahap ini Melakukan pemeriksaan apakah pola
source code, dan menambahkan algoritma sendiri, atau informasi yang ditemukan bertentangan
sejauh setuju dan menyesuaikan dengan lisensi dengan fakta atau hipotesa yang ada sebelumnya
pendistribusian software [5].
Pada penelitian ini, peneliti memutuskan untuk 2.2. Clustering
menggunakan metode K-meansyang digunakan untuk Metode Clustering adalah mempartisi data ke
mengelompokkan data dalam jumlah yang cukup dalam kelompok sehingga data yang memiliki
besar dengan waktu komputasi yang cukup relatif karakteristik yang sama dikelompokkan ke dalam satu
cepat dan efisien. Manfaat yang dapat diambil dari claster yang sama. Tujuan dari clustering ini adalah
862
untuk meminimalkan fungsi tujuan yang diterapkan Pada penelitian ini terdapat tiga tahapan yaitu
dalam proses clustering yang umumnya berusaha tahap awal, tahap analisis, dan tahap akhir. Pada tahap
untuk meminimalisir variasi dalam suatu cluster dan awal yang dilakukan peneliti dengan menggunakan
memaksimalisasi variasi antar cluster [7]. Teknik pengumpulan data yang terdapat dalam arsip
SKCK di Polsek Lodoyo Barat dengan melakukan
2.3. Algoritma K-Means observasi dan wawancara. Tahap Analisis untuk
K-means merupakan salah satu metode proses yang pertama dilakukan proses input data yang
pengelompokan data sekatan yang berusaha akan di lakukan clustering menggunakan algoritma K-
mempartisi data yang ada ke dalam bentuk dua atau Means. Selanjutnya dilakukan proses clustering data
lebih kelompok [8]. Berikut ini merupakan rumus dari dari data yang sudah berhasil diinputkan dengan
Algoritma K-Means: menggunakan software Tanagra dengan algoritma K-
𝑛
means dan yang terakhir yaitu menarik kesimpulan
𝑑 (𝑥, 𝑦) = ∑ (𝑥𝑖 − 𝑦𝑖 )2
𝑖=1 dari hasil keseluruhan penelitian yang sudah dilakukan
Keterangan: dan pemberian saran kepada peneliti selanjutnya yang
xi = objek xke-i akan mengambil topik yang sama pada penelitian ini.
yi = objek xke-i
n = banyaknya objek 3.2. Teknik Pengumpulan Data
1 Teknik pengumpulan data merupakan langkah
𝑐𝑘 = ∑ 𝑑𝑖 awal dalam penelitian. Teknik pengumpulan data yang
𝑛𝑘
Keterangan: dilakukan dalam penelitian ini adalah studi literatur
nk = jumlah data dalam cluster k dan observasi.
di = jumlah dari nilai jarak dalam masing-masing a. Studi Literatur
cluster Pada proses awal dalam penlitian ini yang
dilakukan oleh peneliti adalah studi literatur.
2.4. Tanagra Studi literatur dilakukan oleh peneliti dengan
Tanagra adalah software data mining open cara melakukan serangkaian kegiatan yaitu
source yang mempermudah penggunanya karena mencari data Pustaka, membaca dan mencatat,
pengguna dapat mengakses ke kode sumber melakukan pengumpulan dari hasil penelitian
menambahkan algoritma sendiri, sejauh pengguna terdahulu yang berkaitan dengan penelitian ini
dengan lisensi distribusi perangkat lunak [9]. yaitu analisis Clustering menggunakan algoritma
K-Means.
3. METODE PENELITIAN b. Observasi
3.1. Tahap-Tahap Penelitian Observasi merupakan salah satu teknik
Tahap-tahap penelitian merupakan alur atau pengumpulan data. Dalam penelitianini observasi
tahapan yang akan digunakan peneliti dalam dilakukan untuk mengamati objek yang akan
melakukan penelitian. Berikut ini merupakan diagram diteliti oleh peneliti. Observasi dilakukan dengan
alur keseluruhan yang dilakukan dalam penelitian ini: cara mengamati berbagai arsip SKCK di dalam
file penyimpanan arsip di polsek lobar. Adanya
berbagai macam keperluan atau kebutuhan
pemohon membuat peneliti melakukan penelitian
tersebut
c. Wawancara
Wawancara merupakan teknik pengambilan data
dengan cara mengajukan beberapa pertanyaan
secara langsung kepada narasumber jenis
wawancara yang dilakukan adalah wawancara
terencana dengan berpedoman pada daftar
pertanyaan yang telah dibuat sebelumnya.
Wawancara ini ditunjukan kepada Staf dan
anggota sat intelkam yang mengurusi dalam
bidang SKCK
4. HASIL DAN PEMBAHASAN

4.1. Implementasi Menggunakan Tanagra
Pemrosesan data menggunakan software Tanagra
menghasilkan 3 cluster masing-masing atribut.
Gambar 2. Alur Penelitian Berikut ini merupakan tahapannya:
863
Gambar 3. Input Data pada software Tanagra Gambar 6. K-Means
Setelah tahapan input data selesai selanjutnya Pada tahap cluster ini data dijadikan menjadi 3
klik kanan dan klik “VIEW”. Menghasilkan seperti cluster, yang telah menggunakan standar variabel.
Gambar 2 berikut ini. Untuk melihat hasilnya klik menu “VIEW” seperti
pada Gambar 6 seperti dibawah ini:
Gambar 4. More univariate

Gambar 7. tampilan View
Kemudian klik komponen “STANDARDIZE”
(tab “FEATURE CONSTRUCTION”). Tarik ke Pada tahap ini merupakan langkah awal pada
“DEFINE STATUS” 1. Kemudian klik kanan dan proses clustering, yang mana akan dilakukan
“VIEW”. Seperti pada Gambar 5. interpretasikan kelompok dan menentukan
karakteristik setiap cluster dan membedakannya satu
sama lain dengan tahapan tambahkan “VIEW
DATASET” (tab “DATVISUALIZATION”) lalu
Tarik ke K-Means_1. Klik kanan dan klik “VIEW”.
Maka hasilnya sebagai berikut ini:
Gambar 5. Standardize di Define Status 1
Pada tahap ini data dikelompokkan dengan

menggunakan metode K-means pada software Tanagra
dengan tahapan Insert Komponen K-Means pada tab
“CLUSTERING” lalu Tarik “DEFINE STATUS 2” Gambar 8. Hasil clustering tanagra
kemudian klik kanan dan klik “PARAMETER” seperti
pada gambar 6. 4.2. Proses Clustering
4.2.1. Data Selection
Berdasarkan kegiatan penelitian yang telah
dilakukan data diperoleh dalam bentuk hardcopy dan
belum terkomputerisasi. Oleh karena itu dilakukan
entry data dan disimpan dalam format. xsls. berikut ini
merupakan contoh data yang sudah dilakukan seleksi.
864
Tabel 1. Contoh hasil data selection 4.2.4. Data Mining

No Nama JK Alamat Keperluan Pada penelitian ini jumlah cluster yang akan
Persyaratan digunakan adalah 3 cluster, yaitu berdasarkan radius
Renaldi
melamat wilayah yang mencangkup daerah kecamatan
1 Firman L Bendosari
pekerjaan di PT
Syah kademangan dari polsek lobar. Dengan ketentuan C1
Sap Surabaya
wilayah yang memiliki radius dekan dari Polsek, C2
Persyaratan
melamar memiliki radius pertengahan dari Polsek, C3 wilayah
Ilham yang memiliki radius jauh dari Polsek.
2 L Sumberjati pekerjaan di PT
Maulana Menentukan pusat cluster secara acak berikut ini
Karya Niaga
Abadi merupakan pusat cluster yang telah ditentukan.
4.2.2. Pre-processing/Cleaning Tabel 4. Pusat Cluster

Proses penghapusan noise atau membuang Atribut C1 C2 C3
duplikasi data dimana dalam penelitian ini data yang Jenis Kelamin 2 1 2
tidak diperlukan dalam proses clustering dihapus. Alamat 4 6 2
Berikut ini merupakan contoh data yang sudah Keperluan 2 3 1
dilakukan proses cleaning.
Setelah menentukan titik pusat cluster
Tabel 2. Contoh data hasil proses cleaning selanjutnya adalah menghitung jarak antar objek ke
No Nama JK Alamat Keperluan centeroid dengan menggunakan rumus Euclidean
Persyaratan Distance. Berikut ini merupakan contoh perhitungan
Renaldi
melamat jarak pada data pertama.
1 Firman L Bendosari
pekerjaan di PT
Syah
Sap Surabaya
( )2 ( )2 ( )2
Persyaratan d(1,1) =√ 1 − 2 + 13 − 4 + 1 − 2
melamar
Ilham = 9.110433579
2 L Sumberjati pekerjaan di PT
Maulana
Karya Niaga
Abadi ( )2 ( )2 ( )2
d(1,2) =√ 1 − 1 + 13 − 6 + 1 − 3
4.2.3. Transformation = 7.280109889
Transformasi data dalam penelitian ini dilakukan
dengan cara menginisialisasi kategorik kedalam data ( )2 ( )2 ( )2
numerik. d(1,3) =√ 1 − 2 + 13 − 2 + 1 − 1
Dengan ketentuan pada kolom JK (Jenis = 11.04536102
Kelamin) Laki-Laki ditransformasikan dengan nilai 1
dan Perempuan dengan nilai 2. Pada kolom Alamat
terbagi menjadi 15 yaitu, Plosorejo ditransformasikan ( 1 − 2 )2 + (6 − 4 )2 + (1 − 2 )2
d(2,1) =√
dengan nilai 1, Darungan dengan nilai 2, Maron
dengan nilai 3, Kademangan dengan nilai 4, = 2.449489743
Plumpungrejo dengan nilai 5, Sumberjati dengan nilai
( )2 ( )2 ( )2
6, Sumberjo dengan nilai 7, Suruhwadang dengan nilai d(2,2) =√ 1 − 1 + 6 − 6 + 1 − 3
8, Pakisaji dengan nilai 9, Panggungduwet dengan
nilai 10, Jimbe dengan nilai 11, Kebonsari dengan nilai =2
12, Bendosari dengan nilai 13, Rejowinangun dengan
( )2 ( )2 ( )2
=√ 1 − 2 + 6 − 2 + 1 − 1
nilai 14, dan Dawuhan dengan nilai 15. Pada kolom
d(2,3)
keperluan dikelompokkan menjadi 6 angka yaitu,
persyaratan melamar pekerjaan ditransformasikan = 4.123105626
dengan nilai 1, persyaratan pindah tempat dengan nilai
2, pembuatan buku dengan nilai 3, pendaftaran Perhitungan selanjutnya dilakukan dengan cara
perangkat desa dengan nilai 4, kelengkapan berkas yang sama. Berikut ini merupakan contoh data awal
dengan nilai 5, dan yang terakhir persyaratan sekolah hasil perhitungan menggunakan rumus Euclidean
ditransformasikan dengan niali 6. Berikut ini distance.
merupakan contoh data yang sudah sitransformasikan.
Tabel 5. Hasil perhitungan Jarak Euclidien Distance
Tabel 3. Contoh hasil data transformasi Jarak
Jarak ke 1 Jarak ke 2 Jarak ke 3
No Nama JK Alamat Keperluan terdekat
Renaldi 9,110433579 7,280109889 11,04536102 7,280109889
1 1 13 1
Firman Syah 2,44989743 2 4,123105626 2
Ilham 4,242640687 2,828427125 6,08276253 2,828427125
2 1 6 1
Maulana
865
Mengelompokan jarak terdekat dengan cara merupakan hsil perhitungan nilaimenggunakan pusat
objek yang memiliki jarak terdekat dengan centeroid cluster baru, tidak terjadi perpindahan kelompok pada
maka akan masuk kedalam kelompok anggota setiap data, dengan ini maka pengelompokan sudah
centeroid tersebut. dinyatakan konvergen atau sudah dianggap optimal.
Berikut ini merupakan contoh data awal Berikut ini merupakan hasil perhitungan
pengelompokan cluster berdasarkan jarak terdekat. menggunakan cluster baru.
Tabel 6. Pengelompokan Jarak Tersebut Tabel 8. Hasil perhitungan menggunakan cluster baru
Jarak terdekat Cluster Jarak
I1 I2 I3 I4 I5
7,280109889 2 Terdekat
2 2 4.296009324 2 3 1 1 1
2,828427125 2 3.624215307 2 1 1 2 2
2.157580496 2 3 1 3 3
Langkah selanjutnya adalah menentukan cluster
baru, selanjutnya menghitung nilai rata-rata dari setiap Hasil dari perhitungan jarak euclidien pada
anggota masing-masing cluster yang nantinya hasil iterasi yang terakhir (iterasi 5) menunjukan bahwa
rata-rata tersebut digunakan untuk pusat cluster baru. hasil sudah stabil. Berikut ini merupakan hasil rata-rata
Berikut ini merupakan hasil dari perhitungan rata-rata dari setiap cluster.
cluster.
Tabel 7. Pusat cluster baru Tabel 9. Hasil perhitungan Rata-rata Iterasi terakhir
Nilai Cluster Baru Atribut C1 C2 C3
Atribut C1 C2 C3 Jenis
9,833722 11,60197 9,48403
Jenis Kelamin
1.422535134 6.530343437 2.682896749 Alamat 13,041 4,054912 7,980558
Kelamin
Alamat 2.786535402 5.133350935 4.774124698 Keperluan 11,26107 6,515559 7,29437
Keperluan 2.465372758 8.404564655 1.17163088
Dari tabel diatas telah didapatkan hasil akhir dari
Jika terdapat data yang pindah atau belum stabil proses clustering, hasil yang didapatkan dari
maka ulangi tahapan – tahapan di atas sampai data perhitungan. Cluster 1, 2, 3 sebagai berikut:
stabil dan tidak ada yang pindah. Pada tabel 8
Tabel 10. Hasil perhitungan Cluster 1,2,3
Kluster 1 Kluster 2 Kluster 3

Atribut Banyak Jml Atribut Banyak Jml Atribut Banyak Jml
L 74 1 139 1 33
Jk 124 Jk 210 Jk 82
P 50 2 71 2 49
Plosorejo 0 1 41 1 0
Darungan 0 2 33 2 2
Maron 0 3 16 3 1
Kademangan 0 4 71 4 6
Plumpungrejo 0 5 23 5 1
Sumberjati 0 6 17 6 12
Sumberjo 0 7 9 7 11
Al Suruhwadang 3 124 Al 8 0 210 Al 8 32 82
Pakisaji 0 9 0 9 9
Panggung duwet 1 10 0 10 8
Jimbe 38 11 0 11 0
Kebonsari 14 12 0 12 0
Bendosari 11 13 0 13 0
Rejowinangun 24 14 0 14 0
Dawuhan 33 15 0 15 0
Melamar Pekerjaan 116 1 199 1 67
Persyaratan Pindah
0 2 1 2 1
Tempat
Pembuatan Buku 0 3 3 3 2
Kep Pendaftaran Perangkat 124 Kep 210 Kep 82
4 4 2 4 10
Desa
Kelengkapan Berkas 3 5 5 5 2
Melanjutkan
1 6 0 6 0
Study/Sekolah
866
Hasil perhitungan data yang berjumlah 416 data selain tanagra seperti rapid miner, orange, weka dan
menghasilkan 3 cluster. Untuk cluster 1 berjumlah 124 masih banyak lagi.
data, cluster 2 berjumlah 210 data dan cluster 3
berjumlah 82 data. Dari hasil perhitungan tersebut DAFTAR PUSTAKA
dapat diketahui profil yang mendominasi pada cluster [1] R. Ramanda dan S. Indrahti, “Analisis
1 adalah berjenis kelamin laki-laki, kemudian dalam pengelolaan arsip inaktif terhadap temu kembali
cluster 1 juga yang mendominasi pemohon SKCK arsip dipusat arsip (record center) Politeknik
beralamat di desa Jimbe dan dalam cluster 1 juga yang Negeri Semarang,” J. Inlmu Perpust., vol. 4, no.
mendominasiai pemohon SKCK digunakan untuk 3, hal. 283, 2015, [Daring]. Tersedia pada:
melamar pekerjaan. Cluster 2 yang mendominasi https://ejournal3.undip.ac.id/index.php/jip/articl
adalah jenis kelamin laki-laki, beralamat di e/view/9741.
Kademangan yang digunakan untuk keperluan [2] Moh. Tamsil Tamrin, “LEMBAGA
melamar pekerjaan. Cluster 3 yang didominasi oleh KEPOLISIAN DALAM SISTEM
perempuan, beralamatkan di Suruhwadang dan PENYELENGGARAAN PEMERINTAHAN
menggunakan SKCK untuk melamar pekerjaan. NEGARA INDONESIA,” hal. 133–142, 1386.
Hasil perhitungan manual dan hasil perhitungan [3] A. H. Putri, H. Alumni, S. Tinggi, I. Manajemen,
yang menggunakan Tanagra berbeda, karena inisiasi S. Program, dan S. Manajemen, “Pengaruh
atau titik pusat cluster dimulai dengan angka yang Kualitas Pelayanan terhadap Kepuasan
berbeda. Pada perhitungan manual menggunakan Masyarakat pada Kantor Desa Medan
inisiasi yang dipilih secara acak oleh penulis dan pada Sinembah,” J. Stud. Manaj., vol. 2, no. 1, hal. 1–
Tanagra dipilih secara acak oleh sistem yang ada di 6, 2020, [Daring]. Tersedia pada:
Tanagra sendiri, karena proses Clustering yang http://journals.synthesispublication.org/index.ph
menggunakan Tanagra tidak menyediakan fungsi p/civitas.
untuk memilih sendiri inisiasinya.
[4] J. O. Ong, “Implementasi Algotritma K-means
clustering untuk menentukan strategi marketing
5. KESIMPULAN DAN SARAN president university,” J. Ilm. Tek. Ind., vol.
Hasil dari penelitian yang menggunakan
vol.12, no, no. juni, hal. 10–20, 2013.
algoritma K-means pada pengelompokan arsip SKCK
[5] E. D. Sikumbang, “Penerapan Data Mining
di Polsek Lodoyo Barat dapat ditarik kesimpulan
Penjualan Sepatu Menggunakan Metode
bahwa: Algoritma k-means berhasil di
Algoritma Apriori,” J. Tek. Komput. AMIK BSI,
implementasikan pada analisis pengelompokan arsip
vol. Vol 4, No., no. September, hal. 1–4, 2018.
SKCK di Polsek Lodoyo Barat dengan Jumlah 416
data dan dengan menggunakan 3 cluster. Untuk cluster [6] B. M. Metisen dan H. L. Sari, “Analisis
1 berjumlah 124 data, cluster 2 berjumlah 210 data dan clustering menggunakan metode K-Means dalam
cluster 3 berjumlah 82 data. Dari hasil perhitungan pengelompokkan penjualan produk pada
tersebut dapat diketahui profil yang mendominasi pada Swalayan Fadhila,” J. Media Infotama, vol. 11,
cluster 1 adalah berjenis kelamin laki-laki, kemudian no. 2, hal. 110–118, 2015.
dalam cluster 1 juga yang mendominasi pemohon [7] I. N. M. Adiputra, “Clustering Penyakit Dbd
SKCK beralamat di desa Jimbe dan dalam cluster 1 Pada Rumah Sakit Dharma Kerti Menggunakan
juga yang mendominasiai pemohon SKCK digunakan Algoritma K-Means,” Inser. Inf. Syst. Emerg.
untuk melamar pekerjaan. Cluster 2 yang Technol. J., vol. 2, no. 2, hal. 99, 2022, doi:
mendominasi adalah jenis kelamin laki-laki, beralamat 10.23887/insert.v2i2.41673.
di Kademangan yang digunakan untuk keperluan [8] M. W. Talakua, Z. A. Leleury, dan A. W. Taluta,
melamar pekerjaan. Cluster 3 yang didominasi oleh “Analisis Cluster Dengan Menggunakan Metode
perempuan, beralamatkan di Suruhwadang dan K-Means Untuk Pengelompokkan
menggunakan SKCK untuk melamar pekerjaan. Hasil Kabupaten/Kota Di Provinsi Maluku
penerapan algoritma k-means dengan menggunakan Berdasarkan Indikator Indeks Pembangunan
Tanagra menghasilkan hasil dimana cluster 1 data Manusia Tahun 2014,” BAREKENG J. Ilmu Mat.
yang di dapatkan berjumlah 229 data, cluster 2 data dan Terap., vol. 11, no. 2, hal. 119–128, 2017,
yang di dapatkan berjumlah 155 data dan cluster 3 data doi: 10.30598/barekengvol11iss2pp119-128.
yang di dapatkan berjumlah 32 data. [9] Badrul Mohammad, “Algoritma Asosiasi
Saran yang dapat peneliti berikan kepada Dengan Algoritma Apriori Untuk Analisa Data
penelitian selanjutnya yaitu untuk penelitian Penjualan,” J. Pilar Nusa Mandiri, vol. 12, no. 2,
selanjutnya dapat menggunakan software-software hal. 121–130, 2016.
867

5762-Article Text-16724-1-10-20221116

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

5762-Article Text-16724-1-10-20221116

Diunggah oleh

Hak Cipta:

Format Tersedia

JATI (Jurnal Mahasiswa Teknik Informatika) Vol. 6 No.

PENERAPAN ALGORITMA K-MEANS CLUSTERING DALAM

Wahyu Ananda, Indyah Hartami Santi, Sabitul Kirom

Kata kunci: Algoritma K-Means, Clustering, Data Mining, SKCK, Tanagra

1. PENDAHULUAN teknologi informasi dan komunikasi yang dibuat dan

4. HASIL DAN PEMBAHASAN

Gambar 3. Input Data pada software Tanagra Gambar 6. K-Means

Gambar 4. More univariate

Gambar 5. Standardize di Define Status 1

Pada tahap ini data dikelompokkan dengan

Tabel 1. Contoh hasil data selection 4.2.4. Data Mining

4.2.2. Pre-processing/Cleaning Tabel 4. Pusat Cluster

Tabel 10. Hasil perhitungan Cluster 1,2,3

Kluster 1 Kluster 2 Kluster 3

Anda mungkin juga menyukai