Anda di halaman 1dari 23

PENERAPAN CLUSTERING DATA MINING UNTUK REKOMENDASI

PENENTUAN JABATAN KARYAWAN PADA BANK PEMBANGUNAN


DAERAH JAMBI MENGGUNAKAN KOMPARASI METODE K-MEANS
DAN FUZZY C-MEANS

PROPOSAL SKRIPSI

Diajukan oleh:

M Ilham Effendi 8020160089

Untuk Memenuhi Persyaratan Penelitian


Pada Matakuliah Skripsi

PROGRAM STUDI TEKNIK INFORMATIKA


STIKOM DINAMIKA BANGSA JAMBI
2019
PERNYATAAN HASIL EVALUASI

NAMA/NIM : M Ilham Effendi / 8020160089

PRODI : SI / TI / SK *)

JUDUL : PENERAPAN CLUSTERING DATA MINING UNTUK


REKOMENDASI PENENTUAN JABATAN KARYAWAN
PADA BANK PEMBANGUNAN DAERAH JAMBI
MENGGUNAKAN KOMPARASI METODE K-MEANS DAN
FUZZY C-MEANS

1. Hasil Evaluasi : Disetujui / Disetujui dengan perbaikan / Ditolak *)


2. Catatan :
Alasan Penolakan Skripsi
Proyek Skripsi tidak relevan dengan Program Studi
Pernah ada topik sejenis
Metode utama telah banyak dipakai
Metode yang dipakai tidak jelas
Masalah terlalu sempit
------------------------------------------

Mengetahui,
Ketua Program Studi

Beny, S.Kom, M.Sc

YDB. 07.84.055

*) Coret yang tidak perlu


IDENTITAS PROPOSAL SKRIPSI

Judul Proposal : PENERAPAN CLUSTERING DATA MINING

UNTUK REKOMENDASI PENENTUAN JABATAN

KARYAWAN PADA BANK PEMBANGUNAN

DAERAH JAMBI MENGGUNAKAN KOMPARASI

METODE K-MEANS DAN FUZZY C-MEANS

Program Studi : Teknik Informatika

Jenjang Pendidikan : Strata 1 (S1)

Peneliti :

a. Nama Lengkap : M Ilham Effendi

b. NIM : 8020160089

c. Jenis Kelamin : Laki-laki

d. Tempat / Tgl. Lahir : Jambi, 16 Desember 1998

e. Alamat : Jl. Iswahyudi Chandra, Lrg.Subur No.24

f. No. Telepon : 089512104956

g. Email : Ilhameffendiii@gmail.com
BAB I

PENDAHULUAN

1.1. LATAR BELAKANG

Kemajuan teknologi informasi sudah semakin berkembang pesat di segala

bidang kehidupan. Banyak sekali data yang dihasilkan oleh teknologi informasi

yang canggih, mulai dari bidang industri, ekonomi, ilmu dan teknologi serta

berbagai bidang kehidupan. Salah satu bidang yang sangat membutuhkan

teknologi informasi ini adalah perbankan. Dimana teknologi informasi menjadi

media utama sebagai penghubung antara bank satu dengan lainnya.

Bank Pembangunan Daerah Jambi merupakan bank kebanggaan rakyat

jambi dimana berkantor pusat di Kota Jambi. Bank Jambi sendiri didirikan dengan

maksud untuk menunjang serta mendorong pembangunan daerah dan

mengembangkan pertumbuhan ekonomi daerah dalam rangka mempertinggi taraf

hidup rakyat. Semakin banyaknya kebutuhan masyarakat jambi, semakin banyak

pula kantor cabang dari bank jambi, yang membuat semakin banyak karyawan

yang dibutuhkan. Tentunya tiap-tiap karyawan memiliki kemampuan berbeda-

beda dan akan ditempatkan di beberapa jabatan.

Penentuan jabatan akan berdampak terhadap kegiatan operasional kantor

dan bisa saja mempengaruhi kinerja dari kantor itu sendiri. Penentuan jabatan

selama ini masih banyak memiliki kelemahan. Salah satunya ditentukan

berdasarkan penglihatan visual semata, tanpa melihat latar belakang karyawan dan
sebagainya. Hal ini akan berakibat kepada kinerja karyawan itu sendiri, apabila

dirinya tidak mampu dengan pekerjaan dari jabatan yang diterimanya, maka

karyawan tersebut akan kesulitan.

Pengetahuan dari data pada suatu informasi saja tidak cukup untuk

mengambil suatu keputusan. Diperlukan juga suatu analisa dari setiap data yang

ada untuk mendapatkan bahan pertimbangan dari informasi yang tersedia. Dengan

menggunakan Data Mining, setiap kumpulan atau gudang data dapat memberikan

pengetahuan penting yang menjadi informasi yang sangat berharga bagi suatu

organisasi, seperti pada organisasi pendidikan. Pada organisasi pendidikan, suatu

sistem informasi dapat digunakan untuk memperoleh informasi yang menunjang

setiap kegiatan pada pengambilan suatu keputusan. (David Hartanto Kamagi,

Seng Hansun : 2014).

Data mining adalah proses yang menggunakan teknik statistik,

matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan

mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari

berbagai database besar. tujuan utama data mining adalah untuk menemukan,

menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki,

Mujib Ridwan et al. (2013 : 60).

Hal inilah yang melatar belakangi penulis untuk melakukan penelitian

guna memberi solusi terhadap masalah yang terjadi dengan mengangkat judul

“PENERAPAN CLUSTERING DATA MINING UNTUK REKOMENDASI

PENENTUAN JABATAN KARYAWAN PADA BANK PEMBANGUNAN


DAERAH JAMBI MENGGUNAKAN KOMPARASI METODE K-MEANS

DAN FUZZY C-MEANS”. Dengan adanya penelitian ini diharapkan tingkat

persentase pemilihan dalam menentukan jabatan pada Bank Pembangunan Daerah

Jambi lebih tinggi, berdasarkan atribut terpilih yang kemudian dianalisa dengan

Metode K-Means clustering dan Fuzzy C-Means. Hasil yang diperoleh dapat

dijadikan acuan dalam menentukan jabatan karyawan-karyawan baru yang akan

bergabung di Bank jambi, sehingga bisa lebih selektif dalam menganalisa.

1.2. RUMUSAN MASALAH

Berdasarkan latar belakang diatas, maka rumusan masalah pada penelitian

ini adalah bagaimana mengolah data karyawan dan merekomendasikan jabatan

pada Bank Pembangunan Daerah Jambi untuk karyawan yang belum

mendapatkan jabatan menggunakan komparasi metode k-means clustering dan

fuzzy c-means ?.

1.3. BATASAN MASALAH

Untuk menghindari pembahasan yang meluas, maka penulis hanya

membatasi pembahasan permasalahan hanya pada.

1. Objek yang menjadi sasaran penelitian adalah karyawan di Bank

Pembangunan Daerah Jambi yang belum mendapatkan jabatan.

2. Analisis menggunakan teknik data mining clustering dengan metode k-

means dan fuzzy c-means.

3. Data yang digunakan bersumber dari Bank Pembangunan Daerah Jambi

4. Pengujian hasil analisis menggunakan tools WEKA.


5. Format data yang digunakan adalah Arff.

1.4. TUJUAN DAN MANFAAT PENELITIAN

1.4.1. Tujuan Penelitian

Penelitian ini bertujuan untuk:

1. Menerapkan teknik data mining dalam merekomendasikan jabatan

karyawan pada Bank Pembangunan Daerah Jambi berdasarkan data

karyawan.

2. Mendapatkan hasil akurasi yang tepat untuk merekomendasikan jabatan

karyawan pada Bank Pembangunan Daerah Jambi menggunakan metode

K-Means Clustering dan Fuzzy C-Means.

1.4.2. Manfaat Penelitian

1. Dapat memprediksi dalam penentuan jabatan untuk karyawan pada Bank

Pembangunan Daerah Jambi yang direkomendasikan berdasarkan data

karyawan.

2. Pihak Bank Pembangunan Daerah Jambi dapat menentukan strategi untuk

meningkatkan kualitas dan kuantitas pada seleksi penerimaan karyawan

baru.

3. Penulis dapat menambah ilmu dan wawasan baru mengenai klasifikasi

menentukan jabatan karyawan pada Bank Pembangunan Daerah Jambi.

4. Dapat digunakan sebagai acuan untuk melakukan penelitian berikutnya.


1.5 LANDASAN TEORI

1.5.1 DATA

Menurut Edhy Sutanta dalam jurnal Hermansyah Sembiring dan Nurhayati

(2012:2) menyatakan: “Data adalah sebagai bahan keterangan tentang kejadian

nyata atau fakta-fakta yang dirumuskan dalam sekelompok lambang tertentu yang

tidak acak yang menunjukan jumlah, tindakan, atau hal”

Menurut Eka Iswandy (2015:4) menyatakan: “Data adalah sesuatu yang

belum mempunyai arti bagi penerimanya dan masih memerlukan adanya

suatu pengolahan. Data bisa berwujud suatu keadaan, gambar, suara,

huruf, angka, matematika, bahasa ataupun simbol-simbol lainnya yang

bisa kita gunakan sebagai bahan untuk melihat lingkungan, obyek,

kejadian ataupun suatu konsep”.

Menurut Sutarman (2012:3) mengatakan: “Data adalah fakta dari suatu

pernyataan yang berasal dari kenyataan, dimana pernyataan tersebut merupakan

hasil pengukuran atau pgamatan”.

Jadi dapat disimpulkan bahwa data adalah sekumpulan fakta-fakta hasil

pengukuran dan pengamatan yang belum memiliki arti dan dapat diolah menjadi

suatu informasi tertentu.

1.5.2 DATA MINING

Data Mining sering juga disebut Knowledge Discovery in Database,

adalah kegiatan yang meliputi pengumpulan, pemakaian dan historis untuk

menemukan keteraturan, pola atau hubungan dalam set data berukuran besar.

Menurut (Turban, E. dkk,. 2005) :


Data mining adalah proses yang menggunakan teknik statistik,

matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan

mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari

berbagai database besar.

Menurut Connolly dan Begg dalam artikel Juni dkk (2016 : 748)

menyatakan bahwa : “Data mining adalah suatu proses ekstraksi atau

penggalian data yang belum diketahui sebelumnya, namun dapat dipahami

dan berguna dari database yang besar serta digunakan untuk membuat

suatu keputusan bisnis yang sangat penting.”

Menurut (Turban et al, 2007:202) :

Data mining adalah sebuah istilah yang digunakan untuk menggambarkan

penemuan ilmu pengetahuan dalam bidang database, sebuah bidang analisis

informasi yang mencari pola tersembunyi dalam sekelompok data yang dapat

digunakan untuk memprediksi perilaku masa depan.

1.5.2.1 TAHAPAN DATA MINING

Istilah data mining dan knowledge discovery in databases (KDD) sering

kali digunakan secara bergantian untuk menjelaskan proses penggalian informasi

tersembunyi dalam suatu basis data yang besar. Dan tahapan dalam data mining

ini adalah seperti proses KDD yang secara garis besar dapat dijelaskan sebagai

berikut (Fayyad dalam buku Kusrini dan Luthfi, 2009 : 6) :

a. Data Selection
Pemilihan (Seleksi) data baru sekumpulan data operasional perlu dilakukan

sebelum tahap penggalian informasi dalam data mining dimulai. Data hasil

seleksi yang akan digunakan untuk proses data mining, disimpan dalam suatu

berkas, terpisah dari basis data operasional.

b. Pre-processing/Cleaning

Sebelum proses data mining dapat dilaksanakan, perlu dilakukan proses cleaning

pada data yang menjadi fokus KDD. Proses cleaning mencakup antara lain

membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki

kesalahan pada data, seperti kesalahan cetak (tipografi).

c. Transformation

Coding adalah proses transformasi pada data yang telah dipilih, sehingga data

tersebut sesuai untuk proses data mining.

d. Data Mining

Data mining adalah proses mencari pola atau informasi menarik dalam data

terpilih dengan menggunakan teknik atau metode tertentu.

e. Interpretation/Evaluation

Pola informasi yang dihasilkan dari proses data mining perlu ditampilkan dalam

bentuk yang mudah dimengerti oleh pihak yang berkepentingan. Tahap ini

merupakan bagian dari proses KDD yang disebut interpretation (Fayyad dalam

buku Kusrini dan Luthfi, 2009 : 6).


Gambar 2.1 Proses KDD (Fayyad, 2009)

1.5.2.2 PENGOLAHAN DATA MINING

Pengolahan data mining terdiri dari beberapa metode pengolahan, yaitu:

a) Predictive modelling yang merupakan pengolahan data mining dengan

melakukan prediksi/ peramalan. Tujuan metode ini untuk membangun

model prediksi suatu nilai yang mempunyai ciri-ciri tertentu. Contoh

algoritmanya Linear Regression, Neural Network, Support Vector

Machine, dan lain-lain.

b) Association (Asosiasi) merupakan teknik dalam data mining yang

mempelajari hubungan antar data. Contoh penggunaannya seperti untuk

menganalisis perilaku mahasiswa yang datang terlambat. Contohnya jika

mahasiswa memiliki jadwal dengan dosen A dan B, maka mahasiswa akan

datang terlambat. Contoh algoritmanya FP-Growth, A Priori, dan lain-lain.


c) Clustering (Klastering) atau pengelompokkan merupakan teknik untuk

mengelompokkan data ke dalam suatu kelompok tertentu. Contoh

algoritmanya K-Means, K-Medoids, Self-Organitation Map (SOM), Fuzzy

C-Means, dan lain-lain. Contoh untuk clustering: Terdapat lima pulau di

Indonesia: Sumatera, Kalimantan, Jawa, Sulawesi dan Papua. Maka lima

pulau tersebut dijadikan tiga klaster berdasarkan waktunya: Waktu

Indonesia Barat (Sumatera, Kalimantan dan Jawa), Waktu Indonesia

Tengah (Sulawesi) dan Waktu Indonesia Timur (Papua).

d) Classification merupakan teknik mengklasifikasikan data. Perbedaannya

dengan metode clustering terletak pada data, dimana pada clustering

variabel dependen tidak ada, sedangkan pada classification diharuskan ada

variabel dependen. Contoh algoritma yang menggunakan metode ini ID3

dan K Nearest Neighbors dan lainnya.

Pohon Keputusan (Decision Tree). Pohon keputusan merupakan metode

klasifikasi dan prediksi yang sangat terkenal. Metode pohon keputusan

mengubah fakta yang sangat besar menjadi pohon keputusan yang

merepresentasikan aturan. Aturan dapat dengan mudah dipahami dengan

bahasa alami, juga dapat diekspresikan dalam bentuk bahasa basis data

seperti Structured Query Language untuk mencari record pada kategori

tertentu. Pohon keputusan juga berguna untuk mengeksplorasi data,

menemukan hubungan tersembunyi antara sejumlah calon variabel input

dengan sebuah variabel target. Karena pohon keputusan memadukan

antara eksplorasi data dan pemodelan, pohon keputusan sangat bagus


sebagai langkah awal dalam proses pemodelan bahkan ketika dijadikan

sebagai model akhir dari beberapa teknik lain.

Dari beberapa pendapat diatas , maka dapat disimpulkan bahwa data

mining merupakan sebuah analisa dari observasi data dalam jumlah besar untuk

menemukan hubungan yang tidak diketahui sebelumnya dan dua metode baru

untuk meringkas data agar mudah dipahami serta kegunaannya untuk pemilih

data.

1.5.3 CLUSTERING

Menurut Widodo (2013:9) mengungkapkan : “Clustering atau klasifikasi


adalah metode yang digunakan untuk membagi rangkaian data menjadi
beberapa group berdasarkan kesamaan-kesamaan yang telah ditentukan
sebelumnya. Cluster adalah sekelom-pok atau sekumpulan objek-objek
data yang similar satu sama lain dalam cluster yang sama dan disimilar
terhadap objek-objek yang berbeda cluster. Objek akan dikelomokkan ke
dalam satu atau lebih cluster sehingga objek-objek yang berada dalam satu
cluster akan mempunyai kesamaan yang tinggi antara satu dengan yang
lainnya. “

Adapun tujuan dari data Clustering ini adalah untuk meminimalisasikan

objective function yang diset dalam proses Clustering, yang pada umumnya

berusaha meminimalisasikan variasi di dalam suatu cluster dan

memaksimalisasikan variasi antar cluster (Suwirmayanti et al. 2014).

Pengertian clustering keilmuan dalam Data Mining adalah pengelompokan

sejumlah data atau objek ke dalam cluster (group) sehingga setiap dalam cluster

tersebut akan berisi data yang semirip mungkin dan berbeda dengan objek dalam

cluster yang lainnya.


1.5.4 K-MEANS

K-Means merupakan saalah satu metode data clustering non hierarki yang

berusaha mempartisi data yang ada ke dalam bentuk satu atau lebih cluster atau

kelompok sehingga data yang memiliki karakteristik yang sama dikelompokkan

ke dalam satu cluster yang sama dan data yang mempunyai karakteristik yang

berbeda dikelompokkan ke dalam kelompok yang lainnya.

Menurut (Benri Melpa Metisen, Herlina Latipa Sari., 2015,)


mengungkapkan :K-Means adalah metode clustering berbasis jarak yang
membagi data ke dalam sejumlah cluster dan algoritma ini hanya bekerja
pada atribut numeric. Algoritma K-Means termasuk partitioning clustering
yang memisahkan data ke k daerah bagian yang terpisah. Algoritma K-
Means sangat terkenal karena kemudahan dan kemampuannya untuk
mengcluster data yang besar dan data outlier dengan sangat cepat.Dalam
algoritma K-Means, setiap data harus termasuk ke cluster tertentu dan bisa
dimungkinkan bagi setiap data yang termasuk cluster tertentu pada suatu
tahapan proses, pada tahapan berikutnya berpindah ke cluster lainnya.

1.5.5 FUZZY C-MEANS

Algoritma Fuzzy C-Means diusulkan pertama kali oleh Dunn pada tahun

1973 dan kemudian diperbaharui oleh Bezdek pada tahun 1981. Algoritma ini

merupakan salah satu teknik soft clustering yang paling popular dengan

menggunakan pendekatan data point dimana titik pusat cluster akan selalu

diperbaharui sesuai dengan nilai keanggotaan dari data yang ada dan selain itu

algoritma fuzzy c-means juga merupakan algoritma yang bekerja dengan

menggunakan model fuzzy sehingga memungkinkan semua data dari semua

anggota kelompok terbentuk dengan derajat keanggotaan yang berbeda antara 0

dan 1 (Bora & Gupta, 2014; Sanmorino, 2012). Metode Fuzzy C-Means pada
dasarnya memiliki tujuan meminimalisasikan fungsi serta mendapatkan pusat

cluster yang nantinya akan digunakan untuk mengetahui data yang masuk ke

dalam sebuah cluster (Simbolon et al., 2013).

1.5.6 PROFIL BANK PEMBANGUNAN DAERAH JAMBI

Bank Jambi merupakan Bank Milik Pemerintah Daerah Provinsi Jambi

dan Pemerintah Kabupaten/Kota se Provinsi Jambi yang didirikan berdasarkan

Akte Notaris Adiputra Parlindungan No.6 tanggal 12 Februari 1959 dengan nama

PT. Bank Pembangunan Daerah Jambi. Adapun visi dari Bank Jambi Menjadi

Bank yang ideal dan sehat dalam mewujudkan terpenuhinya kebutuhan

masyarakat di bidang jasa bank yang memiliki nilai tambah bagi ekonomi daerah

khususnya Usaha Kecil Menengah (UKM) dengan pengelolaan secara profesional,

kehati-hatian dan berkembang secara wajar. Sedangkan Misi Bank Pembangunan

Daerah Jambi diantaranya :

1. Menjalankan usaha sebagai bank umum, secara konvensional dan atau

berdasarkan prinsip syariah.

2. Penggerak, pendorong laju perekonomian dan pembangunan daerah.

3. Pemegang Kas Daerah, dan/atau melaksanakan penyimpanan uang daerah.

4. Sebagai salah satu sumber Pendapatan Asli Daerah (PAD).

1.5.7 KARYAWAN

Menurut Undang-Undang Tahun 1969 tentang Ketentuan-Ketentuan

Pokok Mengenai Tenaga Kerja dalam pasal 1 dikatakan bahwa karyawan adalah
tenaga kerja yang melakukan pekerjaan dan memberikan hasil kerjanya kepada

pengusaha yang mengerjakan dimana hasil karyanya itu sesuai dengan profesi

atau pekerjaan atas dasar keahlian sebagai mata pencariannya. Senada dengan hal

tersebut menurut Undang-Undang No.14 Tahun 1969 tentang Pokok Tenaga

Kerja, tenaga kerja adalah tiap orang yang mampu melaksanakan pekerjaan, baik

di dalam maupun diluar hubungan kerja guna menghasilkan jasa atau barang

untuk memenuhi kebutuhan masyarakat (Karimah, 2012).

1.5.8 WEKA

Waikato Environment for Knowledge Analysis (WEKA) merupakan

perangkat lunak pembelajaran mesin yang populer yang ditulis dalam bahasa

pemrograman java. WEKA dikembangkan di Universitas Waikato, Selandia Baru.

WEKA berisikan kumpulan algoritma beserta visualisasinya untuk analisis data

dan pemodelan prediktif. Algoritma-algoritma pembelajaran mesin pada WEKA

dapat dimanfaatkan untuk pemecahan masalah dibidang data mining. WEKA

versi asli awalnya dirancang untuk menganalisis data dari domain pertanian, tetapi

WEKA versi lengkap berbasis java (versi 3), yang mulai dibangun pada tahun

1997, yang sekarang dapat digunakan untuk menganalisis data dari berbagai

domain, khususnya untuk pendidikan dan penelitian. WEKA memiliki

implementasi semua teknik pembelajaran untuk klasifikasi dan regresi , yaitu

decision trees, rules set, pengklasifikasian teorema bayes, Support Vector

Machines (SVM), logistik dan linier, multi layers perceptrons dan metode nearest

neighbour.
1.6 METODOLOGI PENELITIAN

1.6.1 Alat dan Bahan Penelitian

1. Perangkat Keras (Hardware)

a. 1 ASUS K46CA

b. Processor Intel Core i3-3217U, 1.80GHz

c. Harddisk 500 GB

d. Printer Canon

e. Flashdisk 16 GB

2. Perangkat Lunak (Software)

a. Windows 7 Ultimate 64-bit

b. Google Chrome

c. Microsoft office 2007

d. Weka 3.9.2

1.6.2 Metode Penelitian

Adapun tahapan yang akan dilakukan dalam penelitian ini adalah sebagai

berikut :
Identifikasi Masalah

Studi Literatur

Pengumpulan Data

Preparing dan Processing data

K-Means & Fuzzy C-


Means

Analisis Hasil

Pembuatan Laporan

Gambar 1.1 Kerangka Kerja Penelitian

Berdasarkan kerangka kerja penelitian yang telah digambarkan diatas, maka

dapat diuraiakan pembahasan masing-masing tahap dalam penelitian adalah

sebagai berikut:

1. Identifikasi Masalah

Dalam hal ini, diharapkan dapat menghasilkan analisis permasalahan yang

ada, yaitu bagaimana merekomendasikan karyawan pada Bank

Pembangunan Daerah Jambi sesuai penilaian yang diperoleh, agar

karyawan tersebut mendapatkan jabatan sesuai kemapuannya. Berdasarkan

masalah diatas penulis mencari solusi dari permasalahan tersebut.

2. Studi Literatur
Studi literatur merupakan suatu kegiatan mencari referensi teori yang

relevan dengan kasus atau permasalahan yang ditemukan. Pada tahapan ini

dilakukan pencarian landasan-landasan teori yang diperoleh dari berbagai

buku dan juga internet untuk melengkapi perbendaharaan konsep dan teori,

sehingga memiliki landasan dan keilmuan yang baik dan sesuai.

3. Pengumpulan Data

Pada tahap ini penulis melakukan pengumpulan data, pengumpulan data

merupakan tahapan dalam proses penelitian yang penting, karena hanya

dengan mendapatkan data yang tepat, maka proses penelitian

akan berlangsung sampai penulis mendapatkan jawaban dari perumusan

masalah yang telah di tetapkan. Untuk itu data yang akan dicari tersebut

harus sesuai dengan tujuan dari penelitian.

4. Preparing dan Processing Data

Preparing dan Processing data : Pada tahap ini penulis melakukan

persiapan untuk data yang akan di proses.

5. Clustering K-Means & Fuzzy C-Means

Langkah-Langkah algoritma Clustering K-Means adalah sebagai berikut:

a. Pilih jumlah cluster.

b. Inisiasi k pusat cluster atau diberi nilai-nilai random.

c. Tempatkan setiap data atau objek ke cluster terdekat. Kedekatan dua

objek ditentukan berdasarkan kedua objek tersebut.

d. Hitung kembali pusat cluster dengan anggota cluster yang sekarang.

Pusat cluster adalah rata-rata semua data atau objek dalam cluster.
e. Tugaskan lagi setiap objek memakai pusat cluster yang baru. Jika

pusat cluster sudah tidak berubah lagi, maka proses pengklasteran

selesai.

f. Kembali ke langkah 3 pusat cluster tidak berubah lagi.

Langkah-Langkah algoritma Fuzzy C-Means adalah sebagai berikut:

a. Menentukan 3 variabel input.

b. Mengkonversikan input menjadi variabel fuzzy numerik.

c. Menentukan jumlah kelompok (c), serta pemberian nilai awal untuk

pangkat pembobot (w), iterasi maksimum dan kriteria penghentian.

d. Menghitung derajat keanggotaan atau matrik partisi U.

e. Menghitung pusat cluster (Vkj).

f. Menghitung nilai fungsi objektif (ObjFcn).

g. Mendapatkan hasil.

6. Analisis Hasil

Dari hasil analisis akan dinilai keakuratan data model yang sudah di

dapatkan dengan perhitungan metode Clustering dengan menggunakan

algoritma K-Means dan Fuzzy C-Means.

7. Penulisan Laporan

Setelah semua tahapan penelitian dilakukan, maka akan dibuat laporan

sebagai dokumentasi penelitian agar dapat di manfaatkan pada waktu yang

akan datang. Baik oleh penelitian sendiri maupun penelitian lainnya.


1.7 Jadwal Penelitian

Di bawah ini merupakan jadwal penelitian yang akan dilakukan secara

bertahap dalam bentuk tabel :

Tabel 1.1 Tabel Jadwal Penelitian

Oktober November Desember Januari


No
Kegiatan III IV
I II III IV I II III IV I II III IV I II
1 Identifikasi
Masalah
2
Studi Literatur
3 Pengumpulan
Data
4 Preparing dan
Processing data
Clustering K-
5
Means & Fuzzy
C-Means
6
Analisis Hasil
7 Penulisan
Laporan
DAFTAR PUSTAKA

(Yuda Septian, 2009)Yuda Septian, N. (2009). Data Mining Menggunakan

Algoritma Naïve Bayes Untuk Klasifikasi Kelulusan Mahasiswa Universitas

Dian Nuswantoro. Jurnal Semantik 2013, 1–11.

https://doi.org/10.13140/RG.2.1.4204.3923

(Komang, Julyantari, & Suryawan, 2013)Komang, N., Julyantari, S., & Suryawan,

I. K. D. (2013). Data Mining Prestasi Akademik Dengan Naive Bayes

Berdasarkan Attribut Importance ( AI ). Jurnal Sistem Dan Informatika, 75–

85.

(Metisen & Sari, 2015)Metisen, B. M., & Sari, H. L. (2015). Analisis clustering

menggunakan metode K-Means dalam pengelompokkan penjualan produk

pada Swalayan Fadhila. Jurnal Media Infotama, 11(2), 110–118.

(Alvionita & Rasywir, n.d.)Alvionita, V., & Rasywir, K. E. (n.d.). Klasifikasi

Prediksi Lama Masa Studi Mahasiswa Teknik Informatika Pada STIKOM

DB Menggunakan Metode Naïve Bayes, 1–14.

(Syam, 2017)Syam, F. A. (2017). Jurnal Ilmu Komputer dan Bisnis, Volume 8,

Nomor 1, Mei 2017, 8(Sunjana 2010), 1857–1864.

Rossalia, Dewi, dkk, 2015, Big Book SBMPTN Soshum 2016, Jakarta : Penerbit,

Cmedia. 15.
(Purnamaningsih & Aziz, 2014)Purnamaningsih, C., & Aziz, A. (2014).

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan

Siswa SMA, 3(1), 27–33.

(Pramesti, Furqon, & Dewi, 2017)Pramesti, D. F., Furqon, M. T., & Dewi, C.

(2017). Implementasi Metode K-Medoids Clustering Untuk Pengelompokan

Data Potensi Kebakaran Hutan / Lahan Berdasarkan Persebaran Titik Panas (

Hotspot ). Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer,

1(9), 723–732.

(Means, Medoids, Aryuni, Madyatmadja, & Miranda, n.d.)Means, P. K.-,

Medoids, D. A. N. K.-, Aryuni, M., Madyatmadja, E. D., & Miranda, E.

(n.d.). Pada Data Internet Banking Di Bank Xyz Application of K-Means and

K-Medoids Clustering, 349–356.

Anda mungkin juga menyukai