Anda di halaman 1dari 6

Intecoms: Journal of Information Technology and Computer Science

Volume 1 Nomor 1, Juni 2018


e-ISSN : 2614-1574
p-ISSN : 2621-3249
DOI : https://doi.org/10.31539/intecoms.v1i1.141

IMPLEMENTASI DATA MINING PEMILIHAN PELANGGAN POTENSIAL


MENGGUNAKAN ALGORITMA K-MEANS

IMPLEMENTATION OF DATA MINING FOR POTENTIAL CUSTOMER


SELECTION USING K-MEANS ALGORITHM

Randi Rian Putra1, Cendra Wadisman2


Universitas Pembangunan Panca Budi Medan1
Universitas Putra Indonesia “YPTK”2
Randirian@dosen.pancabudi.ac.id1
ABSTRACT
This research was conducted to study data mining using K-Means algorithm which is implemented in the
selection of potential customers in MC Laundry. data collected through observation and interviews
conducted to the owner of the company concerned. Further data is analyzed to determine the data needed
in the process of determining potential customers. From experiments conducted using K-Means algorithm
and using Tanagra Software can provide accurate results in classifying potential customers.

Keywords: Data Mining, K-Means Algorithm, Tanagra Software

ABSTRAK
Penelitian ini dilakukan untuk mempelajari data mining menggunakan algoritma K-Means yang
diimplementasikan dalam pemilihan pelanggan potensial di MC Laundry. data dikumpulkan melalui
observasi dan interview yang dilakukan kepada pemilik perusahaan yang bersangkutan. Selanjutnya data
dianalisa untuk menentukan data yang dibutuhkan dalam proses penentuan pelanggan potensial. Dari
eksperimen yang dilakukan dengan menggunakan algoritma K-Means serta menggunakan Software
Tanagra dapat memberikan hasil yang akurat dalam mengelompokkan pelanggan potensial.

Kata kunci: Data Mining, Algoritma K-Means, Software Tanagra

PENDAHULUAN pelanggan ini menjadi hal yang penting


Hubungan antara perusahaan bagi MC Laundry mengingat semakin
dengan pelanggan sangat penting untuk banyaknya usaha yang sama. Untuk
menunjang perkembangan dan mencegah terjadinya perpindahan
kelangsungan perusahaan. Pihak pelanggan ini, maka perlu diketahui
manajemen perusahaan harus mampu kelompok pelanggan yang potensial,
untuk mengenali pelanggan sehingga perusahaan bisa melindungi
potensialnya dan mempercayainya pelanggan potensial tersebut dengan
dengan meningkatkan pemahaman cara memberikan pelayanan prima
perusahaan akan kebutuhan mereka dan memberikan hadiah. Hadiah
sebagai individu sehingga dapat yang diberikan perusahaan kepada
mempertahankan loyalitasnya terhadap pelanggan berupa cindera mata dan
perusahaan. dilakukan secara kontiniu di setiap
Salah satu hal yang penting tahunnya.
dalam pengelolaan pelanggan adalah Penelitian yang akan dibuat
bagaimana suatu perusahaan dapat penulis penerapan Data Minning
mempertahankan pelanggan yang menggunakan Algoritma K-Means.
dimilikinya. Usaha mempertahankan Penelitian mengenai penerapan Data

72
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77

Minning menggunakan Algoritma K-


Means sudah banyak dilakukan oleh
orang-orang yang berada dibidang

.
Information Technology atau pada .
. .
bidang lainnya.

.
.
METODE PENELITIAN

Gambar 2. Langkah-Langkah Metode k-


means
Evaluation and
presentation

Pelanggan Potensial
Pelanggan menduduki posisi
Data mining
Patterns penting dalam pengembangan strategi
Selection and
bisnis, pelanggan juga merupakan salah
transformation
satu sumber keuntungan dalam
perusahaan. Untuk itu diperlukan suatu
pemahamaan yang baik tentang
Data

Warehouse
pelanggan. Pemahaman yang baik
Cleaning and
terhadap pelanggan dapat digunakan
integration
perusahaan untuk berinvestasi
pelanggan yang potensial. Masalah
yang sering dihadapi adalah kesulitan
Database Flat Files
dalam menganalisa nilai pelanggan.
Banyak pemasar mengalami kesulitan
Gambar 1. Skema Dari Proses KDD
untuk mengidentifikasi pelanggan atau
nasabah yang tepat hal tersebut dapat
K-means Clustering
mengakibatkan perusahan kehilangan
K-Means merupakan algoritma
nasabah potensial dan tentunya akan
clustering yang berulang-ulang.
sangat merugikan perusahaan.
Algoritma K-Means dimulai dengan
Segmentasi pelanggan adalah
pemilihan secara acak K, K disini
metode yang populer yang digunakan
merupakan banyaknya cluster yang
untuk memilih pelanggan atau nasabah
ingin dibentuk. Kemudian tetapkan
yang tepat untuk memulai promosi.
nilai-nilai K secara random, untuk
Dengan segmentasi nasabah
sementara nilai tersebut menjadi pusat
berdasarkan prilakunya, kita dapat
dari cluster atau biasa disebut dengan
menargetkan tindakan mereka dengan
centroid, mean atau “means”. Hitung
lebih baik. Seperti peluncuran produk
jarak setiap data yang ada terhadap
yang disesuaikan, target pemasaran dan
masing-masing centroid menggunakan
untuk memenuhi harapan pelanggan.
rumus Euclidian hingga ditemukan
Namun untuk menganalisa data
jarak yang paling dekat dari setiap data
pelanggan atau nasabah dalam jumlah
dengan centroid. Klasifikasikan setiap
besar memerlukan tenaga dan waktu
data berdasarkan kedekatannya dengan
yang banyak (Widiarina dan Romi
centroid. Lakukan langkah tersebut
S.W., 2015).
hingga nilai centroid tidak berubah
(stabil) (Pralita, 2010).

73
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77

HASIL DAN PEMBAHASAN


A. Data Pengujian
Proses implementasi dan
analisa data dilakukan dengan
menggunakan program aplikasi
Tanagra, dengan melakukan
pengujian pada seluruh data yang
telah didapatkan pada bulan oktober
2015 dan maret 2016 di MC Laundry
sebanyak 20 sample data dimana
sumber data yang pada awal nya di
simpan dalam database yang
menggunakan Microsoft acces
dirubah kebentuk format dokumen
Gambar 4. Tampilan View dataset
program aplikasi excel.

B. Langkah Pengujian Tanagra


Untuk membuktikan kebenaran
pada tahap analisa dan pengujian
scara manual, maka diperlukan
pengujian dengan menggunakan
Software Tanagra, Adapun langkah-
langkah yang dilakukan dalam
pengujian ini yaitu :
1. Import Data
Setelah selesai melakukan
pengumpulan data serta
pengolahan data yang telah
didapat dari hasil penelitian pada
MC Laundry dalam format .txt
pada Notepad++. Gambar 5. Tampilan Parameter K-means

Gambar 3. Import Data MC Laundry

Untuk melihat isi data yang


kita masukkan dapat dilakukan
dengan cara drag dan drop view Gambar 6. Tampilan Hasil K-Means Dengan
dataset, seperti pada gambar Software Tanagra

74
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77

3. Transformation
Coding adalah transformasi pada
data yang telah dipilih, sehingga data
tersebut sesuai untuk proses Data
mining. Proses coding dalam KDD
merupakan proses kreatif dan sangat
tergantung pada jenis atau pola
informasi yang akan dicari dalam
basis data.
4. Data mining
Data mining adalah proses mencari
pola atau informasi menarik dalam
data terpilih dengan menggunakan
teknik atau metode tertentu. Teknik,
Gambar 7. Hasil Clustering metode, atau algoritma dalam Data
mining sangat bervariasi. Pemilihan
Knowledge discovery In Database
metode atau algoritma yang tepat
adalah keseluruhan proses non-trivial
sangat bergantung pada tujuan dan
untuk mencari dan mengidentifikasikan
proses KDD secara keseluruhan.
pola (pattern) dalam data, dimana pola
Seperti halnya Susanto dan
yang ditemukan bersifat sah, baru dapat
Sudiyatno (2014) meneliti tentang
bermanfaat dan dapat dimengerti
penerapan data mining untuk
(Ndaumanu R.I., Kusrini dan M.
memprediksi prestasi belajar siswa
Rudyanto A., 2014).
berdasarkan status sosial ekonomi
Proses KDD secara garis besar
orang tua, motivasi, kedisiplinan
(Nasari F. dan Surya D., 2015) dapat
siswa dan prestasi masa lalu dengan
dijelaskan sebagai berikut:
algoritma J48.
1. Data Selection
5. Interpretation / Evaluation
Pemilihan (seleksi) data dari
Pola informasi yang dihasilkan dari
sekumpulan data operasional perlu
proses Data mining perlu
dilakukan sebelum tahap
ditampilkan dalam bentuk yang
penggalian informasi dalam KDD
mudah dimengerti oleh pihak yang
dimulai. Data hasil seleksi yang
berkepentingan. Tahap ini
akan digunakan untuk proses Data
merupakan bagian dari proses KDD
mining disimpan dalam suatu berkas,
yang disebut interpretation. Tahap
terpisah dari basis data operasional.
ini mencakup pemeriksaan apakah
2. Pre- processing / Cleaning
pola atau informasi yang ditemukan
Sebelum proses Data mining dapat
bertentangan dengan fakta atau
dilaksanakan, perluh dilakukan
hipotesis yang ada sebelumnya
proses pembersihan pada data yang
menjadi focus KDD. Proses
Defenisi Data Mining
pembersihan mencakup antara lain
Data mining merupakan sebuah
membuang duplikasi data,
inti dari proses KDD, meliputi dugaan
memeriksa data yang inkosisten,
algoritma yang mengeksplor data,
dan memperbaiki kesalahan pada
membangun model dan menemukan
data, seperti kesalahan cetak
pola yang belum diketahui. KDD
(tipografi).
bersifat otomatis, dapat didefinisikan
sebagai pengorganisasian proses untuk

75
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77

pengidentifikasian yang benar, data nama pelanggan, data


berguna dan penemuan pola dari jumlah transaksi dan data total
kumpulan data yang besar dan transaksi. Data pelanggan potensial,
komplek. Data mining merupakan didapatkan setelah menginput data
penyelesaian masalah dengan pelanggan yang telah disimpan
menganalisa data yang ada pada dalam notepad kemuadian data
database, dimana data tersimpan secara tersebut diimport ke dalam
elektronik dan pencariannya dilakukan Tanagra.
otomatis seperti pada komputer
(Arumawadu et. al., 2015). DAFTAR PUSTAKA
Kemudian Harryanto dan Hansun Arumawadu, H. I., R. M., Kapila T. R.,
(2017) menggunakan penerapan & Illangarathe, S. K. (2015).
Algoritma C4.5 dalam mengidentifikasi Mining Profitability of
calon pegawai suatu perusahaan dengan Telecomunication Customer
memprediksi dan mengklasifikasi Using K-Means Clustering.
terhadap calon yang potensial untuk Journal of Data Analysis and
masuk ke dalam perusahaan dengan Information Processing. 3(3), 63-
cara membuat pohon keputusan 71
berdasarkan data-data yang sudah ada. Harryanto, F. F., & Hangsung, S.
Dan Algoritma C4.5 juga digunakan (2017). Penerapan Algoritma C4.5
untuk memprediksi masa studi untuk Meprediksi Penerimaan
mahasiswa pada perguruan tinggi Calon Pegawai Baru di PT. WISE.
(Haryati et. al., 2015). JATISI, 3(2), 95-103
Haryati, S., Aji, S., & Eko, S. (2015).
Implementasi Data Mining untuk
SIMPULAN Memprediksi Masa Studi
Dari penelitian yang telah Mahasiswa Menggunakan
dilakukan, maka dapat ditarik Algoritma C4.5. Jurnal Media
kesimpulan sebagai berikut Infotama, 11(2), 130-138
1. Mengelompokkan data dengan Nasari, F., & Surya, D. (2015).
algoritma K-Means dilakukan dengan Penerapan K-Means Clustering
cara menetukan jumlah cluster, pada Data Penerimaan Mahasiswa
hitung jarak terdekat dengan pusat Baru (Studi Kasus Universitas
cluster. Data dengan jarak terdekat Potensi Utama). Seminar Nasional
menyatakan anggota dari cluster Teknologi Informasi dan
tersebut, dilakukan perhitungan Multimedia, 3(1), 73-78
kembali sampai data tidak berpindah Ndaumanu, R. I., Kusrini, K., &
pada cluster lain, untuk Rudyanto, A. (2014). Analisis
meminimalkan fungsi objektif. Prediksi Tingkat Pengunduran
2. Data pelanggan yang potensial Diri Mahasiswa dengan Metode
didapatkan setelah perhitungan K-Nearest Neighbor. JATISI, 1(1),
algoritma K-Means selesai, data 1-15
dengan pusat centroid terbesarlah Pralita, F. (2010). Penerapan Jaringan
yang termasuk ke dalam pelanggan Syaraf Tiruan untuk Memprediksi
yang paling potensial. Jumlah Penumpang Bus dengan
3. Data pelanggan potensial didapatkan Metode Back Propagation”,
dengan cara menggunakan tools Skripsi. Fakultas MIPA,
Tanagra, data yang diproses meliputi Universitas Islam Indonesia

76
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77

Susanto, H., & Sudiyatno. (2014). Data


Mining untuk Memprediksi
Prestasi Siswa Berdasarkan Sosial
Ekonomi, Motivasi, Kedisiplinan
dan Prestasi Masa lalu. Jurnal
Pendidikan Vokasi, 4(2), 222-231
Widiarina, W., & Romi, S. W. (2015).
Algoritma Cluster Dinamik untuk
Optimasi Cluster pada Algoritma
K-Means dalam Pemetaan
Nasabah Potensial. Journal of
Intelligent Systems, 1(1), 3

77

Anda mungkin juga menyukai