ABSTRAK
Penelitian ini dilakukan untuk mempelajari data mining menggunakan algoritma K-Means yang
diimplementasikan dalam pemilihan pelanggan potensial di MC Laundry. data dikumpulkan melalui
observasi dan interview yang dilakukan kepada pemilik perusahaan yang bersangkutan. Selanjutnya data
dianalisa untuk menentukan data yang dibutuhkan dalam proses penentuan pelanggan potensial. Dari
eksperimen yang dilakukan dengan menggunakan algoritma K-Means serta menggunakan Software
Tanagra dapat memberikan hasil yang akurat dalam mengelompokkan pelanggan potensial.
72
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77
.
Information Technology atau pada .
. .
bidang lainnya.
.
.
METODE PENELITIAN
Pelanggan Potensial
Pelanggan menduduki posisi
Data mining
Patterns penting dalam pengembangan strategi
Selection and
bisnis, pelanggan juga merupakan salah
transformation
satu sumber keuntungan dalam
perusahaan. Untuk itu diperlukan suatu
pemahamaan yang baik tentang
Data
Warehouse
pelanggan. Pemahaman yang baik
Cleaning and
terhadap pelanggan dapat digunakan
integration
perusahaan untuk berinvestasi
pelanggan yang potensial. Masalah
yang sering dihadapi adalah kesulitan
Database Flat Files
dalam menganalisa nilai pelanggan.
Banyak pemasar mengalami kesulitan
Gambar 1. Skema Dari Proses KDD
untuk mengidentifikasi pelanggan atau
nasabah yang tepat hal tersebut dapat
K-means Clustering
mengakibatkan perusahan kehilangan
K-Means merupakan algoritma
nasabah potensial dan tentunya akan
clustering yang berulang-ulang.
sangat merugikan perusahaan.
Algoritma K-Means dimulai dengan
Segmentasi pelanggan adalah
pemilihan secara acak K, K disini
metode yang populer yang digunakan
merupakan banyaknya cluster yang
untuk memilih pelanggan atau nasabah
ingin dibentuk. Kemudian tetapkan
yang tepat untuk memulai promosi.
nilai-nilai K secara random, untuk
Dengan segmentasi nasabah
sementara nilai tersebut menjadi pusat
berdasarkan prilakunya, kita dapat
dari cluster atau biasa disebut dengan
menargetkan tindakan mereka dengan
centroid, mean atau “means”. Hitung
lebih baik. Seperti peluncuran produk
jarak setiap data yang ada terhadap
yang disesuaikan, target pemasaran dan
masing-masing centroid menggunakan
untuk memenuhi harapan pelanggan.
rumus Euclidian hingga ditemukan
Namun untuk menganalisa data
jarak yang paling dekat dari setiap data
pelanggan atau nasabah dalam jumlah
dengan centroid. Klasifikasikan setiap
besar memerlukan tenaga dan waktu
data berdasarkan kedekatannya dengan
yang banyak (Widiarina dan Romi
centroid. Lakukan langkah tersebut
S.W., 2015).
hingga nilai centroid tidak berubah
(stabil) (Pralita, 2010).
73
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77
74
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77
3. Transformation
Coding adalah transformasi pada
data yang telah dipilih, sehingga data
tersebut sesuai untuk proses Data
mining. Proses coding dalam KDD
merupakan proses kreatif dan sangat
tergantung pada jenis atau pola
informasi yang akan dicari dalam
basis data.
4. Data mining
Data mining adalah proses mencari
pola atau informasi menarik dalam
data terpilih dengan menggunakan
teknik atau metode tertentu. Teknik,
Gambar 7. Hasil Clustering metode, atau algoritma dalam Data
mining sangat bervariasi. Pemilihan
Knowledge discovery In Database
metode atau algoritma yang tepat
adalah keseluruhan proses non-trivial
sangat bergantung pada tujuan dan
untuk mencari dan mengidentifikasikan
proses KDD secara keseluruhan.
pola (pattern) dalam data, dimana pola
Seperti halnya Susanto dan
yang ditemukan bersifat sah, baru dapat
Sudiyatno (2014) meneliti tentang
bermanfaat dan dapat dimengerti
penerapan data mining untuk
(Ndaumanu R.I., Kusrini dan M.
memprediksi prestasi belajar siswa
Rudyanto A., 2014).
berdasarkan status sosial ekonomi
Proses KDD secara garis besar
orang tua, motivasi, kedisiplinan
(Nasari F. dan Surya D., 2015) dapat
siswa dan prestasi masa lalu dengan
dijelaskan sebagai berikut:
algoritma J48.
1. Data Selection
5. Interpretation / Evaluation
Pemilihan (seleksi) data dari
Pola informasi yang dihasilkan dari
sekumpulan data operasional perlu
proses Data mining perlu
dilakukan sebelum tahap
ditampilkan dalam bentuk yang
penggalian informasi dalam KDD
mudah dimengerti oleh pihak yang
dimulai. Data hasil seleksi yang
berkepentingan. Tahap ini
akan digunakan untuk proses Data
merupakan bagian dari proses KDD
mining disimpan dalam suatu berkas,
yang disebut interpretation. Tahap
terpisah dari basis data operasional.
ini mencakup pemeriksaan apakah
2. Pre- processing / Cleaning
pola atau informasi yang ditemukan
Sebelum proses Data mining dapat
bertentangan dengan fakta atau
dilaksanakan, perluh dilakukan
hipotesis yang ada sebelumnya
proses pembersihan pada data yang
menjadi focus KDD. Proses
Defenisi Data Mining
pembersihan mencakup antara lain
Data mining merupakan sebuah
membuang duplikasi data,
inti dari proses KDD, meliputi dugaan
memeriksa data yang inkosisten,
algoritma yang mengeksplor data,
dan memperbaiki kesalahan pada
membangun model dan menemukan
data, seperti kesalahan cetak
pola yang belum diketahui. KDD
(tipografi).
bersifat otomatis, dapat didefinisikan
sebagai pengorganisasian proses untuk
75
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77
76
2018. Intecoms: Journal of Information Technology and Computer Science 1 (1): 72-77
77