Anda di halaman 1dari 80

Penerapan Data Mining Dalam

Analytic CRM

Penulis:
Ni Wayan Wardani

Penerbit Yayasan Kita Menulis


Penerapan Data Mining Dalam
Analytic CRM
Copyright © Yayasan Kita Menulis, 2020

Penulis:
Ni Wayan Wardani

Editor: Janner Simarmata


Desain Sampul: Tim Kreatif Kita Menulis
Sampul: pexels.com/

Penerbit
Yayasan Kita Menulis
Web: kitamenulis.id
e-mail: press@kitamenulis.id
WA: 0821-6453-7176

Ni Wayan Wardani
Penerapan Data Mining Dalam Analytic CRM
Yayasan Kita Menulis, 2020
xii; 64 hlm; 16 x 23 cm
ISBN: 978-623-94636-7-0
Cetakan 1, September 2020
I. Penerapan Data Mining Dalam Analytic CRM
II. Yayasan Kita Menulis

Katalog Dalam Terbitan


Hak cipta dilindungi undang-undang
Dilarang memperbanyak maupun mengedarkan buku tanpa
Ijin tertulis dari penerbit maupun penulis
Kata Pengantar

Puji dan syukur penulis panjatkan ke hadapan Tuhan Yang Maha Esa,
atas anugrah-Nya, sehingga hanya dengan rahmat-Nya lah penulis dapat
menyelesaikan buku ini.

Buku ini menjelaskan secara mendetail tentang bagaimana penerapan


data mining dalam CRM (Customer Relationship Management) dengan
mengambil studi kasus prediksi customer churn di perusahaan retail
dengan algoritma Decision Tree C4.5 dan Naïve Bayes. Churn adalah
saat di mana pelanggan memutuskan untuk berpindah dari satu layanan
kepada layanan lain dengan jasa/produk yang sama. Dengan menerapkan
konsep CRM (Customer Relationship Management), perusahaan dapat
melakukan identifikasi pelanggan dengan melakukan segmentasi
pelanggan sekaligus dapat melaksanakan program mempertahankan
pelanggan dengan melakukan prediksi potensi churn pada setiap segmen
pelanggan.

Di Perusahaan retail modern yang telah menggunakan sistem komputer


modern tentunya menyimpan data transaksi pelanggan dalam sebuah
basis data. Dengan volume data yang besar dan terus berkembang, baik
dari jumlah record dan jumlah field tentunya akan sangat sulit
mengidentifikasi pelanggan secara manual oleh manusia. Sehingga
diperlukan penerapan data mining yang dapat membantu untuk
menganalisa data yang diperoleh dari transaksi pada sistem informasi
sehingga dapat menggali pola – pola yang dapat dijadikan pengetahuan
baru untuk proses prediksi pelanggan churn perusahaan retail.

Ucapan terima kasih sebesar – besarnya penulis sampaikan kepada semua


pihak yang telah membantu hingga selesainya penulisan buku. Terima
vi Penerapan Data Mining Dalam Analytic CRM

kasih kepada kedua Orang Tua, Mertua, Suami dan anak – anak tercinta
atas segala doa dan dukungannya. Tak lupa kepada Yayasan Kita
Menulis, sebagai penerbit buku ini, penulis ucapkan terima kasih.

Penulis menyadari tak ada sesuatu yang sempurna di dunia ini, termasuk
buku ini yang dibuat dengan segala keterbatasan. Oleh karena itu penulis
sangat membutuhkan saran dan kritik yang membangun dan bermanfaat.
Akhir kata, semoga buku ini bermanfaat.

Denpasar, September 2020


Penulis,

Wardani
Daftar Isi

Kata Pengantar ................................................................................................... v


Daftar Isi ............................................................................................................. vii
Daftar Gambar .................................................................................................. ix
Daftar Tabel ....................................................................................................... xi

Bab 1 Pendahuluan

Bab 2 Data Mining


2.1 Pertumbuhan Data ....................................................................................... 5
2.2 Apa itu Data Mining ?................................................................................. 6
2.3 Tugas Data Mining...................................................................................... 8
2.4 Model Prediksi............................................................................................. 9
2.5 CRISP-DM .................................................................................................. 10

Bab 3 Customer Relationship Management


3.1 Sejarah pemasaran ....................................................................................... 13
3.2 Definisi Customer Relationship Management (CRM) ............................. 14
3.3 Manfaat CRM .............................................................................................. 16
3.4 Teknologi CRM........................................................................................... 16
3.5 Data mining dalam Kerangka Kerja CRM ................................................ 19
3.6 Customer Churn ......................................................................................... 22
3.7 Model RFM (Recency, Frequency, Monetary)......................................... 22
3.8 Segmentasi Pelanggan ................................................................................ 24

Bab 4 Membangun Model Prediksi


4.1 Algoritma Naive Bayes............................................................................... 25
4.2 Confusion Matrix ........................................................................................ 26
4.3 Rancangan Penelitian .................................................................................. 27
4.4 Sumber Data ................................................................................................ 37
4.5 Instrumen Penelitian.................................................................................... 37
viii Penerapan Data Mining Dalam Analytic CRM

Bab 5 Hasil dan Pembahasan


5.1 Proses Segmentasi Pelanggan dengan Model RFM ................................. 39
5.2 Proses Pembangunan Model Algoritma Naïve Bayes.............................. 40
5.3 Pengukuran Kinerja Algoritma Naïve Bayes ............................................ 47
5.4 Hasil Kinerja Algoritma pada Kelas Pelanggan Berpotensi Churn......... 52
5.5 Analisis Kinerja Algoritma ......................................................................... 56
5.6 Analisis Customer Retention dan Customer Churn.................................. 58

Bab 6 Penutup
6.1 Kesimpulan .................................................................................................. 59
6.2 Saran ............................................................................................................. 60

Daftar Pustaka .................................................................................................... 61


Daftar Gambar

Gambar 2.1: Pertumbuhan data .......................................................................6


Gambar 2.2: Knowledge Discovery Process ..................................................7
Gambar 2.3: Empat Tugas Inti Data Mining ..................................................8
Gambar 2.4: Enam tahap siklus hidup pengembangan data mining.............10
Gambar 3.1: Analytical CRM Stages..............................................................18
Gambar 3.2: CRM instruments .......................................................................20
Gambar 3.3: Kerangka Kerja Teknik Data Mining dalam ............................21
Gambar 4.1: Rancangan Penelitian .................................................................27
Gambar 5.1: Pengolahan Data dengan Pivot Table .......................................39
Gambar 5.2: Data Hasil Pemodelan RFM ......................................................40
Gambar 5.3: Grafik Kinerja Algoritma Naïve Bayes di semua kelas
Pelanggan ....................................................................................57
Gambar 5.4: Grafik Kinerja Algoritma Naïve Bayes di Kelas Dormant .....57
x Penerapan Data Mining Dalam Analytic CRM
Daftar Tabel

Tabel 3.1: Kelas dan Karakteristik Pelanggan................................................24


Tabel 4.1: Data Parsial dari Database Perusahaan Retail (a).........................26
Tabel 4.2: Data Parsial dari Database Perusahaan Retail (b) ........................30
Tabel 4.3: Skor dan Domain Nilai RFM ........................................................32
Tabel 4.4: Skor Akhir RFM dan Label Pelanggan.........................................32
Tabel 4.5: Klasifikasi Atribut dengan Variabel Kategorikal .........................34
Tabel 4.6: Deskripsi Variabel Kategorikal dan Label Pelanggan .................35
Tabel 5.1: Hasil Konversi Data Latih Dan Data Uji Algoritma Naïve Bayes .41
Tabel 5.2: Penentuan Model Kriteria Algoritma Naïve Bayes .....................41
Tabel 5.3: Perhitungan Probabilitas Naïve Bayes – Contoh Data Uji ..........43
Tabel 5.4: Keputusan Status Churn pada Data Uji.........................................44
Tabel 5.5: Model Kriteria Algoritma Naïve Bayes Data Latih Kelas
Pelanggan Everyday.......................................................................44
Tabel 5.6: Model Kriteria Algoritma Naïve Bayes Data Latih Kelas
Pelanggan Golden ..........................................................................45
Tabel 5.7: Model Kriteria Algoritma Naïve Bayes Data Latih Kelas
Pelanggan Superstar ......................................................................46
Tabel 5.8: Confusion Matrix............................................................................48
Tabel 5.9: Confusion Matrix Kelas Pelanggan Dormant – NB ....................48
Tabel 5.10: Confusion Matrix Kelas Pelanggan Everyday – Naïve Bayes..49
Tabel 5.11: Confusion Matrix Kelas Pelanggan Golden – Naïve Bayes .....50
Tabel 5.12: Confusion Matrix Kelas Pelanggan Superstar – Naïve Bayes ..50
Tabel 5.13: Confusion Matrix Data Uji Gabungan – Naïve Bayes ..............51
Tabel 5.14: Confusion Matrix Kelas Pelanggan Dormant A – Naïve Bayes..52
Tabel 5.15: Confusion Matrix Kelas Pelanggan Dormant B – Naïve Bayes ..53
Tabel 5.16: Confusion Matrix Kelas Pelanggan Dormant D – Naïve Bayes..54
Tabel 5.17: Confusion Matrix Kelas Pelanggan Dormant D – Naïve Bayes..55
Tabel 5.18: Confusion Matrix Kelas Pelanggan Dormant F – Naïve Bayes ..55
xii Penerapan Data Mining Dalam Analytic CRM
Bab 1
Pendahuluan

Ritel adalah aktivitas yang melibatkan pembelian barang atau jasa dan
selanjutnya menjualnya ke konsumen akhir, biasanya dalam jumlah kecil dan
tanpa transformasi. Retailer atau pengecer adalah seseorang atau perusahaan
yang mendapatkan produk atau layanan dari seseorang untuk dijual kembali
kepada orang lain. Layanan ritel mencakup berbagai macam bentuk (toko,
perdagangan elektronik, pasar terbuka, dan lain-lain), dalam format (toko kecil,
minimarket, supermarket, hypermarket, dan lain-lain), dengan produk
(makanan, non-makanan, obat, dan lain-lain), struktur hukum (toko
independent, waralab, grup terintegrasi, dan lain-lain), dan lokasi (perkotaan /
pedesaan, pusat kota / pinggiran kota, dan lain-lain).
Sektor ritel sangat penting bagi ekonomi dunia, karena menyediakan lapangan
kerja skala besar bagi tenaga kerja terampil dan tidak terampil, pekerja lepas,
penuh waktu dan paruh waktu.
Di tengah persaingan bisnis retail yang sangat ketat dewasa ini menjadikan
perusahaan retail mulai mengalihkan fokus perusahaan dari sekedar
mengembangkan produk dan layanan yang unggul dan juga ekspansi ke basis
pelanggan yang besar menjadi ke arah mempertahankan pelanggan di
perusahaan dengan penciptaan pengalaman personal pelanggan. Hal ini
dilakukan karena hubungan antara perusahaan dengan pelanggan sangat
penting untuk menunjang perkembangan dan kelangsungan perusahaan.
2 Penerapan Data Mining Dalam Analytic CRM

Pelanggan bagi perusahaan adalah aset yang paling berharga. Kehilangan


pelanggan dari waktu ke waktu menjadi masalah yang sangat penting bagi
perusahaan manapun, terutama kehilangan beberapa pelanggan seiring waktu
dalam lingkungan yang sangat kompetitif mengingat saat ini pertumbuhan
perusahaan retail sangat pesat sampai ke pelosok desa, karenanya berbagai
cara ditempuh oleh perusahaan agar pelanggan tidak menghentikan pembelian.
Selain harus mampu mengidentifikasi pelanggan potensial, pihak manajemen
perusahaan retail juga harus mampu mempertahankan pelanggan potensial
(customer retention) sehingga dapat mencegah pelanggan menghentikan
pembelian dan berpindah ke perusahaan pesaing (churn).
Banyak penelitian menunjukkan bahwa lebih menguntungkan untuk
mempertahankan dan memuaskan pelanggan yang sudah ada daripada harus
terus – menerus menarik pelanggan baru. Seperti yang diungkapkan oleh
Emmet C. Murphy dan Mark A. Murphy dalam buku Leading On The Edge
of Chaos bahwa memperoleh pelanggan baru menghabiskan biaya lima kali
lipat dari biaya untuk memuaskan dan mempertahankan pelanggan lama,
sementara itu peningkatan sebanyak 2% dalam mempertahankan pelanggan
(customer retention) punya dampak terhadap laba seperti memangkas biaya
sebesar 10%. Sehingga dapat disimpulkan mempertahankan pelanggan yang
ada adalah salah satu strategi pemasaran terbaik agar perusahaan dapat
bertahan, walaupun tentunya perusahaan harus tetap mencari cara
menyeimbangkan antara menarik pelanggan baru dan mempertahankannya.
Oleh karena itu, strategi untuk mempertahankan pelanggan yang telah ada
perlu dilakukan oleh perusahaan retail yaitu dengan mengetahui terlebih
dahulu pelanggan yang memiliki kecendrungan untuk churn pada suatu waktu.
Salah satu cara untuk mengetahui hal tersebut adalah dengan melakukan
prediksi dan deteksi dini yaitu dengan melakukan churn prediction.
Di era perkembangan teknologi saat ini, sebagian besar perusahaan retail
modern telah menggunakan sistem informasi berbasis komputer untuk
menangani point of sales (POS) dan inventory. Hal ini berdampak pada
pertumbuhan jumlah data yang sangat pesat dan menimbulkan tumpukan data
yang berjumlah besar dalam basis data. Dengan volume data yang sangat besar
dan terus berkembang, baik dari jumlah record dan jumlah field tentunya akan
sangat sulit dianalisa secara manual oleh manusia. Sehingga diperlukan
penerapan data mining yang dapat membantu untuk menganalisa data yang
diperoleh dari transaksi pada sistem informasi sehingga dapat menggali pola –
Bab 1 Pendahuluan 3

pola yang dapat dijadikan pengetahuan baru untuk proses prediksi pelanggan
churn perusahaan retail.
Pada penelitian ini, penerapan data mining dilakukan selain untuk proses
prediksi pelanggan churn, terlebih dahulu penerapan data mining dilakukan
untuk mengidentifikasi karakter pelanggan dan mengelompokkan pelanggan
dalam beberapa kelas pelanggan. Untuk menghasilkan beberapa kelas
pelanggan akan digunakan model RFM (recency, frequency, monetary). Dari
hasil pengelompokkan pelanggan tersebut, selanjutnya akan digunakan untuk
prediksi customer churn menggunakan Algoritma Naïve Bayes. Algoritma
Naïve Bayes adalah suatu klasifikasi yang bekerja berdasarkan teori
probabilitas yang memandang semua fitur dari data sebagai bukti dalam
probabilitas.
4 Penerapan Data Mining Dalam Analytic CRM
Bab 2
Data Mining

2.1 Pertumbuhan Data


Sistem komputer modern mengumpulkan data dengan kecepatan yang hampir
tak terbayangkan dan berasal dari berbagai sumber : dari mesin kasir toko –
toko retail, penarikan tunai bank dan transaksi kartu kredit, hingga satelit
observasi bumi di luar angkasa, dan dengan volume data yang terus bertambah
dan juga semakin bertambahnya volume informasi yang tersedia dari internet
seperti jumlah miliaran postingan di media sosial.
Seiring dengan kemajuan teknologi penyimpanan, yang semakin
memungkinkan untuk menyimpan data dalam jumlah besar dengan biaya yang
relatif rendah, telah muncul kesadaran yang berkembang bahwa data tersebut
terkubur di dalamnya. Pertumbuhan data yang pesat yang telah mencapai
urutan petabyte atau exabyte, menciptakan tumpukan – tumpukan data tetapi
miskin informasi yang bermanfaat atau dengan tepat dikatakan bahwa dunia
menjadi 'kaya data tetapi miskin pengetahuan' menjadikan pentingnya
tumpukan data tersebut diolah sedemikian rupa sehingga menghasilkan
informasi ataupun pengetahuan yang bermanfaat bagi sebuah institusi,
perusahaan ataupun organisasi.
6 Penerapan Data Mining Dalam Analytic CRM

Gambar 2.1: Pertumbuhan data (datanami.com)

2.2 Apa itu Data Mining ?


Data mining adalah studi tentang mengumpulkan, membersihkan, memproses,
menganalisis, dan mendapatkan wawasan berguna dari data (Aggarwal, 2015).
Data mining juga sering disebut dengan istilah Knowledge Discovery in
Database (KDD). KDD merupakan suatu area yang mengintegrasikan
berbagai metode, yang meliputi statistik, basis data, kecerdasan buatan
(artificial intelligence), machine learning, pengenalan pola (pattern
recognition), pemodelan yang menangani ketidakpastian, visualisasi data,
optimasi, Sistem Informasi Manajemen (SIM), dan sistem berbasis
pengetahuan (knowledge based system). Sebagai bagian dari proses yang ada
Bab 2 Data Mining 7

di dalam KDD, maka data mining didahului dengan proses pemilihan data,
pembersihan data, preprocessing dan transformasi data (Sumanthi dan
Sivandham, 2009).

Gambar 2.2: Knowledge Discovery Process (Bramer, 2016)


Terdapat beberapa tahapan penting dalam KDD :
1. Data store

Proses yang ada di dalam KDD dimulai dengan data masuk yang berasal dari
berbagai sumber kemudian terintegrasi dan ditempatkan di beberapa
penyimpanan umum.
2. Data preprocessing

Untuk membuat data sesuai untuk diproses, penting untuk mengubahnya


menjadi format yang sesuai dengan algoritma data mining seperti format
multidimensi, deret waktu, atau semistruktur, karena ketika data dikumpulkan,
seringkali tidak dalam bentuk yang sesuai untuk diproses. Untuk itu dalam
tahap ini dilakukan proses pembersihan data dan memilih atribut data. Proses
persiapan data ini adalah proses yang sangat penting karena keluaran dari
algoritma data mining sangat tergantung pada kualitas persiapan data.
3. Data mining
Selanjutnya data yang telah siap tersebut kemudian diteruskan ke algoritma
data mining yang akan menghasilkan keluaran dalam bentuk aturan atau pola.
Keluaran tersebut kemudian ditafsirkan untuk mendapatkan informasi dan
pengetahuan yang berguna.
8 Penerapan Data Mining Dalam Analytic CRM

3. Postprocessing

Proses ini adalah proses visualisasi di mana menganalisa keluaran dari proses
data mining, yang bertujuan untuk memastikan bahwa hasil keluaran dari
proses data mining adalah hasil valid dan berguna bagi pihak yang
berkepentingan.

2.3 Tugas Data Mining


Tugas data mining secara garis besar dibagi menjadi dua kategori utama, yaitu
(Tan dkk, 2006) :
1. Tugas prediktif

Tujuan utama dari tugas ini adalah untuk memprediksikan nilai yang tidak
diketahui atau nilai di masa mendatang dari atribut tertentu berdasarkan nilai
dari atribut lainnya. Atribut yang diprediksi dikenal sebagai target atau
dependent variable, sedangkan atribut yang digunakan untuk membuat
prediksi disebut penjelas atau independent variable.
2. Tugas deskriptif

Tujuan utama dari tugas ini adalah untuk memperoleh pola (correlation, trend,
cluster, trajectory, anomaly) untuk menyimpulkan hubungan di dalam data.
Tugas deskriptif merupakan tugas data mining yang sering dibutuhkan pada
teknik postprocessing untuk melakukan validasi dan menjelaskan hasil proses
data mining. Inti dari tugas data mining adalah pemodelan prediktif, analisa
asosiasi, analisa cluster, dan deteksi terhadap anomali (Gambar 2.3).

Gambar 2.3: Empat Tugas Inti Data Mining (Tan dkk, 2006)
Bab 2 Data Mining 9

Pemodelan prediktif mengacu pada proses membangun model untuk variable


target sebagai fungsi dari variable penjelas. Ada dua tipe dari pemodelan
prediktif yaitu klasifikasi (classification) yang digunakan untuk variable target
yang diskret, dan regresi (regression) yang digunakan untuk variable target
yang kontinyu. Analisa asosiasi digunakan untuk menemukan pola yang
mendeskripsikan fitur – fitur data yang saling berhubungan. Pola – pola ini
biasanya digambarkan dalam bentuk aturan implikasi. Analisa cluster
merupakan proses untuk mencari kelompok – kelompok data, sedemikian
sehingga data yang berada dalam satu kelompok memiliki kemiripan
dibandingkan data yang terletak pada kelompok lain. Deteksi anomali
merupakan proses identifikasi data yang memiliki perbedaan karakteristik
yang signifikan dengan data yang lain atau yang dikenal dengan istilah outlier
(Tan dkk, 2006).

2.4 Model Prediksi


Terdapat 2 jenis model prediksi, yaitu klasifikasi dan regresi. Klasifikasi
digunakan untuk variable target diskret, sedangkan regresi digunakan untuk
variabel target kontinu (Prasetyo, 2014). Contoh pekerjaan yang menggunakan
jenis klasifikasi adalah churn analysis dan risk management. Pekerjaan ini
termasuk jenis klasifikasi karena target yang diharapkan adalah diskret, hanya
beberapa jenis kemungkinan nilai target yang didapatkan dan tidak ada nilai
seri waktu (time series) yang harus didapatkan untuk mendapat target nilai
akhir (Prasetyo, 2014).
Model regresi mirip dengan model klasifikasi, yang membedakan adalah
model regresi tidak bisa mencari pola yang dijabarkan sebagai class (kelas).
Melakukan prediksi jumlah penjualan yang didapatkan pada 3 bulan ke depan
itu termasuk regresi karena untuk mendapatkan nilai penjualan bulan ketiga
harus mendapatkan nilai penjualan bulan kedua dan untuk mendapatkan nilai
penjualan bulan kedua harus mendapatkan nilai penjualan bulan pertama.
Dalam hal ini ada nilai seri waktu yang harus dihitung untuk sampai pada
target akhir yang diinginkan dan ada nilai kontinu yang harus dihitung untuk
mendapatkan nilai target akhir yang diinginkan (Prasetyo, 2014).
10 Penerapan Data Mining Dalam Analytic CRM

2.5 CRISP-DM
CRISP-DM (Cross-Industry Standard Process for Data mining) merupakan
suatu konsorsium perusahaan yang didirikan oleh Komisi Eropa pada Tahun
1996 dan telah ditetapkan sebagai proses standar dalam data mining yang
dapat diaplikasikan di berbagai sektor industri.

Gambar 2.4: Enam tahap siklus hidup pengembangan data mining (Chapman,
2000)
Berikut ini adalah enam tahap siklus hidup pengembangan data mining
(Chapman, 2000) :
1. Business understanding

Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut pandang
bisnis, kemudian menterjemahkan pengetahuan ini ke dalam pendefinisian
Bab 2 Data Mining 11

masalah dalam data mining. Selanjutnya akan ditentukan rencana dan strategi
untuk mencapai tujuan tersebut.
2. Data understanding

Tahap ini dimulai dengan pengumpulan data yang kemudian akan dilanjutkan
dengan proses untuk mendapatkan pemahaman yang mendalam tentang data,
mengidentifikasi masalah kualitas data, atau untuk mendeteksi adanya bagian
yang menarik dari data yang dapat digunakan untuk hipotesa untuk informasi
yang tersembunyi.
3. Data preparation

Tahap ini meliputi semua keinginan untuk membangun dataset akhir (data
yang akan diproses pada tahap pemodelan/modeling) dari data mentah. Tahap
ini dapat diulang beberapa kali. Pada tahap ini juga mencakup pemilihan table,
record, dan atribut-atribut data, termasuk proses pembersihan dan transformasi
data untuk kemudian dijadikan masukan dalam tahap pemodelan (modeling).
4. Modeling

Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik
pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan
nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang dapat
diterapkan untuk masalah data mining yang sama. Di pihak lain ada teknik
pemodelan yang membutuhkan format data khusus. Sehingga pada tahap ini
masih memungkinkan kembali ke tahap sebelumnya.
5. Evaluation

Pada tahap ini, model sudah terbentuk dan diharapkan memiliki kualitas baik
jika dilihat dari sudut pandang analisa data. Pada tahap ini akan dilakukan
evaluasi terhadap keefektifan dan kualitas model sebelum digunakan dan
menentukan apakah model dapat mencapai tujuan yang ditetapkan pada fase
awal (business understanding). Kunci dari tahap ini adalah menentukan apakah
ada masalah bisnis yang belum dipertimbangkan. Di akhir dari tahap ini harus
ditentukan penggunaan hasil proses data mining.
12 Penerapan Data Mining Dalam Analytic CRM

6. Deployment

Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diatur
dan dipresentasikan dalam bentuk khusus sehingga dapat digunakan oleh
pengguna. Tahap deployment dapat berupa pembuatan laporan sederhana atau
mengimpelementasikan proses data mining yang berulang dalam perusahaan.
Dalam banyak kasus, tahap deployment melibatkan konsumen, di samping
analis data, karena sangat penting bagi konsumen untuk memahami tindakan
apa yang harus dilakukan untuk menggunakan model yang telah dibuat.
Bab 3
Customer Relationship
Management

3.1 Sejarah pemasaran


Customer Relationship Management (CRM) erat kaitannya dengan
pemasaran. Istilah pemasaran berasal dari kata pasar yang berarti sekelompok
penjual dan pembeli yang bekerja sama untuk menukar barang dan jasa.
Konsep awal pemasaran difokuskan pada proses di mana barang dan jasa
dipindahkan dari pemasok ke konsumen.
Beberapa peneliti telah membagi sejarah pemasaran menjadi empat era yang
berbeda sesuai dengan praktik dan fokus yang berbeda antara lain (Hollander
et al., 2005; Boone dan Kurtz, 2008) :
1. Era Kronologis

Di Era kronologis, fokus pemasaran hanya pada proses pemindahan barang


dan jasa dari pemasok ke konsumen.
14 Penerapan Data Mining Dalam Analytic CRM

2. Era Produksi

Pada era ini penekanan utama pemasaran terdiri dari menghasilkan produk
yang memuaskan, tanpa upaya besar dan memperkenalkan kepada calon
pelanggan melalui katalog, brosur dan iklan.
3. Era Penjualan

Era penjualan berlangsung dari tahun 30-an hingga 50-an dan


mempromosikan konsep pemasaran transaksional. Karena kelebihan pasokan
melebihi permintaan, perusahaan menyadari perlunya memiliki tenaga
penjualan untuk menjual produk.
4. Era Pemasaran

Era di mana perusahaan mulai berorientasi terhadap pelanggan dengan


mengikuti pilihan dan motivasi pelanggan
5. Era Relasi

Era di mana berfokus pada mengidentifikasi, membangun, memelihara, dan


meningkatkan hubungan jangka panjang dengan pelanggan dan stakeholder
lainnya dengan didukung oleh kemajuan teknologi.

3.2 Definisi Customer Relationship


Management (CRM)
CRM didasarkan pada RM dan difokuskan pada teknologi yang mendasari
pengelolaan pelanggan. CRM berawal dari keinginan untuk menggabungkan
help desk, dukungan pelanggan, ERP dan data mining (Peel, 2002). Inisiatif
CRM pertama diluncurkan pada awal 1990-an dan terutama difokuskan pada
aktivitas call center (Roya Rahimi, 2007). Kemunculan CRM yang
menjanjikan dipengaruhi oleh kemajuan teknologi informasi, sistem
manajemen data, peningkatan analitik, peningkatan komunikasi, integrasi
sistem dan adopsi internet (Greenberg, 2001). Saat ini, dalam istilah teknologi
informasi, CRM berarti integrasi dari berbagai teknologi seperti:
datawarehouse, website, intranet / extranet, help desk, sales, accounting, ERP
Bab 3 Customer Relationship Management 15

dan data mining. Memang, semua teknologi informasi yang mampu


mengumpulkan data terintegrasi untuk memberikan informasi yang
dibutuhkan untuk menciptakan interaksi yang lebih personal dengan pelanggan
(Bose, 2002).
Pada era relasi saat ini pelanggan merupakan aset berharga bagi suatu
perusahaan. Menjaga hubungan jangka panjang dengan pelanggan dapat
meningkatkan prospek bisnis suatu perusahaan. Hal ini adalah alasan mengapa
perusahaan harus merencanakan dan menggunakan strategi yang cukup jelas
dalam memperlakukan pelanggan sehingga dapat memaksimalkan nilai jangka
panjang pelanggan (customer lifetime value).
Berikut ini akan didefinisikan beberapa pengertian CRM yang diambil dari
berbagai literatur antara lain (Tama, 2009) :
1. Dari sisi yang berkaitan dengan teknologi informasi, CRM adalah
sebuah strategi untuk mengoptimalkan customer lifetime value
dengan cara mengetahui lebih banyak mengenai informasi konsumen
dan berinteraksi dengan konsumen secara intensif (Todman, 2001)
2. Dari sisi komunikasi dan manajemen, CRM didefinisikan sebagai
sebuah pendekatan perusahaan untuk memahami dan memengaruhi
perilaku konsumen melalui komunikasi yang intensif dalam rangka
meningkatkan akuisisi konsumen, mempertahankan konsumen, dan
loyalitas konsumen (Swift, 2000)
3. Definisi CRM jika dilihat dari segi bisnis, dapat diartikan sebagai
sebuah strategi bisnis untuk memahami, mengantisipasi dan
mengelola kebutuhan konsumen yang potensial dalam suatu
organisasi pada saat sekarang dan yang akan datang (Brown, 2000).

Dari ketiga definisi di atas dapat ditarik kesimpulan mengenai definisi CRM
yaitu sebuah pendekatan yang komperehensif yang mengintegrasikan setiap
bisnis proses yang berhubungan langsung dengan konsumen, yaitu penjualan,
pemasaran dan layanan konsumen melalui integrasi filosofi, teknologi, dan
juga proses (Tama, 2009). Dengan kata lain, CRM dipandang bukanlah
sebagai sebuah produk ataupun sebuah layanan, tetapi sebuah filosofi bisnis
yang bertujuan memaksimalkan nilai konsumen dalam jangka panjang
(customer lifetime value).
16 Penerapan Data Mining Dalam Analytic CRM

3.3 Manfaat CRM


Meskipun sebagian besar manfaat CRM berbeda di setiap area bisnis, ada
beberapa manfaat yang umum bagi semua bisnis (Swift, 2000). Manfaat ini
umumnya adalah sebagai berikut (Alhaiou, 2011) :
• Biaya akuisisi pelanggan yang lebih rendah
• Peningkatan layanan pelanggan
• Retensi pelanggan dan peningkatan loyalitas
• Keuntungan pelanggan yang lebih tinggi
• Identifikasi yang lebih mudah dari pelanggan yang menguntungkan
dan
• Peningkatan produktivitas perusahaan.

Layanan pelanggan meningkat karena analisis proses yang dipromosikan oleh


CRM. Sebagai konsekuensi dari peningkatan layanan pelanggan, kepuasan
pelanggan meningkat dan pelanggan lebih loyal. Selain itu, loyalitas
meningkat karena perusahaan dapat menggunakan pengetahuan pelanggan
untuk mengembangkan program loyalitas (Crosby, 2002; Swift, 2000; Curry
dan Kkolou, 2004). Perusahaan dapat mengetahui pelanggan mana yang
diuntungkan, yang mana yang akan mendapat untung di masa depan dan mana
yang tidak akan pernah menguntungkan dengan analisis data pelanggan
(Kotler, 1999; Swift, 2000; Curry dan Kkolou, 2004). CRM juga mendorong
peningkatan produktivitas perusahaan karena memungkinkan integrasi semua
departemen perusahaan, seperti teknologi informasi, keuangan, dan sumber
daya manusia (Romano dan Fjermestad, 2003; Crosby, 2002; Kracklauer et al.,
2001).

3.4 Teknologi CRM


Sebuah definisi standar mengenai komponen teknologi CRM diberikan oleh
META Group di dalam “The Customer Relationship Management
Ecosystem”. Kategorisasi ini bertujuan untuk lebih memahami bagaimana
suatu strategi CRM dan teknologinya mampu menyediakan seluruh arsitektur
secara menyeluruh yang terfokus pada layanan konsumen.
Bab 3 Customer Relationship Management 17

Ada tiga tipe utama dari teknologi CRM yaitu (Tama, 2009) :
1. Operational CRM, mengacu pada komponen yang membantu
meningkatkan efisiensi operasi pelanggan sehari-hari (Peppers dan
Rogers, 2011). Berkaitan dengan otomatisasi proses yang melibatkan
komunikasi dan interaksi dengan pelanggan dan mengintegrasikan
front office, back office dan mobile phone. Komponen CRM ini
adalah produsen awal data dan termasuk fungsi perusahaan yang khas
dari otomasi penjualan, otomatisasi pemasaran perusahaan,
manajemen pesanan dan layanan atau dukungan pelanggan (Crosby
dan Johnson, 2001; Greenberg, 2004). Untuk memastikan
keberhasilan operasional CRM, perusahaan harus fokus pada
kebutuhan pelanggan dan karyawan harus memiliki keterampilan
yang tepat untuk memuaskan pelanggan. Keluaran dari solusi CRM
operasional biasanya hanya tingkat ringkasan, menunjukkan aktivitas
apa yang terjadi, tetapi gagal menjelaskan penyebab atau dampaknya
(Reynolds, 2002). Dengan perkembangan teknologi informasi dan
komunikasi yang pesat, operational CRM kemudian juga dapat
dibedakan menjadi dua bagian yaitu e-CRM dan m-CRM.
2. Collaborative CRM, merupakan pusat komunikasi yang menyediakan
koneksi antara perusahan dan pelanggan, pemasok dan mitra bisnis
sehingga memungkinkan untuk mengakses, mendistribusikan dan
berbagi data merupakan bentuk perluasan dari CRM tradisional.
Aplikasi utama dari collaborative CRM adalah enterprise portal yang
berbasis pada infrastruktur ekstranet dan perangkat lunak manajemen
hubungan mitra (partner relationship management software) yang
memberikan akses kepada konsumen, reseller, dan mitra bisnis
melalui internet. Layanan ini membuat kerja tim lebih mudah dan
lebih produktif, memungkinkan perusahaan untuk meningkatkan
proses dan kepuasan pelanggan (Greenberg, 2001)
3. Analytical CRM, di masa lalu, perusahaan berfokus pada operational
CRM dan collaborative CRM, tetapi kecenderungan ini tampaknya
berubah (Reynolds, 2002). Pengambil keputusan telah menyadari
bahwa analytical CRM diperlukan untuk mendorong strategi dan
18 Penerapan Data Mining Dalam Analytic CRM

keputusan taktis, terkait dengan identifikasi pelanggan, daya tarik,


pengembangan dan retensi. Analytical CRM difokuskan pada
menganalisis data yang dikumpulkan dan disimpan, untuk
menciptakan interaksi yang lebih bermakna dan menguntungkan
dengan pelanggan. Untuk mencapai tujuan ini data diolah,
diinterpretasikan dan dilaporkan menggunakan beberapa tools
(Greenberg, 2004). Pengambilan keputusan dilaksanakan setelah
melalui proses analisis, pemodelan, dan evaluasi terhadap data yang
tersimpan di basis data untuk menghasilkan sebuah hubungan yang
saling menguntungkan antara perusahaan dan konsumennya. Contoh
dari Analytical CRM adalah business intelligence seperti data
warehouse, OLAP, dan data mining.

Gambar 3.1: Analytical CRM Stages


Hal yang terpenting dalam memahami perilaku konsumen tidak hanya
memahami siapa mereka (dalam hal ini customer profiling atau segmentation)
tetapi juga perilaku mereka dan pola-pola (pattern) yang mereka ikuti.
Bab 3 Customer Relationship Management 19

Pemahaman perilaku pelanggan harus ditetapkan sebagai suatu proses yang


dinamis dan berkelanjutan (Xu dan Walton, 2005).

3.5 Data mining dalam Kerangka Kerja


CRM
Menurut Swift (2001), Parvatiyar dan Sheth (2001), serta Kracklauer, Mills,
dan Seifert (2004), CRM memiliki empat dimensi, yaitu :
1. Identifikasi konsumen (customer identification)

CRM dimulai dengan dimensi ini, juga disebut akuisisi pelanggan (Kracklauer
et al., 2004). Identifikasi pelanggan mencakup segmentasi pelanggan dan
menganalisis pelanggan yang menjadi target berdasarkan karakteristik mereka.
2. Membangun daya tarik terhadap konsumen (customer attraction)

Setelah mengidentifikasi dan menganalisis pelanggan yang menjadi target,


dilanjutkan dengan membangun daya tarik terhadap pelanggan dengan
penggunaan metoda komunikasi yang tepat. Seperti : membangun daya tarik
dari segi harga produk, langsung mengirim pesan kepada pelanggan terkait
promosi, dan lain-lain.
3. Mempertahankan konsumen yang ada (customer retention)

Dimensi ini adalah salah satu perhatian utama CRM. Menurut Kracklauer et al.
(2004), kepuasan pelanggan adalah masalah utama dalam retensi pelanggan.
Kepuasan pelanggan dapat didefinisikan sebagai perbandingan harapan
pelanggan (yang dihasilkan dari standar pribadi, citra perusahaan, pengetahuan
tentang alternatif, dan lain-lain) dengan persepsi (yang dihasilkan dari
pengalaman aktual, kesan subjektif dari kinerja produk, kesesuaian produk
atau layanan, dan lain-lain). Persepsi pelanggan tentang nilai yang ditawarkan
oleh perusahaan mengarah pada retensi pelanggan yang berkelanjutan. Selain
itu, pengalaman berbelanja yang berkualitas tinggi mengarah pada perasaan
emosional yang positif, yang memungkinkan perusahaan mencapai loyalitas
pelanggan yang diinginkan. Elemen dari dimensi CRM ini mencakup
pemasaran satu-ke-satu, program loyalitas dan bonus, dan manajemen
20 Penerapan Data Mining Dalam Analytic CRM

keluhan. Pemasaran satu-ke-satu melibatkan kampanye pemasaran yang


dipersonalisasi yang didukung oleh analisis, pendeteksian dan prediksi
perubahan dalam perilaku pelanggan (Chen et al., 2005a; Jiang dan Tuzhilin,
2006). Program loyalitas dan bonus melibatkan kampanye atau aktivitas
pendukung yang bertujuan untuk mempertahankan hubungan jangka panjang
dengan pelanggan. Contoh program loyalitas termasuk penilaian kredit,
kualitas layanan atau kepuasan dan analisis churn, yaitu analisis apakah
pelanggan cenderung pergi ke pesaing (Ngai et al., 2009).
4. Pengembangan konsumen (customer development)

Fokus utama dimensi ini adalah untuk meningkatkan intensitas transaksi, nilai
transaksi, dan profitabilitas pelanggan. Elemen utama pengembangan
pelanggan adalah analisis customer life time dan up/cross selling.

Gambar 3.2: CRM instruments. (Kracklauer et al., 2004)


Keempat dimensi dari CRM tersebut dapat dilihat sebagai siklus tertutup
dalam Customer Management System. Setiap dimensi memiliki tujuan umum
yang sama yaitu untuk membangun pemahaman yang lebih mendalam dari
konsumen dan meningkatkan nilai konsumen (customer value) dari
perusahaan. Dalam kaitannya dengan pencapaian tujuan tersebut, teknik data
mining dapat digunakan untuk menemukan karakteristik dan perilaku
konsumen yang tersembunyi dalam database yang berukuran besar. Untuk
Bab 3 Customer Relationship Management 21

menemukan pola karakteristik dan perilaku konsumen, dapat digunakan


metode pemodelan data dalam teknik data mining.
Beberapa metode pemodelan data yang dapat digunakan, yaitu :
1. Association
2. Classification
3. Clustering
4. Forecasting
5. Regression
6. Sequence discovery
7. Visualization

Kerangka kerja teknik data mining dalam keempat dimensi CRM dijelaskan
melalui Gambar 3.3.

Gambar 3.3: Kerangka Kerja Teknik Data Mining dalam CRM (Ngai dkk,
2008)
22 Penerapan Data Mining Dalam Analytic CRM

3.6 Customer Churn


Menurut Yu dkk (2011), Churn adalah saat di mana pelanggan memutuskan
untuk berpindah dari satu layanan kepada layanan lain dengan jasa/produk
yang sama. Permasalahan ini menjadi krusial yang harus dihadapi oleh
berbagai perusahaan dalam era ini, disamping itu menurut Khakabi dkk (2010)
untuk memperoleh pelanggan baru memerlukan biaya 10x lebih mahal dari
biaya untuk mempertahankan pelanggan yang ada.
Churn dibagi 3 jenis, yaitu :
1. Aktif / disengaja : pelanggan memutuskan untuk menghentikan
pembelian dan beralih ke perusahaan lain dengan alasan :
a Tidak ada pemahaman tentang layanan skema
b Tidak ada resolusi dari kesalahan
c Biaya terlalu tinggi
d Tidak ada imbalan loyalitas pelanggan
e Masalah privacy
2. Rotasi / Insidential : pelanggan menghentikan pembelian tanpa
bertujuan untuk berpindah ke perusahaan lain dengan alasan :
a Masalah financial
b Perubahan lokasi geografis pelanggan
c Pelanggan sudah tidak memerlukan produk / layanan yang
disediakan perusahaan.
3. Pasif : Pihak perusahaan menghentikan kontraknya dengan alasan
pelanggan tidak dapat melunasi tagihan.

3.7 Model RFM (Recency, Frequency,


Monetary)
Model RFM (Recency, Frequency, Monetary) adalah model berbasis perilaku
digunakan untuk menganalisis perilaku pelanggan dan kemudian membuat
prediksi berdasarkan perilaku database (Hughes, 2000). Model RFM ini
Bab 3 Customer Relationship Management 23

merupakan metode yang sudah lama dan populer untuk mengukur hubungan
dengan pelanggan (Schijns, 1996).
Model RFM diaplikasikan secara luas pada database pemasaran dan
merupakan tool yang umum digunakan untuk membangun strategi pemasaran
(Wei et al, 2010). RFM berdasarkan segmentasi pelanggan menghasilkan
kemampuan antara 75% sampai 85% (Hughes, 2000).
Berikut ini adalah penjelasan mengenai RFM menurut C.H.Cheng, Y.S Chen
(2009) :
1. Recency, yaitu kapan transaksi terakhir dilakukan.

Pelanggan yang baru saja melakukan transaksi pembelian dianggap lebih


mungkin menjadi pelanggan aktif dibandingkan pelanggan yang telah lama
melakukan transaksi (Wu and Cen, 2000). Menurut Chen et al (2005), pada
usaha retail, recency untuk kunjungan toko adalah dimensi yang paling penting
dari model RFM. Recency mewakili jumlah hari antara akhir periode analisis
dan tanggal transaksi terakhir. Untuk tujuan model training, recency of
churners adalah jumlah hari antara tanggal diklasifikasikannya seorang
pelanggan memiliki kecendrungan untuk churn dengan tanggal terakhir
transaksi pembelian.
2. Frequency, yaitu tingkat keseringan pelanggan melakukan transaksi.
Misalkan sekali transaksi tiap bulan, atau 2 kali dalam setahun.

Frequency adalah ukuran dari kekuatan hubungan antara pelanggan dan


perusahaan. Pelanggan yang loyal didefinisikan adalah pelanggan yang lebih
sering melakukan pembelian dibandingkan dengan pelanggan yang tidak loyal
(Kamakura et al, 1991). Menurut Berry dan Linoff (2004), frequency adalah
prediktor penting dari churn. Untuk tujuan model training, frequency of
churners adalah jumlah transaksi yang telah dilakukan dari tanggal
pengamatan sampai dengan tanggal terakhir transaksi pembelian.
3. Monetary, besarnya nilai transaksi yang dilakukan.

Monetary value adalah ukuran pengeluaran pelanggan pada perusahaan


tertentu. Menurut Schmittlein dan Peterson (1994), nilai moneter pembelian
masa lalu masing-masing pelanggan dapat menjadi prediktor penting dari
perilaku masa depan. Untuk tujuan model training, monetary of churners
24 Penerapan Data Mining Dalam Analytic CRM

adalah besarnya nilai transaksi pelanggan dari tanggal pengamatan sampai


dengan tanggal terakhir transaksi pembelian.

3.8 Segmentasi Pelanggan


Segmentasi adalah proses membagi pelanggan menjadi beberapa cluster
dengan kategori loyalitas pelanggan untuk membangun strategi pemasaran.
Segmentasi pelanggan dibagi menjadi 6 karakteristik berdasarkan nilai RFM
(Chorianopoulos, 2009) sebagai berikut:
Tabel 3.1: Kelas dan Karakteristik Pelanggan
Kelas Pelanggan Karakteristik
Superstar a. Pelanggan dengan loyalty yang tinggi
b. Mempunyai nilai monetary yang
tinggi
c. Mempunyai frekuensi yang tinggi.
d. Mempunyai transaksi paling tinggi.
Golden Customer a. Mempunyai nilai monetary tertinggi
yang kedua
b. Frekuensi yang tinggi
c. Mempunyai rata-rata transaksi
Typical customer Mempunyai rata-rata nilai monetary dan
rata-rata transaksi
Occational customer a. Nilai monetary terendah kedua setelah
dormant customer
b. Nilai recency paling rendah
c. Transaksi paling tinggi
Everyday Shopper a. Memiliki peningkatan transaksi
b. Transaksi yang rendah
c. Mempunyai nilai monetary sedang
sampai rendah
Dormant customer a. Mempunyai frekuensi dan monetary
yang paling rendah.
b. Nilai recency yang paling rendah.
Bab 4
Membangun Model Prediksi

4.1 Algoritma Naive Bayes


Naive bayes merupakan teknik prediksi berbasis probabilitas sederhana yang
berdasar pada penerapan aturan bayes dengan asumsi ketidaktergantungan
yang kuat. Selain itu Naive Bayes juga dapat menganalisa variabel-variabel
yang paling memengaruhinya dalam bentuk peluang (Prasetyo, 2012).
Berikut merupakan persamaan dari teorema Bayes.

Keterangan :
X : Data dengan class yang belum diketahui H : hipotesis data X
merupakan suatu class spesifik P(H|X): Probabilitas akhir
bersyarat suatu hipotesis H terjadi jika diberikan bukti X
terjadi
P(H) : Probabilitas awal (priori) hipotesis H terjadi tanpa
26 Penerapan Data Mining Dalam Analytic CRM

memandang bukti apapun


P(X|H) : Probabilitas sebuah bukti X terjadi akan memengaruhi hipotesis H.
P(X) : Probabilitas awal (priori) bukti X terjadi tanpa memandang
hipotesis/ bukti yang lain.

4.2 Confusion Matrix


Confusion Matrix adalah suatu metode yang biasanya digunakan untuk
melakukan perhitungan akurasi pada konsep data mining. Evaluasi dengan
confusion matrix menghasilkan nilai accuracy, precision, dan recall.
Tabel 4.1: Data Parsial dari Database Perusahaan Retail (a)

Kelas Hasil Prediksi (j)


fij
Kelas (+) Kelas (-)
Kelas Asli Kelas (+) TP (True Positive) FN (False Negative)
(i) Kelas (-) FP (False Positive) TN (True Negative)
Accuracy dalam klasifikasi adalah persentase ketepatan record data yang
diklasifikasikan secara benar setelah dilakukan pengujian pada hasil klasifikasi
(Han & Kamber, 2006). Sedangkan precision adalah proporsi kasus yang
diprediksi positif yang juga positif benar pada data yang sebenarnya. Recall
adalah proporsi kasus positif yang sebenarnya yang diprediksi positif secara
benar.
Rumusnya sebagai berikut :
1. Recall = TP / (TP + FN)
2. Precision = TP / (TP + FP)
3. Accuracy = (TP + TN) / (TP+FP+FN+TN)

Keterangan :
1. TP (True Positive) adalah jumlah record positif yang diklasifikasikan
sebagai positif
Bab 4 Membangun Model Prediksi 27

2. FP (False Positive) adalah jumlah record negatif yang


diklasifikasikan sebagai positif
3. FN (False Negative) adalah jumlah record positif yang
diklasifikasikan sebagai negative
4. TN (True Negative) adalah jumlah record negatif yang
diklasifikasikan sebagai negative

4.3 Rancangan Penelitian


Berikut ini adalah rancangan tahapan penelitian yang mengacu pada tahapan
CRISP-DM :

Gambar 4.1: Rancangan Penelitian


28 Penerapan Data Mining Dalam Analytic CRM

1. Business Understanding

Pada fase ini ada tiga tahap yang dilakukan, yaitu :


a. Pemahaman terhadap tujuan bisnis

Dalam aplikasinya pada perusahaan retail, perlu didahului dengan pemahaman


terhadap tujuan bisnis yang akan menentukan pola yang akan dicari dalam
proses data mining. Beberapa tujuan bisnis pada perusahaan retail yang
berkaitan dengan prediksi customer churn adalah :
• Mengetahui siapa saja pelanggan yang loyal dan pelanggan terbaik
• Mengetahui pelanggan mana yang berada dalam ambang churn
• Meningkatkan dan mempertahankan jumlah konsumen terutama
konsumen yang berpotensi untuk menjadi konsumen tetap
(pelanggan)
• Meningkatkan nilai penjualan terhadap melalui kegiatan cross-selling
(menawarkan item barang tambahan yang juga menjadi pelengkap
dari item barang utama yang akan dibeli) dan up-selling
(menawarkan item barang tambahan dengan promo khusus, misalnya
ada discount atau hadiah jika pembelian mencapai nilai tertentu,
sehingga nilai pembelian dari konsumen akan bertambah).

b. Penilaian situasi (situation assessment)

Melakukan penilaian situasi di perusahaan retail yang telah menggunakan


sistem informasi berbasis komputer dengan melakukan observasi seperti
berapa jumlah pelanggan, jumlah item barang, rata – rata jumlah transaksi
penjualan serta rata-rata omzet penjualan.
c. Menerjemahkan tujuan bisnis ke dalam tujuan data mining

Pada tahapan ini dibutuhkan pemahaman terhadap tujuan bisnis dan


menterjemahkannya ke dalam tujuan data mining. Salah satu tujuan dari data
mining untuk mendukung proses customer retention adalah membuat prediksi
customer churn. Hasil prediksi dapat digunakan oleh pihak manajemen untuk
upaya mengidentifikasi pelanggan, mempertahankan pelanggan dan
meningkatkan nilai penjualan.
Bab 4 Membangun Model Prediksi 29

2. Tinjauan Pustaka

Pada tahapan ini peneliti melakukan tinjauan pustaka yaitu mengumpulkan


dan mempelajari literature, buku, artikel, jurnal dan sebagainya yang diperoleh
dari berbagai sumber seperti perpustakaan, internet, dan lain-lain.
3. Data Understanding

Tahap ke tiga yaitu Data Understanding. Pada tahap ini dilakukan proses
pengumpulan data, kemudian melakukan analisa data serta melakukan
evaluasi kualitas data yang digunakan dalam penelitian ini. Dari proses
perijinan data yang diajukan, diperoleh data transaksi pelanggan selama 2
tahun sebesar 121.089 record.
4. Konstruksi Model

Menentukan konstruksi model dalam rancangan penelitian ini adalah


menentukan data window dan forecasting window. Data window adalah
kerangka waktu untuk variabel input yang digunakan untuk mengkonstruksi
model. Forecasting window adalah rentang waktu perilaku churn pelanggan
yang akan diprediksi.
Dalam penelitian ini, kerangka waktu yang digunakan untuk konstruksi model
data window di data latih adalah data transaksi pelanggan di tahun pertama
selama 9 bulan sedangkan rentang waktu perilaku churn pelanggan sebagai
forecasting window di data latih yang digunakan adalah data transaksi
pelanggan selama 3 bulan.
Pada data uji, kerangka waktu yang digunakan untuk konstruksi model data
window adalah data transaksi pelanggan di tahun kedua selama 9 bulan
sedangkan rentang waktu perilaku churn pelanggan sebagai forecasting
window yang digunakan adalah data transaksi pelanggan selama 3 bulan.
5. Data Preparation

Pada tahap ini data akan dipersiapkan sehingga mempermudah proses mining.
Proses preparation ini mencakup tiga hal utama yaitu :
a. Data Selection : Memilih data yang akan digunakan dalam proses
data mining. Dalam proses ini dilakukan juga pemilihan atribut-
atribut yang disesuaikan dengan proses data mining.
30 Penerapan Data Mining Dalam Analytic CRM

b. Data Preprocessing : Memastikan kualitas data yang telah dipilih


pada tahap data selection, pada tahap ini masalah yang harus dihadapi
adalah noisy data dan missing values. Proses pembersihan data
(cleansing) dilakukan dengan melakukan metode – metode query
sederhana untuk menemukan anomali-anomali data yang bisa saja
masih terdapat pada sistem.
c. Data Transformation: Mengelompokkan atribut-atribut atau field
yang telah terpilih menjadi 1 tabel dengan cara melakukan
denormalisasi dari basis data OLTP.

Tabel 4.2 berikut ini adalah hasil pemilihan atribut-atribut yang dibutuhkan
untuk proses prediksi, yaitu atribut-atribut yang terkait recency, frequency, dan
monetary.
Tabel 4.2: Data Parsial dari Database Perusahaan Retail (b)

Field Keterangan

KodePelanggan Kode pelanggan

TglBeliAkhir Menandakan recency, merupakan tanggal transaksi yang


dilakukan oleh pelanggan

FrekuensiBeli Menandakan frequency, merupakan jumlah transaksi


selama periode yang ditentukan

TotalBeli Menandakan monetary, merupakan jumlah uang selama


periode yang ditentukan
Dalam proses data preparation dibangun suatu data warehouse untuk
mempermudah proses mining. Data yang akan dilibatkan dalam penelitian ini
adalah data yang berkaitan dengan transaksi penjualan. Data set yang
digunakan dapat disesuaikan selama proses data mining, karena dimungkinkan
untuk kembali ke fase sebelumnya jika ada informasi dan pengetahuan yang
belum terungkap.
Pada tahap ini menghasilkan data latih selama 1 tahun (tahun pertama) dan
data uji selama 1 tahun (tahun kedua). Data latih dan data uji terdiri dari 2 jenis
window sesuai konstruksi model yang telah ditentukan yaitu data window dan
forecasting window.
Bab 4 Membangun Model Prediksi 31

Pada data latih, data window sebanyak 30.765 record, sedangkan forecasting
window sebanyak 17.915 record. Pada data uji, data window sebanyak 51.714
record, forecasting window sebanyak 14.511 record.
6. Modeling

Tahap pemodelan dalam penelitian ini terdiri dari 2 tahap yaitu pemodelan
untuk segmentasi pelanggan berbasis RFM dan pembangunan model untuk
prediksi customer churn menggunakan algoritma Naïve Bayes.
a. Segmentasi Pelanggan Berbasis RFM (Recency, Frequency,
Monetary)

Setelah tahap data preparation, akan dilakukan pemodelan berbasis model


RFM (recency, frequency, monetary) untuk identifikasi karakter pelanggan
sehingga membentuk segmentasi pelanggan. Dalam pembentukan model
RFM, diterapkan RFM skor satu sampai tiga (1- 3) pada domain nilai recency,
frequency, dan monetary di setiap pelanggan. Skor 3 adalah nilai tertinggi dan
skor 1 adalah nilai terendah. Skor akhir dihitung dari kombinasi setiap skor
pada atribut. Pemberian skor sendiri akan memudahkan proses segmentasi
pelanggan.
Nilai recency, frequency, monetary dibagi menjadi 3 bagian dengan nilai 3, 2
dan 1. Nilai recency dihitung berdasarkan tanggal transaksi terakhir atau
interval waktu transaksi terakhir dengan saat ini. Nasabah dengan tanggal
transaksi terbaru mempunyai nilai 3 sedangkan nasabah dengan tanggal
transaksi terjauh di masa lalu mempunyai nilai 1. Begitu juga dengan nilai
frequency, nasabah yang sering bertransaksi mempunyai nilai frequency yang
tinggi, yaitu 3. Sedangkan nasabah yang jarang bertransaksi mempunyai nilai
1. Nasabah yang mempunyai total nilai transaksi terbesar mempunyai nilai
monetary yang tinggi, dengan nilai 3. Sebaliknya nasabah yang mempunyai
total nilai transaksi terkecil mempunyai nilai monetary yang rendah yaitu 1.
Rentang skor dan domain nilai didapatkan dari hasil bagi 3 dari nilai atribut
terkecil ke nilai atribut tertinggi.
Skor dan domain nilai untuk atribut recency, frequency, monetary ditunjukkan
dalam Tabel 4.3 berikut ini :
32 Penerapan Data Mining Dalam Analytic CRM

Tabel 4.3: Skor dan Domain Nilai RFM

Atribut Skor Domain nilai

1 r > 150 hari


Recency 2 61 hari ≤ r ≤ 150 hari

3 0 ≤ r ≤ 60 hari

1 0 < f ≤ 30
Frequency 2 31 ≤ f ≤ 60
3 f > 60

Monetary 1 0 < m ≤ Rp. 1.500.000

2 Rp. 1.500.000 < m ≤ Rp. 3.500.000

3 m > Rp. 3.500.000


Setelah ditentukan skor dan domain nilai pada recency, frequency, dan
monetary maka akan didapatkan skor akhir RFM dan penentuan label
pelanggan.
Terdapat 27 (3×3×3) kombinasi skor akhir RFM. Skor akhir RFM yang
tertinggi adalah 333 dan yang terendah adalah 111. Nasabah dengan skor akhir
333 merupakan nasabah yang dengan tingkat keloyalan yang tinggi sedangkan
nasabah dengan skor akhir 111 merupakan nasabah dengan tingkat keloyalan
yang rendah. Hal tersebut ditampilkan pada Tabel 4.4 berikut ini :
Tabel 4.4: Skor Akhir RFM dan Label Pelanggan

Skor Skor Label


Kelas Akhir Pelanggan
Recency Frequency Monetary RFM

K1 3 1 1 311 Dormant D
K2 3 1 2 312 Dormant A

K3 3 1 3 313 Occational A
Bab 4 Membangun Model Prediksi 33

K4 3 2 1 321 Everyday D
K5 3 2 2 322 Golden D

K6 3 2 3 323 Superstar D

K7 3 3 1 331 Everyday A

K8 3 3 2 332 Golden A
K9 3 3 3 333 Superstar A

K10 2 1 1 211 Dormant E

K11 2 1 2 212 Dormant B

K12 2 1 3 213 Occational B


K13 2 2 1 221 Everyday E

K14 2 2 2 222 Golden E

K15 2 2 3 223 Superstar E


K16 2 3 1 231 Everyday B
K17 2 3 2 232 Golden B

K18 2 3 3 233 Superstar B

K19 1 1 1 111 Dormant F


K20 1 1 2 112 Dormant C

K21 1 1 3 113 Occational C

K22 1 2 1 121 Everyday F


K23 1 2 2 122 Golden F
K24 1 2 3 123 Superstar F

K25 1 3 1 131 Everyday C


34 Penerapan Data Mining Dalam Analytic CRM

K26 1 3 2 132 Golden C

K27 1 3 3 133 Superstar C


b. Pembangunan Model Prediksi Customer Churn

Model yang digunakan untuk membangun model prediksi customer churn


dalam penelitian ini adalah algoritma Naïve Bayes. Data hasil pemodelan
RFM masih dalam bentuk numerik, sedangkan pemodelan dengan algoritma
Naïve Bayes membutuhkan data berbentuk kategorikal, sehingga data hasil
pemodelan RFM harus di konversi ke dalam bentuk kategorikal. Berikut ini
klasifikasi atribut untuk nilai data hasil konversi yang akan digunakan untuk
memprediksi customer churn.
Tabel 4.5: Klasifikasi Atribut dengan Variabel Kategorikal

Atribut Skor Domain nilai Variabel


kategorikal

1 r > 150 hari Lama


Recency
2 61 hari ≤ r ≤ 150 hari Agak lama
3 0 ≤ r ≤ 60 hari Baru saja

1 0 < f ≤ 30 Jarang
Frequency 2 31 ≤ f ≤ 60 Agak sering
3 f > 60 Sering

1 0 < m ≤ Rp. 1.500.000 Rendah


2 Rp. 1.500.000 < m ≤ Rp. Sedang
Monetary
3.500.000

3 m > Rp. 3.500.000 Tinggi


Tabel 4.6 berikut menampilkan variabel kategorikal dan label pelanggan.
Bab 4 Membangun Model Prediksi 35

Tabel 4.6: Deskripsi Variabel Kategorikal dan Label Pelanggan

Skor Skor Label


Kelas Akhir pelanggan
Recency Frequency Monetary RFM

K1 Baru saja Jarang Rendah 311 Dormant D

K2 Baru saja Jarang Sedang 312 Dormant A


K3 Baru saja Jarang Tinggi 313 Occational A

K4 Baru saja Agak sering Rendah 321 Everyday D


K5 Baru saja Agak sering Sedang 322 Golden D

K6 Baru saja Agak sering Tinggi 323 Superstar D

K7 Baru saja Sering Rendah 331 Everyday A


K8 Baru saja Sering Sedang 332 Golden A

K9 Baru saja Sering Tinggi 333 Superstar A


K10 Agak Jarang Rendah 211 Dormant E
lama

K11 Agak Jarang Sedang 212 Dormant B


lama

K12 Agak Jarang Tinggi 213 Occational B


lama

K13 Agak Agak sering Rendah 221 Everyday E


lama

K14 Agak Agak sering Sedang 222 Golden E


lama

K15 Agak Agak sering Tinggi 223 Superstar E


lama
36 Penerapan Data Mining Dalam Analytic CRM

K16 Agak Sering Rendah 231 Everyday B


lama

K17 Agak Sering Sedang 232 Golden B


lama

K18 Agak Sering Tinggi 233 Superstar B


lama

K19 Lama Jarang Rendah 111 Dormant F

K20 Lama Jarang Sedang 112 Dormant C


K21 Lama Jarang Tinggi 113 Occational C

K22 Lama Agak sering Rendah 121 Everyday F


K23 Lama Agak sering Sedang 122 Golden F

K24 Lama Agak sering Tinggi 123 Superstar F


K25 Lama Sering Rendah 131 Everyday C
K26 Lama Sering Sedang 132 Golden C

K27 Lama Sering Tinggi 133 Superstar C


7. Evaluation

Tahap ketujuh adalah evaluation. Pada tahap ini dilakukan evaluasi dari model
yang digunakan, apakah model tersebut sudah mencapai tujuan yang ingin
dicapai. Evaluasi yang digunakan untuk mengukur tingkat akurasi kinerja
algoritma Naïve Bayes adalah confusion matrix.
8. Deployment

Pada penelitian ini, proses deployment adalah melakukan proses mining pada
seluruh database untuk prediksi customer churn dan evaluasi tingkat akurasi
kinerja Algoritma Naïve Bayes. Deployment dalam penelitian ini tidak
dilakukan proses integrasi dengan sistem yang telah ada karena menggunakan
program simulasi dengan XAMPP.
Bab 4 Membangun Model Prediksi 37

4.4 Sumber Data


Data yang digunakan berasal dari basis data Sistem Informasi Manajemen
Perusahaan Retail. Data yang tersimpan adalah data transaksi selama 2 tahun.
Data ini memiliki format Microsoft SQL Server 2008 dengan ukuran database
sekitar 250MB dengan jumlah record untuk table transaksi pelanggan
mencapai 121.100 record.

4.5 Instrumen Penelitian


Berikut ini adalah instrument yang digunakan untuk proses penelitian :
1. Perangkat Lunak

Perangkat lunak yang digunakan dalam perancangan sistem antara lain :


a. Sistem Operasi Windows 10
b. Microsoft Excel 2010
c. DBMS (Database Management System) Microsoft SQL Server 2008
d. XAMPP for Windows 32 bit 1.7.3
e. Notepad++ 7.5.1
2. Perangkat Keras

Perangkat keras yang digunakan dalam penelitian adalah komputer dengan


spesifikasi
a. Processor Intel Pentium P6100 @2.00 GHz
b. 4GB RAM
c. Harddisk 250 GB
d. VGA 320 MB
38 Penerapan Data Mining Dalam Analytic CRM
Bab 5
Hasil dan Pembahasan

5.1 Proses Segmentasi Pelanggan


dengan Model RFM
Proses segmentasi pelanggan dengan model RFM adalah persiapan data latih
dan data uji yang dibutuhkan untuk segmentasi pelanggan menggunakan
pemodelan RFM (recency, frequency, recency). Proses query database
menggunakan perangkat lunak Microsoft Query untuk ditransformasikan ke
dalam database yang akan diolah. Untuk mendapatkan atribut recency,
frequency, dan monetary, hasil query diolah kembali menggunakan perangkat
lunak Microsoft Excel 2010 dengan fasilitas Pivot Table. Gambar 5.1 berikut
menunjukkan pengolahan hasil query dalam bentuk pivot table.

Gambar 5.1: Pengolahan Data dengan Pivot Table


40 Penerapan Data Mining Dalam Analytic CRM

Data yang disajikan oleh Pivot Table diolah kembali untuk mendapatkan skor
RFM sesuai dengan domain nilai yang tercantum pada tabel 4.3. Gambar 5.2
di bawah ini menunjukkan data yang nilai setiap atributnya berupa skor RFM.

Gambar 5.2: Data Hasil Pemodelan RFM


Sesuai tabel 4.4, dari skor akhir RFM yang terbentuk, diperoleh 4 kelas
pelanggan yaitu Dormant (Dormant A, Dormant B, Dormant D, Dormant E,
Dormant F), Everyday (Everyday D & Everyday E), Golden (Golden A &
Golden D) dan Superstar (Superstar A & Superstar D).

5.2 Proses Pembangunan Model


Algoritma Naïve Bayes
Dalam proses pembangunan model Algoritma Naïve Bayes, data yang
digunakan adalah data latih dengan 4 kelas pelanggan. Masing – masing data
memiliki 3 atribut yaitu recency, frequency, monetary. Dalam tahap ini akan
dijelaskan bagaimana proses pembentukan model aturan dari algoritma Naïve
Bayes.
a. Konversi Data Latih dan Data Uji Algoritma Naïve Bayes

Setelah melakukan proses pengumpulan data latih dan data uji, maka lakukan
proses konversi nilai data atribut pada data latih dan data uji sesuai dengan
Bab 5 Hasil dan Pembahasan 41

klasifikasi atribut dengan variabel kategorikal yang sudah dijelaskan pada tabel
4.5. Pada tabel 5.1 hanya ditampilkan beberapa contoh data yang sudah
dilakukan proses konversi.
Tabel 5.1: Hasil Konversi Data Latih Dan Data Uji Algoritma Naïve Bayes

b. Penentuan Model Kriteria

Menentukan kriteria, nilai kriteria, jumlah data dari masing-masing kriteria dan
status dari masing – masing pelanggan yang berada dalam data latih. Hasil
perincian penentuan model kriteria Algoritma Naïve Bayes pada data latih
kelas pelanggan Dormant ditunjukkan dalam Tabel 5.2.
Tabel 5.2: Penentuan Model Kriteria Algoritma Naïve Bayes

KRITERIA NILAI STATUS JUMLAH


KRITERIA DATA

STATUS CHURN “YA”


Recency Baru saja Ya 494

Agak lama Ya 271

Lama Ya 340
Frequency Sering Ya 0

Agak sering Ya 0
42 Penerapan Data Mining Dalam Analytic CRM

Jarang Ya 1105

Monetary Tinggi Ya 0

Sedang Ya 9

Rendah Ya 1096
STATUS CHURN “TIDAK”

Recency Baru saja Tidak 2064


Agak lama Tidak 227

Lama Tidak 108

Frequency Sering Tidak 0


Agak sering Tidak 0

Jarang Tidak 2399


Monetary Tinggi Tidak 0

Sedang Tidak 132

Rendah Tidak 2267


Pada tabel 5.2 dapat dilihat model kriteria yang diperoleh dari data latih yang
digunakan. Model kriteria ini memberikan informasi jumlah data dari masing-
masing nilai kriteria dan status yang dimiliki oleh nilai kriteria tersebut.
c. Perhitungan Probabilitas

Setelah pembentukan model kriteria dari data latih, selanjutnya dilakukan


proses perhitungan probabilitas. Proses perhitungan probabilitas dilakukan
dengan menggunakan data uji. Dalam laporan ini, diambil contoh 1 data uji
serta dilakukan proses perhitungan sebagai berikut. Tabel 5.3 di bawah ini
menampilkan data uji yang digunakan.
Bab 5 Hasil dan Pembahasan 43

Tabel 5.3: Perhitungan Probabilitas Naïve Bayes – Contoh Data Uji

Proses perhitungan probabilitas algoritma Naïve Bayes memiliki 4 tahap,


yaitu:
1. Menghitung probabilitas masing-masing class/label
2. Menghitung jumlah kasus yang sama dengan class yang sama
3. Mengalikan semua variabel “Ya” dan “Tidak”
4. Membandingkan hasil class “Ya” dan “Tidak”

1. Menghitung probabilitas masing-masing class/label data latih kelas


pelanggan dormant

P(Y=YA) = 1105/3504 = 0.3154, Jumlah data “YA” pada kolom “Status


Churn” dibagi jumlah data.
P(Y=TIDAK) = 2399/3504 = 0.6846, Jumlah data “TIDAK” pada kolom
“Status Churn” dibagi jumlah data.
2. Menghitung Jumlah Kasus Yang Sama Dengan Class Yang Sama

P(RECENCY = BARU SAJA| Y= YA = 494/1105 = 0.4471, jumlah data


RECENCY dengan status churn “YA”, dibagi jumlah data YA.
P(RECENCY = BARU SAJA| Y= TIDAK = 2064/2399 = 0.8603, jumlah
data RECENCY dengan status churn “TIDAK”, dibagi jumlah data TIDAK.
P(FREQUENCY = JARANG| Y= YA = 1105/1105 = 1, jumlah data
FREQUENCY dengan status churn “YA”, dibagi jumlah data YA.
P(FREQUENCY = JARANG| Y= TIDAK = 2399/2399 = 1, jumlah data
FREQUENCY dengan status churn “TIDAK”, dibagi jumlah data TIDAK.
P(MONETARY = SEDANG | Y= YA = 9/1105 = 0.0081, jumlah data
MONETARY dengan status churn “YA”, dibagi jumlah data YA.
P(MONETARY = SEDANG | Y= TIDAK = 132/2399 = 0.0550, jumlah data
MONETARY dengan status churn “TIDAK”, dibagi jumlah data TIDAK.
44 Penerapan Data Mining Dalam Analytic CRM

3. Mengalikan Semua Variabel “Ya” dan “Tidak”

(P(RECENCY = BARU SAJA).


P(FREQUENCY.JARANG).P(MONETARY.SEDANG) | YA )
= 0.4471 × 1 × 0.0081 = 0.0036
(P(RECENCY = BARU SAJA).
P(FREQUENCY.JARANG).P(MONETARY.SEDANG)|TIDAK)
= 0.8603 × 1 × 0.0550 = 0.0473
4. Membandingkan Hasil Class “Ya” dan “Tidak”

Hasil (P|YA) dibandingkan dengan hasil (P|TIDAK), didapatkan hasil


(P|TIDAK) lebih besar dari hasil (P|YA) sehingga keputusan status churn pada
data uji adalah TIDAK
Tabel 5.4: Keputusan Status Churn pada Data Uji

ID_PEL RECENCY FREQUENCY MONETARY STATUS


CHURN
87863252140 Baru saja Jarang Sedang Tidak

d. Model Kriteria dan Frekuensi Kemunculan Nilai Atribut pada Data


Latih

Model kriteria Algoritma Naïve Bayes dan frekuensi kemunculan nilai atribut
untuk data latih kelas pelanggan everyday, golden, dan superstar akan
ditampilkan dalam tabel 5.5, tabel 5.6, tabel 5.7 di bawah ini.
Tabel 5.5: Model Kriteria Algoritma Naïve Bayes Data Latih Kelas Pelanggan
Everyday

KRITERIA NILAI STATUS JUMLAH


KRITERIA DATA
STATUS CHURN “YA”
Recency Baru saja Ya 5
Agak lama Ya 4
Bab 5 Hasil dan Pembahasan 45

Lama Ya 0
Frequency Sering Ya 1
Agak sering Ya 8
Jarang Ya 0
Monetary Tinggi Ya 0
Sedang Ya 0
Rendah Ya 9
STATUS CHURN “TIDAK”
Recency Baru saja Tidak 101
Agak lama Tidak 4
Lama Tidak 0
Frequency Sering Tidak 5
Agak sering Tidak 100
Jarang Tidak 0
Monetary Tinggi Tidak 0
Sedang Tidak 0
Rendah Tidak 105
Tabel 5.6: Model Kriteria Algoritma Naïve Bayes Data Latih Kelas Pelanggan
Golden

KRITERIA NILAI STATUS JUMLAH


KRITERIA DATA
STATUS CHURN “YA”
Recency Baru saja Ya 16
Agak lama Ya 0
Lama Ya 1
Frequency Sering Ya 8
46 Penerapan Data Mining Dalam Analytic CRM

Agak sering Ya 9
Jarang Ya 0
Monetary Tinggi Ya 0
Sedang Ya 17
Rendah Ya 0
STATUS CHURN “TIDAK”
Recency Baru saja Tidak 215
Agak lama Tidak 0
Lama Tidak 0
Frequency Sering Tidak 76
Agak sering Tidak 139
Jarang Tidak 0
Monetary Tinggi Tidak 0
Sedang Tidak 215
Rendah Tidak 0
Tabel 5.7: Model Kriteria Algoritma Naïve Bayes Data Latih Kelas Pelanggan
Superstar

KRITERIA NILAI STATUS JUMLAH


KRITERIA DATA
STATUS CHURN “YA”
Recency Baru saja Ya 4
Agak lama Ya 0
Lama Ya 0
Frequency Sering Ya 4
Agak sering Ya 0
Jarang Ya 0
Bab 5 Hasil dan Pembahasan 47

Monetary Tinggi Ya 4
Sedang Ya 0
Rendah Ya 0
STATUS CHURN “TIDAK”
Recency Baru saja Tidak 147
Agak lama Tidak 0
Lama Tidak 0
Frequency Sering Tidak 0
Agak sering Tidak 23
Jarang Tidak 0
Monetary Tinggi Tidak 147
Sedang Tidak 0
Rendah Tidak 0

5.3 Pengukuran Kinerja Algoritma Naïve


Bayes
Untuk mengetahui hasil kinerja algoritma, maka diperlukan sebuah metoda
untuk mengukur kinerja algoritma. Dalam penelitian ini, digunakan
perhitungan Confusion Matrix untuk mengukur kinerja algoritma Naïve
Bayes. Dalam perhitungan Confusion Matrix akan dicari nilai Recall,
Precision, dan Accuracy.
Dalam penelitian ini, nilai TP diperoleh dari jumlah data uji yang bertatus
churn “Tidak”, dan status churn-nya diprediksi “Tidak”. Nilai FP diperoleh
dari jumlah data uji yang berstatus churn “Ya”, tetapi diprediksi “Tidak”. Nilai
FN, diperoleh dari jumlah data uji yang berstatus churn “Tidak”, tetapi
diprediksi “Ya”. Nilai TN, diperoleh dari jumlah data uji yang berstatus churn
“Ya”, dan diprediksi “Ya”. Berikut ditampilkan Confusion Matrix dengan 4
kelompok hasil prediksi (Tabel 5.8).
48 Penerapan Data Mining Dalam Analytic CRM

Tabel 5.8: Confusion Matrix

Kelas Hasil Prediksi


Ya (+) Tidak (-)
Ya (+) TP (True Positive) FN (False Negative)
Kelas Asli
Tidak (-) FP (False Positive) TN (True Negative)
!"#$%& ()$%*++%* 𝒕𝒊𝒅𝒂𝒌 𝒄𝒉𝒖𝒓𝒏 6%*+ 78(9)78:;8 7)*+%* 𝒃𝒆𝒏𝒂𝒓
Recall =
>?@%$ A"#$%& ;)B)*%9*6% ()$%*++%* @87%: C&"9*

!"#$%& ()$%*++%* 𝒕𝒊𝒅𝒂𝒌 𝒄𝒉𝒖𝒓𝒏 6%*+ 78(9)78:;8 7)*+%* 𝒃𝒆𝒏𝒂𝒓


Precision =
>?@%$ A"#$%& ()$%*++%* 6%*+ 78(9)78:;8 @87%: C&"9*

!"#$%& ()$%*++%* 𝒄𝒉𝒖𝒓𝒏 7%* 𝒕𝒊𝒅𝒂𝒌 𝒄𝒉𝒖𝒓𝒏 6%*+ 78(9)78:;8 7)*+%* B)*%9
Accuracy = >?@%$ A"#$%& ()$%*++%* 7)*+%* :)%7%%* ;)B)*%9*6%

1. Proses Perhitungan Confusion Matrix Data Latih Kelas Pelanggan


Dormant

Tabel 5.9: Confusion Matrix Kelas Pelanggan Dormant - NB

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 1530 39
Kelas Asli 1569
Ya (- )= 715 505 210
Recall = 1530/(1530+39) * 100% = 97.51%
Precision = 1530/(1530+505) * 100% = 75.18%
Accuracy = (1530+210)/(1530+505+39+2101) = 76.18%
Sesuai tabel 5.9, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Dormant dengan total 2284 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 1530 kasus dari 1569 kasus yang sebenarnya positif
(Recall 97.51%).
Bab 5 Hasil dan Pembahasan 49

2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 1530 kasus dari 2035 kasus yang
diprediksi positif (Precision 75.18%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 1740 kasus
terdiri dari 1530 kasus positif dan 210 kasus negatif yang diprediksi
secara benar (Accuracy 76.18%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 544 kasus.

1. Proses Perhitungan Confusion Matrix Kelas Pelanggan Everyday

Tabel 5.10: Confusion Matrix Kelas Pelanggan Everyday – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 103 103 0
Kelas Asli
Ya (- ) = 1 1 0
Recall = 103/(103+0) * 100% = 100%
Precision = 103/(103+1) * 100% = 99.04%
Accuracy = (103+0)/(103+1+0+0) * 100% = 99.04%
Sesuai tabel 5.10, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Everyday dengan total 104 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 103 kasus dari 103 kasus yang sebenarnya positif
(Recall 100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 103 kasus dari 104 kasus yang
diprediksi positif (Precision 99.04%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 103 kasus terdiri
dari 103 kasus positif dan 0 kasus negatif yang diprediksi secara
benar (Accuracy 99.04%).
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 1 kasus.
50 Penerapan Data Mining Dalam Analytic CRM

3. Proses Perhitungan Confusion Matrix Kelas Pelanggan Golden

Tabel 5.11: Confusion Matrix Kelas Pelanggan Golden – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 256 256 0
Kelas Asli
Ya (- ) = 3 3 0
Recall = 256/(256+0) * 100% = 100%
Precision = 256/(256+3) * 100% = 98.84%
Accuracy = (256+0)/(256+3+0+0) * 100% = 98.84%
Sesuai tabel 5.11, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Golden dengan total 259 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 256 kasus dari 256 kasus yang sebenarnya positif
(recall 100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 256 kasus dari 259 kasus yang
diprediksi positif (precision 98.84%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 256 kasus terdiri
dari 256 kasus positif dan 0 kasus negatif yang diprediksi secara
benar (accuracy 98.84%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 3 kasus.

4. Proses Perhitungan Confusion Matrix Kelas Pelanggan Superstar

Tabel 5.12: Confusion Matrix Kelas Pelanggan Superstar – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 182 175 7
Kelas Asli
Ya (- ) = 1 1 0
Bab 5 Hasil dan Pembahasan 51

Recall = 175/(175+7) * 100% = 96.15%


Precision = 175/(175+1) * 100% = 99.43%
Accuracy = (175+0)/(175+1+7+0) * 100% = 95.63%
Sesuai tabel 5.12, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Superstar dengan total 183 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 175 kasus dari 182 kasus yang sebenarnya positif
(Recall 96.15%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 175 kasus dari 176 kasus yang
diprediksi positif (Precision 99.43%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 175 kasus terdiri
dari 175 kasus positif dan 0 kasus negatif yang diprediksi secara
benar (Accuracy 95.63%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 8 kasus.

5. Proses Perhitungan Confusion Matrix Data Uji Gabungan Semua


Kelas Pelanggan

Tabel 5.13: Confusion Matrix Data Uji Gabungan – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 2023 86
Kelas Asli 2110
Ya (- ) = 720 381 340
Recall = 2023/(2023+86) * 100% = 95.92%
Precision = 2023/(2023+381) * 100% = 84.15%
Accuracy = (2023+340)/(2023+381+86+340) * 100% = 83.49%
Sesuai tabel 5.13, hasil kinerja algoritma Naïve Bayes pada data gabungan
semua kelas pelanggan dengan total 2830 kasus adalah sebagai berikut :
52 Penerapan Data Mining Dalam Analytic CRM

1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar


adalah sebanyak 862 kasus dari 1211 kasus yang sebenarnya positif
(Recall 95.92%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 862 kasus dari 923 kasus yang
diprediksi positif (Precision 84.15%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 2363 kasus
terdiri dari 2023 kasus positif dan 340 kasus negatif yang diprediksi
secara benar (Accuracy 83.49%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 467 kasus.

5.4 Hasil Kinerja Algoritma pada Kelas


Pelanggan Berpotensi Churn
Menganalisa hasil perhitungan recall, precision dan accuracy dari Algoritma
Naïve Bayes dapat disimpulkan bahwa kelas pelanggan yang berpotensi churn
adalah kelas pelanggan dormant. Untuk mengetahui lebih detail bagaimana
karakter pelanggan dormant yang berpotensi churn, perlu dilakukan
perhitungan recall, precision dan accuracy pada masing-masing label
pelanggan dormant A, dormant B, dormant D, dormant E dan dormant F.
1. Proses Perhitungan Confusion Matrix Kelas Pelanggan Dormant A

Tabel 5.14: Confusion Matrix Kelas Pelanggan Dormant A – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 64 64 0
Kelas Asli
Ya (- ) = 1 1 0
Recall = 64/(64+0) * 100% = 100%
Precision = 64/(64+1) * 100% = 98.46%
Accuracy = (64+0)/(64+1+0+0) * 100% = 98.46%
Bab 5 Hasil dan Pembahasan 53

Sesuai tabel 5.14, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Dormant A dengan total 65 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 64 kasus dari 64 kasus yang sebenarnya positif
(Recall 100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 64 kasus dari 65 kasus yang
diprediksi positif (Precision 98.46%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 64 kasus terdiri
dari 64 kasus positif dan 0 kasus negatif yang diprediksi secara benar
(Accuracy 98.46%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 1 kasus.

2. Proses Perhitungan Confusion Matrix Kelas Pelanggan Dormant B

Tabel 5.15: Confusion Matrix Kelas Pelanggan Dormant B – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 1 1 0
Kelas Asli
Ya (- ) = 5 5 0
Recall = 1/(1+0) * 100% = 100%
Precision = 1/(1+5) * 100% = 16.67%
Accuracy = (1+0)/(5+1+0+0) * 100% = 16.67%
Sesuai tabel 5.15, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Dormant B dengan total 6 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 1 kasus dari 1 kasus yang sebenarnya positif (Recall
100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 1 kasus dari 6 kasus yang diprediksi
positif (Precision 16.67%).
54 Penerapan Data Mining Dalam Analytic CRM

3. Jumlah kasus yang tepat diprediksi adalah sebanyak 1 kasus terdiri


dari 1 kasus positif dan 0 kasus negatif yang diprediksi secara benar
(Accuracy 16.67%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 5 kasus.

3. Proses Perhitungan Confusion Matrix Kelas Pelanggan Dormant D

Tabel 5.16: Confusion Matrix Kelas Pelanggan Dormant D – Naïve Bayes

Kelas Hasil Prediksi


Tidak (+) Ya (-)
Tidak (+) = 709 709 0
Kelas Asli
Ya (- ) = 185 185 0
Recall = 709/(709+0) * 100% = 100%
Precision = 709/(709+185) * 100% = 79.31%
Accuracy = (709+0)/(709+185+0+0) * 100% = 79.31%
Sesuai tabel 5.16, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Dormant D dengan total 894 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 709 kasus dari 709 kasus yang sebenarnya positif
(Recall 100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 709 kasus dari 894 kasus yang
diprediksi positif (Precision 79.31%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 709 kasus terdiri
dari 709 kasus positif dan 0 kasus negatif yang diprediksi secara
benar (Accuracy 79.31%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 185 kasus.
Bab 5 Hasil dan Pembahasan 55

4. Proses Perhitungan Confusion Matrix Kelas Pelanggan Dormant E

Tabel 5.17: Confusion Matrix Kelas Pelanggan Dormant D – Naïve Bayes


Kelas Hasil Prediksi
Tidak (+) Ya (-)
Tidak (+) = 47 47 0
Kelas Asli
Ya (- ) = 129 129 0
Recall = 47/(47+0) * 100% = 100%
Precision = 47/(47+129) * 100% = 26.70%
Accuracy = (47+0)/(47+129+0+0) * 100% = 26.70%
Sesuai tabel 5.17 hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Dormant E dengan total 176 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 47 kasus dari 47 kasus yang sebenarnya positif
(Recall 100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 47 kasus dari 176 kasus yang
diprediksi positif (Precision 26.70%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 47 kasus terdiri
dari 47 kasus positif dan 0 kasus negatif yang diprediksi secara benar
(Accuracy 26.70%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 129 kasus.

5. Proses Perhitungan Confusion Matrix Kelas Pelanggan Dormant F

Tabel 5.18: Confusion Matrix Kelas Pelanggan Dormant F – Naïve Bayes


Kelas Hasil Prediksi
Tidak (+) Ya (-)
Tidak (+) = 39 0 39
Kelas Asli
Ya (- ) = 210 0 210
56 Penerapan Data Mining Dalam Analytic CRM

Recall = 0/(0+39) * 100% = 0%


Precision = 0/(0+0) * 100% = 0%
Accuracy = (0+210)/(39+210+0+0) * 100% = 84.34%
Sesuai tabel 5.18, hasil kinerja algoritma Naïve Bayes pada data kelas
pelanggan Dormant F dengan total 249 kasus adalah sebagai berikut :
1. Proporsi kasus positif yang sebenarnya diprediksi positif secara benar
adalah sebanyak 0 kasus dari 39 kasus yang sebenarnya positif
(Recall 100%).
2. Proporsi kasus yang diprediksi positif yang juga positif benar pada
data yang sebenarnya sebanyak 0 kasus dari 0 kasus yang diprediksi
positif (Precision 0%).
3. Jumlah kasus yang tepat diprediksi adalah sebanyak 210 kasus terdiri
dari 0 kasus positif dan 210 kasus negatif yang diprediksi secara
benar (Accuracy 84.34%)
4. Jumlah kasus yang diprediksi dengan tidak tepat sebesar 39 kasus.

5.5 Analisis Kinerja Algoritma


Hasil kinerja algoritma Naïve Bayes dapat dilihat dari proses perhitungan
confusion matrix pada setiap kelas pelanggan, diperoleh hasil kinerja berupa
precision, recall dan accuracy, seperti berikut ini:
Bab 5 Hasil dan Pembahasan 57

Chart Title
120%
100%
80%
60%
Recall
40%
Precision
20%
0% Accuracy
Dormant Everyday Golden Superstar
Recall 98% 100% 100% 96%
Precision 75.18% 99.04% 98.84% 99.43%
Accuracy 76.18% 99.04% 98.84% 95.63%

Gambar 5.3: Grafik Kinerja Algoritma Naïve Bayes di semua kelas


pelanggan

120%
100%
80%
60%
40% Recall

20% Precision
Accuracy
0%
Dormant Dormant Dormant Dormant Dormant
A B D E F
Recall 100% 100% 100% 100% 0%
Precision 98.46% 16.67% 79.31% 26.70% 0%
Accuracy 98.46% 16.67% 79.31% 26.70% 84.34%

Gambar 5.4: Grafik Kinerja Algoritma Naïve Bayes di Kelas Dormant


Akurasi dari algoritma Naïve Bayes dalam memprediksi pelanggan churn
ataupun tidak churn cukup baik dengan hasil 76.18% di kelas dormant,
99.04% di kelas everyday, 98.84% di kelas golden dan 95.63% di kelas
58 Penerapan Data Mining Dalam Analytic CRM

superstar. Sedangkan kinerja algoritma Naïve Bayes dalam memprediksi


pelanggan churn ataupun tidak churn di masing – masing kelas dormant sangat
rendah di kelas dormant B sebesar 16.67% dan dormant E sebesar 26.70%.

5.6 Analisis Customer Retention dan


Customer Churn
a. Untuk mengetahui pelanggan potensial dalam rangka
mempertahankan pelanggan (customer retention)

Dilihat dari hasil perhitungan recall yang sangat baik di semua kelas (gambar
5.1) dapat dianalisa bahwa sebagian besar pelanggan dari kelas dormant,
everyday, golden, dan superstar yang tidak churn diprediksi tidak churn
(pelanggan potensial/loyal) sehingga divisi CRM perlu memiliki strategi yang
tepat untuk mempertahankan pelanggan sehingga keseluruhan pelanggan dari
ke-empat kelas tersebut dapat tetap berlangganan.
b. Untuk mengetahui pelanggan yang berpotensi churn

Kelas dormant adalah kelas pelanggan yang memiliki karakter recency,


frequency, dan monetary yang paling rendah dibandingkan kelas pelanggan
lain sehingga perlu ditelaah bagaimana potensi setiap pelanggan di masing –
masing kelas dormant. Dari hasil perhitungan recall pada gambar 5.2, dapat
dilihat bahwa pelanggan di kelas dormant F adalah pelanggan yang diprediksi
untuk churn. Karakteristik pelanggan di kelas dormant F adalah pelanggan
yang memiliki karakteristik paling buruk dari keseluruhan kelas pelanggan
yaitu memiliki recency “lama”, frequency “jarang” dan monetary “rendah”.
Dari hal tersebut divisi CRM perlu mengambil langkah tepat agar pelanggan di
kelas dormant F tidak berpindah ke perusahaan lain (churn) tetapi tetap
memperhatikan berapa jumlah pelanggan di kelas dormant F dan juga biaya
untuk mempertahankan. Jika jumlah pelanggan di dormant F sedikit dan biaya
yang dikeluarkan tidak sesuai maka mungkin sebaiknya divisi CRM lebih
berfokus untuk mempertahankan pelanggan kelas lain yang memiliki jumlah
besar.
Bab 6
Penutup

6.1 Kesimpulan
Berdasarkan hasil yang didapat dari penelitian ini maka dapat disimpulkan
sebagai berikut :
1. Dari proses segmentasi pelanggan menggunakan pemodelan RFM
(recency, frequency, monetary) dapat diketahui karakteristik
pelanggan yang dimiliki yaitu kelas dormant, everyday, golden dan
superstar.
2. Jumlah pelanggan terbesar yang dimiliki selama 2 tahun berada di
kelas dormant yaitu pelanggan dengan karakteristik yang memiliki
nilai recency, frequency, dan monetary yang rendah.
3. Jumlah pelanggan terkecil dimiliki selama 2 tahun berada di kelas
everyday yaitu pelanggan dengan karakteristik yang memiliki
peningkatan transaksi dan kategori nilai monetary rendah atau
sedang.
4. Akurasi dari algoritma Naïve Bayes dalam memprediksi pelanggan
churn ataupun tidak churn cukup baik dengan hasil 76.18% di kelas
60 Penerapan Data Mining Dalam Analytic CRM

dormant, 99.04% di kelas everyday, 98.84% di kelas golden dan


95.63% di kelas superstar.
5. Sedangkan kinerja algoritma Naïve Bayes dalam memprediksi
pelanggan churn ataupun tidak churn di masing – masing kelas
dormant sangat rendah di kelas dormant B sebesar 16.67% dan
dormant E sebesar 26.70%.
6. Dari hasil prediksi dan keadaan sebenarnya dapat disimpulkan bahwa
hampir sebagian besar pelanggan di semua kelas (dormant, everyday,
golden, dan superstar) adalah pelanggan potensial yang patut
dipertahankan.
7. Pelanggan dengan label dormant F adalah pelanggan yang paling
berpotensi untuk churn.
8. Dilihat dari kelas pelanggan yang paling berpotensi churn yaitu kelas
dormant F yang memiliki karakteristik recency “lama”, frequency
“jarang” dan monetary “rendah”, dapat dianalisa bawah ketiga atribut
recency, frequency dan monetary adalah atribut yang saling
berpengaruh kuat terhadap potensi churn pelanggan.
9. Divisi CRM perusahaan retail perlu melakukan program
mempertahankan pelanggan (customer retention) terhadap kelas –
kelas pelanggan yang memiliki potensi kuat untuk tetap loyal.

6.2 Saran
Dari hasil pembahasan penelitian ini maka dapat diberikan saran-saran
sebagai berikut :
1. Model segmentasi pelanggan dan prediksi dapat mempertimbangkan
variabel – variabel lainnya seperti lamanya berlangganan, data
demografi pelanggan maupun data dari kompetitor seperti harga dan
jenis produk yang ditawarkan oleh kompetitor. Dengan adanya
variabel tambahan diharapkan hasil segmentasi pelanggan dan hasil
prediksi dapat lebih akurat.
Bab 6 Penutup 61

2. Untuk penelitian berikutnya, memprediksi customer churn dapat


menggunakan algoritma klasifikasi lainnya seperti Artificial Neural
Network, Support Vector Machine, Nearest Neighbor, dan lain-lain.
Dengan harapan hasil kinerja algoritma lainnya dapat dibandingkan
dengan hasil kinerja algoritma pada penelitian ini.
62 Penerapan Data Mining Dalam Analytic CRM
Daftar Pustaka

Alhaiou, T. (2011). A study on the relationship between E-CRM features and


e-loyalty: The case in UK. PhD thesis, Brunel Business School.
Ariana, A. G. B. (2011). Customer Segmentation Dengan Metode Self
Organizing Map (Studi Kasus: UD. Fenny). Neuron, 2(1), 1-7.
Berry, M. J., & Linoff, G. S. (2004). Data mining techniques: for marketing,
sales, and customer relationship management. John Wiley & Sons.
Bose, R. (2002). Customer relationship management: key components for IT
success. Industrial management & Data systems.
Buckinx, W., & Van den Poel, D. (2005). Customer base analysis: partial
defection of behaviourally loyal clients in a non-contractual FMCG retail
setting. European journal of operational research, 164(1), 252-268.
Burez, J., & Van den Poel, D. (2009). Handling class imbalance in customer
churn prediction. Expert Systems with Applications, 36(3), 4626-4636.
Chen, M. C., Chiu, A. L., & Chang, H. H. (2005). Mining changes in customer
behavior in retail marketing. Expert Systems with Applications, 28(4),
773-781.
Chorianopoulos, A. (2016). Effective CRM using predictive analytics. John
Wiley & Sons.
Crosby, L. A., & Johnson, S. L. (2001). Technology: Friend or foe to customer
relationships?. Marketing Management, 10(4), 10.
Curry, A., & Kkolou, E. (2004). Evaluating CRM to contribute to TQM
improvement–a cross-case comparison. The TQM Magazine.
Gorunescu, F. (2011). Data Mining: Concepts, models and techniques (Vol. 12).
Springer Science & Business Media.
Govindaraju, R., Simatupang, T., & Samadhi, T. A. (2009). Perancangan Sistem
Prediksi Churn Pelanggan PT. Telekomunikasi Seluler dengan
Memanfaatkan Proses Data Mining. Jurnal Informatika, 9(1), 33-42.
62 Penerapan Data Mining Dalam Analytic CRM

Hollander, S. C., Rassuli, K. M., Jones, D. B., & Dix, L. F. (2005). Periodization
in marketing history. Journal of Macromarketing, 25(1), 32-41.
Jiang, T., & Tuzhilin, A. (2006). Segmenting customers from population to
individuals: Does 1-to-1 keep your customers forever?. IEEE
Transactions on knowledge and data engineering, 18(10), 1297-1311.
Kamakura, W. A., Ramaswami, S. N., & Srivastava, R. K. (1991). Applying
latent trait analysis in the evaluation of prospects for cross-selling of
financial services. international Journal of Research in Marketing, 8(4),
329-349.
Klepac, G., Kopal, R., & Mrsic, L. (2014). Developing churn models using data
mining techniques and social network analysis. Information Science
Reference.
Kracklauer, A. H., Mills, D. Q., & Seifert, D. (2004). Collaborative customer
relationship management: taking CRM to the next level. Springer Science
& Business Media.
Kracklauer, A., Passenheim, O., & Seifert, D. (2001). Mutual customer
approach: how industry and trade are executing collaborative customer
relationship management. International Journal of Retail & Distribution
Management.
Kurtz, D. L., & Boone, L. E. (2008). Contemporary business. Cengage
Learning.
Liu, Y., & Zhuang, Y. (2015). Research model of churn prediction based on
customer segmentation and misclassification cost in the context of big
data. Journal of Computer and Communications, 3(06), 87.
Miguéis, V. L., Van den Poel, D., Camanho, A. S., & e Cunha, J. F. (2012).
Predicting partial customer churn using Markov for discrimination for
modeling first purchase sequences. Advances in Data Analysis and
Classification, 6(4), 337-353.
Murphy, E. C., & Murphy, M. A. (2002). Leading on the edge of chaos: The 10
critical elements for success in volatile times. Prentice Hall.
Ngai, E. W., Xiu, L., & Chau, D. C. (2009). Application of data mining
techniques in customer relationship management: A literature review and
classification. Expert systems with applications, 36(2), 2592-2602.
Daftar Pustaka 63

Nugraheni, Y. (2013). Data Mining Using Fuzzy Method for Customer


Relationship Management in Retail Industry. Lontar Komputer, 4(1),
2088-1541.
Oliveira, V. L. M. (2012). Analytical customer relationship management in
retailing supported by data mining techniques.
Parvatiyar, A., & Sheth, J. N. (2001). Customer relationship management:
Emerging practice, process, and discipline. Journal of Economic & Social
Research, 3(2).
Peel, J., & Gancarz, M. (2002). CRM: redefining customer relationship
management. Digital press.
Peppers, D., & Rogers, M. (2004). Managing customer relationships: A strategic
framework. John Wiley & Sons.
Prasetyo, E. (2012). Data mining konsep dan aplikasi menggunakan matlab.
Yogyakarta: Andi.
Prasetyo, E. (2014). DATA MINING Mengolah Data Menjadi Informasi
Menggunakan Matlab. In penerbit andi.
Rahimi, R. (2008). Feasibility study of application and implimantation of
customer relationship management (CRM) in hotel industry.
Reynolds, J. (2002). A practical guide to CRM: building more profitable
customer relationships. CRC Press.
Romano, N. C., & Fjermestad, J. (2003). Electronic commerce customer
relationship management: A research agenda. Information technology
and management, 4(2-3), 233-258.
Swift, R. S. (2001). Accelerating customer relationships: Using CRM and
relationship technologies. Prentice Hall Professional.
Tan, P. N., Steinbach, M., & Kumar, V. (2006). Introduction to data mining,
Pearson education. Inc., New Delhi.
Wardani, N. W., & Ariasih, N. K. (2019). Analisa Komparasi Algoritma
Decision Tree C4. 5 dan Naïve Bayes untuk Prediksi Churn Berdasarkan
Kelas Pelanggan Retail. International Journal of Natural Science and
Engineering, 3(3), 103-112.
64 Penerapan Data Mining Dalam Analytic CRM

Wardani, N. W., Dantes, G. R., & Indrawan, G. (2018). Prediksi Customer


Churn dengan Algoritma Decision Tree C4. 5 Berdasarkan Segmentasi
Pelanggan untuk Mempertahankan Pelanggan pada Perusahaan Retail.
Jurnal RESISTOR (Rekayasa Sistem Komputer), 1(1), 16-24.
Wu, C., & Chen, H. L. (2000). Counting your customers: Compounding
customer’s in-store decisions, interpurchase time and repurchasing
behavior. European Journal of Operational Research, 127(1), 109-119.

Anda mungkin juga menyukai