TINJAUAN PUSTAKA
2.1 Pendahuluan
Data Mining atau pertambangan data adalah suatu aplikasi database yang
memiliki kemampuan pencarian data yang menggunakan statistikal algoritma
untuk menemukan pola dan korelasi dalam data. Data mining dapat
menemukan informasi yang berada di gudang data dalam perusahaan. Data
mining mempunyai pola dan hubungan yang menggambarkan langkah-
langkah yang harus diambil untuk memastikan hasil yang tepat. Software
data mining bertujuan untuk mengetahui bisnis, memahami data dan
membantu analis bisnis untuk menghasilkan hipotesis.
Manajemen hubungan pelanggan atau disebut juga Customer Relationship
Management (CRM) adalah sebuah sistem informasi yang digunakan untuk
merencanakan, menjadwalkan, dan mengendalikan aktivitas-aktivitas
prapenjualan dan pascapenjualan dalam sebuah organisasi. Hal ini
melingkupi semua aspek perusahaan yang berhubungan dengan calon
pelanggan.
Manajemen hubungan pelanggan juga mencakup pengembangan yang
menawarkan produk untuk dijual pada pelanggan. Dalam penjualan,
perusahaan menggunakan manajemen pemasaran untuk menargetkan
peningkatan efektivitas pemasaran. Tujuan dari manajemen hubungan
pelanggan adalah meningkatkan pertumbuhan jangka panjang dan
profitabilitas perusahaan melalui pengertian terhadap kebiasaan dan perilaku
(behavior) pelanggan. Sumber data manajemen hubungan pelanggan ini dapat
diperoleh melalui survei pelanggan dari pemberian pertanyaan, serta perilaku
data yang terdapat dalam sistem transaksi.
Kemajuan teknologi zaman sekarang membuat hubungan pemasaran lebih
maju, sehingga hubungan perusahaan dengan pelanggan menjadi pusat
Pada data warehouse, data yang tersimpan adalah data historis dalam kurun
waktu tertentu, bukan data terkini. Oleh karena itu data yang tersimpan
mengandung keterangan waktu, misalnya tanggal, minggu, bulan, catur
wulan, dan sebagainya. Karakteristik time variant pada data warehouse
memiliki karakteristik sebagai berikut :
a. Melakukan analisa terhadap hal di masa lalu.
b. Mencari hubungan antara informasi dengan keadaan saat ini.
c. Melakukan prediksi hal yang akan datang.
4 Non-volatile.
Data dalam sistem operasional dapat di-update sesuai transaksi bisnis. Setiap
kali terjadi transaksi bisnis. Namun dalam data warehouse, data tidak dapat
diubah karena bersifat read only.
Arsitektur data warehouse (gambar 2.1) mencakup proses ETL
(Extraction, Transformation, Loading) untuk memindahkan data dari
operational data source dan sumber data eksternal lainnya ke dalam data
warehouse . Data warehouse dapat dibagi menjadi beberapa data mart,
berdasarkan fungsi bisnisnya (contoh data mart untuk penjualan, pemasaran,
dan keuangan). Data dalam data warehouse dan data mart diatur oleh satu
atau lebih server yang mewakili multidimensional view dari data terhadap
berbagai front end tool, seperti query tools, analysis tools, report writers, dan
data mining tools.
Data mining adalah serangkaian proses untuk menggali nilai tambah berupa
informasi yang selama ini tidak diketahui secara manual dari suatu basisdata.
Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan
mengenali pola yang penting atau menarik dari data yang terdapat dalam
basisdata.
Data mining terutama digunakan untuk mencari pengetahuan yang
terdapat dalam data base yang besar sehingga sering disebut Knowledge
Discovery in Databases (KDD). Proses pencarian pengetahuan ini
menggunakan berbagai teknik-teknik pembelajaran komputer (machine
learning) untuk menganalisis dan mengekstraksikannya. Proses pencarian
bersifat iteratif dan interaktif untuk menemukan pola atau model yang sahih,
baru, bermanfaat, dan dimengerti. Dalam penerapannya data mining
memerlukan berbagai perangkat lunak analisis data untuk menemukan pola
dan relasi data agar dapat digunakan untuk membuat prediksi dengan akurat.
Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu sudut
pandang komersial dan sudut pandang keilmuan. Dari sudut pandang
komersial, pemanfaatan data mining dapat digunakan dalam menangani
meledaknya volume data. Bagaimana mana menyimpannya, mengestraknya
serta memanfaaatkannya. Berbagai teknik komputasi dapat digunakan
menghasilkan informasi yang dibutuhkan. Informasi yang dihasilkan menjadi
asset untuk meningkatkan daya saing suatu institusi.
Data mining tidak hanya digunakan untuk menangani persoalan
menumpuknya data / informasi dan bagaimana menggudangkannya tanpa
kehilangan informasi yang penting (warehousing). Data mining juga
diperlukan untuk menyelesaikan permasalahan atau menjawab kebutuhan
bisnis itu sendiri, misalnya:
Bagaimana mengetahui hilangnya pelanggan karena pesaing
Data mining merupakan salah satu metode alternatif yang dapat digunakan
untuk mengolah data mentah, ketika metode konvensional tidak fisibel untuk
dilakukan karena besarnya volume data yang diolah. Hal ini dapat terjadi
karena data mining memiliki kemampuan mereduksi data baik melalui teknik
katalogisasi, klasifikasi maupun segementasi.
2.3.5 Fungsi-fungsi
Fungsi-fungsi yang umum diterapkan dalam data mining (Haskett, 2000):
Assosiation, adalah proses untuk menemukan aturan assosiatif antara
suatu kombinasi item dalam suatu waktu
Secuence, hampir sama dengan association bedanya seccuence
diterapkan lebih dari satu periode.
Clastering, adalah proses pengelompokan sejumlah data / obyek ke
dalam kelompok-kelompok data (klaster) sehingga setiap klaster akan
berisi data yang saling mirip.
Classification, adalah proses penemuan model atau fungsi yang
menjelaskan atau membedakan konsep atau kelas data, dengan tujuan
untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak
diketahui.
Sebagai cabang ilmu baru di bidang komputer cukup banyak penerapan yang
dapat dilakukan oleh Data Mining. Apalagi ditunjang ke-kaya-an dan
keanekaragaman berbagai bidang ilmu (artificial intelligence, database,
statistik, pemodelan matematika, pengolahan citra ) membuat penerapan data
mining menjadi makin luas. Berikut beberapa penerapannya
Analisa Pasar dan Manajemen
Untuk analisa pasar, banyak sekali sumber data yang dapat
digunakan seperti transaksi kartu kredit, kartu anggota club
tertentu, kupon diskon, keluhan pembeli, ditambah dengan studi
tentang gaya hidup publik.
Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering) dari
model model pembeli dan melakukan klasifikasi terhadap setiap
pembeli sesuai dengan karakteristik yang diinginkan seperti
kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan
membeli dan karakteristik lainnya.
Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli seseorang
dari waktu ke waktu. Sebagai contoh, ketika seseorang menikah
bisa saja dia kemudian memutuskan pindah dari single account ke
joint account (rekening bersama) dan kemudian setelah itu pola
beli-nya berbeda dengan ketika dia masih bujangan.
Berikut ini adalah enam tahap siklus hidup pengembangan data mining
(Chapman, 2000) :
1. Business Understanding
Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut pandang
bisnis, kemudian menterjemakan pengetahuan ini ke dalam pendefinisian
2. Data Understanding
Tahap ini dimulai dengan pengumpulan data yang kemudian akan dilanjutkan
dengan proses untuk mendapatkan pemahaman yang mendalam tentang data,
mengidentifikasi masalah kualitas data, atau untuk mendeteksi adanya bagian
yang menarik dari data yang dapat digunakan untuk hipotesa untuk informasi
yang tersembunyi.
3. Data Preparation
Tahap ini meliputi semua kegiatan untuk membangun dataset akhir (data
yang akan diproses pada tahap pemodelan/modeling) dari data mentah. Tahap
ini dapat diulang beberapa kali. Pada tahap ini juga mencakup pemilihan
tabel, record, dan atribut-atribut data, termasuh proses pembersihan dan
transformasi data untuk kemudian dijadikan masukan dalam tahap pemodelan
(modeling).
4. Modeling
Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik
pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan
nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang dapat
diterapkan untuk masalah data mining yang sama. Di pihak lain ada teknik
pemodelan yang membutuhan format data khusus. Sehingga pada tahap ini
masih memungkinan kembali ke tahap sebelumnya.
5. Evaluation
Pada tahap ini, model sudah terbentuk dan diharapkan memiliki kualitas baik
jika dilihat dari sudut pandang analisa data. Pada tahap ini akan dilakukan
evaluasi terhadap keefektifan dan kualitas model sebelum digunakan dan
menentukan apakah model dapat mencapat tujuan yang ditetapkan pada fase
awal (Business Understanding). Kunci dari tahap ini adalah menentukan
apakah ada masalah bisnis yang belum dipertimbangkan. Di akhir dari tahap
ini harus ditentukan penggunaan hasil proses data mining.
Konsumen merupakan aset yang sangat penting bagi suatu perusahaan. Tidak
akan ada prospek bisnis tanpa adanya hubungan antara perusahaan dengan
konsumen yang bersifat loyal. Hal ini adalah alasan mengapa perusahaan
harus merencanakan dan menggunakan strategi yang cukup jelas dalam
memperlakukan konsumen. Customer Relationship Management (CRM)
telah berkembang dalam beberapa dekade belakangan ini untuk
merefleksikan peranan utama dari konsumen untuk pengaturan strategi
perusahaan. CRM meliputi seluruh ukuran untuk memahami konsumen dan
proses untuk mengeksploitasi pengetahuan ini untuk merancang dan
mengimplementasikannya pada kegiatan marketing, produksi, dan rantai
supply dari pemasok (supplier). Berikut ini akan didefenisikan beberapa
pengertian CRM yang diambil dari berbagai literatur, antara lain (Tama,
2009) :
1. Dari sisi yang berkaitan dengan teknologi informasi, CRM adalah
sebuah strategi untuk mengoptimalkan customer lifetime value
dengan cara mengetahui lebih banyak mengenai informasi konsumen
dan berinteraksi dengan konsumen secara intensif (Todman, 2001).
Dari ketiga definisi di atas dapat ditarik kesimpulan mengenai definisi CRM
yaitu sebuah pendekatan yang komprehensif yang mengintegrasikan setiap
bisnis proses yang berhubungan langsung dengan konsumen, yaitu penjualan,
pemasaran dan layanan konsumen melalui integrasi filosofi, teknologi, dan
juga proses (Tama, 2009). Dengan kata lain, CRM dipandang bukanlah
sebagai sebuah produk ataupun sebuah layanan, tetapi sebuah filosofi bisnis
yang bertujuan memaksimalkan nilai konsumen dalam jangka panjang
(customer lifetime value).
2 Analytical CRM yang dikenal sebagai CRM Back office atau strategic
CRM. Analytical CRM biasanya berhubungan dengan penggunaan data
secara efective, efisien dan strategis sehingga memungkinkan
pengambilan keputusan yang tepat bagi pihak manajemen. Pengambilan
keputusan dilaksanakan setelah melalui proses analisis, pemodelan, dan
evaluasi terhadap data yang tersimpan didata base untuk menghasilkan
sebuah hubungan yang saling menguntungkan antara perusahaan dan
konsumennya . Contoh dari Analytical CRM adalah business intelegence
seperti data warehaouse, OLAP, dan data mining.
Gambar 2.4 Kerangka Kerja Teknik Data Mining dalam CRM (Ngai dkk 2008)
2.5 Clustering
(2.1)
Dimana
x : obyek ke-1
y : obyek ke-2
n : banyaknya atribut obyek ke-1 dan ke-2
Clustering hierarchi membangun sebuah hirarki cluster atau dengan kata lain
sebuah pohon cluster yang juga dikenal sebagai dendogram. Setiap node
cluster mengandung cluster anak, cluster-cluster saudara yang membagi point
yang ditutupi oleh induk mereka. Metode-metode clustering hirarki
dikatagorikan kedalam agglomeratif (bawah atas) dan divisive (atas bawah)
(Jain & Murthy, 1999);, Kaufman & Rouseeuw 1990). Clustering
agglomeratif dimulai dengan cluster satu point (singleton) dan secara
berulang-ulang menggabungkan dua atau lebih cluster yang paling tepat.
Cluster divisive dimulai dengan satu cluster dari semua point data dan secara
berulang-ulang melindungi cluster yang paling tepat. Proses erbut berlanjut
hingga kriteria penghentian (seringkali, jumlah k yang diperlukan dari
cluster) dicapai. Kelebihan cluster hirarki meliputi :
(I) Fleksibilitas yang tertanam mengenai level granaularitas
(II) Kemudahan menangani bentuk-bentuk kesamaan atau jarak
(III) Pada akhirnya, daya pakai pada tpe-tipe atribut apapun.
Analisa RFM terdiri dari tiga dimensi, yaitu (Tsiptsis dan Chorianopoulos,
2009) :
1. Recency, yaitu jenis layanan yang diigunakan para pelanggan untuk
bertransaksi. Terdapat 8 jenis layanan yang ditawarkan kepada pelanggan.
2. Frequency, yaitu jumlah total transaksi atau jumlah rata-rata transaksi
dalam satu periode.
3. Monetary, yaitu jumlah rata-rata nilai pembelian konsumen dalam suatu
satuan waktu.
Terdapat beberapa riset yang telah dilakukan oleh banyak peneliti berkaitan
dengan model segmentasi pelanggan dengan data mining seperti yang akan
dijelaskan dibawah ini :
Penelitian yang dilakukan oleh Jansen (2007) untuk menerapkan
konsep data mining dalam proses segmentasi konsumen (customer
segmentation) dan mendefinisikan profil konsumen (customer profiling) serta
hubungan antara keduanya. Jansen menggunakan algoritma K-Means, K-
Medoid, Fuzzy C-Means, Gustafson Kessel dan Gath Geva Clustering untuk
melakukan proses segmentasi konsumen. Studi kasus dalam penelitian ini
adalah konsumen pengguna jasa telekomunikasi Vodafone. Segmentasi
konsumen didasarkan pada perilaku konsumen yang diukur berdasarkan
jumlah panggilan masuk dan panggilan keluar yang dilakukan oleh
konsumen. Customer profiling dibangun melalui informasi yang berasal
dari data warehouse, seperti umur, jenis kelamin, dan informasi daerah
tempat tinggal. Dengan menggunakan teknik data mining, yaitu Support
Vector Machine (SVM), segmentasi konsumen dapat diperkirakan melalui
profil konsumen. Dalam penelitian ini diperoleh hasil bahwa dengan
menggunakan SVM, dapat dibentuk empat segmen konsumen dari data profil
konsumen yang ada dengan tingkat keakuratan 80,3%. Sedangkan jika jumlah
segmen yang dibentuk berjumlah 6, maka tingkat keakuratan klasifikasinya
adalah 78,5%.
Berikut ini adalah daftar penelitian mengenai data mining yang dilakukan
sebelumnya dilakukan disajikan dalam table 2.1
Tabel 2.1
Penelitian Yang Telah Dilakukan
Cen (2007) menggunakan teknik data mining untuk menemukan pola dan
trend dari data konsumen dalam kaitannya dengan konsep CRM. Proses
clustering dilakukan terhadap data konsumen C-Company, yaitu perusahaan
yang bergerak dibidang industry elektronik.