Anda di halaman 1dari 10

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.

ISSN 0216 - 1184

ANALISA DAN PENERAPAN METODE C4.5 UNTUK PREDIKSI LOYALITAS PELANGGAN

Teguh Budi Santoso


Jurusan Teknik Informatika, Fakultas Teknik
Universitas Satya Negara Indonesia
Jl. Arteri Pondok Indah No. 11 Jakarta 12240
Email: teguh.santos12@gmail.com

ABSTRAK
Menurut Asosiasi Telekomunikasi Seluler Indonesia (ATSI) pada akhir tahun 2011 meningkat pesat menjadi 240
juta pengguna telekomunikasi. Berbagai cara dilakukan oleh masing-masing provider untuk memenangkan
persaingan, antara lain yakni dengan mempertahankan loyalitas pelanggan. Penelitian ini bertujuan membentuk
model klasifikasi pohon keputusan untuk memprediksi loyalitas pelanggan dan melihat variable yang paling
berpengaruh. Obyek dalam penelitian ini adalah pelanggan. Data yang digunakan adalah data primer dari
penyebaran kuisioner berupa pertanyaan. Pembentukan model prediksi menggunakan metode C4.5. pada algoritma
C4.5 dilakukan perhitungan entropy dan information gain dimana atribut loyalitas pelanggan sebagai atribut tujuan,
sedangkan harga, pelayanan, promosi, citra perusahaan, dan kepercayaan sebagai atribut sumber untuk memperoleh
node akar dan node lainnya. Berdasarkan Hasil klasifikasi menggunkan algoritma C4.5 menunjukkan bahwa
diperoleh akurasi mencapai 97.5%, yang menunjukkan bahwa algoritma C4.5 cocok digunakan untuk mengukur
tinggkat loyalitas pelanggan data seluler.
Kata kunci: Loyalitas pelanggan, klasifikasi, decision tree, algoritma C4.5,

ABSTRACT
According to the Indonesian Cellular Telecommunications Association (ATSI) at the end of 2011 increased rapidly
to 240 million telecom users. Various methods are used by each provider to win the competition, among others,
namely by maintaining customer loyalty. This study aims to establish a decision tree classification models to predict
customer loyalty and see the most influential variables. Objects in this study is the customer. The data used is
primary data from questionnaires in the form of a question. Predictive modeling using C4.5. C4.5 algorithm
calculating entropy and information gain customer loyalty which attributes as destination attributes, while the price,
service, promotion, corporate image, and confidence as a source attribute to obtain the root node and other nodes.
By using our algorithm C4.5 classification results indicate that the obtained accuracy reaches 97.5%, which shows
that C4.5 algorithm suitable for measuring customer loyalty tinggkat mobile data.
Keywords: Customer loyalty, classification, decision tree, C4.5 algorithm,

1.

PENDAHULUAN

Pada akhir tahun 2010, jumlah pengguna seluler di Indonesia adalah 180 juta dan menurut Asosiasi
Telekomunikasi Seluler Indonesia (ATSI) pada akhir tahun 2011 meningkat pesat menjadi 240 juta pengguna, atau
tumbuh 33%. Bila dirasio secara persentase pengguna seluler indonesia terhadap jumlah penduduk pada tahun 2010
yang berjumlah 258 juta, maka didapat angka 70%. Artinya dari 10 jiwa, 7 di antaranya adalah pengguna
seluler. Sementara dari 240 juta pengguna seluler, 95% di antaranya adalah pelanggan kartu
prabayar. Memperhatikan data statistik di atas, bisa disimpulkan peluang bisnis seluler sangat terbuka lebar dan
memikat hati para pelaku bisnis. [1] Era telepon selular, khususnya Global System for Mobile communications
(GSM), memang baru marak dalam beberapa tahun belakangan ini. Dari segi teknologi dan merek serta jenis, ponsel

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

yang beredar di Indonesia sama sekali tidak ketinggalan dari Negara lain. Performance sebuah ponsel sangat
tergantung pada kecepatan mengatasi masalah after sales service yang sangat diharapkan oleh pelanggan. Terdapat
banyak operator selular di Indonesia membuat persaingan dibisnis ini menjadi semakin tinggi maka mengakibatkan
pelanggan memiliki banyak pilihan untuh memilih operator sellular yang memberikan pelayanan yang terbaik
dengan harga dan promosi penjulan untuk menarik minat mereka. Dengan banyaknya operator celluler yang
bermunculan maka membuat persaingan diantara operator sellular semakin tinggi. Oleh sebab itu diperlukan strategi
pemasaran yang tepat untuk dapat mempertahankan pelanggan agar mampu bertahan dibisnis ini. Salah satu strategi
pemasaran yang tepat untuk bertahan dari persaingan tinggi dalam dunia usaha operator sellular saat ini adalah
dengan mempertahankan loyalitas pelanggannya. [2] Ada enam alasan mengapa suatu institusi perlu
mempertahankan loyalitas pelanggannya. Pertama: pelanggan yang ada lebih prospektif, artinya pelanggan yang
loyal akan memberikan keuntungan yang besar kepada institusi. Kedua: biaya mendapatkan pelanggan yang baru
jauh lebih besar dibandingkan menjaga dan mempertahankan pelanggan yang sudah ada. Ketiga: pelanggan yang
sudah percaya pada institusi dalam suatu urusan akan percaya dalam urusan yang lain. Keempat: biaya operasi
institusi akan menjadi efisien jika memiliki banyak pelanggan yang loyal. Kelima: institusi dapat mengurangkan
biaya psikologis dan sosial dikarenakan pelanggan yang lama telah mempunyai banyak pengalaman positif dengan
institusi. Keenam: pelanggan yang loyal akan selalu membela institusi bahkan berusaha pula untuk menarik dan
memberi saran kepada orang lain untuk menjadi pelanggan. Kepedulian terhadap konsumen merupakan hal yang
penting. [3] menciptakan hubungan yang kuat dan erat dengan pelanggan adalah mimpi semua pemasar dan hal ini
sering menjadi kunci keberhasilan pemasaran jangka panjang. Loyalitas terjadi apabila pelanggan merasa puas
dengan merek atau kualitas pelayanan yang diterimanya dan berniat untuk terus melanjutkan hubungannya dengan
perusahaan tersebut. [4] Tingkat kepuasan customer sendiri tergantung pada kualitas pelayanan yang ditawarkan
oleh perusahaan. Bila kinerja jauh lebih rendah ketimbang harapan, customer tidak puas, jika kinerja sesuai harapan,
maka customer puas, bila kinerja melebihi harapan, maka customer merasa amat puas. customer yang merasa amat
puas dan customer yang merasa puas akan tetap loyal dan mereka akan memberikan informasi kepada orang lain
mengenai pengalaman baik dengan kinerja yang dirasakan. [5] mengatakan pelanggan adalah tujuan dari apa yang
kita lakukan dan bukannya mereka tergantung pada kami, kami sangat tergantung pada mereka. Itulah alasan utama
mengapa organisasi saat ini berfokus pada loyalitas pelanggan.
Beberapa tahun terakhir banyak metode yang digunakan untuk klasifikasi data. Penelitian yang dilakukan oleh
[6] menggunakan metode klasifikasi Decision Tree Techniques, C4.5 Decision Tree Classifier untuk memprediksi
kinerja karyawan. Dalam penelitian ini, hasil analisis, C4.5 classifier memiliki potensi besar untuk prediksi kinerja.
Peraturan klasifikasi yang dihasilkan dapat digunakan untuk memprediksi kinerja karyawan dengan tingkat hasil
akurasi sebesar 77%, Penelitian yang dilakukan [7] data mining dengan algoritma C4.5. Rules yang dihasilkan ada
11 rules serta tingkat akurasi yang dicapai 79.41%
Dalam penelitian ini penulis menerapkan algoritma C45 untuk menganilisa loyalitas pelanggan .Variabel yang
digunakan berdasarkan harga, sikap dalam melayani konsumen.

2. DATA MINING
Data mining [8] adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan
memeriksa dalam sekumpulan besar data yang tersimpan dalam penyimpanan dengan menggunakan teknik
pengenalan pola seperti teknik statistik dan matematika.
Beberapa solusi yang bisa diselesaikan dengan data mining [9] diantaranya:
a) Menembak target pasar
Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli dan melakukan
klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang diinginkan seperti kesukaan yang
sama, tingkat penghasilan yang sama, kebiasaan membeli dan karakteristik lainnya.
b) Melihat pola beli pemakai dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu. Sebagai contoh,
ketika seseorang menikah bisa saja dia kemudian memutuskan pindah dari single account ke joint account
(rekening bersama) dan kemudian setelah itu pola beli-nya berbeda dengan ketika dia masih bujangan.
c) Cross-Market Analysis
dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu produk dengan produk
lainnya.
d) Profil Customer
Data mining dapat membantu untuk melihat profil customer/pembeli/nasabah sehingga kita dapat
mengetahui kelompok customer tertentu suka membeli produk apa saja.

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

2.1 Data Sampling


Adapun eksperimen yang akan dilakukan yaitu dengan data primer yang diambil pada bulan Oktober
sampai dengan November 2013 yang dapat dilihat pada table 3.2

Tabel 3.2 hasil quesioner


Jumlah
Kasus
Atribut

No

Ya

Tidak

40

23

17

Tua

17

11

Muda

23

12

11

Ramah

19

19

Kurang ramah

12

Tidak ramah

Gratis nelpon

13

Gratis SMS

12

Gratis Internet

15

Murah

20

20

Mahal

20

17

Memiliki Citra Positif

13

Inovatif dan Berwawasan luas

13

Berpengalaman Dan stabil

14

Mengutamakan kepentingan
konsumen

24

17

jaringan yang luas

16

10

Total
1

Usia

Pelayanan

Promosi

Harga

Citra Perusahaan

Kepercayaan

2.2 Evaluasi Dan Validasi


Evaluasi dan validasi hasil dalam penelitian ini adalah hasil klasifikasi pada data training berdasarkan
waktu proses yang dibutuhkan, tingkat akurasi, serta jumlah data yang diklasifikasikan ke dalam kelas
YA/TIDAK. Untuk mengetahui evaluasi dari kinerja model klasifikasi didasarkan pada banyaknya (count)
dataset record yang diprediksi secara benar dan tidak benar pada model klasifikasi tersebut. Count ini
ditabulasikan dalam sebuah hasil yang dikenal sebagai confusion matrix.
Setelah didapatkannya sejumlah atribut maka tahap selanjutnya adalah proses pemilihan atribut. Pemilihan
ini dilakukan untuk mendapatkan atribut-atribut dengan nilai yang relevan. Berikut ini penjelasan tentang
tiap-tiap atribut:
a. Usia

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

Merupakan atribut yang berisi usia responden yang dikelompokkan dalam dua kategori yaitu Muda,
dan tua.
Pelayanan
Merupakan atribut sikap pelayanan yang diberikan oleh call center yang dikelompokkan dalam 3
kategori yaitu ramah, kurang ramah, tidak ramah.
Promosi
Merupakan atribut promosi yang dikelompokkan dalam 3 kategori yaitu
gratis sms, gratis internet, dan gratis nelpon.
Harga
Merupakan atribut harga yang diberikan atribut ini dikelompokan dalam 2 kategori yaitu murah, dan
mahal.
Citra perusahaan
Merupakan atribut citra perusahaan yang dikelompokkan dalam 3 kategori yaitu memiliki citra positif,
inovatif dan berwawasan luas, Berpengalaman dan stabil.
Kepercayaan
Merupakan atribut kepercayaan konsumen terhadap operator tersebut yang dikelompokkan dalam 2
kategori yaitu mengutamakan kepentingan konsumen, dan jaringan yang luas.

b.

c.

d.

e.

f.

Dalam penelitian ini eksperimen dan pengujian dilakukan dengan langkah-langkah sebagai berikut:
a.

Entropy dan Information Gain


Tahap pertama yang dilakukan adalah menghitung nilai entropy dan information gain dapat dilihat pada
tabel 1 dibawah ini:
Table 1 Table Nilai Entropy dan Gain seluruh atribut

Node

Atribut
Total

Jumlah
Kasus
40

Entropy
Ya
23

Gain

Tidak
17

Usia

0.0474
Tua

17

11

23

12

11

Ramah

19

19

Kurang ramah

12

Gratis nelpon

13

Gratis SMS

12

Gratis Internet

15

Murah

20

20

Mahal

20

17

Muda
Pelayanan
1

Tidak ramah
Promosi

Harga

Citra Perusahaan
Memiliki Citra
Positif
Inovatif dan

1.7601
13

13

0.9612

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

Berwawasan
luas
0.8765
Berpengalaman
Dan stabil

14

Kepercayaan
Mengutamakan
kepentingan
konsumen
jaringan yang
luas

0.8709
24

17

16

10

0.9544

Untuk menghitung nilai entropy dan information gain digunakan rumus sebagai berikut:

| |
| |

Pada tabel 4.1 diatas atribut loyalitas = ya dikatakan sebagai sampel positif (+), dan atribut loyalitas = tidak
dikatakan sebagai sampel negative (-) dari sampel data pada tabel 4.1, didapatkan:
Values(Usia) = Tua, Muda
[

]| |
][

][

Selanjutnya nilai-nilai entropy untuk S,

, untuk Usia adalah:

Dan seterusnya
Maka pohon keputusan akhir dapat dilihat pada gambar 1:

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

Gambar 1 Pohon Keputusan Akhir


Dengan memperhatikan pohon keputusan pada gambar 1 diketahui bahwa semua kasus sudah masuk dalam
kelas dengan demikian pohon keputusan pada gambar merupakan pohon keputusan terakhir yang terbentuk.Setelah
pohon terbentuk, dihasilkan sejumlah aturan dalam pohon tersebut. Contoh aturan yang dapat terbentuk dari pohon
pada gambar 1 adalah sebagai berikut:
JIKA pelayanan = ramah MAKA class = YA
JIKA pelayanan = tidak ramah MAKA class = TIDAK
JIKA pelayanan = kurang ramah DAN harga = mahal MAKA class = TIDAK
JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan berpengalaman
MAKA class = YA
JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan = inovatif DAN
kepercayaan = mengutamakan konsumen MAKA class = YA
JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan = citra positif
MAKA class = Tidak
Hasil klasifikasi pada data sampel atribut pelayanan sebagai root pada decision tree, sedangkan atribut
lainnya sebagai child node. Dari data sampel dengan 40 record dihasilkan jumlah aturan yang terbentuk sebanyak 6
aturan.
Tahap selanjutnya yang akan dikerjakan adalah proses pengolahan data dari hasil yang diperoleh dari
konsep algoritma C4.5. Sebelum diproses dengan WEKA data dipecah menjadi 2 bagian, yaitu pertama sebagai data
training sebanyak 75% data testing sebanyak 35% hal ini dilakukan supaya dapat terbentuk suatu model dengan
menggunakan data training, selanjutnya data yang terbentuk dengan menggunakan data training akan diujikan
kembali menggunakan data testing.
Hasil klasifikasi data training sebanyak 65% dengan menggunakan WEKA 3.7.7 dapat dilihat pada gambar
dibawah ini:

Gambar 2 Hasil klasifikasi data training menggunakan WEKA


Pada saat menggunakan data training dengan menggunakan WEKA 3.7.7 waktu yang dibutuhkan untuk menguji
model pada training ini adalah 0.02 second dalam mengklasifikasikan diaplikasi weka 3.7.7. dari confusion matrix

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

dapat dilihat ada 13 rekords data diklasifikasikan sebagai class YA, 10 rekords data yang diklasifikasikan sebagai
class TIDAK dan 2 record diklasifikasikan kedalam class yang tidak sesuai yaitu data diduga sebagai class YA
ternyata adalah class TIDAK

Gambar 3 Hasil akurasi detail oleh Class Training


Tingkat positif benar (TP) Rate adalah proporsi contoh yang diklasifikasikan sebagai kelas x, diantara semua contoh
yang benar-benar memiliki kelas x yang bernilai sama dengan recall.
Untuk mencari nilai TP rate pada class YA adalah:

Untuk mencari nilai FN sama pada class Tidak adalah

Tingkat positif salah (FP) rate adalah proporsi yang diklasifikasikan sebagai kelas x, tetapi masuk kedalam kelas
yang berbeda diantara semua contoh yang bukan dari kelas x.
Untuk mencari nilai FP sama pada class Ya adalah:

Untuk mencari nilai FN sama pada class Tidak adalah:

Untuk mencari precision class YA:

Untuk mencari precision class tidak:

Proses selanjutnya yaitu klasifikasi menggunakan data testing sebanyak 35% dengan menggunakan weka. Hasil
klasifikasi menggunakan data testing pada gambar dibawah ini:

Gambar 4 Hasil klasifikasi data testing menggunakan WEKA


Pada saat menggunakan data tes dengan menggunakan WEKA 3.7.7 waktu yang dibutuhkan untuk menguji model
pada training ini adalah 0 second dalam mengklasifikasikan diaplikasi weka 3.7.7.dari confusion matrix dapat dilihat
ada 8 rekords data diklasifikasikan sebagai class YA, 6 rekords data yang diklasifikasikan sebagai class TIDAK dan

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

1 record diklasifikasikan kedalam class yang tidak sesuai yaitu data diduga sebagai class YA ternyata adalah class
TIDAK

Gambar 5 Hasil akurasi detail oleh Class Training


Tingkat positif benar (TP) Rate adalah proporsi contoh yang diklasifikasikan sebagai kelas x, diantara semua contoh
yang benar-benar memiliki kelas x yang bernilai sama dengan recall.
Untuk mencari nilai TP rate pada class YA adalah:

Untuk mencari nilai FN sama pada class Tidak adalah

Tingkat positif salah (FP) rate adalah proporsi yang diklasifikasikan sebagai kelas x, tetapi masuk kedalam kelas
yang berbeda diantara semua contoh yang bukan dari kelas x.
Untuk mencari nilai FP sama pada class Ya adalah:

Untuk mencari nilai FN sama pada class Tidak adalah:


Untuk mencari precision class YA:

Untuk mencari precision class tidak

F-measure yang merupakan ukuran gabungan dari precision dan recal.proses perhitungannya adalah

Untuk mencari F-Measure classYa:

Untuk mencari F-measure class TIDAK:

= 0.909
Tahap selanjutnya mengukur evaluasi untuk mengetahui evaluasi dari kinerja model klasifikasi. Pada weka classifier
hasil klasifikasi yang diperoleh akan disertakan dengan beberapa alat ukur sebagai bukti terjadinya hasil proses pada
klasifikasi tersebut yang telah tersedia didalamnya, salah satu alat ukur tersebut adalah confusion matrix. Berikut ini
adalah hasil kesimpulan confusion matrik yang terdaat pada aplikasi WEKA dari hasil yang diperoleh dari data
training

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

ISSN 0216 - 1184

Gambar 6 Hasil confusion matrix data training


Dari informasi tersebut, kemudian akan dilakukan proses perhitungan rata-rata persentasiakurasi keberhasilan dan
error rate pada confusion matrix data training sebagai berikut:

Persentase Akurasi = 0.975 x 100% = 97.5 %

Persentase Error= 0.025 x 100%= 2.5%


Proses selanjutnya adalah hasil kesimpulan confusion matrix yang terdapat pada aplikasi WEKA dari hasil yang
diperoleh menggunakan data penjualan barang yang diambil merupakan data testing.

Gambar 7 Hasil confusion matrix data testing

Persentase Akurasi = 0.933 x 100% = 93.3 %

Persentase Error rate= 0.06 x 100%= 6.6%


Dari hasil rata-rata data training dan testing dapat dilihat pada tabel 4.4 dibawah ini:
Tabel 2 Hasil akurasi dan error rate
Dataset
Data training
Data testing

Akurasi (%)
97.5 %
93.3 %

Error Rate (%)


2.5%
6.6%

Dari tabel diatas dapat dilihat nilai akurasi serta error rate data training serta data testing, dimana data
training memiliki nilai akurasi yang lebih tinggi daripada data testing.dengan menggunakan algoritma C4.5 nilai
akurasi dari data training dan data testing lebih dari 90% hingga mencapai 97,5%. Hal ini menunjukkan bahwa
algoritma C4.5 dapat digunakan pada dataset pelanggan.
3.

KESIMPULAN
Berdasarkan analisa penggunaan data minning dengan algoritma C4.5 dapat digunkan pada data set
pelanggan kedalam kegiatan manajemen strategi sehingga dapat menahan selama mungkin pelanggannya
dengan baik,aplikasi algoritma C4.5 ini hendaknya di masukkan kedalam personal computer yang ada sehingga
dapat mengurangi kemungkinan pelanggan untuk berpindah operator atau untuk mempertahankan loyalitas
pelanggannya.

Jurnal Ilmiah Fakultas Teknik LIMITS Vol. 10 No.1

4.

ISSN 0216 - 1184

REFERENSI
[1]

[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]

Rahadian, s. s. (2006). Analisis Pengaruh Loyalitas Pelanggan Dan Prilaku Mencari Variasi
Terhadap Perpindahan Merek (studi kasus pada pengguna kartu prabayar mentari dikota
semarang). Semarang: Universitas Diponegoro.
Ikhsan, m. R. (2011). Pegaruh Kualitas Pelayanan Dan Promosi Penjualan Terhadap Loyalitas
Pelanggan Indra Celllular Kudus. Semarang.
Kotler, p. (2001). Marketing Manajemen.Australia
Hermanto, a. w. (2008). Analisa Tingkat Kepuasan Konsumen Terhadap Penjualan Susu Kedelai.
semarang.
Triswandari, U. (2011). Analisis Pengaruh Kualitas Pelayanan Jasa Terhadap Kepuasan Pelanggan
Pada PT.PLN (PERSERO) Rayon Makasar Timur. Makasar.
Hamdan, A. R., & othman, Z. A. (2010). Human Talent Prediction in HRM using Classification
Algorithm. selangor, malaysia.
Mandasari, V., & Tama, B. A. (2011). Analisis Kepuasan Konsumen Terhadap Restoran Cepat
Saji Melalui Pendekatan Data Mining.
Larose, D. T. (2005). Discovering knowledge in data.
Han, J., & Kamber, M. (2001). Data Mining:Concepts and Technique. sanfransisco.