Anda di halaman 1dari 7

Klasifikasi

1. Masalah yang dikemukakan


Pada akhir 2010 peluang bisnis seluler sangat terbuka lebar dan memikat para
pelaku bisnis. Banyaknya operator seluler membuat tingginya persaingan
bisnis, maka dari itu operator sellular memberikan pelayanan yang terbaik
dengan harga dan promosi penjulan untuk menarik minat pelanggan. Dengan
banyaknya operator celluler yang bermunculan maka membuat persaingan
diantara operator sellular semakin tinggi, untuk bertahan dari persaingan
tinggi dalam dunia usaha operator sellular saat ini adalah dengan
mempertahankan loyalitas pelanggannya.
2. Solusi yang ditawarkan
Menyadari pentingnya loyalitas pelanggan dalam persaingan bisnis, kita harus
dapat memprediksi loyalitas pelanggan dan mengetahui variable/factor yang
mempengaruhi loyalitas pelanggan. Untuk menganalisa loyalitas pelanggan
dan mengetahui variabel yang berpengaruh dapat menerapkan algoritma C45.
3. Pertanyaan penelitian
Bagaimana cara membentuk model klasifikasi pohon keputusan untuk
memprediksi loyalitas pelanggan dengan menggunakan algoritma C4.5?
4. Tahapan penelitian
1. Mengumpulkan data sampling
Data primer yang diambil pada bulan Oktober sampai dengan November
2013
2. Evaluasi Dan Validasi
Evaluasi dan validasi hasil dalam penelitian ini adalah hasil klasifikasi
pada data training berdasarkan waktu proses yang dibutuhkan, tingkat
akurasi, serta jumlah data yang diklasifikasikan ke dalam kelas
YA/TIDAK. Untuk mengetahui evaluasi dari kinerja model klasifikasi
didasarkan pada banyaknya (count) dataset record yang diprediksi secara
benar dan tidak benar pada model klasifikasi tersebut. Count ini
ditabulasikan dalam sebuah hasil yang dikenal sebagai confusion matrix.
Setelah didapatkannya sejumlah atribut maka tahap selanjutnya adalah
proses pemilihan atribut. Pemilihan ini dilakukan untuk mendapatkan
atribut-atribut dengan nilai yang relevan. Atribut yang digunakan adalah
usia, pelayanan, promosi, harga, citra perusahaan dan kepercayaan.
3. Melakukan perhitungan untuk membentuk pohon keputusan dengan
menggunakan data sampling
Hasil klasifikasi pada data sampel atribut pelayanan sebagai root pada
decision tree, sedangkan atribut lainnya sebagai child node. Dari data
sampel dengan 40 record dihasilkan jumlah aturan yang terbentuk
sebanyak 6 aturan.
4. Proses Pengolahan Data
Tahap selanjutnya yang akan dikerjakan adalah proses pengolahan data
dari hasil yang diperoleh dari konsep algoritma C4.5. Sebelum diproses
dengan WEKA data dipecah menjadi 2 bagian, yaitu pertama sebagai data
training sebanyak 75% data testing sebanyak 35% hal ini dilakukan
supaya dapat terbentuk suatu model dengan menggunakan data training,
selanjutnya data yang terbentuk dengan menggunakan data training akan
diujikan kembali menggunakan data testing.
5. Cara kerja metode
1. Mempersiapkan data sampling
2. Menentukan root pohon
Root akan diambil dari atribut yang akan terpilih, dengan cara menghitung
nilai gain dari masing-masing atribut, nilai gain yang paling tinggi yang
akan menjadi akar pertama. Sebelum menghitung nilai gain dari atribut,
hitung dahulu nilai entropy.
Untuk menghitung nilai entropy dan information gain digunakan rumus
sebagai berikut:
3. Membuat cabang untuk masing-masing nilai, artinya membuat cabang
sesuai dengan jumlah nilai variabel gain tertinggi.
4. Membagi setiap kasus dalam cabang.
5. Mengulangi proses dalam setiap cabang sehingga semua kasus dalam
cabang memiliki kelas yang sama, mengulangi semua proses perhitungan
gain tertinggi untuk masing-masing cabang kasus sampai tidak bisa lagi
dilakukan proses perhitungan.
6. Pembahasan dan hasil
Menggunakan data sampling

Jumlah
No Atribut Kasus Ya Tidak
Total 40 2 1
3 7
1 Usia
Tua 17 1 6
1
Muda 23 1 1
2 1
2 Pelayana
n
Ramah 19 1 0
9
Kurang ramah 12 4 8
Tidak ramah 9 0 9
3 Promosi
Gratis nelpon 13 7 6
Gratis SMS 12 8 4
Gratis Internet 15 8 7
4 Harga
Murah 20 2 0
0
Mahal 20 3 1
7
5 Citra Perusahaan
Memiliki Citra Positif 13 9 4
Inovatif dan Berwawasan 13 5 8
luas
Berpengalaman Dan stabil 14 9 4
6 Kepercayaan
Mengutamakan
kepentingan 24 1 7
konsumen 7
jaringan yang luas 16 6 1
0

Perhitungan untuk pohon keputusan

Jumlah
No Atribut Kasus Ya Tidak Entropy Gain
Total 40 2 1
3 7 0.0474
1 Usia
Tua 17 1 6 0.9367
1
Muda 23 1 1 0.9986
2 1 0.7083
2 Pelayana
n
Ramah 19 1 0 0
9
Kurang ramah 12 4 8 0.9183
Tidak ramah 9 0 9 0
3 Promosi 0.0109
Gratis nelpon 13 7 6 0.9957
Gratis SMS 12 8 4 0.9184
Gratis Internet 15 8 7 0.9968
4 Harga 0.6788
Murah 20 2 0 0
0
Mahal 20 3 1 0.6099
7 -0.2074
5 Citra Perusahaan
Memiliki Citra Positif 13 9 4 1.7601
Inovatif dan Berwawasan 13 5 8 0.9612
luas
Berpengalaman Dan 14 9 4 0.8765
6 Kepercayaan 0.0795
Mengutamakan 0.8709
kepentingan 24 1 7
konsumen 7
jaringan yang luas 16 6 1 0.9544
0
Menghasilkan pohon keputusan

Aturan yang dapat terbentuk dari pohon pada gambar 1 adalah sebagai
berikut:
“JIKA pelayanan = ramah MAKA class = YA”
“JIKA pelayanan = tidak ramah MAKA class = TIDAK”
“JIKA pelayanan = kurang ramah DAN harga = mahal MAKA class =
TIDAK”
“JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan
berpengalaman MAKA class = YA”
“JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan
= inovatif DAN kepercayaan = mengutamakan konsumen MAKA class =
YA”
“JIKA pelayanan = kurang ramah DAN harga = murah DAN citra perusahaan
= citra positif MAKA class = Tidak”

Hasil klasifikasi pada data sampel atribut pelayanan sebagai root pada
decision tree, sedangkan atribut lainnya sebagai child node. Dari data sampel
dengan 40 record dihasilkan jumlah aturan yang terbentuk sebanyak 6 aturan.
Tahap selanjutnya yang akan dikerjakan adalah proses pengolahan data
dari hasil yang diperoleh dari konsep algoritma C4.5. Sebelum diproses
dengan WEKA data dipecah menjadi 2 bagian, yaitu pertama sebagai data
training sebanyak 75% dan data testing sebanyak 35% hal ini dilakukan
supaya dapat terbentuk suatu model dengan menggunakan data training,
selanjutnya data yang terbentuk dengan menggunakan data training akan
diujikan kembali menggunakan data testing. Data training diuji menggunakan
WEKA 3.7.7. pertama menguji akurasi data training, mengitung hasil
confusion matrix data training dan testing dan terakhir menghitung hasil
akurasi dan erroe rate.

Dari hasil rata-rata data training dan testing dapat dilihat pada tabel dibawah
ini:
Tabel Hasil akurasi dan error rate

Dari tabel diatas dapat dilihat nilai akurasi serta error rate data training serta
data testing, dimana data training memiliki nilai akurasi yang lebih tinggi
daripada data testing.dengan menggunakan algoritma C4.5 nilai akurasi dari
data training dan data testing lebih dari 90% hingga mencapai 97,5%. Hal ini
menunjukkan bahwa algoritma C4.5 dapat digunakan pada dataset pelanggan.
7. Kesimpulan dan saran
Berdasarkan analisa penggunaan data mining dengan algoritma C4.5
dapat digunakan pada data set pelanggan kedalam kegiatan manajemen
strategi sehingga dapat menahan selama mungkin pelanggannya dengan baik,
aplikasi algoritma C4.5 ini hendaknya di masukkan kedalam personal
computer yang ada sehingga dapat mengurangi kemungkinan pelanggan untuk
berpindah operator atau untuk mempertahankan loyalitas pelanggannya.

Anda mungkin juga menyukai