Disusun Oleh :
Nama : Mochamad Rizki Ilham S
NIM : A11.2012.07233
Program Studi : Teknik Informatika- S1
Disusun Oleh :
Nama : Mochamad Rizki Ilham S
NIM : A11.2012.07233
Program Studi : Teknik Informatika- S1
i
ii
Telah diperiksa dan disetujui oleh pembimbing tugas akhir guna mencapai gelar
Sarjana Komputer Strata Satu pada Fakultas Ilmu Komputer, Universitas Dian
Nuswantoro Semarang.
Menyetujui Mengetahui
Pembimbing Dekan Fakultas Ilmu Komputer
ii
iii
Tugas Akhir ini telah diujikan dan dipertahankan dihadapan Dewan Penguji pada
Sidang Tugas Akhir tanggal 17 Februari 2016 Menurut pandangan kami, tugas akhir
ini memadai dari segi kualitas maupun kuantitas untuk tujuan penganugrahan gelas
Sarjana Komputer (S. Kom)
Ketua Penguji
Penguji 1 Penguji 2
iii
iv
Merupakan karya asli saya (kecuali cuplikan dan ringkasan yang masing-masing
telah saya jelaskan sumbernya dan perangkat pendukung). Apabila di kemudian hari,
karya saya disinyalir bukan merupakan karya asli saya, yang disertai dengan bukti-
bukti yang cukup, maka saya bersedia untuk dibatalkan gelas saya beserta hak dan
kewajiban yang melekat pada gelar tersebut. Demikian surat pernyataan ini saya buat
dengan sebenarnya.
Yang menyatakan
iv
v
Saya bersedia untuk menanggung secara pribadi, tanpa melibatkan pihak Universitas
Dian Nuswantoro, segala bentuk tuntutan hukum yang timbul atas pelanggaran Hak
Cipta dalam karya ilmiah saya ini. Demikian surat pernyataan ini saya buat dengan
sebenarnya.
Yang menyatakan
v
vi
Puji syukur kepada Tuhan yang Maha Esa atas segala berkat yang telah diberikan-
Nya, sehingga Laporan Tugas Akhir ini dapat diselesaikan.
Penulis menyadari bahwa tanpa bimbingan, bantuan, dan doa dari berbagai pihak,
Laporan Tugas Akhir ini tidak akan dapat diselesaikan tepat pada waktunya. Oleh
karena itu, penulis mengucapkan terimakasih yang sebesar-besarnya kepada semua
pihak yang telah membantu dalam proses penulisan Laporan Tugas Akhir ini, yaitu
kepada :
Akhir kata, penulis menyadari bahwa mungkin masih terdapat kekurangan dalam
Laporan Tugas Akhir ini. Oleh karena itu, kritik dan saran dari pembaca sangat
bermanfaat bagi penulis. Semoga Laporan Tugas Akhir ini dapat bermanfaat bagi
semua pihak yang membacanya.
Semarang, 17 Februari 2016
vi
vii
ABSTRAK
Banyak cara dilakukan oleh masing-masing perusahaan penyedia jasa, khususnya
transportasi untuk memenangkan persaingan, antara lain dengan meningkatkan
kepuasan pelanggan transportasi. Salah satu perusahaan penyedia jasa transportasi
yang berkomitmen dalam meningkatkan kepuasan pelangganya adalah Taksi KOSTI.
Penelitian ini bertujuan untuk menganalisis kepuasan pelanggan Taksi KOSTI
dengan menggunakan teknik data mining dengan algoritma C4.5. Atrribut masukan
kepuasan pelanggan dalam penelitian ini mencangkup harga, fasilitas, pelayanan dan
loyalitas. Dalam penelitian ini, didapatkan bahwa hasil yang didapatkan berasal dari
beberapa atribut masukan menghasilkan hubungan sebab-akibat dalam
mengklasifikasikan konsumen puas dan tidak puas. Penelitian ini di harapkan dapat
membantu pihak KOSTI dalam meningkatkan kepuasan konsumen untuk
mempertahankan pelanggan dan meningkatkan laba perusahaan taksi KOSTI
tersebut. Berdasarkan Hasil klasifikasi menggunakan algoritma C4.5 menunjukkan
bahwa diperoleh akurasi mencapai 88.01%, yang menunjukkan bahwa algoritma
C4.5 cocok digunakan untuk mengukur tinggkat kepuasan pelanggan taksi KOSTI.
Kata Kunci : Data mining, Decision Tree, Algoritma C4.5, Kepuasan Pelanggan,
Perusahaan Jasa Transportasi.
vii
DAFTAR ISI
viii
ix
ix
x
DAFTAR GAMBAR
Gambar 4.5 Pohon Keputusan Hasil Pegolahan dengan Rapid Miner ................. 47
x
xi
DAFTAR TABEL
Tabel 4.5 Data yang akan di import ke dalam Rapid Miner ................................. 45
xi
BAB I
PENDAHULUAN
1.1. Latar Belakang
1
2
Dapat dilihat pada tabel diatas bahwa sangat banyak perusahaan yang
bergerak dibidang jasa transportasi taksi ini dan jumlahnya terus bertambah.
Sekarang ini tercatat sampai tahun 2015 Kosti Semarang memiliki anggota
633 orang. Kosti berdiri sejak tahun 1998, dengan memberikan pelayanan-
pelayanan yang baik maka kosti dapat bertahan hingga sekarang [4].
Namun perkembangan dunia usaha yang semakin pesat ini
menyebabkan perusahaan harus menghadapi persaingan yang ketat.
Perusahaan pada umumnya menginginkan pelanggan yang dimilikinya dapat
dipertahankan selama-lamanya. Untuk mewujudkan hal itu bukanlah sesuatu
yang mudah diiklim persaingan usaha yang sangat ketat saat ini mengingat
adanya perubahan-perubahan yang cepat dapat terjadi setiap saat seperti
perubahan pada diri pelanggan, pesaing maupun perubahan kondisi secara
luas yang selalu dinamis. Hal ini menuntut para pengambil kebijakan untuk
mengembangkan suatu strategi yang mampu mancapai sasaran pertumbuhan
penjualan, peningkatan porsi pasar perusahaan, serta pencapaian kemampuan
sebagai dasar pertumbuhan berkelanjutan [3].
Sementara itu, Data mining adalah proses pengekstrakan informasi
dari kumpulan data yang besar [5]. Pengekstrakan informasi dilakukan
berdasarkan metode data mining yang akan digunakan. Ada beberapa metode
serta algoritma data mining yang digunakan untuk mengekstrak informasi
antara lain: metode klasifikasi, metode asosiasi, metode clustering, metode
prediksi, dan metode estimasi.
Algoritma C4.5 adalah salah satu algoritma dari metode klasifikasi
algoritma C4.5 adalah algoritma yang digunakan untuk membuat pohon
keputusan. Pohon keputusan merupakan metode klasifikasi dan prediksi yang
sangat kuat dan terkenal. Metode pohon keputusan mengubah fakta yang
sangat besar menjadi pohon keputusan yang merepresentasikan aturan.
Aturan dapat dengan mudah dipahami dengan bahasa alami.
4
Dari latar belakang diatas terdapat beberapa masalah yang timbul dan
dapat di identifikasikan sebagai berikut :
1. Belum diketahuinya apakah pelanggan sudah puas atau belum dengan
layanan yang diberikan oleh perusahaan Kosti
2. Perlu adanya pengolahan data melalui survey dengan mengajukan
pertanyaan–pertanyaan dalam bentuk kuisioner yang melibatkan faktor–
5
Kualitas Jasa dan Pelayanan merupakan salah satu unsur yang sangat
penting dalam menciptakan kepuasan konsumen. Salah satu cara untuk
menempatkan hasil pelayanan yang lebih unggul daripada pesaing adalah
dengan memberikan pelayanan yang baik, efisien, dan cepat [11]. Umumnya
konsumen melihat dari suatu pelayanan yang diberikan oleh perusahaan
kepada pelanggan. Jika pelayanan yang diberikan sangat memuaskan dan
mencapai tingkat kepuasan konsumen, maka konsumen akan merasa puas
akan jasa atau pelayanan tersebut. Semua pelayanan dan fasilitas yang
diberikan harus disesuaikan dengan kebutuhan konsumen dan dievaluasi
melalui opini atau presepsi konsumen. Opini atau presepsi konsumen
merupakan suatu penilaian terhadap kelebihan atau kekurangan suatu jasa
atau pelayanan.
Atas dasar presepsi konsumen yang merupakan suatu penilaian terhadap
jasa atau pelayanan suatu perusahaan, maka perusahaan harus melakukan
peningkatan kualitas pelayanan yang diharapkan akan semakin meningkatnya
konsumen untuk menggunakan jasa atau layanan yang di tawarkan oleh suatu
perusahaan yang diharapkan dapat memenuhi kebutuhan setiap konsumen
sehingga konsumen dapat merasa puas.
Berdasarkan kualitas jasa dan kepuasan pelanggan yang saling berkaitan
maka dilakukanlah penelitian ini dengan terlebih dahulu melakukan studi
kepuasan pelanggan dari penelitian-penelitian sebelumnya dan sumber lain.
Dari penelitian-penelitian sebelumnya penulis menemukan beberapa
penelitian yang membahas tentang topik yang terkait dengan penelitian
penulis, antara lain adalah algortima yang akan digunakan oleh penulis pada
penelitian ini.
Penelitian pertama dilakukan oleh Ibnu Fatchur Rochman [6] yang
membuat penelitian pada kepuasan pelanggan perum damri menggunkan
algoritma C4.5. Dari hasil pengujian algortima C4.5 dalam memprediksi
8
9
kepuasan pelanggan perum DAMRI atas 90 sample data pelanggan yang diuji
dalam penelitian ini, menunjukan bahwa algoritma C4.5 memiliki tingkat
akurasi yang cukup tinggi yaitu sebesar 93%. Pada penelitian ini peneliti
membuat kuisioner dengan jumlah yang telah di tentukan sejumlah 150
kuisioner yang selanjutnya kuisioner tersebut akan menjadi bahan acuan awal
untuk menentukan jumlah puas dan tidak puas pada prosentasi kepuasan
pelanggan Bus Perum DAMRI. Hasil dari perhitungan manual jumlah puas
dan tidak puas pada kuisioner tersebut dimasukkan kedalam rumus algoritma
C4.5.
Kuisioner di bagi dalam tiga kategori yang masing-masing kategori
memiliki beberapa pertanyaan, kategori kuisioner yang diajukan oleh peneliti
meliputi Harga, Pelayanan, dan Fasilitas.
Peneliti melakukan 3 kali pengujian terhadap data pelanggan dengan
jumlah data testing dan data training yang berbeda yaitu :
2. Skala Interval
Skala yang memiliki jarak yang tetap antar respon yang ditawarkan,
biasanya 1 unit skala [19].
2.2.6 Data Mining
Ada beberapa teknik yang dimiliki data mining berdasarkan tugas yang
bisa dilakukan, setiap teknik memiliki algoritma masing-masing. Teknik
dalam data mining terbagi menjadi enam kategori, yaitu [16] :
a. Deskripsi
Para peneliti biasanya mencoba menemukan cara untuk mendeskripsikan
pola dan trend yang tersembunyi dalam data.
b. Estimasi
Estimasi mirip dengan klasifikasi, kecuali variabel tujuan yang lebih
kearah numerik dari pada kategori.
c. Prediksi
Prediksi memiliki kemiripan dengan estimasi dan klasifikasi. Hanya saja,
prediksi hasilnya menunjukkan sesuatu yang belum terjadi (mungkin
terjadi dimasa depan).
19
d. Klasifikasi
Dalam klasifikasi variabel, tujuan bersifat kategorik. Misalnya, kita akan
mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi,
pendapatan sedang, dan pendapatan rendah.
e. Klastering
Clustering lebih ke arah pengelompokan record, pengamatan, atau
kasusdalam kelas yang memiliki kemiripan.
f. Asosiasi
Mengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada
satu waktu.
2.2.6.1 Tahap-tahap Data Mining
Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa
tahap. Tahap-tahap tersebut bersifat interaktif di mana pemakai terlibat
langsung atau dengan perantaraan knowledge base [17].
juga akan mempengaruhi performasi dari teknik data mining karena data
yang ditangani akan berkurang jumlah dan kompleksitasnya.
5. Proses mining
Merupakan suatu proses utama saat metode diterapkan untuk
menemukan pengetahuan berharga dan tersembunyi dari data.
2.2.7 CRISP-DM
CRISP-DM (Cross-Industry Standard Process for Data Mining)
merupakan suatu konsorsium perusahaan yang didirikan oleh Komisi Eropa
pada tahun 1996 dan telah ditetapkan sebagai proses standar dalam data
mining yang dapat diaplikasikan di berbagai sektor industri. Gambar 2.2
22
Business Data
Understanding Understanding
Data
Preparation
Berikut ini adalah enam tahap siklus hidup pengembangan data mining [16]:
1. Business Understanding
Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut
pandang bisnis, kemudian menterjemakan pengetahuan ini ke dalam
pendefinisian masalah dalam data mining. Selanjutnya akan ditentukan
rencana dan strategi untuk mencapai tujuan tersebut.
2. Data Understanding
Tahap ini dimulai dengan pengumpulan data yang kemudian akan
dilanjutkan dengan proses untuk mendapatkan pemahaman yang mendalam
tentang data, mengidentifikasi masalah kualitas data, atau untuk mendeteksi
adanya bagian yang menarik dari data yang dapat digunakan untuk hipotesa
untuk informasi yang tersembunyi.
3. Data Preparation
Tahap ini meliputi semua kegiatan untuk membangun dataset akhir
(data yang akan diproses pada tahap pemodelan/modeling) dari data mentah.
Tahap ini dapat diulang beberapa kali. Pada tahap ini juga mencakup
pemilihan tabel, record, dan atribut-atribut data, termasuk proses
23
4. Modeling
Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai
teknik pemodelan dan beberapa parameternya akan disesuaikan untuk
mendapatkan nilai yang optimal. Secara khusus, ada beberapa teknik berbeda
yang dapat diterapkan untuk masalah data mining yang sama. Di pihak lain
ada teknik pemodelan yang membutuhan format data khusus. Sehingga pada
tahap ini masih memungkinan kembali ke tahap sebelumnya.
5. Evaluation
Pada tahap ini, model sudah terbentuk dan diharapkan memiliki
kualitas baik jika dilihat dari sudut pandang analisa data. Pada tahap ini akan
dilakukan evaluasi terhadap keefektifan dan kualitas model sebelum
digunakan dan menentukan apakah model dapat mencapat tujuan yang
ditetapkan pada fase awal (Business Understanding). Kunci dari tahap ini
adalah menentukan apakah ada masalah bisnis yang belum dipertimbangkan.
Di akhir dari tahap ini harus ditentukan penggunaan hasil proses data mining.
6. Deployment
Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan
diatur dan dipresentasikan dalam bentuk khusus sehingga dapat digunakan
oleh pengguna. Tahap deployment dapat berupa pembuatan laporan sederhana
atau mengimplementasikan proses data mining yang berulang dalam
perusahaan. Dalam banyak kasus, tahap deployment melibatkan konsumen, di
samping analis data, karena sangat penting bagi konsumen untuk memahami
tindakan apa yang harus dilakukan untuk menggunakan model yang telah
dibuat.
2.2.8 Klasifikasi
Data Mining dibagi menjadi beberapa kelompok berdasarkan tugas
yang dapat dilakukan, yaitu : Deskripsi, Estimasi, Prediksi, Klasifikasi,
Pengklusteran, dan Asosiasi.
24
1. Kelas (Class)
Variabel dependen dari model, merupakan variabel kategorikal yang
merepresentasikan “label” pada objek setelah klasifikasinya. Contoh kelas
semacam ini adalah: adanya kelas penyakit jantung, loyalitas pelanggan,
kelas bintang (galaksi), kelas gempa bumi (badai), dll.
2. Prediktor (Predictor)
Variabel independen dari model, direpresentasikan oleh karakteristik
(atribut) dari data yang akan diklasifikasikan dan berdasarkan klasifikasi yang
telah dibuat. Contoh prediktor tersebut adalah : merokok, konsumsi alkohol,
tekanan darah, frekuensi pembelian, status perkawinan, karakteristik (satelit)
gambar, catatan geologi yang spesifik, kecepatan dan arah angin, musim ,
lokasi terjadinya fenomena , dll.
1. Decision/classification trees;
2. Bayesian classifiers/Naive Bayes classifiers;
3. Neural networks;
4. Statistical analysis;
5. Genetic algorithms;
6. Rough sets;
7. k-nearest neighbor classifier;
8. Rule-based methods;
9. Memory based reasoning;
10. Support vector machines.
2.2.9 Decision Tree Algoritma C4.5
Pohon keputusan adalah salah satu metode klasifikasi yang kuat dan
terkenal. Metode Decision Tree mengubah fakta besar menjadi pohon
keputusan yang mewakili aturan, sehingga aturan tersebut dapat dengan
mudah dipahami oleh manusia. Decision Tree juga berfungsi untuk
mengeksplorasi data, menemukan hubungan tersembunyi antara sejumlah
variabel input dan variabel tujuan [14].
Model pohon keputusan terdiri dari satu set keputusan untuk membagi
sejumlah populasi yang besar menjadi satu aturan yang kecil dengan
memperhatikan target berupa objek. Objek target biasanya diklasifikasikan
dan model pohon keputusan lebih fokus pada perhitungan probabilitas dari
setiap record data dari beberapa kategori atau untuk mengklasifikasikan tiap
record berdasarkan kelompok menjadi suatu kelas. Sebuah keputusan dapat
dibangun dengan menerapkan salah satu algoritma Decision tree untuk
memodelkan sekelompok data yang belum terklasifikasi. Konsep dari
Decision tree adalah mengubah data menjadi pohon keputusan dan aturan
keputusan.
Piagam
Penghargaan
IPK Layak
Tinggi
Cukup Rendah
Layak
Tidak Layak
Penghasilan
Orang Tua
Tinggi Rendah
Layak
Tidak Layak
Keterangan :
S adalah Himpunan (dataset) kasus
k adalah banyaknya partisi S
Pi adalah probabilitaas yang didapat dari Sum (Ya) atau Sum
(Tidak) dibagi total kasus
| S | xEntropi(S )
| Si |
Gain (A) = Entropi (S) - i
i 1
TP TN ad
Akurasi = x 100%
TP FP TN FN a b c d
untuk data mining tidak perlu diragukan lagi karena software ini sudah
terkemuka di dunia. Rapid Miner menempati peringkat pertama sebagai
Software data mining pada polling oleh KDnuggets, sebuah portal data-
mining pada 2010-2011.
Bagaimana Akurasi dan penerapan algortima C4.5 Buku dan jurnal tentang data mining, Algoritma C4.5
pada kepuasan pelanggan taksi KOSTI Semarang. dan kepuasan pelanggan taksi.
Metode
Algoritma C4.5
Penerapan
Pengembangan
Pengujian
Cross Validation
Hasil
Akurasi dan Penerapan Algoritma
C4.5 terhadap kepuasan pelanggan
taksi KOSTI
- RAM 4GB
- 150GB HDD
33
34
2. Skala Interval
Skala yang memiliki jarak yang tetap antar respon yang ditawarkan,
biasanya 1 unit skala [19].
Untuk menilai jawaban dari setiap pertanyaan dari kuesioner, dilakukan
dengan menggunakan metode Skala Likert. Metode ini mengukur setiap
penilaian responden melalui pemberian bobot pada setiap jawaban
pertanyaan sebagai berikut :
1. Sangat Tidak Setuju Bobot 1
2. Tidak Setuju Bobot 2
3. Netral Bobot 3
4. Setuju Bobot 4
5. Sangat Setuju Bobot 5
Mulai
Pengumpulan Data
Pengumpulan Data
Kuisioner pelanggan Pembagian Kuisioner
taksi KOSTI Semarang terhadap Pelanggan
KOSTI Semarang
Praproses
Selesai
Implementasi Rule pada Netbeans
Penjelasan
Penjelasan dari prosedur penelitian kepuasan pelanggan :
5. Hasil Jumlah dari perhitungan manual untuk puas dan tidak puas pada
kuisioner tersebut dimasukan kedalam rumus algoritma C4.5
9. Didapatkan Hasil dari penelitian ini bahwa dapat diketahui sejauh mana
kepuasan pelanggan pada taksi KOSTI Semarang.
40
41
POHON
KEPUTUSAN
ALGORITMA
DATA
C4.5
RULE
Gambar 4.3 Alur Pengolahan Data
46
4.3 Pengujian Rules Terhadap Data Kepuasan Pelanggan Taksi KOSTI dengan
Variabel Data Kuisioner
Pengujian ini dilakukan untuk mengetahui kinerja dari metode algoritma
C4.5 dalam melakukan klasifikasi terhadap kelas yang telah ditentukan dalam uji
coba ini. Pengujian ini dilakukan sebanyak 3 kali dengan K-Fold Validation yang
berbeda pada operator cross validation. K-Fold Validation berfungsi untuk
membagi jumlah data training dan data testing pada data yang di uji. Pengujian
tediri dari :
1. K-Fold Validation 10
2. K-Fold Validation 5
3. K-Fold Validation 3
50
Algoritma C4.5 melakukan training terhadap data – data yang telah dibagi
oleh cross validation menjadi dua kotak yaitu training dan testing. Training
terdiri dari decision tree, sedangkan testing terdiri dari apply model dan
performance.
Berikut dijelaskan mengenai parameter dan operator yang digunakan pada
model algoritma C4.5 sebagai berikut :
1. Retreiving Data adalah operator yang digunakan untuk mengimport
dataset yang akan digunakan, pada penelitian ini data diimport dari file
excel.
2. Validation operator yang digunakan dalam penelitian ini adalah split
validation, validation ini hanya membagi total dari keseluruhan dataset
menjadi data training dan data testing.
3. Decision tree adalah metode klasifikasi yang digunakan dalam
penelitian ini.
4. Apply model adalah operator yang digunakan dalam penelitian ini yaitu
algoritma C4.5.
5. Performance adalah operator yang digunakan untuk mengukur performa
akurasi dari model.
4.3.1 Pengujian 1
Pengujian ini dilakukan dengan membagi sebanyak 10 bagian pada 200
data kuisioner yang akan di uji. 10 bagian tersebut terdiri dari 9 bagian data
training dan 1 bagian data testing. Dan dalam pengujian ini akan menghasilkan
nilai akurasi, precision, recall dan AUC(Area Under Curve).
Berikut adalah gambar 4.6 pengujian algoritma C4.5 pada Rapid Miner,
51
Actual
Puas Tidak Puas
Pred. Puas 124 16
Pred. Tidak Puas 11 49
Jumlah true positive (tp) sebanyak 124 record, false positive (fp) sebanyak
11 record, jumlah true negative (tn) sebanyak 49 record dan jumlah false
negative (fn) sebanyak 16 record.
52
Akurasi yang dihasilkan dari pengujian 1 pada Rapid Miner sebesar 86,50%.
Berikut adalah perhitungan akurasi :
tp tn
Akurasi = x100%
tp tn fp fn
124 49
= x100%
124 49 11 16
= (173 / 200) x 100%
= 0,865 x 100%
= 86,50%
Nilai precision dihitung dengan cara membagi jumlah data benar yang
bernilai positif (True Positive) dibagi dengan jumlah data benar yang bernilai
positif (True Positive) dan data salah yang bernilai negatif (False Negative)
TP
Precision = x100%
TP FN
124
= x100%
124 16
124
= x100%
140
= 88,57%
Nilai recall dihitung dengan cara membagi jumlah data benar yang bernilai
positif (True Positive) dibagi dengan jumlah data benar yang bernilai positif
(True Positive) dan data salah yang bernilai positif (False Positive)
TP
Recall = x100%
TP FP
124
= x100%
124 11
124
= x100%
135
= 91,85%
53
4.3.2 Pengujian 2
Pengujian ini dilakukan dengan membagi sebanyak 5 bagian pada 200 data
kuisioner yang akan di uji. 5 bagian tersebut terdiri dari 4 bagian data training
dan 1 bagian data testing. Dan dalam pengujian ini akan menghasilkan nilai
akurasi, precision, recall dan AUC(Area Under Curve).
54
Berikut adalah gambar 4.9 pengujian algoritma C4.5 pada Rapid Miner,
digunakan cross validation untuk pengujian model dengan number of validation
5.
Actual
Puas Tidak Puas
Pred. Puas 125 15
Pred. Tidak Puas 10 50
Jumlah true positive (tp) sebanyak 125 record, false positive (fp) sebanyak
10 record, jumlah true negative (tn) sebanyak 50 record dan jumlah false
negative (fn) sebanyak 15 record.
Akurasi yang dihasilkan dari pengujian 2 pada Rapid Miner sebesar 87,50%.
Berikut adalah perhitungan akurasi :
tp tn
Akurasi = x100%
tp tn fp fn
125 50
= x100%
125 50 10 15
= (175 / 200) x 100%
= 0,875 x 100%
= 87,50%
Nilai precision dihitung dengan cara membagi jumlah data benar yang
bernilai positif (True Positive) dibagi dengan jumlah data benar yang bernilai
positif (True Positive) dan data salah yang bernilai negatif (False Negative)
TP
Precision = x100%
TP FN
125
= x100%
125 15
125
= x100%
140
= 89,29%
Nilai recall dihitung dengan cara membagi jumlah data benar yang bernilai
positif (True Positive) dibagi dengan jumlah data benar yang bernilai positif
(True Positive) dan data salah yang bernilai positif (False Positive)
56
TP
Recall = x100%
TP FP
125
= x100%
125 10
125
= x100%
135
= 92,59%
Hasil AUC (Area Under Curve) pada Pengujian 2 sebagai berikut
4.3.3 Pengujian 3
Pengujian ini dilakukan dengan membagi sebanyak 3 bagian pada 200 data
kuisioner yang akan di uji. 3 bagian tersebut terdiri dari 2 bagian data training
dan 1 bagian data testing. Dan dalam pengujian ini akan menghasilkan nilai
akurasi, precision, recall dan AUC(Area Under Curve).
57
Berikut adalah gambar 4.12 pengujian algoritma C4.5 pada Rapid Miner,
digunakan cross validation untuk pengujian model dengan number of validation
3.
Actual
Puas Tidak Puas
Pred. Puas 128 17
Pred. Tidak Puas 7 48
Jumlah true positive (tp) sebanyak 128 record, false positive (fp) sebanyak
7 record, jumlah true negative (tn) sebanyak 48 record dan jumlah false negative
(fn) sebanyak 17 record.
Akurasi yang dihasilkan dari pengujian 3 pada Rapid Miner sebesar 88,00%.
Berikut adalah perhitungan akurasi :
tp tn
Akurasi = x100%
tp tn fp fn
128 48
= x100%
125 50 7 17
= (176 / 200) x 100%
= 0,88 x 100%
= 88,00%
Nilai precision dihitung dengan cara membagi jumlah data benar yang
bernilai positif (True Positive) dibagi dengan jumlah data benar yang bernilai
positif (True Positive) dan data salah yang bernilai negatif (False Negative)
TP
Precision = x100%
TP FN
128
= x100%
128 17
128
= x100%
145
= 88,28%
Nilai recall dihitung dengan cara membagi jumlah data benar yang bernilai
positif (True Positive) dibagi dengan jumlah data benar yang bernilai positif
(True Positive) dan data salah yang bernilai positif (False Positive)
59
TP
Recall = x100%
TP FP
128
= x100%
128 7
128
= x100%
135
= 94,81%
Hasil AUC (Area Under Curve) pada Pengujian 3 sebagai berikut
Berdasarkan table yang telah dijelaskan di atas, maka dapat diketahui bahwa
pada K-Fold Validasi 10 memiliki nilai akurasi 86,50%, Precision 88,28%, dan
recall 94,81%. sedangkan K-Fold Validasi 5 memiliki nilai akurasi 87,50%,
Precision 89,29%, dan recall 92,59%. Dan untuk K-Fold Validasi 3 memiliki
nilai akurasi tertinggi yaitu 88,00%, Precision 88,28%, dan recall 94,81%. Maka
semakin kecil nilai K-Fold Validation semakin tinggi nilai akurasi yang di dapat.
4.5 Implementasi
Berdasarkan proses pengolahan data menggunakan Algoritma C4.5 yang
telah menghasilkan pohon keputusan dan rule yang telah terbentuk, selanjutnya
akan diimplementasikan rule tersebut untuk membuat program prediksi data
kuisioner menggunakan tools NetBeans. Adapun design tampilan program dan
codingnya berada di lampiran.
BAB V
5.2 Saran
Untuk meningkatkan kinerja dan menyempurnakan penelitian yang telah
dibuat, peneliti memberikan saran sebagai berikut :
61
DAFTAR PUSTAKA
[1] Deddy Setyawan, “Analisis Kepuasan Pengguna Jasa Transportasi Taksi Untuk
Meningkatkan Loyalitas,” Universitas Diponegoro, 2010.
[5] Han, Jiawei dan Kamber, Micheline, “Data Mining Concepts and Techniques
Second Edition,” San Francisco: Morgan Kauffman, 2001.
[6] Ibnu Fathur Rochman, “Penerapan Algoritma C4.5 Pada Kepuasan Pelanggan
Perum DAMRI,” Universitas Dian Nuswantoro, 2015.
[7] Teguh Budi Santoso, “Analisa dan penerapan metode C4.5 Untuk Prediksi
Loyalitas Pelanggan,” Universitas Satya Negara Indonesia, 2014.
[8] David Hartanto Kamagi, Seng Hansun, “ Implementasi Data Mining dengan
Algoritma C4.5 untuk memprediksi Tingkat Kelulusan Mahasiswa,” Universitas
Multimedia Nusantara, Juni 2014.
[9] Anik Andriani, “ Penerapan Algoritma C4.5 Pada Progam Klasifikasi Mahasiswa
Dropout,” AMIK BSI Jakarta, 2012.
62
63
[13] Santosa, B. “ Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis,”
Graha Ilmu, Yogyakarta. 2007.
[16] Chapman P, “ CRISP-DM 1.0: Step-by-step Data Mining Guide, SPSS,” 2000.
[17] Kusrini dan Emha Taufiq Luthfi, “Alogaritma Data Mining.” Yogyakarta: Andi
Publisher, 2009.
[18] Basuki dan Syarif, "Modul Ajar Decision Tree," Surabaya, 2003
[19] Burns, Alvin C. dan Bush, Ronald F, “Marketing Research”, Prentice Hall, New
Jersey, 2000
1. HARGA
NO PERTANYAAN STS TS N S SS
(1) (2) (3) (4) (5)
1. Taksi kosti tarif harganya relatif terjangkau
2. FASILITAS
NO PERTANYAAN STS TS N S SS
(1) (2) (3) (4) (5)
Fasilitas di dalam mobil seperti (Argo, AC, pembuka
1.
jendela, dll) dengan lengkap serta dapat berfungsi
dengan baik.
2. Tempat duduk sangat bersih, rapih, dan bagus.
3. Taksi yang digunakan memiliki mesin yang selalu
baik sehingga jarang mengalami kerusakan di jalan.
4. Taksi Dilengakapi Dengan Asuransi Untuk Tiap
Penumpang
64
65
3. PELAYANAN
NO PERTANYAAN STS TS N S SS
(1) (2) (3) (4) (5)
4. LOYALITAS
NO PERTANYAAN STS TS N S SS
(1) (2) (3) (4) (5)
Puas
Tidak puas
LAMPIRAN 2
67
68
e. Kolom Fasilitas : Terdapat 4 pertanyaan yang dapat diisi oleh pengisi kuisioner
dengan rentang jawaban dari 1 – 5
f. Kolom Pelayanan : Terdapat 8 pertanyaan yang dapat diisi oleh pengisi
kuisioner dengan rentang jawaban dari 1 – 5
g. Kolom Loyalitas : Terdapat 5 pertanyaan yang dapat diisi oleh pengisi kuisioner
dengan rentang jawaban dari 1 – 5
h. Tombol Rata-rata sebagai fungsi untuk mendapatkan rata-rata dari setiap
kelompok variable yang terdiri dari beberapa pertanyaan
i. Tombol Hasil digunakan untuk melihat hasil dari tingkat kepuasan konsumen
apakah PUAS atau TIDAK PUAS
j. Tombol Refresh digunakan untuk mereset data atau program agar kosong
kembali.
k. Tombol Simpan digunakan untuk menyimpan data dari pengisi kuisioner ke
dalam database.
Filter angka digunakan agar pada kolom pengisian nama hanya bisa diisi
dengan huruf dan tidak bisa diisi dengan angka.
Sama Seperti Kolom Harga Tiap pertanyaan memiliki JRadiobutton yang akan
dipilih dan memiliki nilai. yang membedakan adalah pada rata-rata pada
kolom fasilitas rata-rata berbentuk tombol karena Kolom Fasilitas terdiri dari
4 pertanyaan, jadi nilai rata-rata fasilitas di dapat dari jumlah nilai masing-
masing pertanyaan dan di bagi jumlah pertanyaan itu.
h. Kolom Pelayanan (Fungsi Rata-rata Pelayanan)
n. Fungsi Simpan