Anda di halaman 1dari 10

eProsiding Sistem Informasi (POTENSI), Vol. 1 No.

1 November 2020
E-ISSN: 162

PREDIKSI MINAT KLIEN PADA PRODUK DEPOSITO


MENGGUNAKAN ALGORITMA SVM PARAMETER
KERNEL POLYNOMIAL
Dani Saputra1, Maxsi Ary2
1 Universitas Adhirajasa Reswara Sanjaya

Jl. Sekolah Internasional No. 1-2 Antapani, Bandung, 022-7100124


e-mail: dantra1207@gmail.com

2Universitas Adhirajasa Reswara Sanjaya


Jl. Sekolah Internasional No. 1-2 Antapani, Bandung, 022-7100124
e-mail: maxsi@ars.ac.id

Abstrak
Departement Telemarketing Bank dituntut mampu membuat target klien, karena kinerja
telemarketing bank dinilai dari target klien yang berminat pada produk bank yang ditawarkan
untuk mendukung telemarketing bank meningkatkan keberhasilannya dalam promosi, maka
dilakukan prediksi untuk menentukan keputusan klien berminat atau tidak pada produk deposito,
akan tetapi kepada nasabah atau klien yang memiliki potensial untuk menerima penawaran dari
telemarketing bank, yang dimana dapat meminimalisir kerugian biaya dalam promosi kepada
klien. Maka dapat dilakukan penerapan dan pemanfaatan teknik data mining guna memprediksi
minat klien menggunakan Support Vector Machine yang merupakan salah satu teknik yang cocok
untuk melakukan prediksi. Dengan menerapkan K-Fold Cross Validation untuk mengevaluasi
kinerja model atau algoritma dimana data dipisahkan mejadi dua subset data proses
pembelajaran dan data validasi. Setelah penelitian selesai dilakukan, maka muncul nilai akurasi
dari metode Support Vector Machine K-Fold Cross Validation sebesar 94,91% dengan nilai AUC
0.979 dengan menggunakan 10-fold K Validation. Kemudian dilakukan kembali perhitungan lebih
dengan parameter Kernel Polynominal mendapatkan hasil akurasi lebih besar dengan nilai
akurasi sebesar 95,18% dengan nilai AUC 0,974.
Kata Kunci: Prediksi, Bank Marketing Data Set, Support Vector Machine, Kernel Polynominal,
Klasifikasi

Abstract
The Telemarketing Department of the Bank is demanded to be able to make the target
client, because the performance of the bank telemarketing is assessed from the target of clients
who are interested in the bank products offered to support the telemarketing bank to increase its
success in promotion, then predictions are made to determine whether or not the client's decision
is interested in deposit products. customers or clients who have the potential to receive offers
from telemarketing banks, which can minimize cost losses in promotions to clients. So the
application and utilization of data mining techniques can be done to predict client interests using
Support Vector Machine which is one technique that is suitable for making predictions. By
applying K-Fold Cross Validation to evaluate the performance of a model or algorithm where the
data is separated into two subsets of learning process data and validation data. After the research
is completed, the accuracy of the Support Vector Machine K-Fold Cross Validation method is
94,91%with AUC value of 0.979 using 10-fold K Validation. Then do more calculations with
Polynominal Kernel parameters to get greater accuracy with an accuracy value of 95,18% with
an AUC value of 0,974.
Keywords: Prediction, Bank Marketing Data Set, Support Vector Machine, Polynominal Kernel,
Classification

http://eprosiding.ars.ac.id/index.php/psi
163

1. Pendahuluan besar kapasitasnya disimpan sebagai


Percepatan transaksi keuangan database dan diolah kembali untuk
pada zaman modern sangatlah diperlukan menghasilkan informasi yang berkaitan
oleh setiap orang, sebab dengan tentang nasabah, data tersebut pula dapat
kemudahan dalam bertransaksi maka digunakan untuk keperluaan menjaga
semua hal tentang kebutuhan pun akan hubungan bank dengan nasabah, maka
lebih mudah dilakukan. Oleh karena itu salah satu caranya ialah dengan ketentuan
teknologi menjadi faktor terpenting dalam individual dalam target pemasaran produk
percepatan transaksi, terutama pada bidang bank (Aqham & Hartomo, 2019). Untuk
teknologi komunikasi yang akan membawa mendapatkan kelayakan dalam suatu
konsekuensi pada manusia untuk selalu kehidupan banyak orang maka perlu
meningkatkan kualitas hidupnya. Seiring bantuan dari beberapa masyarakat yang
berkembangnya teknologi, kebutuhan memiliki dana berlebih dan
tenaga kerja pada dibidang industri menyumbangkan dana tersebut kepada
komunikasi akan semakin dibutuhkan, masyarakat lain dalam bentuk kredit,
seperti dalam bidang kerja telemarketing biasanya badan usaha terbesar yang
yang akan mengalami perkembangan menghimpun dana simpanan dan
seiring dengan berkembangannya teknologi memberikan bantuan dana kepada yang
(Ghani et al., 2019). membutuhkannya disebut dengan bank
Kemajuan terhadap teknologi (Sulaehani, 2016).
sangatlah mempengaruhi pemasaran Pada masa sekarang, beberapa
domain dengan permintaan yang sangat perusahaan besar seperti operator jaringan
spesifik, jadi banyak perusahaan yang lebih seluler biasanya menggunakan cara melalui
memilih kampanye pemasaran target panggilan untuk menawarkan sebuah
dengan media telekomunikasi dari pada produk atau layanannya, karena sifatnya
kampanye pemasaran massal secara memang secara pribadi langsung kepada
langsung dilapangan. Untuk melakukan konsumen, dan biasanya cara ini cenderung
kampanye pemasaran target ialah dengan berhasil karena dapat dengan mudah
mempelajari subdomain dan penambangan diterima oleh klien, serta telemarketing
data, yang dapat dipelajari dari teknik sendiri merupakan sebuah cara baru dalam
otomatis untuk pembelajaran membuat bidang pemasaran yang menggunakan
prediksi yang akurat dan spesifik teknologi komunikasi sebagai bagian dari
berdasarkan pengamatan masa lalu. sarana pemasaran yang teratur dan
Pembelajaran mesin menggunakan dua terstruktur (Saputra, 2017). Pemesanan
jenis teknik: pembelajaran terbimbing jarak jauh diidentikan sebagai pengguna
(klasifikasi dan regresi), yang melatih model telepon atau sering disebut pusat panggilan
input dan output yang telah diketahui untuk menarik prospek klien,
datanya sehingga dapat memprediksi mempromosikan kepada pelanggan tentang
keluaran di masa depan, dan selanjutnya apa yang dimiliki oleh pihak bank, serta
ialah tanpa pengawasan learning menjawab pertanyaan dan mengambil
(clustering), yang menemukan pola-pola pesanan klien melalui alat telekomunikasi.
yang tersembunyi atau intrinsik terstruktur Departement telemarketing bank dituntut
dalam inputan data (Tekouabou et al., mampu membuat target klien, karena kinerja
2019). telemarketing bank dinilai dari target klien
Dengan memanfaatkan teknologi yang berminat pada produk bank yang
yang sudah canggih, bank dapat ditawarkan. Untuk mendukung
menggunakan alat komunikasi jarak jauh telemarketing bank meningkatkan
seperti telepon atau media elektronik keberhasilannya dalam promosi, maka
lainnya. Pihak bank biasanya melakukan dilakukan prediksi untuk menentukan
strategi untuk mempromosikan produk dan keputusan klien berminat atau tidak pada
layanan jasanya kepada klien, dari produk deposito, yang dimana dapat
beberapa produk yang diamati ialah meminimalisir kerugian biaya dalam
deposito. Deposito adalah produk investasi panggilan promosi kepada klien. Dalam
dengan menyimpan uang dengan kurun suatu proses penawaran produk deposito,
waktu tertentu untuk penarikannya yang bank tidak melakukan penawarannya ke
telah dijanjikan oleh pihak bank dengan semua nasabah atau kliennya, akan tetapi
persetujuan nasabah (WK & Adani, 2018). kepada nasabah atau klien yang memiliki
Bank pun memiliki data yang cukup sangat potensial untuk menerima penawaran dari

http://eprosiding.ars.ac.id/index.php/psi
164

telemarketing bank. Untuk menentukan menggunakan metode KNN memiliki tingkat


potensial terhadap nasabah atau klien yang akurasi sebesar 80%.
akan di tawarkan, maka bank memerlukan Dari penelitian ketiga yang disusun
sebuah system perhitungan agar tepat oleh (Ferawaty, Zarlis, & Nababan, 2016)
sasaran. Salah satu yang dapat diterapkan dengan judul Analisis Perbandingan Akurasi
adalah dengan menerapkan metode Data dalam Identifikasi Autism dengan SVM dan
Mining (Agustina, 2019). Naive Bayes hasil akurasi dengan
Penulis melakukan perhitungan menggunakan metode SVM lebih besar
dengan algoritma Support Vector Machine yaitu sebesar 93.12% sedangkan
dengan basis perhitungan data mining, yang menggunakan metode Naïve Bayes yaitu
dimana membuat klasifikasi perhitungan sebesar 73.34%.
tentang prediksi klien menggunakan data- Dari ketiga jurnal yang telah
set public dari UCI Dataset. Dalam data-set disebutkan dapat disimpulkan bahwa
tersebut memiliki setidaknya 17 atribut yang metode SVM mempunyai kelebihan dari
dapat dilakukan sebuah ketentuan segi akurasi dibanding metode Naïve Bayes,
perhitungan untuk menghasilkan nilai KNN dan Neural Network, hal itu disebabkan
akurasi dari minat klien, serta untuk karena svm memiliki kelebihan pada
menentukan atribut mana yang dapat Generalisasi, Curse Of Dimensionality,
mengurangi akurasi dan menambahkan Feasibility.
akurasi pada perhitungan klasifikasi minat SVM merupakan salah satu metode
klien. Maka dapat dilakukan penerapan dan unggulan dibidang pattern recognition,
pemanfaatan teknik data mining guna sebagai algoritma yang terhitung masih baru
memprediksi minat klien menggunakan (1992), SVM berkembang pesat karena
SVM yang merupakan salah satu teknik berprinsip Structural Risk Minimization
yang cocok untuk melakukan prediksi, (SRM) dengan tujuan menemukan
karena pemisah dua buah class pada input hyperplane terbaik untuk memisahkan dua
space dijabarkan dengan sederhana untuk buah kelas pada suatu space sehingga
mencari hyper terbaik untuk mendapatkan algoritma ini cocok untuk diimplementasikan
nilai terbaik dalam akurasi (Sulaehani, sebagai clasificator. Berbeda dengan
2016). strategi neural network yang berusaha
Kelebihan dari metode SVM adalah mencari hyperplane pemisah antar class,
SVM dapat menentukan hyperplane atau SVM berusaha menemukan hyperplane
bidang pemisah dengan memilih bidang yang terbaik pada input space. Prinsip dasar
dengan optimal margin maka generalisasi SVM adalah linear classifier, dan
pada SVM dapat terjaga dengan sendirinya, selanjutnya dikembangkan agar dapat
tingkat generalisasi pada SVM tidak bekerja pada problem non-linear. dengan
dipengaruhi oleh jumlah data latih, dengan memasukkan konsep kernel trick pada
menentukan parameter soft margin, noise ruang kerja berdimensi tinggi (Aulia,
dapat dikontrol sehingga makin besar Hadiyoso, & Ramadan, 2015). Selain itu
parameter soft margin, makin besar pula alasan yang kedua SVM memiliki tahapan-
pinalti yang dikenakan pada kesalahan pada tahapan seperti transormasi data, matrik k,
klasifikasi sehingga proses pelatihan pendugaan koefisien weight (w) dan bias
semakin ketat. (Nugroho, Witarto, & (b).
Handoko, 2003). Pada penelitian dengan judul
Dari jurnal yang disusun oleh Perbandingan Metode Data Mining SVM
(Amalia, 2018) dengan judul Perbandingan dan NN Untuk Klasifikasi Penyakit Ginjal
Metode Data Mining SVM dan NN Untuk Kronis (Amalia, 2018) disimpulkan bahwa
Klasifikasi Penyakit Ginjal Kronis, SVM Penelitian ini melakukan pengolahan
memiliki tingkat akurasi yang lebih tinggi dataset penyakit ginjal kronis yang diperoleh
yaitu 95.16% sedangkan akurasi dari dari uci repository. Peneliti melakukan
metode Neural Network adalah 93.36%. pengolahan data untuk memperoleh motede
Dari penelitian kedua yang disusun mana yang memiliki nilai akurasi yang lebih
oleh (Budianto, Maryono, & Ariyuana, 2018) tinggi bagi dataset penyakit ginjal kronis.
yang berjudul Perbandingan K-Nearest Diketahui dari hasil penelitian yaitu dengan
Neighbor (KNN) Dan Support Vector metode Neural Network diperoleh nilai
Machine (SVM) Dalam Pengenalan Karakter akurasi 93,36% dan metode Support Vector
Plat Kendaraan Bermotor mempunyai Machine (SVM) diperoleh nilai akurasi
tingkat akurasi 95% sedangkan dengan 95.16%. Hasil yang diperoleh termasuk

http://eprosiding.ars.ac.id/index.php/psi
165

dalam jenis klasifikasi sangat baik. Sehingga penelitian pengembangan (research and
dapat disimpulkan bahwa SVM dan NN devlopment). Berdasarkan tingkat
memiliki performa kinerja yang baik untuk kealamiannya, metode penelitian dapat
pengolahan dataset penyakit ginjal kronis. dikelompokan menjadi metode penelitian
Dan dari hasil penelitian diketahui untuk eksperimen, survey dan naturalistik
dataset ginjal kronis bahwa metode SVM (Suhardjono et al., 2019).
menghasilkan nilai akurasi yang lebih tinggi Menurut Nurdin & Hartati (2019: 13)
dari metode Neural Network. menyimpulkan bahwa ”penelitian (research)
Pada penelitian dengan judul pada hakikatnya merupakan salah satu cara
Perbandingan K-Nearest Neighbor (KNN) untuk menyelesaikan suatu masalah atau
Dan Support Vector Machine (SVM) Dalam mencari jawaban dari persoalan yang
Pengenalan Karakter Plat Kendaraan dihadapi secara ilmiah. Penelitian
Bermotor (Budianto, Maryono, & Ariyuana, menggunakan cara berpikir reflektif, berpikir
2018) disimpulkan bahwa dari hasil keilmuan dengan prosedur yang sesuai
pengenalan karakter plat nomor dengan dengan tujuan dan sifat penyelidikan”.
metode SVM dan KNN didapatkan hasil Metode penelitian secara umum,
bahwa Prosentase akurasi pengenalan memiliki 4 metode penelitian yaitu:
dengan metode SVM adalah 95%. penelitian tindakan, eksperimen, studi
Sedangkan Pengenalan dengan kasus, dan survey (Dawson, 2009). Pada
menggunakan metode KNN adalah 80%. metode penelitian yang digunakan adalah
Terjadi beberapa kesalahan dalam eksperimen dan tahapan dalam penelitian
mengenali karakter yang hampir mirip yang dapat dilihat pasda Gambar 1
seperti 8 dengan B, 0 dengan O dan Q dan Pengumpulan
Data
beberapa karakter yang lain.
Pada penelitian dengan judul Pengolahan
Data Awal
Analisis Perbandingan Akurasi dalam
Identifikasi Autism dengan SVM dan Naive Model yang
Bayes (Ferawaty, Zarlis, & Nababan, 2016). Diusulkan

Berdasarkan pengujian dengan Eksperimen


menggunakan banyak data yang berbeda – dan
Pengujian
beda saat percobaan dapat diambil Evaluasi
kesimpulan bahwa Metode SVM dan Validasi
hasil
menghasilkan tingkat akurasi rata - rata
klasifikasi 93,12%. Hasil 93,12% ini Gambar 1. Rancang Penelitian
merupakan total dari hasil rata – rata dari Sumber : Dawson (2009)
beberapa percobaan yang telah dilakukan
dengan menggunakan metode SVM. 2.1 Pemodelan yang diusulkan
Metode Naive Bayes menghasilkan rata – Setelah menentukan metode yang
rata klasifikasi 73,34%. Hasil 73,34% ini akan digunakan selanjutnya menetukan
merupakan total dari hasil rata – rata dari pemodelan yang diusulakan, pemodelan
beberapa percobaan yang telah dilakukan yang diusulkan dapat dilihat pada Gambar 2
dengan menggunakan metode Naive Bayes.

2. Metode Penelitian
Penelitian atau research dapat
diartikan mecari kembali. Re yang berarti
kembali dan To Seacrh ialah mencari.
Dikatakan mencari kembali karena teori atau
hasil penelitian sebelumnya belum tentu
benar selamanya. Oleh sebab itu, waktu,
objek dan lokasi yang berbeda dapat
dilakukan penelitian kembali Obyek yang
diteliti berdasarkan tujuan dan tingkat
kealamian (natural setting) yang
diklasifikasikan disebut dengan metode
penelitian. Berdasarkan tujuannya, metode
penelitian pun dapat diklasifikasikan menjadi
penelitian terapan (applied research) dan Gambar 2. Pemodelan yang diusulkan

http://eprosiding.ars.ac.id/index.php/psi
166

Menurut Noor (2018), SVM dapat


2.2 Prediksi diartikan sebagai salah satu proses yang
Prediksi ialah salah satu cara atau paling berpengaruh dan kuat untuk
proses yang memperkirakan secara urut memecahkan sebuah type klasifikasi. SVM
dan sistematis dalam mengenai sesuatu sendiri ialah seperangkat metode yang
yang mungkin dapat terjadi pada masa terkait untuk suatu metode pembelajaran,
depan berdasarkan adanya informasi pada untuk kedua masalah klasifikasi dan regresi.
suatu kejadian yang sudah terjadi dan yang Dengan berorientasi pada suatu tugas, hasil
sekarang diperoleh, agar tingkat kegagalan yang kuat, sifat komputerisasi yang mudah
dan kesalahan yang terjadi dapat diperkecil. dikerjakan, SVM mampu mencapai sukses
Dalam suatu prediksi mungkin saja besar hingga dianggap sebagai state-of-the-
jawabannya tidak ada pada suatu kepastian, art classifier pada saat ini. Dua kelas data
tentang apa yang nantinya terjadi pada yang digambarkan sebagai lingkaran dan
kejadian yang akan mendatang, akan tetapi pada titik-titik yang disajikan pada sebuah
nanti ada upaya untuk mencari jawaban angka. Secara intuitif diamati, ada banyak
yang akurat saat sesuatu terjadi keputusan hyperplanes yang dapat
(Kusumodestoni & Sarwido, 2017). digunakan untuk memisahkan kedua
Prediksi pula sama artiannya kelompok data. Namun, yang digambarkan
dengan ramalan atau perkiraan. Prediksi dengan angka ini dipilih sebagai yang
bisa berdasarkan metode ilmiah ataupun menguntungkan memisahkan bidang,
subjektif belaka. Kesimpulannya ialah karena mengandung margin bermuatan
prediksi memiliki pengertian tergantung maksimal antara dua kelas. Karena itu,
pada konteks atau permasalahannya. dalam tujuan fungsi svm, sebuah istilah
Berbeda dengan pengertian prediksi secara regularization mewakili margin muncul.
bahasa yang berarti ramalan atau perkiraan Apalagi seperti yang terlihat di angka ini,
pada suatu yang menjadi pengertian yang hanya mereka yang penuh poin disebut
baku (Amak Yunus EP, 2017). mendukung vektor terutama menentukan
memisahkan bidang, sementara poin lain
2.3 Metode SVM tidak memberi kontribusi untuk margin di
semua. Dalam kata lain, hanya menjadi
Algoritma Support Vector Mchine sejumlah titik penting untuk melakukan
(SVM) dikembangkan oleh Boser, Guyon, klasifikasi tujuan dalam kerangka SVM dan
Vapnik, pertama kali dipresentasikan pada
dengan demikian harus diambil hasilnya.
tahun 1992 di Annual Workshop on
Banyak teknik data mining atau
Computational Learning Theory. Suatu
machine learning yang dikembangkan
teknik yang relatif baru dilakukan untuk
dengan asumsi kelinieran. Sehingga
memprediksi, baik dalam kasus klasifikasi algoritma yang dihasilkan terbatas untuk
maupun regresi, yang sangat populer kasus-kasus yang linier. Oleh sebab itu, apa
belakangan ini dengan selalu mencapai
bila suatu kasus klasifikasi memperlihatkan
solusi yang sama untuk setiap running dan
ketidaklinieran, seperti perceptron misalnya,
berusaha untuk menemukan fungsi pemisah
maka tidak bisa diatasi. Secara umum,
(klasifier) yang optimal dan mampu
kasus-kasus di dunia nyata adalah kasus
memisahkan dua set data dari dua kelas yang tidak linier (Budi Santosa, 2018: 198).
yang berbeda, perfomansinya meyakinkan Data pada suatu dataset diberikan
dalam memprediksi kelas suatu data baru
variable xi, sedangkan kelas pada dataset
(Abbas, 2016). Proses cara kerja SVM dapat
diberikan variable yi. Metode SVM membagi
dilihat pada Gambar 5
dataset menjadi 2 kelas. Kelas pertama
yang akan dipisah oleh hyperplane bernilai
1 jika Xi.W + b ≥ 1 untuk yi = 1, sedangkan
kelas lainnya bernilai -1 jika Xi.W + b ≤ -1
untuk yi = -1. Bobot vector (w) adalah garis
vector yang tegak lurus antara titik pusat
kordinat dengan garis hyperplane. Bias (b)
merupakan garis relative terhadap titik
Gambar 5. SVM Hyperlane Terbaik Yang kordinat. merupakaan persamaan untuk
Memisahkan Antara Class +1 dan -1 menghitung nilai b dan persamaan mencari
(Sumber Prima Wiajaya & Muslim, 2016) nilai w (Parapat et al., 2018). sebagai
berikut:

http://eprosiding.ars.ac.id/index.php/psi
167

1
b = - (w.x + + W.x -) (1) 2.5 Pengolahan Data Pertama
2
2 Data yang akan diolah
w= ∑𝑛𝑖=1 𝛼i yi xi (2) menggunakan data yang berbentuk numerik
Banyak teknik data mining atau pada atribut data bank marketing dataset,
machine learning yang dikembangkan dari 17 atribut pada dataset bank marketing
dengan asumsi kelinieran, sehingga ada 7 atribut yang memiliki data numerik
algoritma yang dihasilkan terbatas untuk ialah sebagai berikut: (x1) age, (x2) balance,
kasus-kasus yang linier (Santosa, 2007). (x3) day, (x4) duration, (x5) campaign, (x6)
SVM dapat bekerja pada data non-linier pdays, (x7) previous, dan satu atribut class
dengan menggunakan pendekatan kernel dengan label Y (1) untuk Yes dan (-1) untuk
pada fitur data awal himpunan data. Fungsi No.
kernel yang digunakan untuk memetakan Dari atribut yang telah diambil maka
dimensi awal (dimensi yang lebih rendah) selanjutnya adalah menentukan jumlah data
himpunan data ke dimensi baru (dimensi yang diolah sebesar 36 data yang dimana
yang relatif lebih tinggi). Menurut Prasetyo terdiri dari 6 data latih untuk menentukan
(2012) macam fungsi kernel diantaranya: pemodelan dan 30 data uji yang akan
1. Kernel Gaussian Radial Basic Function ditentukan hasil dalam prediksi untuk
(RBF) mengklasifikasikan klien berminat atau tidak
∥ xi − xj ∥ 2 pada produk deposito.seperti pada table
𝐾(𝑥𝑖, 𝑥𝑗) = 𝑒𝑥𝑝 (− )
2𝑎² data berikut.
2. Kernel Polynomial Tabel 1. Data Awal
𝐾(𝑥𝑖, 𝑥𝑗) = (𝑥𝑖. 𝑥𝑗 + 𝐶)𝑑 No X1 X2 X3 X4 X5 X6 X7 Y
dan adalah pasangan dua data training. 1 30 1787 19 79 1 -1 0 -1
2 33 4789 11 220 1 339 4 -1
Parameter merupakan konstanta. Fungsi
3 35 1350 16 185 1 330 1 -1
kernel mana yang harus digunakan untuk 4 30 1476 3 199 4 -1 0 -1
subtitusi dot product di feature space sangat 5 59 0 5 226 1 -1 0 -1
tergantung pada data karena fungsi kernel 6 35 747 23 141 2 176 3 -1
ini akan menentukan fitur baru di mana 7 36 307 14 341 1 330 2 -1
hyperplane akan dicari (Santosa, 2007). 8 39 147 6 151 2 -1 0 -1
9 41 221 14 57 2 -1 0 -1
10 43 -88 17 313 1 147 2 -1
2.4 Pengumpulan Data 11 39 9374 20 273 1 -1 0 -1
Pada penelitian ini penulis 12 43 264 17 113 2 -1 0 -1
13 36 1109 13 328 2 -1 0 -1
menggunakan data publik dari UCI Machine 14 31 360 29 89 1 241 1 -1
Learning Repository dengan nama data 15 40 194 29 189 2 -1 0 -1
Bank Marketing Data Set, yang mudah 16 56 4073 27 239 5 -1 0 -1
diakses dan tersedia untuk publik karena 17 37 2317 20 114 1 152 2 -1
bersifat terbuka. Dataset tersebut 18 25 -221 23 250 1 -1 0 -1
19 55 1613 3 296 1 270 3 1
dipublikasikan pada tahun 2014. Dataset
20 34 1337 17 330 2 127 3 1
terdiri dari 45211 record, serta terdiri dari 17 21 63 3904 4 250 2 187 2 1
atribut. Dimana setiap atribut memeberikan 22 48 1147 5 389 1 64 2 1
informasi tentang profil klien dan 23 36 1049 14 224 4 -1 0 1
pendekatan seorang telemarketing dalam 24 54 2206 12 104 1 99 2 1
mempromosikan sebuah produk, serta satu 25 38 1988 27 164 2 130 2 1
26 33 661 18 968 1 -1 0 1
atribut kelas yang memberikan informasi 27 59 1 15 159 2 378 3 1
klien berminat atau tidak pada deposito yang 28 37 480 22 344 2 182 8 1
ditawarkan. Informasi yang dibawakan pada 29 37 189 1 238 1 107 2 1
Bank Marketing Data Set seperti: age, job, 30 57 0 28 648 1 -1 0 1
marital, education, default, housting, loan, 31 60 366 3 593 1 -1 0 1
32 44 205 3 289 1 -1 0 1
contact, month, day of week, duration, 33 32 5514 22 319 1 182 1 1
campaign, pdays, previous, poutcome dan y 34 33 273 16 803 1 -1 0 1
(S. Moro, P. Cortez dan P. Rita). 35 28 4579 12 409 2 -1 0 1
Dari jumlah data yang begitu besar 36 37 5106 30 244 1 -1 0 1
tidak dapat diproses, karena terlalu lama
untuk dilakukan perhitungan pada aplikasi Tabel 2. Data Latih
yang digunakan. Maka pada tahapan X1 X2 X3 X4 X5 X6 X7 Y
selanjutnya data akan diperkecil agar lebih 35 747 23 141 2 176 3 -1
43 264 17 113 2 -1 0 -1
cepat dalam pemprosesan perhitungannya. 25 -221 23 250 1 -1 0 -1

http://eprosiding.ars.ac.id/index.php/psi
168

54 2206 12 104 1 99 2 1 1. Transformasi Data


57 0 28 648 1 -1 0 1 Lakukan normalisasi data sehingga
37 5106 30 244 1 -1 0 1
data tersebut bernilai antara 0 dan 1 yang
dapat dilihat pada tabel 1 dengan
Tabel 3. Data Uji menggunakan persamaan :
X1 X2 X3 X4 X5 X6 X7 Y
30 1787 19 79 1 -1 0 -1
08 ∗ (𝑋 − 𝑎)
𝑋𝑛 = = 0.1
33 4789 11 220 1 339 4 -1 𝑏−𝑎
35 1350 16 185 1 330 1 -1 Dimana :
30 1476 3 199 4 -1 0 -1 Xn = Nilai ke-n
59 0 5 226 1 -1 0 -1 A = Nilai angka Terendah
36 307 14 341 1 330 2 -1
39 147 6 151 2 -1 0 -1
B = Nilai angka Tertinggi
41 221 14 57 2 -1 0 -1 0.8 dan 0.1 = Ketetapan
43 -88 17 313 1 147 2 -1 Dari rumus transformasi data yang sudah
39 9374 20 273 1 -1 0 -1 dihitung, maka menghasilkan nilai data yang
36 1109 13 328 2 -1 0 -1 dapat dilihat pada Tabel 4
31 360 29 89 1 241 1 -1
40 194 29 189 2 -1 0 -1
56 4073 27 239 5 -1 0 -1 Tabel 4. Transformasi Data
37 2317 20 114 1 152 2 -1 X1 X2 X3 X4 X5 X6 X7 Y
55 1613 3 296 1 270 3 1 0.21 0.27 0.60 0.12 0.10 0.10 0.10 -1
34 1337 17 330 2 127 3 1 0.27 0.52 0.38 0.24 0.10 0.82 0.50 -1
63 3904 4 250 2 187 2 1 0.31 0.23 0.51 0.21 0.10 0.80 0.20 -1
48 1147 5 389 1 64 2 1 0.21 0.24 0.16 0.22 0.70 0.10 0.10 -1
36 1049 14 224 4 -1 0 1 0.82 0.12 0.21 0.25 0.10 0.10 0.10 -1
38 1988 27 164 2 130 2 1 0.31 0.18 0.71 0.17 0.30 0.47 0.40 -1
33 661 18 968 1 -1 0 1 0.33 0.14 0.46 0.35 0.10 0.80 0.30 -1
59 1 15 159 2 378 3 1 0.39 0.13 0.24 0.18 0.30 0.10 0.10 -1
37 480 22 344 2 182 8 1 0.44 0.14 0.46 0.10 0.30 0.10 0.10 -1
37 189 1 238 1 107 2 1 0.48 0.11 0.54 0.32 0.10 0.41 0.30 -1
60 366 3 593 1 -1 0 1 0.39 0.90 0.62 0.29 0.10 0.10 0.10 -1
44 205 3 289 1 -1 0 1 0.48 0.14 0.54 0.15 0.30 0.10 0.10 -1
32 5514 22 319 1 182 1 1 0.33 0.21 0.43 0.34 0.30 0.10 0.10 -1
33 273 16 803 1 -1 0 1 0.23 0.15 0.87 0.13 0.10 0.61 0.20 -1
28 4579 12 409 2 -1 0 1 0.42 0.13 0.87 0.22 0.30 0.10 0.10 -1
0.75 0.46 0.82 0.26 0.90 0.10 0.10 -1
0.35 0.31 0.62 0.15 0.10 0.42 0.30 -1
3. Hasil dan Pembahasan 0.10 0.10 0.71 0.27 0.10 0.10 0.10 -1
3.1. Hasil Penelitian 0.73 0.25 0.16 0.31 0.10 0.67 0.40 1
Hasil penelitian penerapan 0.29 0.23 0.54 0.34 0.30 0.37 0.40 1
algoritma Support Vector Machine bertujuan 0.90 0.44 0.18 0.27 0.30 0.50 0.30 1
untuk membantu telemarketing dalam 0.58 0.21 0.21 0.39 0.10 0.24 0.30 1
0.33 0.21 0.46 0.25 0.70 0.10 0.10 1
memprediksi minat klien. Hasil prediksi yang 0.71 0.30 0.40 0.14 0.10 0.31 0.30 1
dilakukan secara maksimal atau tidaknya 0.37 0.28 0.82 0.19 0.30 0.38 0.30 1
dapat dilihat setelah melakukan eksperimen. 0.27 0.17 0.57 0.90 0.10 0.10 0.10 1
Eksperimen ini dilakukan menggunakan 0.82 0.12 0.49 0.19 0.30 0.90 0.40 1
algoritma Support Vector Machine dengan 0.35 0.16 0.68 0.35 0.30 0.49 0.90 1
0.35 0.13 0.10 0.26 0.10 0.33 0.30 1
menggunakan kernel polynomial. 0.77 0.12 0.84 0.62 0.10 0.10 0.10 1
0.84 0.15 0.16 0.57 0.10 0.10 0.10 1
3.2. Perhitungan Manual SVM 0.50 0.14 0.16 0.30 0.10 0.10 0.10 1
0.25 0.58 0.68 0.33 0.10 0.49 0.20 1
Pada tahapan ini dilakukan
0.27 0.14 0.51 0.76 0.10 0.10 0.10 1
perhitungan manual dengan menggunakan 0.16 0.50 0.40 0.41 0.30 0.10 0.10 1
software excel 2013 dengan ketentuan 0.35 0.54 0.90 0.26 010 0.10 0.10 1
perhitungan dimulai dari pemilihan data
berjumlah 36 record, yang dimana data 2. Mencari Matrik K
diambil dengan 18 record dengan atribut Untuk mencari nilai SVM terlebih dahulu
class bernilai yes (1) dan 18 record dengan kita harus mencari nilai matrik K dengan
class bernilai no (-1). Dan untuk data yang dengan parameter kernel polinomial
diuji menggunakan 7 atribut yang dimana persamaan sebagai berikut :
merupakan faktor utama untuk mengetahui 𝐾(𝑥, 𝑥𝑖) = ∅(𝑥𝑖)
hasil dari prediksi. Berikut tahapan pada K(1,1) = (x1 ∗ x1 + 1)2
perhitungan manual yang dilakukan :

http://eprosiding.ars.ac.id/index.php/psi
169

= ((0.31 * 0.31) + (0.18 * 0.18) + ( 0.71 * 0.71) 6.399


+ (0.17 * 0.17) + (0.30 * 0.30) + (0.47 * 0.47) 5.251
+ ( 0.40 * 0.40) +1)2 = 4.5509 4.848
=
Setelah menghitung nilai matrik kernel 5.838
K, maka didapatkan matrik K dengan ukuran 8.231
N*N (7.090)
𝐾(𝑥, 𝑥𝑖) = ∅(𝑥𝑖) = 𝐾 (𝑁 ∗ 𝑁) Pada proses ini terdapat nilai w dimana nilai
Dari hasil rumus diatasa maka di dapat w didapat dari rumus 𝑎𝑖 𝑦𝑖 𝐾(𝑥, 𝑥1), dimana
hasil yang di dapat pada Tabel 5. untuk mencari nilai 𝑎 = 6/(∑𝑁 𝑖=1(K ∗ z)).
Pencarian nilai z dilakukan dengan perkalian
Yi dikali Yj. Dimana nilai atribut class Yi sama
dengan jumlah hasil pada kernel matrix (Yj).
Tabel 5. Hasil Dari Mencari Matrik K Setelah didapat nilai w, selanjutnya pilih
NO 1 2 3 4 5 6 salahsatu support vector dari kelas “+1” dan
1 4,5509 3,0979 2,9344 3,5433 4,3421 4,0293
“-1” untuk menghitung nilai b dengan
persamaan :
2 3,0979 2,8038 2,3557 2,9356 3,9478 3,3196
1
3 2,9344 2,3557 2,6319 2,2370 3,5465 3,3382 𝑏 = − (𝑤. 𝑥 + + 𝑤. 𝑥 − )
2
4 3,5433 2,9356 2,2370 3,9037 4,3469 3,5593
5 4,3421 3,9478 3,5465 4,3469 7,5048 5,2494 6.399 4.551 6.399 3.543
6 4,0293 3,3196 3,3382 3,5593 5,2494 5,4301 5.251 3.098 5.251 3.936
1 4.848 2.934 4.848 2.237
=- ∗ +
3. Pendugaan Kesfesien weight (w) dan 2 5.838 3.543 5.838 3.904
bias (b) 8.231 4.342 8.231 4.347
Pendugaan koefisien weight dan (7.090) (4.029) (7.090) (3.559)
bias dapat menggunakan persamaan
berikut: = -138.67375489
Pada tahapan ini dilakukan
perhitungan manual Support Vector Jadi b sudah diketahui dengan nilai sebesar
Machine untuk mencari nilai W dengan
langkah- langkah sebagai berikut: = -138.674
𝑁

𝑤 = ∑ 𝑎𝑖 𝑦𝑖𝐾(𝑥, 𝑥1) 4. Menentukan Hyperplane


Maka dari pemodelan yang telah
𝑖=1
4.551 3.098 dilakukan oleh data latih ditentukan
3.098 2.804 hyperplane pada perhitungan SVM dengan
2.934 2.356 kernel polynomial dengan ketentuan:
= 0.28444 + 0.28444 F (x) = w1.x1 + w2.x2 + w3.x3 + w4.x4 +
3.543 2.936
4.342 2.948 w5.x5 + w6.x6 + b = 0
(4.029) (3.320) maka nilai hyperplane nya sebagai berikut:
F (x) = 6,399 x1 + 5,251 x2 + 4,848 x3 +
2.934 3.543
5,838 x4 + 8,231 x5 + 7,090 x6
2.356 3.936
+ (-138,674) = 0
2.632 2.237
+ 0.28444 -0.28444
2.237 3.904 5. Prediksi SVM
3.547 4.347 Setelah mendapatkan nilai w
(3.338) (3.559)
(weight) dan b (bias), maka model SVM
4.342 4.029 dapat digunakan Kernel Trick yang dimana
3.948 3.320 c = 1 dan d = 2 pada data uji dengan
3.547 3.338 persamaan :
-0.28444 -0.28444 𝑓(∅(𝑥)) = 𝑠𝑖𝑔𝑛(𝑤. ∅(𝑥) + 𝑏)
4.347 3.559
𝑁
7.505 5.249
(5.249) (5.430) = 𝑠𝑖𝑔𝑛 (∑ 𝑎𝑖 𝑦𝑖 ∅(𝑥𝑖)𝑇 . ∅(𝑥) + 𝑏)
𝑖=1
Dari hasil rumus diatas dapat
menghasilkan nilai data untuk hasil prediksi
yang telah dihitung, yang dapat dilihat pada
Tabel 6.

http://eprosiding.ars.ac.id/index.php/psi
170

Tabel 6. Hasil Prediksi pada data yang bernilai (1) atau Yes, dalam
X1 X2 X3 X4 X5 X6 X7 Y Prediksi
0,21 0,27 0,60 0,12 0,10 0,10 0,10 -1 -1
hasil prediksi untuk data Yes hanya 4 data
0,27 0,52 0,38 0,24 0,10 0,82 0,50 -1 1 yang benar pada perhitungan prediksinya
0,31 0,23 0,51 0,21 0,10 0,80 0,20 -1 -1
0,21 0,24 0,16 0,22 0,70 0,10 0,10 -1 -1
daripada hasil prediksi (-1) atau No yang
0,82 0,12 0,21 0,25 0,10 0,10 0,10 -1 -1 memiliki 2 data yang salah dalam
0,33 0,14 0,46 0,35 0,10 0,80 0,30 -1 -1
0,39 0,13 0,24 0,18 0,30 0,10 0,10 -1 -1 perhitungan prediksinya. Jadi dapat
0,44 0,14 0,46 0,10 0,30 0,10 0,10 -1 -1 disimpulkan untuk True Positif pada dataset
0,48 0,11 0,54 0,32 0,10 0,41 0,30 -1 -1
0,39 0,90 0,62 0,29 0,10 0,10 0,10 -1 -1 ialah data (-1) atau No karena data hasil
0,33 0,21 0,43 0,34 0,30 0,10 0,10 -1 -1 perhitungannya lebih besar dari (1) atau Yes
0,23 0,15 0,87 0,13 0,10 0,61 0,20 -1 -1
0,42 0,13 0,87 0,22 0,30 0,10 0,10 -1 -1 yang dapat disebut dengan True Negatif.
0,75 0,46 0,82 0,26 0,90 0,10 0,10 -1 1
0,35 0,31 0,62 0,15 0,10 0,42 0,30 -1 -1
Bila diberikan sebuah hasil atau nilai
0,73 0,25 0,16 0,31 0,10 0,67 0,40 1 -1 accuracy yang digunakan pada perhitungan
0,29 0,23 0,54 0,34 0,30 0,37 0,40 1 -1
0,90 0,44 0,18 0,27 0,30 0,50 0,30 1 1
manual saat ini sebesar 56,67% untuk data
0,58 0,21 0,21 0,39 0,10 0,24 0,30 1 -1 yang tepat dalam perhitungannya.
0,33 0,21 0,46 0,25 0,70 0,10 0,10 1 -1
0,37 0,28 0,82 0,19 0,30 0,38 0,30 1 1 Selanjutnya melakukan penelitian
0,27 0,17 0,57 0,90 0,10 0,10 0,10 1 -1 menggunakan algoritma Support Vector
0,82 0,12 0,49 0,19 0,30 0,90 0,40 1 1
0,35 0,16 0,68 0,35 0,30 0,49 0,90 1 -1 Machine untuk mengklasifikasi data dari UCI
0,35 0,13 0,10 0,26 0,10 0,33 0,30 1 -1 Machine Learning Repository
0,84 0,15 0,16 0,57 0,10 0,10 0,10 1 -1
0,50 0,14 0,16 0,30 0,10 0,10 0,10 1 -1 menggunakan Rapidminer dengan dataset
0,25 0,58 0,68 0,33 0,10 0,49 0,20 1 1
0,27 0,14 0,51 0,76 0,10 0,10 0,10 1 -1
Bank Marketing. Dengan sumber data yang
0,16 0,50 0,40 0,41 0,30 0,10 0,10 1 -1 berisi 17 atribut yang dimana 9 atribut
nominal dirubah menjadi numeric dengan
Pada Tabel 6 ditentukan bahwa operator nominal to numeric dengan
hasil pemodelan dan dilakukannya sebuah perbandingan 1:0 merubah nominal yang
prediksi dengan 30 data yang dihitung dipilih menjadi satu (1) dan yang tidak
secara manual mendapatkan hasil terpilih menajdi nol (0), serta jumlah data
klasifikasi sebesar 24 data klien mempunyai sebesar 45211 data menjadi 4521 data yang
nilai prediksi (-1) dan 6 data klien mengikuti data penelitian terbaru dari Bank
mempunyai nilai prediksi (1), dimana nilai Marketing Dataset. Selanjutnya dihitung
prediksi (-1) adalah klien yang tidak menggunakan Metode 10 K-Fold Cross
berminat terhadap produk deposito dan nilai Validation Support Vector Machine dan
(1) adalah klien yang berminat terhadap dengan perbandingan perhitungan lebih
produk deposito. Kernel Polynominal mendapatkan nilai yang
optimal dan terbaik dari kernel dot product.
4. Kesimpulan Kesimpulan yang dapat diambil dari hasil
Pada penelitian ini dilakukan penelitian yang sudah dilakukan sebagai
eksperimen terhadap algoritma Support berikut:
Vector Machine untuk mengklasifikasi data 1. Telah diterapkan algoritma SVM pada
dari UCI Machine Learning Repository Bank Marketing Data Set menggunakan
menggunakan dataset Bank Marketing. metode 10-Fold Cross Validation
Dengan sumber data terbaru yang berisi 17 performa klasifikasi dengan akurasi
atribut dan 45211 data. Dan saat ini sebesar 94,91% dan AUC 0.979.
dilakukan perhitungan manual 2. Telah diketahui nilai hasil akurasi dari
menggunakan Microsoft Excel 2013 dengan algoritma SVM untuk klasifikasi Bank
jumlah data 36 data yang dibagi menjadi Marketing Data Set dengan parameter
data latih sebesar 6 data dan 30 data untuk kernel polynominal hasil akurasi optimal
diuji kebenaran dari pemodelan data yang sebesar 95,18% dan AUC 0.974
diambil dan ternyata dari 30 data hasil menggunakan 10-Fold Cross Validation.
prediksi menggambarkan 24 data yang tidak
berminat pada deposito yang ditawarkan, Referensi
sedangkan 6 data yang lainnya berminat Abbas, I. (2016). Penerapan Metode Moving
kepada deposito yang ditawarkan. Dari 30 Average (MA) Berbasis Algoritma
data maka hanya 20% yang menerima atau Support Vector Machine (SVM) untuk
berminat kepada produk yang ditawarkan Membandingkan Pola Kurva dengan
oleh telemarketing bank. Trend Kurva pada Trading Forex
Maka dalam hasil yang didapatkan Online. ILKOM Jurnal Ilmiah.
ternyata hasil prediksi dan data yang sudah Agustina, C. (2019). Analisa Nasabah
ada memiliki nilai yang berbeda terutama Potensial Tabungan Deposito

http://eprosiding.ars.ac.id/index.php/psi
171

Berjangka Menggunakan Teknik Klasifikasi Penyimpangan Tumbuh


Klasifikasi Data Mining. Jurnal Kembang Anak. Jurnal
Teknologi Informasi Dan Terapan, Pengembangan Teknologi Informasi
5(2), 105–112. Dan Ilmu Komputer, 2(10), 3163–
Amak Yunus EP, A. (2017). Sistem Prediksi 3169.
Penentuan Jenis Tanaman Sayuran Pratama, A., Wihandika, R. C., & Ratnawati,
Berdasarkan Kondisi Musim Dengan D. E. (2018). Implementasi Algoritme
Pendekatan Metode Trend Moment. Support Vector Machine (SVM) untuk
Jurnal Mahasiswa Fakultas Sains Dan Prediksi Ketepatan Waktu Kelulusan
Teknologi, 1(5). Mahasiswa. Jurnal Pengembangan
Aqham, A. A., & Hartomo, K. D. (2019). Data Teknologi Informasi Dan Ilmu
Mining untuk Nasabah Bank Komputer, 2(March), 1704–1708.
Telemarketing Menggunakan Saputra, E. P. (2017). Prediksi Keberhasilan
kombinasi Algoritm Naïve Bayes Dan Telemarketing Bank Untuk. Jurnal Ilmu
Algoritma Genetik. InfoTekJar (Jurnal Pengetahuan Dan Teknologi
Nasional Informatika Dan Teknologi Komputer, 2(2), 66–72.
Jaringan), 4(1), 47–56. Siregar, A. M., & Pusphabuana, A. (2016).
Budi Santosa, A. U. (2018). Data Mining dan DATA MINING : Pengolahan Data
Big Data Analytics : Teori dan Menjadi Informasi dengan RapidMiner.
Implementasi Menggunakan Python & CV Kekata Group.
Apache Spark (Isa (ed.); 2nd ed.). Suhardjono, Wiajaya, G., & Abdul, H.
Penebar Media Pustaka. (2019). Prediksi Waktu Kelulusan
Dawson, S. (2009). Introduction to Mahasiswa Menggunakan Svm
electroweak symmetry breaking. AIP Berbasis Pso. Bianglala Informatika,
Conference Proceedings. 7(2), 97–101.
Ghani, A. D., Salman, N., & Mustikasari. Sulaehani, R. (2016). Prediksi Keputusan
(2019). Algoritma k-Nearest Neighbor Klien Telemarketing Untuk Deposito
Berbasis Backward Elimination Pada Pada Bank Menggunakan Algoritma
Client Telemarketing. Prosiding Naive Bayes Berbasis Backward
Seminar Ilmiah Sistem Informasi Dan Elimination. ILKOM Jurnal Ilmiah, 8(3),
Teknologi Informasi, VIII(2), 141–150. 182–189.
Kusumodestoni, R. H., & Sarwido, S. (2017). Tekouabou, S. C. K., Cherif, W., & Silkan, H.
Komparasi Model Support Vector (2019). A data modeling approach for
Machines (Svm) Dan Neural Network classification problems: Application to
Untuk Mengetahui Tingkat Akurasi bank telemarketing prediction. ACM
Prediksi Tertinggi Harga Saham. International Conference Proceeding
Jurnal Informatika Upgris, 3(1). Series, Part F1481, 1–7. Thohir, M.
Noor, A. (2018). Perbandingan Algoritma (2013). Metodologi Penelitian Sosial
Support Vector Machine Biasa dan Budaya. In CV Andi Offset.
Support Vector Machine berbasis Yogyakarta. MEDIA SAHABAT
Particle Swarm Optimization untuk CENDEKIA.
Prediksi Gempa Bumi. Jurnal WK, W. N., & Adani, Y. (2018). Penerapan
Humaniora Teknologi, 4(1), 31–37. Algoritma Naïve Bayes Untuk
Memprediksi Keputusan Calon
Nasabah Dan Nasabah Tetapbank Bri
Parapat, I. M., Furqon, M. T., & Sutrisno. Syariah Menerima Penawaran
(2018). Penerapan Metode Support Program Deposito Berjangka. Jurnal
Vector Machine ( SVM ) Pada Teknologi Dan Informasi, 8(1), 13–24.

http://eprosiding.ars.ac.id/index.php/psi

Anda mungkin juga menyukai