Anda di halaman 1dari 21

KLASIFIKASI CALON NASABAH DEPOSITO BANK

MENGGUNAKAN
PARTICLE SWARM OPTIMIZATION (PSO)
DAN
ALGORITMA DECISION TREE C.4.5

Nosiel
2021211026

PROGRAM STUDI
MAGISTER TEKNIK INFORMATIKA
FAKULTAS
ILMU KOMPUTER
INSTITUT INFORMATIKA DAN BISNIS DARMAJAYA Dosen Pembahas 1 Dr. Chairani, S.Kom.,M.Eng
BANDAR LAMPUNG
2022
Pembimbing Sriyanto, S.Kom., M.M, Ph.D Dosen Pembahas 2 Dr. Handoyo W.N, S.Kom.,M.T.I
LATAR BELAKANG MASALAH
Bank merupakan perusahaan yang memiliki data yang besar yang
tersimpan di dalam database dan diolah menghasilkan sebuah Apa yang melatar
informasi yang saling berkaitan tentang nasabah, data tersebut dapat belakangi penelitian
digunakan untuk menjaga hubungan antar bank dengan nasabah ini?
yang valid, sehingga berguna untuk menentukan secara individual
tentang penawaran produk bank.
Salah satu produk dari Bank adalah Deposito Berjangka Bank mempunyai ribuan data nasabah, dari
ribuan data nasabah ini, ada beberapa yang
potensial, bagaimana memilih nasabah
Apa itu dianggap potensial atau tidak?
deposito
berjangka? Diperlukan penelitian terkait menggunakan
data mining untuk bisa memilih
mengklasifikasi manasaja nasabah yang
Deposito berjangka adalah potensial, untuk calon nasabah deposito!
deposito yang mempunyai
masa atau jangka waktu
yang telah ditentukan.
LATAR BELAKANG MASALAH
Menurut Hasil Review Penelitian Sebelumnya
No. Judul Metode Hasil Akurasi
01 Klasifikasi Data Mining untuk Prediksi Potensi Decision Tree, Naïve Bayes dan k- Metode decision tree mendapatkan
Nasabah dalam Membuat Deposito Berjangka Nearest Neighbor akurasi tertinggi 91,26%.
02 Analisis Data Bank Direct Marketing dengan Naïve Bayes, K-Nearest Neighbor, Metode Naive Bayes mendapatkan
Perbandingan Klasifikasi Data Mining Berbasis Support Vector Machine akurasi tertinggi 90,18%.
Optimize Selection (Evolutionary)
03 Prediksi Nasabah Yang Berpotensi Membuka Naive Bayes Mendapatkan akurasi 89,70%
Simpanan Deposito
04 Analisis Perbandingan Algoritma Optimasi pada Algoritma Random Forest (RF) Metode Random Forest
Random Forest untuk Klasifikasi Data Bank mendapatkan akurasi 88,30%,
Marketing
05 Analisa Nasabah Potensial Tabungan Deposito Berjan Decision Tree, Naïve Bayes ,NN Metode Decision Tree
gka Menggunakan Teknik Klasifikasi Data Mining mendapatkan akurasi 89,72%
LATAR BELAKANG MASALAH
Situs
Pengambilan
dataset?

Merujuk hasil akurasi kelima penelitian


tersebut masih perlu dikembangkan lagi agar
klasifikasi calon nasabah deposito bank
mendapatkan tingkat akurasi yang lebih tinggi Di ambil dari : situs web
sehingga untuk mencapai hal tersebut peneliti uci machine learning
menggunakan seleksi fiture Particle Swam
Optimization (PSO) dan algoritma Decision (
Tree C4.5 agar tercapai akurasi yang tertinggi. https://archive.ics.uci.edu
/ml/datasets/Bank+Marke
ting
)
LATAR BELAKANG MASALAH
Berikut atribut dijelaskan pada tabel dibawah ini:
Atribut Tipe Keterangan

Dataset yang digunakan Age integer Usia

berjumlah 4.521 record Job polynominal Pekerjaan

data, dengan 17 atribut marital polynominal Status Pernikahan

di mana dari 17 atribut education polynominal Pendidikan

tersebut terdapat 1 default binominal Tunggakan Hutang(Kredit Macet)

atribut prediksi. balance integer Saldo Tabungan


housing binominal Pinjaman KPR
loan binominal Kepemilikan Kredit
contact polynominal Cara Menghubungi
Day integer Hari&Tanggal dihubungi terakhir
month polynominal Bulan Terakhir dihubungi
duration integer Durasi waktu saat dihubungi
campaign integer Jumlah Waktu yang dihubungi
pdays integer Jarak hari untuk menghubungi nasabah setelah penawaran (Nasabah yang belum pernah
dihubungi maka akan diberi tanda -1)
previous integer Jumlah panggilan kepada nasabah sebelum melakukan penawaran.
poutcome polynominal Proses penawaran yang telah dilakukan.
Y polynominal Sebagai label kelas. Ya/Tidak.
(deposito)
Rumusan
Batasan Masalah Masalah Tujuan Penelitian

Agar tidak menyimpang dari


pembahasan masalah maka Rumusan masalah dalam Tujuan dari penelitian ini
peneliti membatasi ruang penelitian ini adalah adalah untuk menghasilkan
lingkup penelitian ini hanya bagaimana cara menghasilkan model algoritma yang
pada klasifikasi calon nasabah model algoritma yang memiliki akurasi sangat
bank untuk menentukan memiliki akurasi yang sangat tinggi menggunakan metode
nasabah dianggap potensial tinggi menggunakan Particle seleksi fiture Particle Swam
atau tidak menggunakan Swam Optimization (PSO) Optimization (PSO) dan
Particle Swam Optimization dan algoritma Decision Tree algoritma Decision Tree
(PSO) dan algoritma Decision C4.5. C4.5.
Tree C4.5, agar menghasilkan
akurasi yang lebih tinggi
Manfaat
penelitian Manfaat dari penelitian ini untuk
mempermudah bagian pemasaran bank
untuk memilih calon nasabah deposito
TINJAUAN PUSTAKA

2.1 Penelitian Terkait


2.2 Data Mining
2.3 Rapidminner
2.4 Klasifikasi
2.5 Decision Tree
2.6 Pengertian Split Validation
2.7 Seleksi Fitur
2.8 Particle Swarm Optimization
2.9 Algoritma C4.5
2.10 Akurasi
2.11 Confusion Matrix
2.12 Kurva AUC
2.13 Metode CRISP-DM
Berikut
Gambar
Pemodelan
METODOLOGI Berikut tahapan Penelitian Metode
PENELITIAN CRISP-DM
Dataset

Seleksi Fiture
Fase Pemahaman Bisnis Split Validation
Pada penelitian ini
saya mengunakan Fase Pemahaman Data
Data Training Data Testing
tahapan Metode
CRISP-DM Fase Persiapan Data

Fase Pemodelan Algoritma Decision Tree C4.5

Evaluasi
Apply Model
Fase Penyusunan Laporan

Performance
HASIL DAN PEMBAHASAN
4.1 Bussiness Understanding 4.2 Data Understanding 4.3 Data Preparation
atau Pemahaman Bisnis atau Pemahaman Data atau Persiapan Data

Tujuan dari penelitian ini Dalam penelitian ini, data


Dataset yang
adalah untuk menghasilkan yang ada pada penelitian
digunakan pada
model algoritma yang ini adalah data sekunder
penelitian ini
memiliki akurasi sangat tinggi dimana data sudah tersedia
berasal dari situs
menggunakan metode seleksi dari situs web uci machine
UCI Machinne
fiture Particle Swam learning sehingga tidak ada
Learning
Optimization (PSO) dan pengambilan data langsung
algoritma Decision Tree C4.5. kepada perusahaan.
HASIL DAN PEMBAHASAN
4.4 Pemodelan

4.4.1 Penelitian Menggunakan Algoritma Decision Tree C4.5


Pada algoritma decision tree, record yang sudah di import ke rapid miner digunakan untuk menentukan pola pohon
keputusan.

Desain model dan pola pohon keputusan

Setelah diketahui pola pohon keputusan berdasarkan data training, maka akan dimodelkan untuk meningkatkan tingkat
akurasi.
HASIL DAN PEMBAHASAN
4.4.2 Penelitian Menggunakan Algoritma Decision Tree

Penerapan data pada Rapidminer untuk klasifikasi calon Hasil eksperimen dapat kita lihat pada gambar
nasabah deposito bank menggunakan Algoritma Decision dibawah ini.
Tree

Didalam confusion matrix kita dapat melihat hasil


akurasi yang dihasilkan adalah 91.69 %, class presisi
71.61 % dan class recall 46.30 %.
HASIL DAN PEMBAHASAN

Tabel Perbandingan Hasil akurasi Penelitian sebelumnya dengan penelitian saat


ini:
Penelitian Tingkat Akurasi

Penelitian Sebelumnya (Nuraeni 2021) 91.26%

Penelitian Saat Ini 91.69%

Eksperimen penelitian menghasilkan tingkat akurasi tinggi dan tingkat akurasi lebih
tinggi dari penelitian sebelumnya, akan tetapi masih dapat ditingkatkan tingkat
akurasinya
HASIL DAN PEMBAHASAN
4.4.3 Penelitian Menggunakan Particle Swarm Optimization (PSO) dan Decision Tree C4.5

Eksperimen lanjutan yang dilakukan pada penelitian ini adalah penggunaan teknik optimasi seleksi fitur menggunakan
Particle Swarm Optimization (PSO) dan algoritma Decision Tree C4.5.
HASIL DAN PEMBAHASAN
Pada gambar 4.4 data yang sudah disiapkan diterapkan pada aplikasi rapidminer dan penggunaan teknik optimasi
seleksi fitur Particle Swarm Optimization (PSO) dan algoritma Decision Tree C4.5. Hasil eksperimen dapat kita
lihat pada gambar dibawah ini.

Pada gambar confusion matrix yang menunjukan hasil eksperimen lanjutan, didalam confusion matrix kita
dapat melihat hasil akurasi 99.94%, class presisi 100% dan class recall 99.45%.
HASIL DAN PEMBAHASAN
Perbandingan hasil eksperimen yang ditunjukan pada tabel dibawah ini:

Tabel Perbandingan Hasil


Akurasi
Penelitian Tingkat Akurasi
(Agustina 2018)
89.72 %

Penelitian saat ini 99.94 %

Hasil dari eksperimen ini menghasilkan tingkat akurasi yang tinggi sebesar 99,94%, class presisi 100% dan class
recall 99.45% dari penelitian sebelumnya sebesar 89,72%(Agustina 2018). akurasi ini meningkat ketika
dilakukannya seleksi fitur oleh algoritma decision tree C4.5 pada dataset deposito bank. Selain Confusion matrix
untuk mengetahui kinerja dari eksperimen ini kita dapat mengandalkan kurva AUC yang dihasilkan. Perbandingan
hasil Kurva AUC pada penelitian sebelumnya dan penelitian saat ini dapat kita lihat pada gambar dibawah ini:
HASIL DAN PEMBAHASAN

Gambar penelitian sebelumnya menghasilkan Area Under Curva (AUC) 0.73 ( Fair Classification )

Gambar AUC hasil eksperimen penelitian saat ini menghasilkan Area Under Curva (AUC) 0.99 yang
membuktikan bahwa akurasi pada model optimasi ini memiliki tingkat klasifikasi yang sangat baik.
(Excelent Clasification).
HASIL DAN PEMBAHASAN
4.4.4 Perbandingan Penelitian Tidak Menggunakan PSO dan Menggunakan PSO

Perbandingan hasil eksperimen yang tidak menggunakan seleksi fitur PSO dan eksperimen yang
menggunakan seleksi fitur PSO ditunjukan pada tabel dibawah ini:

Tabel Perbandingan Hasil


Akurasi
Penelitian Tingkat akurasi
Eksperimen Tidak Menggunakan seleksi fitur  99.80 %
PSO
Eksperimen Yang Menggunakan seleksi fitur  99.94 %
PSO
HASIL DAN PEMBAHASAN

4.5 Evaluasi Berdasarkan model proses yang telah berhasil dilakukan, maka
diperoleh data seleksi pembobotan atribut PSO sebagai berikut:

Pemodelan yang telah dilakukan


berhasil menghasilkan akurasi
yang tinggi. Penggunaan seleksi
fitur Particle Swarm Optimization
(PSO) berhasil meningkatkan
akurasi dalam klasifikasi calon
nasabah deposito bank.
HASIL DAN PEMBAHASAN

Gambar Hasil Seleksi Atribut

Dari gambar diatas dapat dilihat hasil pembobotan atribut-atribut, terdapat 5 atribut yang memiliki nilai 0 yang
artinya atribut tersebut otomatis terseleksi dan tidak perlu digunakan karena tidak memiliki pengaruh dalam
proses.
KESIMPULAN DAN SARAN

5.1 Kesimpulan 5.2 Saran

Berdasarkan hasil penelitian ini, metode


Sebagai perbandingan untuk mencari
yang terbaik menggunakan Particle
Swarm Optimization (PSO) dan Algoritma nilai akurasi terbaik dapat dilakukan
Decision Tree C4.5 dengan akurasi penghitungan dengan aplikasi data
sebesar 99,94%, dan menghasilkan Area
Under Curva (AUC) 0.99 yang mining yang berbeda.
membuktikan bahwa akurasi pada model
optimasi ini memiliki tingkat klasifikasi
yang sangat baik (Excelent Clasification).
TERIMAKASIH

Anda mungkin juga menyukai