Anda di halaman 1dari 7

Jurnal Ilmiah Teknologi dan Informasi ASIA Vol.

8 No 2, Agustus 2014

PENERAPAN DATA MINING UNTUK ANALISA POLA PERILAKU


NASABAH DALAM PENGKREDITAN MENGGUNAKAN METODE C.45
STUDI KASUS PADA KSU INSAN KAMIL DEMAK

Rina Dewi Indah sari, Yuwono Sindunata


STMIK ASIA Malang

ABSTRAK
Intisari implementasi metode C.45 untuk membantu analisis Pola perilaku nasabah dalam pengkreditan.
Kemajuan teknologi Informasi telah merambah ke dunia keuangan, termasuk juga sistem pendukung
keputusan dalam menentukan pola perilaku nasabah dalam kredit. Dalam suatu sistem analisa penentuan
nasabah perlu dilakukan pendeteksian kriteria-kriteria nasabah yang digunakan untuk menentukan layak
atau tidaknya nasabah dalam pengambilan kredit, maka penulis bermaksud merancang suatu program
aplikasi pendukung keputusan yang berbasis pengetahuan yang dapat membantu menentukan pola
perilaku nasabah dalam pengkreditan dengan menggunakan metode Decision Tree Classification dengan
metode C.45.

Program analisis pola perilaku nasabah dibuat menurut urutan perhitungan decision tree, yaitu berupa
struktur flowchart yang menyerupai tree (pohon) yang terbentuk berdasarkan proses learning dari data
pelatihan yang kemudian diubah menjadi aturan jika-maka. Pembentukan tree ini menggunakan metode
ID3 yaitu pemilihan atribut sebagai node penyusun tree yang diambil berdasarkan nilai entropy. Aturan
jika-maka yang terbentuk akan diimplementasikan dengan data nasabah sehingga dapat ditentukan hasil
analisisnya.

Kesimpulan yang dapat diaambil dari pengujian aplikasi penerapan data mining untuk analisa pola
perilaku nasabah dalam pengkreditan menggunakan metode C.45 studi kasus pada KSU Insan Kamil
Demak didapatkan tingkat akurasi 65%. Faktor yang mempengaruhi tingkat akurasi adalah jumlah
dataset yang dimasukkan

Kata Kunci :Data Mining, metode c.45, pola perilaku nasabah


ABSTRACT
Digest implementation methods C.45 to assist the analysis of customer behavior patterns in crediting.
Advancement of information technology has penetrated into the financial world, as well as decision
support systems in determining patterns of behavior of customers in credit. In a system of determining
customer needs analysis conducted client detection criteria used to determine whether or not the
customer in making loans, the author intends to design a program based decision support applications
knowledge can help determine patterns of behavior of customers in crediting by using Decision
Classification tree method C.45.
The program analyzes customer behavior patterns made according to the order of decision tree
calculation, in the form of a flowchart structure that resembles tree (tree) which is formed by the process
of learning from training data is then converted into a rule if-then. This tree formation using ID3 method,
the choice of attributes as a constituent node tree is taken based on the value of entropy. If-then rules that
form will be implemented with the customer data so that it can be determined the results of the analysis.
The conclusion that can be diaambil of testing the application of data mining applications to analyze
customer behavior patterns in crediting method C.45 case study at KSU InsanKamilDemak obtained 65%
accuracy rate. Factors affecting accuracy rate is the number of datasets that included.

Keywords: Data mining, c.45 methodcustomer behavior

10
Sekolah Tinggi Manajemen Informatika dan Komputer ASIA Malang
Jurnal Ilmiah Teknologi dan Informasi ASIA Vol. 8 No 2, Agustus 2014

dengan teknik pohon keputusan yang terkenal


PENDAHULUAN dan disukai karena memiliki kelebihan-
kelebihan. Kelebihan ini misalnya dapat
A. Latar Belakang Masalah mengolah data numerik (kontinyu) dan diskret,
Perkembangan era globalisasi semakin dapat menangani nilai atribut yang hilang,
meningkatkan aktivitas masyarakat dalam menghasilkan aturan-aturan yang mudah
pemenuhan kebutuhan, baik kebutuhan primer, diintrepetasikan dan tercepat diantara
sekunder maupun tersier. Hal ini menandakan algoritma-algoritma yang lain.
meningkatnya kredit konsumsi, kredit konsumsi Untuk itu dilakukan penelitian dengan judul
merupakan kredit yang diberikan oleh bank atau PENERAPAN DATA MINING UNTUK ANALISA
koperasi. Tingginya pertumbuhan kredit ini POLA PERILAKU NASABAH DALAM
terutama dipicu oleh masih tingginya permintaan PENGKREDITAN MENGGUNAKAN METODE C.45
kredit dari masyarakat sebagai sumber STUDI KASUS PADA KSU INSAN KAMIL DEMAK.
pembiayaan ekonomi yang utama. Dilihat dari
Statistik Perbankan Indonesia per Januari 2012
jumlah kredit meningkat, sedangkan untuk kredit
konsumsi naik 20,3% dengan nilai sebesar a) BatasanMasalah
Rp.660,15 triliun dari Rp.548,75 triliun.
Agar hasil penelitian menjadi lebih terarah
Tingginya angka kredit macet ini bisa berdampak dengan tujuan yang diharapkan, maka perlu
pada aliran kas dan kinerja karyawan suatu adanya batasan masalah. Batasan masalah dalam
badan usaha seperti KSU (Koperasi Serba Usaha) penelitian ini adalah:
Insan Kamil Demak. Berbagai dampak ini harus Batasan masalah dari sistem yang dibahas adalah
diperhatikan oleh analisis kredit. Banyak faktor sebagai berikut :
yang dapat menyebabkan kredit macet. Salah a. Penerapandigunakanhanyauntukanalisaresi
satunya adalah penilaian manusia yang kokreditpada KSU InsanKamilDemak
terkadang bersifat subyektif dapat menjadi b. Data yang
faktor utama terjadinya kekurang tepatan karena digunakanberasaldariobyekpenelitiandenga
berpengaruh dalam menentukan keputusan njumlah data sebanyak 200 record
penerimaan ataupun penolakan kredit. Agar c. Algoritma yang digunakanadalah C.45
menekan resiko kekurang tepatan dalam d. Perancanganapikasiinimenggunakanmicros
memprediksi resiko kredit maka diperlukan oft visual basic 6.0
suatu cara yang baik untuk menangani hal
tersebut. LANDASAN TEORI

Upaya yang biasa dilakukan untuk menekan A. KDD (Knowledge Discovery In Database)
angka kredit macet ini adalah dengan cermat
dalam menganalisis kredit, peningkatan kualitas KDD yaitu keseluruhan proses non-trivial untuk
karyawan guna menangani sikap masyarakat mencari dan mengidentifikasi pola (pattern)
yang tidak membayar, meningkatkan sikap dalam data, dimana pola yang ditemukan bersifat
kehati-hatian dalam persetujuan kredit dan sah, baru, dapat bermanfaat dan dapat
memberikan pengawalan saat pembayaran dimengerti (Han and Kamber, 2006). KDD
kredit. berhubungan dengan teknik integrasi dan
penemuan ilmiah, intreprestasi dan visualisasi
Dewasa ini berkembang ilmu yang dapat dari pola-pola sejumlah kumpulan data
mengolah dan menganalisa data-data hingga
menjadi suatu pengetahuan baru dan berguna
untuk membantu mengambil keputusan yaitu B. Data Mining
Data Mining. Dalam kasus ini penerapan ilmu
Data mining, sering disebut juga sebagai
Data Mining bisa dimanfaatkan dalam
Knowledge Discovery in Database (KDD), adalah
memprediksi resiko kredit dari berbagai
kegiatan yang meliputi pengumpulan, pemakaian
informasi yang diperoleh sehingga dapat juga
data-data yang berukuran besar (Santoso,
digunakan sebagai alternatif solusi untuk
2007). Dan keluaran dari Data mining ini bisa
mengurangi tingkat resiko kredit macet.
dipakai untuk memperbaiki pengambilan
Ada beberapa teknik yang digunakan dalam Data keputusan di masa depan. Sehingga istilah
Mining salah satunya klasifikasi. Klasifikasi pattern recognition sekarang jarang digunakan
memilliki beberapa algoritma. Oleh karena itu, karena sudah termasuk bagian dari Data mining.
penelitian ini akan mencoba dengan metode C.45.
C. Prepocessing data mining
Metode C4.5 adalah metode klasifikasi data

11
Sekolah Tinggi Manajemen Informatika dan Komputer ASIA Malang
Jurnal Ilmiah Teknologi dan Informasi ASIA Vol. 8 No 2, Agustus 2014

Sebelum proses data mining dapat 4. Cabanguntuksetiap node akan dibentuk


dilaksanakan, perlu dilakukan proses cleaning berdasarkan nilai-nilai yang diketahui dari
pada data yang menjadi fokus KDD. Proses atribut pengujian.
cleaning mencakup antara lain membuang 5. Algoritmainiakanterus melakukan proses
duplikasi data, memeriksa data yang inkonsisten, yang sama rekursif
dan memperbaiki kesalahan pada data, seperti untukmembentuksuatupohonkeputusanunt
kesalahan cetak (tipografi). Juga dilakukan uksetiap sample di setiapbagiannya.
proses enrichment, yaitu proses memperkaya 6. Proses rekursifiniakanberhenti, ketika salah
data yang sudah ada dengan data atau informasi satu dari kondisi di bawah telah terpenuhi.
lain yang relevan dan diperlukan untuk KDD, Kondisi-kondisinyaadalah:
seperti data atau informasi eksternal a. Semua sample yang diberikanpada
node adalahberasaldarisatukelas yang
D. Algoritma C.45 sama.
Algoritma C4.5 merupakan kelompok algoritma b. Tidakadaatributlainnya yang
decision tree. Algoritma ini mempunyai input dapatdigunakanuntukmempartisi
berupa training samples dan samples. Training sample lebihlanjut.
samples berupa data contoh yang akan c. Tidakada sample yang memenuhi
digunakan untuk membangun sebuah tree test-attribute. Dalam hal ini, sebuah
yang telah diuji kebenarannya. Sedangkan daun dibuat dan dilabeli dengan
samples merupakan field-field data yang kelas yang memiliki sample terbanyak
nantinya akan kita gunakan sebagai parameter (majority voting).
dalam melakukan klasifikasi data.
Pada tahap pembelajaran algoritma C4.5
Algoritma C4.5 adalah algoritma hasil memiliki 2 prinsip kerja yaitu:
pengembangan dari algoritma ID3. Perbaikan
1. Pembuatanpohonkeputusan. Tujuan dari
algoritma C4.5 dari algoritma ID3 dilakukan
algoritma penginduksi pohon keputusan
dalam hal (Santosa,2003):
adalah mengkontruksi struktur data pohon
1. Bisa mengatasi missing value yang dapat digunakan untuk memprediksi
kelas dari sebuah kasus atau sample baru
2. Bisa mengatasi data kontinyu yang belum memiliki kelas. C4.5
melakukan konstruksi pohon keputusan
3. Pruning dengan metode divide and conquer. Pada
4. Adanya aturan awalnya hanya dibuat node akar dengan
menerapkan algoritma divide and
Secara garis beras langkah-langkah yang conquer. Algoritma ini memilih
dilakukan oleh algoritma C4.5 dalam pemecahan kasus-kasus yang terbaik
membentuk pohon keputusan adalah sebagai dengan menghitung dan membandingkan
berikut: gain ratio, kemudian node-node yang
terbentuk di level berikutnya, algoritma
1. Padasaatawalpembentukanpohonakandimu divide and conquer
laidenganmembuatsuatu node yang akanditerapkanlagisampaiterbentukdaun-
melambangkan training sample. daun.
2. Jikasampel-sampeltersebutmemilikikelas 2. Pembuatanaturan-aturan (rule set). Aturan-
yang sama, maka node tersebutdijadikan aturan yang terbentuk dari pohon
leaf node dengan label kelastersebut. keputusan akan membentuk suatu kondisi
3. Jikasampel-sampeltersebuttidak memiliki dalam bentuk if-then. Aturan-aturan ini
kelas yang sama maka algoritma ini akan didapat dengan cara menelusuri pohon
mencari gain ratio tertinggi dari atribut keputusan dari akar sampai daun. Setiap
yang tersedia, sebagai cara untuk memilih node dan syarat percabangan akan
atribut yang paling berpengaruh paada membentuk suatu kondisi atau suatu if,
training sample yang tersedia. Nantinya sedangkan untuk nilai-nilai yang terdapat
atribut ini akan dijadikan atribut penguji pada daun akan membentuk suatu hasil
atau keputusan pada node tersebut. Hal atau suatu then.
yang perlu diperhatikan
adalahketikaatributtersebutbernilaicontinu, PEMBAHASAN
makaatributtersebutharusdidiskritkanterle
bihdahulu A. AnalisaMasalah

12
Sekolah Tinggi Manajemen Informatika dan Komputer ASIA Malang
Jurnal Ilmiah Teknologi dan Informasi ASIA Vol. 8 No 2, Agustus 2014

Seperti yang sudah dijelaskan pada latar 2. Preprocessing cleaning (Pembersihan


belakang masalah, bahwa permasalahan yang Data)Proses Cleaning
muncul adalah bagaimana mengolah data padapenelitianilmiahiniadalah proses
operasional yang sudah ada menjadi ilmu menghilangkan data yang tidak konsisten,
pengetahuan baru berupa informasi yang akan yang bisa terjadi karena kesalahan inputan
datang, yang dapat berguna untuk menciptakan atau adanya field yang kosong. Proses
suatu strategi baru untuk memperoleh solusi cleaning diawali dengan load atau
dalam penyelesaian masalah yang sedang terjadi, mengambil data nasabah kemudian
pada kasus ini adalah menganalisa pola perilaku diproses cleaning. Setelahselesai proses
nasabah dalam pengkreditan pada KSU Insan cleaning maka data terbaruakandisimpan.
Kamil Demak. Dimana analisa ini bermanfaat 3. Preprocessing (Pengelompokan Data)
untuk mengetahui karakteristik calon nasabah Preprocessing data
yang akan melakukan kredit, sehingga dilakukanuntukmendapatkanhasil analisis
membantu para analisis kredit dalam melakukan yang lebih akurat dalam pemakaian teknik-
penilaian terhadap calon nasabahnya. Penilaian teknik machine learning maupun Data
ini bertujuan agar dapat mengurangi masalah Mining.Pada tahapini yang
ketidaklancaran dalam pembayaran kredit. Oleh dilakukanadalahmengelompokkan data
karena itu, Data Mining merupakan salah satu sesuaidengankebutuhan yang diinginkan.
solusinya. 4. Data Mining

Proses analisa data warehouse dengan Algoritma


C.45. Pada proses akan dilihat berbandingan
keakurasian, kelebihan, serta kekurangan dari
masing-masing algoritma. Sehingga akan
diperoleh suatu kesimpulan ketepatan Algoritma
yang digunakan dalam kasus ini.
IMPLEMENTASI
A. Implementasi Program

Gambar 1. Model Metode Penelitian


Memulai sistem analisa, kemudian
mengidentifikasi kebutuhan pihak koperasi
kemudian dilanjutkan dengan pengumpulan data Gambar 2 Menu Utama
dan informasi yang dibutuhkan dengan
menggunakan tabel data nasabah yaitu data yang Menu Utama adalah tampilan dimana terdapat
didapat saat nasabah mulai melakukan kredit. judul dari aplikasi dan juga terdapat tombol
Setelah data tersedia, kemudian dianalisa untuk option untuk login, exit dan tombol about.
menjadi informasi yang dibutuhkan supaya
mempermudah jalannya sistem. Setelah itu
menganalisa data dengan menggunakan
Algoritma C.45. Setelah mendapatkan prosesnya
maka akan diketahui pola-pola tertentu untuk
mempermudah keputusan.
B. Analisa Proses
Gambar 3 Login
Setelah menentukan kebutuhan input, kemudian
Login dilakukan setelah masuk pada Menu Utama
dilakukan data Preprocessing yang terdiri dari 3
untuk dapat masuk pada menu pilihan.
tahapan sebagai berikut :
1. Data Selection (Menyeleksi Data)

13
Sekolah Tinggi Manajemen Informatika dan Komputer ASIA Malang
Jurnal Ilmiah Teknologi dan Informasi ASIA Vol. 8 No 2, Agustus 2014

About berisi informasi mengenai aplikasi yang


ada pada menu Help.

B. Pengujian

Dalam subbab ini akan dijelaskan tentang proses


pengujian hasil implementasi program yang telah
dibuat. Implementasi dalam hal ini adalah
bagaimana keakurasian program dalam
menentukan tingkah perilaku nasabah
Gambar 4 Menu berdasarkan perhitungan dari data yang
dimasukkan.
Menu yang terdiri dari beberapa item pilihan
diantaranya adalah Training, Testing dan Untuk pengujian ini, dilakukan terhadap 40 data
Halaman User. nasabah yang telah dimasukkan pada nasabah,
sehingga dapat ditentukan beberapa rule sebagai
berikut:

1. if alamat = kalikondang then


polaperilakunasabahtudakbaik
2. if alamat = demak then
polaperilakunasabahtidakbaik
3. if alamat =
wonosalamandaplapon>5750000 then
polaperilakunasabahbaik
4. if alamat
mat = wonosalam and
plapon<=5750000 then
Gambar 5Training
polaperilakunasabahtidakbaik
Form Training merupakan form yang berfungsi 5. if alamat = gajah then
untuk menganalisa resiko kredit calon nasabah polaperilakunasabahbaik
baru. 6. if alamat = kuningan then
polaperilakunasabahbaik
7. if alamat = sayung then
polaperilakunasabahtidakbaik
8. if alamat =kebonagug then
polaperilakunasabahbaik
9. if alamat = karangtengah then
polaperilakunasabahbaik
10. if alamat = bonang then
polaperilakunasabahbaik
Gambar 6Halaman
Halaman User 11. if alamat = mranggen then
polaperilakunasabahbaik
Halaman user berfungsi untuk mengolah data 12. if alamat = mangunjiwan then
user, seperti menambah, mengubah dan polaperilakunasabahbaik
menghapus data user. 13. if alamat = petengan the
then
polaperilakunasabahbaik
14. if alamat = banyumanik then
polaperilakunasabahbaik
15. if alaman = tanubayan then
polaperilakunasabahbaik
16. if alamat = mijen then
polaperilakunasabahtidakbaik
17. if alamat = sugihmanik then
polaperilakunasabahtidakbaik
18. if alamat = bongsari
ongsari then
polaperilakunasabahtidakbaik
19. if alamat = bangetayu then
Gambar 7 About polaperilakunasabahbaik

14
Jurnal Ilmiah Teknologi dan Informasi ASIA Vol. 8 No 2, Agustus 2014

menggunakanmetodepohonkeputusanmaka
sampeldiujihanyaberdasarkankriteriaatauk
elastertentu.
2. Daerah pengambilankeputusan yang
sebelumnyakompleksdansangat global,
dapatdiubahmenjadilebihsimpe
dapatdiubahmenjadilebihsimpeldanspesifik.
3. Fleksibeluntukmemilihfitur dari node
internal yang berbeda, fitur yang terpilih
akan membedakan suatu kriteria
dibandingkan kriteria yang lain dalam node
yang sama. Kefleksibelan metode pohon
keputusan ini meningkatkan kualitas
keputusan yang
dihasilkanjikadibandingkanketikamengguna
kanmetodepenghitungansatutahap yang
Gambar8Contoh
Contoh rule dalam program
lebihkonvensional
4. Dari Hasil uji coba sebanyak 20 data uji
Dari beberapa rule di atas, maka diujikan
dihasilkan 13 data benardan 7 data salah,
beberapa data baru yang dimasukkan ke dalam
sehinggadapatdisimpulkantingkatkeakurasi
program. Dari hasil ujicoba ini, didapatkan data
ansebesar 65%.
sebagai berikut:
B. Saran

1. Pengukurankinerjasebuahalgoritma
jasebuahalgoritma Data
Mining dapat dilakukan berdasarkan
beberapa kriteria antara lain akurasi,
kecepatan komputasi, robustness,
skalabilitas dan interpretabilitas. Penelitian
ini baru menggunakan satu kinerja yaitu
berdasarkan akurasi. Akan lebih baik
jikasemuakriteriadiujicoba
kasemuakriteriadiujicoba agar algoritma
yang ditelitilebihterujikinerjanya.
2. Penelitianjugamenggunakan data sampel
yang cukup terbatas yaitu 200 record, ini
dikarenakan keterbatasan akses data
perusahaan yang lengkap. Sampel yang
digunakan untuk pengembanga
pengembangan model
adalah sampel yang cenderung biasa karena
hanya melibatkan data awal customer.
Untuk mengestimasi akurasi sebuah
Dari hasil pengujian terhadap 20 data uji algoritma akan lebih baik jika jumlah data
didapatkan 13 data benar antara dataset dengan sampel yang digunakan mendekati populasi
data uji, 7 hasil uji tidak sama antara dataset dan yang ada. Diharapkan pada penelitian
hasil data uji. Hal ini dipengaruhi jumlah dataset. selanjutnya, record
ecord yang digunakan lebih
Dengan demikian, akurasi presentase proses banyak karena semakin banyak record
pengujian adalah : maka semakin banyak record yang dilatih
% Akurasi = (banyak jumlah data yang sehingga memungkinkan untuk menemukan
benar / banyak jumlah data uji) X 100 % pola diluar perkiraan atau karakteristik
% Akurasi = (13 / 20) X 100 % = 65 % pemohon kredit diluar pola.

DAFTAR PUSTAKA
PENUTUP [1] Agrawel dan Et Al. Mining Association Rule
A. Kesimpulan Between Sets Of Items In Large Databases.
Washington DC. In Procedings of The ACM
Secara keseluruhan, kinerja algoritma C.45 cukup SLGMOB. 1993
efisien karena,
[2] Chopde. Gosar dkk. A Study of Classification
1. Eliminasiperhitungan-perhitungan
perhitungan yang Based Credit Risk Analysis Algorithm.
tidak diperlukan, karena ketika Mumbai. VJTI. 2012

15
Jurnal Ilmiah Teknologi dan Informasi ASIA Vol. 8 No 2, Agustus 2014

[3] Dunham. Data Mining Introductory and


Advanced Topics. New Jersey. US. Prentice
Hall. Upper Pearson Education Inc. 2003

[4] Firdaus dan Ariyanti. Manajemen Perkreditan


Bank Umum. Bandung. Alfabeta. 2009

[5] Han dan Kamber. Data Mining : Concepts and


Techniques. America US. Elevier Inc. 2006

[6] Kusumadewi. Artificial Intelligence Teknik


dan Aplikasinya. Yogyakarta. Graha Ilmu.
2003

[7] Malmon O dan Last M. Knowledge Discovery


and Data Mining The Fuzzy Networks (IFN)
Methodology Dordrecht. Netherlands.Klower
Acdemy. 2000

[8] Nemati dan D.Barko. Organisation Data


Mining : Leveraging Enterprise Data
Resources for Optimal Performances. Hershey
PA. US and UK. Idea Group Inc. URL :
http://www.idea-group.com. 2001

[9] Santosa. DATA MINING : Teknik Pemanfaatan


Data Untuk Keperluan Bisnis. Yogyakarta.
Graha Ilmu. 2007

[10] Supriyanto. Buku Pintar Perbankan.


Yogyakarta. Andi. 2011

[11] Therling K. An Introduction to Data Mining


Discovery Hidden Value in Your Data
Warehouse. Url: http://www.thearling.com .
2006

[12] W Yusuf. A.S Vivianne dan Pratikto. Evaluasi


Pemohon Kredit Mobil di PT X dengan
Menggunakan Teknik Data Mining Decision
Tree. Bandung. Universitas Katolik
Parahyangan. 2009

16
Sekolah Tinggi Manajemen Informatika dan Komputer ASIA Malang

Anda mungkin juga menyukai