Anda di halaman 1dari 19

TUGAS DATA MINING

KLASIFIKASI POLA NASABAH BANK BRI MENGGUNAKAN


ALGORITMA C4.5

Disusun Oleh :
Kenia Samantha (24010216120019)
Nabila Surya Wardani (24010216140053)
Haniatul Mutamakkinah (24010216130057)
Nabila Chairunnisa (24010216130095)

DEPARTEMEN STATISTIKA
FAKULTAS SAINS DAN MATEMATIKA
UNIVERSITAS DIPONEGORO
SEMARANG
2019
KATA PENGANTAR
Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunia-
Nya sehingga penulis dapat menyelesaikan makalah tugas matakuliah Data Mining.
Penulisan laporan ini tidak dapat terselesaikan dengan baik tanpa adanya keterlibatan
dari berbagai pihak. Oleh karena itu, penulis ingin menyampaikan terima kasih kepada
:
1. Bapak Dr. Tarno, M.Si, selaku Ketua Departemen Statistika Fakultas Sains dan
Matematika Universitas Diponegoro.
2. Bapak Alan Prahutama, S.Si, M.Si, selaku Dosen Matakuliah Data Mining.
3. Semua pihak yang tidak dapat disebutkan satu per satu yang telah mendukung
penulis dalam menyelesaikan laporan ini.
Pada penulisan makalah tugas matakuliah Data Mining ini, penulis menyadari
masih terdapat kekurangan dan jauh dari sempurna. Oleh karena itu, penulis
mengharapkan kritikan dan saran yang bersifat membangun, dan semoga makalah ini
dapat bermanfaat bagi pembaca.

Semarang, 04 Juli 2019


Penulis
BAB I
Pendahuluan

1.1.Latar Belakang
PT. Bank Rakyat Indonesia (Persero) adalah salah satu bank
yang menyediakan layanan Kredit Pegawai kepada para
nasabahnya. Pengajuan kredit Pegawai (BRIGuna) bisa dilakukan
oleh pemohon yang telah memenuhi syarat dari pihak bank.
Pemberian kredit ini masih menjadi masalah yang krusial, karena
pihak bank masih sangat sulit untuk menentukan pola debitur atau
pemohon yang menyebabkan kredit lancar atau macet. Banyak
faktor yang menyebabkan kredit macet, diantaranya jumlah
penghasilan tiap bulan dan banyaknya kebutuhan ekonomi.
Pembayaran kredit yang macet membuat performa bank menjadi
buruk.
Pada Bank BRI Cabang Batang kredit yang banyak diambil
adalah kredit pegawai, dimana hanya yang berpenghasilan tetap
yang diperbolehkan mengambil kredit tersebut. Syarat untuk
mengajukan kredit pada Bank BRI juga sangatlah mudah, tetapi
walaupun demikian, masih ada juga nasabah yang membayar kredit
secara macet. Apalagi jika nasabah tersebut tiba-tiba menghilang,
tidak terlihat lagi dalam instansinya. Sedangkan untuk nasabah yang
meninggal sebelum kreditnya lunas, biaya itu ditanggung oleh
asuransi.
Oleh karena itu, data nasabah dari Bank Rakyat Indonesia
(Persero) Kantor Cabang Batang menjadi bahan acuan untuk
menganalisa pola nasabah pemohon kredit. Pemohon kredit
termasuk dalam kategori lancar, diperlukan perhatian khusus,
kurang lancar, atau macet. Dalam kasus ini digunakan teknik data
mining decision treeuntuk mengklasifikasi pola nasabah dengan
menggunakan pohon keputusan algoritma C4.5.
Data mining dapat diterapkan pada berbagai bidang yang
mempunyai sejumlah data, tetapi karena wilayah penelitian dengan
sejarah yang belum lama, dan belum melewati masa “remaja”, maka
data mining masih diperdebatkan posisi bidang pengetahuan yang
memilikinya. Maka, Daryl Pregibon menyatakan bahwa “data
mining adalah campuran dari statistik, kecerdasan buatan, dan riset
basis data” yang masih berkembang. Kemunculan data mining
berdasarkan pada jumlah data yang tersimpan pada basis data
semakin besar.
Decision Tree atau pohon keputusan adalah pohon yang
digunakan sebagai prosedur penalaran untuk mendapatkan jawaban
dari masalah yang dimasukkan. Pohon yang dibentuk tidak selalu
berupa pohon biner. Apabila semua fitur data set menggunakan dua
macam nilai kategorikal maka bentuk pohon yang didapatkanadalah
pohon biner. Apabila dalam fitur berisi lebih dari dua macam nilai
kategorikal atau menggunakan tipe numerik maka bentuk yang
didapatkan biasanya tidak berupa pohon biner. Kefleksibelan
membuat metode ini atraktif, khususnya karena memberikan
keuntungan berupa visualisasi saran (dalam bentuk decision tree)
yang membuat prosedur prediksinya dapat diamati (Gorunescu,
2011). Algoritma C4.5 juga menggunakan kriteria gain dalam
menentukan fitur yang menjadi pemecah node pada pohon yang
diinduksi.
1.2.Rumusan Masalah
Bagaimana cara mengklasifikasikan data nasabah kredit
BRIGuna pada Bank Rakyat Indonesia (Persero) dengan
menggunakan algoritma C4.5.
1.3.Tujuan
Tujuan dari penelitian ini adalah untuk menerapkan data
mining pada pengklasifikasian data nasabah kredit pegawai
(BRIGuna) pada Bank Rakyat Indonesia (Persero) dengan
algoritma C4.5 agar mengetahui pola nasabah pada pembayaraan
kredit.
BAB II
Isi

Pada penelitian ini , digunakan data primer yang didapat dari Bank BRI Kantor Cabang
Batang dengan jumlah 81 data nasabah kredit dengan atribut nama, nomor rekening,
umur, status, penghasilan, angsuran, jangka waktu, dan label. Berikut merupakan
keterangan masing-masing atribut:

Nama Atribut yang difungsikan sebagai ID

Nomor Rekening Atribut yang difungsikan sebagai ID

Umur Atribut yang digunkan sebagai kelayakan


pengambilan kredit
Status Atribut yang menunjukkan status pernikahan
dari nasabah
Penghasilan Atribut yang menjelaskan penghasilan
nasabah kredit
Angsuran Atribut yang menjelaskan pembayaran
angsuran dan bunga yang diambil nasabah
kredit setiap bulannya
Jangka Waktu Atribut yang digunakan untuk menentukan
lama waktu pembayaran kredit yang diambil
yang sudah ada kesepakatan dengan pihak
bank
Label Atribut yang digunakan untuk menjelaskan
hasil dari kredit asabah yang merupkan
pembayaran lacar ata macet
Langkah selanjutnya yaitu pemilihan atribut data yang digunakan. Pengklasifikasian
c45 menggunakan aplikasi WEKA.

Atribut Detail penggunaan


Nama Tidak digunakan No

Nomor Rekening Tidak digunakan No


Umur Digunakan Nilai Model

Status Digunakan Nilai Model

Penghasilan Digunakan Nilai Model

Angsuran Digunakan No

Jangka Waktu Digunakan Nilai Model

Label Digunakan Label Target

 Proses Pengklasifikasian
1. Pilih Explorer

2. Klik Open File > pilih file yang akan diklasifikasikan dalam format “.csv”,
dalam hal ini file “nasabah.csv” > klik open
3. Pilih menu Classify > klik choose > pilih Trees > pilih J48 > pilih
percentage split 80% (artinya 80% data nasabah menjadi training set
kemudian sisanya yaitu 20% menjadi test set) > klik Start
4. Untuk memunculkan diagram pohon adalah dengan cara klik kanan pada
Result list > pilih Visualize Tree
 Hasil Pengujian

Gambar 1. Diagram Pohon


Output :

=== Run information ===

Scheme: weka.classifiers.trees.J48 -C 0.25 -M 2


Relation: nasabah
Instances: 147
Attributes: 6
Umur
Status
Penghasilan
Angsuran
Jangka Waktu
Label
Test mode: split 80.0% train, remainder test

=== Classifier model (full training set) ===

J48 pruned tree


------------------

Penghasilan = rendah: Macet (33.0)


Penghasilan = tinggi: Lancar (24.0)
Penghasilan = sedang
| Angsuran = <=700000: Lancar (8.0)
| Angsuran = >1500000: Lancar (0.0)
| Angsuran = >=800000-
| | Jangka Waktu <= 180: Macet (13.0/5.0)
| | Jangka Waktu > 180: Lancar (3.0)
| Angsuran = 1500000: Lancar (0.0)

Number of Leaves : 7

Size of the tree : 10

Time taken to build model: 0.01 seconds

=== Evaluation on test split ===

Time taken to test model on test split: 0 seconds

=== Summary ===

Correctly Classified Instances 14 87.5 %


Incorrectly Classified Instances 2 12.5 %
Kappa statistic 0.7538
Mean absolute error 0.1912
Root mean squared error 0.3021
Relative absolute error 38.1641 %
Root relative squared error 60.3004 %
Total Number of Instances 16
Ignored Class Unknown Instances 13

=== Detailed Accuracy By Class ===

TP Rate FP Rate Precision Recall F-Measure MCC ROC Area


PRC Area Class
0.778 0.000 1.000 0.778 0.875 0.778 0.828 0.852
Macet
1.000 0.222 0.778 1.000 0.875 0.778 0.968 0.841
Lancar
Weighted Avg. 0.875 0.097 0.903 0.875 0.875 0.778 0.889 0.847

=== Confusion Matrix ===

a b <-- classified as
7 2 | a = Macet
0 7 | b = Lancar

Dengan Percentage Split 80%, tingkat keberhasilan 87,5% serta error sebesar
12,5% diperoleh model sebagai berikut :
 Jika penghasilannya rendah maka pembayaran kredit mengalami
kemacetan.
 Jika penghasilannya tinggi maka pembayaran kredit lancar.
 Jika penghasilannya sedang maka dilihat lagi pada jenis angsurannya.
 Jika angsurannya <= 700000, maka pembayaran kredit lancar.
 Jika angsurannya >1500000, maka pembayaran kredit lancar.
 Jika angsurannya >= 800000, maka dilihat lagi pada jenis jangka waktu
pembayaran kredit.
 Jika jangka waktu pembayaran kredit <= 180, maka pembayaran
kredit mengalami kemacetan.
 Jika jangka waktu pembayaran kredit > 180 , maka pembayaran
kredit lancar.
 Jika angsurannya = 1500000 , maka pembayaran kredit lancar.

Dari output diatas, dapat diketahui pula mengenai nilai akurasi melalui
Confusion Matrix:
7+7
Akurasi = 7+2+0+7 × 100% = 87,5%

Keterangan dari Confusion Matrix adalah :


 Jumlah data real yang macet dan diprediksi macet adalah 7
 Jumlah data real yang lancar dan diprediksi lancar adalah 7
 Jumlah data real yang macet dan diprediksi lancar adalah 2
 Jumlah data real yang lancar dan diprediksi macet adalah 0
KESIMPULAN

Setelah melakukan analisis dan pengklasifikasian, maka dapat diperoleh


kesimpulan sebagai berikut :

a. Berdasarkan hasil Running aplikasi WEKA, penerapan data mining klasifikasi


pola nasabah menggunakan algoritma C4.5 pada Bank BRI Batang
menghasilkan akurasi yang tinggi yaitu sebesar 87,5%
b. Berdasarkan hasil tersebut, kriteria macet yang diperoleh adalah yang
berpenghasilan rendah, atau yang berpenghasilan sedang dengan angsuran
>=800000 dan dengan jangka waktu pembayaran kredit yang <=180
LAMPIRAN

Data Nasabah Bank BRI Batang:

Jangka
No Umur Status Penghasilan Angsuran Label
Waktu
1. dewasa MENIKAH rendah <=700000 240 Macet
2. BELUM
muda tinggi >1500000 160 Lancar
MENIKAH
3 >=800000-
dewasa MENIKAH sedang 1500000 160 Macet
4. BELUM
muda MENIKAH rendah <=700000 120 Macet
5. tua MENIKAH rendah <=700000 180 Macet
6. BELUM >=800000-
muda sedang 160 Lancar
MENIKAH 1500000
7. muda MENIKAH tinggi >1500000 160 Lancar
8. tua MENIKAH rendah <=700000 120 Macet
9. >=800000-
tua MENIKAH tinggi 1500000 120 Lancar
10. BELUM
muda MENIKAH sedang <=700000 160 Lancar
11. dewasa MENIKAH rendah <=700000 180 Macet
12. dewasa MENIKAH tinggi >1500000 240 Lancar
13. BELUM >=800000-
muda sedang 180 Macet
MENIKAH 1500000
14. BELUM
muda rendah <=700000 160 Macet
MENIKAH
15. dewasa MENIKAH rendah <=700000 240 Macet
16. >=800000-
tua MENIKAH sedang 1500000 240 Lancar
17. dewasa MENIKAH tinggi >1500000 160 Lancar
18. BELUM
muda MENIKAH rendah <=700000 160 Macet
19. >=800000-
tua MENIKAH tinggi 120 Lancar
1500000
20. tua MENIKAH sedang <=700000 180 Lancar
21. tua MENIKAH rendah <=700000 160 Macet
22. tua MENIKAH tinggi >1500000 160 Lancar
23. muda BELUM sedang >=800000- 120 Macet
MENIKAH 1500000
24. dewasa MENIKAH rendah <=700000 120 Macet
25. tua MENIKAH rendah <=700000 160 Macet
26. muda BELUM sedang >=800000- 180 Lancar
MENIKAH 1500000
27. dewasa MENIKAH tinggi >1500000 240 Lancar
28. tua MENIKAH rendah <=700000 180 Macet
29. muda BELUM tinggi >=800000- 160 Lancar
MENIKAH 1500000
30. muda BELUM sedang <=700000 240 Lancar
MENIKAH
31. tua MENIKAH rendah <=700000 240 Macet
32. tua MENIKAH tinggi >1500000 160 Lancar
33. muda MENIKAH sedang >=800000- 160 Macet
1500000
34. tua MENIKAH rendah <=700000 120 Macet
35. tua MENIKAH rendah <=700000 180 Macet
36. muda BELUM sedang >=800000- 160 Lancar
MENIKAH 1500000
37. muda BELUM tinggi >1500000 160 Lancar
MENIKAH
38. dewasa MENIKAH rendah <=700000 120 Macet
39. tua MENIKAH tinggi >=800000- 120 Lancar
1500000
40. muda BELUM sedang <=700000 160 Lancar
MENIKAH
41. muda BELUM rendah <=700000 180 Macet
MENIKAH
42. dewasa MENIKAH tinggi >1500000 240 Lancar
43. tua MENIKAH sedang >=800000- 180 Macet
1500000
44. muda BELUM rendah <=700000 160 Macet
MENIKAH
45. muda BELUM rendah <=700000 240 Macet
MENIKAH
46. tua MENIKAH sedang >=800000- 240 Lancar
1500000
47. tua MENIKAH tinggi >1500000 160 Lancar
48. muda MENIKAH rendah <=700000 160 Macet
49. tua MENIKAH tinggi >=800000- 120 Lancar
1500000
50. tua MENIKAH sedang <=700000 180 Lancar
51. muda BELUM rendah <=700000 160 Macet
MENIKAH
52. muda BELUM tinggi >1500000 160 Lancar
MENIKAH
53. dewasa MENIKAH sedang >=800000- 120 Macet
1500000
54. tua MENIKAH rendah <=700000 120 Macet
55. muda BELUM rendah <=700000 160 Macet
MENIKAH
56. dewasa MENIKAH sedang >=800000- 180 Lancar
1500000
57. tua MENIKAH tinggi >1500000 240 Lancar
58. muda BELUM rendah <=700000 180 Macet
MENIKAH
59. tua MENIKAH tinggi >=800000- 160 Lancar
1500000
60. tua MENIKAH sedang <=700000 240 Lancar
61. muda MENIKAH rendah <=700000 240 Macet
62. tua MENIKAH tinggi >1500000 160 Lancar
63. tua MENIKAH sedang >=800000- 160 Macet
1500000
64. muda BELUM rendah <=700000 120 Macet
MENIKAH
65. muda BELUM rendah <=700000 180 Macet
MENIKAH
66. dewasa MENIKAH sedang >=800000- 160 Lancar
1500000
67. tua MENIKAH tinggi >1500000 160 Lancar
68. muda BELUM rendah <=700000 120 Macet
MENIKAH
69 tua MENIKAH tinggi >=800000- 120 Lancar
1500000
70. dewasa MENIKAH sedang <=700000 160 Lancar
71. tua MENIKAH rendah <=700000 180 Macet
72. muda BELUM tinggi >1500000 240 Lancar
MENIKAH
73. tua MENIKAH sedang >=800000- 180 Macet
1500000
74. tua MENIKAH rendah <=700000 160 Macet
75. muda BELUM rendah <=700000 240 Macet
MENIKAH
76. tua MENIKAH sedang >=800000- 240 Lancar
1500000
77. tua MENIKAH tinggi >1500000 160 Lancar
78. tua MENIKAH rendah <=700000 160 Macet
79. muda BELUM tinggi >=800000- 120 Lancar
MENIKAH 1500000
80. dewasa MENIKAH sedang <=700000 180 Lancar
81. tua MENIKAH rendah <=700000 160 Macet

Anda mungkin juga menyukai