2023106301
Vol. 10, No. 2, April 2023, hlm. 271-280 p-ISSN: 2355-7699
Akreditasi KEMENRISTEKDIKTI, No. 36/E/KPT/2019 e-ISSN: 2528-6579
Abstrak
Salah satu tantangan dalam institusi keuangan adalah manajemen risiko kredit. Hal ini juga terjadi pada institusi
pendidikan swasta dimana pengelolaan keuangan dilakukan secara mandiri serta sumber dana mayoritas berasal
dari mahasiswa. Setiap institusi harus menjamin kesehatan finansial melalui monitoring cashflow. Adanya
penundaan atau kredit pembayaran biaya kuliah mahasiswa akan mempengaruhi cashflow institusi. Oleh karena
itu dibutuhkan analisis kredit sebagai tindakan preventif guna mencegah terjadinya kredit yang bermasalah dan
meminimalkan risiko kredit lainnya yang timbul di kemudian hari. Pada penelitian ini, algoritma machine learning
digunakan untuk analisis kredit pembayaran biaya kuliah pada perguruan tinggi. Dataset yang digunakan adalah
data riwayat tagihan, transaksi pembayaran, dan data pengajuan kredit/ angsuran. Tahap perancangan sistem terdiri
dari preprocessing, pemilihan fitur, pemodelan, pengujian dan evaluasi hasil. Berdasarkan hasil pengujian
algoritma dengan kinerja terbaik adalah KNN dengan recall untuk prediksi “gagal bayar” sebesar 0,8 dan prediksi
“berhasil” sebesar 0,76. Model machine learning ini kemudian ditanamkan dalam sebuah sistem informasi analisis
kredit biaya kuliah. Selain itu juga sistem akan memberikan skor setiap pengajuan berdasarkan metode scorecard.
Semakin tinggi skor kredit semakin kecil risiko gagal bayarnya. Skor kredit ini berkisar antara 250 – 600. Jika
kredit yang diajukan diprediksi “gagal bayar” dengan skor kredit rendah atau berpotensi menjadi piutang macet,
sistem akan merekomendasikan untuk menilik ulang skema pengajuan kredit dari mahasiswa tersebut agar
mahasiswa tetap dapat melanjutkan pendidikan dan cash collection ratio tetap baik.
Kata kunci: analisis kredit, credit scoring, machine learning, scorecard, cashflow, keuangan.
One of the challenges in financial institutions is credit risk management. This also occurs in private educational
institutions where financial management is carried out independently and most of funding sources come from
students. Each institution must ensure financial health through cashflow monitoring. Any delay or credit in paying
student tuition fees will affect the institution's cashflow. Therefore, credit analysis is needed as a preventive
measure to prevent non-performing loans and minimize other credit risks that arise in the future. In this study,
machine learning algorithms are used for credit analysis for paying tuition fees activity at universities. The
datasets used are billing history data, payment transactions, and credit/installment application data. The system
design stage consists of preprocessing, feature selection, modeling, uji and evaluation of results. Based on the
results of uji the algorithm with the best performance is KNN with a recall for the prediction of "failure to pay" of
0,8 and prediction of "success" of 0,76. This machine learning model is then embedded in a tuition credit analysis
information system. In addition, the system will provide a score for each submission based on the scorecard
method. The higher the credit score, the lower the risk of default. This credit score ranges from 250 – 600. If the
proposed credit is predicted to be "in default" with a low credit score or has the potential to become bad debts,
the system will recommend reviewing the student's credit application scheme so that students can continue their
education and cash collection ratio remains good.
Keywords: credit analysis, credit scoring, machine learning, scorecard, cashflow, finance.
271
272 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), Vol. 10, No. 2, April 2023, hlm. 271-280
1. PENDAHULUAN pengajuan kredit oleh mahasiswa dan dapat
meminimalkan risiko penurunan cash collection ratio.
Salah satu tantangan dalam institusi keuangan
Berdasarkan kajian literatur yang telah dilakukan,
adalah manajemen risiko kredit. Hal ini juga terjadi
penelitian ini adalah implementasi pertama kali analisis
pada institusi pendidikan swasta di mana pengelolaan
kredit pembayaran biaya kuliah di Perguruan Tinggi.
keuangan dilakukan secara mandiri serta sumber dana
Pada umumnya analisis kredit dilakukan di Lembaga
mayoritas berasal dari mahasiswa. Setiap institusi harus
Keuangan dengan menggunakan berbagai informasi
menjamin kesehatan finansial melalui monitoring
keuangan pribadi yang lebih kompleks seperti FICO
cashflow. Adanya penundaan atau kredit pembayaran
score atau riwayat kredit pada Sistem Informasi Debitur
biaya kuliah mahasiswa akan mempengaruhi cashflow
(SID).
institusi. Oleh karena itu dibutuhkan analisis kredit
sebagai tindakan preventif guna mencegah terjadinya
2. METODE PENELITIAN
kredit yang bermasalah dan meminimalkan risiko kredit
lainnya yang timbul di kemudian hari. Analisis kredit Penelitian yang dilakukan bertujuan untuk
merupakan penilaian terhadap permohonan kredit baru, pemodelan machine learning untuk analisis kredit biaya
perpanjangan, maupun restrukturisasi layak atau tidak kuliah mahasiswa. Model machine learning yang
untuk diberikan. Biasanya seorang kredit analis akan dibangun akan ditanamkan ke dalam sistem informasi
melakukan pemeringkatan kelayakan dan risiko kredit kredit mahasiswa. Pada sistem informasi tersebut
yang diajukan dengan metode Credit Risk Rating mahasiswa dapat mengajukan permohonan angsuran
(CRR). Hal ini tentunya sangat bergantung pada dengan memasukkan data-data yang dibutuhkan,
kepakaran seseorang dalam melakukan analisis kredit. kemudian sistem akan menghitung score kredit dari
Saat ini pemanfaatan analisis data menggunakan pengajuan untuk memberikan rekomendasi seberapa
machine learning sudah banyak diaplikasikan di bidang besar risiko jika kredit disetujui.
keuangan, di antaranya deteksi fraud kartu kredit
(Varmedja et al., 2019), trading (Ritter, 2017), credit 2.1 Data
scoring (Dastile, Celik & Potsane, 2020), sistem
rekomendasi produk keuangan (Barreau, 2020), risk Data histori kredit mahasiswa yang telah
management (Leo, Sharma & Maddulety, 2019), terkumpulkan sejumlah 393 yang terdiri dari data
money-laundering prevention (Chen et al., 2018), dan nomor induk mahasiswa, nama mahasiswa, nominal
sebagainya. Pemodelan credit scoring menggunakan dan jatuh tempo kredit, serta nominal dan tanggal
algoritma machine learning beberapa di antaranya pembayaran. Dari data ini dapat dihitung keterlambatan
menggunakan algoritma logistic regression (Shen, pembayaran setiap kredit untuk kemudian
Wang & Shen, 2019; Dumitrescu et al., 2022), nearest dikategorikan ke dalam dua kategori yaitu kategori
neighbord (Mukid et al., 2018), Bayesian (Abid et al., Bayar: 0 - 90 hari dan Gagal Bayar: >90 hari.
2017), artificial neural network (Munkhdalai et al., Selain data histori kredit, data profil mahasiswa
2019), decision tree (Damrongsakmethee & Neagoe, juga dikumpulkan. Data tersebut terdiri dari data orang
2019; Liu, Fan & Xia, 2021), algoritma genetika tua terkait pekerjaan, penghasilan, pendidikan, dan usia;
(Zhang, He & Zhang, 2019), dan SVM (Goh & Lee, jumlah anggota dalam kartu keluarga; jumlah anak; dan
2019). usia masing-masing anak.
Penggunaan algoritma machine learning sangat
membantu dalam analisis data keuangan dengan efektif 2.2 Preprocessing Data
dan efisien. Credit scoring sebagai alat penilaian kredit Tahap preprocessing dilakukan sebelum tahap
otomatis yang telah digunakan oleh pemberi pinjaman analisis atau pembentukan model machine learning
seperti bank dan lembaga keuangan lainnya. Dengan terhadap data yang telah dikumpulkan. Tahap
demikian, permasalahan analisis kredit pembayaran preprocessing di antaranya yaitu memilah data,
biaya kuliah pada perguruan tinggi pun dapat membersihkan data (missing value, outlier, dll),
diselesaikan dengan membangun sistem cerdas yang memvalidasi data, dan mengkonstruksi data.
dapat menganalisis kelayakan kredit yang diajukan. Proses memilah data dilakukan dengan
Jika kredit yang diajukan berpotensi menjadi piutang menghapuskan data riwayat kredit mahasiswa yang
macet, sistem akan merekomendasikan untuk menilik telah berstatus Drop Out/ tidak aktif. Data yang diolah
ulang skema pengajuan kredit dari mahasiswa tersebut hanya data mahasiswa yang berstatus aktif saja,
agar mahasiswa tetap dapat melanjutkan pendidikan sehingga data berkurang dari 393 menjadi 377 data.
dan pembayaran biaya pendidikan lancar. Sistem ini Setelah data dipilah kemudian data dibersihkan dari
dapat dibangun dengan pemodelan machine learning format yang tidak konsisten, missing value dan outlier.
dari data transaksi pembayaran mahasiswa. Beberapa Missing value adalah data yang kosong sedangkan
algoritma machine learning akan dibandingkan outlier adalah data yang menyimpang terlalu jauh dari
kinerjanya untuk mendapatkan model machine learning data yang lainnya dalam suatu kumpulan data
dengan kinerja terbaik yang akan digunakan pada (pencilan). Terdapat 34 data outlier yang dihapuskan
sistem. Dengan sistem ini unit keuangan akan lebih dari kumpulan data. Transformasi data kemudian
mudah dalam melakukan screening awal terhadap dilakukan untuk data numerik dan kategorik.
Arliyanti Nurdin, dkk, Analisis Kredit Pembayaran… 273
hasil prediksi positif. Precision dihitung dengan Nilai IV pada credit scoring direpresentasikan pada
persamaan (10) berikut. Tabel 2 berikut:
Tabel 2 Representasi Nilai IV pada Credit Scoring
𝑇𝑃
𝑝𝑟𝑒𝑐𝑖𝑠𝑠𝑖𝑜𝑛 = (10) (Naeem Siddiqi, 2012).
𝑇𝑃+𝐹𝑃
Information Value Variable Predictiveness
𝑇𝑃
𝑟𝑒𝑐𝑎𝑙𝑙 = (11) 2.8. Evaluasi Model Scorecard
𝑇𝑃+𝐹𝑁
Gambar 5 Halaman Daftar Pengajuan Kredit – Skor Kredit dan Rekomendasi Sistem
3.3. Sistem Informasi Analisis Kredit Biaya Kuliah learning dengan kinerja terbaik yaitu KNN, dapat
dilihat pada Gambar 5. Sistem dapat memberikan
Tampilan sistem informasi analisis kredit biaya
rekomendasi setiap pengajuan kredit apakah diterima
kuliah yang telah dilengkapi dengan algoritma machine
278 Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK), Vol. 10, No. 2, April 2023, hlm. 271-280
atau ditolak berdasarkan hasil prediksi dari algoritma seperti SVM, dan algoritma pembelajaran lainnya yang
KNN terhadap status kredit “berhasil” atau “gagal belum dilakukan saat ini.
bayar”. Jika prediksi “berhasil” maka rekomendasi
sistem adalah “diterima”, sebaliknya jika prediksi
“gagal bayar” maka rekomendasi sistem adalah DAFTAR PUSTAKA
“ditolak”. Selain itu juga sistem akan memberikan skor
ABID, L., ZAGHDENE, S., MASMOUDI, A. &
setiap pengajuan berdasarkan metode scorecard yang
Ghorbel, S.Z., 2017. Bayesian Network
telah ditanamkan pada sistem. Semakin tinggi skor
Modeling: A Case Study of Credit Scoring
kredit semakin kecil risiko gagal bayarnya. Skor kredit
Analysis of Consumer Loans Default
ini berkisar antara 250 – 600. Jika rekomendasi kredit
Payment. Asian Economic and Financial
“ditolak” maka perlu menilik ulang skema pengajuan
Review, 7(9), pp.846–857.
kredit dari mahasiswa tersebut.
https://doi.org/10.18488/journal.aefr.2017.79.
846.857.
4. KESIMPULAN
ALTMAN, N.S., 1992. An introduction to kernel and
Pada penelitian ini, algoritma machine learning nearest-neighbor nonparametric regression.
digunakan untuk analisis kredit melalui prediksi gagal American Statistician, 46(3), pp.175–185.
bayar pada setiap permohonan kredit biaya kuliah. Fitur https://doi.org/10.1080/00031305.1992.10475
yang dapat digunakan dari dokumen slip gaji orang tua, 879.
Kartu Keluarga dan KTP di antaranya data orang tua BARREAU, B., 2020. Machine Learning for Financial
(penghasilan, pendidikan, usia, status pernikahan, status Products Recommendation. [online] Available
kematian), jumlah anggota keluarga, jumlah anak, dan at: <https://tel.archives-ouvertes.fr/tel-
rata-rata usia anak. 02974918>.
Ukuran kinerja model machine learning pada BREIMAN, L., J.H.F.R.A.O. & C.J.STONE., 1984.
kasus ini yang diprioritaskan adalah berdasarkan nilai Classification and Regression Trees. Belmont,
recall pada kelas “1” yang mewakili kelas gagal bayar. CA: Wadsworth International Group.
Semakin tinggi nilai recall maka semakin kecil false CHEN, Z., VAN KHOA, L.D., TEOH, E.N., NAZIR,
negative yang terjadi. Dengan demikian kesalahan A., KARUPPIAH, E.K. & LAM, K.S., 2018.
memprediksi gagal bayar sebagai berhasil bayar Machine learning techniques for anti-money
semakin sedikit. Berdasarkan hasil pengujian algoritma laundering (AML) solutions in suspicious
dengan kinerja terbaik adalah KNN dengan recall untuk transaction detection: a review. Knowledge
prediksi “gagal bayar” sebesar 0,8 dan prediksi and Information Systems, 57(2), pp.245–285.
“berhasil” sebesar 0,76. Model machine learning ini https://doi.org/10.1007/s10115-017-1144-z.
kemudian ditanamkan dalam sebuah sistem informasi DAMRONGSAKMETHEE, T. & NEAGOE, V.-E.,
analisis kredit biaya kuliah. Algoritma machine 2019. Principal Component Analysis and
learning untuk memberikan hasil prediksi status kredit ReliefF Cascaded with Decision Tree for
“berhasil” atau “gagal bayar”. Selain itu juga sistem Credit Scoring. pp.85–95.
akan memberikan skor setiap pengajuan berdasarkan https://doi.org/10.1007/978-3-030-19810-
metode scorecard yang telah ditanamkan pada sistem. 7_9.
Semakin tinggi skor kredit semakin kecil risiko gagal DASTILE, X., CELIK, T. & POTSANE, M., 2020.
bayarnya. Skor kredit ini berkisar antara 250 – 600. Jika Statistical and machine learning models in
kredit yang diajukan diprediksi “gagal bayar” dengan credit scoring: A systematic literature survey.
skor kredit rendah atau berpotensi menjadi piutang Applied Soft Computing, 91, p.106263.
macet, sistem akan merekomendasikan untuk menilik https://doi.org/10.1016/j.asoc.2020.106263.
ulang skema pengajuan kredit dari mahasiswa tersebut DUMITRESCU, E., HUÉ, S., HURLIN, C. &
agar mahasiswa tetap dapat melanjutkan pendidikan TOKPAVI, S., 2022. Machine learning for
dan cash collection ratio tetap baik. credit scoring: Improving logistic regression
Pada penelitian ini jumlah data histori kredit with non-linear decision-tree effects.
masih sedikit, sehingga untuk pengembangan penelitian European Journal of Operational Research,
selanjutnya, data histori kredit dan fitur untuk 297(3), pp.1178–1192.
membangun model prediksi dapat ditambahkan seperti https://doi.org/10.1016/j.ejor.2021.06.053.
data kepemilikan rumah dan kendaraan, tagihan listrik FANG, F. & CHEN, Y., 2019. A new approach for
dan PDAM, PBB atau biaya sewa rumah per bulan, credit scoring by directly maximizing the
serta kredit lainnya yang dimiliki. Fitur tambahan ini Kolmogorov–Smirnov statistic.
berpotensi dapat meningkatkan kinerja algoritma dalam Computational Statistics and Data Analysis,
menganalisis kredit apakah berpotensi gagal bayar atau 133, pp.180–194.
tidak. Pada penelitian ini, fitur-fitur tersebut tidak dapat https://doi.org/10.1016/j.csda.2018.10.004.
ditambahkan karena keterbatasan data. Selain FAWCETT, T., 2006. An introduction to ROC analysis.
penambahan fitur, pada penelitian selanjutnya juga Pattern Recognition Letters, 27(8), pp.861–
dapat membandingkan algoritma pembelajaran mesin 874.
https://doi.org/10.1016/j.patrec.2005.10.010.
Arliyanti Nurdin, dkk, Analisis Kredit Pembayaran… 279