ABSTRAK
Perkembangan teknologi informasi saat ini memungkinkan penyimpanan data dalam skala yang sangat
besar. Melimpahnya data menjadi tantangan dalam dunia teknologi informasi, termasuk perbankan, untuk
tidak hanya mendapatkan informasi saja, tetapi juga menemukan pola untuk menghasilkan pengetahuan.
Data mining merupakan kegiatan menemukan pengetahuan dari sejumlah data yang sangat besar. Dengan
memanfaatkan data pinjaman anggota, data mining dapat membantu pengambilan keputusan besar
pinjaman bagi anggota koperasi simpan pinjam. Algoritma data mining yang digunakan untuk
membangun aplikasi data mining adalah k-nearest neighbor (kNN). KNN digunakan untuk
mengklasifikasikan besar pinjaman anggota berdasarkan jarak kedekatan atribut. Percobaan
menggunakan 25 sampel data dengan nilai k=8 dan k=12 menghasilkan akurasi sebesar 84%. Hasil proses
mining dapat digunakan untuk membantu pegawai koperasi simpan pinjam dalam menentukan besar
pinjaman bagi anggotanya.
besarnya pinjaman yang sudah diberikan di masa Seringkali data mining menggunakan data dari
lalu dalam membantu menentukan besar berbagai sumber data sehingga integrasi data
pinjaman bagi anggotanya. harus dilakukan secara cermat..
c. Pemilihan Data (Data Selection)
II. TINJAUAN PUSTAKA Pemilihan data merupakan proses pemilihan data
yang akan digunakan dalam proses data mining.
d. Transformasi Data (Data Transformation)
2.1. Pengertian Data Mining
Transformasi data merupakan proses pengubahan
Data mining merupakan kegiatan
data sebelum digunakan untuk data mining.
mengumpulkan dan memakai data historis untuk
e. Proses Mining
menemukan keteraturan, pola atau hubungan dalam
Proses mining merupakan proses utama dalam
set data berukuran besar. Keluaran dari data mining
menemukan pola yang didapat dengan
dapat dipakai untuk memperbaiki pengambilan
melaksanakan metode-metode data mining.
keputusan dimasa depan [5]. Secara sederhana, data
f. Evaluasi Pola (Pattern Evaluation)
mining adalah kegiatan menemukan pengetahuan dari
Evaluasi pola merupakan proses mengidentifikasi
sejumlah data yang sangat besar. Data tersimpan
pola yang didapat dari proses mining untuk
dalam bentuk basis data, data warehouse, dan
dievaluasi apakah pola hipotesa yang ada benar-
penyimpanan informasi lainnya [1].
benar tercapai.
Dengan memanfaatkan data mining,
g. Presentasi Pengetahuan (Knowledge
pengetahuan menarik atau informasi tingkat tinggi
Presentation)
dapat diperoleh dari database. Pengetahuan ini dapat
Pengetahuan dari pola yang ada divisualisasikan
digunakan oleh pemakai untuk mendukung
untuk dapat dipahami dan dimanfaatkan oleh
keputusan, proses kontrol, manajemen informasi dan
pengguna.
pemrosesan query [1].
2.3. Teknik Data Mining
2.2. Tahap Data Mining
Metode pembelajaran dibagi ke dalam dua
Data mining merupakan salah satu tahap
pendekatan yaitu supervised dan unsupervised.
dalam KDD [1]. Proses KDD digambarkan pada
Pendekatan unsupervised learning adalah pendekatan
gambar 1.
yang tidak menggunakan latihan maupun label data.
Contoh : clustering. Data pada pendekatan ini
dikelompokkan ke dalam beberapa kelas yang
dikehendaki.
Sedangkan pendekatan supervised learning
adalah metode belajar dengan adanya pelatih dan
latihan, sebagai contoh adalah regresi, analisis
diskriminan, jaringan syaraf tiruan, klasifikasi, dan
Support Vector Machine(SVM)[5].
Data mining dibedakan dalam fungsi minor
dan fungsi mayor[6].
a. Fungsi Minor atau fungsi tambahan, meliputi
deskripsi, estimasi, dan prediksi.
b. Fungsi Mayor atau fungsi utama, meliputi
klasifikasi, pengelompokan dan asosiasi.
Fungsi-fungsi dalam data mining adalah sebagai
berikut[3] :
a. Deskripsi
Gambar 1. Tahapan Proses KDD [1] Deskripsi merupakan analisis sederhana untuk
menggambarkan pola dan kecenderungan yang
Proses KDD terdiri atas 7 tahap [1] yaitu : terdapat dalam data.
a. Pembersihan Data (Data Cleaning) b. Estimasi
Pembersihan data merupakan proses Estimasi hampir mirip dengan klasifikasi, hanya
menghilangkan noise, data yang tidak lengkap, saja variabel target biasanya bernilai numerik
dan data yang tidak konsisten. daripada kategorial.
b. Integrasi Data (Data Integration) c. Prediksi
Prediksi hampir mirip dengan klasifikasi dan Hasil yang diperoleh dari aplikasi data mining ini
estimasi, tetapi hasil prediksi bisa berbeda berupa range nilai pinjaman.
dengan kenyataan di masa datang. Atribut yang digunakan dalam menentukan
d. Klasifikasi nilai pinjaman di BMT Bina Insani adalah taksiran
Dalam klasifikasi, data didistribusikan ke dalam harga barang jaminan, jumlah penghasilan anggota,
beberapa kelas sebagai target variabel kategori. jumlah tanggungan anggota, jangka waktu dan
e. Pengelompokan (clustering) karakter anggota dilihat dari pernah atau tidaknya
Pengelompokan record, pengamatan, atau mendapatkan pinjaman di BMT Bina Insani. Data
memperhatikan dan membentuk kelas objek yang digunakan adalah data pinjaman BMT Bina
objek yang memiliki kemiripan Insani cabang Bergas periode 2010 hingga Januari
f. Asosiasi 2012. Data yang digunakan untuk proses mining
Tugas asosiasi dalam data mining adalah dibatasi pada akad pinjaman yang menggunakan
menemukan atribut yang muncul dalam satu jaminan hanya berupa kendaraan bermotor saja dan
waktu. atas nama pribadi.
Berikut tahap persiapan data yang dilakukan
2.4. Algoritma k-Nearest Neighbor dalam aplikasi data mining BMT Bina Insani.
K-nearest neighbor adalah salah satu metode a. Pembersihan Data
pengklasifikasian dengan cara mencari jarak terdekat Pembersihan dilakukan terhadap data yang tidak
antara data baru dengan k tetangga terdekatnya dalam memiliki kelengkapan nilai untuk setiap atribut
data pelatihan [2]. Setelah sejumlah k tetangga yang digunakan dalam aplikasi ini.
terdekat diperoleh, kemudian dilakukan voting untuk b. Pemilihan Data
menentukan label data baru. Output dari sejumlah k Data pinjaman yang digunakan hanya pinjaman
yang mempunyai frekuensi paling banyak ditetapkan atas nama pribadi saja dan hanya menggunakan
sebagai label untuk data baru. jaminan berupa kendaraan bermotor.
Algoritma k-nearest neighbor memiliki c. Transformasi Data
ketangguhan terhadap data pelatihan yang memiliki Semua atribut yang digunakan dinormalisasi
banyak noise dan efektif jika datanya sangat besar. kedalam skala 0-1, sedangkan nilai pinjaman
Namun algoritma ini membutuhkan biaya komputasi dibagi kedalam 7 kelas seperti terlihat pada tabel
yang cukup tinggi karena diperlukan perhitungan 1.
jarak data uji ke semua data pelatihan [1].
Algoritma k-nearest neighbor dijelaskan Tabel 1 Kategori Kelas Pembiayaan
sebagai berikut [5]: Kelas Keterangan
a. Persiapan data pelatihan dan data uji A Nilai pinjaman kurang dari 3 juta
b. Menentukan nilai k B Nilai pinjaman 3-6 juta
c. Penghitungan jarak data uji ke setiap data
pelatihan.
C Nilai pinjaman 6-9 juta
Jarak kedekatan dihitung menggunakan rumus D Nilai pinjaman 9-12 juta
penghitungan jarak Euclidean[5] sebagai berikut. E Nilai pinjaman 12-15 juta
F Nilai pinjaman 15-25 juta
G Nilai pinjaman lebih dari 25 juta
d. Tentukan sejumlah k data pelatihan yang
memiliki jarak terdekat dengan data uji dan Spesifikasi kebutuhan fungsional pada aplikasi
tentukan sejumlah k data pelatihan terdekat. ini merujuk pada kebutuhan akan perancangan data
e. Periksa label dari k data pelatihan terdekat mining sebagai berikut.
f. Tentukan label yang frekuensinya paling banyak. a. Sistem dapat menampilkan data pinjaman
g. Masukkan data uji ke dalam kelas dengan (datasource)
frekuensi paling banyak. b. Sistem dapat melayani praproses data
h. Kondisi berhenti. c. Sistem dapat melayani pemrosesan data mining
d. Sistem dapat menampilkan tanggal terakhir
III. PEMBAHASAN melakukan praproses data
Desain tampilan proses mining pada aplikasi
3.1. Analisis dan Desain Aplikasi Data data mining BMT Bina Insani ini tampak pada
Mining gambar 2.
Aplikasi yang dikembangkan digunakan untuk
membantu menentukan besar pinjaman bagi anggota.