PROPOSAL SKRIPSI
Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer
dari Fakultas Ilmu Komputer Universitas Singaperbangsa Karawang
Oleh:
Euis
1510631170045
i
8. Yang teristimewa kepada kedua Orangtua yang telah memberikan dukungan
baik moril maupun materil, nasehat, dan do’a kepada penulis sehingga penulis
dapat menyelesaikan proposal skripsi ini tanpa hambatan yang berat.
9. Kakak tercinta Roni Nahroni, S.Pd. dan Evi Sapriyah, S.M. yang senantiasa
memberikan semangat dan do’a kepada penulis seingga penyusunan proposal
skripsi ini dapat terlaksana dengan baik.
10. Rekan-rekan mahasiswa/i kelas A Fakultas Ilmu Komputer yang telah
memberikan motivasi kepada penulis sehingga terwujudnya proposal skripsi
ini.
11. Aryasa Miftah Mubaraq Siagian yang senantiasa menjadi motivator pribadi
bagi penulis dan tanpa hentinya memberikan dukungan dan semangat agar
penulis dapat berusaha lebih baik dan bekerja keras dalam mengerjakan
proposal skripsi ini. You’re the best!
Akhir kata, penulis mengharapkan semoga proposal skripsi ini dapat
bermanfaat dan semoga Allah SWT senantiasa memberikan perlindungan kepada
kita semua. Dalam hal ini, penulis menghapkan saran dan kritik yang membangun
demi menambah kesempurnan proposal ini.
Penulis
ii
DAFTAR ISI
KATA PENGANTAR..............................................................................................i
DAFTAR ISI..........................................................................................................iii
DAFTAR TABEL....................................................................................................v
DAFTAR GAMBAR..............................................................................................vi
BAB I PENDAHULUAN.......................................................................................1
1.1. Latar Belakang.................................................................................................1
1.2. Rumusan Masalah...........................................................................................4
1.3. Batasan Masalah..............................................................................................4
1.4. Tujuan Penelitian.............................................................................................4
1.5. Manfaat Penelitian...........................................................................................4
1.5.1. Manfaat Teoritis.................................................................................4
1.5.2. Manfaat Praktis..................................................................................4
1.6. Metodologi Penelitian...............................................................................5
1.7. Sistematika Penulisan................................................................................5
1.8. Jadwal Penelitian.......................................................................................5
BAB II LANDASAN TEORI..................................................................................7
2.1. Data Mining..................................................................................................7
2.1.1. Pengertian Data Mining............................................................................7
2.1.2. Tahapan Data Mining................................................................................8
2.1.3. Pengelompokkan Data Mining................................................................10
2.2. Klasifikasi Data Mining..............................................................................12
2.3. KDD (Knowledge Discovery in Databases)...............................................13
2.4. Algoritma C4.5...........................................................................................14
2.4.1. Contoh Perhitungan C4.5........................................................................16
2.4.2. Confusion Matrix....................................................................................32
2.5. Kredit..........................................................................................................33
2.5.1. Definisi Kredit.........................................................................................33
2.5.2. Tujuan dan Fungsi Kredit........................................................................34
2.6. Definisi Kredit Macet.................................................................................34
2.7. WEKA (Waikato Environment for Knowledge Analysis)...........................35
2.8. Kajian Terdahulu........................................................................................36
iii
BAB III OBJEK DAN METODOLOGI PENELITIAN.......................................40
3.1. Objek Penelitian......................................................................................40
3.1.1. Sejarah Singkat Koperasi Guru Rawamerta....................................40
3.1.2. Visi Misi...........................................................................................41
3.1.3. Struktur Organisasi..........................................................................41
3.2. Metodologi Penelitian.............................................................................41
DAFTAR PUSTAKA............................................................................................44
iv
DAFTAR TABEL
Tabel 1. 1 Data Kredit Macet Tahun 2015-2017....................................................2
Tabel 1. 2 Jadwal Penelitian....................................................................................6
v
DAFTAR GAMBAR
Gambar 2. 1 Tahapan Data Mining Menurut Han..................................................8
Gambar 2. 2 Gain Tertinggi Sebagai Node Akar.................................................23
Gambar 2. 3 Outlook Sebagai Node Akar Selanjutnya........................................28
Gambar 2. 4 Hasil Pohon Keputusan Akhir.........................................................31
vi
vii
BAB I
PENDAHULUAN
1.1. Latar Belakang
Saat ini pembangunan ekonomi merupakan bagian dari
pembangunan nasional yang salah satu upaya untuk mencapai masyarakat
adil dan makmur berdasarkan UUD 1945. Untuk mencapai tujuan berikut,
pelaksanaan pembangunan harus senantiasa dengan memperhatikan
keserasian, keselarasan dan keseimbangan dengan berbagai unsur
pembangunan khususnya bidang ekonomi yaitu keuangan. Lembaga
finansial merupakan suatu lembaga yang bergerak di bidang keuangan
dimana para nasabahnya merupakan masyarakat dari berbagai perilaku.
Dalam menjalankan usahanya, setiap lembaga keuangan menawarkan
berbagai produknya seperti contohnya pemberian fasilitas kredit. Menurut
KBBI (Kamus Besar Bahasa Indonesia), kredit itu sendiri merupakan
pinjaman uang dengan pembayaran pengembalian secara mencicil atau
mengangsur. Kredit yang diberikan oleh pihak lembaga keuangan
merupakan pemberian kepercayaan kepada nasabah. Oleh karena itu,
lembaga keuangan hanya memberikan kredit kepada nasabah yang Ia
betul-betul yakin bahwa debitor akan mengembalikan pinjaman yang
diterimanya sesuai dengan jangka waktu yang telah disepakati oleh kedua
belah pihak.
Koperasi simpan pinjam merupakan salah satu bentuk lembaga
finansial yang berperan penting dalam membantu meningkatkan taraf
hidup masyarakat dengan cara menghimpun dana dan menyalurkannya
dalam bentuk kredit atau pinjaman kepada nasabahnya (Iqbal, Nanang,
Fitria: 2018). Adapun, proses pengajuan kredit di koperasi simpan pinjam
terbilang lebih sederhana namun diperlukan analisa yang mendalam agar
terhindar dari resiko kredit. Dalam penelitian (Nanang, Supiyanto: 2017),
mengungkapkan bahwa resiko kredit merupakan resiko yang timbul
sebagai akibat dari kegagalan para pihak dalam memenuhi kewajibannya
untuk membayar angsuran kredit. Pokok utama yang dihadapi oleh setiap
lembaga yang menyediakan fasilitas kredit yaitu tidak tertagihnya piutang
2
BAB I PENDAHULUAN
Pada bab ini melingkupi latar belakang, rumusan masalah, batasan
masalah, tujuan penelitian, manfaat penelitian, metodologi
penelitian dan sistematika penulisan.
BAB II LANDASAN TEORI
Pada bab ini yang menguraikan landasan-landasan teori yang
mendukung pemecahan masalah yang relevan dengan penelitian
ini.
BAB III OBJEK DAN METODOLOGI PENELITIAN
6
8
9
Prediksi hampir sama dengan klasifikasi dan estimasi, kecuali bahwa prediksi
nilai dari hasil aka nada dimasa mendatang. Contoh prediksi dalam bisnis dan
penelitian adalah prediksi harga beras dalam tiga bulan yang akan datang, dan
prediksi tingkat pengangguran dalam 5 tahun yang akan datang. Beberapa
metode dan teknik yang digunakan dalam klasifikasi dan estimasi dapat pula
digunakan (untuk keadaan yang tepat) untuk prediksi.
4. Classification (Klasifikasi)
Dalam klasifikasi, terdapat target variabel kategori. Sebagai contoh,
penggolongan pendapatan dapat dipisahkan dalam tiga kategori yaitu
pendapatan tinggi, pendapatan sedang dan pendapatan rendah. Contoh lain
klasifikasi dalam bisnis dan penelitian adalah menentukan aakah suatu
transaksi kartu kredit merupakan transaksi yang curang atau bukan,
memperkirakan apakah suatu pengajuan hipotek oleh nasabah merupakan
suatu kredit yang baik atau buruk, dan mendiagnosis penyakit seorang pasien
untuk mendapatkan termasuk penyakit apa.
5. Clustering (Pengklusteran)
Pengklusteran merupakan pengelompokkan record, pengamatan, atau
memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.
Kluster adalah kumpulan record yang memiliki kemiripan satu dengan yang
lainnya dan memiliki ketidakmiripan dengan record-record dalam cluster lain.
Pengklusteran beda dengan klasifikasi yaitu tidak adanya variabel target
dalam pengklusteran. Pengklusteran tidak mencoba untuk melakukan
klasifikasi, mengestimasi, atau memprediksi nilai dari variabel target. Akan
tetapi, algoritma pengklusteran mencoba untuk melakukan pembagian
terhadap keseluruhan data menjadi kelompok-kelompok (homogen), yang
mana kemiripan record dalam satu kelompok akan bernilai maksimal,
sedangkan kemiripan dengan record dalam kelompok lain akan bernilai
minimal. Contoh pengklusteran dalam bisnis dan penelitian adalah:
a. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari
suatu produk bagi perusahaan yang tidak memiliki dana pemasaran yang
besar.
13
berlum diketahui. Namun, sebuah model hanya boleh digunakan untuk klasifikasi
jika model tersebut mempunyai tingkat akurasi yang cukup tinggi (Awaludin &
Yuniarsi, 2016).
d. Format Data
Transformasi pemformatan mengacu pada modifikasi sintaksis yang
dilakukan pada data yang tidak berubah, tapi mungkin dibutuhkan oleh
alat pemodelan.
4. Pemodelan (Modeling)
Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik
pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan
nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang dapat
diterapkan untuk masalah data mining yang sama. Di pihak lain ada teknik
pemodelan yang membutuhkan dormat data khusus sehingga pada tahap ini
masih memungkinkan kembali ke tahapan sebelumnya. Adapun tahapannya
adalah sebagai berikut:
a. Select Modelint Techniques
Sebagai langkah awal dalam pemodelan, pilih teknik pemodelan
sebenarnya yang akan digunakan. Tugas ini mengacu pada yang spesifik
teknik pemodelan. Jika beberapa teknik diterapkan, lakukan tugas ini
secara terpisah untuk setiap teknik.
b. Generate Test Design
Sebelum kita benar-benar membangun sebuah model, kita perlu
menghasilkan sebuah prosedur atau mekanisme untuk menguji modelnya
seperti kualitas dan validitasnya. Misalnya. Dalam tugas penambangan
data yang diawasi seperti klasifikasi, adalah pada umumnya menggunakan
tingkat kesalahan sebagai ukuran kualitas untuk model data mining.
c. Build Model
Menjalankan alat pemodelan pada dataset yang disiapkan untuk membuat
satu atau lebih model, dengan menentukan parameternya terlebih dahulu.
d. Asses Model
Menginterpretasikan model sesuai dengan pengetahuan domainnya, data
mining kriteria keberhasilan, dan desain uji yang diinginkan. Teknis data
mining menilai keberhasilan penerapan teknik pemodelan dan penermuan
secara teknis.
18
5. Evaluasi (Evaluation)
Pada tahapan ini, model sudah terbentuk dan diharapkan memiliki kualitas
baik jika dilihat dari sudut pandang analisa data. Tahap ini akan dilakukan
evaluasi terhadap keefektifan dan kualitas model sebelum digunakan dan
menentukan apakah model dapat mencapai tujuan yang ditentukan pada fase
awal (Business Understanding). Kunci dari tahapan ini yaitu untuk
memnentukan apakah ada masalah binsis yang belum dipertimbangkan. Akhir
dari tahapan ini harus ditentukan penggunaan hasil proses data mining.
6. Penyebaran (Deployment)
Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diataur
dan dipresentasikan dalam bentuk khusus sehingga dapat digunakan oleh
pengguna. Tahap deployment dapat berupa embuatan laporan sederhana atau
mengimplementasikan proses data mining yang berulang dalam perusahaan.
Dalam banyak kasus, tahap deployment melibatkan konsumen, disamping
analis data, karena sangat penting bagi konsumen untuk memahami tindakan
apa yang harus dilakukan untuk menggunakan model yang telah dibuat.
Dengan tahapan sebagai berikut:
a. Plan Deployment
Tugas ini mengambil hasil evaluasi dan menentukan strategi penyebaran.
Jika prosedur umum yang dimiliki telah diidentifikasi untuk membuat
model yang relevan, prosesdur ini didokumentasikan disini utnuk
penerapan selanjutnya.
b. Plan Monitoring and Maintenance
Pemantauan dan pemeliharaan merupakan hal penting jika hasil data
mining menjadi bagian dari bisnis dan lingkunannya. Persiapan strategi
pemeliharaan yang hati-hati membantu menghindari hal yang tidak perlu
seperti penggunaan data mining yang salah. Untuk memantau penyebaran
hasil data mining, proyek memerlukan rencana pemantauan terperinci.
Rencaa ini diperhitungkan dengan jenis penyebaran yang spesifik.
c. Produce Final Report
Kemudian pada tahap akhir adalah menulis sebuah laporan. Bergantung
pada rencana penggelaran, laporan ini mungkin hanya ringkasan proyek
19
atau merupakan presentasi akhir dan komprehensif dari hasil data mining
(Siti dalam Muhammad Rizky, 2018).
S = himpunan kasus
n = jumlah partisi S
Pi = jumlah sampel pada kelas i
2. Perhitungan information gain
Ketika sudah memperoleh suatu nilai entropy, maka langkah selanjutnya
adalah melakukan perhitungan terhadap information gain. Berdasarkan
perhitungan matematis information gain dari suatu atribut A dapat
diformulasikan sebagai berikut:
n
Gain ( S , A )=Entropy ( S )−∑ ¿ Si∨ ¿ ¿¿
i=1 ¿ S∨¿∗Entropy (S i)
S = himpunan kasus
A = atribut
N = jumlah partisi
¿ Si∨¿ = jumlah kasus pada partisi ke-i
¿ S∨¿ = jumlah kasus dalam S
3. Gain ratio
Untuk menghitung gain ratio kita perlu mengetahui suatu term baru yang
disebut split information. Split information dihitung dengan formula sebagai
berikut:
n
SplitInfoA ( D )=−∑ ¿ Dv∨ ¿ ¿¿
j=1 ¿ D∨¿∗log2 ¿ ¿
Gain( A)
Gain Ratio ( A ) =
SplitInfo( A)
(Saraswati, 2017)
2.4.1. Contoh Perhitungan C4.5
1. Siapkan Data Training
Tabel 2.1 Data Training merupakan tabel yang akan digunakan sebagai data
training untuk proses perhitungan algoritma C4.5.
Rainy 5
TEMPERATUR
E
Hot 4
Mild 6
Cool 4
HUMIDITY
High 8
Normal 6
WINDY
False 8
True 6
Entropy (Total) = ( −4
14
∗log 2
4
14
+ ( )) (
−10
14
∗log 2
10
14 ( ))
= 0.873120569
Entropy (Outlook)
Entropy (Sunny) = ( −3
5
∗log 2
3
5
+( )) (
−2
5
∗log 2
2
5 ( ))
= 0.970950594
Entropy (Cloudy) = ( −0
4
∗log 2( )) (
0
4
+
−4
4
∗log 2
4
4 ( ))
=0
Entropy (Rainy) = ( −1
5
∗log 2
1
5( )) (
+
−4
5
∗log 2
4
5 ( ))
= 0.721928095
Entropy (Temperature)
Entropy (Hot) = ( −2
4
∗log2
2
4
+ ( )) (
−2
4
∗log 2
2
4 ( ))
23
=1
Entropy (Mild) = ( −2
6
∗log2
2
6( )) (
+
−4
6
∗log 2
4
6 ( ))
= 0.918295834
Entropy (Cold) = ( −0
4
∗log 2 ( )) (
0
4
+
−4
4
∗log 2
4
4( ))
=0
Entropy (Humidity)
Entropy (High) = ( −2
4
∗log2
2
4( )) (
+
−2
4
∗log 2
2
4 ( ))
=0
Entropy (Normal) = ( −4
7 ( )) (
∗log 2
4
7
+
−3
7
∗log 2( ))
3
7
=0
Entropy (Windy)
Entropy (False) = ( −2
8
∗log2
2
8 ( )) (
+
−6
8
∗log 2
6
8 ( ))
= 0.8112781
Entropy (True) = ( −2
6
∗log2
2
6( )) (
+
−4
6
∗log 2
4
6 ( ))
= 0.9182958
Setelah nilai entropy selesai dihitung, berikut hasilnya terdapat pada Tabel
2. 3 Hasil Perhitungan Nilai Entropy
Total 14 0.863120569
OUTLOOK
Sunny 5 0.970950594
Cloudy 4 0
Rainy 5 0.721928095
TEMPERATURE
Hot 4 1
Mild 6 0.918295834
Cool 4 0
HUMIDITY
High 8 1
Normal 6 0
WINDY
False 8 0.8112781
True 6 0.9182958
3. Perhitungan Gain
Setelah menghitung nilai entropy, maka langkah selanjutnya adalah
menghitung nilai gain.
Gain ( Total , Outlook ) =0.8631206− ( 145 ∗0.970950594 )+( 144 ∗0)+( 145 ∗0.7219)
Gain ( Total , Outlook ) =0.28521
4. Perhitungan SplitInfo
Setelah perhitungan nilai gain maka selanjutnya adalah menghitung nilai
SplitInfo.
( −514∗log 145 ) 2
= 1.57740628
= 1.55665671
=1
= 0.98522814
Setelah mendapat SplitInfo, maka nilai dimasukkan ke dalam Tabel 2.5
Hasil Perhitungan Splitinfo.
0.28521
Gain Ratio(OUTLOOK) =
1.57740628
= 0.16388995
0.1838509
Gain Ratio(TEMPERATURE) =
1.55665671
= 0.118106275
0.3705065
Gain Ratio(HUMIDITY) =
1
= 0.370506501
0.0059777
Gain Ratio(OUTLOOK) =
0.98522814
= 0.006067337
Setelah mendapatkan hasil dari perhitungan gain ratio, berikut hasilnya
terdapat pada Tabel 2.6 Hasil Perhitungan Gain Ratio
7 37
False 8 0.8112781
True 6 0.9182958
High Normal
??? Yes
= 0.985228136
Entropy (Outlook)
Entropy (Sunny) = ( −3
3
∗log 2
3
3( )) (
+
−0
3
∗log 2
0
3 ( ))
=0
Entropy (Cloudy) = ( −0
3 ( )) (
∗log 2
0
3
+
−2
2
∗log2
2
2 ( ))
=0
Entropy (Rainy) = ( −1
2
∗log 2 ( )) (
1
2
+
−1
2
∗log 2
1
2( ))
= 0.721928095
Entropy (Temperature)
Entropy (Hot) = ( −2
3
∗log2
2
3
+
−2
3 ( )) (
∗log 2
1
3 ( ))
= 0.918295834
Entropy (Mild) = ( −2
4
∗log2
2
4
+ ( )) (
−2
4
∗log 2
2
4 ( ))
=1
Entropy (Windy)
Entropy (False) = ( −2
4
∗log2
2
4
+ ( )) (
−2
4
∗log 2
2
4 ( ))
=1
30
Entropy (True) = ( −2
3
∗log2 ( )) (
2
3
+
−1
3
∗log 2
1
3 ( ))
= 0.918295834
Setelah selesai menghitung nilai Gain Humidity High, maka nilai tersebut
akan dimasukkan kedalam Tabel 2.9 Hasil Perhitungan Nilai Gain Humidity
High.
= 0.985228136
= 0.985228136
Setelah mendapatkan hasil dari perhitungan SplitInfo Humidity High, maka
hasilnya akan dimasukkan ke dalam Tabel 2.10 Hasil Perhitungan Nilai
SplitInfo Humidity High.
= 0.449369374
0.02024
Gain Ratio (TEMPERATURE) =
0.985228136
= 0.020547736
0.02024
Gain Ratio (WINDY) =
0.985228136
= 0.020547736
Setelah selesai menghitung niali Gain Ratio Huumidity High, maka nilai
tersebut dimasukkan ke dalam Tabel 2.11 Hasil Perhitungan Nilai Gain Ratio
Humidity High.
HUMIDITY
High
Normal
Outlook Yes
Cloudy
Rainy Sunny
Yes ??? No
=1
Entropy (Temperature)
Entropy (Mild) = ( −1
2 ( )) (
∗log 2
1
2
+
−1
2
∗log 2
1
2( ))
=1
Entropy (Windy)
Entropy (False) = ( −1
1 ( )) (
∗log 2
1
1
+
−0
1
∗log 2
0
1( ))
35
=0
Entropy (True) = ( −1
1
∗log 2 ( )) (
1
1
+
−0
1
∗log 2
0
1 ( ))
=0
Setelah menghitung nilai Entropy Outlook Rainy, maka hasilnya akan
dimasukkan ke dalam Tabel 2.12 Hasil Perhitungan Nilai Entropy Outlook
Rainy.
=0
=1
Setelah mendapatkan hasil dari perhitungan SplitInfo Outlook Rainy, maka
hasilnya akan dimasukkan ke dalam Tabel 2.14 Hasil Perhitungan Nilai
SplitInfo Outlook Rainy.
WINDY 1 1
False 1 0
True 1 0
HUMIDITY
High Normal
Outlook Yes
Cloudy
y Sunn
Rain y
y
Yes Windy No
False True
Yes No
2. Karena semua kasus sudah masuk kedalam kelas. Jadi pohon keputusan pada
Gambar 2.4 merupakan Pohon Keputusan Akhir yang terbentuk.
2.4.2. Confusion Matrix
Confusion matrix adalah tools yang digunakan untuk evaluasi model
klasifikasi untuk memperkirakan objek yang benar atau salah. Sebuah matrix dari
prediksi yang akan dibandingkan dengan kelas yang asli dari inputan atau dengan
kata lain berisi informasi nilai actual dan prediksi pada klasifikasi. Pada Tabel
2.16 merupakan tabel confusion matrix.
3. False positive (FP) menunjukkan bahwa dokumen yang termasuk dalam hasil
pengelompokkan oleh system ternyata seharusnya bukan merupakan anggota
kelas.
4. True negative (TN) menunjukkan bahwa dokumen yang tidak termasuk dalam
hasil pengelompokkan oleh system ternyata seharusnya bukan merupakan
anggota kelas (Akbar dalam Novia, 2016 p. 33)
Evaluasi dan validasi hasil hitung menggunakan rumus akurasi, precision
recall dan f-measure berikut ini:
1. Akurasi
Perhitungan akurasi dilakukan dengan cara membagi jumlah data yang
diklasifikasi secara benar dengan total sampel data testing yang diuji.
Jumlah prediksi yang benar
Akurasi=
Jumlah total prediksi
Jumlah prediksi salah
Laju Error=
Jumla total prediksi
2. Precision
Menghitung nilai precision dengan cara membagi jumlah data benar yang
bernilai positif (True Positive) dibagi dengan jumlah data benar yang bernilai
positif (True Positive) dan data salah yang bernilai positif (False Negative).
TP
Precision=
TP+ FP
3. Recall
Sedangkan recall dihitung dengan cara membagi data benar yang bernilai
positive (True Positive) dengan nilai penjumlahan dari data benar yang
bernilai positif (True Positive) dan data salah yang bernilai negative (False
Negative).
TP
Recall=
TP+ FN
4. F-Measure
Nilai F-measure didapat dari perhitungan pembagian hasil dari perkalian
precision dan recall dengan hasil penjumlahan precision dan recall, kemudian
dikalikan dua.
2∗precision∗recall
F−Measure=
precision+recall
40
3. Prediksi Kredit Macet Berdasarkan C.45 Atribut yang digunakan, studi Hasil yang didapatkan dari confussion matrix
Preferensi Nasabah Menggunakan kasus, dan pengujian algoritma. adalah tingkat akurasi sebesar 94,5946%.
Metode Klasifikasi C4.5 pada Sedangkan berdasarkan kurva ROC dihasilkan
Koperasi Simpan Pinjam Mitra Atribut yang digunakan dalam nilai AUC sebesar 0,9689. Usabilitas yang
Raya Wates (Iqbal, Nanang, dan penelitian ini yaitu jenis kelamin, dihasilkan dengan memanfaatkan SUS adalah
Fitria, 2018) jumlah tanggungan, status sebesar 82,5.
pernikahan, pendapatan utama,
total biaya hidup, dan status
pinjaman.
4. Prediksi Ketepatan Masa Studi C4.5 Atribut, masalah yang terjadi, Algoritma C.45 dapat digunakan untuk
Mahasiswa dengan Algoritma studi kasus dan teknik pengujian memprediksi ketepatan masa studi mahasiswa
Pohon Keputusan C45 (Sri algoritma. dengan menggunakan data latih mahasiswa
Yunianita, Novi Setiani, Sri Teknik Informatika UII angkatan 2010 hingga
Mulyati, 2018) Atribut yang digunakan dalam 2013. Dengan menggunakan teknik filter dan
penelitian ini yaitu nilai kuis, nilai wrapper terhadap subset atribut, maka
tugas, dan nilai ujian. ditemukan pengetahuan bahwa IPK, jumlah
SKS, nilai matakuliah Aljabar Linear dan
Matriks, Basisdata, Metode Numerik, Sistem
Informasi, Pemrograman Web, Pemrograman
Berorientasi Obyek, dan Sistem Operasi
memiliki pengaruh yang cukup signifikan
terhadap tingkat kelulusan mahasiswa.
Pengujian terhadap model klasifikasi berbasis
pohon keputusan C4.5 memberikan hasil yang
cukup baik, yaitu dengan dicapainya akurasi
sebesar 73.9%.
5. Analisa Kinerja Decision Tree C4.5 C4.5 Menggunakan data latih debitur Hasil pengujian melalui 5 kategori uji yang
dalam Prediksi Potensi Pelunasan pembiayaan kendaraan sepeda dilakukan dalam proses generate tree
Kredit Calon Debitur (Bambang, motor kemudian diprediksi potensi dibutuhkan rata-rata waktu 112 detik dengan
Azhari, dan Fajri, 2017) pelunasan kredit dari calon debitur perolehan waktu tercepat pada kategori uji
tersebut, melakukan proses pertama dengan jumlah data 3000 record
pengujian dengan membaginya senilai 9 detik. Sedangkan dalam proses
kedalam 5 kategori uji generate rules dibutuhkan rata-rata waktu 1,78
berdasarakan pemetaan data detik dengan perolehan waktu tercepat pada
45
Melihat dari penelitian sebelumnya, dari penelitian yang melakukan komparasi antara algoritma C4.5 dan Naïve bayes
menunjukkan bahwa hasil penelitian yang dilakukan menggunakan algoritma C4.5 memiliki tingkat akurasi yang lebih baik daripada
algoritma Naïve bayes. Dalam beberapa penelitian sebelumnya menunjukkan bahwa prediksi kredit macet dapat di klasifikasikan dengan
data mining menggunakan algoritma C4.5 dan menghasilkan tingkat akurasi yang tinggi dengan menggunakan beberapa macam pengujian
algoritma. Oleh karena itu, berdasarkan kajian terdahulu tersebut diatas penelitian ini memiliki perbedaan dengan tempat penelitian yang
dilakukan yaitu Koperasi Guru Rawamerta Karawang, atribut yang digunakan, implementasi hasil dari algoritma C4.5 akan diterapkan
46
pada sebuah dashboard sederhana berbasis desktop menggunakan bahasa pemrograman Visual Basic yang nantinya dapat digunakan oleh
staff koperasi dalam menentukan status kredit nasabah yang akan meminjam uang kepada koperasi.
BAB III
OBJEK DAN METODOLOGI PENELITIAN
48