Implementasi dari metode penelitian yang dijelaskan pada bab sebelumnya digunakan
sebagai tindaklanjut atas studi yang dilakukan. Pengimplementasian metode penelitian
dijabarkan pada beberapa sub-bab dibawah ini
35
Gambar 3. Tampilan Dataset setelah di treatment
Kemudian dilanjutkan pada nilai unknown tiap fitur di ubah menjadi nilai NaN.Maka
Hasilnya akan menjadi seperti gambar 3 dibawah ini.
Terlihat bahwa setiap nilai Unknown diubah menjadi nilai NaN. Pada gambar 4.
Berdasarkan gambar tersebut diketahui bahawa dataframe memiliki data kolom yang
bernilai null. Dataset memiliki nilai null pada beberapa variabel atau fitur antara lain
job sebanyak 288 data, education sebanyak 1857, contact sebanyak 13020, poutcome
sebanyak 36959.
36
4.3. Data Labeling
Setelah dilakukan data treatment selanjutkan dilakukan data labeling pada
tahapan ini setiap data berjenis kategori diubah menjadi label angka agar dataset
terlihat lebih bersih. Setelah kode dijalankan, dataset menjadi seperti gambar 5
dibawah dibawah.
Terdapat perubahan nilai NaN menjadi -1 hal ini dikarenakan efek dari code yang
dijalankan sebelumnya. Nilai -1 akan disesuaikan pada proses berikutnya yaitu proses
imputasi
Hasil imputasi akan terlihat pada gambar 6. Nilai -1 telah di isi dengan hasil
imputasi decision tree. Maka tahapan imputasi telah selesai
37
Gambar 6. Tampilan dataset setelah dilakukan proses imputasi decision tree
Terlihat pada gambar 7 bahwa semua data numerik telah di normalisasi menggunakan
MinMaxScaler dengan rentang angka 0 hingga 1
38
ulang menggunakan teknik one hot encoding sehingga menghasilkan dataset input
yang lebih banyak dan spesifik dari sebelumnya. Dataset yang telah dilakukan proses
encoding ini menghasilkan data sebesar 45221 dengan kolom sebanyak 48 kolom
seperti pada gambar 8.
Hasil dari Splitting dari 45221 data menjadi 36168 untuk data latih, dan 9043 untuk
data uji. Jumlah tersebut telah sesuai dengan rasio yang telah ditentukan yaitu 80% :
20%
39
4.8. Balancing Dataset
Gambar 10. Tampilan jumlah data train yang telah dilakukan proses SMOTE
40
Gambar 11. Tampilan Hyperparameter yang ditentukan
Gambar 12. Tampilan kode menginisiasi model gradient boosting dengan menggunakan optimalisasi
hyperparameter
41
4.12. Mendapatkan Parameter terbaik
Langkah selanjutnya adalah menampilkan parameter terbaik yang dihasilkan
setelah dilakukan proses melatih model yang telah dilakukan pada tahap sebelumnya.
Hasil parameter dari optimalisasi hyperaparamter dalam kode diatas tertera pada
gambar 14
Gambar 14. Tampilan hyperparameter terbaik beserta hasil score pembelajaran dari dataset latih
42
4.13. Evaluasi Model
Dalam penelitian ini, metrik evaluasi umum digunakan untuk mengukur
performa model yang telah dihasilkan, Metrik evaluasi yang digunakan antara lain:
metrik akurasi, presisi, recall, dan spesifitas. Metrik eveluasi dapat dihitung
menggunakan pada persamaan 2 dan 3 berdasarkan nilai yang diekstrak dari confusion
matrix pada gambar 15.
Nilai evaluasi confusion matrix merupakan hasil perbandingan pada prediksi label data
uji terhadap label sebenar. Pada gambar diatas merupakan hasil confusion matrix dari
Model Gradient Boosting dengan optimalisasi hyperparemeter. Pada gambar terlihat
bahwa pada kelas 1 terdapat 776 data yang diprediksi benar dan 3 data kelas 1 yang
dipredisi salah, untuk kelas 0 yang terprediksi benar berjumlah 7742 dan terdapat 267
data kelas 0 terprediksi salah oleh model.
43
Berikut perhitungan nilai metrik berdasarkan hasil confusion matrix diatas
776 + 7742
𝐴𝑘𝑢𝑟𝑎𝑠𝑖 = = 0.941944045
1034 + 8009
Akurasi merupakan nilai seluruh kelas yang terperediksi benar dengan nilai
keseluruhan data didapatkan nilai kelas 1 dengan nilai prediksi benar atau true positive
sebanyak 776 dan kelas 0 yang terprediksi benar atau true negative sebanyak 7742
kemudian dibagi dengan nilai keseluruhan data. Didapatkan nilai presentasi sebesar
94.41 % nasabah yang benar diprediksi mengambil deposito dan tidak mengambil dari
seluruh nasabah
7742
𝑃𝑟𝑒𝑠𝑖𝑠𝑖𝑘𝑒𝑙𝑎𝑠0 = = 0.96775
7742 + 258
776
𝑃𝑟𝑒𝑠𝑖𝑠𝑖𝑘𝑒𝑙𝑎𝑠1 = = 0.744008
776 + 267
0.96775 + 0.74008
𝑅𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 𝑝𝑟𝑒𝑠𝑖𝑠𝑖 = = 0.855879
2
Presisi merupakan rasio prediksi true positive kelas 1 maupun true negative
kelas 0 dibandingkan dengan keseluruhan hasil yang diprediksi positive maupun
negative. Didapatkan hasil presisi masing-masing kelas 0 dengan nilai presentase
96.77% dan kelas 1 75.44%, Kemudian di rata-ratakan didapatkan nilai 85,58%.
7742
𝑅𝑒𝑐𝑎𝑙𝑙𝐾𝑒𝑙𝑎𝑠0 = 7742+267 = 0.966663
776
𝑅𝑒𝑐𝑎𝑙𝑙𝐾𝑒𝑙𝑎𝑠1 = 776+258 = 0.750484
0.966663 + 0.750484
𝑅𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎𝑟𝑒𝑐𝑎𝑙𝑙 = = 0.858573032
2
Recall merupakan rasio prediksi true positive kelas 1 maupun true negative
kelas 0 dibandingkan dengan keseluruhan nilai Sebenarnya pada masing-masing kelas.
Didapatkan hasil presisi masing-masing pada kelas 0 dengan nilai presentase 96.77%
dan kelas 1 75.44%, Kemudian di rata-ratakan didapatkan nilai 85,58%.
44
0.855878835 × 0.858573032
𝐹1 − 𝑆𝑐𝑜𝑟𝑒 = 2 × = 0.857225933
0.855878835 + 0.858573032
Tabel 5. Tabel perbandingan hasil model yang diusulkan dengan hasil penelitian sebelumnya
Pada perhitungan diatas, dilihat hasil evaluasi accuracy pada model gradient
boosting dengan optimalisasi hyperparameter sangat baik dengan nilai presentase
94%, Nilai presentase presisi untuk kelas 0 sebesar 96.7% dan kelas 1 sebesar 75.04%
untuk kelas 1, Nilai presentase recall untuk kelas 0 sebesar 96.6% dan kelas 1 sebesar
74.4% dan nilai F1-score berarti perbandingan nilai rata-ata dari presisi dan recall yang
telah dibobotkan pada nilai F1-score pada model ini telah menghasilkan nilai sebesar
85.7%.
45