Keterangan Metode
Pohon keputusan Pengertian :
Algoritma C4.5 Salah satu teknik klasifikasi machine learning yang di gunakan pada
proses data mining dengan membentuk sebuah pohon keputusan
Algoritma C4.5 pengembangan dari algoritma ID3
Kelebihan :
Pohon keputusan adalah salah satu metode klasifikasi yang paling
populer karena mudah untuk diinterpretasi oleh manusia.
Pohon keputusan berkemampuan untuk mem-break down proses
pengambilan keputusan yang kompleks menjadi lebih simpel sehingga
pengambil keputusan akan lebih menginterpretasikan solusi dari
permasalahan
Pohon Keputusan berguna untuk mengeksplorasi data, menemukan
hubungan tersembunyi antara sejumlah calon variabel input dengan
sebuah variabel target.
Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena
ketika menggunakan metode pohon keputusan maka sample diuji
hanya berdasarkan kriteria atau kelas tertentu.
Kekurangan :
Terjadi overlap terutama ketika kelas-kelas dan criteria yang
digunakan jumlahnya sangat banyak. Hal tersebut juga dapat
menyebabkan meningkatnya waktu pengambilan keputusan dan
jumlah memori yang diperlukan.
Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon
keputusan yang besar.
Kesulitan dalam mendesain pohon keputusan yang optimal.
Hasil kualitas keputusan yang didapatkan dari metode pohon
keputusan sangat tergantung pada bagaimana pohon tersebut didesain.
Ensemble bagging Pengertian :
singkatan dari bootstrap aggregating
salah satu teknik dari ensemble learning/ensemble method
bagging menggunakan resampling acak dengan pengembalian dataset
awal sehingga diperoleh dataset baru
teknik bagging digunakan untuk melatih algoritma yang sama berkali-
kali dengan menggunakan subset berbeda
Kelebihan :
meningkatkan akurasi dengan mengurangi varian kesalahan dari
klasifikasi
memperbaiki hasil dari algoritma klasifikasi dengan menggabungkan
klasifikasi prediksi dari beberapa model majority voting.
Kekurangan :
bagging paling cocok untuk masalah dengan dataset yang relatif kecil
Flowchart