Anda di halaman 1dari 1

Algoritma Batch Deleting Attribute Mechanism Decision Tree

Pada tahun 2016 Hong Zhao, Xiangju Li mengusulkan Batch Deleting Attribute
Mechanism Decision Tree (BDADT) untuk induksi Decision Tree (pohon keputusan)
menggunakan weighted information entropy, weighted information ratio dan fungsi heuristic
untuk split atribut.
Ada 4 tahapan dalam algoritma Batch Deleting Attribute Mechanism Decision Tree
adalah (1) menghitung nilai fungsi heuristik atribut a sesuai dengan persamaan f(a,tc(a)) =
GainRatioW (a) ∗ (1 + tc(a )) θ , (2) membandingkan nilai fungsi heuristik atribut a i dengan
nilai heuristik maksimum, maxGain. Jika maxGain <f (a i, tc (a i)), maka nilai maxGain diganti
dengan f (a i, tc (a i)), (3) beberapa atribut yang berlebihan dihapus dan tidak dipertimbangkan
dalam pemilihan simpul berikutnya, (4) Nilai algoritma BDADT akan dikembalikan ke nol jika f
(a, tc (a)) = 0 untuk setiap atribut dalam C. Algoritma Batch Deleting Attribute Mechanism
Decision Tree menggunakan fungsi heuristik baru untuk memilih atribut yang memiliki biaya tes
rendah dan nilai informasi gain tertinggi sebagai node..
Flowchart algoritma ini bisa dilihat pada Gambar 2.11. Pada penelitian ini menggunakan
20 dataset dari UCI repository dengan distribusi normal biaya uji representatif untuk
mengevaluasi algoritma BDADT. Sebagai contoh, 80% dari atribut kondisi dihapus dalam
memilih node root untuk kumpulan dataset Prostate-GE. Sebagai contoh lain, 13.996 atribut
dihapus dalam memilih node root untuk dataset SMK-CAN-187, dan pohon keputusan berisi 36
node non-daun. Artinya, mengurangi evaluasi atribut dengan faktor 13, 996 × 35 = 489, 860
Dalam penelitian ini setiap dataset dibagi menjadi dua kategori, 60% data training dan
40% data testing. Alat ukur yang digunakan pada penelitian ini menggunakan average cost dan
running time dari setiap algoritma. Berdasarkan hasil perhitungan average cost dan
perbandingan running time dengan algoritma CS-C4.5 dan CS-GainRatio, algoritma BDADT
memperoleh nilai average cost yang lebih kecil dan running time yang lebih cepat daripada
algoritma CS-C4.5 dan CS-GainRatio.

Anda mungkin juga menyukai