Ryo Shandy
205150401111030
Sistem Pengantar Keputusan A
.
2. Decision Tree C5.0
Decision tree atau yang biasa dikenal dengan nama pohon keputusan merupakan
salah satu teknik klasifikasi. Decision tree adalah top-down pohon rekursif dari algoritma
induksi, yang menggunakan ukuran seleksi atribut untuk memilih atribut yang diuji.
Dengan adanya decision tree, seseorang dapat menggunakan sebagai prosedur penalaran
untuk mendapatkan jawaban dari sebuah permasalahan.
Salah satu jenis algoritma yang diterapkan dalam decision tree adalah algoritma
5.0. Algoritma C5.0 merupakan penyempurnaan dari algoritma sebelumnya yaitu ID3
dan C4.5. Pada algoritma ini pemilihan atribut diproses menggunakan gain ratio.
Algoritma C5.0 menghasilkan jumlah cabang per node yang lebih bervariasi.
Penerapan pembuatan tree pada algoritma C5.0 meliputi perhitungan entropy dan
gain. Adapun rumus untuk mencari nila entropy adalah sebagai berikut:
dengan :
S : Himpunan kasus
k : Jumlah kelas pada variabel A
pj : Proporsi dari Sj dan S
S : Himpunan kasus
Si : Himpunan kasus pada kategori ke-i
A : Variabel
m : Jumlah kategori pada variabel A
|Si|: Jumlah kasus pada kategori ke-i
|S| : Jumlah kasus dalam S
Setelah mendapatkan nilai entropy dan gain, selanjutnya perhitungan nilai gain ratio.
Berikut merupakan rumus dasar dari perhitungan gain ratio:
dengan :
Gain(S, A) : Nilai gain dari suatu variabel
dengan:
b : Banyaknya data pada suatu variabel
L : Banyaknya kategori pada suatu variabel
Selanjutnya adalah penentuan fungsi indeks gini. Fungsi indeks gini digunakan
untuk memisahkan kelas dengan anggota paling besar/kelas terpentng dalam simpul
terlebih dahulu. Berikut merupakan fungsi indeks gini:
dengan:
j,k : Kelas
P(j|t) : Probabilitas bersyarat kelas j yang berada dalam node t
P(k|t) : Probabilitas bersyarat kelas k yang berada dalam node t
dengan j(t) adalah fungsi keheterogenan indeks gini, P(j|t) adalah peluang j pada
node t, dan P(k|t) adalah peluang k pada node t.