Klasifikasi (DEcision Tree)
Klasifikasi (DEcision Tree)
Jurusan Matematika
Universitas Tadulako
2016
2. Bayessian Network
3. Rule-based (berbasis aturan)
4. Neural network (jaringan syaraf)
5. Support Vector Machine (SVM)
Penyelesaian:
Langkah -1: Mengubah Data Menjadi Tree.
a. Menentukan NodeTerpilih.
Dari data sampel tentukan dulu node terpilih, yaitu dengan menghitung
nilai information gain masing-masing atribut. (Cuaca, suhu, kelembaban
dan angin)
9 9 5 5
𝐼 =− 14
𝑙𝑜𝑔 2 14
− 14
𝑙𝑜𝑔 2 14
= 0.9403
12/03/2018 14:07 Data Mining | Desy Lusiyanti
Contoh pembentukan Tree
2. Menghitung nilai informasi tiap atribut
Contoh : nilai informasi atribut cuaca
Dengan menggunakan persamaan : −𝑝 + 𝑙𝑜𝑔 2 𝑝 + −𝑝 − 𝑙𝑜𝑔 2 𝑝 −
Mendung Ya 4 4 0
𝐼2 = −( )𝑙𝑜𝑔 2(4/4) – (0/4) 𝑙𝑜𝑔 2 =0
Mendung Tidak 0 4 4
Hujan Ya 3 3 2
𝐼3 = −( )𝑙𝑜𝑔 2(3/5) – (2/5) 𝑙𝑜𝑔 2 = 0.9710
Hujan Tidak 2 5 5
Hasil tersebut menunjukan bahwa gain tertinggi ada pada atribut cuaca,
sehingga cuaca dijadikan sebagai node akar. Selanjutnya digunakan 3 nilai dari
node akar yaitu cerah, mendung dan hujan untuk menentukan internal node.
Algoritma C4.5 diperkenalkan oleh Quinlan (1996). Sama halnya dengan ID3,
C4.5 juga menggunakan informasi gain dalam menentukan fitur yang menjadi
pemecah node. Perbaikan yang membedakan algortima C.45 dari ID3 adalah
dapat menangani fitur dengan tipe numerik, melakukan pemotongan
(pruning) serta dapat mengatasi data yang missing.