DATA MINING Materi 2
DATA MINING Materi 2
Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3
dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel
training, label training dan atribut. Algoritma C4.5 merupakan pengembangan dari ID3.
Rumus Entropy :
Keterangan :
S = Himpunan Kasus
n = Jumlah Partisi S
Rumus Gain :
Keterangan :
S = Himpunan Kasus
A = Atribut
Solusi :
Hitung :
Entropy (Total),
Entropy (Outlook),
Entropy (Temperature),
Entropy (Windy)
node Jumlah No Yes Entrophy Gain
1 Total 14 4 10
Outlook
Sunny 5 3 2
Cloudy 4 0 4
Rainy 5 1 4
Temperature
Hot 4 2 2
Mild 6 2 4
Cool 4 0 4
Humidity
High 7 4 3
Normal 7 0 7
Windy
FALSE 8 2 6
TRUE 6 2 4
Hitung :
1 Total 14 4 10 0,863120569
Outlook
Sunny 5 3 2 0,970950594
0,258521037
Cloudy 4 0 4 0
Rainy 5 1 4 0,721928095
Temperature
Hot 4 2 2 1
0,183850925
Mild 6 2 4 0,918295834
Cool 4 0 4 0
Humidity
Normal 7 0 7 0
Windy
TRUE 6 2 4 0,918295834