Classification - Algoritma C 4.5
Classification - Algoritma C 4.5
5
Salah satu algoritma induksi pohon keputusan yaitu ID3
(Iterative Dichotomiser 3).
Keterangan :
S = Himpunan Kasus
n = Jumlah Partisi S
pi = Proporsi dari Si terhadap S
Rumus Gain :
Keterangan :
S = Himpunan Kasus
A = Atribut
n = Jumlah Partisi Atribut A
| Si | = Jumlah Kasus pada partisi ke-i
| S | = Jumlah Kasus dalam S
Tabel Keputusan Bermain Tenis
Solusi :
a. Hitung Jumlah Kasus
b. Hitung Jumlah Keputusan “Yes”
c. Hitung Jumlah Keputusan “No”
d. Hitung :
- Entropy (Total),
- Entropy (Outlook),
- Entropy (Temperature),
- Entropy (Humidity), dan
- Entropy (Windy)
e. Hitung :
- Gain (Total, Outlook)
- Gain (Total, Temperature)
- Gain (Total, Humidity)
- Gain (Total, Windy)
Dari tabel diatas, Gain Tertinggi adalah HUMIDITY dan
menjadi node akar. Maka diperoleh bentuk pohon keputusan
awal seperti :
1.
HUMIDIT
Y
High Normal
1.1
?????
Yes
f. Hitung :
- Entropy (Humidity-High),
- Entropy (Outlook),
- Entropy (Temperature), dan
- Entropy (Windy)
h. Hitung :
- Gain (Humidity-High, Outlook)
- Gain (Humidity-High, Temperature)
- Gain (Humidity-High, Windy)
Dari tabel diatas, Gain Tertinggi 1.
HUMIDIT
adalah OUTLOOK dan menjadi Y
1.1
OUTLOO Yes
K
Cloudy Sunny
Rainy
1.1.2
Yes ????? No
i. Hitung :
- Entropy (Outlook-Rainy),
- Entropy (Temperature), dan
- Entropy (Windy)
j. Hitung :
- Gain (Outlook-Rainy, Temperature)
- Gain (Outlook-Rainy, Windy)
1.
HUMIDIT
Y
High Normal
Dari tabel diatas,
1.1
OUTLOO Yes
Gain Tertinggi
K
adalah WINDY
Cloudy
Rainy
Sunny dan menjadi node
cabang dari atribut
Yes
1.1.2
WINDY No
RAINY.
False True
Yes No