Anda di halaman 1dari 22

ALGORITMA C4.

5
Salah satu algoritma induksi pohon keputusan yaitu ID3
(Iterative Dichotomiser 3).

ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur


algoritma ID3, input berupa sampel training, label training
dan atribut.

Algoritma C4.5 merupakan pengembangan dari ID3.


Algoritma C 4.5 :

1. Pilih atribut sebagai akar

2. Buat cabang untuk tiap-tiap nilai

3. Bagi kasus di dalam cabang

4. Ulangi Proses untuk setiap cabang sampai semua


kasus pada cabang memiliki kelas yang sama
Untuk memilih atribut akar, didasarkan pada nilai GAIN
tertinggi dari atribut-atribut yang ada.

Untuk mendapatkan nilai GAIN, harus ditentukan terlebih


dahulu nilai ENTROPY
Rumus Entropy :

Keterangan :
S = Himpunan Kasus
n = Jumlah Partisi S
pi = Proporsi dari Si terhadap S
Rumus Gain :

Keterangan :
S = Himpunan Kasus
A = Atribut
n = Jumlah Partisi Atribut A
| Si | = Jumlah Kasus pada partisi ke-i
| S | = Jumlah Kasus dalam S
Tabel Keputusan Bermain Tenis
Solusi :
a. Hitung Jumlah Kasus
b. Hitung Jumlah Keputusan “Yes”
c. Hitung Jumlah Keputusan “No”
d. Hitung :
- Entropy (Total),
- Entropy (Outlook),
- Entropy (Temperature),
- Entropy (Humidity), dan
- Entropy (Windy)
e. Hitung :
- Gain (Total, Outlook)
- Gain (Total, Temperature)
- Gain (Total, Humidity)
- Gain (Total, Windy)
Dari tabel diatas, Gain Tertinggi adalah HUMIDITY dan
menjadi node akar. Maka diperoleh bentuk pohon keputusan
awal seperti :

1.
HUMIDIT
Y

High Normal

1.1
?????
Yes
f. Hitung :
- Entropy (Humidity-High),
- Entropy (Outlook),
- Entropy (Temperature), dan
- Entropy (Windy)
h. Hitung :
- Gain (Humidity-High, Outlook)
- Gain (Humidity-High, Temperature)
- Gain (Humidity-High, Windy)
Dari tabel diatas, Gain Tertinggi 1.
HUMIDIT
adalah OUTLOOK dan menjadi Y

node cabang dari atribut HIGH. High Normal

1.1
OUTLOO Yes
K

Cloudy Sunny
Rainy

1.1.2
Yes ????? No
i. Hitung :
- Entropy (Outlook-Rainy),
- Entropy (Temperature), dan
- Entropy (Windy)
j. Hitung :
- Gain (Outlook-Rainy, Temperature)
- Gain (Outlook-Rainy, Windy)
1.
HUMIDIT
Y
High Normal
Dari tabel diatas,
1.1
OUTLOO Yes
Gain Tertinggi
K
adalah WINDY
Cloudy
Rainy
Sunny dan menjadi node
cabang dari atribut
Yes
1.1.2
WINDY No
RAINY.

False True

Yes No

Anda mungkin juga menyukai