Oleh :
FREKWENSI
E(Rendah) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (2/2) log2 (2/2) (0/2) log2 (0/2)
=0
E(Sedang) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (3/5) log2 (3/5) (2/5) log2 (2/5)
= 0,970950
E(Tinggi) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,721928
Gain(S,Frekwensi) = Entropy(S) - ve(RendahSedangTinggi) Sv/S Entropy(Sv)
= 0,811278 (2/12)0 (5/12)0,970950 (5/12)0,721928
= 0,105912
PRIORITAS
E(Rendah) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,721928
E(Tinggi) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (5/7) log2 (5/7) (2/7) log2 (2/7)
= 0,863120
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 0,811278 (5/12)0,721928 (7/12)0,863120
= 0,006988
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
12 9 3 0,811278
WAKTU PENDEK 7 5 2 0,863120 0,006988
PANJANG 5 4 1 0,721928
PAKET KECIL 8 6 2 0,811278 0
BESAR 4 3 1 0,811278
FREKWENSI RENDAH 2 2 0 0 0,105912
SEDANG 5 3 2 0,970950
TINGGI 5 4 1 0,721928
PRIORITAS RENDAH 5 4 1 0,721928 0,006988
TINGGI 7 5 2 0,863120
Gain terbesar adalah pada kelas WAKTU root di bawah FREKWENSI SEDANG
Node 3 (FREKWENSI TINGGI)
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
Gain terbesar adalah pada kelas WAKTU root di bawah FREKWENSI TINGGI
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
Pada FREKWENSI TINGGI & WAKTU PENDEK terdapat target NORMAL = 3 dan
GANGGUAN = 0, sehingga Entropy dari FREKWENSI TINGGI & WAKTU
PENDEK = 0 dan langsung menjadi node daun.
Pada FREKWENSI TINGGI, WAKTU PENDEK & PAKET BESAR terdapat target
NORMAL = 1 dan GANGGUAN = 0, sehingga Entropy dari FREKWENSI TINGGI,
WAKTU PENDEK & PAKET BESAR = 0 dan langsung menjadi node daun.
Gain pada kelas PAKET dan kelas PRIORITAS berjumlah sama sehingga root di
bawah FREKWENSI SEDANG & WAKTU PENDEK bisa kelas PAKET atau kelas
PRIORITAS
Suhu 70 75 80
<= > <= > <= >
Y 4 5 7 2 7 2
T 1 4 3 2 4 1
Gain 0,0453 0,0251 0,0005
Kelembaban 70 75 80 85
<= > <= > <= > <= >
Y 2 7 3 6 7 2 7 2
T 1 4 1 4 2 3 3 2
Gain 0,0005 0,0150 0,1022 0,0251
Jadi range untuk atribut Kelembaban yang digunakan pada node 1 adalah subnet
dengan nilai Gain terbesar yaitu <=80 dan >80.
Jadi Root (Akar) untuk Decision Tree yang digunakan adalah attribut dengan nilai
Gain terbesar yaitu Cuaca.
Attribut Subnet Jumlah Entrophy Gain Rasio Gain
Total 14 0,2467
Cerah 5
Mendung 4 105774 0,16
Hujan 5
Cerah 5
Mendung & 9 0,9403 0,26
Cuaca Hujan
Cerah & 9
Mendung 0,9403 0,26
Hujan 5
Cerah & 10
Hujan 0,8631 0,29
Mendung 4
Jadi pilihan untuk cabang yang digunakan pada atribut Cuaca adalah dengan nilai
Rasio Gain terbesar yaitu Cerah & Hujan serta Mendung.
karena data pada atribut Mendung memiliki hasil yang sama yaitu Ya, maka atribut
Mendung tidak memiliki percabangan namun langsung memiliki daun yaitu Ya.
Data Uji Coba Decision Tree dengan algoritma C45 tanpa subnet Mendung pada
atribut Cuaca.
Cuaca Suhu Kelembaban Angin Bermain
Cerah 85 85 Pelan T
Cerah 80 90 Kencang T
Hujan 70 96 Pelan Y
Hujan 68 80 Pelan Y
Hujan 65 70 Kencang T
Cerah 72 95 Pelan T
Cerah 69 70 Pelan Y
Hujan 75 80 Pelan Y
Cerah 75 70 Kencang Y
Hujan 71 80 Kencang T
karena jumlah data Ya dan Tidak adalah sama, maka Entrophy keseluruhan
adalah 1.
Suhu 70 75 80
<= > <= > <= >
Y 3 2 5 0 5 0
T 1 4 3 2 4 1
Gain 0,1245 0,2365 0,1080
Jadi range untuk atribut Suhu yang digunakan pada node 3 adalah subnet dengan
nilai Gain terbesar yaitu <=75 dan >75.
Kelembaban 70 75 80 85
<= > <= > <= > <= >
Y 2 3 2 3 4 3 4 1
T 1 4 1 4 2 1 3 2
Gain 0,0349 0,0349 0,1245 0,0349
Jadi node 3 untuk Decision Tree adalah attribut dengan nilai Gain terbesar yaitu Suhu.
Karena data pada atribut >75 memiliki hasil yang sama yaitu Tidak, maka atribut
>75 tidak memiliki percabangan namun langsung memiliki daun yaitu Tidak.
Data Uji Coba Decision Tree dengan algoritma C45 tanpa subnet >75 pada atribut
Suhu.
Cuaca Suhu Kelembaban Angin Bermain
Hujan 70 96 Pelan Y
Hujan 68 80 Pelan Y
Hujan 65 70 Kencang T
Cerah 72 95 Pelan T
Cerah 69 70 Pelan Y
Hujan 75 80 Pelan Y
Cerah 75 70 Kencang Y
Hujan 71 80 Kencang T
Kelembaban 80 85 90 95
<= > <= > <= > <= >
Y 4 1 4 1 4 1 4 1
T 2 1 2 1 2 1 3 0
Gain 0,0157 0,0157 0,0157 0,0923
Jadi range untuk atribut Kelembaban yang digunakan pada node 5 adalah subnet
dengan nilai Gain terbesar yaitu <=95 dan >95.
Jadi node 5 untuk Decision Tree adalah attribut dengan nilai Gain terbesar yaitu
Angin.
Node 6 akan berubah menjadi daun Ya dan node 7 akan berubah menjadi daun
Tidak.
Mengubah Tree Menjadi Rule
IF Cuaca=Mendung THEN
Bermain=Ya
IF Cuaca=Cerah & Hujan ^ Suhu=lebih besar dari 75 THEN
Bermain=Tidak
IF Cuaca=Cerah & Hujan ^ Suhu=lebih kecil sama dengan 75 ^ Angin=Pelan THEN
Bermain=Ya
IF Cuaca=Cerah & Hujan ^ Suhu=lebih kecil sama dengan 75 ^ Angin=Kencang
THEN
Bermain=Tidak