Anda di halaman 1dari 36

Data Mining (B)

Proses Klasifikasi dalam Data Mining dengan Decision Tree Menggunakan


Algoritma ID3 dan C45

Oleh :

Muhamad Raihan Obbiansyah Amri 1404505055


I Wayan Alit Rangkan Nuaja 1404505057

JURUSAN TEKNOLOGI INFORMASI


FAKULTAS TEKNIK
UNIVERSITAS UDAYANA
2017
1. Algoritma ID3
Data Uji Coba Decision Tree dengan algoritma ID3
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


12 9 3
WAKTU PENDEK 7 5 2
PANJANG 5 4 1
PAKET KECIL 8 6 2
BESAR 4 3 1
FREKWENSI RENDAH 2 2 0
SEDANG 5 3 2
TINGGI 5 4 1
PRIORITAS RENDAH 5 4 1
TINGGI 7 5 2

E(Semua) = -p+ log2 p+ - p- log2 p-


= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (3/12) log2 (3/12) (9/12) log2 (9/12)
= 0,811278
WAKTU
E(Pendek) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (2/7) log2 (2/7) (5/7) log2 (5/7)
= 0,863120
E(Panjang) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,721928
Gain(S,Waktu) = Entropy(S) - ve(PendekPanjang) Sv/S Entropy(Sv)
= 0,811278 (7/12)0,863120 (5/12)0,721928
= 0,006988
PAKET
E(Kecil) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (6/8) log2 (6/8) (2/8) log2 (2/8)
= 0,811278
E(Besar) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (3/4) log2 (3/4) (1/4) log2 (1/4)
= 0,811278
Gain(S,Paket) = Entropy(S) - ve(KecilBesar) Sv/S Entropy(Sv)
= 0,811278 (8/12)0,811278 (4/12)0,811278
=0

FREKWENSI
E(Rendah) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (2/2) log2 (2/2) (0/2) log2 (0/2)
=0
E(Sedang) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (3/5) log2 (3/5) (2/5) log2 (2/5)
= 0,970950
E(Tinggi) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,721928
Gain(S,Frekwensi) = Entropy(S) - ve(RendahSedangTinggi) Sv/S Entropy(Sv)
= 0,811278 (2/12)0 (5/12)0,970950 (5/12)0,721928
= 0,105912
PRIORITAS
E(Rendah) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,721928
E(Tinggi) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (5/7) log2 (5/7) (2/7) log2 (2/7)
= 0,863120
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 0,811278 (5/12)0,721928 (7/12)0,863120
= 0,006988
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
12 9 3 0,811278
WAKTU PENDEK 7 5 2 0,863120 0,006988
PANJANG 5 4 1 0,721928
PAKET KECIL 8 6 2 0,811278 0
BESAR 4 3 1 0,811278
FREKWENSI RENDAH 2 2 0 0 0,105912
SEDANG 5 3 2 0,970950
TINGGI 5 4 1 0,721928
PRIORITAS RENDAH 5 4 1 0,721928 0,006988
TINGGI 7 5 2 0,863120

Gain terbesar terdapat pada kelas FREKWENSI root


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Node 2 (FREKWENSI RENDAH)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Pada FREKWENSI RENDAH terdapat target NORMAL = 2 dan GANGGUAN = 0,


sehingga Entropy dari FREKWENSI RENDAH = 0 dan langsung menjadi node daun.

Node 3 (FREKWENSI SEDANG)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


5 3 2
WAKTU PENDEK 4 2 2
PANJANG 1 1 0
PAKET KECIL 2 1 1
BESAR 3 2 1
PRIORITAS RENDAH 3 2 1
TINGGI 2 1 1
E(Semua) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (3/5) log2 (3/5) (2/5) log2 (2/5)
= 0,970950
WAKTU
E(Pendek) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 2)
E(Panjang) = 0 (karena salah satu target berjumlah 0 yaitu target GANGGUAN)
Gain(S,Waktu) = Entropy(S) - ve(PendekPanjang) Sv/S Entropy(Sv)
= 0,970950 (4/5)1 (1/5)0
= 0,17095
PAKET
E(Kecil) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
E(Besar) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,918295
Gain(S,Paket) = Entropy(S) - ve(KecilBesar) Sv/S Entropy(Sv)
= 0,970950 (2/5)1 (3/5)0,918295
= 0,019973
PRIORITAS
E(Rendah) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,918295
E(Tinggi) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 0,970950 (3/5) 0,918295 (2/5)1
= 0,019973
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
5 3 2 0,970950
WAKTU PENDEK 4 2 2 1 0,17095
PANJANG 1 1 0 0
PAKET KECIL 2 1 1 1 0,019973
BESAR 3 2 1 0,918295
PRIORITAS RENDAH 3 2 1 0,918295 0,019973
TINGGI 2 1 1 1

Gain terbesar adalah pada kelas WAKTU root di bawah FREKWENSI SEDANG
Node 3 (FREKWENSI TINGGI)
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


5 4 1
WAKTU PENDEK 3 3 0
PANJANG 2 1 1
PAKET KECIL 1 1 0
BESAR 4 3 1
PRIORITAS RENDAH 2 2 0
TINGGI 3 2 1
E(Semua) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,721928
WAKTU
E(Pendek) = 0 (karena salah satu target berjumlah 0 yaitu target GANGGUAN)
E(Panjang) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
Gain(S,Waktu) = Entropy(S) - ve(PendekPanjang) Sv/S Entropy(Sv)
= 0,721928 (3/5)0 (2/5)1
= 0,321928
PAKET
E(Kecil) = -p+ log2 p+ - p- log2 p-
= - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (3/4) log2 (3/4) (1/4) log2 (1/4)
= 0,811278
E(Besar) = 0 (karena salah satu target berjumlah 0 yaitu target GANGGUAN)
Gain(S,Paket) = Entropy(S) - ve(KecilBesar) Sv/S Entropy(Sv)
= 0,721928 (4/5)0,811278 (1/5)0
= 0,072905
PRIORITAS
E(Rendah) = 0 (karena salah satu target berjumlah 0 yaitu target GANGGUAN)
E(Tinggi) = - p(normal/semua) log2 p(normal/semua) - p(gangguan/semua) log2
p(gangguan/semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,918295
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 0,721928 (2/5) 0 (3/5)0,918295
= 0,170951
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
5 4 1 0,721928
WAKTU PENDEK 3 3 0 0 0,321928
PANJANG 2 1 1 1
PAKET KECIL 1 1 0 0 0,072905
BESAR 4 3 1 0,811278
PRIORITAS RENDAH 2 2 0 0 0,170951
TINGGI 3 2 1 0,918295

Gain terbesar adalah pada kelas WAKTU root di bawah FREKWENSI TINGGI
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Node 3 (FREKWENSI TINGGI & WAKTU PENDEK)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Pada FREKWENSI TINGGI & WAKTU PENDEK terdapat target NORMAL = 3 dan
GANGGUAN = 0, sehingga Entropy dari FREKWENSI TINGGI & WAKTU
PENDEK = 0 dan langsung menjadi node daun.

Node 1 (FREKWENSI TINGGI & WAKTU PANJANG)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


2 1 1 1
PAKET KECIL 1 0 1 0 1
BESAR 1 1 0 0
PRIORITAS RENDAH 0 0 0 0 0
TINGGI 2 1 1 1
E(Semua) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
PAKET
E(Kecil) = 0 (karena salah satu target berjumlah 0 yaitu target NORMAL)
E(Besar) = 0 (karena salah satu target berjumlah 0 yaitu target GANGGUAN)
Gain(S,Paket) = Entropy(S) - ve(KecilBesar) Sv/S Entropy(Sv)
= 1 (1/2)0 (1/2)0
=1
PRIORITAS
E(Rendah) = 0 (karena kedua target berjumlah 0)
E(Tinggi) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 1 (0/2) 0 (2/2)1
=0
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
2 1 1 1
PAKET KECIL 1 0 1 0 1
BESAR 1 1 0 0
PRIORITAS RENDAH 0 0 0 0 0
TINGGI 2 1 1 1
Gain terbesar adalah pada kelas PAKET root di bawah FREKWENSI TINGGI &
WAKTU PANJANG

WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN


PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Node 0 (FREKWENSI TINGGI, WAKTU PENDEK & PAKET KECIL)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
Pada FREKWENSI TINGGI, WAKTU PENDEK & PAKET KECIL terdapat target
NORMAL = 0 dan GANGGUAN = 1, sehingga Entropy dari FREKWENSI TINGGI,
WAKTU PENDEK & PAKET KECIL = 0 dan langsung menjadi node daun.
Node 1 (FREKWENSI TINGGI, WAKTU PANJANG & PAKET BESAR)
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Pada FREKWENSI TINGGI, WAKTU PENDEK & PAKET BESAR terdapat target
NORMAL = 1 dan GANGGUAN = 0, sehingga Entropy dari FREKWENSI TINGGI,
WAKTU PENDEK & PAKET BESAR = 0 dan langsung menjadi node daun.

WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN


PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Node 2 (FREKWENSI SEDANG & WAKTU PENDEK)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


4 2 2 1
PAKET KECIL 2 1 1 1 0
BESAR 2 1 1 1
PRIORITAS RENDAH 2 1 1 1 0
TINGGI 2 1 1 1
E(Semua) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 2)
PAKET
E(Kecil) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
E(Besar) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
Gain(S,Paket) = Entropy(S) - ve(KecilBesar) Sv/S Entropy(Sv)
= 1 (2/4)1 (2/4)1
=0
PRIORITAS
E(Rendah) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
E(Tinggi) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 1 (2/4)1 (2/4)1
=0
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
4 2 2 1
PAKET KECIL 2 1 1 1 0
BESAR 2 1 1 1
PRIORITAS RENDAH 2 1 1 1 0
TINGGI 2 1 1 1

Gain pada kelas PAKET dan kelas PRIORITAS berjumlah sama sehingga root di
bawah FREKWENSI SEDANG & WAKTU PENDEK bisa kelas PAKET atau kelas
PRIORITAS

Node 1 (FREKWENSI SEDANG & WAKTU PANJANG)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Pada FREKWENSI SEDANG & WAKTU PANJANG terdapat target NORMAL = 1


dan GANGGUAN = 0, sehingga Entropy dari FREKWENSI SEDANG & WAKTU
PANJANG = 0 dan langsung menjadi node daun.

WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN


PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

Node 1 (FREKWENSI SEDANG, WAKTU PENDEK & PAKET KECIL)


WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


2 1 1
PRIORITAS RENDAH 0 0 0
TINGGI 2 1 1
E(Semua) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
PRIORITAS
E(Rendah) = 0 (karena kedua target berjumlah 0)
E(Tinggi) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 1 (0/2)1 (2/2)1
=0
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
2 1 1 1
PRIORITAS RENDAH 0 0 0 0 0
TINGGI 2 1 1 1
Kelas PRIORITAS menjadi root di bawah FREKWENSI SEDANG, WAKTU
PENDEK & PAKET KECIL.
Node 1 (FREKWENSI SEDANG, WAKTU PENDEK & PAKET BESAR)
WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN
PENDEK BESAR SEDANG RENDAH GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI GANGGUAN
PENDEK KECIL TINGGI RENDAH NORMAL
PENDEK KECIL SEDANG TINGGI NORMAL
PANJANG BESAR SEDANG RENDAH NORMAL
PANJANG KECIL TINGGI TINGGI GANGGUAN
PENDEK BESAR SEDANG RENDAH NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL
PENDEK KECIL TINGGI TINGGI NORMAL
PANJANG BESAR TINGGI TINGGI NORMAL
PANJANG KECIL RENDAH TINGGI NORMAL

ATRIBUT SUBSET JML NORMAL GANGGUAN E G


2 1 1
PRIORITAS RENDAH 2 1 1
TINGGI 0 0 0
E(Semua) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
PRIORITAS
E(Rendah) = 1 (karena target NORMAL dan target GANGGUAN berjumlah sama
yaitu 1)
E(Tinggi) = 0 (karena kedua target berjumlah 0)
Gain(S,Prioritas) = Entropy(S) - ve(RendahTinggi) Sv/S Entropy(Sv)
= 1 (2/2)1 (0/2)0
=0
ATRIBUT SUBSET JML NORMAL GANGGUAN E G
2 1 1 1
PRIORITAS RENDAH 2 1 1 1 0
TINGGI 0 0 0 0
Kelas PRIORITAS menjadi root di bawah FREKWENSI SEDANG, WAKTU
PENDEK & PAKET BESAR.
Mengubah Tree Menjadi Rule
IF frekwensi=rendah THEN
Gangguan=Normal
IF frekwensi=sedang ^ waktu=panjang THEN
Gangguan=Normal
IF frekwensi=sedang ^ waktu=pendek ^ paket=kecil ^ prioritas=tinggi THEN
Gangguan=Normal v Gangguan=Gangguan
IF frekwensi=sedang ^ waktu=pendek ^ paket=besar ^ prioritas=rendah THEN
Gangguan=Normal v Gangguan=Gangguan
IF frekwensi=tinggi ^ waktu=pendek THEN
Gangguan=Normal
IF frekwensi=tinggi ^ waktu=panjang ^ paket=kecil THEN
Gangguan=Gangguan
IF frekwensi=tinggi ^ waktu=panjang ^ paket=besar THEN
Gangguan=Normal

WAKTU PAKET FREKWENSI PRIORITAS GANGGUAN PREDIKSI


PENDEK BESAR SEDANG RENDAH GANGGUAN GvN
PENDEK KECIL TINGGI RENDAH NORMAL N
PENDEK KECIL SEDANG TINGGI GANGGUAN GvN
PENDEK KECIL TINGGI RENDAH NORMAL N
PENDEK KECIL SEDANG TINGGI NORMAL GvN
PANJANG BESAR SEDANG RENDAH NORMAL N
PANJANG KECIL TINGGI TINGGI GANGGUAN G
PENDEK BESAR SEDANG RENDAH NORMAL GvN
PANJANG KECIL RENDAH TINGGI NORMAL N
PENDEK KECIL TINGGI TINGGI NORMAL N
PANJANG BESAR TINGGI TINGGI NORMAL N
PANJANG KECIL RENDAH TINGGI NORMAL N
Keterangan: G=Gangguan
N=Normal
2. Algoritma C45
Data Uji Coba Decision Tree dengan algoritma C45
Cuaca Suhu Kelembaban Angin Bermain
Cerah 85 85 Pelan T
Cerah 80 90 Kencang T
Mendung 83 78 Pelan Y
Hujan 70 96 Pelan Y
Hujan 68 80 Pelan Y
Hujan 65 70 Kencang T
Mendung 64 65 Kencang Y
Cerah 72 95 Pelan T
Cerah 69 70 Pelan Y
Hujan 75 80 Pelan Y
Cerah 75 70 Kencang Y
Mendung 72 90 Kencang Y
Mendung 81 75 Pelan Y
Hujan 71 80 Kencang T

Suhu 70 75 80
<= > <= > <= >
Y 4 5 7 2 7 2
T 1 4 3 2 4 1
Gain 0,0453 0,0251 0,0005

E(<=70) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,7219
E(>70) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (5/9) log2 (5/9) (4/9) log2 (4/9)
= 0,9910
Gain(70) = Entropy(S) - ve(<=70>70) Sv/S Entropy(Sv)
= 0,9403 (5/14)0,7219 (9/14)0,9910
= 0,0455

E(<=75) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (7/10) log2 (7/10) (3/10) log2 (3/10)
= 0,8812
E(>75) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/4) log2 (2/4) (2/4) log2 (2/4)
=1
Gain(75) = Entropy(S) - ve(<=75>75) Sv/S Entropy(Sv)
= 0,9403 (10/14)0,8812 (4/14)1
= 0,0252

E(<=80) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (7/11) log2 (7/11) (4/11) log2 (4/11)
= 0,9456
E(>80) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,9182
Gain(80) = Entropy(S) - ve(<=80>80) Sv/S Entropy(Sv)
= 0,9403 (11/14)0,9456 (3/14)0,9182
= 0,0007
Jadi range untuk atribut Suhu yang digunakan pada node 1 adalah subnet dengan
nilai Gain terbesar yaitu <=70 dan >70.

Kelembaban 70 75 80 85
<= > <= > <= > <= >
Y 2 7 3 6 7 2 7 2
T 1 4 1 4 2 3 3 2
Gain 0,0005 0,0150 0,1022 0,0251

E(<=70) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,9182
E(>70) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (7/11) log2 (7/11) (4/11) log2 (4/11)
= 0,9456
Gain(70) = Entropy(S) - ve(<=70>70) Sv/S Entropy(Sv)
= 0,9403 (3/14)0,9182 (11/14)0,9456
= 0,0007

E(<=75) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (3/4) log2 (3/4) (1/4) log2 (1/4)
= 0,8112
E(>75) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (6/10) log2 (6/10) (4/10) log2 (4/10)
= 0,9709
Gain(75) = Entropy(S) - ve(<=75>75) Sv/S Entropy(Sv)
= 0,9403 (4/14)0,8112 (10/14)0,9709
= 0,0151

E(<=80) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (7/9) log2 (7/9) (2/9) log2 (2/9)
= 0,7642
E(>80) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/5) log2 (2/5) (3/5) log2 (3/5)
= 0,9709
Gain(80) = Entropy(S) - ve(<=80>80) Sv/S Entropy(Sv)
= 0,9403 (9/14)0,7642 (5/14)0,9709
= 0,1024

E(<=85) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (7/10) log2 (7/10) (3/10) log2 (3/10)
= 0,8812
E(>85) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/4) log2 (2/4) (2/4) log2 (2/4)
=1
Gain(85) = Entropy(S) - ve(<=85>85) Sv/S Entropy(Sv)
= 0,9403 (10/14)0,8812 (4/14)1
= 0,0252

Jadi range untuk atribut Kelembaban yang digunakan pada node 1 adalah subnet
dengan nilai Gain terbesar yaitu <=80 dan >80.

Attribut Subnet Jumlah Ya Tidak Entrophy Gain


Total 14 9 5 0,9403
Cerah 5 2 3 0,9710
Cuaca Mendung 4 4 0 0 0,2467
Hujan 5 3 2 0,9710
<=70 5 4 1 0,7219
Suhu 0,0453
>70 9 5 4 0,9911
<=80 9 7 2 0,7642
Kelembaban 0,1022
>80 5 3 2 0,9710
Pelan 8 6 2 0,8113
Angin 0,0481
Kencang 6 3 3 1

Jadi Root (Akar) untuk Decision Tree yang digunakan adalah attribut dengan nilai
Gain terbesar yaitu Cuaca.
Attribut Subnet Jumlah Entrophy Gain Rasio Gain
Total 14 0,2467
Cerah 5
Mendung 4 105774 0,16
Hujan 5
Cerah 5
Mendung & 9 0,9403 0,26
Cuaca Hujan
Cerah & 9
Mendung 0,9403 0,26
Hujan 5
Cerah & 10
Hujan 0,8631 0,29
Mendung 4
Jadi pilihan untuk cabang yang digunakan pada atribut Cuaca adalah dengan nilai
Rasio Gain terbesar yaitu Cerah & Hujan serta Mendung.

karena data pada atribut Mendung memiliki hasil yang sama yaitu Ya, maka atribut
Mendung tidak memiliki percabangan namun langsung memiliki daun yaitu Ya.

Data Uji Coba Decision Tree dengan algoritma C45 tanpa subnet Mendung pada
atribut Cuaca.
Cuaca Suhu Kelembaban Angin Bermain
Cerah 85 85 Pelan T
Cerah 80 90 Kencang T
Hujan 70 96 Pelan Y
Hujan 68 80 Pelan Y
Hujan 65 70 Kencang T
Cerah 72 95 Pelan T
Cerah 69 70 Pelan Y
Hujan 75 80 Pelan Y
Cerah 75 70 Kencang Y
Hujan 71 80 Kencang T

karena jumlah data Ya dan Tidak adalah sama, maka Entrophy keseluruhan
adalah 1.

Suhu 70 75 80
<= > <= > <= >
Y 3 2 5 0 5 0
T 1 4 3 2 4 1
Gain 0,1245 0,2365 0,1080

E(<=70) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (3/4) log2 (3/4) (1/4) log2 (1/4)
= 0,8112
E(>70) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/6) log2 (2/6) (4/6) log2 (4/6)
= 0,9182
Gain(70) = Entropy(S) - ve(<=70>70) Sv/S Entropy(Sv)
= 1 (4/10)0,8112 (6/10)0,9182
= 0,1246

E(<=75) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (5/8) log2 (5/8) (3/8) log2 (3/8)
= 0,9544
E(>75) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (0/2) log2 (0/2) (2/2) log2 (2/2)
=0
Gain(75) = Entropy(S) - ve(<=75>75) Sv/S Entropy(Sv)
= 1 (8/10)0,9544 (2/10)0
= 0,2364

E(<=80) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (5/9) log2 (5/9) (4/9) log2 (4/9)
= 0,9910
E(>80) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (0/1) log2 (0/1) (1/1) log2 (1/1)
=0
Gain(80) = Entropy(S) - ve(<=80>80) Sv/S Entropy(Sv)
= 1 (9/10)0,9910 (1/10)0
= 0,1081

Jadi range untuk atribut Suhu yang digunakan pada node 3 adalah subnet dengan
nilai Gain terbesar yaitu <=75 dan >75.
Kelembaban 70 75 80 85
<= > <= > <= > <= >
Y 2 3 2 3 4 3 4 1
T 1 4 1 4 2 1 3 2
Gain 0,0349 0,0349 0,1245 0,0349

E(<=70) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,9182
E(>70) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (3/7) log2 (3/7) (4/7) log2 (4/7)
= 0,9852
Gain(70) = Entropy(S) - ve(<=70>70) Sv/S Entropy(Sv)
= 1 (3/10)0,9182 (7/10)0,9852
= 0,0349

E(<=75) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (2/3) log2 (2/3) (1/3) log2 (1/3)
= 0,9182
E(>75) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (3/7) log2 (3/7) (4/7) log2 (4/7)
= 0,9852
Gain(75) = Entropy(S) - ve(<=75>75) Sv/S Entropy(Sv)
= 1 (3/10)0,9182 (7/10)0,9852
= 0,0349

E(<=80) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/6) log2 (4/6) (2/6) log2 (2/6)
= 0,9182
E(>80) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (3/4) log2 (3/4) (1/4) log2 (1/4)
= 0,8112
Gain(80) = Entropy(S) - ve(<=80>80) Sv/S Entropy(Sv)
= 1 (6/10)0,9182 (4/10)0,8112
= 0,1246

E(<=85) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/7) log2 (4/7) (3/7) log2 (3/7)
= 0,9852
E(>85) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/3) log2 (1/3) (2/3) log2 (2/3)
= 0,9182
Gain(85) = Entropy(S) - ve(<=85>85) Sv/S Entropy(Sv)
= 1 (7/10)0,9852 (3/10)0,9182
= 0,0349
Jadi range untuk atribut Kelembaban yang digunakan pada node 3 adalah subnet
dengan nilai Gain terbesar yaitu <=80 dan >80.

Mengitung Entrophy dan Gain dari Atribut Angin :


E(Pelan) = -p+ log2 p+ - p- log2 p-
= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/6) log2 (4/6) (2/6) log2 (2/6)
= 0,9182
E(Kencang)= -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/4) log2 (1/4) (3/4) log2 (3/4)
= 0,8112
Gain(S, Angin)= Entropy(S) - ve(PelanKencang) Sv/S Entropy(Sv)
= 1 (6/10)0,9182 (4/10)0,8112
= 0,1246

Attribut Subnet Jumlah Ya Tidak Entrophy Gain


Total 10 5 5 1
Suhu <=75 8 5 3 0,9544
0,2364
>75 2 0 2 0
Kelembaban <=80 6 4 2 0,9182
0,1264
>80 4 3 1 0,8122
Angin Pelan 6 4 2 0,9182
0,1246
Kencang 4 1 3 0,8112

Jadi node 3 untuk Decision Tree adalah attribut dengan nilai Gain terbesar yaitu Suhu.
Karena data pada atribut >75 memiliki hasil yang sama yaitu Tidak, maka atribut
>75 tidak memiliki percabangan namun langsung memiliki daun yaitu Tidak.
Data Uji Coba Decision Tree dengan algoritma C45 tanpa subnet >75 pada atribut
Suhu.
Cuaca Suhu Kelembaban Angin Bermain
Hujan 70 96 Pelan Y
Hujan 68 80 Pelan Y
Hujan 65 70 Kencang T
Cerah 72 95 Pelan T
Cerah 69 70 Pelan Y
Hujan 75 80 Pelan Y
Cerah 75 70 Kencang Y
Hujan 71 80 Kencang T

Menghitung Entrophy keseluruhan :


E(S) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (5/8) log2 (5/8) (3/8) log2 (3/8)
= 0,9544

Kelembaban 80 85 90 95
<= > <= > <= > <= >
Y 4 1 4 1 4 1 4 1
T 2 1 2 1 2 1 3 0
Gain 0,0157 0,0157 0,0157 0,0923

E(<=80) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/6) log2 (4/6) (2/6) log2 (2/6)
= 0,9182
E(>80) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/2) log2 (1/2) (1/2) log2 (1/2)
=1
Gain(80) = Entropy(S) - ve(<=80>80) Sv/S Entropy(Sv)
= 0,9544 (6/8)0,9182 (2/8)1
= 0,0157

E(<=85) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/6) log2 (4/6) (2/6) log2 (2/6)
= 0,9182
E(>85) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/2) log2 (1/2) (1/2) log2 (1/2)
=1
Gain(85) = Entropy(S) - ve(<=85>85) Sv/S Entropy(Sv)
= 0,9544 (6/8)0,9182 (2/8)1
= 0,0157

E(<=90) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/6) log2 (4/6) (2/6) log2 (2/6)
= 0,9182
E(>90) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/2) log2 (1/2) (1/2) log2 (1/2)
=1
Gain(90) = Entropy(S) - ve(<=90>90) Sv/S Entropy(Sv)
= 0,9544 (6/8)0,9182 (2/8)1
= 0,0157

E(<=95) = -p+ log2 p+ - p- log2 p-


= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/7) log2 (4/7) (3/7) log2 (3/7)
= 0,9852
E(>95) = -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/1) log2 (1/1) (0/1) log2 (0/1)
=0
Gain(95) = Entropy(S) - ve(<=95>95) Sv/S Entropy(Sv)
= 0,9544 (7/8)0,9852 (1/8)0
= 0,0923

Jadi range untuk atribut Kelembaban yang digunakan pada node 5 adalah subnet
dengan nilai Gain terbesar yaitu <=95 dan >95.

Mengitung Entrophy dan Gain dari Atribut Angin :


E(Pelan) = -p+ log2 p+ - p- log2 p-
= -p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) - p(jumlah
tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (4/5) log2 (4/5) (1/5) log2 (1/5)
= 0,7219
E(Kencang)= -p+ log2 p+ - p- log2 p-
= - p(jumlah ya/jumlah semua) log2 p(jumlah ya/jumlah semua) -
p(jumlah tidak/jumlah semua) log2 p(jumlah tidak/jumlah semua)
= - (1/3) log2 (1/3) (2/3) log2 (2/3)
= 0,9182
Gain(S, Angin)= Entropy(S) - ve(PelanKencang) Sv/S Entropy(Sv)
= 0,9544 (5/8)0,7219 (3/8)0,9182
= 0,1588

Attribut Subnet Jumlah Ya Tidak Entrophy Gain


Total 8 5 3 0,9544
<=95 7 4 3 0,9852
Kelembaban 0,0923
>95 1 1 0 0
Pelan 5 4 1 0,7219
Angin 0,1588
Kencang 3 1 2 0,9182

Jadi node 5 untuk Decision Tree adalah attribut dengan nilai Gain terbesar yaitu
Angin.

Node 6 akan berubah menjadi daun Ya dan node 7 akan berubah menjadi daun
Tidak.
Mengubah Tree Menjadi Rule
IF Cuaca=Mendung THEN
Bermain=Ya
IF Cuaca=Cerah & Hujan ^ Suhu=lebih besar dari 75 THEN
Bermain=Tidak
IF Cuaca=Cerah & Hujan ^ Suhu=lebih kecil sama dengan 75 ^ Angin=Pelan THEN
Bermain=Ya
IF Cuaca=Cerah & Hujan ^ Suhu=lebih kecil sama dengan 75 ^ Angin=Kencang
THEN
Bermain=Tidak

Anda mungkin juga menyukai