NPM : 2013030050
PRODI : SI/3B
DATA MINING
TUGAS 3
1. Jika diberikan dataset seperti berikut ini, dan labelnya adalah "play", maka hitung secara
manual seperti yang telah dicontohkan (video 'Decision Tree - Play Golf'). Serta
gambarkan pohon keputusannya.
2. Presentasikan hasil kerja anda dalam bentuk rekaman video dengan ketentuan sebagai
berikut :
o Durasi maksimal video masing-masing soal dengan 10 menit
o Video menampilkan hasil kerja yang dipresentasikan dan wajah presenter
(mahasiswa)
o Dalam video tersebut menceritakan penjelasan tahapan-tahapan perhitungan yang
dibuat beserta pengetahuan yang didapat berupa pohon keputusan.
JAWAB :
Diketahui data set
1. Jabarkan dataset menjadi seperti tabel dibawah ini abaikan untuk entropy dan gain.
2. Hitung entropy masing-masing dengan rumus
𝑛
𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) = ∑ − 𝑝𝑖 ∗ 𝑙𝑜𝑔2 𝑝𝑖
𝑖=1
3 3 2 2
Entropy (sunny) =(− ∗ 𝑙𝑜𝑔2 ( )) + (− ∗ 𝑙𝑜𝑔2 ( )) = 0.970950594
5 5 5 5
0 0 4 4
Entropy (cloudly) = (− ∗ 𝑙𝑜𝑔2 ( )) + (− ∗ 𝑙𝑜𝑔2 ( )) = 0.000000000
4 4 4 4
1 1 4 4
Entropy (rainy) = (− ∗ 𝑙𝑜𝑔2 ( )) + (− ∗ 𝑙𝑜𝑔2 ( )) = 0.721928095
5 5 5 5
𝑛
|𝑆𝑖 |
𝐺𝑎𝑖𝑛 (𝑆, 𝐴) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆) − ∑ ∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑆𝑖 )
|𝑆|
𝑖=1
𝑛
|𝐻𝑢𝑚𝑖𝑑𝑖𝑡𝑦𝑖 |
𝐺𝑎𝑖𝑛 (𝑇𝑜𝑡𝑎𝑙, ℎ𝑢𝑚𝑖𝑑𝑖𝑡𝑦) = 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝑡𝑜𝑡𝑎𝑙 ) − ∑ ∗ 𝐸𝑛𝑡𝑟𝑜𝑝𝑦(𝐻𝑢𝑚𝑖𝑑𝑖𝑡𝑦)
|𝑇𝑜𝑡𝑎𝑙 |
𝑖=1
𝐺𝑎𝑖𝑛 (𝑇𝑜𝑡𝑎𝑙, ℎ𝑢𝑚𝑖𝑑𝑖𝑡𝑦)
7 7
= 0.863120569 − ( ( ∗ 0.95228136) + ( ∗ 0.591672779))
14 14
Outlock
coudly
Sunny Rainy
ya 1.1 1.2
? ?
Outlock
coudly
Sunny Rainy
ya 1.1 1.2
temperature ?
ya 1.1.2 No
Windy
Tdk Ya
No Ya
7. Hitung OUTLOOK-RAINY
Gain terbesar windy maka
Outlock
coudly
Sunny Rainy
ya 1.1 1.2
temperature WINDY
1.2.1 Ya
ya 1.1.2 No
?
Windy
Tdk Ya
No Ya
8. Hitung Outlook -Rainy dan Windy-Ya
Gain terbesar bernilai sama maka kita pilih salah satu
Outlock
coudly
Sunny Rainy
ya 1.1 1.2
temperature WINDY
1.2.1 Ya
ya 1.1.2 No
Humidity
Windy
High Normal
Tdk Ya
No Ya No Ya
9. pengetahuan dari pohon keputusan
Outlock
coudly Rainy
Sunny
1.2
1.1 WINDY
ya
temperature
Tdk
Ya
Hot
Cool Mild
1.2.1 Ya
ya 1.1.2 No
Humidity
Windy
High Normal
Tdk Ya
No Ya No Ya