Dimana :
S : himpunan kasus
A : atribut
n : jumlah partisi atribut A
|Si| : jumlah partisi ke-i
|S| : jumlah kasus dalam S
Sedangkan rumus untuk menghitung Entropy adalah sebagai berikut :
Dimana :
S : himpunan kasus
n : jumlah partisi S
Pi : jumlah kasus pada partisi ke-i
Untuk memprediksi menang atau kalah pada pertandingan sepakbola,dengan memakai data
sebagai berikut :
Kandang
No Pelatih Sendiri Latihan Stamina Mental Menang
1 pengertian Ya Rutin Kuat PD Ya
2 pengertian Ya Rutin Kuat Gerogi Tidak
3 pengertian Ya Rutin Lemah PD Ya
4 pengertian Ya Jarang Lemah PD Ya
Tidak
5 pengertian Ya ada Lemah PD Tidak
6 pengertian Tidak Rutin Kuat PD Ya
7 pengertian Tidak Jarang Lemah Gerogi Tidak
8 menekan Ya Rutin Lemah PD Ya
9 menekan Tidak Rutin Lemah Gerogi Tidak
10 menekan Ya Jarang Lemah Gerogi Tidak
11 menekan Ya Rutin Kuat PD Ya
12 menekan Tidak Rutin Kuat PD Ya
Tabel 1. Data prediksi pertandingan sepakbola
Dari data diatas dihitung nilai Entropy dan Gain untuk masing-masing atribut dengan
menggunakan rumus yang telah disebutkan diatas, seperti pada tabel berikut ini :
Node jumlah Ya Tidak Entropy Gain
1 Total 12 7 5 0.979868757
Pelatih 0.000589596
pengertia
n 7 4 3 0.985228136
menekan 5 3 2 0.970950594
Kandang
Sendiri 0.010246088
ya 8 5 3 0.954434003
tidak 4 2 2 1
Latihan 0.209442715
rutin 8 6 2 0.811278124
jarang 3 1 2 0.918295834
tidak ada 1 0 1 0
Stamina 0.104348971
kuat 5 4 1 0.721928095
lemah 7 3 4 0.985228136
Mental 0.617492461
PD 8 7 1 0.543564443
Gerogi 4 0 4 0
Tabel 2. Perhitungan Node 1
Dari hasil pada Tabel 2. Dapat diketahui bahwa atribut dengan Gain tertinggi adalah Mental,
sebesar 0.617492461. Dengan demikian, Mental dapat menjadi node akar yang mempunyai dua
nilai yaitu PD dan Gerogi. Dari kedua nilai atribut tersebut nilai atribut Gerogi sudah
mengklasifikasi kasus menjadi satu dengan keputusan Tidak, sehingga tidak perlu dilakukan
perhitungan lebih lanjut, tetapi untuk nilai atribut PD masih perlu perhitungan lagi. Dari hasil
perhitungan Node 1 dapat digambarkan pohon keputusan sementaranya tampak seperti pada
gambar 2
Dari hasil pada tabel 3 dapat diketahui bahwa atribut dengan Gain tertinggi adalah
Latihan,yaitu sebesar 0.543564443. Dengan demikian, Latihan dapat menjadi node cabang
dari nilai atribut PD. Ada 3 nilai atribut dari Latihan, yaitu Rutin,Jarang dan Tidak ada,dari 3
atribut tersebut, nilai atribut Rutin sudah mengklasifikasi kasus menjadi satu yaitu
keputusannya Ya, nilai atribut Jarang juga sudah mengklasifikasi kasus menjadi satu yaitu
keputusannya Ya,serta nilai atribut Tidak ada juga sudah mengklasifikasi kasus menjadi satu
yaitu keputusannya Tidak,sehingga tidak perlu dilakukan perhitungan lebih lanjut. Dengan
demikian diperoleh pohon keputusan tampak seperti Gambar 3
TUGAS KELOMPOK
ILMU KOMPUTER
KUPANG
2019