Anda di halaman 1dari 6

PENYELESAIAN

Algoritma C4.5 merupakan sebuah algoritma yang digunakan untuk membangun


decision tree ( pengambilan keputusan). Algoritma C4.5 adalah salah satu algoritma induksi
pohon keputusan yaitu ID3 yang dikembangkan oleh J.Ross Quinlan, dalm prosedur algoritma
ID3 input berupa sampel label dan atribut. Pohon dibangun dengan cara membangun data secara
rekursif hingga tiap bagian terdiri dari data yang berasal dari kelas yang sama, bentuk
pemecahan (split) yang digunakan untuk membagi data tergantung dari jenis atribut yang
digunakan dalam split. Algoritma C4.5 dapat menangani data numeric (kontinyu) dan diskret.
Jika suatu set data mempunyai beberapa pengamatan dengan missing value yaitu record dengan
beberapa nilai variabel tidak ada, jika jumlah pengamatan terbatas maka atribut dengan missing
value dapat diganti dengan nilai rata-rata dari variabel yang bersangkutan. Dalam melakukan
pemisahan obyek (split) dilakukan tes terhadap atribut dengan mengukur tingkat ketidakmurnian
pada sebuah simpul atau node.
Secara singkat logika algoritma yang digunakan adalah sebagai berikut :
a. Pilih atribut sebagai akar
b. Buat cabang untuk masing-masing nilai
c. Bagi kasus dalam cabang
d. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang
memiliki kelas yang sama.
Untuk memilih atribut sebagai akar didasarkan pada nilai Gain tertinggi dari atribut-atribut yang
ada. Untuk menghitung Gain digunakan rumus sebagai berikut :

Dimana :
S : himpunan kasus
A : atribut
n : jumlah partisi atribut A
|Si| : jumlah partisi ke-i
|S| : jumlah kasus dalam S
Sedangkan rumus untuk menghitung Entropy adalah sebagai berikut :

Dimana :
S : himpunan kasus
n : jumlah partisi S
Pi : jumlah kasus pada partisi ke-i

Untuk memprediksi menang atau kalah pada pertandingan sepakbola,dengan memakai data
sebagai berikut :

Kandang
No Pelatih Sendiri Latihan Stamina Mental Menang
1 pengertian Ya Rutin Kuat PD Ya
2 pengertian Ya Rutin Kuat Gerogi Tidak
3 pengertian Ya Rutin Lemah PD Ya
4 pengertian Ya Jarang Lemah PD Ya
Tidak
5 pengertian Ya ada Lemah PD Tidak
6 pengertian Tidak Rutin Kuat PD Ya
7 pengertian Tidak Jarang Lemah Gerogi Tidak
8 menekan Ya Rutin Lemah PD Ya
9 menekan Tidak Rutin Lemah Gerogi Tidak
10 menekan Ya Jarang Lemah Gerogi Tidak
11 menekan Ya Rutin Kuat PD Ya
12 menekan Tidak Rutin Kuat PD Ya
Tabel 1. Data prediksi pertandingan sepakbola

Dari data diatas dihitung nilai Entropy dan Gain untuk masing-masing atribut dengan
menggunakan rumus yang telah disebutkan diatas, seperti pada tabel berikut ini :
Node     jumlah Ya Tidak Entropy Gain
1 Total   12 7 5 0.979868757  
  Pelatih           0.000589596
pengertia
    n 7 4 3 0.985228136  
    menekan 5 3 2 0.970950594  
Kandang
  Sendiri           0.010246088
    ya 8 5 3 0.954434003  
    tidak 4 2 2 1  
  Latihan           0.209442715
    rutin 8 6 2 0.811278124  
    jarang 3 1 2 0.918295834  
    tidak ada 1 0 1 0  
  Stamina           0.104348971
    kuat 5 4 1 0.721928095  
    lemah 7 3 4 0.985228136  
  Mental           0.617492461
    PD 8 7 1 0.543564443  
    Gerogi 4 0 4 0  
Tabel 2. Perhitungan Node 1

Dari hasil pada Tabel 2. Dapat diketahui bahwa atribut dengan Gain tertinggi adalah Mental,
sebesar 0.617492461. Dengan demikian, Mental dapat menjadi node akar yang mempunyai dua
nilai yaitu PD dan Gerogi. Dari kedua nilai atribut tersebut nilai atribut Gerogi sudah
mengklasifikasi kasus menjadi satu dengan keputusan Tidak, sehingga tidak perlu dilakukan
perhitungan lebih lanjut, tetapi untuk nilai atribut PD masih perlu perhitungan lagi. Dari hasil
perhitungan Node 1 dapat digambarkan pohon keputusan sementaranya tampak seperti pada
gambar 2

Gambar 2. Pohon keputusan hasil perhitungan Node 1


Selanjutnya dihitung nilai Entropy dan Gain untuk masing-masing atribut,sehingga dapat
menjadi node akar dari atribut PD seperti dibawah ini

Node     Jumlah Ya Tidak Entropy Gain


0.54356444
1.1 Mental-PD   8 7 1 3  
  Pelatih           0.092359384
0.72192809
    pengertian 5 4 1 5  
    Menekan 3 3 0 0  
  Kandang           0.056047627
Sendiri
0.65002242
    Ya 6 5 1 2  
    Tidak 2 2 0 0  
  Latihan           0.543564443
    Rutin 6 6 0 0  
    Jarang 1 1 0 0  
    tidak ada 1 0 1 0  
  Stamina           0.137925381
    Kuat 4 4 0 0  
0.81127812
    Lemah 4 3 1 4  
Tabel 3. Perhitungan Node 1.1

Dari hasil pada tabel 3 dapat diketahui bahwa atribut dengan Gain tertinggi adalah
Latihan,yaitu sebesar 0.543564443. Dengan demikian, Latihan dapat menjadi node cabang
dari nilai atribut PD. Ada 3 nilai atribut dari Latihan, yaitu Rutin,Jarang dan Tidak ada,dari 3
atribut tersebut, nilai atribut Rutin sudah mengklasifikasi kasus menjadi satu yaitu
keputusannya Ya, nilai atribut Jarang juga sudah mengklasifikasi kasus menjadi satu yaitu
keputusannya Ya,serta nilai atribut Tidak ada juga sudah mengklasifikasi kasus menjadi satu
yaitu keputusannya Tidak,sehingga tidak perlu dilakukan perhitungan lebih lanjut. Dengan
demikian diperoleh pohon keputusan tampak seperti Gambar 3

Gambar 3. Pohon keputusan terakhir yang terbentuk

TUGAS KELOMPOK

PREDIKSI KEMENANGAN DALAM PERTANDINGAN


SEPAKBOLA DENGAN ALGORITMA C4.5
OLEH

ADIMS R. MILLU (1506080003)

IMANUEL J. G. BELI (15060800)

JANNY K. P. NARA KAHA (15060800)

MARKO K. RIWUKEDO (15060800)

EKO T. HARTONO (15060800)

ILMU KOMPUTER

FAKULTAS SAINS DAN TEKNIK

UNIVERSITAS NUSA CENDANA

KUPANG

2019

Anda mungkin juga menyukai