Anda di halaman 1dari 21

Algoritma C4.

5
Klasifikasi dengan Konsep Pohon (Tree)
pada Data Mining
Dedi Darwis, M.Kom.
Konsep Algoritma C4.5
• Algoritma data mining C4.5 merupakan salah satu algoritma
yang digunakan untuk melakukan klasifikasi atau segmentasi
atau pengelompokan dan bersifat prediktif.
• Klasifikasi merupakan salah satu proses pada data mining yang
bertujuan untuk menemukan pola yang berharga dari data
yang berukuran relatif besar hingga sangat besar. Algortima
C4.5 sendiri merupakan pengembangan dari algortima ID3.
Keunggulan C4.5
• Mampu Menangani Atribut yang Kosong (Missing Value)
• Nilai kosong pada sebuah dataset wajib kita isi terlebih dahulu
sebelum diproses untuk tahap machine learningatau bentuk
kedalam sebuah model decision tree.
Keunggulan C4.5
• Cara paling mudah dalam pengisian atribut kosong adalah
dengan memberikan nilai berdasar nilai yang paling banyak
atau dominan dalam atribut tersebut. Contoh, atribut Shape
baris ketiga dan keempat kita beri nilai 4 dikarenakan pada
kelompok class 1 mayoritas atribut Shape memiliki angka 4.
Sedangkan pada class 0, baris 7 kita berikan nilai 1.
Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
• Untuk memilih atribut sebagai akar, didasarkan pada nilai gain
tertinggi dari atribut-atribut yang ada. Untuk menghitung gain
digunakan rumus seperti tertera dalam Rumus 1.

Studi Kasus C4.5
• Sedangkan penhitungan nilai entropy dapat dilihat pada
rumus 2.
Studi Kasus C4.5
Studi Kasus C4.5

0
Studi Kasus C4.5

Hitung Versi Excel

- -
0.258

Hitung Versi Excel


Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
Studi Kasus C4.5
Latihan
• Buatlah proses algoritma klasifikasi data mining menggunakan
C4.5 berdasarkan tabel berikut ini :

Anda mungkin juga menyukai