PENDAHULUAN
yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan
sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang
menyimpan begitu banyak data di data server, mulai data mahasiswa, alumni dan
data karyawan dan Dosen. Jika data ini dimanfaatkan dengan mencari informasi
tersembunyi dari data tersebut mungkin bisa memberikan informasi penting bagi
penggalian informasi, ini merupakan langkah awal yang besar dan tidak menutup
informasi.
Banyak metode dan teknik yang sudah dilakukan dalam model prediksi,
teknik klasifikasi misalnya, teknik klasifikasi adalah sebuah metode dari data
mining yang digunakan untuk memprediksi kategori atau kelas dari suatu data
1
instance berdasarkan sekumpulan atribut-atribut dari data tersebut dan algoritma
C.45 sebagai pembangun decision tree. Decision tree adalah model prediksi yang
biasanya digunakan dalam penelitian, konsep dari decision tree adalah mengubah
2
BAB II
PEMBAHASAN
3
Berikut contoh kasus menggunakan data buys computer dengan menggunakan
algoritma C4.5.
4
Langkah 1, menghitung entropy total dari masing-masing nilai kelas dengan
persamaan :
= 0.40977638 + 0.53050958
= 0.940285959
= 0.24674982
5
Langkah 4, menghitung Split information untuk atribut Age dengan
persamaan (4) :
= 1.577406283
Langkah 5, menghitung Gain ratio untuk atribut Age dengan persamaan (3) :
= 0.156427563
= 0.311278124 + 0.5
= 0.81127812
= 0.389975 + 0.528320834
= 0.91829583
= 0.5 + 0.5
=1
6
Entropy Total (Income) = 4/14 * (0.81127812) + 6/14 * (0.91829583) + 4/14 * (1)
= 0.9110634
persamaan (2):
= 0.029222559
persamaan (4) :
= 1.556656707
= 0.018772642
= 0.190622075 + 0.401050703
= 0.591672779
7
Entropy Student no (3yes,4no) = (-3/7 * log2(3/7)) + (-4/7 * log2(4/7))
= 0.523882466 + 0.46134567
= 0.985228136
= 0.29583639 + 0.492614068
= 0.788450458
= 0.151835501
= 0.151835501
= 0.5 + 0.5
=1
8
Ulangi Langkah 5, menghitung Gain ratio untuk atribut Student dengan
persamaan (3) :
= 0.151835501
= 0.311278124 + 0.5
= 0.811278124
= 0.5 + 0.5
=1
= 0.463587499 + 0.428571429
= 0.892158928
= 0.048127031
9
Ulangi Langkah 4, menghitung Split information untuk atribut Credit_Rating
dengan persamaan (4) :
= 0.46134567 + 0.523882466
= 0.985228136
persamaan (3) :
= 0.048848616
Age
<=30 >40
31-40
Student Credit_rating
Yes
Yes No Fair Excellent
Yes No Yes No
10
BAB III
3.1 Kesimpulan
Berdasarkan kasus yang ada dapat di simpulkan bahwa dalam kasus buys
computer yang diselesaikan menggunakan algoritma C4.5 di hasilkan decision tree
yang menghasilkan beberapa rule.
3.2 Saran
11