MAGISTER KOMPUTER
SOAL
CREDIT
UMUR PENGHASILAN WILAYAH BELI MOBIL
RATING
<25 Tinggi Rendah A Tidak
<25 Tinggi Tinggi A Tidak
25..40 Tinggi Rendah A Ya
>40 Sedang Rendah A Ya
>40 Rendah Rendah B Ya
>40 Rendah Tinggi B Tidak
>40 Sedang Rendah B Ya
25..40 Rendah Tinggi B Ya
25..40 Sedang Tinggi A Ya
<25 Sedang Rendah A Tidak
<25 Rendah Rendah B Ya
25..40 Tinggi Rendah B Ya
<25 Sedang Tinggi B Ya
>40 Sedang Tinggi A Tidak
Catatan : Untuk pemodelan Decision Tree dan naïve Bayes, uraikan tahapan
tahapannya.
Pertanyaan :
1. Buatlah satu model Decision Tree menggunakan Hunt’s Algorithm.
2. Buatlah model Decision Tree menggunakan algoritma ID3.
3. Tentukan akurasi dari Decision Tree ID3 tersebut (jawaban no 2)
4. Tentukan Keputusan Beli Mobil untuk data = (Umur >40, Penghasilan
Tinggi, Credit rating tinggi, tinggal di wilayah B).
5. Jawablah soal no 4 tersebut menggunakan klasifikasi Naïve Bayes.
*************
Ya Penghasilan
Tinggi Rendah
Penghasilan Ya
A B
Penghasilan Ya
Tidak Ya
JUMLAH
TIDAK
NODE ATRIBUT KASUS YA (Si) ENTROPHY GAIN
(Si)
(S)
1 TOTAL 14 9 5 0.940286
UMUR 0.24674982
<25 5 2 3 0.9709506
25..40 4 4 0 0
>40 5 3 2 0.9709506
PENGHASILAN 0.064238637
TINGGI 4 2 2 1
SEDANG 6 4 2 0.9182958
RENDAH 3 2 1 0.9182958
CREDIT RATING 0.04812703
TINGGI 6 3 3 1
RENDAH 8 6 2 0.8112781
WILAYAH 0.151835501
A 7 3 4 0.9852281
B 7 6 1 0.5916728
Menghitung Entrophy :
Entrophy (total) = ((-(5/14)xlog2(5/14))+(-(9/14)xlog2(9/14))) = 0.940286
Entrophy (umur) :
<25 = ((-(3/5)xlog2(3/5))+(-(2/5)xlog2(2/5))) = 0.9709506
25..40 = ((-(0/4)xlog2(0/4))+(-(4/4)xlog2(4/4))) = 0
>40 = ((-(2/5)xlog2(2/5))+(-(3/5)xlog2(3/5))) = 0.9709506
Entrophy (penghasilan) :
Tinggi = ((-(2/4)xlog2(2/4))+(-(2/4)xlog2(2/4))) = 1
Sedang = ((-(2/6)xlog2(2/6))+(-(4/6)xlog2(4/6))) = 0.9182958
Rendah= ((-(2/4)xlog2(2/4))+(-(2/4)xlog2(2/4))) = 0.9182958
Entrophy (credit rating) :
Tinggi = ((-(3/6)xlog2(3/6))+(-(3/6)xlog2(3/6))) = 1
Rendah= ((-(2/8)xlog2(2/8))+(-(6/8)xlog2(6/8))) = 0.8112781
Entrophy (wilayah) :
A = ((-(4/7)xlog2(4/7))+(-(3/7)xlog2(3/7))) = 0.9852281
B = ((-(1/7)xlog2(1/7))+(-(6/7)xlog2(6/7))) = 0.5916728
Umur
<25 >40
25..40
???? Ya Ya
Ada 3 nilai atribut dari UMUR yaitu <25, 25..40 dan >40. Dari ketiga nilai tersebut, nilai
atribut 25..40 dan >40 sudah mengklasifikasikan kasus menjadi 1 yaitu keputusan-nya
Ya, sehingga tidak perlu dilakukan perhitungan lebih lanjut tetapi untuk nilai atribut <25
masih perlu dilakukan perhitungan lagi.
JUMLAH
YA TIDAK
NODE ATRIBUT KASUS ENTROPHY GAIN
(Si) (Si)
(S)
1 UMUR 5 2 3 0.9709506
PENGHASILAN 0.631315773
TINGGI 3 1 2 0.9182958
RENDAH 2 1 1 1
CREDIT RATING 0.631315773
TINGGI 2 1 1 1
RENDAH 3 1 2 0.9182958
WILAYAH 0.970950594
A 3 0 3 0
B 2 2 0 0
Menghitung Entrophy :
Entrophy (umur) = ((-(3/5)xlog2(3/5))+(-(2/5)xlog2(2/5))) = 0.9709506
Entrophy (penghasilan) :
Tinggi = ((-(2/3)xlog2(2/3))+(-(1/3)xlog2(1/3))) = 0.9182958
Rendah= ((-(1/2)xlog2(1/2))+(-(1/2)xlog2(1/2))) = 1
Entrophy (credit rating) :
Tinggi = ((-(1/2)xlog2(1/2))+(-(1/2)xlog2(1/2))) = 1
Rendah= ((-(2/3)xlog2(2/3))+(-(1/3)xlog2(1/3))) = 0.9182958
Entrophy (wilayah) :
A = ((-(3/3)xlog2(3/3))+(-(0/3)xlog2(0/3))) = 0
B = ((-(0/2)xlog2(0/2))+(-(2/2)xlog2(2/2))) = 0
Umur
<25 >40
25..40
Wilayah Ya Ya
A B
Tidak Ya
Karena semua kasus sudah masuk dalam kelas jadi, pohon keputusan pada gambar
merupakan pohon keputusan terakhir yang terbentuk.
3. Tentukan Keputusan Beli Mobil untuk data = (Umur >40, Penghasilan Tinggi, Credit
rating tinggi, tinggal di wilayah B). menggunakan klasifikasi Naïve Bayes. (nomor 4
dan 5)
Diketahui :
• Class 1 -> Beli Mobil = Ya -> 9 record
• Class 2 -> Beli Mobil = Tidak -> 5 record
• Total = 14 record
Maka :
• P (Class 1) = 9/14 = 0.643
• P (Class 2) = 5/14 = 0.357
Pertanyaan :
• Data = (Umur= >40, Penghasilan= tinggi, Credit rating= Tinggi, Wilayah= B)
• Beli mobil = ya atau tidak ?
Hitung jumlah kasus yang sama dengan class yang sama :
• P(umur = “>40” | Beli_mobil = “Ya”) = 3/9 = 0.333
• P(umur = “>40” | Beli_mobil = “Tidak”) = 2/5 = 0.4
• P(penghasilan = “Tinggi” | Beli_mobil = “Ya”) = 2/9 = 0.222
• P(penghasilan = “Tinggi” | Beli_mobil = “Tidak”) = 3/5 = 0.6
• P(credit rating = “Tinggi” | Beli_mobil = “Ya”) = 3/9 = 0.333
• P(credit rating = “Tinggi” | Beli_mobil = “Tidak”) = 3/5 = 0.6
• P(wilayah = “B” | Beli_mobil = “Ya”) = 6/9 = 0.667
• P(wilayah = “B” | Beli_mobil = “Ya”) = 1/5 = 0.2