Anda di halaman 1dari 7

Nama : Ii Nurholiq

NIM : 2013091052
Kelas : SI 2013 C
M.K : Data Mining

Soal Tugas Data Minning !


Dengan Algoritma Decision Tree akan mencoba mengklasifikasikan Penyakit Jantung dengan kriteria
apa yang akan dikelompokan kedalam Terkena Jantung dan Tidak Terkena Jantung
Usia Kelamin Merokok Olahraga Jantung
Tua Pria Tidak Ya Tidak
Tua Pria Ya Ya Tidak
Muda Pria Ya Tidak Tidak
Tua Pria Tidak Tidak Tidak
Muda Wanita Tidak Tidak Ya
Muda Pria Tidak Ya Ya
Muda Pria Tidak Ya Tidak
Tua Wanita Tidak Tidak Ya
Muda Pria Ya Tidak Tidak
Tua Pria Ya Tidak Tidak
Muda Pria Ya Ya Ya
Tua Pria Ya Tidak Tidak
Muda Pria Tidak Tidak Tidak
Tua Pria Tidak Ya Tidak
Muda Pria Ya Tidak Tidak

Jawaban Tugas Data Minning !


Data Usia Kelamin Merokok Olahraga Jantung
1 Tua Pria Tidak Ya Tidak
2 Tua Pria Ya Ya Tidak
3 Muda Pria Ya Tidak Tidak
4 Tua Pria Tidak Tidak Tidak
5 Muda Wanita Tidak Tidak Ya
6 Muda Pria Tidak Ya Ya
7 Muda Pria Tidak Ya Tidak
8 Tua Wanita Tidak Tidak Ya
9 Muda Pria Ya Tidak Tidak
10 Tua Pria Ya Tidak Tidak
11 Muda Pria Ya Ya Ya
12 Tua Pria Ya Tidak Tidak
13 Muda Pria Tidak Tidak Tidak
14 Tua Pria Tidak Ya Tidak
15 Muda Pria Ya Tidak Tidak

1. Membuat Calon Percabangan


PENENTUAN CALON CABANG
1 Usia Tua Usia Muda
2 Jenis Kelamin Pria Jenis Kelamin Wanita
3 Tidak Merokok Merokok
4 Tidak Olahraga Sering Olahraga
5 Tidak Terkena Jantung Terkena Jantung

2. Berikutnya buat tabel untuk menghitung frekwensi yang muncul berikut dengan proporsi-
nya serta entropy dan gain nya.

a. Hasil Perhitungan Entropi dan Gain


Terkena
Jumlah
Jantung
No kasus Entropy Gain
Ya Tidak
(S)
(S1) (S2)
Total Data 15 4 11 0.83664074
1 Usia 0.05149531
Tua 7 1 6 0.59167278
Muda 8 3 5 0.954434
2 Jenis Kelamin 0.29984284
Pria 13 2 11 0.61938219
Wanita 2 2 0 0
3 Merokok 0.05149531
Ya 7 1 6 0.59167278
Tidak 8 3 5 0.954434
4 Olahraga 0.010799704
Ya 6 2 4 0.91829583
Tidak 9 2 7 0.76420451
Diketahui dari perhitungan diatas, nilai Gain tertinggi adalah untuk Jenis Kelamin (0.29984284)
dan selanjutnya dilihat dari Jenis kelamin wanita yang semuanya terkena jantung, maka
untuk jenis kelamin wanita tidak perlu dihitung lagi Nilai Entropi dan Nilai Gainnya.
b. Pohon Keputusan Level Pertama (Cabang Jenis Kelamin)

Terkena Jantung (Ya + Tidak)


1,2,3,4,5,6,7,8,9,10,11,12,13,14,15

Wanita Pria

Terkena Jantung (Ya) Terkena Jantung (Ya + Tidak)


5,8 1,2,3,4,6,7,9,10,11,12,13,14,15

c. Hasil Perhitungan Entropidan Gain untuk Jenis Kelamin Pria


Jumlah Terkena Jantung
No kasus Ya Tidak Entropy Gain
(S) (S1) (S2)
Total Data Pria 13 2 11 0.61938219
1 Usia 0.154624965
Tua 6 0 6 0
Muda 7 2 5 0.86312057
2 Jenis Kelamin
3 Merokok 0.000778812
Ya 7 1 6 0.59167278
Tidak 6 1 5 0.65002242
4 Olahraga 0.195553348
Ya 6 2 4 0.91829583
Tidak 7 0 7 0
Diketahui dari perhitungan diatas, nilai Gain tertinggi adalah untuk Olah Raga (0.195553348)
dan selanjutnya dilihat dari Jenis kelamin Pria yang tidak ber olahraga semuanya terkena
tidak terkena jantung, maka untuk yang jenis kelamin pria yang tidak ber olahraga, tidak perlu
dihitung lagi Nilai Entropi dan Nilai Gainnya.

d. Pohon Keputusan Level Kedua (Cabang Jenis Kelamin dan OlahRaga)

Pria Terkena Jantung (Ya + Tidak)


1,2,3,4,6,7,9,10,11,12,13,14,15

Tidak Berolahraga Berolahraga


e. Hasil Perhitungan Entropidan Gain untuk Jenis Kelamin Pria yang berolah raga
Terkena
Jumlah
Jantung
No kasus Entropy Gain
Ya Tidak
(S)
(S1) (S2)
Total Pria 6 2 4 0.91829583
Olahraga
1 Usia 0.459147917
Tua 3 0 3 0
Muda 3 2 1 0.91829583
2 Jenis
Kelamin
3 Merokok 0.044110418
Ya 2 1 1 1
Tidak 4 1 3 0.81127812
4 Olahraga
Diketahui dari perhitungan diatas, nilai Gain tertinggi adalah untuk Usia (0.459147917) dan
selanjutnya dilihat dari Jenis kelamin Pria yang ber olahraga dan tua semuanya terkena
tidak terkena jantung, maka untuk yang jenis kelamin pria yang ber olahraga dan tua, tidak
perlu dihitung lagi Nilai Entropi dan Nilai Gainnya.

f. Pohon Keputusan Level Ketiga (Cabang Jenis Kelamin, OlahRaga dan Usia)

Pria, ber OlahRaga, Terkena Jantung (Ya + Tidak)


1,2,6,7,11,14

Tua Muda

Tidak Terkena Jantung Terkena Jantung (Ya + Tidak)


1,2,14 6,7,11
g. Hasil Perhitungan Entropidan Gain untuk Jenis Kelamin Pria yang berolah raga dan
muda
Terkena
Jumlah
Jantung
No kasus Entropy Gain
Ya Tidak
(S)
(S1) (S2)
Total Pria 3 2 1 0,91829583
Olahraga
Muda
1 Usia
2 Jenis
Kelamin
3 Merokok 0
Ya 1 1 0 0
Tidak 1 1 0 0
4 Olahraga
Diketahui dari perhitungan diatas, nilai Gain adalah 0

h. Pohon Keputusan Level Keempat (Cabang Jenis Kelamin, OlahRaga, Usia dan
Merokok)

Pria, ber OlahRaga, Muda, Terkena Jantung (Ya + Tidak)


6,7,11

Tidak Merokok Merokok

Terkena Jantung (Ya + Tidak) Terkena Jantung


6,7 11

Terkena Jantung Tidak Terkena Jantung


6 7
3. Decision Tree

Terkena Jantung (Ya + Tidak)


1,2,3,4,5,6,7,8,9,10,11,12,13,14,15

Wanita Pria

Terkena Jantung (Ya) Terkena Jantung (Ya + Tidak)


5,8 1,2,3,4,6,7,9,10,11,12,13,14,15

Tidak Berolahraga
Berolahraga

Tidak Terkena Jantung Terkena Jantung (Ya + Tidak)


3,4,9,10,12,13,15 1,2,6,7,11,14

Tua Muda

Tidak Terkena Jantung Terkena Jantung (Ya + Tidak)


1,2,14 6,7,11

Tidak Merokok
Merokok

Terkena Jantung (Ya + Tidak) Terkena Jantung


6,7 11

Tidak Terkena Jantung Terkena Jantung


7 6
4. Merubah Tree Menjadi Rule
Rule adalah aturan yang nantinya akan diterapkan ke dalam program, Hasil Diatas Dapat dibuat
Menjadi Rule sbb :
1) IfJenis Kelamin WanitaThenTerkena Penyakit Jantung
2) IfJenis Kelamin Pria and ber OlahRagaThenTerkena Penyakit Jantung
3) IfJenis Kelamin Pria and ber OlahRagaandUsia MudaThenTerkena Penyakit Jantung
4) IfJenis Kelamin Pria and ber OlahRagaandUsia Mudaand Merokok ThenTerkena Penyakit
Jantung
5) IfJenis Kelamin Pria and ber OlahRagaandUsia Mudaand Tidak Merokok ThenTerkena
Penyakit Jantung Else Tidak Terkena Penyakit Jantung.