Anda di halaman 1dari 29

Decision Tree

Pertemuan : 2 & 3

Decision Tree
Decision Tree merupakan struktur flowchart yang mempunyai tree(pohon), dimana setiap simpul internal menandakan suatu tes atribut,setiap cabang merepresentasikan hasil tes, dan simpul daun merepresentasikan kelas atau distribusi kelas.

Alur pada Decision Tree


Ditelusuri dari simpul akar ke simpul daun yang memegang prediksi kelas untuk contoh tersebut.

Decision tree mudah untuk dikonversi ke aturan klasifikasi (classification rule). Konsep data dalam decision tree dinyatakan dalam bentuk tabel dengan atribut dan record

Pohon (Tree)
Pohon merupakan sebuah graf terhubung yang tidak mengandung sirkuit. Konsep pohon (tree) dalam teori graf merupakan konsep yang sangat penting, karena terapannya diberbagai bidang ilmu. Oleh karenanya antara pohon (tree) sangat erat hubungannya dengan teori graf.

Dari defenisi Pohon, ada dua sifat penting pada pohon yaitu:
Terhubung Tidak mengandung sirkuit.

Karakteristik Tree:
Pohon seringkali memiliki akar . karena setiap simpul pada pohon hanya memiliki satu lintasan akses dari setiap simpul lainnya, maka tidak mungkin bagi sebuah lintasan untuk membentuk simpul (loop) atau siklus (cycle) yang secara berkesinambungan melalui serangkaian simpul

Gambar

Konsep Decision Tree


Mengubah data menjadi pohon keputusan (decision tree) dan aturan-aturan keputusan (Rule)

Data

Decision Tree

Rule

Konsep Data dalam Decision Tree


Data dinyatakan dalam bentuk tabel yang tersusun atas atribut dan record Atribut menyatakan sebuah parameter yang dibuat sebagai kriteria dalam pembentukan tree Atribut terdiri atas atribut kriteria dan atribut target. Atribut target merupakan atribut yang menyatakan data solusi. Nilai pada masing-masing atribut disebut dengan instance

Continue...

Proses dalam Decision Tree


Ubah bentuk data menjadi model tree Ubah model tree menjadi rules Sederhanakan rule (Proses Pruning)

Proses Data menjadi Tree

Continue..
Mengubah data menjadi tree dilakukan dengan menghitung nilai Entropy pada masing-masing kriteria dari sejumlah data sampel yang digunakan.

Mengubah Tree menjadi Rule

Conjunction dan Disjunction

Contoh Soal
Dari 8 data sampel yang digunakan berikut akan diprediksi seseorang menderita penyakit Hipertensi atau tidak. Digunakan 3 kriteria penilaian, yaitu: Usia, berat badan, dan jenis kelamin. Tabel berikut menjelaskan data selengkapnya:

Penyelesaian:
1. Menghitung Entropi pada masing-masing kriteria

Nilai entropy untuk masing-masing kriteria :

Penyusunan Tree Awal

Penentuan Node berikutnya pada Berat Overweight

Kasus Soal 1
Waktu Pendek Pendek Panjang Panjang Pendek Panjang Panjang Panjang Panjang Panjang Pendek Panjang Kecil Besar Kecil Besar Kecil Kecil Kecil Besar Kecil Besar Besar Paket Besar Frekuensi Sedang Rendah Sedang Tinggi Tinggi Rendah Tinggi Sedang Tinggi Sedang Sedang Rendah Prioritas Rendah Tinggi Tinggi Rendah Tinggi Tinggi Rendah Rendah Tinggi Rendah Tinggi Tinggi Kondisi Gangguan Gangguan Normal Normal Gangguan Gangguan Gangguan Normal Normal Gangguan Normal Normal

Pertanyaan:
Buat Decision Tree Dan tentukan rule keputusannya dari kasus tersebut

Kasus Soal2

Pertanyaan:
Buat Decision Tree Dan tentukan rule keputusannya dari kasus tersebut Apakah Prediksinya jika diketahui:
Seorang wanita muda yang merokok tetapi tidak berolah raga?