Anda di halaman 1dari 31

KLASIFIKASI DECISION

TREE
(Algoritma C4.5)
M. Syukri Mustafa,S.Si., MMSI.
syukri@dipanegara.ac.id

Lecture 09, Algoritma Decision Tree


Syukri 2016

Pokok Bahasan

Konsep Decision Tree


Penggunaan Decision Tree
Konsep Data dalam DT
Proses Decision Tree
Contoh kasus
Tugas 3

Konsep Decision Tree

Decision Tree merupakan Teknik data


mining termasuk kelompok Klasifikasi
Merubah Data menjadi Pohon
Keputusan (Decision Tree) dan aturanaturan keputusan (rule)

Gambaran penggunaan DT

Menggunakan aturan (rule) yang


dapat digunakan untuk
menentukan apakah seseorang
mempunyai potensi untuk
menderita hipertensi atau tidak
berdasarkan data usia, berat
badan dan jenis kelamin.

Gambaran penggunaan DT

Beberapa contoh pemakaian


DT

Diagnosa penyakit tertentu seperti


hipertensi, kanker, stroke, dll
Pemilihan produk seperti rumah,
kendaraan, computer, dll
Pemilihan pegawai teladan
berdasarkan kriteria tertentu
Analisis pemberian pinjaman
terhadap calon kreditur., dll

Konsep data dalam DT

Data dinyatakan dalam table dengan atribut dan


record
Atribut menyatakan sebuah parameter yang dibuat
sebagai kriteria dalam pembentukan tree.
misalkan untuk menentukan main tenis, kriteria
yang
diperhitungkan adalah cuaca, angin dan
temperature.
Atribut memiliki nilai2 yang disebut instance, misal
atribut cuaca memiliki instance berupa cerah,
berawan dan hujan.

Konsep data dalam DT


(cont)

Proses dalam DT

Mengubah bentuk data (table)


menjadi model Tree
Mengubah model tree menjadi
rule
Menyederhanakan rule
(Pruning)

Proses data menjadi tree

Entropy

S adalah ruang (data) sampel yang digunakan untuk


training
P+ adalah jumlah yang bersolusi poritif (mendukung) pada
data sampel untuk kriteria tertentu.
P- adalah jumlah yang bersolusi negative (tidak
mendukung) pada data sample untuk kriteria tertentu
Besarnya entropy pada ruang sampel S didefinisikan
dengan :

Definisi Entropy

Menrubah tree menjadi


Rule

Conjunction & Disjunction

Contoh Kasus

Contoh permasalahan Penentuan sesorang


menderita Hipertensi menggunakan decition
tree
Data diambil dengan 8 sample, dengan
pemikiran bahwa yang mempengaruhi
seseorang menderita hipertensi atau tidak
adalah usia, berat badan, dan jenis kelamin.
Usia mempunyai instance : muda dan tua
Berat badan instance : underweight, average
dan overweight
Jenis kelamin instance : pria dan wanita

Data sample yang


digunakan untuk
menentukan hipertensi

Langkah merubah data menjadi tree :

Menentukan node terpilih


Menyusun tree

Menentukan node terpilih

Untuk menentukan nodeterpilih,


gunakan nilai Entropy darisetiap
kriteria yang ditentukan
None terpilih adalah kriteria
dengan entropy palingkecil

Memilih Node Awal

Memilih Node Awal (cont)

Menyusun tree Awal

Penentuan Leaf Node


untuk Berat=Overweight

Penyusunan Tree (cont)

Hasil tree

Merubah tree menjadi rule

Hasil prediksi pada data


training

Menyederhanakan dan menguji rule

Hasil prediksi pada data


training

TUGAS 3
Pilih Salah satu dari Tugas berikut
(3a atau 3b)
Tugas Ditulis tangan
Dikumpul Pertemuan Berikutnya

TUGAS 3 (a)

1.

2.

Buatlah tree dan rule untuk mendeteksi adanya gangguan


pada jaringan computer menggunakan data di atas
Berapa persen besarnya erro yang terjadi tanpa
penyederhanaan (pruning) dan dengan penyederhanaan.

TUGAS 3 (b)

1.

2.
3.

Buatlah tree untuk mendeteksi penyakit jantung


menggunakan data di atas
Lakukan penyederhanaan (pruning)
Berapa persen bersarnya error yang terjadi tanpa
penyederhanaan dan dengan penyederhanaan.

Sekian
Next
Clastering (K-Means)

Anda mungkin juga menyukai