Anda di halaman 1dari 6

DECISION TREE

Dalam suatu analisis keputusan, Decision Tree (Pohon Keputusan) merupakan salah satu
alat untuk mencapai keputusan terbaik tersebut. Dimana Decision Tree adalah suatu decision
support tool yang menggunakan sebuah grafik atau model suatu keputusan dan konsekuensi-
konsekuensi dari keputusan tersebut. Disebut Decision Tree karena bila digambarkan mirip
sebuah pohon dengan cabang-cabang dan ranting-rantingnya. Decision Tree biasanya digunakan
untuk mengidentifikasi strategi terbaik yang harus digunakan untuk mencapai tujuan.
Kegunaan lain dari Decision Tree adalah sebagai alat deskriptif untuk menghitung
probabilitas kondisional. Dibandingkan dengan decision support tools yang lain, Decision Tree
memiliki beberapa kelebihan yakni mudah dimengerti dan diinterpretasikan. Orang akan mudah
memahami model dari Decision Tree setelah memperoleh penjelasan singkat. Selain itu Decision
Tree tetap memiliki nilai bahkan dengan data yang sulit. Untuk pengertian yang lebih mendalam
dapat diperoleh berdasarkan gambaran dari tenaga ahli mengenai situasinya (alternatifnya,
probabilitasnya, dan biaya-biayanya) dan pilihan mereka untuk hasilnya.
Decision Tree menggunakan white box model. Jika kita memperoleh hasil dari model
tersebut maka penjelasannya akan dapat dengan mudah dimengerti dengan matematika
sederhana. Decision Tree juga bisa dikombinasikan dengan teknik pengambilan keputusan yang
lainnya contohnya dengan metode NPV, PERT dan distribusi linear. Bukan hanya itu, Decision
Tree dapat digunakan untuk mengoptimalisasikan suatu investasi.
Pohon keputusan adalah salah satu metode klasifikasi yang paling populer karena mudah
untuk diinterpretasi oleh manusia. Pohon keputusan adalah model prediksi menggunakan struktur
pohon atau struktur berhirarki. Konsep dari pohon keputusan adalah mengubah data menjadi
pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan
adalah kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks
menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari
permasalahan.
Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan
tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Pohon keputusan
memadukan antara eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal
dalam proses pemodelan bahkan ketika dijadikan sebagai model akhir dari beberapa teknik lain.
Kelebihan dari metode pohon keputusan (Decision Tree) adalah:
Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah
menjadi lebih simpel dan spesifik.
Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika menggunakan
metode pohon keputusan maka sample diuji hanya berdasarkan kriteria atau kelas tertentu.
Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan
membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama.
Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan yang dihasilkan
jika dibandingkan ketika menggunakan metode penghitungan satu tahap yang lebih
konvensional
Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang
penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun
parameter tertentu dari distribusi kelas tersebut. Metode pohon keputusan dapat menghindari
munculnya permasalahan ini dengan menggunakan criteria yang jumlahnya lebih sedikit pada
setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.
Kekurangan dari metode pohon keputusan (Decision Tree) adalah:
Terjadi overlap terutama ketika kelas-kelas dan criteria yang digunakan jumlahnya sangat
banyak. Hal tersebut juga dapat menyebabkan meningkatnya waktu pengambilan keputusan
dan jumlah memori yang diperlukan.
Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon keputusan yang besar.
Kesulitan dalam mendesain pohon keputusan yang optimal.
Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat tergantung
pada bagaimana pohon tersebut didesain.
Decision Tree merupakan salah satu metode klasifikasi yang menggunakan representasi struktur
pohon (tree) dimana setiap node merepresentasikan atribut, cabang nya merepresentasikan nilai dari
atribut, dan daun merepresentasikan kelas. Node yang paling atas dari Decision Tree disebut
sebagai root. Decision Tree merupakan metode klasifikasi yang paling populer digunakan. Selain
karena pembangunannya relatif cepat, hasil dari model yang dibangun mudah untuk dipahami.
Pada Decision Tree terdapat 3 jenis node, yaitu:
a. Root Node, merupakan node paling atas, pada node ini tidak ada input dan bisa tidak
mempunyai output atau mempunyai output lebih dari satu.
b. Internal Node , merupakan node percabangan, pada node ini hanya terdapat satu input dan
mempunyai output minimal dua.
c. Leaf node atau terminal node , merupakan node akhir, pada node ini hanya terdapat satu input
dan tidak mempunyai output.
Decision Tree menggunakan algoritma ID3 atau C4.5, yang diperkenalkan dan
dikembangkan pertama kali oleh Quinlan yang merupakan singkatan dari Iterative Dichotomiser 3
atau Induction of Decision 3 (baca: Tree). Algoritma ID3 membentuk pohon keputusan dengan
metode divide-and-conquer data secara rekursif dari atas ke bawah. Strategi pembentukan Decision
Tree dengan algoritma ID3 adalah:
Pohon dimulai sebagai node tunggal (akar/root) yang merepresentasikan semua data.
Sesudah node root dibentuk, maka data pada node akar akan diukur dengan information gain
untuk dipilih atribut mana yang akan dijadikan atribut pembaginya.
Sebuah cabang dibentuk dari atribut yang dipilih menjadi pembagi dan data akan
didistribusikan ke dalam cabang masing-masing.
Algoritma ini akan terus menggunakan proses yang sama atau bersifat rekursif untuk dapat
membentuk sebuah Decision Tree. Ketika sebuah atribut telah dipilih menjadi node pembagi
atau cabang, maka atribut tersebut tidak diikutkan lagi dalam penghitungan nilai information
gain.
Proses pembagian rekursif akan berhenti jika salah satu dari kondisi dibawah ini terpenuhi:
1. Semua data dari anak cabang telah termasuk dalam kelas yang sama.
2. Semua atribut telah dipakai, tetapi masih tersisa data dalam kelas yang berbeda.
Dalam kasus ini, diambil data yang mewakili kelas yang terbanyak untuk menjadi
label kelas pada node daun.
3. Tidak terdapat data pada anak cabang yang baru. Dalam kasus ini, node daun akan
dipilih pada cabang sebelumnya dan diambil data yang mewakili kelas terbanyak
untuk dijadikan label kelas.
Beberapa contoh pemakaian Decision Tree,yaitu :
Diagnosa penyakit tertentu, seperti hipertensi, kanker, stroke dan lain-lain
Pemilihan produk seperti rumah, kendaraan, komputerdanlain-lain
Pemilihan pegawai teladan sesuai dengan kriteria tertentu
Deteksi gangguan pada computer atau jaringan computer seperti Deteksi Entrusi,
deteksi virus (Trojan dan varians),dan lain-lain
Diagram pohon sering kali membantu dalam memahami dan menyelesaikan persoalan
probabilitas. Diagram pohon biasanya digambarkan dengan lambang yang baku. Dimulai dengan
suatu nokhta kemudian dibuat cabang-cabang sebanyak peristiwa yang mungkin dapat dihasilkan dari
percobaan. Pada masing-masing cabang dituliskan probabilitas terjadinya peristiwa yang
bersangkutan. Jika percobaan dilakukan lagi, maka langkahlangkah itu diulang. Setiap cabang
berakhir pada nokhta yang kemudian diisi dengan probabilitas peristiwa bersama. Pada nokhta yang
paling awal dituliskan angka 1 yang artinya jumlah probabilitas dari seluruh peristiwa yang mungkin.
Menganalisis masalah dengan menggunakan pohon keputusan mencakup lima langkah :
1. Mendefinisikan masalah.
2. Menggambarkan pohon keputusan.
3. Menentukan peluang bagi kondisi alamiah.
4. Memperkirakan imbalan bagi setiap kombinasi alternatif keputusan dan kondisi alamiah
yang mungkin.
5. Menyelesaikan masalah dengan menghitung EMV bagi setiap titik kondisi alamiah. Hal
ini dilakukan dengan mengerjakannya dari belakang ke depan (backward) yaitu
memulai dari sisi kanan pohon, terus menuju ke titik keputusan di sebelah kirinya.






Kasus Sumur Minyak

PT.Tambang dalam mencari minyak bumi akan memutuskan apakah menggunakan peta geologi
(biaya $ 25,-) atau tidak.
Pilihan berikutnya adalah menjual konsesi atau bor sendiri dengan kondisi sbb:
Beli peta dan berhasil (favourable) dengan Peluang = 0.24
Jual konsesi, hasil $ 86,-
Bor sendiri, dan bila ternyata:
Kering, P=0.25, rugi $ 50,-
Asam, P=0.33, hasil $ 200,-
Manis (dapat minyak), P=0.42, hasil $ 500,-
Beli peta dan tidak berhasil (unfavourable) dengan Peluang = 0.76
Jual konsesi, hasil $ 80,-
Bor sendiri :
Kering, P=0.71, rugi $ 50,-
Asam, P=0.158, hasil $ 200,-
Manis, P=132, hasil $ 500,-
Tidak beli peta
Jual konsesi, hasil $ 80,-
Bor sendiri :
Kering, P=0.6, rugi $ 50,-
Asam, P=0.2, hasil $ 200,-
Manis, P=0.2, hasil $ 500,-

DECISION TREE


Keputusan: Tidak Beli Peta
Alasannya adalah :
1. Jika Membeli Peta maka ada 2 kemungkinan yang terjadi yakni berhasil dan Tidak
Berhasil
2. Peluang (P) Berhasil lebih kecil dari Peluang Tidak Berhasil
3. Hasil dari pembelian Peta Jika Berhasil Keuntungan yang didapat sama dengan hasil
Tanpa Pembelian Peta
Secara singkat bahwa Decision Tree merupakan salah satu metode klasifikasi pada Text Mining.
Klasifikasi adalah proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan
memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum
memiliki kelas data tertentu (Jianwei Han, 2001).
Decision Tree adalah sebuah struktur pohon, dimana setiap node pohon merepresentasikan
atribut yang telah diuji, setiap cabang merupakan suatu pembagian hasil uji, dan node daun (leaf)
merepresentasikan kelompok kelas tertentu. Level node teratas dari sebuah Decision Tree adalah node
akar (root) yang biasanya berupa atribut yang paling memiliki pengaruh terbesar pada suatu kelas
tertentu. Pada umumnya Decision Tree melakukan strategi pencarian secara top-down untuk solusinya.
Pada proses mengklasifikasi data yang tidak diketahui, nilai atribut akan diuji dengan cara melacak jalur
dari node akar (root) sampai node akhir (daun) dan kemudian akan diprediksi kelas yang dimiliki oleh
suatu data baru tertentu.

Decision Tree di atas menunjukkan alur pengambilan keputusan seseorang berdasarkan beberapa nilai
beberapa item yaitu ParentsVisiting, Weather, dan Money. Pada leaf node merupakan tindakan yang akan
diambil sementara inner node menunjukkan item yang menjadi input dan tiap cabang dari inner node
mewakili dari salah satu nilai yang dimiliki oleh inner node tersebut.

b) Nave Bayes
Nave Bayes merupakan sebuah metode pengkalisifikasian yang bersifat probabilistik berdasarkan
teorema Bayes dengan anggapan fitur-fitur yang mempengaruhi pengklasifikasian tidak saling
bergantung/berhubungan, sehingga ada tidaknya salah satu atau beberapa fitur tidak mempengaruhi fitur
lainnya.
c) Decision Tables
Secara umum, decision tables mirip dengan konsep decision tree yaitu sama-sama menggunakan konsep
dasar if-else atau switch-case. Bedanya hanya pada bagian representasi dimana decision table
menggunakan tabel.
Tabel akan dibagi menjadi 2 bagian besar, yaitu kondis dan aksi. Kondisi merupakan hal-hal yang
mempengaruhi pengambilan keputusan sementara aksi merupakan keputusan yang diambil. Keputusan
yang diambil bisa lebih dari 1.