Anda di halaman 1dari 25

Sri Astuti Thamrin

} Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan


oleh berbagai macam masalah dari berbagai macam bidang.
} Untuk menghadapi masalah, manusia mulai mengembangkan sebuah
sistem yang dapat membantu manusia agar dapat dengan mudah
mampu untuk menyelesaikan masalah-masalah tersebut.

} Pohon keputusan : sebuah jawaban akan sebuah sistem yang


dikembangkan untuk membantu mencari dan membuat keputusan dari
suatu masalah dengan memperhitungkan berbagai macam faktor yang
ada di dalam lingkup masalah tersebut.

} Metode ini akan mempelajari kumpulan data tersebut untuk didapatkan


sebuah informasi yang dapat dijadikan pengambilan keputusan.
} Mungkin ini menjadi alasan mengapa diambil kata “Keputusan
(Decision)” dan penyelesaian masalah menyerupai struktur “Pohon
(Tree)” sebagai nama dari metode ini.

} Semisal contoh sederhana, pengajuan kredit mobil. Kita dapat


menggunakan metode ini untuk menganalisa apakah orang yang akan
mengajukan kredit layak ataukah tidak tentu berdasarkan atriibut
(kriteria) yang telah ditentukan. Tentu bila kita hanya mengandalkan
intuisi tanpa berkaca pada data data sebelumnya akan membuka
peluang besar terjadinya human error.
} Pohon keputusan adalah model prediksi menggunakan
struktur pohon atau struktur berhirarki.
} Pohon keputusan adalah salah satu metode klasifikasi
yang paling populer karena mudah untuk diinterpretasi
oleh manusia.
} Pohon yang dalam analisis pemecahan masalah
pengambilan keputusan adalah pemetaan mengenai
alternatif-alternatif pemecahan masalah yang dapat
diambil dari masalah tersebut.
} Konsep dari pohon keputusan adalah mengubah data
menjadi pohon keputusan dan aturan-aturan keputusan.

} Data dalam pohon keputusan biasanya dinyatakan dalam


bentuk tabel dengan atribut dan record. Atribut menyatakan
suatu parameter yang dibuat sebagai kriteria dalam
pembentukan tree
} Proses pada pohon keputusan adalah mengubah bentuk
data (tabel) menjadi model pohon, mengubah model
pohon menjadi rule, dan menyederhanakan rule
} Manfaat utama dari penggunaan pohon keputusan
adalah kemampuannya untuk mem-break down proses
pengambilan keputusan yang kompleks menjadi lebih
simpel sehingga pengambil keputusan akan lebih
menginterpretasikan solusi dari permasalahan.
} Pohon Keputusan juga berguna untuk mengeksplorasi
data, menemukan hubungan tersembunyi antara
sejumlah calon variabel input dengan sebuah variabel
target.
} Pohon keputusan merupakan himpunan aturan IF…THEN.
Setiap path dalam tree dihubungkan dengan sebuah aturan,
di mana premis terdiri atas sekumpulan node-node yang
ditemui, dan kesimpulan dari aturam terdiri atas kelas yang
terhubung dengan leaf dari path.

} Bagian awal dari pohon keputusan ini adalah titik akar


(root), sedangkan setiap cabang dari pohon keputusan
merupakan pembagian berdasarkan hasil uji, dan titik akhir
(leaf) merupakan pembagian kelas yang dihasilkan
1. Simpul akar, dimana tidak memiliki cabang yang
masuk dan memiliki cabang lebih dari satu, terkadang
tidak memiliki cabang sama sekali. Simpul ini biasanya
berupa atribut yang paling memiliki pengaruh terbesar
pada suatu kelas tertentu.
2. Simpul internal, dimana hanya memiliki 1 cabang yang
masuk, dan memiliki lebih dari 1 cabang yang keluar.
3. Simpul daun, atau simpul akhir dimana hanya memiliki
1 cabang yang masuk, dan tidak memiliki cabang
sama sekali dan menandai bahwa simpul tersebut
merupakan label kelas.
} Pohon keputusan banyak digunakan dalam proses data mining
karena memiliki beberapa kelebihan, yaitu:
1. Tidak memerlukan biaya yang mahal saat membangun
algoritma.
2. Mudah untuk diinterpetasikan.
3. Mudah mengintegrasikan dengan sistem basis data.
4. Memiliki nilai ketelitian yang lebih baik.
5. Dapat menemukan hubungan tak terduga dan suatu data.
6. Dapat menggunakan data pasti/mutlak atau data kontinu.
7. Mengakomodasi data yang hilang.
} Terjadi overlap terutama ketika kelas-kelas dan criteria
yang digunakan jumlahnya sangat banyak.
} Pengakumulasian jumlah eror dari setiap tingkat dalam
sebuah pohon keputusan yang besar.
} Hasil kualitas keputusan yang didapatkan dari metode
pohon keputusan sangat tergantung pada bagaimana
pohon tersebut didesain.
} Pohon keputusan adalah model prediksi
menggunakan struktur pohon atau struktur
berhirarki.
} Setiap percabangan menyatakan kondisi yang
harus dipenuhi
} tiap ujung pohon menyatakan kelas data.
} model pohon (tree) menjadi aturan (rule).
} Iterative Dichotomiser 3 (ID3) merupakan sebuah metode
yang digunakan untuk membuat pohon keputusan yang
telah dikembangkan oleh J. Ross Quinlan sejak tahun 1986.
Algoritma pada metode ini menggunakan konsep dari
entropy informasi. Algoritma ini melakukan pencarian
secara rakus/menyeluruh (greedy) pada semua
kemungkinan pohon keputusan.
1. Hitung Entropy dan Information gain dari setiap atribut
dengan menggunakan rumus:

} Dimana:
S = ruang (data) sample yang digunakan untuk training.
P+ = jumlah yang bersolusi positif (mendukung) pada data
sample untuk kriteria tertentu.
P- = jumlah yang bersolusi negatif (tidak mendukung)
pada data sample untuk kriteria tertentu.
} Dimana:
S = ruang (data) sample yang digunakan untuk training.
A = atribut.
V = suatu nilai yang mungkin untuk atribut A.
Nilai(A) = himpunan yang mungkin untuk atribut A.
|Sv| = jumlah sample untuk nilai V.
|S| = jumlah seluruh sample data.
Entropy(Sv) = entropy untuk sample-sample yang memiliki
nilai V.
Tujuan dari pengukuran nilai information gain adalah
untuk memilih atribut yang akan dijadikan cabang pada
pembentukan pohon keputusan. Pilih atribut yang memiliki
nilai information gain terbesar.
2. Bentuk simpul yang berisi atribut tersebut.

3. Ulangi proses perhitungan information gain yang akan


terus dilaksanakan sampai semua data telah termasuk
dalam kelas yang sama. Atribut yang telah dipilih tidak
diikutkan lagi dalam perhitungan nilai information gain.
} Sample data yang digunakan oleh ID3 memiliki beberapa
syarat:
- Deskripsi atribut-nilai. Atribut yang sama harus
mendeskripsikan tiap contoh dan memiliki jumlah nilai yang
sudah ditentukan.
- Kelas yang sudah didefinisikan sebelumnya. Suatu atribut
contoh harus sudah didefinisikan, karena mereka tidak dipelajari
oleh ID3.
- Kelas-kelas yang diskrit. Kelas harus digambarkan dengan
jelas. Kelas yang kontinu dipecah-pecah menjadi kategori-
kategori yang relatif, misalnya saja metal dikategorikan menjadi
“hard, quite hard, flexible, soft, quite soft”.
- Jumlah contoh (example) yang cukup. Karena pembangkitan
induktif digunakan, maka dibutuhkan test case yang cukup untuk
membedakan pola yang valid dari peluang suatu kejadian.
} WEKA (Waikato Environment for Knowledge Analysis) adalah
suatu perangkat lunak pembelajaran mesin yang populer
ditulis dengan Java, yang dikembangkan di Universitas
Waikato di selandia baru. WEKA adalah perangkat lunak
gratis yang tersedia di bawah GNU General Public License.
} Pada WEKA menyediakan penggunaan teknik klasifikasi
menggunakan pohon keputusan dengan algoritma J48. Teknik
klasifikasi dan algoritma yang digunakan di WEKA disebut
classifier.

Anda mungkin juga menyukai