MINING
Klasifikasi adalah suatu proses untuk menemukan model atau
PROSES fungsi untuk menggambarkan class atau konsep dari suatu data.
KLASIFIKASI
Proses klasifikasi biasanya dibagi menjadi dua fase : learning dan
DALAM DATA
test. Pada fase learning, sebagian data yang telah diketahui kelas
MINING datanya diumpankan untuk membentuk model perkiraan.
Kemudian pada fase test model yang sudah terbentuk diuji
dengan sebagian data lainnya untuk akurasi dari model tersebut.
Bila akurasinya mencukupi model ini dapat dipakai untuk prediksi
kelas data yang belum diketahui.
Ada beberapa teknik klasifikasi yang digunakan sebagai soluasi
TEKNIK pemecahan kasus diantaranya yaitu:
1. Decision Tree (Pohon Keputusan)
KLASIFIKASI 2. Klasifikasi Bayes
3. Artificial Neural Network
4. Nearest Neighbour Rule
Decision Tree adalah salah satu metode klasifikasi yang popular
Decision Tree dan banyak digunakan secara praktis.
Langkah 2 : Jika semua sampel berada dalam kelas yang sama, maka
simpul ini menjadi daun dan dilabeli menjadi kelas. Jika tidak,
information gain akan digunakan untuk memilih atribut terbaik dalam
memisahkan data sampel menjadi kelas-kelas individu.
Langkah 3 : Cabang akan dibuat untuk setiap nilai pada atribut dan
data sampel akan dipartisi lagi.
Langkah 4 : Algoritma ini menggunakan proses rekursif untuk
membentuk pohon keputusan pada setiap data partisi. Jika sebuah
atribut sduah digunakan disebuah simpul, maka atribut ini tidak akan
digunakan lagi di simpul anak-anaknya.
Langkah 2 :
Menentukan
node akar
NODE 1.1
cabang
NODE 1.1
Kemudian dihitung nilai entropi atribut “Kelembaban” Tinggi dan
entropi setiap atribut serta gainnya. Setelah itu tentukan pilih
atribut yang memiliki gain tertinggi untuk dibuatkan node
berikutnya.
Gain tertinggi yang didapat ada pada atribut “Cuaca”, dan Nilai
yang dijadikan daun atau leaf adalah Berawan dan Cerah. Jika
divualisasi maka pohon keputusan tampak seperti Gambar
dibawah.