RANDOM FOREST DENGAN banyak pohon keputusan dan melakukan
PYTHON klasifikasi berdasarkan keluaran dari hasil A. Mengklasifikasikan Kelas Animal klasifikasi setiap pohon keputusan anggota. Berdasarkan Ciri-cirinya Setiap pohon keputusan dalam random forest sdibentuk menggunakan algoritma berikut: Dataset yang kami gunakan adalah 1. N diartikan sebagai jumlah pelatihan dan list nama hewan dengan atribut- M sebagai jumlah variabel pada classifier atribut yang meliputi : 2. m yang merupakan variabel input 1. Nama Hewan = Unik digunakan untuk menentukan keputusan pada 2. Berambut = Boolean sebuah titik di pohon; m<M 3. Berbulu = Boolean 3. Pilih training set untuk tree dengan 4. Bertelur = Boolean memilih n kali dengan pemindahan untuk 5. Susu = Boolean semua N training cases yang tersedia (misal : 6. Bersayap = Boolean ambil sampel bootstrap). gunakan sisa kasus 7. Hidup di air = Boolean untuk memperkirakan error dari tree dengan 8. Pemangsa = Boolean cara memprediksi kelasnya. 9. Mempunyai gigi = Boolean 4. untuk setiap titik dari tree, secara acak pilih 10. Memiliki tulang belakang = m variabel yang berdasarkan keputusan pada Boolean titik tersebut. Kalkulasi split terbaik 11. Bernapas dengan paru-paru = berdasarkan m variabel tersebut pada training Boolean set. 12. Berbisa = Boolean 5. Masing-masing tree tumbuh dan tidak 13. Memiliki sirip = Boolean ditaklukkan (sebagaimana dilakukan pada 14. Jumlah kaki = Numeris (Nilai : 0, saat membangun classifier pada normal tree). 2, 4, 5, 6, 8) 15. Ekor = Boolean C. Implementasi Metode Random 16. Dapat dipelihara = Boolean Forest pada Python 17. Catsize = Boolean 18. Tipe Kelas Tipe Kelas = Numeris • Mendeklarasikan penggunaan library (Integer dalam rentang 1 – 7), dan fungsi yang akan digunakan dengan rincian sebagai berikut : 1. Mengimpor modul pandas 1. Mamalia 2. Mengimpor modul numpy 2. Aves 3. Mengimpor modul 3. Reptil matplotlib.pyplot 4. Pisces 4. Mengimpor fungsi 5. Amfibi RandomForestClassifier dari modul 6. Serangga sklearn.neighbors 7. Invertebrata 5. Mengimpor fungsi accuracy_score dari modul sklearn.metrics B. Penjelasan Metode Random Forest • Program mengimpor dataset “zoo.data.txt” Random forest (atau random forests) adalah sekumpulan classifier yang terdiri dari • Membuat numpy array “X” yang mengambil data dengan kolom berisi atribut hewan kecuali “type” 1. Hair 2. Feather 3. Egg 4. Milk 5. Airbone 6. Aquatic 7. Predator 8. Toothed 9. Backbone 10. Breathe Grafik Percobaan dan Grafik Real 11. Venomous 12. Fin 13. Leg 14. Tail 15. Domestic 16. Catsize • Membuat numpy array “y” yang mengambil data dengan kolom berisi atribut hewan “type” • Melakukan train dan validasi sebanyak 10 kali dan menampilkan akurasi yang didapat dari setiap Fig. 1 : Percobaan dengan 101 Dataset iterasi Nilai Akurasi : 0.9498 • Memprediksi tipe hewan dan membandingkan dengan tipe REFERENSI sebenarnya dengan 101 dataset, lalu ditampilkan nilai akurasinya. Koehrsen W. 2017. Randomm Forest 2. Hasil Program in Python. Diakses 22 Mei 2018. Polamuri S. 2017. Building Random Tabel 1 Forest Classifier with Python Scikit Random Forest Validation Learn. Diakses 22 Mei 2018. Hidayat S. 2018. Algoritma Random Forest. Diakses 22 Mei 2018.