Anda di halaman 1dari 2

III.

RANDOM FOREST DENGAN banyak pohon keputusan dan melakukan


PYTHON klasifikasi berdasarkan keluaran dari hasil
A. Mengklasifikasikan Kelas Animal klasifikasi setiap pohon keputusan anggota.
Berdasarkan Ciri-cirinya Setiap pohon keputusan dalam random forest
sdibentuk menggunakan algoritma berikut:
Dataset yang kami gunakan adalah 1. N diartikan sebagai jumlah pelatihan dan
list nama hewan dengan atribut- M sebagai jumlah variabel pada classifier
atribut yang meliputi : 2. m yang merupakan variabel input
1. Nama Hewan = Unik digunakan untuk menentukan keputusan pada
2. Berambut = Boolean sebuah titik di pohon; m<M
3. Berbulu = Boolean 3. Pilih training set untuk tree dengan
4. Bertelur = Boolean memilih n kali dengan pemindahan untuk
5. Susu = Boolean semua N training cases yang tersedia (misal :
6. Bersayap = Boolean ambil sampel bootstrap). gunakan sisa kasus
7. Hidup di air = Boolean untuk memperkirakan error dari tree dengan
8. Pemangsa = Boolean cara memprediksi kelasnya.
9. Mempunyai gigi = Boolean 4. untuk setiap titik dari tree, secara acak pilih
10. Memiliki tulang belakang = m variabel yang berdasarkan keputusan pada
Boolean titik tersebut. Kalkulasi split terbaik
11. Bernapas dengan paru-paru = berdasarkan m variabel tersebut pada training
Boolean set.
12. Berbisa = Boolean 5. Masing-masing tree tumbuh dan tidak
13. Memiliki sirip = Boolean ditaklukkan (sebagaimana dilakukan pada
14. Jumlah kaki = Numeris (Nilai : 0, saat membangun classifier pada normal tree).
2, 4, 5, 6, 8)
15. Ekor = Boolean C. Implementasi Metode Random
16. Dapat dipelihara = Boolean Forest pada Python
17. Catsize = Boolean
18. Tipe Kelas Tipe Kelas = Numeris • Mendeklarasikan penggunaan library
(Integer dalam rentang 1 – 7), dan fungsi yang akan digunakan
dengan rincian sebagai berikut : 1. Mengimpor modul pandas
1. Mamalia 2. Mengimpor modul numpy
2. Aves 3. Mengimpor modul
3. Reptil matplotlib.pyplot
4. Pisces 4. Mengimpor fungsi
5. Amfibi RandomForestClassifier dari modul
6. Serangga sklearn.neighbors
7. Invertebrata 5. Mengimpor fungsi accuracy_score
dari modul sklearn.metrics
B. Penjelasan Metode Random Forest • Program mengimpor dataset
“zoo.data.txt”
Random forest (atau random forests)
adalah sekumpulan classifier yang terdiri dari
• Membuat numpy array “X” yang
mengambil data dengan kolom berisi
atribut hewan kecuali “type”
1. Hair
2. Feather
3. Egg
4. Milk
5. Airbone
6. Aquatic
7. Predator
8. Toothed
9. Backbone
10. Breathe Grafik Percobaan dan Grafik Real
11. Venomous
12. Fin
13. Leg
14. Tail
15. Domestic
16. Catsize
• Membuat numpy array “y” yang
mengambil data dengan kolom berisi
atribut hewan “type”
• Melakukan train dan validasi
sebanyak 10 kali dan menampilkan
akurasi yang didapat dari setiap
Fig. 1 : Percobaan dengan 101 Dataset
iterasi
Nilai Akurasi : 0.9498
• Memprediksi tipe hewan dan
membandingkan dengan tipe
REFERENSI
sebenarnya dengan 101 dataset, lalu
ditampilkan nilai akurasinya.
 Koehrsen W. 2017. Randomm Forest
2. Hasil Program in Python. Diakses 22 Mei 2018.
 Polamuri S. 2017. Building Random
Tabel 1 Forest Classifier with Python Scikit
Random Forest Validation Learn. Diakses 22 Mei 2018.
 Hidayat S. 2018. Algoritma Random
Forest. Diakses 22 Mei 2018.

Anda mungkin juga menyukai