Kelompok 5 - Uts
Kelompok 5 - Uts
“Random Forest”
Disusun Oleh :
2021/2022
DAFTAR ISI
DAFTAR ISI.......................................................................................................................................... 2
BAB I ...................................................................................................................................................... 3
1.1 Latar Belakang .............................................................................................................................. 3
1.2 Tujuan .......................................................................................................................................... 3
1.3 Alur ................................................................................................................................................ 4
BAB II .................................................................................................................................................... 5
2.1 Sumber Dataset............................................................................................................................ 5
2.2 Atribut dan Kelas .......................................................................................................................... 5
2.3 Struktur Dataset ........................................................................................................................... 6
2.4 Dataset Test ................................................................................................................................. 6
2.5 kelebihan Random Forest ............................................................................................................. 6
2.6 kelemahan Random Forest ........................................................................................................... 6
BAB III................................................................................................................................................... 7
3.1 Pengertian Random Forest .......................................................................................................... 7
3.2 Parameter .................................................................................................................................... 7
BAB I
LATAR BELAKANG DAN TUJUAN
Data mining adalah suatu teknologi yang dapat digunakan untuk membantu perusahaan
dalam mencari informasi yang dapat digunakan dari data yang dimiliki. Penggunaan data
mining di implementasikan untuk mempredisi apa yang terjadi di masa yang akan datang.
Dataset ini berasal dari National Institute of Diabetes and Digestive and Kidney Diseases.
Tujuan dari kumpulan data adalah untuk memprediksi secara diagnostik apakah pasien
menderita diabetes atau tidak, berdasarkan pengukuran diagnostik tertentu yang termasuk
dalam kumpulan data. Beberapa kendala ditempatkan pada pemilihan contoh ini dari
database yang lebih besar. Secara khusus, semua pasien di sini adalah perempuan berusia
minimal 21 tahun dari keturunan Pima India.
Dataset terdiri dari beberapa variabel prediktor medis dan satu variabel target, Hasil.
Variabel prediktor meliputi jumlah kehamilan yang dialami pasien, BMI, kadar insulin,
usia, dan sebagainya
1.2 Tujuan
1. Mendiagnosis apakah pasien menderita diabetes atau tidak, berdasarkan tindakan
diagnostik tertentu dalam kumpulan data
2. Untuk menghasilkan nilai akurasi dan presisi terbaik dari dataset Pima Indians
Diabetes Database
3. Untuk mencegah penyakit diabetes sedini mungkin.
1.3 Alur Diagram
BAB II
DATASET
3.2 Parameter
No Parameter Deskripsi
1 n_estimators Jumlah tree dalam Random Forest.