Anda di halaman 1dari 2

1.

Kelompok kami mengunakan aplikasi Rapidminer karena menurut kami, aplikasi


Rapidminer lebih mudah digunakan dibandingkan dengan 2 aplikasi lainnya.
Dataset Tranfusion

Dataset GradeHouse

Perbandingan antara dataset Tranfusion dan dataset GradeHouse yaitu kalau dataset
Tranfusion datanya lebih sedikit sehingga Decision Treenya lebih mudah dibaca dan kecil,
kemudian kalau dataset GradeHouse datanya lebih banyak dan Decision Treenya lebih besar
dan lebih rumit dibaca.

2. Decision Tree Analysis atau Analisis Pohon keputusan merupakan salah satu metodologi
data mining. Decision tree adalah model prediksi menggunakan struktur pohon atau
struktur berhirarki. Konsepnya adalah mengubah data menjadi pohon keputusan. Manfaat
utama dari penggunaan decision tree adalah kemampuannya untuk mem-break
down proses pengambilan keputusan yang kompleks menjadi lebih simple sehingga
pengambilan keputusan akan lebih menginterpretasikan solusi dari permasalahan.

3. Analisis Data set Tranfusion:

Dataset Tranfusion ini memiliki 798 data yang terbagi ke 4 waktu yaitu dari bulan Januari
– April. Decision Tree dari data Tranfusion memiliki 9 cabang. Cabang pertama
menjelaskan jika waktunya memiliki nilai kurang dari sama dengan 2500 maka masuk ke
bulan Februari dan jika nilainya lebih dari 2500, maka harus memilih alternative waktu
yang lain. Kemudian, cabang kedua menjelaskan jika nilainya lebih dari 6500 maka harus
memilih alternative waktu yang lain, jika nilainya lebih kecil sama dengan 6500 maka
masuk ke bulan Maret. Cabang ketiga menjelaskan, jika nilainya lebih besar dari 11500
maka harusmemiliki alternative waktu lain dan jika nilainya lebih kecil sama dengan
11500 maka masuk ke kolom frequency. Di kolom frequency dijelaskan jika nilainya
lebih besar dari 1500 maka harus memilih alternative waktu lain dan jika nilainya lebih
kecil sama dengan 1500 maka masuk ke bulan Januari. Di cabang waktu lainnya,
dijelaskan jika nilainya lebih besar dari 13 maka masuk ke bulan April, dan jika lebih
kecil sama dengan 13500 maka masuk ke bulan Maret. Di cabang waktu lainnya,
dijelaskan bahwa jika nilainya lebih besar dari 9.5 maka masuk ke bulan Februari dan jika
nilainya lebih kecil sama dengan 9500, maka masuk ke bulan Maret.

Analisi data set GradeHouse:

Data set Grade House memiliki 9988, jika kondisi bernilai lebih besar dari 1500 maka dia
akan masuk ke dalam kolon yr_built. Sedangkan apabila bernilai kurang dari sama
dengan 1500 masuk ke dalam kolom standard. Setelah di dalam kolom yr_built apabila
lebih kecil sama dengan 2013.5 masuk ke kolom floor, sedangkan apabila lebih besar dari
2013.5 masuk kedalam eksklusif. Kemudian jika di dalam kolom floor kurang dari sama
dengan 3250 masuk ke dalam bed rooms, apabila lebih besar dari 3250 masuk ke dalam
kolom eksklusif. Setelah itu, apabila kolom bed rooms memiliki nilai kurang dari sama
dengan 1500 masuk kembali ke kolom bed rooms, apabila nilai lebih besar dari 1500
masuk ke dalam kolom premium. Apabila nilai bed rooms memiliki nilai lebih besar dari
0.500 maka akan masuk ke dalam kolom yr_built, sedangkan apabila lebih kecil sama
dengan 0.500 maka dia akan masuk ke dalam kolom yr_built.
Di dalam kolom yr_built, apabila bernilai lebih besar 1993 masuk ke kolom premium.
Apabila lebih kecil sama dengan masuk ke dalam kolom eksklusif. Selanjutnya dapat
dilihat bahwa setiap kolom memiliki cabang yang bercabang.

Anda mungkin juga menyukai