Anda di halaman 1dari 7

LAPORAN TUGAS KECIL DATA MINING 3

Disusun Oleh :
Ivan Rekyan Fitrayana Sauki Ridwan Nursaid Nida Mujahidah Azzahra Dany Dwi Prayoga 1107090021 1107100048 1107112072 1107114098

PROGRAM STUDI ILMU KOMPUTASI TELKOM INFORMATICS SCHOOL TELKOM UNIVERSITY 2014

Proses Preprocessing 1. Contoh data raw yang didapat. Data ini tidak dapat dibuka langsung pada aplikasi weka karena formatnya tidak sesuai dengan format input data.

2. Data di atas, menggunakan tanda penghubung (;) yang tidak dapat terbaca oleh aplikasi weka sehingga harus diganti dengan tanda penghubung koma (,) agar data dapat terbaca. Dan juga ditambahkan format dasar atribut. Kemudian file dapat disimpan dalam ekstensi *.arff seperti dibawah ini:

3. Setelah file tadi disimpan dalam ekstensi *.arff, buka file tersebut dengan aplikasi weka

4. Maka akan muncul pada jendela weka seperti berikut

5. Pada Tab Preprocess, dilakukan filtering terlebih dahulu, proses filtering pertama yang dilakukan adalah Attribute Selection, proses ini akan mengeliminasi beberapa atribut yang tidak diperlukan, setelah proses Attribute Selection maka atribut yang tersisa menjadi 6.

6. Agar dapat dilakukan klasifikasi dengan menggunakan ID3, data yang sudah di-filter tersebut dilakukan discretization dengan menggunakan discretize.

Proses Data Mining menggunakan ID3 1. Proses Preprocessing telah selesai, selanjutnya pindahkan Tab pada Tab Classify. Pilih ID3 pada kolom Classifier dan use training set pada kolom test options. Jika sudah, klik Start, sehingga akan muncul data pada classifier output seperti berikut:

2. Setelah itu, agar proses klasifikasi lebih valid, langkah selanjutnya perlu dilakukan validasi, dalam hal ini akan dilakukan cross-validation sebanyak 10 kali. Pada kolom test options pilih Cross-validation kemudian klik Start.

Analisis Sebelum dilakukan klasifikasi menggunakan algoritma ID3 terdapat 45211 data tanpa missing value dan 17 atribut yang terdiri dari,

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17.

age job marital education default balance housing loan contact day month duration campaign pdays previous poutcome y

Pada teknik klasifikasi kali ini kita gunakan semua atribut yang ada, sedangkan yang digunakan sebagai parameter target (class) yaitu field y. Dimana field y ini berisi apakah client telah melakukan deposit atau tidak. Berdasarkan records dari data pada field y tersebut, maka teknik classification bisa diterapkan untuk melakukan data mining pada data tersebut. Adapun kolom yang bisa diambil sebagai parameter-parameter pembentuk pohon keputusannya walaupun pada tools Weka tidak muncul bentuk pohonnya. Hasil uji Kita gunakan 75% (33908) dari total data untuk data training dan 25% (2355) untuk data testing, sehingga diperoleh hasil sebagai berikut : Untuk training data diperoleh akurasi data senilai 91, 9518 %

Kemudian dilakukan testing data,

Diperoleh akurasi sebesar 80,253 % Kesimpulan Pada percobaan ini, dihasilkan pohon ID3 yang cukup bagus dalam hal klasifikasi data. Besar akurasinya pun memuaskan. Namun kekurangannya hanya tak bisa menampilkan pohon ID3 dalam bentuk visualisasinya.

Anda mungkin juga menyukai