Anda di halaman 1dari 11

Praktikum 10 Klasifikasi

Tujuan 1. Mahasiswa bisa menggunakan algoritma klasifikasi untuk memecahkan masalah 2. Mahasiswa bisa menggunakan perangkat lunak WEKA untuk memecahkan masalah terkait klasifikasi Petunjuk Pengerjaan : 1. Praktikum dikerjakan perorangan di laboratorium 2. Tugas dikumpulkan ke e-learning

Klasifikasi dengan Dataset yang Disediakan oleh Weka


Pada kesempatan ini kita akan mencoba metode klasifikasi dengan menggunakan data yang telah disediakan oleh Weka. Langkah-langkah : 1. Buka Weka Explorer 2. Klik tombol open file, pilih file weather.arff yang ada di c:/program files/weka 3-6/data/ 3. Muncul tampilan di bawah ini :

Gambar 1 Weka Explorer-Preprocessing untuk Weather.arff 4. File weather.arff mempunyai 5 buah atribut, yaitu outlook, temperature, humidity, windy, dan play. Play bertindak sebagai kelasnya. 5. Di weka explorer kita melihat karakteristik data yang digunakan oleh setiap atribut. Caranya : klik atribut outlook di sebelah kiri, mana di tabel sebelah kanan akan muncul informasi seputar atribut tersebut, yaitu : Name : outlook Missing : 0(0%) Unique : 0 (0%) N o 1 Label sunny Count 5 Type : nominal Distinct : 3

2 3

Overcast rainy

4 5

Gambar 2 Histogram untuk atribut outlook 6. Di weka explorer bisa melihat visualisasi isi file tersebut, dengan menekan tombol Visualize All, yang berisi histogram semua atribut yang ada di file weather.arff 7. Kita bisa melanjutkan proses ke metode data mining, dengan mengklik tab classify, dan muncul gambar 3.

Gambar 3 Weka Explorer-Classify Di gambar 3, kita bisa memilih : A. berbagai jenis teknik-teknik yang sudah disediakan dan siap digunakan B. test option, ada 4 test option, yaitu : a. use training set, artinya pengujian menggunakan data pelatihan(data uji sama dengan data pelatihan) b. supplied test set, artinya pengetesan menggunakan data baru, dalam bentuk file baru, yang bisa dimasukkan c. cross validation, dengan masukan jumlah fold, yang popular 10 fold

d. percentage split % x, artinya mengalokasikan data training sejumlah x%. sisanya menjadi data uji C. Pada praktikum sekarang, digunakan : a. classifier : J4.8, yang termasuk jenis tree. J4.8 adalah pengembangan algoritma C4.5 b. test options : cross-validation folds 10 D. Klik tombol Start hasilnya ada di gambar 8 di sebelah kanan. Output yang diperoleh adalah : a. Scheme, menunjukkan teknik yang digunakan b. Relation, menunjukkan nama relasi data c. Instances, menunjukkan jumlah instance atau record d. attributes, menunjukkan jumlah atribut dan nama atribut e. test-mode, menunjukkan jenis pengujian yang digunakan f. J48 pruned tree, menunjukkan tree yang terbentuk g. Number of leaves, menunjukkan jumlah daun yang terbentuk h. Size of the tree, menunjukkan jumlah simpul yang terbentuk i. Time taken, menunjukkan waktu yang dibutuhkan untuk melakukan proses pembentukan tree j. Summary i. Correctly classified instances, menunjukkan jumlah instance/record yang bisa diklasifikasi dengan benar

ii. Incorrectly classified instances, menunjukkan jumlah instance/record yang tidak bisa diklasifikasi dengan benar k. Confusion matrix a b classified as 7 2 | a=yes 3 2 | b=no Artinya : ada 2 buah instances yang mempunyai class yes, tapi diklasifikasi ke class no dan ada 3 buah instances yang mempunyai class no, tapi diklasifikasi ke class yes

Gambar 4 Hasil Klasifikasi berbentuk tree, di bagian yang dikasih tanda warna ungu 8. Tersedia juga fasilitas visualize tree. Caranya : klik kanan tree.J48 yang ada di bagian result list. Cari fitur Visualize tree. Dapat dilihat di gambar 9. 9. Hasil visualize tree dapat dilihat di gambar 10.

Gambar 5 Letak Visualize Tree

Gambar 6 Hasil Visualize Tree Tugas 1. Lakukan klasifikasi dengan data weather.arff, sesuai dengan langkahlangkah pengerjaan di atas. Hal-hal yang harus dicatat adalah : a. karakteristik data yang digunakan oleh setiap atribut. Catat karakteristik data di tabel di bawah ini : Nama Atribut Outlook Name : outlook Type : nominal Missing : 0(0%) Distinct : 3 Karakteristik Data

Nama Atribut

Karakteristik Data

Unique : 0 (0%) Temperature Humidity Windy Play ... ... ... ...

b. Bandingkan dengan isi file weather.arff di bawah ini : @relation weather @attribute outlook {sunny, overcast, rainy} @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,yes rainy,70,96,FALSE,yes rainy,68,80,FALSE,yes rainy,65,70,TRUE,no overcast,64,65,TRUE,yes sunny,72,95,FALSE,no sunny,69,70,FALSE,yes rainy,75,80,FALSE,yes sunny,75,70,TRUE,yes overcast,72,90,TRUE,yes

overcast,81,75,FALSE,yes rainy,71,91,TRUE,no Apa yang dinamakan type nominal? Type numeric? Apa yang dapat Anda simpulkan? c. Capture gambar pohon yang terbentuk ! d. Berdasarkan hasil eksperimen Anda, atau di gambar 5, tuliskan aturan yang terbentuk e. Berapa % instances yang bisa diklasifikasikan dengan benar? Dan berapa % instances yang tidak bisa diklasifikasikan dengan benar? 2. Lakukan klasifikasi dengan data labor.arff, sesuai dengan langkahlangkah pengerjaan di atas. File labor.arff berisi daftar kontrak kerja 57 karyawan. Ada dua kelas di data tersebut, yaitu bad dan good. Good menandakan kontrak kerja yang bagus, sedangkan bad sebaliknya. Hal-hal yang harus dicatat adalah : d. Capture gambar pohon yang terbentuk di. Tulis aturan yang dihasilkan Berapa % instances yang bisa diklasifikasikan dengan benar? Dan berapa % instances yang

Anda mungkin juga menyukai