Eksplorasi WEKA Sebagai Tools Untuk Analisis Pengetahuan

13508003 Ikmal Syifai
IF3054 Intelegensi Buatan Eksplorasi WEKA Sebagai Tools Untuk Analisis Pengetahuan
1. Buatlah file input WEKA untuk data WillWait!
@relation WillWait @attribute @attribute @attribute @attribute @attribute @attribute @attribute @attribute @attribute @attribute Alt {T,F} Bar {T,F} Fri {T,F} Hun {T,F} Pat {Some,Full,None} Price {$,$$,$$$} Rain {T,F} Res {T,F} Type {French,Thai,Burger,Italian} Est {0-10,30-60,10-30,>60}
@data T,F,F,T,Some,$$$,F,T,French,0-10,T T,F,F,T,Full,$,F,F,Thai,30-60,F F,T,F,F,Some,$,F,F,Burger,0-10,T T,F,T,T,Full,$,F,F,Thai,10-30,T T,F,T,F,Full,$$$,F,T,French,>60,F F,T,F,T,Some,$$,T,T,Italian,0-10,T F,T,F,F,None,$,T,F,Burger,0-10,F F,F,F,T,Some,$$,T,T,Thai,0-10,T F,T,T,F,Full,$,T,F,Burger,>60,F T,T,T,T,Full,$$$,F,T,Italian,10-30,F F,F,F,F,None,$,F,F,Thai,0-10,F T,T,T,T,Full,$,F,F,Burger,30-60,T
2. Jelaskanlah perbedaan untuk setiap test-option! 1. Use training set Classifier dilatih dengan sebuah kelas instance dan akan dites seberapa baik classifier mengklasifikasikan instance tersebut. 2. Supplied test set Classifier dilatih dengan sebuah kelas instance dan akan dites seberapa baik classifier mengklasifikasikan instance lain yang ditentukan oleh user. 3. Cross-validation Classifier akan dites menggunakan cross-validation menggunakan jumlah folds yang diinput user. 4. Percentage split Classifier akan dites seberapa baik classifier mengklasifikasikan sebesar persen tertentu dari data. Nilai persentase ditentukan user. 3. Sebutkanlah nama teknik yang sesuai dengan k-NN, Naive Bayes, dan Decision Tree yang sudah dipelajari, dan jelaskanlah setiap parameter yang disediakan untuk setiap teknik tersebut! 1. k-NN Nama pada WEKA: weka.classifiers.lazy.IBk Parameter: KNN: Jumlah neighbours yang akan digunakan. crossValidate: Apakah hold-one-out cross-validation akan digunakan untuk memilih k value terbaik. debug: Apakah classifier akan mengeluarkan info tambahan ke konsol.
13508003 Ikmal Syifai distanceWeighting: Metode yang digunakan pada distance weighting. meanSquared: Apakah error rata-rata kuadrat akan digunakan dibanding error rata-rata absolut saat melakukan cross-validation untuk masalah regresi. nearestNeighbourSearchAlgorithm: Algoritma pencarian nearest neighbour yang digunakan (Default: weka.core.neighboursearch.LinearNNSearch). windowSize: Jumlah maksimal instance yang dibolehkan dalam training pool. Penambahan instance baru yang melewati batas tersebut akan menyebabkan pengeluaran instance lama. Nilai 0 menyatakan tidak ada batas untuk jumlah instance. 2. Nave Bayes Nama pada WEKA: weka.classifiers.bayes.NaiveBayes Parameter: debug: Apakah classifier akan mengeluarkan info tambahan ke konsol. displayModelInOldFormat: Apakah akan menggunakan format lama untuk keluaran model. useKernelEstimator: Apakah akan menggunakan kernel estimator untuk antribut numerik dibanding distribusi normal. useSupervisedDiscretization: Apakah akan menggunakan supervised discretization untuk mengonversi atribut numerik ke nominal. 3. Decision Tree Nama pada WEKA: weka.classifiers.trees.J48 Parameter: binarySplits: Apakah akan menggunakan binary splits pada atribut nominal pada saat membangun pohon. confidenceFactor: Faktor confidence yang digunakan untuk pruning (nilai yang semakin kecil akan menyebabkan lebih banyak pruning). debug: Apakah classifier akan mengeluarkan info tambahan ke konsol. minNumObj: Minimum jumlah instance per daun. numFolds: Menentukan jumlah data yang digunakan untuk reduced-error pruning. reducedErrorPruning: Apakah reduced-error pruning akan digunakan dibanding C.4.5 pruning. saveInstanceData: Apakah akan menyimpan data latihan untuk visualisasi. seed: Jumlah seed yang digunakan untuk merandomisasi data saat reduced-error pruning digunakan. subtreeRaising: Apakah akan mempertimbangkan subtree raising operation saat pruning. Unpruned: Apakah pruning sudah dilakukan. useLaplace: Apakah menghitung daun berdasarkan Laplace.
13508003 Ikmal Syifai 4. Lakukan setiap skema pada test-option untuk ketiga teknik tersebut! 1. kNN
Gambar 1 Use Training Set
Gambar 2 Cross-Validation Folds 10
Gambar 3 Percentage Split 66%
13508003 Ikmal Syifai 2. Nave Bayes
13508003 Ikmal Syifai 3. Decision Tree
13508003 Ikmal Syifai 5. Buatlah kesimpulan dari eksplorasi ini! 1. Metode yang paling optimal untuk data set WillWait adalah kNN. 2. Penggunaan test option Cross-Validation menyebabkan error terbanyak.

Eksplorasi WEKA Sebagai Tools Untuk Analisis Pengetahuan

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Eksplorasi WEKA Sebagai Tools Untuk Analisis Pengetahuan

Diunggah oleh

Hak Cipta:

Format Tersedia

13508003 Ikmal Syifai

Gambar 1 Use Training Set

Gambar 2 Cross-Validation Folds 10

Gambar 3 Percentage Split 66%

13508003 Ikmal Syifai 2. Nave Bayes

Gambar 4 Use Training Set

Gambar 5 Cross-Validation Folds 10

Gambar 6 Percentage Split 66%

13508003 Ikmal Syifai 3. Decision Tree

Gambar 7 Use Training Set

Gambar 8 Cross-Validation Folds 10

Gambar 9 Percentage Split 66%

Anda mungkin juga menyukai