Dosen Pengasuh
Dr. Taufik Fuadi Abidin, M.Tech
Dr. Muhammad Subianto, M.Si
{tfa,subianto}@informatika.unsyiah.ac.id
PENDAHULUAN
Ada dua proses penting yang dilakukan saat melakukan klasifikasi. Proses yang pertama
adalah learning (training) yaitu proses pembelajaran menggunakan training set. Untuk kasus
Nave Bayesian Classifier, perhitungan probabilitas dari data berdasarkan data pembelajaran
dilakukan. Proses yang kedua adalah proses testing yaitu menguji model menggunakan data
testing. Gambar berikut memperlihatkan alur dari kedua proses tersebut.
Materi praktikum ini berkaitan dengan metode Naive Bayesian Classifier. Naive Bayesian
Classifier adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayesian
dengan asumsi bahwa setiap variabel X bersifat bebas (independent). Dengan kata lain, Nave
Bayesian Classifier mengansumsikan bahwa keberadaan sebuah atribut (variabel) tidak ada
kaitannya dengan beradaan atribut yang lain.
Jika diketahui X adalah data sampel dengan klas (label) yang tidak diketahui, H merupakan
hipotesa bahwa X adalah data dengan klas (label) C, P(H) adalah peluang dari hipotesa H,
P(X) adalah peluang data sampel yang diamati, maka P(X|H) adalah peluang data sampel X,
bila diasumsikan bahwa hipotesa H benar (valid).
Karena asumsi atribut tidak saling terkait (conditionally independent), maka P(X|Ci) dapat
didekati dengan cara:
n
P XCi = P x kC i
k=1
Jika P(X|Ci) diketahui maka klas dari data sampel X dapat didekati dengan menghitungg P(X|
Ci)*P(Ci). Klas Ci dimana P(X|Ci)*P(Ci) maksimum adalah klas dari sampel X.
KEGIATAN PRAKTIKUM
1. Pahami data contact-lense.arff yang disimpan dalam direktori data dimana aplikasi Weka
di install. Data contact-lense.arff memiliki 4 atribut nominal (categorical) dan 1 klas
label yang menerangkan apakah seseorang menggunakan hard contact lenses, soft
contact lenses, atau tidak perlu menggunakan contact lenses.
Buka file arff tersebut dengan menggunakan text editor (gedit, textpad atau vim) dan
pelajari bagaimana data dalam format arff disusun. Perhatikan penjelasan di bagian atas
file tersebut dan perhatikan pula bagian deklarasi seperti potongan pernyataan berikut:
@relation contact-lenses
@data
%
% 24 instances
%
young,myope,no,reduced,none
young,myope,no,normal,soft
young,myope,yes,reduced,none
:
:
- - - Happy Mining - - -