Presentasi

Anda mungkin juga menyukai

Anda di halaman 1dari 23

INFORMATION RETRIEVAL

Data Clasification

Dipresentasikan Oleh:
I Gede Bendesa Subawa
PROGRAM STUDI ILMU KOMPUTER
PROGRAM PASCASARJANA
UNIVERSITAS PENDIDIKAN GANESHA
2017
REVIEW ARTIKEL / JURNAL

Klasifikasi Data Forum dengan menggunakan


Metode Nave Bayes Classifier
Aida Indriani
Program Studi Teknik Informatika, STMIK PPKIA Tarakanita Rahmawati
Jl. Yos Sudarso 8 Tarakan, Indonesia
ditamaniez2014@gmail.com
LATAR BELAKANG
Adanya keterbatasan antara mahasiswa dan dosen dalam komunikasi
lansung (tatap muka) sehingga solusi yang ditawarkan untuk mengatasi hal
tersebut adalah dengan membuat sebuah forum diskusi online.
Didalam forum itu sendiri terdapat beberapa kelas (kategori) dengan
tujuan untuk memudahkanmahasiswa dalam mencari informasi terkait dengan
tugas-tugas matakuliah maupun dalam pembuatan skripsi/tugas akhir. Untuk
menghasilkan pengkategorian data forum yang tepat yaitu dengan melakukan
proses klasifikasi terhadap pertanyaan atau pernyataan yang dituliskan oleh
pengguna.
METODOLOGI
Pre-Processing (digunakan untuk membangun sebuah index dari koleksi
dokumen).
> Tokenisasi, Penghapusan Stop Word, Stemming, dan Indexing Text
Nave Bayes Clasification
metode klasifikasi yang berdasarkan probabilitas dan teorema Bayesian
dengan asumsi bahwa setiap variable X bersifat bebas (independence). Dengan
kata lain, NBC mengansumsikan bahwa keberadaan sebuah atribut (variable)
tidak ada kaitannya dengan keberadaan atribut (variable) yang lain.
> Tahap Pelatihan dan Tahap Klasifikasi
Confusion Matrix
Confusion matrix adalah sebuah tabel yang menyatakan jumlah data uji
yang benar diklasifikasikan dan jumlah data uji yang salah diklasifikasikan.
DATA LATIH
No Data Forum Kelas
Dokumen 1 Bagaimana cara membuat Galeri Image pada Eclipse Android

Dokumen 2 Ada yang tau gak cara membuat koneksi pada Delphi Delphi
dengan MysQL
Dokumen 3 Saya kesulitan dalam membuat Mailmerge pada Ms. Office
Word, bagaimana caranya ya?
Dokumen 4 Membuat fungsi Sum pada Ms. Excel seperti apa ya? Office

Dokumen 5 Bagaimana cara menghilangkan warning pada Android Android

Dokumen 6 Bagaimana membuat form cetak dengan Delphi Delphi


HASIL DAN PEMBAHASAN
a. Tokenizazi Dokumen
No Data Forum Kelas
Dokumen 1 bagaimana cara membuat galeri image pada eclipse Android

Dokumen 2 ada yang tau gak cara membuat koneksi pada delphi Delphi
dengan mysql
Dokumen 3 saya kesulitan dalam membuat mailmerge pada ms word, Office
bagaimana caranya ya
Dokumen 4 membuat fungsi sum pada ms excel seperti apa ya Office

Dokumen 5 bagaimana cara menghilangkan warning pada android Android

Dokumen 6 bagaimana membuat form cetak dengan delphi Delphi


HASIL DAN PEMBAHASAN
b. Filtering Dokumen
No Data Forum Kelas
Dokumen 1 galeri image eclipse Android
Dokumen 2 koneksi delphi mysql Delphi
Dokumen 3 Kesulitan mailmerge ms word Office

Dokumen 4 fungsi sum ms excel Office


Dokumen 5 menghilangkan warning android Android
Dokumen 6 form cetak delphi Delphi
HASIL DAN PEMBAHASAN
c. Stemming Dokumen
No Data Forum Kelas
Dokumen 1 galeri image eclipse Android
Dokumen 2 koneksi delphi mysql Delphi
Dokumen 3 sulit mailmerge ms word Office

Dokumen 4 fungsi sum ms excel Office


Dokumen 5 hilang warning android Android
Dokumen 6 form cetak delphi Delphi
HASIL DAN PEMBAHASAN
d. Indexing Data
Term Dokumen 1 Dokumen 2 Dokumen 3 Dokumen 4 Dokumen 5 Dokumen 6
galeri 1
image 1
eclipse 1
koneksi 1
delphi 1
mysql 1
sulit 1
mailmerge 1
ms 1 1
word 1
function 1
sum 1
excel 1
HASIL DAN PEMBAHASAN
d. Indexing Data
Term Dokumen 1 Dokumen 2 Dokumen 3 Dokumen 4 Dokumen 5 Dokumen 6
hilang 1
warning 1
android 1
form 1
cetak 1
delphi 1
HASIL DAN PEMBAHASAN
e. Nave Bayes Clasification

Probabiliti dirumuskan sebagai berikut :


() jumlah masing-masing kelas dokumen
p(V)= = pada data latih (V) adalah:
() Dimana
Kelas Android = 2
Kelas Office = 2
Kelas Delphi = 2
Peluang masing kelas Total data latih (n) = 6
2
p android = = 0,33
6
2
p Office = = 0,33 Sehingga
6
2
p Delphi = = 0,33
6
HASIL DAN PEMBAHASAN
e. Nave Bayes Clasification
Term Android Office Delphi Term Android Office Delphi
galeri 1 hilang 1
image 1 warning 1
eclipse 1 android 1
koneksi 1 form 1
delphi 1 cetak 1
mysql 1 delphi 1
sulit 1 Jumlah
(n)
6 8 6
mailmerge 1
ms 2
word 1
function 1
sum 1
excel 1
HASIL DAN PEMBAHASAN
f. Data Testing
No Data Forum Kelas
Dokumen 7 Tolong dong, gimana membuat daftar isi secara ?
otomatis dengan Ms. Word.
Dokumen 8 Bingung nich, cara memasukkan gambar pada ?
eclipse dan bagaimana menjalankan aplikasi
androidnya.
HASIL DAN PEMBAHASAN
g. Pre- Processing Data Testing
No Data Forum Kelas
Dokumen 7 daftar isi otomatis dengan ms word ?
Dokumen 8 masuk gambar eclipse jalan aplikasi android ?
HASIL DAN PEMBAHASAN
h. Klasifikasi

a
Langkah pertama yaitu menentukan peluang masing-masing term uji ( i) di tiap kelas

v
( j) dgn rumus:
c+mp( i)
P(i|j) =
+

P(i|j) = Peluang term j pada kelas i


nc = jumlah term j pada kelas i
m = jumlah seluruh term
n = jumlah dokumen latih
HASIL DAN PEMBAHASAN
h. Klasifikasi

c+mp(i) 0 + 5 0.33
(i|j) = dimana P = = 0.15
+ 6+5

0 + 5 0.33
m=5 P = = 0.15
6+5
p(i) = p(android) =0.33
Jumlah term Kelas Android (n) = 6 0 + 5 0.33
P = = 0.15
Jumlah term pada Kelas Android: 6+5
nc(daftar) = 0 0 + 5 0.33
nc(isi) = 0 SEHINGGA P = = 0.15
6+5
nc(otomatis) = 0
0 + 5 0.33
nc(ms) = 0 P = = 0.15
6+5
nc(word) =0
HASIL DAN PEMBAHASAN
h. Klasifikasi

c+mp(i) P =
0 + 5 0.33
= 0.15
(i|j) = dimana 6+5
+
0 + 5 0.33
m=5 P = = 0.15
6+5
p(i) = p(office) =0.33
Jumlah term kelas Office(n) = 8 P =
0 + 5 0.33
= 0.15
Kemunculan term pd Kelas Office 6+5
nc(daftar) = 0 2 + 5 0.33
nc(isi) = 0 SEHINGGA P = = 0.28
8+5
nc(otomatis) = 0
nc(ms) = 2 1 + 5 0.33
P = = 0.21
nc(word) =1 8+5
HASIL DAN PEMBAHASAN
h. Klasifikasi

c+mp(i) 0 + 5 0.33
P = = 0.15
(i|j) = dimana 6+5
+
0 + 5 0.33
m=5 P = = 0.15
6+5
p(i) = p(office) =0.33
0 + 5 0.33
Jumlah term kelas Delphi(n) = 6 P = = 0.15
6+5
Kemunculan term pd Kelas Delphi
nc(daftar) = 0 0 + 5 0.33
SEHINGGA P = = 0.15
nc(isi) = 0 6+5
nc(otomatis) = 0
0 + 5 0.33
nc(ms) = 0 P = = 0.15
6+5
nc(word) =0
HASIL DAN PEMBAHASAN
h. Klasifikasi

untuk menentukan klasifikasi pada data uji, digunakan persamaan:

Sehingga:
V(Android) = 0,33*0,15*0,15*0,15*0,15*0,15 = 0,000026
V(Delphi)=0,33*0,15*0,15*0,15*0,15*0,15 = 0,000026
V(Office)=0,33*0,13*0,13*0,13*0,28*0,21=0,000040
HASIL DAN PEMBAHASAN
h. Klasifikasi

Vnb = argmax ( v(android) | v(delphi) | v(office))


Vnb = argmax ( 0,000026 | 0,000026 | 0,000040)
Vnb = 0,000040

Nilai maksimal yang diperoleh yaitu 0,000040. 0,000040 nilai


v untuk kelas Office. Jadi kesimpulan yang diperoleh adalah
data uji Dokumen 7 termasuk kelas Office.Untuk data uji
Dokumen 8 dan seterusnya dilakukan proses yang sama seperti
pada data uji Dokumen 7.
HASIL DAN PEMBAHASAN
i. Confusion Matrix

Dari 15 dokumen uji bisa dbuat


Confusion Matrix sebagai berikut:

Berdasarkan tabel diatas diketahui


jumlah dokumen yang berhasil
=
diklasisifikasi dengan tepat sebanyak 11
dokumen (D7, D8, D10, D11, D12, D14,
= % = . % = % .
D15, D17, D18, D19, D21) sehingga
akurasi keberhasilannya dihitung sbb:
KESIMPULAN
1. Penggunaan metode NBC dapat digunakan untuk
pengklasifikasian otomatis terhadap data forum dengan
tingkat akurasi klasifikasi sebesar 73% dengan
menggunakan pengukuran efektifitas Confusion Matrix.
2. Untuk pengembangan lebih lanjut, dapat menambahkan
fitur-fitur khusus dalam tokenisasi kalimat dengan
menggunakan Bi-gram atau gabungan Uni-gram dan
Bigram sehingga mendapatkan hasil klasifikasi dengan
akurasi yang lebih tinggi.
TERIMA KASIH

Anda mungkin juga menyukai