Anda di halaman 1dari 10

4rg

tm
'v/;----7-
'7 *a
3dr-
*%.
PERAN PENGEMBANGAN
APLIKASI TEKNOLOGI INFORMASI
DALAM BIDANG ENERGI DAN MANUEAKTUR
r
t
i
DEWAN REDAKSI
KETUA
Dr.Eng. Anggit Murdani, ST., M.Eng.
REVIEWERYKOMITE PROGRAM
Prof. Dr. Bambang Riyanto (lTB)
Dr. lr. Syaad Patmanthara (UM)
Hadi Suyono, ST., MT., PhD. (UB)
Dr. lr. Agnes Hanna P., MT.
Dr. lr. R. Edy Punranto, MSc.
Dr. M. Sarosa, Dipl. lng., MT.
Dr. M. Maskan, MSi.
Dr.Eng. Anggit Murdani, ST., M.Eng.
Dr. Andriani Parastiwi, B.SEET, MT.
Dr. Kartika Dewi Sri S., SE, MBA
Ir. Achmad Chumaidi, MT.
Ratih lndri Hapsari, ST., MT., PhD.
KOMITE ORGANISASI
Ratna lka Putri, ST., MT.
Mila Fauziyah, ST., MT.
M. Rifa'i, ST., MT.
Lisa Agustriyana, ST., MT.
Denda Dewatama, ST., MT.
lka Noer Syamsiana, ST., MT.
Fauziah S. CSM., ST., MT.
Haris Puspito Buwono, ST., MT.
Utsman Syah A., ST., MT.
Beauty lka A., ST., MT.
M. Nanak Zakaria, ST., MT.
Haryono
M. Junus, ST., MT.
Rudi Ariyanto, ST., MT.
Usman Zulhijah, AMd.
mg SENTIA 201 3-Politeknik Negeri Malang Volume 5-ISSN:2085-2347
9. SPATIAL ANALYTICAL HIERARCHY PROCESS UNTUK PENENTUAN
KECOCOKAN RUANG TERBUKA HUAU
Sigit Priyantar, Guntur Budi Herwanto2......... .(B-57)
II,TENENTUAN ORIENTASI OPINI MENGGUNAKAN METODE SUPERT'ISED
L&IRNING
hrarn Fahrur Rozil, Banni Satriya A.2, Rudy Ariyanto3 (B-64)
ILIENERAPAN ALGORITMA NAZIEF & ADRIANI PADA PREPROSES SISTEM
IM5GJKURAN TINGKAT KEMIRIPAN JUDUL TUGAS AKHIR DI PROGRAM
fiTTIDI MANAJEMEN INFORMATIKA POLITEKNIK NEGERI MALANG
lLelldfua Rosianir, Dwi Puspitasari2, Banni Satria Andoko3 ........(B-71)
ILMIFIKASI JATUH TEMPO TUNGGAKAN KULIAH MAHASISWA
"TSIS SMS GATEWAY DAN APLIKASI WEB(STUDI KASUS POLITEKNIK
AATA}I NADA SOLMISASI SEBAGAI IDENTIFIKASI MULTI POINT
MN,f-qIS
IYTMF PADA JALA-JALA LISTRIK 22OYI5OHZ
illEffiooor,Hru Sumamo2.. .....(B-81)
PENCARIAN INFORMASI PEKERJAAN (JOBDROID)
rySErAfrlai
r,
Amelia LinggaRizky2, Rani Salidowati
3
.(A-87)
SLEEP STAGES DENGAN FITUR TIME DOMAIN
METODE TIME DEI,AY NEURAL NETWORK
ltsrimingrrm
.....(B-92)
'ASI
E-LIBRARY PADA PERGURUAN TINGGI SEBAGAI SOLUSI
PUSTAKA YANG MURAH DAN MUDAH
BANGUN PERHITUNGAN ANGKA KREDIT BERDASARKA}I
KINERJA DOSEN
Prosiding SENTIA 201 3-Politeknik Negeri Malang Volume 5-ISSN:2085-2347
PENENTUAN ORIENTASI OPINI MENGGUNAKAI\ METODE
SAPERVISED LEARNING
Imam Fahrur Rozir, Banni Satriya A.2, Rudy Ariyanto3
Politeknik Negeri Malang
E-mail : imam.rozi@polinema.ac.idl, ando@oolinerna.ac.id2, ariyantorudy@gmail.com3
Abstraksi
Dalam sistem analisis sentimen (opinion mining), data teks opini akan ditentukan orientasinya, apakah
termasuk ke dalam orientasi negatif atau positif. Proses penentuan orientasi teks opini bisa dipandang sebagai
proses klasifikasi atau kategorisasi dokumen teks. Oleh karena itu, metode yang dapat digunakan untuk
menyelesaikan masalah klasifikasi teks, sebenamya
jula
dapat digunakan
juga
untuk menyelsaikan
permasalahan penentuan orientasi opini. Salahsatu metode yang paling popular digunakan untuk kategorisasi
teks adalah menggunakan strategi Supervised Learning, yaitu menggunakan metode Naive Bayes Classifier
(NBC).Pada penelitian ini, metode NBC tersebut akan diimplementasikan pada sistem analisis sentimen untuk
menentukan orientasi dari suatu kalimat atau teks opini. Sistem yang dibangun akan diujikan pada sekumpulan
teks opini tentang perguruan tinggi, yang telah dikoleksi oleh peneliti dengan menyebarkan kuisioner online.
Proses pengujian ditujukan untuk mengetahui akurasi sistem yang dibangun menggunakan NBC, yaifi dengan
mencari rilai precission dan recall. Dari proses pengujian, didapatkan nilai precission sebesar 0.95 dan recall
sebesar 0.94.
Kata kunci : Opinion Mining, Supervised Learning,NBC
1. Pendahuluan
Pada bagian pendahuluan disajikan latar
belakang dan tujuan penelitian.
1.1. Latar Belakang
Informasi tekstual yang tersebar di dunia ini
tergolong ke dalam 2 kategoi utama yaitLr, fakta
dan opini. Fakta merupakan ekspresi yang bersifat
obyektif atas suatu objek atau entitas, maupun
peristiwa. Berbeda dengan fakta, opini sifatnya
lebih subyektif dan ia mengekspresikan tentang
perasaan, penilaian, pendapat seseorang terhadap
suatu entitas maupun peristiwa
[5].
Mayoritas penelitian yang telah dilakukan
sampai saat ini yang berkenaan dengan pengolahan
informasi teks masih sebatas pada pengolahan data
faktual/fakta, seperti information retrteval, web
search, text clusteing dan beberapa
jenis
lainnya
yang tergolong dalam text mining ataupun natural
language processing lainnya. Masih sedikit
penelitian yang masuk ke bidang opinion mining.
Padahal pengolahan data opini
juga penting. Salah
satu alasan sedikitnya penelitian dalam opinion
mining adalah terbatasnya jumlah informasi
tekstual yang didalamnya terdapat ungkapan opini.
Akantetapi, kemajuan dalam dunia World Wide
Web beberapa tahun terakhir ini telah merubah
kondisi tersebut. WWW telah memfasilitasi manusia
untuk dapat mem-publish ungkapan opini mereka,
baik dalam bentuk blog, forum di inteme! gnp
grup diskusi dan berbagai sosial media/networkiry
yang ada di intemet
[5].
Sumber-sumber informasi
dari internet sangat beragam dan banyak. Hal ini
menyebabkan kesulitan untuk menganilisis opiri
yang tersebar di WWW secara manual. Disinilah
letak relevansi penelitian opinion mining, yaifr
untuk mengembangkan sistem untuk analisis opiri
yang terotomatisasi.
Penelitian ini ditujukan r-ltr*
mengembangkan sistem yang dapat mendet#
orientasi dari suatu dokumen teks
fq
menyatakan opini. Metode yang digunakan ud
membangun sistem penentuan orientasi oeit-
adalah supervised learning, yaitu dengr
menggunakan metode text classifier NBC (Nairc
Bayes Classifier). Permasalahan penenbr
orientasi opini bisa dipandang sebag-
permasalahan klasifikasi atau kategorisasi teks y4
mengelompokkan atau mengklasif,rkasikan t&
opini ke dalam kategori opini positifatau negatif
1.2. Tujuan Penelitian
Penelitian ini ditujukan ud
mengembangkan sistem deteksi orientasi opil
(penentuan apakah suatu teks opini termasuk qr-
negatif atau positif), dengan menggunakan NH
sebagai salah satu metode supervised learning-
B-63
Prosiding SENTIA 201 3-Politeknik Negeri Malang
2. Kajian Pustaka
Untuk pustaka pendukung, disajikan secara
ringkas mengenai opinion mining dan NBC.
2.1. Hasil Penelitian Terkait
Penelitian tentang opinion mining mulai
marak setelah Tumey melakukan penelitian tentang
opinion mining yang diterapkan pada data review
konsumen suatu produk menggunakan Semantic
Orientation-Pointwise Mutual Information (SO-
PMI), dengan nilai akurasi terbaik yang didapat
adalah 84Yo rxtfiik review kendaraan dan 66% untuk
data review film
[8].
Pada tahun yang sama, Pang
dkk. mengambangkan sistem opinion mining
menggunakan metode machine learning, dengan
nilai akurasi berkisar 72Yo sampai 83%
t7).
Penelitian tentang penggunaan Naive Bayes
Classifier sebagai metode pengklasifikasi teks telah
dilakukan oleh SM Kamaruzzaman dan Chowdury
Mofizur Rahman
[2]
serta Ashraf M Kibriya dkk.
[3]
pada tahun 2004. Dari proses pengujian secara
kualitatif disebutkan bahwa teks bisa
diklasifikasikan dengan akurasi yang tinggi.
2.2. Opinion Mining
Opinion mining atau sentiment analysis
(sebagian besar peneliti menganggap dua istilah
ini sama) merupakan sebuah cabang dari text
mining yang mulai marak pada awal tahun 2002.
Riset pada bidang ini mulai berkembang semenjak
paper dari Bo Pang dan L.Lee diterbitkan
[7].
Secara umurn, sentiment analysis dibagi menjadi 2
kategori
[1]:
l. Coarse-grained SentimentAnalysis
2. Fined-grained SentirnentAnalysis
Coarse-grained Sentiment Analysis
melakukan proses analisis pada level dokumen.
Artinya, proses klasifikasi opini berdasarkan isi
dokumen secara keseluruhan (berada pada level
dokumen). Orientasi ini ada 2 jenis yaitu positif dan
negatif. Akan tetapi, ada
juga yang menjadikan
nilai orientasi ini bersifat kontinu / tidak diskrit.
Fined-grained Sentiment Analysis
melakukan analisis opini pada level kalimat, bukan
pada level dokumen. Artinya, opini akan
diklasifikasikan per kalimat. Contoh :
o
Saya tidak suka pemrograman. (negatif)
r
Hotel yang baru saja dikunjungi sangat indah
sekali. (positifl
Hingga sekarang, hampir sebagian besar
penelitian di bidang analisis sentimen hanya
ditujukan untuk bahasa Inggris karena tools dan
resource untuk bahasa Inggris sangat banyak.
Beberapa sumberdaya yang sering digunakan
untuk sentiment analysis adalah SentiWordNet dan
WordNet. Analisis sentimen terdiri dari 3
subproses besar
[5].
Masing-masing subproses ini
bisa dijadikan bahan/topik riset secara terpisah
Volume 5-ISSN:2085-2347
karena masing-masing subproses ini membutuhkan
teknik yang tidak mudah
1. Document Subjectivity: proses menentukan
kalimat yang merupakan opini atau kalimat
yang mengandung nuansa sentimen.
2. Opinion Orientation: proses menentukan
orientasi opini, apakah suatu kalimat opini
termasuk ke dalam kategori atau klasifikasi
positifatau negatif.
Opinion Holder and Target Detection: proses
menentukan subyek yang mengemukakan kalimat
opini tersebut dan menentukan objek yang menjadi
target dari sentimen atau opini.
'
2.3. Naive Bayes Classifwr (NBC)
Nai've Bayes Classifier (NBC) merupakan
algoritma yang bisa digunakan untuk
menyelesaikan masalah klasifikasi atau kategorisasi
dengan menggunakan metode probablistik. Pada
penelitian ini NBC digunakan pada proses
klasifikasi opirtt (opinion orientation detection),
apakah opini termasuk klasifikasi positif atau
negatif. Prinsip dari NBC adalah probabilitas suatu
kata akan masuk ke dalam suatu kategori (posterior
probability), didasarkan pada nilai probabilitas
tertinggi yang telah dimiliki sebehmnya (pior
probability) yang dimiliki teks yang bersangkutan
untuk suatu ketegori tertentu. Misalnya kata
"processor" pada koleksi data memiliki probabilitas
untuk kategori "komputer" sebesar 0.9, sedangkan
untuk kategori "elektronik" sebesar 0.3. Sehingga
kalau pada proses pengujian ditemukan kata
"processor" maka akan masuk ke dalam kategori
"komputer". Dengan kata lain, NBC menggunakan
asumsi bahwa kemunculan atau ketidakmunculan
dari suatu kata atau fitur tidak terkait dengan
kemunculan atau ketidakmunculan fitur yang lain
14).
Sebagai ilustrasi, misal data training
dikategorikan menjadi /r kategori Ci
= {Ct
Cz,
Ca...,C*]
,
dan prior probability untuk masing-
masing kategori adalah p(C), dimanal
=
7,2,3,...,k.
Koleksi data disimbolkan di
=
(wt,..,wy...wn), dan kata atau fitur yang ada dalam
dokumen adalah w1, dimana j
=
7,2,3,...m, akan
masuk kedalam kategori Cy Untuk
mengklasifikasikan dokumen di, dilakukan dengan
menghitung nilai probabilitas dari semua dokumen
(po s terio r prob ability). P os terior pro b ability suaht
dokumen pada suatu kategori dapat dihitung
dengan menggunakan persamaan (l)
t6l,
p[til*iti
-
rirt'1r'ihrir"ri
(1)
F f.l.J
Keterangan:
. p[LJ'lnli] :
posterior probability yang
menunjukkan probabilitas suatu kategori T;,
ketika diberikan dokumen sli
B-64
Prosiding SENTIA 20 I 3-Politeknik Negeri Malang
. p[d.ilt'j] = likelihood probability yans
menunjukkan probabilitas dokumen
oli
ketika
diberikan kategori L;
. p[ilj]: prior probability yang menunjukkan
probabilitas suatu kategori t';
.
P(d")
:
probabilitas suatu dokumen
dji
Klasifikasi teks menggunakan NBC
dilakukan dengan memaksimalkan nilai dari
persamaan (l). Karena untuk semua kategori yang
diberikan, nilai penyebut
P(ttr') bernilai sama atau
konstan, maka bisa dihilangkan dari persamaan.
Sehingga persamaan untuk menghitung nilai
maksimal dari persamaan (l) menjadi persamaan
(2)
I6t.
m{?r
/_r-a
rna.Y
/.r_\ Q)
Ct c.c.e[fild!] cr tr f
p[tltl{'}p(Cr}
Berdasarkan pada hipotesis Bayesian yang
menyebutkan bahwa setiap kata atau frfix w6 .-. wi
..., w, dari di: wt, ... wi ..., w, adalah tidak saling
terkait, maka dishibusi probabilitas total
merupakan hasil perkalian (product) dari distribusi
probabilitas tiap fitur atau kata, seperti ditunjukkan
pada persamaan (3).
p(drlfr) p(rsr,.-,ui.."..r,r*lq]
IN
tz p[,u,lE] (3)
i1
Dengan memasukkan persamaan (3) ke persamaan
(2), maka persamaan (2) menjadi,
tttcr
-
rnfl.t
!n
q trcplcrldr} Ci c{
p(cri.n.,.u[n,lf1]
i1
(4)
Persamaan (4) ini yang disebut sebagai Formula
Pengklasifikasi. Nilai (Ci) dapat dihitung
menggunakan persamaan
p(e;]:F (5)
Keterangan:
.
j[+ : jumlah
dokumen yang masuk
kedalam kategori L;
. ,\r:iumtah
total dokumen.
Sedangkan untuk menghitung nilai p(ffj
JC;)
auput
dihitung menggunakan persamaan,
P(tr,;ltri) -
"":i;:t
(6)
t\"+tf
Keterangan:
. i$-.r*, : jumlah
kata 14 yang ada dalam
dokumen training yang masuk ke dalam
kategori
Q,
. IJ. : jumlah
semua kata yang ada dalam
dokumen training yang masuk kedalam kategori
L; (tanpa menghiraukan ada kata yang sama
atau tidak),
Volume 5-ISSN:2085-2347
c
Y
: jumlah
total
jenis
kata yang ada dalam
dokumen training (kata yang sama hanya
dihitung 1).
Jika dalam dokumen training tidak ditemukan kata
rt pada kategori C;, maka nilai "r\t*r menjadi 0.
Untuk menghindari nilai 0 maka pembilang
ditambahkan l, ini yang disebut laplace smothing
16l.
2.4. Metode Evaluasi Precrbsion llaa RecaA
Dua buah teknik evaluasi unjuk kerja sistem,
yang biasanya digunakan pada sistem temu kembali
(information retrieval), sistem pengenalan pola,
ataupun sistem kategorisasi teks adalah precision
dan recall.
Precision adalah rasio
jumlah
dokumen
relevan yang ditemukan dengan total
jumlah
dokumen yang ditemukan oleh sistem. Recall
adalah rasio jumlah
dokumen relevan yang
ditemukan kernbali dengan total
jumlah
dokumen
dalam kumpulan dokumen yang dianggap relevan.
Nilai keduanya biasanya ditunjukkan dalam satuan
persen (%). Persamaan wfiitk precision ditunjukkan
pada persamaan (7) dan recall pada persamaan (8)
t6l.
Ji ltr.r rl tsG I {
rr ii }rr rl
:,1i
ll,f #lri :.tt lfuti: I r :
iA.!-.:-r fif,
JiiIf u iri[{ Jlli ntu-trii:
f5(relermn
I
tiitenlukcn)
(7)
h rr Slrt*tr i\r'.S,'44'ua'- >urrq r.{iridru*{rrri
trrr...-.ri:----
.i
;.adlrlli lt':iu tu.!i aL:trirril
FI dirernu&mn
]
r* fa unn)
(8)
Kedua persamaan tersebut, dapat lebih
disederhanakan dengan memperhatikan Tabel 1.
Tabel L. Variabel untuk perhitungan precision dan
.
recall
Sehingga rumus precision dan recall
seperti pada persamaan (9) dan (10).
i$ tpl[qr I
fp]
"E
fp/lf.u I
rdfl]
menjadi
(e)
(10)
3. Metode Penelitian
Pada bagian ini akan diuraikan metode yang
digunakan rmtuk mengembangkan sistem.
3.1 Data
Data yang digunakan dalam penelitian ini
berupa data teks yang menyatakan opini seseorang.
Peneliti mengumpulkan data tersebut dengan
B-65
Prosiding SENTIA 20 I 3 -politeknik
Negeri Malang
menggunakan kuisioner online. Data tersebut bisa
diklasifikasikan
menjadi 2, yaitu:
.
?ata
training: data ini berupa data opini
dalam bentuk teks yang digunakan daiam
proses training sistem. Dari proses training,
NBC akan mendapatkan
model probabilistik
dari distribusi kata atas suatu kategori.
.
Data testing: data ini juga
berupa data opini
berbentuk teks, yang digunakan pada proses
pengujian.
Model probabilistik
yang
didapatkan dari proses training, akan
digunakan untuk mengklasifikasikan
teks
yang ada pada data testing.
3.2 Metode Pengolahan Data
.
NBC secara global terbagi atas 2 tahap yaitu
ylay tlainins dan tahap klasifikasi.
proses
tiaining
dilakukan terhadap kumpulan
data yang
sebelumnya sudah diklasifikasikan
secara manual
oleh peneliti. Dari proses training akan dihasilkan
model probabilitas/distribusi
kata tiap klasifikasi.
Algoritma proses training NBC digambarkan pada
flowchartpada Gambar l.
Volume S-ISSN:2085-2347
Gambar l. Flowchart TrainingNBC
Data hasil training tersebut akan dijadikan
acuan untuk menentukan
suatu dokumen teks
termasuk ke dalam kategori tertentu (proses
klasi{ikasi).
Algoritma klasifikasi ditunjukan pada
Gambar 2. Tabel 2 menunjukkan ilustrasi proses
klasifikasi teks.
Table 2. Ilustlasi Klasifikasi Teks
B-66
Prosiding SENTIA 201 3-Politeknik Negeri Malang
33 Tools
Beberapa tools yang digunakan oleh peneliti
untuk membangun sistem ini antara lain:
o
Bahasa pemrograman yang digunakan untuk
membangun sistem adalah Java Enterprise
Edition. JEE digunakan karena sistem
direancang sebagai aplikasi berbasis web.
o
Database Management System yang
digunakan adalah MySQL 5.5. Database
digunakan untuk menyimpan data training
dan data testing.
Volume 5-ISSN:2085-2347
3.4 Metode Pengujian
Pengujian ditujukan untuk mengetahui
akurasi sistem untuk mengelompokan teks opini ke
dalam klasifikasi positif atau negatif. Metode
pengujian yang digunakan adalah dengan mencari
nilai precission dan recall.
4. Hasil dan Pembahasan
Pengujian pada peneilitian ini ditujukan
untuk mengetahui akurasi sistem dalam
mengklasifikasikan orientasi suatu opini, apakah
termasuk ke dalam klasifikasi opini positif atau
opini negatif. Pengujian opinion orientation
menggunakan dataset vrtttk training berupa koleksi
data opini yang telah diklasfikasikan secara manual
ke dalam kategori opini positif dan negatif,
sebanyak 575 data. Setelah proses training,
kemudian sistem diujikan pada. 87 data teks opini.
Data-data tersebut dikumpulkan oleh peneliti
melalui krlisioner o n lin e.
Tabel 3 menunjukan beberapa contoh data
training.
Tabel 3. Contoh Data Trai
Tabel 4 menunjukan beberapa contoh data
yang digunakan pada proses pengujian, yang akan
diklasifikan orientasi opininya, apakah termasuk
opini positif atau negatif.
I Banyak komputer lab yang
rusak
negatif
2 Beberapa matakuliah sering
kosons
negatif
J Beruntung saya bisa kuliah
disini
positif
4 Beberapa dosen sering molor
atau kosons
negatif
5 Konten materi sudah cukup Positif
teksuii
=
inputteks yang
akan dicai orientasinya
lmp E indeksltoken][oriefitasi] +1 /
iumTokenP6of eNasilo]intasfl+lumTol(af t
Gambar 2. Flowchart Klasifikasi NBC
B-67
Prosiding SENTIA 201 3-Politeknik Negeri Malang
Tabel 5 menunjukan niali precission dan recall
setelah proses pengujian. Dari Tabel 5 nilai
precission dan recall sebagai berikut:
Precission
= 60 / (60+3)
:
0.95
Recall
:
60 I (60+4)
:
0.94
Volume 5-ISSN:2085-2347
digolongkan ke dalam opini negatif. Nilai recall
didapatkan dari perbandingan
antara jumlah
dokumen yang ditentukan relevan oleh sistem dan
peneliti, dengan jumlah jumlah
semua dokumen
yang dinyatakan relevan oleh peneliti (meskipun
tidak ditemukan relevan oleh sistem).
Nilai precision dan recall yang didapatkan
dari proses pengujian sangat tinggi, yaitu masing-
masing 0.95 dan 0.94 dai skala l. Hasil ini yang
didapatkan dengan menerapkan data training dan
data testing yang dimiliki oleh peneliti.
Pada sistem ini, sebelum data diolah
menggunakan NBC, tidak di preproses
menggnnaan stemming ataruipu,n stopword removing.
Karena dimungkinkan apabila dilakukan preproses,
akan ada informasi yang hilang (seperti kata negasi,
kata sambung dsb), yang akan berpengaruh pada
akurasi sistem.
5. Kesimpulan
Sistem penentuan orientasi opini yang
dikembangkan oleh peneliti dengan menggunakan
NBC, yang diterapkan pada 575 data training dan
87 data testing, memiliki akurasi yang cukup tinggi.
Hal ini bisa ditunjukan dari nilai precission 0.95
dan nilai recall 0.94.
6. Saran
NBC mengelompokan dokumen teks ke
dalam beberapa klasifikasi berdasarkan dishibusi
kemunculan kata dari teks dalam suatu klasifikasi.
Hubungan antar kata dalam suatu teks tidak
diperhitungkan. Pada kasus analisis sentimen
sebenarnya hubungan kata dengan kata lain perlu
diperhitungkan. Penelitian selanjutnya bisa
mengkombinasikan
atau membandingkan antara
metode supervised learning dan unsupervised
learning (menggunakan
orientasi semantik).
Daftar Pustaka
Fink, R. Clayton. 2011. Coarse- and Fine-Grained
Sentiment Analysis of Social Media Text. Johns
Hopkins APL Technical Digest, Vol. 30 No. l.
Kamaruzaman, S.M., Chowdhury M.R. 2004.
Tekst Categorization using Association Rule
and Naive Bayes Classifier. Asian Journal of
Information Technology, Vol. 3, No. 9, pp 657-
665, Sep. 2004
Kibriya Ashraf M., Frank Eibe,
Pfahringer Egrnb4ld, Holmes Geoffrey . 2004.
Multinomial Nai've Bayes
for
Text Categorization
Revisited. Australian joint
conference on
artificial intelligence No 17.
Kim.S., Han.K., Rim.H., Myaeng.S. 2006. Some
Effective Techniques
for
Naive Bayes Text
Classification IEEE Transactions on Knowledge
and Data Engineering. (2006) I 8(l I
), I 4 57 -t 466.
tidak dikenali sebagai opini
"negatif'
:24
Dari pengujian, dari total
g7
dokumen uji
didapatkan 63 dokumen yang dikenali sebagai opini
negatif dan 24 dokumen yang tidak dikenali
sebagai opini negatif, Dari 63 dokumen yang
dikenali sebagai opini negatif, setelah divalidasi
oleh peneliti, ternyata terdapat 3 dokumen yang
seharusnya tidak digolongkan sebagai opini negatif.
Jadi, hanya 60 dokumen yang dinyatakun b"na.
oleh sistem dan dinyatakan benar pula oleh peneliti
(setelah divalidasi secara manual) dan 3 dokumen
yang dinyatakan benar oleh sistem tapi dinyatakan
tidak benar oleh peneiliti. Nllai precision diperoleh
dari hasi perbandingan
antara jum_lah
dokumen
yang dinyatakan relevan baik oleh sistem maupun
peneliti dengan jumlah
semua dokuman yang
dinyatakan relevan oleh sistem saja (meskipun
tidak dinyatakan relevan oleh peneliti
setelah
divalidasi).
Dari 24 data yang tidak dikenali sebagai
opini negatif setelah divalidasi secara manual oleh
peneliti, terdapat 4 dokumen yang seharusnya
B-68
Tabel 4. Contoh Data Tt
Praktek dengan teori tidak
Ruang himpunan hanya
menjadi tempat menginap gratis
Lingkungan kuliah di elektro
sudah kondusif
Tabel 5. Hasil
Catatan: total dokumen = 87, total dok"-en yang
dikenali sebagai opini 'hegatif' = 63, total dokumen
Prosiding SENTIA 20l3-Politeknik Negeri Malang
Litu B. 2010. Handbook of Natural Language
Processing, chapter Sentiment Analysis and
Analysis, 2nd Edition. Chapman & Hall / CRC
Press.
Manning, D. Cristopher, Prabakhar Raghavan dan
Hinrich Schutze. 2009. An Introduction to
Information Retrieval. Cambridge University
Press
Pang, Bo. Lee, L dan Vaithyanathan, S. 2002.
Thumbs up? Sentiment classification using
machine learaing techniques. Proceedings of the
7th Conference on Empirical Methods in Natural
Language Processing (EMNLP-O2)
Volume 5-ISSN:2085-2347
Tumey, Peter D. 2002. Thumbs Up or Thumbs
Down? Semantic Ortentution Applied to
Unsupervised Classification of Reviews..
Dipresentasikan pada Association for
Computational Linguistics 40 Anniversary
Meeting, New Brunswick, N.J
Thabtah, Fadi. Ali, Mohammad. Zamzeer
Mannam and Hadi, M.W. 2009. Navie
Bayessian Based on Chi Square to
Categoize Arabic Data. Communication of
IBIMA VoL 10, ISSN: 1943-7765.
B-69

Anda mungkin juga menyukai