Anda di halaman 1dari 8

JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp.

31~38
ISSN: 2355-990X
E-ISSN:2549-5178 31

ANALISIS SENTIMEN APLIKASI TRANSPORTASI


ONLINE KRL ACCESS MENGGUNAKAN METODE
NAIVE BAYES
Siti Nurwahyuni
Universitas Bina Sarana Informatika
Email: sitinunu29@gmail.com

ABSTRAK
Angkutan umum dianggap sebagai solusi untuk persoalan yang terkait dengan
mobilitas di daerah perkotaan. Terkait dengan transportasi, jabodetabek memiliki masalah seperti
kota-kota besar lainnya di dunia, kemacetan lalu lintas. Kemacetan lalu lintas terjadi di jam sibuk
di pagi dan sore hari, untuk itu dibutuhkan aplikasi yang dapat digunakan untuk mengakses alat
transportasi dengan mudah dan cepat, salah satunya adalah aplikasi transportasi secara online
yang saat ini banyak digunakan oleh pengguna smartphone mobile. Analisis Sentimen dapat
dianggap sebagai proses klasifikasi yang memiliki 3 tingkat klasifikasi utama yaitu tingkat pada
dokumen, tingkat pada kalimat dan tingkat pada aspek. Pada tingkat dokumen analisis sentimen
bertujuan untuk mengklasifikasikan dokumen opini sebagai pernyataan pendapat atau sentimen
positif dan negatif. Metode yang digunakan dalam penelitian kali ini adalah yang banyak
digunakan dalam mengolah data dalam bentuk text mining dengan tingkat akurasi yang cukup
tinggi yaitu algoritma Naive Bayes Classifier (NBC). Dengan algoritma Naive Bayes Classifier
(NBC) didapatkan hasil sebesar 84.00%.

Kata Kunci: Analisis Sentimen, Aplikasi Transportasi, Naive Bayes classifier algorithm
(NBC).

ABSTRACT
Public transport is considered as a solution to problems related to urban mobility. Associated with
the transport, jabodetabek have problems like other big cities in the world, traffic congestion.
Traffic congestion occurs at peak hours in the morning and evening, for it needed an application
that can be used to access transport easily and quickly one of which is transport applications
online that is currently widely used by mobile smartphone. Sentiment analysis can be considered
as a classification process that has three major classification level is the level documents, at the
sentence level and at the level of aspects. At the level of sentiment analysis document aims to
classify a document as a statement of opinion or the opinion of the positive and negative
sentiment. In addition the use of method used in the present study was methods that are widely
used in data processing in the form of text mining with a fairly high degree of accuracy that the
algorithm Naive Bayes Classifier (NBC). while The Naive Bayes classifier algorithm ( NBC ) is
obtained by 84.00%.

Key Words: sentiment analysis,Transportation applications, Naive Bayes classifier


algorithm (NBC).

Diterima Februari 10, 2019; Revisi Maret 10 , 2019; Disetujui Maret 15, 2019
JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
32

1. PENDAHULUAN Native applications, the Native Development


Kit (NDK). NDK memungkinkan untuk
Angkutam umum dianggap sebagai melaksanakan bagian dari aplikasi Java
solusi untuk persoalan yang terkait dengan menggunakan bahasa asli-kode seperti C dan
mobilitas di daerah perkotaan, sistem C ++. Menggunakan kode asli tidak
transportasi umum yang ramah pengguna mengakibatkan peningkatan kinerja secara
(user-friendly) harus mempertimbangkan otomatis. Kode asli berguna untuk tempat
aksesibilitas ke stasiun transportasi umum, menyimpan kode asli yang ada untuk Android,
mobilitas sistem transportasi publik, dan bukan untuk mempercepat bagian dari sebuah
konektivitas tanpa batas dengan berbagai aplikasi Android. Untuk memanfaatkan
sistem transportasi lainnya (misalnya, kereta kemampuan komputasi tinggi pada perangkat
api, metro, lokal angkutan kereta ringan, dan Android saat memberikan Renderscript (H.
bus) (Mishra et al., 2012). Terkait dengan Guihot, 2012).
transportasi, jabodetabek memiliki masalah Google Play adalah layanan konten
seperti kota-kota besar lainnya di dunia, digital milik Google yang melingkupi toko
kemacetan lalu lintas. Kemacetan lalu lintas daring untuk produk-produk seperti
terjadi di jam sibuk di pagi dan sore hari. musik/lagu, buku, aplikasi, permainan,
kemacetan yang ditimbulkan menyebabkan ataupun pemutar media berbasis awan.
Rp 5,5 miliar dari keuangan hilang dalam Layanan ini dapat diakses baik melalui web,
bentuk biaya kendaraan operasional dan aplikasi android (Play Store), dan Google TV.
waktu perjalanan (JICA Study Team, 2014). Konten yang telah dibeli tersedia pada seluruh
Kereta api merupakan salah satu platform-platform di atas Google Play mulai
sarana transportasi tertua di dunia (Wikipedia, dikenalkan pada bulan Maret 2012 sebagai
2008), memiliki berbagai keunggulan pengganti dari Android Market dan Layanan
komparatif dan kompetetif, hemat lahan dan Musik Google (Wikipedia, 2015).
energi, rendah polusi, bersifat masal, dan juga Salah satu metode klasifikasi yang
adaptif dengan perubahan teknologi dapat digunakan adalah metode Naïve Bayes
(www.kereta-api.com). Kereta api di yang sering disebut dengan Naïve Bayes
Indonesia, merupakan sarana transportasi Classifier (NBC). Kelebihan NBC adalah
umum yang cukup tua, didirikan tahun 1864 sederhana tetapi memiliki akurasi yang tinggi.
oleh pemerintah Belanda, NV Nederlandsch Berdasarkan hasil eksperimen, NBC terbukti
Indische Spoorweg Mastshappij (NIS), yang dapat digunakan secara efektif untuk
merupakan cikal bakal dari perkembangan mengklasifikasikan berita secara otomatis
industri perkeretapian di Indonesia saat ini. dengan akurasi mencapai 90.23%. Algoritma
Industri perkeretaapian saat ini NBC yang sederhana dan kecepatannya yang
dikelola sepenuhnya oleh negara sebagai tinggi dalam proses pelatihan dan klasifikasi
sebuah perusahaan layanan publik dengan membuat algoritma ini menarik untuk
nama PT. Kereta Api Indonesia yang disingkat digunakan sebagai salah satu metode
dengan PT. KAI (Undang-Undang Repu- klasifikasi (Yudi Wibisono, 2008). Sesuai
JURNAL MANAJEMEN PEMASARAN, VOL. dengan penelitian yang sebelumnya telah
4, NO. 1, April 2009: 23-37 24 blik Indonesia dilakukan oleh Amir Hamzah dalam
Nomor 13 Tahun 1992 Tentang (Klasifikasi Teks dengan Naives Bayes
Perkeretaapian Bab 3 Pasal 4). Classifier (NBC) untuk Pengelompokkan Teks
Android adalah sistem operasi Berita dan Abstract Academis, 2012). Bahwa
berbasis Linux yang dirancang untuk penggunaan Algoritma NBC memiliki kinerja
perangkat mobile seperti smartphone dan yang cukup tinggi untuk klasifikasi dokumen
tablet. Aplikasi Android ditulis pada bahasa teks, baik dokumen berita maupun dokumen
pemrograman Java, dan Software akademik. Pada klasifikasi dokumen berita
Development Kit Android (SDK) menyediakan didapatkan akurasi yang lebih tinggi (maksimal
perpustakaan API dan alat pengembang yang 91%) dibandingkan dengan dokumen
diperlukan untuk membangun, melakukan tes, akademik (maksimal 82%). Baik pada
dan mengecek kesalahan pada aplikasi. Java dokumen berita maupun dokumen akademik,
adalah bahasa utama di Android. Selain penggunaan 50% dokumen sebagai dokumen
pengembangan aplikasi Java, Android pelatihan memberikan kinerja akurasi diatas
menyediakan paket alat pengembangan dan 75%.
perpustakaan untuk mengembangkan develop

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38


JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
33

Yudi Wibisono dalam Klasifika si


Berita Berbahasa Indonesia menggunakan
Naïve Bayes Classifier, 2006 telah melakukan
klasifikasi pada 582 dokumen berbahasa
Indonesia menggunakan metode NBC dan
memperoleh hasil eksperimen nilai akurasi
NBC tinggi, terutama jika dokumen contoh
yang digunakan besar (≥400 dokumen). Hal
yang menarik adalah akurasi tidak
menunjukkan peningkatan yang signifikan
walaupun dokumen contoh telah meningkat
banyak dari 70% menjadi 90% serta akurasi
masih relative tinggi walaupun dokumen
contoh secara ekstrim dikurangi hanya 58
dokumen (10%).
Fatimah Wulandini dan Anto Satriyo
Nugroho dalam (Text Classification Using
Support Vector Machine for Webmining Based
Spation Temporal Analysis of the Spread of Gambar 1. Kerangka Pemikiran Penelitian
Tropical Diseases, 2009) mendapatkan hasil
bahwa metode SVM menunjukkan hasil paling Tahapan-tahapan yang dilakukan
baik pada kategorisasi teks berbahasa dalam penelitian ini adalah sebagai berikut:
Indonesia. Eksperimen dilakukan pada 3713 1. Pengumpulan Data
features dan 360 instances. Data tersebut Data diambil dari sebuah website
dibagi menjadi 120 instances sebagai data uji pengunduh aplikasi untuk smartphone
dan 240 instances sebagai data latih. hasil dari android, kemudian diseleksi agar sesuai
algoritma tersebut menunjukkan performansi dengan kebutuhan penelitian.
yang tidak berbeda jauh antara metode SVM 2. Pengolaha Awal Data
dan NBC walaupun metode NBC adalah Pengolahan awal data bertujuan untuk
metode yang lebih konvensional dan lebih mengurangi data yang tidak relevan, atau
sederhana. data dengan atribut yang hilang.
Fabrice Colas dan Pavel Brazdil Pengolahan juga dapat berupa konversi
dalam penelitiannya berjudul Comparison of nilai-nilai redundan atau nilai yang terlalu
SVM and Some Older Classification beragam kedalam kelompok yang lebih
Algorithms in Text Classification Tasks kecil untuk mempermudah pembentukan
mendapatkan bahwa metode NBC memiliki model.
performansi yang lebih baik dibandingkan 3. Metode Yang Diusulkan
KNN dan SVM untuk menyelesaikan binary Metode yang digunakan dalam penelitian
classification pada dokumen berbahasa ini adalah 2 metode algoritma yang umum
Inggris. Hasil penelitiannya juga menyebutkan digunakan dalam mengolah data degan
waktu komputasi yang jauh lebih pendek oleh metode text mining dalam analisis
metode NBC dan KNN. Waktu komputasi SVM sentimen yaitu algoritma algoritma Naive
berkembang secara kuadratik seiring dengan Bayes Classifier (NBC).
perkembangan jumlah data latih. 4. Eksperimen dan Pengujian Metode
Dalam eksperimen dan metode yang
2. METODE PENELITIAN dilakukan penulis membandingkan 2
metode algoritma tersebut untuk
mengolah data sehingga menghasilkan
nilai akurasi yang tinggi. ekperimen
dilakukan secara terpisah agar
didapatkan hasil secara maksimal dan
dapat ditentukan metode algoritma mana
yang dapat menghasilkan akurasi yang
lebih tinggi.

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38


JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
34

5. Rancangan Klasifikasi Teks dengan terus lemot ujung


Naive Bayes Classifier (NBC) dari aturan ujungnya masalah di
bayes server
P(X|Y) = P(X)P(Y|X) Error dan error Yg
P(Y) negatif3.txt suka latih kesabaran
maka dapat dibuat sebuah asumsi boleh di download
tentang bagaimana kita menghitung error akun sering
probabilitas dari kemunculan dokumen negatif4.txt expired .reset
yang setara dengan perkalian (product) pasword gabisa terus
dari probabilitas kemunculan tiap kata di Loading utk
dalamnya. Hal ini menyebabkan tidak ada negatif5.txt penarikan datany
hubungan antara kata yang satu dengan lama bngt
kata yang lainnya. Asumsi independen ini Idiiihhh lemot banget
tidak sepenuhnya benar, banyak kata- sekarang gojek
kata lebih sering muncul bersamaan negatif6.txt
susah banget mau
daripada muncul secara individual, tapi order ,
hal ini menyederhanakan proses Aplikask lemot bikin
klasifikasi. HP lemot, kena
6. Rancangan Klasifikasi Teks dengan negatif7.txt korban 1 HP rusak
Support Vector Machine (SVM) setelah download
Proses klasifikasi menggunakan SVM apliaksi ini.
dimulai dengan mengubah text menjadi Lambat Respon nya
data vector. Vector dalam penelitian ini negatif8.txt lama banget klo top
memiliki dua komponen yaitu dimensi up
(word id) dan bobot. Bobot ini sering negatif9.txt Kecewa bgt saya,
dikombinasikan ke dalam sebuah nilai tf- Aplikasi tdk bisa pilih
idf, secara sederhana dengan stasiun, Coba re
mengalikan mereka bersama-sama. Ada negatif10.txt
install, malah ga bisa
banyak variasi pada gagasan dasar tf-idf, open aplikasi
7. Evaluasi dan Validasi Hasil
Pdhl ngandelin ni
Evaluasi berfungsi untuk mengetahui
aplikasi tapi kesel
akurasi dari kedua model algoritma yang
stiap di refresh atau d
diusulkan. Akurasi algoritma akan diukur negatif11.txt
buka suka gagal
menggunakan Confusion Matrix dan akan server tolong di
ditampilkan dalam bentuk Curve ROC
perbaiki trima kasih
(Receiver Operating Characteristic).
Tolong dong di
Teknik validasi yang digunakan adalah
perbaiki aplilasi suka
Cross Validation.
lemot kalau buka
negatif12.txt
suka ada tulisan
3. HASIL PENELITIAN
penarikan data bisa
A. Pengumpulan Data
setengah jam
Review aplikasi trannsportasi darat
dikumpulkan melalui situs download aplikasi
Tabel 2. Contoh Review Data Positif
smartphone android:
https://play.google.com/store/apps/ Nama Isi Dokumen
Dokumen
Tabel 1. Contoh Review Data Negatif Sangat membantu
positif1.txt saya di saat gk di
Nama Isi Dokumen
jemput suami heheee
Dokumen
Aplikasi sudah Sangat membantu
dalam memperkirakan
kadaluwarsa, jadwal
negatif1.txt jadwal kereta api akan
waktu yang tidak positif2.txt
realtime, tiba di stasiun tujuan
akhir.
akhir akhir ini suka
negatif2.txt
gak bisa kebuka,

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38


JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
35

Good Bagus ah...


positif3.txt sedikit lemot tp gak Tabel 3. Perbandingan teks sebelum dan
apa2 sesudah dilakukan proses tokenization
aplikasi ini sgt Teks data Tidak memuaskan!!!
positif4.txt
membantu Review sebelum Untuk log on susah,
Info ini sangat dilakukan proses mengaktifkan lupa kata
membantu saya. Saya tokenization sandi juga tidak bisa.
dari rawabuntu Gimama nih??!!??
positif5.txt
station-tanah Teks data Tidak memuaskan
abang.dari tanah Review setelah Untuk log on susah
abang -Jatinegara dilakukan proses mengaktifkan lupa kata
Bagus bgt cukup tokenization sandi juga tidak bisa
positif6.txt Gimama nih
membantu
Wow Membantu
positif7.txt banget.. buat gw yg Tabel 4. Perbandingan teks sebelum dan
suka ngubek2 kota.. . sesudah dilakukan proses filter tokens (by
Bagus. sangat lenght)
membantu sekali Teks data Review Aplikasi tdk bisa pilih
untuk pengetahui sebelum dilakukan stasiun, Coba re
posisi kereta tujuan proses filter tokens install, malah ga
positif8.txt (by lenght) bisa open aplikasi
jadi bisa
memprediksikan Teks data Review Aplikasi bisa pilih
waktu berangkat dr setelah dilakukan stasiun Coba re
rumah. proses filter tokens install malah ga bisa
Cukup membantu tp (by lenght) open aplikasi
lbh bagus lg tmbh
positif9.txt vending mesin d Tabel 5. Perbandingan teks sebelum dan
setiap stasiun spy tdk sesudah dilakukan proses Stopwords
panjang antrian Teks data Review Tidak memuaskan!!!
Aplikasi ini sangat sebelum Untuk log on susah,
membantu Saya yg dilakukan proses mengaktifkan lupa kata
stiap hari berpergian stopwords sandi juga tidak bisa.
positif10.txt
mnggunakan KRL jadi Gimama nih??!!??
tau jadwal dan Teks data Review Tidak memuaskan
keterlambatan nya setelah dilakukan Untuk susah
Cukup bagus dan proses stopwords mengaktifkan lupa kata
membantu,sayangnya sandi juga tidak bisa
positif11.txt aplikasi lama yg Gimana
terpasang gk bisa
diupdate. Tabel 6. Perbandingan teks sebelum dan
Good App Membantu sesudah dilakukan proses Stemming
positif12.txt
sekali. Thanks

B. Pengolahan Data Awal Teks data Review Payah Diupdate malah


(Preprocessing) sebelum jd keliatan banget bug
Dalam preprocessing ada beberapa dilakukan proses nya.. masa tempat
tahapan yang dilakukan, diantaranya adalah stemming duduknya gk
tokenize, filter tokens (by lenght),Stopwords kedetect? Payah!!!!
dan stemming. Tolong diperbaiki
secepatnya..!!!
Teks data Review payah diupdate malah
setelah dilakukan keliatan banget masa
proses stemming tempat duduknya
kedetect payah tolong
Gambar 2. Desain Tahap Preprocessing diperbaiki secepatnya
pada Rapid Miner

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38


JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
36

C. Klasifikasi Teks Menggunakan data yang tidak bersifat internal. Apply model
Naive Bayes Classifier (NBC) digunakan untuk dapat membaca data yang
Setelah melalui tahap preprocessing akan diestimasi berdasarkan data yang sudah
pada rapid miner, kemudian digunakan dipelajari sebelumnya.
algoritma NBC untuk mengetahui tingkat D. Hasil Klasifikasi Teks antara
akurasi dari data yang diolah. Proses algoritma Naive Bayes Classifier
klasifikasi dokumen pada penelitian ini adalah (NBC)
untuk menentukan sebuah kalimat sebagai 1. Evaluasi Metode Naive Bayes
anggota kelas positif atau kelas negatif Classifier
berdasarkan nilai perhitungan pembobotan. Data Review Positif disatukan dalam
satu folder dengan nama positif dan data
Tabel 7. Tabel Dokumen yang dihitung Review Negatif disatukan dalam satu folder
nilai bobotnya dengan nama negatif. setelah proses
Atribut
klasifikasi, kemudian melalui tahapan
Dokumen Kelas preprocessing. Hasil yang didapatkan
Bagus Membantu Aplikasi Gojek Error Kecewa
melalui pengolahan menggunakan
positif34.txt 0,182 0,138 0,164 0,182 0 0 Positif Rapidminer sebagai berikut:
negatif7.txt 0 0 0,200 0,233 0,203 0,354 Negatif
Tabel 9. Contoh hasil proses vector
creation menggunakan Rapidminer
No. Kata Statistic Range
avg = 0.003 [0.000 ;
1 abis
+/- 0.033 0.460]
avg = 0.005 [0.000 ;
2 access
+/- 0.040 0.382]
avg = 0.004 [0.000 ;
3 adanya
+/- 0.037 0.410]
avg = 0.001 [0.000 ;
Gambar 3. Desain Validasi Model NBC 4 admin
+/- 0.021 0.360]
dengan menggunakan Rapid Miner
avg = 0.003 [0.000 ;
5 agak
+/- 0.036 0.548]
Proses validasi dengan menggunakan
10-fold cross validation. Nilai k yang diambil avg = 0.001 [0.000 ;
6 agar
adalah 10 karena beberapa penelitian +/- 0.019 0.321]
sebelumnya menunjukkan bahwa nilai avg = 0.001 [0.000 ;
7 ahhhhh
tersebut menunjukkan hasil terbaik untuk +/- 0.022 0.382]
proses validasi.
Tabel 10. Confusion Matrix Model
Algoritma Naive Bayes Classifier (NBC)
dengan Rapid Miner

accuracy: 84.00% +/- 7.12% (mikro:


84.00%)
true true class
negatif positif precision
Gambar 4. Desain Model NBC dengan
menggunakan Rapid Miner pred. negatif 133 31 81.10%
pred. positif 17 119 87.50%
Proses terakhir adalah penerapan class recall 88.67% 79.33%
algoritma Naive Bayes Classifier sebagai
metode yang akan digunakan pada kasus precision: 88.70% +/- 9.26% (mikro: 87.50%) (positive
analisis sentiment review aplikasi transportasi class: positif)
darat. Pada penelitian ini data yang digunakan true true class
negatif positif precision
berbentuk teks proses klasifikasi tidak dapat
diasumsikan secara linear, oleh karena itu pred. negatif 133 31 81.10%
akan digunakan kernel sebagai parameter pred. positif 17 119 87.50%
yang dapat melakukan klasifikasi terhadap

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38


JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
37

class recall 88.67% 79.33%


Akurasi yang diperoleh yaitu 84.00%
recall: 79.33% +/- 12.09% (mikro: 79.33%) (positive dari 150 data review negatif dan 150 data
class: positif) review positif. Data review yang dihasilkan
true true class RapidMiner dengan model NBC menunjukan
negatif positif precision
bahwa klasifikasi untuk review positif yang
pred. negatif 133 31 81.10%
sesuai prediksi yaitu 133. Data review negatif
pred. positif 17 119 87.50% yang termasuk ke dalam prediksi positif yaitu
class recall 88.67% 79.33% 17. Dara review positif yang termasuk ke
dalam prediksi negatif yaitu 31 dan data review
negatif yang termasuk ke dalam prediksi
negatif yaitu 119.
Acc (Accuracy)
TP+TN = 133 + 119 = 275 = 0.84
TP+TN+FP+FN 133+17+31+119 300
Sensitivity
TP = 133 = 133 = 0.811
TP + FP 133+31 164

Specificity
TN____ = 119 = 146 = 0.875
Gambar 7. Kurva ROC Model Naive Bayes TN + FN 17 + 119 155
Classifier (NBC)
PPV
Kurva ROC (Receiver Operating TP____ = 133 = 133 = 0.887
Characteristic) adalah cara lain untuk TP + TN 133 + 17 150
mengevaluasi akurasi dari klasifikasi secara NPV
visual. Sebuah grafik ROC adalah plot dua TN___ = 119 = 119 = 0.793
dimensi dengan proporsi positif salah pada FP + FN 119 + 31 150
sumbu X dan positif benar pada sumbu Y.
Hasil perhitungan pada kurva ROC,
meggambarkan kurva ROC untuk algoritma
4. KESIMPULAN
Kesimpulan dari penelitian ini adalah:
Naive Bayes Clasification (NBC). Dapat
1. Metode NBC memberikan hasil dengan
disimpulkan bahwa satu point pada kurva
akurasi hingga 84.00% untuk data uji
ROC adalah lebih baik dari pada yang lainnya
review opini positif berbahasa indonesia
jika arah garis melintang dari kiri bawah ke
pada pemilihan aplikasi transportasi darat
kanan atas didalam grafik. Kurva ROC Naive
pada smartphone.
Bayes Clasification (NBC) memiliki AUC
2. Metode NBC memberikan hasil yang
sebesar 0.976 yang termasuk ke dalam
tepat dalam mengklasifikasikan opini
kategori excellent classification.
dalam bentuk paragraf yang terdiri dari
beberapa kalimat.
3. Diketahui bahwa dokumen teks memliki
struktur yang tidak teratur. Maka tahap
preprocessing sangat dibutuhkan untuk
pemrosesan data awal. Karena terbukti
dapat mengurangi dimensi dokumen dan
membantu membuang kata yang tidak
perlu. Sehingga kinerja tahap seleksi fitur
dan klasifikasi menjadi lebih mudah
dengan hasil yang lebih akurat.
4. Pada algoritma NBC dapat ditambahkan
metode tambahan agar akurasinya dapat
menyamai algoritma SVM seperti sample
boosting dengan metode tambahan
Gambar 8. Performance Vector Model tersebut akurasi dari metode NBC dapat
Naive Bayes Clasification (NBC) meningkat hingga hampir 10% sehingga

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38


JURNAL SWABUMI, Vol. 7 No.1 Maret 2019, pp. 31~38
ISSN: 2355-990X
E-ISSN:2549-5178
38

dapat menyamai akurasi dari algoritma applications: A survey. Ain Shams


SVM. Engineering Journal
doi:10.1016/j.asej.2014.04.011

REFERENSI Mishra, S., Welch, T.F., Jha, M.K., (2012).


Performance indicators for public transit
A.D. Reid, K. Flautner, E. Grimley-Evans, Y. connectivity in multi-modal transportation
Lin, SoC-C: efficient programming networks. Transport. Res. Part A: Policy
abstractions for heterogeneous multicore Practice 46 (7), 1066–1085.
systems on chip, in: E.R. Altman (Ed.), Tan, P. N., Steinbach, M. & Kumar, V. (2006).
(2008). Proceedings of the 2008 Introduction to Data Mining. Boston :
International Conference on Compilers, Pearson Addison Wesley.
Architecture, and Synthesis for Embedded
Systems, CASES’08, ACM, Atlanta, GA, Turban, E.; et.al. (2011). Decision Support and
USA, pp. 95–104. Business Intelligence Systems (9 ed.). New
Jersey: Pearson Education, Inc.

Chou, J.-S., Cheng, M.-Y., Wu, Y.-W., & Wibisono, Y. 2005. Klasifikasi Berita
Pham, A.-D. (2014). Optimizing parameters Berbahasa Indonesia menggunakan Naïve
of support vector machine using fast messy Bayes Classifier. [Online]. Tersedia di:
genetic algorithm for dispute classification. http://fpmipa.upi.edu/staff/yudi/yudi_0805.
Expert Systems with Applications, 41(8), pdf [diunduh: 1 Nov 2010].
3955–3964.
doi:10.1016/j.eswa.2013.12.035 http://www.
suaramerdeka.com/harian/0403/29/ko
Hamzah, A. (2012). Klasifikasi Teks dengan t2.htm
Naive Bayes Classifier (NBC) untuk
Pengelompokan Teks Berita dan Abstrak
Akademis. Prosiding Seminar Nasional
Aplikasi Sains & Teknologi (SNAST)
Periode III, Yogyakarta, 269-277.
H. Guihot, Renderscript, (2012). in: Pro
Android Apps Performance Optimization,
Springer, pp. 231–263.

http://www.
suaramerdeka.com/harian/0403/29/
kot2.htm
JICA Study Team. (2004). The Study on
Integrated Transportasi Master Plan for
Jabodetabek (Phase II), Find Report, Main
Report, I:Masterplan Study, in Coordination
with National Development Planning
Agency (BAPPENAS) Republic Indonesia

Manning, C. D., Ragnavan, P., & Schutze, H.


(2008). An Introduction to Information
Retreival. Cambridge: Cambridge
University Press.

Medhat, W., Hassan, A., & Korashy, H. (2014).


Sentiment analysis algorithms and

JURNAL SWABUMI Vol.7 No.1, Maret 2019: 31~38

Anda mungkin juga menyukai