TemplateJurnalIJCCS 1kolom

IJCCS, Vol.x, No.x, July xxxx, pp.
1~5
ISSN: 1978-1520 1
ANALISIS SENTIMEN PADA PROVIDER

TELEKOMUNIKASI MENGGUNAKAN METODE
NAVE BAYES CLASSIFIER
Luh Gede Putri Suardani

Jurusan Teknik Elektro, Fakultas Teknik Udayana, Denpasar
e-mail: putrisuardani94@gmail.com
Abstrak
Penelitian di bidang analisis sentimen dari suatu data merupakan hal yang penting dan
dibutuhkan di era big data seperti saat ini. Analisis sentimen dapat diaplikasikan pada
perusahaan provider telekomunikasi karena banyaknya jumlah pengguna dari provider
telekomunikasi membuat perusahaan tersebut harus menyediakan layanan berupa feedback
untuk penggunanya agar memudahkan dalam meninjau kembali produknya. Salah satu media
yang digunakan sebagai layanan feedback adalah Twitter. Analisis sentimen berguna untuk
menganalisis komentar-komentar di Twitter menjadi pengetahuan yang lebih bermakna.
Metode Nave Bayes Classifier dipilih karena metode ini sederhana atau mudah diaplikasikan,
memiliki proses komputasi yang cepat, dan akurasi yang tinggi. Sedangkan Mutual Information
digunakan sebagai seleksi fitur dalam penelitian ini karena fungsinya yang cocok untuk menilai
term dari isi informasi dalam proses klasifikasi. Data yang digunakan untuk training sebanyak
3.000 data, masing-masing 1.000 data untuk sentimen positif, negatif, dan netral. Pada data
testing digunakan sebanyak 1.000 data untuk evaluasi sistem. Hasil penelitian memperlihatkan
terjadinya perubahan dari segi kecepatan dan akurasi sistem setelah ditambahkannya seleksi
fitur Mutual Information untuk n-gram kata n = 1. Didapatkan waktu pemrosesan sebelum
ditambahkan seleksi fitur Mutual Information yaitu 53 detik dan setelah penambahan seleksi
fitur menjadi 60 detik. Selain itu, meningkatnya akurasi sistem dengan bertambahnya nilai
akurasi tanpa seleksi fitur yaitu 64.80 % menjadi 73.60% setelah penambahan seleksi fitur
Mutual Information.
Kata kunciAnalisis Sentimen, Provider Telekomunikasi, Twitter, Nave Bayes Classifier,

Mutual Information
1. PENDAHULUAN
Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak

data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
informasi sentimen yang terkandung dalam suatu kalimat opini secara otomatis (Rozi, dkk.,
2012). Analisis sentimen memungkinkan untuk melacak produk, merek, maupun orang yang
menentukan apakah hal tersebut dilihat sebagai suatu hal positif, negatif, atau netral. Hal ini
memungkinkan bisnis untuk melacak persepsi produk baru, persepsi merek, manajemen
reputasi, dan sebuah pandangan tentang suatu opini pada skala global.
Penelitian di bidang analisis sentimen dari suatu data merupakan hal yang penting dan
dibutuhkan di era big data seperti saat ini. Sentimen positif menyatakan pemberian nilai yang
baik, sentimen negatif menyatakan pemberian nilai yang buruk pada konteks dalam bentuk teks,
sedangkan sentimen netral menyatakan pemberian nilai yang tidak berpihak pada baik maupun
buruk dan biasanya kalimat dengan sentimen ini tidak mengandung opini di dalamnya. Analisis
Received June 1st,2012; Revised June 25th, 2012; Accepted July 10th, 2012
2 ISSN: 1978-1520
sentimen dapat diaplikasikan pada perusahaan yang mengeluarkan suatu produk dan
menyediakan layanan untuk menerima pendapat (feedback) dari konsumen untuk produk
tersebut. Analisis sentimen diaplikasikan untuk mengelompokkan feedback positif, negatif, dan
netral dari konsumen sehingga mempercepat dan mempermudah tugas perusahaan untuk
meninjau kembali kekurangan produk mereka. Apabila ditemukan adanya sentimen negatif,
maka perusahaan dapat dengan cepat mengambil tindakan untuk menanggulanginya.
Sebaliknya, jika sentimen positif yang lebih dominan, perusahaan dapat meningkatkan produksi
dan distribusi produk. Salah satu perusahaan yang memerlukan adalah provider telekomunikasi
seperti Telkomsel, Indosat Oredoo, dan XL Axiata. Banyaknya jumlah pengguna dari provider
telekomunikasi membuat perusahaan tersebut harus menyediakan layanan berupa feedback
untuk penggunanya agar memudahkan dalam meninjau kembali produknya. Mengingat ketatnya
persaingan antara provider satu dengan provider lainnya membuat perusahaan tersebut harus
mempertahankan promo yang disukai oleh pelanggan dan mengganti atau memperbaiki promo
dan layanan yang tidak disukai dengan cepat dan tepat. Salah satu media yang digunakan
sebagai layanan feedback adalah Twitter.
Pendahuluan menguraikan latar belakang permasalahan yang diselesaikan, isu-isu

yang terkait dengan masalah yg diselesaikan, ulasan penelitan yang pernah dilakukan
sebelumnya oleh peneliti lain yg relevan dengan penelitian yang dilakukan.
2. METODE PENELITIAN
Makalah hendaknya memuat tulisan yang berisi 1.Pendahuluan, 2. Metode Penelitian

(bisa meliputi analisa, arsitektur, metode yang dipakai untuk menyelesaikan masalah,
implementasi), 3. Hasil dan Pembahasan, 4. Kesimpulan dan 5. Saran (future works) yg
berisi penelitian lanjut di masa mendatang. Pada setiap paragraph bisa terdiri dari beberapa
subparagraph yang dituliskan dengan penomoran angka arab seperti yang ditunjukkan section
berikut ini. Jumlah halaman minimum 10 halaman dan maksimum 12 halaman ukuran A4.
2.1 Tahapan Review

Harap mengirimkan naskah anda secara elektronik untuk direview sebagai attachments
e-mail. Ketika anda mengirimkan dokumen naskah versi awal dalam format Word.doc satu
kolom, termasuk gambar dan tabel.
2. 1.1 Gambar dan tabel

Semua tabel dan gambar yang anda masukkan dalam dokumen harus disesuaikan dengan urutan
1 kolom atau ukuran penuh satu kertas, agar memudahkan bagi reviewer untuk mencermati
makna gambar.
Gambar 1 Citra lena.bmp
IJCCS Vol. x, No. x, July 201x : first_page end_page

IJCCS ISSN: 1978-1520 3
2. 2 Formulir Copyright
Formulir copyright harus disertakan pada pengiriman naskah akhir. Anda bisa meminta
versi .pdf, atau .doc via email ke indoceiss@gmail.com
2. 2.1 Rumus Matematika

Jika anda menggunakan Word, gunakan persamaan Microsoft Equation Editor atau
MathType, ditulis ditengah, dan diberi nomor persamaan mulai dari (1), (2) dst.
p ( x, y ) ; (0 x M 1 , 0 y N 1)
(1)
2. 2.3 Pengacuan Pustaka

Pengacuan pustaka dilakukan dengan menuliskan [nomor urut pada daftar pustaka] mis.
[1], [1,2], [1,2,3]. Sitasi kepustakaan harus ada dalam Daftar Pustaka dan Daftar Pustaka harus
ada sitasinya dalam naskah. Pustaka yang disitasi pertama kali pada naskah [1], harus ada pada
daftar pustaka no satu, yg disitasi ke dua, muncul pada daftar pustaka no 2, begitu seterusnya.
Daftar pustaka urut kemunculan sitasi, bukan urut nama belakang. Daftar pustaka hanya
memuat pustaka yang benar benar disitasi pada naskah.
3. HASIL DAN PEMBAHASAN
Pengumpulan data dilakukan dengan memanfaatkan API Twitter versi 1.1. Tiga bagian
penting dari platform Twitter yaitu: 1) OAuth Authentication, 2) REST API, 3) Streaming API
OAuth Authentication. Pada versi 1.1 API Twitter membutuhkan otentikasi OAuth, baik
otentikasi application-only maupun otentikasi application-user. OAuth ini memungkinkan
pengguna Twitter untuk dapat mengakses situs Twitter yang dimiliki user.
Cara yang paling umum digunakan untuk mengakses data Twitter adalah melalui REST
API. REST API menggunakan token yang akan diperoleh melalui OAuth, aplikasi yang dibuat
akan melakukan request ke Twitter untuk data tertentu. Streaming API memungkinkan
pengguna untuk menerima tweet dan pemberitahuan secara real time dari Twitter.
Pada uji coba ini dicari hasil untuk akurasi dan waktu pemrosesan. Pengujian dilakukan
dengan menggunakan N-gram 1 sampai 4 dengan algoritma Nave Bayes Classifier dan seleksi
fitur Mutual Information. Berikut ini hasil evaluasi kinerja sistem di setiap N-gram n = 1,2,3,4.
Jumlah Klasifikasi Akurasi Waktu

N-gram
Benar (%) (detik)
1 736 73.60 60
2 445 44.50 141
3 618 61.80 170
4 642 64.20 175
4. KESIMPULAN
Berdasarkan hasil analisis dan pengujian terhadap analisis sentimen pada provider
telekomunikasi dengan mengimplementasikan metode Nave Bayes Classifier dengan seleksi
fitur Mutual Information maka dapat disimpulkan bahwa :
Title of manuscript is short and clear, implies research results (First Author)
4 ISSN: 1978-1520
1. Sistem dapat dimanfaatkan oleh pihak produsen yaitu pihak perusahaan provider
telekomunikasi dalam memantau penerimaan produk dan layanan mereka di masyarakat secara
real time melalui menu cek real time. Terdapat perubahan dari segi kecepatan dan akurasi sistem
setelah ditambahkannya seleksi fitur Mutual Information. Didapatkan waktu pemrosesan
sebelum ditambahkan seleksi fitur Mutual Information yaitu 53 detik dan setelah penambahan
seleksi fitur menjadi 60 detik.
2. Meningkatnya akurasi sistem setelah penambahan seleksi fitur Mutual Information.
Hal tersebut dibuktikan dengan bertambahnya nilai akurasi tanpa seleksi fitur yaitu 64.80 %
menjadi 73.60% setelah penambahan seleksi fitur Mutual Information. Dikarenakan seleksi fitur
Mutual Information dapat memilih fitur penting yang mewakili dokumen dan dapat mengurangi
dimensi ruang fitur sehingga dapat meningkatkan kinerja klasifikasi..
5. SARAN
Untuk penelitian selanjutnya, penulis menyarankan untuk menambahkan jumlah data

training yang lebih bervariasi sehingga akan berpengaruh pada bertambahnya akurasi. Selain
itu, diperlukan suatu cara untuk mendapatkan hasil analisis yang tepat dalam kasus kalimat
sindiran dan kata yang disingkat untuk tweet berbahasa Indonesia.
DAFTAR PUSTAKA
Ahmed, A., Hsinchun, C., Arab S. 2007. Sentiment Analysis in Multiple Languages: Feature
Selection for Opinion Classification in Web Forums. Arizona: Department of Management
Information Sistems, University of Arizona.
Battiti, R. 1994. Using Mutual Information for Selecting Features in Supervised Neural Net
Learning. IEEE Computational Intelligence Society. 5(4):537-550. Doi: 10.1109/72.298224.
Berry, M.W. & Kogan, J. 2010. Text Mining Aplication and Theory. WILEY : United Kingdom.
Blitzer, J., Dredze, M., Pereira. 2007. Biographies, Bollywood, Boom-boxes and Blenders:
Domain Adaptation for Sentiment Classification. Proceedings of the 45th Annual Meeting of the
Association of Computational Linguistics, pages 440-447.
Colas, F. & Brazdil, P. 2005. Comparison of SVM and Some Older Classification Algorithms in
Text Classification Tasks.
Dharmawan, F.Y. 2014. Analisis Jawaban Soal Essay Menggunakan Text Mining dengan
Metode Nave Bayes. Skripsi. Kediri: Universitas Nusantara PGRI Kediri.
Fieldman, R & Sanger, J. 2007. The Text Mining Handbook : Advanced Approaches in
Analyzing Unstructured Data. New York : Cambridge University Press.
Garnes L. 2009. Feature Selection for Text Categorisation. Norwegia : NTNU.
Korde, V., & Mahender, C. 2012. Text Classification and Classifier: A Survey. International
journal of Artificial Intelligence & Applications (IJAIA), 85-99.

IJCCS ISSN: 1978-1520 5
Liu, B. 2012. Sentiment Analysis and Opinion Mining. Morgan & Claypool
Publishers.http://www.dcc.ufrj.br/~valeriab/DTMSentimen-AnalysisAnd OpinionMining-
BingLiu.pdf [Diakses Tanggal 3 Mei 2015].
Manalu, B.U. 2014. Analisis Sentimen pada Twitter menggunakan Text Mining. Skripsi. Medan:
Universitas Sumatera Utara.
Manning, C. D., Raghavan, P., Schutze, H. 2009. Introduction to Information Retrieval.

Cambridge (GB): Cambridge University Press.
MIT Technology Review. 2003. The Many Tongues of Twitter. http://www.

technologyreview.com/graphiti/522376/the-many-tongues-of-twitter [Diakses Tanggal 4 Mei
2015].
Narayanan, V., Arora, I., Bhatia, A. TT. Fast and accurate sentiment classification using
enhanced Nave Bayes model. India: Department of Electronics Engineering, Indian Institute of
Technology (BHU).
Pang, B., Lee, L., Vithyanathan, S. 2002. Thumbs Up ?Sentiment Classification Using Machine
Learning Techniques. Proceedings of The ACL-02 conference on Empirical methods in natural
language processing (pp. 79-86). Stroudsburg: Association for Computational Linguistic.
Parikh, R. & Movassate, M. 2009. Sentiment Analysis of User Generated Twitter Updates using
Various Classification. http://nlp.stanford.edu/courses/ cs224n/2009/fp/19.pdf [Diakses Tanggal
3 Mei 2015].
Prasad, S. 2010. Micro-blogging Sentimen Analysis Using Bayesian Classification Methods.

http://nlp.stanford.edu/courses/cs224n/2010/reports/suhaasp.pdf [Diakses Tanggal 3 Mei 2015].
Rish, Irina. 2001. An Empirical Study of the Nave Bayes Classifier. T.J. Watson Research
Center. http://www.research.ibm.com/people/r/rish/papers/RC 22230.pdf [Diakses Tanggal 1
Mei 2016].
Rozi, I.F., Pramono, S.H., Dahlan, E.A. 2012. Implementasi Opinion Mining (Analisis
Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi. Jurnal EECCIS Vol. 6,
No. 1.
Saraswati, S. 2011. Text Mining dengan Metode Nave Bayes Classifier dan Support Vector
Machines untuk Sentiment Analysis. Tesis. Bali: Universitas Udayana.
Tala, Fadillah Z. 2003. A Study of Stemming Efects on Information Retrieval in Bahasa

Indonesia. Institute for Logic, Language and Computation Universiteit van Amsterdam The
Netherlands. http://www.illc.uva.nl/ Research/Reports/MoL-2003-02.text.pdf [Diakses Tanggal
3 Mei 2015].
Twitter. 2013. https://support.twitter.com/. Diakses tanggal 30 Maret 2016.
Wang, A. H. 2010. Dont Follow Me: Twitter Spam Detection. Proceedings of 5th International
Conference on Security and Cryptography (SECRYPT) Athens 2010. California: IEEE pp. 1-10.
Weiss, S.M., Indurkhya, N., Zhang, T., Damerau, F.J. 2005. Text Mining : Predictive Methods of
Analyzing Unstructered Information. New York : Springer.
Title of manuscript is short and clear, implies research results (First Author)
6 ISSN: 1978-1520
Wibisono, Y. 2005. Klasifikasi Berita Berbahasa Indonesia. http://fpmipa.upi.

edu/staff/yudi/KNSI_Clustering_yudi_masayu.pdf [Diakses Tanggal 2 Mei 2015].

TemplateJurnalIJCCS 1kolom

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

TemplateJurnalIJCCS 1kolom

Diunggah oleh

Hak Cipta:

Format Tersedia

IJCCS, Vol.x, No.x, July xxxx, pp.

ANALISIS SENTIMEN PADA PROVIDER

Luh Gede Putri Suardani

Kata kunciAnalisis Sentimen, Provider Telekomunikasi, Twitter, Nave Bayes Classifier,

Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak

Pendahuluan menguraikan latar belakang permasalahan yang diselesaikan, isu-isu

Makalah hendaknya memuat tulisan yang berisi 1.Pendahuluan, 2. Metode Penelitian

2.1 Tahapan Review

2. 1.1 Gambar dan tabel

Gambar 1 Citra lena.bmp

IJCCS Vol. x, No. x, July 201x : first_page end_page

2. 2.1 Rumus Matematika

2. 2.3 Pengacuan Pustaka

3. HASIL DAN PEMBAHASAN

Jumlah Klasifikasi Akurasi Waktu

Untuk penelitian selanjutnya, penulis menyarankan untuk menambahkan jumlah data

Garnes L. 2009. Feature Selection for Text Categorisation. Norwegia : NTNU.

IJCCS Vol. x, No. x, July 201x : first_page end_page

Manning, C. D., Raghavan, P., Schutze, H. 2009. Introduction to Information Retrieval.

MIT Technology Review. 2003. The Many Tongues of Twitter. http://www.

Prasad, S. 2010. Micro-blogging Sentimen Analysis Using Bayesian Classification Methods.

Tala, Fadillah Z. 2003. A Study of Stemming Efects on Information Retrieval in Bahasa

Twitter. 2013. https://support.twitter.com/. Diakses tanggal 30 Maret 2016.

Wibisono, Y. 2005. Klasifikasi Berita Berbahasa Indonesia. http://fpmipa.upi.

IJCCS Vol. x, No. x, July 201x : first_page end_page

Anda mungkin juga menyukai