Anda di halaman 1dari 6

IJCCS, Vol.x, No.x, July xxxx, pp.

1~5
ISSN: 1978-1520 1

ANALISIS SENTIMEN PADA PROVIDER


TELEKOMUNIKASI MENGGUNAKAN METODE
NAVE BAYES CLASSIFIER

Luh Gede Putri Suardani


Jurusan Teknik Elektro, Fakultas Teknik Udayana, Denpasar
e-mail: putrisuardani94@gmail.com

Abstrak
Penelitian di bidang analisis sentimen dari suatu data merupakan hal yang penting dan
dibutuhkan di era big data seperti saat ini. Analisis sentimen dapat diaplikasikan pada
perusahaan provider telekomunikasi karena banyaknya jumlah pengguna dari provider
telekomunikasi membuat perusahaan tersebut harus menyediakan layanan berupa feedback
untuk penggunanya agar memudahkan dalam meninjau kembali produknya. Salah satu media
yang digunakan sebagai layanan feedback adalah Twitter. Analisis sentimen berguna untuk
menganalisis komentar-komentar di Twitter menjadi pengetahuan yang lebih bermakna.
Metode Nave Bayes Classifier dipilih karena metode ini sederhana atau mudah diaplikasikan,
memiliki proses komputasi yang cepat, dan akurasi yang tinggi. Sedangkan Mutual Information
digunakan sebagai seleksi fitur dalam penelitian ini karena fungsinya yang cocok untuk menilai
term dari isi informasi dalam proses klasifikasi. Data yang digunakan untuk training sebanyak
3.000 data, masing-masing 1.000 data untuk sentimen positif, negatif, dan netral. Pada data
testing digunakan sebanyak 1.000 data untuk evaluasi sistem. Hasil penelitian memperlihatkan
terjadinya perubahan dari segi kecepatan dan akurasi sistem setelah ditambahkannya seleksi
fitur Mutual Information untuk n-gram kata n = 1. Didapatkan waktu pemrosesan sebelum
ditambahkan seleksi fitur Mutual Information yaitu 53 detik dan setelah penambahan seleksi
fitur menjadi 60 detik. Selain itu, meningkatnya akurasi sistem dengan bertambahnya nilai
akurasi tanpa seleksi fitur yaitu 64.80 % menjadi 73.60% setelah penambahan seleksi fitur
Mutual Information.

Kata kunciAnalisis Sentimen, Provider Telekomunikasi, Twitter, Nave Bayes Classifier,


Mutual Information

1. PENDAHULUAN

Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak


data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
informasi sentimen yang terkandung dalam suatu kalimat opini secara otomatis (Rozi, dkk.,
2012). Analisis sentimen memungkinkan untuk melacak produk, merek, maupun orang yang
menentukan apakah hal tersebut dilihat sebagai suatu hal positif, negatif, atau netral. Hal ini
memungkinkan bisnis untuk melacak persepsi produk baru, persepsi merek, manajemen
reputasi, dan sebuah pandangan tentang suatu opini pada skala global.
Penelitian di bidang analisis sentimen dari suatu data merupakan hal yang penting dan
dibutuhkan di era big data seperti saat ini. Sentimen positif menyatakan pemberian nilai yang
baik, sentimen negatif menyatakan pemberian nilai yang buruk pada konteks dalam bentuk teks,
sedangkan sentimen netral menyatakan pemberian nilai yang tidak berpihak pada baik maupun
buruk dan biasanya kalimat dengan sentimen ini tidak mengandung opini di dalamnya. Analisis

Received June 1st,2012; Revised June 25th, 2012; Accepted July 10th, 2012
2 ISSN: 1978-1520

sentimen dapat diaplikasikan pada perusahaan yang mengeluarkan suatu produk dan
menyediakan layanan untuk menerima pendapat (feedback) dari konsumen untuk produk
tersebut. Analisis sentimen diaplikasikan untuk mengelompokkan feedback positif, negatif, dan
netral dari konsumen sehingga mempercepat dan mempermudah tugas perusahaan untuk
meninjau kembali kekurangan produk mereka. Apabila ditemukan adanya sentimen negatif,
maka perusahaan dapat dengan cepat mengambil tindakan untuk menanggulanginya.
Sebaliknya, jika sentimen positif yang lebih dominan, perusahaan dapat meningkatkan produksi
dan distribusi produk. Salah satu perusahaan yang memerlukan adalah provider telekomunikasi
seperti Telkomsel, Indosat Oredoo, dan XL Axiata. Banyaknya jumlah pengguna dari provider
telekomunikasi membuat perusahaan tersebut harus menyediakan layanan berupa feedback
untuk penggunanya agar memudahkan dalam meninjau kembali produknya. Mengingat ketatnya
persaingan antara provider satu dengan provider lainnya membuat perusahaan tersebut harus
mempertahankan promo yang disukai oleh pelanggan dan mengganti atau memperbaiki promo
dan layanan yang tidak disukai dengan cepat dan tepat. Salah satu media yang digunakan
sebagai layanan feedback adalah Twitter.

Pendahuluan menguraikan latar belakang permasalahan yang diselesaikan, isu-isu


yang terkait dengan masalah yg diselesaikan, ulasan penelitan yang pernah dilakukan
sebelumnya oleh peneliti lain yg relevan dengan penelitian yang dilakukan.

2. METODE PENELITIAN

Makalah hendaknya memuat tulisan yang berisi 1.Pendahuluan, 2. Metode Penelitian


(bisa meliputi analisa, arsitektur, metode yang dipakai untuk menyelesaikan masalah,
implementasi), 3. Hasil dan Pembahasan, 4. Kesimpulan dan 5. Saran (future works) yg
berisi penelitian lanjut di masa mendatang. Pada setiap paragraph bisa terdiri dari beberapa
subparagraph yang dituliskan dengan penomoran angka arab seperti yang ditunjukkan section
berikut ini. Jumlah halaman minimum 10 halaman dan maksimum 12 halaman ukuran A4.

2.1 Tahapan Review


Harap mengirimkan naskah anda secara elektronik untuk direview sebagai attachments
e-mail. Ketika anda mengirimkan dokumen naskah versi awal dalam format Word.doc satu
kolom, termasuk gambar dan tabel.

2. 1.1 Gambar dan tabel


Semua tabel dan gambar yang anda masukkan dalam dokumen harus disesuaikan dengan urutan
1 kolom atau ukuran penuh satu kertas, agar memudahkan bagi reviewer untuk mencermati
makna gambar.

Gambar 1 Citra lena.bmp

IJCCS Vol. x, No. x, July 201x : first_page end_page


IJCCS ISSN: 1978-1520 3

2. 2 Formulir Copyright
Formulir copyright harus disertakan pada pengiriman naskah akhir. Anda bisa meminta
versi .pdf, atau .doc via email ke indoceiss@gmail.com

2. 2.1 Rumus Matematika


Jika anda menggunakan Word, gunakan persamaan Microsoft Equation Editor atau
MathType, ditulis ditengah, dan diberi nomor persamaan mulai dari (1), (2) dst.
p ( x, y ) ; (0 x M 1 , 0 y N 1)
(1)

2. 2.3 Pengacuan Pustaka


Pengacuan pustaka dilakukan dengan menuliskan [nomor urut pada daftar pustaka] mis.
[1], [1,2], [1,2,3]. Sitasi kepustakaan harus ada dalam Daftar Pustaka dan Daftar Pustaka harus
ada sitasinya dalam naskah. Pustaka yang disitasi pertama kali pada naskah [1], harus ada pada
daftar pustaka no satu, yg disitasi ke dua, muncul pada daftar pustaka no 2, begitu seterusnya.
Daftar pustaka urut kemunculan sitasi, bukan urut nama belakang. Daftar pustaka hanya
memuat pustaka yang benar benar disitasi pada naskah.

3. HASIL DAN PEMBAHASAN

Pengumpulan data dilakukan dengan memanfaatkan API Twitter versi 1.1. Tiga bagian
penting dari platform Twitter yaitu: 1) OAuth Authentication, 2) REST API, 3) Streaming API
OAuth Authentication. Pada versi 1.1 API Twitter membutuhkan otentikasi OAuth, baik
otentikasi application-only maupun otentikasi application-user. OAuth ini memungkinkan
pengguna Twitter untuk dapat mengakses situs Twitter yang dimiliki user.
Cara yang paling umum digunakan untuk mengakses data Twitter adalah melalui REST
API. REST API menggunakan token yang akan diperoleh melalui OAuth, aplikasi yang dibuat
akan melakukan request ke Twitter untuk data tertentu. Streaming API memungkinkan
pengguna untuk menerima tweet dan pemberitahuan secara real time dari Twitter.
Pada uji coba ini dicari hasil untuk akurasi dan waktu pemrosesan. Pengujian dilakukan
dengan menggunakan N-gram 1 sampai 4 dengan algoritma Nave Bayes Classifier dan seleksi
fitur Mutual Information. Berikut ini hasil evaluasi kinerja sistem di setiap N-gram n = 1,2,3,4.

Jumlah Klasifikasi Akurasi Waktu


N-gram
Benar (%) (detik)
1 736 73.60 60
2 445 44.50 141
3 618 61.80 170
4 642 64.20 175

4. KESIMPULAN

Berdasarkan hasil analisis dan pengujian terhadap analisis sentimen pada provider
telekomunikasi dengan mengimplementasikan metode Nave Bayes Classifier dengan seleksi
fitur Mutual Information maka dapat disimpulkan bahwa :

Title of manuscript is short and clear, implies research results (First Author)
4 ISSN: 1978-1520

1. Sistem dapat dimanfaatkan oleh pihak produsen yaitu pihak perusahaan provider
telekomunikasi dalam memantau penerimaan produk dan layanan mereka di masyarakat secara
real time melalui menu cek real time. Terdapat perubahan dari segi kecepatan dan akurasi sistem
setelah ditambahkannya seleksi fitur Mutual Information. Didapatkan waktu pemrosesan
sebelum ditambahkan seleksi fitur Mutual Information yaitu 53 detik dan setelah penambahan
seleksi fitur menjadi 60 detik.
2. Meningkatnya akurasi sistem setelah penambahan seleksi fitur Mutual Information.
Hal tersebut dibuktikan dengan bertambahnya nilai akurasi tanpa seleksi fitur yaitu 64.80 %
menjadi 73.60% setelah penambahan seleksi fitur Mutual Information. Dikarenakan seleksi fitur
Mutual Information dapat memilih fitur penting yang mewakili dokumen dan dapat mengurangi
dimensi ruang fitur sehingga dapat meningkatkan kinerja klasifikasi..

5. SARAN

Untuk penelitian selanjutnya, penulis menyarankan untuk menambahkan jumlah data


training yang lebih bervariasi sehingga akan berpengaruh pada bertambahnya akurasi. Selain
itu, diperlukan suatu cara untuk mendapatkan hasil analisis yang tepat dalam kasus kalimat
sindiran dan kata yang disingkat untuk tweet berbahasa Indonesia.

DAFTAR PUSTAKA

Ahmed, A., Hsinchun, C., Arab S. 2007. Sentiment Analysis in Multiple Languages: Feature
Selection for Opinion Classification in Web Forums. Arizona: Department of Management
Information Sistems, University of Arizona.

Battiti, R. 1994. Using Mutual Information for Selecting Features in Supervised Neural Net
Learning. IEEE Computational Intelligence Society. 5(4):537-550. Doi: 10.1109/72.298224.

Berry, M.W. & Kogan, J. 2010. Text Mining Aplication and Theory. WILEY : United Kingdom.

Blitzer, J., Dredze, M., Pereira. 2007. Biographies, Bollywood, Boom-boxes and Blenders:
Domain Adaptation for Sentiment Classification. Proceedings of the 45th Annual Meeting of the
Association of Computational Linguistics, pages 440-447.

Colas, F. & Brazdil, P. 2005. Comparison of SVM and Some Older Classification Algorithms in
Text Classification Tasks.

Dharmawan, F.Y. 2014. Analisis Jawaban Soal Essay Menggunakan Text Mining dengan
Metode Nave Bayes. Skripsi. Kediri: Universitas Nusantara PGRI Kediri.

Fieldman, R & Sanger, J. 2007. The Text Mining Handbook : Advanced Approaches in
Analyzing Unstructured Data. New York : Cambridge University Press.

Garnes L. 2009. Feature Selection for Text Categorisation. Norwegia : NTNU.

Korde, V., & Mahender, C. 2012. Text Classification and Classifier: A Survey. International
journal of Artificial Intelligence & Applications (IJAIA), 85-99.

IJCCS Vol. x, No. x, July 201x : first_page end_page


IJCCS ISSN: 1978-1520 5

Liu, B. 2012. Sentiment Analysis and Opinion Mining. Morgan & Claypool
Publishers.http://www.dcc.ufrj.br/~valeriab/DTMSentimen-AnalysisAnd OpinionMining-
BingLiu.pdf [Diakses Tanggal 3 Mei 2015].

Manalu, B.U. 2014. Analisis Sentimen pada Twitter menggunakan Text Mining. Skripsi. Medan:
Universitas Sumatera Utara.

Manning, C. D., Raghavan, P., Schutze, H. 2009. Introduction to Information Retrieval.


Cambridge (GB): Cambridge University Press.

MIT Technology Review. 2003. The Many Tongues of Twitter. http://www.


technologyreview.com/graphiti/522376/the-many-tongues-of-twitter [Diakses Tanggal 4 Mei
2015].

Narayanan, V., Arora, I., Bhatia, A. TT. Fast and accurate sentiment classification using
enhanced Nave Bayes model. India: Department of Electronics Engineering, Indian Institute of
Technology (BHU).

Pang, B., Lee, L., Vithyanathan, S. 2002. Thumbs Up ?Sentiment Classification Using Machine
Learning Techniques. Proceedings of The ACL-02 conference on Empirical methods in natural
language processing (pp. 79-86). Stroudsburg: Association for Computational Linguistic.

Parikh, R. & Movassate, M. 2009. Sentiment Analysis of User Generated Twitter Updates using
Various Classification. http://nlp.stanford.edu/courses/ cs224n/2009/fp/19.pdf [Diakses Tanggal
3 Mei 2015].

Prasad, S. 2010. Micro-blogging Sentimen Analysis Using Bayesian Classification Methods.


http://nlp.stanford.edu/courses/cs224n/2010/reports/suhaasp.pdf [Diakses Tanggal 3 Mei 2015].

Rish, Irina. 2001. An Empirical Study of the Nave Bayes Classifier. T.J. Watson Research
Center. http://www.research.ibm.com/people/r/rish/papers/RC 22230.pdf [Diakses Tanggal 1
Mei 2016].

Rozi, I.F., Pramono, S.H., Dahlan, E.A. 2012. Implementasi Opinion Mining (Analisis
Sentimen) untuk Ekstraksi Data Opini Publik pada Perguruan Tinggi. Jurnal EECCIS Vol. 6,
No. 1.

Saraswati, S. 2011. Text Mining dengan Metode Nave Bayes Classifier dan Support Vector
Machines untuk Sentiment Analysis. Tesis. Bali: Universitas Udayana.

Tala, Fadillah Z. 2003. A Study of Stemming Efects on Information Retrieval in Bahasa


Indonesia. Institute for Logic, Language and Computation Universiteit van Amsterdam The
Netherlands. http://www.illc.uva.nl/ Research/Reports/MoL-2003-02.text.pdf [Diakses Tanggal
3 Mei 2015].

Twitter. 2013. https://support.twitter.com/. Diakses tanggal 30 Maret 2016.

Wang, A. H. 2010. Dont Follow Me: Twitter Spam Detection. Proceedings of 5th International
Conference on Security and Cryptography (SECRYPT) Athens 2010. California: IEEE pp. 1-10.

Weiss, S.M., Indurkhya, N., Zhang, T., Damerau, F.J. 2005. Text Mining : Predictive Methods of
Analyzing Unstructered Information. New York : Springer.

Title of manuscript is short and clear, implies research results (First Author)
6 ISSN: 1978-1520

Wibisono, Y. 2005. Klasifikasi Berita Berbahasa Indonesia. http://fpmipa.upi.


edu/staff/yudi/KNSI_Clustering_yudi_masayu.pdf [Diakses Tanggal 2 Mei 2015].

IJCCS Vol. x, No. x, July 201x : first_page end_page

Anda mungkin juga menyukai