35
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
36
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
37
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
termasuk opini atau bukan, diperlukan rule untuk penelitian ini penulis menggunakan metode Naive Bayes
mengolah data hasil proses POS Tagging. Rule opini Classifier untuk klasifikasi teks, seperti yang dilakukan
yang digunakan dalam penelitian ini ditunjukkan oleh [21] pada persamaan 2.2.
tabel 2.2.
Tabel 2.2 Rule Opini[23] ,
P(v1|C = c) = ………(2.2)
No Rule Contoh
Sangat baik, dengan baik,
1 RB JJ
agak baik
Semoga berjalan, semoga Dimana v1 dalam penelitian ini adalah satu kata
2 RB VB tertentu dalam tweet, sedangkan
membawa
Bukunya bagus, pakaiannya CountTermsv1 , docsvc menunjuk pada jumlah
3 NN JJ kemunculan suatu kata berlabel c (“positif” atau “negatif”
rapi
Pelajaran membosankan, atau “netral”) . AllTerms1docsc2 menunjuk pada
4 NN VB jumlah semua kata berlabel c yang ada pada dataset.
pekataannya menjengkelkan
Mudah difahami, gampang Untuk menghindari adanya nilai nol pada probabilitas,
5 JJ VB maka diberlakukan Laplace (add-one) smoothing. Tujuan
dimaafkan
6 CK JJ Bagus atau baik, tetapi malas daripada smoothing adalah untuk mengurangi
7 JJ BB Sama bagus probabilitas dari hasil/keluaran yang terobeservasi, dan
Membuat merinding, juga sekaligus meningkatkan/menambah probabilitas
8 VB VB hasil/keluaran yang belum terobservasi[22], sehingga
membikin pusing
9 JJ RB Indah sekali, bagus sekali persamaan menjadi sebagi berikut:
10 VB JJ Membikin bingung
1 ,23
Tidak seindah, tidak P(v1|C = c) = ...…(2.3)
11 NEG JJ 123|4|
semudah
Tidak mengerti, tidak
12 NEG VB Dimana |V| menunjuk pada jumlah semua kata dalam
memahami
tweet yang ada di dataset.
13 PRP VBI Saya menyukai
14 PRP VBT Kita suka 3. METODOLOGI PENELITIAN
15 VBT NN Memiliki kedekatan 3.1. Studi Literatur dan Pemahaman
16 MD VBT Perlu mengambil referensi Pada tahap ini, penulis mencari dan mempelajari
17 MD VBI Perlu dikembangkan referensi berupa textbook, artikel ilmiah maupun jurnal
yang berkaitan dengan penelitian. Topik yang akan
2.9 Naïve Bayes Classifier dibahas antara lain : analisis sentimen, part-of-speech
Naïve Bayes Classifier merupakan sebuah metode tagging pada kalimat bahasa Indonesia dan metode
klasifikasi dengan probabilitas sederhana yang klasifikasi Naive Bayes Classifier.
mengaplikasikan Teorema Bayes dengan asumsi
ketidaktergantungan (independen) yang tinggi. 3.2. Pengumpulan Data
Penggunaan metode Naive Bayes Classifier pada Dataset yang akan digunakan dalam penelitian adalah
penelitian ini didasarkan pada banyaknya dataset yang public timeline tweet bahasa Indonesia yang merupakan
dipakai sehingga membutuhkan suatu metode yang hasil pencarian berdasarkan percakapan seseorang
mempunyai performansi yang cepat dalam terhadap account resmi tokoh politik yang akan maju
pengklasifikasian serta keakuratan yang cukup tinggi[4]. sebagai calon presiden Indonesia 2014. Beberapa account
Keuntungan penggunaan Naive Bayes Classifier adalah resmi yang diambil diantaranya, @jokowi_do2 (Joko
metode ini hanya membutuhkan jumlah data pelatihan Widodo), @Prabowo08 (Prabowo Subianto), @Pak_JK
(training data) yang kecil untuk menentukan estimasi (Jusuf Kalla), @hattarajasa (Hatta Rajasa). Dataset
parameter yang diperlukan dalam proses didapatkan dengan cara streaming memanfaatkan API
pengklasifikasian[20]. dari Twitter kemudian disimpan dalam bentuk database.
Metode Naive Bayes Classifier menempuh dua tahap Pengambilan data tweet dilakukan pada tiga periode
dalam proses klasifikasi teks, yaitu tahap pelatihan dan berbeda. Yang pertama periode sebelum pemilu legislatif,
tahap klasifikasi. Pada tahap pelatihan dilakukan proses yaitu pada tanggal 1 Februari sampai 3 Februari 2014.
tehadap sampel data yang sedapat mungkin dapat Kemudian saat pemilu legislatif, antara tanggal 7 April
menjadi representasi data tersebut. Selanjutnya adalah sampai 9 April 2014. Periode terakhir adalah setelah
penetuan probabilitas prior bagi tiap kategori pengumuman deklarasi pasangan capres dan cawapres
berdasarkan sampel data. Pada tahap klasifikasi yang resmi maju ke pemilihan umum presiden dan wakil
ditentukan nilai kategori dari suatu data berdasarkan term presiden Indonesia tahun 2014.
yang muncul dalam data yang diklasifikasi. Teorema 3.3. Implementasi
Naïve Bayes dapat dinyatakan dalam persamaan 2.1. Implementasi penelitian ini dilakukan dengan
langkah kerja seperti gambar. 3.1.
|
PX | Y = ∑ ……………………….(2.1)
|
38
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
39
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
Prabowo Subianto lebih banyak dari tokoh lainnya. terjadi penurunan sentimen negatif terhadap Joko Widodo
Prabowo Subianto unggul sebanyak 4474 tweet, mejadi 34,4%.
dibandingkan dengan Joko Widodo yang mendapat 3281 Perolehan sentimen positif pada keseluruhan periode
tweet. Sedangkan Jusuf Kalla dan Hatta Rajasa hanya waktu menunjukkan calon presiden Prabowo Subianto
mendapat 35 dan 8 tweet saja. Kemudian pada periode lebih unggul mendapatkan 47,6% dibandingkan calon
waktu selanjutnya, yaitu saat diadakan pemilu legislatif, presiden Joko Widodo yang mendapatkan 35%.
perolehan tweet Prabowo Subianto masih unggul Sedangkan untuk sentimen negatif, Joko Widodo
dibandingkan tokoh politik yang lainnya dengan mendapatkan perolehan yang lebih tinggi sebesar 36,9%
perolehan 9942. Periode yang terakhir adalah saat setelah dibandingkan dengan Prabowo Subianto yang mendapat
deklarasi pengumuman pasangan capres dan cawapres sentimen negatif sebesar 26,9%. Dan untuk sentimen
yang resmi akan maju dalam pemilu Indonesia tahun berpolaritas netral Joko Widodo lebih unggul sebanyak
2014 menunjukkan bahwa Prabowo Subianto tetap 36,9% sedangan Prabowo Subianto mendapatkan 26,9%.
unggul dibanding tokoh politik yang lain. Prabowo
Subianto unggul mendapat 19297 tweet, Joko Widodo
mendapat 16212 tweet, Jusuf Kalla mendapat 5647 tweet 4.1.4. Analisis Sentimen Terhadap Calon Wakil
dan Hatta Rajasa mendapat 1213 tweet. Presiden
Hal ini dapat disimpulkan bahwa percakapan atau
opini masyarakat terhadap account resmi tokoh politik
yang akan maju sebagai calon presiden dan wakil
presiden Indonesia tahun 2014, menempatkan Prabowo
Subianto sebagai capres yang banyak dibicarakan di
jejaring sosial Twitter. Sedangkan untuk cawapres, Jusuf
Kalla yang menjadi pasangan dari Joko Widodo
mendapat opini lebih tinggi dari Hatta Rajasa dimana
beliau adalah cawapres dari Prabowo Subianto. Dari
grafik ini pula dapat dilihat bahwa perkembangan antara
periode pengambilan data tweet semakin naik pada setiap
periode waktu.
4.1.3. Analisis Sentimen Terhadap Calon Presiden 4.3 Statistik Polaritas Tweet Cawapres Indonesia
Tahun 2014
40
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
adalah 60,4%. Sedangkan kecenderungan sentimen terhadap capres dan cawapres Prabowo Subianto - Hatta
positif tehadap Hatta Rajasa pada periode kedua adalah Rajasa. Sentimen terhadap Prabowo Subianto setelah
48%. Kemudian periode ketiga yaitu saat setelah berpasangan dengan Hatta Rajasa terjadi kenaikan tipis
deklarasi berpasangan dengan calon presiden, entimen dari 47,6% menjadi 47,7%. Sedangkan sentimen
positif terhadap Jusuf Kalla cenderung menurun menjadi berpolaritas negatif juga terjadi penurunan sebesar 0,5%
44,8%. Sedangkan Hatta Rajasa terjadi peningkatan dari 26,9% menjadi 26,4%. Untuk sentimen berpolaritas
sentimen positif menjadi 49, 2%. netral, terjadi kenaikan dari 25,2% menjadi 25,9%.
Secara keseluruhan periode waktu, Hatta Rajasa
mendapatkan sentimen positif yang lebih tinggi daripada 5. KESIMPULAN
Jusuf Kalla. Hatta Rajasa mendapat 48,6% sedangkan Hasil dari pengamatan sentimen masyarakat melalui
Jusuf Kalla menyusul dengan selisihh tipis sebesar jejaring sosial Twitter menunjukkan jumlah percakapan
47,2%. Dilihat dari sentimen negatif, Jusuf Kalla terhadap capres dan cawapres di jejaring sosial Twitter
mendapatkan sentimen negatif yang lebih tinggi daripada menjelang mendekati pemilu 2014 semakin meningkat.
Hatta Rajasa. Jusuf Kalla mendapatkan 25,4% sedangkan Jumlah percakapan terhadap pasangan Prabowo Subianto
Hatta Rajasa mendapatkan 16,3%. Sedangkan untuk – Hatta Rajasa lebih unggul sebesar 53% dibandingkan
sentimen berpolaritas netral, perolehan Jusuf Kalla lebih percakapan terhadap pasangan Joko Widodo – Hatta
tinggi dibandingkan dengan Hatta Rajasa, yaitu 25,4% Rajasa yang mendapat 47 %.
dan 16,3%. Hasil dari pengamatan polaritas sentiment
masyarakat terhadap pasangan calon presiden dan wakil
4.1.5. Analisis Sentimen Terhadap Pasangan Calon preside menunjukkan pasangan Prabowo Subianto –
Presiden dan Wakil Presiden Hatta Rajasa mendapatkan 47,7% untuk sentimen positif,
26,4% sentimen negatif dan 25,9% sentimen netral.
Sedangkan pasangan Joko Widodo – Jusuf Kalla
mendapatkan total 37,6% sentimen positif, 34,4%
sentimen negatif, dan 27,9 sentimen netral. Dari hal ini
dapat disimpulkan bahwa pasangan Prabowo Subianto –
Hatta Rajasa lebih unggul dari pasangan Joko Widodo –
Jusuf Kalla dalam hal jumlah percakapan dan sentimen
positif pada jejaring sosial Twitter.
6. SARAN
Adapun saran yang dipertimbangkan untuk
pengembangan penelitian selanjutnya adalah dengan
mengkombinasikan sistem deteksi spam tweet untuk
meningkatkan kualitas hasil tweet. Kemudian pada
4.4 Statistik Polaritas Pasangan Joko Widodo – Jusuf
penelitian selanjutnya bisa menggunakan data opini dari
Kalla
jejaring sosial selain Twitter seperti Facebook, Youtube,
Path, komentar bertita, maupun forum untuk mengetahui
Grafik 4.4 mununjukkan hasil polaritas sentimen
perbandingan bagaimana keakuratan hasil analisa
terhadap capres dan cawapres Joko Widodo dan Jusuf
sentimen dengan data aktual yang tejadi.
Kalla. Terlihat sentimen positif terhadap pasangan Joko
Widodo – Jusuf Kalla sebesar 37,6%. Hal ini
menunjukkan peningkatan terhadap sentimen positif Joko 7. DAFTAR PUSTAKA
[1] Beritagar.com. (2013). Statistik pengguna
Widodo yang sebelumnya mendapatkan 35% sebelum
Twitter Indonesia Oktober 2013. Diakses 30
berpasangan dengan Jusuf Kalla. Sedangkan polaritas
Desember 2013.
sentimen negatif terjadi penurunan setelah Joko Widodo
(http://beritagar.com/p/statistik-pengguna-
berpasangan dengan Jusuf Kalla. Penurunan terjadi dari
twitter-indonesia-oktober-2013-10207)
semula 36,9% menjadi 34,4%. Penurunan juga terjadi
[2] Bolen, Johan; Mao, Huina; Zeng, Xiaojung.
pada polaritas sentimen netral pasangan Joko Widodo –
(2011) Twitter mood predicts the stock market.
Jusuf Kalla yaitu sebesar 0,2% dari 28,1% menjadi
Dalam Journal of Computational Science 2
27,9%.
p.1–8
[3] Natalius, Samuel., 2011, Metoda Naïve Bayes
Classifier dan Penggunaannya pada Klasifikasi
Dokumen.
[4] Larose, D. T. 2006. Naïve Bayes Estimation
and Bayesian Networks, in Data Mining
Methods and Models, John Wiley & Sons, Inc.,
Hoboken, NJ, USA. doi:
10.1002/0471756482.ch5
[5] McCue, Rita. (2009) A Comparison of the
Accuracy of Support Vector Machine and Naıve
Bayes Algorithms In Spam Classification.
[6] Parikh, R., & Movassate, M. (2009).
Sentimen Analysis of User Generated Twitter
4.5 Statistik Polaritas Pasangan Prabowo Subianto-Hatta Updates using Various Classification
Rajasa [7] Rozi, Imam F; Pramono Sholeh H; Dahlan,
Grafik 4.5 mununjukkan hasil polaritas sentimen Achmad E. (2012) Implementasi Opinion
41
JURNAL ITSMART Vol 2. No 2. Desember 2013 ISSN : 2301–7201
42