G14 Ead
G14 Ead
EGA ADITYAWAN
Ega Adityawan
NIM G64100099
ABSTRAK
ABSTRACT
EGA ADITYAWAN. Sentiment Analysis with Naïve Bayes Classification on
Twitter Data Using Balanced Data. Supervised by AHMAD RIDHA.
The purpose of this research is to classify tweet data into 3 sentiments, i.e.,
positive, negative, and neutral using balanced data. The data consists of 8 different
entities where each entity consists of 80-90 tweets for each sentiment. Data
classification uses naïve Bayes with Multinomial and Bernoulli method. Before
classification, preprocessing includes normalization and stopword removal.
Evaluation is conducted on 60 data of each entity per sentiment to get the best
model using 3-fold cross validation. After that, the remaining data from previous
evaluation is considered to be new data. The new data will be classified using the
training data of the best models in the 3-fold cross validation. Classification
results on new data shows, that naïve Bayes method gives an accuracy rate of
71.09% and 66.42% for the Multinomial and Bernoulli. The accuracy rate of each
sentiment for Multinomial and Bernoulli models respectively are 58.62% and
64.53% and for the positive sentiment, 77.42% and 65.53% for the negative
sentiment, 64.40% and 84.18% for the neutral sentiment.
EGA ADITYAWAN
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Komputer
pada
Departemen Ilmu Komputer
Disetujui oleh
Diketahui oleh
Tanggal Lulus:
PRAKATA
Segala puji bagi Allah subhanahu wata’ala atas segala rahmat serta karunia-
Nya yang telah diberikan sehingga penulis mampu menyelesaikan karya ilmiah ini
dengan baik. Shalawat dan salam semoga senantiasa tercurah kepada Nabi
Muhammad shallallahu ‘alaihi wasallam serta kepada keluarganya, sahabatnya,
serta para pengikutnya yang selalu berpegang kepada Al-Quran dan As-Sunnah.
Terima kasih penulis ucapkan kepada Bapak Ahmad Ridha, SKom MS
selaku pembimbing yang telah memberikan banyak ide, saran, bantuan, serta
dukungan sampai selesainya karya ilmiah ini, serta yang telah berkenan menjadi
penguji Bapak Aziz Kustiyo, SSi MKom dan Ibu Dr Imas S Sitanggang, SSi
MKom yang telah banyak memberikan saran. Ungkapan terima kasih juga
disampaikan kepada ayah, ibu, adik, serta seluruh keluarga, atas doa dan kasih
sayangnya. Terima kasih juga disampaikan kepada Ahmad Thoriq Abdul Aziz
atas bantuan diberikannya semua sumberdaya pada penelitian sebelumnya serta
rekan-rekan seperjuangan di Ilmu Komputer IPB angkatan 47 atas segala
kebersamaan, bantuan, dukungan, serta kenangan bagi penulis selama menjalani
masa studi.
Semoga karya ilmiah ini bermanfaat.
Ega Adityawan
DAFTAR ISI
DAFTAR TABEL x
DAFTAR LAMPIRAN x
PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 1
Manfaat Penelitian 2
Ruang Lingkup Penelitian 2
METODE 2
Pengumpulan Data 3
Penentuan Sentimen Secara Manual 3
Normalisasi Teks 3
Evaluasi Normalisasi Teks 3
Pembuangan Stopword 4
K-fold Cross Validation 4
Klasifikasi Menggunakan Naïve Bayes 4
EvaluasiHasil Klasifikasi 6
Lingkungan Implementasi 6
HASIL DAN PEMBAHASAN 6
Pengumpulan Data 6
Penentuan Sentimen Secara Manual 6
Normalisasi Teks 7
Evaluasi Normalisasi Teks 7
Pembuangan Stopword 7
K-fold Cross Validation 8
Klasifikasi Menggunakan Naïve Bayes 9
KESIMPULAN DAN SARAN 11
Kesimpulan 11
Saran 12
DAFTAR PUSTAKA 12
RIWAYAT HIDUP 22
DAFTAR TABEL
1 Hasil 3-Fold Cross Validation untuk entitas XL 8
2 Hasil 3-Fold Cross Validation 9
3 Confusion matrix untuk hasil klasifikasi menggunakan naïve Bayes
model Multinomial 11
4 Confusion matrix untuk hasil klasifikasi menggunakan naïve Bayes
model Bernoulli 11
DAFTAR LAMPIRAN
1 Contoh keyword pada pengumpulan data 13
2 Contoh tabel kamus kata dalam normalisasi teks 13
3 Daftar kata buang pada stoplist (Ridha et al. 2002) 14
4 Daftar kata tambahan normalisasi teks 15
5 Confusion matrix 3-fold cross validation terbaik 16
6 Contoh tabel kata dan frekuensi pada tiap sentimen 20
7 Contoh tabel kata dan peluang pada tiap sentimen 21
2
1
PENDAHULUAN
Latar Belakang
Perumusan Masalah
Tujuan Penelitian
Manfaat Penelitian
Ruang lingkup penelitian ini menggunakan data statis dari Twitter yang
telah dikumpulkan dan berbahasa Indonesia. Data tweet diklasifikasikan
menggunakan teknik naïve Bayes dengan 3 kelas sentimen, yaitu positif, negatif,
dan netral. Penelitian ini tidak menangani keberadaan entitas yang ambigu.
METODE
Metode yang digunakan dalam penelitian ini terdiri atas 8 tahap, seperti
pada Gambar 1. Tahap pertama adalah pengumpulan data. Data yang digunakan
berasal dari jejaring sosial Twitter. Setelah data didapatkan, langkah selanjutnya
ialah melakukan penentuan sentimen secara manual terhadap data tersebut.
Kemudian, data dianalisis untuk mendapatkan sentimennya. Namun, sebelum
dilakukan analisis sentimen, data harus masuk ke dalam tahap praproses terlebih
dahulu, yaitu normalisasi dan pembuangan stopwords. Normalisasi teks bertujuan
mengubah tweet yang awalnya sulit dimengerti menjadi tweet yang mudah
dimengerti. Untuk mengetahui tingkat efektivitas proses normalisasi teks ini,
dilakukan evaluasi terhadap hasil normalisasi. Tahap praproses selanjutnya adalah
pembuangan stopwords, pada proses ini kata-kata yang kemunculannya tinggi dan
dianggap tidak memiliki makna akan dihilangkan. Setelah itu dilakukan k-fold
cross validation dengan tujuan mendapatkan model data latih terbaik. Pada bagian
klasifikasi sentimen digunakan klasifikasi naïve Bayes model Multinomial dan
Bernoulli. Tahap terakhir adalah evaluasi hasil klasifikasi.
Pengumpulan Data
Tahap pertama adalah pengumpulan data. Data berupa kumpulan tweet yang
belum terklasifikasi namun sudah diekstraksi berdasarkan keyword yang
ditentukan. Penentuan keyword (contoh pada Lampiran 1), ditentukan sesuai
entitas yang ingin di ambil datanya. Data diperoleh selama periode 1 Februari
2014 sampai dengan 20 April 2014. Pengambilan data ini memanfaatkan Twitter
API dan dilakukan secara real time menggunakan aplikasi yang telah dibuat oleh
Hawksey (2013). Untuk menghindari adanya tweet spam digunakan juga batas
minimal follower suatu akun yaitu 200. Tiap tweet dilengkapi dengan atribut
seperti identitas, sentimen, topik, isi pesan, keyword, nama pengguna Twitter,
nama entitas, tanggal, dan identitas editor.
Normalisasi Teks
Tweet hasil normalisasi teks dievaluasi secara manual. Evaluasi ini bertujuan
menghitung tingkat akurasi dari hasil normalisasi. Proses evaluasi dilakukan
terhadap 1000 tweet yang diambil secara acak mengingat banyaknya jumlah tweet
yang ada.
4
Pembuangan Stopword
didapatkan, akan dihitung nilai peluang untuk kata t masuk pada sentimen c
(P(t|c)). Perhitungan peluang ini dapat bernilai nol apabila frekuensi kata pada
data uji di sentimen c (Tct) bernilai nol. Untuk mengatasi masalah ini, dimasukkan
koreksi seperti Laplace smoothing di semua probabilitas perkiraan sehingga
peluang tidak bernilai nol (Manning et al. 2008). Perhitungan peluang model
Multinomial dapat dilihat pada persamaan berikut:
Tct+1 (1)
P tc =
( t'∈V Tct')+B
N (2)
n
P cd = P t c *P c
i=1
Sementara itu, pada model Bernoulli, setiap data uji dihitung nilai peluang
tiap kata terhadap masing-masing sentimen. Perbedaannya dengan model yang
pertama yaitu perhitungan peluang menggunakan jumlah data yang mengandung
kata t (Tct), bukan frekuensi kemunculan kata t (Manning et al. 2008). Selain itu,
jika model Multinomial menggunakan jumlah kata dan jumlah vocabulary, model
Bernoulli menggunakan jumlah data latih tiap sentimen (Tc) dan jumlah sentimen
(∑c). Peluang tiap kata dihitung menggunakan persamaan:
Tct+1 (3)
P tc =
Tc+∑c
Setelah peluang tiap kata didapatkan, nilai dari hasil perkalian invers untuk
tiap peluang kata pada data latih selain kata pada data uji dihitung. Misalnya ada
sekumpulan kata pada data latih D dan sekumpulan kata pada data uji T.
Selanjutnya dicari kata-kata pada data latih D yang independen dengan kata-kata
pada data uji T. Dari kata-kata tersebut, diambil nilai peluang kata (dalam hal ini
diberi simbol P(t’|c)) dan jumlah kata (M) (Manning et al. 2008). Nilai peluang
kalimat terhadap suatu sentimen dihitung dengan persamaan:
N M
Lingkungan Implementasi
Pengumpulan Data
Pada tahap pengumpulan data diperoleh 1997 data tweet yang terdiri
dari 8 entitas dengan 8 atribut setiap datanya dan menggunakan 41 keyword
yang berbeda untuk pencarian. Setiap entitas per sentimennya terdiri atas
sekitar 80-90 data. Dari atribut yang didapat hanya beberapa atribut saja
yang digunakan, yaitu id sebagai pengenal tweet, isi tweet sebagai input
system, dan keyword sebagai penciri dari entitas. Data dikumpulkan dengan
melakukan penyaringan pada isi tweet-nya menggunakan keyword tertentu.
Sebagai contoh untuk melakukan penyaringan data pada entitas 'Prabowo',
peneliti menggunakan keyword 'Prabowo'. Nantinya tweet yang
mengandung kata 'Prabowo' akan tersaring secara otomatis dan masuk
kedalam database.
Normalisasi Teks
Banyak tweet yang mengandung kata tidak baku. Kata yang tidak baku
dapat berupa pengulangan karakter sehingga sulit dikenali maupun singkatan-
singkatan kata, contohnya @indosatcare knapa sinyal hp ku sdh 3 hr ini tidak
ada?. Kasus pengulangan karakter perlu dilakukan penghilangan karakter yang
berulang. Penghilangan karakter hanya dilakukan pada perulangan karakter teks,
bukan karakter angka, karena jika dilakukan pada angka justru membuat tweet
semakin sulit dipahami atau memiliki arti yang berbeda. Contohnya pada kasus
perulangan angka nomor telepon 0011 yang angka 1 dan 0 pada nomer telepon
tersebut tidak akan dilakukan penghilangan. Pada kasus singkatan-singkatan kata
yang tidak baku, dibuat sebuah kamus yang berisi kata yang tidak baku beserta
kata bakunya. Proses normalisasi melalui 2 tahap, pertama adalah menghilangkan
semua tanda baca seperti titik, tanda koma, dan tanda tanya. Setelah itu dilakukan
proses penggantian kata tidak baku yang ada di tweet dengan kata baku
berdasarkan kamus yang sebelumnya sudah di siapkan. Kata yang dianggap tidak
baku akan digantikan oleh kata yang baku secara otomatis oleh sistem. Kamus
yang digunakan diambil dari penelitian Aziz (2013) dengan melakukan
penambahan beberapa kata (Lihat Lampiran 4) disebabkan oleh karena adanya
perbedaan entitas yang digunakan pada penelitian ini. Dalam normalisasi teks juga
terdapat beberapa kasus kata yang tidak tertangani karena kata yang tidak baku
memiliki makna lebih dari satu, contohnya: bet, bkn, bwt, gws, dah, dan masih
banyak lagi. Kata bet bisa berarti banget, namun bisa juga berarti nama panggilan
seseorang.
Pembuangan Stopword
Setelah itu dilakukan pengujian k-fold croos validation untuk 60 data setiap
entitas per sentimennya. Setiap kelompok data akan tepat satu kali menjadi data
uji dan kelompok lainnya menjadi data latih. Data dibagi menjadi 3 subset data
dan diberi label A, B, dan C dengan jumlah masing-masing sebanyak 60 data yang
terdiri dari 20 data sentimen positif, 20 data sentimen negatif, dan 20 data
sentimen netral. Ada 3 tahap pada proses ini, pertama subset data A dan B akan
menjadi data latih sedangkan subset data C akan menjadi data uji. Kedua data
kelompok B dan C menjadi data latih sedangkan data kelompok A menjadi data
uji. Terakhir data kelompok A dan C menjadi data latih sedangkan data kelompok
B menjadi data uji. Ketiga tahap proses tersebut dilakukan terpisah masing-masing
untuk setiap entitas per sentimennya agar didapat model terbaik untuk setiap
entitas per sentimennya. Setelah semua selesai, didapatkan pasangan subset data
yang terbaik dari proses ini. Contoh proses ini sebagai berikut, pada entitas XL
dikelompokkan data A, B, dan C. Setelah itu, dilakukan pengujian pada data
tersebut. Hasil klasifikasi untuk kedua modelnya pada setiap kelompok data untuk
entitas XL dapat dilihat pada Tabel 1.
Tabel 1 Hasil 3-Fold Cross Validation untuk entitas XL
Multinomial Bernoulli
Perlakuan Akurasi Perlakuan Akurasi
Latih (A dan B) 43.33% Latih (A dan B) 55%
Uji (C) Uji (C)
Latih (C dan B) 43.33% Latih (C dan B) 46.67%
Uji (A) Uji (A)
Latih (A dan C) 50% Latih (A dan C) 60%
Uji (B) Uji (B)
Multinomial Bernoulli
Entitas Nilai Kelompok Nilai Kelompok
Akurasi Akurasi
XL 55% A dan C 60% A dan C
TSEL 65% B dan C 80% A dan C
Indosat 70% A dan B 68.33% A dan C
ARB 75% B dan C 68.33% A dan C
HR 85 % A dan C 98.33 % A dan C
Jokowi 65% B dan C 61.67% B dan C
Prabowo 85% A dan C 81.67% A dan C
Wiranto 85% A dan C 65% B dan C
Seperti ditunjukan oleh Tabel 2 dan Lampiran 5, data tweet yang diduga
bernilai positif banyak yang hasil klasifikasinya menjadi negatif begitu juga
sebaliknya. Hal ini disebabkan oleh belum diperhatikannya penggantian frase
pada kata sehingga saat kata tersebut terkena proses stoplist teks akan berubah
maknanya pada kata yang sebaliknya. Contohnya pada tweet @kurnia Pak
Wiranto orang yang tidak layak menjadi presiden. Setelah mengalami
pemotongan stopword tweet menjadi @kurnia Pak Wiranto orang layak menjadi
presiden sehingga tweet yang diduga sentimen negatif, hasil klasifikasinya
sentimen positif.
Data latih berjumlah 960 yang terdiri atas 320 sentimen positif, 320
sentimen negatif, dan 320 sentimen netral. Data uji berjumlah 557 yang terdiri
dari 203 sentimen positif, 177 sentimen negatif, dan 177 sentimen netral. Data uji
maupun data latih telah diwakili oleh setiap entitas per sentimennya yang
digunakan pada penelitian ini. Data tweet yang tersisa dari proses k-fold cross
validation terdiri atas sekitar 20-30 data dianggap sebagai data baru dan akan
menjalani proses klasifikasi sebagai data uji. Proses klasifikasi mengunakan naïve
Bayes model Multinomial dan model Bernouli, dengan data latih untuk setiap
entitasnya didapatkan dari proses k-fold croos validation yang telah dilakukan.
Model pertama yaitu model Multinomial. Model Multinomial menghitung
nilai peluang setiap data uji terhadap tiap sentimen dengan mengambil nilai
peluang terbesar. Misalnya, sebuah data memliki peluang terhadap sentimen
positif sebesar 0.7, sentimen negatif sebesar 0.2, dan sentimen netral sebesar 0.5.
Hal ini menunjukkan bahwa data masuk ke dalam sentimen positif. Data uji dalam
penelitian ini berupa kalimat sehingga harus dipotong menjadi kata dan dihitung
jumlah kata yang unik atau tidak sama (N). Dari tiap kata tersebut, dihitung nilai
frekuensi kemunculannya pada keseluruhan data latih di tiap sentimen (Tct) dan
frekuensi kemunculannya pada kalimat (n). Untuk mempermudah proses
perhitungan frekuensi kemunculan kata pada keseluruhan data latih, dilakukan
proses training terhadap data latih. Training ini berupa pembuatan suatu tabel
yang berisi kata beserta frekuensi kemunculannya di dalam data latih (contoh pada
Lampiran 6). Selanjutnya, jumlah kata pada data latih masing-masing sentimen
10
dihitung (Tct'). Total kata pada data latih sentimen positif sebanyak 7065,
sentimen negatif sebanyak 3625, dan sentimen netral sebanyak 10060. Pada
keseluruhan data latih, dihitung juga jumlah kata yang unik atau vocabulary (B)
yang dalam penelitian ini berjumlah 3066. Setelah nilai Tct, Tct', dan B
didapatkan, maka nilai peluang suatu kata terhadap suatu sentimen (P(t|c)) dapat
dihitung menggunakan Persamaan 1.
Setelah nilai peluang tiap kata didapatkan, selanjutnya dicari jumlah data
latih keseluruhan suatu sentimen dan jumlah data latih masing-masing sentimen.
Nilai peluang kalimat (d) terhadap suatu sentimen (c) dihitung menggunakan
Persamaan 2. Penempatan suatu data ke dalam suatu sentimen dilakukan
berdasarkan nilai peluang P(c|d). Nilai P(c|d) terbesar menunjukkan bahwa
peluang data untuk masuk ke dalam sentimen tersebut paling besar atau paling
memungkinkan. Rata-rata waktu eksekusi yang dibutuhkan dalam proses
klasifikasi menggunakan naïve Bayes model Multinomial adalah sebesar 4.30
detik per tweet.
Model kedua yaitu model Bernoulli. Model Bernoulli memiliki konsep dasar
yang sama dengan model Multinomial. Perbedaannya terletak pada proses
perhitungan peluang pada model ini menggunakan jumlah dokumen yang
mengandung suatu kata. Langkah pertama, setiap data uji dipotong menjadi kata-
kata. Tiap kata dihitung banyaknya dokumen yang mengandung kata tersebut
untuk setiap sentimen (Tct). Kemudian, total dokumen data latih tiap sentimen
(Tc) dan jumlah sentimen (∑c) dihitung juga. Selanjutnya, nilai peluang tiap kata
dihitung dengan Persamaan 3.
Untuk mempermudah perhitungan nilai peluang tiap kata, dilakukan proses
training seperti pada model Multinomial. Perbedaannya dengan model
Multinomial, pada training kali ini dilakukan pembuatan tabel yang berisi kata,
nilai peluang, dan sentimen (contoh pada Lampiran 7). Perhitungan nilai peluang
kata didapatkan dari tabel jika ada atau menggunakan Persamaan 3 jika tidak
dengan nilai Tct = 0. Setelah nilai peluang tiap kata didapatkan, dihitung nilai dari
hasil perkalian invers untuk tiap peluang kata pada data latih selain kata pada data
uji. Misalnya, ada sekumpulan kata pada data latih D dan sekumpulan kata pada
data uji T. Selanjutnya dicari kata-kata pada data latih D yang independen dengan
kata-kata pada data uji T. Dari kata-kata tersebut diambil nilai peluang kata
(dalam hal ini diberi simbol P(t’|c)) dan jumlah kata (M).
Nilai peluang kalimat terhadap suatu sentimen dihitung menggunakan
Persamaan 4. Rata-rata waktu eksekusi yang dibutuhkan dalam proses klasifikasi
menggunakan naïve Bayes model Bernoulli adalah sebesar 3.03 detik per tweet.
sehingga tingkat akurasi sebesar 71.09%. Hasil evaluasi model ini dapat dilihat
pada Tabel 4 dengan tingkat akurasi sentimen positif sebesar 64.53%, sentimen
negatif sebesar 65.53%, dan sentimen netral sebesar 84.18%.
Dugaan
Positif Negatif Netral
Hasil
Positif 119 18 13
Negatif 29 137 50
Netral 55 22 114
Dugaan
Positif Negatif Netral
Hasil
Positif 131 13 11
Negatif 20 116 17
Netral 52 48 149
Kebanyakan data yang diduga pada sentimen positif dan negatif justru
menghasilkan sentimen netral pada hasil klasifikasinya. Contohnya pada tweet
@AndiJ pilih mantan menteri ekonomi pak hatta rajasa presiden. Tweet ini
termasuk dalam sentimen positif tetapi hasil klasifikasinya sentimen netral.
Kesalahan tersebut dikarenakan kata menteri banyak terdapat pada sentimen netral
seperti pada contoh tweet @Gerindra Pak prabowo bertemu menteri pertanian
pagi atau @siddikak Hari ini Pak Jokowi mendatangi menteri pekerjaan umum.
Hal ini terjadi karena suatu kata pada entitas bisa berbeda makna dientitas lainnya.
Kesimpulan
Selisih akurasi setiap sentimennya tidak terlalu besar dan juga tidak ada satu
sentimen yang lebih dominan secara mutlak dibanding sentimen lainnya.
Saran
DAFTAR PUSTAKA
[Alexa]. 2013. Top 500 sites on the web [internet]. [diunduh 2014 januari 1].
Tersedia dari: http://www.alexa.com/topsites.
Aziz ATA. 2013. Sistem pengklasifikasian entitas pada pesan Twitter
menggunakan ekspresi regular dan Naïve Bayes [skripsi]. Bogor (ID):
Institut Pertanian Bogor.
Barnes JA. 1969. Graph theory and social networks: a technical comment on
connectedness and connectivity. Sociology. 3(2): 215-232.
Hawksey M. 2013. Twitter Archiving Google Spreadsheet TAGS v5 [internet].
[diunduh 2014 Januari 21]. Tersedia dari:
http://mashe.hawksey.info/2013/02/twitter-archive-tagsv5/.
Manning CD, Raghavan P, Schütze H. 2008. An Introduction to Information
Retrieval. Cambridge (UK): Cambridge University Press.
Meira JR, Zaki MJ. 2014. Data Mining and Analysis Fundamental Concepts
and Algorithms. Cambridge (UK): Cambridge University Press.
Ridha A, Adisantoso J, Bukhari F. 2004. Pengindeksan otomatis dengan
istilah tunggal untuk dokumen berbahasa Indonesia. Prosiding Seminar
Nasional Ilmu Komputer dan Teknologi Informasi V, SNIKTI 2014; [Waktu
dan tempat pertemuan tidak diketahui]. hlm 328-335.
Saumi RR. 2012. Apa itu sosial media [internet]. [diunduh 2014 April 24].
Tersedia dari: http://www.unpas.ac.id/apa-itu-sosial-media/.
[Semiocast]. 2012. Top 20 Cities By Number Of Tweets [Internet]. [diunduh
2013 Des 20]. Tersedia dari:
http://semiocast.com/publications/2012_07_30_Twitter_reaches_half_a_bil
lion_accounts_140m_in_the_US.
Sproat S, Black AW, Chen S, Kumar S, Ostendorf M, Richards C. 2001.
Normalization of non-standard words. Computer Speech and Language.
15:287-333.doi:10.1006/csla.2001.0169.
[Tempo]. 2012. Indonesia Pengguna Twitter Terbesar Kelima Dunia
[internet]. [diunduh 2013 Des 1]. Tersedia dari:
http://www.tempo.co/read/news/2012/02/02/07238132.
13
No Keyword Entitas
1 xlcare xl
2 xl123 xl
3 indosat indosat
4 indosatcare indosat
5 telkomsel tsel
6 telkomselflash tsel
7 tselbb tsel
8 prabowo prabowo
9 jokowi jokowi
10 wiranto wiranto
11 hatta rajasa hatta rajasa
12 arb arb
13 aburizal bakrie arb
14 hr hatta rajasa
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 10 3 6
Negatif 6 11 2
Netral 4 6 12
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 15 4 5
Negatif 3 13 7
Netral 2 3 8
Entitas TSEL
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 16 0 4
Negatif 1 18 13
Netral 3 2 3
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 18 0 1
Negatif 0 18 7
Netral 2 2 12
17
Lanjutan
Entitas Indosat
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 10 0 3
Negatif 4 17 2
Netral 6 3 15
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 9 1 1
Negatif 0 14 1
Netral 11 5 18
Entitas ARB
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 13 2 1
Negatif 4 17 3
Netral 3 1 16
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 12 6 1
Negatif 6 13 3
Netral 2 1 16
18
Lanjutan
Entitas HR
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 16 0 0
Negatif 3 18 3
Netral 1 2 17
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 19 0 0
Negatif 0 20 0
Netral 1 0 20
Entitas Jokowi
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 10 3 2
Negatif 6 15 4
Netral 4 2 14
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 15 1 1
Negatif 0 8 5
Netral 5 11 14
19
Lanjutan
Entitas Prabowo
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 14 1 0
Negatif 6 18 1
Netral 0 1 19
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 15 2 3
Negatif 3 17 0
Netral 2 1 17
Entitas Wiranto
Model Multinomial
Dugaan
Positif Negatif Netral
Hasil
Positif 18 3 3
Negatif 2 16 0
Netral 0 1 17
Model Bernoulli
Dugaan
Positif Negatif Netral
Hasil
Positif 15 7 3
Negatif 1 10 3
Netral 4 3 14
20
RIWAYAT HIDUP
Penulis dilahirkan di Trenggalek, Jawa Timur pada tanggal 30 Juni 1992 dan
merupakan anak pertama dari pasangan Agus Suharyanto dan Narwati. Pada tahun
2010, penulis menamatkan pendidikan di SMAI Nurul Fikri Boarding School,
Banten. Penulis lulus seleksi masuk Institut Pertanian Bogor (IPB) pada tahun yang
sama melalui jalur Undangan Seleksi Masuk IPB dan diterima sebagai mahasiswa di
Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam.
Selama aktif menjadi mahasiswa, penulis pernah menjadi asisten praktikum
Algoritma dan Pemrograman (2012). Penulis juga melaksanakan kegiatan Praktik
Kerja Lapangan di PT. Pertamina EP pada tahun 2013. Selain itu, penulis juga aktif
mengikuti berbagai pelatihan diluar kampus yang diantaranya Oracle database 11g
SQL Fundamental 2013, Oracle database 11g Administrator 1 2014, dan Building
Datawarehouse 2014. Penulis juga telah tersertifikasi untuk bidang database pada
Oracle database 11g ascociate tahun 2014 dan Junior database programmer SKKNI.