Naskah TA 5170411152 Andhika Pratama

ANALISIS SENTIMEN PADA KOMENTAR AKUN
INSTAGRAM JOKOWI MENGGUNAKAN METODE NAÏVE

BAYES CLASSIFIER
HALAMAN JUDUL
LAPORAN TUGAS AKHIR
ANDHIKA PRATAMA
5170411152
PROGRAM STUDI INFORMATIKA

FAKULTAS SAINS & TEKNOLOGI
UNIVERSITAS TEKNOLOGI YOGYAKARTA
2021
HALAMAN PENGESAHAN
ii
LEMBAR PERNYATAAN
iii
KATA PENGANTAR
Puji syukur dipanjatkan atas kehadirat Allah SWT, karena dengan

limpahan karunia-Nya penulis dapat menyelesaikan Tugas Akhir dengan judul
Analisis Sentimen Pada Komentar Akun Instagram Jokowi Menggunakan Metode
Naïve Bayes Classifier.
Penyusunan Tugas Akhir diajukan sebagai salah satu syarat untuk
memperoleh gelar sarjana pada Program Studi Informatika Fakultas Sains &
Teknologi Universitas Teknologi Yogyakarta.
Tugas Akhir ini dapat diselesaikan tidak lepas dari segala bantuan,
bimbingan, dorongan, dan doa dari berbagai pihak, yang pada kesempatan ini
penulis ingin menyampaikan ucapan terima kasih kepada:
a. Bapak Dr. Bambang Moertono S., MM., Ak., CA., selaku Rektor
Universitas Teknologi Yogyakarta.
b. Ibu Dr. Endy Marlina MT, selaku Dekan Fakultas Sains & Teknologi
Universitas Teknologi Yogyakarta.
c. Ibu Dr. Enny Itje Sela S.Si., M.Kom., selaku Ketua Program Studi
Informatika Universitas Teknologi Yogyakarta.
d. Bapak Muhammad Fachrie, S.T., M.Cs. selaku Dosen Pembimbing Tugas
Akhir yang selalu memberikan bimbingan serta arahan hingga saya dapat
menyelesaikan Proyek Tugas Akhir.
e. Kepada Kedua Orang Tua, keluarga, teman teman dan kekasih saya yang
bernama Syima tercinta, yang senantiasa memberikan kasih sayang,
dukungan doa dan motivasi yang tak pernah berhenti untuk menuntun saya
sehinga sampai saat ini, semoga Allah selalu melindungi kita semua.
iv
Akhir kata, penulis menyadari bahwa sepenuhnya akan terbatasnya
pengetahuan penyusun sehingga tidak menutup kemungkinan jika ada kesalahan
serta kekurangan dalam penyusunan Tugas Akhir, untuk itu sumbang saran dari
pembaca sangat diharapkan sebagai bahan pelajaran berharga di masa yang akan
datang.
Yogyakarta, 20 April 2021
Penulis
v
ABSTRAK
Instagram merupakan media sosial yang cukup populer saat ini. Pengguna yang
dimulai dari anak-anak, remaja hingga orang dewasa turut mendongkrak
popularitas instagram. Dalam suatu postingan instagram, semua orang dapat
dengan bebas menulis komentar. Tidak jarang pengguna instagram berkomentar
dengan kata-kata kasar bahkan tidak segan mengeluarkan ujaran kebencian.
Begitu pula pada akun instagram Presiden Republik Indonesia yaitu Bapak Joko
Widodo dengan nama akun @jokowi biasanya kritikan, pujian, hinaan warganet
tertuang dalam kolom komentar yang ada pada setiap postingannya. Media sosial
dapat dimanfaatkan untuk menganalisis sentimen dari komentar pengguna
instagram sehingga dapat menggambarkan seberapa puas masyarakat terhadap
kinerja pak Jokowi. Analisis sentimen merupakan suatu cabang ilmu dari text
mining yang digunakan untuk mengekstrak, memahami, dan mengolah data teks.
Dalam penelitian ini analisis sentimen berupa proses klasifikasi dokumen tekstual
ke dalam dua kelas, yaitu kelas sentimen negatif dan positif. Untuk mengetahui
klasifikasi setiap sentimen pada komentar digunakan metode Naïve Bayes
Classifier. Dari penelitian yang telah dilakukan, peneliti telah berhasil membuat
sistem analisis sentimen dengan hasil rata – rata akurasi sebesar 83%, precission
sebesar 90,25% dan recall sebesar 74,49% dari 750 data latih dan 250 data uji.
Kata Kunci: Analisis Sentimen, Naïve Bayes Classifier, Instagram.
vi
ABSTRACT
Instagram is a social media that is quite popular nowadays. Users ranging from
children, teenagers to adults also boosted the popularity of Instagram. In an
instagram post, everyone can freely write a comment. Not infrequently instagram
users comment with harsh words do not even hesitate to issue hate speech.
Similarly, on the instagram account of the President of the Republic of Indonesia,
Mr. Joko Widodo with the account name @jokowi usually criticism, praise,
insults warganet contained in the comments column on each post. Social media
can be used to analyze the sentiment of instagram user comments so as to
describe how satisfied the public is with mr. Jokowi's performance. Sentiment
analysis is a branch of text mining science used to extract, understand, and
process text data. In this study sentiment analysis in the form of textual document
classification process into two classes, namely negative and positive sentiment
classes. To know the classification of each sentiment on the comment used naïve
bayes classifier method. From the research that has been done, researchers have
managed to create a sentiment analysis system with average results - average
accuracy of 83%, precission of 90.25% and recall of 74.49% of 750 training data
and 250 test data.
Keywords : Sentiment Analysis, Naïve Bayes Classifier, Instagram
vii
DAFTAR ISI
DAFTAR ISI
HALAMAN JUDUL.............................................................................................1i
HALAMAN PENGESAHAN................................................................................ii
LEMBAR PERNYATAAN..................................................................................iii
KATA PENGANTAR...........................................................................................iv
ABSTRAK.............................................................................................................vi
ABSTRACT...........................................................................................................vii
DAFTAR ISI.......................................................................................................viii
DAFTAR GAMBAR..............................................................................................x
DAFTAR TABEL................................................................................................xii
BAB I Pendahuluan...............................................................................................1
1.1 Latar Belakang...................................................................................................1
1.2 Rumusan Masalah..............................................................................................2
1.3 Batasan Masalah................................................................................................2
1.4 Tujuan penelitian................................................................................................2
1.5 Manfaat Penelitian.............................................................................................3
1.6 Sistematika Penulisan........................................................................................3
BAB II Kajian Hasil Penelitian dan Landasan Teori.........................................5

2.1 Kajian Hasil Penelitian.......................................................................................5
2.2 Landasan Teori.................................................................................................15
2.2.1 Analisis Sentimen.....................................................................................15
2.2.2 Pre-Processing..........................................................................................15
2.2.3 TF-IDF.....................................................................................................16
2.2.4 Naïve Bayes Classifier.............................................................................17
2.2.5 PHP...........................................................................................................18
2.2.6 Data Flow Diagram (DFD)......................................................................19
2.2.7 Entity Relationship Diagram (ERD)........................................................20
BAB III METODE PENELITIAN.....................................................................21

3.1 Bahan / Data.....................................................................................................21
3.1.1 Data Yang Diperoleh................................................................................21
3.1.2 Prosedur Pengumpulan Data....................................................................22
3.2 Aturan Bisnis....................................................................................................24
3.2.1 Analisis Sistem Saat Ini............................................................................24
3.2.2 Kelemahan Sistem Saat Ini......................................................................25
3.3 Tahapan Penelitian...........................................................................................25
BAB IV ANALISIS DAN DESAIN SISTEM....................................................27

4.1 Analisis Sistem Yang Diusulkan......................................................................27
4.1.1 Analisis Fungsional..................................................................................27
4.1.2 Analisis Non Fungsional..........................................................................28
4.1.3 Arsitektur Sistem......................................................................................29
viii
ix
4.2 Desain Sistem...................................................................................................30

4.2.1 Desain Logik............................................................................................30
4.2.2 Desain Fisik..............................................................................................44
BAB V IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN................48

5.1 Implementasi....................................................................................................48
5.1.1 Implementasi Hardware dan Software.....................................................48
5.1.2 Implementasi Script Inti Sistem...............................................................49
5.2 Hasil.................................................................................................................61
5.2.1 Hasil Uji Coba..........................................................................................61
5.2.2 Pembuktian Dengan Perhitungan Manual................................................70
5.3 Pembahasan......................................................................................................75
BAB VI PENUTUP..............................................................................................76
6.1 Simpulan..........................................................................................................76
6.2 Saran.................................................................................................................76
DAFTAR PUSTAKA...........................................................................................77
LAMPIRAN..........................................................................................................80
DAFTAR GAMBAR
Gambar 3. 1 Screenshoot akun @jokowi...............................................................22

Gambar 3. 2 Screenshoot salin link.......................................................................22
Gambar 3. 3 Screenshoot website exportcomments.com.......................................23
Gambar 3. 4 Screenshoot hasil download data......................................................23
Gambar 3. 5 Screenshoot data yang sudah diberi label.........................................24
Gambar 3. 6 Flowchart Sistem Saat Ini.................................................................24
Gambar 3. 7 Diagram Tahapan Penelitian.............................................................25
Gambar 4. 1 Arsitektur Sistem...............................................................................29
Gambar 4. 2 Diagram Konteks..............................................................................30
Gambar 4. 3 Diagram Jenjang...............................................................................31
Gambar 4. 4 DAD Level 1.....................................................................................32
Gambar 4. 5 DAD Level 2 Proses 2......................................................................33
Gambar 4. 6 Flowchart Pre Processing..................................................................34
Gambar 4. 7 Flowchart Training Dataset...............................................................35
Gambar 4. 8 Flowchart Proses Klasifikasi Sentimen.............................................37
Gambar 4. 9 Entity Relationship Diagram (ERD).................................................39
Gambar 4. 10 Rancangan Basis Data.....................................................................40
Gambar 4. 11 Desain Halaman Login Admin.......................................................44
Gambar 4. 12 Desain Halaman Dataset Training..................................................45
Gambar 4. 13 Desain Halaman Dataset Training..................................................45
Gambar 4. 14 Desain Halaman Dataset Testing....................................................46
Gambar 4. 15 Desain Halaman Akurasi................................................................47
Gambar 4. 16 Desain Halaman Hasil Proses Dataset Training.............................47
Gambar 5. 1 Script halaman login.........................................................................49
Gambar 5. 2 Script halaman dashboard.................................................................49
Gambar 5. 3 Script halaman dataset full................................................................49
Gambar 5. 4 Script halaman dataset training.........................................................50
Gambar 5. 5 Script halaman dataset testing...........................................................50
Gambar 5. 6 Script halaman kamus data...............................................................50
Gambar 5. 7 Script pre processing........................................................................51
Gambar 5. 8 Script perhitungan idf........................................................................52
Gambar 5. 9 Script perhitungan tf-idf....................................................................52
Gambar 5. 10 Lanjutan Script perhitungan tf-idf...................................................53
Gambar 5. 11 Script perhitungan idf, tf-idf positif dan negatif.............................54
Gambar 5. 12 Script pre processing dataset testing..............................................55
Gambar 5. 13 Script perhitungan conditional probabilitas....................................56
Gambar 5. 14 Script perhitungan prior probabilitas..............................................56
Gambar 5. 15 Script perhitungan posterior probabilitas.......................................57
Gambar 5. 16 Script proses klasifikasi sentimen...................................................57
Gambar 5. 17 Script perhitungan akurasi..............................................................58
Gambar 5. 18 Script proses testing cross validation..............................................59
Gambar 5. 19 Script proses testing komentar inputan...........................................60
Gambar 5. 20 Hasil halaman login........................................................................61
Gambar 5. 21 Hasil halaman dashboard................................................................61
x
xi
Gambar 5. 22 Hasil halaman dataset full...............................................................62

Gambar 5. 23 Hasil halaman dataset training........................................................62
Gambar 5. 24 Hasil halaman dataset testing..........................................................63
Gambar 5. 25 Hasil halaman kamus data...............................................................63
Gambar 5. 26 Dataset Awal...................................................................................64
Gambar 5. 27 Hasil Proses pre processing............................................................64
Gambar 5. 28 Hasil Proses Perhitungan idf...........................................................65
Gambar 5. 29 Hasil Proses Perhitungan tf-idf (Positif).........................................65
Gambar 5. 30 Hasil Proses Perhitungan tf-idf (Negatif)........................................65
Gambar 5. 31 Hasil Proses Perhitungan total idf dan tf-idf...................................66
Gambar 5. 32 Hasil Proses Pre Processing...........................................................66
Gambar 5. 33 Hasil Proses Perhitungan Conditional Probabilitas........................66
Gambar 5. 34 Hasil Proses Perhitungan Prior Probabilitas...................................67
Gambar 5. 35 Hasil Proses Perhitungan Posterior Probabilitas............................67
Gambar 5. 36 Hasil Proses Klasifikasi Sentimen..................................................67
Gambar 5. 37 Hasil Proses Akurasi.......................................................................68
Gambar 5. 38 Hasil Testing Dataset (cross validation).........................................68
Gambar 5. 39 Hasil Testing Komentar Inputan.....................................................69
Gambar 5. 40 Hasil Pengujian Sistem...................................................................75
DAFTAR TABEL
Tabel 2. 1 Perbandingan Kajian Hasil Penelitian....................................................9

Tabel 2. 2 DFD (Data Flow Diagram)...................................................................19
Tabel 2. 3 Entity Relationship Diagram (ERD).....................................................20
Tabel 3. 1 Sampel Data Mentah.............................................................................21
Tabel 4. 1 Tabel admin..........................................................................................41
Tabel 4. 2 Tabel dataset_test..................................................................................41
Tabel 4. 3 Tabel dataset_train................................................................................42
Tabel 4. 4 Tabel value_idf_tfidf............................................................................42
Tabel 4. 5 Tabel data_tfidf.....................................................................................43
Tabel 4. 6 Tabel value_accuracy...........................................................................43
Tabel 4. 7 Tabel dataset_full..................................................................................43
Tabel 5. 1 Tabel dataset training...........................................................................70
Tabel 5. 2 Tabel hasil pre processing....................................................................70
Tabel 5. 3 Tabel kata unik dan idf.........................................................................71
Tabel 5. 4 Tabel Klasifikasi Kata Unik Positif dan tf-idf......................................72
Tabel 5. 5 Tabel Klasifikasi Kata Unik Negatif dan tf-idf....................................72
Tabel 5. 6 Tabel data test komentar.......................................................................73
Tabel 5. 7 Tabel pre-processing komentar............................................................73
Tabel 5. 8 Tabel conditional probability positif....................................................73
Tabel 5. 9 Tabel conditional probability negatif...................................................73
Tabel 5. 10 Tabel posterior probability positif......................................................74
Tabel 5. 11 Tabel posterior probability negatif.....................................................74
Tabel 5. 12 Hasil pengujian akurasi sistem...........................................................75
xii
BAB I
PENDAHULUAN
I.1 Latar Belakang

Pada era digital tepatnya di tahun 2021, instagram adalah salah satu media
untuk berekspresi dan berpendapat tentang berbagai macam topik. Instagram
merupakan contoh media sosial yang berfungsi untuk berbagi atau memosting
foto maupun vídeo pada sesama pengguna. Dalam suatu postingan instagram,
semua pengguna dapat dengan bebas menulis komentar guna mengekspresikan
pendapat terhadap postingan tersebut. Tidak jarang pengguna berkomentar dengan
kata-kata kasar serta mengeluarkan ujaran kebencian. Pada akun instagram
Presiden Republik Indonesia pada tahun 2021 yaitu @jokowi, setiap postingannya
pasti mendapat banyak komentar dari pengguna media sosial Instagram.
Banyaknya pengguna instagram yang menyampaikan opini-opininya melalui
komentar maka dapat dimanfaatkan untuk mencari sebuah informasi.
Masyarakat Indonesia berhak untuk mengetahui seberapa baik kinerja dari
presiden republik Indonesia yaitu bapak Joko Widodo maka diperlukan sistem
yang dapat mengetahui kinerja bapak jokowi dengan cara menganalisa sebaran
komentar atau opini yang bersifat positif dan negatif dari postingan akun
instagram @jokowi.
Analisis sentimen diperlukan dalam menyaring komentar-komentar di
media sosial yang berisi informasi penting. Dalam penelitian ini analisis sentimen
dirancang guna untuk melihat sebaran kecenderungan opini masyarakat yang
mengandung sentimen negatif dan positif dari suatu postingan akun instagram
@jokowi menggunakan algoritma Naïve Bayes Classifier (NBC) dan TF-IDF
sebagai pembobotan kata. Naïve Bayes Classifier (NBC) merupakan teknik
pembelajaran mesin yang berbasis probabilistik. Naïve Bayes Classifier adalah
metode sederhana tetapi memiliki akurasi dan performansi yang tinggi dalam
pengklasifikasian teks sehingga menjadi acuan peneliti untuk menggunakan
metode tersebut.
1
2
I.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan di atas, maka rumusan
masalah yang didapatkan adalah sebagai berikut :
a. Apakah metode Naïve Bayes Classifier dapat melakukan klasifikasi sentimen?
b. Berapa tingkat akurasi yang dihasilkan pada penerapan klasifikasi
menggunakan metode Naïve Bayes Classifier?
I.3 Batasan Masalah

Pada suatu penelitian diperlukan suatu batasan untuk membatasi objek
atau ruang lingkup yang akan dijelaskan sebagai berikut :
a. Penelitian ini hanya menggunakan komentar pada postingan akun Instagram
Presiden Republik Indonesia pada tahun 2020 yaitu Joko Widodo sebagai
sumber data.
b. Proses klasifikasi sentimen dilakukan hanya pada komentar berbahasa
Indonesia.
c. Metode yang digunakan dalam klasifikasi sentimen adalah Naïve Bayes
Classifier, sedangkan untuk pembobotan menggunakan TF-IDF.
d. Hasil analisa hanya berupa sentimen positif dan negatif.
e. Data yang digunakan hanya berjumlah 1000 yang didapatkan dari 20
postingan akun instagram @jokowi.
f. Pada proses pengumpulan data tidak dilakukan penyaringan terhadap akun
bot, palsu dan asli.
I.4 Tujuan penelitian

Tujuan penelitian ini adalah mengimplementasikan Naïve Bayes Classifier
dalam melakukan Analisis Sentimen untuk mengklasifikasikan komentar postif
dan negatif dalam postingan instagram pada akun Presiden Republik Indonesia
@jokowi.
3
I.5 Manfaat Penelitian

Manfaat penelitian ini adalah :
a. Mengetahui bahwa algoritma Naïve Bayes Classifier benar dapat melakukan
klasifikasi sentimen.
b. Menambah pengetahuan tentang pengimplementasian algoritma Naïve Bayes
Classifier untuk menganalisis sentimen komentar di sosial media.
I.6 Sistematika Penulisan

Adapun sistematika penulisan proposal tugas akhir ini disusun dalam
beberapa bab yang dijelaskan sebagai berikut:
BAB I PENDAHULUAN
Bab ini akan berisi mengenai latar belakang, perumusan masalah,
tujuam, dan manfaat penelitian yang menjadi pendahuluan dalam
pengerjaan Tugas Akhir mengenai pembuatan aplikasi Analisis
Sentimen Komentar Pada Postingan Akun Instagram Jokowi
dengan Metode Naive Bayes Classifier.
BAB II KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI

Bab ini akan berisi kajian-kajian penelitian terdahulu yang
digunakan oleh penulis ssebgai referensi dan tolak ukur atau
pembanding dalam pembuatan aplikasi Analisis Sentimen
Komentar Pada Postingan Akun Instagram Jokowi dengan Metode
Naive Bayes Classifier, dalam bab ini terdapat sub bab yang terdiri
dari penelitian terkait yang berhubungan dengan analisis sentimen,
dan berisi landasan teori yang mendukung pembuatan aplikasi
Analisis Sentimen Komentar Pada Postingan Akun Instagram
Jokowi dengan Metode Naive Bayes Classifier.
BAB III METODE PENELITIAN

Bagian ini menyajikan secara lengkap setiap langkah eksperimen
yang dilakukan dalam penelitian yang antara lain meliputi bahan
4
atau data yang diperoleh dari lapangan, aturan bisnis dan tahapan
penelitian dari pembuatan aplikasi Analisis Sentimen Komentar
Pada Postingan Akun Instagram Jokowi dengan Metode Naive
Bayes Classifier.
BAB IV ANALISIS DAN DESAIN SISTEM

Bab ini berisi analisis sistem yang akan diusulkan yang terdiri dari
analisis fungsional dan non fungsional, desain sistem yang terdiri
dari desain logik dan desain fisik dari penelitian Analisis Sentimen
Komentar Pada Postingan Akun Instagram Jokowi dengan Metode
Naive Bayes Classifier.
BAB V IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN

Bab ini berisi tentang implementasi script inti dari program yang
dirancang, hasil dari input output, hasil akurasi serta pembahasan
dari hasil penelitian yang telah dilakukan.
BAB VI PENUTUP
Bab ini berisi simpulan dari penelitian yang telah dilakukan dan
saran mengenai kekurangan yang harus diperbaiki ke depannya.
BAB II
KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI
II.1 Kajian Hasil Penelitian

Penelitian oleh Nurhuda, F. dan Sihwi, S. W., (2014), dengan judul
Analisis Sentimen Masyarakat terhadap Calon Presiden Indonesia 2014
berdasarkan Opini dari Twitter Menggunakan Metode Naive Bayes Classifier
membahas mengenai bagaimana melakukan analisis sentiment masyarakat
terhadap calon presiden dan wakil presiden Indonesia 2014 yang diungkapkan
melalui jejaring sosial Twitter. Hasil dari penelitian ini didapatkan bahwa
pasangan capres dan cawapres Prabowo Subianto dan Hatta Rajasa mendapatkan
jumlah percakapan 53% dan pasangan Joko Widodo – Jusuf Kalla mendapatksan
47%. Sedangkan untuk hasil polaritas sentimen, Prabowo Subianto – Hatta Rajasa
mendapatkan 47,7% untuk sentimen positif, 26,4% sentimen negatif dan 25,9%
sentimen netral. Sedangkan pasangan Joko Widodo – Jusuf Kalla mendapatkan
total 37,6% sentimen positif, 34,4% sentimen negatif, dan 27,9 sentimen netral.
Penelitian oleh Buntoro, G. A., (2017), dengan judul Analisis Sentimen
Calon Gubernur DKI Jakarta 2017 Di Twitter bertujuan untuk menentukan
sentimen opini masyarakat yang mengandung sentimen positif, netral atau negatif
tentang calon Gubernur DKI Jakarta 2017. Algoritma yang digunakan adalah
Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM). Data yang
digunakan adalah tweet dalam bahasa Indonesia dengan kata kunci AHY, Ahok,
Anies, dengan jumlah dataset sebanyak 300 tweet. Hasil dari penelitian ini adalah
analisis sentimen terhadap calon gubernur DKI Jakarta 2017. Akurasi tertinggi
didapat saat menggunakan metode klasifikasi Naïve Bayes Classifier (NBC),
dengan nilai rata-rata akurasi mencapai 95%, nilai presisi 95%, nilai recall 95%
nilai TP rate 96,8% dan nilai TN rate 84,6%.
Penelitian oleh Santoso, E. B. dan Nugroho, A., (2019), dengan judul
Analisis Sentimen Calon Presiden Indonesia 2019 Berdasarkan Komentar Publik
di Facebook bertujuan untuk mengklasifikasikan teks dengan baik terhadap
5
6
sentimen positif dan negatif, sehingga informasi yang terdapat di dalamnya bisa
diekstraksi serta dari data yang diamati dapat memberikan informasi yang berguna
bagi pihak yang membutuhkannya. Metode yang digunakan adalah Naïve Bayes
Classifier. Hasil dari penelitian berdasarkan data yang telah dikumpulkan sejak
tanggal 17 April 2019 sampai 22 Mei 2019, Joko Widodo lebih unggul sentimen
positif dari data sebanyak 5.000 komentar yang dipilih secara acak pada masing-
masing calon presiden dan melalui tahap preprocessing yang menghasilkan
polaritas sentimen. Joko Widodo diperoleh 85% sentimen positif, dan 15% untuk
sentimen negatif. Sedangkan Prabowo Subianto diperoleh 76% sentimen positif,
dan 24% untuk sentimen negatif. Tingkat akurasi yang dihasilkan adalah sebesar
86,4%.
Penelitian oleh Rofiqoh, U. dkk., (2017), dengan judul Analisis Sentimen
Tingkat Kepuasan Pengguna Penyedia Layanan Telekomunikasi Seluler Indonesia
Pada Twitter Dengan Metode Support Vector Machine dan Lexicon Based
Features bertujuan untuk mengetahui sentimen opini masyarakat tentang penyedia
layanan telekomunikasi seluler menggunakan Algoritma SVM dan Lexicon Based
Feature. Data yang digunakan sebanyak 300 data, 70% untuk data latih dan 30%
untuk data uji. Hasil dari pengujian menggunakan SVM + Lexicon mendapat
akurasi sebesar 79%, sedangkan jika hanya menggunakan SVM tanpa Lexicon
bisa mencapai 84% dengan parameter yang sama.
Penelitian oleh Sipayung, E. M. dkk., (2016), dengan judul Perancangan
Sistem Analisis Sentimen Komentar Pelanggan Menggunakan Metode Naive
Bayes Classifier bertujuan untuk mengetahui sentimen pada komentar yang
diberikan pelanggan terhadap produk dan layanan hotel XYZ dikarenakan
banyaknya komentar yang ada, pertahun mencapai 675 komentar. Algoritma
yang digunakan adalah Naïve Bayes. Data yang digunakan 175 komentar, 155
komentar positif dan 20 komentar negatif. Hasil akurasi yang didapatkan dalam
penentuan kategori adalah sebesar 77.14% dan 75.42% dalam penentuan sentimen
memiliki tingkat precision 99.12% dan recall 72.9%.
Penelitian oleh Luqyana, W. A. dkk., (2018), dengan judul Analisis
Sentimen Cyberbullying pada Komentar Instagram dengan Metode Klasifikasi
7
Support Vector Machine bertujuan untuk mengetahui sentimen pembullyan pada

komentar instagram. Penelitian ini menggunakan Algoritma SVM. Data yang
digunakan sejumlah 400 data yang diambil secara offline, sama seperti
sebelumnya yaitu 70% untuk data latih dan 30% data uji. Nilai learning rate yang
digunakan sebesar 0,0001 dan iterasi yang digunakan sebanyak 200x. dan hasil
akurasi yang didapatkan adalah 90%.
Penelitian oleh Gunawan, B. dkk., (2018), dengan judul Sistem Analisis
Sentimen pada Ulasan Produk Menggunakan Metode Naive Bayes bertujuan
untuk mengetahui sentimen pada ulasan produk online bahasa Indonesia untuk
memperoleh informasi meliputi informasi sentimen yang merupakan bagian dari
ulasan online. Algoritma yang digunakan adalah naïve bayes classifier. Pada
pembobotan kata digunakan metode TF-IDF. Data yang ada akan diklasifikasikan
ke dalam 5 (lima) kelas, yaitu sangat negatif, negatif, netral, positif dan sangat
positif. Data tersebut kemudian akan dievaluasi menggunakan pengujian
confusion matrix dengan parameter akurasi, recall, dan precision. Hasil pengujian
menunjukkan pada pengujian 3 kelas (negatif, netral dan positif) hasil terbaik
didapatkan pada 90% data latih dan 10% data uji dengan nilai akurasi 77.78%,
recall 93.33% dan precision 77.78% dan pada pengujian 5 kelas hasil terbaik
didapatkan pada 90% data latih dan 10% data uji dengan nilai akurasi 59.33 %,
recall 58.33 % dan precision 59.33 %.
Penelitian oleh Fauzi, A. dkk., (2019), dengan judul Sentimen Analisis
Berinternet Pada Media Sosial dengan Menggunakan Algoritma Bayes bertujuan
untuk menentukan sentimen publik terhadap universitas yang disampaikan di
Instagram , sehingga membantu usaha untuk melakukan riset marketing atas opini
publik. Algoritma yang digunakan adalah Naive Bayes dan metodenya, dan akan
diuji dengan dua masukan dengan menggunakan komentar tokenize and
Transform Case yang positif (100 teks komentar) dan negatif (100 komentar teks),
akurasi yang di dapat algoritma Naive Bayes 76.50%+/-7.76% (mikro:76.50).
Hasil penelitian menunjukkan bahwa Naive Bayes (NB) mendapatkan hasil
terbaik dan akurat.
8
Penelitian oleh Kurniawan, S. dkk., (2019), dengan judul Perbandingan

Metode Klasifikasi Analisis Sentimen Tokoh Politik Pada Komentar Media Berita
Online bertujuan untuk menentukan sentimen komentar dari pembaca dan dapat
digunakan sebagai penilaian terhadap tokoh-tokoh politik. Algoritma yang
digunakan adalah Naïve Bayes dan Support Vector Machine yang dioptimalkan
menggunakan Particle Swarm Optimization. Pengujian yang dilakukan dengan
kedua metode mendapatkan hasil bahwa, Support Vector Machine berbasisi
Particle Swarm Optimization adalah metode terbaik dengan akurasi 78.40% dan
AUC 0.850. Penelitian ini mendapatkan algoritma yang efektif dalam
mengklasifikasikan komentar positif dan negatif terkait dengan tokoh-tokoh
politik dari media berita online.
Penelitian oleh Fauzi, M. A. dan Adinugroho, S., (2018), dengan judul
Analisis Sentimen Pariwisata di Kota Malang Menggunakan Metode Naïve Bayes
dan Seleksi Fitur Query Expansion Ranking bertujuan untuk menganalisis
sentimen ulasan dari masyarakat tentang pariwisata Kota Malang dan
diklasifikasikan menjadi dua kelas yaitu positif dan negatif. Algoritma yang
digunakan adalah Naive Bayes dengan seleksi fitur Query Expansion Ranking
untuk mengurangi jumlah fitur pada proses klasifikasi. Pengujian pada penelitian
ini adalah uji akurasi dengan menggunakan variasi rasio seleksi fitur, hasilnya
seleksi fitur 75% memiliki akurasi terbaik sebesar 86.6%.
9
Tabel 2. 1 Perbandingan Kajian Hasil Penelitian

No Judul Penulis Metode Hasil/ Kesimpulan
1 Analisis Sentimen Faishol Naïve Hasil dari
Masyarakat Nurhuda, Bayes pengamatan polaritas
terhadap Calon Sari Widya Classifie sentiment masyarakat
Presiden Sihwi, dan r (NBC) terhadap pasangan
Indonesia 2014 Afrizal calon presiden dan
berdasarkan Opini Doewes wakil preside
dari Twitter menunjukkan
Menggunakan pasangan Prabowo
Metode Naive Subianto – Hatta
Bayes Classifier Rajasa mendapatkan
47,7% untuk
sentimen positif,
26,4% sentimen
negatif dan 25,9%
sentimen netral.
Sedangkan pasangan
Joko Widodo – Jusuf
Kalla mendapatkan
total 37,6% sentimen
positif, 34,4%
sentimen negatif, dan
27,9 sentimen netral.
2 Analisis Sentimen Ghulam Naïve Data yang digunakan
Calon Gubernur Asrofi Bayes adalah tweet dalam
DKI Jakarta 2017 Buntoro (NBC), bahasa Indonesia
Di Twitter Support dengan kata kunci
Vector AHY, Ahok, Anies,
Machine dengan jumlah
(SVM) dataset sebanyak 300
tweet. Akurasi
tertinggi didapat saat
menggunakan metode
klasifikasi Naïve
Bayes Classifier
(NBC), dengan nilai
rata-rata akurasi
mencapai 95%.
10
Tabel 2. 1 (Lanjutan)
3 Analisis Sentimen Eko Budi Naïve Hasil dari penelitian
Calon Presiden Santoso, Aryo Bayes berdasarkan data
Indonesia 2019 Nugroho Classifie yang telah
Berdasarkan r (NBC) dikumpulkan sejak
Komentar Publik sebanyak 5.000
di Facebook komentar yang
dipilih secara acak
pada masing-masing
calon presiden dan
melalui tahap
preprocessing yang
menghasilkan
polaritas sentimen.
Joko Widodo
diperoleh 85%
sentimen positif, dan
15% untuk sentimen
negatif. Sedangkan
Prabowo Subianto
diperoleh 76%
sentimen positif, dan
24% untuk sentimen
negatif. Tingkat
akurasi yang
dihasilkan adalah
sebesar 86,4%.
4 Analisis Sentimen Umi Rofiqoh, Support Pada penelitian
Tingkat Kepuasan Rizal Setya Vector analisis sentimen
Pengguna Perdana, M. Machine terhadap tingkat
Penyedia Layanan Ali Fauzi (SVM). kepuasan pengguna
Telekomunikasi penyedia layanan
Seluler Indonesia telekomunikasi
Pada Twitter seluler pada Twitter
Dengan Metode dengan metode
Support Vector Support Vector
Machine dan Machine dan Lexicon
Lexicon Based Based Features
Features menghasilkan nilai
accuracy sebesar
79%, precision
sebesar 65%, recall
sebesar 97%, dan f-
measure sebesar
78%.
11
5 Perancangan Evasaria M. Naïve Data yang digunakan
Sistem Analisis Sipayung, Bayes 175 komentar, 155
Sentimen Herastia Classifie komentar positif dan
Komentar Maharani, r (NBC) 20 komentar negatif.
Pelanggan Ivan Zefanya Hasil akurasi yang
Menggunakan didapatkan dalam
Metode Naive penentuan kategori
Bayes Classifier adalah sebesar
77.14% dan 75.42%
dalam penentuan
sentimen memiliki
tingkat precision
99.12% dan recall
72.9%.
6 Analisis Sentimen Wanda Athira Support Data yang digunakan

Cyberbullying Luqyana, Vector sejumlah 400 data
pada Komentar Imam Machine yang diambil secara
Instagram dengan Cholissodin, (SVM). offline, sama seperti
Metode Rizal Setya sebelumnya yaitu
Klasifikasi Perdana 70% untuk data latih
Support Vector dan 30% data uji.
Machine. Nilai learning rate
yang digunakan
sebesar 0,0001 dan
iterasi yang
digunakan sebanyak
200x. dan hasil
akurasi yang
didapatkan adalah
90%.
12
7 Sistem Analisis Billy Gunawan, Naïve Hasil pengujian
Sentimen pada Helen Sasty Bayes menunjukkan pada
Ulasan Produk Pratiwi, Enda Classifi pengujian 3 kelas
Menggunakan Esyudha er (negatif, netral dan
Metode Naive Pratama (NBC) positif) hasil terbaik
Bayes didapatkan pada 90%
data latih dan 10%
data uji dengan nilai
akurasi 79.78%,
recall 93.33% dan
precision 77.78% dan
pada pengujian 5
kelas hasil terbaik
didapatkan pada 90%
data latih dan 10%
data uji dengan nilai
akurasi 59.33 %,
recall 58.33 % dan
precision 59.33 %.
8 Sentimen Analisis Ahmad Fauzi, Naïve Pengujian model
Berinternet Pada Muhammad Bayes dengan menggunakan
Media Sosial Faittullah Classifi Naive Bayes (NB)
dengan Akbar, Yudhi er dengan menggunakan
Menggunakan Ferdi Andri (NBC) data review analisis
Algoritma Bayes Asmawan sentimen Etika
berinternet dimedia
social dari 200 data
review dalam teks
bahasa indonesia
yang terdiri dari 100
review positif dan
100 review negatif.
Model yang
dihasilkan
mendapatkan hasil
accuracy pengujian
pertama dilakukan
dengan menggunakan
Naive Bayes(NB)
yaitu mendapatkan
nilai accuracy
76.50%+/-
7.76(mikro: 76.50%).
13
9 Perbandingan Sigit Naïve Pengujian yang
Metode Kurniawan, Bayes dilakukan dengan
Klasifikasi Windu Gata, (NBC), kedua metode
Analisis Sentimen Dewi Ayu Support mendapatkan hasil
Tokoh Politik Puspitawati, Vector bahwa, Support
Pada Komentar Nurmalasari, Machin Vector Machine
Media Berita Muhamad e (SVM) berbasisi Particle
Online Tabrani, Swarm Optimization
Kadinar Novel adalah metode
terbaik dengan
akurasi 78.40% dan
AUC 0.850.
Penelitian ini
mendapatkan
algoritma yang
efektif dalam
mengklasifikasikan
komentar positif dan
negatif terkait dengan
tokoh-tokoh politik
dari media berita
10 Analisis Sentimen Shima Fanissa, Naïve online.
Pengujian pada
Pariwisata di Kota M. Ali Fauzi, Bayes penelitian ini
Malang Sigit (NBC) Menggunakan
Menggunakan Adinugroho pengujian seleksi
Metode Naive fitur dengan
Bayes dan Seleksi mengganti rasio
Fitur Query seleksi fitur antara 0-
Expansion 100 menggunakan
Ranking jumlah data latih dan
data uji
pada setiap pengujian
yang sama, yaitu 200
data latih dan data uji
sejumlah 30
dokumen. Hasil
seleksi fitur 75%
memiliki akurasi
terbaik sebesar
86.6%.
14
Terlihat pada tabel 2.1 perbedaan dari referensi dengan judul yang
diangkat oleh penulis terletak pada metode yang digunakan, yaitu dengan
penggunaan metode Naïve Bayes Classiffier (NBC) atau Support Vector Machine
(SVM). Dari hasil analisa referensi, peneliti mendapatkan kesimpulan yaitu
metode Naïve Bayes Classifier lebih cocok untuk kasus sentimen analisis pada
komentar masyarakat untuk mendukung perhitungan dan tingkat akurasi,
sehingga hasil analisis sentiment yang dilakukan dapat dipertanggung jawabkan.
15
II.2 Landasan Teori

II.2.1 Analisis Sentimen
Menurut Liu, B., (2015), analisis sentimen juga disebut penambangan
opini, adalah bidang studi yang menganalisis pendapat, sentimen, evaluasi,
penilaian, sikap dan emosi orang-orang terhadap entitas seperti produk, layanan,
organisasi, individu, masalah, peristiwa, topik dan atributnya. Terdapat banyak
nama dan tugas yang sedikit berbeda, misalnya analisis sentimen, penambangan
opini, ekstrasi pendapat, penambangan sentimen, analisis subjektivitas, analisis
pengaruh, analisis emosi, penambangan peninjauan, dan lain-lain namun sekarang
semuanya berada dibawah payung analisis sentimen atau penambangan opini.
II.2.2 Pre-Processing
Preprocessing merupakan salah satu tahapan menghilangkan
permasalahan-permasalahan yang dapat mengganggu hasil daripada proses
pengolahan data. Dalam kasus klasifikasi dokumen yang menggunakan data
bertipe teks, terdapat beberapa macam proses yang dilakukan umumnya
diantaranya case folding, stemming, stopword removal, Uniq character removing
dan tokenizing.
Menurut Salam, A. dkk., (2018), preprocessing dilakukan pada komentar
terlebih dahulu, karena tidak semua atribut yang terdapat pada kolom komentar
dapat digunakan untuk menganalisis masalah. Didalam preprocessing terdapat
beberapa tahap, yaitu :
a. Case Folding
Proses untuk mengubah semua huruf besar (uppercase) tehadap komentar
menjadi huruf kecil (lowercase).
b. Stemming
Tahap ini melakukan proses mengubah kata yang berimbuh infix maupun
suffix menjadi sebuah kata dasar yang akan lebih mengandung sebuah makna
untuk peroleh suatu informasi sehingga komentar akan menjadi lebih spesifik
dalam pengkategorian.
c. Stopword Removal
16
Pada tahap ini akan dilakukan pengecekan disetiap kata pada komentar,
selanjutnya proses menghilangkan kata-kata yang dianggap tidak penting,
semisal terdapat kata sambung, kata depan, kata ganti maka akan dihapus.
Selain itu pada tahap ini juga dilakukan penghapusan uniqu character,
biasanya berupa emoji atau serangkaian karakter yang mendefinisikan sebuah
pola.
d. Tokenizing
Pada tahap ini dilakukan pengecekan karakter pertama sampai karakter
terakhir, apabila karakter ke-I bukan karakter pemisah kata seperti titik(.),
koma(,), spasi dan tanda pemisah lainnya, maka akan digabungkan dengan
karakter selanjutnya.
II.2.3 TF-IDF
TF-IDF adalah suatu metode yang bisa digunakan untuk pembobotan kata.
Menurut Rahman, A. dkk., (2017), Term Weighting atau pembobotan kata
bertujuan untuk memberikan bobot nilai pada setiap kata. Perhitungan bobot ini
memerlukan dua hal yaitu Term Frequency (TF) dan Inverse Document
Frequency (IDF). Term Frequency merupakan banyaknya jumlah kata atau term
tertentu yang ada dalam suatu dokumen. Sementara Inverse Document Frequency
adalah frekuensi kemunculan kata atau term pada seluruh dokumen. Sebelum
menghitung bobot TF-IDF terlebih dahulu menghitung bobot IDF. Rumus
perhitungan Inverse Document Frequency (IDF) dapat dilihat pada persamaan (1).
d
IDF t =log ⁡( ) ................................................................
df t
Keterangan dari formula (1) tersebut adalah :
𝐼𝐷𝐹𝑡 = Bobot IDF ke t dokumen d.
𝑑𝑓𝑡 = Jumlah dokumen yang mengandung term t.
d = Jumlah dokumen keseluruhan.
17
Setelah itu barulah menghitung bobot Term Frequency dan Inverse Document
Frequency (TF-IDF) dengan rumus seperti pada persamaan (2).
W dt =tf t x IDFt .................................................................................
𝑊𝑑𝑡 = Bobot term ke t dokumen d
𝑡𝑓𝑡 = Jumlah kemunculan term t pada dokumen t.
𝐼𝐷𝐹𝑡 = Bobot IDF yang telah dihitung sebelumnya.
II.2.4 Naïve Bayes Classifier

Menurut Rossi, A. dkk., (2017), Naïve Bayes Classifier adalah konsep
probabilitas penentuan kelompok kelas dokumen. Algoritma klasifikasi ini dapat
mengolah data dalam jumlah besar dengan hasil akurasi yang tinggi. Sedangkan
menurut Munitasri, I. dkk., (2018), Naïve Bayes Classifier adalah metode klasifikasi
berdasarkan probabilitas dan teorema bayesian dengan asumsi bahwa setiap variable
X bersifat bebas (independence), dengan mengasumsikan bahwa keberadaan sebuah
atribut (variable) tidak ada kaitannya dengan atribut (variable) yang lain. Performa
Naïve Bayes yang kompetitif dalam proses klasifikasi walaupun menggunakan
asusmsi ke-indepenan atribut (tidak ada kaitan antar atribut).
Naïve Bayes Classifier dilakukan dengan melakukan perhitungan prior
probability, perhitungan conditional probability, dan perhitungan posterior
probability. Rumus perhitungan prior probability menurut Rahman, A. dkk., (2017),
dapat dilihat pada persamaan (3).
d
P(𝑐)= ............................................................................
dc
c = Hipotesis data merupakan suatu class spesifik
P(c) = Prior Probability dari class c
d = Jumlah keseluruhan dokumen
𝑑𝑐 = Jumlah keseluruhan dokumen dari class c
18
Perhitungan conditional probability dilakukan dengan model multinomial.

Multinomial Naïve Bayes digunakan untuk menghitung conditional probability
setiap kata yang ada. Menurut Rahman, A. dkk., (2017), model multinomial
memperhitungkan frekuensi setiap kata yang muncul pada dokumen. Rumus
perhitungan model multinomial dapat dilihat pada persamaan (4).
count (dn∨c)+1
(𝑇𝑒𝑟𝑚 𝑑𝑛|𝑐) = ............................................
count (c)+¿ V ∨¿ ¿
(𝑇𝑒𝑟𝑚 𝑑𝑛|𝑐) = Conditional Probability kata ke-n diketahui kelas c.
count(𝑑𝑛|𝑐) = Jumlah term tn yang ditemukan diseluruh data pelatihan
dengan kategori c.
count(c) = Jumlah term diseluruh data pelatihan kategori kelas c.
|V| = Jumlah seluruh term pada data pelatihan.
Menurut Rahman, A. dkk., (2017), perhitungan posterior probability

dilakukan dengan rumus yang dapat dilihat pada persamaan (5).
(𝑇𝑒𝑟𝑚 𝑑|𝑐)=(𝑐)×𝑃(𝑇𝑒𝑟𝑚 𝑑1|𝑐)×𝑃(𝑇𝑒𝑟𝑚 𝑑2|𝑐)×… ×𝑃(𝑇𝑒𝑟𝑚 𝑑𝑛|𝑐)..................................
(𝑇𝑒𝑟𝑚 𝑑|𝑐) = Posterior Probability suatu dokumen termasuk kelas c.
P(c) = Prior Probability dari kelas c.
(𝑇𝑒𝑟𝑚 𝑑𝑛|𝑐) = Conditional Probability kata ke-n diketahui kelas c.
II.2.5 PHP
Menurut Anhar, (2010), PHP adalah bahasa pemrograman web server-side
yang bersifat open source, PHP juga merupakan script yeng terintegrasi dengan
HTML dan berada pada server (server side HTML embedded script). PHP juga
merupakan script yang digunakan untuk membuat halaman website yang sangat
dinamis, dinamis berarti halaman tampilan yang akan ditampilkan dibuat saat
halaman itu diminta oleh client. PHP pertama kali dibuat oleh Rasmus Lerdorf
seorang pemrogram C yang handal dari greenland Denmrak di tahun 1995, PHP
diberi nama FI (Form Interpreted) yang digunakan untuk mengelola from dari
19
web. Pada perkembangannya, kode-kode yang digunkan dirilis untuk umum

sehingga mulai banyak dikembangkan oleh programer diseluruh dunia. Tahun
1997 PHP dirilis dengan versi 2.0, pada versi ini sudah terintegrasi dengan bahasa
pemrograman C dan sudah dilengkapi dengan modul sehingga kualitas kerja PHP
lebih meningkat secara signifikan. Ditahun yang sama sebuah perusahaan
programbernama Zend merilis ulang PHP versi ini dengan lebih baik, bersih dan
cepat. Seiring berkembangnya jaman ditahun 1994 PHP versi 4.0 mulai dirilis dan
versi ini paling banyak digunakan pada awal abad 21 karena PHP versi ini sudah
mampu membangun web komplek dengan stabilitas kecepatan yang tinggi.
II.2.6 Data Flow Diagram (DFD)

Menurut Mustakini, J. H., (2016), Data Flow Diagram (DFD) merupakan
diagram yang menggunakan notasi-notasi untuk menggambarkan arus data sistem
secara logika. DFD merupakan dokumentasi grafik yang menggunakan simbol
penomoran di dalam mengilustrasikan arus data yang saling berhubungan diantara
pemrosesan data untuk diubah menjadi informasi. Tabel 2.2 menggambarkan
simbol yang digunakan dalam DAD.
Tabel 2. 2 DFD (Data Flow Diagram)
No. Gambar Keterangan
1 Eksternal Entity (kesatuan luar) atau

Boundary (batas sistem)
2. Data Flow (arus data)
3. Proses
4. Data store
Sumber : Mustakini, J. H., (2016)

20
II.2.7 Entity Relationship Diagram (ERD)

ERD adalah model data untuk menggambarkan hubungan antara satu
entitas dengan entitas lain yang mempunyai relasi (hubungan) dengan batasan-
batasan Oetomo, B. S. D., (2003). Hubungan antara entitas akan menyangkut dua
komponen yang menyatakan jalinan ikatan yang terjadi, yaitu derajat hubungan
dan partisipasi hubungan. Adapun beberapa simbol dalam ERD dapat dilihat pada
tabel 2.3.
Tabel 2. 3 Entity Relationship Diagram (ERD)
No. Gambar Keterangan

1. Entitas atau bentuk persegi panjang
merupakan sesuatu objek data yang ada di
Entitas dalam sistem, nyata maupun abstrak
dimana data tersimpan atau dimana terdapat
data.
2. Relationship merupakan hubungan alamiah
Relasi yang terjadi antar entitas. Umumnya diberi
nama dengan kata kerja dasar
3. Atribut atau bentuk elips adalah sesuatu

yang menjelaskan apa sebenarnya yang
Attribut dimaksud entitas atau relationship dan
mewakili atribut dari masing-masing
entitas.
4. Garis merupakan penghubung antar entitas
Sumber : Oetomo, B. S. D., (2003)
BAB III
METODE PENELITIAN
III.1 Bahan / Data

III.1.1 Data Yang Diperoleh
Data yang digunakan pada penelitian ini adalah data berupa komentar
tekstual. Komentar tekstual ini diperoleh akun instagram yaitu @jokowi. Data
yang dikumpulkan adalah komentar dalam sebuah postingan foto pada media
sosial instagram yang dikumpulkan dalam rentang waktu tertentu. Data yang telah
terkumpul terbagi menjadi dua yaitu data latih sejumlah 750 dan data uji sejumlah
250 komentar. Berikut adalah beberapa data komentar yang diperoleh yang dapat
dilihat pada Tabel 3. 1.
Tabel 3. 1 Sampel Data Mentah

No Username Komentar
1 mahdiabdurrahman Aamiin..oke sama2
2 sufyanussauri Alhamdulillah
Alhamdulillah, infrastruktur jalan makin bertambah,
3 sastra2265 semoga memberikan banyak manfaat kebaikan
bersama.
4 lincesimamoraa Mantap Pak Presiden Jokowi yang TERBAIK
5 asna2001x P'Jokowi, Sht slalu utk bpk dn keluarga.
6 saptosuhardiyo Lanjutkan Bpk Jokowi
7 dilla_arifka02 Gk bilang bilang bapak kalah mau ke aceh
8 12daffagaming gitu aja sombong
9 solikhin_bhocil_86 pak jokowi jangan tol terus dong!!
10 m.adil_ardian Jangan di jual ke cina ya pak...
21
22
III.1.2 Prosedur Pengumpulan Data

Proses pengumpulan data dilakukan dengan waktu yang tidak terlalu lama,
yaitu pada tanggal 05 Februari 2021 hingga 12 Februari 2021. Berikut langkah
pengumpulan data yang akan digunakan untuk penelitian :
1. Salin link https://www.instagram.com/jokowi/ pada browser kemudian enter
untuk membuka akun instagram milik bapak Persiden R.I yaitu bapak Joko
Widodo seperti gambar 3.1 dibawah ini.
Gambar 3. 1 Screenshoot akun @jokowi

2. Kemudian pilih salah satu postingan yang ada di akun @jokowi, lalu salin link
tersebut seperti pada gambar 3.2 dibawah ini.
Gambar 3. 2 Screenshoot salin link

23
3. Kemudian tempelkan link yang telah disalin dari akun instagram tersebut ke
website https://www.exportcomments.com seperti gambar 3.3 dibawah ini.
Gambar 3. 3 Screenshoot website exportcomments.com

4. Data komentar yang sudah terkumpul kemudian diseleksi untuk nantinya.
Kemudian melakukan penghapusan emoticon pada data data tersebut. Contoh
hasil yang diperoleh dari export komentar dapat dilihat pada Gambar 3.4.
Gambar 3. 4 Screenshoot hasil download data

24
5. Kemudian melakukan pemberian label sentimen positif dan negatif secara

manual. Pemberian label sentimen didukung oleh seorang ahli di bidang bahasa
Indonesia yang dapat dilihat pada bagian halaman lampiran laporan. Data yang
telah diberi label dapat dilihat pada gambar 3.5.
Gambar 3. 5 Screenshoot data yang sudah diberi label
III.2 Aturan Bisnis

III.2.1 Analisis Sistem Saat Ini
Sistem yang berjalan saat ini yaitu pengguna Instagram yang ingin
mengetahui sentimen pada suatu topik harus mencari data komentar dari sumber
data dan memahami maksud dari komentar satu per satu secara manual. Cara ini
memiliki kekurangan apabila pengguna ingin menganalisis data komentar dalam
jumlah yang banyak maka akan memakan waktu yang banyak juga karena
pengguna harus membaca dan memahami maksud dari komentar satu per satu
secara manual. Analisis sistem dapat digambarkan pada gambar 3.6.
Gambar 3. 6 Flowchart Sistem Saat Ini

25
III.2.2 Kelemahan Sistem Saat Ini

Sistem yang berlaku untuk saat ini masih kurang baik untuk digunakan.
Karena jika untuk menentukan sentimen komentar pada akun instagram @jokowi
dalam jumlah yang banyak atau besar akan memerlukan waktu yang cukup lama
karena pengguna akun instagram harus melakukan pemilihan komentar secara
satu per satu dan juga menentukan sentimen secara manual.
III.3 Tahapan Penelitian

Tahapan penelitian yang dilakukan penulis dalam melakukan penelitian
untuk membangun sistem yang akan dibangun dapat dilihat pada Gambar 3.7.
Gambar 3. 7 Diagram Tahapan Penelitian

a. Observasi
Observasi dilakukan dengan melakukan pengamatan langsung dengan
mengakses media sosial instagram untuk mengetahui komentar-komentar yang
ada didalam postingan akun instagram @jokowi. Observasi juga dilakukan
dengan mencari algoritma yang baik untuk mengolah sentimen dari data komentar
yang akan digunakan.
b. Studi Pustaka
Studi pustaka dilakukan dengan melakukan pencarian bahan-bahan dan
pengambilan informasi yang relevan. Sumber studi pustaka mengambil informasi
dari jurnal, skripsi dan sumber lain dengan kasus mengenai analisis sentimen.
Proses studi pustaka juga dilakukan dengan mencari jurnal, skripsi dengan
algoritma yang serupa dengan topik penelitian.
26
c. Pengumpulan Data
Proses pengumpulan data adalah proses yang dilakukan untuk
mengumpulkan data yang akan digunakan sebagai data latih dan data uji. Hal ini
dilakukan dengan mengambil data komentar dari instagram terutama pada
postingan yang akan dianalisis. Pengambilan data dilakukan meng-export
komentar yang ada pada postingan tersebut melalui situs
https://exportcomments.com/.
d. Perancangan Sistem
Pada perancangan beberapa perancangan utama dibuat, seperti rancangan
alur sistem, rancangan basis data, maupun rancangan antarmuka pengguna.
Perancangan dataset yang dibuat adalah menggunakan 1000 data teks berupa
komentar. Data training yang digunakan adalah 75% dari total data yang
digunakan, sedangkan untuk data test menggunakan 25% dari data yang
digunakan. Untuk perancangan interface dilakukan agar pengguna dapat
menentukan sentimen yang di inputkan pada form input komentar.
e. Implementasi
Dalam sistem ujian yang akan dibangun, sistem dibangun menggunakan
menggunakan framework Codeigniter3 dan bahasa pemrograman PHP.
Pengimplementasian antarmuka menggunakan HTML dan Bootstrap. Tools yang
digunakan untuk melakukan pengkodean adalah aplikasi Visual Studio Code.
Penyimpanan data untuk sistem ujian disimpan dalam basis data MySQL sehingga
pengguna dapat melihat data hasil sentimen yang telah disimpan.
f. Pengujian
Sistem yang telah selesai dibangun kemudian dilakukan pengujian untuk
mengetahui apakah sistem telah berjalan seperti yang diharapkan dan untuk
mengetahui kekurangan sistem. Metode yang digunakan untuk melakukan
pengujian akurasi adalah kombinasi confusion matrix dan cross validation untuk
mengukur akurasi dari sistem. Data terdiri dari 75% data latih dan 25% data uji
dari total dataset yang digunakan yaitu 1000 baris data.
BAB IV
ANALISIS DAN DESAIN SISTEM
IV.1 Analisis Sistem Yang Diusulkan

Sistem yang diusulkan yaitu dengan memanfaatkan algoritma machine
learning metode Naive Bayes Classifier untuk menganalisis sentimen dari suatu
dan banyak komentar. Hal ini diharapkan mampu membantu peneliti agar dapat
melakukan analisis sentimen secara otomatis terhadap data komentar yang tidak
sedikit. Sistem ini dapat diakses oleh admin dan masyarakat. Admin bertugas
untuk menginputkan dataset training dan testing serta dapat melihat hasil
perhitungan dan akurasi sistem. Masyarakat hanya dapat melihat hasil dari sistem
sentimen analisis.
IV.1.1 Analisis Fungsional

Analisis Fungsional merupakan analisis fungsional yang terkait dengan
fasilitas yang dibutuhkan oleh sistem secara umum. Kebutuhan fungsional dari
sistem yang akan dibangun meliputi :
a. Analisis Kebutuhan Input
1. Input Login : input berupa username dan password dari admin yang
digunakan untuk masuk kedalam sistem.
2. Input Data Latih / Dataset : input berupa data komentar data yang akan
digunakan data latih untuk proses analisis sentimen serta data
keseluruhan.
3. Input Data Uji : input berupa data komentar yang akan diuji untuk
menentukan label sentimen yang akan diberikan.
b. Analisis Kebutuhan Proses
1. Proses log-in, yaitu proses verifikasi terhadap username dan password
yang digunakan untuk masuk kedalam sistem.
2. Proses preprocessing, yaitu proses untuk mengolah data komentar.
3. Proses penghitungan TF-IDF, yaitu proses untuk menghitung bobot suatu
kata.
27
28
4. Proses klasifikasi yang diproses oleh metode Naïve Bayes Classifier, yaitu
proses untuk mengklasifikasikan sentimen data komentar.
c. Analisis Kebutuhan Output

1. Informasi dataset training dan testing.
2. Informasi hasil dari pre processing, kamus positif dan negatif.
3. Informasi hasil dari perhitungan tf-idf positif, tf-idf negatif dan total idf.
4. Informasi hasil analisis sentimen.
IV.1.2 Analisis Non Fungsional

4.1.2.1 Perangkat Keras (Hardware) yang Digunakan
Perangkat keras yang digunakan untuk mengoperasikan sistem yang akan
dibuat dapat adalah :
a. Notebook ASUS A456UR.
b. Processor Intel Core i5-6200 CPU 2.40GHz.
c. Mouse Logitech M330.
d. RAM 8GB.
e. Monitor BenQ Resolusi 1920 x 1080.
f. Hardisk 1TB, SSD 240GB.
4.1.2.2 Perangkat Lunak (Software) yang Digunakan

Perangkat lunak yang digunakan untuk membangun sistem yang akan
dibuat adalah :
a. Sistem Operasi Windows 10.
b. Aplikasi Visual Studio Code.
c. MySQL Database Server v3.2.2.
d. XAMPP di gunakan sebagai server.
e. Pembuatan ERD dan DFD dengan aplikasi Draw IO.
IV.1.3 Arsitektur Sistem

Arsitektur sistem adalah sebuah penjelasan mengenai alur proses dari
sistem yang akan dibuat. Arsitektur sistem menjelaskan bahwa sistem yang
Masyarakat 29
dirancang dapat diakses oleh admin dan masyarakat. Admin bertugas untuk
menginputkan dan mengupdate dataset dari excel menuju ke sebuah basis data.
Selain itu admin juga dapat melihat hasil perhitungan dari pre – processing dan
akurasi sistem. Masyarakat hanya dapat melihat hasil dari sistem sentimen
analisis. Arsitektur sistem dapat dilihat pada gambar 4.1.
30
IV.2 Desain Sistem

Didalam desain sistem terdiri dari dua bagian yaitu desain logik dan desain
fisik. Desain logik terdiri dari diagram konteks, diagram jenjang, dad level 1, dad
level 2, flowchart sistem yang akan dibuat dan Entity Relationship Diagram
(ERD).
IV.2.1 Desain Logik

4.2.1.1 Diagram Konteks
Dalam diagram konteks hanya terdapat satu proses saja. Pada diagram
konteks sistem menjelaskan bahwa admin dan masyarakat dapat mengakses sistem
analisis sentimen. Admin bertugas untuk melakukan input dataset training dan dataset
testing. Admin dapat melihat dataset, hasil dari proses dan hasil akurasi dari sistem
analisis sentimen. Masyarakat hanya dapat melihat hasil dari sistem sentimen analisis.
Diagram konteks dapat dilihat pada gambar 4.2.
Gambar 4. 2 Diagram Konteks

31
4.2.1.2 Diagram Jenjang

Diagram ini mengambarkan hubungan dan seluruh dari fungsi-fungsi didalam
sistem secara berjenjang. Pada level 0 menjelaskan mengenai gambaran umum
sistem. Pada level 1 menjelaskan mengenai penjelasan sistem secara menyeluruh.
Dan pada level 2 menjelaskan sistem secara rinci. Rancangan diagram jenjang untuk
sistem pada sistem analisis sentimen ini dapat dilihat pada Gambar 4.3.
Gambar 4. 3 Diagram Jenjang

32
4.2.1.3 Diagram Alir Data (DAD) Level 1

Pada dad level 1 sistem analisis sentimen memiliki 3 proses yaitu proses
1.0 master data, 2.0 preprocessing, dan 3.0 klasifikasi. Pada DAD ini menjelaskan
bahwa proses 1.0 memiliki fungsi sebagai penyimpanan data, proses 2.0 adalah
tahap preprocessing dan prose 3.0 adalah tahap perhitungan klasifikasi dari hasil
sentimen yang diharapkan. Rancangan dad level 1 dapat dilihat pada Gambar 4.4.
Gambar 4. 4 DAD Level 1

33
4.2.1.4 Diagram Alir Data (DAD) Level 2 Proses 2

Pada DAD level 2 proses 2 menggambarkan mengenai preprocessing dari
dataset yang digunakan. DAD ini memiliki proses yaitu dari data store
dataset_full, dataset_train dan dataset_test akan melalui 6 proses yaitu case
folding, remove num & char, stemming, stopword remove, tokenize dan
perhitungan tf-idf. Pada proses 2.6 memiliki aliran data menuju data store
data_tfidf dan value_idf-tfidf yang berarti melakukan penyimpanan data yang
telah diproses kedalam data store tersebut. DAD level 2 proses 2 dapat dilihat
Gambar 4. 5 DAD Level 2 Proses 2

pada gambar 4.5.
34
4.2.1.5 Flowchart Sistem

a. Flowchart Pre Processing
Sebelum melakukan klasifikasi, data harus melewati teks processing yang
bernama pre processing. Pre processing memiliki banyak tahapan, tahapan
tersebut antara lain adalah case folding, unique character removal and number
removal, stemming, dan yang terakhir adalah stopword removal. Case folding
adalah merubah semua karakter di dalam teks menjadi lower case atau huruf kecil.
Unique character removal adalah menghapus karakter unik seperti !?@#
%^&*()_+-=;’:”,. dan lain lain. Number removal adalah proses untuk menghapus
angka. Stopword removal adalah proses menghapus kata sambung seperti “dan”,
“yang”, “kemudian” dan lain lain. Flowchart pre processing dapat dilihat pada
Gambar 4.6. dibawah ini.
Remove number
and unique char
Stopword removal Stemming
Gambar 4. 6 Flowchart Pre Processing

35
b. Flowchart Training Dataset

Flowchart training dataset membahas tentang proses sebelum melakukan
klasifikasi sentimen menggunakan metode naïve bayes classifier. Hasil yang akan
digunakan untuk proses klasifikasi adalah melakukan preprocessing, tokenisasi
dan menghitung total tfidf positif, total tfidf negatif dan total idf. Flowchart
training dataset dapat dilihat pada Gambar 4.7.
Gambar 4. 7 Flowchart Training Dataset

36
Gambar 4. 7 Lanjutan
37
c. Flowchart Proses Klasifikasi Sentimen

Setelah melakukan training dataset, maka sistem akan menampilkan
tampilan untuk menginputkan komentar. Setelah menginputkan komentar, sistem
akan memproses komentar tersebut yaitu melalui langkah yang sama seperti
proses pre processing dan tokenisasi. Setelah itu sistem akan mengklasifikasikan
sentimen menggunakan metode naïve bayes classifier yang dapat dilihat
flowchartnya pada Gambar 4.8.
Gambar 4. 8 Flowchart Proses Klasifikasi Sentimen

38
Gambar 4. 8 Lanjutan
39
4.2.1.6 Entity Relationship Diagram (ERD)

Di dalam sebuah database pasti memiliki lebih dari satu entitas. Entitas
yang terdapat pada database sistem yang akan dibuat diantaranya adalah :
1. Entitas admin 5. Entitas value_accuracy
2. Entitas dataset_train 6. Entitas value_idf_tfidf
3. Entitas dataset_test 7. Entitas data_tfidf
4. Entitas dataset_full
Rancangan Entity Relationship Diagram (ERD) dapat dilihat pada gambar 4.9.
Gambar 4. 9 Entity Relationship Diagram (ERD)
Rancangan ERD pada gambar 4.9 di atas tidak memiliki relasi karena sistem yang
dirancang hanya memerlukan entitas untuk penyimpanan data saja.
40
4.2.1.7 Rancangan Basis Data

Rancangan basis data dapat dilihat pada gambar 4.10.
Gambar 4. 10 Rancangan Basis Data
Rancangan basis data pada gambar 4.14 diatas tidak memiliki relasi karena sistem
yang dirancang hanya memerlukan tabel untuk menyimpan data.
41
4.2.1.8 Struktur Tabel

Struktur tabel dapat disebut sebagai pendefinisian setiap atribut dari masing
masing entitas yang ada di dalam basis data yang meliputi nama atribut, tipe data, dan
keterangan tiap-tiap field.
a. Tabel admin
Nama Tabel : admin
Primary Key : -
Foreign Key : -
Adapun struktur tabel admin dapat dilihat pada Tabel 4.1.
Tabel 4. 1 Tabel admin
No Nama Field Tipe Data Key Keterangan
1 username Varchar(20) Tidak Menyimpan username
2 password Varchar(20) Tidak Menyimpan password
b. Tabel dataset_test
Nama Tabel : dataset_test
Primary Key : -
Foreign Key : -
Adapun struktur tabel dataset_test dapat dilihat pada Tabel 4.2.
Tabel 4. 2 Tabel dataset_test
2 komentar Text Tidak Menyimpan komentar
3 sentimen Varchar(20) Tidak Menyimpan sentimen
42
c. Tabel dataset_train
Nama Tabel : dataset_train
Primary Key : -
Foreign Key : -
Adapun struktur tabel dataset_train dapat dilihat pada Tabel 4.3.
Tabel 4. 3 Tabel dataset_train
d. Tabel value_idf_tfidf
Nama Tabel : value_idf_tfidf
Primary Key : -
Foreign Key : -
Adapun struktur tabel value_idf_tfidf dapat dilihat pada Tabel 4.4.
Tabel 4. 4 Tabel value_idf_tfidf
1 sum_idf Float Tidak Menyimpan total idf
Menyimpan total tfidf
2 tfidf_pos Float Tidak
kata positif
Menyimpan total tfidf
3 tfidf_neg Float Tidak
kata negatif
43
e. Tabel data_tfidf
Nama Tabel : data_tfidf
Adapun struktur tabel data_tfidf dapat dilihat pada Tabel 4.5.
Tabel 4. 5 Tabel data_tfidf
1 word Text Tidak Menyimpan kata
2 tf Int(11) Tidak Menyimpan nilai tf
Menyimpan tfidf dari
3 tfidf Float Tidak
setiap kata
f. Tabel value_accuracy
Nama Tabel : value_accuracy
Adapun struktur tabel value_accuracy dapat dilihat pada Tabel 4.6.
Tabel 4. 6 Tabel value_accuracy
1 accuracy Double Tidak Menyimpan akurasi
2 positive Double Tidak Menyimpan total positif
3 negative Double Tidak Menyimpan total negatif
g. dataset_full
Nama Tabel : dataset_full
Adapun struktur tabel dataset_full dapat dilihat pada Tabel 4.7.
Tabel 4. 7 Tabel dataset_full
44
IV.2.2 Desain Fisik

Desain fisik berisi tentang rancangan atau desain antarmuka dan desain tabel.
Desain antar muka menjelaskan mengenai perancangan antarmuka sebelum
diimplementasikan menjadi sistem. Desain tabel menjelaskan mengenai ERD dan
menjelaskan mengenai struktur tabel (field, tipe data, panjang data, dan lain lain).
4.2.2.1 Desain Antar Muka
a. Desain Halaman Login Admin
Halaman ini menjelaskan mengenai login yang hanya dilakukan oleh
admin untuk menuju ke halaman home admin. Desain login admin dapat dilihat
pada Gambar 4.11.
Gambar 4. 11 Desain Halaman Login Admin

45
b. Desain Halaman Dataset Full

Halaman ini menjelaskan mengenai pengguna yang dapat melihat dataset
training dengan field username instagram, komentar dan label. Desain dataset
training dapat dilihat pada Gambar 4.12.
Dataset Full
Dataset Full
Gambar 4. 12 Desain Halaman Dataset Training
c. Desain Halaman Dataset Training

training dengan field username instagram, komentar dan label. Desain dataset
training dapat dilihat pada Gambar 4.13.
Gambar 4. 13 Desain Halaman Dataset Training

46
d. Desain Halaman Dataset Testing

testing dengan field username instagram, komentar dan label. Desain dataset
testing dapat dilihat pada Gambar 4.14.
Gambar 4. 14 Desain Halaman Dataset Testing

47
e. Desain Halaman Akurasi

Halaman ini menjelaskan mengenai pengguna dapat melihat hasil akurasi
sistem dan total dataset training dan testing. Desain halaman akurasi dapat dilihat
pada Gambar 4.15.
Gambar 4. 15 Desain Halaman Akurasi
f. Desain Halaman Hasil Proses Dataset Training

Halaman ini menjelaskan mengenai pengguna dapat melihat hasil proses
dari sistem yaitu hasil pre processing, kamus positif, kamus negatif, tf-idf positif,
tf-idf negatif dan total idf. Desain halaman hasil proses dataset training dapat
dilihat pada Gambar 4.16.
Gambar 4. 16 Desain Halaman Hasil Proses Dataset Training

BAB V
IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN
V.1 Implementasi
Pada penelitian ini implementasi dijabarkan menjadi 2 bagian, yaitu
implementasi hardware dan software dan implementasi script inti sistem.
V.1.1 Implementasi Hardware dan Software
a. Perangkat Keras (Hardware) yang Digunakan
Perangkat keras yang digunakan untuk mengoperasikan sistem yang akan
dibuat dapat adalah :
 Notebook ASUS A456UR.
 Processor Intel Core i5-6200 CPU 2.40GHz.
 Mouse Logitech M330.
 RAM 8GB.
 Monitor BenQ Resolusi 1920 x 1080.
 Hardisk 1TB, SSD 240GB.
b. Perangkat Lunak (Software) yang Digunakan

Perangkat lunak yang digunakan untuk membangun sistem yang akan
dibuat adalah :
 Sistem Operasi Windows 10.
 Aplikasi Visual Studio Code.
 Browser Microsoft Edge
 MySQL Database Server v3.2.2.
 XAMPP di gunakan sebagai server.
 Pembuatan ERD dan DFD dengan aplikasi Draw IO.
48
49
V.1.2 Implementasi Script Inti Sistem

Implementasi ini berisi dari script inti dari sistem yaitu tampilan halaman,
proses perhitungan training testing secara manual, proses klasifikasi dan akurasi
dari sistem.
5.1.2.1 Script Tampilan Halaman Admin
a. Tampilan Halaman Login
Script ini merupakan function untuk menampilkan halaman login admin
yang dapat dilihat pada gambar 5.1.
Gambar 5. 1 Script halaman login
b. Tampilan Halaman Dashboard

Script ini merupakan function untuk menampilkan halaman dashboard
admin yang dapat dilihat pada gambar 5.2.
Gambar 5. 2 Script halaman dashboard
c. Tampilan Halaman Dataset Full

Script ini merupakan function untuk menampilkan halaman dataset full
Gambar 5. 3 Script halaman dataset full

50
d. Tampilan Halaman Dataset Training

Script ini merupakan function untuk menampilkan halaman dataset
training yang dapat dilihat pada gambar 5.4.
Gambar 5. 4 Script halaman dataset training
e. Tampilan Halaman Dataset Testing

Script ini merupakan function untuk menampilkan halaman dataset testing
Gambar 5. 5 Script halaman dataset testing
f. Tampilan Halaman Kamus Data

Script ini merupakan function untuk menampilkan halaman kamus data
Gambar 5. 6 Script halaman kamus data

51
5.1.2.2 Script Proses Training Dataset

a. Proses pre processing
Proses pre processing memiliki beberapa proses yaitu case folding,
remove unique character, stemming dan stopword removal dan tokenizing. Proses
pre processing dapat dilihat pada gambar 5.7.
Gambar 5. 7 Script pre processing

52
b. Proses perhitungan idf

Script ini merupakan proses perhitungan nilai idf. Rumus dari idf dapat
dilihat pada landasan teori pada rumus persamaan (1). Proses perhitungan idf
dapat dilihat pada gambar 5.8.
Gambar 5. 8 Script perhitungan idf
c. Proses perhitungan tf-idf

Script ini merupakan proses perhitungan nilai idf. Rumus dari idf dapat
dilihat pada landasan teori pada rumus persamaan (2). Proses perhitungan tf-idf
dapat dilihat pada gambar 5.9 dan 5.10.
Gambar 5. 9 Script perhitungan tf-idf

53
d. Proses perhitungan total idf, tf-idf (negatif) dan tf-idf (positif)

Script ini merupakan proses perhitungan total dari idf, tf-idf (negatif) dan
(positif). Proses perhitungan dapat dilihat pada gambar 5.11.
Gambar 5. 11 Script perhitungan idf, tf-idf positif dan negatif

54
5.1.2.3 Script Proses Testing Dataset

a. Proses pre processing
remove unique character, stemming dan stopword removal dan tokenizing. Proses
pre processing dapat dilihat pada gambar 5.12.
Gambar 5. 12 Script pre processing dataset testing

55
b. Proses Perhitungan Conditional Probabilitas Positif dan Negatif

Script ini merupakan proses perhitungan conditional probabilitas positif
dan negatif. Rumus dari conditional probabilitas dapat dilihat pada landasan teori
pada rumus persamaan (4). Proses perhitungan dapat dilihat pada gambar 5.13.
Gambar 5. 13 Script perhitungan conditional probabilitas
c. Proses Perhitungan Prior Probabilitas Positif dan Negatif

Script ini merupakan proses perhitungan prior probabilitas positif dan
negatif. Rumus dari prior probabilitas dapat dilihat pada landasan teori pada
rumus persamaan (3). Proses perhitungan dapat dilihat pada gambar 5.14.
Gambar 5. 14 Script perhitungan prior probabilitas

56
d. Proses Perhitungan Posterior Probabilitas Positif dan Negatif

Script ini merupakan proses perhitungan posterior probabilitas positif dan
negatif. Rumus dari posterior probabilitas dapat dilihat pada landasan teori pada
rumus persamaan (5). Proses perhitungan dapat dilihat pada gambar 5.15.
Gambar 5. 15 Script perhitungan posterior probabilitas
e. Proses Klasisfikasi Sentimen

Script ini merupakan proses perhitungan klasifikasi sentimen positif dan
negatif. Proses dapat dilihat pada gambar 5.16.
Gambar 5. 16 Script proses klasifikasi sentimen

57
f. Proses Perhitungan Akurasi

Script ini merupakan proses perhitungan akurasi dari sistem. Akurasi
diperoleh menggunakan metode confusion matrix yang menghasilkan nilai
precission, recall dan akurasi sistem. Proses perhitungan dapat dilihat pada
gambar 5.17.
Gambar 5. 17 Script perhitungan akurasi

58
5.1.2.4 Script Proses Testing Dataset (Cross Validation)

Script ini merupakan proses perhitungan testing dataset full dengan
metode cross validation. Perhitungan ini dilakukan untuk melihat apakah metode
Naïve Bayes Classifier cocok digunakan untuk penelitian yang dilakukan. Proses
testing ini memiliki alur yang sama seperti perhitungan dataset testing. Hanya saja
proses testing dilakukan beberapa kali sesuai k yang diinputkan. Proses
perhitungan testing diletakkan pada baris code yang ditandai panah berwarna
merah yang dapat dilihat pada gambar 5.18.
Gambar 5. 18 Script proses testing cross validation

59
5.1.2.5 Script Proses Testing Komentar Inputan

Script ini merupakan proses perhitungan dari testing komentar yang
diinputkan oleh pengguna. Proses testing ini memiliki alur yang sama seperti
perhitungan dataset testing. Proses untuk mengambil inputan dari pengguna
diletakkan pada baris code yang ditandai panah berwarna merah yang dapat dilihat
pada gambar 5.19.
Gambar 5. 19 Script proses testing komentar inputan

60
V.2 Hasil
V.2.1 Hasil Uji Coba
Hasil uji coba berisi tentang hasil dari implementasi sistem yaitu tampilan
halaman, training dataset dengan jumlah 750 baris data, testing dataset
menggunakan metode confusion matrix dengan jumlah 250 baris data dan testing
dataset dengan kombinasi cross validation dan confusion matrix dengan jumlah
1000 baris data.
5.2.1.1 Hasil Tampilan Halaman Admin
a. Halaman Login
Halaman login adalah hasil dari implementasi di dalam script inti sistem
Gambar 5. 20 Hasil halaman login
b. Halaman Dashboard
Halaman dashboard adalah hasil dari implementasi di dalam script inti
sistem yang dapat dilihat pada gambar 5.21.
Gambar 5. 21 Hasil halaman dashboard

61
c. Halaman Dataset Full

Halaman dataset full adalah hasil dari implementasi di dalam script inti
Gambar 5. 22 Hasil halaman dataset full
d. Halaman Dataset Trining

Halaman dataset training adalah hasil dari implementasi di dalam script
inti sistem yang dapat dilihat pada gambar 5.23.
Gambar 5. 23 Hasil halaman dataset training

62
e. Halaman Dataset Testing

Halaman dataset testing adalah hasil dari implementasi di dalam script inti
Gambar 5. 24 Hasil halaman dataset testing
f. Halaman Kamus Data

Halaman kamus data adalah hasil dari implementasi di dalam script inti
Gambar 5. 25 Hasil halaman kamus data

63
5.2.1.2 Hasil Training Dataset

Hasil uji coba training dataset dilakukan dengan menggunakan 750 baris
data. Tetapi pada halaman ini hanya diambil 3 baris data saja sebagai gambaran.
a. Dataset Awal
Dataset awal adalah data murni yang belum di proses sama sekali dan akan
diolah untuk proses selanjutnya. Dataset awal dapat dilihat pada gambar 5.26.
Gambar 5. 26 Dataset Awal
b. Hasil Proses Pre Processing

Proses pre processing terdiri dari case folding, remove unique character
and number, stemming dan stopword removal. Hasil dari proses pre processing
dapat dilihat pada gambar 5.27.
Gambar 5. 27 Hasil Proses pre processing

64
c. Hasil Proses Perhitungan idf

Gambar 5.28 merupakan hasil dari proses perhitungan nilai idf. Rumus
dari idf dapat dilihat pada landasan teori pada rumus persamaan (1).
Gambar 5. 28 Hasil Proses Perhitungan idf
d. Hasil Proses Perhitungan tf-idf (Positif)

Gambar 5.29 merupakan hasil dari proses perhitungan nilai tf-idf yang
berlabel positif. Rumus dari tf-idf dapat dilihat pada landasan teori pada rumus
persamaan (2).
Gambar 5. 29 Hasil Proses Perhitungan tf-idf (Positif)
e. Hasil Proses Perhitungan tf-idf (Negatif)

Gambar 5.30 merupakan hasil dari proses perhitungan nilai tf-idf yang
berlabel negatif. Rumus dari tf-idf dapat dilihat pada landasan teori pada rumus
persamaan (2).
Gambar 5. 30 Hasil Proses Perhitungan tf-idf (Negatif)

65
f. Hasil Proses Perhitungan total idf dan total tf-idf

Gambar 5.31 merupakan hasil proses perhitungan total dari idf, tf-idf
(negatif) dan tf-idf (positif).
Gambar 5. 31 Hasil Proses Perhitungan total idf dan tf-idf
5.2.1.3 Hasil Testing Dataset

a. Hasil Proses pre processing
remove unique character, stemming dan stopword removal dan tokenizing. Hasil
dari proses pre processing dapat dilihat pada gambar 5.32.
Gambar 5. 32 Hasil Proses Pre Processing
b. Hasil Proses Perhitungan Conditional Probabilitas Positif dan Negatif

Pada gambar 5.33 merupakan hasil dari perhitungan conditional
probabilitas positif dan negatif. Rumus dari conditional probabilitas dapat dilihat
pada landasan teori pada rumus persamaan (4).
Gambar 5. 33 Hasil Proses Perhitungan Conditional Probabilitas

66
c. Hasil Proses Perhitungan Prior Probabilitas Positif dan Negatif

Pada gambar 5.34 merupakan hasil dari perhitungan prior probabilitas
positif dan negatif. Rumus dari prior probabilitas dapat dilihat pada landasan teori
pada rumus persamaan (3).
Gambar 5. 34 Hasil Proses Perhitungan Prior Probabilitas
d. Hasil Proses Perhitungan Posterior Probabilitas Positif dan Negatif

Pada gambar 5.35 merupakan hasil dari perhitungan posterior probabilitas
positif dan negatif. Rumus dari posterior probabilitas dapat dilihat pada landasan
teori pada rumus persamaan (5).
Gambar 5. 35 Hasil Proses Perhitungan Posterior Probabilitas
e. Hasil Proses Klasifikasi

Pada gambar 5.36 merupakan hasil dari perhitungan klasifikasi sentimen
positif dan negatif.
Gambar 5. 36 Hasil Proses Klasifikasi Sentimen

67
f. Hasil Proses Akurasi

Pada gambar 5.37 merupakan hasil dari perhitungan akurasi dari sistem
menggunakan metode confusion matrix.
Gambar 5. 37 Hasil Proses Akurasi
5.2.1.4 Hasil Testing Dataset (Cross Validation + Confusion Matrix)

Pada gambar 5.38 merupakan hasil dari perhitungan akurasi menggunakan
metode cross validation dengan jumlah k = 4.
Gambar 5. 38 Hasil Testing Dataset (cross validation)

68
5.2.1.5 Hasil Testing Komentar Inputan

Halaman testing komentar inputan adalah hasil dari implementasi di dalam
script inti sistem yang dapat dilihat pada gambar 5.39.
Gambar 5. 39 Hasil Testing Komentar Inputan

69
V.2.2 Pembuktian Dengan Perhitungan Manual

Hasil dari uji coba dari sistem yang telah diimplementasikan dapat
dibuktikan kebenarannya menggunakan perhitungan manual. Perhitungan manual
meliputi 2 bagian yaitu perhitungan training dan testing.
5.2.2.1 Perhitungan Training Dataset
a. Dataset training :
Sebelum melakukan training atau belajar, diperlukan dataset yang akan
digunakan untuk proses training itu sendiri. Pada contoh perhitungan manual,
digunakan 4 record data dari sebuah dataset. Dataset training dapat dilihat
pada tabel 5.1.
Tabel 5. 1 Tabel dataset training
No Komentar Sentimen
1 Terharu .., semoga berkah ya pak .., Positif
2 Papua perlu 1000 orang Kaya pak @jokowi Positif
3 heran deh kok suka tolol >:0 Negatif
4 gak tau emang suka tolol Negatif
b. Melakukan preprocessing terhadap dataset training. Proses preprocessing

dilakukan untuk mengolah data komentar sebelum dilakukan perhitungan.
Hasil dari preprocessing dapat dilihat pada Tabel 5.2.
Tabel 5. 2 Tabel hasil pre processing
No Komentar Pre-Processing
1 Terharu .., semoga berkah ya pak .., haru moga berkah pak
Papua perlu 1000 orang Kaya pak papua perlu orang kaya pak
2 @jokowi jokowi
3 heran deh kok suka tolol >:0 heran deh suka tolol
4 gak tau emang suka tolol gak tau emang suka tolol
70
c. Proses setelah preprocessing adalah pembobotan kata yaitu untuk memperoleh

daftar kata unik / kamus kata dan nilai idf. Daftar kata ini didapatkan dari hasil pre
processing. Kata unik secara keseluruhan dan nilai idf dapat dilihat pada Tabel
4.3.
Tabel 5. 3 Tabel kata unik dan idf
No Kata d tf idf = log(d/df) idf
1 haru 4 1 Log(4/1) 0,60205999
2 moga 4 1 Log(4/1) 0,60205999
3 berkah 4 1 Log(4/1) 0,60205999
4 pak 4 1 Log(4/1) 0,60205999
5 papua 4 1 Log(4/1) 0,60205999
6 perlu 4 1 Log(4/1) 0,60205999
7 orang 4 1 Log(4/1) 0,60205999
8 kaya 4 1 Log(4/1) 0,60205999
9 jokowi 4 1 Log(4/1) 0,60205999
10 heran 4 1 Log(4/1) 0,60205999
11 deh 4 1 Log(4/1) 0,60205999
12 suka 4 2 Log(4/2) 0,30103
13 tolol 4 2 Log(4/2) 0,30103
14 gak 4 1 Log(4/1) 0,60205999
15 tau 4 1 Log(4/1) 0,60205999
16 emang 4 1 Log(4/1) 0,60205999
Total idf = 8,7298698742
71
d. Klasifikasi Kata unik kelas positif diambil dari kamus data yang kemudian
dilakukan pengecekan apakah kata ada di dataset setelah hasil pre-processing
dengan label positif. Jika kata tersebut tersedia, maka kata tersebut akan
dimasukkan kedalam daftar kata positif. Lalu melakukan perhitungan tf-idf dengan
rumus tf dikali dengan idf. Kata unik positif dan tf-idf dapat dilihat pada tabel 5.4.
Tabel 5. 4 Tabel Klasifikasi Kata Unik Positif dan tf-idf
No Kata tf idf tf-idf = tf x idf tf-idf
1 haru 1 0,602059991 1 x 0,602059991 0,60206
2 moga 1 0,602059991 1 x 0,602059991 0,60206
3 berkah 1 0,602059991 1 x 0,602059991 0,60206
4 pak 1 0,602059991 1 x 0,602059991 0,60206
5 papua 1 0,602059991 1 x 0,602059991 0,60206
6 perlu 1 0,602059991 1 x 0,602059991 0,60206
7 orang 1 0,602059991 1 x 0,602059991 0,60206
8 kaya 1 0,602059991 1 x 0,602059991 0,60206
9 jokowi 1 0,602059991 1 x 0,602059991 0,60206
Total tf-idf (positif) = 5,41853992
e. Klasifikasi kata unik kelas negatif dan bobot tf-idf. Perhitungan sama seperti
mencari dengan mencari kata yang berlabel negatif. Kata unik positif dan tf-idf
dapat dilihat pada tabel 5.5.
Tabel 5. 5 Tabel Klasifikasi Kata Unik Negatif dan tf-idf
No Kata tf idf tf-idf = tf x idf tf-idf
1 heran 1 0,602059991 1 x 0,602059991 0,60206
2 deh 1 0,602059991 1 x 0,602059991 0,60206
3 suka 2 0,301029996 2 x 0,301029995 0,60206
4 tolol 2 0,301029996 2 x 0,301029995 0,60206
5 gak 1 0,602059991 1 x 0,602059991 0,60206
6 tau 1 0,602059991 1 x 0,602059991 0,60206
7 emang 1 0,602059991 1 x 0,602059991 0,60206
Total tf-idf (negatif) = 4,21442
Setelah melakukan perhitungan training dataset, maka diperoleh nilai nilai yang
akan digunakan untuk perhitungan uji komentar, diantaranya adalah nilai total idf,
total tf-idf positif dan total tf-idf negatif.
72
5.2.2.2 Perhitungan Testing Data

a. Data komentar untuk menganalisis sentimen dari sebuah komentar. Data test
komentar dapat dilihat pada Tabel 5.6.
Tabel 5. 6 Tabel data test komentar
No Komentar
1 Bikin terharu ya pak jokowi :’)
b. Pre-processing komentar. Hasil dari pre-processing komentar dapat dilihat

pada Tabel 5.7.
Tabel 5. 7 Tabel pre-processing komentar
No Komentar Pre-Processing
1 Bikin terharu ya pak jokowi :’) bikin haru pak jokowi
c. Menghitung conditional probability positif dan negatif

Cara mendapatkan hasil dari perhitungan conditional probability adalah
dengan melakukan pengecekan setiap kata dari hasil pre-processing pada
kamus data. Rumus dapat dilihat pada halaman landasan teori di rumus poin 4.
Hasil dari conditional probability dapat dilihat pada Tabel 5.8 dan 5.9.
Tabel 5. 8 Tabel conditional probability positif
P(bikin|positif) = ( 5.41854+8.72987
0+1
) = 0,070679320
= (
5.41854+8.72987 )
0,60206+1
P(haru|positif) = 0,113232511
= (
5.41854+8.72987 )
0,60206+1
P(pak|positif) = 0,113232511
= (
5.41854+8.72987 )
0,60206+1
P(jokowi|positif) = 0,113232511
Tabel 5. 9 Tabel conditional probability negatif
P(bikin|negatif) = ( 4,21442+8.72987
0+1
) = 0,077254140
= (
4,21442+8.72987 )
0+1
P(haru|negatif) = 0,077254140
= (
4,21442+8.72987 )
0+1
P(pak|negatif) = 0,077254140
73
P(jokowi|negatif) = ( 4,21442+8.72987
0+1
) = 0,077254140
d. Menghitung probabilitas komentar kelas positif dengan menghitung prior
probability dari kelas positif dan negatif dengan rumus yang dapat dilihat pada
landasan teori rumus poin 3 dan implementasi perhitungan sebagai berikut:
jumlah data positif
P(positif) =
jumlah seluruh data
= 24 =0,5
jumlah data positif 2
P(Negatif) = = =0,5
jumlah seluruh data 4
e. Menghitung posterior probability positif dan negatif. Hasil dari perhitungan

posterior probability dapat dilihat pada Tabel 5.10 dan 5.11.
Tabel 5. 10 Tabel posterior probability positif
P(Positif | bikin haru pak jokowi) Hasil
0,5 x 0,070679320 x 0,113232511 x 0,113232511 x 0,00005130690
0,113232511
Tabel 5. 11 Tabel posterior probability negatif

P(Negatif | bikin haru pak jokowi) Hasil
0,5 x 0,077254140 x 0,077254140 x 0,077254140 x 0,00001780972
0,077254140
Didapatkan hasil dari posterior probability yaitu kelas positif dengan nilai
0,00005130690 dan kelas negatif dengan nilai 0,00001780972 , karena nilai kelas
positif lebih besar dari nilai negatif maka data uji diklasifikasikan dengan hasil
Positif. Perhitungan untuk mendapatkan akurasi dapat dilakukan secara berulang
pada dataset testing sejumlah 250 baris data. Kemudian menghitung dengan
rumus confusion matrix.
74
V.3 Pembahasan
Pembahasan ini berisi tentang pembahasan hasil pengujian. Pengujian
sistem dilakukan dengan kombinasi dari metode confusion matrix dan cross
validation. Pengujian cross validation menggunakan k = 4 dan menghasilkan nilai
yang dapat dilihat pada tabel 5.12.
Tabel 5. 12 Hasil pengujian akurasi sistem
Fold ke i TP TN FP FN Accuracy Precission Recall
Fold - 1 99 108 20 23 82,8% 83,19% 81,15%
Fold – 2 111 96 9 34 82,8% 92,5% 76,55%
Fold – 3 92 121 5 32 85,2% 94,85% 74,19%
Fold – 4 76 127 8 39 81,2% 90,48% 66,09%
Rata - rata 83% 90,25% 74,49%
Kesalahan prediksi dari dari sistem yang telah dirancang dikarenakan banyaknya
faktor seperti contoh adalah kesalahan ketik oleh user (typo), kalimat sindiran
halus yang tidak dapat dianalisa oleh sistem dan kata yang belum ada di dalam
kamus sehingga mengakibatkan akurasi yang kurang maksimal. Hasil pengujian
sistem dapat dilihat pada gambar 5.40.
Gambar 5. 40 Hasil Pengujian Sistem

BAB VI
PENUTUP
VI.1 Simpulan
Sistem analisis sentimen untuk mengklasifikasikan komentar postif dan
negatif dalam postingan instagram pada akun Presiden Republik Indonesia
@jokowi telah berhasil dibuat. Sistem yang dibuat dengan menggunakan metode
Naïve Bayes Classifier sebagai klasifikasi sentimen dan TF-IDF sebagai
pembobotan kata berhasil untuk melakukan klasifikasi sentimen pada komentar
masyarakat pada postingan instagram @jokowi.
Sistem diuji menggunakan kombinasi dari metode confusion matrix dan
cross validation untuk mengetahui hasil akurasi yang didapatkan oleh sistem.
Hasil pengujian dari cross validation dan confussion matrix mendapatkan rata –
rata akurasi sebesar 83%, precission sebesar 90,25% dan recall sebesar 74,49%
sehingga dapat disimpulkan bahwa metode Naïve Bayes Classiffier dapat
melakukan klasifikasi sentimen dengan akurasi rata - rata di atas 80%.
VI.2 Saran
Saran untuk penelitian berikutnya adalah melakukan pre processing yang
lebih baik lagi terutama untuk mengolah kata yang bersifat singkatan yang
mengandung kata positif / negatif menjadi kata yang sebenarnya (benar), karena kata
singkatan tersebut akan sangat berpengaruh jika menjadi kata sebenarnya saat masuk
ke dalam perhitungan sistem sehingga akan mendapatkan akurasi yang lebih baik
lagi.
75
DAFTAR PUSTAKA
Buntoro, G.A. (2017), Analisis Sentimen Calon Gubernur DKI Jakarta 2017 Di
Twitter, INTEGER: Journal of Information Technology, 1(1), 32–41Diakses
https://www.researchgate.net/profile/Ghulam_Buntoro/publication/31661719
4_Analisis_Sentimen_Calon_Gubernur_DKI_Jakarta_2017_Di_Twitter/
links/5907eee44585152d2e9ff992/Analisis-Sentimen-Calon-Gubernur-DKI-
Jakarta-2017-Di-Twitter.pdf.
Fauzi, A., Akbar, M.F. dan Asmawan, Y.F.A. (2019), Sentimen Analisis
Berinternet Pada Media Sosial Dengan Menggunakan Algoritma Bayes,
Jurnal Informatika, 6(1), 77–83.
Fauzi, M.A. dan Adinugroho, S. (2018), Analisis Sentimen Pariwisata Di Kota
Malang Menggunakan Metode Naive Bayes Dan Seleksi Fitur Query
Expansion Ranking Image Processing View Project Smart Wheelchair View
Project, Researchgate.Net, (February)Diakses
https://www.researchgate.net/publication/322959527.
Gunawan, B., Pratiwi, H.S. dan Pratama, E.E. (2018), Sistem Analisis Sentimen
Pada Ulasan Produk Menggunakan Metode Naive Bayes, Jurnal Edukasi
dan Penelitian Informatika (JEPIN), 4(2), 113.
Kurniawan, S., Gata, W., Puspitawati, D.A., -, N., Tabrani, M. dan Novel, K.
(2019), Perbandingan Metode Klasifikasi Analisis Sentimen Tokoh Politik
Pada Komentar Media Berita Online, Jurnal RESTI (Rekayasa Sistem dan
Teknologi Informasi), 3(2), 176–183.
Liu, B. (2015), Sentiment Analysis: Mining Opinions, Sentiments, And Emotions,
Cambridge University Press: Bing Liu.
Luqyana, W.A., Cholissodin, I. dan Perdana, R.S. (2018), Analisis Sentimen
Cyberbullying Pada Komentar Instagram Dengan Metode Klasifikasi
Support Vector Machine, Jurnal Pengembangan Teknologi Informasi dan
Ilmu Komputer (J-PTIIK) Universitas Brawijaya, 2(11), 4704–4713.
Munitasri, I., Santosa, S. dan Supriyanto, C. (2018), Klasifikasi Pesan Sms
Menggunakan Algoritma Naive Bayes Dengan Seleksi Fitur Genetic
76
77
Algorithm, Jurnal Teknologi Informasi, 14(1)Diakses http://research.

Mustakini, J.H. (2016), Analisa Dan Perancangan Sistem Modern, Yogyakarta:
ANDI Publisher.
Nurhuda, F. dan Sihwi, S.W. (2014), Analisis Sentimen Masyarakat Terhadap
Calon Presiden Indonesia 2014 Berdasarkan Opini Dari Twitter
Menggunakan Metode Naive Bayes Classifier, ITSmart: Jurnal Ilmiah
Teknologi dan Informasi, 2(2), 35–42.
Oetomo, B.S.D. (2003), Sistem Basis Data: Analisis Dan Pemodelan Data,
Yogyakarta: Graha Ilmu.
Rahman, A., Wiranto, W. dan Doewes, A. (2017), Online News Classification
Using Multinomial Naive Bayes, ITSMART: Jurnal Teknologi dan Informasi,
6(1), 32–38.
Rofiqoh, U., Perdana, R.S. dan Fauzi, M.A. (2017), Analisis Sentimen Tingkat
Kepuasan Pengguna Penyedia Layanan Telekomunikasi Seluler Indonesia
Pada Twitter Dengan Metode Support Vector Machine Dan Lexion Based
Feature, Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer (J-
PTIIK) Universitas Brawijaya, 1(12), 1725–1732Diakses http://j-
ptiik.ub.ac.id/index.php/j-ptiik/article/view/628.
Rossi, A., Lestari, T., Setya Perdana, R. dan Fauzi, M.A. (2017), Analisis
Sentimen Tentang Opini Pilkada DKI 2017 Pada Dokumen Twitter
Berbahasa Indonesia Menggunakan Näive Bayes Dan Pembobotan Emoji,
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 1(12),
1718–1724Diakses http://j-ptiik.ub.ac.id.
Salam, A., Zeniarja, J. dan Khasanah, R.S.U. (2018), Analisis Sentimen Data
Komentar Sosial Media Facebook Dengan K-Nearest Neighbor (Studi Kasus
Pada Akun Jasa Ekspedisi Barang J&T Ekpress Indonesia), Prosiding
SINTAK, 480–486.
Santoso, E.B. dan Nugroho, A. (2019), Analisis Sentimen Calon Presiden
Indonesia 2019 Berdasarkan Komentar Publik Di Facebook, Eksplora
Informatika, 9(1), 60–69.
78
Sipayung, E.M., Maharani, H. dan Zefanya, I. (2016), Perancangan Sistem

Analisis Sentimen Komentar Pelanggan Menggunakan Metode Naive Bayes
Classifier, Jurnal Sistem Informasi, 8(1), 958–965Diakses
https://ejournal.unsri.ac.id/index.php/jsi/article/view/3250/1907.
LAMPIRAN
Lampiran 1. Bukti surat pernyataan konsultasi dengan ahli bahasa Indonesia
79
80
Lampiran 2. Bukti foto konsultasi dengan ahli bahasa Indonesia

Naskah TA 5170411152 Andhika Pratama

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Naskah TA 5170411152 Andhika Pratama

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS SENTIMEN PADA KOMENTAR AKUN

INSTAGRAM JOKOWI MENGGUNAKAN METODE NAÏVE

PROGRAM STUDI INFORMATIKA

Puji syukur dipanjatkan atas kehadirat Allah SWT, karena dengan

Kata Kunci: Analisis Sentimen, Naïve Bayes Classifier, Instagram.

Keywords : Sentiment Analysis, Naïve Bayes Classifier, Instagram

BAB II Kajian Hasil Penelitian dan Landasan Teori.........................................5

BAB III METODE PENELITIAN.....................................................................21

BAB IV ANALISIS DAN DESAIN SISTEM....................................................27

4.2 Desain Sistem...................................................................................................30

BAB V IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN................48

Gambar 3. 1 Screenshoot akun @jokowi...............................................................22

Gambar 5. 22 Hasil halaman dataset full...............................................................62

Tabel 2. 1 Perbandingan Kajian Hasil Penelitian....................................................9

I.1 Latar Belakang

I.2 Rumusan Masalah

I.3 Batasan Masalah

I.4 Tujuan penelitian

I.5 Manfaat Penelitian

I.6 Sistematika Penulisan

BAB II KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI

BAB III METODE PENELITIAN

BAB IV ANALISIS DAN DESAIN SISTEM

BAB V IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN

II.1 Kajian Hasil Penelitian

Support Vector Machine bertujuan untuk mengetahui sentimen pembullyan pada

Penelitian oleh Kurniawan, S. dkk., (2019), dengan judul Perbandingan

Tabel 2. 1 Perbandingan Kajian Hasil Penelitian

6 Analisis Sentimen Wanda Athira Support Data yang digunakan

II.2 Landasan Teori

II.2.4 Naïve Bayes Classifier

Perhitungan conditional probability dilakukan dengan model multinomial.

Menurut Rahman, A. dkk., (2017), perhitungan posterior probability

web. Pada perkembangannya, kode-kode yang digunkan dirilis untuk umum

II.2.6 Data Flow Diagram (DFD)

1 Eksternal Entity (kesatuan luar) atau

2. Data Flow (arus data)

Sumber : Mustakini, J. H., (2016)

II.2.7 Entity Relationship Diagram (ERD)

No. Gambar Keterangan

3. Atribut atau bentuk elips adalah sesuatu

III.1 Bahan / Data

Tabel 3. 1 Sampel Data Mentah

III.1.2 Prosedur Pengumpulan Data

Gambar 3. 1 Screenshoot akun @jokowi

Gambar 3. 2 Screenshoot salin link

Gambar 3. 3 Screenshoot website exportcomments.com

Gambar 3. 4 Screenshoot hasil download data

5. Kemudian melakukan pemberian label sentimen positif dan negatif secara

Gambar 3. 5 Screenshoot data yang sudah diberi label

III.2 Aturan Bisnis

Gambar 3. 6 Flowchart Sistem Saat Ini

III.2.2 Kelemahan Sistem Saat Ini

III.3 Tahapan Penelitian

Gambar 3. 7 Diagram Tahapan Penelitian

IV.1 Analisis Sistem Yang Diusulkan

IV.1.1 Analisis Fungsional

c. Analisis Kebutuhan Output

IV.1.2 Analisis Non Fungsional

4.1.2.2 Perangkat Lunak (Software) yang Digunakan

IV.1.3 Arsitektur Sistem

IV.2 Desain Sistem

IV.2.1 Desain Logik