Anda di halaman 1dari 35

SENTIMENT ANALYSIS MASYARAKAT INDONESIA

TERHADAP PENERAPAN PSBB DI MASA PANDEMI


DENGAN NAÏVE BAYES

LAPORAN TUGAS AKHIR

MOHAMAD DHIFTA RAMADHAN


5170411036

PROGRAM STUDI INFORMATIKA


FAKULTAS TEKNOLOGI INFORMASI DAN ELEKTRO
UNIVERSITAS TEKNOLOGI YOGYAKARTA
YOGYAKARTA
2020
SENTIMENT ANALYSIS MASYARAKAT INDONESIA
TERHADAP PENERAPAN PSBB DI MASA PANDEMI
DENGAN NAÏVE BAYES

Disusun oleh
MOHAMAD DHIFTA RAMADHAN
5171011036

Telah dipertahankan di depan Dewan Penguji


pada tanggal ................................

DEWAN PENGUJI

Nama & Gelar Jabatan Tanda tangan Tanggal

Nama
Ketua Penguji ............................. ................
NIK ..................

Nama
NIK.............. Penguji I ............................. ................

Nama
Penguji II
NIK ..................... ............................. ...............
(Dosen Pembimbing)

Yogyakarta, ........................
Ketua Program Studi Informatika

Dr. Enny Itje Sela, S.Si., M.Kom.


NIK 110909046

ii
LEMBAR PERNYATAAN

Yang bertanda tangan di bawah ini, saya


Nama : Mohamad Dhifta Ramadhan
NPM : 5170411036
Program Studi : Informatika
Program : Sarjana
Fakultas : Teknologi Informasi dan Elektro
menyatakan bahwa tugas akhir dengan judul Sentiment analysis
masyarakat Indonesia terhadap penerapan PSBB di masa pandemi dengan
Naïve Bayes ini adalah karya ilmiah asli saya dan belum pernah dipublikasikan
oleh orang lain, kecuali yang tertulis sebagai acuan dalam naskah ini dan disebutkan
dalam daftar pustaka. Apabila di kemudian hari, karya saya disinyalir bukan
merupakan karya asli saya, maka saya bersedia menerima konsekuensi apa yang
diberikan Program Studi Informatika Fakultas Teknologi Informasi dan Elektro
Universitas Teknologi Yogyakarta.

Demikian surat pernyataan ini saya buat dengan sebenarnya.

Dibuat di : Yogyakarta
Pada tanggal : 10 oktober
2020
Yang menyatakan

Mohamad Dhifta
Ramadhan

iii
ABSTRAK

Corona virus adalah keluarga besar virus yang menyebabkan penyakit mulai dari
gejala ringan sampai berat. Ada setidaknya dua jenis coronavirus yang diketahui
menyebabkan penyakit yang dapat menimbulkan gejala berat seperti Middle East
Respiratory Syndrome (MERS) dan Severe Acute Respiratory Syndrome (SARS).
Dalam mencegah penyebaran virus covid-19 tersebut Indonesia menerapkan
kebijakan PSBB, kemudian banyak tanggapan dan masalah-masalah yang timbul
dengan penerapan PSBB di Indonesia, ada yang menganggap bahwa kebijakan itu
sangatlah baik untuk mencegah penyebaran covid-19 ada pula yang menentang
kebijakan tersebut karna beranggapan banyak hal-hal yang mempengaruhi ekonomi
masyarakat ketika penerapan tersebut ditetapkan. Untuk mengetahui sebuah
sentiment dari opini masyarakat terhadap penerapan PSBB di Indonesia maka
dibuatlah sebuah sistem sentiment analysis menggunakan metode Naïve Bayes
untuk mengetahui tanggapan bersifat negative atau positif.

Kata kunci: Naïve Bayes, Corona Virus, Analisis Sentiment, PSBB

iv
ABSTRACT

Corona viruses are a large family of viruses that cause illness ranging from mild to
severe symptoms. There are at least two types of coronavirus that are known to
cause diseases that can cause severe symptoms such as Middle East Respiratory
Syndrome (MERS) and Severe Acute Respiratory Syndrome (SARS). In preventing
the spread of the Covid-19 virus, Indonesia implemented the PSBB policy, then
there were many responses and problems that arose with the implementation of
PSBB in Indonesia, some thought that the policy was very good at preventing the
spread of Covid-19, some were against the policy because they thought There are
many things that affect the economy of society when the implementation is
determined. To find out a sentiment from public opinion regarding the
implementation of PSBB in Indonesia, a sentiment analysis system was created
using the Naïve Bayes method to determine whether the response was negative or
positive.

Keywords: Naïve Bayes, Corona Virus, Sentiment Analysis, PSBB

v
KATA PENGANTAR

Puji syukur dipanjatkan atas kehadirat Allah SWT, karena dengan limpahan
karunia-Nya penulis dapat menyelesaikan Tugas Akhir dengan judul Sentiment
analysis masyarakat Indonesia terhadap penerapan PSBB di masa pandemi dengan
Naïve Bayes.
Penyusunan Tugas Akhir diajukan sebagai salah satu syarat untuk
memperoleh gelar sarjana pada Program Studi Informatika Fakultas Teknologi
Informasi dan elektro Universitas Teknologi Yogyakarta.
Tugas Akhir ini dapat diselesaikan tidak lepas dari segala bantuan,
bimbingan, dorongan dan doa dari berbagai pihak, yang pada kesempatan ini
penulis ingin menyampaikan ucapan terima kasih kepada:
a. Bapak Dr. Bambang Moertono Setiawan, M.M, CA., Akt. Selaku Rektor
Universitas Teknologi Yogyakarta.
b. Bapak Sutarman, M.Kom., Ph.D. Selaku Dekan Fakultas Teknologi
Informasi dan Elektro.
c. Ibu Dr. Enny Itje Sela, S.Si., M.Kom. selaku Ketua Program Studi
Informatika Universitas Teknologi Yogyakarta.
d. Bapak Suhirman, S.Kom., M.Kom., Ph.D. selaku dosen Pembimbing
Tugas Akhir.

Akhir kata, penulis menyadari bahwa sepenuhnya akan terbatasnya


pengetahuan penyusun, sehingga tidak menutup kemungkinan jika ada
kesalahan serta kekurangan dalam penyusunan Tugas Akhir, untuk itu sumbang
saran dari pembaca sangat diharapkan sebagai bahan pelajaran berharga dimasa
yang akan datang.
Yogyakarta, Oktober 2020

Penulis

vi
DAFTAR ISI

ABSTRAK ............................................................................................................ iv
ABSTRACT ........................................................................................................... v
KATA PENGANTAR .......................................................................................... vi
DAFTAR ISI ........................................................................................................ vii
DAFTAR GAMBAR ............................................................................................ ix
DAFTAR TABEL ................................................................................................. x
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang ............................................................................................. 1
1.2 Rumusan Masalah ........................................................................................ 2
1.3 Batasan Masalah........................................................................................... 2
1.4 Tujuan penelitian .......................................................................................... 2
1.5 Manfaat Penelitian ....................................................................................... 3
1.6 Sistematika Penulisan .................................................................................. 3
BAB II KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI .............. 5
2.1 Kajian Hasil Penelitian ................................................................................. 5
2.2 Landasan Teori ............................................................................................. 7
2.2.1 Sentimen Analisis ...................................................................................... 7
2.2.2 Naïve Bayes ............................................................................................... 8
2.2.3 Python ........................................................................................................ 9
2.2.4 Pre-processing ............................................................................................ 9
2.2.5 Natural Language Toolkit (NLTK) .......................................................... 10
2.2.6 Term Frequency-Inverse Document Frequency (TF-IDF) ...................... 10
2.2.7 Entity Relationship Diagram (ERD) ........................................................ 10
2.2.8 Data Flow Diagram (DFD) ...................................................................... 11
BAB III METODE PENELITIAN..................................................................... 13
3.1 Bahan/Data ...................................................................................................... 13
3.1.1 Data yang diperoleh ................................................................................. 13
3.1.2 Prosedur pengumpulan data ..................................................................... 13
3.1.3 Pengumpulan Data ................................................................................... 13
3.1.4 Tahapan Penelitian ................................................................................... 17
BAB IV ANALISIS DAN PERANCANGAN SISTEM ................................... 19
4.1 Analisis Sistem ........................................................................................... 19
4.1.1 Analisis Sistem yang Berjalan ................................................................ 19
4.1.2 Analisis sistem yang diusulkan. ............................................................. 19
4.2 Desain Sistem ............................................................................................. 19
4.2.1 Perancangan Logik. ................................................................................ 19
4.2.2 Perancangan Fisik................................................................................... 20
BAB V IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN ............... 21
5.1. Implementasi .............................................................................................. 21
5.2. Hasil ........................................................................................................... 23
5.3. Pembahasan ................................................................................................ 23
BAB VI PENUTUP ............................................................................................. 24
vii
6.1 Simpulan .................................................................................................... 24
6.2 Saran ........................................................................................................... 24
DAFTAR PUSTAKA .......................................................................................... 25

viii
DAFTAR GAMBAR

Gambar 3.1 Proses pengumpulan data .................................................................. 14


Gambar 3.2 Data kotor hasil crawling .................................................................. 15
Gambar 3.3 Tahapan penelitian ............................................................................ 17
Gambar 4.1 DFD level 0 ....................................................................................... 20
Gambar 5.1 Script koneksi.php ............................................................................. 22
Gambar 5.2 Tampilan Home ................................................................................. 23

ix
DAFTAR TABEL

Tabel 2.1 Perbandingan Kajian Hasil Penelitian .................................................... 6


Tabel 2.2 Notasi dalam ERD ................................................................................ 11
Tabel 2.3 DFD (Data Flow Diagram) ................................................................... 12
Tabel 3.1 Pelabelan Data....................................................................................... 15
Tabel 3.2 Cleaning data......................................................................................... 16
Tabel 3.3 Case Folding ......................................................................................... 16

x
BAB I
PENDAHULUAN

1.1 Latar Belakang


Coronavirus adalah keluarga besar virus yang menyebabkan penyakit mulai
dari gejala ringan sampai berat. Ada setidaknya dua jenis coronavirus yang
diketahui menyebabkan penyakit yang dapat menimbulkan gejala berat seperti
Middle East Respiratory Syndrome (MERS) dan Severe Acute Respiratory
Syndrome (SARS). Coronavirus Disease 2019 (COVID-19) adalah penyakit jenis
baru yang belum pernah diidentifikasi sebelumnya pada manusia. Virus penyebab
COVID-19 ini dinamakan Sars-CoV-2. Virus corona adalah zoonosis (ditularkan
antara hewan dan manusia). Penelitian menyebutkan bahwa SARS ditransmisikan
dari kucing luwak (civet cats) ke manusia dan MERS dari unta ke manusia. Adapun,
hewan yang menjadi sumber penularan COVID-19 ini sampai saat ini masih belum
diketahui.
Untuk mengendalikan penyebaran COVID-19 Kementerian Kesehatan
Republik Indonesia membuat peraturan pedoman pembatasan sosial bersekala
besar (PSBB). Peraturan yang dibuat oleh Kementerian Kesehatan Republik
Indonesia ini membatasi kegiatan penduduk dalam wilayah tertentu yang diduga
terinfeksi COVID-19. Pembatasan tersebut meliputi pembatasan kegiatan kerja,
keagamaan, penggunaan tempat umum, budaya, sekolah, dan segala macam bentuk
kegiatan lainnya. Dengan adanya PSBB ini, banyak orang yang harus
menyesuaikan kegiatannya sejalan dengan peraturan yang sudah dibuat oleh
Kementrian Kesehatan Republik Indonesia.
Banyak tanggapan dan masalah-masalah yang timbul dengan penerapan
PSBB di Indonesia, ada yang menganggap bahwa kebijakan itu sangatlah baik
untuk mencegah penyebaran COVID-19 ada pula yang menentang kebijakan
tersebut karna beranggapan banyak hal-hal yang mempengaruhi ekonomi
masyarakat ketika penerapan tersebut ditetapkan.
Hal-hal ini menjadi sebuah masalah baru pada masyarakat Indonesia,
terlebih penerapan PSBB dilakukan dengan skala besar yang memungkinkan akan

1
2

menjadi faktor adanya masalah baru ataupun peluang baru di masa pandemi ini.
Opini-opini masyarakat mulai bertebaran di media sosial, terutama media sosial
twitter. Masyarakat mulai mengeluarkan opini mereka tentang PSBB dengan bebas
di media sosial twitter, hal inilah yang bisa digunakan untuk mengenali sebuah pola
analisis sentimen dari tanggapan mereka apakah itu tanggapan positif atau negatif.
Dengan bantuan sistem sentimen analysis dengan metode naïve bayes hal
ini dapat menghasilkan sebuah performa classification dari metode naïve bayes dan
membangun sistem yang dapat mengetahui sebuah sentiment dari tanggapan
seseorang.

1.2 Rumusan Masalah


Berdasarkan latar belakang maka rumusan masalah adalah bagaimana
membuat sistem sentimen analysis dengan metode naïve bayes sehingga dapat
mengetahui sebuah sentimen dari tanggapan seseorang?

1.3 Batasan Masalah


Penelitian pembuatan Sentiment Analysis masyarakat indonesia terhadap
penerapan psbb di masa pandemi dengan Naïve Bayes, yang mencakup berbagai
hal, sebagai berikut:
a. Data sentimen hanya dibagi menjadi 2 yaitu positif dan negatif.
b. Perancangan sistem dilakukan dengan menggunakan bahasa pemrograman
Python.
c. Analisis sentimen dilakukan menggunakan metode Naïve Bayes Classifier.
d. Data yang digunakan diambil dari twitter.

1.4 Tujuan penelitian


Penelitian ini bertujuan untuk mengetahui sebuah sentimen dari tanggapan
masyakarat Indonesia terkait kebijakan pemerintah dalam melakukan penerapan
PSBB di Indonesia apakah hal ini berdampak buruk atau tidak pada masyakarat,
dengan dibantu menggunakan metode Naïve Bayes Classifier.
3

1.5 Manfaat Penelitian


Manfaat yang didapatkan dari penelitian ini berupa hasil yang dapat
digunakan oleh pemerintah dan masyarakat untuk mengetahui sebuah baik dan
buruknya penerapan PSBB di Indonesia, sehingga kebijakan baru yang lebih baik
dari PSBB bisa dibuat kembali untuk mencegah penyebaran COVID-19.

1.6 Sistematika Penulisan


BAB I: PENDAHULUAN
Bab pendahuluan akan berisi mengenai latar belakang, perumusan masalah,
tujuan, manfaat penelitian yang menjadi sebuah pendahuluan dalam pekerjaan
Tugas Akhir mengenai pembuatan sistem Sentiment Analysis masyarakat
indonesia terhadap penerapan psbb di masa pandemi dengan Naïve Bayes.

BAB II: KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI


Bab kajian hasil penelitian dan landasan teori akan berisi kajian-kajian
penelitian yang digunakan oleh penulis sebagai refrensi dan tolak ukur atau
pembandingan dalam pembuatan sistem sentimen analisis penerapan PSBB di
Indonesia dengan menggunakan metode Naïve Bayes. Pada bab ini terdapat
beberapa sub bab yang berisi landasan teori yang mendukung pembuatan sistem
dan juga hubungan dengan sistem yang akan dibuat.

BAB III: METODE PENELITIAN


Bab metode penelitian akan berisi tentang penjelasan-penjelasan mengenai
data-data yang akan digunakan dalam pembuatan sistem sentimen analisis terkait
penerepan PSBB di Indonesia. Bab ini pula akan dijelaskan metode yang digunakan
untuk melakukan pembuatan sistem sentimen analisis penerapan PSBB dengan
metode Naïve Bayes.
4

BAB IV: ANALISIS DAN PERANCANGAN SISTEM


Bab analisis dan perancanagan sistem akan menjelaskan tentang sistem
yang akan dibuat. Pada bab ini dijelaskan pula mengenai perancangan sistem
sentiment untuk melakukan analysis pada penerapan PSBB di Indonesia. Bab ini
berisi tentang aliran data, perancangan, dan penerapan sistem sentimen dengan
metode naïve bayes.

BAB V: IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN


Bab implementasi dan hasil serta pembahasan akan membahas tentang
bagaimana implementasi sistem yang dibangun, termasuk bagaimana kebutuhan
perangkat keras yang digunakan, perangkat lunak yang dibutuhkan, dan bagaimana
implementasi rancangan dalam pengkodean program sehingga sistem dapat
dibangun. Pada bab ini dijelaskan pula hasil analysis menggunakan metode Naïve
Bayes.

BAB VI: PENUTUP


Bab penutup berisi sebuah kesimpulan dan kesulurah hasil penelitian
sentimen analisis penerapan PSBB di Indonesia dengan menggunakan metode
Naïve Bayes dan berisi saran-saran untuk penelitian selanjutnya yang berguna
untuk pengembangan sistem ini.
BAB II
KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI

2.1 Kajian Hasil Penelitian

Beberapa hasil penelitian yang pernah dilakukan oleh peneliti sebelumnya


yang memiliki bidang dan tema yang sama dengan penelitian yang akan dilakukan.
Penelitian oleh Hikmawan, Sisferi., Pardamean, Amsal., dan Khasanah, Siti
Nur. (2019), dengan judul Sentimen Analisis Publik Terhadap Joko Widodo
Terhadap Wabah Covid-19 Menggunakan Metode Machine Learning. Penelitian
tersebut membahas tentang analysis sentiment menggunakan tiga algoritma, yaitu
Naïve Bayse, K-NN dan Support Vector Machine. Penelitian ini menggunakan dua
input data keyword yaitu Jokowi dan Covid yang datanya diambil di twitter. Tujuan
dari penelitian tersebut adalah untuk mengetahui sebuah sentiment positif, netral
dan negatif menggunakan dua keyword tersebut.
Penelitian oleh Muljono., Artanti, Dian Putri., Syukut, Abdul., Prihandono,
Adi., dan Setiadi, De Rosal I. Moses. (2018) dengan judul Analisa Sentimen Untuk
penilaian pelayanan situs belanja online menggunakan algoritma Naïve Bayes.
Penelitian tersebut membahas bagaimana melakukan analisis sentimen terhadap
data opini pelanggan marketplace pada twitter yang digunakan untuk menentukan
situs belanja online yang dikategorikan baik.
Penelitian oleh Syarifuddin, Muhammad. (2020) dengan judul Analisis
sentimen opini publik mengenai covid-19 pada twitter menggunakan metode Naïve
Bayes dan KNN. Penelitian tersebut membahas sebuah gambaran tentang COVID-
19 yang cenderung ke opini positif atau negatif dan juga membandingkan sebuah
metode Naïve Bayes dan KNN untuk mengetahui akurasi yang paling baik.
Penelitian oleh Ratino., Hafidz, Noor., Anggraeni, Sita., dan Gata, Windu.
(2020) dengan judul Sentimen Analisis Informasi Covid-19 menggunakan Support
Vector Machine dan Naïve Bayes. Penelitian tersebut membahas tentang sebuah
analisis pada komentar Instragram terkait informasi COVID-19 dan

5
6

membandingkan dua algoritma yaitu Naïve Bayes dan Support Vector Machine
untuk mengetahui akurasi terbaik dari dua algoritma tersebut dengan dua label
postif dan negatif.
Penelitian oleh Hakim, Ikhwanul., Nugroho, Arifin., Sukmana, Sulaeman
Hadi., dan Gata, Windu. (2020) dengan judul Sentimen Analisis Stay Home
menggunakan metode klasifikasi Naive Bayes, Support Vector Machine, dan k-
Nearest Neighbor. Penelitian tersebut membahas sebuah analisis terkait stay home
menggunakan data dari twitter dan tiga metode berbeda yaitu Naïve Bayes, SVM,
dan K-NN.

Tabel 2.1 Perbandingan Kajian Hasil Penelitian


No Judul Penulis Metode Hasil/ Kesimpulan
1 Sentimen Analisis Hikmawan, Naïve Sentiment yang dihasilkan
Publik Terhadap Pardaeman, Bayes, dari penelitian tersebut adalah
Joko Widodo dan Khasanah K-NN sebuah akurasi dari tiga
Terhadap Wabah dan metode yang digunakan.
Covid-19 SVM Naïve Bayes menghasilkan
Menggunakan 84.58%, SVM menghasilkan
Metode Machine 92.93% sedangkan K-NN
Learning menghasilkan 83.70%.
2 Analisa Sentimen Muljono, Naïve Sentiment yang dihasilkan
Untuk Penilaian Artianti, Bayes dari penelitian tersebut
Pelayanan Situs Syukur, setelah menggunakan 1080
Belanja Online Prihandono, data latih dan 120 data uji
Menggunakan dan Setiadi menggunakan Naïve Bayes
Algoritma Naïve sebesar 95.16% positif dan
Bayes 91.38% negatif.
3 Analisis Sentimen Syarifuddin Naïve Hasil yang didapatkan dari
Opini Publik Bayes penelitian tersebut adalah
Mengenai Covid- dan sebuah tanggapan bahwa
19 Pada Twitter KNN sentiment pada covid-19
Menggunakan cenderung positif dan Naïve
Metode Naïve Bayes adalah model terbaik
Bayes Dan Knn dengan akurasi 63.21% dan
KNN 58.19%.
7

Tabel 2.1 Lanjutan Perbandingan Kajian Hasil Penelitian


No Judul Penulis Metode Hasil/ Kesimpulan
4 Sentimen Analisis Ratino, Naïve Hasil yang didapatkan dari
Informasi Covid- Hafidz, Bayes dan penelitian tersebut adalah
19 menggunakan Anggraeni, SVM sebuah hasil akurasi 80,23%
Support Vector dan Gata dari SVM dan 78,2% dari
Machine dan Naïve Naïve Bayes yang datanya
Bayes diperoleh dari tanggapan
komentar di Instragarm
5 Sentimen Analisis Hakim, Naïve Hasil yang didapatkan adalah
Stay Home Nugroho, Bayes, akurasi terbaik diperoleh oleh
menggunakan Sukman, SVM, dan Support Vector Machine
metode klasifikasi dan Gata KNN dengan akurasi 80,05%,
Naive Bayes, Naïve Bayes 66,80% dan
Support Vector KNN 51,45%
Machine, dan k-
Nearest Neighbor

Seperti terlihat pada tabel 2.1. perbedaan dari kelima referensi dengan judul
yang diangkat oleh penulis terletak pada pembahasan dan khasus penelitian yang
diangkat. Dari kelima penelitian tersebut bisa dilihat bahwa Naïve Bayes sebagai
metode penelitian terkait sentiment analysis masih kerap digunakan dengan akurasi
yang terbilang bagus. Hal inilah yang membuat penulis tertarik untuk melakukan
penelitian terkasi sentiment dengan metode naïve bayes.

2.2 Landasan Teori


2.2.1 Sentimen Analisis
Sentiment analysis merupakan sebuah Teknik untuk mengolah informasi
berupa sudut pandang seseorang terhadap sebuah isu atau kejadian. Hal ini dapat
digunakan untuk mengetahui sebuah tanggapan seseorang dalam hal-hal yang
sedang terjadi.
8

Sedangkan menurut Santoso, dkk. (dalam Faizar, 2014) sentiment analysis


adalah sebuah riset komputasional dari opini, sentiment dan emosi yang dituangkan
secara tekstual lalu diklasifikasi menjadi kelompok sentiment positif dan negatif.
Juga dalamn Santoso, dkk. (dalam Wicaksono, 2011) mengatakan bahwa sentiment
analysis dibagi menjadi 2 kategori besar, yaitu:
a. Coarse – grained sentiment analysis: Proses Analisa dan dan klasifikasi
orientasi sebuah dokumen secara keseluruhan. Orientasi ini dibagi
menjadi 3 jenis yaitu postif, netral, dan negatif.
b. Fined – grained sentiment analysis: Obyek yang diklasifikasi tidak pada
level kalimat dalam sebuah dokumen. Sebagai contoh:
1. Cara pengajaran kurang menarik > negative
2. Kuliah terlaksana dengan tepat waktu > positif

2.2.2 Naïve Bayes


Menurut Muljono., dkk. (2018) Naïve Bayes adalah algoritma klasifikasi
yang mudah, sederhana dan sering digunakan untuk klasifikasi dokumen. Dalam
proses membangun sistem pengklasifikasi menggunakan NB terdapat 2 tahapan
yang dilakukan. Tahap pertama adalah proses pelatihan (training) dan tahap yang
kedua adalah proses pengujian (testing).
Naive Bayes juga merupakan bentuk jaringan Bayes yang paling sederhana, di
yang mana semua atribut independen diberi nilai variabel kelas. Ini disebut
kemerdekaan bersyarat. Itu jelas bahwa asumsi kemerdekaan bersyarat jarang benar
di sebagian besar aplikasi dunia nyata.
Pada tahap training dilakukan beberapa tahapan yaitu menentukan
probabilitas kategori data latih, menghitung probabilitas kata data latih dan
menghitung probabilitas setiap kelas pada data latih. Berikut rumus dalam
perhitungan data latih menurut Muljono, dkk. (2018).
𝑝𝑘 + 1
𝑃(𝑤𝑘) =
𝑛 + |𝑣𝑜𝑐𝑎𝑏|
9

Dimana :
P(wk) : probabilitas term
Pk+1 : query+angka satu agar hasil perhitungan tidak nol
n : semua jumlah kata yang muncul di outcome dokumen
|vocab| : total kata keseluruhan

2.2.3 Python
Python adalah sebuah bahasa pemerograman yang dinamis dan memiliki
keberagaman luas dengan library dan tool yang disediakan oleh bahasa
pemerograman tersebut. Bahasa python sangat terkenal dibidang Artifical
Intiligance karena library yang disediakan sangat mendukung bidang tersebut, salah
satu yang di banggakan dari bahasa pemerograman python adalah librarynya dan
penulisannya yang mudah dan simple.
Menurut Rosmala dan Dwipa (2012), Python adalah salah satu bahasa
pemerograman tingkat tinggi yang bersifat interpreter, interaktif, object-oriented
dan dapat beroprasi di hampir semua platform, seperti keluarga UNIX, Mac,
Windows, dan lainnya. Sebagai bahasa tingkat tinggi, python termasuk salah satu
bahasa pemerograman yang mudah untuk di pelajari karena sintaks yang jelas dan
elegan, dikombinasikan dengan penggunaan module-module siap pakai dan
struktur data tingkat tinggi yang efesien.
Bahasa pemerograma python seringkali digunakan untuk melakukan sebuah
proses data, hal inilah yang membuat python menjadi bahasa yang popular dan
digemari oleh para Data Scientist dan Data Analysis.

2.2.4 Pre-processing
Pre-processing adalah sebuah tahapan yang dilakukan untuk melakukan
sebuah pemerosesan mining data. Pre-prosesing digunakan untuk melakukan
sebuah proses pembersihan data yang memiliki sebuah karakter yang tidak
diperlukan untuk melakukan proses pengolahan data. Beberapa tahapan dalam
melakukan pre-prosesing seperti case folding, filtering, stopword removal,
stemming dan lainnya.
10

Menurut Mujilahwati. (2016) Pre-processing atau praproses data


merupakan proses untuk mempersiapkan data mentah sebelum dilakukan proses
lain. Praproses data dilakukan dengan cara mengeleminasi data yang tidak sesuai
atau mengubah data menjadi bentuk yang lebih mudah diproses oleh sistem.

2.2.5 Natural Language Toolkit (NLTK)


Natural Language Toolkit atau NLTK adalah sebuah library pada bahasa
pemerograman python yang digunakan pada ilmu Natural Language Processing
(NLP).
Menurut Suryono, dkk. (dalam NLTK Project, 2017) NLTK merupakan
salah satu tools pengolahan bahasa natural yang berjalan pada bahasa
pemerograman python. NLTK menawarkan tampilan antar muka yang mudah
dipahami dan menyediakan 50 data serta kamus data yang dapat digunakan antara
lain Worldnet, TextProcessing serta untuk proses klasifikasi yaitu tokenization,
stemming, tagging, parsing dan juga semantic reasoning.

2.2.6 Term Frequency-Inverse Document Frequency (TF-IDF)


TF-IDF adalah sebuah metode yang digunakkan untuk melakukan proses
pemberian sebuah bobot term pada dokumen atau teks data. Hal ini dilakukan untuk
melakukan sebuah proses klasifikasi data.
Term Frequency merupakan algoritma yang digunakan untuk melakukan
pembobotan heuristik yang dapat menentukan sebuah bobot teks data sesuai dengan
kemunculan term. Sedangkan Inverse Document Frequency merupakan sebuah
kumpulan istilang yang muncul pada data atau dokumen.

2.2.7 Entity Relationship Diagram (ERD)


ERD adalah model data untuk menggambarkan hubungan antara satu
entitas dengan entitas lain yang mempunyai relasi (hubungan) dengan batasan-
batasan (Oetomo, B. S. D., 2003). Hubungan antara entitas akan menyangkut
dua komponen yang menyatakan jalinan ikatan yang terjadi, yaitu derajat
11

hubungan dan partisipasi hubungan. Adapun beberapa simbol dalam ERD dapat
dilihat pada tabel 2.2.
Tabel 2.2 Notasi dalam ERD
No. Gambar Keterangan
1. Entitas atau bentuk persegi panjang
merupakan sesuatu objek data yang ada di
Entitas dalam sistem, nyata maupun abstrak dimana
data tersimpan atau dimana terdapat data.
2. Relationship merupakan hubungan alamiah
Relasi yang terjadi antar entitas. Umumnya diberi
nama dengan kata kerja dasar

3. Atribut atau bentuk elips adalah sesuatu


yang menjelaskan apa sebenarnya yang
Attribut dimaksud entitas atau relationship dan
mewakili atribut dari masing-masing entitas.

4. Garis merupakan penghubung antar entitas


sumber: Hermawan, A. M., (2015).

2.2.8 Data Flow Diagram (DFD)


Menurut Mustakini, J. H., (2016), Data Flow Diagram (DFD) merupakan
diagram yang menggunakan notasi-notasi untuk menggambarkan arus data
sistem secara logika. DFD merupakan dokumentasi grafik yang menggunakan
simbol penomoran di dalam mengilustrasikan arus data yang saling berhubungan
diantara pemrosesan data untuk diubah menjadi informasi. Tabel 2.3
menggambarkan simbol yang digunakan dalam DAD.
12

Tabel 2.3 DFD (Data Flow Diagram)


No. Gambar Keterangan

1 Eksternal Entity (kesatuan luar) atau


Boundary (batas sistem)

2. Data Flow (arus data)

3. Proses

4. Data store

Sumber: Mustakini, J. H., (2016)


BAB III
METODE PENELITIAN

3.1 Bahan/Data
3.1.1 Data yang diperoleh
Data yang digunakan pada penelitian ini adalah kumpulan-kumpulan
komentar atau tweet yang dikumpulkan dari media sosial twitter. Data dikumpulkan
dengan menggunakan API yang telah disediakan oleh twitter dengan twitter API
maka dilakukan crawling data dengan kata kunci “PSBB”. Setelah data terkumpul
maka data akan dibagi menjadi dua jenis, yaitu data training dan data testing yang
akan digunakan dalam penelitian.

3.1.2 Prosedur pengumpulan data


Metode yang dilakukan dalam pengambilan data adalah metode Observasi
dengan cara mengamati langsung media sosial twitter dan mengambil data dengan
cara crawling menggunakan twitter API yang sudah disediakan. Pengambilan data
tersebut termaksud sebagai Observasi langsung yaitu mengambil dan mengamati
tweet secara langsung di sosial media twitter.

,3.1.3 Pengumpulan Data


Proses pengumpulan data merupakan sebuah proses yang dilakukan untuk
mencari dan mengumpulkan data yang akan digunakan untuk proses penelitian.
Dalam proses pengumpulan data ada pula tahap-tahap yang akan digunakan, seperti
normalisasi dan pelabelan teks. Hal ini dilakukan supaya data yang digunakan tidak
akan memiliki noise sehingga penelitian bisa dilakukan dengan baik. Langkah-
langkah dalam pengambilan data dapat dilihat pada Gambar 3.1.

13
14

Gambar 3.1 Proses pengumpulan data

Proses pengumpulan data menggunakan metode crawling yang dibantu oleh


library tweepy yang ada pada bahasa pemerograman python. Untuk melakukan
crawling data dengan tweepy diperlukan sebuah API key twitter yang di dapatkan
dengan cara mengirim permohonan kepada pihak twitter developer, ketika
permohonan sudah diterima maka pihak twitter akan mengirimkan pemberitahuan
yang menyatakan bahwa permohonan sudah diterima.
Setelah melakukan crawling data maka hasil yang didapatkan adalah file
berbentuk csv yang berisi dengan tweet-tweet masyarakat yang belum dilabeling,
normalisasi dan juga pre-processing. Tweet tersebut masilah berbentuk data mentah
atau disebut sebagai data kotor. Bentuk data yang dihasilkan dapat dilihat pada
Gambar 3.2.
15

Gambar 3.2 Data kotor hasil crawling

Setelah berhasil mendapatkan data maka dilakukan sebuah proses pelabelan


untuk data training, pada penelitian ini pelabelan menggunakan sebuah angka yang
mewakili setiap sentiment. Angka 1 mewakilkan bahwa data tersebut bersifat postif
dan angka 0 mewakilkan data tersebut sebagai data negatif. Hal ini dilakukan untuk
mempermudah Naïve Bayes dalam melakukan klasifikasi data. Contoh pelabelan
ada pada Tabel 3.1
Tabel 3.1 Pelabelan Data
No tweet label
1 woi apa gunanya psbb kalo demo juga akhirnya 0
2 karena ada psbb uang bulanan jadi irit 1
3 psbb bikin pusing karna gak bisa kemana-mana 0
4 Psbb diperpanjang supaya covid-19 hilang 1

Setelah melakukan pelabelan maka tahap selanjutnya adalah melakukan


pre-processing pada data yang sudah dilabeli. Pre-processing sendiri merupakan
tahap yang penting untuk sebuah pemerosesan data karna hal ini sangat
mempengaruhi data yang akan digunakan, hasil yang didapatkan juga sangat
berpengaruh pada pre-processing supaya data bisa dibaca dengan baik oleh sistem.
Tahap pre-processing setelah pelabelab merupakan tahap cleaning data, case
folding, stopward removal, stemming dan tokenizing.
16

a. Cleaning data
Cleaning data adalah proses pembersihan data yang memiliki karakter-
karakter yang tidak diperlukan dalam pengedintifikasian data yang akan
digunakan. Contohnya seperti di Table 3.2.
Tabel 3.2 Cleaning data
No Input output
1 psbb bikin pusing :( psbb bikin pusing karna gak bisa
karna gak bisa kemana- kemana mana
mana!!???
2 Psbb diperpanjang supaya Psbb diperpanjang supaya covid
covid-19 hilang hilang

b. Case Folding
Case Folding adalah sebuah proses untuk merubah setiap kata supaya
menjadi sama, contohnya teks yang memiliki huruf besar akan diubah
menjadi huruf kecil. Contohnya dapat dilihat di Tabel 3.3.
Tabel 3.3 Case Folding
No Input output
1 PSBB bikin pusing karna psbb bikin pusing karna gak bisa
gak bisa kemana-mana kemana-mana
2 Psbb diperpanjang supaya psbb diperpanjang supaya covid
covid-19 hilang hilang

c. Stopword Removal
Stopword Removal adalah sebuah proses untuk menghapus kata-kata
yang terlalu umum atau kurang penting sehingga tidak diperlukan dalam
melakukan pemerosesan data teks.
d. Tokenezing
Tokenizing adalah proses pemisahan data atau pemenggalan data, hal ini
dilakukan untuk mempermudah pemerosesan data dan mengedintifikasi
setiap data teks yang akan digunakan.
17

Setelah melakukan pre-processing maka data dibagi menjadi dua yaitu data
training dan data testing, hal ini dilakukan supaya bisa menerapkan metode naïve
bayes dalam melakukan klasifikasian data teks yang akan diteliti.

3.2 Tahapan Penelitian


Tahapan penelitian adalah tahap-tahap setiap proses yang dilakukan selama
penelitian, diawali dengan pencarian data dan diakhiri dengan penerapan metode
naïve bayes yang akan diterapkan pada sistem yang akan dibuat. Urutan penelitian
yang akan dilakukan dapat dilihat pada Gambar 3.3.

Gambar 3.3 Tahapan penelitian


Langkah awal untuk melakukan penelitian adalah pencarian data, pencarian
data sendiri dilakukan dengan cara crawling menggunakan twitter API yang
dibantu dengan library Tweepy. Hal pertama yang dilakukan adalah mengirim
permohonan untuk mendapatkan twitter API melalui twitter developer. Lalu
setelah mengirimkan permohonan kita diharuskan menunggu paling lama
1x24jam. Setelah mendapatkan twitter API maka kita dapat melakukan crawling
data di twitter dengan kata kunci ‘PSBB’.
Tahap kedua adalah proses pembersihan data, pada tahap ini kita akan
melakukan pre-processing dengan bantuan library NLTK yang disediakan oleh
bahasa pemerograman python. Pada tahap ini pula kita akan melakukan pelabelan
data sebagai dua kategori yaitu positif dan negatif. Pada tahap ini pula kita akan
melakukan pembersihan kata-kata yang tidak diperlukan oleh sistem supaya
penelitian dapat berjalan dengan baik. Karakter-karakter yang tidak diperlukan
akan dihapus, seperti karakter *, %, $, #, @, ), ( dan lain sebagainya.
Pada tahap kedua juga dilakukan persamaan karakter, yaitu karakter yang
memiliki huruf besar akan diubah menjadi huruf kecil untuk menyamaratakan
karakter. Hal ini dilakukan supaya sistem dapat membaca data teks dengan baik
sehingga tidak timbul noise yang membuat sistem mengabaikan data tersebut.
Setelah itu data akan di pisah atau disebut sebagai proses Tokenezing.
18

Setelah data dibersihkan maka tahap selanjutnya adalah pembagian data uji
dan data latih, data yang sudah dibesihkan akan dibagi menjadi dua data. Hal ini
digunakan untuk menerapkan metode naïve bayes, karena metode tersebut
membutuhkan sebuah data latih yang bisa digunakan untuk pembelajaran mesin.
Tahap ketiga dan keempat adalah membuat sistem untuk sentiment analysis
dengan penerapan metode naïve bayes, sistem yang dibuat dapat diberikan data
latih dan data uji yang nantinya diterapkan metode naïve bayes pada sistem tersebut
sehingga sistem dapat melakukan pelatihan dan pengujian secara langsung.
BAB IV
ANALISIS DAN PERANCANGAN SISTEM

4.1 Analisis Sistem


4.1.1 Analisis Sistem yang Berjalan
Bagian ini gambarkan proses yang saat ini menjadi masalah

4.1.2 Analisis sistem yang diusulkan.


Bagian ini menggambarkan proses yang Anda usulkan sebagai perbaikan
dari proses yang ada saat ini (lihat analisis sistem yang berjalan)
a. Analisis fungsional
Terdiri atas analisis kebutuhan fungsional (fitur dan kemampuan yang
dimiliki sistem)
b. Analisis non fungsional.
Bagian ini menjelaskan semua peralatan (hardware dan software) yang
digunakan untuk menjalankan penelitian harus disebutkan dan diuraikan dengan
jelas dan apabila perlu (terutama peralatan yang dirancang khusus) dapat disertai
dengan bagan dan keterangan secukupnya. Untuk instrumentasi khusus merk dan
tipe/spesifikasi peralatan harus dicantumkan, sedangkan kondisi pengoperasian
disajikan pada bagian lain yang sesuai.

4.2 Desain Sistem


4.2.1 Perancangan Logik.
Bagian ini bisa dituliskan menggunakan diagram ER, DAD (diagram alir
data), DAS (diagram alir sistem), flowchart, algoritma, relasi tabel, class diagram,
sequential diagram dan lain-lainTahapan rancangan sistem yang dibangun sesuai
dengan teori metode pembangunan sistem yang digunakan.
Diagram Alir Data (DAD)
Pada DFD level 0, seperti pada Gambar 4.1 DFD level 0 terdapat 3 entitas
luar yaitu member sebagai pengguna sistem dan dapat melakukan marker pada
peta. Pengunjung sebagai pengguna sistem dan admin sebagai pengelola sistem,
pada user terdapat beberapa alir data yaitu data obyek wisata, data buku tamu,

19
20

data marking, data registrasi, dan data login. Pada admin juga terdapat alir data
yaitu data login, data user, data katagori wisata, data katagori fasilitas, data obyek
wisata, data fasilitas, data event, data buku tamu dan data marking.

Gambar 4.1 DFD level 0

4.2.2 Perancangan Fisik


Rancangan sistem meliputi rancangan antar muka, desain fisik tabel/class
menggunakan DBMS (termasuk field, tipe data, panjang dan lain-lain).

a. Entity Relationship Diagram (ERD)

b. Relasi antar tabel


BAB V
IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN

5.1. Implementasi
Proses implementasi dari perancangan aplikasi yang dilakukan pada bab
sebelumnya akan dijelaskan pada bab ini. Implementasi bertujuan untuk
menterjemahkan keperluan perangkat lunak ke dalam bentuk sebenarnya yang
dimengerti oleh komputer atau dengan kata lain tahap implemetasi ini
merupakan tahapan lanjutan dari tahap perancangan yang sudah dilakukan.
Dalam tahap implementasi ini akan dijelaskan mengenai perangkat keras
(hardware) dan perangkat lunak (software) yang digunakan dalam membangun
sistem ini, file-file yang digunakan dalam membangun sistem, tampilan web
beserta potongan-potongan script program untuk menampilkan Halaman web.

a. Perangkat Keras (Hardware) yang Digunakan


Perangkat keras yang digunakan untuk mengoperasikan Sistem Informasi
Geografis berbasis Web ini adalah:
a. Notebook HP Pavilion dv3000
b. Processor Genuine Intel(R) CPU P7350 Core 2 Duo 2.00GHz
c. RAM 3072MB
d. Hardisk 320 GB
e. NVIDIA GeForce 9300M GS

b. Perangkat Lunak (Software) yang digunakan


Perangkat lunak yang digunakan dalam membangun Sistem Informasi
Geografis berbasi Web ini adalah:
a. Macromedia dreamweaver CS3
b. Adobe Photoshop CS3
c. Mozila firefox

21
22

Berisikan uraian Bagian Implementasi berisi uraian alat bantu untuk


tahapan implementasi, sistem operasi, perangkat implementasi, algoritma
program, tampilan interaksi input-output aplikasi dan pengujian implementasi
tahapan awal. Untuk bidang network, implementasi berisi hasil rancangan network
yang dibangun, infrastrukur pendukung network dan pengujian awal network.

Implementasi WEB
Implementasi Halaman User
Implementasi Interface halaman User merupakan implementasi halaman
web yang digunakan oleh User pengunjung web yang berisi informasi-informasi
tentang Sistem Informasi Geografis.

Koneksi.php
File koneksi.php merupakan script php untuk menghubungkan web dengan
basis data “wisatagianyar” yang terdapat dalam database MySQL.

<?php
$server = "localhost";
$username = "root";
$password = "root";
$database = "anyar";
// Koneksi dan memilih database di server
mysql_connect($server,$username,$password) or die("Koneksi
gagal"); mysql_select_db($database) or die("Database tidak bisa
dibuka");
?>

Gambar 5.1 Script koneksi.php


Tampilan Halaman Home
Halaman Home merupakan halaman utama dari Website Sistem Informasi
Geografis Berbasis Web untuk Pemetaan Pariwisata Kabupaten Gianyar. Halaman
ini berfungsi sebagai tempat untuk menampilkan informasi-informasi tentang
Web ini. Adapun Tampilan Home sebagai berikut:
23

Gambar 5.2 Tampilan Home

5.2. Hasil

5.3. Pembahasan
BAB VI
PENUTUP

6.1 Simpulan
Yang diambil dari isi bab III dan bab IV dan harus konsisten dengan
tujuan, dan menjawab rumusan masalah serta harus mencerminkan terpecahkan
atau tidak masalah yang dibahas di bab I dan didasarkan pada analisis yang
obyektif.

6.2 Saran
Merupakan hal-hal yang susah/belum dibuat dalam Tugas Akhir yang
dibuat dan dapat dikembangkan orang lain.

24
DAFTAR PUSTAKA

Aminah, S.O. (2015), Sistem Informasi Kepegawaian (Studi Kasus: PT Makmur


Sexali), Skripsi, S.Pd., Pendidikan T. Informatika Universitas Kepingin
Negeri, .

Asfi dan Sari (2010), Sistem Penunjang Keputusan Seleksi Mahasiswa Berprestasi
Menggunakan Metode AHP, Skripsi, S.Kom., Universitas Teknologi
Yogyakarta.

Hermawan, A.M. (2015), Perancangan Sistem Basis Data, Jakarta: Elex media
Komputindo.

Kadir, A. (2013), Pengantar Teknologi Informasi, Yogyakarta: ANDI Publisher.

-----yang dipakai----

Maulana (2012). Penilaian Kinerja Karyawan Di Ifun Jaya Textile Dengan Metode
Fuzzy Simple Additive Weighted. Tugas Akhir, S.Kom., STMIK AMIKOM
Yogykarta.

Mustakini, J.H. (2016). Analisa Dan Perancangan Sistem Modern. Yogyakarta:


ANDI Publisher.

Suryono, Sigit., Utami, Ema., & Luthfi, Emha Taufiq. (2018), Klasifikasi
Sentiment pada twitter dengan naïve bayes classifier. Jurnal Ilmiah Bidang
Teknologi: ANGKASA, Vol. 10, No.1

Muljahwati, Siti. (2016). Pre-processing text mining pada twitter, SENTIKA.

Rosmala, Dewi., & Dwipa, Gadya. (2012). Pembangunan Website


Contentmonitoringsystem Menggunakan DIFFLIB Python. Jurnal
Informatika, Vol.3, No.3.

25

Anda mungkin juga menyukai