Laporan PDF
Laporan PDF
Disusun oleh
MOHAMAD DHIFTA RAMADHAN
5171011036
DEWAN PENGUJI
Nama
Ketua Penguji ............................. ................
NIK ..................
Nama
NIK.............. Penguji I ............................. ................
Nama
Penguji II
NIK ..................... ............................. ...............
(Dosen Pembimbing)
Yogyakarta, ........................
Ketua Program Studi Informatika
ii
LEMBAR PERNYATAAN
Dibuat di : Yogyakarta
Pada tanggal : 10 oktober
2020
Yang menyatakan
Mohamad Dhifta
Ramadhan
iii
ABSTRAK
Corona virus adalah keluarga besar virus yang menyebabkan penyakit mulai dari
gejala ringan sampai berat. Ada setidaknya dua jenis coronavirus yang diketahui
menyebabkan penyakit yang dapat menimbulkan gejala berat seperti Middle East
Respiratory Syndrome (MERS) dan Severe Acute Respiratory Syndrome (SARS).
Dalam mencegah penyebaran virus covid-19 tersebut Indonesia menerapkan
kebijakan PSBB, kemudian banyak tanggapan dan masalah-masalah yang timbul
dengan penerapan PSBB di Indonesia, ada yang menganggap bahwa kebijakan itu
sangatlah baik untuk mencegah penyebaran covid-19 ada pula yang menentang
kebijakan tersebut karna beranggapan banyak hal-hal yang mempengaruhi ekonomi
masyarakat ketika penerapan tersebut ditetapkan. Untuk mengetahui sebuah
sentiment dari opini masyarakat terhadap penerapan PSBB di Indonesia maka
dibuatlah sebuah sistem sentiment analysis menggunakan metode Naïve Bayes
untuk mengetahui tanggapan bersifat negative atau positif.
iv
ABSTRACT
Corona viruses are a large family of viruses that cause illness ranging from mild to
severe symptoms. There are at least two types of coronavirus that are known to
cause diseases that can cause severe symptoms such as Middle East Respiratory
Syndrome (MERS) and Severe Acute Respiratory Syndrome (SARS). In preventing
the spread of the Covid-19 virus, Indonesia implemented the PSBB policy, then
there were many responses and problems that arose with the implementation of
PSBB in Indonesia, some thought that the policy was very good at preventing the
spread of Covid-19, some were against the policy because they thought There are
many things that affect the economy of society when the implementation is
determined. To find out a sentiment from public opinion regarding the
implementation of PSBB in Indonesia, a sentiment analysis system was created
using the Naïve Bayes method to determine whether the response was negative or
positive.
v
KATA PENGANTAR
Puji syukur dipanjatkan atas kehadirat Allah SWT, karena dengan limpahan
karunia-Nya penulis dapat menyelesaikan Tugas Akhir dengan judul Sentiment
analysis masyarakat Indonesia terhadap penerapan PSBB di masa pandemi dengan
Naïve Bayes.
Penyusunan Tugas Akhir diajukan sebagai salah satu syarat untuk
memperoleh gelar sarjana pada Program Studi Informatika Fakultas Teknologi
Informasi dan elektro Universitas Teknologi Yogyakarta.
Tugas Akhir ini dapat diselesaikan tidak lepas dari segala bantuan,
bimbingan, dorongan dan doa dari berbagai pihak, yang pada kesempatan ini
penulis ingin menyampaikan ucapan terima kasih kepada:
a. Bapak Dr. Bambang Moertono Setiawan, M.M, CA., Akt. Selaku Rektor
Universitas Teknologi Yogyakarta.
b. Bapak Sutarman, M.Kom., Ph.D. Selaku Dekan Fakultas Teknologi
Informasi dan Elektro.
c. Ibu Dr. Enny Itje Sela, S.Si., M.Kom. selaku Ketua Program Studi
Informatika Universitas Teknologi Yogyakarta.
d. Bapak Suhirman, S.Kom., M.Kom., Ph.D. selaku dosen Pembimbing
Tugas Akhir.
Penulis
vi
DAFTAR ISI
ABSTRAK ............................................................................................................ iv
ABSTRACT ........................................................................................................... v
KATA PENGANTAR .......................................................................................... vi
DAFTAR ISI ........................................................................................................ vii
DAFTAR GAMBAR ............................................................................................ ix
DAFTAR TABEL ................................................................................................. x
BAB I PENDAHULUAN ...................................................................................... 1
1.1 Latar Belakang ............................................................................................. 1
1.2 Rumusan Masalah ........................................................................................ 2
1.3 Batasan Masalah........................................................................................... 2
1.4 Tujuan penelitian .......................................................................................... 2
1.5 Manfaat Penelitian ....................................................................................... 3
1.6 Sistematika Penulisan .................................................................................. 3
BAB II KAJIAN HASIL PENELITIAN DAN LANDASAN TEORI .............. 5
2.1 Kajian Hasil Penelitian ................................................................................. 5
2.2 Landasan Teori ............................................................................................. 7
2.2.1 Sentimen Analisis ...................................................................................... 7
2.2.2 Naïve Bayes ............................................................................................... 8
2.2.3 Python ........................................................................................................ 9
2.2.4 Pre-processing ............................................................................................ 9
2.2.5 Natural Language Toolkit (NLTK) .......................................................... 10
2.2.6 Term Frequency-Inverse Document Frequency (TF-IDF) ...................... 10
2.2.7 Entity Relationship Diagram (ERD) ........................................................ 10
2.2.8 Data Flow Diagram (DFD) ...................................................................... 11
BAB III METODE PENELITIAN..................................................................... 13
3.1 Bahan/Data ...................................................................................................... 13
3.1.1 Data yang diperoleh ................................................................................. 13
3.1.2 Prosedur pengumpulan data ..................................................................... 13
3.1.3 Pengumpulan Data ................................................................................... 13
3.1.4 Tahapan Penelitian ................................................................................... 17
BAB IV ANALISIS DAN PERANCANGAN SISTEM ................................... 19
4.1 Analisis Sistem ........................................................................................... 19
4.1.1 Analisis Sistem yang Berjalan ................................................................ 19
4.1.2 Analisis sistem yang diusulkan. ............................................................. 19
4.2 Desain Sistem ............................................................................................. 19
4.2.1 Perancangan Logik. ................................................................................ 19
4.2.2 Perancangan Fisik................................................................................... 20
BAB V IMPLEMENTASI DAN HASIL SERTA PEMBAHASAN ............... 21
5.1. Implementasi .............................................................................................. 21
5.2. Hasil ........................................................................................................... 23
5.3. Pembahasan ................................................................................................ 23
BAB VI PENUTUP ............................................................................................. 24
vii
6.1 Simpulan .................................................................................................... 24
6.2 Saran ........................................................................................................... 24
DAFTAR PUSTAKA .......................................................................................... 25
viii
DAFTAR GAMBAR
ix
DAFTAR TABEL
x
BAB I
PENDAHULUAN
1
2
menjadi faktor adanya masalah baru ataupun peluang baru di masa pandemi ini.
Opini-opini masyarakat mulai bertebaran di media sosial, terutama media sosial
twitter. Masyarakat mulai mengeluarkan opini mereka tentang PSBB dengan bebas
di media sosial twitter, hal inilah yang bisa digunakan untuk mengenali sebuah pola
analisis sentimen dari tanggapan mereka apakah itu tanggapan positif atau negatif.
Dengan bantuan sistem sentimen analysis dengan metode naïve bayes hal
ini dapat menghasilkan sebuah performa classification dari metode naïve bayes dan
membangun sistem yang dapat mengetahui sebuah sentiment dari tanggapan
seseorang.
5
6
membandingkan dua algoritma yaitu Naïve Bayes dan Support Vector Machine
untuk mengetahui akurasi terbaik dari dua algoritma tersebut dengan dua label
postif dan negatif.
Penelitian oleh Hakim, Ikhwanul., Nugroho, Arifin., Sukmana, Sulaeman
Hadi., dan Gata, Windu. (2020) dengan judul Sentimen Analisis Stay Home
menggunakan metode klasifikasi Naive Bayes, Support Vector Machine, dan k-
Nearest Neighbor. Penelitian tersebut membahas sebuah analisis terkait stay home
menggunakan data dari twitter dan tiga metode berbeda yaitu Naïve Bayes, SVM,
dan K-NN.
Seperti terlihat pada tabel 2.1. perbedaan dari kelima referensi dengan judul
yang diangkat oleh penulis terletak pada pembahasan dan khasus penelitian yang
diangkat. Dari kelima penelitian tersebut bisa dilihat bahwa Naïve Bayes sebagai
metode penelitian terkait sentiment analysis masih kerap digunakan dengan akurasi
yang terbilang bagus. Hal inilah yang membuat penulis tertarik untuk melakukan
penelitian terkasi sentiment dengan metode naïve bayes.
Dimana :
P(wk) : probabilitas term
Pk+1 : query+angka satu agar hasil perhitungan tidak nol
n : semua jumlah kata yang muncul di outcome dokumen
|vocab| : total kata keseluruhan
2.2.3 Python
Python adalah sebuah bahasa pemerograman yang dinamis dan memiliki
keberagaman luas dengan library dan tool yang disediakan oleh bahasa
pemerograman tersebut. Bahasa python sangat terkenal dibidang Artifical
Intiligance karena library yang disediakan sangat mendukung bidang tersebut, salah
satu yang di banggakan dari bahasa pemerograman python adalah librarynya dan
penulisannya yang mudah dan simple.
Menurut Rosmala dan Dwipa (2012), Python adalah salah satu bahasa
pemerograman tingkat tinggi yang bersifat interpreter, interaktif, object-oriented
dan dapat beroprasi di hampir semua platform, seperti keluarga UNIX, Mac,
Windows, dan lainnya. Sebagai bahasa tingkat tinggi, python termasuk salah satu
bahasa pemerograman yang mudah untuk di pelajari karena sintaks yang jelas dan
elegan, dikombinasikan dengan penggunaan module-module siap pakai dan
struktur data tingkat tinggi yang efesien.
Bahasa pemerograma python seringkali digunakan untuk melakukan sebuah
proses data, hal inilah yang membuat python menjadi bahasa yang popular dan
digemari oleh para Data Scientist dan Data Analysis.
2.2.4 Pre-processing
Pre-processing adalah sebuah tahapan yang dilakukan untuk melakukan
sebuah pemerosesan mining data. Pre-prosesing digunakan untuk melakukan
sebuah proses pembersihan data yang memiliki sebuah karakter yang tidak
diperlukan untuk melakukan proses pengolahan data. Beberapa tahapan dalam
melakukan pre-prosesing seperti case folding, filtering, stopword removal,
stemming dan lainnya.
10
hubungan dan partisipasi hubungan. Adapun beberapa simbol dalam ERD dapat
dilihat pada tabel 2.2.
Tabel 2.2 Notasi dalam ERD
No. Gambar Keterangan
1. Entitas atau bentuk persegi panjang
merupakan sesuatu objek data yang ada di
Entitas dalam sistem, nyata maupun abstrak dimana
data tersimpan atau dimana terdapat data.
2. Relationship merupakan hubungan alamiah
Relasi yang terjadi antar entitas. Umumnya diberi
nama dengan kata kerja dasar
3. Proses
4. Data store
3.1 Bahan/Data
3.1.1 Data yang diperoleh
Data yang digunakan pada penelitian ini adalah kumpulan-kumpulan
komentar atau tweet yang dikumpulkan dari media sosial twitter. Data dikumpulkan
dengan menggunakan API yang telah disediakan oleh twitter dengan twitter API
maka dilakukan crawling data dengan kata kunci “PSBB”. Setelah data terkumpul
maka data akan dibagi menjadi dua jenis, yaitu data training dan data testing yang
akan digunakan dalam penelitian.
13
14
a. Cleaning data
Cleaning data adalah proses pembersihan data yang memiliki karakter-
karakter yang tidak diperlukan dalam pengedintifikasian data yang akan
digunakan. Contohnya seperti di Table 3.2.
Tabel 3.2 Cleaning data
No Input output
1 psbb bikin pusing :( psbb bikin pusing karna gak bisa
karna gak bisa kemana- kemana mana
mana!!???
2 Psbb diperpanjang supaya Psbb diperpanjang supaya covid
covid-19 hilang hilang
b. Case Folding
Case Folding adalah sebuah proses untuk merubah setiap kata supaya
menjadi sama, contohnya teks yang memiliki huruf besar akan diubah
menjadi huruf kecil. Contohnya dapat dilihat di Tabel 3.3.
Tabel 3.3 Case Folding
No Input output
1 PSBB bikin pusing karna psbb bikin pusing karna gak bisa
gak bisa kemana-mana kemana-mana
2 Psbb diperpanjang supaya psbb diperpanjang supaya covid
covid-19 hilang hilang
c. Stopword Removal
Stopword Removal adalah sebuah proses untuk menghapus kata-kata
yang terlalu umum atau kurang penting sehingga tidak diperlukan dalam
melakukan pemerosesan data teks.
d. Tokenezing
Tokenizing adalah proses pemisahan data atau pemenggalan data, hal ini
dilakukan untuk mempermudah pemerosesan data dan mengedintifikasi
setiap data teks yang akan digunakan.
17
Setelah melakukan pre-processing maka data dibagi menjadi dua yaitu data
training dan data testing, hal ini dilakukan supaya bisa menerapkan metode naïve
bayes dalam melakukan klasifikasian data teks yang akan diteliti.
Setelah data dibersihkan maka tahap selanjutnya adalah pembagian data uji
dan data latih, data yang sudah dibesihkan akan dibagi menjadi dua data. Hal ini
digunakan untuk menerapkan metode naïve bayes, karena metode tersebut
membutuhkan sebuah data latih yang bisa digunakan untuk pembelajaran mesin.
Tahap ketiga dan keempat adalah membuat sistem untuk sentiment analysis
dengan penerapan metode naïve bayes, sistem yang dibuat dapat diberikan data
latih dan data uji yang nantinya diterapkan metode naïve bayes pada sistem tersebut
sehingga sistem dapat melakukan pelatihan dan pengujian secara langsung.
BAB IV
ANALISIS DAN PERANCANGAN SISTEM
19
20
data marking, data registrasi, dan data login. Pada admin juga terdapat alir data
yaitu data login, data user, data katagori wisata, data katagori fasilitas, data obyek
wisata, data fasilitas, data event, data buku tamu dan data marking.
5.1. Implementasi
Proses implementasi dari perancangan aplikasi yang dilakukan pada bab
sebelumnya akan dijelaskan pada bab ini. Implementasi bertujuan untuk
menterjemahkan keperluan perangkat lunak ke dalam bentuk sebenarnya yang
dimengerti oleh komputer atau dengan kata lain tahap implemetasi ini
merupakan tahapan lanjutan dari tahap perancangan yang sudah dilakukan.
Dalam tahap implementasi ini akan dijelaskan mengenai perangkat keras
(hardware) dan perangkat lunak (software) yang digunakan dalam membangun
sistem ini, file-file yang digunakan dalam membangun sistem, tampilan web
beserta potongan-potongan script program untuk menampilkan Halaman web.
21
22
Implementasi WEB
Implementasi Halaman User
Implementasi Interface halaman User merupakan implementasi halaman
web yang digunakan oleh User pengunjung web yang berisi informasi-informasi
tentang Sistem Informasi Geografis.
Koneksi.php
File koneksi.php merupakan script php untuk menghubungkan web dengan
basis data “wisatagianyar” yang terdapat dalam database MySQL.
<?php
$server = "localhost";
$username = "root";
$password = "root";
$database = "anyar";
// Koneksi dan memilih database di server
mysql_connect($server,$username,$password) or die("Koneksi
gagal"); mysql_select_db($database) or die("Database tidak bisa
dibuka");
?>
5.2. Hasil
5.3. Pembahasan
BAB VI
PENUTUP
6.1 Simpulan
Yang diambil dari isi bab III dan bab IV dan harus konsisten dengan
tujuan, dan menjawab rumusan masalah serta harus mencerminkan terpecahkan
atau tidak masalah yang dibahas di bab I dan didasarkan pada analisis yang
obyektif.
6.2 Saran
Merupakan hal-hal yang susah/belum dibuat dalam Tugas Akhir yang
dibuat dan dapat dikembangkan orang lain.
24
DAFTAR PUSTAKA
Asfi dan Sari (2010), Sistem Penunjang Keputusan Seleksi Mahasiswa Berprestasi
Menggunakan Metode AHP, Skripsi, S.Kom., Universitas Teknologi
Yogyakarta.
Hermawan, A.M. (2015), Perancangan Sistem Basis Data, Jakarta: Elex media
Komputindo.
-----yang dipakai----
Maulana (2012). Penilaian Kinerja Karyawan Di Ifun Jaya Textile Dengan Metode
Fuzzy Simple Additive Weighted. Tugas Akhir, S.Kom., STMIK AMIKOM
Yogykarta.
Suryono, Sigit., Utami, Ema., & Luthfi, Emha Taufiq. (2018), Klasifikasi
Sentiment pada twitter dengan naïve bayes classifier. Jurnal Ilmiah Bidang
Teknologi: ANGKASA, Vol. 10, No.1
25