Metopen-Sentimen Analisis Vaksin Yogyakarta Menggunakan Metode NB

Analisis Sentimen Opini Masyarakat Kota Yogyakarta
Menggunakan Metode Naïve Bayes Pada Pelaksanaan

Vaksin 2021
METODOLOGI PENELITIAN
Untuk Memenuhi Sebagian

Persyaratan Mencapai Derajat Sarjana
Komputer
Disusun Oleh:
Fitri Andini
1700018155
PROGRAM STUDI TEKNIK

INFORMATIKA FAKULTAS TEKNOLOGI
INDUSTRI UNIVERSITAS AHMAD
DAHLAN YOGYAKARTA
2021
Analisis Sentimen Opini Masyarakat Kota Yogyakarta
Menggunakan Metode Naïve Bayes Pada Pelaksanaan Vaksin
2021
Fitri Andini
1700018155
Abstrak
Vaksin adalah produk biologis yang berasal dari mikroorganisme hidup, dan
dapat berfungsi sebagai peningkat kekebalan tubuh dari penyakit, baik mencegah
atau mengobati penyakit. Terdapat banyak pendapat dari masyarakat mengenai
pelaksanaan vaksin yang menyebabkan khususnya pada pemerintah Kota
Yogyakarta mengalami kesulitan untuk mengetahui apakah masyarakat banyak yang
setuju (positif) tidak setuju (negatif) biasa saja (netra) perihal pelaksanaan vaksin.
Dalam penelitian ini menggunakan metode Naïve Bayes Classifier, Metode ini
merupakan sebuah metode penggolongan berdasarkan probabilitas sederhana,
serta dibuat untuk digunakan dengan asumsi bahwa antara satu kelas menggunakan
kelas yang lain tak saling tergantung (Independen). Dataset yang digunakan
dalam penelitian ini, didapatkan dengan cara crawling di Twitter, crawling dilakukan
dengan menggunakan software python dan menggunakan Api Twitter, dengan
menggunakan kata kunci “vaksin Yogyakarta”. Penarikan data dengan cara
mengambil sampel Tweet dengan rentan waktu pengambilan pada senin 27
september sampai dengan 3 oktober 2021.
Harapan pada penelitian ini khususnya Pemerintah Kota Yogyakarta akan lebih
mudah mengetahui opini masyarakat terkait pelaksanaan vaksin, dan dapat lebih
mudah melihat atau memilah pandangan dari masyarakat apakah lebih banyak
pendapat positif, negatif atau netral. Pemerintah juga bisa mengetahui bagaimana
penerapan metode Naïve Bayes di pelaksannan vaksin di Kota Yogyakarta serta
pemerintah dapat mengetahui analisis sentimen apa saja yang terdapat pada proses
pelaksanaan vaksin di Kota Yogyakarta.
Kata Kunci: Vaksin, Naïve Bayes Classifier.
DAFTAR ISI
KATA PENGANTAR
i
DAFTAR ISI
1
BAB 1 PENDAHULUAN
A. Latar Belakang 1
B. identifikasi Masalah 3
C. Batasan Masalah 3
D. Rumusan Masalah 3
E. Tujuan penelitian 4
F. Manfaat Penelitian 4
BAB II KAJIAN PUSTAKA 5
A. Kajian hasil penelitian terdahulu 5
2.1 Tabel kajian penelitian terdahulu 9
2.2 Landasan teori 15
BAB III METODE PENELITIAN 21
A. Objek Penelitian 21
B. .Metode Pengumpulan Data 21
C. Spesifikasi Kebutuhan 21
D. Tahapan Penelitian 22
E. Studi Kasus 24
DAFTAR PUSTAKA 28
BAB 1
PENDAHULUAN
A. Latar Belakang
COVID-19 merupakan penyakit yang disebabkan oleh virus. Covid-19 memiliki

beberapa gejala seperti nyeri tenggorokan, nyeri kepala, nyeri otot dan Flu. Cara
penularan COVID-19 yaitu dari kontak menggunakan droplet saluran napas
penderita. Droplet bisa melewati hingga jeda tertentu (biasanya 1 meter).
Pencegahan COVID-19 dapat dilakukan dengan cara menggunakan vaksin, vaksin
memiliki manfaat bagi tubuh supaya tidak mudah terserang oleh penyakit Covid-19
dengan cara meningkatkan kekebalan tubuh. (Astari dkk, 2020).
Pada tahun 1798 Edward Jenner menunjukan bahwa vaksin tersebut mampu
mencegah cacar di manusia. Vaksin adalah produk biologis yang berasal dari
mikroorganisme hidup, dan dapat berfungsi sebagai peningkat kekebalan tubuh dari
penyakit baik, mencegah atau mengobati penyakit. Vaksinasi berasal dari istilah
“Vaccine” yaitu zat yang bisa merangsang timbulnya kekebalan aktif mirip BCG,
Polio, DPT, Kepatitis B, dan lain-lain. Syarat ketentuan vaksin di Kota Yogyakarta ialah
masyarakat umum menggunakan KTP Nasional, Domisili Bebas, masyarakat harus
terlebih dahulu mendaftar pada pedulilindungi.id.(Mala Olhang dkk, 2020)
Lebih dari 100 orang pada tanggal 10 Oktober 2021 masyarakat indonesia telah
mendapat vaksin dosis pertama, dan lebih dari 57.5 juta masyarakat Indonesia telah
mendapatkan dosis 2. Telah mencapai 157.707.427 takaran Jumlah vaksinasi dari
dosis pertama dan kedua. Takaran pertama sebanyak 48.11% masyarakat Indonesia
serta vaksinasi dosis kedua sebanyak 27.62% dan target vaksinasi di Indonesia
sebanyak 208.265.720 orang dari jumlah yang telah melakukan vaksin. Kementerian
Kesihatan melakukan pendekatan Dengan masyarakat supaya dapat dengan mudah
menjangkau layanan vaksinasi, untuk mempertinggi cakupan vaksinasi Terus
dikembangkan di seluruh indonesia untuk pusat vaksinasi dengan kapasitas 1000-
2000 target per hari. (Astari dkk,2020)
Media sosial merupakan alat komunikasi yang sangat membantu untuk
berkomunikasi, berinteraksi, menyebarkan berita dan lain sebagainya dalam bentuk
virtual. Dampak positif yang dapat diperoleh dari media sosial seperti informasi bisa
tersampaikan dengan cepat, serta dampak negatif dapat membuat warga lebih
dominan terhadap media sosial dibandingkan dengan menggunakan cara
berkomunikasi secara langsung. Media sosial mempermudah proses berlangsungnya
vaksin, karena isu perihal vaksin khususnya vaksin pada Kota Yogyakarta lebih cepat
dan efektif tersampaikan pada masyarakat. Masyarakat dengan adanya media sosial
dapat lebih mudah untuk memperoleh info sebab pengguna hanya bermodalkan
handphone, khususnya berita tentang vaksin cepat tersampaikan.(Rasyadi, 2017.)
Diperoleh dari jumlah penduduk Indonesia yang terdaftar sebanyak lebih dari 62
juta orang dan memiliki akun di media sosial khususnya media sosial Twitter. Rata-
rata pengguna internet telah menghabiskan waktu hampir 3 jam untuk terkoneksi.
Media sosial ialah sebuah alat komunikasi yang berfungsi untuk saling menyebarkan
berita atau informasi diantara individu (To Beshare One-To-One). Dengan adanya
media sosial dapat memudahkan pengguna atau masyarakat dalam memperoleh
informasi karena media sosial pada dasarnya ialah komunikasi 2 arah, sebagai
akibatnya dapat dilakukan beberapa aktifitas pada banyak sekali bentuk kerjasama,
dan saling mengenal dengan bentuk tulisan, serta visual. (Mala Olhang dkk, 2020)
Dari Agustus 10-11 2020,ribu perhari dosis vaksin di Kota Yogyakarta meningkat
jumlah target. Di bulan Juni sampai Juli 2020 lalu 6 ribu, Dalam beberapa minggu
belakangan kapasitas vaksin ditingkatkan, di Kota Yogyakarta menerapkan jenis
vaksin yaitu Sinovac, Astrazeneca dan Moderna. Berpatokan pada banyaknya target
Pemerintah Kota Yogyakarta pada penyebaran vaksin sehingga perlu melakukan
penelitian ini yang bertujuan untuk mengetahui opini masyarakat tentang
pelaksanaan vaksin di Kota Yogyakarta. (Pratama dkk,2020)
Pada bulan Maret tahun 2006 oleh Jack Dorsey dan pada bulan Juli merupakan
Awal terbentuknya Twitter. Konsep awal asal Twitter yaitu sebuah alat komunikasi
atau sistem yang dapat mempermudah pengguna untuk berkomunikasi. Twitter bisa
menjadi layanan jejaring sosial dengan fitur posting pesan singkat atau status serta
beberapa fitur menarik lainnya setelah beberapa kali melalui tahap revisi. Manfaat
Twitter yaitu merupakan media sosial yang bisa menghubungkan pengguna dengan
dapat mengirimkan chat, postingan, bisa melihat postingan berita dan lain
sebagainya. (Dwiraswati dkk, 2019).
Proses pengumpulan data pada Twitter menggunakan Api Key dan dibantu
menggunakan bahasa pemrograman Phyton. Api key merupakan suatu code untuk
membatu pada saat penarikan data. Api Key Twitter memiliki suatu Consumer Keys,
Consumer Secret, Access Key, dan Accsess Secret yang berfungsi untuk memperoleh
data Twitter yang dibutuhkan oleh programmer. (Dwiraswati dkk, 2019).
Analisis sentimen merupakan proses pembentukan melalui analisis teks untuk

mendapatkan pendapat masyarakat. apakah banyak yang berpendapat positif,
negatif atau netral. Sentimen analisis dapat menghemat waktu serta tenaga.
Sentimen analisis sering pula disebut sebagai opinion mining. (Rasyadi, 2017)
Selain metode Naïve Bayes metode lainnya yang digunakan untuk analisis yaitu
memakai metode KNearest Neighbor. Metode KNearest Neighbor berfungsi
mengatasi masalah dengan pengklasifikasian. Dengan membandingkan jeda
kedekatan antara data pelatihan serta data testing. Algoritma metode KNN
merupakan algoritma yang sederhana, dapat berfungsi berdasarkan ketika
pengerjaannya menggunakan jeda terpendek dari sampel uji ke sampel latih untuk
memilih KNN nya. Kemudian asal dominasi KNN diambil sehingga dapat menjadikan
prediksi dari uji sampel. Beberapa kelebihan KNN yaitu efektif apabila data latih nya
besar dan andal terhadap training. KNearest Neighbor memiliki Kelemahan yaitu
pembelajaran berdasarkan jarak yang tidak jelas mengenai jenis jeda yang harus
digunakan, atribut mana yang wajib dipergunakan untuk mendapatkan hasil yang
terbaik KNearest Neighbor harus terlebih dahulu memilih nilai dari parameter K
(jumlah asal tetangga terdekat), dan membutuhkan pengujian asal sampel yang
membutuhkan jeda maka perhitungan biaya komputasi cukup tinggi (Cahyono,
Y,2017).
Melihat manfaat dan kekurangan asal metode KNearest Neighbor maka metode
yang cocok untuk penelitian ini adalah metode Naïve Bayes karena metode Naïve
Bayes merupakan sebuah metode penggolongan berdasarkan probabilitas
sederhana, serta dibuat untuk digunakan dengan asumsi bahwa antar satu kelas
menggunakan kelas yang lain tak saling tergantung (Independen). Pada klasifikasi
Naïve Bayes proses pembelajaran lebih ditekankan pada mengestimasi probabilitas,
sehingga dengan memakai metode Naïve Bayes bisa dengan mudah untuk
menentukan hasil asal sentimen masyarakat perihal Vaksin di Kota Yogyakarta.
Apabila probabilitas kondisonal yang terdapat pada Naïve Bayes bernilai 0 maka
metode Naïve Bayes tidak akan berlaku dan prediksi probabilitas akan bernilai nol
serta pada metode Naïve Bayes mengasumsi variabel bebas. Penelitian Vaksin di
Kota Yogyakarta menggunakan Naïve Bayes Classifier pertanda bahwa algoritma
Naïve Bayes efektif dikarenakan ketika dikomparasi dengan algoritma Lexicon Based
tahap akurasi Naïve Bayes lebih baik dari Lexicon Based (Yono Cahyono,2017)
Penelitian ini betujuan untuk mengetahui opini Masyarakat Kota Yogyakarta

tentang pelaksanaan Vaksin 2021. Khususnya Pemerintah Kota Yogyakarta akan
lebih mudah mengetahui opini masyarakat terkait pelaksanaan vaksin, dan dapat
lebih mudah melihat atau memilah pandangan dari Masyarakat apakah lebih banyak
pendapat positif, negatif atau netral. Pemerintah juga bisa mengetahui bagaimana
penerapan metode Naïve Bayes di pelaksannan vaksin di Kota Yogyakarta serta
pemerintah dapat mengetahui analisis sentimen apa saja yang terdapat pada proses
pelaksanaan vaksin di Kota Yogyakarta.
B. Identifikasi Masalah
Berdasarkan dari uraian latar belakang di atas, identifikasi masalah yang didapat
ialah:
1. Pemerintah kesulitan mengetahui opini (positif, negatif dan netral)
masyarakat mengenai pelaksanaan vaksin Yogyakarta.(Tidak ada di latar
belkng masalah)
2. Asumsi sederhana yang diterapkan pada Naive Bayes Menyebabkan kurang
optimalnya hasil estimasi probabilitas, khususnya pada masalah domain teks.
C. Batasan Masalah
Dapat dilihat pada latar belakang di atas, sehingga batasan masalah yang
terdapat pada penelitian ini adalah:
1. Data yang diteliti pada penelitian ini ialah opini dari masyarakat berupa
variabel dan memiliki polaritas positif, negatif, dan netral
2. Menggunakan metode Naïve Bayes Classifier.
3. Media sosial untuk memperoleh data pada penelitian ini yaitu Twitter.
4. Menggunakan cara Crawling (proses mesin pencarian dapat mencari dan

memindai konten atau data yang berada pada situs web).
D. Rumusan Masalah
Dapat dilihat pada latar belakang di atas, rumusan masalah yang diperolah pada
penelitian ini adalah:
1. Bagaimana melakukan analisis sentimen terhadap pelaksanaan Vaksin di

Kota Yogyakarta dengan menggunakan algoritma Naïve Bayes Classifier.
2. Bagaimana menguji keakuratan metode Naïve Bayes dalam pelaksanaan
Vaksin di Kota Yogyakarta.
E. Tujuan penelitian
Tujuan dari penelitian ini adalah:
1. Menggunakan metode Naïve Bayes Classifier dalam menguji hasil sentimen

masyarakat mengenai vaksin di Kota Yogyakarta.
2. Memperoleh dan mengetahui tingkat keakurasian pada pelaksanaan Vaksin
di Kota Yogyakarta dengan menggunakan Confusion Matrix (matriks
klasifikasi).
F. Manfaat Penelitian
Dapat dilihat pada latar belakang, manfaat yang terdapat dalam penelitian ini
adalah:
1. Dengan adanya penelitian ini pemerintah khusus nya di Kota Yogyakarta

dapat mengetahui pendapat dari masyarakat tentang pelaksanaan vaksin
di kota Yogyakarta, serta dapat lebih mudah melihat atau memilah
pandangan dari masyarakat apakah lebih banyak pendapat posistif ,
negatif atau netral, dari masyarakat perihal kinerja pemerintah dalam
pelaksanaan vaksin.
2. Bagi masyarakat dengan adanya penelitian ini dapat dengan mudah
mengetahui lebih banyak masyarakat yang beropini positif, netral atau
negatif perihal pelaksanaan Vaksin di Kota Yogyakarta, serta dapat
menambah wawasan masyarakat perihal pelaksanaan Vaksin khususnya di
Kota Yogyakarta.
BAB II
KAJIAN PUSTAKA
A. Kajian hasil penelitian terdahulu
Dengan melihat pada penelitian dahulu sebagai acuan penelitian ini
dapat dilakukan, penelitian pertama yaitu dilakukan oleh Yono Cahyono (2017)
dengan judul “Analisis Sentimen Pada Sosial Media Twitte Menggunakan Naïve
Bayes Classifie Dengan Feature Selection Particle Swarm Optimization Dan Term
Frequency” tujuan dari penelitian ini untuk mendapatkan sentimen analisis
kedalam kategori positif, negatif dan netral. Metode Naive Bayes Classifier
dengan Feature Selection Particle Swarm Optimization berfungsi untuk
mengurangi atribut yang kurang baik atau relevan pada data set. Dengan
menggunakan kata kunci “Kurikulum 2013” penulis memperoleh 3300 data
Tweet. Pada 100 data menggunakan cara pelabelan manual untuk sentimen
positif, negatif dan netral. Menggunakan 3000 data Tweet data latih dan 1000
Tweet tiap kategori sentimennya. Maka mendapatkan hasil 3000 data latih
pengujian dan 100 Tweet data uji coba mencapai 91 %, sehingga mendapatkan
akurasi 97,48% dengan algoritma Naïve Bayes Classifier dan Feature Selection
Particle Swarm Optimization (PSO) menggunakan parameter Term Frequency
(TF)
Penelitian Kedua oleh Maria Mega Mala Olhang, Sentot Achmadi, dan
F.X Ariwibisono, judul penelitian “analisis sentimen pengguna Twitter terhadap
covid-19 di Indonesia menggunakan metode Naïve Bayes Classifie(NBC)” tujuan
penelitian adalah dilakukan proses menganalisis sentimen masyarakat terhadap
aspirasi yang disampaikan melalui Twitter. Proses pengambilan data
menggunakan hashtags #Coronavirusindonesia dan #covid19. Data diklasifikasi
dengan cara manual memberikan label positif atau negatif dan jumlah data yang
digunakan adalah sebanyak 500 data. Diperoleh hasil akurasi recall 325,
Precission 80%, F-Measure 45% serta rata-rata akurasi 36% dengan Sebanyak 75
Tweet.
Penelitian Ketiga oleh Ni Made Ayu Juli Astari1, Dewa Gede Hendra Divayana2,
dan Gede Indrawan3 dengan judul penelitian “Analisis Sentimen Dokumen
Twitter Mengenai Dampak Virus Corona Menggunakan Metode Naive Bayes
Classifier” Penelitian Ini bertujuan untuk memperoleh analisis dokumen text
untuk mendapatkan sentimen positif atau negatif masyarakat. Dokumen Tweet
dari Twitter mengenai dampak virus Corona merupakan data yang digunakan
dalam penelitian ini . Metode yang digunakan untuk klasifikasi dalam penelitian
ini adalah Metode Naive Bayes Classifier. Memperoleh Hasil penelitian akurasi
sebanyak 67% dan Error rate sebesar 33%. Dengan menggunakan data
Percobaan yang berbeda (100, 200, dan 500) mendapatkan hasil akurasi yaitu
0.02.
Penelitian Keempat oleh Imam Fahrur Rozi, Elok Nur Hamdana, Iqbal Alfahmi,
Muhammad Balya,judul penelitian “Pengembangan Aplikasi Analisis Sentimen
Twitter Menggunakan Metode Naïve Bayes Classifier (Studi Kasus Samsat Kota
Malang)” bertujuan untuk membuat aplikasi analisis sentimen untuk melakukan
fungsi Naïve Bayes Classifier melabelkan kata-kata dan lebih khususnya pada
Tweet dalam bahasa Indonesia. Memperoleh data dengan Web Scrapping dan
topik bahasan sumber teks yang digunakan adalah Sistem Administrasi
Manunggal Satu Atap (SAMSAT) Malang Kota. Hasil penelitian memberikan
unjuk kerja yang baik dalam Analisis sentimen. Mempeoleh akurasi klasifikasi
pada setiap kategori positif, negatif, netral masing-masing sebesar 82%, 92%,
80% dengan jumlah data latih 200 Tweet negatif, 200 Tweet positif, dan 200
Tweet netral.
Penelitian Kelima oleh M. Wino Adi Putra, Susanti, Erlin, dan Herwin,judul
Penelitian Ini Adalah “Analisis Sentimen Dompet Elektronik Pada Twitter
Menggunakan Metode Naïve Bayes Classifier” Penelitian Ini bertujuan untuk
mendapatkan sentimen masyarakat pada hadirnya berbagai aplikasi dompet
elektronik di Indonesia dengan mengklasifikasikannya kedalam tiga kelas yakni
positif, negatif dan netral.
Data diperoleh secara langsung dari situs Microblogging Twitter dengan hashtag
pencarian #GoPay, #OVO dan #DANA, dari data tersebut, diambil 100 data
dengan rincian 70 data latih dan 30 data uji. Mendapatkan hasil positif sebesar
46.67% diikuti oleh dana sebesar 37,50% dan OVO sebesar 16,67%. Dompet
elektronik OVO memiliki nilai negatif yang lebih tinggi yaitu sebesar 63.33%
diikuti oleh GoPay sebesar 53,33% dan Dana sebesar 30,00%.

2.1 Tabel kajian penelitian terdahulu
Tabel 2.1. merupakan perbandingan dari kajian penelitian terdahulu untuk mengetahui persamaan dan perbedaan pada penelitian yang
telah dilakukan sebelumnya, dapat dilihat pada tabel berikut:
Aspek Pustaka 1 Pustaka 2 Pustaka 3 Pustaka 4 Pustaka 5 Hasil


penelitian
Nama Penulis Yono Cahyono Maria Mega Ni Made Ayu Juli Imam Fahrur Rozi, M. Wino Adi Putra, Fitri Andini
(2017) Mala Olhang, Astari1, Dewa Elok Nur Hamdana, Susanti, Erlin, dan
Sentot Achmadi, Gede Hendra Iqbal Alfahmi, dan Herwin
dan F.X Divayana2, Muhammad Balya
Ariwibisono dan Gede
Indrawan3
Nama jurnal “Analisis analisis sentimen “Analisis “Pengembangan “Analisis Sentimen Analisis
Sentimen Pada pengguna Twitter Sentimen Aplikasi Analisis Dompet Elektronik Sentimen
sosial Media terhadap Dokume Sentimen Pada Twitter Menggunaka
covid-19 N Twitter n
Twitter di Indonesia Twitter Menggunakan Menggunakan Metode Naïve
menggunakan menggunakan Mengenai Metode Naïve Bayes Metode Naïve Bayes Bayes
Naïve Bayes metode Naïve Dampak Virus Classifier (Studi Kasus Classifier” Pada Vaksin
Classifie dengan Bayes Corona Samsat Kota Yogyakarta
feature Classifie(NBC) Menggunakan Malang)”, 2021
selection Metode Naïve
particle swarm Bayes
optimization Classifier”
dan term
frequency”
Volume, Vol. 2 No. 1 Vol. 4 No. 2 Vol. 15 Vol 4 No 2 Vol. 5 No. 1 -
Nomor No. 1
Bulan, tahun Maret 2017 September 2019 November 2020 Februari 2018 Januari -
Terbit 2020
Penerbit - - - - -
Masalah Jumlah seleksi Seleksi fitur tidak Metode Hasil yang di Dompet elektronik
Peneitian fitur dengan selalu klasifikasi. dapatkan belum OVO memiliki nilai
Terms lebih meningkatkan Terdapat banyak akurat dan penelitian negatif yang lebih
banyak akurasi pada kata tidak baku selanjutnya di tinggi yaitu sebesar
dijadikan metode Yang tidak sarankan untuk 63.33% diikuti oleh
sebagai wakil klasifikasi. terdeteksi menggunakan metide GoPay sebesar
penting untuk Terdapat banyak sehingga lain agar 53,33% dan Dana
kumpulan kata tidak baku menurunkan memperoleh hasil sebesar 30,00%.
dokumen yang yang tidak nilai evaluasi. yang lebih akurat
akan terdeteksi
dianalisis. sehingga
menurunkan
nilai
evaluasi.
Tujuan Untuk Untuk dilakukan Untuk Untuk membangun Untuk menganalisa Untuk
Penelitian memisahkan proses memperoleh aplikasi analisis tanggapan masyarakat mendapatkan
Tweet menganalisis analisis sentimen yang atas hadirnya hasil opini
berbahasa sentimen dokumen text menerapkan berbagai aplikasi masyarakat
Indonesia pada masyarakat untuk pendekatan Naïve dompet elektronik di apakah banyak
media sosial terhadap aspirasi mendapatkan Bayes Classifier Indonesia dengan yang beropini
Twitter kedalam yang disampaikan sentimen untuk mengklasifikasikannya positif, negatif
kategori positif, melalui Twitter positif atau mengklasifikasikan kedalam tiga kelas atau netral
negatif dan yaitu negatif kata-kata dan yakni positif, negatif mengenai
netral. Metode mengembangkan masyarakat. difokuskan pada dan netral dengan pelaksanaan
Naїve Bayes sistem dengan Data yang Tweet dalam bahasa menggunakan metode vaksin di kota
Classifier (NBC) mengacu pada digunakan Indonesia. Naïve Bayes Yogyakarta.
dengan Feature berbagai sistem merupakan dan menggunakan
Selection yang sudah ada dokumen
Tweet
dari Twitter
Particle Swarm sebelumnya mengenai perangkat lunak
Optimization dengan dampak virus Rapidminer untuk
(PSO) menggunakan Corona. menganalisisa suatu
diterapkan metode Naïve sentimen ataupun
pada dataset Bayes Classifier sejenisnya dengan
untuk untuk melewati suatu
mengurangi mengklasifikasikan proses
atribut yang sentimen. preprocessing
kurang relevan
pada saat
proses
klasifikasi. ).
Metode/Teori Metode Naїve Met ode Naїve Metode Naїve Metode Naїve Bayes Metode Naїve Bayes Metode Naїve
Bayes Classifier Bayes Classifier Bayes Bayes Classifier
(NBC) (NBC) Classifier Classifier (NBC) Classifier (NBC) (NBC)
(NBC)
Objek dan sosial media covid-19 Mengenai Studi Kasus Samsat Dompet Elektronik Vaksin
Variable Twitter Dampak Kota Malang yogyakarta
dengan Virus Corona
feature
selection
particle swarm
Hasil Menghasilkan Hasil pengujian, Klasifikasi Hasil uji Menunjukkan bahwa -
Penelitian sebuah dokumen dengan dievaluasi akurasi analisis sentimen
sistem yang jumlah sebanyak menggunakan klasifikasi pada dompet
dapat 75 Tweet accuracy dan yang elektronik GoPay
mengklasifikasi diperoleh hasil error rate dilakukan lebih banyak dinilai
sentimen secara pengukuran dengan tujuan oleh aplikasi positif oleh pengguna
otomatis akurasi recall 32%, mengetahui menghasilkan Twitter yaitu sebesar
dengan precission 80%, F- keakuratan nilai akurasi 46,67% diikuti oleh
hasil pengujian Measure 45% serta dokumen Dana sebesar 37,50%

tertinggi
3000
data latih dan

100 Tweet data rata-rata akurasi Setelah Pada setiap dan OVO sebesar
ujicoba 36%. diklasifikasi kategori 16,67%. Dompet
mencapai 91 %, menjadi positif, elektronik OVO
Hasil pengujian sentimen positif negatif, memiliki nilai negatif
menunjukan atau negatif. netral yang lebih tinggi
bahwa Hasil penelitian masing- yaitu sebesar 63.33%
algoritma Naïve menunjukkan masing diikuti oleh GoPay
Bayes Classifier metode Naive sebesar 82%, sebesar 53,33% dan
dengan feature Bayes mampu 92%, 80% Dana sebesar 30,00%.
selection mengklasifikasi dengan
Particle Swarm dokumen Tweet jumlah data
Optimization dengan akurasi latih 200
(PSO) 67% dan error Tweet
Menggunakan negatif,
200
parameter Term rate sebesar Tweet positif,
Frequency (TF) 33%. dan 200
dengan akurasi Tweet netral.
97,48%.
2.2 Landasan Teori
1. Data Mining
Data mining merupakan pengumpulan data dalam jumlah besar.
(By Beon Intermedia March 17, 2020)
Beberapa fungsi dari Data mining sebagai berikut:
a) Fungsi untuk memahami secara jauh data yang diteliti disebut fungsi
deskripi dengan tujuan mengetahui fungsi dari data tersebut. Data
tersebut bertujuan untuk mengetahui fungsi dari deskripi.
b) Fungsi prediksi menemukan suatu pola tertentu, pola tersebut dapat
diketahui dari variabel yang terkandung dalam data.
2. Analisis sentimen
Analisis sentimen adalah menganalisis data dan menemukan hasil
emosional dari penulisnya (Brand24). Tidak perlu menggunakan waktu yang
banyak dalam proses sentimen analisis. Berikut merupakan tipe-tipe Analisis
sentimen:
a) Fine-grained sentimen analysis adalah tipe analisis yang memiliki
penilaian spesifik. Tipe ini memungkinkan memiliki range penilaian
yang lebar. Tipe analisis sentimen ini bertujuan untuk mendeteksi
emosi, seperti kebahagiaan, kemarahan, kesedihan, dan frustrasi.
b) Aspect-based sentimen analysis digunakan untuk mengetahui aspek
yang mendapat penilaian positif, netral, atau negatif.
c) Analisis sentimen multilingual dimanfaatkan untuk menganalisis kata-
kata dalam berbagai bahasa. Tipe Analisis yang satu ini terbilang cukup
sulit karena kamu harus memiliki daftar kata dari bermacam bahasa.
Berikut merupakan teknik dasar dari sentimen analisis:
a) Rule-based sentimen analysis menggunakan kamus kata-kata yang
diberi label sentimen tertentu. Skor setiap sentimen diberi aturan
tertentu guna menghindari adanya kalimat sarkasme atau kalimat
lain yang bermakna ganda.
b) Machine learning dengan contoh emosi dalam teks, mesin secara
otomatis mempelajari cara mendeteksi sentimen tanpa perlu kamu
masukkan secara manual.
3. Preprocessing
Preprocessing berfungsi untuk membersihkan data yang telah didapat dari

proses crawling sehingga data tersebut dapat berupa data bersih yang siap
diolah dalam tahap selanjutnya.
Tahapan text preprocessing dalam sebagai salah satu teknik pengolahan data
text sebagai berikut:
a) Case Folding yaitu untuk merubah kalimat yang berhuruf kapital (besar)
menjadi kecil.
b) Tokenizing yaitu untuk menghilangkan tanda baca .
c) Filtering yaitu untuk menghilangkan kata sambung seperti yang,dan,di, dan
lain sebagainya
d) Stemming yaitu untuk mengubah kata yang berimbuhan menjadi kata

dasar seperti memberi menjadi beri, berjalan menjadi jalan.
4. Naïve Bayes Classifier
Naïve Bayes classifier merupakan algoritma yang digunakan untuk
mencari nilai probabiitas tertinggi untuk mengklasifikasikan data uji pada
kategori yang paling tepat (Feldman & Sanger, 2007). Tweet yang ada Pada
Naïve Bayes Classifier di notasikan dalam bentuk pasangan variabel (x1, x2, x3,
….., xn) dimana kata petama merupakan x1, kata kedua meupakan x2, kata
ketiga merupakan x3 sampai seterusnya. Kemudian terdapat himpinan kelas
yang didefinisikans sebagai V. Tahapan klasifikasi pada Naïve Bayes Classifier

dilakukan setelah tahap preprocessing, sehingga data yang digunakan pada
tahapan ini sudah besih. Ada empat proses yang dilakukan pada tahapan
klasifikasi tersebut yaitu (Nugroho dkk, 2016):
a) Pembentukan Variabel Data Latih
Pada pembentukan data latih memilik variabel komentar
(Tweet) yang dipeoleh dari Twitte kemudian akan dilakukan
pengklasifikasian didalam kelas sentimen yaitu positif, negatif, atau
netral, proses ini merupakan proses awal dari pembentukan
variabel data latih, dengan mempehatikan kemunculan frequency
kemunculan setiap kata pada setiap variabel tesebut.
b) Menghitung Nilai Probabilitas Data Latih
Dengan memperhatikan frequency kemunculan setiap kata
dalam variabel kemudian pembentukan data latih, dan proses
selanjutnya dengan menghitung probabilitas setiap kelas dengan
menggunakan persamaan berikut:
P(vj) = (2.1)
jumlah kelas pada vj ditulis : N(vj), dan jumlah semua kelas yang digunakan
dalam data latih ditulis: n(s)
a) Menentukan Probabilitas Setiap Kata
Pada proses ini probabilitas kata pada setiap masing masing kelas dapat di
hitung dengan menggunakan persamaan seperti berikut:
P(vj) = (2.2)
Jumlah kemunculan kata x1 adalah n1 dan jumlah semua kata pada proses
Training adalah fk, persamaan (2.2) dipeoleh dari perhitungan Maximum Extimate
(MLE) dengan mencari parameter pi pada distribusi multinominal berikut ini:

f(x1,x2,………….,xk ; p1,p2,……….,pk;n) = (2.3)
Dengan dan
Fungsi likehood dari distribusi multinominal tersebut adalah
L(p1, p2, ……… pk|x1, x2 ,…, xk) = (2.4)
=( )
Dengan = kemudian log likehood dari fungsi likehood diatas adalah
Log (L(p1,p2,…..,pk|x1,x2,……..,xk)) = log (

= log (
=log
= log
Untuk mencari nilai dari parameter pi, I = 1,2, ……,k yang paling maksimum dari
log likehood diatas, dapat menggunakan persamaan langrange multiplier sebagai
berikut :
L( p1,p2,….,pk) = log(L(p1,p2,….,pk|x1,x2,….,xk)) + (1-
c) Seleksi Fitur Chi Square

Seleksi fitur (Feature Selection) dilakukan untuk mereduksi fitur-
fitur yang tidak relevan dalam proses klasifikasi oleh Naive Bayes. Seleksi
fitur Chi Square menggunakan teori statistika untuk menguji
independensi sebuah term dengan kategorinya. Untuk melakukan
perhitungan nilai Chi Square dapat menggunakan rumus berikut:
𝑋2 (𝐷,𝑡,𝑐) =(𝑁00 + 𝑁11 + 𝑁10 + 𝑁01)𝑥(𝑁00𝑁11 − 𝑁10𝑁01)2
(𝑁11 + 𝑁01)(𝑁11 + 𝑁10)(𝑁10 + 𝑁00)(𝑁01 + 𝑁00)

Atau dapat menggunakan rumus sebagai berikut:
Rumus:
X2 = (2.5)
O: nilai Observasi (pengamatan)
E: nilai Expected (harapan)
Df = (b-1) (k-1) (2.6)
b: jumlah baris
k: jumlah kolom Salah satu tujuan penggunaan seleksi fitur adalah

untuk menghilangkan fitur pengganggu dalam klasifikasi.
Dalam seleksi fitur Chi Square berdasarkan teori statistika, dua peristiwa di
antaranya adalah kemunculan dari fitur dan kemunculan dari kategori, yang
kemudian setiap nilai term di urutkan dari yang tertinggi. Uji Chi Square dalam
statistika diterapkan untuk menguji Independensi dari dua peristiwa.

BAB III
METODE PENELITIAN
A. Objek Penelitian
Pada penelitian ini menggunakan objek penelitian yaitu analisis sentimen

Vaksin Kota Yogyakarta, harus mematuhi protokol kesehatan pada pelaksanaan
Vaksin.
B. Metode Pengumpulan Data
Data yang dibutuhkan dalam penelitian ini adalah berapa banyak penyebaran
data yang ada di Twitter pada saat pelaksanaan Vaksin khususnya di kota Yogyakarta,
metode pengumpulan data pada penilitian ini menggunakan metode crawling,
metode ini dapat mengumpulkan Tweet di Twitter, metode crawling dilakukan
dengan menggunakan Software Python dan menggunakan Api Twitter, dengan
menggunakan kata kunci “Vaksin Yogyakarta” , penarikan data dengan cara
mengambil sampel Tweet dengan rentan waktu pengambilan pada senin 27
September sampai dengan 3 Oktober 2021, penarikan sampel dilakukan untuk
mewakili rangakaian pelaksanaan Vaksin di Kota Yogyakarta 2021.
C. Spesifikasi Kebutuhan
Spesifikasi kebutuhan pada penelitian ini diantaranya:
1. Perangkat Lunak (Software)
Perangkat lunak yang dibutuhkan pada penelitian ini diantaranya:
a. Microsoft Excel 2016
b. Microsoft word 2010
b. Python
c. Google Chrome
d. Jupyter Notebook
2. Perangkat Keras (Hardware)
Perangkat keras yang dibutuhkan pada penelitian ini yaitu laptop dengan spesifikasi
sebagai berikut:
a. Processor : Intel Core i3-6100U, up to 2.6GHz
b. RAM : 4 GB
c. Operating System : Windows 10 64-bit
D. Tahapan Penelitian
Tahapan penelitian dapat dilihat pada gambar 3.1 tahap penelitian berikut :
Gambar 3.1 Tahap penelitian

Dalam metode Naïve Bayes Classifier menggunakan metode analisa data
dengan pengelolahan datanya menggnakan Software Phyton, adapun tahapan
analisis data menggunakan metode Naïve Bayes Classifier dapat dilihat sebagai
berikut:
1. Mempelajari tentang penggunaan metode Naïve Bayes dan mempelajari hal
yang berkaitan tentang sentimen analisis
2. Selanjutnya melakukan pengumpulan data dengan melakukan cara crawling
pada Twitter dengan menggunakan software phyton dengan menggunakan
kata kunci “Vaksin Yogyakarta”
3. Kemudian melakukan preprocessing dengan membersihkan data yang di
peroleh sehingga data menjadi bersih, proses processing yang dimaksud yaitu
case folding ( mengubah kalimat yang berhuruf besar menjadi kecil),
tokenizing (menghilangkan tanda baca seperti tanda “.”,”,”,”?”), filtering
(menghilangkan kata sambung seperti “yang”,”di”,”dan”) dan stemming
(merubah kata yang berimbuhan menjadi kata dasar “memberi” menjadi
“beri”, “menjual” menjadi “jual”).
4. Data yang telah melalui tahap preprocesing (pembersihan) kemudian di bagi
menjadi dua yaitu menjadi data testing dan data training.
5. Setelah itu melakukan klasifikasi data latih yang berguna untuk mengetahui
kategori dari text dengan menggunakan Naïve Bayes.
6. Setelah data di klasifikasi kemudian dimasukan ke pengklasifikasian data uji
7. Terakhir data yang telah melalui tahap pemasukan di pengklasifikasian data
uji kemudian data tersebut akan dihitung keakurasian tingkatnya dengan
menggunakan matriks klasifikasi.

DAFTAR PUSTAKA
Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis
Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan
Metode Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29.
https://doi.org/10.30864/jsi.v15i1.332
Mala Olhang, M. M., Achmadi, S., & Wibisono, F. . A. (2020). Analisis Sentimen
Pengguna Twitter Terhadap Covid-19 Di Indonesia Menggunakan Metode Naive
Bayes Classifier (NBC). JATI (Jurnal Mahasiswa Teknik Informatika), 4(2), 214–
221. https://doi.org/10.36040/jati.v4i2.2695
Cahyono, Y. (2017). Analisis Sentimen pada Sosial Media Twitter Menggunakan Naїve
Bayes Classifier dengan Feature Selection Particle Swarm Optimization dan Term
Frequency. Jurnal Informatika Universitas Pamulang,
2(1), 14.
https://doi.org/10.32493/informatika.v2i1.1500
Dwiraswati, O., Siregar, K. N., Pengawas, B., & Indonesia, U. (2019). Penggunaan
Antibiotik Di Indonesia Dengan Naive Bayes Classifier Sentimen Analysis on
Twitter About The Use of Antibiotics in Indonesia With Naive Bayes Classifier.
15(1), 1–9.
Imam Fahrur Rozi, Elok Nur Hamdana, Iqbal Alfahmi, dan Muhammad Balya.
Pengembangan Aplikasi Analisis Sentimen Twitter Menggunakan Metode Naïve
Bayes Classifier (Studi Kasus Samsat Kota Malang).
Rasyadi, M. H. (2017). Analisis Sentimen Pada Twitter Menggunakan Metode Naïve

Bayes (Studi Kasus Pemilihan Gubernur Dki Jakarta 2017). 1–17.
M. Wino Adi Putra, Susanti, Erlin, dan Herwin. Analisis Sentimen Dompet Elektronik
Pada Twitter Menggunakan Metode Naïve Bayes Classifier.
Pratama, D. Y., Informatika, P. S., Komunikasi, F., Informatika, D. A. N., & Surakarta, U.
M. (2020). IMPLEMENTASI ANALISIS SENTIMEN MENGGUNAKAN NAÏVE BAYES.
Mala Olhang, M. M., Achmadi, S., & Wibisono, F. . A. (2020). Analisis Sentimen
Pengguna Twitter Terhadap Covid-19 Di Indonesia Menggunakan Metode Naive
Bayes Classifier (NBC). JATI (Jurnal Mahasiswa Teknik Informatika), 4(2), 214–
221. https://doi.org/10.36040/jati.v4i2.2695
Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis
Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan Metode
Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29.
https://doi.org/10.30864/jsi.v15i1.332

Metopen-Sentimen Analisis Vaksin Yogyakarta Menggunakan Metode NB

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Metopen-Sentimen Analisis Vaksin Yogyakarta Menggunakan Metode NB

Diunggah oleh

Hak Cipta:

Format Tersedia

Analisis Sentimen Opini Masyarakat Kota Yogyakarta

Menggunakan Metode Naïve Bayes Pada Pelaksanaan

Untuk Memenuhi Sebagian

PROGRAM STUDI TEKNIK

Kata Kunci: Vaksin, Naïve Bayes Classifier.

BAB II KAJIAN PUSTAKA 5

A. Kajian hasil penelitian terdahulu 5

2.1 Tabel kajian penelitian terdahulu 9

2.2 Landasan teori 15

BAB III METODE PENELITIAN 21

B. .Metode Pengumpulan Data 21

COVID-19 merupakan penyakit yang disebabkan oleh virus. Covid-19 memiliki

Analisis sentimen merupakan proses pembentukan melalui analisis teks untuk

Penelitian ini betujuan untuk mengetahui opini Masyarakat Kota Yogyakarta

2. Menggunakan metode Naïve Bayes Classifier.

4. Menggunakan cara Crawling (proses mesin pencarian dapat mencari dan

1. Bagaimana melakukan analisis sentimen terhadap pelaksanaan Vaksin di

Tujuan dari penelitian ini adalah:

1. Menggunakan metode Naïve Bayes Classifier dalam menguji hasil sentimen

1. Dengan adanya penelitian ini pemerintah khusus nya di Kota Yogyakarta

A. Kajian hasil penelitian terdahulu

Dengan melihat pada penelitian dahulu sebagai acuan penelitian ini

Frequency” tujuan dari penelitian ini untuk mendapatkan sentimen analisis

dengan Feature Selection Particle Swarm Optimization berfungsi untuk

menggunakan kata kunci “Kurikulum 2013” penulis memperoleh 3300 data

Particle Swarm Optimization (PSO) menggunakan parameter Term Frequency

F.X Ariwibisono, judul penelitian “analisis sentimen pengguna Twitter terhadap

covid-19 di Indonesia menggunakan metode Naïve Bayes Classifie(NBC)” tujuan

penelitian adalah dilakukan proses menganalisis sentimen masyarakat terhadap

aspirasi yang disampaikan melalui Twitter. Proses pengambilan data

menggunakan hashtags #Coronavirusindonesia dan #covid19. Data diklasifikasi

dan Gede Indrawan3 dengan judul penelitian “Analisis Sentimen Dokumen

Twitter Mengenai Dampak Virus Corona Menggunakan Metode Naive Bayes

Classifier” Penelitian Ini bertujuan untuk memperoleh analisis dokumen text

untuk mendapatkan sentimen positif atau negatif masyarakat. Dokumen Tweet

Muhammad Balya,judul penelitian “Pengembangan Aplikasi Analisis Sentimen

Malang)” bertujuan untuk membuat aplikasi analisis sentimen untuk melakukan

Manunggal Satu Atap (SAMSAT) Malang Kota. Hasil penelitian memberikan

Penelitian Ini Adalah “Analisis Sentimen Dompet Elektronik Pada Twitter

Menggunakan Metode Naïve Bayes Classifier” Penelitian Ini bertujuan untuk

mendapatkan sentimen masyarakat pada hadirnya berbagai aplikasi dompet

elektronik di Indonesia dengan mengklasifikasikannya kedalam tiga kelas yakni

positif, negatif dan netral.

diikuti oleh GoPay sebesar 53,33% dan Dana sebesar 30,00%.

telah dilakukan sebelumnya, dapat dilihat pada tabel berikut:

Aspek Pustaka 1 Pustaka 2 Pustaka 3 Pustaka 4 Pustaka 5 Hasil

Sentot Achmadi, Gede Hendra Iqbal Alfahmi, dan Herwin

dan F.X Divayana2, Muhammad Balya

Ariwibisono dan Gede

sosial Media terhadap Dokume Sentimen Pada Twitter Menggunaka

Classifie dengan Bayes Corona Samsat Kota Yogyakarta

feature Classifie(NBC) Menggunakan Malang)”, 2021

selection Metode Naïve

particle swarm Bayes

Volume, Vol. 2 No. 1 Vol. 4 No. 2 Vol. 15 Vol 4 No 2 Vol. 5 No. 1 -

dijadikan metode Yang tidak sarankan untuk 63.33% diikuti oleh

sebagai wakil klasifikasi. terdeteksi menggunakan metide GoPay sebesar

kumpulan kata tidak baku menurunkan memperoleh hasil sebesar 30,00%.

dokumen yang yang tidak nilai evaluasi. yang lebih akurat

Penelitian memisahkan proses memperoleh aplikasi analisis tanggapan masyarakat mendapatkan

Tweet menganalisis analisis sentimen yang atas hadirnya hasil opini

berbahasa sentimen dokumen text menerapkan berbagai aplikasi masyarakat

Twitter kedalam yang disampaikan sentimen untuk mengklasifikasikannya positif, negatif