Metopen-Sentimen Analisis Vaksin Yogyakarta Menggunakan Metode NB
Metopen-Sentimen Analisis Vaksin Yogyakarta Menggunakan Metode NB
METODOLOGI PENELITIAN
Disusun Oleh:
Fitri Andini
1700018155
Abstrak
Vaksin adalah produk biologis yang berasal dari mikroorganisme hidup, dan
dapat berfungsi sebagai peningkat kekebalan tubuh dari penyakit, baik mencegah
atau mengobati penyakit. Terdapat banyak pendapat dari masyarakat mengenai
pelaksanaan vaksin yang menyebabkan khususnya pada pemerintah Kota
Yogyakarta mengalami kesulitan untuk mengetahui apakah masyarakat banyak yang
setuju (positif) tidak setuju (negatif) biasa saja (netra) perihal pelaksanaan vaksin.
Dalam penelitian ini menggunakan metode Naïve Bayes Classifier, Metode ini
merupakan sebuah metode penggolongan berdasarkan probabilitas sederhana,
serta dibuat untuk digunakan dengan asumsi bahwa antara satu kelas menggunakan
kelas yang lain tak saling tergantung (Independen). Dataset yang digunakan
dalam penelitian ini, didapatkan dengan cara crawling di Twitter, crawling dilakukan
dengan menggunakan software python dan menggunakan Api Twitter, dengan
menggunakan kata kunci “vaksin Yogyakarta”. Penarikan data dengan cara
mengambil sampel Tweet dengan rentan waktu pengambilan pada senin 27
september sampai dengan 3 oktober 2021.
Harapan pada penelitian ini khususnya Pemerintah Kota Yogyakarta akan lebih
mudah mengetahui opini masyarakat terkait pelaksanaan vaksin, dan dapat lebih
mudah melihat atau memilah pandangan dari masyarakat apakah lebih banyak
pendapat positif, negatif atau netral. Pemerintah juga bisa mengetahui bagaimana
penerapan metode Naïve Bayes di pelaksannan vaksin di Kota Yogyakarta serta
pemerintah dapat mengetahui analisis sentimen apa saja yang terdapat pada proses
pelaksanaan vaksin di Kota Yogyakarta.
DAFTAR ISI
KATA PENGANTAR
i
DAFTAR ISI
1
BAB 1 PENDAHULUAN
A. Latar Belakang 1
B. identifikasi Masalah 3
C. Batasan Masalah 3
D. Rumusan Masalah 3
E. Tujuan penelitian 4
F. Manfaat Penelitian 4
A. Objek Penelitian 21
C. Spesifikasi Kebutuhan 21
D. Tahapan Penelitian 22
E. Studi Kasus 24
DAFTAR PUSTAKA 28
BAB 1
PENDAHULUAN
A. Latar Belakang
Pada tahun 1798 Edward Jenner menunjukan bahwa vaksin tersebut mampu
mencegah cacar di manusia. Vaksin adalah produk biologis yang berasal dari
mikroorganisme hidup, dan dapat berfungsi sebagai peningkat kekebalan tubuh dari
penyakit baik, mencegah atau mengobati penyakit. Vaksinasi berasal dari istilah
“Vaccine” yaitu zat yang bisa merangsang timbulnya kekebalan aktif mirip BCG,
Polio, DPT, Kepatitis B, dan lain-lain. Syarat ketentuan vaksin di Kota Yogyakarta ialah
masyarakat umum menggunakan KTP Nasional, Domisili Bebas, masyarakat harus
terlebih dahulu mendaftar pada pedulilindungi.id.(Mala Olhang dkk, 2020)
Lebih dari 100 orang pada tanggal 10 Oktober 2021 masyarakat indonesia telah
mendapat vaksin dosis pertama, dan lebih dari 57.5 juta masyarakat Indonesia telah
mendapatkan dosis 2. Telah mencapai 157.707.427 takaran Jumlah vaksinasi dari
dosis pertama dan kedua. Takaran pertama sebanyak 48.11% masyarakat Indonesia
serta vaksinasi dosis kedua sebanyak 27.62% dan target vaksinasi di Indonesia
sebanyak 208.265.720 orang dari jumlah yang telah melakukan vaksin. Kementerian
Kesihatan melakukan pendekatan Dengan masyarakat supaya dapat dengan mudah
menjangkau layanan vaksinasi, untuk mempertinggi cakupan vaksinasi Terus
dikembangkan di seluruh indonesia untuk pusat vaksinasi dengan kapasitas 1000-
2000 target per hari. (Astari dkk,2020)
Media sosial merupakan alat komunikasi yang sangat membantu untuk
berkomunikasi, berinteraksi, menyebarkan berita dan lain sebagainya dalam bentuk
virtual. Dampak positif yang dapat diperoleh dari media sosial seperti informasi bisa
tersampaikan dengan cepat, serta dampak negatif dapat membuat warga lebih
dominan terhadap media sosial dibandingkan dengan menggunakan cara
berkomunikasi secara langsung. Media sosial mempermudah proses berlangsungnya
vaksin, karena isu perihal vaksin khususnya vaksin pada Kota Yogyakarta lebih cepat
dan efektif tersampaikan pada masyarakat. Masyarakat dengan adanya media sosial
dapat lebih mudah untuk memperoleh info sebab pengguna hanya bermodalkan
handphone, khususnya berita tentang vaksin cepat tersampaikan.(Rasyadi, 2017.)
Diperoleh dari jumlah penduduk Indonesia yang terdaftar sebanyak lebih dari 62
juta orang dan memiliki akun di media sosial khususnya media sosial Twitter. Rata-
rata pengguna internet telah menghabiskan waktu hampir 3 jam untuk terkoneksi.
Media sosial ialah sebuah alat komunikasi yang berfungsi untuk saling menyebarkan
berita atau informasi diantara individu (To Beshare One-To-One). Dengan adanya
media sosial dapat memudahkan pengguna atau masyarakat dalam memperoleh
informasi karena media sosial pada dasarnya ialah komunikasi 2 arah, sebagai
akibatnya dapat dilakukan beberapa aktifitas pada banyak sekali bentuk kerjasama,
dan saling mengenal dengan bentuk tulisan, serta visual. (Mala Olhang dkk, 2020)
Dari Agustus 10-11 2020,ribu perhari dosis vaksin di Kota Yogyakarta meningkat
jumlah target. Di bulan Juni sampai Juli 2020 lalu 6 ribu, Dalam beberapa minggu
belakangan kapasitas vaksin ditingkatkan, di Kota Yogyakarta menerapkan jenis
vaksin yaitu Sinovac, Astrazeneca dan Moderna. Berpatokan pada banyaknya target
Pemerintah Kota Yogyakarta pada penyebaran vaksin sehingga perlu melakukan
penelitian ini yang bertujuan untuk mengetahui opini masyarakat tentang
pelaksanaan vaksin di Kota Yogyakarta. (Pratama dkk,2020)
Pada bulan Maret tahun 2006 oleh Jack Dorsey dan pada bulan Juli merupakan
Awal terbentuknya Twitter. Konsep awal asal Twitter yaitu sebuah alat komunikasi
atau sistem yang dapat mempermudah pengguna untuk berkomunikasi. Twitter bisa
menjadi layanan jejaring sosial dengan fitur posting pesan singkat atau status serta
beberapa fitur menarik lainnya setelah beberapa kali melalui tahap revisi. Manfaat
Twitter yaitu merupakan media sosial yang bisa menghubungkan pengguna dengan
dapat mengirimkan chat, postingan, bisa melihat postingan berita dan lain
sebagainya. (Dwiraswati dkk, 2019).
Proses pengumpulan data pada Twitter menggunakan Api Key dan dibantu
menggunakan bahasa pemrograman Phyton. Api key merupakan suatu code untuk
membatu pada saat penarikan data. Api Key Twitter memiliki suatu Consumer Keys,
Consumer Secret, Access Key, dan Accsess Secret yang berfungsi untuk memperoleh
data Twitter yang dibutuhkan oleh programmer. (Dwiraswati dkk, 2019).
Selain metode Naïve Bayes metode lainnya yang digunakan untuk analisis yaitu
memakai metode KNearest Neighbor. Metode KNearest Neighbor berfungsi
mengatasi masalah dengan pengklasifikasian. Dengan membandingkan jeda
kedekatan antara data pelatihan serta data testing. Algoritma metode KNN
merupakan algoritma yang sederhana, dapat berfungsi berdasarkan ketika
pengerjaannya menggunakan jeda terpendek dari sampel uji ke sampel latih untuk
memilih KNN nya. Kemudian asal dominasi KNN diambil sehingga dapat menjadikan
prediksi dari uji sampel. Beberapa kelebihan KNN yaitu efektif apabila data latih nya
besar dan andal terhadap training. KNearest Neighbor memiliki Kelemahan yaitu
pembelajaran berdasarkan jarak yang tidak jelas mengenai jenis jeda yang harus
digunakan, atribut mana yang wajib dipergunakan untuk mendapatkan hasil yang
terbaik KNearest Neighbor harus terlebih dahulu memilih nilai dari parameter K
(jumlah asal tetangga terdekat), dan membutuhkan pengujian asal sampel yang
membutuhkan jeda maka perhitungan biaya komputasi cukup tinggi (Cahyono,
Y,2017).
Melihat manfaat dan kekurangan asal metode KNearest Neighbor maka metode
yang cocok untuk penelitian ini adalah metode Naïve Bayes karena metode Naïve
Bayes merupakan sebuah metode penggolongan berdasarkan probabilitas
sederhana, serta dibuat untuk digunakan dengan asumsi bahwa antar satu kelas
menggunakan kelas yang lain tak saling tergantung (Independen). Pada klasifikasi
Naïve Bayes proses pembelajaran lebih ditekankan pada mengestimasi probabilitas,
sehingga dengan memakai metode Naïve Bayes bisa dengan mudah untuk
menentukan hasil asal sentimen masyarakat perihal Vaksin di Kota Yogyakarta.
Apabila probabilitas kondisonal yang terdapat pada Naïve Bayes bernilai 0 maka
metode Naïve Bayes tidak akan berlaku dan prediksi probabilitas akan bernilai nol
serta pada metode Naïve Bayes mengasumsi variabel bebas. Penelitian Vaksin di
Kota Yogyakarta menggunakan Naïve Bayes Classifier pertanda bahwa algoritma
Naïve Bayes efektif dikarenakan ketika dikomparasi dengan algoritma Lexicon Based
tahap akurasi Naïve Bayes lebih baik dari Lexicon Based (Yono Cahyono,2017)
B. Identifikasi Masalah
Berdasarkan dari uraian latar belakang di atas, identifikasi masalah yang didapat
ialah:
1. Pemerintah kesulitan mengetahui opini (positif, negatif dan netral)
masyarakat mengenai pelaksanaan vaksin Yogyakarta.(Tidak ada di latar
belkng masalah)
2. Asumsi sederhana yang diterapkan pada Naive Bayes Menyebabkan kurang
optimalnya hasil estimasi probabilitas, khususnya pada masalah domain teks.
C. Batasan Masalah
Dapat dilihat pada latar belakang di atas, sehingga batasan masalah yang
terdapat pada penelitian ini adalah:
1. Data yang diteliti pada penelitian ini ialah opini dari masyarakat berupa
variabel dan memiliki polaritas positif, negatif, dan netral
3. Media sosial untuk memperoleh data pada penelitian ini yaitu Twitter.
D. Rumusan Masalah
Dapat dilihat pada latar belakang di atas, rumusan masalah yang diperolah pada
penelitian ini adalah:
F. Manfaat Penelitian
Dapat dilihat pada latar belakang, manfaat yang terdapat dalam penelitian ini
adalah:
KAJIAN PUSTAKA
dapat dilakukan, penelitian pertama yaitu dilakukan oleh Yono Cahyono (2017)
dengan judul “Analisis Sentimen Pada Sosial Media Twitte Menggunakan Naïve
Bayes Classifie Dengan Feature Selection Particle Swarm Optimization Dan Term
kedalam kategori positif, negatif dan netral. Metode Naive Bayes Classifier
mengurangi atribut yang kurang baik atau relevan pada data set. Dengan
Tweet. Pada 100 data menggunakan cara pelabelan manual untuk sentimen
positif, negatif dan netral. Menggunakan 3000 data Tweet data latih dan 1000
Tweet tiap kategori sentimennya. Maka mendapatkan hasil 3000 data latih
pengujian dan 100 Tweet data uji coba mencapai 91 %, sehingga mendapatkan
akurasi 97,48% dengan algoritma Naïve Bayes Classifier dan Feature Selection
(TF)
Penelitian Kedua oleh Maria Mega Mala Olhang, Sentot Achmadi, dan
dengan cara manual memberikan label positif atau negatif dan jumlah data yang
digunakan adalah sebanyak 500 data. Diperoleh hasil akurasi recall 325,
Precission 80%, F-Measure 45% serta rata-rata akurasi 36% dengan Sebanyak 75
Tweet.
Penelitian Ketiga oleh Ni Made Ayu Juli Astari1, Dewa Gede Hendra Divayana2,
dari Twitter mengenai dampak virus Corona merupakan data yang digunakan
dalam penelitian ini . Metode yang digunakan untuk klasifikasi dalam penelitian
ini adalah Metode Naive Bayes Classifier. Memperoleh Hasil penelitian akurasi
sebanyak 67% dan Error rate sebesar 33%. Dengan menggunakan data
Percobaan yang berbeda (100, 200, dan 500) mendapatkan hasil akurasi yaitu
0.02.
Penelitian Keempat oleh Imam Fahrur Rozi, Elok Nur Hamdana, Iqbal Alfahmi,
Twitter Menggunakan Metode Naïve Bayes Classifier (Studi Kasus Samsat Kota
fungsi Naïve Bayes Classifier melabelkan kata-kata dan lebih khususnya pada
Tweet dalam bahasa Indonesia. Memperoleh data dengan Web Scrapping dan
topik bahasan sumber teks yang digunakan adalah Sistem Administrasi
unjuk kerja yang baik dalam Analisis sentimen. Mempeoleh akurasi klasifikasi
pada setiap kategori positif, negatif, netral masing-masing sebesar 82%, 92%,
80% dengan jumlah data latih 200 Tweet negatif, 200 Tweet positif, dan 200
Tweet netral.
Penelitian Kelima oleh M. Wino Adi Putra, Susanti, Erlin, dan Herwin,judul
Data diperoleh secara langsung dari situs Microblogging Twitter dengan hashtag
pencarian #GoPay, #OVO dan #DANA, dari data tersebut, diambil 100 data
dengan rincian 70 data latih dan 30 data uji. Mendapatkan hasil positif sebesar
46.67% diikuti oleh dana sebesar 37,50% dan OVO sebesar 16,67%. Dompet
elektronik OVO memiliki nilai negatif yang lebih tinggi yaitu sebesar 63.33%
Tabel 2.1. merupakan perbandingan dari kajian penelitian terdahulu untuk mengetahui persamaan dan perbedaan pada penelitian yang
Nama Penulis Yono Cahyono Maria Mega Ni Made Ayu Juli Imam Fahrur Rozi, M. Wino Adi Putra, Fitri Andini
(2017) Mala Olhang, Astari1, Dewa Elok Nur Hamdana, Susanti, Erlin, dan
Indrawan3
Nama jurnal “Analisis analisis sentimen “Analisis “Pengembangan “Analisis Sentimen Analisis
Sentimen Pada pengguna Twitter Sentimen Aplikasi Analisis Dompet Elektronik Sentimen
covid-19 N Twitter n
Twitter di Indonesia Twitter Menggunakan Menggunakan Metode Naïve
menggunakan menggunakan Mengenai Metode Naïve Bayes Metode Naïve Bayes Bayes
Naïve Bayes metode Naïve Dampak Virus Classifier (Studi Kasus Classifier” Pada Vaksin
optimization Classifier”
dan term
frequency”
Nomor No. 1
Bulan, tahun Maret 2017 September 2019 November 2020 Februari 2018 Januari -
Terbit 2020
Penerbit - - - - -
Masalah Jumlah seleksi Seleksi fitur tidak Metode Hasil yang di Dompet elektronik
Peneitian fitur dengan selalu klasifikasi. dapatkan belum OVO memiliki nilai
Terms lebih meningkatkan Terdapat banyak akurat dan penelitian negatif yang lebih
banyak akurasi pada kata tidak baku selanjutnya di tinggi yaitu sebesar
penting untuk Terdapat banyak sehingga lain agar 53,33% dan Dana
akan terdeteksi
dianalisis. sehingga
menurunkan
nilai
evaluasi.
Tujuan Untuk Untuk dilakukan Untuk Untuk membangun Untuk menganalisa Untuk
Indonesia pada masyarakat untuk pendekatan Naïve dompet elektronik di apakah banyak
media sosial terhadap aspirasi mendapatkan Bayes Classifier Indonesia dengan yang beropini
kategori positif, melalui Twitter positif atau mengklasifikasikan kedalam tiga kelas atau netral
negatif dan yaitu negatif kata-kata dan yakni positif, negatif mengenai
netral. Metode mengembangkan masyarakat. difokuskan pada dan netral dengan pelaksanaan
Naїve Bayes sistem dengan Data yang Tweet dalam bahasa menggunakan metode vaksin di kota
Tweet
dari Twitter
Particle Swarm sebelumnya mengenai perangkat lunak
kurang relevan
pada saat
proses
klasifikasi. ).
Metode/Teori Metode Naїve Met ode Naїve Metode Naїve Metode Naїve Bayes Metode Naїve Bayes Metode Naїve
Bayes Classifier Bayes Classifier Bayes Bayes Classifier
(NBC) (NBC) Classifier Classifier (NBC) Classifier (NBC) (NBC)
(NBC)
Objek dan sosial media covid-19 Mengenai Studi Kasus Samsat Dompet Elektronik Vaksin
feature
selection
particle swarm
Hasil Menghasilkan Hasil pengujian, Klasifikasi Hasil uji Menunjukkan bahwa -
sentimen secara pengukuran dengan tujuan oleh aplikasi positif oleh pengguna
Menggunakan negatif,
200
parameter Term rate sebesar Tweet positif,
97,48%.
2.2 Landasan Teori
1. Data Mining
a) Fungsi untuk memahami secara jauh data yang diteliti disebut fungsi
2. Analisis sentimen
sentimen:
kata dalam berbagai bahasa. Tipe Analisis yang satu ini terbilang cukup
sulit karena kamu harus memiliki daftar kata dari bermacam bahasa.
Berikut merupakan teknik dasar dari sentimen analisis:
3. Preprocessing
Tahapan text preprocessing dalam sebagai salah satu teknik pengolahan data
text sebagai berikut:
a) Case Folding yaitu untuk merubah kalimat yang berhuruf kapital (besar)
menjadi kecil.
b) Tokenizing yaitu untuk menghilangkan tanda baca .
c) Filtering yaitu untuk menghilangkan kata sambung seperti yang,dan,di, dan
lain sebagainya
kategori yang paling tepat (Feldman & Sanger, 2007). Tweet yang ada Pada
Naïve Bayes Classifier di notasikan dalam bentuk pasangan variabel (x1, x2, x3,
….., xn) dimana kata petama merupakan x1, kata kedua meupakan x2, kata
tahapan ini sudah besih. Ada empat proses yang dilakukan pada tahapan
P(vj) = (2.1)
jumlah kelas pada vj ditulis : N(vj), dan jumlah semua kelas yang digunakan
Pada proses ini probabilitas kata pada setiap masing masing kelas dapat di
P(vj) = (2.2)
Jumlah kemunculan kata x1 adalah n1 dan jumlah semua kata pada proses
Training adalah fk, persamaan (2.2) dipeoleh dari perhitungan Maximum Extimate
Dengan dan
=( )
=log
= log
Untuk mencari nilai dari parameter pi, I = 1,2, ……,k yang paling maksimum dari
berikut :
fitur yang tidak relevan dalam proses klasifikasi oleh Naive Bayes. Seleksi
Rumus:
X2 = (2.5)
b: jumlah baris
Dalam seleksi fitur Chi Square berdasarkan teori statistika, dua peristiwa di
antaranya adalah kemunculan dari fitur dan kemunculan dari kategori, yang
kemudian setiap nilai term di urutkan dari yang tertinggi. Uji Chi Square dalam
METODE PENELITIAN
A. Objek Penelitian
Data yang dibutuhkan dalam penelitian ini adalah berapa banyak penyebaran
data yang ada di Twitter pada saat pelaksanaan Vaksin khususnya di kota Yogyakarta,
C. Spesifikasi Kebutuhan
b. Python
c. Google Chrome
d. Jupyter Notebook
Perangkat keras yang dibutuhkan pada penelitian ini yaitu laptop dengan spesifikasi
sebagai berikut:
b. RAM : 4 GB
D. Tahapan Penelitian
Tahapan penelitian dapat dilihat pada gambar 3.1 tahap penelitian berikut :
analisis data menggunakan metode Naïve Bayes Classifier dapat dilihat sebagai
berikut:
peroleh sehingga data menjadi bersih, proses processing yang dimaksud yaitu
5. Setelah itu melakukan klasifikasi data latih yang berguna untuk mengetahui
Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis
Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan
Metode Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29.
https://doi.org/10.30864/jsi.v15i1.332
Mala Olhang, M. M., Achmadi, S., & Wibisono, F. . A. (2020). Analisis Sentimen
Pengguna Twitter Terhadap Covid-19 Di Indonesia Menggunakan Metode Naive
Bayes Classifier (NBC). JATI (Jurnal Mahasiswa Teknik Informatika), 4(2), 214–
221. https://doi.org/10.36040/jati.v4i2.2695
Cahyono, Y. (2017). Analisis Sentimen pada Sosial Media Twitter Menggunakan Naїve
Bayes Classifier dengan Feature Selection Particle Swarm Optimization dan Term
Frequency. Jurnal Informatika Universitas Pamulang,
2(1), 14.
https://doi.org/10.32493/informatika.v2i1.1500
Dwiraswati, O., Siregar, K. N., Pengawas, B., & Indonesia, U. (2019). Penggunaan
Antibiotik Di Indonesia Dengan Naive Bayes Classifier Sentimen Analysis on
Twitter About The Use of Antibiotics in Indonesia With Naive Bayes Classifier.
15(1), 1–9.
Imam Fahrur Rozi, Elok Nur Hamdana, Iqbal Alfahmi, dan Muhammad Balya.
Pengembangan Aplikasi Analisis Sentimen Twitter Menggunakan Metode Naïve
Bayes Classifier (Studi Kasus Samsat Kota Malang).
M. Wino Adi Putra, Susanti, Erlin, dan Herwin. Analisis Sentimen Dompet Elektronik
Pada Twitter Menggunakan Metode Naïve Bayes Classifier.
Pratama, D. Y., Informatika, P. S., Komunikasi, F., Informatika, D. A. N., & Surakarta, U.
M. (2020). IMPLEMENTASI ANALISIS SENTIMEN MENGGUNAKAN NAÏVE BAYES.
Mala Olhang, M. M., Achmadi, S., & Wibisono, F. . A. (2020). Analisis Sentimen
Pengguna Twitter Terhadap Covid-19 Di Indonesia Menggunakan Metode Naive
Bayes Classifier (NBC). JATI (Jurnal Mahasiswa Teknik Informatika), 4(2), 214–
221. https://doi.org/10.36040/jati.v4i2.2695
Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis
Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan Metode
Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29.
https://doi.org/10.30864/jsi.v15i1.332