Anda di halaman 1dari 29

Analisis Sentimen Opini Masyarakat Kota Yogyakarta

Menggunakan Metode Naïve Bayes Pada Pelaksanaan


Vaksin 2021

METODOLOGI PENELITIAN

Untuk Memenuhi Sebagian


Persyaratan Mencapai Derajat Sarjana
Komputer

Disusun Oleh:
Fitri Andini
1700018155

PROGRAM STUDI TEKNIK


INFORMATIKA FAKULTAS TEKNOLOGI
INDUSTRI UNIVERSITAS AHMAD
DAHLAN YOGYAKARTA
2021
Analisis Sentimen Opini Masyarakat Kota Yogyakarta
Menggunakan Metode Naïve Bayes Pada Pelaksanaan Vaksin
2021
Fitri Andini
1700018155

Abstrak

Vaksin adalah produk biologis yang berasal dari mikroorganisme hidup, dan
dapat berfungsi sebagai peningkat kekebalan tubuh dari penyakit, baik mencegah
atau mengobati penyakit. Terdapat banyak pendapat dari masyarakat mengenai
pelaksanaan vaksin yang menyebabkan khususnya pada pemerintah Kota
Yogyakarta mengalami kesulitan untuk mengetahui apakah masyarakat banyak yang
setuju (positif) tidak setuju (negatif) biasa saja (netra) perihal pelaksanaan vaksin.

Dalam penelitian ini  menggunakan metode  Naïve Bayes Classifier, Metode ini 
merupakan sebuah metode penggolongan berdasarkan probabilitas sederhana,
serta dibuat untuk digunakan dengan asumsi bahwa antara satu kelas menggunakan
kelas yang lain tak saling tergantung (Independen). Dataset yang digunakan
dalam penelitian ini, didapatkan dengan cara crawling di Twitter, crawling dilakukan
dengan menggunakan software python dan menggunakan Api Twitter, dengan
menggunakan kata kunci “vaksin Yogyakarta”. Penarikan data dengan cara
mengambil sampel Tweet dengan rentan waktu pengambilan pada senin 27
september sampai dengan 3 oktober 2021.

Harapan pada penelitian ini khususnya Pemerintah Kota Yogyakarta akan lebih
mudah mengetahui opini masyarakat terkait pelaksanaan vaksin, dan dapat lebih
mudah melihat atau memilah pandangan dari masyarakat apakah lebih banyak
pendapat positif, negatif atau netral. Pemerintah juga bisa mengetahui bagaimana
penerapan metode Naïve Bayes di pelaksannan vaksin di Kota Yogyakarta serta
pemerintah dapat mengetahui analisis sentimen apa saja yang terdapat pada proses
pelaksanaan vaksin di Kota Yogyakarta.

Kata Kunci: Vaksin, Naïve Bayes Classifier.

DAFTAR ISI

KATA PENGANTAR
i
DAFTAR ISI
1
BAB 1 PENDAHULUAN
A. Latar Belakang 1
B. identifikasi Masalah 3
C. Batasan Masalah 3
D. Rumusan Masalah 3
E. Tujuan penelitian 4
F. Manfaat Penelitian 4

BAB II KAJIAN PUSTAKA 5

A. Kajian hasil penelitian terdahulu 5

2.1 Tabel kajian penelitian terdahulu 9

2.2 Landasan teori 15

BAB III METODE PENELITIAN 21

A. Objek Penelitian 21

B. .Metode Pengumpulan Data 21

C. Spesifikasi Kebutuhan 21

D. Tahapan Penelitian 22

E. Studi Kasus 24

DAFTAR PUSTAKA 28
BAB 1

PENDAHULUAN

A. Latar Belakang

COVID-19 merupakan penyakit yang disebabkan oleh virus. Covid-19 memiliki


beberapa gejala seperti nyeri tenggorokan, nyeri kepala, nyeri otot dan Flu. Cara
penularan COVID-19 yaitu dari kontak menggunakan droplet saluran napas
penderita. Droplet bisa melewati hingga jeda tertentu (biasanya 1 meter).
Pencegahan COVID-19 dapat dilakukan dengan cara menggunakan vaksin, vaksin
memiliki manfaat bagi tubuh supaya tidak mudah terserang oleh penyakit Covid-19
dengan cara meningkatkan kekebalan tubuh. (Astari dkk, 2020).

Pada tahun 1798 Edward Jenner menunjukan bahwa vaksin tersebut mampu
mencegah cacar di manusia. Vaksin adalah produk biologis yang berasal dari
mikroorganisme hidup, dan dapat berfungsi sebagai peningkat kekebalan tubuh dari
penyakit baik, mencegah atau mengobati penyakit. Vaksinasi berasal dari istilah
“Vaccine” yaitu zat yang bisa merangsang timbulnya kekebalan aktif mirip BCG,
Polio, DPT, Kepatitis B, dan lain-lain. Syarat ketentuan vaksin di Kota Yogyakarta ialah
masyarakat umum menggunakan KTP Nasional, Domisili Bebas, masyarakat harus
terlebih dahulu mendaftar pada pedulilindungi.id.(Mala Olhang dkk, 2020)

Lebih dari 100 orang pada tanggal 10 Oktober 2021 masyarakat indonesia telah
mendapat vaksin dosis pertama, dan lebih dari 57.5 juta masyarakat Indonesia telah
mendapatkan dosis 2. Telah mencapai 157.707.427 takaran Jumlah vaksinasi dari
dosis pertama dan kedua. Takaran pertama sebanyak 48.11% masyarakat Indonesia
serta vaksinasi dosis kedua sebanyak 27.62% dan target vaksinasi di Indonesia
sebanyak 208.265.720 orang dari jumlah yang telah melakukan vaksin. Kementerian
Kesihatan melakukan pendekatan Dengan masyarakat supaya dapat dengan mudah
menjangkau layanan vaksinasi, untuk mempertinggi cakupan vaksinasi Terus
dikembangkan di seluruh indonesia untuk pusat vaksinasi dengan kapasitas 1000-
2000 target per hari. (Astari dkk,2020)
Media sosial merupakan alat komunikasi yang sangat membantu untuk
berkomunikasi, berinteraksi, menyebarkan berita dan lain sebagainya dalam bentuk
virtual. Dampak  positif yang dapat diperoleh dari media sosial seperti informasi bisa
tersampaikan dengan cepat, serta dampak negatif dapat membuat warga lebih
dominan terhadap media sosial dibandingkan dengan menggunakan cara
berkomunikasi secara langsung. Media sosial mempermudah proses berlangsungnya
vaksin, karena isu perihal vaksin khususnya vaksin pada Kota Yogyakarta lebih cepat
dan efektif tersampaikan pada masyarakat. Masyarakat dengan adanya media sosial
dapat lebih mudah untuk memperoleh info sebab pengguna hanya bermodalkan
handphone, khususnya berita tentang vaksin cepat tersampaikan.(Rasyadi, 2017.)

Diperoleh dari jumlah penduduk Indonesia yang terdaftar sebanyak lebih dari 62
juta orang dan memiliki akun di media sosial khususnya media sosial Twitter. Rata-
rata pengguna internet telah menghabiskan waktu hampir 3 jam untuk terkoneksi.
Media sosial ialah sebuah alat komunikasi yang berfungsi untuk saling menyebarkan
berita atau informasi diantara individu (To Beshare One-To-One). Dengan adanya
media sosial dapat memudahkan pengguna atau masyarakat dalam memperoleh
informasi karena media sosial pada dasarnya ialah komunikasi 2 arah, sebagai
akibatnya dapat dilakukan beberapa aktifitas pada banyak sekali bentuk kerjasama,
dan saling mengenal dengan bentuk tulisan, serta visual. (Mala Olhang dkk, 2020)

Dari Agustus 10-11 2020,ribu perhari dosis vaksin di Kota Yogyakarta meningkat
jumlah target. Di bulan Juni sampai Juli 2020 lalu 6 ribu, Dalam beberapa minggu
belakangan kapasitas vaksin ditingkatkan, di Kota Yogyakarta menerapkan jenis
vaksin yaitu Sinovac, Astrazeneca dan Moderna. Berpatokan pada banyaknya target
Pemerintah Kota Yogyakarta pada penyebaran vaksin sehingga perlu melakukan
penelitian ini yang bertujuan untuk mengetahui opini masyarakat tentang
pelaksanaan vaksin di Kota Yogyakarta. (Pratama dkk,2020)

Pada bulan Maret tahun 2006 oleh Jack Dorsey dan pada bulan Juli merupakan
Awal terbentuknya Twitter. Konsep awal asal Twitter yaitu sebuah alat komunikasi
atau sistem yang dapat mempermudah pengguna untuk berkomunikasi. Twitter bisa
menjadi layanan jejaring sosial dengan fitur posting pesan singkat atau status serta
beberapa fitur menarik lainnya setelah beberapa kali melalui tahap revisi. Manfaat
Twitter yaitu merupakan media sosial yang bisa menghubungkan pengguna dengan
dapat mengirimkan chat, postingan, bisa melihat postingan berita dan lain
sebagainya. (Dwiraswati dkk, 2019).
Proses pengumpulan data pada Twitter menggunakan Api Key dan dibantu
menggunakan bahasa pemrograman Phyton. Api key merupakan suatu code untuk
membatu pada saat penarikan data. Api Key Twitter memiliki suatu Consumer Keys,
Consumer Secret, Access Key, dan Accsess Secret yang berfungsi untuk memperoleh
data Twitter yang dibutuhkan oleh programmer. (Dwiraswati dkk, 2019).

Analisis sentimen merupakan proses pembentukan melalui analisis teks untuk


mendapatkan pendapat masyarakat. apakah banyak yang berpendapat positif,
negatif atau netral. Sentimen analisis dapat menghemat waktu serta tenaga.
Sentimen analisis sering pula disebut sebagai opinion mining. (Rasyadi, 2017)

Selain metode Naïve Bayes metode lainnya yang digunakan untuk analisis yaitu
memakai metode KNearest Neighbor. Metode KNearest Neighbor berfungsi
mengatasi masalah dengan pengklasifikasian. Dengan membandingkan jeda
kedekatan antara data pelatihan serta data testing. Algoritma metode KNN
merupakan algoritma yang sederhana, dapat berfungsi berdasarkan ketika
pengerjaannya menggunakan jeda terpendek dari sampel uji ke sampel latih untuk
memilih KNN nya. Kemudian asal dominasi KNN diambil sehingga dapat menjadikan
prediksi dari uji sampel. Beberapa kelebihan KNN yaitu efektif apabila data latih nya
besar dan andal terhadap training. KNearest Neighbor memiliki Kelemahan yaitu
pembelajaran berdasarkan jarak yang tidak jelas mengenai jenis jeda yang harus
digunakan, atribut mana yang wajib dipergunakan untuk mendapatkan hasil yang
terbaik KNearest Neighbor harus terlebih dahulu memilih nilai dari parameter K
(jumlah asal tetangga terdekat), dan membutuhkan pengujian asal sampel yang
membutuhkan jeda maka perhitungan biaya komputasi cukup tinggi (Cahyono,
Y,2017).

Melihat manfaat dan kekurangan asal metode KNearest Neighbor maka metode
yang cocok untuk penelitian ini adalah metode Naïve Bayes karena metode Naïve
Bayes merupakan sebuah metode penggolongan berdasarkan probabilitas
sederhana, serta dibuat untuk digunakan dengan asumsi bahwa antar satu kelas
menggunakan kelas yang lain tak saling tergantung (Independen). Pada klasifikasi
Naïve Bayes proses pembelajaran lebih ditekankan pada mengestimasi probabilitas,
sehingga dengan memakai metode Naïve Bayes bisa dengan mudah untuk
menentukan hasil asal sentimen masyarakat perihal Vaksin di Kota Yogyakarta.
Apabila probabilitas kondisonal yang terdapat pada Naïve Bayes bernilai 0 maka
metode Naïve Bayes tidak akan berlaku dan prediksi probabilitas akan bernilai nol
serta pada metode Naïve Bayes mengasumsi variabel bebas. Penelitian Vaksin di
Kota Yogyakarta menggunakan Naïve Bayes Classifier pertanda bahwa algoritma
Naïve Bayes efektif dikarenakan ketika dikomparasi dengan algoritma Lexicon Based
tahap akurasi Naïve Bayes lebih baik dari Lexicon Based (Yono Cahyono,2017)

Penelitian ini betujuan untuk mengetahui opini Masyarakat Kota Yogyakarta


tentang pelaksanaan Vaksin 2021. Khususnya Pemerintah Kota Yogyakarta akan
lebih mudah mengetahui opini masyarakat terkait pelaksanaan vaksin, dan dapat
lebih mudah melihat atau memilah pandangan dari Masyarakat apakah lebih banyak
pendapat positif, negatif atau netral. Pemerintah juga bisa mengetahui bagaimana
penerapan metode Naïve Bayes di pelaksannan vaksin di Kota Yogyakarta serta
pemerintah dapat mengetahui analisis sentimen apa saja yang terdapat pada proses
pelaksanaan vaksin di Kota Yogyakarta.

B. Identifikasi Masalah
Berdasarkan dari uraian latar belakang di atas, identifikasi masalah yang didapat
ialah:
1. Pemerintah kesulitan mengetahui opini (positif, negatif dan netral)
masyarakat mengenai pelaksanaan vaksin Yogyakarta.(Tidak ada di latar
belkng masalah)
2. Asumsi sederhana yang diterapkan pada Naive Bayes Menyebabkan kurang
optimalnya hasil estimasi probabilitas, khususnya pada masalah domain teks.
C. Batasan Masalah
Dapat dilihat pada latar belakang di atas, sehingga batasan masalah yang
terdapat pada penelitian ini adalah:
1. Data yang diteliti pada penelitian ini ialah opini dari masyarakat berupa
variabel dan memiliki polaritas positif, negatif, dan netral

2. Menggunakan metode Naïve Bayes Classifier.

3. Media sosial untuk memperoleh data pada penelitian ini yaitu Twitter.

4. Menggunakan cara Crawling (proses mesin pencarian dapat mencari dan


memindai konten atau data yang berada pada situs web).

D. Rumusan Masalah

Dapat dilihat pada latar belakang di atas, rumusan masalah yang diperolah pada
penelitian ini adalah:

1. Bagaimana melakukan analisis sentimen terhadap pelaksanaan Vaksin di


Kota Yogyakarta dengan menggunakan algoritma Naïve Bayes Classifier.
2. Bagaimana menguji keakuratan metode Naïve Bayes dalam pelaksanaan
Vaksin di Kota Yogyakarta.
E. Tujuan penelitian

Tujuan dari penelitian ini adalah:

1. Menggunakan metode Naïve Bayes Classifier dalam menguji hasil sentimen


masyarakat mengenai vaksin di Kota Yogyakarta.
2. Memperoleh dan mengetahui tingkat keakurasian pada pelaksanaan Vaksin
di Kota Yogyakarta dengan menggunakan Confusion Matrix (matriks
klasifikasi).

F. Manfaat Penelitian

Dapat dilihat pada latar belakang, manfaat yang terdapat dalam penelitian ini
adalah:

1. Dengan adanya penelitian ini pemerintah khusus nya di Kota Yogyakarta


dapat mengetahui pendapat dari masyarakat tentang pelaksanaan vaksin
di kota Yogyakarta, serta dapat lebih mudah melihat atau memilah
pandangan dari masyarakat apakah lebih banyak pendapat posistif ,
negatif atau netral, dari masyarakat perihal kinerja pemerintah dalam
pelaksanaan vaksin.
2. Bagi masyarakat dengan adanya penelitian ini dapat dengan mudah
mengetahui lebih banyak masyarakat yang beropini positif, netral atau
negatif perihal pelaksanaan Vaksin di Kota Yogyakarta, serta dapat
menambah wawasan masyarakat perihal pelaksanaan Vaksin khususnya di
Kota Yogyakarta.
BAB II

KAJIAN PUSTAKA

A. Kajian hasil penelitian terdahulu

Dengan melihat pada penelitian dahulu sebagai acuan penelitian ini

dapat dilakukan, penelitian pertama yaitu dilakukan oleh Yono Cahyono (2017)

dengan judul “Analisis Sentimen Pada Sosial Media Twitte Menggunakan Naïve

Bayes Classifie Dengan Feature Selection Particle Swarm Optimization Dan Term

Frequency” tujuan dari penelitian ini untuk mendapatkan sentimen analisis

kedalam kategori positif, negatif dan netral. Metode Naive Bayes Classifier

dengan Feature Selection Particle Swarm Optimization berfungsi untuk

mengurangi atribut yang kurang baik atau relevan pada data set. Dengan

menggunakan kata kunci “Kurikulum 2013” penulis memperoleh 3300 data

Tweet. Pada 100 data menggunakan cara pelabelan manual untuk sentimen

positif, negatif dan netral. Menggunakan 3000 data Tweet data latih dan 1000

Tweet tiap kategori sentimennya. Maka mendapatkan hasil 3000 data latih

pengujian dan 100 Tweet data uji coba mencapai 91 %, sehingga mendapatkan

akurasi 97,48% dengan algoritma Naïve Bayes Classifier dan Feature Selection

Particle Swarm Optimization (PSO) menggunakan parameter Term Frequency

(TF)
Penelitian Kedua oleh Maria Mega Mala Olhang, Sentot Achmadi, dan

F.X Ariwibisono, judul penelitian “analisis sentimen pengguna Twitter terhadap

covid-19 di Indonesia menggunakan metode Naïve Bayes Classifie(NBC)” tujuan

penelitian adalah dilakukan proses menganalisis sentimen masyarakat terhadap

aspirasi yang disampaikan melalui Twitter. Proses pengambilan data

menggunakan hashtags #Coronavirusindonesia dan #covid19. Data diklasifikasi

dengan cara manual memberikan label positif atau negatif dan jumlah data yang

digunakan adalah sebanyak 500 data. Diperoleh hasil akurasi recall 325,

Precission 80%, F-Measure 45% serta rata-rata akurasi 36% dengan Sebanyak 75

Tweet.

Penelitian Ketiga oleh Ni Made Ayu Juli Astari1, Dewa Gede Hendra Divayana2,

dan Gede Indrawan3 dengan judul penelitian “Analisis Sentimen Dokumen

Twitter Mengenai Dampak Virus Corona Menggunakan Metode Naive Bayes

Classifier” Penelitian Ini bertujuan untuk memperoleh analisis dokumen text

untuk mendapatkan sentimen positif atau negatif masyarakat. Dokumen Tweet

dari Twitter mengenai dampak virus Corona merupakan data yang digunakan

dalam penelitian ini . Metode yang digunakan untuk klasifikasi dalam penelitian

ini adalah Metode Naive Bayes Classifier. Memperoleh Hasil penelitian akurasi

sebanyak 67% dan Error rate sebesar 33%. Dengan menggunakan data

Percobaan yang berbeda (100, 200, dan 500) mendapatkan hasil akurasi yaitu

0.02.

Penelitian Keempat oleh Imam Fahrur Rozi, Elok Nur Hamdana, Iqbal Alfahmi,

Muhammad Balya,judul penelitian “Pengembangan Aplikasi Analisis Sentimen

Twitter Menggunakan Metode Naïve Bayes Classifier (Studi Kasus Samsat Kota

Malang)” bertujuan untuk membuat aplikasi analisis sentimen untuk melakukan

fungsi Naïve Bayes Classifier melabelkan kata-kata dan lebih khususnya pada

Tweet dalam bahasa Indonesia. Memperoleh data dengan Web Scrapping dan
topik bahasan sumber teks yang digunakan adalah Sistem Administrasi

Manunggal Satu Atap (SAMSAT) Malang Kota. Hasil penelitian memberikan

unjuk kerja yang baik dalam Analisis sentimen. Mempeoleh akurasi klasifikasi

pada setiap kategori positif, negatif, netral masing-masing sebesar 82%, 92%,

80% dengan jumlah data latih 200 Tweet negatif, 200 Tweet positif, dan 200

Tweet netral.

Penelitian Kelima oleh M. Wino Adi Putra, Susanti, Erlin, dan Herwin,judul

Penelitian Ini Adalah “Analisis Sentimen Dompet Elektronik Pada Twitter

Menggunakan Metode Naïve Bayes Classifier” Penelitian Ini bertujuan untuk

mendapatkan sentimen masyarakat pada hadirnya berbagai aplikasi dompet

elektronik di Indonesia dengan mengklasifikasikannya kedalam tiga kelas yakni

positif, negatif dan netral.

Data diperoleh secara langsung dari situs Microblogging Twitter dengan hashtag

pencarian #GoPay, #OVO dan #DANA, dari data tersebut, diambil 100 data

dengan rincian 70 data latih dan 30 data uji. Mendapatkan hasil positif sebesar

46.67% diikuti oleh dana sebesar 37,50% dan OVO sebesar 16,67%. Dompet

elektronik OVO memiliki nilai negatif yang lebih tinggi yaitu sebesar 63.33%

diikuti oleh GoPay sebesar 53,33% dan Dana sebesar 30,00%.


2.1 Tabel kajian penelitian terdahulu

Tabel 2.1. merupakan perbandingan dari kajian penelitian terdahulu untuk mengetahui persamaan dan perbedaan pada penelitian yang

telah dilakukan sebelumnya, dapat dilihat pada tabel berikut:

Aspek Pustaka 1 Pustaka 2 Pustaka 3 Pustaka 4 Pustaka 5 Hasil



penelitian

Nama Penulis Yono Cahyono Maria Mega Ni Made Ayu Juli Imam Fahrur Rozi, M. Wino Adi Putra, Fitri Andini

(2017) Mala Olhang, Astari1, Dewa Elok Nur Hamdana, Susanti, Erlin, dan

Sentot Achmadi, Gede Hendra Iqbal Alfahmi, dan Herwin

dan F.X Divayana2, Muhammad Balya

Ariwibisono dan Gede

Indrawan3

Nama jurnal “Analisis analisis sentimen “Analisis “Pengembangan “Analisis Sentimen Analisis

Sentimen Pada pengguna Twitter Sentimen Aplikasi Analisis Dompet Elektronik Sentimen

sosial Media terhadap Dokume Sentimen Pada Twitter Menggunaka

covid-19 N Twitter n
Twitter di Indonesia Twitter Menggunakan Menggunakan Metode Naïve

menggunakan menggunakan Mengenai Metode Naïve Bayes Metode Naïve Bayes Bayes

Naïve Bayes metode Naïve Dampak Virus Classifier (Studi Kasus Classifier” Pada Vaksin

Classifie dengan Bayes Corona Samsat Kota Yogyakarta

feature Classifie(NBC) Menggunakan Malang)”, 2021

selection Metode Naïve

particle swarm Bayes

optimization Classifier”

dan term

frequency”

Volume, Vol. 2 No. 1 Vol. 4 No. 2 Vol. 15 Vol 4 No 2 Vol. 5 No. 1 -

Nomor No. 1

Bulan, tahun Maret 2017 September 2019 November 2020 Februari 2018 Januari -

Terbit 2020
Penerbit - - - - -

Masalah Jumlah seleksi Seleksi fitur tidak Metode Hasil yang di Dompet elektronik

Peneitian fitur dengan selalu klasifikasi. dapatkan belum OVO memiliki nilai

Terms lebih meningkatkan Terdapat banyak akurat dan penelitian negatif yang lebih

banyak akurasi pada kata tidak baku selanjutnya di tinggi yaitu sebesar

dijadikan metode Yang tidak sarankan untuk 63.33% diikuti oleh

sebagai wakil klasifikasi. terdeteksi menggunakan metide GoPay sebesar

penting untuk Terdapat banyak sehingga lain agar 53,33% dan Dana

kumpulan kata tidak baku menurunkan memperoleh hasil sebesar 30,00%.

dokumen yang yang tidak nilai evaluasi. yang lebih akurat

akan terdeteksi

dianalisis. sehingga

menurunkan

nilai

evaluasi.
Tujuan Untuk Untuk dilakukan Untuk Untuk membangun Untuk menganalisa Untuk

Penelitian memisahkan proses memperoleh aplikasi analisis tanggapan masyarakat mendapatkan

Tweet menganalisis analisis sentimen yang atas hadirnya hasil opini

berbahasa sentimen dokumen text menerapkan berbagai aplikasi masyarakat

Indonesia pada masyarakat untuk pendekatan Naïve dompet elektronik di apakah banyak

media sosial terhadap aspirasi mendapatkan Bayes Classifier Indonesia dengan yang beropini

Twitter kedalam yang disampaikan sentimen untuk mengklasifikasikannya positif, negatif

kategori positif, melalui Twitter positif atau mengklasifikasikan kedalam tiga kelas atau netral

negatif dan yaitu negatif kata-kata dan yakni positif, negatif mengenai

netral. Metode mengembangkan masyarakat. difokuskan pada dan netral dengan pelaksanaan

Naїve Bayes sistem dengan Data yang Tweet dalam bahasa menggunakan metode vaksin di kota

Classifier (NBC) mengacu pada digunakan Indonesia. Naïve Bayes Yogyakarta.

dengan Feature berbagai sistem merupakan dan menggunakan

Selection yang sudah ada dokumen

Tweet

dari Twitter
Particle Swarm sebelumnya mengenai perangkat lunak

Optimization dengan dampak virus Rapidminer untuk

(PSO) menggunakan Corona. menganalisisa suatu

diterapkan metode Naïve sentimen ataupun

pada dataset Bayes Classifier sejenisnya dengan

untuk untuk melewati suatu

mengurangi mengklasifikasikan proses

atribut yang sentimen. preprocessing

kurang relevan

pada saat

proses

klasifikasi. ).
Metode/Teori Metode Naїve Met ode Naїve Metode Naїve Metode Naїve Bayes Metode Naїve Bayes Metode Naїve
Bayes Classifier Bayes Classifier Bayes Bayes Classifier
(NBC) (NBC) Classifier Classifier (NBC) Classifier (NBC) (NBC)
(NBC)
Objek dan sosial media covid-19 Mengenai Studi Kasus Samsat Dompet Elektronik Vaksin

Variable Twitter Dampak Kota Malang yogyakarta

dengan Virus Corona

feature

selection

particle swarm
Hasil Menghasilkan Hasil pengujian, Klasifikasi Hasil uji Menunjukkan bahwa -

Penelitian sebuah dokumen dengan dievaluasi akurasi analisis sentimen

sistem yang jumlah sebanyak menggunakan klasifikasi pada dompet

dapat 75 Tweet accuracy dan yang elektronik GoPay

mengklasifikasi diperoleh hasil error rate dilakukan lebih banyak dinilai

sentimen secara pengukuran dengan tujuan oleh aplikasi positif oleh pengguna

otomatis akurasi recall 32%, mengetahui menghasilkan Twitter yaitu sebesar

dengan precission 80%, F- keakuratan nilai akurasi 46,67% diikuti oleh

hasil pengujian Measure 45% serta dokumen Dana sebesar 37,50%


tertinggi
3000

data latih dan


100 Tweet data rata-rata akurasi Setelah Pada setiap dan OVO sebesar

ujicoba 36%. diklasifikasi kategori 16,67%. Dompet

mencapai 91 %, menjadi positif, elektronik OVO

Hasil pengujian sentimen positif negatif, memiliki nilai negatif

menunjukan atau negatif. netral yang lebih tinggi

bahwa Hasil penelitian masing- yaitu sebesar 63.33%

algoritma Naïve menunjukkan masing diikuti oleh GoPay

Bayes Classifier metode Naive sebesar 82%, sebesar 53,33% dan

dengan feature Bayes mampu 92%, 80% Dana sebesar 30,00%.

selection mengklasifikasi dengan

Particle Swarm dokumen Tweet jumlah data

Optimization dengan akurasi latih 200

(PSO) 67% dan error Tweet

Menggunakan negatif,
200
parameter Term rate sebesar Tweet positif,

Frequency (TF) 33%. dan 200

dengan akurasi Tweet netral.

97,48%.
2.2 Landasan Teori

1. Data Mining

Data mining merupakan pengumpulan data dalam jumlah besar.

(By Beon Intermedia March 17, 2020)

Beberapa fungsi dari Data mining sebagai berikut:

a) Fungsi untuk memahami secara jauh data yang diteliti disebut fungsi

deskripi dengan tujuan mengetahui fungsi dari data tersebut. Data

tersebut bertujuan untuk mengetahui fungsi dari deskripi.

b) Fungsi prediksi menemukan suatu pola tertentu, pola tersebut dapat

diketahui dari variabel yang terkandung dalam data.

2. Analisis sentimen

Analisis sentimen adalah menganalisis data dan menemukan hasil

emosional dari penulisnya (Brand24). Tidak perlu menggunakan waktu yang

banyak dalam proses sentimen analisis. Berikut merupakan tipe-tipe Analisis

sentimen:

a) Fine-grained sentimen analysis adalah tipe analisis yang memiliki

penilaian spesifik. Tipe ini memungkinkan memiliki range penilaian

yang lebar. Tipe analisis sentimen ini bertujuan untuk mendeteksi

emosi, seperti kebahagiaan, kemarahan, kesedihan, dan frustrasi.

b) Aspect-based sentimen analysis digunakan untuk mengetahui aspek

yang mendapat penilaian positif, netral, atau negatif.

c) Analisis sentimen multilingual dimanfaatkan untuk menganalisis kata-

kata dalam berbagai bahasa. Tipe Analisis yang satu ini terbilang cukup

sulit karena kamu harus memiliki daftar kata dari bermacam bahasa.
Berikut merupakan teknik dasar dari sentimen analisis:

a) Rule-based sentimen analysis menggunakan kamus kata-kata yang

diberi label sentimen tertentu. Skor setiap sentimen diberi aturan

tertentu guna menghindari adanya kalimat sarkasme atau kalimat

lain yang bermakna ganda.

b) Machine learning dengan contoh emosi dalam teks, mesin secara

otomatis mempelajari cara mendeteksi sentimen tanpa perlu kamu

masukkan secara manual.

3. Preprocessing

Preprocessing berfungsi untuk membersihkan data yang telah didapat dari


proses crawling sehingga data tersebut dapat berupa data bersih yang siap
diolah dalam tahap selanjutnya.

Tahapan text preprocessing dalam sebagai salah satu teknik pengolahan data
text sebagai berikut:
a) Case Folding yaitu untuk merubah kalimat yang berhuruf kapital (besar)
menjadi kecil.
b) Tokenizing yaitu untuk menghilangkan tanda baca .
c) Filtering yaitu untuk menghilangkan kata sambung seperti yang,dan,di, dan
lain sebagainya

d) Stemming yaitu untuk mengubah kata yang berimbuhan menjadi kata


dasar seperti memberi menjadi beri, berjalan menjadi jalan.

4. Naïve Bayes Classifier

Naïve Bayes classifier merupakan algoritma yang digunakan untuk

mencari nilai probabiitas tertinggi untuk mengklasifikasikan data uji pada

kategori yang paling tepat (Feldman & Sanger, 2007). Tweet yang ada Pada

Naïve Bayes Classifier di notasikan dalam bentuk pasangan variabel (x1, x2, x3,

….., xn) dimana kata petama merupakan x1, kata kedua meupakan x2, kata

ketiga merupakan x3 sampai seterusnya. Kemudian terdapat himpinan kelas

yang didefinisikans sebagai V. Tahapan klasifikasi pada Naïve Bayes Classifier


dilakukan setelah tahap preprocessing, sehingga data yang digunakan pada

tahapan ini sudah besih. Ada empat proses yang dilakukan pada tahapan

klasifikasi tersebut yaitu (Nugroho dkk, 2016):

a) Pembentukan Variabel Data Latih

Pada pembentukan data latih memilik variabel komentar

(Tweet) yang dipeoleh dari Twitte kemudian akan dilakukan

pengklasifikasian didalam kelas sentimen yaitu positif, negatif, atau

netral, proses ini merupakan proses awal dari pembentukan

variabel data latih, dengan mempehatikan kemunculan frequency

kemunculan setiap kata pada setiap variabel tesebut.

b) Menghitung Nilai Probabilitas Data Latih

Dengan memperhatikan frequency kemunculan setiap kata

dalam variabel kemudian pembentukan data latih, dan proses

selanjutnya dengan menghitung probabilitas setiap kelas dengan

menggunakan persamaan berikut:

P(vj) = (2.1)

jumlah kelas pada vj ditulis : N(vj), dan jumlah semua kelas yang digunakan

dalam data latih ditulis: n(s)

a) Menentukan Probabilitas Setiap Kata

Pada proses ini probabilitas kata pada setiap masing masing kelas dapat di

hitung dengan menggunakan persamaan seperti berikut:

P(vj) = (2.2)

Jumlah kemunculan kata x1 adalah n1 dan jumlah semua kata pada proses

Training adalah fk, persamaan (2.2) dipeoleh dari perhitungan Maximum Extimate

(MLE) dengan mencari parameter pi pada distribusi multinominal berikut ini:


f(x1,x2,………….,xk ; p1,p2,……….,pk;n) = (2.3)

Dengan dan

Fungsi likehood dari distribusi multinominal tersebut adalah

L(p1, p2, ……… pk|x1, x2 ,…, xk) = (2.4)

=( )

Dengan = kemudian log likehood dari fungsi likehood diatas adalah

Log (L(p1,p2,…..,pk|x1,x2,……..,xk)) = log (


= log (

=log

= log

Untuk mencari nilai dari parameter pi, I = 1,2, ……,k yang paling maksimum dari

log likehood diatas, dapat menggunakan persamaan langrange multiplier sebagai

berikut :

L( p1,p2,….,pk) = log(L(p1,p2,….,pk|x1,x2,….,xk)) + (1-

c) Seleksi Fitur Chi Square


Seleksi fitur (Feature Selection) dilakukan untuk mereduksi fitur-

fitur yang tidak relevan dalam proses klasifikasi oleh Naive Bayes. Seleksi

fitur Chi Square menggunakan teori statistika untuk menguji

independensi sebuah term dengan kategorinya. Untuk melakukan

perhitungan nilai Chi Square dapat menggunakan rumus berikut:

𝑋2 (𝐷,𝑡,𝑐) =(𝑁00 + 𝑁11 + 𝑁10 + 𝑁01)𝑥(𝑁00𝑁11 − 𝑁10𝑁01)2

(𝑁11 + 𝑁01)(𝑁11 + 𝑁10)(𝑁10 + 𝑁00)(𝑁01 + 𝑁00)


Atau dapat menggunakan rumus sebagai berikut:

Rumus:

X2 = (2.5)

O: nilai Observasi (pengamatan)

E: nilai Expected (harapan)

Df = (b-1) (k-1) (2.6)

b: jumlah baris

k: jumlah kolom Salah satu tujuan penggunaan seleksi fitur adalah


untuk menghilangkan fitur pengganggu dalam klasifikasi.

Dalam seleksi fitur Chi Square berdasarkan teori statistika, dua peristiwa di

antaranya adalah kemunculan dari fitur dan kemunculan dari kategori, yang

kemudian setiap nilai term di urutkan dari yang tertinggi. Uji Chi Square dalam

statistika diterapkan untuk menguji Independensi dari dua peristiwa.


BAB III

METODE PENELITIAN

A. Objek Penelitian

Pada penelitian ini menggunakan objek penelitian yaitu analisis sentimen


Vaksin Kota Yogyakarta, harus mematuhi protokol kesehatan pada pelaksanaan
Vaksin.

B. Metode Pengumpulan Data

Data yang dibutuhkan dalam penelitian ini adalah berapa banyak penyebaran

data yang ada di Twitter pada saat pelaksanaan Vaksin khususnya di kota Yogyakarta,

metode pengumpulan data pada penilitian ini menggunakan metode crawling,

metode ini dapat mengumpulkan Tweet di Twitter, metode crawling dilakukan

dengan menggunakan Software Python dan menggunakan Api Twitter, dengan

menggunakan kata kunci “Vaksin Yogyakarta” , penarikan data dengan cara

mengambil sampel Tweet dengan rentan waktu pengambilan pada senin 27

September sampai dengan 3 Oktober 2021, penarikan sampel dilakukan untuk

mewakili rangakaian pelaksanaan Vaksin di Kota Yogyakarta 2021.

C. Spesifikasi Kebutuhan

Spesifikasi kebutuhan pada penelitian ini diantaranya:

1. Perangkat Lunak (Software)

Perangkat lunak yang dibutuhkan pada penelitian ini diantaranya:

a. Microsoft Excel 2016

b. Microsoft word 2010

b. Python
c. Google Chrome

d. Jupyter Notebook

2. Perangkat Keras (Hardware)

Perangkat keras yang dibutuhkan pada penelitian ini yaitu laptop dengan spesifikasi

sebagai berikut:

a. Processor : Intel Core i3-6100U, up to 2.6GHz

b. RAM : 4 GB

c. Operating System : Windows 10 64-bit

D. Tahapan Penelitian

Tahapan penelitian dapat dilihat pada gambar 3.1 tahap penelitian berikut :

Gambar 3.1 Tahap penelitian


Dalam metode Naïve Bayes Classifier menggunakan metode analisa data

dengan pengelolahan datanya menggnakan Software Phyton, adapun tahapan

analisis data menggunakan metode Naïve Bayes Classifier dapat dilihat sebagai

berikut:

1. Mempelajari tentang penggunaan metode Naïve Bayes dan mempelajari hal

yang berkaitan tentang sentimen analisis

2. Selanjutnya melakukan pengumpulan data dengan melakukan cara crawling

pada Twitter dengan menggunakan software phyton dengan menggunakan

kata kunci “Vaksin Yogyakarta”

3. Kemudian melakukan preprocessing dengan membersihkan data yang di

peroleh sehingga data menjadi bersih, proses processing yang dimaksud yaitu

case folding ( mengubah kalimat yang berhuruf besar menjadi kecil),

tokenizing (menghilangkan tanda baca seperti tanda “.”,”,”,”?”), filtering

(menghilangkan kata sambung seperti “yang”,”di”,”dan”) dan stemming

(merubah kata yang berimbuhan menjadi kata dasar “memberi” menjadi

“beri”, “menjual” menjadi “jual”).

4. Data yang telah melalui tahap preprocesing (pembersihan) kemudian di bagi

menjadi dua yaitu menjadi data testing dan data training.

5. Setelah itu melakukan klasifikasi data latih yang berguna untuk mengetahui

kategori dari text dengan menggunakan Naïve Bayes.

6. Setelah data di klasifikasi kemudian dimasukan ke pengklasifikasian data uji

7. Terakhir data yang telah melalui tahap pemasukan di pengklasifikasian data

uji kemudian data tersebut akan dihitung keakurasian tingkatnya dengan

menggunakan matriks klasifikasi.


DAFTAR PUSTAKA

Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis
Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan
Metode Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29.
https://doi.org/10.30864/jsi.v15i1.332

Mala Olhang, M. M., Achmadi, S., & Wibisono, F. . A. (2020). Analisis Sentimen
Pengguna Twitter Terhadap Covid-19 Di Indonesia Menggunakan Metode Naive
Bayes Classifier (NBC). JATI (Jurnal Mahasiswa Teknik Informatika), 4(2), 214–
221. https://doi.org/10.36040/jati.v4i2.2695

Cahyono, Y. (2017). Analisis Sentimen pada Sosial Media Twitter Menggunakan Naїve
Bayes Classifier dengan Feature Selection Particle Swarm Optimization dan Term
Frequency. Jurnal Informatika Universitas Pamulang,
2(1), 14.
https://doi.org/10.32493/informatika.v2i1.1500

Dwiraswati, O., Siregar, K. N., Pengawas, B., & Indonesia, U. (2019). Penggunaan
Antibiotik Di Indonesia Dengan Naive Bayes Classifier Sentimen Analysis on
Twitter About The Use of Antibiotics in Indonesia With Naive Bayes Classifier.
15(1), 1–9.

Imam Fahrur Rozi, Elok Nur Hamdana, Iqbal Alfahmi, dan Muhammad Balya.
Pengembangan Aplikasi Analisis Sentimen Twitter Menggunakan Metode Naïve
Bayes Classifier (Studi Kasus Samsat Kota Malang).

Rasyadi, M. H. (2017). Analisis Sentimen Pada Twitter Menggunakan Metode Naïve


Bayes (Studi Kasus Pemilihan Gubernur Dki Jakarta 2017). 1–17.

M. Wino Adi Putra, Susanti, Erlin, dan Herwin. Analisis Sentimen Dompet Elektronik
Pada Twitter Menggunakan Metode Naïve Bayes Classifier.

Pratama, D. Y., Informatika, P. S., Komunikasi, F., Informatika, D. A. N., & Surakarta, U.
M. (2020). IMPLEMENTASI ANALISIS SENTIMEN MENGGUNAKAN NAÏVE BAYES.

Mala Olhang, M. M., Achmadi, S., & Wibisono, F. . A. (2020). Analisis Sentimen
Pengguna Twitter Terhadap Covid-19 Di Indonesia Menggunakan Metode Naive
Bayes Classifier (NBC). JATI (Jurnal Mahasiswa Teknik Informatika), 4(2), 214–
221. https://doi.org/10.36040/jati.v4i2.2695

Astari, N. M. A. J., Dewa Gede Hendra Divayana, & Gede Indrawan. (2020). Analisis
Sentimen Dokumen Twitter Mengenai Dampak Virus Corona Menggunakan Metode
Naive Bayes Classifier. Jurnal Sistem Dan Informatika (JSI), 15(1), 27–29.
https://doi.org/10.30864/jsi.v15i1.332

Anda mungkin juga menyukai