JUDUL PROGRAM
Analisis sentimen pendapat positif/negatif kuliah dengan sistem daring dengan
Metode Naive Bayes
Disusun Oleh:
Fajar Bhaskoro Catur Saputra 41518010041 Angkatan 2018
An Nisaa’ Muzdalifah 41518010141 Angkatan 2018
Muhammad Yudha Pratama
ABSTRAK
Pandemi yang sedang melanda dunia ini membuat segala sektor kehidupan manusia
menjadi rusak, termasuk di bidang pendidikan. Berbagai upaya dilakukan untuk
mencegah penyebaran virus Covid-19 ini, mulai dari mencuci tangan setelah melakukan
interaksi, menggunakan masker, melakukan Social Distancing (Menjaga jarak), serta
penyemprotan desinfektan untuk membunuh virus-virus yang terdapat di berbagai
tempat terutama tempat umum, dan juga ada hal lain yang sangat ditunggu oleh
masyarakat dunia yaitu vaksin dari virus tersebut. Banyak dari masyarakat
menyampaikan opini serta pendapatnya menggunakan sosial media, seperti contohnya
Twitter, Facebook, Instagram, dan lain-lain. Opini dan pendapat yang mereka
sampaikan dapat kami gunakan dan manfaatkan sebagai bahan penelitian untuk
menganalisis sentimen untuk mengetahui penilaian dalam kuliah daring, apakah positif
atau negatif. Hasil sentimen ini dapat kami manfaatkan dalam penilaian dan dapat
dijadikan bahan untuk evaluasi khusus nya dalam penanganan kuliah daring seperti ini.
Data opini di Twitter didapatkan melalui Twitter API yang diambil dengan
menggunakan salah satu bahasa pemrograman yaitu Python.
ABSTRACT
The pandemic that is currently sweeping the world has damaged all sectors of human
life, including in the field of education. Various efforts have been made to prevent the
spread of the Covid-19 virus, starting from washing hands after interacting, using
masks, doing Social Distancing, and spraying disinfectants to kill viruses found in
various places, especially public places, and also there is another thing that is eagerly
awaited by the world community, namely a vaccine from the virus. Many of the public
express their opinions and opinions using social media, such as for example Twitter,
Facebook, Instagram, and others. The opinions and opinions they convey can be used
and utilized as research material to analyze sentiment to determine assessments in
online lectures, whether positive or negative. We can use the results of this sentiment in
the assessment and can be used as material for its special evaluation in handling online
lectures like this. Opinion data on Twitter is obtained via the Twitter API which is taken
using a programming language, namely Python.
PENDAHULUAN
1. Latar belakang
Pandemi COVID-19 telah mengubah tatanan hidup manusia, terutama dalam
beraktivitas. Banyak kegiatan yang kini dilakukan secara online, salah satunya adalah
kegiatan belajar mengajar. Pengurangan bahkan peniadaan kegiatan belajar mengajar di
kampus menjadi keputusan yang tepat untuk mencegah transmisi COVID-19. Kegiatan
perkuliahan daring dilaksanakan dengan beberapa aplikasi yang menyediakan layanan
tatap muka berupa audio dan video, seperti Zoom, Skype, Google Meet, Microsoft Teams,
dan WhatsApp Group. Kegiatan ini dilakukan dengan tetap memperhatikan keefektifan dan
ketercapaian mutu pembelajaran yang telah direncanakan. Melalui pembelajaran daring
mahasiswa dapat belajar seperti biasa dan tidak akan ketinggalan materi perkuliahan, serta
waktu yang lebih flexibel.
Namun pembelajaran daring ini tidak sepenuhnya disambut baik oleh para
mahasiswa, karena ada sebagian mahasiswa yang menganggap pembelajaran daring ini
lebih menyulitkan dibandingkan dengan pembelajaran biasa, belum lagi kuota internet
harus tersedia dan ini adalah kesulitan terbesar yang dialami mahasiswa, kendala pada
jaringan, ketersediaan perangkat pembelajaran seperti laptop, tingkat pemahaman materi
yang dirasa lebih baik jika melakukan kuliah tatap muka, dan juga tidak semua dosen dan
mahasiswa siap mengoperasikan sistem pembelajaran daring dengan cepat, termasuk juga
mempersiapkan bahan perkuliahan secara digital.
Untuk mencegah penyebaran Covid-19, WHO memberikan himbauan untuk
menghentikan acara-acara yang dapat menyebabkan massa berkerumun. Maka dari itu,
pembelajaran tatap muka yang mengumpulkan banyak mahasiswa di dalam kelas ditinjau
ulang pelaksanaanya.
TUJUAN
Tujuan dari penelitian ini untuk mengetahui seberapa banyak pendapat positif /
negatif dari mahasiswa dalam perkuliahan dengan menggunakan sistem daring sehingga
hasil dari sentimen ini dapat dijadikan bahan informasi dan evaluasi.
METODE
Dalam penelitian ini, metode yang kami gunakan adalah menggunakan metode
Classification dengan algoritma yang sering digunakan dalam memprediksi peluang di
masa depan yaitu Naive Bayes Classifier. Di penelitian yang kami lakukan, kami
menggunakan perangkat lunak yang bernama RapidMiner untuk melakukan uji coba dalam
penelitian menggunakan algoritma Naive Bayes.
A. Analisis Sentimen (Sentiment Analysis)
Analisis sentimen atau bisa disebut juga opinion mining merupakan proses
memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan
informasi sentimen yang terkandung dalam suatu kalimat opini terhadap sebuah masalah
atau objek oleh seseorang, apakah cenderung beropini negatif atau positif.
B. Twitter
Twitter adalah sebuah situs jejaring sosial yang sedang berkembang pesat saat ini
karena pengguna dapat berinteraksi dengan pengguna lainnya dari komputer ataupun
perangkat mobile mereka dari manapun dan kapanpun. Setelah diluncurkan pada Juli 2006,
jumlah pengguna Twitter meningkat sangat pesat. Pada September 2010, diperkirakan
jumlah pengguna Twitter yang terdaftar sekitar 160 juta pengguna (Chiang, 2011).
C. Naive Bayes
Pengklasifikasi bayes merupakan salah satu pengklasifikasi statistik, dimana
pengklasifikasi ini dapat memprediksi probabilitas keanggotaan kelas suatu data tuple yang
akan masuk ke dalam kelas tertentu, sesuai dengan perhitungan probabilitas.
Pengklasifikasi Bayes didasari oleh teorema bayes yang ditemukan oleh Thomas Bayes
pada abad ke-18. Dalam studi perbandingan algoritma klasifikasi telah ditemukan simple
bayesian atau yang biasa dikenal dengan Naïve Bayes classifier. Naïve Bayes classifier
menunjukkan akurasi dan kecepatan yang tinggi bila diterapkan pada database yang besar.
Metode ini sering digunakan dalam menyelesaikan masalah dalam bidang mesin
pembelajaran karena metode ini dikenal memiliki tingkat akurasi yang tinggi dengan
perhitungan sederhana.
D. Dataset
Dataset yang digunakan dalam penelitian ini merupakan tweet berbahasa Indonesia
mengenai perkuliahan daring yang berasal dari Twitter. Dataset pada dasarnya merupakan
opini atau ungkapan masyarakat mengenai suatu hal melalui media sosial, pada kasus ini
yaitu perkuliahan daring. Dalam penelitian ini, kami berfokus mengumpulkan data
berdasarkan hashtag atau tagar yang dipakai pengguna tersebut.
E. Preprocessing Data
Data yang didapat dari hasil crawling dari Twitter belum bisa langsung
diklasifikasikan karena data tersebut masih terdapat informasi-informasi yang tidak
diperlukan, seperti lokasi, nama akun, jumlah pengikut dan lain sebagainya. Selain itu,
didapati juga tweet yang berasal dari luar Indonesia. Oleh karena itu kita memerlukan salah
satu teknik preprocessing data yang disebut Data Cleaning agar data lebih terstruktur dan
bersih sehingga bisa diklasifikasikan. Langkah pertama yang kami lakukan yaitu
menghapus tweet – tweet yang tidak berhubungan dengan topik yang kami bawa. Setelah
itu, kami juga menghapus tweet – tweet yang berasal dari luar Indonesia. Dalam kasus ini
kami hanya memakai 3 variabel, yaitu id, tweet dari masyarakat dan juga sentimen mereka
yang kami labeli secara manual.
F. Pelabelan Data
Proses pelabelan data dilakukan secara manual. Kami melakukan pelabelan dengan
menentukan secara pribadi kalimat tersebut merupakan kalimat bermakna positif atau
negatif. Label positif dilihat dari isi tweet mengandung kalimat bermakna positif,
mendukung dan pernyataan setuju. Label negatif merupakan kelas dengan data yang
mengandung kalimat bermakna negatif, ejekan, dan kontra. Label ini akan kami gunakan
dalam model machine learning nantinya.
H. Desain Model
Pada penelitian ini, kami menggunakan RapidMiner sebagai alat penelitian.
Dibawah ini adalah proses bagaimana kami menambang informasi dari data yang kami
gunakan.
HASIL DAN PEMBAHASAN
Proses penelitian yang kami lakukan dalam pengujian dari data yang diperoleh
ialah preprocessing, di dalam preprocessing dilakukanlah pembersihan dari tweet dan
menyiapkan tweet untuk proses selanjutnya. Sebanyak 614 data tweet hasil pencarian
dilabeli secara manual untuk diklasifikasi dengan menggunakan Naive Bayes. Hasil dari
pengujian tersebut ditunjukkan pada gambar. Dari hasil akurasi yang kami dapat yaitu
sebesar 63,11%. Dengan akurasi tersebut dapat kami simpulkan bahwa Naive Bayes cukup
bagus untuk menangani kasus dalam memprediksi sebuah sentimen. Setelah proses training
dilakukan, Naive Bayes dapat digunakan dengan baik untuk mencari tahu secara otomatis
sentimen itu dapat diklasifikasi sebagai sentimen yang bersifat positif atau sentimen yang
bersifat negatif.
Dari gambar visualization Confidence Positif dan Confidence Negatif yang lebih
cenderung ke negatif. Kami mendapat lebih banyak sentimen negatif daripada sentimen
positif di media sosial Twitter.
KESIMPULAN
Berdasarkan hasil analisis yang dilakukan terkait sentimen analisis mahasiswa tentang
positif / negatif tentang sistem perkuliahan daring yang akan dilakukan dengan
menggunakan metode Naïve Bayes untuk menentukan kelas prediksi, didapatkan akurasi
sebesar 63,11% dengan hasil sentimen positif sebesar 33,3% dan sentimen negatif sebesar
74,16%. Hasil ini menunjukkan tingkat sentimen negatif lebih besar dibandingkan dengan
tingkat sentimen positif. Pengujian menggunakan Rapid Miner ini menunjukkan bahwa
algoritma Naive Bayes memiliki akurasi yang baik untuk mengklasifikasi tweet. Dari hasil
penelitian ini juga bisa dilihat bahwa perkuliahan daring dapat membuat perkuliahan
menjadi tidak efektif
DAFTAR PUSTAKA
[1] Pratama, S., Andrean, R. and Nugroho, A., 2019. Analisis Sentimen Twitter Debat
Calon Presiden Indonesia Menggunakan Metode Fined-Grained Sentiment Analysis.
JOINTECS (Journal of Information Technology and Computer Science), 4(2), p.39.
[2] Putranti, N. and Winarko, E., 2014. Analisis Sentimen Twitter untuk Teks
Berbahasa Indonesia dengan Maximum Entropy dan Support Vector Machine. IJCCS
(Indonesian Journal of Computing and Cybernetics Systems), 8(1), p.91.
[3] Pintoko, B. and Muslim L., K., 2020. Analisis Sentimen Jasa Transportasi Online
pada Twitter Menggunakan Metode Naïve Bayes Classifier. e- Proceeding of
Engineering, 5(3), p.8121.
[4] Fauziyyah, A., 2020. Analisis Sentimen Pandemi Covid19 Pada Streaming Twitter
Dengan Text Mining Python. Jurnal Ilmiah SINUS, 18(2), p.31.
LAMPIRAN
A. Identitas Diri
A. Identitas Diri
4 NIM 41518010141
Anggota
( An Nisaa’ Muzdalifah )
3. Biodata Anggota Pelaksana
A. Identitas Diri
6 Alamat E-mail
Semua data yang saya isikan dan tercantum dalam biodata ini adalah benar
dan dapat dipertanggung jawabkan secara hukum. Apabila di kemudian
hari ternyata dijumpai ketidaksesuaian dengan kenyataan, saya sanggup
menerima sanksi.
Demikian biodata ini saya buat dengan sebenarnya untuk memenuhi
salah satu persyaratan dalam pengajuan PKM-AI.
Jakarta, 10 Desember 2020
Anggota
A. Identitas Diri
3. Algoritma Lanjut
4. Advanced Algorithm
5. Computer Security
B. Riwayat Pendidikan
S-1 S-2
Nama Perguruan Universitas Mercu Wuhan University
Tinggi Buana of Technology
Bidang Ilmu Ilmu Komputer Computer Science
Tahun Masuk-Lulus 2012 - 2016 2016 - 2018
Aplikasi
Judul Skripsi/Thesis/Disertasi Multi-Label
Identifikasi Ciri
Learning
Kayu Jati dengan
Template
Menggunakan
Protection
metode GLCM
Nama Pembimbing/Promotor Desi Ramayanti,
Dr. Zhou Jung Wei
S.Kom., MT
Semua data yang saya isikan dan tercantum dalam biodata ini adalah
benar dan dapat dipertanggungjawabkan secara hukum. Apabila di
kemudian hari ternyata dijumpai ketidaksesuaian dengan kenyataan,
saya sanggup menerima sanksi.
Dosen Pendamping
Alokasi
Program Uraian
No Nama / NIM Bidang Waktu
Studi Tugas
(jam/minggu)
Fajar Bhaskoro Catur Ketua
Teknik Ilmu 21
1 Saputra Pelaksana
/ 41518010041 Informatika Komputer jam/minggu
+ Peneliti 1
An Nisaa’ Muzdalifah /
Peneliti 2
41518010141 Teknik Ilmu 21
2 + Penyusun
Informatika Komputer jam/minggu
Proposal 1
Muhammad Yudha Peneliti 3
Ekonomi Akuntansi 21
3 Pratama + Penyusun
dan Bisnis jam/minggu Proposal 2
Lampiran 4. Surat Pernyataan Ketua Pelaksana
Yang diusulkan untuk tahun anggaran 2021 asli karya kami dan belum
pernah dibiayai oleh lembaga atau sumber lain. Bilamana dikemudian hari
ditemukan ketidaksesuaian dengan pernyataan ini, maka saya bersedia
dituntut dan diproses sesuai dengan ketentuan yang berlaku dan
mengembalikan seluruh biaya penelitian yang sudah diterima ke kas negara.
Demikian pernyataan ini dibuat dengan sesungguhnya dan dengan sebenar-
benarnya.
Jakarta, 10 Desember 2020
Yang menyatakan,
Dosen Pendamping, Materai 6000
Tanda tangan
Mengetahui,
Wakil Dekan II Bidang Inovasi dan
Kemahasiswaan Fakultas Ilmu
Komputer,