Abstrak
Bangsa yang maju adalah bangsa yang memiliki sistem transportasi yang
berkualitas. Sistem transportasi yang berkualitas diperlukan untuk menunjang
berkembangnya sektor lain guna mendorong perkembangan daerah tertinggal
(Adisasmita, 2011). Pengguna internet mendorong perkembangan digital yang
berpengaruh terhadap semua bidang kehidupan sehari-hari tak terkecuali pada
bidang jasa dan transportasi di Indonesia Saat ini. Agen Travel adalah jasa yang
menyediakan berbagai pelayanan kepada para konsumen yang berhubungan dengan
tiket dan jasa pelayanan perjalanan. perkembangan zaman mengubah proses bisnis
mereka dari cara konvensional menuju digital yang dimana layanan informasi jual
beli dan pembayaran terjadi melalui online. Di Indonesia saat ini banyak aplikasi
online travel agent yang berkembang salah satunya adalah tiket.com dan
pegipegi.com yang menyediakan jasa tiketing secara online untuk memudahkan
proses transaksi. Analisis Sentimen biasa di sebut juga dengan opinion mining yaitu
sebuah proses yang dimana bertujuan untuk menemukan pendapat pengguna
tentang topik yang disampaikan pengguna apakah pendapat tersebut positif , netral
atau negatif. Pada penelitian untuk melihat sentimen pengguna terkait aplikasi
tiket.com dan pegipegi.com menggunakan metode naïve bayes dan didapatkan hasil
komentar Positif ,Negative dan Netral dari aplikasi tiket.com adalah 571, 79, dan
19. Pada aplikasi pegipegi.com terdapat polaritas Positif ,Negatif dan Netral adalah
542 ,135, 46.
Kata kunci: Tiket.com,Pegipegi.com, Analisis Sentimen, Klasifikasi, Naive
Bayes, Bahasa R.
1. Pendahuluan
Naiknya angka pengguna internet mendorong perkembangan digital yang
berpengaruh terhadap semua bidang kehidupan sehari-hari tak terkecuali pada
bidang transportasi di Indonesia. Pengguna internet mendorong perkembangan
digital yang berpengaruh terhadap semua bidang kehidupan sehari-hari tak
terkecuali pada bidang jasa dan transportasi di Indonesia Saat ini sektor
transportasi di Indonesia telah mulai memanfaatkan internet guna menunjang
sistem transportasi yang lebih berkualitas. Bangsa yang maju adalah bangsa
yang memiliki sistem transportasi yang berkualitas. Sistem transportasi yang
berkualitas diperlukan untuk menunjang berkembangnya sektor lain guna
mendorong perkembangan daerah tertinggal (Adisasmita, 2011).
Agen Travel adalah jasa yang menyediakan berbagai pelayanan kepada para
konsumen termasuk pembelian tiket pesawat, booking, dan reservasi hotel atau
resort, membuat jadwal rencana perjalanan wisata juga memberikan informasi
akurat terkait produk jasa yang akan di beli oleh konsumen yang sekarang
sudah berkembang mengikuti perkembangan zaman mengubah proses bisnis
mereka dari cara konvensional menuju digital yang dimana layanan informasi
jual beli dan pembayaran terjadi melalui online Di Indonesia saat ini sudah
banyak aplikasi online travel agent yang berkembang salah satunya adalah
tiket.com dan pegipegi.com yang menyediakan jasa tiketing secara online
untuk memudahkan masyarakat.
Analisis Sentimen biasa di sebut juga dengan opinion mining yaitu sebuah
proses yang dimana bertujuan untuk menemukan pendapat pengguna tentang
topik yang disampaikan pengguna apakah pendapat tersebut positif atau
negatif, sehingga nantinya data yang didapat dari review pengguna dapat
memberikan informasi kepada kita yang mana topik tersebut dikategorikan
baik atau buruk.
Berdasarkan latar belakang diatas, maka penelitian yang dilakukan ini
nantinya untuk mencari sentimen pengguna menggunakan metode naïve bayes
untuk mengetahui bagaimana melihat kepuasan pengguna layanan online
travel agent dari tiket.com dan pegipegi.com dalam memberikan layanan
terhadap pengguna aplikasi
2. Tinjauan Pustaka
2.1.Analisis Sentimen
Analisis sentimen merupakan salah satu cabang ilmu dari text
mining, natural language program, dan artificial intelegence. Proses yang
dilakukan oleh analisis sentimen untuk memahami, mengekstrak, dan
mengolah data teks secara otomatis sehingga menjadi suatu informasi yang
bermanfaat. Selain itu analisis sentimen merupakan bidang ilmu yang
menganalisis pendapat, sikap, evaluasi, dan penilaian terhadap suatu
peristiwa, topik, organisasi, maupun perseorangan (Luqyana, Cholissodin,
& Perdana, 2018).
2.2.Web Scraping
Web Scraping (Turland, 2010) adalah proses pengambilan sebuah
dokumen semi-terstruktur dari internet, umumnya berupa halaman-
halaman web dalam bahasa markup seperti HTML atau XHTML, dan
menganalisis dokumen tersebut untuk digunakan bagi kepentingan lain.
Menurut Josi (2014), web scraping memiliki sejumlah langkah yaitu
sebagai berikut :
a. Create Scraping Template : Pembuat program mempelajari dokumen
HTML dari website yang akan diambil informasinya untuk tag HTML
yang mengapit informasi yang diinginkan.
b. Explore Site Navigation : Pembuat program mempelajari teknik
navigasi pada website yang akan diambil informasinya untuk
ditirukan pada aplikasi web scraper yang akan dibuat.
c. Automate Navigation and Extraction : Berdasarkan informasi yang
didapat pada langkah 1 dan 2 di atas, aplikasi web scraper dibuat untuk
mengotomatisasi pengambilan informasi dari website yang
ditentukan.
d. Extracted Data and Package History : Informasi yang didapat dari
langkah 3 disimpan dalam tabel atau tabel-tabel database
2.3.Google Play Store
Google Play adalah layanan konten digital milik Google yang
melingkupi toko Online untuk produk-produk seperti musik/lagu, buku,
aplikasi, permainan, ataupun pemutar media berbasis Cloud
2.4.Data Miner
Data Miner adalah ekstensi Google Chrome yang membantu untuk
mengekstrak data dari halaman web dan menjadi file CSV atau spreadsheet
Excel
2.5.Naïve Bayes Classifier
Naïve Bayes Classifier merupakan sebuah metoda klasifikasi yang
berakar pada teorema Bayes. Metode pengklasifikasian dengan
menggunakan metode probabilitas dan statistik yang dikemukakan oleh
ilmuwan Inggris Thomas Bayes , yaitu memprediksi peluang di masa depan
berdasarkan pengalaman di masa sebelumnya sehingga dikenal sebagai
Teorema Bayes . Ciri utama dari Naïve Bayes Classifier ini adalah asumsi
yang sangat kuat (naïf) akan independensi dari masing- masing kondisi /
kejadian.
Naïve Bayes Classifier bekerja sangat baik dibanding dengan model
classifier lainnya. Hal ini dibuktikan oleh Xhemali , Hinde Stone dalam
jurnalnya “Naïve Bayes vs. Decision Trees vs. Neural Networks in the
Classification of Training Web Pages” mengatakan bahwa “Naïve Bayes
Classifier memiliki tingkat akurasi yang lebih baik dibandingmodel
classifier lainnya”. Berikut rumus yang digunakan :
Gambar 2.2.1 Rumus Naïve Bayes
Keterangan :
X : Data dengan class yang belum diketahui
y : Hipotesis data X merupakan suatu class spesifik
P(y|X): Probabilitas Hipotesis berdasarkan kondisi
X (posteriori probability)
P(y) : Probabilitas Hipotesis (posteriori probability) P(X|y): probabilitas
X berdasar kondisi pada hipotesis y
2.6.Program R
R (juga dikenal sebagai GNU S) adalah bahasa pemrograman dan
perangkat lunak untuk analisis statistika dan grafik. R dibuat oleh Ross
Ihaka dan Robert Gentleman di Universitas Auckland, Selandia Baru, dan
kini dikembangkan oleh R Development Core Team, di mana Chambers
merupakan anggotanya. R dinamakan sebagian setelah nama dua
pembuatnya (Robert Gentleman dan Ross Ihaka), dan sebagian sebagian
dari permainan nama dari S.
R adalah suatu sistem untuk analisis data yang termasuk kelompok
software statistik open source yang tidak memerlukan lisensi atau gratis,
yang dikenal dengan freeware.
2.7.R Studio
R studio adalah sebuah perangkat lunak yang biasa digunakan untuk
analisis statistic baik itu kualitatif ataupun kuantitatif. R studio pada
pengoperasiannya berbasis script dengan formula atau kode tertentu yang
dapat menghasilkan hasil analisis dalam bentuk teks, tabel juga gambar
(berbagaimacam diagram, peta, dsb).
Kelebihan lain dari R studio adalah merupakan perangkat lunak
yang gratis (open source) sehingga hasil analisis baik teks, tabel ataupun
gambar dapat digunakan pada publikasi ilmiah. Selain itu R studio ini
sudah compatible dengan data yang pengambilannya atau entri datanya
menggunakan ENKETO smart paper atau ODK (Open Data Kit).
3. Metode Penelitian
Untuk menghasilkan system yang dimaksud terdapat 4 proses besar yang
harus dilakukan dalam penelitian ini. Tahapan yang dilakukan dalam penelitian
dapat dilihat pada gambar
4.2.Pre-Processing Data
a. Casefolding
Mudah "mudah"
Kecewa dgn pelayanan ini. Uda mau " kecewa dgn pelayanan ini. uda
2bln refund hotel saya. Belum juga di mau 2bln refund hotel saya. belum
refund juga di refund"
Mantap “mantap”
sangat membantu “sangat membantu”
b. Cleansing
Cleansing berfungsi untuk menghilangkan seluruh tanda
baca. Berikut merupakan syntax cleansing :
Hasil Cleansing :
Tabel 4.5 Hasil Tahapan Cleansing Tiket.com
Data Case Folding Tiket Data Cleansing Tiket
" sekedar saran ,,tambahin fitur " sekedar saran tambahin fitur
po.bus+tiket pelni di aplikasi...full pobustiket pelni di aplikasifull
komplit darat,laut ,udara komplit daratlaut udara
...pengembangan tiket online di pengembangan tiket online di
indonesia.." indonesia"
kecewa dgn pelayanan ini. uda mau 2bln kecewa dgn pelayanan ini uda mau
refund hotel saya. belum juga di refund bln refund hotel saya belum juga di
refund
c. Stemming
Stemming adalah tahapan untuk membuat kata berimbuhan
menjadi kata dasar, Pada tahap ini menggunakan library katadasaR
yang dibuat oleh Nurandi. Berikut tabel yang menunjukkan kata
yang diolah menggunakan library katadasaR:
Berikut syntax untuk melakukan Stemming :
Hasil Stemming :
Tabel 4.7 Hasil Stemming Tiket.com
kecewa dgn pelayanan ini uda mau bln refund "kecewa" "dgn" "ayan" "ini"
e. WordCloud
Word cloud (atau disebut juga tag cloud) adalah representasi
visual dari data teks, biasanya digunakan untuk
menggambarkan metadata keywords (tags) pada sebuah website,
untuk memvisualisasikan suatu bentuk teks secara bebas. Berikut
syntax dari wordcloud :
Hasil WordCloud :
Berikutadalah representasi visual dari data teks tiket.com
dan Pegipegi.com
Gambar 4.3 Hasil WordCloud Tike
4.4.Sentimen Analysis
Berikut syntax untuk melakukan sentiment analysis :
Pada grafik data Tiket.com, hasil sentiment analisis memiliki data unknown
sebanyak 538 data. unknown merupakan data yang tidak terbaca dan tidak
dapat diklasifikasikan pada emotion karena tidak termasuk dalam daftar
library kategori emosi. Joy 96 ,Sadness 16, Surprise 14, anger 4 dan fear
1.
5. 6.
4.5.Polarity Analysis
Berikut syntax untuk melakukan polarity analysis:
plotSentiments2 <- function(sentiment_dataframe, title)
{
ggplot(sentiment_dataframe, aes(x= factor(polarity)),
fill=factor(polarity))
+geom_bar(aes(y=..count.., fill=polarity))
+geom_text(aes(label=..count..),stat =
"count",position = position_dodge(0.9),
vjust=-0.2)+scale_fill_brewer(palette="RdGy")
+ ggtitle(title) +
theme(legend.position="right") + ylab("Number
of Tweets") + xlab("Polarity Categories")
}
plotSentiments2(SentimenDataFrame, "Polarity Analysis
") head(SentimenDataFrame, 100)
5. Penutup
a. Kesimpulan
DAFTAR PUSTAKA
Josi, A. L.A. Abdillah, Suryayusra, (2014), Penerapan Teknik Web Scraping Pada
Mesin Pencari Artikel Ilmiah.
Liu, B. (2012). Sentiment Analysis and Opinion Mining Morgan & Claypool
Publishers. Language Arts & Disciplines, (May), 167.
Muljono, dkk (2018) “Analisa Sentimen Untuk Penilaian Pelayanan Situs Belanja
Online Menggunakan Algoritma Naive Bayes “Fakultas Ilmu Komputer,
Universitas Dian Nuswantoro
Didik Garbian Nugroho dkk (2017) “Analisis Sentimen Pada Jasa Ojek Online
Menggunakan Metode Naive Bayes “Jurusan Informatika, Fakultas
Matematika dan Ilmu Pengetahuan Alam Universitas Jenderal Achmad
Yani,2017
Sunardi 1), Abdul Fadlil 2), Suprianto 2,3) “Analisis Sentimen Menggunakan
Metode Naive Bayes Classifier Pada Angket Mahasiswa ”1) Program Studi
Teknik Elektro, Universitas Ahmad Dahlan 2) Magister Teknik
Informatika, Universitas Ahmad Dahlan 3) Program Studi Sistem
Informasi, STMIK PPKIA Tarakanita Rahmawati,2018
Nur Shafiya Nabilah Salam1, Ahmad Afif Supianto2, Andi Reza Perdanakusuma3
“Analisis Sentimen Opini Mahasiswa Terhadap Saran Kuesioner Penilaian
Kinerja Dosen dengan Menggunakan TF-IDF dan K-Nearest Neighbor”
Program Studi Sistem Informasi,Fakultas Ilmu Komputer, Universitas
Brawijaya, 2019