Disusun oleh:
Tan Anugrah Ramadhani
18330119
FAKULTAS TEKNIK
UNIVERSITAS JANABADRA
Yogyakarta
2020
Jemmy Edwin Bororing1, Tan Anugrah Ramadhani2
Abstrak
Bangsa yang maju adalah bangsa yang memiliki sistem transportasi yang
berkualitas. Sistem transportasi yang berkualitas diperlukan untuk menunjang
berkembangnya sektor lain guna mendorong perkembangan daerah tertinggal
(Adisasmita, 2011). Pengguna internet mendorong perkembangan digital yang
berpengaruh terhadap semua bidang kehidupan sehari-hari tak terkecuali pada
bidang jasa dan transportasi di Indonesia Saat ini. Agen Travel adalah jasa yang
menyediakan berbagai pelayanan kepada para konsumen yang berhubungan
dengan tiket dan jasa pelayanan perjalanan. perkembangan zaman mengubah
proses bisnis mereka dari cara konvensional menuju digital yang dimana layanan
informasi jual beli dan pembayaran terjadi melalui online. Di Indonesia saat ini
banyak aplikasi online travel agent yang berkembang salah satunya adalah
tiket.com dan pegipegi.com yang menyediakan jasa tiketing secara online untuk
memudahkan proses transaksi. Analisis Sentimen biasa di sebut juga dengan
opinion mining yaitu sebuah proses yang dimana bertujuan untuk menemukan
pendapat pengguna tentang topik yang disampaikan pengguna apakah pendapat
tersebut positif , netral atau negatif.
1.
1. Pendahuluan
2.2.6 Program R
R (juga dikenal sebagai GNU S) adalah bahasa pemrograman
dan perangkat lunak untuk analisis statistika dan grafik. R dibuat
oleh Ross Ihaka dan Robert Gentleman di Universitas Auckland,
Selandia Baru, dan kini dikembangkan oleh R Development Core
Team, di mana Chambers merupakan anggotanya. R dinamakan
sebagian setelah nama dua pembuatnya (Robert Gentleman dan Ross
Ihaka), dan sebagian sebagian dari permainan nama dari S.
2.2.7 R Studio
1 Case Folding
Dalam penulisan komentar, pasti terdapat perbedaan bentuk
huruf, tahapan ini merupakan proses merubah bentuk huruf
menjadi huruf kecil (lower case) atau dapat disebut juga
penyeragaman bentuk huruf.
2 Cleansing
Cleansing adalah tahap dimana karakter selain huruf (abjad a-z)
dihilangkan dan dianggap delimite
3 Stemming
Stemming adalah tahapan untuk membuat kata berimbuhan
menjadi kata dasar sesuai dengan aturan Bahasa Indonesia yang
benar
4 Filtering
Filtering adalah tahap mengambil kata-kata penting dari hasil
token. Bisa menggunakan algoritma stoplist (membuang kata
yang kurang penting) atau wordlist (menyimpan kata penting).
Stoplist/stopword adalah kata-kata yang tidak deskriptif yang
dapat dibuang. Contoh stopwords adalah “yang”, “dan”, “di”,
“dari”, “dengan” dan seterusnya (Triawati, 2009).
Pada Gambar 4.1 data yang telah di scraping dari web google Play
store akan masuk pada data collection pada akun milik kita. Data yang
telah kita scraping menggunakan aplikasi data miner dapat di download
dengan eksistensi CSV ataupun XLS.
pada data collection pada akun data miner yang siap untuk diunduh.
1 Casefolding
Casefolding yaitu dengan memproses data dan mengubah seluruh data
mentah menjadi huruf-huruf kecil.
#case folding
inspect(docs[1:11])
inspect(docs[23])
Hasil Casefolding :
2 Cleansing
#cleansing
docs <- Corpus(VectorSource(temp))
#1. menghilangkan url
inspect(docs[1:11])
docs <-
read.csv("~/Desktop/Tiket/casefoldingtiket_ind.csv")
inspect(docs[23])
inspect(docs[1:11])
3 Stemming
#(Stemming)
docs <-
read.csv("~/Desktop/Tiket/cleansingTiket_ind.csv")
4 Stopword/Stoplist removal
id_stopwords<-read.csv("~/Desktop/Tiket/sword.csv",
header = FALSE, sep = ";")
id_stopwords=data.frame(text=unlist(sapply(id_stopw
ords, '[')), stringsAsFactors = F )
6 WordCloud
Word cloud (atau disebut juga tag cloud) adalah representasi visual
dari data teks, biasanya digunakan untuk menggambarkan metadata
Hasil WordCloud :
Berikut adalah representasi visual dari data teks tiket.com dan
Pegipegi.com
8. Menghapus data yang tidak perlu pada data yang telah diterjemahkan
menggunakan stopword. Berikut syntax untuk menghapus kata yang
tidak perlu kemudian menghilangkan spasi di awal dan akhir kalimat
library(tm)
stopwords("en")
stopwords("smart")
docs <- read.csv("~/Desktop/Tiket/dump0_en.csv")
docs<-Corpus(VectorSource(dump0_en$text))
id_stopwords<-
read.csv("~/Desktop/Tiket/stopwords_en.csv", header
= FALSE, sep = ";")
id_stopwords=data.frame(text=unlist(sapply(id_stopwo
rds, '[')), stringsAsFactors = F )
#menghapus kata yang terdaftar pada stopword list
inggris
#docs <- iconv(tiket_eng$text,"utf-8-mac", "AScii",
sub = "")
docs <- tm_map(docs,removeWords,c(id_stopwords$V1))
inspect(docs[1:1000])
Berikut hasil dari tampilan dari polarity analysis yang didapatkan dari
data tiket.com yaitu data yang bernilai positif berjumlah 3830 data
netral 128 data dan negatif 510 data
Josi, A. L.A. Abdillah, Suryayusra, (2014), Penerapan Teknik Web Scraping Pada Mesin
Pencari Artikel Ilmiah.
Liu, B. (2012). Sentiment Analysis and Opinion Mining Morgan & Claypool Publishers.
Language Arts & Disciplines, (May), 167.
Muljono, dkk (2018) “Analisa Sentimen Untuk Penilaian Pelayanan Situs Belanja Online
Menggunakan Algoritma Naive Bayes “Fakultas Ilmu Komputer, Universitas Dian
Nuswantoro
Didik Garbian Nugroho dkk (2017) “Analisis Sentimen Pada Jasa Ojek Online
Menggunakan Metode Naive Bayes “Jurusan Informatika, Fakultas Matematika dan
Ilmu Pengetahuan Alam Universitas Jenderal Achmad Y ani,2017
Sunardi 1), Abdul Fadlil 2), Suprianto 2,3) “Analisis Sentimen Menggunakan Metode
Naive Bayes Classifier Pada Angket Mahasiswa ”1) Program Studi Teknik Elektro,
Universitas Ahmad Dahlan 2) Magister Teknik Informatika, Universitas Ahmad
Dahlan 3) Program Studi Sistem Informasi, STMIK PPKIA Tarakanita
Rahmawati,2018
Nur Shafiya Nabilah Salam1, Ahmad Afif Supianto2, Andi Reza Perdanakusuma3
“Analisis Sentimen Opini Mahasiswa Terhadap Saran Kuesioner Penilaian Kinerja
Dosen dengan Menggunakan TF-IDF dan K-Nearest Neighbor” Program Studi
Sistem Informasi,Fakultas Ilmu Komputer, Universitas Brawijaya, 2019