Anda di halaman 1dari 10

Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

PENERAPAN NATURAL LANGUAGE PROCESSING UNTUK ANALISIS


SENTIMEN TERHADAP APLIKASI STREAMING
Paskariawan br Sihotang1, Fanny Dameka br Sitanggang2, Nadila Azriansyah3, Evta
Indra4*
Program Studi Sistem Informasi Universitas Prima Indonesia
Jl. Sampul No.4, Sei Putih Bar., Kec. Medan Petisah, Kota Medan, Sumatera Utara
Sur-el : evtaindra@unprimdn.ac.id

Abstrak: Aplikasi video streaming seperti Viu, Viki, dan WeTV sangat populer karena
memberikan akses yang mudah dan nyaman bagi pengguna untuk menonton konten multimedia
mereka. Menurut data dari Google Play Store per akhir tahun 2022, Viu, Viki, dan WeTv
adalah layanan streaming teratas. VIU telah menerima lebih dari 100 juta unduhan dan 993.000
ulasan, Viki telah menerima lebih dari 50 juta unduhan dan 899.000 ulasan, dan WeTV telah
menerima lebih dari 50 juta unduhan dan 545.000 ulasan meskipun dinilai terbaik dan menerima
peringkat 5. Sangat penting untuk terus menilai seberapa baik layanan disampaikan kepada
pengguna karena peringkat dan jumlah ulasan tidak selalu berarti bahwa tuntutan atau masalah
pengguna telah terpenuhi. diperlukan sistem untuk memproses semua input pengguna, termasuk
peringkat dan komentar. Untuk memastikan pengalaman yang baik bagi pengguna, penting bagi
pengembang aplikasi untuk memahami perasaan dan harapan pengguna. karena itu, dilakukan
penelitian untuk Analisis Sentimen terhadap Aplikasi Streaming Video menggunakan
Pendekatan Support Vector Machine (SVM). Data diambil melalui proses scraping yang
didasarkan pada informasi dari Google Play Store , pada aplikasi Viu, Viki, dan WeTv dengan
jumlah 2400 data. Berdasarkan data yang ditemukan ulasan terbanyak terdapat pada ulasan tidak
konsisten sebesar 89.5% dengan jumlah 2399 data. kemudian, pada ulasan dengan menggunakan
diagram pie chart berdasarkan jam, data tersebut menggambarkan jumlah ulasan pada setiap jam
terlihat bahwa jam 14.00 memiliki jumlah ulasan terbanyak dengan 7.4%. Pada penelitian ini
diperoleh hasil berupa akurasi untuk pengujian model Regresi Logistik adalah 0,90 untuk data
pelatihan dan 0,89 untuk data pengujian, selanjutnya pada pengujian model Decision
Treedidapatkan hasil akurasi sempurna pada data latih sebesar 1.0, dan pada data uji sebesar
1.0.dan Hasil untuk pengujian akurasi menggunakan model SVM adalah 0,968 untuk data
pelatihan dan 0,910 untuk data pengujian.

Kata Kunci: Penerapan Neuro Linguistic Program, Analisis Sentimen, Aplikasi Streaming.

Abstract: Video streaming applications such as Viu, Viki, and WeTV have gained immense
popularity due to their easy and convenient access to multimedia content for users. According to
data from the Google Play Store as of the end of 2022, Viu, Viki, and WeTV are among the top
streaming services. Viu has received over 100 million downloads and 993,000 reviews, Viki has
received over 50 million downloads and 899,000 reviews, and WeTV has received over 50
million downloads and 545,000 reviews, even though they are rated highly and have a 5-star
rating. It is crucial to continually assess the quality of service delivered to users because ratings

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


273
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

and review counts do not always indicate whether user demands or issues have been met.
Therefore, a system is needed to process all user inputs, including ratings and comments. To
ensure a good user experience, it is important for application developers to understand user
sentiments and expectations. Hence, research is conducted for Sentiment Analysis on Video
Streaming Applications using the Support Vector Machine (SVM) approach. Data is collected
through a scraping process based on information from the Google Play Store for the Viu, Viki,
and WeTV applications, with a total of 2400 data points. Based on the data found, the majority of
reviews are inconsistent, accounting for 89.5% with 2399 data points. Furthermore, using a pie
chart based on the time of day, the data illustrates the distribution of reviews throughout each
hour. It is observed that 14:00 has the highest number of reviews with 7.4%. This research
yielded results in terms of accuracy for the Logistic Regression model, which achieved 0.90 for
the training data and 0.89 for the testing data. Similarly, the Decision Tree model achieved
perfect accuracy with a score of 1.0 for both the training and testing data. Lastly, the SVM model
achieved an accuracy of 0.968 for the training data and 0.910 for the testing data

Keywords :Neuro linguistic programming, Sentiment Analysis, Applications streaming

1. PENDAHULUAN merupakan perhatian utama karena aplikasi


Analisis sentimen adalah proses yang seringkali meminta akses informasi pribadi
menggunakan Natural Language Processing pengguna. Masalah lain termasuk
(NLP) untuk secara otomatis menambang keterbatasan konten yang tersedia di masing-
sikap, pendapat, pandangan, dan emosi dari masing aplikasi dan biaya yang dibutuhkan
teks, audio, kicauan, dan sumber data [1]. untuk menonton konten tertentu, pengguna
Mencari tahu apa yang dipikirkan populasi sering merasa kesulitan untuk menemukan
umum tentang sesuatu juga disebut dengan konten yang mereka cari dan
analisis sentimen [2]. Sentimen terhadap membandingkan harga antar aplikasi. Sangat
aplikasi streaming video merupakan kegiatan penting untuk terus menilai seberapa baik
untuk memahami perasaan dan sudut layanan disampaikan kepada pengguna
pandang pengguna terhadap layanan dan karena peringkat dan jumlah ulasan tidak
produk yang dipakai. Aplikasi video selalu berarti bahwa tuntutan atau masalah
streaming seperti Viu , Viki, dan WeTV pengguna telah terpenuhi [3]. Menurut
sangat populer karena memberikan akses penjelasan yang diberikan, sistem diperlukan
yang mudah dan nyaman bagi pengguna untuk memproses semua input pengguna,
untuk menonton konten multimedia mereka. termasuk peringkat dan komentar [4]. Untuk
Menurut data dari GooglePlay Store per memastikan pengalaman yang baik bagi
akhir tahun 2022, Viu, Viki, dan WeTv pengguna, penting bagi pengembang aplikasi
adalah layanan streaming teratas. VIU telah untuk memahami perasaan dan harapan
menerima lebih dari 100 juta unduhan dan pengguna. Beberapa penelitian tentang
993.000 ulasan, Viki telah menerima lebih analisis sentimen dalam ulasan aplikasi
dari 50 juta unduhan dan 899.000 ulasan, meliputi, antara lain: Perbandingan sentimen
dan WeTV telah menerima lebih dari 50 juta Corona Virus Disease (Covid19) 2019 di
unduhan dan 545.000 ulasan meskipun Twitter Saat mengkategorikan suasana hati
dinilai terbaik dan menerima peringkat 5. di Twitter seputar Penyakit Virus Corona
Namun, ada beberapa masalah yang dapat 2019 (Covid-19) Dalam situasi tweet yang
muncul saat menggunakan aplikasi ini. membandingkan nilai akurasi metode
Masalah utama termasuk kualitas gambar Support Vector Machine (SVM) dan
yang kurang baik, buffering yang berulang, Logistic Regression [5], nilai akurasi teknik
dan gangguan koneksi. Ini dapat Support Vector Machine (SVM) adalah
mempengaruhi pengalaman penonton dan 91,15% lebih tinggi. Selain itu, penelitian
mengurangi tingkat kepuasan mereka. Selain dilakukan dengan judul Analisis Sentimen
itu, masalah privasi dan keamanan juga Zoom Cloud Meetings di Play Store

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


274
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

Menggunakan Naïve Bayes dan Support WeTV di website Google Play Store.
Vector Machine [6], angka akurasi yang Perumusan masalah dalam penelitian ini
diperoleh dengan menggunakan pendekatan didasarkan pada deskripsi yang telah
Support Vector Machine adalah 81,22%. ditemukan, dan itu adalah Bagaimana NLP
Teknik Support Vector Machine dapat digunakan untuk menganalisis ulasan
menghasilkan nilai akurasi sebesar 85,54%, pengguna dan komentar untuk sentimen.
menurut studi berjudul Analisis Sentimen Tujuan dari penelitian ini;dataset yang
pada Aplikasi Grab di GooglePlay Store diambil berupa hasil ulasan dari platform
Menggunakan Support Vector Machine [7]. aplikasi streaming VIU,VIKI, dan WeTV
Pendekatan Support Vector Machine dan dan Metode yang digunakan berupa
merupakan salah satu pilihan metodologi Support Vector Machine. Batasan masalah
yang akan dimanfaatkan peneliti dalam pada penelitian ini Batasan masalah pada
analisis sentimen, menurut banyak referensi penelitian ini adalah;dataset yang diambil
studi yang telah diselesaikan [8]. Untuk berupa hasil ulasan dari platform aplikasi
menentukan apakah dokumen tertulis streaming VIU,VIKI, dan WeTV dan metode
mengandung sikap positif, negatif, dan yang digunakan berupa Support Vector
netral, analisis sentimen menggunakan NLP Machine.
[9]. Penting untuk mengklasifikasikan
balasan dalam analisis sentimen untuk 2. METODE PENELITIAN
menentukan mana yang positif, negatif, dan Pada penelitian ini diawali dengan studi
netral [10]. Hal tersebut membantu literatur, data acquistion, data cleaning dan
pengembang aplikasi untuk memahami menggunakan metode Support Vector
masalah yang dialami oleh pengguna. Machine (SVM).
Diharapkan analisis sentimen terhadap
aplikasi streaming video memberikan
manfaat yang signifikan bagi pengembang
aplikasi dan pengguna. Akibatnya, metode
SVM digunakan dalam proses klasifikasi
penelitian ini. Informasi ulasan yang
digunakan mungkin konstruktif dalam
bentuk rekomendasi atau destruktif dalam
bentuk kritik terhadap layanan streaming.
Analisis emosi digunakan untuk menentukan
apakah suatu pendapat atau emosi memiliki
kecenderungan untuk menjadi positif atau Gambar 1. Metode Penelitian
negatif [11]. Analisis sentimen dapat
digunakan dalam situasi ini untuk 2.1 Studi Literatur
memeriksa ulasan aplikasi yang tersedia di Kegiatan penelitian yang dikenal sebagai
GooglePlay Store . Berdasarkan hal tersebut, "studi literatur" memanfaatkan metode
penelitian ini mencoba menggunakan pengumpulan informasi dan data serta
informasi ulasan dari Google Play Store berbagai sumber daya tambahan yang
untuk mengatasi masalah yang sekarang ditemukan di perpustakaan, seperti
dialami platform streaming online. ensiklopedi, laporan dari studi serupa, artikel
Metodologi dan jenis sumber data yang jurnal, catatan, dan bahan lain yang
digunakan dalam penelitian ini berbeda dari berkaitan dengan masalah yang dihadapi
penelitian sebelumnya. Pendekatan Support [12]. Jurnal penelitian dari penelitian
Vector Machine (SVM) dengan linear sebelumnya, tesis, dan buku tentang
digunakan dalam penelitian penulis, dan penelitian semuanya dapat digunakan untuk
jenis sumber data yang digunakan adalah menemukan literatur [13].
data review aplikasi bernama Viu, Viki, dan

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


275
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

untuk analisis data dan pengenalan pola [18].


2.2 Data Acquisition Jika dibandingkan dengan algoritma lain,
Tahap awal dalam pelabelan data melibatkan SVM adalah metode yang sangat dicari
akuisisi data [14]. Suatu sistem yang karena tingkat presisi / akurasi dan
bertindak untuk memperoleh, kualitasnya yang tinggi [19]. Python juga
mengumpulkan, dan menyiapkan data digunakan untuk melakukan analisis
sebelum mengolahnya untuk menghasilkan sentimen menggunakan teknik Support
data yang dibutuhkan dapat disebut sebagai Vector Machine, dan hasilnya meliputi
sistem akuisisi data [15]. Pada penelitian ini laporan klasifikasi, kapasitas untuk
dataset yang digunakan berdasarkan data memulihkan data (recall), hasil presisi
google play store di akhir tahun 2022 (presisi), dan hasil akurasi (akurasi) [20].
aplikasi Viu, Viki, dan WeTv data ini
memiliki 4 kolom dan 1200 baris pengguna, 3. HASIL DAN PEMBAHASAN
jika ditotal dari ke-2 aplikasi data ini
3.1 Data Acquisition
memiliki 2.400 baris atau data. Yang dimana
data ini berisikan review atau ulasan Dalam penelitian ini pengumpulan data dari
pengguna aplikasi Viu, Viki, dan WeTV. aplikasi streaming Wetv, Viu dan Viki yang
Gambar di bawah ini menunjukkan data dikumpulkan menggunakan web scraping,
secara rinci. terdapat 2.400 rows × 12 columns. Hasil dari
pengumpulan data tersebut dapat dilihat pada
gambar 3.1

Gambar 2. Dataset
Gambar 3. Hasil Pengumpulan Data
2.3 Data Cleaning
Himpunan data ini menjalani pembersihan
3.2 Pre-processing
data untuk membuatnya siap untuk analisis.
Prosedur ini diperlukan untuk memperbaiki
Pembersihan data dilakukan dengan
kesalahan dalam data mentah, yang
menggunakan teknik Natural Language
seringkali tidak lengkap dan memiliki format
Processing (NLP). Natural Language
yang salah. Preprocessing banyak
Processing (NLP) adalah subbidang
digunakan untuk membersihkan, menyusun,
kecerdasan buatan yang berfokus pada
dan menyiapkan data untuk memenuhi
pemrosesan bahasa alami dan dapat
persyaratan analisis atau pemodelan yang
digunakan untuk mengatasi masalah dengan
akan dilakukan. Beberapa langkah dalam
sistem komputer yang mampu mengenali
preprocessing data meliputi:
bahasa lisan umum [16]. Sebelum data
diproses oleh model, selama fase
3.2.1 Data manipulation
pembersihan atau penghapusan data, upaya
Dalam kode program ini, menggunakan
dilakukan untuk membersihkan data agar
metode rename() pada objek dataframe
menghasilkan hasil output terbaik [17].
untuk mengubah nama kolom. Setelah
mengganti nama kolom, menggunakan
2.4 Support Vector Machine
df.head() untuk menampilkan beberapa baris
Support Vector Machine (SVM) adalah nama
pertama dari dataframe yang sudah
metode pembelajaran mesin yang digunakan

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


276
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

dimodifikasi. Outputnya akan menunjukkan 3.2.4 Feature Engineering


beberapa baris pertama dari data frame Kode yang diberikan untuk melakukan
dengan nama kolom yang sudah diganti feature engineering dengan memisahkan
menjadi bahasa Indonesia. tanggal dan jam dari kolom 'Waktu_Ulasan'
dalam data frame. menggunakan metode
pd.to_datetime() untuk mengubah nilai
kolom menjadi tipe data datetime, dan
kemudian menggunakan metode .dt.time dan
.dt.date untuk mengambil bagian jam dan
Gambar 4. Proses Data Manipulation
tanggal. Dengan menjalankan code tersebut,
3.2.2 Duplicate Removal akan mendapatkan dataframe dengan kolom
Metode yang digunakan untuk menghapus baru 'jam' dan 'tanggal' yang memisahkan
data duplikat dari dataframe yaitu metode bagian jam dan tanggal dari kolom
drop_duplicates(). Setelah itu, menggunakan 'Waktu_Ulasan'.
metode info() untuk menampilkan informasi
tentang dataframe.

Gambar 6. Proses Feature Engineering

3.2.5 Normalisasi Teks


Beberapa teknik yang umum digunakan
dalam normalisasi teks antara lain,
A. Case folding
bagian dari kode program yang berguna
untuk mengubah huruf kapital menjadi huruf
kecil pada kolom 'content' di suatu dataframe
Gambar 4. Proses Duplicate Removal yang disimpan dalam variabel df. Selain itu,
kode program ini juga menghilangkan
3.2.3 Reduksi Dimensi (Dimensionality karakter yang dianggap tidak penting, seperti
Reduction): tanda baca dan emoji. Terakhir, kode
Mengurangi jumlah variabel atau fitur yang program ini juga menghapus spasi kosong
digunakan dalam analisis atau pemodelan, yang berlebihan pada teks.
tetapi masih mempertahankan informasi
penting dalam data. Dalam kode ini, peneliti
mengurangi jumlah variabel atau fitur yang
digunakan dalam analisis atau pemodelan
dengan menghapus beberapa kolom yang
tidak berpengaruh pada analisis sentimen
dari dataframe. Kolom-kolom 'Id Ulasan',
'Versi_Ulasan','Balasan_Ulasan','Waktu_Bal
asan', dan 'Foto_Pengguna' akan dihapus
menggunakan metode drop(). Dengan
menjalankan kode ini, kolom-kolom yang
tidak penting akan dihapus dari dataframe df.
Gambar 7. Proses Case Folding

B. Stemming
Gambar 5. Proses Reduksi Dimensi bagian dari normalisasi teks yang berfungsi
untuk menyederhanakan kata-kata yang

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


277
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

tidak baku agar dapat diproses menggunakan ulasan berdasarkan jam, yang menunjukkan
algoritma xgboost. Hal ini terlihat dalam persentase ulasan yang diterima pada setiap
Gambar 3.7 jam dalam sehari.

Analisis sentimen terhadap ulasan Dapat


dilakukan dengan menggunakan metode atau
algoritma analisis sentimen yang telah
diimplementasikan sebelumnya, Kode yang
diberikan merupakan implementasi analisis
pada kolom "Ulasan" dalam DataFrame.
Setiap ulasan akan diklasifikasikan ke dalam
tiga kategori sentimen: positif (nilai 2),
negatif (nilai 0), atau tidak konsisten(nilai 1).
Gambar 8. Proses Stemming seperti pada tabel berikut:

C. Tokenizing Tabel 1. Hasil Sentimen Terhadap Ulasan


Untuk mempermudah pengolahan teks 1.(Tidak Konsisten) 2143
dengan menghilangkan tanda baca, angka, 2.(Positif) 156
dan simbol yang tidak penting. Pada kode 3.(Negatif) 95
program ini, teks dalam kolom 'content'
dipisah menggunakan tanda koma sebagai Pencarian 10 kalimat dengan jumlah like
pembatas. Potongan-potongan teks terbanyak di setiap sentimen Setelah
kemudian disimpan dalam list bernama 'nstr', mendapatkan hasil analisis sentimen, maka
dan elemen-elemen kosong dalam list langkah selanjutnya mencari 10 kalimat
tersebut dihapus menggunakan perulangan. berdasarkan jumlah like terbanyak di setiap
Hasil tokenisasi kemudian disimpan kembali sentimen, seperti dibawah ini
ke dalam kolom 'content' pada dataframe df.
seperti yang digambarkan pada Gambar 3.8.

Gambar 9. Hasil Tokenizing


Gambar 10. Hasil 10 Kalimat Dengan Jumlah
Like Terbanyak Disetiap Sentimen
3.2.6 Analisis Sentimen
Dalam analisis ini, terdapat tiga analisis Analisis persentase ulasan berdasarkan jam
sentimen yang dilakukan. Pertama, analisis Analisis persentase ulasan berdasarkan jam
sentimen berdasarkan ulasan sentimen yang menunjukkan pola penggunaan Aplikasi
mencakup ulasan positif, ulasan negatif, dan Viu, Viki, dan WeTv pada berbagai waktu.
ulasan yang tidak konsisten. Kedua, Berdasarkan data yang dianalisis, terdapat
dilakukan pencarian 10 kalimat dengan variasi dalam jumlah ulasan pada jam-jam
jumlah like terbanyak disetiap sentimen, tertentu sebagai berikut:
yaitu 10 kalimat dengan jumlah like
terbanyak pada ulasan positif dan ulasan
negatif. Ketiga, dilakukan analisis persentase

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


278
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

ini juga mencakup visualisasi ulasan


berdasarkan jam menggunakan diagram pie
chart. Dengan menggunakan diagram pie
chart berdasarkan jam, data tersebut
menggambarkan jumlah ulasan pada setiap
jam. Terlihat bahwa jam 14.00 memiliki
jumlah ulasan terbanyak dengan 7.4%
ulasan, diikuti oleh jam 13.00 dengan 7.1%
ulasan. Jam-jam tersebut menunjukkan
Gambar 11. Hasil Persentase Ulasan tingkat aktivitas pengguna yang tinggi dalam
Berdasarkan Jam memberikan ulasan pada aplikasi tersebut.
Visualisasi
Dalam penelitian ini, melakukan dua tahap
visualisasi untuk menganalisis ulasan
pengguna. Tahap pertama, menggunakan bar
plot untuk menampilkan jumlah ulasan
pengguna berdasarkan sentimen. Hasil
visualisasi ini memberikan gambaran yang
jelas tentang distribusi ulasan pengguna
dalam kategori sentimen positif, negatif, dan Gambar 13. Hasil Visualisasi Pie Chart
tidak konsisten, Selain itu, melalui visualisasi
ini dapat melihat hasil terkait dengan kalimat
10 ternegatif berdasarkan jumlah dislike 3.3 TF IDF Vectorizer
terhadap sentimen Metode frekuensi istilah (TF) menentukan
seberapa sering sebuah kata muncul dalam
dokumen. Inverse Document Frequency
(IDF) mengukur signifikansi kata di dalam
korpus atau kumpulan dokumen. IDF
digunakan untuk meningkatkan bobot kata-
kata yang jarang muncul dan mengurangi
bobot istilah yang biasa ditemukan dalam
korpus.
3.3.1 Splitting Data
Proses memisahkan data menjadi dua
atau lebih bagian untuk digunakan dalam
tahap yang berbeda dalam analisis data.
Biasanya, Data pelatihan dan data pengujian
adalah dua kategori data. Data pengujian
digunakan untuk menilai kinerja model
setelah dilatih menggunakan data pelatihan.
Gambar 12. Visualisasi Bar Plot Tujuan dari splitting data untuk menghindari
overfitting dan underfitting pada model, serta
Tahap kedua melibatkan penggunaan pie untuk mengevaluasi seberapa baik model
chart untuk memperlihatkan proporsi ulasan dapat digeneralisasi pada data yang belum
pengguna berdasarkan sentimen. Pie chart pernah dilihat sebelumnya. Setelah proses
memberikan gambaran visual yang jelas splitting data dilakukan, didapatkan hasil
mengenai persentase ulasan pengguna yang sebagai berikut: Jumlah data pada training
tergolong dalam kategori sentimen positif, set : 1915 Jumlah data pada testing set : 479
negatif, dan tidak konsisten. Selain itu, tahap

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


279
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

Tabel 2. Hasil Spliting data data uji. Selanjutnya, model dievaluasi


Training set 1915 menggunakan confusion matrix untuk
melihat seberapa baik model
mengklasifikasikan sentimen positif, negatif,
Testing set 479 dan tidak konsisten. Selain itu, peneliti juga
menghitung Kappa Score sebagai matrix
Total 2394 evaluasi tambahan. Kappa Score yang
diperoleh adalah 1.0.

3.3.2 Pengolahan Machine Learning


Dengan menyajikan data dengan algoritma
pembelajaran, sekelompok teknik yang
dikenal sebagai Machine Learning dapat
membantu dalam menangani dan membuat
prediksi tentang jumlah data yang sangat
besar. penelitian ini melakukan pengolahan Gambar 15. Hasil Decision Tree
menggunakan tiga model machine learning,
yaitu Logistic Regression, Decision Tree, C Support Vector Machine (SVM)
dan Support Vector Machine (SVM). Dalam penelitian ini, peneliti menggunakan
model Support Vector Machine (SVM)
A Logistic Regression dengan kernel linear untuk klasifikasi.
Penelitian ini menggunakan model Logistic Model ini memiliki akurasi 0.968 pada data
Regression dengan fitur TF-IDF untuk latih dan 0.910 pada data uji. Confusion
mengklasifikasikan sentimen pada data matrix digunakan untuk melihat seberapa
ulasan. Model ini memberikan akurasi 0.90 baik model mengklasifikasikan sentimen
pada data latih dan 0.88 pada data uji. Dalam positif, negatif, dan tidak konsisten. Peneliti
evaluasi model juga menggunakan confusion juga menyajikan classification report yang
matrix untuk melihat seberapa baik model mencakup precision, recall, dan f1-score
dapat mengklasifikasikan sentimen positif, untuk setiap kelas sentimen.
negatif, dan tidak konsisten.
Tabel 3. Hasil Pengujian Support Vector
Machine (SVM)
Kelas Precision Recall F1- Support
Score
Negatif(0) 1.00 0.40 0.57 30
Tidak 0.92 1.00 0.96 429
konsisten(1)
Positif(2) 1.00 0.10 0.18 20

4. KESIMPULAN DAN SARAN


4.1 Kesimpulan
Gambar 14. Hasil Logistic Regression Berdasarkan hasil penelitian analisis
sentimen data review pengguna dari
B Decision Tree
Aplikasi Viu, Viki, dan WeTv. Ada banyak
Dalam penelitian ini, peneliti menggunakan
kesimpulan yang bisa diambil. Data diambil
model Decision Tree untuk analisis
melalui proses scraping yang didasarkan
sentimen. Model ini memiliki akurasi
pada informasi dari Google Play Store, pada
sempurna yaitu 1.0 pada data latih maupun

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


280
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

aplikasi Viu, Viki, dan WeTv dengan jumlah kredibel dalam memahami sentiment
2400 data. Berdasarkan data yang terhadap aplikasi streaming.
ditemukan ulasan terbanyak terdapat pada
ulasan tidak konsisten sebesar 89.5% dengan DAFTAR PUSTAKA
jumlah 2399 data. Pada ulasan dengan [1] D. S. Utami and A. Erfina, “Analisis
menggunakan diagram pie chart berdasarkan Sentimen Pinjaman Online di Twitter
jam, data tersebut menggambarkan jumlah Menggunakan Algoritma Support Vector
ulasan pada setiap jam. Terlihat bahwa Machine (SVM),” SISMATIK (Seminar
Nas. Sist. Inf. dan Manaj. Inform., vol. 1,
jam 14.00 memiliki jumlah ulasan terbanyak
no. 1, pp. 299–305, 2021.
dengan 7.4%. [2] A. Andreyestha and A. Subekti, “Analisa
Temuan akurasi untuk pengujian Sentiment Pada Ulasan Film Dengan
model Regresi Logistik adalah 0,90 untuk Optimasi Ensemble Learning,” J.
data pelatihan dan 0,89 untuk data Inform., vol. 7, no. 1, pp. 15–23, 2020,
pengujian. Pada pengujian model Decision doi: 10.31311/ji.v7i1.6171.
Tree didapatkan hasil akurasi [3] M. R. Nadhif, D. Wisnu Brata, and B.
sempurna pada data latih sebesar 1.0, dan Rahayudi, “Analisis Sentimen Data
pada data uji sebesar 1.0. Hasil untuk Ulasan Pengguna Aplikasi TIX ID di
pengujian akurasi menggunakan model SVM Indonesia pada Google Play Store
adalah 0,968 untuk data pelatihan dan 0,910 menggunakan Support Vector Machine,”
vol. 6, no. 8, pp. 3932–3937, 2022,
untuk data pengujian. Hal ini menunjukan
[Online]. Available: http://j-ptiik.ub.ac.id
bahwa banyaknya pengguna memberikan
[4] M. T. Anjasmoros, I. Istiadi, and F.
ulasan terdapat pada jam 14.00 Dari Marisa, “Analisis Sentimen Aplikasi Go-
pengujian dengan model DecisionTtree dan Jek Menggunakan Metode SVM Dan
SVM didapatkan hasil akurasi lebih baik NBC (Studi Kasus: Komentar Pada Play
menggunakan model decision tree dengan Store),” Conf. Innov. Appl. Sci. Technol.
akurasi data train sebesar 0.1 yang (CIASTECH 2020), no. Ciastech, pp.
menunjukan bahwa model tersebut dapat 489–498, 2020.
memprediksi dengan sempurna. [5] K. Kelvin, J. Banjarnahor, E. I. -, and M.
NK Nababan, “Analisis perbandingan
4.2 Saran sentimen Corona Virus Disease-2019
(Covid19) pada Twitter Menggunakan
Beberapa ide yang dapat dipertimbangkan
Metode Logistic Regression Dan
untuk penyelidikan tambahan meliputi:
Support Vector Machine (SVM),” J. Sist.
1 Pada ulasan yang tidak konsisten, Inf. dan Ilmu Komput. Prima(JUSIKOM
melakukan analisis yang mendalam PRIMA), vol. 5, no. 2, pp. 47–52, 2022,
dengan mengidentifikasi adanya doi:
sentimen yang tidak konsisten dalam 10.34012/jurnalsisteminformasidanilmuk
data ulasan pengguna, perlu dilakukan omputer.v5i2.2365.
analisis lebih lanjut untuk memahami [6] N. Herlinawati, Y. Yuliani, S. Faizah,
penyebabnya. W. Gata, and S. Samudi, “Analisis
2 Pada sentiment rentang waktu tidak Sentimen Zoom Cloud Meetings di Play
ditemukan pola waktu mana yang lebih Store Menggunakan Naïve Bayes dan
Support Vector Machine,” CESS
baik untuk melihat ulasan, maka
(Journal Comput. Eng. Syst. Sci., vol. 5,
penelitian lebih lanjut perlu no. 2, p. 293, 2020, doi:
mengidentifikasi pola waktu, di waktu 10.24114/cess.v5i2.18186.
mana yang banyak berdampak positif, [7] R. Wahyudi and G. Kusumawardana,
negative, dan tidak konsisten pada “Analisis Sentimen pada Aplikasi Grab
setiap data ulasan. di Google Play Store Menggunakan
3 Diperlukannya data lebih luas terhadap Support Vector Machine,” J. Inform.,
cakupan pengguna dan variatibilitas vol. 8, no. 2, pp. 200–207, 2021, doi:
akan memberikan temuan yang lebih 10.31294/ji.v8i2.9681.

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


281
Paskariawan br Sihotang, Fanny Dameka br Sitanggang, Nadila Azriansyah, Evta Indra

[8] W. A. Luqyana, I. Cholissodin, and R. S. no. 1, p. 43, 2022, doi:


Perdana, “Analisis Sentimen 10.37600/tekinkom.v5i1.517.
Cyberbullying pada Komentar Instagram [16] E. H. Muktafin, K. Kusrini, and E. T.
dengan Metode Klasifikasi Support Luthfi, “Analisis Sentimen pada Ulasan
Vector Machine,” vol. 2, no. 11, pp. Pembelian Produk di Marketplace
4704–4713, 2018. Shopee Menggunakan Pendekatan
[9] J. Nurvania and K. M. Lhaksamana, Natural Language Processing,” J.
“Analisis Sentimen Pada Ulasan di Eksplora Inform., vol. 10, no. 1, pp. 32–
TripAdvisor Menggunakan Metode 42, 2020, doi:
Long Short-Term Memory ( LSTM ),” 10.30864/eksplora.v10i1.390.
vol. 8, no. 4, pp. 4124–4135, 2021. [17] R. Sitanggang et al., “Sentiment
[10] F. Sodik and I. Kharisudin, “Analisis Analysis Compare Linear Regression
Sentimen dengan SVM , NAIVE and Decision Tree Regression Algorithm
BAYES dan KNN untuk Studi To Determine Film Rating Accuracy,”
Tanggapan Masyarakat Indonesia Infokum, vol. 10, no. 2, pp. 880–890,
Terhadap Pandemi Covid-19 pada Media 2022.
Sosial Twitter,” vol. 4, pp. 628–634, [18] H. Christanto, J. Rahmad, S. H. Sinurat,
2021. and D. Ryan, “Analisis Perbandingan
[11] M. N. Muttaqin and I. Kharisudin, Decision Tree , Support Vector Machine
“Analisis Sentimen Pada Ulasan , dan Xgboost dalam Mengklasifikasi
Aplikasi Gojek Menggunakan Metode Review Hotel Trip Advisor,” vol. 9, no.
Support Vector Machine dan K Nearest 1, pp. 306–319, 2023.
Neighbor,” UNNES J. Math., vol. 10, no. [19] S. I. Nurhafida and F. Sembiring,
2, pp. 22–27, 2021, [Online]. Available: “Analisis Sentimen Aplikasi Novel
http://journal.unnes.ac.id/sju/index.php/u Online Di Google Play Store
jm Menggunakan Algoritma Support Vector
[12] V. Melinda and M. Zainil, “Penerapan Machine (SVM),” J. Sains Komput.
Model Project Based Learning untuk Inform. (J-SAKTI, vol. 6, no. 1, pp. 317–
Meningkatkan Kemampuan Komunikasi 327, 2022.
Matematis Siswa Sekolah Dasar ( Studi [20] A. Triayudi and W. O. Widyarto,
Literatur ),” J. Pendidik. tambusai, vol. “Comparison J48 and Naïve Bayes
4, pp. 1526–1539, 2020, [Online]. Methods in Educational Analysis,” J.
Available: Phys. Conf. Ser., vol. 1933, no. 1, pp.
https://jptam.org/index.php/jptam/article/ 15–20, 2021, doi: 10.1088/1742-
download/618/545 6596/1933/1/012062.
[13] S. N. Lase, Y. Yenny, O. Owen, M.
Turnip, and E. Indra, “Application of
Data Mining To Predicate Stock Price
Using Long Short Term Memory
Method,” Infokum, vol. 10, no. 2, pp.
1001–1005, 2022, [Online]. Available:
http://infor.seaninstitute.org/index.php/in
fokum/article/view/454
[14] S. Dey, S. Wasif, D. S. Tonmoy, S.
Sultana, J. Sarkar, and M. Dey, “A
Comparative Study of Support Vector
Machine and Naive Bayes Classifier for
Sentiment Analysis on Amazon Product
Reviews,” 2020 Int. Conf. Contemp.
Comput. Appl. IC3A 2020, no. May, pp.
217–220, 2020, doi:
10.1109/IC3A48958.2020.233300.
[15] D. T. Husni et al., “Analisis Big Data
Penjualan Video Games Mengunakan
Eda,” J. Tek. Inf. dan Komput., vol. 5,

Jurnal Ilmiah Betrik, Volume.14, No.02, Agustus 2023


282

Anda mungkin juga menyukai