Anda di halaman 1dari 6

JURNAL INFORMATIKA, Vol.10 No.

Desember 2023, Halaman 1-6


ISSN: 2355-6579 | E-ISSN: 2528-2247
DOI: <nomor doi>

Penerapan Algoritma C4.5 Dalam Analisis Sentimen


Pengguna Spotify
Renata Elfrin1*, Lifia Novianti2, Muhammad Kurniawansyah3
1,2,3
Fakultas Teknik Informatika, Universitas Bina Sarana Informatika

Jl. Kamal Raya No.18, RT.6/RW.3, Cengkareng Tim., Kec. Cengkareng, Jakarta Barat, Indonesia

e-mail: 119210504@bsi.ac.id, 219211158@bsi.ac.id, 319211056@bsi.ac.id

Informasi Artikel Diterima: 00-00-2023 Direvisi: 00-00-2023 Disetujui: 00-00-2023

Abstrak
Penelitian ini mengeksplorasi penerapan algoritma C4.5 dalam analisis sentimen terhadap ulasan
pengguna layanan Spotify. Spotify, sebagai platform streaming musik yang populer, menarik minat
pengguna secara luas. Analisis sentimen menjadi krusial untuk memahami persepsi, preferensi, dan
kepuasan pengguna terhadap layanan aplikasi. Metodologi penelitian ini memanfaatkan data ulasan
pengguna Spotify dari playstore yang berupa review sebanyak 10 ulasan positif dan 10 ulasan negatif.
Tahapan utama melibatkan praproses data, pembentukan model pohon keputusan dan evaluasi kinerja
model dengan rapidminer sebagai Machine Learning yang digunakan dalam penelitian ini. Langkah-
langkah spesifik seperti Transform cases, Tokenize, Filter tokens, serta Stemming diterapkan untuk
mempersiapkan data sebelum diimplementasikan pada algoritma C4.5. Hasil penelitian Analisis
Sentimen Pengguna Spotify dengan menggunakan algoritma C4.5 mempunyai tingkat acuracy sebesar
80% dengan precision 71,43% (positive class: negatif) dan recall 100% (positive class: negatif).

Kata Kunci: spotify, algoritma C4.5, analisis sentimen

Abstract
This research explores the application of the C4.5 algorithm in sentiment analysis of user reviews of the
Spotify service. Spotify, as a popular music streaming platform, attracts widespread user interest.
Sentiment analysis is crucial for understanding user perceptions, preferences and satisfaction with
application services. This research methodology utilizes Spotify user review data from Playstore in the
form of 10 positive reviews and 10 negative reviews. The main stages involve data preprocessing,
forming a decision tree model and evaluating model performance with rapidminer as the Machine
Learning used in this research. Specific steps such as Transform cases, Tokenize, Filter tokens, and
Stemming are applied to prepare the data before being implemented in the C4.5 algorithm. The results
of Spotify User Sentiment Analysis research using the C4.5 algorithm have an accuracy level of 80%
with precision 71,43% (positive class: negatif) and recall 100% (positive class: negatif).

Keywords: spotify, C4.5 algorithm, sentiment analysis

1. Pendahuluan dunia. Penggunaannya yang meluas


Musik adalah salah satu bentuk seni memberikan kontribusi pada akumulasi besar
yang universal. Perkembangan teknologi telah data yang mencakup beragam preferensi
mengubah cara kita mengakses dan pengguna, ulasan, dan umpan balik. Dengan
mengkonsumsi musik secara drastis. Salah satu pertumbuhan yang pesat dalam jumlah
platform yang telah merevolusi pengalaman pengguna tiap tahunnya, analisis sentimen
mendengarkan musik adalah Spotify. Spotify terhadap layanan tersebut menjadi krusial dalam
merupakan layanan musik, podcast, dan video memahami persepsi dan kepuasan pengguna.
digital yang memberi akses jutaan lagu dan Analisis sentimen atau disebut juga dengan
konten lain dari pembuat konten di seluruh dunia opinion mining merupakan riset komputasional
(spotify,2023). Sebagai salah satu layanan dari pendapat, sentimen dan emosional yang
streaming musik terkemuka di dunia, Spotify diekspresikan secara tekstual oleh penulis.
telah menjadi bagian integral dari kehidupan Analisis Sentimen adalah solusi yang secara
sehari-hari bagi jutaan pengguna di seluruh otomatis mengelompokkan opini atau peringkat
1

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International


License.
JURNAL INFORMATIKA, Vol. 10 No. Desember 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247

menjadi opini positif atau negatif (Rahayu et al.,


2022)
Salah satu pendekatan untuk
menganalisis sentimen adalah dengan
menerapkan algoritma data mining(machine
learning) yang kuat. Data mining adalah
serangkaian proses yang membantu
mengeksplorasi dan mengambil nilai dalam
bentuk hubungan serta informasi kompleks yang
disimpan dalam data base. Dengan menggali
pola informasi terhadap data yang berguna
sebagai memanipulasi data menjadi sebuah
informasi baru dan lebih berfaedah yang
didapatkan melalui cara mengekstrasi juga
mengetahui beberapa pola menarik atau
berharga dari basis data (Dito, 2019). Algoritma
yang paling polpuler pada data mining dan
sering digunakan dalam aplikasi industri, salah
satunya adalah Algoritma C4.5. Algoritma ini
merupakan teknik pembelajaran mesin yang
digunakan untuk membangun model pohon
keputusan. Penerapan Algoritma C4.5 dalam
analisis sentimen Spotify membuka peluang
besar untuk mengeksplorasi opini pengguna,
memahami preferensi, dan meningkatkan Gambar 1. Kerangka Penelitian
layanan berdasarkan umpan balik yang
diberikan. 2.1 Pengumpulan data
Jurnal ini mengusung tujuan untuk Pengumpulan data merupakan proses
mempelajari secara mendalam kemampuan pengambilan informasi atau data dari sumber
Algoritma C4.5 dalam menggali wawasan dari tertentu untuk digunakan dalam penelitian atau
data sentimen pengguna Spotify. Dengan analisis. Metode pengumpulan data bisa
memanfaatkan pendekatan algoritma ini, diartikan sebagai metode ilmiah untuk
penelitian ini akan mencakup konsep, memperoleh data yang valid dengan tujuan
metodologi, dan hasil dari analisis sentimen menemukan, mengembangkan dan
yang dilakukan pada data pengguna Spotify. membuktikan pengetahuan tertentu, sehingga
Oleh karena itu, peneliti mengharapkan hasil pengetahuan tersebut dapat digunakan untuk
dari penelitian ini dapat memberikan pandangan memahami, memecahkan masalah, dan
yang lebih terperinci tentang efektivitas mengantisipasi setiap masalah(Sugiyono,
bagaimana data mining dan algoritma 2019).
pembelajaran mesin dapat diterapkan dalam Pengumpulan data sentimen dalam
pemahaman budaya dan perilaku manusia penelitian ini melibatkan pengambilan data dari
melalui analisis sentimen pengguna spotify. playstore, berupa ulasan yang terkait dengan
penggunaan layanan Spotify dengan
memanfaatkan Web Scrapping menggunakan
2. Metode Penelitian
bahasa pemograman python untuk
Dalam analisis Sentimen Pengguna mengumpulkan data-data review atau komentar
Spotify, penulis menggunakan metode algoritma dari playstore.
klasifikasi C4.5. Metode ini adalah salah satu
metode klasifikasi yang tersedia dalam data 2.2 Praproses Data
mining. Metode ini terdiri dari langkah-langkah Praproses adalah langkah pembersihan
yang terperinci untuk memperoleh data, data dengan mengubah teks asli untuk
melakukan analisis, dan menginterpretasi menghapus beberapa bagian teks yang tidak
hasilnya. relevan dalam pengolahan data selanjutnya
(Delvika et al, 2023). Langkah ini melibatkan
pembersihan data dari duplikasi, data yang tidak
relevan, atau data yang tidak valid. Teknik
seperti tokenisasi, penghapusan stopwords, dan
normalisasi teks juga dapat digunakan dalam
mempersiapkan data teks untuk analisis
sentimen.

<Link address> 2
JURNAL INFORMATIKA, Vol. 10 No. Desember 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247

2.3 Metode Algoritma C4.5


C4.5 adalah algoritma pembelajaran
mesin yang digunakan untuk menghasilkan
pohon keputusan dari data pelatihan. Pohon
keputusan ini digunakan untuk klasifikasi dan
prediksi dalam analisis data. Algoritma ini Gambar 2. Proses replace data dengan
mencari aturan-aturan yang membagi data Rapiminer
menjadi kelompok-kelompok yang homogen c. Nominal to text
berdasarkan fitur-fitur tertentu. Aturan-aturan ini Operator ini mengubah nilai kategori dalam
kemudian digunakan untuk membangun pohon atribut nominal yang diseleksi menjadi teks.
keputusan yang dapat digunakan untuk Setiap nilai nominal hanya digunakan sebagai
mengklasifikasikan data baru. C4.5 merupakan nilai string dari atribut baru. Jika nilai tidak ada
salah satu algoritma pohon keputusan yang dalam atribut nominal, nilai baru juga akan
populer dan telah digunakan dalam berbagai hilang.
aplikasi, termasuk pengenalan pola, analisis
data, dan sistem pakar. d. Proses Documents From Data
Dalam implementasi algoritma C4.5,
Machine Learning yang akan digunakan adalah
Rapidminer, yaitu perangkat lunak open source
yang berfungsi untuk menganalisis
penambangan data, penambangan teks, dan
analitik prediktif.
Gambar 3. Pemodelan Proses documents from
2.4 Validasi dan Evaluasi data
Performa model klasifikasi dapat diukur
menggunakan operator Cross Validation. Cross 1) Transform cases : mengonversikan huruf-
Validation merupakan sebuah metode validasi huruf menjadi huruf kecil atau huruf besar
model yang digunakan untuk mengevaluasi untuk memastikan konsistensi dalam
kinerja model prediktif. Dalam prosesnya representasi teks. Dalam penelitian ini semua
terdapat 4 nilai yaitu, (1)True Positive(TP): diberi huruf diubah menjadi huruf kecil karena
label positif dan menurut machine learning juga kebanyakan teks berbentuk tulisan opini yang
positif, (2)False Positive (FP): diberi label positif hampir semua teks menggunakan huruf kecil.
sedangkan menurut machine learning negative, 2) Tokenize : merupakan teknik memotong
(3)True Negative(TN): diberi label negatif dan setiap kata yang membentuk string masukan.
juga menurut machine learning negatif, (4)False Saat mengekstraksi kata-kata yang
Negative (FN) diberi label negatif tetapi machine membentuk teks, semua karakter selain yang
learning menganggap positif. Evaluasi dalam ada di dalam kata tersebut akan dihilangkan
penelitian akan meliputi pengukuran akurasi, atau dihapus.
presisi, recall, untuk mengevaluasi kinerja 3) Filter tokens : mengeliminasi karakter-
algoritma dalam menganalisis sentimen. karakter tertentu seperti tanda baca serta
membersihkan teks yang tidak relevan.
4) Stemming : pada proses ini, kata-kata
3. Hasil dan Pembahasan dalam teks akan diubah menjadi kata dasar
3.1 Implementasi Model dengan Rapidminer atau mengubah kata menjadi baku. Tujuannya
untuk mengurangi variasi kata yang memiliki
a. Read Excel akar atau makna yang sama.
Operator ini dapat digunakan untuk memuat 5) Filter stopwords : dengan fitur ini maka
data dalam bentuk Microsoft Excel. sebelum teks diklasifikasikan, teks yang tidak
relevan dengan data sentimen perlu
dihilangkan sehingga format teks akan
b. Replace
berkurang tanpa mengurangi isi teks tersebut.
berguna dalam proses pembersihan data dan
pra-pemrosesan sebelum analisis lebih lanjut.
e. Select Attributes
Operator ini digunakan untuk mengganti nilai-
Proses pemilihan atribut atau fitur yang
nilai dalam atribut (kolom) tertentu dalam
relevan dari dataset yang digunakan untuk
dataset dengan nilai yang ditentukan.
analisis atau emodelan data.

f. Set Role
Proses penentuan peran atau role dari setiap
kolom atau atribut dalam dataset.

<Link address> 3
JURNAL INFORMATIKA, Vol. 10 No. Desember 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247

g. Cross Validation berhierarki. Pada decision tree, data


Validasi model yang digunakan untuk dipartisi berdasarkan pada fitur-fitur
mengevaluasi kinerja model prediktif. tertentu dengan tujuan untuk membuat
keputusan atau prediksi.
2) Apply Model : proses menerapkan
model yang telah dibuat pada dataset
baru yaitu mengaplikasikan model
decision tree yang sudah dibuat ke
dalam data yang baru untuk melakukan
prediksi atau klasifikasi.
3) Performance : untuk mengukur
Gambar 4. Proses Cross Validation
performance akurasi dari model.
1) Decision tree : untuk melakukan prediksi
berdasarkan serangkaian keputusan 3.2 Hasil Pengolahan Data

Gambar 5. Hasil accuracy performance vector pada cross validation

Gambar 6. Grafik ROC pada cross validation

<Link address> 4
JURNAL INFORMATIKA, Vol. 10 No. Desember 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247

Hasil akhir dari Performance Vector Delvika, B.,dkk. (2023). Perbandingan


pada gambar 5 di atas menggambarkan bahwa Algoritma NBC dan C4.5 Dalam
pembelajaran mesin mencapai suatu Analisa Sentimen Pemilihan Presiden
kesimpulan. Review yang benar-benar positif 2024 Pada Twitter. SENTIMAS,
(true positive) sebanyak 6 dari 10 data ulasan NO(ISSN(E): 2830-3083), 41-48.
positif dan dianggap negatif (false positive) https://journal.irpi.or.id/index.php/senti
sebanyak 4 ulasan. Kemudian untuk review mas
yang benar-benar negatif, machine learning Maulida, R., & Bani. (2020). Prediksi Kelulusan
menyimpulkan bahwa review yang benar-benar Mahasiswa Tepat Waktu dengan
negatif(true negative) sebanyak 10 dari 10 data Algoritma C4.5 dengan Particle Swarm
ulasan negatif dan yang dianggap positif (false Optimization pada Univeristas XYZ.
negative) sebanyak 0 ulasan. Dengan tingkat Journal of Artificial Intelligence and
persentase recall sebesar 100% (positive class: Innovative Applications, 1(3), 138-144.
negatif) dan precision sebesar 80%(positive http://openjournal.unpam.ac.id/index.ph
class: negatif). Dan tingkat accuracy pada p/JOAIIA/index
analisis sentimen pengguna Spotify dari data
review tersebut disimpulkan mencapai 80% Senubekti, M. A., & Dewi, L. A. P. (2022).
dalam persentase Prinsip Klasifikasi Dan Data Mining
AUC (Area Under the Curve) pada Dengan Algoritma C4.5. JURNAL
gambar 6. adalah metrik evaluasi kinerja model NUANSA INFORMATIKAJurnal
yang umum digunakan dalam klasifikasi. AUC Nuansa Informatika, 16(2), 87-93.
mengukur area di bawah kurva ROC (Receiver https://journal.uniku.ac.id/index.php/ilko
Operating Characteristic), yang merupakan m
grafik yang memplot Tingkat True Positive(TP) Rahayu, A. S., Fauzi, A., & Rahmat. (2020).
Versus Tingkat False Positive(FP) pada Komparasi Algoritma Naïve Bayes Dan
berbagai nilai ambang batas (threshold untuk Support Vector Machine (SVM) Pada
model klasifikasi. Dari hasil evaluasi kurva ROC Analisis Sentimen Spotify. Jurnal
pada algoritma C4.5 mencapai 0.800. Sistem Komputer dan Informatika
(JSON), 4(2), 349-354. DOI
10.30865/json.v4i2.5398
4. Kesimpulan Ginabila, G., & Fauzi, A. (2023). Analisis
Penelitian ini menggambarkan Sentimen Terhadap Pemutar Musik
penerapan algoritma C4.5 dalam menganalisis Online Spotify Dengan Algoritma Naive
sentimen terhadap ulasan pengguna layanan Bayes dan Support Vector Machine.
Spotify. Dalam prosesnya, data ulasan Jurnal Ilmiah ILKOMINFO-Ilmu
pengguna Spotify dikumpulkan sebanyak 20 Komputer & Informatika, 6(2), 111-122.
data teks dengan pelabelan 10 positif dan 10 Bachtiar, L., & Mahradianur. (2023). Analisis
negatif. Kemudian diproses dan dianalisis Data Mining Menggunakan Metode
menggunakan metode algoritma C4.5. Untuk Algoritma C4.5 Menentukan Penerima
hasil pengujiannya yang dilakukan Bantuan Langsung Tunai. JURNAL
menggunakan tools Rapidminer mendapatkan INFORMATIKA, 10(1), 28-36. DOI:
hasil akurasi sebesar 80,00%. Dari tingkat https://doi.org/10.31294/inf.v10i1.15115
akurasi yang diperoleh memperlihatkan Ratnawati, & Natalia, F. (2021). Penerapan
kemampuan algoritma C4.5 dalam Algoritma C4.5 pada Pengaruh Iklan
mengklasifikasikan sentimen pengguna dengan Tanpa Label Harga di Instagram.
baik. Secara keseluruhan, penelitian ini SISTEMASI: Jurnal Sistem Informasi,
menyoroti potensi algoritma C4.5 dalam 10(1), 176.
menganalisis sentimen pengguna Spotify dan http://sistemasi.ftik.unisi.ac.id
menyediakan landasan untuk penelitian lebih Rahmadayanti, F., Lovita, A., & Muntari, S.
lanjut guna memperbaiki pemahaman kita (2023). Klasifikasi Kelayakan Penerima
tentang preferensi dan pandangan pengguna Bantuan Sosial Dengan Algoritma
terhadap layanan digital. Decision Tree. ESCAF, 2(1) 1002-
1007.
https://semnas.univbinainsan.ac.id/inde
Referensi x.php/escaf/article/view/469
Rhajendra, M. D., & Trianasari, N. (2021). Nurhalimah, L., Hermanto, T. I., & Kaniawulan,
Analisis Sentimen Ulasan Aplikasi I. (2022). Analisis Prediksi Mood Genre
Spotify Untuk Peningkatan Layanan Musik Pop Menggunakan Algoritma K-
Menggunakan Algoritma Naive Bayes. Means dan C4.5. JURIKOM (Jurnal
eProceedings of Management, 8(5).

<Link address> 5
JURNAL INFORMATIKA, Vol. 10 No. Desember 2023
ISSN: 2355-6579 | E-ISSN: 2528-2247

Riset Komputer), 09(4), 1006-1013. Menggunakan C4. 5 Algoritma


DOI 10.30865/jurikom.v9i4.4597 Kepuasan Pelanggan di PDAM Tirta
Insan, M. K., Hayati, U., & Nurdiawan, O. Lihou. Jurnal Jaringan Komputer,
(2023). Analisis Sentimen Aplikasi Arsitektur dan Komputasi Kinerja
Brimo Pada Ulasan Pengguna Di Tinggi, 3(1), 9-20.
Google Play Menggunakan Algoritma Cahyaningtyas, C., Nataliani, Y., & Widiasari, I.
Naive Bayes. JATI (Jurnal Mahasiswa R. (2021). Analisis sentimen pada
Teknik Informatika), 7(1), 478-483. rating aplikasi Shopee menggunakan
Albasithu, F., & Wibowo, A. (2022). metode Decision Tree berbasis
Perbandingan Algoritma Naïve Bayes SMOTE. AITI, 18(2), 173-184.
Dan C4.5 pada Analisis Sentimen Rakhman, A., & Tsani, M. R. (2019). Analisis
Presiden 3 Periode di Twitter. Prosiding Sentimen Review Media Massa
Seminar Nasional Mahasiswa Fakultas Menggunakan Metode C4. 5 Berbasis
Teknologi Informasi (SENAFTI), 1(1), Forward Selection. Smart Comp:
510–516. Jurnalnya Orang Pintar Komputer, 8(2),
https://senafti.budiluhur.ac.id/index.php/ 78-82.
senafti/article/view/217 GmbH, R. (n.d.). Performance Binominal
Sinaga, T. H., Wanto, A., Gunawan, I., Classification (RapidMiner Studio Core)
Sumarno, S., & Nasution, Z. M. (2021).
Implementasi Data Mining

<Link address> 6

Anda mungkin juga menyukai