Abstrak
Musik digital sudah berkembang secara dramatis dalam beberapa tahun ini. Musik-musik yang
disediakan terdiri dari berbagai jenis dan emosi yang bersifat acak. Karenanya, diperlukan cara untuk
mengorganisasikan lagu-lagu tersebut, untuk mengelompokan lagu-lagu tersebut berdasarkan suatu
karakteristik yang spesifik. Pengorganisasian lagu memungkinkan pengguna untuk menavigasi ke
musik-musik yang mereka tuju, juga untuk memberikan saran dan rekomendasi lagu baik bagi
masyarakat ataupun industri yang berhubungan dengan musik. Penelitian ini akan melakukan
pengelompokan lagu berdasarkan emosi menggunakan algoritma Fuzzy C-Means. Kami menggunakan
atribut audio berupa valensi, energi, loudness, dan tempo sebagai fitur yang mencerminkan emosi dari
lagu. Hasil cluster dari setiap data lagu ditentukan berdasarkan derajat keanggotaan yang dimilikinya.
Pengujian validitas cluster dilakukan untuk menguji ketepatan dari hasil clustering yang dilakukan.
Pengujian dilakukan dengan variasi data 20%, 40%, 60%, 80%, dan 100% dari total keseluruhan data
yang berjumlah 150 lagu. Dari hasil pengujian, didapatkan nilai error minimum sebesar 0.00000001
(1x10-8). Hasil pengujian menunjukkan bahwa jumlah cluster yang optimal untuk digunakan dalam
penelitian ini adalah sebanyak 5 cluster. Sedangkan, nilai pembobot yang optimal untuk digunakan
dalam penelitian ini yaitu 2, dengan nilai validitas cluster mencapai 0.7 atau 70%.
Kata Kunci: pengelompokan, emosi, lagu, fuzzy c-means, atribut audio
Abstract
Digital music has grown dramatically in recent years. They offering musics in various type and emotion
that are random. Therefore, there is a need to organize the songs, they need to somehow clusterize their
files based on a specific characteristic. The purpose of such organization is to enable users to navigate
to pieces of music they like, and also to give them advice and recommendation for people or music-
related industries. This research proposed a clustering of songs based on their emotion using the Fuzzy
c-means algorithm. Audio attributes of valence, energy, loudness, and tempo are used as features that
represent the emotions of the song. The cluster of each data is determined based on their membership
degree. Cluster validity index is used to evaluate the fitness of partitions produced by clustering
algorithms. The algorithm is tested on different amount of data, which is 20%, 40%, 60%, 80%, and
100% data of total 150 songs. The testing result obtained a minimum error value of 0.00000001 (1x10-
8). The results showed that the optimal number of clusters that are best to be used in this research is 5.
While, the optimal fuzzifier value to be used in this research is 2 with the cluster validity value reaches
0.7 or 70%
Keywords: clustering, emotion, song, fuzzy c-means, audio atribut
untuk menavigasi ke musik-musik yang mereka Algoritma Fuzzy c-means sendiri juga
tuju, pengorganisasian tersebut juga bertujuan merupakan perbaikan dari metode
untuk memberikan saran dan rekomendasi lagu pengelompokan yang sudah ada sebelumnya
(Cilibrasi, et al., 2004). (Dunn, 1973). Fitria Febrianti melakukan
Selain genre, pengelompokan musik penelitian untuk membandingkan algoritma K-
berdasarkan emosi yang dimilikinya juga Means dengan FCM, hasil menunjukkan bahwa
penting untuk dilakukan. Studi tentang nilai RMSE metode FCM lebih kecil
hubungan antara musik dan emosi telah banyak dibandingkan dengan nilai RMSE metode K-
diteliti dalam bidang psikologi musik. Means (Febrianti, et al., 2016).
Penelitian-penelitian tersebut berusaha untuk Berdasarkan uraian permasalahan yang
memahami hubungan psikologis antara musik telah dijelaskan, maka dibuat sebuah penelitian
dan pengaruhnya terhadap manusia. Hal ini tentang pengelompokan lagu berdasarkan emosi
termasuk dengan reaksi emosional manusia menggunakan algoritma Fuzzy C-Means yang
terhadap musik dan komponen apa saja dari diharapkan mampu memberikan hasil yang lebih
musik yang dapat mencerminkan emosi. baik dibandingkan penelitian – penelitian
Beberapa penelitian menyebutkan bahwa fitur sebelumnya.
suprasegmental dalam musik, seperti tempo,
merupakan komponen dalam musik yang lebih 2. LANDASAN TEORI
membawa informasi emosional dari suatu lagu
dibandingkan fitur segmental yang dimilikinya 2.1. Model Emosi Lagu
(Kappas, et al., 1991).
Keragaman struktur yang dimiliki oleh Emosi lagu menggambarkan makna
suatu lagu atau musik membuat banyak peneliti emosional yang melekat pada sebuah klip lagu.
tertarik untuk mengorganisasikannya. Salah satu Hal ini membantu dalam pemahaman lagu,
penelitian yang melakukan pengelompokan lagu pencarian lagu, dan beberapa aplikasi yang
yaitu Abhisek Sen yang mengelompokan genre berkaitan dengan lagu (Liu, et al., 2003). Dalam
lagu menggunakan algoritma K-Means (Sen, pengelompokan lagu berdasarkan emosi,
2014). Akurasi yang dihasilkan dalam penelitian diperlukan pemilihan model untuk memetakan
ini sebesar 75%. Namun, metode K-Means ruang dalam emosi menjadi nilai matematika
memiliki beberapa kelemahan untuk yang terukur sehingga setiap lagu dapat
permasalahan clustering. Kegagalan untuk dipisahkan sesuai emosinya (Singth, et al.,
mencapai konvergen merupakan salah satu 2010). Pada akhir tahun 1990-an, Thayer
kelemahan yang memiliki peluang yang cukup mengusulkan sebuah model emosi dengan dua
besar pada algoritma K-Means (Agusta, 2007). dimensi. Pendekatan ini memberikan teori
Dalam metode K-Means, setiap data di dalam bahwa emosi membawakan dua faktor, yaitu
dataset dialoasikan secara tegas (hard) untuk stress (senang atau cemas), dan energi (tenang
menjadi bagian dari suatu kelompok (cluster) atau energik). Dalam model ini, emosi lagu
tertentu. Hal ini mengakibatkan data yang telah terbagi ke dalam empat kelompok (Liu, et al.,
dipindah ke cluster baru bisa jadi justru lebih 2003), yaitu kepuasan atau kesenangan
cocok dalam cluster sebelumnya. Begitu pula (contentment), depresi (depression), gembira
dengan keadaan sebaliknya (Bora & Gupta, (exuberance), dan cemas (anxious) yang
2014). digambarkan dalam Gambar 1.
Untuk mengatasi kelemahan dari
penggunaan algoritma K-Means, penelitian ini
mengusulkan penggunaan algoritma Fuzzy c-
means (FCM). FCM merupakan sebuah
algoritma untuk clustering data, dimana setiap
data akan digolongkan menjadi anggota sebuah
cluster dengan ditentukan oleh derajat
keanggotaannya. Kelebihan dari FCM adalah
sebuah data diukur derajat keanggotaannya Gambar 1 Model Emosi Thayer
dalam rentang 0 sampai 1. Hal ini membuat
peluang permasalahan konvergensi pada FCM Pada Gambar 1, kepuasan (contentment)
sangatlah kecil. mengacu pada musik yang bahagia dan tenang,
depresi (depression) mengacu pada musik yang
dilakukan proses evaluasi menggunakan MPC didapatkan pada pengujian pertama. Pengujian
untuk didapatkan nilai validitas cluster. Setelah validitas cluster dilakukan menggunakan MPC
keseluruhan proses selesai, maka akan dan terdiri dari tiga tahap, yaitu pengujian
didapatkan output berupa nilai MPC serta terhadap banyaknya jumlah cluster, pengujian
kelompok-kelompok lagu. Alur proses terhadap nilai pembobot, dan pengujian terhadap
pengelompokan lagu berdasarkan emosi ciri. Data lagu yang digunakan untuk setiap
menggunakan algoritma Fuzzy C-Means secara pengujian berasal dari genre dan jumlah yang
umum ditunjukkan pada Gambar 3. berbeda.
ketika mencapai iterasi ke-20. Nilai error validitas MPC yang semakin menurun ketika
minimum yang diperoleh pada saat fungsi nilai c yang dimasukkan semakin besar.
objektif telah konvergen adalah sebesar Pada Tabel 2 juga terlihat bahwa nilai
0.00000001 (1 x 10-8). Nilai ini kemudian akan indeks validitas MPC tertinggi didapatkan pada
ditetapkan sebagai masukan pada pengujian- nilai c=5. Hal ini berarti pada jumlah c=5,
pengujian berikutnya. masing-masing data sudah berada dalam
kelompok yang memiliki satu emosi lagu yang
5.2. Hasil Pengujian Terhadap Jumlah serupa dengan tingkat ketepatan hasil clustering
Cluster sebesar 0.69472. Dengan demikian, nilai c=5
Pengujian terhadap jumlah cluster (c) merupakan jumlah cluster yang optimal untuk
dilakukan untuk mengetahui pengaruh diterapkan dalam penelitian ini.
banyaknya jumlah cluster terhadap nilai
5.3. Hasil Pengujian Terhadap Pembobot
validitas MPC. Tujuan pengujian ini yaitu untuk
mendapatkan nilai c terbaik yang memiliki nilai Pengujian validitas juga dilakukan terhadap
MPC paling baik untuk digunakan pada nilai w yang merupakan bobot pangkat pada
pengujian selanjutnya. Pengujian terhadap perhitungan nilai keanggotaan metode FCM.
jumlah cluster dilakukan dengan Nilai dari pembobot (w) bernilai w>1. Tujuan
membandingkan hasil nilai MPC dari banyaknya dari pengujian ini untuk mengetahui pengaruh
cluster yang berbeda untuk setiap variasi data nilai pembobot terhadap nilai validitas MPC
uji. Pengujian dilakukan dengan variasi data serta untuk mendapatkan nilai w terbaik yang
sebanyak 20%, 40%, 60%, 80%, dan 100% dari memiliki nilai MPC paling tinggi.
total keseluruhan 150 data. Pada pengujian ini, Pengujian terhadap nilai pembobot
nilai c yang digunakan yaitu c=2 sampai dengan dilakukan dengan membandingkan hasil nilai
c=9 dengan nilai pembobot w=2. Hasil uji MPC dari nilai w yang berbeda untuk setiap
validitas terhadap variasi jumlah cluster variasi data uji. Komposisi data lagu untuk
ditunjukkan pada Tabel 2. pengujian nilai pembobot sama dengan
komposisi data lagu yang digunakan pada
Tabel 2 Hasil Pengujian MPC Terhadap Jumlah pengujian jumlah cluster. Pada pengujian ini,
Cluster
nilai w yang digunakan terdiri dari w=2 sampai
Nilai MPC Setiap Variasi dengan w=9 dengan jumlah cluster 5. Hasil
Nilai Jumlah Data Uji Rata- pengujian terhadap pembobot ditunjukkan
c Rata
20% 40% 60% 80% 100% dalam Tabel 3.
c=2 0.72 0.65 0.64 0.63 0.63 0.659
Tabel 3 menunjukkan bahwa nilai validitas
tertinggi didapatkan pada saat w bernilai 2, yaitu
c=3 0.71 0.69 0.67 0.67 0.68 0.689 sebesar 0.69951. terlihat bahwa semakin besar
c=4 0.73 0.66 0.67 0.68 0.67 0.687 nilai w yang dimasukkan maka hasil validitas
c=5 0.73 0.71 0.69 0.67 0.66 0.695 cluster akan semakin rendah. Hal ini berarti nilai
w yang besar mengakibatkan hasil clustering
c=6 0.72 0.70 0.68 0.67 0.66 0.686
yang semakin tidak optimal. Penyebaran partisi
c=7 0.72 0.67 0.66 0.64 0.65 0.67 data yang cenderung kabur (fuzzy) menyebabkan
c=8 0.76 0.65 0.65 0.65 0.64 0.672 turunnya nilai validitas cluster pada nilai w yang
c=9 0.79 0.67 0.66 0.65 0.64 0.682 besar. Dengan demikian, dalam kasus ini nilai
Rata-
w=2 merupakan nilai pembobot yang baik untuk
0.73 0.68 0.67 0.66 0.66 diterapkan dalam penelitian ini.
Rata
Tabel 3 Hasil Pengujian MPC Terhadap Jumlah
Tabel 2 menunjukkan bahwa semakin besar
Cluster
jumlah cluster atau nilai c yang dimasukkan
maka nilai validitas MPC yang dihasilkan Nilai MPC Setiap Variasi Jumlah
cenderung semakin menurun. Nilai c yang Nilai Data Uji Rata-
w Rata
semakin besar berarti bahwa semakin banyak 20% 40% 60% 80% 100%
variasi pada tingkatan emosi lagu. Persebaran
data dalam kelompok yang tidak merata dan w=2 0.746 0.719 0.699 0.677 0.657 0.6995
jarak data yang semakin jauh menyebabkan nilai w=3 0.743 0.717 0.697 0.669 0.669 0.6991
w=4 0.733 0.716 0.695 0.675 0.673 0.6982
w=5 0.638 0.713 0.693 0.667 0.675 0.6772 Loudness, Tempo, dan
39 0.6948
Valensi
w=6 0.61 0.711 0.691 0.678 0.676 0.673 Energi, Loudness, Tempo,
45 0.69971
w=7 0.608 0.709 0.689 0.678 0.676 0.6721 dan Valensi
w=8 0.598 0.661 0.688 0.678 0.677 0.6602 Dalam Tabel 4, perpaduan ciri energi dan
w=9 0.498 0.633 0.686 0.658 0.677 0.6303 valensi yang merupakan atribut dalam model
emosi Thayer menghasilkan nilai MPC terendah,
yaitu sebesar 0.49049. Dalam penelitian ini,
5.4. Hasil Pengujian Terhadap Ciri kami memadukan energi dan valensi dengan
Pengujian terhadap ciri dilakukan dengan atribut audio lain, yaitu tempo dan loudness yang
membandingkan hasil nilai MPC terhadap setiap dalam berbagai literatur disebutkan bahwa kedua
variasi ciri yang diujikan. Ciri yang digunakan fitur tersebut juga berpengaruh dalam
dalam penelitian ini berupa atribut audio dari merepresentasikan emosi dari lagu. Nilai MPC
lagu, yaitu valensi, energi, loudness, dan tempo. yang dihasilkan oleh ciri atribut audio tempo
Variasi ciri yang digunakan untuk pengujian ini yaitu sebesar 0.72039 yang merupakan nilai
yaitu dengan menguji setiap ciri secara individu, MPC tertinggi yang didapatkan dalam pengujian
menguji kombinasi ciri dengan jumlah 2 variasi ini. Hal ini membuktikan teori bahwa tempo
dan 3 variasi, serta menguji keempat ciri secara merupakan atribut audio lagu yang sangat
keseluruhan. Hal ini dilakukan untuk merepresentasikan emosi dari lagu. Sementara
mengetahui kombinasi ciri mana yang itu, perpaduan keempat ciri atribut audio yang
menghasilkan nilai MPC terbaik serta untuk dipilih dalam penelitian ini berhasil mencapai
untuk mengetahui efektifitas ciri yang digunakan nilai MPC sebesar 0.6997. Nilai yang didapatkan
terhadap hasil clustering. Data yang digunakan oleh perpaduan keempat ciri ini menunjukkan
dalam pengujian ini berjumlah 75 data lagu. nilai yang lebih tinggi dibandingkan hanya
Pengujian ini menggunakan parameter terbaik menggunakan kedua fitur energi dan valensi.
yang telah didapatkan pada pengujian-pengujian Nilai MPC yang lebih tinggi ini membuktikan
sebelumnya, yaitu dengan memasukkan nilai bahwa penambahan fitur yang kami lakukan
error minimum ξ=1x10-8, pembobot w=2, dan dapat merepresentasikan emosi lagu lebih baik
banyak cluster c=5. Hasil pengujian terhadap ciri dibandingkan dengan hanya menggunakan fitur
yang telah dilakukan dapat ditunjukkan pada energi dan valensi. Namun, nilai MPC yang
Tabel 4. didapatkan pada perpaduan keempat ciri masih
lebih rendah dibandingkan dengan perpaduan
Tabel 4 Hasil Pengujian MPC terhadap Variasi tiga fitur energi, tempo, dan valensi yang
Ciri Atribut Lagu mencapai 0.71984. Hal ini kemungkinan besar
Banyak Nilai dikarenakan penggunaan fitur loudness yang
Atribut Lagu
Iterasi MPC digunakan dalam penelitian ini. Hal ini terbukti
Energi 75 0.68466 dengan rendahnya nilai MPC yang dimiliki oleh
Loudness 78 0.66942 fitur loudness jika dibandingkan dengan hasil
Tempo 42 0.72039 nilai MPC dari ketiga fitur lainnya.
Valensi 33 0.71806
Energi dan Loudness 85 0.65577 6. KESIMPULAN
Energi dan Tempo 37 0.72019 Berdasarkan hasil pengujian dan analisis
Energi dan Valensi 59 0.49049 hasil penelitian terhadap pengelompokan lagu
Loudness dan Tempo 64 0.69513 berdasarkan emosi menggunakan algoritma
Loudness dan Valensi 69 0.63577 Fuzzy C-Means, maka dapat diambil beberapa
kesimpulan, yaitu :
Tempo dan Valensi 43 0.72004
1. Metode Fuzzy C-Means dapat digunakan
Energi, Loudness, dan
34 0.69496 untuk melakukan pengelompokan lagu
Tempo
berdasarkan emosi dengan tingkat validitas
Energi, Loudness, dan
128 0.59649 sebesar 0.6997 atau 70%. Hal ini
Valensi
Energi, Tempo, dan didapatkan dengan menerapkan ciri atribut
42 0.71984 audio lagu berupa valensi, energi, loudness,
Valensi
dan tempo untuk merepresentasikan emosi Akhir Kuliah Dengan Fuzzy C-Means.
lagu. Seminar Nasional Sistem dan
2. Berdasarkan pengujian yang telah Informatika, pp. 232-238.
dilakukan, nilai error minimum yang
Kusumadewi, S. & Purnomo, H., 2010 . Aplikasi
didapatkan pada saat fungsi objektif telah
Logika Fuzzy untuk Pendukung
konvergen adalah sebesar 0.00000001 (1 x
Keputusan. Jakarta: Graha Ilmu.
10-8). Banyaknya cluster yang optimal
untuk digunakan dalam penelitian ini Liu, D., Liu, L. & Zhang, H.-J., 2003. Automatic
adalah sebanyak 5 cluster dengan nilai Mood Detection from Acoustic Music
validitas cluster mencapai 0.69472 atau Data. In Proceedings of the 4th
69.5%. Sedangkan, nilai pembobot (w) International Symposium on Music
yang optimal untuk digunakan dalam Information Retrieval, pp. 81-87.
penelitian ini yaitu 2 dengan nilai validitas Maimon, O. & Rokach, L., 2010. Data Mining
cluster mencapai 0.69951 atau 69.95%. and Knowledge Discovery Handbook.
2nd ed. London: Springer
DAFTAR PUSTAKA Science+Business Media.
Agusta, Y., 2007. K-Means – Penerapan, Nascimento, S., Mirkin, B. & Moura-Pires, F.,
Permasalahan dan Metode Terkait. 1999. A Fuzzy Clustering Model of Data
Jurnal Sistem dan Informatika, Februari, and Fuzzy c-Means, s.l.: Department of
Volume 3, pp. 47-60. Computer Science of FCT-
Universidade Nova de Lisboa and
Bezdek, J., 1981. Pattern Recognition with
DIMACS .
Fuzzy Objective Function Algorithms.
New York: Plenum Press. Pravitasari, A. A., 2009. Penentuan Banyak
Kelompok dalam Fuzzy C-Means
Bora, D. . J. & Gupta, D. A. K., 2014. A
Cluster Berdasarkan Proporsi Eigen
Comparative study Between Fuzzy
Value Dari Matriks Similarity dan
Clustering Algorithm and Hard
Indeks XB (Xie dan Beni).
Clustering Algorithm. International
PROSIDING, 5 Desember.pp. 623-632.
Journal of Computer Trends and
Technology (IJCTT), April, 10(2), pp. Sandhir, R. P., Muhuri , S. & Nayak, T. K., 2012.
108 - 113. Dynamic Fuzzy c-Means (dFCM)
Clustering and its Application to
Cilibrasi, R., Vit´anyi, P. & Wolf, R. d., 2004.
Calorimetric Data Reconstruction in
Algorithmic Clustering of Music.
High Energy Physics. Nuclear
Amsterdam, EDELMUSIC, pp. 110-
Instruments and Methods in Physics
117.
Research Section A: Accelerators,
Gabrielle, A. & Stromboli, E., 2001. The Spectrometers, Detectors and
influence of musical structure on Associated Equipment, Volume 681, pp.
emotional expression. Music and 34-43.
Emotion: Theory and Research, pp. 223-
Sen, A., 2014. Automatic Music Clustering
243.
using Audio Attributes. International
Jamdar, A., Abraham, J., Khanna, K. & Dubey, Journal of Computer Science
R., 2015. Emotion Analysis of Songs Engineering (IJCSE), November, 3(06),
Based on Lyrical and Audio Features. pp. 307-312.
International Journal of Artificial
Singth, P., Kapoor, A., Kaushik, V. &
Intelligence & Applications (IJAIA),
Maringanti, H. B., 2010. Architecture
May, 6(03), pp. 35-50.
for Automated Tagging and Clustering
Kappas, A., Hess, U. & Scherer, K. R., 1991. of Song Files According to Mood. IJCSI
Voice and emotion. In: Fundamentals of International Journal of Computer
nonverbal behavior. Cambridge, UK: Science, pp. 11-17.
Cambridge University Press, pp. 38-
Thompson , W. F. & Quinto, L., 2011. Music and
200.
Emotion: Psychological Considerations.
Khoiruddin, A. A., 2007. Menentukan Nilai In: E. Schellekens & P. Goldie, eds. The