Anda di halaman 1dari 7

JITSINET e-ISSN: 2962-7753

Jurnal Information Technology, Software Engineering and Networking


Volume 1, Nomor 2, Oktober 2022

Klasifikasi Musik Berdasarkan Genre Dengan


Metode K Nearest Neighbor

Nysa Marlyani Putri br Jabat 1), Paska Marto Hasugian 2)


1)2)
Program Studi Teknik Informatika STMIK Pelita Nusantara
Jl. Iskandar Mudan No. 1 Medan
1)
putrisijabat12@gmail@gmail.com
2)
paskamarto86@gmail.com

Abstrak
Musik adalah suara yang disusun sedemikian rupa sehingga mengandung irama, lagu, nada,
dan keharmonisan terutama dari suara yang dihasilkan dari alat- alat yang dapat menghasilkan
irama. Genre musik adalah cara yang paling umum digunakan untuk mengorganisasi database
musik digital. Musik yang berada pada genre yang sama biasanya memiliki kemiripan
karakteristik tertentu yang terkait dengan instrumentasi, struktur ritmis, dan pitch musik. Fitur-
fitur akustik musik yang dapat digunakan untuk klasifikasi berdasarkan genre adalah timbre.
Penelitian ini bertujuan untuk mengkalisifikasikan musik berdasarkan genre dengan
menggunakan metode K Nearest Neighbor (KNN). Mengaitkan genre dengan musik dapat
mempermudah pendengar untuk mengetahui genre musik yang didengar dengan membuat suatu
sistem pengklasifikasian genre yang mengambil sampel data dari GTzan genre collection. Dalam
penelitian ini, penulis membatasi jumlah genre yang dapat diklasifikasikan, yaitu classical,
country, hiphop, jazz, reggae dan rock.

Kata kunci: Music, Genre, K Nearest Neighbor, Timbre.

Abstract
Music is sound that is arranged in such a way that it contains rhythm, song, tone, and
harmony, especially from the sound produced by the instruments that can produce the rhythm.
Music genre is the most commonly used way to organize a digital music database. Music in the
same genre usually bears certain similar characteristics related to instrumentation, rhythmic
structure, and musical pitch. Music acoustic features that can be used for classification by genre
are timbre.
This study aims to classify music by genre using the K Nearest Neighbor (KNN) method.
Linking genres to music can make it easier for listeners to know the genre of music being heard
by creating a genre classification system that takes data samples from the GTzan genre collection.
In this study, the author decides the number of genres that can be supported, namely classical,
country, hiphop, jazz, reggae and rock.

Keywords: Music, Genre, K Nearest Neighbor, Timbre.

1. PENDAHULUAN
Data mining merupakan gabungan sejumlah disiplin ilmu komputer yang didefinisikan
sebagai proses penemuan pola-pola baru dari kumpulan-kumpulan data sangat besar, meliputi
metode -metode yang merupakan irisan dari artificial intelligence, machine learning, statistics,
dan database systems [1].
Algoritma K Nearest Neighbor (KNN) adalah sebuah metode klasifikasi terhadap sekumpulan
data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Termasuk dalam
supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan
mayoritas kedekatan jarak dari kategori yang ada dalam KNN [2].

Received: 29-09-2022
Accepted: 10-10-2022

126
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022

Supervised Learning membuat fungsi yang memetakan masukan ke keluaran yang


dikehendaki, misalnya pada pengelompokan (klasifikasi). Pendekatan klasifikasi yang terawasi
atau supervised untuk musik berdasarkan genre adalah pendekatan yang paling banyak digunakan
untuk klasifikasi musik berdasarkan genre. Walaupun paling banyak digunakan, tetapi masalah
dalam klasifikasi ini sama dengan yang dihadapi teknik sistem pakar, yaitu tidak ada taksonomi
genre yang pasti. Masalah ini dapat diatasi dengan membatasi genre yang digunakan dalam
sebuah penelitian. Kelebihan klasifikasi supervised jika dibandingkan dengan sistem pakar adalah
klasifikasi supervised dapat menggunakan metode seperti k-Nearest Neighbor (KNN),yang tidak
menggunakan aturan/rule [3].
Musik dalam Kamus Besar Bahasa Indonesia [4] diartikan sebagai: Ilmu atau seni menyusun
nada atau suara dalam urutan, kombinasi, dan hubungan temporal untuk menghasilkan
komposisi(suara) yang mempunyai kesatuan dan kesinambungan; Nada atau suara yang disusun
sedemikian rupa sehingga mengandung irama, lagu dan keharmonisan (terutama yang
menggunakan alat-alat yang dapat menghasilkan bunyi-bunyi itu).
Kata musik dapat didefinisikan sebagai seni mengorganisasi kumpulan nada- nada menjadi
suatu bunyi yang mempunyai arti. Musik sangat dekat dengan kehidupan. Sejak masih bayi
seseorang sudah dikenalkan dengan “seni musik” oleh ibunya dengan lagu atau nyanyian
sederhana (misalnya: lagu Nina Bobo, Pelangi, PakPos, dll) lagu atau nyanyian itu juga
menyemarakkan hidup hingga memasuki masa pendidikan prasekolah maupun awal-awal sekolah
[5].

2. METODE PENELITIAN
Pada tahapan ini dilakukan proses untuk melakukan, menentukan, menganalisa, mengolah,
mengembangkan serta menguji permasalahan pada penelitian dengan menggunakan cara-cara
yang ilmiah. Adapun tahapan kerangka kerja penelitian penulis sebagai berikut:

Gambar 1. Kerangka Kerja Penelitian

Berdasarkan tahapan kerangka kerja penelitian pada gambar 1, maka akan dijelaskan masing-
masing tahapan kerangka kerja sebagai berikut:
1. Identifikasi Masalah
Pada tahap ini penulis mengidentifikasi masalah bagaimana melakukan klasifikasi musik
berdasarkan genre dengan menggunakan metode K Nearest Neighbor.Pada dasarnya penelitian
ini dilakukan karena banyaknya pendengar musik tidak mengenali setiap genre musik yang

127
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022

sedang didengarkan, sehingga untuk mempermudah pendengar musik maka dilakukan penelitian
ini agar mempermudah pendengar musik untuk membuat playlist musik berdasarkan genremusik
dan suasana hati pendengar musik tersebut.
2. Pengumpulan Data
a. Data Primer
Data primer diperoleh dengandilakukannya pengunduhan dataset yang sudah tersedia dan
siap pakai.Dataset tersebut bernama GTZAN, dibuat dandigunakan oleh G.Tzanetakis dan P.
Cook.
b. Data Sekunder
Data sekunder diperoleh melalui studi literatur yang dilakukan dengan cara mencari
referensi dari internet, buku dan jurnal-jurnal mengenai penelitian- penelitian tentang
klasifikasi musik berdasarkan genre. Selain itu, dilakukan pencarian tentang algoritma
klasifikasi K-Nearest Neighbor serta pengaplikasiannya pada klasifikasi musik.
3. Data Mining
Berikut penjelasan tahap-tahapanya akan dibahas sebagai berikut.

a. Data Selection
Pada tahapan ini akan dilakukan proses pemilihan genre musik yang digunakan untuk
penelitian ini. Di antaranya penulis hanya memilih dan menggunakan 6 genre lagu saja, yaitu
jazz, rock, hiphop, reggae, classical, dan country.
b. Preprocessing
Pada tahapan ini akan dilakukan proses pembersihan data-data yang tidak digunakan
dengan penelitian ini. Seperti pemilihan data musik terlebih dahulu, setelah itu dilakukan
pengunduhan 100 data musik untuk setiap genre-nya. Dikarenakan ada 6 genre yang akan
digunakan penulis didalam penelitian ini maka akan diperoleh 600 data musik di tahap ini.
Dengan adanya data cleaning, proses pengolahan akan menjadi lebih baik sesuai dengan tujuan
penelitian yang akan dicapai.
c. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan
sangat bergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
d. K Nearest Neighbor
KNN yaitu sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran
data yang sudah diklasifikasikan sebelumya. Untuk membuat sebuah prediksi dengan metode
K-NN yaitu dengan cara mendefinisikan metrik untuk mengukur jarak antara query point dan
kasus. Dengan demikian dekat atau jauhnya jarak bisa dihitung berdasarkan Euclidean
Distance.
Tahapan langkah menggunakan metode tersebut :
1) Menentukan parameter k (jumlah tetangga paling dekat).
2) Menghitung kuadrat jarak euclidean objek terhadap data training yang diberikan.
3) Mengurutkan hasil No 2 secara ascending (berurutan dari nilai tinggi ke rendah)
4) Mengumpulkan kategori Y (Klasifikasi nearest neighbor berdasarkan nilai k).
e. Pattern Evaluation
Pada tahap ini penulis mencakup pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
4. Rancangan Sistem
Dalam tahap perancangan dan design sistem ini yang dilakukan oleh penulis adalah sebagai
berikut:
a. Perancangan Interface
Pada tahap ini dilakukan perancangan bentuk interface GUI (Graphical User Interface)
program yang dibuat, perancangan interface GUI (Graphical User Interface) ini meliputi

128
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022

perancangan tampilan (form) yang diinginkan serta menu-menu yang terdapat dalam
program nantinya.
b. Basis Data
Bahasa yang digunakan dalam perancangan basis datayaitu UMLyaitu digunakan untuk
merancangkan bentuk pembuatan diagram UseCase, Activity,dan Class.
c. Data Base
Untuk data yang digunakan dalam penelitian ini diambil dari data set GTZAN Genre
collection (G. Tzanetakis and p.cook) yang dapat di download melalui halaman web
https://www.kaggle.com/andradaolteanu/gtzan-dataset-music-genre-classification.
5. Pengembangan Aplikasi
Aplikasi akan dikembangkan dengan menggunakan bahasa pemrograman Microsoft Visual
C# 2013.
6. Pengujian Sistem
Untuk pengujian sistem digunakan parameter akurasi untuk memperkirakan hasil
pengelompokkan. Akurasi adalah ukuran ketepatan sistem dalam mengenali input yang diberikan
sehingga menghasilkan keluaran yangbenar . Akurasi tersebut didapat dari perhitungan:

𝐽𝑢𝑚𝑙𝑎ℎ 𝐷𝑎𝑡𝑎 𝐵𝑒𝑛𝑎𝑟


Akurasi = 𝑥 100%
𝐽𝑢𝑚𝑙𝑎ℎ 𝑆𝑒𝑙𝑢𝑟𝑢ℎ 𝐷𝑎𝑡𝑎

Semakin tinggi akurasi sistem menunjukkan bahwa sistem memiliki kinerja yangbaik karena
mampu mengenali masukan yang diberikan.
7. Implementasi
Tahap ini memiliki tujuan yaitu untuk mendapatkan hasil dari pengklasifikasian musik
berdasarkan genre musik tersebut. Untuk mendapatkan hasil yang diinginkan maka data akan di
ekstraksi dan kemudian dilakukan proses pengklasifikasian yang akan dilakukan implementasi
dari metode K Nearest Neighbor.

3. PEMBAHASAN DAN HASIL PENELITIAN


Genre dataset diambil dari data set GTZAN Genre collection
(G.Tzanetakis and p.cook) dan dapat diperoleh melalui halaman website berikut
https://www.kaggle.com/datasets/andradaolteanu/gtzan-dataset-music-genre- classification.
Dataset terdiri dari 10 jenis genre, yang mencakup blues, classical, country, disco, hiphop, jazz,
metal, pop, reggae dan rock. Adapun hasil ekstraksi fitur dari data yang digunakan adalah sebagai
berikut:
Tabel 1 Dataset
spectral_ban
chroma_stft_ chroma_stft_ spectral_centspectral_cent spectral_ban
No filename rms_mean rms_var dwidth_mea
mean var roid_mean roid_var dwidth_var
n
1 blues.00000.wav 0.350088 0.088757 0.130228 0.002827 1784.166 129774.1 2002.449 85882.76
2 blues.00001.wav 0.340914 0.09498 0.095948 0.002373 1530.177 375850.1 2039.037 213843.8
3 blues.00002.wav 0.363637 0.085275 0.17557 0.002746 1552.812 156467.6 1747.702 76254.19
4… blues.00003.wav 0.404785 0.093999 0.141093 0.006346 1070.107 184355.9 1596.413 166441.5
100 blues.00099.wav 0.370215 0.085141 0.105011 0.005345 1538.394 225342.4 1703.282 104428.7
101 classical.00000.wav 0.252392 0.084153 0.036245 0.000221 1505.166 44457.89 1559.006 43682.97
102 classical.00001.wav 0.214995 0.08501 0.030625 0.000161 1360.644 61611.21 1441.243 32378.73
103 classical.00002.wav 0.277958 0.083759 0.04386 0.000193 1490.275 38993.34 1600.116 31200.9
104 classical.00003.wav 0.234229 0.083451 0.029442 0.000357 1526.63 91344.31 1499.439 60196.23

200 classical.00099.wav 0.333908 0.078685 0.010506 4.29E-06 1525.124 46679.59 1869.056 21425.26
201 country.00000.wav 0.384027 0.081182 0.248418 0.000704 2797.845 354673 2847.552 105651.3
202 country.00001.wav 0.414032 0.079332 0.230516 0.000446 2938.155 101837.5 2839.658 40987.08
203 country.00002.wav 0.297045 0.097204 0.146586 0.001544 2308.673 545384.3 2618.607 99595.72
204 country.00003.wav 0.376894 0.083747 0.204364 0.001915 2174.034 570638.9 2280.889 207005.3

300 country.00099.wav 0.380838 0.082651 0.220811 0.004228 2157.477 338757.3 2160.389 87741.51
900 reggae.00099.wav 0.431106 0.081969 0.180177 0.001482 2467.092 454158.6 2006.391 30949.78
901 rock.00000.wav 0.387577 0.085947 0.129127 0.005176 1996.328 253317 2097.081 96097.54

129
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022

902 rock.00001.wav 0.365396 0.092115 0.18047 0.00492 1529.475 226976 1845.615 118302.9
903 rock.00002.wav 0.436806 0.086603 0.148662 0.006555 1875.316 469319.1 1983.974 168248.3
904 rock.00003.wav 0.379949 0.098387 0.151299 0.003987 1421.446 428116.8 1902.678 172163.2

1000 rock.00099.wav 0.358401 0.085884 0.054454 0.000336 1609.795 422203.2 1797.213 120115.6

Proses kerja dari aplikasi klasifikasi musik berdasarkan genre dapat digambarkan dalam
bentuk flowchart seperti terlihat pada gambar berikut:

Gambar 2 Flowchart dari Aplikasi Klasifikasi Musik Berdasarkan Genre

Proses kerja dari metode K-Nearest Neighbor dapat digambarkan dalam bentuk
flowchart seperti terlihat pada gambar berikut:

Gambar 3 Flowchart dari Metode K-Nearest Neighbor

Langkah kerja dari proses klasifikasi musik dapat dirincikan sebagai berikut:
1. Data Selection
Pada tahapan ini akan dilakukan proses pemilihan genre musik yang digunakan untuk
penelitian ini. Di antaranya penulis hanya memilih dan menggunakan 6 genre lagu saja, yaitu
jazz, rock, hiphop, reggae, classical, dan country.
2. Preprocessing / Data Cleaning
Pada tahapan ini akan dilakukan proses pembersihan data-data yang tidak digunakan dengan
penelitian ini.Seperti pemilihan data musik terlebih dahulu, setelah itu dilakukan pengunduhan
100 data musik untuk setiap genre-nya. Dikarenakan ada 6 genre yang akan digunakan penulis
didalam penelitian ini maka akan diperoleh 600 data musik di tahap ini. Dengan adanya data
cleaning, proses pengolahan akan menjadi lebih baik sesuai dengan tujuan penelitian yang akan
dicapai.

130
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022

3. Transformation
Pada tahap ini proses yang dilakukan adalah mengubah format data yang akan diinput,
dikarenakan format data yang digunakan adalah .au maka dilakukan pengubahan format data dari
.wav ke .au . Proses ini akan dilakukan melalui halaman website https://convertio.co/id/wav-au/ .
Dan juga alasan proses ini dilakukan agar sesuai dengan batasan masalah pada penelitian ini.
4. Metode K Nearest Neighbor
Tahapan yang dilakukan untuk melakukan metode K Nearest Neighbor didalam penelitian ini
adalah sebagai berikut :
a. Tentukan parameter k, misalkan ditentukan nilai k = 3.
b. Hitung jarak Euclidean objek terhadap data training.
Misalkan digunakan tiga kriteria untuk melakukan proses klasifikasi.
Dataset yang digunakan adalah sebagai berikut:
Tabel 2 Data training
Kode Filename Genre chroma_stft_mean chroma_stft_var rms_mean
F1 blues.00000.0.wav Blues 0.335406363 0.091048 0.130405
F2 blues.00000.1.wav Blues 0.343065351 0.086147 0.112699
F3 blues.00000.2.wav Blues 0.346814752 0.092243 0.132003
F4 rock.00099.8.wav Rock 0.387527 0.084815 0.06643
F5 rock.00099.9.wav Rock 0.369293 0.086759 0.050524
Misalkan diketahui sebuah musik berikut:
Tabel 3 Yang Akan Dicari
Kode Filename chroma_stft_mean chroma_stft_var rms_mean Genre
F6 blues.00000.3.wav 0.363639 0.086856 0.132565 ?

F6 dengan F1:
𝑑 = √(0.363639 − 0.335406363)2 + (0.086856 − 0.091048)2 + (0.132565 − 0.130405)2
𝑑 = 0.028624
F6 dengan F2:
𝑑 = √(0.363639 − 0.343065351)2 + (0.086856 − 0.086147)2 + (0.132565 − 0.112699)2
𝑑 = 0.028608

F6 dengan F3:
𝑑 = √(0.363639 − 0.346814752)2 + (0.086856 − 0.092243)2 + (0.132565 − 0.132003)2
𝑑 = 0.017675
F6 dengan F4:
𝑑 = √(0.363639 − 0.387527)2 + (0.086856 − 0.084815)2 + (0.132565 − 0.06643)2
𝑑 = 0.070347
F6 dengan F5:

𝑑 = √(0.363639 − 0.369293)2 + (0.086856 − 0.086759)2 + (0.132565 − 0.050524)2


𝑑 = 0.082236
c. Mengurutkan hasil secara ascending.
Hasil pengurutan:
F6 dengan F3 (d = 0.017675)F6 dengan F2 (d = 0.028608)F6 dengan F1 (d = 0.028624)F6
dengan F4 (d = 0.070347)F6 dengan F5 (d = 0.082236)
d. Karena nilai k = 3, maka dipilih tiga nilai teratas dari hasil pengurutan.
Tabel 4 Hasil
Kode Genre
F3 Blues
F2 Blues

131
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022

F1 Blues
e. Ambil jumlah terbanyak dari genre sebagai solusi. Genre Blues memiliki jumlah =
3, sehingga lagu dengan filenames = ‘blues.00000.3.wav’ memiliki genre Blues.

4. KESIMPULAN
Dari pembahasan pada bab-bab sebelumnya, maka akhirnya pada penelitian tugas
akhir ini dapat diambil beberapa kesimpulan, antara lain adalah bahwa Aplikasi klasifikasi musik
dapat memberikan pengetahuan dan menambah wawasan bagi pengguna (user) terutama dalam
membedakan jenis musik. Dengan menerapkan metode KNN, proses pendeteksian jenis musik
dapat dilakukan, untuk kemudian dilakukan proses klasifikasi. Penerapan metode KNN pada
aplikasi yang dibangun dapat melakukan pendeteksian jenis musik berdasarkan genre musik.

DAFTAR PUSTAKA
[1] Suyanto. (2017). Data mining : untuk klasifikasi dan klasterisasi data / Suyanto.
Bandung : Penerbit Informatika, 2017.
[2] Pandu Deski Prasetyo, I. G. (2019). Klasifikasi Genre Musik Menggunakan Metode Mel
Frequency Cepstrum Coefficients (MFCC) dan K-Nearest Neighbor (KNN).
[3] Kaminskas, M. &. (2012). Contextual Music Information Retrieval and Recommendation:
State of The Art and Challenges.
[4] Novianti, R. E. (2014). CLUSTERING MUSIK DENGAN MENGGUNAKAN MEL
FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN SELF ORGANIZING MAPS
(SOM).
[5] Beauchamp, T. L., & Childress, J. F. (2012). Principles of biomedical ethics.

132

Anda mungkin juga menyukai