Abstrak
Musik adalah suara yang disusun sedemikian rupa sehingga mengandung irama, lagu, nada,
dan keharmonisan terutama dari suara yang dihasilkan dari alat- alat yang dapat menghasilkan
irama. Genre musik adalah cara yang paling umum digunakan untuk mengorganisasi database
musik digital. Musik yang berada pada genre yang sama biasanya memiliki kemiripan
karakteristik tertentu yang terkait dengan instrumentasi, struktur ritmis, dan pitch musik. Fitur-
fitur akustik musik yang dapat digunakan untuk klasifikasi berdasarkan genre adalah timbre.
Penelitian ini bertujuan untuk mengkalisifikasikan musik berdasarkan genre dengan
menggunakan metode K Nearest Neighbor (KNN). Mengaitkan genre dengan musik dapat
mempermudah pendengar untuk mengetahui genre musik yang didengar dengan membuat suatu
sistem pengklasifikasian genre yang mengambil sampel data dari GTzan genre collection. Dalam
penelitian ini, penulis membatasi jumlah genre yang dapat diklasifikasikan, yaitu classical,
country, hiphop, jazz, reggae dan rock.
Abstract
Music is sound that is arranged in such a way that it contains rhythm, song, tone, and
harmony, especially from the sound produced by the instruments that can produce the rhythm.
Music genre is the most commonly used way to organize a digital music database. Music in the
same genre usually bears certain similar characteristics related to instrumentation, rhythmic
structure, and musical pitch. Music acoustic features that can be used for classification by genre
are timbre.
This study aims to classify music by genre using the K Nearest Neighbor (KNN) method.
Linking genres to music can make it easier for listeners to know the genre of music being heard
by creating a genre classification system that takes data samples from the GTzan genre collection.
In this study, the author decides the number of genres that can be supported, namely classical,
country, hiphop, jazz, reggae and rock.
1. PENDAHULUAN
Data mining merupakan gabungan sejumlah disiplin ilmu komputer yang didefinisikan
sebagai proses penemuan pola-pola baru dari kumpulan-kumpulan data sangat besar, meliputi
metode -metode yang merupakan irisan dari artificial intelligence, machine learning, statistics,
dan database systems [1].
Algoritma K Nearest Neighbor (KNN) adalah sebuah metode klasifikasi terhadap sekumpulan
data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Termasuk dalam
supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan
mayoritas kedekatan jarak dari kategori yang ada dalam KNN [2].
Received: 29-09-2022
Accepted: 10-10-2022
126
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022
2. METODE PENELITIAN
Pada tahapan ini dilakukan proses untuk melakukan, menentukan, menganalisa, mengolah,
mengembangkan serta menguji permasalahan pada penelitian dengan menggunakan cara-cara
yang ilmiah. Adapun tahapan kerangka kerja penelitian penulis sebagai berikut:
Berdasarkan tahapan kerangka kerja penelitian pada gambar 1, maka akan dijelaskan masing-
masing tahapan kerangka kerja sebagai berikut:
1. Identifikasi Masalah
Pada tahap ini penulis mengidentifikasi masalah bagaimana melakukan klasifikasi musik
berdasarkan genre dengan menggunakan metode K Nearest Neighbor.Pada dasarnya penelitian
ini dilakukan karena banyaknya pendengar musik tidak mengenali setiap genre musik yang
127
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022
sedang didengarkan, sehingga untuk mempermudah pendengar musik maka dilakukan penelitian
ini agar mempermudah pendengar musik untuk membuat playlist musik berdasarkan genremusik
dan suasana hati pendengar musik tersebut.
2. Pengumpulan Data
a. Data Primer
Data primer diperoleh dengandilakukannya pengunduhan dataset yang sudah tersedia dan
siap pakai.Dataset tersebut bernama GTZAN, dibuat dandigunakan oleh G.Tzanetakis dan P.
Cook.
b. Data Sekunder
Data sekunder diperoleh melalui studi literatur yang dilakukan dengan cara mencari
referensi dari internet, buku dan jurnal-jurnal mengenai penelitian- penelitian tentang
klasifikasi musik berdasarkan genre. Selain itu, dilakukan pencarian tentang algoritma
klasifikasi K-Nearest Neighbor serta pengaplikasiannya pada klasifikasi musik.
3. Data Mining
Berikut penjelasan tahap-tahapanya akan dibahas sebagai berikut.
a. Data Selection
Pada tahapan ini akan dilakukan proses pemilihan genre musik yang digunakan untuk
penelitian ini. Di antaranya penulis hanya memilih dan menggunakan 6 genre lagu saja, yaitu
jazz, rock, hiphop, reggae, classical, dan country.
b. Preprocessing
Pada tahapan ini akan dilakukan proses pembersihan data-data yang tidak digunakan
dengan penelitian ini. Seperti pemilihan data musik terlebih dahulu, setelah itu dilakukan
pengunduhan 100 data musik untuk setiap genre-nya. Dikarenakan ada 6 genre yang akan
digunakan penulis didalam penelitian ini maka akan diperoleh 600 data musik di tahap ini.
Dengan adanya data cleaning, proses pengolahan akan menjadi lebih baik sesuai dengan tujuan
penelitian yang akan dicapai.
c. Transformation
Coding adalah proses transformasi pada data yang telah dipilih, sehingga data tersebut
sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif dan
sangat bergantung pada jenis atau pola informasi yang akan dicari dalam basis data.
d. K Nearest Neighbor
KNN yaitu sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran
data yang sudah diklasifikasikan sebelumya. Untuk membuat sebuah prediksi dengan metode
K-NN yaitu dengan cara mendefinisikan metrik untuk mengukur jarak antara query point dan
kasus. Dengan demikian dekat atau jauhnya jarak bisa dihitung berdasarkan Euclidean
Distance.
Tahapan langkah menggunakan metode tersebut :
1) Menentukan parameter k (jumlah tetangga paling dekat).
2) Menghitung kuadrat jarak euclidean objek terhadap data training yang diberikan.
3) Mengurutkan hasil No 2 secara ascending (berurutan dari nilai tinggi ke rendah)
4) Mengumpulkan kategori Y (Klasifikasi nearest neighbor berdasarkan nilai k).
e. Pattern Evaluation
Pada tahap ini penulis mencakup pemeriksaan apakah pola atau informasi yang ditemukan
bertentangan dengan fakta atau hipotesis yang ada sebelumnya.
4. Rancangan Sistem
Dalam tahap perancangan dan design sistem ini yang dilakukan oleh penulis adalah sebagai
berikut:
a. Perancangan Interface
Pada tahap ini dilakukan perancangan bentuk interface GUI (Graphical User Interface)
program yang dibuat, perancangan interface GUI (Graphical User Interface) ini meliputi
128
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022
perancangan tampilan (form) yang diinginkan serta menu-menu yang terdapat dalam
program nantinya.
b. Basis Data
Bahasa yang digunakan dalam perancangan basis datayaitu UMLyaitu digunakan untuk
merancangkan bentuk pembuatan diagram UseCase, Activity,dan Class.
c. Data Base
Untuk data yang digunakan dalam penelitian ini diambil dari data set GTZAN Genre
collection (G. Tzanetakis and p.cook) yang dapat di download melalui halaman web
https://www.kaggle.com/andradaolteanu/gtzan-dataset-music-genre-classification.
5. Pengembangan Aplikasi
Aplikasi akan dikembangkan dengan menggunakan bahasa pemrograman Microsoft Visual
C# 2013.
6. Pengujian Sistem
Untuk pengujian sistem digunakan parameter akurasi untuk memperkirakan hasil
pengelompokkan. Akurasi adalah ukuran ketepatan sistem dalam mengenali input yang diberikan
sehingga menghasilkan keluaran yangbenar . Akurasi tersebut didapat dari perhitungan:
Semakin tinggi akurasi sistem menunjukkan bahwa sistem memiliki kinerja yangbaik karena
mampu mengenali masukan yang diberikan.
7. Implementasi
Tahap ini memiliki tujuan yaitu untuk mendapatkan hasil dari pengklasifikasian musik
berdasarkan genre musik tersebut. Untuk mendapatkan hasil yang diinginkan maka data akan di
ekstraksi dan kemudian dilakukan proses pengklasifikasian yang akan dilakukan implementasi
dari metode K Nearest Neighbor.
129
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022
902 rock.00001.wav 0.365396 0.092115 0.18047 0.00492 1529.475 226976 1845.615 118302.9
903 rock.00002.wav 0.436806 0.086603 0.148662 0.006555 1875.316 469319.1 1983.974 168248.3
904 rock.00003.wav 0.379949 0.098387 0.151299 0.003987 1421.446 428116.8 1902.678 172163.2
…
1000 rock.00099.wav 0.358401 0.085884 0.054454 0.000336 1609.795 422203.2 1797.213 120115.6
Proses kerja dari aplikasi klasifikasi musik berdasarkan genre dapat digambarkan dalam
bentuk flowchart seperti terlihat pada gambar berikut:
Proses kerja dari metode K-Nearest Neighbor dapat digambarkan dalam bentuk
flowchart seperti terlihat pada gambar berikut:
Langkah kerja dari proses klasifikasi musik dapat dirincikan sebagai berikut:
1. Data Selection
Pada tahapan ini akan dilakukan proses pemilihan genre musik yang digunakan untuk
penelitian ini. Di antaranya penulis hanya memilih dan menggunakan 6 genre lagu saja, yaitu
jazz, rock, hiphop, reggae, classical, dan country.
2. Preprocessing / Data Cleaning
Pada tahapan ini akan dilakukan proses pembersihan data-data yang tidak digunakan dengan
penelitian ini.Seperti pemilihan data musik terlebih dahulu, setelah itu dilakukan pengunduhan
100 data musik untuk setiap genre-nya. Dikarenakan ada 6 genre yang akan digunakan penulis
didalam penelitian ini maka akan diperoleh 600 data musik di tahap ini. Dengan adanya data
cleaning, proses pengolahan akan menjadi lebih baik sesuai dengan tujuan penelitian yang akan
dicapai.
130
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022
3. Transformation
Pada tahap ini proses yang dilakukan adalah mengubah format data yang akan diinput,
dikarenakan format data yang digunakan adalah .au maka dilakukan pengubahan format data dari
.wav ke .au . Proses ini akan dilakukan melalui halaman website https://convertio.co/id/wav-au/ .
Dan juga alasan proses ini dilakukan agar sesuai dengan batasan masalah pada penelitian ini.
4. Metode K Nearest Neighbor
Tahapan yang dilakukan untuk melakukan metode K Nearest Neighbor didalam penelitian ini
adalah sebagai berikut :
a. Tentukan parameter k, misalkan ditentukan nilai k = 3.
b. Hitung jarak Euclidean objek terhadap data training.
Misalkan digunakan tiga kriteria untuk melakukan proses klasifikasi.
Dataset yang digunakan adalah sebagai berikut:
Tabel 2 Data training
Kode Filename Genre chroma_stft_mean chroma_stft_var rms_mean
F1 blues.00000.0.wav Blues 0.335406363 0.091048 0.130405
F2 blues.00000.1.wav Blues 0.343065351 0.086147 0.112699
F3 blues.00000.2.wav Blues 0.346814752 0.092243 0.132003
F4 rock.00099.8.wav Rock 0.387527 0.084815 0.06643
F5 rock.00099.9.wav Rock 0.369293 0.086759 0.050524
Misalkan diketahui sebuah musik berikut:
Tabel 3 Yang Akan Dicari
Kode Filename chroma_stft_mean chroma_stft_var rms_mean Genre
F6 blues.00000.3.wav 0.363639 0.086856 0.132565 ?
F6 dengan F1:
𝑑 = √(0.363639 − 0.335406363)2 + (0.086856 − 0.091048)2 + (0.132565 − 0.130405)2
𝑑 = 0.028624
F6 dengan F2:
𝑑 = √(0.363639 − 0.343065351)2 + (0.086856 − 0.086147)2 + (0.132565 − 0.112699)2
𝑑 = 0.028608
F6 dengan F3:
𝑑 = √(0.363639 − 0.346814752)2 + (0.086856 − 0.092243)2 + (0.132565 − 0.132003)2
𝑑 = 0.017675
F6 dengan F4:
𝑑 = √(0.363639 − 0.387527)2 + (0.086856 − 0.084815)2 + (0.132565 − 0.06643)2
𝑑 = 0.070347
F6 dengan F5:
131
JITSINET e-ISSN: 2962-7753
Jurnal Information Technology, Software Engineering and Networking
Volume 1, Nomor 2, Oktober 2022
F1 Blues
e. Ambil jumlah terbanyak dari genre sebagai solusi. Genre Blues memiliki jumlah =
3, sehingga lagu dengan filenames = ‘blues.00000.3.wav’ memiliki genre Blues.
4. KESIMPULAN
Dari pembahasan pada bab-bab sebelumnya, maka akhirnya pada penelitian tugas
akhir ini dapat diambil beberapa kesimpulan, antara lain adalah bahwa Aplikasi klasifikasi musik
dapat memberikan pengetahuan dan menambah wawasan bagi pengguna (user) terutama dalam
membedakan jenis musik. Dengan menerapkan metode KNN, proses pendeteksian jenis musik
dapat dilakukan, untuk kemudian dilakukan proses klasifikasi. Penerapan metode KNN pada
aplikasi yang dibangun dapat melakukan pendeteksian jenis musik berdasarkan genre musik.
DAFTAR PUSTAKA
[1] Suyanto. (2017). Data mining : untuk klasifikasi dan klasterisasi data / Suyanto.
Bandung : Penerbit Informatika, 2017.
[2] Pandu Deski Prasetyo, I. G. (2019). Klasifikasi Genre Musik Menggunakan Metode Mel
Frequency Cepstrum Coefficients (MFCC) dan K-Nearest Neighbor (KNN).
[3] Kaminskas, M. &. (2012). Contextual Music Information Retrieval and Recommendation:
State of The Art and Challenges.
[4] Novianti, R. E. (2014). CLUSTERING MUSIK DENGAN MENGGUNAKAN MEL
FREQUENCY CEPSTRAL COEFFICIENT (MFCC) DAN SELF ORGANIZING MAPS
(SOM).
[5] Beauchamp, T. L., & Childress, J. F. (2012). Principles of biomedical ethics.
132