PENERAPAN JARINGAN SYARAF TIRUAN DENGAN RADIAL BASIS
FUNCTION UNTUK PENGENALAN GENRE MUSIK
Tangguh Gradhianta♠, Dr. Yusuf Fuad, M. App. Sc. ♠ ♠ Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetauhan Alam, Universitas Negeri Surabaya 60231 email : t.gradhianta@gmail.com
ABSTRAK JST bermanfaat semisal untuk pengklasifikasian
dan peramalan. Pada JST terdapat dua jenis Kecerdasan buatan dapat diaplikasikan pembelajaran yaitu metode tanpa pengawasan dalam banyak bidang dalam kehidupan. Penerapan (unsupervised learning method) dan metode dengan kecerdasan buatan diantaranya dapat dicapai dengan pengawasan (supervised learning method). Salah pendekatan jaringan syaraf tiruan (JST). Salah satu satu contoh metode JST diantaranya radial basis contoh metode jaringan syaraf tiruan yang dikenal function (RBF) dimana JST RBF memiliki dua adalah metode radial basis function (RBF). tahap pembelajaran yaitu metode tanpa pengawasan Jaringan syaraf tiruan radial basis function (JST yang menghasilkan bobot latih dan tahap kedua RBF) dikenal sebagai salah satu jaringan syaraf yaitu metode dengan pengawasan yang yang memiliki tiga lapis bersifat feedforward yang membuahkan solusi linier [1]. dapat memecahkan masalah klasifikasi atau Salah satu contoh aplikasi JST RBF adalah pengenalan pola. Dalam penelitian ini JST RBF seperti dalam Turnbull dan Elkan (2005) dengan digunakan untuk menglasifikasi musik ke dalam artikel berjudul “Fast Recognition of Musical genre (jenis) musik berdasarkan kedekatannya Genres Using RBF Networks”. Dalam salah satu dengan target. Sebagai kebutuhan, jenis musik yang percobaaan JST RBF tersebut digunakan 800 data dipakai pada penelitian ini adalah campursari, latih dan 200 data uji dengan 90 neuron pada lapis keroncong, pop, dan rock dengan 3 macam durasi tersembunyi yang menghasilkan akurasi pengenalan yaitu 2 detik, 5 detik, dan 10 detik pada setiap jenis musik sebesar 71,5%. Pada percobaan ini, musik. Sedangkan banyak neuron yang dapakai salah satu cara untuk menginisialisasi parameter dalam lapisan tersembunyi sebanyak 56 neuron. fungsi basis adalah dengan menggunakan algoritma Bahan masukan (input) yang digunakan dalam JST kmeans. Input yang digunakan adalah hasil RBF ini berformat *.mp3 yang diunduh dari internet ekstraksi dengan algoritma mel-frequency cepstrum yang selanjutnya dikonversi ke dalam format *.wav coefficients (MFCC) sehingga menghasilkan vektor dan diektraksi dengan menggunakan mel-frequency ciri audio. cepstrum coeffisients (MFCC). Teknik ini Ciri khas suatu musik dapat diketahui dari mengekstraksi fitur suara yang terdapat pada data refrain. Refrain atau chorus adalah bagian musik musik. Koefisien yang digunakan dalam penelitian yang paling representatif dan menonjol secara ini sebanyak 7 koefisien untuk setiap data musik. tematis dari sebuah lagu. Bagian ini sering diulangi Dari hasil simulasi program menunjukkan bahwa dan merupakan kesan dari sebuah lagu [4]. Oleh JST RBF dapat mengklasifikasi musik dengan karena itu penulis mengupayakan pengenalan jenis akurasi paling tinggi pada data uji berdurasi 10 musik dengan pendekatan JST RBF menggunakan detik sebesar 75%. data musik berupa lagu dimana durasi data diambil Kata kunci : Genre, jaringan syaraf tiruan, dari awal refrain. kecerdasan buatan, mel-frequency cepstrum coefficients, musik, radial basis function. II. DASAR TEORI
I. PENDAHULUAN 2.1. Musik dan Jenis Musik
Kecerdasan buatan merupakan salah satu Musik adalah kombinasi suara yang bagian pemrograman komputer yang membuat terorganisasi dalam suatu cara dengan ritme, mesin agar dapat melakukan pekerjaan sebaik melodi, dan harmoni sehingga dapat dinikmati oleh manusia [6]. Kecerdasan buatan dapat dicapai pendengar. Musik dikembangkan, dimanipulasi dan dengan pendekatan jaringan syaraf tiruan (JST). dirancang ulang oleh manusia. Pada kenyataannya musik merupakan fenomena alam yang berakibat pembagian sinyal menjadi beberapa partisi yang dari prinsip-prinsip matematika dan fisika [2]. Jenis selanjutnya disebut dengan frame. Berikut adalah (genre) musik adalah kelas suatu musik dengan contoh representasi frame blocking kumpulan sifat umum yang dibuat melalui persepsi manusia dengan cara membedakan satu musik dengan yang lain. Sebuah jenis musik ditandai oleh struktur instrumentasi dan ritme musik [5].
2.2. Pengenalan Jenis Musik
Seperti klasifikasi sinyal, pengenalan musik adalah mengenai pengklasifikasian musik ke dalam M N beberapa kategori yang telah ditentukan dengan tujuan mengembangkan sistem dengan input berupa Gambar 2. Ilustrasi frame blocking dengan M = 100 sinyal musik dalam bentuk digital dan output dan N = 256 berupa informasi mengenai keterkaitan input dengan kelas jenis musik yang beragam. Berikut Langkah 2: Windowing. Untuk setiap frame, disajikan skema pengenalan jenis musik dilakukan windowing dengan menggunakan persamaan
Sinyal Output ( ) ( ) ( ) (1)
FX CL dengan
Gambar 1. Skema Pengenalan jenis musik ( ) ( ) (2)
dimana , ( ) sinyal input, ( )
Desain black box pada skema diatas yang sinyal hasil windowing, dan ( ) adalah fungsi menghasilkan output dari sinyal input merupakan hamming window [7]. subyek penelitian mengenai pengenalan jenis musik. Pada skema diatas, pengenalan musik adalah Langkah 3: Fast Fourier transform. Pada tiap permasalahan klasifikasi yang berisi dua langkah frame, dihitung FFT hasil windowing dengan dasar yang harus dilakukan yaitu ekstraksi fitur persamaan DFT yang telah terdekomposisi menjadi (feature extraction/FX) dan klasifikasi FFT yang diterapkan oleh Cooley dan Tukey pada (classification/CL). Tujuan langkah 1965 [7] yaitu pengekstraksian fitur adalah untuk memperoleh informasi penting dari data input. Langkah ( ) ( ) ( ) (3) klasifikasi bertujuan untuk menemukan kombinasi dengan nilai fitur yang sesuai dengan kategori yang telah tersedia [5]. ( ) ∑ ( ) dan ( ) ∑ ( ) ( ) 2.3. Ekstraksi Fitur Suara MFCC dimana ( ) adalah kelompok sinyal berindeks Untuk membuat suatu perbandingan yang genap dan ( ) adalah kelompok sinyal selanjutnya dilakukan suatu pengklasifikasian, data berindeks ganjil. Dalam hal ini, banyak titik sampel musik yang diperoleh harus ditransformasikan harus memenuhi bilangan perpangkatan 2 (radix-2). supaya informasi yang terkandung dapat diakses. Proses ini dinamakan dengan ekstraksi fitur. Langkah 4: Mel-frequency wrapping. Proses ini Metode pengekstraksian yang paling populer adalah dilakukan dengan melibatkan persamaan mel-frequency cepstrum coefficients (MFCC) yang didasarkan pada informasi spektrum suara untuk (∑ | ( )| ( )) (4) menangkap bagian spektrum yang relevan [5]. Algoritma Pengekatraksian fitur dengan dengan | ( )| adalah magnitudo sinyal hasil FFT, menggunakan MFCC melalui tahapan-tahapan ( ) adalah nilai filter frekuensi, dan sebagai berikut [3]: ; adalah banyak filter [3]. Langkah 1: Frame blocking. Untuk memudahkan Langkah 5: Cepstrum. Langkah selanjutnya dan mempercepat proses analisis suara, dilakukan menentukan cepstrum atau koeffisien spektral. Hasil dari proses ini dinamakan mel-frequency Langkah 2: menghitung output tiap fungsi basis. cepstrum coefficients (MFCC). Persamaan yang Fungsi basis yang digunakan adalah digunakan adalah fungsi Gaussian yaitu ( ) ‖ ‖ ∑ ( ) (5) (‖ ‖) ( ) (6) dengan . adalah banyaknya dengan adalah input, pusat data ke- koefisien MFCC yang diinginkan dan adalah dan adalah standar deviasi ke- banyak filter yang digunakan. Dalam hal ini dengan adalah banyak pusat data disebut koefisien ke-j MFCC [3]. Langkah 3: menghitung bobot pelatihan dengan 2.4. Radial Basis Function (RBF) menggunakan persamaan
Jaringan syaraf tiruan metode fungsi basis ̅ ̅ (7)
radial merupakan JST yang memiliki 2 tahap dengan ̅ adalah matriks bobot pelatihan, pelatihan. Pada tahap awal, parameter fungsi basis adalah pseudo invers matriks Gaussian , dan ̅ ditentukan secara cepat dengan menggunakan adalah vektor target. unsupervised method yang hanya memerlukan data input saja. Tahap kedua pelatihan ini adalah Langkah 4: menghitung output JST RBF dengan membawa hasil dari unit tersembunyi ke unit output menggunakan persamaan secara linier. Fungsi basis radial merupakan fungsi ̅ ̅ (8) yang bergantung pada jarak antara data dengan suatu pusat data. Fungsi basis radial yang dimana ̅ adalah vektor output. digunakan umunya nonlinier yaitu (‖ ̅ ̅‖) Langkah 5: menghitung galat (error) antara output dengan ̅ dan ‖ ‖ adalah norm Euclidean dan hasil pelatihan dengan target. Persamaannya yaitu himpunan vektor ̅ adalah pusat data dari sampel data [1]. (9) 2. Proses Pengujian: Langkah 1: menentukan pusat data dan standar deviasi dari data uji. Langkah 2: menghitung output tiap fungsi basis. Fungsi basis yang digunakan adalah fungsi Gaussian yaitu ‖ ‖ (‖ ‖) ( ) (6)
dengan adalah input, pusat data ke-
dan adalah standar Gambar 3. Ilustrasi Proses JST RBF deviasi ke- dengan adalah banyak pusat data Pada gambar diatas, proses dari lapisan input Langkah 3: menghitung output JST RBF untuk menuju lapisan tersembunyi menggunakan metode data latih dengan persamaan (8) dimana pembelajaran tidak terawasi (unsupervised bobot yang digunakan adalah hasil learning) dan proses yang terjadi dari lapisan pelatihan yaitu ̅. tersembunyi menuju lapisan output menggunakan metode pembelajaran terawasi (supervised Langkah 4: menghitung galat (error) antara output learning). Algoritma JST RBF adalah: hasil pengujian dengan target menggunakan persamaan (9). 1. proses pelatihan : Langkah 1: menentukan pusat data dan standar III. KESIMPULAN deviasi dari data latih. Dari hasil simulasi yang dilakukan, percobaan ini telah berhasil menerapkan metode MFCC sebagai pengektraksi ciri data audio yang digunakan sebagai bahan masukan JST RBF seperti [Online]. http://www.ifp.uiuc.edu/ [Diakses: yang telah diterapkan oleh [8]. Pada simulasi ini 20 November 2012]. telah menghasilkan akurasi pengenalan jenis musik sebesar: 54,17% pada data musik berdurasi 2 detik, [4] Goto, Masataka (2006) A Chorus Section 70,83% pada data musik berdurasi 5 detik, dan 75% Method for Musical Audio Signals and its pada data musik berdurasi 10 detik. Dari hasil Application to a Music Learning Station. IEEE penelitian ini dapat disimpulkan bahwa akurasi Transactions on Audio, Speech, and Language pengenalan jenis musik paling tinggi terdapat pada Processing vol. 14 no. 5 [Online]. data musik berdurasi 10 detik dengan rata-rata http://citeseerx.ist.psu.edu [Diakses: 14 April akurasi sebesar 75%. Hasil ini lebih baik daripada 2103]. hasil penelitian oleh [8] yang menghasilkan akurasi sebesar 71,5%. [5] Kosina, Karin (2002) Music Genre Recognition. Skripsi Sarjana. Politeknik Tabel 1. Prosentase hasil klasifikasi musik dalam % Media Teknologi dan Desain Hagenberg: Hagenberg, Jerman [Online]. 2 detik 5 detik 10 detik www.music.mcgill.ca [Diakses: 18 Desember Percobaan 1 54,17% 70,83% 75% 2011]. Percobaan 2 54,17% 70,83% 75% [6] McCarthy, John (2007) What is Artificial Percobaan 3 54,17% 70,83% 75% Intelligence?. Artikel. Universitas Stanford: Amerika Serikat [Online]. 54,17% 70,83% 75% http://www.formal.stanford.edu [Diakses: 11 April 2013]. Hasil klasifikasi yang diambil adalah pada [7] Rao, R. K. dan Kim, D. N dkk. (2010) Fast hasil proses pengujian. Dari tabel tersebut terlihat Fourier Transform: Algorithms and bahwa hasil klasifikasi yang paling baik terdapat Applications. Springer: Amerika Serikat. pada implementasi algoritma jaringan syaraf tiruan RBF dengan menggunakan data musik berdurasi 10 [8] Turnbull, Douglas dan Elkan, Charles (2005) detik dengan presentase akurasi sebesar 75%. Fast Recognition of Musical Genres Using RBF Networks. IEEE Transactions of IV. SARAN Knowledge and Data Enginering Vol. 17 No. 4 [Online]. web.cs.swarthmore.edu/~turnbull Saran dari penulis yang dapat diberikan [10 Januari 2011]. untuk penelitian selanjutnya yang berkaitan adalah dapat diupayakannya suatu variasi dalam penelitian tersebut baik dari segi metode pengekstraksian, banyaknya jenis musik, banyak data musik, banyak durasi, dan banyak neuron yang digunakan pada penelitian yang terkait baik dengan menggunakan spesifikasi komputer yang sama maupun berbeda.
DAFTAR PUSTAKA
[1] Bishop, Christian M. (1995) Neural Networks
for Pattern Recognition. Universitas Aston: Birmingham, Britania Raya.
[2] David Jr, Jack H. (1995) The Mathematics of
Music. Paper Math 1513.5097 [Online]. http://jackhdavid.thehouseofdavid.com [Diakses: 11 April 2013].