Anda di halaman 1dari 4

PENERAPAN JARINGAN SYARAF TIRUAN DENGAN RADIAL BASIS

FUNCTION UNTUK PENGENALAN GENRE MUSIK


Tangguh Gradhianta♠, Dr. Yusuf Fuad, M. App. Sc. ♠

Jurusan Matematika, Fakultas Matematika dan Ilmu Pengetauhan Alam, Universitas Negeri Surabaya
60231
email : t.gradhianta@gmail.com

ABSTRAK JST bermanfaat semisal untuk pengklasifikasian


dan peramalan. Pada JST terdapat dua jenis
Kecerdasan buatan dapat diaplikasikan pembelajaran yaitu metode tanpa pengawasan
dalam banyak bidang dalam kehidupan. Penerapan (unsupervised learning method) dan metode dengan
kecerdasan buatan diantaranya dapat dicapai dengan pengawasan (supervised learning method). Salah
pendekatan jaringan syaraf tiruan (JST). Salah satu satu contoh metode JST diantaranya radial basis
contoh metode jaringan syaraf tiruan yang dikenal function (RBF) dimana JST RBF memiliki dua
adalah metode radial basis function (RBF). tahap pembelajaran yaitu metode tanpa pengawasan
Jaringan syaraf tiruan radial basis function (JST yang menghasilkan bobot latih dan tahap kedua
RBF) dikenal sebagai salah satu jaringan syaraf yaitu metode dengan pengawasan yang
yang memiliki tiga lapis bersifat feedforward yang membuahkan solusi linier [1].
dapat memecahkan masalah klasifikasi atau Salah satu contoh aplikasi JST RBF adalah
pengenalan pola. Dalam penelitian ini JST RBF seperti dalam Turnbull dan Elkan (2005) dengan
digunakan untuk menglasifikasi musik ke dalam artikel berjudul “Fast Recognition of Musical
genre (jenis) musik berdasarkan kedekatannya Genres Using RBF Networks”. Dalam salah satu
dengan target. Sebagai kebutuhan, jenis musik yang percobaaan JST RBF tersebut digunakan 800 data
dipakai pada penelitian ini adalah campursari, latih dan 200 data uji dengan 90 neuron pada lapis
keroncong, pop, dan rock dengan 3 macam durasi tersembunyi yang menghasilkan akurasi pengenalan
yaitu 2 detik, 5 detik, dan 10 detik pada setiap jenis musik sebesar 71,5%. Pada percobaan ini,
musik. Sedangkan banyak neuron yang dapakai salah satu cara untuk menginisialisasi parameter
dalam lapisan tersembunyi sebanyak 56 neuron. fungsi basis adalah dengan menggunakan algoritma
Bahan masukan (input) yang digunakan dalam JST kmeans. Input yang digunakan adalah hasil
RBF ini berformat *.mp3 yang diunduh dari internet ekstraksi dengan algoritma mel-frequency cepstrum
yang selanjutnya dikonversi ke dalam format *.wav coefficients (MFCC) sehingga menghasilkan vektor
dan diektraksi dengan menggunakan mel-frequency ciri audio.
cepstrum coeffisients (MFCC). Teknik ini Ciri khas suatu musik dapat diketahui dari
mengekstraksi fitur suara yang terdapat pada data refrain. Refrain atau chorus adalah bagian musik
musik. Koefisien yang digunakan dalam penelitian yang paling representatif dan menonjol secara
ini sebanyak 7 koefisien untuk setiap data musik. tematis dari sebuah lagu. Bagian ini sering diulangi
Dari hasil simulasi program menunjukkan bahwa dan merupakan kesan dari sebuah lagu [4]. Oleh
JST RBF dapat mengklasifikasi musik dengan karena itu penulis mengupayakan pengenalan jenis
akurasi paling tinggi pada data uji berdurasi 10 musik dengan pendekatan JST RBF menggunakan
detik sebesar 75%. data musik berupa lagu dimana durasi data diambil
Kata kunci : Genre, jaringan syaraf tiruan, dari awal refrain.
kecerdasan buatan, mel-frequency cepstrum
coefficients, musik, radial basis function. II. DASAR TEORI

I. PENDAHULUAN 2.1. Musik dan Jenis Musik


Kecerdasan buatan merupakan salah satu Musik adalah kombinasi suara yang
bagian pemrograman komputer yang membuat terorganisasi dalam suatu cara dengan ritme,
mesin agar dapat melakukan pekerjaan sebaik melodi, dan harmoni sehingga dapat dinikmati oleh
manusia [6]. Kecerdasan buatan dapat dicapai pendengar. Musik dikembangkan, dimanipulasi dan
dengan pendekatan jaringan syaraf tiruan (JST). dirancang ulang oleh manusia. Pada kenyataannya
musik merupakan fenomena alam yang berakibat pembagian sinyal menjadi beberapa partisi yang
dari prinsip-prinsip matematika dan fisika [2]. Jenis selanjutnya disebut dengan frame. Berikut adalah
(genre) musik adalah kelas suatu musik dengan contoh representasi frame blocking
kumpulan sifat umum yang dibuat melalui persepsi
manusia dengan cara membedakan satu musik
dengan yang lain. Sebuah jenis musik ditandai oleh
struktur instrumentasi dan ritme musik [5].

2.2. Pengenalan Jenis Musik


Seperti klasifikasi sinyal, pengenalan musik
adalah mengenai pengklasifikasian musik ke dalam
M N
beberapa kategori yang telah ditentukan dengan
tujuan mengembangkan sistem dengan input berupa Gambar 2. Ilustrasi frame blocking dengan M = 100
sinyal musik dalam bentuk digital dan output dan N = 256
berupa informasi mengenai keterkaitan input
dengan kelas jenis musik yang beragam. Berikut Langkah 2: Windowing. Untuk setiap frame,
disajikan skema pengenalan jenis musik dilakukan windowing dengan menggunakan
persamaan

Sinyal Output ( ) ( ) ( ) (1)


FX CL
dengan

Gambar 1. Skema Pengenalan jenis musik ( ) ( ) (2)

dimana , ( ) sinyal input, ( )


Desain black box pada skema diatas yang
sinyal hasil windowing, dan ( ) adalah fungsi
menghasilkan output dari sinyal input merupakan
hamming window [7].
subyek penelitian mengenai pengenalan jenis
musik. Pada skema diatas, pengenalan musik adalah
Langkah 3: Fast Fourier transform. Pada tiap
permasalahan klasifikasi yang berisi dua langkah
frame, dihitung FFT hasil windowing dengan
dasar yang harus dilakukan yaitu ekstraksi fitur
persamaan DFT yang telah terdekomposisi menjadi
(feature extraction/FX) dan klasifikasi
FFT yang diterapkan oleh Cooley dan Tukey pada
(classification/CL). Tujuan langkah
1965 [7] yaitu
pengekstraksian fitur adalah untuk memperoleh
informasi penting dari data input. Langkah ( ) ( ) ( ) (3)
klasifikasi bertujuan untuk menemukan kombinasi dengan
nilai fitur yang sesuai dengan kategori yang telah
tersedia [5]. ( ) ∑ ( ) dan
( ) ∑ ( ) ( )
2.3. Ekstraksi Fitur Suara MFCC
dimana ( ) adalah kelompok sinyal berindeks
Untuk membuat suatu perbandingan yang genap dan ( ) adalah kelompok sinyal
selanjutnya dilakukan suatu pengklasifikasian, data berindeks ganjil. Dalam hal ini, banyak titik sampel
musik yang diperoleh harus ditransformasikan harus memenuhi bilangan perpangkatan 2 (radix-2).
supaya informasi yang terkandung dapat diakses.
Proses ini dinamakan dengan ekstraksi fitur. Langkah 4: Mel-frequency wrapping. Proses ini
Metode pengekstraksian yang paling populer adalah dilakukan dengan melibatkan persamaan
mel-frequency cepstrum coefficients (MFCC) yang
didasarkan pada informasi spektrum suara untuk (∑ | ( )| ( )) (4)
menangkap bagian spektrum yang relevan [5].
Algoritma Pengekatraksian fitur dengan dengan | ( )| adalah magnitudo sinyal hasil FFT,
menggunakan MFCC melalui tahapan-tahapan ( ) adalah nilai filter frekuensi, dan
sebagai berikut [3]: ; adalah banyak filter [3].
Langkah 1: Frame blocking. Untuk memudahkan
Langkah 5: Cepstrum. Langkah selanjutnya
dan mempercepat proses analisis suara, dilakukan
menentukan cepstrum atau koeffisien spektral.
Hasil dari proses ini dinamakan mel-frequency Langkah 2: menghitung output tiap fungsi basis.
cepstrum coefficients (MFCC). Persamaan yang Fungsi basis yang digunakan adalah
digunakan adalah fungsi Gaussian yaitu
( ) ‖ ‖
∑ ( ) (5) (‖ ‖) ( ) (6)
dengan . adalah banyaknya dengan adalah input, pusat data ke-
koefisien MFCC yang diinginkan dan adalah dan adalah standar deviasi ke-
banyak filter yang digunakan. Dalam hal ini
dengan adalah banyak pusat data
disebut koefisien ke-j MFCC [3].
Langkah 3: menghitung bobot pelatihan dengan
2.4. Radial Basis Function (RBF) menggunakan persamaan

Jaringan syaraf tiruan metode fungsi basis ̅ ̅ (7)


radial merupakan JST yang memiliki 2 tahap dengan ̅ adalah matriks bobot pelatihan,
pelatihan. Pada tahap awal, parameter fungsi basis adalah pseudo invers matriks Gaussian , dan ̅
ditentukan secara cepat dengan menggunakan adalah vektor target.
unsupervised method yang hanya memerlukan data
input saja. Tahap kedua pelatihan ini adalah Langkah 4: menghitung output JST RBF dengan
membawa hasil dari unit tersembunyi ke unit output menggunakan persamaan
secara linier. Fungsi basis radial merupakan fungsi ̅ ̅ (8)
yang bergantung pada jarak antara data dengan
suatu pusat data. Fungsi basis radial yang dimana ̅ adalah vektor output.
digunakan umunya nonlinier yaitu (‖ ̅ ̅‖) Langkah 5: menghitung galat (error) antara output
dengan ̅ dan ‖ ‖ adalah norm Euclidean dan hasil pelatihan dengan target. Persamaannya yaitu
himpunan vektor ̅
adalah pusat data dari sampel data [1]. (9)
2. Proses Pengujian:
Langkah 1: menentukan pusat data dan standar
deviasi dari data uji.
Langkah 2: menghitung output tiap fungsi basis.
Fungsi basis yang digunakan adalah
fungsi Gaussian yaitu
‖ ‖
(‖ ‖) ( ) (6)

dengan adalah input, pusat data ke-


dan adalah standar
Gambar 3. Ilustrasi Proses JST RBF deviasi ke- dengan
adalah banyak pusat data
Pada gambar diatas, proses dari lapisan input Langkah 3: menghitung output JST RBF untuk
menuju lapisan tersembunyi menggunakan metode data latih dengan persamaan (8) dimana
pembelajaran tidak terawasi (unsupervised bobot yang digunakan adalah hasil
learning) dan proses yang terjadi dari lapisan pelatihan yaitu ̅.
tersembunyi menuju lapisan output menggunakan
metode pembelajaran terawasi (supervised Langkah 4: menghitung galat (error) antara output
learning). Algoritma JST RBF adalah: hasil pengujian dengan target
menggunakan persamaan (9).
1. proses pelatihan :
Langkah 1: menentukan pusat data dan standar III. KESIMPULAN
deviasi dari data latih.
Dari hasil simulasi yang dilakukan,
percobaan ini telah berhasil menerapkan metode
MFCC sebagai pengektraksi ciri data audio yang
digunakan sebagai bahan masukan JST RBF seperti [Online]. http://www.ifp.uiuc.edu/ [Diakses:
yang telah diterapkan oleh [8]. Pada simulasi ini 20 November 2012].
telah menghasilkan akurasi pengenalan jenis musik
sebesar: 54,17% pada data musik berdurasi 2 detik, [4] Goto, Masataka (2006) A Chorus Section
70,83% pada data musik berdurasi 5 detik, dan 75% Method for Musical Audio Signals and its
pada data musik berdurasi 10 detik. Dari hasil Application to a Music Learning Station. IEEE
penelitian ini dapat disimpulkan bahwa akurasi Transactions on Audio, Speech, and Language
pengenalan jenis musik paling tinggi terdapat pada Processing vol. 14 no. 5 [Online].
data musik berdurasi 10 detik dengan rata-rata http://citeseerx.ist.psu.edu [Diakses: 14 April
akurasi sebesar 75%. Hasil ini lebih baik daripada 2103].
hasil penelitian oleh [8] yang menghasilkan akurasi
sebesar 71,5%. [5] Kosina, Karin (2002) Music Genre
Recognition. Skripsi Sarjana. Politeknik
Tabel 1. Prosentase hasil klasifikasi musik dalam % Media Teknologi dan Desain Hagenberg:
Hagenberg, Jerman [Online].
2 detik 5 detik 10 detik
www.music.mcgill.ca [Diakses: 18 Desember
Percobaan 1 54,17% 70,83% 75% 2011].
Percobaan 2 54,17% 70,83% 75%
[6] McCarthy, John (2007) What is Artificial
Percobaan 3 54,17% 70,83% 75% Intelligence?. Artikel. Universitas Stanford:
Amerika Serikat [Online].
54,17% 70,83% 75% http://www.formal.stanford.edu [Diakses: 11
April 2013].
Hasil klasifikasi yang diambil adalah pada [7] Rao, R. K. dan Kim, D. N dkk. (2010) Fast
hasil proses pengujian. Dari tabel tersebut terlihat Fourier Transform: Algorithms and
bahwa hasil klasifikasi yang paling baik terdapat Applications. Springer: Amerika Serikat.
pada implementasi algoritma jaringan syaraf tiruan
RBF dengan menggunakan data musik berdurasi 10 [8] Turnbull, Douglas dan Elkan, Charles (2005)
detik dengan presentase akurasi sebesar 75%. Fast Recognition of Musical Genres Using
RBF Networks. IEEE Transactions of
IV. SARAN Knowledge and Data Enginering Vol. 17 No.
4 [Online]. web.cs.swarthmore.edu/~turnbull
Saran dari penulis yang dapat diberikan
[10 Januari 2011].
untuk penelitian selanjutnya yang berkaitan adalah
dapat diupayakannya suatu variasi dalam penelitian
tersebut baik dari segi metode pengekstraksian,
banyaknya jenis musik, banyak data musik, banyak
durasi, dan banyak neuron yang digunakan pada
penelitian yang terkait baik dengan menggunakan
spesifikasi komputer yang sama maupun berbeda.

DAFTAR PUSTAKA

[1] Bishop, Christian M. (1995) Neural Networks


for Pattern Recognition. Universitas Aston:
Birmingham, Britania Raya.

[2] David Jr, Jack H. (1995) The Mathematics of


Music. Paper Math 1513.5097 [Online].
http://jackhdavid.thehouseofdavid.com
[Diakses: 11 April 2013].

[3] Do, Minh (1994) DSP Mini-Project: An


Automatic Speaker Recognition System

Anda mungkin juga menyukai