1
Dalam proses digitalisasi audio, gelombang Sinyal Kontinu
audio melalui dua tahap proses yaitu sampling
dan kuantisasi (Jurafsky & Martin 2000).
Sampling merupakan proses pengambilan nilai
dalam jangka waktu tertentu. Nilai yang Frame Blocking
dimaksud adalah amplitudo, yaitu besarnya
volume suara pada suatu waktu. Proses
sampling menghasilkan sebuah vektor yang frame
menyatakan nilai – nilai hasil sampling. Vektor
tersebut mempunyai panjang yang bergantung
pada lamanya sinyal dan sampling rate yang Windowing
digunakan. Sampling rate sendiri adalah
banyaknya nilai yang diambil setiap detiknya.
Untuk mengukur panjang vektor sinyal,
digunakan rumus beikut:
Fast Fourier
𝑆 = 𝐹𝑠 × 𝑇 Transform
dengan
S = panjang vektor spectrum
𝐹𝑠 = sampling rate (Hertz)
T = panjang sinyal (detik) Mel Frequency
Wrapping
Tahap selanjutnya adalah proses kuantisasi.
Kuantisasi bertujuan menyimpan nilai
mel spctrum
amplitudo ke dalam representasi nilai 8 bit atau
16 bit (Jurafsky & Martin 2000).
Ekstraksi Ciri Sinyal Audio Cepstrum
2
2. Windowing, pada tahap ini sinyal yang telah 4. Mel-Frequency Wrapping. Berdasarkan
dibagi ke dalam frame dilakukan proses studi psikofisik, persepsi manusia terhadap
windowing untuk meminimalkan frekuensi sinyal audio tidak berupa skala
diskontinuitas sinyal, dengan cara linier. Jadi untuk setiap nada dengan
meminimalkan distorsi spectral dengan frekuensi aktual f (dalam Hertz) dapat
menggunakan window untuk memperkecil diukur tinggi subjektifnya menggunakan
sinyal hingga mendekati nol pada awal dan skala ‘mel’. Skala mel-frequency adalah
akhir tiap frame. Window yang dipakai pada selang frekuensi di bawah 1000 Hz, dan
proses ini adalah Hamming window dengan selang logaritmik untuk frekuensi di atas
persamaan : 1000 Hz. Gambar 5 mengilustrasikan filter
pada proses mel- frequency wrapping.
𝑤 𝑛 = 0,54 − 0,46 𝑐𝑜𝑠 (2𝜋𝑛/(𝑁 − 1))
(1)
Dengan n = 1, 2, 3... N-1 (N adalah jumlah
frame yang digunakan)
Ilustrasi dari Hamming window dapat dilihat
pada Gambar 3.
3
Klasifikasi input (Widodo 2005). Ilustrasi dari jaringan
LVQ dapat dilihat pada Gambar 7.
Klasifikasi merupakan proses menemukan
sekumpulan model (atau fungsi) yang
menggambarkan dan membedakan konsep atau
kelas-kelas data, dengan tujuan agar model
tersebut dapat digunakan untuk memprediksi
kelas dari suatu objek atau data yang label
kelasnya tidak diketahui (Han & Kamber 2001).
Klasifikasi terdiri atas dua tahap, yaitu
pelatihan dan prediksi (klasifikasi). Pada tahap
pelatihan dibentuk sebuah model domain
permasalahan dari setiap instance yang ada.
Penentuan model tersebut berdasarkan analisis
pada sekumpulan data pelatihan, yaitu data yang
label kelasnya telah diketahui. Pada tahap Gambar 7 Arsitektur jaringan LVQ (Widodo
klasifikasi, dilakukan prediksi kelas dari 2005)
instance (kasus) baru yang telah dibuat pada Algoritme pelatihan LVQ bertujuan
tahap pelatihan (Güvnir et al 1998). memperoleh unit output yang paling dekat
Jaringan Syaraf Tiruan dengan vektor input. Bila x dan wc berasal dari
kelas yang sama, maka vektor bobot didekatkan
Jaringan syaraf tiruan (JST) adalah sistem ke vektor input, tetapi apabila berasal dari kelas
pemroses informasi yang memiliki karakteristik yang berbeda, maka vektor bobot akan
mirip dengan jaringan syaraf biologi. JST dijauhkan dengan vektor input.
dibentuk sebagai generalisasi model matematika
dari jaringan syaraf biologi, dengan asumsi Kelebihan dari LVQ adalah:
bahwa: 1. nilai error yang lebih kecil dibandingkan
Pemrosesan informasi terjadi pada banyak dengan jaringan syaraf tiruan seperti
elemen sederhana (neuron). backpropagation.
2. Dapat meringkas data set yang besar
Sinyal dikirimkan di antara neuron-neuron
menjadi vektor codebook berukuran kecil
melalui penghubung-penghubung (sinapsis).
untuk klasifikasi.
Untuk menentukan output, setiap neuron
3. Dimensi dalam codebook tidak dibatasi
menggunakan fungsi aktivasi (Jong 1992).
seperti dalam teknik nearest neighbour.
Arsitektur jaringan syaraf tiruan disajikan 4. Model yang dihasilkan dapat diperbaharui
pada Gambar 6. secara bertahap.
Kekurangan dari LVQ adalah:
1. Dibutuhkan perhitungan jarak untuk seluruh
atribut.
2. Akurasi model dangan bergantung pada
inisialisasi model serta parameter yang
digunakan (learning rate, iterasi, dan
sebagainya).
3. Akurasi juga dipengaruhi distribusi kelas
Gambar 6 Arsitektur JST sederhana (Jong
pada data training.
1992)
4. Sulit untuk menentukan jumlah codebook
Learning Vector Quantization (LVQ) vektor untuk masalah yang diberikan.
Learning Vector Quantization (LVQ) Algoritme LVQ
merupakan suatu metode klasifikasi pola yang
Berikut ini adalah algoritme dari LVQ :
masing-masing unit output mewakili kategori
atau kelas tertentu. Vektor bobot untuk unit Diinisialisasikan nilai bobot, maksimum
output sering disebut vektor referensi untuk epoch, dan learning rate,
kelas yang dinyatakan oleh unit tersebut. LVQ Nilai input (m,n), dan kelas target
mengklasifikasikan vektor input dalam kelas dimasukkan ke dalam vector (1,n)
yang sama dengan unit output yang memiliki Selama kondisi berhenti bernilai salah,
vektor bobot yang paling dekat dengan vektor dilakukan :
4
a. Untuk masing-masing pelatihan Informasi tersebut didapatkan dari buku, jurnal,
vektor input x internet dan artikel-artikel yang membahas
b. Dicari j sehingga ||x-wj|| bernilai klasifikasi genre musik.
minimum
Mulai
c. Perbaiki wj dengan :
1. Jika T = cj maka
wj baru =wj lama + Studi Pustaka
α x-wj lama
Perumusan Masalah
2. Jika T ≠ cj
wj baru =wj lama -
Data Musik
α x-wj lama
Pelatihan Klasifikasi
Evaluasi
Selesai