Abstrak 13515076
Abstrak 13515076
Oleh
NIM : 13515076
Derau menjadi salah satu penyebab menurunnya akurasi dari sistem pengenal
ucapan. Untuk menangani hal ini, beberapa teknik telah dikembangkan. Salah satu
teknik yang dilakukan adalah dengan menggunakan model akustik berbasis
jaringan saraf tiruan. Convolutional neural network (CNN) merupakan salah satu
varian dari jaringan saraf tiruan yang digunakan dalam pemodelan akustik. Teknik
pre-processing pada sinyal ucapan dapat diterapkan pula untuk meningkatkan
akurasi sistem pengenal ucapan. Cepstral mean and variance normalization
(CMVN) adalah salah satu teknik pre-processing pada sinyal ucapan. Penerapan
CMVN telah terbukti meningkatkan akurasi dari sistem pengenal ucapan.
Pada tugas akhir ini dibangun model akustik berbasis CNN yang dipadukan
dengan teknik CMVN untuk menangani ucapan yang mengandung derau. Dua
model akustik dibuat untuk menangani 2 jenis ucapan, yaitu ucapan yang
mengandung derau babble dan ucapan yang mengandung derau kendaraan.
Ucapan yang digunakan untuk pengujian memiliki nilai SNR (signal-to-noise)
beragam. Nilai akurasi yang didapatkan dari hasil pengujian model CNN
kemudian dibandingkan dengan nilai akurasi dari model berbasis GMM-HMM.
Hasil dari penelitian ini menunjukkan bahwa model akustik yang dibangun
memiliki akurasi yang semakin tinggi, seiring dengan bertambahnya variasi dan
jumlah data latih. Akurasi semakin menurun ketika model diuji menggunakan
ucapan dengan nilai SNR rendah. Hasil pembandingan antara model berbasis
CNN dengan model berbasis GMM-HMM menunjukkan bahwa fitur yang
digunakan pada pemodelan berpengaruh terhadap akurasi model. Model berbasis
CNN yang dibangun dengan fitur FBANK memiliki akurasi yang lebih tinggi jika
dibandingkan dengan model berbasis GMM-HMM yang dibangun dengan fitur
yang sama.
By
NIM : 13515076