Mimi Tantono
535020172
Speech Recognition
(Pengenalan Suara)
Adalah proses yang dilakukan komputer
untuk mengidentifikasikan kata-kata yang
diucapkan kepadanya.
Sistem pengenalan suara isolated
utterances: mengenali suatu kata sebagai
perintah kepada sistem untuk melakukan
fungsi atau aksi tertentu sesuai dengan arti
kata.
Sistem Pengenalan Suara
Sinyal Percakapan
Sinyal yang dihasilkan dari suara manusia sewaktu melakukan
percakapan.
Vocal Tract: mulut, lidah, gigi, bibir, dan langit-langit.
Metode Linear Predictive
Coding (LPC)
Transformasi Fourier
Inverse DFT
N −1
1
x ( n) =
N
∑ X
k =0
( k ) e j 2πnk / N
Momentum Back Propagation
Neural Network (MBPNN)
Back Propagation Neural Network (BPNN)
dikembangkan oleh Rumelhart, Hinton, dan
Williams pada tahun 1986
MBPNN merupakan JST dengan
pembelajaran yang supervised, artinya data
pembelajaran terdiri dari vektor pasangan
input dan target (output yang diharapkan).
Arsitektur MBPNN
Self Organizing Maps
Self Organizing Maps (SOM)
dikembangkan pada tahun 1982 oleh
Teuvo Kohonen dari The Academy of
Finland.
SOM menggunakan metode pembelajaran
unsupervised, artinya di dalam melakukan
pembelajaran tidak menggunakan data
output sebagai target pembelajaran.
Arsitektur SOM
Rumusan Hipotesis
Sinyal
suara Ekstraksi Koefisien Nilai Output (dalam bentuk
Fast Fourier Jaringan
digital fitur cepstral spektral teks kata)
Transform Saraf
(LPC) (FFT) Tiruan
10
8
Jumlah 6
keberhasilan
per kata 4 MBPNN
SOM
2
0
Model 1 Model 2 Model 3
Model
Kesimpulan