Speech Recognition

Perbandingan Keakuratan
Antara Jaringan Saraf

Tiruan Back Propagation
dan Self Organizing Maps
Untuk Speech Recognition
Mimi Tantono
535020172
Speech Recognition
(Pengenalan Suara)
 Adalah proses yang dilakukan komputer
untuk mengidentifikasikan kata-kata yang
diucapkan kepadanya.
 Sistem pengenalan suara isolated
utterances: mengenali suatu kata sebagai
perintah kepada sistem untuk melakukan
fungsi atau aksi tertentu sesuai dengan arti
kata.
Sistem Pengenalan Suara
 Ekstraksi fitur: mengkompresi informasi dalam

ucapan.
 Pengenalan: menentukan keluaran dari sistem,
dapat digunakan jaringan saraf tiruan
Tujuan Penelitian
 Membandingkan kinerja antara JST

MBPNN dan JST SOM dalam hal
akurasi bila digunakan untuk
pengenalan suara.
Sinyal Percakapan dan Sistem
Produksi Suara
 Sinyal Percakapan
Sinyal yang dihasilkan dari suara manusia sewaktu melakukan
percakapan.
 Vocal Tract: mulut, lidah, gigi, bibir, dan langit-langit.
Metode Linear Predictive
Coding (LPC)
Transformasi Fourier
 Transformasi Fourier merupakan metode untuk

transformasi sinyal domain waktu menjadi sinyal
domain frekuensi.
 Untuk transformasi terhadap sinyal diskrit,
digunakan Discrete Fourier Transform (DFT).
 DFT N −1
X (k ) = ∑ x(n)e − j 2πnk / N
n =0
 Inverse DFT
N −1
1
x ( n) =
N
∑ X
k =0
( k ) e j 2πnk / N
Momentum Back Propagation
Neural Network (MBPNN)
 Back Propagation Neural Network (BPNN)
dikembangkan oleh Rumelhart, Hinton, dan
Williams pada tahun 1986
 MBPNN merupakan JST dengan
pembelajaran yang supervised, artinya data
pembelajaran terdiri dari vektor pasangan
input dan target (output yang diharapkan).
Arsitektur MBPNN
Self Organizing Maps
 Self Organizing Maps (SOM)
dikembangkan pada tahun 1982 oleh
Teuvo Kohonen dari The Academy of
Finland.
 SOM menggunakan metode pembelajaran
unsupervised, artinya di dalam melakukan
pembelajaran tidak menggunakan data
output sebagai target pembelajaran.
Arsitektur SOM
Rumusan Hipotesis
 JST MBPNN memberikan tingkat akurasi

pengenalan yang lebih tinggi daripada JST
SOM untuk pengenalan suara dengan
ekstraksi fitur menggunakan metode LPC
dan transformasi FFT
Rancangan Penelitian (1)
 Sampel suara yang digunakan adalah 300
buah sinyal digital yang direkam untuk 30
buah kata masing-masing diucapkan oleh 10
orang.
 Percobaan dilakukan terhadap model 1, 2,
dan 3 yang masing-masing terdiri dari 10
kata. Untuk masing-masing model, dilakukan
pembelajaran terhadap 80 sinyal suara dan
pengenalan terhadap 100 sinyal suara.
 Model 1 terdiri dari kata “nol”, “satu”, “dua”,
“tiga”, “empat”, “lima”, “enam”, “tujuh”,
“delapan”, dan “sembilan”.
 Model 2 terdiri dari kata “maju”, “mundur”,
“kiri”, “kanan”, “atas”, “bawah”, “naik”, “turun”,
“buka” dan “tutup”.
 Model 3 terdiri dari kata “barat”, “utara”,
“timur”, “selatan”, “tarik”, “dorong”, “tambah”,
“kurang”, “kali”, dan “bagi”.
Sinyal
suara Ekstraksi Koefisien Nilai Output (dalam bentuk
Fast Fourier Jaringan
digital fitur cepstral spektral teks kata)
Transform Saraf
(LPC) (FFT) Tiruan
 Perangkat keras : PC dengan prosesor AMD Duron

950 MHz dan memori 352 MB.
 Perangkat lunak : Java 2 Platform Standard Edition
(J2SE) versi 1.5.0_01 untuk merancang JST dan
Matlab 6.1 untuk merancang pemrosesan sinyal,
dengan sistem operasi Windows XP.
Teknik Analisis Data
 Hipotesis Statistika
H0 : µXm = µXs
H1 : µXm > µXs
 Keterangan:
µXm = jumlah keberhasilan pengenalan

suara menggunakan JST MBPNN.
µXs = jumlah keberhasilan pengenalan
suara menggunakan JST SOM.
Tampilan Program
Tabel Rata-rata jumlah
keberhasilan
Jaringan Saraf Rata-rata
Simpangan
Model jumlah
baku
Tiruan keberhasilan
MBPNN 8.6 0.516398

Model 1
SOM 3.2 2.043961
MBPNN 8.5 0.707107

Model 2
SOM 3.1 3.414023
MBPNN 8.3 0.483046

Model 3
SOM 3.1 1.449138
Grafik Rata-Rata Jumlah
Keberhasilan
10
8
Jumlah 6
keberhasilan
per kata 4 MBPNN
SOM
2
0
Model 1 Model 2 Model 3
Model
Kesimpulan
 JST Momentum Back Propagation lebih

akurat dibandingkan dengan jaringan saraf
tiruan Self Organizing Maps jika digunakan
untuk melakukan pengenalan suara
sebagai kata tertentu dengan ekstraksi
parameter menggunakan metode LPC dan
transformasi dengan metode FFT.
Saran
 Penelitian ini dapat dikembangkan
dengan penelitian mengenai
pengenalan suara dengan jaringan
saraf tiruan jenis lainnya seperti time
delay neural network.
 Penelitian ini dapat dilanjutkan
dengan penelitian mengenai
identifikasi dan verifikasi suara.
Penelitian yang Relevan
 Penggunaan JST untuk pengenalan suara, 1998.
 Studi perbandingan antara JST MLP, MOLP,
TDNN, dan SOM untuk pengenalan suara, 1998.
 Pengenalan Suara Manusia dengan Metode LPC
dan JST Back Propagation, 1999.
 Perbandingan Akurasi Prediksi Harga Stok Antara
Back Propagation dan SOM, 2003.
 Perbandingan Keakuratan Pengenalan Pola
Kurva Tertutup Dua Dimensi Antara MBPNN
dengan Kohonen SOM, 2004.
Jaringan Lapis Tunggal
Jaringan Lapis Jamak
Algoritma Momentum Back
Propagation
Algoritma SOM
Sinyal dan Sinyal Digital
 Sinyal
Kuantitas fisik yang bervariasi seiring waktu dan variabel lainnya.
 Sinyal Digital
Sinyal analog yang telah melalui proses sampling, quantization, dan
encoding.
Jaringan Saraf Tiruan
 JST adalah sebuah sistem pemrosesan
informasi yang memiliki karakteristik yang
hampir sama dengan jaringan saraf biologis.
 Karakteristik JST
- Arsitektur jaringan: jaringan lapis jamak dan
jaringan lapis tunggal
- Algoritma pembelajaran: supervised dan
unsupervised
- Fungsi aktivasi

Speech Recognition

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Speech Recognition

Diunggah oleh

Hak Cipta:

Format Tersedia

Perbandingan Keakuratan

Antara Jaringan Saraf

 Ekstraksi fitur: mengkompresi informasi dalam

 Membandingkan kinerja antara JST

 Transformasi Fourier merupakan metode untuk

 JST MBPNN memberikan tingkat akurasi

 Perangkat keras : PC dengan prosesor AMD Duron

µXm = jumlah keberhasilan pengenalan

MBPNN 8.6 0.516398

MBPNN 8.5 0.707107

MBPNN 8.3 0.483046

 JST Momentum Back Propagation lebih

Anda mungkin juga menyukai