DISUSUN OLEH :
2014
KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Allah SWT. karena rahmat serta
hidayah-Nyalah sehingga kami dapat menyusun makalah yang berjudul “Speech
Recognition”. Makalah ini kami buat dengan tujuan menjelaskan secara sederhana
tentang Speech recognition khususnya bagi mahasiswa – mahasiswa yang bergelut di
dunia kecerdasan buatan. Makalah ini juga membantu untuk lebih jauh mengetahui
tentang speech recognition.
Kami juga tak lupa mengucapkan terima kasih kepada segenap pihak yang
telah banyak membantu, mendorong dan membina kami sehingga dapat
menyelesaikan makalah ini. Seperti pepatah yang mengatakan bahwa “tak ada gading
yang tak retak“ seperti pula makalah ini tentu banyak kekurangan dan kesalahan.
Karena itu para pembaca khususnya Dosen mata kuliah ini, dimohon kritik dan saran
yang bersifat membangun untuk penyempurnaan makalah kami yang selanjutnya.
Penyusun
DAFTAR ISI
HALAMAN JUDUL i
KATA PENGANTAR ii
BAB I PENDAHULUAN 1
A. Latar Belakang 1
B. Rumusan Masalah 2
C. Manfaat Pembahasan 3
BAB II PEMBAHASAN 5
A. Kesimpulan 13
DAFTAR PUSTAKA 14
BAB I
PENDAHULUAN
A. Latar Belakang
Hadirnya teknologi informasi berdampak pada perubahan dan menjadikan
mudahnya melakukan pekerjaan-pekerjaan manusia dalam berbagai bidang, seperti :
sektor bisnis, sektor pemerintahan dan sektor lainnya. Teknologi pada dasarnya
dibuat dan dikembangkan sebagai alat utnuk membantu manusia, tetapi apakah semua
manusia dapat merasakanya atau dapat menggunakan produk teknology yang selama
ini dikembangkan. Sebagai manusia yang memiliki panca indera yang utuh dan
sempurna mungkin tidak masalah dalam menggunakan produk teknologi. Lalu
bagaimana dengan mereka yang tidak memiliki panca indera yang utuh ? oleh sebab
itu dengan memanfaatkan teknologi speech recognition diharapkan dapat
menyelesaikan permasalahan diatas dan lebih memudahkan manusia dalam
melakukan pekerjaan manusia dalam berbagai bidang.
B. Rumusan Masalah
1. Jelaskan apa itu Speech Recognition !
2. Jelaskan Sejarah Speech Recognition ?
3. Bagaimana Skema Utama dan Algoritmanya ?
4. Bagaimana Implementasinya ?
C. Manfaat Pembahasan
1. Untuk mengetahui Apa itu Speech Recogition.
2. Untuk mengetahui sejarah dari penemuan Speech Recognition.
3. Untuk mengetahui skema serta algoritma Speech Recognition.
4. Untuk mengetahui Implementasi dari Speech Recognition.
BAB II
PEMBAHASAN
Keuntungan dari sistem ini adalah pada kecepatan dan kemudahan dalam
penggunaannya. Kata – kata yang ditangkap dan dikenali bisa jadi sebagai hasil akhir,
untuk sebuah aplikasi seperti command & control, penginputan data, dan persiapan
dokumen. Parameter yang dibandingkan ialah tingkat penekanan suara yang
kemudian akan dicocokkan dengan template database yang tersedia. Sedangkan
sistem pengenalan suara berdasarkan orang yang berbicara dinamakan speaker
recognition. Pada makalah ini hanya akan dibahas mengenai speech recognition
karena kompleksitas algoritma yang diimplementasikan lebih sederhana daripada
speaker recognition.
Metode Hidden Markov Model mulai diperkenalkan dan dipelajari pada akhir
tahun 1960, metode yang berupa model statistik dari rantai Markov ini semakin
banyak dipakai pada tahun-tahun terakhir terutama dalam bidang speech recognition,
seperti dijelaskan oleh Lawrence R. Rabiner dalam laporannya yang berjudul “A
Tutorial on Hidden Markov Models and Selected Applications in Speech
Recognition”
Proses dalam dunia nyata secara umum menghasilkan observable output yang
dapat dikarakterisasikan sebagai signal. Signal bisa bersifat diskrit (karakter dalam
alfabet) maupun kontinu (pengukuran temperatur, alunan musik). Signal bisa bersifat
stabil (nilai statistiknya tidak berubah terhadap waktu) maupun nonstabil (nilai signal
berubah-ubah terhadap waktu). Dengan melakukan pemodelan terhadap signal secara
benar, dapat dilakukan simulasi terhadap sumber dan pelatihan sebanyak mungkin
melalui proses simulasi tersebut. Sehingga model dapat diterapkan dalam sistem
prediksi, sistem pengenalan, maupun sistem identifikasi. Secara garis besar model
signal dapat dikategorikan menjadi 2 golongan yaitu : model deterministik dan model
statistikal. Model deterministik menggunakan nilai-nilai properti dari sebuah signal
seperti : amplitudo, frekuensi, fase dari gelombang sinus. Sedangkan model statistikal
menggunakan nilai-nilai statistik dari sebuah signal seperti: proses Gaussian, proses
Poisson, proses Markov, dan proses Hidden Markov.
N, yaitu jumlah state dalam model. Secara umum state saling terhubung satu
dengan yang lain, dan suatu state bisa mencapai semua state yang lain dan
sebaliknya (disebut model ergodic). Namun hal tersebut tidak mutlak, terdapat
kondisi lain dimana suatu state hanya bisa berputar ke diri sendiri dan
berpindah ke satu state berikutnya, hal ini bergantung pada implementasi dari
model.
State Transition Probability { } -> ij A a
Observation Symbol Probability pada state j, { } () -> j Bb k
Initial State Distribution -> i p p
Spektrum Suara
Sebelumnya, data suara masukan dipilah-pilah dan diproses satu per satu berdasarkan
urutannya. Pemilahan ini dilakukan agar proses analisis dapat dilakukan secara
paralel. Proses yang pertama kali dilakukan ialah memproses gelombang kontinu
spektrum suara ke dalam bentuk diskrit. Langkah berikutnya ialah proses kalkulasi
yang dibagi menjadi dua bagian :
Dari tiap elemen array data tersebut, dikonversi ke dalam bentuk bilangan biner. Data
biner tersebut yang nantinya akan dibandingkan dengan template data suara.
Proses divide and conquer:
Banyak aplikasi Electronic Medical Records (EMR) dapat menjadi lebih efektif
dan dapat dilakukan lebih mudah bila digunakan dalam hubungannya dengan
pengenalan-mesin bicara. Pencarian, query, dan pengisian formulir semua bisa lebih
cepat untuk melakukan dengan suara dibandingkan dengan menggunakan keyboard.
BAB III
KESIMPULAN
1. http://id.wikipedia.org/wiki/Pengenalan_ucapan
2. http://yanti91.blogspot.com/2012/10/tugas-2-speech-recognition_12.html,
(http://www.ee.columbia.edu/-dpwe/clases/e6820-2006-01/papers/Lipp97-
hummach.pdf,diakses pada 30 november 2014)
5. http://asrindonesia.blogspot.com/
6. http://en.wikipedia.org/wiki/Speech_recognition
7. http://www.informatika.org/~rinaldi/Stmik/2007-
2008/Makalah2008/MakalahIF2251-2008-077.pdf