Anda di halaman 1dari 7

PEMPROSESAN ISYARAT DIGITAL (DSP):

MEMPROSES ISYARAT AUDIO (SPEECH)


• Memproses isyarat audio secara digital adalah
praktikal bagi tujuan-tujuan berikut:
a. Menyimpan (storing) dan menghantar (transmitting)
isyarat audio
• Tujuan utama sistem penghantaran (transmission) secara
digital adalah untuk mengurangkan jumlah data
penghantaran supaya dapat membentuk semula
gelombang asal pada
penerima (receiver).
b. Mempertingkatkan (enhancing) isyarat audio dengan
memperbaiki keseluruhan kualiti dan kemampuan/
kebolehan (intelligibility)isyarat tersebut
• Objektif utama adalah untuk memperbaiki kualiti audio yang
telah menyusut disebabkan oleh persekitaran yang bising.
MEMPROSES ISYARAT AUDIO (SPEECH)
• Memproses isyarat audio secara digital adalah
praktikal bagi tujuan-tujuan berikut:
c. Menjana (generating) atau mengabungkan
(synthesizing) bentuk-bentuk gelombang yang
hampir menyerupai/menyamai percakapan manusia.
• Sistem ini dapat menjana gelombang yang menyerupai
percakapan manusia, dengan memberi ransangan kepada
model percakapan di mana mekanisma ini mempunyai
parameter yang boleh menghasilkan isyarat audio yang
dikehendali.
• Penggunaan termasuklah ‘Automatic Information Response
Systems’ iaitu panggilan telefon dari tempat jauh dan meminta
anda masukkan nombor kad kredit atau deposit untuk 3 minit
pertama.
MEMPROSES ISYARAT AUDIO (SPEECH)
• Memproses isyarat audio secara digital adalah
praktikal bagi tujuan-tujuan berikut:
d. Pengesahan (Verifying) identiti sumber audio
melalui vokal masukan.
• Proses ini dapat mengawal kemasukan database
‘speaker queried’. Contohnya automated bank tellers.
e. Mengenalpasti (recognizing) perkataan-perkataan
daripada sumber audio dan menghasilkan
penulisan yang setanding dengan sumber.
• Objektif adalah untuk mendapatkan hasil penulisan (keluaran) yang
setanding dengan versi sumber percakapan.
• Kebolehan/kemampuan seperti ini diperlukan di dalam sistem untuk
masukan suara ke komputer contohnya perkataan yang terhad
digunakan dan tempoh latihan diperlukan bagi membiasakan
penggunaan system.
MEMPROSES ISYARAT AUDIO (SPEECH)
• Memproses isyarat audio secara digital adalah
praktikal bagi tujuan-tujuan berikut:
f. Pengubahsuaian (modifying) maklumat audio
(speech) kepada bentuk yang lebih sesuai terutama
bagi membantu individu yang penglihatan atau
pendengaran yang tidak sempurna
• Proses ini dapat menunjuk informasi percakapan dalam
bentuk yang lebih sempurna berbandingkan dengan yang
sedia ada tanpa perlu diproses

• Contohnya: Kelajuannya dapat diubah supaya individu yang


mempunyai masalah penglihatan dapat meneruskan
pendengaran semasa mendengar pengucapan dan
sebagainya
HUMAN SPEECH-PRODUCING MECHANISM
MODEL

A Model For Signal Processing in Vocoder


HUMAN SPEECH-PRODUCING MECHANISM
MODEL
• Merujuk kepada gambarajah di atas.
•Jika model ini diransangkan melalui penerimaan nilai yang
sesuai untuk pitch period (masa tinggi atau rendah
nada/suara), switch voiced / unvoiced, parameter tract vokal
dan AV dan AN amplitude, maka ia dapat menghasilkan satu
anggaran tekanan yang sebenar di speaker.
•Dalam konfigurasi ini, impulse train generator dan glottal
pulse model akan menjana signal yang menunjukkan bunyi
suara seperti beberapa bunyi vokal.
•Random noise generator digunakan untuk membentuk
unvoiced sound seperti ‘sh’ bagi ‘shall’.
HUMAN SPEECH-PRODUCING MECHANISM
MODEL

•Vocal tract parameter akan bertukar jarak dalam anggaran


10-20ms.
•Oleh itu model ini adalah sistem asas sintesis percakapan
dan boleh didapati di bahagian penerima vocoder (speech
processing)

Anda mungkin juga menyukai