Ch2 E5823 Set No 1

PEMPROSESAN ISYARAT DIGITAL (DSP):
MEMPROSES ISYARAT AUDIO (SPEECH)

• Memproses isyarat audio secara digital adalah
praktikal bagi tujuan-tujuan berikut:
a. Menyimpan (storing) dan menghantar (transmitting)
isyarat audio
• Tujuan utama sistem penghantaran (transmission) secara
digital adalah untuk mengurangkan jumlah data
penghantaran supaya dapat membentuk semula
gelombang asal pada
penerima (receiver).
b. Mempertingkatkan (enhancing) isyarat audio dengan
memperbaiki keseluruhan kualiti dan kemampuan/
kebolehan (intelligibility)isyarat tersebut
• Objektif utama adalah untuk memperbaiki kualiti audio yang
telah menyusut disebabkan oleh persekitaran yang bising.
c. Menjana (generating) atau mengabungkan
(synthesizing) bentuk-bentuk gelombang yang
hampir menyerupai/menyamai percakapan manusia.
• Sistem ini dapat menjana gelombang yang menyerupai
percakapan manusia, dengan memberi ransangan kepada
model percakapan di mana mekanisma ini mempunyai
parameter yang boleh menghasilkan isyarat audio yang
dikehendali.
• Penggunaan termasuklah ‘Automatic Information Response
Systems’ iaitu panggilan telefon dari tempat jauh dan meminta
anda masukkan nombor kad kredit atau deposit untuk 3 minit
pertama.
d. Pengesahan (Verifying) identiti sumber audio
melalui vokal masukan.
• Proses ini dapat mengawal kemasukan database
‘speaker queried’. Contohnya automated bank tellers.
e. Mengenalpasti (recognizing) perkataan-perkataan
daripada sumber audio dan menghasilkan
penulisan yang setanding dengan sumber.
• Objektif adalah untuk mendapatkan hasil penulisan (keluaran) yang
setanding dengan versi sumber percakapan.
• Kebolehan/kemampuan seperti ini diperlukan di dalam sistem untuk
masukan suara ke komputer contohnya perkataan yang terhad
digunakan dan tempoh latihan diperlukan bagi membiasakan
penggunaan system.
f. Pengubahsuaian (modifying) maklumat audio
(speech) kepada bentuk yang lebih sesuai terutama
bagi membantu individu yang penglihatan atau
pendengaran yang tidak sempurna
• Proses ini dapat menunjuk informasi percakapan dalam
bentuk yang lebih sempurna berbandingkan dengan yang
sedia ada tanpa perlu diproses
• Contohnya: Kelajuannya dapat diubah supaya individu yang

mempunyai masalah penglihatan dapat meneruskan
pendengaran semasa mendengar pengucapan dan
sebagainya
HUMAN SPEECH-PRODUCING MECHANISM
MODEL
A Model For Signal Processing in Vocoder

MODEL
• Merujuk kepada gambarajah di atas.
•Jika model ini diransangkan melalui penerimaan nilai yang
sesuai untuk pitch period (masa tinggi atau rendah
nada/suara), switch voiced / unvoiced, parameter tract vokal
dan AV dan AN amplitude, maka ia dapat menghasilkan satu
anggaran tekanan yang sebenar di speaker.
•Dalam konfigurasi ini, impulse train generator dan glottal
pulse model akan menjana signal yang menunjukkan bunyi
suara seperti beberapa bunyi vokal.
•Random noise generator digunakan untuk membentuk
unvoiced sound seperti ‘sh’ bagi ‘shall’.
MODEL
•Vocal tract parameter akan bertukar jarak dalam anggaran

10-20ms.
•Oleh itu model ini adalah sistem asas sintesis percakapan
dan boleh didapati di bahagian penerima vocoder (speech
processing)

Ch2 E5823 Set No 1

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Ch2 E5823 Set No 1

Diunggah oleh

Hak Cipta:

Format Tersedia

PEMPROSESAN ISYARAT DIGITAL (DSP):

MEMPROSES ISYARAT AUDIO (SPEECH)

• Contohnya: Kelajuannya dapat diubah supaya individu yang

A Model For Signal Processing in Vocoder

•Vocal tract parameter akan bertukar jarak dalam anggaran

Anda mungkin juga menyukai