• Memproses isyarat audio secara digital adalah praktikal bagi tujuan-tujuan berikut: a. Menyimpan (storing) dan menghantar (transmitting) isyarat audio • Tujuan utama sistem penghantaran (transmission) secara digital adalah untuk mengurangkan jumlah data penghantaran supaya dapat membentuk semula gelombang asal pada penerima (receiver). b. Mempertingkatkan (enhancing) isyarat audio dengan memperbaiki keseluruhan kualiti dan kemampuan/ kebolehan (intelligibility)isyarat tersebut • Objektif utama adalah untuk memperbaiki kualiti audio yang telah menyusut disebabkan oleh persekitaran yang bising. MEMPROSES ISYARAT AUDIO (SPEECH) • Memproses isyarat audio secara digital adalah praktikal bagi tujuan-tujuan berikut: c. Menjana (generating) atau mengabungkan (synthesizing) bentuk-bentuk gelombang yang hampir menyerupai/menyamai percakapan manusia. • Sistem ini dapat menjana gelombang yang menyerupai percakapan manusia, dengan memberi ransangan kepada model percakapan di mana mekanisma ini mempunyai parameter yang boleh menghasilkan isyarat audio yang dikehendali. • Penggunaan termasuklah ‘Automatic Information Response Systems’ iaitu panggilan telefon dari tempat jauh dan meminta anda masukkan nombor kad kredit atau deposit untuk 3 minit pertama. MEMPROSES ISYARAT AUDIO (SPEECH) • Memproses isyarat audio secara digital adalah praktikal bagi tujuan-tujuan berikut: d. Pengesahan (Verifying) identiti sumber audio melalui vokal masukan. • Proses ini dapat mengawal kemasukan database ‘speaker queried’. Contohnya automated bank tellers. e. Mengenalpasti (recognizing) perkataan-perkataan daripada sumber audio dan menghasilkan penulisan yang setanding dengan sumber. • Objektif adalah untuk mendapatkan hasil penulisan (keluaran) yang setanding dengan versi sumber percakapan. • Kebolehan/kemampuan seperti ini diperlukan di dalam sistem untuk masukan suara ke komputer contohnya perkataan yang terhad digunakan dan tempoh latihan diperlukan bagi membiasakan penggunaan system. MEMPROSES ISYARAT AUDIO (SPEECH) • Memproses isyarat audio secara digital adalah praktikal bagi tujuan-tujuan berikut: f. Pengubahsuaian (modifying) maklumat audio (speech) kepada bentuk yang lebih sesuai terutama bagi membantu individu yang penglihatan atau pendengaran yang tidak sempurna • Proses ini dapat menunjuk informasi percakapan dalam bentuk yang lebih sempurna berbandingkan dengan yang sedia ada tanpa perlu diproses
• Contohnya: Kelajuannya dapat diubah supaya individu yang
mempunyai masalah penglihatan dapat meneruskan pendengaran semasa mendengar pengucapan dan sebagainya HUMAN SPEECH-PRODUCING MECHANISM MODEL
A Model For Signal Processing in Vocoder
HUMAN SPEECH-PRODUCING MECHANISM MODEL • Merujuk kepada gambarajah di atas. •Jika model ini diransangkan melalui penerimaan nilai yang sesuai untuk pitch period (masa tinggi atau rendah nada/suara), switch voiced / unvoiced, parameter tract vokal dan AV dan AN amplitude, maka ia dapat menghasilkan satu anggaran tekanan yang sebenar di speaker. •Dalam konfigurasi ini, impulse train generator dan glottal pulse model akan menjana signal yang menunjukkan bunyi suara seperti beberapa bunyi vokal. •Random noise generator digunakan untuk membentuk unvoiced sound seperti ‘sh’ bagi ‘shall’. HUMAN SPEECH-PRODUCING MECHANISM MODEL
•Vocal tract parameter akan bertukar jarak dalam anggaran
10-20ms. •Oleh itu model ini adalah sistem asas sintesis percakapan dan boleh didapati di bahagian penerima vocoder (speech processing)