I. TUJUAN
Mahasiswa mampu melakukan proses perekaman dan pengeditan sinyal wicara dengan
menggunakan perangkat lunak.
Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu (nasals) juga
merangsang nasal cavity (rongga hidung). Ketika rongga beresonansi, akan menimbulkan
radiasi sebuah gelombang suara yang mana merupakan sinyal wicara. Kedua rongga beraksi
sebagai resonators dengan karacteristik frekuensi resonansi masing-masing, yang disebut
formant frequencies. Pada saat rongga mulut dapat mengalami perubahan besar, kita mampu
untuk menghasilkan beragam pola ucapan suara yang berbeda.
Di dalam kasus unvoiced sounds (suara tak terucap), exitasi pada vocal tract lebih
menyerupai noise (derau). Gambar 3 menampilkan proses produksi suara-suara /a/, dan /f/.
Untuk sementara perbedaan bentuk dan posisi pada organ articulation diabaikan saja.
Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan menampilkannya
dalam tiga kondisi dasar, yaitu silence (S) atau keadaan tenang dimana sinyal wicara tidak
diproduksi, unvoice (U) dimana vocal cord tidak berfibrasi, dan yang ketiga adalah voiced (V)
dimana vocal cord bervibrasi secara periodik sehingga menggerakkan udara ke kerongkongan
melalui mekanisme akustik sampai keluar mulut dan menghasilkan sinyal wicara.
2.3. Proses Sampling
Perhatikan sinyal sinus berikut ini:
x(t) = A cos(ωt +φ) (1)
Sinyal tersebut merupakan contoh sinyal waktu kontinyu. Kita juga seringkali
menggunakan terminologi sinyal analog untuk menyebutnya.
Untuk proses komputasi, sinyal waktu kontinyu harus dirubah menjadi bentuk waktu
diskrit dan dilanjutkan dengan proses digitalisasi. Untuk memperoleh bentuk sinyal waktu
diskrit, sinyal waktu kontinyu harus di-sampel.
Sekuen x[n] didapakan setelah proses perubahan dari continues to discrete (C-to-D).
Kondisi realnya secara hardware adalah menggunakan rangkaian sampling seperti Gambar 6
berikut ini.
Rangkaian sampling diatas merupakan sebuah ujung tombak dari sebuah analog to
digital conversion (ADC).
Gambar 7. Blok diagram rangkaian ADC
Persyaratan frekuensi sampling menurut teorema Shannon harus sama dengan atau
melebihi 2 kali frekuensi sinyal yang di sample.
fs > 2x fi
Jika sinyal informasi yang kita sample memiliki komponen frekuensi beragam, misalnya
untuk sinyal wiacara memungkinkan untuk memiliki frekuensi dari 20 sampai 4000 Hz, maka
sinyal informasi tersebut bisa dituliskan sebagai:
I. TUJUAN
Mahasiswa mampu melakukan proses penghitungan energi pada sinyal wicara dengan
menggunakan perangkat lunak.
Dalam hal ini nilai nilai R biasanya dinyatakan sebesar 1 Ω. Dan parameter ini seringkali
tidak dituliskan, sehingga persamaan 2 menjadi lebih sederhana.
Sedangkan besarnya energi dari suatu sinyal diketahui sebagai total daya pada suatu durasi
waktu tertentu. Dengan mengacu pada persamaan yang sudah dimodifikasi, maka dapat
dinyatakan sebagai:
Untuk sinyal sinus diatas dalam bentuk energi dapat diberikan seperti Gambar 2 berikut ini.
dimana: w(m) = merupakan fungsi window seperti hamming, hanning, bartlett, dan boxcarr.
Panjang window dalam hal ini adalah m, untuk durasi dari t=0 sampai t=T akan
didapatkan window sebanyak n=T/m apabila tidak ada overlapping antara window satu dengan
yang lain. Jika terjadi overlapping antara window satu dengan yang lain, misalnya sebesar m/2,
maka jumlah window dalam satu durasi T adalah sebanyak n = 1 + T/(m/2).
Untuk suatu pengamatan energi pada frame ke-k bentuk persamaan menjadi:
dimana k akan menentukan posisi titik-titik window pada sinyal tersebut, ini juga dikenal
sebagai model sliding window.
Gambar 3. Sinyal wicara
Dengan menggunakan model short time measurement dapat digunakan untuk memilah
bagian dari sinyal wicara yang merupakan voiced atau unvoiced. Sebab pada umumnya
unvoiced speech memiliki durasi yang lebih pendek. Untuk pengukuran winyal wicara
menggunakan window biasanya dipilih panjang window dengan durasi 10 s/d 20 mili detik.
Apabila menggunakan frekuensi sampling sebesar 16 KHz, maka nilainya akan ekuivalen dengan
sampel sebanyak 160 sampai 320 sampel setiap frame.
Gambar 4. Segmen sinyal wicara ‘a’ dan window hamming 20 mili detik per frame widow
PC harus dilengkapi dengan peralatan multimedia seperti sound card, speaker active dan
microphone. Untuk microphone dan speaker active bisa juga digantikan dengan head set
lengkap. Sebelum anda memulai praktikum, sebaiknya dites dulu, apakah seluruh perangkat
multimedia yang diguanakan sudah terintegrasi dengan PC.
I. TUJUAN
Mahasiswa mampu menjelaskan perbedaan sinyal wicara dalam domain waktu dan
domain frekuensi menggunakan perangkat lunak
Persamaan (1) diatas menyatakan bahwa sinyal akan periodic pada setiap nilai N.
Implementasi DFT dapat diujudkan dengan sebuah Bank Filter seperti Gambar 2 berikut
ini.
Gambar 2. Blok diagram system Bank Filter Spectrum Analyzer untuk menghitung DFT
Untuk mengoptimalkan proses komputasi, DFT bias dimodifikasi dengan satu algorithma
yang seringkali kita kenal sebagai fast fourier transform (FFT). Dengan FFT proses komputasi
bias direduksi dari N2 menjadi N log2N. Misalnya dengan menggunakan DFT kita akan
melakukan transformasi sebanyak N=1024 titik, maka kita memerlukan perkalian sebanyak N2 =
1.048.567. Sedangkan dengan menggunakan FFT perkalian yang diperlukan sebanyak N log2N =
5120 perkalian.
Sebuah contoh hasil penmggunakan algorithma FFT untuk system yang lebih komplek
adalah untuk mengolah sinyal wicara. Pada gambar 3 ditunjukkan sebuah hasil proses FFT untuk
kalimat “a-i-u-e-o”.
MODUL 4
PEMFILTERAN PADA SINYAL WICARA
I. TUJUAN
Mahasiswa mampu menyusun filter digital dan melakukan pemfilteran pada sinyal
wicara
dimana:
- {bk} koefisien feed forward
- {al} koefisien feed back
- banyaknya (total koefisien) = M+N+1
- N ditetapkan sebagai orde filter IIR
Untuk merealisasikan ke dalam sebuah program simulasi atau perangkat keras maka
bentuk persamaan diatas dapat disederhanakan ke dalam diagram blok Gambar 1. Untuk
implementasi sebuah low pass filter bersifat narrow-band menggunakan sebuah filter IIR
merupakan pilihan yang sangat sulit tetapi masih mungkin dilakukan. Satu alasannya adalah
penentuan orde yang tepat sehingga menghasilkan bentuk yang tajam pada respon frekuensi
relative sulit. Pada domain unit circle bidang-z sering ditandai dengan letak pole-pole yang ada
diluar lingkaran, hal ini secara fisis memberikan arti bahwa filter yang dihasilkan tidak stabil.
Gambar 1. Diagram blok Filter IIR
Kita coba untuk merealisasikan dalam program Matlab secara sederhana dengan
melihat pada masing-masing kasus, dalam hal ini adalah low pass filter (LPF) dan high pass filter
(HPF).
Contoh 1:
Kita akan mencoba merancang sebuah low pass filter (LPF) IIR dengan memanfaatkan
filter Butterworth. Frekuensi cut off ditetapkan sebesar 2000 Hz. Dalam hal ini frekuensi
sampling adalah 10000 Hz. Langkah realisasi dalam Matlab adalah sebagai berikut.
clear all;
R=0.2;
N=16;
Wn=0.2;
figure(1);
[B,A] = butter(N,Wn);
[H,w]=freqz(B,A,N);
len_f=length(H);
f=1/len_f:1/len_f:1;
plot(f,20*log10(abs(H)),'linewidth',2)
Dari langkah ini akan didapatkan respon frkeuensi seperti gambar berikut.
Gambar 2. Respon Frekuensi Filter IIR, LPF
Contoh 2:
Pada contoh kedua ini kita akan mencoba merancang sebuah filter IIR untuk high pass
filter (HPF). Tetap dengan frekuensi cut off 2000 Hz, dan frekuensi sampling 10000. Langkah
pemrogramanya adalah dengan sedikit memodifikasi bagian berikut.
[B,A] = butter(N,Wn,'high');
Ini akan memberikan respon frekuensi seperti berikut.
Gambar 3. Respon Frekuensi Filter IIR, HPF
dimana:
-{bk}= koefisien feed forward
- banyaknya (total koefisien) L = M + 1
- M ditetapkan sebagai orde filter FIR
Dalam realisasi diagram blok akan dapat digambarkan seperti pada Gambar 4 berikut ini
Gambar 4. Diagram blok FIR Filter
Untuk tujuan simulasi perangkat lunak kita bisa memanfaatkan fungsi standar berikut
ini: B = FIR1(N,Wn)
Ini merupakan sebuah langkah untuk merancang filter digital FIR dengan orde sebesar
N, dan frekuensi cut off Wn. Secara default oleh Matlab ditetapkan bahwa perintah tersebut
akan menghasilkan sebuah low pass filter (LPF). Perintah ini akan menghasilkan koefisien-
koesifien filter sepanjang (N+1) dan akan disimpan pada vektor B. Karena dalamdomain digital,
maka nilai frekuensi cut off harus berada dalam rentang 0<Wn<1.0. Nilai 1.0 akan memiliki
ekuivalensi dengan nilai 0,5 dari sampling rate (fs/2).Yang perlu anda ketahui juga adalah
bahwa B merupakan nilai real dan memiliki fase yang linear. Sedangkan gain ternormalisasi
filter pada Wn sebesar -6 dB.
Contoh 3:
Kita akan merancang sebuah LPF dengan frekuensi cut off sebesar 2000 Hz. Frekuensi
sampling yang ditetapkan adalah 10000 Hz. Orde filter ditetapkan sebesar 32. Maka langkah
pembuatan programnya adalah sebagai berikut:
fs=10000;
[x,fs]=wavread('a.wav');
Wn = .20;
N = 32;
LP = fir1(N,Wn);
[H_x,w]=freqz(LP);
len_f=length(H_x);
wavplay(x,fs);
f=1/len_f:1/len_f:1;
plot(f,20*log10(abs(H_x)) ,'linewidth',2)
grid
Contoh 5:
Kita akan merancang sebuah High Pass Filter (HPF) dengan frekuensi cut off sebesar
5000 Hz (untuk daerah tinggi). Frekuensi sampling yang ditetapkan adalah 10000 Hz. Orde filter
ditetapkan sebesar 32. Beberapa bagian program diatas perlu modifikasi seperti berikut.
Wn2 = .50;
HP = fir1(N,Wn2,'high');
Hasilnya berupa akan didapatkan respon frekuensi seperti pada Gambar 7 berikut ini.
Bentuk ini kemudian akan memberikan dasar pembentukan diagram blok yang
menggambarkan hubungan input dan output seperti pada Gambar 8.
Hasilnya adalah berupa sebuah gambaran bentuk sinyal input dan output dari file sinyal
wicara ’a.wav’ dalam domain waktu.
Gambar 11. Sinyal input dan output dari pre-emphasis filter dalam domain waktu
Sedangkan hasil yang didapatkan dalam bentuk domain frekuensi adalah seperti berikut.
Gambar 12. Sinyal input dan output dari pre-emphasis filter dalam domain frekuensi