Anda di halaman 1dari 41

MODUL 1

PROSES PEREKAMAN DAN PENGEDITAN SINYAL WICARA

I. TUJUAN
 Mahasiswa mampu melakukan proses perekaman dan pengeditan sinyal wicara dengan
menggunakan perangkat lunak.

II. DASAR TEORI


2.1. Pembangkitan Sinyal Wicara pada Manusia
Speech (wicara) dihasilkan dari sebuah kerjasama antara lungs(paru-paru), glottis
(dengan vocal cords) dan articulation tract (mouth/mulut dan nose cavity/rongga hidung).
Gambar 1 menunjukkan penampang melintang dari organ wicara manusia. Untuk
menghasilkan sebuah voiced sounds (suara ucapan), paru-paru lungs menekan udara melalui
epiglottis, vocal cords bergetar, menginterupt udara melalui aliran udara dan menghassilkan
sebuah gelombang tekanan quasi-periodic.

Gambar 1. Organ wicara manusia


Impuls tekanan pada umumnya disebut sebagai pitch impulses dan frekuensi sinyal
tekanan adalah pitch frequency atau fundamental frequency. Di dalam Gambar 2a sederetan
impuls (fungsi tekanan suara) dihasikan oleh vocal cords untuk sebuah suara.
Ini merupakan bagian dari sinyal voice (suara) yang mendefinisikan speech melody
(melodi wicara). Ketika kita berbicara dengan sebuah frekuensi pitch konstan, suara sinyal
wicara monotonous tetapi dalam kasus normal sebuah perubahan permanen pada frekuensi
terjadi. Variasi frekuensi pitch dapat dilihat seperti pada Gambar 2b.

a. Sederetan impulse yang sama

b. Variasi pada frekuensi pitch


Gambar 2. Sederetan impuls dan pitch pada sinyal wicara

Impuls pitch merangsang udara di dalam mulut, dan untuk suara tertentu (nasals) juga
merangsang nasal cavity (rongga hidung). Ketika rongga beresonansi, akan menimbulkan
radiasi sebuah gelombang suara yang mana merupakan sinyal wicara. Kedua rongga beraksi
sebagai resonators dengan karacteristik frekuensi resonansi masing-masing, yang disebut
formant frequencies. Pada saat rongga mulut dapat mengalami perubahan besar, kita mampu
untuk menghasilkan beragam pola ucapan suara yang berbeda.
Di dalam kasus unvoiced sounds (suara tak terucap), exitasi pada vocal tract lebih
menyerupai noise (derau). Gambar 3 menampilkan proses produksi suara-suara /a/, dan /f/.
Untuk sementara perbedaan bentuk dan posisi pada organ articulation diabaikan saja.

a. Pembangkit ucapan /a/

b. Pembangkit ucapan /f/


Gambar 3. Proses produksi suara
2.2. Bentuk Sinyal Wicara dalam Domain Waktu
Sinyal wicara merupakan sinyal yang bervariasi lambat sebagai fungsi waktu, dalam hal
ini ketika diamati pada durasi yang sangat pendek (5 sampai 100 mili detik) karakteristiknya
masih stasioner. Tetapi bilamana diamati dalam durasi yang lebih panjang (> 1/5 detik)
karakteristik sinyalnya berubah untuk merefleksikan suara ucapan yang keluar dari pembicara.

Gambar 4. Contoh sinyal wicara ucapan “Selamat Datang”

Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan menampilkannya
dalam tiga kondisi dasar, yaitu silence (S) atau keadaan tenang dimana sinyal wicara tidak
diproduksi, unvoice (U) dimana vocal cord tidak berfibrasi, dan yang ketiga adalah voiced (V)
dimana vocal cord bervibrasi secara periodik sehingga menggerakkan udara ke kerongkongan
melalui mekanisme akustik sampai keluar mulut dan menghasilkan sinyal wicara.
2.3. Proses Sampling
Perhatikan sinyal sinus berikut ini:
x(t) = A cos(ωt +φ) (1)
Sinyal tersebut merupakan contoh sinyal waktu kontinyu. Kita juga seringkali
menggunakan terminologi sinyal analog untuk menyebutnya.
Untuk proses komputasi, sinyal waktu kontinyu harus dirubah menjadi bentuk waktu
diskrit dan dilanjutkan dengan proses digitalisasi. Untuk memperoleh bentuk sinyal waktu
diskrit, sinyal waktu kontinyu harus di-sampel.

Gambar 5. Blok diagram konversi sinyal kontinyu menjadi sinyal diskrit

Sekuen x[n] didapakan setelah proses perubahan dari continues to discrete (C-to-D).
Kondisi realnya secara hardware adalah menggunakan rangkaian sampling seperti Gambar 6
berikut ini.

Gambar 6. Rangkaian Sampling

Rangkaian sampling diatas merupakan sebuah ujung tombak dari sebuah analog to
digital conversion (ADC).
Gambar 7. Blok diagram rangkaian ADC

Persyaratan frekuensi sampling menurut teorema Shannon harus sama dengan atau
melebihi 2 kali frekuensi sinyal yang di sample.
fs > 2x fi
Jika sinyal informasi yang kita sample memiliki komponen frekuensi beragam, misalnya
untuk sinyal wiacara memungkinkan untuk memiliki frekuensi dari 20 sampai 4000 Hz, maka
sinyal informasi tersebut bisa dituliskan sebagai:

Dan persyaratan untuk frekuensi smpling menjadi:


fs > 2x fimax
Frekuensi sampling seringkali dikatakan dengan terminology sampling rate, yaitu jumlah sample
yang diambil setiap detik, fs=1/Ts yang juga dikenal sebagai Nyquist rate.

III. PERANGKAT YANG DIPERLUKAN


 1 (satu) buah PC Multimedia lengkap sound card dan microphone
 Satu perangkat lunak Matlab

IV. LANGKAH-LANGKAH PERCOBAAN


4.1. Penataan Perangkat
Sebelum melakukan percobaan siswa harus melakukan penataan seperti pada Gambar 8
berikut ini.
Gambar 8. Penataan perangkat percobaan recording dan editing
PC yang digunakan harus dilengkapi dengan peralatan multimedia seperti sound card,
speaker aktif dan microphone. Untuk microphone dan speaker aktif bias juga digantikan dengan
head set lengkap. Sebelum memulai praktikum, sebaiknya dites dulu, apakah seluruh perangkat
multimedia sudah terintegrasi dengan PC.

4.2 Perekaman dengan Matlab


Praktikum Pengolahan Informasi Wicara dengan langkah pertama adalah melakukan
proses recording (perekaman) suara. Untuk itu ikuti langkah berikut ini.
1. Aktifkan Matlab, seperti pada pertemuan pertama saat mengenal Matlab Audio. Siapkan
microphone dan perangkat multimedia.
2. Buat program berikut ini untuk melakukan recording dengan Matlab
clear all;
Fs = 8000;
y = wavrecord(5.0*Fs, Fs, 'double');
wavwrite(y,Fs,'aiueo.wav')
3. Untuk mengetahui apakah proses perekaman yang telah dilakukan berhasil, cobalah
untuk membuat perintah tambahan pada program diatas sehingga bisa membaca file
*.wav hasil perekaman.
4. Tambahkan juga pada program bagaimana cara memainkan file *.wav yang sudah
direkam. Kalau mengalami kesulitan buka kembali catatan tentang Matlab Audio yang
ada di bagian lain pada buku ini.

4.3. Proses Pengeditan untuk Pemisah Vokal


Apabila telah selesai berdiskusi dengan teman terdekat, coba aktifkan kembali Matlab,
dan lanjtukan dengan langkah berikut ini.
1. Buka file hasil rekaman “aiueo.wav”. Tampilkan dengan perintah plot, dan coba
perhatikan dengan seksama durasi sinyal hasil dari proses perekaman tersebut.
2. Coba tampilkan sebagian saja dari seluruh sinyal, caranya adalah sebagai berikut:
clear all;
Fs = 8000;
y1=wavread('aiueo.wav');
t=length(y1);
y2=y1(1:40000);
plot(y2)
3. Sekarang coba buat program yang hanya membuat tampilan untuk vokal ’a’ saja, dan
jangan lupa mengujinya dengan melalui gambar dan mendengarkan suara yang
dihasilkan.
4. Simpan ke dalam suatu file a.wav.
wavwrite(y1,Fs,’a.wav’);
5. Lakukan hal yang sama untuk vocal ’i’, ’u’, ’e’ dan ’o’. Semuanya juga harus disimpan
dalam bentuk file *.wav.

4.4. Perubahan Nilai Sampling


1. Coba panggil kembali file hasil perekaman dengan cara sebagai berikut.
clear all;
Fs = 8000;
y=wavread('aiueo.wav')
wavplay(y,Fs)
2. Rubah nilai frekuensi sampling menjadi Fs=10000, perhatikan apa yang terjadi. Lakukan
hal yang sama, dengan nilai Fs = 14000, 16000, 24000, 44000 Hz.
3. Coba rubah dengan menurunkan nilai sampling Fs=7000, 6000, dan 5000. Amati
kejadian apa yang dapat diamati pada sinyal suara tsb.

5. ANALISA DATA DAN TUGAS


1. Untuk grafik “aiuoe.wav”, coba beri tanda mana yang termasuk katagori silence,
unvoice, dan voice.
2. Dari hasil percobaan yang telah dilakukan, coba buat catatan tentang durasi perekaman
masing-masing vokal yang telah dilakukan.
3. Berikan catatan nilai magnitudo tertinggi pada masing-masing vokal yang telah direkam.
4. Berikan analisa terhadap perubahan nilai Sampling Rate terhadap suara yang dihasilkan.
MODUL 2
PENGHITUNGAN ENERGI PADA SINYAL WICARA

I. TUJUAN
 Mahasiswa mampu melakukan proses penghitungan energi pada sinyal wicara dengan
menggunakan perangkat lunak.

II. DASAR TEORI


2.1. Energi Suatu Sinyal
Perhatikan sinyal sinus berikut ini:
x(t) = A cos(2πt +φ)
Sinyal tersebut merupakan contoh sinyal waktu kontinyu. Kita juga seringkali
menggunakan terminologi sinyal analog untuk menyebutnya.
Bentuk persamaan diatas merepresentasikan nilai magnitudo sinyal sebagai fungsi
waktu. Di dalam kondisi real seringkali dinyatakan dalam besaran volt. Nilai x(t) dalam
parameter yang umum untuk pengukuran dinyatakan dalam V(t) yang menunjukkan nilai
simpangan sinyal atau magnitudonya pada suatu waktu t.

Gambar 1. Contoh sinyal sinus dengan frekuensi 200 Hz


Sedangkan untuk besaran lain dari sinyal dalam hal ini daya dinyatakan sebagai:

Dalam hal ini nilai nilai R biasanya dinyatakan sebesar 1 Ω. Dan parameter ini seringkali
tidak dituliskan, sehingga persamaan 2 menjadi lebih sederhana.

Sedangkan besarnya energi dari suatu sinyal diketahui sebagai total daya pada suatu durasi
waktu tertentu. Dengan mengacu pada persamaan yang sudah dimodifikasi, maka dapat
dinyatakan sebagai:

dan energi rata-rata untuk suatu durasi tertentu T, dinyatakan sebagai

Untuk sinyal sinus diatas dalam bentuk energi dapat diberikan seperti Gambar 2 berikut ini.

Gambar 2. Sinyal sinus dalam bentuk energy


2.2. Energi Pada Sinyal Wicara
Untuk pengkuran nilai energi pada sinyal wicara kita harus melibatkan fungsi window.
Hal ini karena dalam pengukuran energi sinyal wicara kita harus menyusunnya dalam frame-
frame tertentu. Ini merupakan standar dalam teknologi speech processing, sebab secara umum
dalam pengolahan sinyal wicara kita terlibat dengan sinyal dengan durasi yang terlalu panjang
bila dihitung dalam total waktu pengukuran. Fenomena ini juga dikenal sebagai short term
speech signal energy.
Untuk menghitung energi sinyal wicara kita gunakan formulasi dasar seperti berikut:

dimana: w(m) = merupakan fungsi window seperti hamming, hanning, bartlett, dan boxcarr.
Panjang window dalam hal ini adalah m, untuk durasi dari t=0 sampai t=T akan
didapatkan window sebanyak n=T/m apabila tidak ada overlapping antara window satu dengan
yang lain. Jika terjadi overlapping antara window satu dengan yang lain, misalnya sebesar m/2,
maka jumlah window dalam satu durasi T adalah sebanyak n = 1 + T/(m/2).
Untuk suatu pengamatan energi pada frame ke-k bentuk persamaan menjadi:

dimana k akan menentukan posisi titik-titik window pada sinyal tersebut, ini juga dikenal
sebagai model sliding window.
Gambar 3. Sinyal wicara
Dengan menggunakan model short time measurement dapat digunakan untuk memilah
bagian dari sinyal wicara yang merupakan voiced atau unvoiced. Sebab pada umumnya
unvoiced speech memiliki durasi yang lebih pendek. Untuk pengukuran winyal wicara
menggunakan window biasanya dipilih panjang window dengan durasi 10 s/d 20 mili detik.
Apabila menggunakan frekuensi sampling sebesar 16 KHz, maka nilainya akan ekuivalen dengan
sampel sebanyak 160 sampai 320 sampel setiap frame.
Gambar 4. Segmen sinyal wicara ‘a’ dan window hamming 20 mili detik per frame widow

III. PERANGKAT YANG DIPERLUKAN


 1 (satu) buah PC Multimedia lengkap sound card dan microphone
 Satu perangkat lunak Matlab under windows

IV. LANGKAH-LANGKAH PERCOBAAN


4.1. Penataan Perangkat
Sebelum melakukan percobaan anda harus melakukan penataan seperti pada Gambar
5 berikut ini.
Gambar 5. Penataan perangkat percobaan pengukuran energi sinyal wicara

PC harus dilengkapi dengan peralatan multimedia seperti sound card, speaker active dan
microphone. Untuk microphone dan speaker active bisa juga digantikan dengan head set
lengkap. Sebelum anda memulai praktikum, sebaiknya dites dulu, apakah seluruh perangkat
multimedia yang diguanakan sudah terintegrasi dengan PC.

4.2 Penghitungan Energi Sinyal Sinus


Pada percobaan ini akan dilakukan pembangkitan sinyal sinus dan menghitung
energinya. Langkah-langkahnya adalah sebagai berikut.
1. Bangkitkan sinyal sinus dengan menggunakan sampel sebanyak 16000 sampel per detik.
Caranya adalah dengan menetapkan fs=16000. Waktu t mulai dari 1/fs dengan step
kenaikan 1/fs dan berakhir di t=1. Nilai frekuensinya tetapkan f = 800 Hz.
clear all;
fs=16000;
t=1/fs:1/fs:1;
f=800;
2. Coba gambarkan segmen sinyal sinus tersebut sebesar 1 frame atau senilai 20 ms. Ini
seharusnya ekuivalen dengan sampel sebanyak 320 sampel. Aktifkan suaranya, dan
perhatikan bagaimana bunyinya.
3. Hitung besarnya energi sinyal sinus dengan formulasi dasar pada persamaan. Tampilkan
grafiknya untuk sinyal sinus dalam bentuk magnitudo dan energinya sebagai fungsi
waktu.
y=sin(2*pi*f*t);
yy=y.*y;
sound(y,fs)
plot(yy)
axis([0 50 -0.1 1.1])

4.3. Penghitungan Energi Sigal to Noise Ratio


Pada percobaan ini kita akan menghitung besarnya perbandingan nilai signal-to-noise
ratio. Langkahnya adalah sebagai berikut.
1. Bangkitkan sinyal noise gaussian dengan jumlah sampel persis seperti jumlah sampel
yang digunakan pada langkah percobaan 4.2. Jangan lupa tetapkan nilai noise ini harus
zero mean dan varians sebesar 0.1.
2. Hitung besarnya nilai energi noise yang telah dibangkitkan
3. Dengan memanfaatkan langkah percobaan 4.2 bangkitkan sinyal sinus, dengan
spesifikasi yang sama, dan jumlahkan nilainya.
4. Coba hitung perbandingan energi sinyal terhadap besarnya energi noise, atau yang lebih
dikenal sebagai signal-to-noise ratio. Caranya harus mengikuti formulasi dasar sbb.

dimana : S(t) merupakan sinyal sinus tanpa noise


N(t) merupakan sinyal noise
Note: Seharusnya nilai SNR berkisar 34 dB.
4.4. Penghitungan Energi Sinyal Wicara
Untuk peraktikum ini anda harus menggunakan formulasi yang didasarkan pada
persamaan. sehingga hasil penghitungannya bisa benar-benar mendekati cara penghitungan
sinyal wicara yang benar.
1. Baca file sinyal wicara hasil rekaman suara yang telah dihasilkan dari sebuah lingkungan
bebas dari noise. Untuk keperluan ini bisa menggunakan digital voice recorder dan bisa
melakukan proses perekaman di Studio yang ada di Laboratorium Jaringan Komputer,
Jurusan Teknologi Informasi, lantai 3 Gedung Baru Blok C.
Usahakan tidak terlalu panjang proses perekamannya, sehingga tidak membebani
memori pada PC.
2. Gunakan formulasi yang benar untuk menghitung besarnya short-term-energy sinyal
wicara, dengan cara menggunakan windowing dan pilih window hamming untuk ini.
Untuk kali ini gunakan formulasi panjang window yang standar untuk menghitung sinyal
wicara, dimana panjang window sebesar 320 atau 160 sampel per frame.
3. Coba ulangi langkah 2 dan kali ini gunakan panjang window yang berbeda, perhatikan
bagaimana pengaruh bentuk energinya.
4. Lakukan hal yang sama seperti langkah 2 dan 3, kali ini gunakan jenis window yang
berbeda, misalnya window hanning, bartlett, atau boxcar.

4.5. Penghitungan Energi to Noise ratio pada Sinyal Wicara


Pada percobaan ini kita akan menghitung besarnya perbandingan nilai signal-tonoise
ratio. Langkahnya adalah sebagai berikut.
1. Lakukan proses perekaman suara pada kondisi lingkungan yang bernoise.
2. Ulangi proses yang sama pada percobaan 4.4, untuk langkah 2 sampai 4. Dengan
demikian akan didapatkan energi sinyal bernoise.
3. Bandingkan besarnya sinyal wicara hasil perekaman percobaan 4.3 dengan hasil
perekaman pada percobaan 4.4. Dapatkan selisihnya sebagai nilai noise dari lingkungan
perekaman.
4. Hitung nilai energy noise average dari yang dihasilkan pada langkah 3.
5. Lakukan penghitungan besarnya average energy-to-noise ratio untuk sinyal wicara
dengan memanfaatkan langkah yang telah dilakukan pada percobaan 4.3.

5. ANALISA DATA DAN TUGAS


1. Coba cari formulasi signal to noise ratio (SNR) untuk energi average.
2. Cari standar penghitungan dalam besaran dB untuk sebuah sinyal yang diukur langsung
dengan menggunakan spectrum analyzer.
3. Cari formulasi penghitungan apabila sinyal wicara diukur dengan sebuah sound pressure
level (SPL).
MODUL 3
REPRESENTASI SINYAL DALAM DOMAIN WAKTU
DAN DOMAIN FREKUENSI

I. TUJUAN
 Mahasiswa mampu menjelaskan perbedaan sinyal wicara dalam domain waktu dan
domain frekuensi menggunakan perangkat lunak

II. DASAR TEORI


2.1. Representasi Sinyal Wicara dalam Domain Waktu dan Domain Frekuensi
Salah satu cara untuk mencirikan sinyal wicara dan mereprensetasikan suaranya adalah
melalui representasi spectral. Cara yang paling popular dalam hal ini adalah sound spectrogram
yang mana merupakan suatu bentuk gray scale image yang merepresentasikan nilai freukensi
sinyal pada waktu tertentu.

Gambar 1. Bentuk spectrogram dan waveform “a-i-u-e-o”


Intensitas spectral pada suatu titik waktu ditunjukkan dengan tingkat keabuan yang
merupakan suatu bentuk analisis frekuensi particular dari sinyal wicara yang sedang diamati.
Perhatikan Gambar 1 pada nilai t = 1,5 detik. Tampak bahwa banyak nilai frekuensi muncul
pada bagian spectrogram-nya, ini sesuai dengan tampilan grafik domain waktu yang
menunjukkan simpangan gelombang pada waktu tersebut cukup tinggi dan beragam.
Sedangkan pada nilai t = 2,3 detik tampak spectrogram menunjukkan sedikit sekali warna
hitam, yang menunjukkan komponen frekuensi yang muncul sangat sedikit, ini sesuai dengan
bentuk gelombang dalam domain waktu yang hampir tidak ada sinyal.

2.2. Discrete Fourier Transform


Salah satu cara mentransformasi sinyal dari domain waktu ke dalam domain frekuensi
adalah dengan meggunakan discrete fourier transform (DFT).

Persamaan (1) diatas menyatakan bahwa sinyal akan periodic pada setiap nilai N.
Implementasi DFT dapat diujudkan dengan sebuah Bank Filter seperti Gambar 2 berikut
ini.

Gambar 2. Blok diagram system Bank Filter Spectrum Analyzer untuk menghitung DFT
Untuk mengoptimalkan proses komputasi, DFT bias dimodifikasi dengan satu algorithma
yang seringkali kita kenal sebagai fast fourier transform (FFT). Dengan FFT proses komputasi
bias direduksi dari N2 menjadi N log2N. Misalnya dengan menggunakan DFT kita akan
melakukan transformasi sebanyak N=1024 titik, maka kita memerlukan perkalian sebanyak N2 =
1.048.567. Sedangkan dengan menggunakan FFT perkalian yang diperlukan sebanyak N log2N =
5120 perkalian.
Sebuah contoh hasil penmggunakan algorithma FFT untuk system yang lebih komplek
adalah untuk mengolah sinyal wicara. Pada gambar 3 ditunjukkan sebuah hasil proses FFT untuk
kalimat “a-i-u-e-o”.

Gambar 3 Spektral frekuensi kalimat “a-i-u-e-o”

III. PERANGKAT YANG DIPERLUKAN


 1 (satu) buah PC Multimedia lengkap sound card dan microphone
 Satu perangkat lunak Matlab under windows
IV. LANGKAH-LANGKAH PERCOBAAN
4.1. Penataan Perangkat
Sebelum melakukan percobaan anda harus melakukan penataan seperti pada Gambar
4 berikut ini.

Gambar 4. Penataan perangkat percobaan recording dan editing


PC harus dilengkapi dengan peralatan multimedia seperti sound card, speaker aktif dan
microphone. Untuk microphone dan speaker aktif bisa juga digantikan dengan head set lengkap.
Sebelum memulai praktikum, sebaiknya dites dulu, apakah seluruh perangkat multimedia sudah
terintegrasi dengan PC.

4.2. Sinyal Sinus dalam Domain Waktu dan Frekuensi


Pada bagian ini akan dilakukan pembangkitan sinyal sinus, mengamati bentuknya dalam
domain waktu dan domain frekuensi. Langkah-langkahnya adalah seperti berikut:
1. Bangkitkan sinyal sinus dan coba anda tampilkan bentuk sinyal dan suaranya.
%File Name:sinus_0.m
clear all;
fs=16000;
t=1/fs:1/fs:1;
y=sin(2*pi*800*t);
sound(y,fs)
2. Lakukan proses perekaman dengan menggunakan perintah
wavwrite(y,fs,'sinus_0.wav')
Dengan langkah ini berarti telah dilakukan recording sinyal sinus ke dalam sebuah file
sinus_0.wav.
3. Coba amati bentuk sinyal sinus dalam domain frekuensi dengan memanfaatkan fungsi
fft.
Y_f=20*log10(abs(fft(y)));
plot(Y_f)
axis([0 1000 -275 100])

4.3. Sinyal Wicara dalam Domain Waktu dan Frekuensi


Pada bagian ini kita akan melakukan pengamatan sinyal wicara dalam domain waktu
dan domain frekuensi. Dengan memanfaatkan file wicara yang telah direkam dan diedit pada
Percobaan 1, anda coba panggil kembali dan lakukan langkah-langkah berikut.
1. Panggil kembali sinyal wicara vokal ’a.wav’ yang telah dihasilkan pada percobaan 1.
Untuk lebih yakin bahwa langkah pemrogramannya benar, coba suarakan dan
gambarkan hasilnya sebagai fungsi waktu.
2. Gunakan perintah dasar pengamatan power spektral density (PSD) pada Matlab, dalam
hal ini manfaatkan fungsi fft yang ada. Kemudian amati bentuk power spectral density
(PSD) sinyal wicara vokal ‘a.wav’ dalam sebuah gambar yang terpisah. Untuk ini harus
memanfaatkan perintah dasar figure(1); untuk menggambarkan sinyal wicara sebagai
fungsi waktu dan perintah dasar figure(2); untuk menempatkan power spectral density
(PSD) sinyal wicara tersebut.
3. Pada langkah selanjutnya coba gambarkan spectrogram sinyal wicara vokal ’a.wav’.
Untuk itu gunakan perintah figure(3); agar spectrogram yang dihasilkan berada pada
tempat yang terpisah.
4. Lakukan hal yang sama pada vokal i,u,e dan o.

4.3. Pemanfaatan Perangkat Lunak Colea


Pada sub bagian 4.1 dan 4.2, siswa diwajibkan menyusun perintah Matlab sendiri untuk
mengamati bentuk sinyal dalam domain waktu dan domain frekuensi. Sekarang yang harus
dilakukan adalah memanfaatkan perangkat lunak Colea, salah satu produk pengembangan dari
Matlab yang dikususkan uneukpengolahan sinyal wicara. Dengan langkah-langkah yang sama
dengan sub bagian 4.2. Lakukan pengolahan sinyal wicara denagn memanfaatkan Colea. Jika
anda masih ragu dengan perangkat lunak ini, coba anda tanyakan ke dosen pengajar praktikum.

5. ANALISA DATA DAN TUGAS


1. Untuk representasi sinyal vokal a-i-u-e-o jelaskan bagaimana bentuknya dalam domain
waktu dan domain frekuensi. Dan jelaskan pula apa arti gambar yang muncul pada
spectrogram sinyal sinyal tersebut.
2. Jelaskan penggunaan perintah dasar pada Matlab Colea, ambil salah satu saja dan
uraikan dengan mendetail.

MODUL 4
PEMFILTERAN PADA SINYAL WICARA

I. TUJUAN
 Mahasiswa mampu menyusun filter digital dan melakukan pemfilteran pada sinyal
wicara

II. DASAR TEORI


2.1. Filter IIR
Yang perlu diingat disini bahwa infinite inpulse response (IIR) dalam hal ini bukan berarti
filter yang bekerja dari nilai negatif tak hingga sampai positif tak hingga. Pengertian sederhana
untuk infinite impulse respon filter disini adalah bahwa output filter merupakan fungsi dari
kondisi input sekarang, input sebelumnya dan output di waktu sebelumnya. Konsep ini
kemudian lebih kita kenal sebagai recursive filter, yang mana melibatkan proses feedback dan
feed forward. Dalam bentuk persamaan beda yang menghubungkan input dengan output
dinyatakan seperti persmaaan berikut ini.

dimana:
- {bk} koefisien feed forward
- {al} koefisien feed back
- banyaknya (total koefisien) = M+N+1
- N ditetapkan sebagai orde filter IIR
Untuk merealisasikan ke dalam sebuah program simulasi atau perangkat keras maka
bentuk persamaan diatas dapat disederhanakan ke dalam diagram blok Gambar 1. Untuk
implementasi sebuah low pass filter bersifat narrow-band menggunakan sebuah filter IIR
merupakan pilihan yang sangat sulit tetapi masih mungkin dilakukan. Satu alasannya adalah
penentuan orde yang tepat sehingga menghasilkan bentuk yang tajam pada respon frekuensi
relative sulit. Pada domain unit circle bidang-z sering ditandai dengan letak pole-pole yang ada
diluar lingkaran, hal ini secara fisis memberikan arti bahwa filter yang dihasilkan tidak stabil.
Gambar 1. Diagram blok Filter IIR
Kita coba untuk merealisasikan dalam program Matlab secara sederhana dengan
melihat pada masing-masing kasus, dalam hal ini adalah low pass filter (LPF) dan high pass filter
(HPF).

Contoh 1:
Kita akan mencoba merancang sebuah low pass filter (LPF) IIR dengan memanfaatkan
filter Butterworth. Frekuensi cut off ditetapkan sebesar 2000 Hz. Dalam hal ini frekuensi
sampling adalah 10000 Hz. Langkah realisasi dalam Matlab adalah sebagai berikut.
clear all;
R=0.2;
N=16;
Wn=0.2;
figure(1);
[B,A] = butter(N,Wn);
[H,w]=freqz(B,A,N);
len_f=length(H);
f=1/len_f:1/len_f:1;
plot(f,20*log10(abs(H)),'linewidth',2)
Dari langkah ini akan didapatkan respon frkeuensi seperti gambar berikut.
Gambar 2. Respon Frekuensi Filter IIR, LPF

Contoh 2:
Pada contoh kedua ini kita akan mencoba merancang sebuah filter IIR untuk high pass
filter (HPF). Tetap dengan frekuensi cut off 2000 Hz, dan frekuensi sampling 10000. Langkah
pemrogramanya adalah dengan sedikit memodifikasi bagian berikut.
[B,A] = butter(N,Wn,'high');
Ini akan memberikan respon frekuensi seperti berikut.
Gambar 3. Respon Frekuensi Filter IIR, HPF

2.2. Filter FIR


Sebuah finite impulse respon filter (filter FIR) memiliki hubungan input dan output dalam
domain waktu diskrit sebagai berikut:

dimana:
-{bk}= koefisien feed forward
- banyaknya (total koefisien) L = M + 1
- M ditetapkan sebagai orde filter FIR

Dalam realisasi diagram blok akan dapat digambarkan seperti pada Gambar 4 berikut ini
Gambar 4. Diagram blok FIR Filter
Untuk tujuan simulasi perangkat lunak kita bisa memanfaatkan fungsi standar berikut
ini: B = FIR1(N,Wn)
Ini merupakan sebuah langkah untuk merancang filter digital FIR dengan orde sebesar
N, dan frekuensi cut off Wn. Secara default oleh Matlab ditetapkan bahwa perintah tersebut
akan menghasilkan sebuah low pass filter (LPF). Perintah ini akan menghasilkan koefisien-
koesifien filter sepanjang (N+1) dan akan disimpan pada vektor B. Karena dalamdomain digital,
maka nilai frekuensi cut off harus berada dalam rentang 0<Wn<1.0. Nilai 1.0 akan memiliki
ekuivalensi dengan nilai 0,5 dari sampling rate (fs/2).Yang perlu anda ketahui juga adalah
bahwa B merupakan nilai real dan memiliki fase yang linear. Sedangkan gain ternormalisasi
filter pada Wn sebesar -6 dB.

Contoh 3:
Kita akan merancang sebuah LPF dengan frekuensi cut off sebesar 2000 Hz. Frekuensi
sampling yang ditetapkan adalah 10000 Hz. Orde filter ditetapkan sebesar 32. Maka langkah
pembuatan programnya adalah sebagai berikut:
fs=10000;
[x,fs]=wavread('a.wav');
Wn = .20;
N = 32;
LP = fir1(N,Wn);
[H_x,w]=freqz(LP);
len_f=length(H_x);
wavplay(x,fs);
f=1/len_f:1/len_f:1;
plot(f,20*log10(abs(H_x)) ,'linewidth',2)
grid

Hasilnya adalah respon frekuensi seperti Gambar 5 berikut

Gambar 5. Respon Frekuensi Low Pass Filter


Contoh 4:
Kita akan merancang sebuah Band Pass Filter (BPF) dengan frekuensi cut off sebesar
2000 Hz (untuk daerah rendah) dan 5000 Hz (untuk daerah tinggi). Frekuensi sampling yang
ditetapkan adalah 10000 Hz. Orde filter ditetapkan sebesar 32. Beberapa bagian program diatas
perlu modifikasi seperti berikut.
Wn1 = [.20, .50];
BP = fir1(N,Wn1);
Hasilnya akan didapatkan respon frekuensi seperti pada Gambar 6 berikut ini.

Gambar 6. Respon Frekuensi Band Pass Filter

Contoh 5:
Kita akan merancang sebuah High Pass Filter (HPF) dengan frekuensi cut off sebesar
5000 Hz (untuk daerah tinggi). Frekuensi sampling yang ditetapkan adalah 10000 Hz. Orde filter
ditetapkan sebesar 32. Beberapa bagian program diatas perlu modifikasi seperti berikut.
Wn2 = .50;
HP = fir1(N,Wn2,'high');

Hasilnya berupa akan didapatkan respon frekuensi seperti pada Gambar 7 berikut ini.

Gambar 7 Respon Frekuensi High Pass Filter

2.3. Filter Pre-Emphasis


Dalam proses pengolahan sinyal wicara pre emphasis filter diperlukan setelah proses
sampling. Tujuan dari pemfilteran ini adalah untuk mendapatkan bentuk spectral frekuensi
sinyal wicara yang lebih halus. Dimana bentuk spectral yang relatif bernilai tinggi untuk daerah
rendah dan cenderung turun secara tajam untuk daerah fekuensi diatas 2000 Hz.
Gambar 8. Posisi Filter Pre-Emphasis pada sistem pengolah wicara
Filter pre-emphasis didasari oleh hubungan input/output dalam domain waktu yang
dinyatakan dalam persamaan beda seperti berikut:
y(n) = x(n) – ax(n−1)
dimana:
a merupakan konstanta filter pre-emhasis, biasanya bernilai 0.9 < a < 1.0 Dalam bentuk
dasar operator z sebagai unit filter, persamaan diatas akan memberikan sebuah transfer
function filter pre-emphasis seperti berikut.

Bentuk ini kemudian akan memberikan dasar pembentukan diagram blok yang
menggambarkan hubungan input dan output seperti pada Gambar 8.

Gambar 9. Diagram blok pre-emphasis filter


Dengan memanfaatan perangkat lunak Matlab kita akan dengan mudah mendapatkan bentuk
respon frekuensi filter pre-empasis.
clear all;
w=0:.01:3.14;
a=0.93;
H=1-a*exp(-j*w);
plot(w/3.14,20*log10(abs(H)),'linewidth',2)
grid
axis([0 1.00 -25 10])
xlabel('frekuensi ternormalisasi')
ylabel('magnitudo (dB)')
title('Pre-Emphasis filter')

Gambar 10. Respon frekuensi filter pre-emphasis


Dengan nilai a = 0,93 akan mampu melakukan penghalusan spectral sinyal wicara yang
secara umum mengalami penurunsan sebesar 6 dB/octav.
Sekarang yang menjadi pertanyaan adalah bagaimana pengaruh sebenarnya filter ini
pada sebuah sinyal wicara? Untuk itu anda dapat memanfaatkan program dibawah ini.
clear all;
fs=10000;[x,fs]=wavread('a.wav');
xx=length(x)+1;x(xx)=0; alpha=0.96;
for i=2:xx
y0(i)=x(i-1);
end
for i=1:xx
y(i) = x(i) - alpha*y0(i);
end
subplot(211)
t=1:xx;
plot(t/fs,y);legend('input');grid
xlabel('waktu (dt)'); ylabel('magnitudo');axis([0.9 1.25 -0.25 0.25]);
subplot(212)
plot(t/fs,y0); legend('output');grid
xlabel('waktu (dt)'); ylabel('magnitudo'); axis([0.9 1.25 -0.25 0.25 ])

Hasilnya adalah berupa sebuah gambaran bentuk sinyal input dan output dari file sinyal
wicara ’a.wav’ dalam domain waktu.
Gambar 11. Sinyal input dan output dari pre-emphasis filter dalam domain waktu

Sedangkan hasil yang didapatkan dalam bentuk domain frekuensi adalah seperti berikut.
Gambar 12. Sinyal input dan output dari pre-emphasis filter dalam domain frekuensi

III. PERANGKAT YANG DIPERLUKAN


 1 (satu) buah PC Multimedia lengkap sound card dan microphone
 Satu perangkat lunak Matlab

IV. LANGKAH-LANGKAH PERCOBAAN


4.1. Penataan Perangkat
Sebelum melakukan percobaan harus dilakukan penataan seperti pada Gambar 13 berikut ini.
Gambar 13. Penataan perangkat percobaan filtering sinyal wicara
PC harus dilengkapi dengan peralatan multimedia seperti sound card, speaker aktif dan
microphone. Untuk microphone dan speaker aktif bisa juga digantikan dengan head set lengkap.
Sebelum anda memulai praktikum, sebaiknya dites dulu, apakah seluruh perangkat multimedia
anda sudah terintegrasi dengan PC.

4.2. Pemfilteran Sinyal Wicara dengan IIR


Pada bagian ini akan dilakukan perancangan filter IIR, mengamati bentuknya respon
frekuensi, melakukan pemfilteran pada sinyal wicara, dan melihat pengaruhnya dalam domain
waktu dan domain frekuensi. Langkah-langkahnya adalah seperti berikut:
1. Rancang sebuah low pass filter IIR dengan spesifikasi sepreti berikut fc= 4000 Hz,
frekuensi sampling fs=10000 Hz, dan pembentukan filter didasarkan pada metode
yang sederhana yaitu Butterworth filter.
2. Amati bentuk respon frekuensi yang dihasilkannya, usahakan untuk menampilkan
dengan sumbu mendatar frekuensi (Hz) dan sumbu tegak berupa magnitudo dalam
besaran dB.
3. Tambahkan program untuk memangil sebuah file ‘*.wav’, dalam hal ini bisa
digunakan hasil perekaman yang telah dilakukan pada percobaan 1, misal file
’u.wav’.
[s,fs]=wavread('FILE_U.wav');
4. Lakukan pemfilteran dengan menggunakan koefisien-koefisien IIR yang telah
dirancang pada langkah 1.
s0=filter(B,A,s);
5. Buat sebuah tambahan program untuk mengamati bentuk spectralnya, bandingkan
sinyal wicara tersebut sebelum pemfilteran dan sesudah pemfilteran.
6. Coba tambahkan noise Gausian dengan varians σ2 = 0.2 pada sinyal wicara yang
dipanggil pada langkah ke 3. Dan lakukan proses pemfilteran ulang seperti pada
langkah 4.
7. Ulangi langkah 5 untuk melihat pengaruh noise pada spectral sinyal wicara, dan lihat
pengaruh pemfilteran pada spectal sinyal bernois tersebut.
8. Setelah menyelesaikan langkah 1 sampai 7, cobalah untuk membuat sebuah filter
high pass filter IIR dengan spesifikasi yang sama dengan yang telah dilakukan dengan
low pass filter, kecuali frekuensi cut off dirubah menjadi fc = 200 Hz.

4.3. Pemfilteran Sinyal Wicara dengan FIR


Pada bagian ini akan dilakukan perancangan filter FIR, mengamati bentuknya respon
frekuensi, melakukan pemfilteran pada sinyal wicara, dan melihat pengaruhnya dalam domain
waktu dan domain frekuensi. Langkah-langkahnya adalah seperti berikut:
1. Rancang sebuah low pass filter FIR dengan spesifikasi seperti berikut:
fc= 4000 Hz, frekuensi sampling fs=10000 Hz, dan pembentukan filter didasarkan pada
metode yang sederhana yaitu seperti pada contoh yang ada di bagian teori.
2. Amati bentuk respon frekuensi yang dihasilkannya, usahakan menampilkan dengan
sumbu mendatar frekuensi (Hz) dan sumbu tegak berupa magnitudo dalam besaran dB.
3. Tambahkan program untuk memangil sebuah file ‘*.wav’, dalam hal ini bisa kita
gunakan hasil perekaman yang telah dilakukan pada percobaan 1, misal file
’FILE_U.wav’.
[s,fs]=wavread('FILE_U.wav');
4. Lakukan pemfilteran dengan menggunakan koefisien-koefisien FIR yang telah dirancang
pada langkah 1
y1 = conv(LP,x);
5. Buat sebuah tambahan program untuk mengamati bentuk spectralnya, bandingkan
sinyal wicara tersebut sebelum pemfilteran dan sesudah pemfilteran.
6. Coba tambahkan noise Gausian dengan varians σ2 = 0.2 pada sinyal wicara yang
dipanggil pada langkah ke 3. Dan lakukan proses pemfilteran ulang seperti pada langkah
4.
7. Ulangi langkah 5 untuk melihat pengaruh noise pada spectral sinyal wicara, dan lihat
pengaruh pemfilteran pada spectal sinyal bernois tersebut.
8. Setelah menyelesaikan langkah 1 sampai 7, cobalah untuk membuat sebuah filter high
pass filter FIR dengan spesifikasi yang sama dengan yang telah dilakukan dengan low
pass filter, kecuali frekuensi cut off anda rubah menjadi fc = 200 Hz.
9. Ulangi langkah 8 dengan band pass filter yang memiliki spesifikasi fL = 200 Hz dan fH =
4000 Hz

4.4. Pre Emphasis Filter pada Sinyal Speech


Pada bagian ini akan dilakukan perancangan filter pre-emphasis, mengamati bentuknya
respon frekuensi, melakukan pemfilteran pada sinyal wicara, dan melihat pengaruhnya dalam
domain waktu dan domain frekuensi. Langkah-langkahnya adalah seperti berikut:
1. Lakukan perancangan filter pre-empashis dengan nilai a = 0,95. Dalam hal ini kita bisa
memanfaatkan program yang ada pada bagian teori.
2. Panggil sebuah file ’*.wav’, dalam hal ini bisa memilih file ’aiueo.wav’ atau jika tidak
keberatan lakukan perekaman lebih dulu dan anda gunakan sebagai file ’*.wav’ yang
akan dianalisa.
3. Amati bentuk spectral sinyal, sebelum dan sesudah diperlakukan dengan pre-empashis.
4. Cobalah rancang sebuah filter de-emphasis. Jika mengalami kesulitan dengan hal ini,
tanyakan kepada instruktur atau dosen praktikum.

5. ANALISA DATA DAN TUGAS


1. Anda telah melakukan serangkaian percobaan dengan filter digital untuk sinyal wicara,
yang harus dilakukan sekarang adalah membuat analisa tentang filter digital tersebut
dan jawab berbagai masalah berikut:
a. Mengapa pemfilteran sinyal wicara dilakukan pada daerah 200 Hz sampai 4000 Hz?
b. Apa pengaruh filer pre-emphasis pada bentuk spectral sinyal wicara?
c. Seberapa besar redaman yang dihasilkan sebuah filter FIR dan filter IIR yang telah
anda rancang terhadap spectral sinyal wicara tepat pada daerah frekuensi cut-off?
2. Berikan analisa tentang sinyal wicara bernoise, dan pengaruh filter low pass yang
dirancang.

Anda mungkin juga menyukai