Modul 3
Penghitungan Short Term Energy
I. TUJUAN
- Mahasiswa mampu melakukan penghitungan energi pada sinyal secara umum
- Mahasiswa mampu melakukan penghitungan dB dan threshold sinyal wicara yang mampu
didengar telinga
- Mahasiswa mampu melakukan penghitungan energi sinyal wicara dengan mengacu standar
frame
Sedangkan untuk besaran lain bernama energi dari sebuah sinyal dinyatakan sebagai:
T
E V k
2
(2)
k 0
V k
2
k 0
E ave (3)
T
Untuk sinyal sinus diatas bisa diberikan dalam bentuk magnitudo dan energinya seperti
pada Gambar 1 berikut ini.
Tekanan Suara
Suara yang dapat didengar (audible sound) tersusun dari tekanan gelombang,
sedemikian hingga besarnya suara merupakan hasil dari variasi nilai relative tekanan
gelombang terhadap tekanan oleh udara. Karena sensitivitas pada pendengaran manusia
sangat kuat, maka threshold of hearing berkaitan dengan variasi tekanan kurang dari
seper satu juta tekanan atmosfer sudah bisa dikenali.
Standar threshold of hearing dapat dinyatakan dalam terminologi tekanan dan
intensitas suara dalam http://hyperphysics.phy-astr.gsu.edu/hbase/sound/db.html - c1
decibel dapat dinyatakan dalam terminology tekanan euara:
Po 2 10 5 Newton / m2 (4)
I P
2
P
I (dB ) 10 log10 10 log10 2 20 log10 (5)
Io P0 P0
Tekanan P disini bisa dipahami sebagai amplitude pada tekanan gelombang. Daya yang
dibawa oleh sebuah gelombang berjalan adalah proporsional dengan kuadrat pada
amplitudo. Nilai 20 berasal dari kenyataan bahwa nilai kuadrat pada nilai yang
dlogarithma akan sebanding dengan 2 x hasil logarithma. Secara umum mikropone
bekerja sebagai dynamic microphones yang menghasilkan sebuah tegangan yang
proposional dengan tekanan suara, maka perubahan di dalam intensitas suara yang sampai
ke mikropone dapat dihitung sebagai:
V
I (dB) 20 log10 2 (6)
V1
Threshold of Hearing
Tingkat suara diukur dalam decibel secara umum mengacu pada sebuah standar
threshold of hearing (ambang pendengaran) pada daerah kerja sekitar frekuensi 1000 Hz
untuk telinga manusia dapat dinyatakan dengan terminology intensitas suara:
Io 10 2 watts / m 2 10 16 watts / cm 2 (7)
atau di dalam terminologi tekanan suara:
dimana: w(m) = merupakan fungsi window seperti hamming, hanning, bartlett, dan boxcarr.
Panjang window dalam hal ini adalah m, untuk durasi dari k = 0 sampai k = T akan
didapatkan window sebanyak n=T/m apabila tidak ada overlapping antara window satu dengan
yang lain. Jika terjadi overlapping antara window satu dengan yang lain, misalnya sebesar m/2,
maka jumlah window dalam satu durasi T adalah sebanyak n = 1 + T/(m/2).
Untuk suatu pengamatan energi pada frame ke-k bentuk persamaan (5) menjadi:
T
E l V k wl k
2
(6)
k 0
dimana l akan menentukan posisi titik-titik window pada sinyal tersebut, ini juga dikenal sebagai
model sliding window.
Dengan menggunakan model short time measurement atau sort term energy (STE)
measurement dapat digunakan untuk memilah bagian dari sinyal wicara yang merupakan voiced
atau closed. Sebab pada umumnya unvoiced speech memiliki durasi yang lebih pendek. Untuk
pengukuran winyal wicara menggunakan window biasanya dipilih panjang window dengan durasi
10 s/d 20 mili detik. Apabila menggunakan frekuensi sampling sebesar 16 KHz, maka nilainya
akan ekuivalen dengan sampel sebanyak 160 sampai 320 sampel setiap frame.
Gambar 4. Segmen sinyal wicara ‘a’ dan window hamming 20 mili detik per frame widow
Sebelum anda melakukan percobaan anda harus melakukan penataan seperti pada
Gambar 5 berikut ini.
Microphone
Software
Sound Card Matlab
PC Multimedia
Speaker
PC anda harus dilengkapi dengan peralatan multimedia seperti sound card, speaker aktif dan
microphone. Untuk microphone dan speaker active bisa juga digantikan dengan head set lengkap.
Sebelum anda memulai praktikum, sebaiknya anda tes dulu, apakah seluruh perangkat multimedia
anda sudah terintegrasi dengan PC.
2. Coba gambarkan segmen sinyal sinus tersebut sebesar 1 frame atau senilai 20 ms. Ini
seharusnya ekuivalen dengan sampel sebanyak 320 sampel. Aktifkan suaranya, dan
perhatikan bagaimana bunyinya.
3. Hitung besarnya energi sinyal sinus dengan formulasi dasar pada persamaan (2), (3)
dan (4). Tampilkan grafiknya untuk sinyal sinus dalam bentuk magnitudo dan
energinya sebagai fungsi waktu.
y=sin(2*pi*f*k);
yy=y.*y;
1. Bangkitkan sinyal noise gaussian dengan jumlah sampel persis seperti jumlah sampel
yang anda gunakan pada langkah percobaan 4.1. Jangan lupa anda tetapkan nilai noise
ini harus zero mean dan varians sebesar 0.1.
2. Hitung besarnya nilai energi noise yang telah anda bangkitkan
3. Dengan memanfaatkan langkah percobaan 4.1 anda bangkitkan sinyal sinus, dengan
spesifikasi yang sama, dan jumlahkan nilainya.
4. Coba anda hitung perbandingan energi sinyal terhadap besarnya energi noise, atau
yang lebih dikenal sebagai signal-to-noise ratio. Caranya harus mengikuti formulasi
dasar sbb.
kN
S (k ) 2
SNR 10 log 10 kkN1
N (k )
2
k 1
dimana : S(k) merupakan sinyal sinus yang sudah bercampur noise
N(k) merupakan sinyal noise
Anda akan dapat melihat pola yang kurang lebih mendekati Gambar 7. Dalam hal ini
anda memperolah tampilan yang bagus pada sinyal wicara dan bentuk energi sebagai
fungsi waktu.
Pada proses pengolahan sinyal yang sesungguhnya, cara yang telah anda tempuh pada
langkah 1 dan 2 adalah salah, sebab tidak mengikuti prosesdur yang benar dalam
pengolahan sinyal. Untuk itu anda harus mengikuti logika seperti pada diagram blok pada
Gambar 8 berikut ini.
Gambar 8. Diagram blok penghitungan short term energy pada sinyal wicara
1. Anda baca file sinyal wicara hasil rekaman suara anda yang telah dihasilkan dari
sebuah lingkungan bebas dari noise.
2. Gunakan formulasi yang benar untuk menghitung besarnya short-term-energy sinyal
wicara, dengan cara membagi sinyal wicara dalam bentuk frame. Satu panjang frame
adalah 20 ms, untuk frekuensi sampling fs = 16000, maka panjang satu grama dalah
sebesar (20s/1000) x 16000 sampel/s= 320 sample.
3. Tampilkan gambar bentuk sinyal dan energi sebagai fungsi frame.
%File Name:tbs_p3_WE_01.m
clear all;
fs=10000;
[y,fs]=wavread('a.wav');
subplot(211)
plot(y)
axis([0 length(y) -1.2 1.2])
title('Sinyal Wicara & Energi Rata-2 setiap Frame')
ylabel('Magnitudo Sinyal Wicara')
y_l=length(y);
jj=floor(length(y)/200);
n1=1; n2=200;
for j=1:jj
for i=n1:n2
x(i)=y(i);
xx =sum(abs(x(i)));
end
xx=xx/200;
for i=n1:n2
x(i)=xx;
end
n1=n1+200;
n2=n2+200;
end
subplot(212)
plot(x);
ylabel('Energi Setiap Frame')
Gambar 8. Gambaran bentuk sinyal wicara dan energi rata-rata setiap frame
1. Anda bisa menggunakan program yang telah anda buat pada langkah 4.3 sebelumnya.
2. Tambahkan noise pada setiap frame sinyal wicara dan hitung besarnya energi noise
rata-rata yang terbangkit.
3. Bandingkan besarnya enegi sinyal rata-rata dan noise rata-rata dengan formula
logarithmik seperti pada persamaan yang terdapat pada percobaan 4.2.
4. Ulangi langkah 1-3 mulai dari nilai SNR 30 dB, 35 dB, ....70 dB.