I. TUJUAN
- Mahasiswa mampu menjelaskan perbedaan sinyal wicara dalam domain waktu dan domain
frekuensi menggunakan perangkat lunak
2.1. Representasi Sinyal Wicara dalam Domain Waktu dan Domain Frekuensi
Salah satu cara untuk mencirikan sinyal wicara dan mereprensetasikan suaranya adalah
melalui representasi spectral. Cara yang paling popular dalam hal ini adalah sound
spectrogram yang mana merupakan suatu bentuk gray scale image yang merepresentasikan
nilai freukensi sinyal pada waktu tertentu.
t =1,5 t =2,3
Salah satu cara mentransformasi sinyal dari domain waktu ke dalam domain frekuensi
adalah dengan meggunakan discrete fourier transform (DFT).
N−1
X[k] =∑ x[n]e− j(2π/ N )kn (1)
n=0
Persamaan (1) diatas menyatakan bahwa sinyal akan periodic pada setiap nilai N.
Implementasi DFT dapat diujudkan dengan sebuah Bank Filter seperti Gambar 2 berikut ini.
xN-1[n] N-point
Running-Sum yN-1[n] = X[N-1]
Filter
e-j[2πk/(N-1)]n
xk[n] N-point
Running-Sum yk[n] = X[k]
Filter
e-j(2πk/N)n
x1[n]
N-point
x[n] Running-Sum y1[n] = X[i]
Filter
e-j(2π/N)n
x0[n] N-point
Running-Sum y0[n] = X[0]
Filter
e-j(0)n
Gambar 2. Blok diagram system Bank Filter Spectrum Analyzer untuk menghitung DFT
Untuk mengoptimalkan proses komputasi, DFT bias dimodifikasi dengan satu algorithma
yang seringkali kita kenal sebagai fast fourier transform (FFT). Dengan FFT proses komputasi
bias direduksi dari N2 menjadi N log2N. Misalnya dengan menggunakan DFT kita akan
melakukan transformasi sebanyak N=1024 titik, maka kita memerlukan perkalian sebanyak N2
= 1.048.567. Sedangkan dengan menggunakan FFT perkalian yang diperlukan sebanyak N
log2N = 5120 perkalian.
Sebuah contoh hasil penmggunakan algorithma FFT untuk system yang lebih komplek
adalah untuk mengolah sinyal wicara. Pada gambar 3 ditunjukkan sebuah hasil proses FFT
untuk kalimat “a-i-u-e-o”.
Sebelum melakukan percobaan anda harus melakukan penataan seperti pada Gambar 4
berikut ini.
Microphone
Matlab
Sound Card Software
PC Multimedia
Speaker
PC harus dilengkapi dengan peralatan multimedia seperti sound card, speaker aktif dan
microphone. Untuk microphone dan speaker aktif bisa juga digantikan dengan head set
lengkap. Sebelum memulai praktikum, sebaiknya dites dulu, apakah seluruh perangkat
multimedia sudah terintegrasi dengan PC.
Pada bagian ini akan dilakukan pembangkitan sinyal sinus, mengamati bentuknya dalam
domain waktu dan domain frekuensi. Langkah-langkahnya adalah seperti berikut:
1. Bangkitkan sinyal sinus dan coba anda tampilkan bentuk sinyal dan suaranya.
wavwrite(y,fs,'sinus_0.wav')
Dengan langkah ini berarti telah dilakukan recording sinyal sinus ke dalam sebuah file
sinus_0.wav.
3. Coba amati bentuk sinyal sinus dalam domain frekuensi dengan memanfaatkan fungsi fft.
Y_f=20*log10(abs(fft(y))); plot(Y_f)
axis([0 1000 -100 100])
Pada bagian ini kita akan melakukan pengamatan sinyal wicara dalam domain waktu dan
domain frekuensi. Dengan memanfaatkan file wicara yang telah direkam dan diedit pada
Percobaan 1, anda coba panggil kembali dan lakukan langkah-langkah berikut.
1. Panggil kembali sinyal wicara vokal ’a.wav’ yang telah dihasilkan pada percobaan 1.
Untuk lebih yakin bahwa langkah pemrogramannya benar, coba suarakan dan gambarkan
hasilnya sebagai fungsi waktu.
2. Gunakan perintah dasar pengamatan power spektral density (PSD) pada Matlab, dalam hal
ini manfaatkan fungsi fft yang ada. Kemudian amati bentuk power spectral density (PSD)
sinyal wicara vokal ‘a.wav’ dalam sebuah gambar yang terpisah. Untuk ini harus
memanfaatkan perintah dasar figure(1); untuk menggambarkan sinyal wicara sebagai
fungsi waktu dan perintah dasar figure(2); untuk menempatkan power spectral density
(PSD) sinyal wicara tersebut.
3. Pada langkah selanjutnya coba gambarkan spectrogram sinyal wicara vokal ’a.wav’.
Untuk itu gunakan perintah figure(3); agar spectrogram yang dihasilkan berada pada
tempat yang terpisah.
4. Lakukan hal yang sama pada vokal i,u,e dan o.
Pada sub bagian 4.1 dan 4.2, siswa diwajibkan menyusun perintah Matlab sendiri untuk
mengamati bentuk sinyal dalam domain waktu dan domain frekuensi. Sekarang yang harus
dilakukan adalah memanfaatkan perangkat lunak Colea, salah satu produk pengembangan dari
Matlab yang dikususkan uneukpengolahan sinyal wicara. Dengan langkah-langkah yang sama
dengan sub bagian 4.2. Lakukan pengolahan sinyal wicara denagn memanfaatkan Colea. Jika
anda masih ragu dengan perangkat lunak ini, coba anda tanyakan ke dosen pengajar praktikum.
5. ANALISA DATA DAN TUGAS
1. Untuk representasi sinyal vokal a-i-u-e-o jelaskan bagaimana bentuknya dalam domain
waktu dan domain frekuensi. Dan jelaskan pula apa arti gambar yang muncul pada
spectrogram sinyal sinyal tersebut.
Jawab :
Opsi ini menampilkan spektogram (dalam warna atau skala abu-abu) dari sinyal
ucapan. Rentang frekuensi default untuk tampilan spektrogram adalah 0-5 kHz. Untuk
menampilkan rentang penuh, yaitu dari 0-Fs / 2, gunakan opsi 'Jangkauan penuh' dari
submenu Spectrogram. Untuk beralih kembali ke bentuk gelombang waktu pilih opsi
' Bentuk gelombang waktu' dari menu tampilan.
2. Jelaskan penggunaan perintah dasar pada Matlab Colea, ambil salah satu saja dan
uraikan dengan mendetail.
Jawab :
Buka matlab > masuk ke direktori colea, ketik cd \ colea . Setelah
mengetik colea akan melihat jendela dialog file > dapat memilih file. Colea dapat
memproses beberapa format file dengan membaca ekstensi file (missal WAV, VOC,
dll). Ekstensi file sangat penting karena setiap format file memiliki perbedaan informasi
header. Colea mengetahui frekuensi pengambilan sampel file, jumlah sampel, dll.,
6. HASIL PRAKTIKUM
Pada percobaan 4.2 Sinyal Sinus dalam Domain Waktu dan Frekuensi, pada domain
waktu, ketika diplot salah satu sumbu dengan variabel waktu maka variabel lainnya adalah
amplitudo. Sinyal domain waktu berupa gelombang berjalan yang direpresentasikan pada
waktu terhadap amplitudo dari sinyal. Amplitudo pada sinyal domain waktu menunjukan keras
lemahnya sinyal yang diterima. Sehingga, sinyal yang diterima tidak memiliki karakteristik
yang berbeda tiap waktunya. Pada sinyal domain frekuensi, ketika diplot berupa spektrum
dengan penyajian frekuensi terhadap magnitudo. Spektrum frekuensi sinyal pada dasarnya
adalah komponen frekuensi (spektral frekuensi) sinyal yang menunjukkan frekuensi apa yang
muncul. Frekuensi menunjukkan tingkat perubahan. Jika suatu variabel sering berubah, maka
disebut berfrekuensi tinggi. Namun, jika tidak sering berubah, maka disebut berfrekuensi
rendah. Jika variabel tersebut tidak berubah sama sekali, maka disebut tidak mempunyai
frekuensi (nol frekuensi). Pertama menetapkan fs= Waktu t mulai dari 1/fs dengan step
kenaikan 1/fs dan berakhir di t=1. Nilai frekuensinya tetapkan f = 16000 Hz. Pemanggilan
sinyal dengan perintah sin(2*pi*800*t). Kemudian mengaktifkan suaranya, bunyinya
terdengar nyaring. Simpan hasil records sinyal sinus dan membuat domain frekuensi
menggunakan fft. Bisa dilihat bahwa frekuensi berada di 800 Hz dengan sampling 16000 Hz.
Pada percobaan 4.3 Sinyal Wicara dalam Domain Waktu dan Frekuensi, untuk
menghitung frekuensi dari suatu sinyal, sebuah implementasi diskrit dari analisa Fourier dapat
digunakan, yang kemudian lebih disempurnakan dengan suatu algoritma yang kita kenal
sebagai Fast Fourier transform (FFT). Secara umum teknik ini merupakan pendekatan yang
terbaik untuk transformasi. Pada praktikum ini syntax fft(y) dapat menghitung transformasi
Fourier diskrit (DFT) X menggunakan algoritma transformasi Fourier cepat (FFT). Sinyal
wicara merupakan sinyal yang bervariasi lambat sebagai fungsi waktu, dalam hal ini ketika
diamati pada durasi yang sangat pendek (5 sampai 100 mili detik) karakteristiknya masih
stasioner. Tetapi bilamana diamati dalam durasi yang lebih panjang (> 1/5 detik) karakteristik
sinyalnya berubah untuk merefleksikan suara ucapan yang keluar dari pembicara. Salah satu
cara dalam menyajikan sebuah sinyal wicara adalah dengan menampilkannya dalam tiga
kondisi dasar, yaitu silence (S) atau keadaan tenang dimana sinyal wicara tidak diproduksi,
unvoice (U) dimana vocal cord tidak berfibrasi, dan yang ketiga adalah voiced (V) dimana
vocal cord bervibrasi secara periodik sehingga menggerakkan udara ke kerongkongan melalui
mekanisme akustik sampai keluar mulut dan menghasilkan sinyal wicara. Pada percobaan ini
menghasilkan 3 buah figure dengan komposisi x dan y tiap figure berbeda. Percobaan kedua
adalah sinyal wicara dalam domain waktu dan frekuensi. Menggunakan sinyal wicara vokal
aiueo.wav sebagai praktikum. Dari hasil spectrum dapat dilihat bahwa penyebutan aiueo
mengalami kenaikan pitch kemudian penurunan.
Pada percobaan 4.3 pemanfaatan perangkat lunak colea dapat dianalisa bahwa
pengolahan sinyal wicara dengan memanfaatkan Colea dapat menampilkan gelombang waktu
dan spectrogram secara ganda, dapat merekam suara langsung ke matlab. Pada colea dapat pula
menyaring sinyal ucapan pada frekuensi cutoff yang ditentukan oleh pengguna. Pada colea
dapat dilakukan perbandingan dua bentuk gelombang menggunakan beberapa ukuran jarak
spectral dan dapat menambahkan derau ke sinyal ucapan pada SNR yang ditentukan oleh
pengguna. Percobaan ini menggunakan colea dari Matlab yaitu program untuk menganalisa
sinyal wicara. Setelah menginstall colea buka colea.m yang merupakan file untuk membuka
file wav setelah di run. Setelah file wav ini ter-run melalui colea bisa diamati atau diubah
menjadi spectrogram dan lain-lain sesuai kebutuhan. Pada percobaan ini file colea dimasukkan
pada file install matlab kemudian dimasukkan ke bin baru dibuka melalui jendela matlab dan
di run kemudian memilih file suara sinus_0.wav menghasilkan gambar gelombang yang rapat
dan mencoba lagi run dan memilih file aiueo.wav menghasilkan gelombang yang berbeda dari
gambar colea pertama dengan menunjukkan amplitude dan waktu pada garis x dan y.
8. KESIMPULAN