Modul 1 PDF
Modul 1 PDF
Modul 1
Proses Perekaman dan Pengeditan Sinyal Wicara
I. TUJUAN
- Mahasiswa mampu melakukan proses perekaman dan pengeditan sinyal wicara
dengan menggunakan perangkat lunak wavsurfer.
V
U
S
Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan menampilkannya
dalam tiga kondisi dasar, yaitu silence (S) atau keadaan tenang dimana sinyal wicara tidak
diproduksi, unvoice (U) dimana vocal cord tidak berfibrasi, dan yang ketiga adalah voiced (V)
dimana vocal cord bervibrasi secara periodic sehingga menggerakkan udara ke kerongkongan
melalui mekanisme akustik sampai keluar mulut dan menghasilkan sinyal wicara. Contoh unvoice
adalah konsonan ‘k’, dan contoh voice adalah vocal ’a’.
Ts = 1/fs
Sekuen x[n] didapakan setelah proses perubahan dari continues to discrete (C-to-D). Kondisi
realnya secara hardware adalah menggunakan rangkaian sampling seperti Gambar 3 berikut ini.
fs=1/Ts
Sinyal
Sinyal
output
input
Rangkaian sampling diatas merupakan sebuah ujung tombak dari sebuah analog to digital
conversion (ADC).
informasi N bit
Sample &
…
Persyaratan frekuensi sampling menurut teorema Shannon harus sama dengan atau melebihi 2 kali
frekuensi sinyal yang di sample.
fs > 2x fi (2)
Jika sinyal informasi yang kita sample memiliki komponen frekuensi beragam, misalnya untuk
sinyal wiacara memungkinkan untuk memiliki frekuensi dari 20 sampai 4000 Hz, maka sinyal
informasi tersebut bias dituliskan sebagai:
i max
x(t ) sin(2f t )
i 1
i (3)
Sebelum anda melakukan percobaan anda harus melakukan penataan seperti pada
Gambar 5 berikut ini.
Microphone
Software
Sound Card wavsurfer
PC Multimedia
Speaker
PC anda harus dilengkapi dengan peralatan multimedia seperti sound card, speaker aktif dan
microphone. Untuk microphone dan speaker aktif bias juga digantikan dengan head set lengkap.
Sebelum anda memulai praktikum, sebaiknya anda tes dulu, apakah seluruh perangkat multimedia
anda sudah terintegrasi dengan PC.
Pertemuan 1
4.2 Mengenal WAVSURFER Sebagai Perangkat Lunak Pengolah Informasi Wicara
Sedikit Tentang WaveSurfer
WaveSurfer memiliki bentuk sederhana tetapi merupakan interface yang sangat
bermanfaat. Perangkat ini sangat membantu bagi anda yang bergelut dengan masalah
pengolahan sinyal wicara. Ketika WaveSurfer pertama kali anda buka, tampilan awalnya
hanya kosong saja. Anda bisa melakukan proses recording dengan wavsurfer, atau bisa
juga memanfatkan file *.wav yang sudah ada. Apakah hanya file *.wav saja yang bisa
ditampilkan? ….. Untuk sementara jangan berfikir telalu jauh dulu, yang penting coba
dan nikmati saja ya…(smile).
Membuka Wavsurfer
Bagaimana cara membuka wavsurfer ? Coba anda cari icon seperti Gambar 6 berikut ini
pada desktop anda. Jika ada langsung double click, dan hasilnya akan tampil seperti pada
Gambar 7.
Anda perhatikan bagian bawah wavesurfer, anda lihat, kalimat File: , rate:16000,
encoding Lin 16, channels:1, length:00.00[hms,d]. Ini berarti file masih belum ada yang
dibuka, sampling rate 16000Hz, pengkodean linear 16 bit (PCM 16 bit), channel 1 berarti
mono channel, panjang 0 jam, 0 menit dan 0 detik, sebab masih belum ada sinyal.
Jika anda akan melakukan perubahan sampling rate, anda bisa lakukan dengan menekan
Toolbar Transform|Convert.
Gambar 8. Langkah awal untuk merubah nilai sampling rate, jenis pengkodean dan channel
Selanjutnya anda bisa memilih nilai sampling rate, jenis pengkodean yang akan anda
gunakan dan channel mono atau stereo.
Gambar 9. Penentuan sampling rate untuk proses perekaman atau yang lain
Merekam Suara
Coba anda lihat bagian kanan atas pada wavsurfer anda, perhatikan button yang mirip
dengan tombol yang biasa terdapat pada perangkat audio.
Dengan mudah tentu anda bias melakukan beberapa perintah seperti play, pause, stop,
dsb. Coba anda play file tersebut, dan dengarkan apa yang terucap dari file sinyal wicara
tersebut.
Selanjutnya anda harus memilih file yang anda inginkan, jangan lupa posisi folder
tempat file tersebut berada. Di dalam contoh ini mengambil file ”ada.wav”. Pada saat file
tersebut akan terbuka, anda diberi pilihan jenis tampilan yang akan muncul, untuk
langkah awal pilih waveform seperti berikut.
Collapser button
Waveform Panel
Wavebar
Gambar 14. Tampilan file ada.wav
Dengan melihat keterangan bagian kiri pada Gambar 14, diharapkan anda bisa memahami
bagian-bagian di dalam tampilan wavesurfer dan bagaimana fungsinya.
Dengan langkah ini akan menghasilkan tampilan tambahan berupa spectrogram sinyal
wicara seperti pada Gambar 16. Perhatikan bentuk tampilan yang berada diatas tampilan
sinyal wicara dalam domain waktu.
Pertemuan 2
4.3. Proses Pengeditan untuk Pemisah Fonem (Pelabelan)
Untuk bisa melakukan proses pemisahan satu fonem dari fonem yang lain dalam suatu
bunyi ucapan bahasa Indonesia, kita harus memahami lebih dulu aturan dan standar
fonem yang ada di dalam Bahasa Indonesia. Proses pengeditan untuk pemisahan antar
satu fonem dari fonem yang lain ini dikenal sebagai proses pelabelan. Dari proses
pelabelan ini anda akan mengetahui durasi sebuah fonem di dalam sebuah kata.
Voiced plosive
Letup tak bersuara/
31. C /c/ Blok letup
Voiced plosive
Letup bersuara/
32. J /j/ Blok letup
Voiced plosive
33. Sil /#/ Kawasan sunyi
Kawasan sunyi persiapan letup
34. Cl /cl/ Sebelum blok letup
tak berbunyi.
35. Bz /bz/ Buzzbar sebelum voiced plosive Sebelum blok letup
d a
a bz
Gambar 17. Contoh pemilahan/segmentasi posisi fonem dalam sebuah kata ’ada’
Perhatikan untuk fonem ’a’, posisi dimulai pada 381 ms dan berakhir pada 555 ms. Cara
penulisan selengkapnya adalah seperti pada Tabel dibawah ini.
Sekuen fomen
a bz cl d a #
t001-001m 381 555 580 749 785 1044
t002-001m 492 626 658 781 809 975
t003-001m 290 461 483 614 643 915
t0004-001f …. …. …. ….. ….. …..
t0005-001f …. …. …. ….. ….. …..
t0006-001f …. …. …. ….. ….. …..
t0007-001f …. …. …. ….. ….. …..
t0008-001f
Untuk melakukan proses pelabelan anda harus mendapatkan data yang cukup banyak dan
berasal dari orang berbeda. Untuk kasus diatas, anda pilih 10 orang teman anda, dan
lakukan proses perekaman untuk kata ”ada”. Anda lakukan proses pelabelan satu demi
satu dan buat catatan seperti yang telah diberikan pada contoh diatas. Untuk orang
pertama anda beri nama file t001-001m jika pengucap pria atau t001-001f jika pengucap
wanita. Begitu juga untuk kata ada dari penucap kedua, anda beri nama file t002-001m
atau t002-001f. Lakukan langkah ini sampai minimal 10 orang.
Untuk kata yang berbeda, misalnya ”saya”, anda harus bertanya lebih dulu kepada dosen
pembiimbing praktikum untuk melakukan pelabelan.
Apakah anda merasa kantuk? Minum kopi dulu, berhenti sejenak dan kalau sudah siap
lanjutkan pekerjaan anda.