Modul 1 PDF

Modul 1 Praktikum Aplikasi Pengolahan Sinyal Digital Recording dan Editing
Modul 1
Proses Perekaman dan Pengeditan Sinyal Wicara
I. TUJUAN
- Mahasiswa mampu melakukan proses perekaman dan pengeditan sinyal wicara
dengan menggunakan perangkat lunak wavsurfer.
II. DASAR TEORI

2.1. Sinyal Wicara
Sinyal wicara merupakan sinyal yang bervariasi lambat sebagai fungsi waktu, dalam
hal ini ketika diamati pada durasi yang sangat pendek (+ 20 mili detik) karakteristiknya
masih stasioner. Tetapi bilamana diamati dalam durasi yang lebih panjang ( > 20 mili
detik) karakteristik sinyalnya berubah untuk merefleksikan suara ucapan yang keluar dari
pembicara.
V
U
S
Gambar 1. Contoh sinyal wicara ucapan “Selamat Datang”
Salah satu cara dalam menyajikan sebuah sinyal wicara adalah dengan menampilkannya
dalam tiga kondisi dasar, yaitu silence (S) atau keadaan tenang dimana sinyal wicara tidak
diproduksi, unvoice (U) dimana vocal cord tidak berfibrasi, dan yang ketiga adalah voiced (V)
dimana vocal cord bervibrasi secara periodic sehingga menggerakkan udara ke kerongkongan
melalui mekanisme akustik sampai keluar mulut dan menghasilkan sinyal wicara. Contoh unvoice
adalah konsonan ‘k’, dan contoh voice adalah vocal ’a’.
Tri Budi Santoso 1

2.2. Proses Sampling

Perhatikan sinyal sinus berikut ini:
x(t) = A cos(t +) (1)
Sinyal tersebut merupakan contoh sinyal waktu kontinyu. Kita juga seringkali menggunakan
terminlogi sinyal analog untuk menyebutnya.
Untuk proses komputasi, sinyal waktu kontinyu harus dirubah menjadi bentuk waktu diskrit
dan dilanjutkan dengan proses digitalisasi. Untuk memperoleh bentuk sinyal waktu diskrit, sinyal
waktu kontinyu harus di-sampel.
x(t) C-to-D x[n] = x[nTs]
Ts = 1/fs
Gambar 2. Blok diagram konversi sinyal kontinyu menjadi sinyal diskrit
Sekuen x[n] didapakan setelah proses perubahan dari continues to discrete (C-to-D). Kondisi
realnya secara hardware adalah menggunakan rangkaian sampling seperti Gambar 3 berikut ini.
fs=1/Ts
Sinyal
Sinyal
output
input
Gambar 3. Rangkaian Sampling
Rangkaian sampling diatas merupakan sebuah ujung tombak dari sebuah analog to digital
conversion (ADC).
informasi N bit
Sample &
…
Quantization Encoding kode digital

Hold
Gambar 4. Blok diagram rangkaian ADC
Tri Budi Santoso 2

Persyaratan frekuensi sampling menurut teorema Shannon harus sama dengan atau melebihi 2 kali
frekuensi sinyal yang di sample.
fs > 2x fi (2)
Jika sinyal informasi yang kita sample memiliki komponen frekuensi beragam, misalnya untuk
sinyal wiacara memungkinkan untuk memiliki frekuensi dari 20 sampai 4000 Hz, maka sinyal
informasi tersebut bias dituliskan sebagai:
i max
x(t )   sin(2f t )
i 1
i (3)
Dan persyaratan untuk frekuensi smpling menjadi:

fs > 2x fimax (4)
Frekuensi sampling seringkali dikatakan dengan terminologi sampling rate, yaitu jumlah sample
yang diambil setiap detik, fs=1/Ts yang mana ini juga dikenal sebagai Nyquist rate.
III. PERANGKAT YANG DIPERLUKAN

- 1 (satu) buah PC Multimedia lengkap sound card dan microphone
- Satu perangkat lunak wavsurfer under windows
Sebelum anda melakukan percobaan anda harus melakukan penataan seperti pada
Gambar 5 berikut ini.
Microphone
Software
Sound Card wavsurfer
PC Multimedia
Speaker
Gambar 5. Penataan perangkat percobaan recording dan editing
PC anda harus dilengkapi dengan peralatan multimedia seperti sound card, speaker aktif dan
microphone. Untuk microphone dan speaker aktif bias juga digantikan dengan head set lengkap.
Sebelum anda memulai praktikum, sebaiknya anda tes dulu, apakah seluruh perangkat multimedia
anda sudah terintegrasi dengan PC.
Tri Budi Santoso 3

IV. LANGKAH-LANGKAH PERCOBAAN
Pertemuan 1
4.2 Mengenal WAVSURFER Sebagai Perangkat Lunak Pengolah Informasi Wicara
Sedikit Tentang WaveSurfer
WaveSurfer memiliki bentuk sederhana tetapi merupakan interface yang sangat
bermanfaat. Perangkat ini sangat membantu bagi anda yang bergelut dengan masalah
pengolahan sinyal wicara. Ketika WaveSurfer pertama kali anda buka, tampilan awalnya
hanya kosong saja. Anda bisa melakukan proses recording dengan wavsurfer, atau bisa
juga memanfatkan file *.wav yang sudah ada. Apakah hanya file *.wav saja yang bisa
ditampilkan? ….. Untuk sementara jangan berfikir telalu jauh dulu, yang penting coba
dan nikmati saja ya…(smile).
Membuka Wavsurfer
Bagaimana cara membuka wavsurfer ? Coba anda cari icon seperti Gambar 6 berikut ini
pada desktop anda. Jika ada langsung double click, dan hasilnya akan tampil seperti pada
Gambar 7.
Gambar 6. Icon Wavsurfer
Gambar 7. Tampilan awal wavsurfer
Anda perhatikan bagian bawah wavesurfer, anda lihat, kalimat File: , rate:16000,
encoding Lin 16, channels:1, length:00.00[hms,d]. Ini berarti file masih belum ada yang
dibuka, sampling rate 16000Hz, pengkodean linear 16 bit (PCM 16 bit), channel 1 berarti
mono channel, panjang 0 jam, 0 menit dan 0 detik, sebab masih belum ada sinyal.
Jika anda akan melakukan perubahan sampling rate, anda bisa lakukan dengan menekan
Toolbar Transform|Convert.
Tri Budi Santoso 4

Gambar 8. Langkah awal untuk merubah nilai sampling rate, jenis pengkodean dan channel
Selanjutnya anda bisa memilih nilai sampling rate, jenis pengkodean yang akan anda
gunakan dan channel mono atau stereo.
Gambar 9. Penentuan sampling rate untuk proses perekaman atau yang lain
Merekam Suara
Coba anda lihat bagian kanan atas pada wavsurfer anda, perhatikan button yang mirip
dengan tombol yang biasa terdapat pada perangkat audio.
Gambar 10. Button Audio Audio
Dengan mudah tentu anda bias melakukan beberapa perintah seperti play, pause, stop,
dsb. Coba anda play file tersebut, dan dengarkan apa yang terucap dari file sinyal wicara
tersebut.
Tri Budi Santoso 5

Gambar 11. Hasil perekaman kata “ada”

Untuk menyimpan hasil perekaman yang telah dilakukan, anda pilih toolbar File|Save,
dan beri nama misalnya ”ada.wav”. Jika anda terlupa memberi extension secara otomatis
akan disimpan sebagai file berkestension wav.
Membuka File *.wav

Agar mudah bagi anda, kita mulai dengan membuka file *.wav seperti berikut. Pilih
toolbar File|Open seperti Gambar 12.
Gambar 12. Membuka File
Selanjutnya anda harus memilih file yang anda inginkan, jangan lupa posisi folder
tempat file tersebut berada. Di dalam contoh ini mengambil file ”ada.wav”. Pada saat file
Tri Budi Santoso 6

tersebut akan terbuka, anda diberi pilihan jenis tampilan yang akan muncul, untuk
langkah awal pilih waveform seperti berikut.
Gambar 13. Menentukan format tampilan wavsurfer
Langkah ini akan memberikan tampilan seperti pada Gambar 14.
Collapser button
Waveform Panel
Time Axis Panel
Wavebar
Gambar 14. Tampilan file ada.wav
Dengan melihat keterangan bagian kiri pada Gambar 14, diharapkan anda bisa memahami
bagian-bagian di dalam tampilan wavesurfer dan bagaimana fungsinya.
Melihat Tampilan Spectrogram Sinyal Wicara

Salah satu keungulan perangkat lunak wavsurfer adalah kemudahan untuk melihat
tampilan sinyal dalam berbagai domain sesuai yang kita inginkan. Salah satu tampilan
yang cukup popular didalam pengolahan sinyal wicara adalah spectrogram, atau dalam
bahasa yang lebih mudah dipahami adalah tampilan spectrum frekuensi yang muncul
sebagai fungsi waktu. Untuk bisa melihat spectrogram sinyal tersebut diatas, lakukan
langkah seperti berikut. Click kanan pada mouse anda, pilih Create Panel, lanjutkan
dengan Spectrogram.
Tri Budi Santoso 7

Gambar 15. Langkah menampilkan spectrogram
Dengan langkah ini akan menghasilkan tampilan tambahan berupa spectrogram sinyal
wicara seperti pada Gambar 16. Perhatikan bentuk tampilan yang berada diatas tampilan
sinyal wicara dalam domain waktu.
Gambar 16. Tampilan waveform dan Spectrogram secara bersamaan
Tri Budi Santoso 8

Pertemuan 2
4.3. Proses Pengeditan untuk Pemisah Fonem (Pelabelan)
Untuk bisa melakukan proses pemisahan satu fonem dari fonem yang lain dalam suatu
bunyi ucapan bahasa Indonesia, kita harus memahami lebih dulu aturan dan standar
fonem yang ada di dalam Bahasa Indonesia. Proses pengeditan untuk pemisahan antar
satu fonem dari fonem yang lain ini dikenal sebagai proses pelabelan. Dari proses
pelabelan ini anda akan mengetahui durasi sebuah fonem di dalam sebuah kata.
Untuk Bahasa Indonesia kita memiliki 35 fonem, seperti tabel berikut:

No. Simbol Fonem Bunyi Bahasa Blok fitur yang dipakai sebagai ciri
1. A /a/
2. O /o/ Periode yang paling stasioner yang paling
3. U /u/ Vokal mirip dengan vokal tunggal
4. I /i/
5. E /e/ /m e d a n/
6. @ /@/ /c @ p a t /
7. Y /y/ Semi vokal Akhir periode stasioner sampai awal periode
8. W /w/ stasioner
9. aı /ai/ Vokal rangkap/ Akhir periode stasioner sampai awal periode
10. aω /au/ Diftong stasioner
11. òı /oi/
12. M /m/
13. N /n/ Nasal/sengau
14. Ň /ny/ Blok akhir dari murmur nasal
15. Ŋ /ng/
16. B /b/
Letup bersuara/
17. D /d/ Blok letup.
Voiced plosive
18. G /g/
Blok dengan power paling kecil, atau blok
19. L /l/ Sampingan/lateral
letup.
20. R /r/ Geletar/trills Blok tengah fonem.
Geseran bersuara/
21. Z /z/ Blok geseran bagian tengah
voiced fricatives
Geseran tak bersuara/ unvoice
22 S /s/ Blok geseran bagian tengah
fricatives
23. H /h/ Blok geseran bagian tengah
fricatives
24. F /f/ Blok geseran bagian tengah
fricatives
Geseran bersuara/
25. V /v/ Blok geseran bagian tengah
voiced fricatives
26. Σ /sy/ Blok geseran bagian tengah
fricatives
27. X /kh/ Blok geseran bagian tengah
fricatives
Letup tak bersuara/
28. P /p/ Blok letup
Voiced plosive
Letup tak bersuara/
29. T /t/ Blok letup
Voiced plosive
30. K /k/ Letup tak bersuara/ Blok letup
Tri Budi Santoso 9

Voiced plosive
Letup tak bersuara/
31. C /c/ Blok letup
Voiced plosive
Letup bersuara/
32. J /j/ Blok letup
Voiced plosive
33. Sil /#/ Kawasan sunyi
Kawasan sunyi persiapan letup
34. Cl /cl/ Sebelum blok letup
tak berbunyi.
35. Bz /bz/ Buzzbar sebelum voiced plosive Sebelum blok letup
Melakukan Proses Pelabelan

Untuk melakukan proses pelabelan anda harus memahami posisi masing-masing
fonem dari tampilan yang dihasilkan oleh sebuah perangkat lunak. Dengan memanfaatkan
wavsurfer kita bisa mengamati secara visual posisi masing-masing dari file *.wav yang
kita analisa.
Perhatikan hasil modifikasi dari Gambar 16 berikut ini.
d a
a bz
Gambar 17. Contoh pemilahan/segmentasi posisi fonem dalam sebuah kata ’ada’
Gambar 17 merupakan salah satu contoh bentuk pemilahan/segmentasi posisi fonem

berdasarkan Bahasa Indonesia.
Untuk proses pelabelan kita akan mengacu pada:
- 35 jenis segmen fonem
- Segmentasi lebih didasarkan pada penglihatan terhadap perubahan stuktur
sinyal maupun spektogram (pendengaran hanya sebagai pelengkap)
- Hasil segmentasi ditulis dalam unit milidetik.
Tri Budi Santoso 10

Memasukkan data ke dalam *.txt

Dengan menyesuaikan dengan tabulasi batas fonem yang telah diperoleh dari gambar
diatas, proses selanjutnya adalah mengisi tabel pelabelan yang sudah tersedia.Contohnya
adalah seperti berikut:
Perhatikan untuk fonem ’a’, posisi dimulai pada 381 ms dan berakhir pada 555 ms. Cara
penulisan selengkapnya adalah seperti pada Tabel dibawah ini.
Sekuen fomen
a bz cl d a #
t001-001m 381 555 580 749 785 1044
t002-001m 492 626 658 781 809 975
t003-001m 290 461 483 614 643 915
t0004-001f …. …. …. ….. ….. …..
t0005-001f …. …. …. ….. ….. …..
t0006-001f …. …. …. ….. ….. …..
t0007-001f …. …. …. ….. ….. …..
t0008-001f
Tri Budi Santoso 11

Untuk melakukan proses pelabelan anda harus mendapatkan data yang cukup banyak dan
berasal dari orang berbeda. Untuk kasus diatas, anda pilih 10 orang teman anda, dan
lakukan proses perekaman untuk kata ”ada”. Anda lakukan proses pelabelan satu demi
satu dan buat catatan seperti yang telah diberikan pada contoh diatas. Untuk orang
pertama anda beri nama file t001-001m jika pengucap pria atau t001-001f jika pengucap
wanita. Begitu juga untuk kata ada dari penucap kedua, anda beri nama file t002-001m
atau t002-001f. Lakukan langkah ini sampai minimal 10 orang.
Untuk kata yang berbeda, misalnya ”saya”, anda harus bertanya lebih dulu kepada dosen
pembiimbing praktikum untuk melakukan pelabelan.
Apakah anda merasa kantuk? Minum kopi dulu, berhenti sejenak dan kalau sudah siap
lanjutkan pekerjaan anda.
5. DATA DAN ANALISA

1. Lakukan proses perataan dari data proses pelabelan yang telah anda lakukan, cari nilai
mean dan varians untuk nilai durasi masing-masing fonem pada posisi berbeda.
Misalnya untuk ’a’ berada di depan dan di belakan fonem ’d’. Durasi kedua fonem ’a’
ini belum tentu sama.
Tri Budi Santoso 12

Modul 1 PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Modul 1 PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Modul 1 Praktikum Aplikasi Pengolahan Sinyal Digital Recording dan Editing

II. DASAR TEORI

Gambar 1. Contoh sinyal wicara ucapan “Selamat Datang”

Tri Budi Santoso 1

2.2. Proses Sampling

x(t) C-to-D x[n] = x[nTs]

Gambar 2. Blok diagram konversi sinyal kontinyu menjadi sinyal diskrit

Gambar 3. Rangkaian Sampling

Quantization Encoding kode digital

Gambar 4. Blok diagram rangkaian ADC

Tri Budi Santoso 2

Dan persyaratan untuk frekuensi smpling menjadi:

III. PERANGKAT YANG DIPERLUKAN

Gambar 5. Penataan perangkat percobaan recording dan editing

Tri Budi Santoso 3

IV. LANGKAH-LANGKAH PERCOBAAN

Gambar 6. Icon Wavsurfer

Gambar 7. Tampilan awal wavsurfer

Tri Budi Santoso 4

Gambar 10. Button Audio Audio

Tri Budi Santoso 5

Gambar 11. Hasil perekaman kata “ada”

Membuka File *.wav

Gambar 12. Membuka File

Tri Budi Santoso 6

Gambar 13. Menentukan format tampilan wavsurfer

Langkah ini akan memberikan tampilan seperti pada Gambar 14.

Time Axis Panel

Melihat Tampilan Spectrogram Sinyal Wicara

Tri Budi Santoso 7

Gambar 15. Langkah menampilkan spectrogram

Gambar 16. Tampilan waveform dan Spectrogram secara bersamaan

Tri Budi Santoso 8

Untuk Bahasa Indonesia kita memiliki 35 fonem, seperti tabel berikut:

Tri Budi Santoso 9

Melakukan Proses Pelabelan

Gambar 17 merupakan salah satu contoh bentuk pemilahan/segmentasi posisi fonem

Tri Budi Santoso 10

Memasukkan data ke dalam *.txt

Tri Budi Santoso 11

5. DATA DAN ANALISA

Tri Budi Santoso 12

Anda mungkin juga menyukai