Oleh :
Abdul Rahim
(A1C315019)
Dosen Pengampu :
UNIVERSITAS JAMBI
2018
KATA PENGANTAR
Dengan mengucapkan puji syukur kehadirat Allah SWT yang telah memberikan
rahmat serta karunia-Nya, sehingga penyusun dapat menyelesaikan makalah yang
berjudul “Identifikasi Suara Manusia dengan Menggunakan Silent Ratio dan
Avarage Energy di MATLAB” dengan baik dan lancar.
Penyusun
i
DAFTAR ISI
ii
BAB I
PENDAHULUAN
1
BAB II
LANDASAN TEORI
Berdasarkan frekuensi, bunyi atau suara dibedakan menjadi tiga daerah frekuensi
(Gabriel, 1996), yaitu:
2
c. Frekuensi bunyi di atas 20.000 Hz (Daerah Ultrasonik)
Dalam bidang kedokteran, frekuensi ini berfungsi dalam menentukan 3 hal,
yaitu: pengobatan, penghancuran/ destruktif dan diagnosa. Hal ini disebabkan
karena frekuensi yang tinggi memiliki daya tembus jaringan yang cukup
besar (Gabriel, 1996).
𝑛=0
k = 0,. . ., N – 1
Menghitung deret ini secara langsung memerlukan operasi aritmetika
sebanyak O(N2). Sebuah algoritme FFT hanya memerlukan operasi sebanyak
O(N log N) untuk menghitung deret yang sama. Secara umum algoritme tersebut
tergantung pada pemfaktoran N. Setiap algoritme FFT, dengan penyesuaian, dapat
diterapkan pula untuk menghitung DFT invers. Ini karena DFT invers adalah
sama dengan DFT, namun dengan tanda eksponen berlawanan dan dikalikan
dengan faktor 1/N. Algoritme FFT yang paling awal dan karena itu paling populer
adalah algoritme Cooley-Tukey.
3
Fast Fourier Transform (FFT) adalah suatu metoda untuk
mentransformasikan sinyal suara menjadi sinyal frekuensi, artinya proses
perekaman suara disimpan dalam bentuk digital berupa gelombang spectrum
suara berbasis frekuensi. Ada beberapa klasifikasi sinyal yang ada :
Sinyal waktu kontinyu, yaitu terdefinisi pada setiap waktu
Sinyal analog, yaitu sinyal waktu kontinyu dengan amplitudo yang kontinyu
Sinyal digital, yaitu sinyal waktu diskrit dengan amplitudo bernilai diskrit
4
2.3. Silent Ratio (SR)
Silent Ratio (SR) adalah jumlah dari banyaknya sampel yang dibawah nilai
treshold tertentu, dibagi dengan banyaknya sampel. Silence Ratio (SR) adalah
bagian dari potongan audio dalam keadaan hening atau diam. Persamaan yang
digunakan untuk mengukur rasio periode keheningan adalah :
∑𝑠
𝑆𝑅 =
∑𝑙
Dengan
SR = rasio periode keheningan
s = periode keheningan dalam potongan file audio
l = menyatakan panjang potongan file audio.
Dengan :
E = rata-rata energi dari potongan audio
x(n) = nilai dari sample ke n
N = jumlah total sample pada potongan audio
Di mana E adalah Everage Energy pada satuan audio, N adalah Total nomor
sampel di dalam satuan audio dan x(n) adalah nilai sampel pada sampel n.
5
BAB III
6
BAB IV
4.1 Hasil
Tabel 1. Silent Ratio dan Avarage Energy untuk Identifikasi Suara Manusia
No Waktu Silent Ratio Avarage Energy
1 0 – 0.2 0 0.097159
2 0.2 – 0.4 0 16.7346
3 0.4 – 0.6 0 198.815
4 0.6 – 0.8 0 212.7565
5 0.8 - 1 NAN NAN
Jumlah 0 428.397859
Rata-rata 0 85.6795718
4.2 Pembahasan
Hasil nilai rata-rata Silent ratio dan avarage energy pada makalh ini berasal
dari suara penulis sendiri. Yang kemudian nilai tersebut digunakan sebagai
ekstraksi suara yang akan dikenali oleh komputer. Pada pengamatan yang
dilakukan, ini berasal dari suara selama 1 detik dengan nilai frekuensi (Fs) yaitu
32000, nBits = 8 dan Channel = 1. Selama 1 detik, dilakukan pengamatan setiap
rentang 0.2 detik. Dari grafik hasil pemotongan, terlihat adanya penyimpangan
amplitudo yang lebih besar sehingga menghasilkan adanya energi pada sinyal.
7
Dari rentang tersebut menghasilkan silent ratio bernilai 0 dan memiliki energi
sebesar 16.7346. ini menandakan adanya peningkatan energi yang cukup
besar dari rentang sebelumnya hal itu bisa dikarenaka adanya penyimpangan
amplitudo yang disebabkan oleh intonasi yang sangat besar ketika sedang
melakukan perekaman. Grafik hasil pemotongan suara untuk rentang waktu
0.2-0,4 detik dapat dilihat pada gambar di bawah
8
e. Pengambilan suara rentang waktu 0.8-1 detik
Dari rentang tersebut menghasilkan silent ratio bernilai NAN dan memiliki
energi sebesar NAN. Pada pengambilan rentang ini, terjadi kesalahan dalam
MATLAB sehingga data yang keluar dari hasil perekaman terdeteksi NAN.
Grafik hasil pemotongan suara untuk rentang waktu 0.8-1 detik dapat dilihat
pada gambar di bawah
9
BAB V
PENUTUP
5.1. Kesimpulan
Dari hasil yang pengamatan yang dilakukan oleh gelombang suara penulis
selama satu detik dengan selang waktu 0.2 detik, didapatkan bahwa nilai rata-
rata silent ratio nya yaitu 0. Ini berarti ketika dalam proses perekaman atau
pengambilan suara tidak ada suara diam atau suara jedanya. Dan untuk nilai
rata-rata dari avarage energy nya yaitu sebesar 85.6795718, ini berarti
avarage suara yang dimiliki oleh penulis besar dan kemungkinan juga adanya
penyimpangan amplitudo yang menyebabkan energi rata-ratanya menjadi
besar.
5.2. Saran
Diharapkan bagi penulis yang ingin lebih mengamati dari identifikasi suara
manusia dengan menggunakan silent ratio dan avarage energy pada matlab,
lebih baiknya pengetahuan terhadap matlab harus lebih bagus sehingga tidak
adanya data yang tidak dapat diperoleh atau tidak ada data yang invalid.
10
DAFTAR PUSTAKA
Adler, John dkk.2013. Identifikasi Suara dengan MATLAB sebagai Aplikasi
Jaringan Syaraf Tiruan.UNIKOM. Jurnal Telekontran Vol 1 No 1 Januari
2013
Gabriel J.P. 1996. Fisika Kedokteran. Penerbit buku kedokteran EGC.
Jakarta.
Kurniawan, wawan. 2016. Identifikasi Speech Recognition Manusia dengan
Menggunakan Average Energy dan Silent Ratio Sebagai Feature
Extraction Suara pada Komputer.Unja. Biospecies Vol. 9 No.1, Januari
2016, hal. 1-6.
Tanudjaja, Harlianto. 2007. Pengolahan Sinyal Digital dan Sistem
Pemrosesan Sinyal. ANDI. Yogyakarta.
11