Makala H

MAKALAH FISIKA KOMPUTASI
“ Identifikasi Suara Manusia dengan Menggunakan Silent Ratio dan

Average Energy ”
Oleh :
Abdul Rahim
(A1C315019)
Dosen Pengampu :
Wawan Kurniawan, S.Si, M.Cs
PROGRAM STUDI PENDIDIKAN FISIKA
JURUSAN PENDIDIKAN MATEMATIKA ILMU PENGETAHUAN

ALAM
FAKULTAS KEGURUAN ILMU PENDIDIKAN
UNIVERSITAS JAMBI
2018
KATA PENGANTAR
Dengan mengucapkan puji syukur kehadirat Allah SWT yang telah memberikan
rahmat serta karunia-Nya, sehingga penyusun dapat menyelesaikan makalah yang
berjudul “Identifikasi Suara Manusia dengan Menggunakan Silent Ratio dan
Avarage Energy di MATLAB” dengan baik dan lancar.
Adapun maksud dan tujuan dari penyusunan makalah ini diharapkan

pembaca dan penulis dapat mengetahui tentang pemanfatan aplikasi Matlab dalam
menganalisa frekuensi suara manusia. Makalah ini berisikan materi teori
mengenai definisi suara, komponen suara, definisi suara manusia, jenis – jenis
suara manusia, Fast Faurier Transform ( FFT ), Silent Ratio, dan Avarage
Energy, kemudian dilanjutkan dengan aplikasi GUI Matlab tentang identifikasi
suara manusia menggunakan Silent Ratio dan Avarage Energy.
Terwujudnya makalah ini, juga tidak terlepas dari bantuan dan dukungan
berbagai pihak. Untuk itu penulis berterimakasih kepada Bapak Wawan
Kurniawan, S.Si, M.Cs sebagai dosen pengampu yang telah membantu. Penulis
sangat menyadari bahwa makalah ini masih mempunyai kelemahan dan
kekurangan. Oleh karena itu, saran dan kritik yang bersifat membangun dari
pembaca sangat penyusun harapkan demi perbaikan di masa yang akan datang.
Akhir kata, penyusun mengharapkan semoga makalah ini dapat memberi

manfaat kepada pihak-pihak yang membacanya.
Jambi, Mei 2018
Penyusun
i
DAFTAR ISI
KATA PENGANTAR ............................................................................................ i

DAFTAR ISI .......................................................................................................... ii
BAB I PENDAHULUAN
1.1 Latar Belakang ...................................................................................................1
1.2 Tujuan Penulisan ................................................................................................1
1.3 Manfaat Penulisan ..............................................................................................1
BAB II LANDASAN TEORI
2.1. Suara Manusia ...................................................................................................2
2.2. Fast Faurier Transform ( FFT )........................................................................3
2.3. Silent Ratio (SR) ...............................................................................................4
2.4. Avarage Eenergy (E).........................................................................................4
BAB III APLIKASI GUI MATLAB
3.1. Aplikasi Identifikasi Suara Manusia dengan Menggunakan Silent Ratio dan
Average Energy .................................................................................................5
BAB IV HASIL DAN PEMBAHASAN
4.1 Hasil ..................................................................................................................7
4.2 Pembahasan .......................................................................................................7
BAB V PENUTUP
5.1. Kesimpulan .....................................................................................................10
5.2. Saran ...............................................................................................................10
DAFTAR PUSTAKA ...........................................................................................11
ii
BAB I
PENDAHULUAN
1.1 Latar Belakang

Suara yang diucapkan manusia berbentuk gelombang sinyal. Oleh karena
berbentuk sinyal, maka suara tersebut dapat diolah secara digital, dan juga sering
digunakan pada dunia teknologi maupun dunia hiburan. Seperti merekam suara
bernyanyi, merekam pidato, atau dapat digunakan untuk membuat aplikasi
pengenal suara.
Biometric recognition merupakan sistem pengenalan atau identifikasi
seseorang berdasarkan karakteristik biologis khusus yang dimiliki oleh orang
tersebut, fungsinya untuk sistem keamanan dengan mengenali identitas seseorang.
Aplikasi biometric recognition antara lain retinal scan (identifikasi berdasarkan
pola pembuluh darah pada retina mata), fingerprint recognition (identifikasi pola
sidik jari unik pada setiap orang), face recognition (pengenalan se-seorang
berdasarkan raut dan ekspresi seseorang dengan kunci utama pada letak mata dan
mulut), dan voice recognition. Voice recognition dibagi menjadi dua jenis, yaitu
speech recognition dan speaker recognition.
Speech recognition merupakan suatu proses yang dilakukan komputer untuk
mengenali kata yang diucapkan oleh seseorang tanpa mempedulikan identitas
orang terkait. Pola peningkatan dan penurunan signal suara merupakan ciri khas
(feature extraction) dari seseorang dalam hal berbicara, sehingga antara energy
rata-rata (Average Energy) bunyi dan lamanya ambang diam (Silent Ratio)
merupakan faktor yang terpenting untuk mendeteksi karakter dan pola suara
seseorang.
1.2 Tujuan
Dengan latar belakang diatas, tujuan dari makalah ini adalah :
1. Membuat aplikasi identifikasi suara manusia dengan perangkat lunak
MATLAB menggunakan Silent Ratio dan Average Energy
1.3 Manfaat
Adapun makalah ini dibuat supaya pembaca dapat memahami mengenai

“Identifikasi Suara Manusia dengan Menggunakan Silent Ratio dan Avarage
Energy di MATLAB” dan dapat dijadikan sebuah referensi bagi pembaca .
1
BAB II
LANDASAN TEORI
2.1. Frekuensi Suara Manusia

Frekuensi suara adalah jumlah getaran atau banyak getaran yang terjadi
dalam setiap detik pada gelombang suara atau gelombang bunyi (Alonso dan
Finn, 1994). Frekuensi juga diartikan sebagai jumlah perubahan tekanan dalam
setiap detiknya atau frekuensi setiap detiknya dalam satuan cycles per second (cls)
atau Hertz (Hz). Sifat dari bunyi ditentukan oleh frekuensi dan intesitasnya.
Medium dan suhu mempengaruhi kecepatan rambatan suara yang bervariasi,
tetapi untuk kecepatan perambatan suara pada medium udara pada suhu 20°C
berkisar 344 m/s, pada kondisi tersebut maka panjang gelombang suara berkisar
13 inch (0,344 m) pada frekuensi 1000 Hz (Wardhana, 2001).
Berdasarkan frekuensi, bunyi atau suara dibedakan menjadi tiga daerah frekuensi
(Gabriel, 1996), yaitu:
a. Frekuensi bunyi antara 0 – 20 Hz (Daerah Infrasonik)

Frekuensi bunyi ini contohnya adalah getaran tanah, getaran bangunan
maupun truk mobil. Vibrasi yang ditimbulkan oleh truk mobil memiliki
frekuensi sekitar 1 – 20 Hz. Frekuensi di bawah 20 Hz dapat menyebabkan
perasaan yang kurang nyaman (discomfort), kelesuan (fatique), dan terkadang
dapat menimbulkan gangguan penglihatan. Apabila vibrasi bunyi mengenai
tubuh dapat menyebabkan resonansi dan akan terasa sakit pada beberapa
bagian tubuh (Gabriel, 1996).
b. Frekuensi bunyi antara 20 – 20.000 Hz (Frekuensi Sonik/pendengaran)
Kepekaan telinga dB = 0 terjadi pada frekuensi 1.000 Hz, dimana nilai
ambang rata-rata secara internasional terletak pada daerah 1.000 Hz. Arti dari
nilai ambang adalah frekuensi yang berkaitan dengan kuat bunyi (dB) yang
dapat didengar, misalnya pada frekuensi 30 Hz kuat bunyi harus 60 dB (yaitu
10 × 10 W) (Cameron dan Skofronick, 1978). Untuk mendengar bunyi 60 dB
artinya telinga seseorang harus 10 × lebih kuat pada nada 1.000 Hz baru dapat
mendengar bunyi tersebut dan artinya lagi tekanan bunyinya harus 10 × lebih
besar. (Gabriel, 1996).
2
c. Frekuensi bunyi di atas 20.000 Hz (Daerah Ultrasonik)
Dalam bidang kedokteran, frekuensi ini berfungsi dalam menentukan 3 hal,
yaitu: pengobatan, penghancuran/ destruktif dan diagnosa. Hal ini disebabkan
karena frekuensi yang tinggi memiliki daya tembus jaringan yang cukup
besar (Gabriel, 1996).
2.2. Fast Fourier Transform (FFT)

Fast Fourier Transform (FFT) adalah suatu algoritma transformasi Fourier
yang dikembangkan dari algoritma Discrete Fourier Transform (DFT). Dengan
metode Fast Fourier Transform, kecepatan komputasi dari perhitungan
transformasi Fourier dapat ditingkatkan. Pada Discrete Fourier Transform proses
komputasi memerlukan looping sehingga banyak memerlukan memori. Dengan
menerapkan metode Fast Fourier Transform perhitungan Discrete Fourier
Transform dapat dipersingkat dengan cara mereduksi proses looping. Ada dua
macam metode Fast Fourier Transform yaitu Decimation In time (DIT) dan
metode Decimation In Frekuensi (DIF) yang memiliki fungsi yang sama yaitu
untuk mentransformasi sinyal menjadi frekuensi dasarnya.
Transformasi Fourier Cepat diterapkan dalam beragam bidang, mulai dari
pengolahan sinyal digital, memecahkan persamaan diferensial parsial, dan untuk
algoritme untuk mengalikan bilangan bulat besar. Misalkan ''x0, ...., xN-1
merupakan bilangan kompleks. Transformasi Fourier Diskret didefinisikan oleh
rumus :
𝑁−1
2𝜋𝑖
𝑋𝑘 = ∑ 𝑥𝑛 𝑒 − 𝑁
𝑛𝑘
𝑛=0
k = 0,. . ., N – 1
Menghitung deret ini secara langsung memerlukan operasi aritmetika
sebanyak O(N2). Sebuah algoritme FFT hanya memerlukan operasi sebanyak
O(N log N) untuk menghitung deret yang sama. Secara umum algoritme tersebut
tergantung pada pemfaktoran N. Setiap algoritme FFT, dengan penyesuaian, dapat
diterapkan pula untuk menghitung DFT invers. Ini karena DFT invers adalah
sama dengan DFT, namun dengan tanda eksponen berlawanan dan dikalikan
dengan faktor 1/N. Algoritme FFT yang paling awal dan karena itu paling populer
adalah algoritme Cooley-Tukey.
3
Fast Fourier Transform (FFT) adalah suatu metoda untuk
mentransformasikan sinyal suara menjadi sinyal frekuensi, artinya proses
perekaman suara disimpan dalam bentuk digital berupa gelombang spectrum
suara berbasis frekuensi. Ada beberapa klasifikasi sinyal yang ada :
 Sinyal waktu kontinyu, yaitu terdefinisi pada setiap waktu
 Sinyal waktu diskrit, yaitu terdefinidi pada waktu-waktu tertentu
 Sinyal analog, yaitu sinyal waktu kontinyu dengan amplitudo yang kontinyu
 Sinyal digital, yaitu sinyal waktu diskrit dengan amplitudo bernilai diskrit
Fast Fourier Transform (FFT) diterapkan dalam beragam bidang dari

pengolahan sinyal digital dan memecahkan persamaan diferensial parsial menjadi
algoritma-algoritma untuk penggandaan bilangan integer dalam jumlah banyak.
Ada pun kelas dasar dari algoritma FFT yaitu decimation in time (DIT) dan
decimation in frequency (DIF). Garis besar dari kata Fast diartikan karena
formulasi FFT jauh lebih cepat dibandingkan dengan metode perhitungan
algoritma Fourier Transform sebelumnya.
4
2.3. Silent Ratio (SR)
Silent Ratio (SR) adalah jumlah dari banyaknya sampel yang dibawah nilai
treshold tertentu, dibagi dengan banyaknya sampel. Silence Ratio (SR) adalah
bagian dari potongan audio dalam keadaan hening atau diam. Persamaan yang
digunakan untuk mengukur rasio periode keheningan adalah :
∑𝑠
𝑆𝑅 =
∑𝑙
Dengan
SR = rasio periode keheningan
s = periode keheningan dalam potongan file audio
l = menyatakan panjang potongan file audio.
2.4. Average Energy (E)

Ciri Average Energy adalah ciri yang digunakan untuk menyatakan nyaring
atau tidaknya sinyal audio. Menampilkan time-domain atau time-amplitude yang
merupakan dasar dari teknik pengenalan signal, maka digunakan Average Energy
dan Zero Crossing Rate sebagai rumusan. Average Energy mengindikasikan besar
kecil suara pada signal audio. Dalam kalkulasi yang simpel, dengan rumus :
Dengan :
E = rata-rata energi dari potongan audio
x(n) = nilai dari sample ke n
N = jumlah total sample pada potongan audio
Di mana E adalah Everage Energy pada satuan audio, N adalah Total nomor
sampel di dalam satuan audio dan x(n) adalah nilai sampel pada sampel n.
5
BAB III
APLIKASI GUI MATLAB
3.1 Pembuatan Aplikasi Identifikasi Suara Manusia Menggunakan Silent

Ratio dan Avarage Energy pada GUI MATLAB
3.2 Hasil Aplikasi Pembuatan Aplikasi Identifikasi Suara Manusia

Menggunakan Silent Ratio dan Avarage Energy pada GUI MATLAB
6
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil
Tabel 1. Silent Ratio dan Avarage Energy untuk Identifikasi Suara Manusia
No Waktu Silent Ratio Avarage Energy
1 0 – 0.2 0 0.097159
2 0.2 – 0.4 0 16.7346
3 0.4 – 0.6 0 198.815
4 0.6 – 0.8 0 212.7565
5 0.8 - 1 NAN NAN
Jumlah 0 428.397859
Rata-rata 0 85.6795718
4.2 Pembahasan
Hasil nilai rata-rata Silent ratio dan avarage energy pada makalh ini berasal
dari suara penulis sendiri. Yang kemudian nilai tersebut digunakan sebagai
ekstraksi suara yang akan dikenali oleh komputer. Pada pengamatan yang
dilakukan, ini berasal dari suara selama 1 detik dengan nilai frekuensi (Fs) yaitu
32000, nBits = 8 dan Channel = 1. Selama 1 detik, dilakukan pengamatan setiap
rentang 0.2 detik. Dari grafik hasil pemotongan, terlihat adanya penyimpangan
amplitudo yang lebih besar sehingga menghasilkan adanya energi pada sinyal.
a. Pengambilan suara rentang waktu 0-0.2 detik

Dari rentang tersebut menghasilkan silent ratio bernilai 0, ini berarti pada saat
melakukan rekaman di selang waktu tersebut tidak ada suara diam atau tidak
ada frekuensi yang tidak masuk. dan memiliki energi sebesar 0.097159, ini
menandakan bahwa penyimpangan amplitudonya kecil sehingga energi yang
dihasilkan juga kecil.
Grafik hasil pemotongan suara untuk rentang waktu 0-0,2 detik dapat dilihat
pada gambar di bawah
b. Pengambilan suara rentang waktu 0.2-0.4 detik
7
Dari rentang tersebut menghasilkan silent ratio bernilai 0 dan memiliki energi
sebesar 16.7346. ini menandakan adanya peningkatan energi yang cukup
besar dari rentang sebelumnya hal itu bisa dikarenaka adanya penyimpangan
amplitudo yang disebabkan oleh intonasi yang sangat besar ketika sedang
melakukan perekaman. Grafik hasil pemotongan suara untuk rentang waktu
0.2-0,4 detik dapat dilihat pada gambar di bawah
c. Pengambilan suara rentang waktu 0.4-0.6 detik

amplitudo yang disebabkan oleh intonasi yang sangat besar ketika sedang
melakukan perekaman.
Grafik hasil pemotongan suara untuk rentang waktu 0.4-0.6 detik dapat
dilihat pada gambar di bawah
d. Pengambilan suara rentang waktu 0.6-0.8 detik

amplitudo yang disebabkan oleh intonasi yang sangat besar ketika pembicara
mengeluarkan bunyi sebuah kata-kata.
Grafik hasil pemotongan suara untuk rentang waktu 0.6-0.8 detik dapat
dilihat pada gambar di bawah
8
e. Pengambilan suara rentang waktu 0.8-1 detik
Dari rentang tersebut menghasilkan silent ratio bernilai NAN dan memiliki
energi sebesar NAN. Pada pengambilan rentang ini, terjadi kesalahan dalam
MATLAB sehingga data yang keluar dari hasil perekaman terdeteksi NAN.
Grafik hasil pemotongan suara untuk rentang waktu 0.8-1 detik dapat dilihat
pada gambar di bawah
9
BAB V
PENUTUP
5.1. Kesimpulan
Dari hasil yang pengamatan yang dilakukan oleh gelombang suara penulis
selama satu detik dengan selang waktu 0.2 detik, didapatkan bahwa nilai rata-
rata silent ratio nya yaitu 0. Ini berarti ketika dalam proses perekaman atau
pengambilan suara tidak ada suara diam atau suara jedanya. Dan untuk nilai
rata-rata dari avarage energy nya yaitu sebesar 85.6795718, ini berarti
avarage suara yang dimiliki oleh penulis besar dan kemungkinan juga adanya
penyimpangan amplitudo yang menyebabkan energi rata-ratanya menjadi
besar.
5.2. Saran
Diharapkan bagi penulis yang ingin lebih mengamati dari identifikasi suara
manusia dengan menggunakan silent ratio dan avarage energy pada matlab,
lebih baiknya pengetahuan terhadap matlab harus lebih bagus sehingga tidak
adanya data yang tidak dapat diperoleh atau tidak ada data yang invalid.
10
DAFTAR PUSTAKA
Adler, John dkk.2013. Identifikasi Suara dengan MATLAB sebagai Aplikasi
Jaringan Syaraf Tiruan.UNIKOM. Jurnal Telekontran Vol 1 No 1 Januari
2013
Gabriel J.P. 1996. Fisika Kedokteran. Penerbit buku kedokteran EGC.
Jakarta.
Kurniawan, wawan. 2016. Identifikasi Speech Recognition Manusia dengan
Menggunakan Average Energy dan Silent Ratio Sebagai Feature
Extraction Suara pada Komputer.Unja. Biospecies Vol. 9 No.1, Januari
2016, hal. 1-6.
Tanudjaja, Harlianto. 2007. Pengolahan Sinyal Digital dan Sistem
Pemrosesan Sinyal. ANDI. Yogyakarta.
11

Makala H

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makala H

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH FISIKA KOMPUTASI

“ Identifikasi Suara Manusia dengan Menggunakan Silent Ratio dan

Wawan Kurniawan, S.Si, M.Cs

PROGRAM STUDI PENDIDIKAN FISIKA

JURUSAN PENDIDIKAN MATEMATIKA ILMU PENGETAHUAN

FAKULTAS KEGURUAN ILMU PENDIDIKAN

Adapun maksud dan tujuan dari penyusunan makalah ini diharapkan

Akhir kata, penyusun mengharapkan semoga makalah ini dapat memberi

Jambi, Mei 2018

KATA PENGANTAR ............................................................................................ i

1.1 Latar Belakang

Adapun makalah ini dibuat supaya pembaca dapat memahami mengenai

2.1. Frekuensi Suara Manusia

a. Frekuensi bunyi antara 0 – 20 Hz (Daerah Infrasonik)

2.2. Fast Fourier Transform (FFT)

 Sinyal waktu diskrit, yaitu terdefinidi pada waktu-waktu tertentu

Fast Fourier Transform (FFT) diterapkan dalam beragam bidang dari

2.4. Average Energy (E)

APLIKASI GUI MATLAB

3.1 Pembuatan Aplikasi Identifikasi Suara Manusia Menggunakan Silent

3.2 Hasil Aplikasi Pembuatan Aplikasi Identifikasi Suara Manusia

HASIL DAN PEMBAHASAN

a. Pengambilan suara rentang waktu 0-0.2 detik

b. Pengambilan suara rentang waktu 0.2-0.4 detik

c. Pengambilan suara rentang waktu 0.4-0.6 detik

d. Pengambilan suara rentang waktu 0.6-0.8 detik

Anda mungkin juga menyukai