Makalah Uas Fiskom

MAKALAH FISIKA KOMPUTASI
“Identifikasi Suara Manusia dengan Menggunakan Silent Ratio

dan Average Energy”
DOSEN PENGAMPU :
Wawan Kurniawan, S.Si, M.Cs
DISUSUN OLEH :
RIKA IRMAYANTI
A1C315016
PROGRAM STUDI PENDIDIKAN FISIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS JAMBI
2018
KATA PENGANTAR
Puji syukur kehadirat Tuhan Yang Maha Esa karena berkat rahmat dan
karunia-Nya, penulis dapat menyelesaikan makalah yang berjudul “Identifikasi
Suara Manusia dengan Menggunakan Silent Ratio dan Average Energy” ini.
Makalah ini disusun untuk memenuhi tugas akhir mata kuliah Fisika Komputasi
pada Program Studi Pendidikan Fisika di Universitas Jambi.
Dalam kesempatan ini penulis mengucapkan terima kasih kepada bapak
Wawan Kurniawan, S.Si, M.Cs selaku dosen pengampu karena telah memberikan
pengarahan yang sangat berarti dalam menunjang penyusunan makalah ini.
Akhirnya penulis berharap semoga makalah ini dapat bermanfaat bagi
pembaca. Penulis menyadari bahwa makalah ini masih terdapat banyak
kekurangan, sehingga masukan berupa kritik dan saran yang membangun dari
pembaca sangat kami perlukan.
Jambi, Mei 2018
Penulis
i
DAFTAR ISI
KATA PENGANTAR ....................... i

DAFTAR ISI ii
BAB I PENDAHULUAN
1.1 Latar Belakang 1
1.2 Rumusan Masalah.......................................................................................... 2
1.3 Tujuan Penulisan .......................................................................................... 3
1.4 Manfaat Penulisan ......................................................................................... 3
BAB II LANDASAN TEORI
2.1 Suara 4
2.1.1 Suara Manusia...................................................................................... 4
2.1.2 Komponen Suara.................................................................................. 5
2.1.3 Frekuensi Suara.................................................................................... 6
2.2 Fast Fourier Transform (FFT)........................................................................ 7
2.3 Silent Ratio...................................................................................................... 10
2.4 Average Energy............................................................................................... 10
BAB III APLIKASI GUI MATLAB
3.1 Pembuatan Aplikasi Deteksi Suara pada GUI MATLAB.............................. 11
3.2 Coding Aplikasi Deteksi Suara pada GUI MATLAB.................................... 12
3.3 Tampilan Jadi Aplikasi Deteksi Suara pada GUI MATLAB......................... 22
BAB IV HASIL DAN PEMBAHASAN

4.1 Hasil Data....................................................................................................... 23
4.2 Hasil Gelombang............................................................................................ 23
4.3 Pembahasan.................................................................................................... 27
BAB V PENUTUP
5.1 Kesimpulan ................................................................................................... 31
5.2 Saran ............................................................................................................. 31
DAFTAR PUSTAKA......................................................................................... 32
LAMPIRAN........................................................................................................ 33
ii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Suara dapat menjadi ciri khas dari setiap individu yang dapat membedakan
antara individu satu dengan yang lainnya. Perbedaan tersebut terletak pada
karakteristik suara yang dihasilkan oleh masing – masing individu tersebut.
Tapitidak semua pendengaran manusia mampu membedakan suara dari masing-
masing individu yang dikenalnya. Kepekaan telinga juga memiliki berbagai
keterbatasan dan sensitif terhadap suara. Oleh karena itu dibutuhkan suatu sistem
untuk mengenali suara manusia tersebut sehingga dapat hasilnya akan tertuju tepat
kepada individu yang dimaksud. Sistem untuk mengenali suara manusia tersebut
biasa dikenal dengan nama identifikasi suara, sistem ini bisa membedakan antara
suara individu yang satu dengan individu yang lainnya berdasarkan perbedaan
karakteristik suara dari masing – masing indivdu yang bisa dicari dengan beberapa
metode ekstraksi ciri.
Darshan Mandalia (2011) pernah membuat suatu sistem jaringan saraf tiruan
untuk identifikasi suara dengan metode ekstraksi ciri MFCC menggunakan
perangkat lunak MATLAB. Sistem ini juga menggunakan metode Vector
Quantization untuk clustering suara yang sudah direkam sebelumnya. Secara garis
besar cara kerja sistem identifikasi suara ini adalah pertama – tama sistem akan
merekam suara yang akan diidentifikasi, lalu suara hasil rekama tersebut akan
mengalami proses Silence Detection dan Windowing, setelahnya suara hasil
rekaman tersebut dikonversikan ke dalam domain frekuensi dilanjukan dengan
mengkonversinya ke dalam domain Mel Frequency Cepstrum. Setelah melalui
proses tersebut, suara rekaman akan digambarkan dalam Overlapping Triangle
Window yang nantinya akan mendapatkan nilai energy dari setiap window,
selanjutnya akan mendapatkan nilai DCT (Discrete Cosine Transform) dari
Spectrum Energy, dan didapatkan nilai MSE (Mean Square Error) dari suara
rekaman yang pertama. Untuk mencocokkanya, diperlukan suara rekaman kedua
yang mengalami proses sama dengan rekaman suara pertama dan nilai MSE dari
kedua suara ini akan dicocokkan, apabila nilai MSEnya kurang dari 1,5
1
makan kedua rekaman suara tersebut berasal dari orang yang sama, sebaliknya
apabila nilai MSE dari kedua rekaman suara ini melebihi 1,5 maka kemungkinan
kedua rekaman suara itu bukan berasal dari suara orang yang sama. Faktor –
faktor yang bisa mempengaruhi proses identifikasi suara menggunakan sistem
jaringan saraf tiruan ini antara lain yaitu kondisi kesehatan individu yang suaranya
dijadikan sampel, kondisi lingkungan tempat pengambilan sampel, dan kondisi
perangkat keras yang digunakan dalam pengambilan sampel suara.
Pada penelitian oleh Ghulam M. tahun 2009, yang mengambil kasus
pengenalan digit terisolasi yang menggunakan kombinasi metode MFCC dan
HMM dalam bahasa Bangia, sistem mampu mengenali digit bilangan yang
digunakan dengan tingkat keberhasilan mencapai 90%. Sedangkan, untuk studi
kasus yang sama pada penelitian oleh M. Chandrasekar yang mengdopsi metode
MFCC dalam mengekstrak fitur suara, kemudian dikenali dengan Back
Propagation Network diperoleh nilai akurasi yang lebih kecil yaitu 80,95%.
Dalam pengenalan kata berkelanjutan (continuous) dengan kosa kata berukuran
besar oleh Corneliu O. dan Inger Gavat, digunakan Hidden Markov Model
sebagai recognizer dan 3 macam metode algoritma ekstraksi fitur yaitu MFCC,
LPC, dan PLP. Dari ketiga metode ekstraksi fitur tersebut, MFCC menghasilkan
tingkat akurasi tertinggi dengan persentase 90,41%. Sedangkan metode LPC
memiliki persentase keberhasilan 63,55% sementara PLP sebesar 75,78%.
Pada penelitian ini akan membahas dan membuat suatu aplikasi identifikasi
suara yang bisa mengidentifikasi, menyocokkan suara dari individu yang berbeda-
beda. Untuk membuat aplikasi identifikasi suara ini menggunakan metode MFCC
(Mel Frequency Cepstral Coefficients) sebagai metode esktraksi cirinya dan 2
metode pengenalan (recognition) yaitu Hidden Markov Model dan Vector
Quantization. Jaringan saraf tiruan untuk identifikasi suara ini akan dibuat dengan
menggunakan perangkat lunak MATLAB.
1.2 Rumusan Masalah

Adapun rumusan masalah pada makalah ini adalah sebagai berikut :
1. Apa pengertian dari suara manusia?
2. Apa yang dimaksud dengan Fast Fourier Transform (FFT)?
2
3. Apa yang dimaksud dengan Silent Ratio?
4. Apa yang dimaksud dengan Average Energy?
5. Bagaimana cara pembuatan program identifikasi suara manusia dengan
silent ratio dan average energy pada MATLAB?
1.3 Tujuan Penulisan

Adapun tujuan dalam penulisan makalah ini adalah sebagai berikut :
1. Untuk mengetahui pengertian suara manusia
2. Untuk mengetahui apa yang dimaksud dengan Fast Fourier Transform
(FFT)
3. Untuk mengetahui apa yang dimaksud dengan Silent Ratio
4. Untuk mengetahui apa yang dimaksud dengan Average Energy
5. Untuk mengetahui cara pembuatan program identifikasi suara manusia
dengan silent ratio dan average energy pada MATLAB
1.4 Manfaat Penulisan

Adapun manfaat penulisan makalah ini adalah sebagai berikut :
a. Bagi penulis
1. Untuk memperdalam pengetahuan mengenai pembuatan aplikasi
2. Menambah pengalaman dalam bidang programming
b. Bagi pembaca
1. Memperoleh informasi bagaimana cara pembuatan aplikasi deteksi
suara menggunakan silent ratio dan average energy pada GUI
MATLAB.
1.5
3
BAB II
LANDASAN TEORI
2.1 Suara
Suara dapat menjadi ciri khas dari setiap individu yang dapat
membedakan antara individu satu dengan yang lainnya. Perbedaan tersebut
terletak pada karakteristik suara yang dihasilkan oleh masing – masing individu
tersebut. Tapitidak semua pendengaran manusia mampu membedakan suara dari
masing-masing individu yang dikenalnya. Kepekaan telinga juga memiliki
berbagai keterbatasan dan sensitif terhadap suara. Oleh karena itu dibutuhkan
suatu sistem untuk mengenali suara manusia tersebut sehingga dapat hasilnya
akan tertuju tepat kepada individu yang dimaksud. Sistem untuk mengenali suara
manusia tersebut biasa dikenal dengan nama identifikasi suara, sistem ini bisa
membedakan antara suara individu yang satu dengan individu yang lainnya
berdasarkan perbedaan karakteristik suara dari masing – masing indivdu yang bisa
dicari dengan beberapa metode ekstraksi ciri.
Menurut Putra (2017) Sinyal suara adalah suatu sinyal analog yang
membutuhkan pemrosesan lebih lanjut sebelum dapat dipahami oleh mesin. Pada
mulanya, sinyal suara dipisahkan dari sinyal silent (jeda) menggunakan voice
activity detection (VAD). Kemudian ciri sinyal diekstrak menggunakan mel-
frequency cepstral coefficients (MFCC). Sistem ini mengemulasikan sistem
pendengaran manusia dengan menganalisis spektrum frekuensi ke dalam beberapa
spectral filter tertentu. Artificial neural network (ANN) akan digunakan dalam
proses identifikasi cepstral yang dihasilkan. ANN adalah sekelompok jaringan
unit pemroses yang dapat memodelkan sesuatu berdasarkan sistem jaringan syaraf
manusia. ANN mampu untuk memproses data statistik non-linier. ANN akan
memberikan penilaian statistik tingkat kecocokan sinyal suara dengan kata-kata
yang dilatihkan.
2.1.1 Suara Manusia

Menurut Muhammad Nuh Al-Azhar (2011) suara dihasilkan melalui
proses Generation dan Filtering. Pada proses Generation, suara pertama kali
diproduksi melalui bergetarnya pita suara yang berada di larynx untuk
4
menghasilkan bunyi periodik. Bunyi periodik yang bersifat konstan tersebut
kemudian difilterisasi melalui vocal tract (juga disebut dengan istilah resonator
suara atau articulator) yang terdiri dari lidah, gigi, bibir, langit-langit mulut dan
lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran berupa bunyi
vokal dan atau bunyi konsonan yang membentuk kata-kata yang memiliki arti
yang nantinya dapat dianalisa untuk identifikasi suara.
Untuk dapat diidentifikasi, ada beberapa karakteristik suara yang dapat
dijadikan parameter untuk membedakan antara orang yang satu dengan yang
lainnya. Menurut Nilsson dan Ejnarsson (2002), sinyal suara dan karakteristiknya
dapat direpresentasikan ke dalam dua domain yang berbeda, yaitu domain waktu
dan domain frekuensi. Sinyal suara merupakan sinyal yang bervariasi lambat
sebagai fungsi waktu, dalam hal ini ketika diamati pada durasi yang sangat pendek
(5 sampai 100 m) karakteristiknya masih stasioner. Tetapi apabila diamati dalam
durasi yang lebih panjang (> 1/5 detik) karakteristik sinyalnya berubah untuk
merefleksikan suara yang keluar dari pembicara.
Gambar 2.1 Human Vocal Tract

Sumber: http://www.dukemagazine.duke.edu/issues/050608/images/050608-lg-figure1purves.jpg
2.1.2 Komponen Suara

Suara terdiri dari beberapa komponen, yaitu pitch, formant dan
spectrogram yang dapat digunakan untuk mengidentifikasi karakteristik suara
seseorang untuk kepentingan voice recognition.
a. Pitch
Frekuensi getar dari pita suara yang juga disebut dengan istilah frekwensi
fundamental (dasar) dengan notasi F0. Masing-masing orang memiliki pitch yang
5
khas (habitual pitch) yang sangat dipengaruhi oleh aspek fisiologis larynx
manusia. Pada kondisi pembicaraan normal, level habitual pitch berkisar pada 50
s/d 250 Hz untuk laki-laki dan 120 s/d 500 Hz untuk perempuan. Frekuensi F0 ini
berubah secara konstan dan memberikan informasi linguistik seseorang seperti
perbedaan intonasi dan emosi. Analisa pitch dapat digunakan untuk melakukan
voice recognition terhadap suara seseorang, yaitu melalui analisa statistik terhadap
minimum pitch, maximum pitch dan mean pitch.
b. Formant
Formant adalah frekwensi-frekwensi resonansi dari filter, yaitu vocal tract
(articulator) yang meneruskan dan memfilter bunyi periodik dari getarnya pita
suara (vocal cord) menjadi bunyi keluaran berupa kata-kata yang memiliki makna.
Secara umum, frekuensi-frekuensi formant bersifat tidak terbatas, namun untuk
identifikasi suara seseorang, paling tidak ada 3 (tiga) formant yang dianalisa, yaitu
Formant 1 (F1), Formant 2 (F2) dan Formant 3 (F3).
c. Spectogram
Spectrogram merupakan representasi spectral yang bervariasi terhadap
waktu yang menunjukkan tingkat density (intensitas energi) spektral. Dengan kata
lain spectrogram adalah bentuk visualisasi dari masing-masing nilai formant yang
dilengkapi dengan level energi yang bervariasi terhadap waktu. Level energy ini
dikenal dengan istilah formant bandwidth. Nantinya pada kasus-kasus yang
bersifat pemalsuan suara dengan teknik pitch shift atau si subyek berusaha untuk
menghilangkan karakter suara aslinya, maka formant bandiwidth dapat digunakan
untuk memetakan atau mengidentifikasi suara aslinya. Spectrogram membentuk
pola umum yang khas dalam pengucapan kata dan pola khusus masing-masing
formant dalam pengucapan suku kata, sehingga spectrogram juga digunakan
untuk melakukan analisa identifkasi suara seseorang. Jika durasi rekaman suara
unknown lumayan panjang, maka analisa spectrogram juga dapat digunakan untuk
mempercepat pemilihan pengucapan kata-kata yang akan dianalisa dalam rangka
untuk mendapatkan jumlah minimal 20 kata untuk dapat menunjukkan ke-identik-
an suara unknown dengan known (pembanding).
2.1.3 Frekuensi Suara
6
Frekuensi suara atau frekuensi audio yaitu getaran frekuensi yang
terdengar oleh manusia dengan standard antara 20 Hertz sampai dengan 20.000
Hertz. Menurut sistem pendengaran manusia di bagi menjadi tiga kelompok, yaitu
frekuensi infrasonik, dengan rentang 0-20 Hz, frekuensi audible, 20-20.000 Hz,
dan frekuensi ultrasonik, dengan rentang > 20.000 Hz.
2.2 Fast Fourier Transform (FFT)

Menurut Putra (2017) Analisis fourier adalah metode yang digunakan
untuk menganalisa komponen level sinyal dalam domain frekuensi. Representasi
level frekuensi biasa disebut spectrogram. Pada spectogram, ada hubungan yang
sangat dekat antara waktu dan frekuensi. Hubungan antara frekuensi dan waktu
berbanding terbalik dengan hubungan proporsional. Ketika menggunakan resolusi
waktu yang tinggi, resolusi frekuensi yang dihasilkan akan lebih rendah. Fast
fourier transform adalah solusi yang dapat digunakan dalam proses analisis
sinyal.
Fast Fourier Transform (FFT) adalah algoritma yang
mengimplementasikan Discrete Fourier Transform (DFT) yang dioperasikan pada
sebuah sinyal waktu diskrit yang terdiri dari sampel menggunakan persamaan
berikut.
𝑅𝑒𝑎𝑙𝑋[𝑘]=Σ𝑥[𝑖].cos (2𝜋𝑘𝑖𝑁)𝑁−1𝑖=0 ……………………….…......................
(2.1)
𝐼𝑚𝑎𝑗𝑖𝑛𝑒𝑟𝑋[𝑘]=−Σ𝑥[𝑖].sin (2𝜋𝑘𝑖𝑁)𝑁−1𝑖=0 ………………...................…...... (2.2)
dengan
 𝑁 = jumlah data
 𝑘 = 0,1,2,…,𝑁2
 𝑥(𝑖) = data pada titik ke-𝑖
Proses selanjutnya adalah menghitung nilai magnitude dari FFT.
Persamaan yang digunakan adalah persamaan berikut :
|𝑋[𝑘]|=√(𝑅𝑒𝑎𝑙𝑋[𝑘])2+(𝐼𝑚𝑎𝑗𝑖𝑛𝑒𝑟𝑋[𝑘])2 …................................................….. (2.3)
FFT (Fast fourier transform) adalah suatu metoda untuk
mentransformasikan sinyal suara menjadi sinyal frekuensi, artinya proses
7
perekaman suara disimpan dalam bentuk digital berupa gelombang spectrum
suara berbasis frekuensi.
Ada beberapa klasifikasi sinyal yang ada :
1. Sinyal waktu kontinyu, yaitu terdefinisi pada setiap waktu
Gambar 2.2 Sinyal kontinyu

Sumber: Identifikasi Suara dengan MATLAB sebagai Aplikasi Jaringan Syaraf Tiruan oleh John Alder
2. Sinyal waktu diskrit, yaitu terdefinisi pada waktu-waktu tertentu
Gambar 2.3 Sinyal diskrit

3. Sinyal analog, yaitu sinyal waktu kontinyu dengan amplitudo yang kontinyu
Gambar 2.4 Sinyal analog
8
4. Sinyal digital, yaitu sinyal waktu diskrit dengan amplitudo bernilai diskrit
Gambar 2.5 Sinyal digital

2.3 Silent Ratio

Menurut Kurniawan (2016) Silent Ratio (SR) adalah jumlah dari
banyaknya sampel yang dibawah nilai treshold tertentu, dibagi dengan banyaknya
sampel seperti rumus (2.4).
SR=
∑S ............................................................................................................
∑l
(2.4)
s = Periode keheningan dalam potongan file audio
l = Panjang dari tiap potongan file audio
Masukkan audio, apabila berpusat tinggi maka dikenal sebagai musik. Apabila
tidak, maka perkataan dan musik. Apabila rasio keheningan tinggi, maka bukan
musik, tetapi perkataan dan solo musik.
2.4 Average Energy

Menurut Tamatjita dan Agus (2014) Menampilkan time-domain atau time-
amplitude yang merupakan dasar dari teknik pengenalan signal, maka digunakan
Average Energy dan Zero Crossing Rate sebagai rumusan. Average Energy
mengindikasikan besar kecil suara pada signal audio.
Dalam kalkulasi yang simpel, dengan rumus (2.5).
N=1
∑ X (n)2 ..................................................................................................(2.5)
E= n=0
N
E = Energi rata-rata pada potongan audio.
9
N = Jumlah total sampel dalam potongan audio.
X(n) = Nilai dari sampel ke n.
Di mana E adalah Everage Energy pada satuan audio, N adalah Total nomor
sampel di dalam satuan audio dan x(n) adalah nilai sampel pada sampel n.
Berikut ini sinyal sinus:
x(t) = A cos(2πt +φ)
Bentuk persamaan diatas merepresentasikan nilai magnitudo sinyal
sebagai fungsi waktu. Di dalam kondisi real seringkali dinyatakan dalam besaran
volt. Nilai x(t) dalam parameter yang umum untuk pengukuran dinyatakan dalam
V(t) yang menunjukkan nilai simpangan sinyal atau magnitudonya pada suatu
waktu t.
Sedangkan untuk besaran lain dari sinyal dalam hal ini daya dinyatakan sebagai:
(V (t ) )2
P (t)=
R
Dalam hal ini nilai nilai R biasanya dinyatakan sebesar 1 Ω. Dan
parameter ini seringkali tidak dituliskan, sehingga persamaannya menjadi lebih
sederhana.
P ( t ) =(V ( t ))2
Sedangkan besarnya energi dari suatu sinyal diketahui sebagai total daya
pada suatu durasi waktu tertentu. Dengan mengacu pada persamaannya yang
sudah dimodifikasi, maka dapat dinyatakan sebagai berikut.
T
∑ ¿(V ( t ) )2
t =0
10
Kemudia energi rata-rata untuk suatu durasi tertentu T, dinyatakan sebagai
berikut.
T
∑ (V ( t ) )2
E= t =0
T
BAB III
APLIKASI GUI MATLAB
3.1 Pembuatan Aplikasi Deteksi Suara pada GUI MATLAB
Berikut adalah gambar dari tampilan Aplikasi Deteksi Suara yang sedang
di buat dalam menu editor GUI MATLAB :
Gambar 3.1 Pembuatan Aplikasi pada GUI MATLAB
Keterangan :
Nama
String Tag Tittle
UIControl
Panel 1 - uipanel1 Editor
Panel 2 - uipanel2 Gelombang
Rekaman Suara
Panel 4 - uipanel4 Gelombang FFT
(Fast Fourier
Transform)
11
Average Energy
Panel 6 - uipanel6 Hasil
Static Text 1 Frekuensi Sumber text1 -
(Fs)
Static Text 2 nBeats text2 -
Static Text 3 nChannels text3 -
Static Text 4 Waktu (t) text4 -
Static Text 5 Waktu Awal (X) text5 -
Static Text 6 Waktu Akhir (Y) text6 -
Static Text 7 Silent Ratio text7 -
Static Text 8 Average Energy text8 -
Static Text 9 APLIKASI text11 -
DETEKSI SUARA
Static Text 10 Oleh : RIKA text14 -
IRMAYANTI
(A1C315016)
Static Text 11 (Only Supported : 8, text17 -
16, 24)
Edit 1 edit1 -
Edit 2 edit2 -
Edit 3 edit3 -
Edit 4 edit4 -
Edit 5 edit5 -
Edit 6 edit6 -
Edit 7 ... edit7 -
Edit 8 edit8 -
Edit 9 edit9 -
Pushbutton 1 REKAM pushbutton1 -
Pushbutton 2 RESET pushbutton2 -
Pushbutton 3 EXIT pushbutton3 -
Pushbutton 4 SIMPAN pushbutton4 -
Pushbutton 5 MAINKAN pushbutton5 -
REKAMAN
Axes 1 - axes2 -
Axes 2 - axes3 -
Axes 3 - axes4 -
Untuk warna baground, warna tulisan, serta model tulisan juga bisa diatur sesuka
hati di property inspector.
3.2 Coding Aplikasi Deteksi Suara pada GUI MATLAB
Berikut adalah coding dari pembuatan aplikasi diatas :

function varargout = TUGASUAS(varargin)
12
% TUGASUAS MATLAB code for TUGASUAS.fig
% TUGASUAS, by itself, creates a new TUGASUAS or raises the
existing
% singleton*.
%
% H = TUGASUAS returns the handle to a new TUGASUAS or the
handle to
% the existing singleton*.
%
% TUGASUAS('CALLBACK',hObject,eventData,handles,...) calls
the local
% function named CALLBACK in TUGASUAS.M with the given input
arguments.
%
% TUGASUAS('Property','Value',...) creates a new TUGASUAS or
raises the
% existing singleton*. Starting from the left, property
value pairs are
% applied to the GUI before TUGASUAS_OpeningFcn gets called.
An
% unrecognized property name or invalid value makes property
application
% stop. All inputs are passed to TUGASUAS_OpeningFcn via
varargin.
%
% *See GUI Options on GUIDE's Tools menu. Choose "GUI allows
only one
% instance to run (singleton)".
%
% See also: GUIDE, GUIDATA, GUIHANDLES
% Edit the above text to modify the response to help TUGASUAS
% Last Modified by GUIDE v2.5 21-May-2018 15:18:10
% Begin initialization code - DO NOT EDIT

gui_Singleton = 1;
gui_State = struct('gui_Name', mfilename, ...
'gui_Singleton', gui_Singleton, ...
'gui_OpeningFcn', @TUGASUAS_OpeningFcn, ...
'gui_OutputFcn', @TUGASUAS_OutputFcn, ...
'gui_LayoutFcn', [] , ...
'gui_Callback', []);
if nargin && ischar(varargin{1})
gui_State.gui_Callback = str2func(varargin{1});
end
if nargout
[varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:});
else
gui_mainfcn(gui_State, varargin{:});
end
% End initialization code - DO NOT EDIT
% --- Executes just before TUGASUAS is made visible.

function TUGASUAS_OpeningFcn(hObject, eventdata, handles,
varargin)
13
% This function has no output args, see OutputFcn.
% hObject handle to figure
% eventdata reserved - to be defined in a future version of
MATLAB
% handles structure with handles and user data (see GUIDATA)
% varargin command line arguments to TUGASUAS (see VARARGIN)
% Choose default command line output for TUGASUAS

handles.output = hObject;
% Update handles structure

guidata(hObject, handles);
% UIWAIT makes TUGASUAS wait for user response (see UIRESUME)

% uiwait(handles.figure1);
% --- Outputs from this function are returned to the command line.
function varargout = TUGASUAS_OutputFcn(hObject, eventdata,
handles)
% varargout cell array for returning output args (see VARARGOUT);
% hObject handle to figure
MATLAB
% Get default command line output from handles structure

varargout{1} = handles.output;
function edit1_Callback(hObject, eventdata, handles)

% hObject handle to edit1 (see GCBO)
MATLAB
% Hints: get(hObject,'String') returns contents of edit1 as text

% str2double(get(hObject,'String')) returns contents of
edit1 as a double
% --- Executes during object creation, after setting all

properties.
function edit1_CreateFcn(hObject, eventdata, handles)
MATLAB
% handles empty - handles not created until after all
CreateFcns called
% Hint: edit controls usually have a white background on Windows.

% See ISPC and COMPUTER.
if ispc && isequal(get(hObject,'BackgroundColor'),
get(0,'defaultUicontrolBackgroundColor'))
set(hObject,'BackgroundColor','white');
14
end

MATLAB

edit2 as a double

properties.
MATLAB
CreateFcns called

end

MATLAB

edit3 as a double

properties.
MATLAB
CreateFcns called

15
end

MATLAB

edit4 as a double

properties.
MATLAB
CreateFcns called

end
% --- Executes on button press in pushbutton1.

function pushbutton1_Callback(hObject, eventdata, handles)
Fs = str2double(get(handles.edit1,'String'));
nBits = str2double(get(handles.edit2,'String'));
Channels = str2double(get(handles.edit3,'String'));
t = str2double(get(handles.edit4,'String'));
rekam = audiorecorder(Fs,nBits,Channels);
set(handles.edit5,'String','Start Speaking...')
recordblocking(rekam, t);
set(handles.edit5,'String','End of Recording...')
y = getaudiodata(rekam);
axes(handles.axes2)
plot(y)
grid on
handles.Fs = Fs;
handles.y=y;
guidata(hObject,handles)
waktu = 30;
y = y';
t = 0:1/Fs:waktu;
t(length(t))= [];
16
X = str2double(get(handles.edit6,'String'));
Y = str2double(get(handles.edit7,'String'));
x1 = find (t==X);
y1 = find (t==Y);
t1 = t(x1:y1);
y1 = y(x1:y1);
axes(handles.axes3);
plot (t1,y1);
grid on
sil = [];
for i = 1:length(y1),
if (y1(i) > -.005)&& (y1(i) <.005),
else
sil(i) = 1;
end
end
sil;
sum(sil);
silent_rasio = sum(sil)/length(y1);
B = fft(y1);
power = abs(B(1:(length(B)+1)/2));
frek = Fs*(0:(length(B)-1)/2)/length(B);
kuadrat = power.^2;
av = sum(kuadrat)/length(power);
axes(handles.axes4)
plot(frek,power);
xlabel('Frekuensi');
ylabel('Power');
grid on
set(handles.edit8,'String',strcat(num2str(silent_rasio)));
set(handles.edit9,'String',strcat(num2str(av)));
% hObject handle to pushbutton1 (see GCBO)

MATLAB

MATLAB

edit5 as a double
17
properties.
MATLAB
CreateFcns called

end

MATLAB

edit6 as a double

properties.
MATLAB
CreateFcns called

end

MATLAB

edit7 as a double
18
properties.
MATLAB
CreateFcns called

end

MATLAB

edit8 as a double

properties.
MATLAB
CreateFcns called

end

MATLAB
19
edit9 as a double

properties.
MATLAB
CreateFcns called

end

MATLAB
axes(handles.axes2)
cla reset
axes(handles.axes3)
cla reset
axes(handles.axes4)
cla reset
set(gca,'XTick',[])
set(gca,'YTick',[])
set(handles.edit1,'String',[0])
set(handles.edit5,'String',[ ])

MATLAB
close
20
MATLAB
[filename, pathname] = uiputfile('*.wav');
if ~isequal(filename,0)
Fs = handles.Fs;
y = handles.y;
audiowrite(fullfile(pathname, filename),y,Fs)
else
return
end

MATLAB
y = handles.y;
Fs = handles.Fs;
sound (y,Fs);

MATLAB

MATLAB

edit10 as a double

properties.
MATLAB
21
CreateFcns called

end

MATLAB
3.3 Tampilan Jadi Aplikasi Deteksi Suara pada GUI MATLAB
Setelah dilakukan pengkodingan maka aplikasi bisa dijalankan (run)

sehingga tampilannya sebagai berikut :
Gambar 3.2 Tampilan Run Aplikasi Deteksi Suara pada GUI MATLAB
22
Gambar 3.3 Contoh tampilan Aplikasi Deteksi Suara pada GUI MATLAB setelah proses
perekaman
23
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil Data
Berikut hasil percobaan perhitungan rata-rata silent ratio dan average

energy pada aplikasi GUI matlab :
Untuk ;
Fs = 16000
nBeats = 8
nChannel = 1
t=1
Tabel 1. Silent Ratio dan Avarage Energy untuk Identifikasi Signal Suara
No Waktu Silent Ratio Average Energy

1. 0.0-0.2 0 0
2. 0.2-0.4 0.22337 3.1908
3. 0.4-0.6 0.29053 14.7692
4. 0.6-0.8 0.95189 36.9367
5. 0.8-1.0 0 0
Jumlah 1.46579 54.8967
Rata-rata 0.293158 10.97934
4.2 Hasil Gelombang
a. Waktu (0.0-0.2)
24
b. Waktu (0.2-0.4)
c. Waktu (0.4-0.6)
25
d. Waktu (0.6-0.8)
26
e. Waktu (0.8-1.0)
27
4.3 Pembahasan
Pada aplikasi deteksi suara GUI MATLAB yang telah dibuat, dilakukan
percobaan perekaman suara untuk memperoleh nilai silent ratio dan average
energy. Pada percobaan yang dilakukan, diambil nilai frekuensi sebesar 16000
hertz, kemudian dipilih nBeats dengan nilai 8 (karena untuk nilai nBeat yang
didukung hanya 8, 16 dan 24), lalu nilai nChannels dibuat 1, dan waktu (t) yang
digunakan untuk lama perekaman diambil 1 sekon. Angka-angka yang diambil
bisa dibuat sesuka hati namun ada ketentuan-ketentuan tertentu untuk memperoleh
keluaran yang baik. Misalnya nilai X harus lebih kecil dari nilai Y, nilai Y juga
tidak bisa lebih besar dari nilai t, dan untuk menghasilkan suara yang baik
berdasarkan aplikasi yang sudah dibuat besar frekuensi yang menghasilkan
keluaran yang baik adalah diatas 16000 Hz. Selanjutnya dilakukan beberapa kali
percobaan dengan mengubah nilai X dan Y untuk mendapatkan rata-rata silent
ratio dan rata-rata average energy.
Percobaan pertama, dimasukkan nilai X = 0.0 dan nilai Y = 0.2 diperoleh
hasil nilai silent ratio 0 dan nilai average energy nya juga 0. Gelombang yang
dihasilkan hanya tampak pada gelombang rekaman suara sedangkan pada FFT
dan average energy tidak tampak gelombang dihasilkan seperti yang terlihat pada
data hasil gelombang diatas.
Kemudian pada percobaan kedua, dimasukkan nilai X = 0.2 dan nilai Y =
0.4 diperoleh nilai silent ratio = 0.22337 dan nilai average energy = 3.1908
dengan gelombang yang dihasilkan seperti pada data hasil gelombang diatas.
28
Selanjutnya pada percobaan ketiga, dimasukkan nilai X = 0.4 dan nilai Y =
0.6 diperoleh nilai silent ratio = 0.29053 dan nilai average energy = 14.7692
dengan gelombang yang dihasilkan seperti pada data hasil gelombang diatas.
Diulang kembali pada percobaan keempat, dengan mengubah nilai X = 0.6
dan nilai Y = 0.8 diperoleh nilai silent ratio = 0.95189 dan nilai average energy =
36.9367 dengan gelombang yang dihasilkan seperti pada data hasil gelombang
diatas.
Terakhir pada percobaan kelima, dengan mengubah nilai X = 0.8 dan nilai
Y = 1.0 dimana batas waktu akhir ini sama dengan waktu yang digunakan dalam
perekaman yaitu 1 sekon, artinya ini adalah waktu maksimum sehingga diperoleh
nilai silent ratio = 0 dan nilai average energy = 0 dengan gelombang yang
dihasilkan hanya tampak pada gelombang rekaman suara, sedangkan pada FFT
dan average energy nya tidak dihasilkan gelombang seperti tampak pada data hasil
gelombang diatas.
Berdasarkan data yang diperoleh, terlihat bahwa setiap perekaman
menghasilkan silent ratio dan average energy yang berbeda-beda. Semakin besar
batas X dan Y yang dimasukkan maka akan semakin besar nilai silent ratio dan
nilai average energy nya. Namun, nilai silent ratio dan average energy akan
bernilai nol jika besar X yang dimasukkan mulai dari 0.0 dan juga ketika
mencapai nilai maksimum t. Misalnya seperti percobaan yang dilakukan diatas
digunakan t=1 maka jika batas Y yang dimasukkan adalah 1 maka nilai silent ratio
dan average energynya juga 0. Dari beberapa percobaan diatas maka dapat
dihitung nilai rata-rata silent ratio dan nilai rata-rata average energy sebagai
berikut :
´ =
SR
∑ SR =
0+0.22337+ 0.29053+ 0.95189+0
=
1.46579
=
n kali percobaan 5 5
0.293158
´ =
AE
∑ AE =
0+3.1908+14.7692+36.9367+0
=
54.8967
=
n kali percobaan 5 5
10.97934
Terlihat bahwa rentang nilai silent ratio dan nilai average energy cukup jauh.
Selain itu berdasarkan percobaan yang dilakukan, ketika nilai frekuensi
diubah-ubah maka berpengaruh juga terhadap suara/bunyi hasil rekaman. Semakin
29
besar nilai frekuensi yang dimasukkan maka suara hasil rekaman yang berbunyi
akan semakin besar. Begitu sebaliknya, semakin kecil frekuensi yang dimasukkan
maka suara hasil rekaman semakin kecil bahkan sampai tidak berbunyi.
Selain itu, hasil rekaman yang diperoleh juga bergantung pada suara yang
direkam. Setiap suara yang direkam akan menghasilkan nilai silent ratio dan
average energy yang berbeda-beda. Sehingga hal ini dapat membuktikan bahwa
setiap manusia mempunyai suara yang berbeda-beda yang menjadikannya ciri
suara yang khas sehingga bisa dikenali oleh orang lain. Begitu juga dengan
aplikasi, dengan menggunakan aplikasi deteksi suara menggunakan silent ratio
dan average energy ini dapat membuktikan bahwa setiap manusia mempunyai
suara yang berbeda-beda terbukti juga dengan tampak keluaran gelombang yang
berbeda-beda, baik dari gelombang rekaman suara, gelombang Fast Fourier
Transform (FFT) dan gelombang average energy nya.
30
BAB V
PENUTUP
5.1 Kesimpulan
Dari proses pembuatan aplikasi sampai pada hasil aplikasi yang dibuat
dimana diperoleh hasil bahwa setiap suara mempunyai ciri khas yang berbeda-
beda. Terlihat dari nilai silent ratio dan nilai average energy tiap suara yang
diperoleh dari aplikasi menghasilkan nilai serta gelombang yang berbeda-beda.
Pada percobaan kali ini diperoleh nilai rata-rata silent ratio sebesar 0.293158 dan
nilai rata-rata average energy sebesar 10.97934.
5.2 Saran
Untuk melakukan percobaan yang dilakukan secara berulang dengan

tujuan mendapatkan nilai rata-rata yang mendekati benar, sebaiknya gunakan
suara yang konstan untuk direkam. Jika jenis suara yang direkam berbeda-beda
maka rentang noise nya akan semakin besar.
Kemudian saran untuk pembaca agar bisa mengembangkan lagi aplikasi
deteksi suara yang lebih jelas dan lebih detail dalam proses pendeteksiannya.
31
DAFTAR PUSTAKA
Al-Azhar, Muhammad Nuh. 2011. Digital Forensik Panduan Praktis. Salemba

Infotek: Investigasi Komputer.
Kurniawan, Wawan. 2016. Identifikasi Speech Recognition Manusia dengan
Menggunakan Average Energy dan Silent Ratio Sebagai Feature
Extraction Suara pada Komputer. Jurnal Biospecies, Vol. 9, No.1, Januari
2016, P.1-6.
Mandalia Darshan, Pravin Gareta. 2011. Speaker Recognition Using Mel
Frequency Cepstrum Coefficient (MFCC) and Vector Quantization
Model. Teknik Elektro, Fakultas Teknik, Universitas Nirma.
Nilsson, M. dan Ejnarsson M. 2002. Speech Recognition using Hidden Markov
Model, Master Thesis, Blekinge Institute of Technology, Karlskrona,
Sweden.
Putra, Karisma Trinanda. 2017. Sistem Pengenal Wicara Menggunakan Mel-F
requency Cepstral Coefficient (Speech Recognition System Using Mel-
Frequency Cepstral Coefficient). Jurnal Ilmiah Semesta Teknika, Vol. 20,
No. 1, P.75-80.
Tamatjita, Nurmiyati dan Agus Harjoko.2014. Klasifikasi Lagu Berdasarkan Genre pada
Format WAV. Jurnal IJCCS, Vol.8, No.2, P. 145-154.
32
LAMPIRAN
Gambar 1. Percobaan dengan ambang waktu 0.0-0.2
33
34
35

Makalah Uas Fiskom

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah Uas Fiskom

Diunggah oleh

Hak Cipta:

Format Tersedia

MAKALAH FISIKA KOMPUTASI

“Identifikasi Suara Manusia dengan Menggunakan Silent Ratio

PROGRAM STUDI PENDIDIKAN FISIKA

Jambi, Mei 2018

KATA PENGANTAR ....................... i

3.2 Coding Aplikasi Deteksi Suara pada GUI MATLAB.................................... 12

3.3 Tampilan Jadi Aplikasi Deteksi Suara pada GUI MATLAB......................... 22

BAB IV HASIL DAN PEMBAHASAN

1.2 Rumusan Masalah

1.3 Tujuan Penulisan

1.4 Manfaat Penulisan

2.1.1 Suara Manusia

Gambar 2.1 Human Vocal Tract

2.1.2 Komponen Suara

2.1.3 Frekuensi Suara

2.2 Fast Fourier Transform (FFT)

Gambar 2.2 Sinyal kontinyu

2. Sinyal waktu diskrit, yaitu terdefinisi pada waktu-waktu tertentu

Gambar 2.3 Sinyal diskrit

Gambar 2.4 Sinyal analog

Gambar 2.5 Sinyal digital

2.3 Silent Ratio

2.4 Average Energy

3.1 Pembuatan Aplikasi Deteksi Suara pada GUI MATLAB

Gambar 3.1 Pembuatan Aplikasi pada GUI MATLAB

3.2 Coding Aplikasi Deteksi Suara pada GUI MATLAB

Berikut adalah coding dari pembuatan aplikasi diatas :

% Edit the above text to modify the response to help TUGASUAS

% Last Modified by GUIDE v2.5 21-May-2018 15:18:10

% Begin initialization code - DO NOT EDIT

% --- Executes just before TUGASUAS is made visible.

% Choose default command line output for TUGASUAS

% Update handles structure

% UIWAIT makes TUGASUAS wait for user response (see UIRESUME)

% Get default command line output from handles structure

function edit1_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit1 as text

% --- Executes during object creation, after setting all

% Hint: edit controls usually have a white background on Windows.

function edit2_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit2 as text

% --- Executes during object creation, after setting all

% Hint: edit controls usually have a white background on Windows.

function edit3_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit3 as text

% --- Executes during object creation, after setting all

% Hint: edit controls usually have a white background on Windows.

function edit4_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit4 as text

% --- Executes during object creation, after setting all

% Hint: edit controls usually have a white background on Windows.

% --- Executes on button press in pushbutton1.

% hObject handle to pushbutton1 (see GCBO)

function edit5_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit5 as text

% Hint: edit controls usually have a white background on Windows.

function edit6_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit6 as text

% --- Executes during object creation, after setting all

% Hint: edit controls usually have a white background on Windows.

function edit7_Callback(hObject, eventdata, handles)

% Hints: get(hObject,'String') returns contents of edit7 as text

% Hint: edit controls usually have a white background on Windows.