DOSEN PENGAMPU :
Wawan Kurniawan, S.Si, M.Cs
DISUSUN OLEH :
RIKA IRMAYANTI
A1C315016
Puji syukur kehadirat Tuhan Yang Maha Esa karena berkat rahmat dan
karunia-Nya, penulis dapat menyelesaikan makalah yang berjudul “Identifikasi
Suara Manusia dengan Menggunakan Silent Ratio dan Average Energy” ini.
Makalah ini disusun untuk memenuhi tugas akhir mata kuliah Fisika Komputasi
pada Program Studi Pendidikan Fisika di Universitas Jambi.
Dalam kesempatan ini penulis mengucapkan terima kasih kepada bapak
Wawan Kurniawan, S.Si, M.Cs selaku dosen pengampu karena telah memberikan
pengarahan yang sangat berarti dalam menunjang penyusunan makalah ini.
Akhirnya penulis berharap semoga makalah ini dapat bermanfaat bagi
pembaca. Penulis menyadari bahwa makalah ini masih terdapat banyak
kekurangan, sehingga masukan berupa kritik dan saran yang membangun dari
pembaca sangat kami perlukan.
Penulis
i
DAFTAR ISI
ii
BAB I
PENDAHULUAN
1.1 Latar Belakang
Suara dapat menjadi ciri khas dari setiap individu yang dapat membedakan
antara individu satu dengan yang lainnya. Perbedaan tersebut terletak pada
karakteristik suara yang dihasilkan oleh masing – masing individu tersebut.
Tapitidak semua pendengaran manusia mampu membedakan suara dari masing-
masing individu yang dikenalnya. Kepekaan telinga juga memiliki berbagai
keterbatasan dan sensitif terhadap suara. Oleh karena itu dibutuhkan suatu sistem
untuk mengenali suara manusia tersebut sehingga dapat hasilnya akan tertuju tepat
kepada individu yang dimaksud. Sistem untuk mengenali suara manusia tersebut
biasa dikenal dengan nama identifikasi suara, sistem ini bisa membedakan antara
suara individu yang satu dengan individu yang lainnya berdasarkan perbedaan
karakteristik suara dari masing – masing indivdu yang bisa dicari dengan beberapa
metode ekstraksi ciri.
Darshan Mandalia (2011) pernah membuat suatu sistem jaringan saraf tiruan
untuk identifikasi suara dengan metode ekstraksi ciri MFCC menggunakan
perangkat lunak MATLAB. Sistem ini juga menggunakan metode Vector
Quantization untuk clustering suara yang sudah direkam sebelumnya. Secara garis
besar cara kerja sistem identifikasi suara ini adalah pertama – tama sistem akan
merekam suara yang akan diidentifikasi, lalu suara hasil rekama tersebut akan
mengalami proses Silence Detection dan Windowing, setelahnya suara hasil
rekaman tersebut dikonversikan ke dalam domain frekuensi dilanjukan dengan
mengkonversinya ke dalam domain Mel Frequency Cepstrum. Setelah melalui
proses tersebut, suara rekaman akan digambarkan dalam Overlapping Triangle
Window yang nantinya akan mendapatkan nilai energy dari setiap window,
selanjutnya akan mendapatkan nilai DCT (Discrete Cosine Transform) dari
Spectrum Energy, dan didapatkan nilai MSE (Mean Square Error) dari suara
rekaman yang pertama. Untuk mencocokkanya, diperlukan suara rekaman kedua
yang mengalami proses sama dengan rekaman suara pertama dan nilai MSE dari
kedua suara ini akan dicocokkan, apabila nilai MSEnya kurang dari 1,5
1
makan kedua rekaman suara tersebut berasal dari orang yang sama, sebaliknya
apabila nilai MSE dari kedua rekaman suara ini melebihi 1,5 maka kemungkinan
kedua rekaman suara itu bukan berasal dari suara orang yang sama. Faktor –
faktor yang bisa mempengaruhi proses identifikasi suara menggunakan sistem
jaringan saraf tiruan ini antara lain yaitu kondisi kesehatan individu yang suaranya
dijadikan sampel, kondisi lingkungan tempat pengambilan sampel, dan kondisi
perangkat keras yang digunakan dalam pengambilan sampel suara.
Pada penelitian oleh Ghulam M. tahun 2009, yang mengambil kasus
pengenalan digit terisolasi yang menggunakan kombinasi metode MFCC dan
HMM dalam bahasa Bangia, sistem mampu mengenali digit bilangan yang
digunakan dengan tingkat keberhasilan mencapai 90%. Sedangkan, untuk studi
kasus yang sama pada penelitian oleh M. Chandrasekar yang mengdopsi metode
MFCC dalam mengekstrak fitur suara, kemudian dikenali dengan Back
Propagation Network diperoleh nilai akurasi yang lebih kecil yaitu 80,95%.
Dalam pengenalan kata berkelanjutan (continuous) dengan kosa kata berukuran
besar oleh Corneliu O. dan Inger Gavat, digunakan Hidden Markov Model
sebagai recognizer dan 3 macam metode algoritma ekstraksi fitur yaitu MFCC,
LPC, dan PLP. Dari ketiga metode ekstraksi fitur tersebut, MFCC menghasilkan
tingkat akurasi tertinggi dengan persentase 90,41%. Sedangkan metode LPC
memiliki persentase keberhasilan 63,55% sementara PLP sebesar 75,78%.
Pada penelitian ini akan membahas dan membuat suatu aplikasi identifikasi
suara yang bisa mengidentifikasi, menyocokkan suara dari individu yang berbeda-
beda. Untuk membuat aplikasi identifikasi suara ini menggunakan metode MFCC
(Mel Frequency Cepstral Coefficients) sebagai metode esktraksi cirinya dan 2
metode pengenalan (recognition) yaitu Hidden Markov Model dan Vector
Quantization. Jaringan saraf tiruan untuk identifikasi suara ini akan dibuat dengan
menggunakan perangkat lunak MATLAB.
2
3. Apa yang dimaksud dengan Silent Ratio?
4. Apa yang dimaksud dengan Average Energy?
5. Bagaimana cara pembuatan program identifikasi suara manusia dengan
silent ratio dan average energy pada MATLAB?
3
BAB II
LANDASAN TEORI
2.1 Suara
Suara dapat menjadi ciri khas dari setiap individu yang dapat
membedakan antara individu satu dengan yang lainnya. Perbedaan tersebut
terletak pada karakteristik suara yang dihasilkan oleh masing – masing individu
tersebut. Tapitidak semua pendengaran manusia mampu membedakan suara dari
masing-masing individu yang dikenalnya. Kepekaan telinga juga memiliki
berbagai keterbatasan dan sensitif terhadap suara. Oleh karena itu dibutuhkan
suatu sistem untuk mengenali suara manusia tersebut sehingga dapat hasilnya
akan tertuju tepat kepada individu yang dimaksud. Sistem untuk mengenali suara
manusia tersebut biasa dikenal dengan nama identifikasi suara, sistem ini bisa
membedakan antara suara individu yang satu dengan individu yang lainnya
berdasarkan perbedaan karakteristik suara dari masing – masing indivdu yang bisa
dicari dengan beberapa metode ekstraksi ciri.
Menurut Putra (2017) Sinyal suara adalah suatu sinyal analog yang
membutuhkan pemrosesan lebih lanjut sebelum dapat dipahami oleh mesin. Pada
mulanya, sinyal suara dipisahkan dari sinyal silent (jeda) menggunakan voice
activity detection (VAD). Kemudian ciri sinyal diekstrak menggunakan mel-
frequency cepstral coefficients (MFCC). Sistem ini mengemulasikan sistem
pendengaran manusia dengan menganalisis spektrum frekuensi ke dalam beberapa
spectral filter tertentu. Artificial neural network (ANN) akan digunakan dalam
proses identifikasi cepstral yang dihasilkan. ANN adalah sekelompok jaringan
unit pemroses yang dapat memodelkan sesuatu berdasarkan sistem jaringan syaraf
manusia. ANN mampu untuk memproses data statistik non-linier. ANN akan
memberikan penilaian statistik tingkat kecocokan sinyal suara dengan kata-kata
yang dilatihkan.
4
menghasilkan bunyi periodik. Bunyi periodik yang bersifat konstan tersebut
kemudian difilterisasi melalui vocal tract (juga disebut dengan istilah resonator
suara atau articulator) yang terdiri dari lidah, gigi, bibir, langit-langit mulut dan
lain-lain sehingga bunyi tersebut dapat menjadi bunyi keluaran berupa bunyi
vokal dan atau bunyi konsonan yang membentuk kata-kata yang memiliki arti
yang nantinya dapat dianalisa untuk identifikasi suara.
Untuk dapat diidentifikasi, ada beberapa karakteristik suara yang dapat
dijadikan parameter untuk membedakan antara orang yang satu dengan yang
lainnya. Menurut Nilsson dan Ejnarsson (2002), sinyal suara dan karakteristiknya
dapat direpresentasikan ke dalam dua domain yang berbeda, yaitu domain waktu
dan domain frekuensi. Sinyal suara merupakan sinyal yang bervariasi lambat
sebagai fungsi waktu, dalam hal ini ketika diamati pada durasi yang sangat pendek
(5 sampai 100 m) karakteristiknya masih stasioner. Tetapi apabila diamati dalam
durasi yang lebih panjang (> 1/5 detik) karakteristik sinyalnya berubah untuk
merefleksikan suara yang keluar dari pembicara.
5
khas (habitual pitch) yang sangat dipengaruhi oleh aspek fisiologis larynx
manusia. Pada kondisi pembicaraan normal, level habitual pitch berkisar pada 50
s/d 250 Hz untuk laki-laki dan 120 s/d 500 Hz untuk perempuan. Frekuensi F0 ini
berubah secara konstan dan memberikan informasi linguistik seseorang seperti
perbedaan intonasi dan emosi. Analisa pitch dapat digunakan untuk melakukan
voice recognition terhadap suara seseorang, yaitu melalui analisa statistik terhadap
minimum pitch, maximum pitch dan mean pitch.
b. Formant
Formant adalah frekwensi-frekwensi resonansi dari filter, yaitu vocal tract
(articulator) yang meneruskan dan memfilter bunyi periodik dari getarnya pita
suara (vocal cord) menjadi bunyi keluaran berupa kata-kata yang memiliki makna.
Secara umum, frekuensi-frekuensi formant bersifat tidak terbatas, namun untuk
identifikasi suara seseorang, paling tidak ada 3 (tiga) formant yang dianalisa, yaitu
Formant 1 (F1), Formant 2 (F2) dan Formant 3 (F3).
c. Spectogram
Spectrogram merupakan representasi spectral yang bervariasi terhadap
waktu yang menunjukkan tingkat density (intensitas energi) spektral. Dengan kata
lain spectrogram adalah bentuk visualisasi dari masing-masing nilai formant yang
dilengkapi dengan level energi yang bervariasi terhadap waktu. Level energy ini
dikenal dengan istilah formant bandwidth. Nantinya pada kasus-kasus yang
bersifat pemalsuan suara dengan teknik pitch shift atau si subyek berusaha untuk
menghilangkan karakter suara aslinya, maka formant bandiwidth dapat digunakan
untuk memetakan atau mengidentifikasi suara aslinya. Spectrogram membentuk
pola umum yang khas dalam pengucapan kata dan pola khusus masing-masing
formant dalam pengucapan suku kata, sehingga spectrogram juga digunakan
untuk melakukan analisa identifkasi suara seseorang. Jika durasi rekaman suara
unknown lumayan panjang, maka analisa spectrogram juga dapat digunakan untuk
mempercepat pemilihan pengucapan kata-kata yang akan dianalisa dalam rangka
untuk mendapatkan jumlah minimal 20 kata untuk dapat menunjukkan ke-identik-
an suara unknown dengan known (pembanding).
6
Frekuensi suara atau frekuensi audio yaitu getaran frekuensi yang
terdengar oleh manusia dengan standard antara 20 Hertz sampai dengan 20.000
Hertz. Menurut sistem pendengaran manusia di bagi menjadi tiga kelompok, yaitu
frekuensi infrasonik, dengan rentang 0-20 Hz, frekuensi audible, 20-20.000 Hz,
dan frekuensi ultrasonik, dengan rentang > 20.000 Hz.
7
perekaman suara disimpan dalam bentuk digital berupa gelombang spectrum
suara berbasis frekuensi.
Ada beberapa klasifikasi sinyal yang ada :
1. Sinyal waktu kontinyu, yaitu terdefinisi pada setiap waktu
3. Sinyal analog, yaitu sinyal waktu kontinyu dengan amplitudo yang kontinyu
8
Sumber: Identifikasi Suara dengan MATLAB sebagai Aplikasi Jaringan Syaraf Tiruan oleh John Alder
4. Sinyal digital, yaitu sinyal waktu diskrit dengan amplitudo bernilai diskrit
SR=
∑S ............................................................................................................
∑l
(2.4)
s = Periode keheningan dalam potongan file audio
l = Panjang dari tiap potongan file audio
Masukkan audio, apabila berpusat tinggi maka dikenal sebagai musik. Apabila
tidak, maka perkataan dan musik. Apabila rasio keheningan tinggi, maka bukan
musik, tetapi perkataan dan solo musik.
∑ X (n)2 ..................................................................................................(2.5)
E= n=0
N
E = Energi rata-rata pada potongan audio.
9
N = Jumlah total sampel dalam potongan audio.
X(n) = Nilai dari sampel ke n.
Di mana E adalah Everage Energy pada satuan audio, N adalah Total nomor
sampel di dalam satuan audio dan x(n) adalah nilai sampel pada sampel n.
Berikut ini sinyal sinus:
x(t) = A cos(2πt +φ)
Bentuk persamaan diatas merepresentasikan nilai magnitudo sinyal
sebagai fungsi waktu. Di dalam kondisi real seringkali dinyatakan dalam besaran
volt. Nilai x(t) dalam parameter yang umum untuk pengukuran dinyatakan dalam
V(t) yang menunjukkan nilai simpangan sinyal atau magnitudonya pada suatu
waktu t.
Sedangkan untuk besaran lain dari sinyal dalam hal ini daya dinyatakan sebagai:
(V (t ) )2
P (t)=
R
Dalam hal ini nilai nilai R biasanya dinyatakan sebesar 1 Ω. Dan
parameter ini seringkali tidak dituliskan, sehingga persamaannya menjadi lebih
sederhana.
P ( t ) =(V ( t ))2
Sedangkan besarnya energi dari suatu sinyal diketahui sebagai total daya
pada suatu durasi waktu tertentu. Dengan mengacu pada persamaannya yang
sudah dimodifikasi, maka dapat dinyatakan sebagai berikut.
T
∑ ¿(V ( t ) )2
t =0
10
Kemudia energi rata-rata untuk suatu durasi tertentu T, dinyatakan sebagai
berikut.
T
∑ (V ( t ) )2
E= t =0
T
BAB III
APLIKASI GUI MATLAB
Berikut adalah gambar dari tampilan Aplikasi Deteksi Suara yang sedang
di buat dalam menu editor GUI MATLAB :
Keterangan :
Nama
String Tag Tittle
UIControl
Panel 1 - uipanel1 Editor
Panel 2 - uipanel2 Gelombang
Panel 3 - uipanel3 Gelombang
Rekaman Suara
Panel 4 - uipanel4 Gelombang FFT
(Fast Fourier
Transform)
11
Panel 5 - uipanel5 Gelombang
Average Energy
Panel 6 - uipanel6 Hasil
Static Text 1 Frekuensi Sumber text1 -
(Fs)
Static Text 2 nBeats text2 -
Static Text 3 nChannels text3 -
Static Text 4 Waktu (t) text4 -
Static Text 5 Waktu Awal (X) text5 -
Static Text 6 Waktu Akhir (Y) text6 -
Static Text 7 Silent Ratio text7 -
Static Text 8 Average Energy text8 -
Static Text 9 APLIKASI text11 -
DETEKSI SUARA
Static Text 10 Oleh : RIKA text14 -
IRMAYANTI
(A1C315016)
Static Text 11 (Only Supported : 8, text17 -
16, 24)
Edit 1 edit1 -
Edit 2 edit2 -
Edit 3 edit3 -
Edit 4 edit4 -
Edit 5 edit5 -
Edit 6 edit6 -
Edit 7 ... edit7 -
Edit 8 edit8 -
Edit 9 edit9 -
Pushbutton 1 REKAM pushbutton1 -
Pushbutton 2 RESET pushbutton2 -
Pushbutton 3 EXIT pushbutton3 -
Pushbutton 4 SIMPAN pushbutton4 -
Pushbutton 5 MAINKAN pushbutton5 -
REKAMAN
Axes 1 - axes2 -
Axes 2 - axes3 -
Axes 3 - axes4 -
Untuk warna baground, warna tulisan, serta model tulisan juga bisa diatur sesuka
hati di property inspector.
12
% TUGASUAS MATLAB code for TUGASUAS.fig
% TUGASUAS, by itself, creates a new TUGASUAS or raises the
existing
% singleton*.
%
% H = TUGASUAS returns the handle to a new TUGASUAS or the
handle to
% the existing singleton*.
%
% TUGASUAS('CALLBACK',hObject,eventData,handles,...) calls
the local
% function named CALLBACK in TUGASUAS.M with the given input
arguments.
%
% TUGASUAS('Property','Value',...) creates a new TUGASUAS or
raises the
% existing singleton*. Starting from the left, property
value pairs are
% applied to the GUI before TUGASUAS_OpeningFcn gets called.
An
% unrecognized property name or invalid value makes property
application
% stop. All inputs are passed to TUGASUAS_OpeningFcn via
varargin.
%
% *See GUI Options on GUIDE's Tools menu. Choose "GUI allows
only one
% instance to run (singleton)".
%
% See also: GUIDE, GUIDATA, GUIHANDLES
if nargout
[varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:});
else
gui_mainfcn(gui_State, varargin{:});
end
% End initialization code - DO NOT EDIT
13
% This function has no output args, see OutputFcn.
% hObject handle to figure
% eventdata reserved - to be defined in a future version of
MATLAB
% handles structure with handles and user data (see GUIDATA)
% varargin command line arguments to TUGASUAS (see VARARGIN)
% --- Outputs from this function are returned to the command line.
function varargout = TUGASUAS_OutputFcn(hObject, eventdata,
handles)
% varargout cell array for returning output args (see VARARGOUT);
% hObject handle to figure
% eventdata reserved - to be defined in a future version of
MATLAB
% handles structure with handles and user data (see GUIDATA)
14
end
15
if ispc && isequal(get(hObject,'BackgroundColor'),
get(0,'defaultUicontrolBackgroundColor'))
set(hObject,'BackgroundColor','white');
end
waktu = 30;
y = y';
t = 0:1/Fs:waktu;
t(length(t))= [];
16
X = str2double(get(handles.edit6,'String'));
Y = str2double(get(handles.edit7,'String'));
x1 = find (t==X);
y1 = find (t==Y);
t1 = t(x1:y1);
y1 = y(x1:y1);
axes(handles.axes3);
plot (t1,y1);
grid on
sil = [];
for i = 1:length(y1),
if (y1(i) > -.005)&& (y1(i) <.005),
else
sil(i) = 1;
end
end
sil;
sum(sil);
silent_rasio = sum(sil)/length(y1);
B = fft(y1);
power = abs(B(1:(length(B)+1)/2));
frek = Fs*(0:(length(B)-1)/2)/length(B);
kuadrat = power.^2;
av = sum(kuadrat)/length(power);
axes(handles.axes4)
plot(frek,power);
xlabel('Frekuensi');
ylabel('Power');
grid on
set(handles.edit8,'String',strcat(num2str(silent_rasio)));
set(handles.edit9,'String',strcat(num2str(av)));
17
% --- Executes during object creation, after setting all
properties.
function edit5_CreateFcn(hObject, eventdata, handles)
% hObject handle to edit5 (see GCBO)
% eventdata reserved - to be defined in a future version of
MATLAB
% handles empty - handles not created until after all
CreateFcns called
18
% --- Executes during object creation, after setting all
properties.
function edit7_CreateFcn(hObject, eventdata, handles)
% hObject handle to edit7 (see GCBO)
% eventdata reserved - to be defined in a future version of
MATLAB
% handles empty - handles not created until after all
CreateFcns called
19
% str2double(get(hObject,'String')) returns contents of
edit9 as a double
20
function pushbutton4_Callback(hObject, eventdata, handles)
% hObject handle to pushbutton4 (see GCBO)
% eventdata reserved - to be defined in a future version of
MATLAB
% handles structure with handles and user data (see GUIDATA)
[filename, pathname] = uiputfile('*.wav');
if ~isequal(filename,0)
Fs = handles.Fs;
y = handles.y;
audiowrite(fullfile(pathname, filename),y,Fs)
else
return
end
sound (y,Fs);
21
% handles empty - handles not created until after all
CreateFcns called
Gambar 3.2 Tampilan Run Aplikasi Deteksi Suara pada GUI MATLAB
22
Gambar 3.3 Contoh tampilan Aplikasi Deteksi Suara pada GUI MATLAB setelah proses
perekaman
23
BAB IV
HASIL DAN PEMBAHASAN
4.1 Hasil Data
a. Waktu (0.0-0.2)
24
b. Waktu (0.2-0.4)
c. Waktu (0.4-0.6)
25
d. Waktu (0.6-0.8)
26
e. Waktu (0.8-1.0)
27
4.3 Pembahasan
Pada aplikasi deteksi suara GUI MATLAB yang telah dibuat, dilakukan
percobaan perekaman suara untuk memperoleh nilai silent ratio dan average
energy. Pada percobaan yang dilakukan, diambil nilai frekuensi sebesar 16000
hertz, kemudian dipilih nBeats dengan nilai 8 (karena untuk nilai nBeat yang
didukung hanya 8, 16 dan 24), lalu nilai nChannels dibuat 1, dan waktu (t) yang
digunakan untuk lama perekaman diambil 1 sekon. Angka-angka yang diambil
bisa dibuat sesuka hati namun ada ketentuan-ketentuan tertentu untuk memperoleh
keluaran yang baik. Misalnya nilai X harus lebih kecil dari nilai Y, nilai Y juga
tidak bisa lebih besar dari nilai t, dan untuk menghasilkan suara yang baik
berdasarkan aplikasi yang sudah dibuat besar frekuensi yang menghasilkan
keluaran yang baik adalah diatas 16000 Hz. Selanjutnya dilakukan beberapa kali
percobaan dengan mengubah nilai X dan Y untuk mendapatkan rata-rata silent
ratio dan rata-rata average energy.
Percobaan pertama, dimasukkan nilai X = 0.0 dan nilai Y = 0.2 diperoleh
hasil nilai silent ratio 0 dan nilai average energy nya juga 0. Gelombang yang
dihasilkan hanya tampak pada gelombang rekaman suara sedangkan pada FFT
dan average energy tidak tampak gelombang dihasilkan seperti yang terlihat pada
data hasil gelombang diatas.
Kemudian pada percobaan kedua, dimasukkan nilai X = 0.2 dan nilai Y =
0.4 diperoleh nilai silent ratio = 0.22337 dan nilai average energy = 3.1908
dengan gelombang yang dihasilkan seperti pada data hasil gelombang diatas.
28
Selanjutnya pada percobaan ketiga, dimasukkan nilai X = 0.4 dan nilai Y =
0.6 diperoleh nilai silent ratio = 0.29053 dan nilai average energy = 14.7692
dengan gelombang yang dihasilkan seperti pada data hasil gelombang diatas.
Diulang kembali pada percobaan keempat, dengan mengubah nilai X = 0.6
dan nilai Y = 0.8 diperoleh nilai silent ratio = 0.95189 dan nilai average energy =
36.9367 dengan gelombang yang dihasilkan seperti pada data hasil gelombang
diatas.
Terakhir pada percobaan kelima, dengan mengubah nilai X = 0.8 dan nilai
Y = 1.0 dimana batas waktu akhir ini sama dengan waktu yang digunakan dalam
perekaman yaitu 1 sekon, artinya ini adalah waktu maksimum sehingga diperoleh
nilai silent ratio = 0 dan nilai average energy = 0 dengan gelombang yang
dihasilkan hanya tampak pada gelombang rekaman suara, sedangkan pada FFT
dan average energy nya tidak dihasilkan gelombang seperti tampak pada data hasil
gelombang diatas.
Berdasarkan data yang diperoleh, terlihat bahwa setiap perekaman
menghasilkan silent ratio dan average energy yang berbeda-beda. Semakin besar
batas X dan Y yang dimasukkan maka akan semakin besar nilai silent ratio dan
nilai average energy nya. Namun, nilai silent ratio dan average energy akan
bernilai nol jika besar X yang dimasukkan mulai dari 0.0 dan juga ketika
mencapai nilai maksimum t. Misalnya seperti percobaan yang dilakukan diatas
digunakan t=1 maka jika batas Y yang dimasukkan adalah 1 maka nilai silent ratio
dan average energynya juga 0. Dari beberapa percobaan diatas maka dapat
dihitung nilai rata-rata silent ratio dan nilai rata-rata average energy sebagai
berikut :
´ =
SR
∑ SR =
0+0.22337+ 0.29053+ 0.95189+0
=
1.46579
=
n kali percobaan 5 5
0.293158
´ =
AE
∑ AE =
0+3.1908+14.7692+36.9367+0
=
54.8967
=
n kali percobaan 5 5
10.97934
Terlihat bahwa rentang nilai silent ratio dan nilai average energy cukup jauh.
Selain itu berdasarkan percobaan yang dilakukan, ketika nilai frekuensi
diubah-ubah maka berpengaruh juga terhadap suara/bunyi hasil rekaman. Semakin
29
besar nilai frekuensi yang dimasukkan maka suara hasil rekaman yang berbunyi
akan semakin besar. Begitu sebaliknya, semakin kecil frekuensi yang dimasukkan
maka suara hasil rekaman semakin kecil bahkan sampai tidak berbunyi.
Selain itu, hasil rekaman yang diperoleh juga bergantung pada suara yang
direkam. Setiap suara yang direkam akan menghasilkan nilai silent ratio dan
average energy yang berbeda-beda. Sehingga hal ini dapat membuktikan bahwa
setiap manusia mempunyai suara yang berbeda-beda yang menjadikannya ciri
suara yang khas sehingga bisa dikenali oleh orang lain. Begitu juga dengan
aplikasi, dengan menggunakan aplikasi deteksi suara menggunakan silent ratio
dan average energy ini dapat membuktikan bahwa setiap manusia mempunyai
suara yang berbeda-beda terbukti juga dengan tampak keluaran gelombang yang
berbeda-beda, baik dari gelombang rekaman suara, gelombang Fast Fourier
Transform (FFT) dan gelombang average energy nya.
30
BAB V
PENUTUP
5.1 Kesimpulan
Dari proses pembuatan aplikasi sampai pada hasil aplikasi yang dibuat
dimana diperoleh hasil bahwa setiap suara mempunyai ciri khas yang berbeda-
beda. Terlihat dari nilai silent ratio dan nilai average energy tiap suara yang
diperoleh dari aplikasi menghasilkan nilai serta gelombang yang berbeda-beda.
Pada percobaan kali ini diperoleh nilai rata-rata silent ratio sebesar 0.293158 dan
nilai rata-rata average energy sebesar 10.97934.
5.2 Saran
31
DAFTAR PUSTAKA
32
LAMPIRAN
33
Gambar 1. Percobaan dengan ambang waktu 0.4-0.6
34
Gambar 1. Percobaan dengan ambang waktu 0.8-1.0
35