Resume PDF
Resume PDF
Abstrak
Suara manusia memiliki karakteristik yang berbeda-beda antara satu dengan yang lain,
karakteristik yang membedakan berupa keunikan dari kontrol dan pengucapan lafal. Ciri tersebut
yang menjadi dasar identifikasi atau pengenalan dari masing-masing individu. Fungsinya untuk
sistem keamanan dengan mengenali identitas seseorang. Pengenalan melalui pendengaran
manusia terkadang tidaklah mudah dilakukan karena berbagai keterbatasan. Sehingga
dibutuhkan suatu sistem yang yang dapat menganalisis suara dari manusia untuk membedakan
antar individu tersebut.
Dalam tugas akhir ini, telah dirancang dan direalisasikan suatu sistem yang dapat
mengidentifikasi suara manusia dengan metode JST-SOM, di mana sistem tersebut dapat
mengenali, membandingkan dan mencocokkan pola suara masukan sistem dengan pola suara
yang telah disimpan dalam memori secara otomatis. Sistem mengekstrasi parameter suara
manusia menggunakan metode Mel Frequency Cepstral Coefficient (MFCC).
Sistem ini menggunakan suara manusia sebagai sinyal input. Di mana sinyal input tersebut diolah
menggunakan piranti lunak MATLAB R2009a. Adapun parameter yang diukur adalah perubahan
parameter dari ekstrasi ciri MFCC dan JST SOM. Hasil terbaik diperoleh dengan tingkat akurasi
mencapai 96% pada pengujian dengan nilai melbank filter 64 dan nilai epoch 300. Data latih yang
digunakan sebanyak 300 sampel dan data uji yang digunakan juga sebanyak 300 sampel, di mana
data uji bukan termasuk ke dalam data latih. Simulasi yang dilakukan telah berhasil untuk
mengidentifikasi individu berdasarkan pengucapan huruf vokal /a/, /i/, /u/, /e/, /o/ dan kata /aku/
yang diucapkan (text dependent).
Kata Kunci : suara, identifikasi, Mel Frequency Cepstral Coefficient, JST-SOM, MATLAB, text
dependent
Abstract
The human voice has different characteristics with each other, a characteristic that distinguishes
the uniqueness of control and pronunciation. The characteristics which to base the identification
or recognition of each individual. The system function for the security to identify person.
Introduction through human hearing is sometimes not easy to do because of various limitations.
For that reason, need a system that can analyze the sound of the human to distinguish between
them.
In this thesis , has been designed and realized a system that can identify people with JST - SOM
method, which the system can identify, compare and match the pattern of the input sound with
sound patterns that have been stored in memory automatically. Systems of human voice
parameters extracted using the Mel Frequency Cepstral Coefficient ( MFCC ).
This system uses the human voice as an input signal. Where the input signal is processed using
MATLAB R2009a software. The parameters measured were changes in the parameters of the
extraction characteristics of MFCC and neural network SOM. The best results obtained with an
accuracy of 96% on a test with a value of melbank filter 64 and a value of epoch 300. The data
used to train as many as 300 samples and test data are used as well as 300 samples, in which test
data is not included in the training data. Simulations performed have managed to identify
individuals based on the pronunciation of the vowels /a/, /i/, /u/, /e/, /o/ and the /aku/ word ( text
dependent) .
Keywords : sound , identification , Mel Frequency cepstral Coefficient , JST - SOM , MATLAB , text
dependent
BAB 1
PENDAHULUAN
manusia untuk memastikan bahwa hasil dari proses identifikasi dengan tepat
menunjukkan bahwa suara tersebut merupakan suara yang menunjuk individu
tertentu. Manfaat untuk penelitian selanjutnya, sebagai dasar pembuatan sistem
keamanan dan juga dapat dijadikan cara alternatif memastikan individu dalam
suara rekaman telepon pada proses penyadapan yang biasanya dilakukan oleh
intelejen. Metode yang digunakan dalam sistem ini adalah JST-SOM di mana
JST-SOM merupakan jaringan saraf tiruan yang tergolong sebagai unsupervised
learning yang berarti jaringan tersebut melakukan pembelajaran tanpa bimbingan
data input-target, sehingga mampu belajar mandiri. Penggunaannya tidak perlu
merumuskan kaidah atau fungsi tertentu.
Dengan menggunakan metode JST-SOM sistem yang dihasilkan dapat
memberikan akurasi performansi yang lebih baik dibandingkan dengan metode
yang telah digunakan sebelumnya.
1.3 Tujuan
Adapun tujuan dari penelitian untuk Tugas Akhir ini adalah :
1. Membuat simulasi sistem pendeteksi dan identifikasi suara manusia
menggunakan metode JST-SOM.
BAB I PENDAHULUAN
Bab ini berisi uraian mengenai latar belakang pembuatan Tugas Akhir,
rumusan masalah, tujuan, batasan masalah, metode penelitian dan
sistematika penulisan.
BAB II DASAR TEORI
Berisi tentang dasar teori yang diperlukan serta literatur yang mendukung
dalam tugas akhir ini seperti metode Mel Frequency Cepstral Coefficient
dan JST-SOM.
BAB III PERANCANGAN SISTEM
Membahas tentang sistem dalam Tugas Akhir.
BAB IV PENGUJIAN SISTEM DAN ANALISIS
Menjelaskan dan menganalisis hasil keluaran dari sistem dan performansi
sistem.
BAB V KESIMPULAN DAN SARAN
Berisi simpulan dan saran pengembangan lebih lanjut.
BAB 5
5.1 Kesimpulan
Dari penelitian dan pengujian yang telah dilakukan, dapat diambil beberapa
kesimpulan mengenai sistem identifikasi suara manusia, antara lain sebagai
berikut :
1. Nilai cropping yang cocok dalam sistem ini adalah 0,01.
2. Pengolahan sinyal suara melalui proses MFCC ada parameter yang harus
diperhatikan yaitu melbank filter. Hal ini berpengaruh terhadap tingkat
akurasi yang dihasilkan oleh sistem.
3. Nilai melbank filter yang memberikan tingkat akurasi tertinggi adalah 64
dengan tingkat akurasi tertinggi mencapai 96% pada identifikasi vokal
/a/. Sedangkan tingkat akurasi terendah sebesar 72% pada identifikasi
kata /aku/.
4. Nilai melbank filter yang memberikan tingkat akurasi terendah adalah 31
dengan akurasi yang tertinggi hanya mencapai 74% pada identifikasi
vokal /a/ dan yang paling rendah mencapai persentase 56% pada
identifikasi kata /aku/.
5. Nilai melbank filter 24 memberikan akurasi terburuk dengan yang paling
rendah mencapai 52% pada identifikasi vokal /a/. Namun akurasi
tertinggi masih cukup baik dibandingkan nilai melbank filter 31 yaitu
sebesar 86% pada identifikasi vokal /e/.
6. Pada perubahan nilai epoch JST-SOM dicapai akurasi tertinggi pada nilai
epoch 300 yang mencapai akurasi 96%. Sedangkan nilai epoch yang
memberikan tingkat akurasi terburuk adalah 100 dengan akurasi hanya
mencapai 38%.
7. Sistem ini cukup handal dalam mengidentifikasi suara manusia yang data
inputnya diminimalisir adanya noise pada saat pencuplikan data.
5.2 Saran
DAFTAR PUSTAKA
[3] http://www.ittelkom.ac.id/library/index/self-organizing-maps-som.
Diakses pada tanggal 21 Maret 2011, pukul 22.47
[4] http://digilib.itb.ac.id/gdl.php?mod=browse&op=read&id=jbptitbpp-gdl-
fenikhairu-32417. Diakses pada tanggal 10 Mei 2011, pukul 22.08
[5] http://www.scribd.com/doc/30855434/Forensic-speaker-identification.
Diakses pada tanggal 10 Mei 2011, pukul 22.08
[10] Mustofa, Ali. 2007. Sistem Pengenalan Penutur dengan Metode Mel-
frequency Wrapping. Malang : Teknik Elektro Universitas Brawijaya.
[11] Nurunnadifah, Liliek. 2012. Perancangan Aplikasi Mesin Pencari Judul
Lagu MP3 dengan Input Suara Piano Menggunakan Metode JST-SOM.
[12] Manipulated wav fikes. http://aldiena.qweinborn.co.cc/2010/11/mengenal-
berbagai -jenis-format-file.html. Diakses pada tanggal 18 September 2013
pukul 17.11
[13] Adipranata, Rudi.,Resmana.1999.Pengenalan Suara Manusia Dengan
Metode LPC dan Jaringan Sarang Tiruan Propagasi Balik.Surabaya :
Universitas Kristen Petra.
xvi
xvii