Anda di halaman 1dari 9

Tugas Akhir - 2014

SIMULASI SISTEM IDENTIFIKASI SUARA MANUSIA MENGGUNAKAN METODE


JARINGAN SARAF TIRUAN SELF ORGANIZING MAPS (SOM)

Roy Cesaro Erari¹, Bambang Hidayat², Ledya Novamizanti³

¹Teknik Telekomunikasi, Fakultas Teknik Elektro, Universitas Telkom

Abstrak
Suara manusia memiliki karakteristik yang berbeda-beda antara satu dengan yang lain,
karakteristik yang membedakan berupa keunikan dari kontrol dan pengucapan lafal. Ciri tersebut
yang menjadi dasar identifikasi atau pengenalan dari masing-masing individu. Fungsinya untuk
sistem keamanan dengan mengenali identitas seseorang. Pengenalan melalui pendengaran
manusia terkadang tidaklah mudah dilakukan karena berbagai keterbatasan. Sehingga
dibutuhkan suatu sistem yang yang dapat menganalisis suara dari manusia untuk membedakan
antar individu tersebut.
Dalam tugas akhir ini, telah dirancang dan direalisasikan suatu sistem yang dapat
mengidentifikasi suara manusia dengan metode JST-SOM, di mana sistem tersebut dapat
mengenali, membandingkan dan mencocokkan pola suara masukan sistem dengan pola suara
yang telah disimpan dalam memori secara otomatis. Sistem mengekstrasi parameter suara
manusia menggunakan metode Mel Frequency Cepstral Coefficient (MFCC).
Sistem ini menggunakan suara manusia sebagai sinyal input. Di mana sinyal input tersebut diolah
menggunakan piranti lunak MATLAB R2009a. Adapun parameter yang diukur adalah perubahan
parameter dari ekstrasi ciri MFCC dan JST SOM. Hasil terbaik diperoleh dengan tingkat akurasi
mencapai 96% pada pengujian dengan nilai melbank filter 64 dan nilai epoch 300. Data latih yang
digunakan sebanyak 300 sampel dan data uji yang digunakan juga sebanyak 300 sampel, di mana
data uji bukan termasuk ke dalam data latih. Simulasi yang dilakukan telah berhasil untuk
mengidentifikasi individu berdasarkan pengucapan huruf vokal /a/, /i/, /u/, /e/, /o/ dan kata /aku/
yang diucapkan (text dependent).

Kata Kunci : suara, identifikasi, Mel Frequency Cepstral Coefficient, JST-SOM, MATLAB, text
dependent

Abstract
The human voice has different characteristics with each other, a characteristic that distinguishes
the uniqueness of control and pronunciation. The characteristics which to base the identification
or recognition of each individual. The system function for the security to identify person.
Introduction through human hearing is sometimes not easy to do because of various limitations.
For that reason, need a system that can analyze the sound of the human to distinguish between
them.
In this thesis , has been designed and realized a system that can identify people with JST - SOM
method, which the system can identify, compare and match the pattern of the input sound with
sound patterns that have been stored in memory automatically. Systems of human voice
parameters extracted using the Mel Frequency Cepstral Coefficient ( MFCC ).
This system uses the human voice as an input signal. Where the input signal is processed using
MATLAB R2009a software. The parameters measured were changes in the parameters of the
extraction characteristics of MFCC and neural network SOM. The best results obtained with an
accuracy of 96% on a test with a value of melbank filter 64 and a value of epoch 300. The data
used to train as many as 300 samples and test data are used as well as 300 samples, in which test
data is not included in the training data. Simulations performed have managed to identify
individuals based on the pronunciation of the vowels /a/, /i/, /u/, /e/, /o/ and the /aku/ word ( text
dependent) .

Keywords : sound , identification , Mel Frequency cepstral Coefficient , JST - SOM , MATLAB , text
dependent

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2014

BAB 1

PENDAHULUAN

1.1 Latar Belakang


Suara dapat menjadi ciri khas yang membedakan antara individu satu
dengan yang lain selain sistem-sistem yang dapat membedakan tiap individu
lainnya, seperti fingerprint recognition (identifikasi pola sidik jari pada setiap
orang), retinal scan (identifikasi berdasarkan pola pembuluh darah pada retina
mata), face recognition (pengenalan seseorang berdasarkan raut dan ekspresi
seseorang dengan kunci utama pada letak mata dan mulut). Dalam pengenalan
atau identifikasi terhadap suara manusia, tidak semua pendengaran manusia
mampu membedakan suara dari masing-masing individu yang dikenalnya.
Kepekaan telinga juga memiliki berbagai keterbatasan dan sensitif terhadap
amplitudo dari suara asal. Oleh karena itu dibutuhkan suatu sistem untuk
mengenali suara manusia tersebut sehingga dapat hasilnya akan tertuju tepat
kepada individu yang dimaksud.
Dalam tugas akhir ini telah dibuat sistem pengenalan dan identifikasi suara
manusia dengan metode jaringan saraf tiruan Self Organizing Maps (SOM)
menggunakan personal computer (PC) dan piranti lunak MATLAB R2009a.
Model JST SOM di sini digunakan bersama-sama dengan metode Mel Frequency
Cepstral Coefficient (MFCC) yang digunakan dalam pemrosesan awal terhadap
ekstraksi ciri dari parameter suara yang direkam. Dengan MFCC frekuensi sinyal
suara akan dipetakan ke dalam skala mel yang logaritmik. Dalam proses
pengambilan data, sampel suara direkam sebelumnya sebagai input untuk
dijadikan database sampel dari sistem, yang kemudian suara uji akan dicuplik dan
kemudian dicocokkan untuk mengenali suara pembicara. Simulasi yang dilakukan
berusaha untuk mengklasifikasikan individu berdasarkan huruf vokal atau kata
yang diucapkan (text dependent). Dari penelitian yang dilakukan sebelumnya
didapatkan fungsi identifikasi suara dijadikan sebagai operasi perintah pada
piranti lunak seperti komputer untuk menjalankan perintah tertentu dan
menggunakan metode yang berbeda dengan metode yang akan dibuat dalam tugas
akhir ini. Di dalam tugas akhir ini juga lebih fokus kepada identifikasi suara

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Tugas Akhir - 2014
BAB 1 PENDAHULUAN

manusia untuk memastikan bahwa hasil dari proses identifikasi dengan tepat
menunjukkan bahwa suara tersebut merupakan suara yang menunjuk individu
tertentu. Manfaat untuk penelitian selanjutnya, sebagai dasar pembuatan sistem
keamanan dan juga dapat dijadikan cara alternatif memastikan individu dalam
suara rekaman telepon pada proses penyadapan yang biasanya dilakukan oleh
intelejen. Metode yang digunakan dalam sistem ini adalah JST-SOM di mana
JST-SOM merupakan jaringan saraf tiruan yang tergolong sebagai unsupervised
learning yang berarti jaringan tersebut melakukan pembelajaran tanpa bimbingan
data input-target, sehingga mampu belajar mandiri. Penggunaannya tidak perlu
merumuskan kaidah atau fungsi tertentu.
Dengan menggunakan metode JST-SOM sistem yang dihasilkan dapat
memberikan akurasi performansi yang lebih baik dibandingkan dengan metode
yang telah digunakan sebelumnya.

1.2 Rumusan Masalah


Rumusan masalah yang menjadi acuan dalam pembuatan tugas akhir ini
adalah :
1. Bagaimana membuat simulasi menggunakan MATLAB untuk
identifikasi suara manusia yang membedakan antara individu satu
dengan yang lainnya menggunakan metode JST-SOM.
2. Bagaimana pengaruh ekstraksi ciri dan parameter lainnya terhadap
ketepatan dari kerja sistem.
3. Bagaimana keakuratan dari metode yang digunakan untuk
mengidentifikasi suara manusia melalui lafal yang diucapkan.
4. Bagaimana pengaruh paramater epoch dalam JST-SOM terhadap
akurasi dari kerja sistem.

1.3 Tujuan
Adapun tujuan dari penelitian untuk Tugas Akhir ini adalah :
1. Membuat simulasi sistem pendeteksi dan identifikasi suara manusia
menggunakan metode JST-SOM.

Simulasi Sistem Identifikasi Suara Manusia Menggunakan Metode 2


Jaringan Saraf Tiruan Self-Organizing Maps (SOM)

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Tugas Akhir - 2014
BAB 1 PENDAHULUAN

2. Mengetahui pengaruh ekstraksi ciri dan parameter lainnya terhadap


ketepatan dari sistem serta mengetahui tingkat keakuratan dari sistem
yang telah dibuat.

1.4 Batasan Masalah


Dalam pembahasannya, Tugas Akhir ini dibatasi pada hal-hal sebagai
berikut:
1. Format penyimpanan file nada adalah format wave (*.wav).
2. Menggunakan frekuensi sampling 8000 Hz.
3. Suara manusia yang menjadi sampel diambil sebanyak 10 sampel suara
pembicara yang berbeda yaitu 5 orang wanita dan 5 orang pria.
4. Suara manusia yang direkam adalah suara manusia normal, dalam arti
tidak sedang dalam kondisi sakit dan diambil pada ruangan yang
tertutup seperti kamar untuk meminimalisir pengaruh dari suara
lainnya.
5. Sistem yang dibuat merupakan sistem yang bekerja dengan tidak real
time dan menggunakan piranti lunak MATLAB R2009a dalam
perancangannya.

1.5 Metode Penelitian


Metode penelitian yang digunakan dalam Tugas Akhir ini adalah :
1. Pengambilan Data Langsung
Bertujuan untuk mendapatkan recording data yang akan berfungsi baik
itu sebagai data sampel maupun data uji dengan merekam secara
langsung.
2. Analisis Performansi
Bertujuan untuk melakukan analisis performansi yang dapat dicapai
oleh sistem.

1.6 Sistematika Penulisan


Penelitian ini disusun menjadi 5 BAB, dengan rincian sebagai berikut :

Simulasi Sistem Identifikasi Suara Manusia Menggunakan Metode 3


Jaringan Saraf Tiruan Self-Organizing Maps (SOM)

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Tugas Akhir - 2014
BAB 1 PENDAHULUAN

BAB I PENDAHULUAN
Bab ini berisi uraian mengenai latar belakang pembuatan Tugas Akhir,
rumusan masalah, tujuan, batasan masalah, metode penelitian dan
sistematika penulisan.
BAB II DASAR TEORI
Berisi tentang dasar teori yang diperlukan serta literatur yang mendukung
dalam tugas akhir ini seperti metode Mel Frequency Cepstral Coefficient
dan JST-SOM.
BAB III PERANCANGAN SISTEM
Membahas tentang sistem dalam Tugas Akhir.
BAB IV PENGUJIAN SISTEM DAN ANALISIS
Menjelaskan dan menganalisis hasil keluaran dari sistem dan performansi
sistem.
BAB V KESIMPULAN DAN SARAN
Berisi simpulan dan saran pengembangan lebih lanjut.

Simulasi Sistem Identifikasi Suara Manusia Menggunakan Metode 4


Jaringan Saraf Tiruan Self-Organizing Maps (SOM)

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2014

BAB 5

KESIMPULAN DAN SARAN

5.1 Kesimpulan

Dari penelitian dan pengujian yang telah dilakukan, dapat diambil beberapa
kesimpulan mengenai sistem identifikasi suara manusia, antara lain sebagai
berikut :
1. Nilai cropping yang cocok dalam sistem ini adalah 0,01.
2. Pengolahan sinyal suara melalui proses MFCC ada parameter yang harus
diperhatikan yaitu melbank filter. Hal ini berpengaruh terhadap tingkat
akurasi yang dihasilkan oleh sistem.
3. Nilai melbank filter yang memberikan tingkat akurasi tertinggi adalah 64
dengan tingkat akurasi tertinggi mencapai 96% pada identifikasi vokal
/a/. Sedangkan tingkat akurasi terendah sebesar 72% pada identifikasi
kata /aku/.
4. Nilai melbank filter yang memberikan tingkat akurasi terendah adalah 31
dengan akurasi yang tertinggi hanya mencapai 74% pada identifikasi
vokal /a/ dan yang paling rendah mencapai persentase 56% pada
identifikasi kata /aku/.
5. Nilai melbank filter 24 memberikan akurasi terburuk dengan yang paling
rendah mencapai 52% pada identifikasi vokal /a/. Namun akurasi
tertinggi masih cukup baik dibandingkan nilai melbank filter 31 yaitu
sebesar 86% pada identifikasi vokal /e/.
6. Pada perubahan nilai epoch JST-SOM dicapai akurasi tertinggi pada nilai
epoch 300 yang mencapai akurasi 96%. Sedangkan nilai epoch yang
memberikan tingkat akurasi terburuk adalah 100 dengan akurasi hanya
mencapai 38%.
7. Sistem ini cukup handal dalam mengidentifikasi suara manusia yang data
inputnya diminimalisir adanya noise pada saat pencuplikan data.

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Tugas Akhir - 2014
BAB 5 KESIMPULAN DAN SARAN

5.2 Saran

1. Melakukan variasi perubahan parameter lainnya baik dalam tahap


ekstraksi ciri maupun identifikasi sehingga didapat tingkat akurasi yang
lebih variatif untuk performansi sistem.
2. Sistem dapat dikembangkan menjadi sistem untuk identifikasi suara
manusia secara real time sehingga dapat diaplikasikan ke sistem deteksi
maupun otentifikasi.
3. Sistem dapat dikembangkan dengan melakukan penambahan dan
permasalahan adanya noise lebih untuk menguji kehandalan sistem yang
dibuat.

Simulasi Sistem Identifikasi Suara Manusia Menggunakan Metode


Jaringan Saraf Tiruan Self-Organizing Maps (SOM)
49

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Powered by TCPDF (www.tcpdf.org)
Tugas Akhir - 2014

DAFTAR PUSTAKA

[1] http://id.wikipedia.org/wiki/Transformasi_Fourier_cepat. Diakses pada


tanggal 21 Maret 2011, pukul 22.47

[2] http://id.wikipedia.org/wiki/suara. Diakses pada tanggal 21 Maret 2011,


pukul 22.47

[3] http://www.ittelkom.ac.id/library/index/self-organizing-maps-som.
Diakses pada tanggal 21 Maret 2011, pukul 22.47

[4] http://digilib.itb.ac.id/gdl.php?mod=browse&op=read&id=jbptitbpp-gdl-
fenikhairu-32417. Diakses pada tanggal 10 Mei 2011, pukul 22.08

[5] http://www.scribd.com/doc/30855434/Forensic-speaker-identification.
Diakses pada tanggal 10 Mei 2011, pukul 22.08

[6] Fausett, Laurene. Fundamentals Of Neural Network. Englewood Cliffs,


New Jersey : Prentice-Hall.Inc., 1994.

[7] Rabiner, L.R., Juang, B.H. Fundamentals Of Speech Recognition.


Englewood Cliffs, New Jersey : Prentice-Hall.Inc., 1993.

[8] Kusumadewi, Sri. 2004. Membangun Jaringan Syaraf Tiruan


Menggunakan MATLAB & EXCEL LINK. Yogyakarta : Graha Ilmu.

[9] Suyanto, ST, MSc. 2011. Artifcial Intelligence. Bandung : Informatika.

[10] Mustofa, Ali. 2007. Sistem Pengenalan Penutur dengan Metode Mel-
frequency Wrapping. Malang : Teknik Elektro Universitas Brawijaya.
[11] Nurunnadifah, Liliek. 2012. Perancangan Aplikasi Mesin Pencari Judul
Lagu MP3 dengan Input Suara Piano Menggunakan Metode JST-SOM.
[12] Manipulated wav fikes. http://aldiena.qweinborn.co.cc/2010/11/mengenal-
berbagai -jenis-format-file.html. Diakses pada tanggal 18 September 2013
pukul 17.11
[13] Adipranata, Rudi.,Resmana.1999.Pengenalan Suara Manusia Dengan
Metode LPC dan Jaringan Sarang Tiruan Propagasi Balik.Surabaya :
Universitas Kristen Petra.

xvi

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Tugas Akhir - 2014

[14] Hernawan, Mochdiana. 2011.Simulasi Kompresi Citra dengan Neural


Network Menggunakan Metode Self-Organizing Map.Semarang : Jurusan
Teknik Elektro Undip.
[15] Chakraborty, Dipanjan. K-Nearest Neighbor Learning. Slide.
[16] Novamizanti, Ledya. 2009. Identifikasi Pola Iris Mata Menggunakan
Transformasi Wavelet dan Levenshtein Distance. Bandung : IT TELKOM.
[17] Michel Misiti, Yves Misiti, Georges Oppenheim, Jean-Michel Poggi.
2010. Wavelet ToolboxTM 4 User’s Guide. Manualslib.
[18] Campbell, Jr. J.P. Speaker Recognition: A Tutorial. Proceedings of The
IEEE, 85 (9). 1437-1461.

xvii

Fakultas Teknik Elektro Program Studi S1 Teknik Telekomunikasi


Powered by TCPDF (www.tcpdf.org)

Anda mungkin juga menyukai