Anda di halaman 1dari 9

Agustini, Biometrik Suara Dengan Transformasi Wavelet 49

BIOMETRIK SUARA DENGAN TRANSFORMASI


WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

Ketut Agustini(1)

Abstract: Biometric as one of identification or recognition person techniques that based on uniquely part
of human body. Voice one of uniquely human has. Voice signal that come out from different speakers give
different voice pattern. Because of high variations used neural network (NNW)for matching the patterns.
Before voice data is processed using NNW it’s processed using digital processed through feature extrac-
tion phase using discrit wavelet orthogonal base 4 orders with 10 and 15 decomposition rate. The result of
NNW is processed by model decision maker that determine speaker identification. The result of experi-
ment shows system biometric built can identify as high as 86%

Keywords: Voice Biometric, Wavelet Transformation, Orthogonal Daubenchies, NNW, Decomposition


Rate

.
Biometrik merupakan studi tentang metode suatu alat identifikasi seperti pada teknik konven-
otomatis untuk mengenali atau mengidentifikasi sional.
manusia berdasarkan satu atau lebih bagian tubuh Proses biometrik (selanjutnya menggunakan
manusia atau kelakuan dari manusia itu sendiri. kata “identifikasi”) dengan suara memiliki
Dalam dunia teknologi informasi, biometrik relevan keunggulan secara ekonomis dibandingkan dengan
dengan teknologi yang digunakan untuk mengana- karakteristik yang lain. Identifikasi dengan suara
lisa fisik dan kelakuan manusia untuk autentifi- hanya membutuhkan alat tambahan berupa mikrofon
kasi. Contohnya dalam pengenalan fisik manusia dan kartu suara, sedangkan karakteristik-karakteristik
yaitu dengan pengenalan sidik jari, retina, iris, yang lain misalnya sidik jari atau wajah mem-
pola dari wajah (facial patterns), tanda tangan butuhkan alat tambahan seperti scanner. Hal ini
dan cara mengetik (typing patterns) serta suara. sedikit banyak dapat menekan biaya pengembangan
Beberapa hal yang mendorong penggunaan iden- sistem.
tifikasi secara biometrik adalah biometrik bersifat Identifikasi melalui suara termasuk dalam
universal (terdapat pada setiap orang), unik (tiap masalah nonalgorithmic (Fu, 1994). Walaupun sirkuit
orang mempunyai ciri khas tersendiri), dan tidak digital (komputer) mempunyai kecepatan yang jauh
mudah dipalsukan (Xafopoulos, 2001). Dengan lebih tinggi daripada otak manusia tetapi dalam
teknik biometrik seseorang tidak harus membawa memproses masalah-masalah nonalgorithmic otak
(1)
Ketut Agustini,Manajemen Informatika Fakultas PTK Undiksha Singaraja, Kampus Tengah Jl. Udayana Singaraja, Email:
adisti_cecilia@yahoo.com
50 GEMATEK JURNAL TEKNIK KOMPUTER, VOLUME 9 NOMOR 2, SEPTEMBER 2007

manusia lebih unggul. Suatu teknik yang dibuat memberikan informasi sinyal dalam domain waktu
dengan memodelkan otak manusia adalah Jaringan dan frekuensi secara bersamaan dan mengana-
Syaraf Tiruan (JST) atau artificial neural network. lisis sinyal yang tidak stationer, untuk itu ingin
Seperti pada otak manusia, JST terdiri atas neuron- dikembangkan suatu konsep atau pendekatan lain
neuron yang saling berhubungan yang dapat bekerja dalam pemrosesan sinyal tanpa berbasiskan trans-
sama satu dengan yang lainnya untuk membentuk formasi fourier yaitu dengan transformasi wa- velet.
suatu sistem. Jaringan syaraf tiruan dapat belajar Transformasi Wavelet merupakan sarana yang
untuk mengenali suatu pola melalui pembelajaran mulai populer untuk pemrosesan sinyal, seperti citra
dan diharapkan dapat memecahkan masalah-masalah dan suara, dan transformasi ini belum banyak
yang bersifat nonalgorithmic. diaplikasikan untuk analisis suara, khususnya untuk
Penelitian mengenai identifikasi pembicara identifikasi pembicara menggunakan teks berba-
telah banyak dilakukan dengan berbagai metode hasa Indonesia. Dalam praktek, Transformasi
pem-rosesan sinyal, seperti Linier Prediction Coding Wavelet digunakan untuk ekstraksi ciri dalam
(LPC), Mel Frequency Cepstrum Coefficients sistem pengenalan suara karena mempunyai ka-
(MFCC), Neural Predictive Coding (NPC), dan rakter khusus yang sesuai untuk analisis sinyal,
sebagainya, yang mana keseluruhan metode diatas termasuk sinyal suara. Transformasi wavelet
berbasiskan Transformasi Fourier, dan tingkat sinyal suara menghasilkan resolusi waktu yang
identifikasinya telah mencapai 100%, berikut ada- baik pada frekuensi tinggi dalam menentukan
lah metode-metode yang telah diterapkan de- lokasi awal suara dan parameterisasi ciri suara du-
ngan tingkat identifikasi yang telah dicapainya, rasi pendek serta mampu menganalisis sinyal dis-
dituangkan dalam bentuk Tabel 1 (Chetouani, kontinu (non stationary) secara akurat (Krisnan,
2004). 1994).
Pengenalan pembicara dapat diklasifikasikan ke
Tabel 1 Metode-metode yang Digunakan Penelitian
dalam tiga tahap yaitu identifikasi, deteksi dan
Sebelumnya
verifikasi. Identifikasi pembicara merupakan proses
Metode pemrosesan sinyal suara Tingkat
identifikasi untuk menentukan identitas pembicara melalui suara
(%) yang telah diucapkan, sedangkan deteksi pembicara
LPC (Linier Predictive Coding) 90.61
LPCC 96.73 merupakan proses penemuan suara pembicara dari
MFCC (Mel Frequency Cepstrum 97.55 sekumpulan suara, dan verifikasi pembicara
Coefficient)
PLP 86.12 merupakan proses untuk memverifikasi kesesuaian
NPC (random initialization) 61.63 suara pembicara dengan identitas yang diklaim oleh
NPC (linier initialization) 100
pembicara. Pengenalan pembicara lebih meni-
Sumber: Universite Pierre&MarieCurie, LA Science A Paris,
2004 tikberatkan pada pengenalan suara pembicara dan
tidak pada pengenalan ucapan pembicara (Ho,
Namun, masih banyak kelemahan yang dimiliki 1998) .
transformasi fourier diantaranya, kurang mampu
Agustini, Biometrik Suara Dengan Transformasi Wavelet 51

Metode identifikasi pembicara yang merupakan sesi pendaftaran (enrollment sessions) atau fase
bagian dari pengenalan pembicara (Gambar 1), dapat training, sedangkan yang kedua menunjukkan sesi
dibagi ke dalam metode text-independent dan text- operasi atau fase testing. Di dalam fase training, tiap
dependent. Pada sistem text-independent, model pembicara yang telah terdaftar memasukkan contoh
pembicara meng-capture karakteristik ucapan (sampel) suaranya sehingga sistem dapat mulai
seseorang melalui sinyal ucapan dengan menga- dibangun atau dilatih berdasarkan reference model
baikan apa yang diucapkannya, dalam artian kata- pembicara tadi.
kata yang diucapkan sembarang (bebas). Sebaliknya Secara umum sistem identifikasi pembicara
pada sistem text-dependent, pengenalan identitas mempunyai tahapan sebagai berikut dengan dia-
pembicaranya didasarkan pada ucapan seseorang gram bloknya diilustrasikan pada Gambar 2
dengan kata-kata yang spesifik atau telah disepakati, (Campbell,1997), (a) akuisisi data suara digital, yaitu
seperti password, card numbers, kode PIN dan proses untuk mengakuisisi ucapan pembicara (dalam
sebagainya (Mudry,1997) . sinyal analog) dan mengubahnya menjadi sinyal
digital. Sinyal digital yang terbentuk berupa suatu
Text to Speech
vektor yang merepresentasikan suara pembicara, (b)
Pengenalan Ucapan
(Speech Recognition) frame blocking dan windowing, yaitu frame blocking
Speech to Text
Teks tertentu merupakan proses segmentasi sinyal suara digital
Pengenalan Bahasa (Text-Dependent)
(Language Recognition) Identifikasi Pembicara
Sinyal ucapan
(Speaker Identification)
Teks Bebas
yang telah diakuisisi ke dalam durasi tertentu,
(Text-Independent )
Pengenalan Pembicara
(Speaker Recognition)
Deteksi Pembicara
(Speaker Detection)
sedangkan frame windowing adalah proses yang
Verifikasi Pembicara bertujuan untuk meminimalkan diskontinuitas (non-
(Speaker Verification)

stationary) sinyal pada bagian awal dan akhir sinyal


Gambar 1 Klasifikasi Sistem Pengolahan Sinyal Suara suara, (c) ekstraksi ciri (feature extraction), yaitu
mengekstrak data hasil akuisisi sehingga dihasilkan
Semua sistem identifikasi pembicara melalui data yang berdimensi lebih kecil tanpa merubah
dua proses penting yaitu feature extraction dan karakteristik sinyal suara, (d) pembentukan model
feature matching. Feature extraction merupakan referensi pembicara, merupakan tahapan pembe-
proses mengekstraksi data hasil akuisisi sehingga lajaran dan akan membentuk suatu model referensi
dihasilkan data yang berdimensi lebih kecil, yang agar sistem dapat mengenali pembicara. Tahap ini
nantinya digunakan untuk merepresentasikan tiap- memerlukan data berupa vektor-vektor ciri hasil dari
tiap pembicara. Feature matching menyangkut ekstraksi ciri yang mencakup seluruh pembicara,
prosedur aktual yang mengidentifikasi pembicara model referensi yang terbentuk akan digunakan dalam
yang tidak dikenal dan membandingkan fitur pencocokan pola, pembentukan model referensi
ekstraksi suara yang dimasukan dengan salah satu pembicara merupakan tahapan khusus yang dila-
dari himpunan pembicara yang telah dikenal. kukan pada waktu awal sebelum sistem siap
Sistem Identifikasi pembicara juga menyajikan digunakan, tahap ini hanya dilakukan sekali dan
dua sesi yang berbeda, yang pertama menunjukkan setelah dilakukan maka sistem siap untuk digunakan,
52 GEMATEK JURNAL TEKNIK KOMPUTER, VOLUME 9 NOMOR 2, SEPTEMBER 2007

(e) pencocokan pola (pattern matching), yaitu proses dibangun menggunakan transformasi wavelet
pencocokan pola dengan menerima data yang telah berbasis orthogonal daubenchies, (2) diimple-
diolah oleh ekstrasi ciri sebagai data input, proses mentasikannya model prototipe sistem biometrik
tersebut akan mencocokan pola data masukan (input) suara yang dibangun menggunakan transformasi
dengan model referensi dan akan memberikan hasil wavelet berbasis orthogonal daubenchies serta 3).
berupa besarnya skor kesesuaian data input dengan Diperolehnya tingkat identifikasi (generlisasi)
pola-pola referensi yang ada, (f) Pembuatan kepu- tertinggi yang dicapai dari sistem biometrik suara
tusan yaitu yang akan menerima skor hasil penco- yang dibangun menggunakan transformasi wavelet
cokan pola. Pada sistem identifikasi, pembuatan berbasis orthogonal daubenchies.
keputusan akan menentukan identitas pembicara. Penelitian ini diharapkan dapat digunakan
Seperti terlihat pada Gambar 2. untuk melakukan identifikasi seseorang melalui kata-
kata yang diucapkan orang tersebut. Hasil yang
diberikan pada identifikasi berupa identitas pengguna
Pembicara sistem. Sistem ini antara lain bermanfaat untuk
Blocking dan suara vektor Pencocokan skor Pembuatan
Ekstraksi ciri

melakukan identifikasi semacam aplikasi absensi,


windowing digital feature pola Keputusan

Identitas

kontrol akses untuk fasilitas tertentu, remote akses


Pendaftaran pembicara
Model referensi
(enrollment)
pembelajaran pembelajaran

untuk jaringan komputer, forensik, dan lain-lain, serta


Gambar 2 Tahapan Identifikasi Pembicara
untuk pengembangan ilmu pengetahuan khususnya
Berdasarkan latar belakang diatas, maka dalam pengolahan sinyal suara.
rumusan pertanyaan pada penelitian ini adalah
“Bagaimanakah rancangan model prototipe sistem Metode Penelitian
biometrik suara yang dibangun menggunakan Perancangan model sistem dibangun untuk
transformasi wavelet berbasis orthogonal memudahkan pengguna di dalam pengolahan data
daubenchies?”, “bagaimanakah implementasi model dan melihat hasil yang diperoleh dari model sistem
prototype sistem biometrik suara yang dibangun tersebut. Sistem yang akan dikembangkan disajikan
menggunakan transformasi wavelet berbasis pada Gambar 3. Sistem tersebut terbagi ke dalam
orthogonal daubenchies?”, dan “Berapakah tingkat tiga modul yaitu modul perekaman, modul training
identifikasi (generalisasi) tertinggi yang dicapai dari (pelatihan), dan modul testing (pengujian)
sistem biometrik suara yang dibangun mengguna-
kan transformasi wavelet berbasis orthogonal M odul Perekaman Pengguna

daubenchies?”.
Pada dasarnya tujuan dari penelitian ini adalah D ata hasil
perekam an
Antar m uka

(100 data)
untuk mendapatkan jawaban dari pertanyaan
50 data T esting
penelitian yang telah dirumuskan diatas. Sehingga T raining
identifikasi

tujuan penelitian ini adalah (1) diperolehnya ran- 50 data

cangan model prototipe sistem biometrik suara yang Gambar 3 Perancangan Model Sistem
Agustini, Biometrik Suara Dengan Transformasi Wavelet 53

identifikasi. Modul training dan modul testing perekaman yang dilakukan selama 3 detik meng-
identifikasi dalam satu interface atau satu submenu, hasilkan 195 frame. Proses ektraksi ciri pada
sedangkan modul perekaman terdapat dalam penelitian ini, adalah data yang telah terbagi ke dalam
submenu yang berbeda (Gambar 4). Pada modul frame-frame dan telah dikalikan dengan Hamming
perekaman didalamnya terdapat suatu tahapan window. Masing-masing dari proses ekstraksi ciri
praproses (preprocessing) dan data hasil perekaman diatas akan menghasilkan koefisien-koefisien
yang dihasilkan seluruhnya adalah 100 data suara. (koefisien detail dan perkiraan) yang diperoleh dari
hasil dekomposisi pada level 10 dan 15. Pada
penelitian ini koefisien yang diambil sebagai
masukan ke proses selanjutnya adalah koefisien yang
dihasilkan dari frekuensi rendah yaitu koefisien
perkiraan (approximation) karena bagian penting
dari suatu sinyal terletak pada frekuensi tersebut,
yang mampu memberikan identitas dari suatu sinyal.
Gambar 4 Interface dari Modul Perekaman Suara Koefisien yang dihasilkan akan membentuk suatu
vektor. Algoritma berikut adalah untuk mencari
Pengguna sistem akan mengucapkan kata yang koefisien detail dan perkiraan pada proses multiple
telah ditentukan sebelumnya yaitu “Ilmu Komputer”. dekom-posisi:
Data audio yang diperoleh akan diubah menjadi ben- - Sinyal yang masuk difilter ke dalam sinyal
tuk digital (vektor) menggunakan proses sampling frekuensi rendah (low-pass filter) dan sinyal
dengan perangkat lunak MATLAB 7.0.1. Perekaman frekuensi tinggi (high-pass filter)
dilakukan selama 3 detik (1 detik sama dengan 1000 - Lakukan downsampling pada ke dua sinyal
ms) dengan frekuensi sampling 20kHz (dalam 1 detik tersebut
diperoleh data sebanyak 22.050 data). Akuisisi data - Low-pass frekuensi hasil downsampling
dilakukan pada beberapa tahap. Pada tahap pertama selanjutnya melalui proses seperti pada tahap
dilakukan akuisisi data untuk pembelajaran sistem. pertama
Pada tahap kedua akuisisi data dilakukan untuk - Lakukan ulang sampai pada level yang
menguji sistem identifikasi. diinginkan
Dalam penelitian ini menggunakan frame (n) Pembentukan model referensi pembicara dan
dengan lebar waktu 30 ms di mana tiap frame pencocokan pola dilakukan menggunakan JST
menyimpan data sebanyak 661 (hasil pembulatan Propagasi Balik. Arsitektur yang digunakan untuk
dari 661,5) sampel dengan overlap (m) 50%, JST Propagasi Balik adalah Multi Layer Perceptron,
sehingga diperoleh jumlah frame dengan waktu dengan satu lapisan tersembunyi. JST terlebih dahulu
perekaman selama 1 detik sebesar 65 frame (dengan dilatih untuk membentuk model referensi pembicara.
tiap frame mengandung data sebanyak 22050 data). Setelah tahap pembelajaran selesai dilakukan, JST
Dengan diperolehnya dalam 1 detik 65 frame maka dapat digunakan untuk melakukan pencocokan pola.
54 GEMATEK JURNAL TEKNIK KOMPUTER, VOLUME 9 NOMOR 2, SEPTEMBER 2007

Pada proses identifikasi, pembuatan keputusan menghasilkan pengidentifikasian yang lebih akurat,
dilakukan dengan metode nilai maksimum. Jika mengingat sinyal suara sangat terpengaruh (sen-
neuron output ke-n merupakan neuron dengan nilai sitive) terhadap waktu.
maksimum, maka data yang masuk dikenali sebagai Proses Ekstraksi ciri dari Daubenchies orde 4
pembicara ke-n. Sebagai contoh jika neuron pertama (daub4) pada level 10 memberikan hasil tiap satu
pada lapisan output bernilai 1 dan yang lainnya 0, data file (satu file *.wav) pembicara (dari 10 data
maka input diidentifikasi sebagai pembicara pertama. file setiap pembicara) menghasilkan koefisien
Fungsi yang digunakan untuk metode nilai sebanyak 134 elemen dengan elapsed time pra-
maksimum didalam syntax matlab adalah prosesnya rata-rata sebesar 1,061 detik, dan pada saat
Competitive Transfer Function (COMPET). Syntax 50 data suara yang digunakan untuk training
matlab dari penggunaan fungsi tersebut, di mana diproses, membutuhkan waktu 96,479 detik. Dari 50
testing merupakan hasil simulasi dengan jaringan, data suara tersebut akan membentuk suatu matriks
numkenal_test adalah jumlah pola yang dikenal, dan dengan dimensi 134 x 50, yang digunakan sebagai
jum_pola adalah jumlah pola keseluruhan, adalah input untuk proses pembentukan referensi pembicara
sebagai berikut, dan pencocokan pola. Sedangkan pada level 15, satu
hasil_test=compet(ytesting);
file pembicara (dari 10 file setiap pembicara)
numkenal_test=recognize(hasil_test);
menghasilkan koefisien sebanyak 10 elemen dengan
generalisasi_test=numkenal_test/
elapsed time praprosesnya sebesar 1,092 detik,
jum_pola*100 sedangkan untuk 50 data yang digunakan untuk
training menghabiskan waktu sebesar 71,933 detik.
HASIL DAN PEMBAHASAN Pengujian selanjutnya adalah (2) tahap referensi
Pengujian yang telah dilakukan merupakan (1) pembicara dan pencocokan pola dengan
tahap praproses meliputi proses akuisisi data suara menggunakan laju pembelajaran 0.01 dan 0.3 serta
digital, proses frame blocking dan windowing, serta toleransi galat sebesar 0.00001, mencapai
proses ekstraksi ciri dengan wavelet tipe orthogonal kekonvergenan pada epoch ke-555 dengan waktu
yaitu Daubenchies dengan orde 4 pada level 10 dan 8.07 detik dan mean square error-nya sebesar
15. Pada proses akuisisi data suara digital dan proses 9.99238 X 10-6, (Gambar 5).
frame blocking serta windowing, kombinasi suara
yang digunakan dengan lamanya durasi perekaman,
memberikan hasil untuk tiap data suara berupa
vektor, dengan dimensi 66.150 (22.050 x 3). Jumlah
pembicara yang diambil sebagai data training adalah
50 (lima puluh) data suara yang dipilih dengan index
ganjil dari 100 (seratus) data hasil perekaman,
kemudian sisanya dengan index genap digunakan
Gambar 5 Proses Pembelajaran Daubenchies Orde 4 Level
untuk data test identifikasi. Hal ini dilakukan agar 10
Agustini, Biometrik Suara Dengan Transformasi Wavelet 55

Generalisasi yang dihasilkan terhadap data setelah disimulasikan. Hasil keseluruhan pengujian
testing sebesar 86% (43 pembicara dari 50 data identifikasi ditunjukkan dalam Tabel 2. Dari
pembicara dikenali). Hal ini terlihat pada Gambar keseluruhan hasil, terlihat bahwa laju pembelajaran
6, yang menunjukkan perbandingan antara target JST 0.3 memberikan tingkat generalisasi yang lebih baik
dengan output yang dihasilkan dari data testing dibandingkan dengan laju pembelajaran 0.01.
Dengan metode trial and error dalam menentukan
besarnya neuron tersembunyi, maka diperoleh hasil
terbaik pada banyaknya neuron tersembunyi 10 dan
waktu proses tersingkat yaitu 6,98 detik dengan
tingkat generalisasi tertinggi 86%.
Pada percobaan yang dilakukan terhadap
wavelet tipe Daub4 level 15, dengan laju pem-
belajaran 0.3 dan neuron tersembunyi 80 mem-
berikan tingkat pengenalan yang paling baik, namun
proses pembelajarannya berjalan sangat lambat dan
kinerja tujuannya (10-5) secara keseluruhan belum
Gambar 6 Hasil Simulasi Data Pengujian Pada Epoch ke-
555 tercapai. Generalisasi terbaik yang dicapai yaitu

Tabel 2 Hasil Pengujian Identifikasi db4 Level 10 dengan err = 0.00001

Pembelajaran Pengujian Wkt


Neuron Mse Di-indentifikasi dg Generalisasi proses
Lr epoch
tersembunyi x 10-6 benar (%) (dt)
0.3 555 9.992 43/50 86 6.98
10
0.01 935 9.922 41/50 82 16.424
0.3 598 9.989 42/50 84 8.022
20
0.01 633 9.818 42/50 84 8.582
0.3 603 9.879 41/50 82 8.722
30
0.01 635 9.938 40/50 80 9.063
0.3 660 9.980 41/50 82 10.065
40
0.01 575 9.860 40/50 80 8.793
0.3 688 9.915 42/50 84 11.366
50
0.01 833 9.654 41/50 82 13.380
0.3 642 9.882 41/50 82 11.336
60
0.01 860 9.893 42/50 84 14.851
0.3 800 9.954 41/50 82 14.611
70
0.01 915 9.953 42/50 84 16.574
0.3 777 9.731 41/50 82 15.012
80
0.01 810 9.977 41/50 82 16.173
0.3 764 9.878 41/50 82 15.612
90
0.01 810 9.813 42/50 84 16.694
0.3 888 9.900 42/50 84 19.107
100
0.01 986 9.714 42/50 84 20.850
Sumber: Hasil Percobaan
56 GEMATEK JURNAL TEKNIK KOMPUTER, VOLUME 9 NOMOR 2, SEPTEMBER 2007

84%, menurun dibandingkan dengan Daub4 level 10 RUJUKAN


yang memiliki koefisien lebih banyak. Burrus, CS, Gopinath, RA, and Guo, H. 1998. Introduction
to Wavelets and Wavelet Transforms A Primer.
Hal ini menunjukkan bahwa untuk proses International Edition. New Jersey: Prentice-Hall
ekstraksi ciri menggunakan metode Transformasi International, Inc.
Campbell, JPJR. 1997. Speaker Recognition: A Tutorial.
Wavelet, teori yang menyatakan “semakin besar Proc. IEEE, vol.85, no 9, pp1437-1462.
jumlah input yang diterima maka semakin besar pula Fausett, L. 1994. Fundamentals of Neural Network.
Englewood Cliffs. New Jersey: Prentice Hall.
waktu pembelajaran yang dibutuhkan JST “, kurang Fu, L. 1994. Neural Network in Computer Intelligence,
berkenaan terhadap kasus ini, karena semakin tinggi Singapore: McGraw-Hill.
Gonzalez RC, and Wood, RE. 2002. Digital Image
tingkat (level) dekomposisi, yang berimplikasi Processing, Second Edition, New Jersey: Prentice
terhadap jumlah koefisiennya (koefisien yang Hall, Inc.
Ho, CE. 1998. Speaker Recognition System, Project
dihasilkan semakin tereduksi) maka proses Report. California: California Institut of
pembelajaran JST berjalan sangat lambat dan Technology.
Jang, JSR, Sun, CT, and Mizutani, E. 1997. Neuro Fuzzy
menurunkan tingkat pengenalan jaringannya (dapat and Soft Computing, A Computational Approach
ditunjukkan pada hasil generalisasi). to Learning and Machine Intelligence. International
Edition. New Jersey: Prentice-Hall International
Inc.
SIMPULAN Krishnan, M, Neophytou, CP, and Prescott, G. 1994.
Transformasi Wavelet berbasis orthogonal Wavelet Transform Speech Recognition Using
Vector Quantization, Dynamic Time Warping and
daubenchies dapat digunakan dalam proses iden- Artificial Neural Networks, Lawrence, KS
tifikasi pembicara pada bagian pemrosesan awal 66045:Center of excellence in computer aided
systems engineering and Telecominication &
(praproses) sinyal untuk mendapatkan informasi Information Sciences Laboratory 2291 Irving Hill
(ciri) sinyal tersebut. Sistem identifikasi pada tahap Drive.
Mallat, S. 1999. A Wavelet Tour Of Signal Processing,
praproses Daub4 level 10 menghasilkan tingkat Second Edition, Academic Press 24-28 Oval Road,
generalisasi tertinggi sebesar 86%. Pada transformasi London NW1 7DX UK, http://www.hbuk.co.uk/ap/
Mudry, AH. 1997. Speaker Identification using Wavelet
wavelet, tingkat (level) dekomposisi mempengaruhi Transform, Tesis Master of Engineering, Ontario:
tingkat pengenalan jaringan yaitu makin tinggi Ottawa-Carleton Institut of Electrical Engineering.
Proakis, JG, dan Manolakis, DG. 1997. Pemrosesan Sinyal
tingkat dekomposisi maka tingkat pengenalan Digital, edisi Bahasa Indonesia jilid 1, Jakarta:
jaringan semakin menurun. Jaringan syaraf tiruan Prenhallindo.
Rabiner, LR, Juang BH. 1993. Fundamentals of Speech
propagasi balik baik digunakan untuk pembentukan Recognition. New Jersey: Prentice Hall. ISBN 0-
referensi pembicara dan pencocokan pola. 13-015157-2.
Xafopoulos, A. 2001. Speaker Verification (an overview),
TUT-TICSP presentation, TICSP (Tampere
International Center for Signal Processing),
Tempere: TUT (Tampere Univ).

Anda mungkin juga menyukai