Anda di halaman 1dari 11

REVIEW PAPER

Using Hierarchical Time Series Clustering Algorithm and Wavelet Classifier for Biometric Voice Classification
Simon Fong Department of Computer and Information Science, University of Macau, Taipa, Macau Correspondence should be addressed to Simon Fong, ccfong@umac.mo Received 22 December 2011; Accepted 25 December 2011 Academic Editor: Sabah Mohammed

A. PENDAHULUAN Di dalam paper yang saya review menjelaskan bagaimana mengklasifikasikan suara, dengan klasifikasi suara ini dapat menentukan etnis, jenis kelamin, kewarganegaraan, dan lain sebagainya. Pengklasifikasian ini menggunakan metode time series dan wavelet classifier. Seperti yang sudah kita ketahui suara sudah banyak digunakan di dalam system biosekuriti atau bisa kita sebut system keamanan yang menggunakan karakteristik dari tubuh manusia. Biometrika suara atau voice biometric biasanya digunakan di dalam identifikasi suara (voice identification) dan verifikasi suara (voice verification). Sebelumnya kita akan membahas apa itu biometrika suara (voice biometric). Biometrika suara adalah pengukuran dengan menggunakan suara manusia. Biometrika suara sesungguhnya merupakan kombinasi dari karakteristik fisiologis dan tingkah laku. Mulut, rongga hidung, bibir, gigi dan bagian bagian pembentuk suara yang lain merupakan karakteristik fisiologis (fisik) yang berkaitan, sedangkan bagaimana seseorang mengeluarkan suaranya dan tekanan udara yang bervariasi sepanjang waktu pembicaraan merupakan karakteristik tingkah laku. Time series clustering adalah pengelompokkan urutan titik data, biasanya data ini diukur pada titik titik yang berurutan dan dalam interval waktu yang sama. B. PENGENALAN Voice biometric banyak digunakan di dalam keamanan identifikasi biometric dan verifikasi biometric. Dalam verifikasi suara atau voice verification, system aplikasi suara mencocokkan inputan rekaman suara (voiceprint) dengan suara

yang ada di database aplikasi. Jadi sebelumnya aplikasi memiliki sample suara yang disimpan di database, ketika ada voiceprint, maka akan dilakukan pengecekan secara one to one dengn suara yang ada di database. Berbeda halnya dengan identifikasi suara, voice identification menggunakan system pengecekan one to many dimana suara yang diidentifikasi tidak diketahui sebelumnya, sehingga pengecekan dilakukan diseluruh database hingga menemukan kecocokan dari sample yang diketahui. Dapat dilihat pada gambar 1.

Gambar 1. Sistem Kerja Voice Verification dan Voice Identification

Gambar 2. Contoh dari Voice Biometric System yang berkompromi dan yang benar benar dilindungi (Secured)

Dapat dilihat pada gambar 2 voice biometric compromised dimodivikasi dengan voiceprint lain (A) yang memiliki otoritas akses yang lebih tinggi. Hal itu dapat dilakukan dengan menginsert fitur vocal dari A ke B. karena database voiceprint dienkripsi dan daftar password dapat diakses secara individual, setiap voiceprint dilindungi secara independen, sehingga memungkinkan adanya dua voiceprint

yang sama namun tidak terdeteksi. Jadi seorang penipu, misalnya B bisa memperoleh akses terbatas, dengan mencocokkan B ke A dalam system voice identification. Hal ini dapat diatasi dengan voice classification dengan memriksa berapa banyak item yang unik ada di suatu kelompok yang berbeda. C. MODEL USULAN Model yang digunakan bertujuan untuk mendapatkan kerangka klasifikasi. Keuntungan dari kerangka klasifikasi ini adalah dapat diterapkan di berbagai aplikasi yang memanfaatkan klasifikasi suara. Inputan suara yang belum diketahui sebelumnya akan dikelompokkan berdasarkan karakteristik yang dimilikinya. Suara dikumpulkan di gelombang dan akan direkam dalam format time series. Dalam dataset dikumpulkan identitas speaker yang tidak diketahui, sample suara ini dikelompokkan dengan menggunakan algoritma clustering. Pengelompokn dilakukan berdasarkan karakteristik sample suara, misalkan klasifikasi yang muncul seperti jenis kelamin, latar belakang etnis, dan lain sebaginya.

Gambar 3. Proses Klasifikasi Suara

Gambar 3 merupakan proses klasifikasi suara menggunakan hirarki clustering. Suara suara yang masuk diasumsikan terdistorsi dan tidak bercampur. Hirarki

clustering diterapkan karena memberikan struktur berlapis yang sebelumnya suara tidak diketahui dalam resolusi yang berbeda. D. DESAIN HIRARKI TIME SERIES ALGORITMA CLUSTERING Dalam penelitian paper ini data time series dikelompokkan berdasarkan kesamaan gelombang. Untuk menemukan keselarasan antara dua titik data time series menggunakan fungsi dynamic time warping (DTW).

Gambar 4 Visualisasi Plot Time Series dengan 3 Pembicara berbeda yang Mengucapkan Vokal Jepang yang Sama

E. PERCOBAAN 1. Dataset Tiap gelombang ditandai dengan 60 koefisien, setiap kelompok yang berbeda memiliki 100 sample dan total ada 600 sample dataset. Setiap kelas memiliki gelombang yang unik. 6 kelas mewakili 6 jenis speaker yang memiliki voiceprint berbeda.

Gambar 5. Sample Time Series yang Dihasilkan oleh Vokal Jepang

2. Perbandingan Data sintetis sample pertama memiliki perbandingan sebesar 10%. DTW yang berfungsi sebagai fungsi kesamaan tertanam dalam algoritma cluster untuk memproses data time series.

Gambar 6. (a) Enam kelompok karakteristik pada dendrogram dengan menggunakan fungsi kesamaan DTW. (b) Nomor baris sesuai dataset pada dendrogram dengan menggunakan fungsi kesamaan DTW

Gambar 7. (a) Enam kelompok karakteristik pada dendrogram dengan menggunakan fungsi kesamaan Euclidean. (b) Nomor baris sesuai dataset pada dendrogram dengan menggunakan fungsi kesamaan Euclidean.

Gambar 8 perbandingan dendrogram yang dihasilkan oleh DTW dan fungsi masingmasing kesamaan Euclidean

Penelitian ini menegaskan bahwa DTW cocok untuk pengelompokan time series.

Gambar 9 (a) Atribut Time Series Suara (b) Perubahan Atribut yang Disebut Koefisien Haar dari Wavelet Time Series.

Tabel 1 Akurasi klasifikasi dengan dua dataset

Gambar 10 Pohon Keputusan (a) Menggunakan Time Series Asli (b) Menggunakan Transform Wavelet

F. KESIMPULAN Klasifikasi suara menjadi teknik yang mendasari untuk memantau pembicara dari telepon / panggilan web, aplikasi ini memiliki tingkat keamanan yang tinggi. Time series dapat dikelompokkan di dalam cluster yang berbeda, sama halnya dengan suara yang tidak diketahui dapat dikelompokkan sesuai dengan

karakteristik mereka. Setelah wavelet mengubah sample time series ke dalam domain frekuensi, hal ini menunjukkan bahwa meningkatnya kinerja akurai dalam pohon keputusan. G. KELEBIHAN MENGGUNAKAN TIME SERIES CLUSTERING DAN WAVELET CLASIFFIER Hasil akhir dari metode ini dapat menghasilkan 2 jenis pohon keputusan. Pohon keputusan yang pertama dihasilkan dari time series, dan yang kedua dihasilkan dari wavelet classifier. Dari 2 keputusan ini semakin meningkatkan akurasi dan keamanan dari aplikasi voice biometric. Sehingga voice classification ini dapat digunakan di dalam voice identification maupun voice verification. H. KELEMAHAN MENGGUNAKAN TIME SERIES CLUSTERING DAN WAVELET CLASIFFIER Dalam metode ini, jika terdapat suara yang memiliki tingkat keunikan yang banyak, maka akan dimasukkan ke dalam kelompok yang berbeda, misalkan seorang pembicara yang menginput suara normalnya maka suara tersebut akan direkam dan disimpan di dalam database, suatu saat ketika sang pembicara tersebut mengalami sakit yang dapat merubah suaranya, maka pada saat akan memverifikasi suara pembicara tersebut, system aplikasi cenderung akan memasukkan suara itu ke dalam kelompok yang berbeda, sehingga pencocokan suara akan sulit terjadi.