Anda di halaman 1dari 8

BAB I

PENDAHULUAN
1.1 Latar Belakang

Secara garis besar system identifikasi speaker merupakan suatu usaha untuk

menghasilkan suatu mesin cerdas ynag mampu mengenali dan menetukan asal dan

ciri speaker berdasarkan ucapan individual. Kesulitan yang paling mendasar adalah

bagaimana melakukan ekstraksi ciri terhadap sinyal ucapan menjadi beberapa

parameter yang dapat digunakan untuk mengklasifikasi sinyal secara efisien.

Beberapa contoh kesalahan hingga sekarang masih belum teratasi adalah

membedakan kata-kata yang mempunyai akustik-fonetik sama, misalnya “ hawai”

dengan “ how why”. Karena itu diperlukan pendekatan yang lebih revolusioner

untuk mendapatkan model yang lebih tepat.

. Pemahaman Wicara

Analisa dan
Ekstraksi ciri
Kompresi data

Sinyal Wicara

Parameter

Konversi Ke Kode
Linguistik

Kode Linguistik (Text)


Gambar 1.1 Prinsip teknologi pengolahan informasi sinyal wicara

Pemahaman

Arti/maksud
1
Untuk mengatasi kesulitan tersebut, muncul dan berkembang beberapa

metode pendekatan. Dan diantara pendekatan yang sangat berhasil sampai saat ini

adalah metode LPC (Linier Predictive Coding) dan cepstral yang merupakan metode

parametric yang digunakan untuk merepresentasikan suatu sinyal wicara. Keluaran

dari LPC dan cepstral ini adalah himpunan parameter yang merupakan representasi

suatu segmen sinyal.

Setelah parameter-parameter tersebut dihasilkan oleh LPC dan Cepstral,

maka tentu dibutuhkan suatu metode lainnya yang berfungsi untuk memproses

parameter-parameter tersebut sebagai akibat dari parameter sinyal.

Perubahan tersebut terjadi karena adanya perbedaan gaya bicara, warna suara,

jenis kelamin, umur dan sebagainya. Metode yang menjadi pilihan di dalam system

identifikasi suara tersebut adalah metode Hierarchical dan Kmeans yang merupakan

metode cukup akurat yang dapat menggambarkan struktur temporal dari suatu sinyal

wicara dalam mengklasifikasi sinyal suara. Kinerja dari kedua metode analisa wicara

tersebut akan dievaluasi dengan menggunakan 50 kata dalam bahasa Indonesia yang

diucapkan oleh 79 penutur pria dan 21 penutur wanita [4,11].

1.2 Masalah dan Perumusan Masalah

Permasalahan yang selalu dijumpai pada system identifikasi speaker adalah

begitu luasnya variasi pengucapan dari suatu suku kata. Pengucapan suatu suku kata

yang sama baik dilakukan secara dependent atau independent secara berulang-ulang

akan menghasilkan pola sinyal yang berbeda-beda. Perbedaan tersebut dapat

disebabkan oleh gaya bicara, warna suara, kondisi emosional pembicara, jenis

kelamin, umur dan sebagainya. Dari permasalahan tersebut muncul pertanyaan

2
bagaimana memperoleh cara yang terbaik dan efektif di dalam mengenali suatu

sinyal ucapan?

Permasalahan tersebut senantiasa dikaji dan dianalisis oleh para peneliti oleh

para peneliti untuk memperoleh metode yang lebih baik. Diantara metode-metode

yang telah dikembangkan adalah : Metode Dynamic Time warping (DTW), Jaringan

Syaraf Tiruan, Hidden Markov Model (HMM), Vektor Kuantisasi (VQ).

Dalam melakukan pengklasteran penulis mencoba memilih metode

Hierarchical dan Kmeans. Beberapa faktor mengapa metode tersebut menjadi pilihan

adalah sebagai berikut:

1. Metode kmeans modified mempunyai algoritma sederhana dan mudah, mudah

dalam menentukan kemiripan atau kedekatan cluster.

2. Metode Hierarachical mempunyai algoritma yang mudah digunakan karena

merupakan metode clustering yang mendasar, mudah dalam menentukan

kedekatan cluster dan menentukan pusat cluster.

3. Perbandingan kedua metode cluster untuk mendapatkan metode terbaik diantara

keduanya.

1.3 Hipotesis

Hipotesis yang dipakai adalah:

1. Perbandingan antara metode hierarchical dan kmeans untuk mendapatkan metode

clustering terbaik

2. Metode Hierarchical adalah metode yang mudah dalam menentukan kedekatan

atau similaritas.

3. Mendapatkan pusat cluster terbaik diantara kedua metode.

3
1.4 Batasan Masalah

Penelitian ini dibatasi untuk menentukan cluster yang terbaik, dengan batasan

sebagai berikut:

o Umur dari speaker bervariasi, dengan jumlah terbatas.

o Sinyal wicara direkam dengan menggunakan software wavesurfer dan

diolah dengan menggunakan matlab versi 6.5

o Basis data sinyal wicara yang digunakan meliputi 50 kosa kata bahasa

Indonesia yang mempunyai kandungan informasi rata-rata kata-kata yang

keluar dalam surat kabar Jawa Pos. Kata-kata tersebut diucapkan oleh 79

penutur pria dan 21 penutur wanita [11].

o Metode clustering yang dipakai adalah metode Hierarchical dan kmeans

o Pengujian metode didasarkan pada hipotesis yang dipakai.

1.5 Metodologi Penelitian

Untuk menyelesaikan penelitian ini, maka langkah-langkah yang meliputi:

pendalaman dan pemahaman literatur, pemodelan system, pengambilan data suara,

pembuatan algoritma dan simulasi, analisa dan kesimpulan, Rincian tahapan langkah

yang ditempuh adalah sebagai berikut:

o Pemahaman Litaratur

Pada tahap pertama dilakukan pendalaman tentang teori sistem pengenalan

wicara dan metode analisa sinyal wicara, serta pengolahan sinyal digital,

melalui beberapa referensi berupa buku, tutorial, paper, proceeding seminar

dan lain-lain yang tercantum pada daftar pustaka.

4
o Pemodelan Sistem

Pada tahap ini dilakukan pemodelan pengenalan sinyal wicara dengan urutan

sebagai berikut:

o Proses preemphasis

Pengubahan sinyal wicara dalam bentuk frame-frame sinyal

suara sepanjang 20 milidetik di setiap pergeseran 10 milidetik.

Jadi terdapat 240 sampel dalam satu frame

o Proses windowing untuk meminimalkan diskontinuitas sinyal

pada awal dan akhir tiap frame. Window yang digunakan

adalah window Hamming, yang mempunyai main lobe paling

sempit dan redaman side lobe yang besar dibandingkan

window-window lainnya, yaitu:

w(n) = 0.54 –0.46 cos (2πn/N-1)

o Proses mendapatkan parameter ciri sinyal suara menggunakan

metode analisa LPC Cepstrum

o Penghitungan matriks jarak dari sinyal suara menggunakan

dynamic programming

o Pengelompokkan pola wicara sebagai kelompok training ke

dalam 2 cluster, 4 cluster, 6 cluster dan 8 cluster menggunakan

algoritma Modified Kmeans (MKM) dan Hierarchical

Clustering

o Pengenalan sinyal wicara dengan kelompok training 2 cluster,

4 cluster, 6 cluster dan 8 cluster

5
o Pengambilan Data Suara

o Pengambilan data sinyal wicara menggunakan software

wavesurfer, dengan mengeset frekuensi sampling sebesar 12

KHz. Data diambil sebanyak 50 kata yang berbeda dari basis

data [11] yang dipilih berdasarkan perhitungan dari 79 pria

dan 21 wanita.

Daftar kata-kata yang diucapkan terlihat pada tabel 2.3. hasil

rekaman ditampilkan dalam bentuk spektogram.

o Analisa

Menganalisa hasil simulasi yang telah dilakukan, yaitu nilai

akurasi pengenalan sinyal wicara untuk bermacam

pengelompokkan kelas wicara dan metode analisa wicara yang

digunakan.

o Kesimpulan

Tahapan akhir dari penelitian ini adalah membuat kesimpulan

hasil penelitian yang telah dilakukan. Selain itu juga diberikan

saran-saran hal-hal yang dapat dilakukan untuk penelitian

selanjutnya.

1.6 Tujuan

Penelitian ini bertujuan mengetahui perbedaan metode clustering sinyal suara

antara metode Hierarchical dan Kmeans dengan kosa kata yang dipakai adalah

kosa kata bahasa Indonesia.

6
1.7 Manfaat/Relevan

Manfaat dari penelitian ini adalah mendapatkan metode cluster sinyal wicara

terbaik yang digunakan dalam pengenalan sinyal wicara bahasa Indonesia.

1.8 Sistematika Penulisan

Untuk mendapatkan pembahasan yang sistematis dan terarah, maka penulisan

tesis ini dibagi kedalam 5 bab, dengan sistematika sebagai berikut:

o Bab 1. Pendahuluan

Pada bab I dibahas Latar Belakang, Perumusan Masalah, Batasan Masalah,

Metodologi, Tujuan dan Manfaat dari penelitian yang dilakukan, kemudian

penjelasan mengenai sistematika penulisan thesis.

o Bab 2. Tinjauan pustaka clustering

Pada bab 2 dibahas teori pendukung dan tinjauan pustaka yang dibutuhkan

untuk membuat dan menganalisa system pengenalan sinyal wicara yang

dibuat, yang meliputi clustering pada pengenalan sinyal wicara.

o Bab 3. Tinjauan pustaka pendukung

Pada bab 3 dibahas teori pendukung dan tinjauan pustaka yang dibutuhkan

untuk membuat dan menganalisa system pengenalan sinyal wicara yang

dibuat, yang meliputi pemodelan produksi sinyal wicara, pengolahan sinyal

wicara, pengolahan sinyal wicara, metode analisa parameter sinyal wicara,

proses pengenalan sinyal wicara. Selain itu juga studi pendahuluan

mengenai evaluasi sistem, dan basis data sinyal wicara.

o Bab 4 metodologi

7
Pada bab 4 dibahas algoritma dan alur-alur simulasi dari pemodelan sinyal

wicara, yaitu proses preemphasis, pembuatan frame, proses windowing,

penentuan parameter ciri sinyal wicara untuk metode LPC Cepstrum,

penghitungan matriks jarak, pengelompokkan kelas kata dan pengenalan

sinyal wicara, penentuan metode cluster

o Bab 5 Percobaan dan Analisa

Pada bab 5 dibahas analisa data hasil simulasi, yaitu membandingkan data-

data yang didapatkan dari kedua metode clustering yang berbeda untuk

mendapatkan kesimpulan yang dapat dijadikan acuan dalam system

pengenalan sinyal wicara menggunakan kosa kata bahasa Indonesia

o Bab 6 kesimpulan dan saran

Bab 6 merupakan kesimpulan dari seluruh uraian dalam bab-bab

sebelumnya dan juga saran yang nantinya dapat ditindaklanjuti untuk

menyempurnakan penelitian ini.

Anda mungkin juga menyukai