Laporan Skripsi

PENGENALAN ISYARAT TUTUR SUKU KATA BAHASA INDONESIA MENGGUNAKAN SKEMA PREDIKSI ADAPTIF SKRIPSI
Disusun oleh :
FAJAR NUGROHO 08/266647/ET/05972
JURUSAN TEKNIK ELEKTRO DAN TEKNOLOGI INFORMASI FAKULTAS TEKNIK UNIVERSITAS GADJAH MADA YOGYAKARTA 2011
PENGESAHAN
PERSEMBAHAN
Skripsi ini saya persembahkan kepada:
Bapa dan Tuhan kita Yesus Kristus
Kedua orang tua, dan nenek di rumah
Kakak dan adikku tercinta
Kekasihku tersayang
AMDG
KATA PENGANTAR
Puji dan syukur atas kehadirat Tuhan Yang Maha Esa, sehingga skripsi ini, yang berjudul Pengenalan Isyarat Tutur Suku Kata Bahasa Indonesia Menggunakan Skema Prediksi Adaptif dapat teselesaikan. Skripsi ini diharapkan kedepannya mampu memberikan gambaran yang cukup baik tentang
perkembangan teknologi pengolahan isyarat suara yang dewasa ini semakin maju pesat perkembangannya. Penulis menyadasi bahwa selesainya skripsi ini tidaklah lepas dari bantuan segala pihak secara langsung maupun tak langsung. Maka dalam kesempatan ini penulis ingin mengucapkan terima kasih yang sedalam dalamnya kepada: 1. Bapak Ir. Lukito Edi Nugroho, M.Sc., Ph.D., selaku Ketua Jurusan Teknik Elektro dan Teknologi Informasi Fakultas Teknik Universitas Gadjah Mada. 2. Bapak Ir. Priyatmadi, M.T., selaku dosen pembimbing I yang telah memberikan gagasan, bimbingan dan dukungan yang berarti kepada penulis dalam proses penyusunan skripsi. 3. Bapak Prof. Dr. Ir. Thomas Sri Widodo, DEA selaku dosen pembimbing II yang telah memberikan saran, bimbingan dan dukungan yang berarti kepada penulis dalam proses penyusunan skripsi.
4. Bapak, Ibu, kakak dan adik yang tercinta, yang telah memberikan bayak dukungan materiil, moral dan spiritual sehigga selesailah skripsi ini. 5. Angelina Mellissa S, yang memberikan dukungan waktu dan spiritual selama penyusunan skripsi. 6. Apung, Bintang, Ayu dan semua teman temanku yang tidak bias saya sebutkan satu per satu. Semoga segala kebaikan dan kemurah hati dari semuanya mendapat berkah dari Tuhan Yang Maha Kuasa. Akhir kata penulis mohon maaf apabila masih banyak kekurangan dalam penyusunan skripsi ini. Semoga skripsi ini dapat bermanfaat bagi semua pihak yang memerlukan.
Yogyakarta, 4 Juli 2011
Penulis
DAFTAR ISI
HALAMAN JUDUL.....................................Error: Reference source not found pengesahan..............................................................................................................ii persembahan.........................................................................................................iii kata pengantar.......................................................................................................iv Daftar isi.................................................................................................................vi daftar tabel..........................................................................................................viii daftar gambar........................................................................................................ix Intisari.....................................................................................................................x BAB I.....................................................................................................................xii 1.1 Latar Belakang Masalah................................................................xii 1.2 Batasan Masalah...........................................................................xvi 1.3 Maksud dan Tujuan......................................................................xvi 1.4 Sistematika Penulisan.................................................................xvii BAB II..................................................................................................................xix 2.1 Produksi Suara.............................................................................xix 2.2 Fonem Bahasa Indonesia..............................................................xxi 2.2.1 Persukuan...........................................................................xxi 2.3 Ciri Fisik Sinyal Suara.....................................................................i 2.4 Sistem Adaptif...............................................................................iii 2.4.1 Algoritma LMS...................................................................vii 2.4.2 Skema Adaptif Prediktif....................................................viii 2.5 Algoritma K-nearest Neighbor (KNN)...........................................x BAB III.................................................................................................................xiv
3.1 Suku kata yang digunakan...........................................................xiv 3.1.1 Persukuan pola Konsonan-Vokal (K-V)............................xiv 3.2 Rancangan sistem pengenal suara................................................xvi 3.3 Langkah-langkah simulasi...........................................................xix 3.3.1 Perekaman suara................................................................xix 3.3.2 Pelatihan..............................................................................xx 3.3.3 Pengujian...........................................................................xxii 3.4 Pemrograman Matlab.................................................................xxiii BAB IV...............................................................................................................xxix 4.1 Pemetaan Bobot..........................................................................xxx 4.2 Hasil Pengujian........................................................................xxxiii 4.2.1 Tingkat Keberhasilan Pengenalan Suku Kata................xxxiii 4.2.2 Tingkat Keberhasilan Pengenalan Fonem.......................xxxv 4.3 Pengujian dengan berbagai jumlah bobot................................xxxvi BAB V............................................................................................................xxxviii 5.1 Kesimpulan............................................................................xxxviii 5.2 Saran......................................................................................xxxviii DAFTAR PUSTAKA............................................................................................xl DAFTAR PUSTAKA....................................Error: Reference source not found LAMPIRAN
DAFTAR TABEL
Tabel 3.1 Label kelas konsonan dan vokal.....................................................xviii Tabel 3.2 Klasifikasi masing-masing suku kata..............................................xxii Tabel 4.3 Tingkat pengenalan suku kata kelompok /k/..............................xxxiii Tabel 4.4 Tingkat pengenalan suku kata kelompok /p/...............................xxxiv Tabel 4.5 Tingkat pengenalan suku kata kelompok /m/..............................xxxiv Tabel 4.5 Tingkat pengenalan suku kata kelompok /s/...............................xxxiv Tabel 4.6 Tingkat pengenalan komponen konsonan....................................xxxv Tabel 4.7 Tingkat pengenalan komponen vokal............................................xxxv Tabel 4.8 Pengujian dengan berbagai nilai orde.........................................xxxvii
DAFTAR GAMBAR
...............................................................................................................................xix Gambar 2.1 Organ organ produksi suara.....................................................xix Gambar 2.2 contoh sinyal ucapan ka..............................................................iii Gambar 2.3 Sistem adaptif kalang terbuka.......................................................iii Gambar 2.4 Sistem adaptif kalang tertutup.......................................................iv Gambar 2.5 Sistem adaptif masukan jamak......................................................vi Gambar 2.6 Sistem adaptif masukan tunggal....................................................vi Gambar 2.7 Bentuk umum linear combiner ...................................................viii Gambar 2.8 linear combiner sebagai transversal filter...................................viii Gambar 2.10 perbandingan sinyal prediksi dengan sinyal asli.........................x Gambar 2.11 Contoh klasifikasi k-nearest neighbor.........................................xi Gambar 3.1 Sinyal suara ka............................................................................xv Gambar 3.2 Sistem prediksi adaptif orde lima...............................................xvii ................................................................................................................................xx Gambar. 3.3 Pengaturan perekaman Cool Edit Pro.......................................xx Gambar 3.4 Bagan proses pelatihan pengenalan suara..................................xxi Gambar 3.5 Bagan pengujian pengenalan suara...........................................xxiii Gambar 4.1 Peta nilai bobot konsonan awal suku kata su........................xxx Gambar 4.2 Peta nilai bobot konsonan akhir suku kata su..........................xxxi Gambar 4.3 Peta nilai bobot vokal akhir suku kata su................................xxxii
Intisari
Teknologi pengenalan isyarat suara telah pada tahap yang sangat menjanjikan untuk memudahkan manusia dalam berbagai kegiatannya, isyarat suara telah mencapai pada taraf komunikasi antar perangkat elektronis yang disandikan dengan beberapa metode, salah satunya adalah dengan menggunakan skema prediksi adaptif. Dengan asumsi bahwa setiap fonem memiliki ciri yang khas, maka ekstraksi ciri tentunya dapat menjadi cara yang cukup efektif untuk dijadikan cara mengenal setiap fonem. Claudio Becchetti dan Lucio Prina Ricotti dalam bukunya Speech Recognition Theory and C++ Implementation menulis bahwa sinyal ucapan merupakan sinyal yang stabil pada rentang waktu yang sangat singkat yaitu selama pengucapan sebuah fonem, dan kemudian berpindah ke keadaan stabil berikutnya saat ada perubahan ucapan.[4] Skripsi ini bertujuan untuk menunjukan seberapa besar tingkat keberhasilan pengenalan suku kata dengan menggunakan skema prediksi adaptif. Kata kunci: skema prediksi adaptif, Speech Recognition, pengenalan suku kata
Abstrack
Speech recognition technology has been on stage very promising to enable people in various activities, speech signal have been achieved at the level of communication between electronic device are encoded by several methods, one of which is to use adaptive prediction scheme. Assuming that each phoneme has specific feature, the feature extraction can certainly be an effective way to become familiar with how each phoneme. Claudio Becchetti and Lucio Prina Ricotti in his book Speech Recognition Theory and C++ Implementation writes that the speech signal is a signal that is stable at a very short span of time i.e during the pronunciation of a phoneme and then move on to the next stable state when there are changes in speech. This thesis aims to show how much the success rate of syllable recognition using adaptive prediction scheme.
Key words: adaptive prediction scheme, Speech Recognition, syllable recognition
BAB I PENDAHULUAN
1.1 Latar Belakang Masalah Suara merupakan alat komunikasi yang paling populer di era manusia, dari zaman purbakala sampai zaman modern sarana komunikasi ini menjadi hal yang vital dalam tujuan pencapaian informasi. Walaupun perkembangan pengiriman informasi sudah semakin berkembang dari ditemukannya tulisan dan bahasa pengisyaratan yang lain, tetapi suara tetap menjadi andalan dan diakui dalam berbagai bidang lebih terpercaya keakuratannya dalam komunikasi. Keberadaan komunikasi dengan menggunakan suara, semula memang hanya terbatas antara mulut -dengan media udara- ke telinga (Real Time), tetapi ide manusia terus berkembang, sampai pada ide untuk menyimpan informasi suara dan memperdengarkannya lagi untuk ditindaklanjuti. Seperti sebuah ide Alexander Graham Bell dan kedua sepupunya, Chicester Bell dan Charles Summer Tainter. Idenya yaitu membuat suatu alat perekam yang disebut dictaphone dan diperdengarkan lagi kepada sekretarisnya untuk diketik. Kira kira pada kisaran tahun yang tidak jauh, Thomas Alva Edison juga menemukan phonograph yang berfungsi sama dengan alat temuan Bell tetapi dengan bahan baku dan sistem yang berbeda. Hal inilah yang menjadi cikal bakal pengembangan Automatic Typewriter.
Sistem yang digunakan dalam mesin tulis otomatis juga bermacam macam. Para ilmuwan menyadari bahwa penyusun suku kata ( Speech Synthesizer) sangat penting peranannya jika ingin membuat mesin tulis otomatis ini. Pada tahun 1930 Homer Dudley diilhami oleh penelitian Fletcher di laboratorium Bell, mengembangkan suatu alat penggabung atau penyusun suku kata yang disebut VODER (Voice Operating Demonstrator) dan diperdengarkan pada World Fair di New York tahun 1932. Kode masukan yang disintesa sudah berupa sinyal elektrik tetapi menggunakan kendali mekanik yang diadaptasi dari mesin wicara mekanik Wheatstone. Dari sinilah dikenal pentingnya sintesa spektrum suara. Pada zaman sekarang ilmuwan memanfaatkan daya spektrum suatu sinyal untuk pengolahan isyarat digital. Digitasi isyarat suara diawali oleh penelitian Davis, Biddulph, and Balashek di Bell Laboratories dengan satu sumber bunyi (wicara) pada tahun 1952, dan pada era itu juga, Olson and Belar dari RCA Laboratories membuat suatu sistem untuk pengenalan 10 suku kata dari satu sumber wicara. Lalu dilanjutkan oleh Forgie dari MIT Lincoln Laboratories membuat suatu pengenalan huruf hidup 10 pembicara independent. Tahun 1960an beberapa laboratorium jepang mendemonstrasikan kemampuan mereka membuat perangkat keras tentang pengenalan isyarat suara yang dirancang dengan tujuan tertentu. Beberapa yang tercatat yaitu alat pengenalan huruf hidup oleh Suzuki dan Nakata di laboratorium penelitian radio di Tokyo, alat pengenalan vonem oleh Sakai dan Doshita di Universitas Kyoto, dan alat pengenalan digit oleh Laboratorium NEC.
Pengembangan yang dilakukan Sakai dan Doshita menegaskan bahwa tidak lagi diperlukan batas yang tegas dalam inisiasi suara dan digitasinya, dengan demikian Universitas Kyoto bisa dikatakan sebagai pelopor sistem pengenalan isyarat suara kontinyu. Fry dan Denes dari inggris membuat alat pengenalan vonem yaitu untuk 4 vowel dan 9 konsonan, merekalah yang menggunakan sintaksis dengan dasar statistik untuk pertama kali. Ada juga yang mengadopsi non-uniform time scale untuk
menyempurnakan bentuk sinyal suara. Konsep ini secara luas diterima pada sekitar tahun 1960an dari hasil kerja keras Tom Martin di laboratorium RCA dan oleh Vintsyuk di Rusia. Sampai pertengahan 1970an Departemen pertahanan USA mengucurkan dana untuk membuat suatu kamus besar untuk pengenalan isyarat suara. Hingga saat ini para ilmuwan telah berhasil membuat sistem pengenal suara yang dapat mengenali seluruh kata (dalam bahasa Inggris) atau yang dikenal dengan large vocabularies speech recognition. [Juang & Rabiner, 2004]. Speech recognition dimulai dari proses pembangkitan suara yaitu saat orang berbicara memikirkan pesan (di dalam pikiran) apa yang ingin dia sampaikan kepada pendengar melalui suara. Kemudian dari mulut orang yang berbicara keluar sinyal terakhir yang akan diterima oleh pendengar., kemudian dimulailah proses pesepsi suara tersebut atau speech recognition. Proses selanjutnya setelah mengetahui kode bahasa apa yang digunakan, kemudian sinyal
suara yang diterima saraf pedengar dikodekan sesuai kode bahasa yang dikehendaki orang yang berbicara dan dikirim ke otak, dan akhirnya maksud pesan yang dikirimkan dapat dimengerti pendengar. Tetapi sampai sekarang belum ada teknologi yang seakurat otak manusia, beberapa pendekatan dilakukan oleh ilmuwan untuk menghasilkan sistem persepsi suara yang terbaik. Beberapa contohnya adalah dengan menggunakan metode metode yang ada dalam sistem pengenalan isyrat dan sistem yaitu: metode
Dynamic Time-warping (DTW), metode Linear Predictive Coding (LPC), metode Hidden Markov Model (HMM), metode Neural Network, Wavelet dan metode adaptif Least Mean Square (LMS). Penelitian ini sendiri menggunakan metode adaptif LMS dengan skema prediktif yang mana pada metode ini ekstraksi ciri sebuah sinyal suara dilakukan melalui pencarian nilai-nilai bobot dan mengelompokkannya pada kelas yang sesuai. Alasan utama dipilihnya metode ini adalah karena kesederhanaan dan kemudahan dalam mengaplikasikannya. Terdapat dua tipe dari sistem pengenal suara, yang pertama disebut speaker-dependent dan yang lain disebut speaker-independent. Kedua tipe ini berbeda pada proses pelatihannya dan digunakan pada aplikasi yang berbeda. Sistem speaker-dependent bekerja dengan mempelajari keunikan dari karakteristik suara seseorang. Pengguna baru sebelumnya harus melatih sistem terlebih dahulu, sehingga komputer dapat menganalisa bagaimana seseorang berbicara. Pelatihan yang dilakukan dapat berupa pembacaan teks ke komputer. Sistem speaker-dependent banyak digunakan sebagai perangkat lunak pendiktean.
Sistem speaker-independent dirancang untuk mengenali suara siapapun, sehingga tidak melibatkan proses pelatihan dalam pengenalan suara orang lain. Sistem ini banyak digunakan dalam aplikasi interactive voice response systems. Kelemahan sistem speaker-independent ini adalah tingkat akurasi yang lebih rendah dibanding sistem speaker-dependent. 1.2 Batasan Masalah Lingkup pembahasan tugas akhir ini adalah melakukan simulasi pengenalan beberapa fonem dalam bahasa indonesia oleh komputer. Penelitian ini dibatasi hanya pada : 1. Pengenalan suku kata bahasa Indonesia dalam pola konsonan-vokal. 2. Hanya terbatas pada 20 jenis suku kata yaitu ka, ke, ki, ko, ku, ma, me, mi, mo, mu, sa, se, si, so, su, pa, pe, pi, po dan pu. 3. Sistem speaker dependent. 4. Sistem penutur tunggal. 5. Sistem Non-real time. 1.3 Maksud dan Tujuan 1. Mencoba menerapkan algoritma prediksi adaptif dalam pengenalan isyarat tutur kata bahasa Indonesia. 2. Mencoba mengetahui tingkat keberhasilan algoritma prediksi adaptif
dalam mengenal isyarat tutur kata bahasa Indonesia. 1.4 Sistematika Penulisan Laporan akhir penelitian ini berupa sebuah karya tulis ( tugas akhir ) yang direncanakan terdiri dari lima bab, dengan sistematika penulisan sebagai berikut : BAB I PENDAHULUAN
Berisi latar belakang masalah, batasan masalah, maksud dan tujuan, serta sistematika penulisan. BAB II DASAR TEORI
Berisi pembagian jenis suku kata dalam bahasa Indonesia, Pre-emphasis, Sistem adaptif, metode Least Mean Square (LMS), sistem prediksi adaptif, sistem klasifikasi dan algoritma K-Tetangga Terdekat atau K-Nearest Neighbor (KNN). BAB III PERANCANGAN SISTEM
Berisi tentang perancangan sistem pengenal tutur dengan menggunakan sistem prediksi adaptif dan pengelompokan KNN, rancangan pelatihan dan pengujian sistem serta rancangan program sistem dengan menggunakan program aplikasi Matlab. BAB IV SIMULASI PROGRAM DAN PEMBAHASAN HASIL
PENGAMATAN.
Berisi penjelasan program pada Matlab untuk mensimulasikan Sistem pengenal tutur dan pembahasan hasil simulasi.
BAB V
KESIMPULAN DAN SARAN
Berisi kesimpulan dan saran yang didasari dari pembahasan hasil pengamatan.
BAB II DASAR TEORI
2.1 Produksi Suara Bunyi bahasa dibuat oleh manusia untuk mengungkapkan sesuatu. Dalam pembentukan bunyi bahasa ada 3 faktor utama yang berperan yaitu sumber tenaga, alat ucap yang menimbulkan getaran, dan rongga pengubah getaran. Pada saat kita mengeluarkan nafas, paru-paru kita menghembuskan tenaga berupa arus udara yang mengalami perubahan pada pita suara yang terletak pada pangkal tenggorokan. Arus udara dari paru-paru itu dapat membuka kedua pita suara yang merapat sehingga mengakibatkan corak bunyi bahasa tertentu. Gerakan membuka dan menutup pita suara itu menyebabkan arus udara dan udara di sekitar pita suara berubah tekanannya atau bergetar. Perubahan bentuk saluran suara yang terdiri dari rongga faring, rongga mulut, dan rongga hidung menghasilkan bunyi bahasa yang berbeda-beda.
Gambar 2.1 Organ organ produksi suara.
Organ-organ pembentuk sinyal suara meliputi : 1. Bagian Pulmonary Tract; terdiri dari paru-paru dan batang tenggorokan. 2. Bagian Larynk; terdiri dari tali-tali vokal. Ruang antara pita suara disebut glottis. 3. Bagian hidung. Berdasarkan cara eksitasinya, suara dibagi menjadi 3, yaitu : 1. Suara Voiced (Voiced Sound): Tekanan udara yang dibangkitkan dilewatkan pada glottis dengan pita suara yang tegang. Getaran pita suara akan mengubah aliran udara menjadi pulsapulsa yang quasi-periodic. 2. Suara Desah (Fricative/Unvoiced Sound): Suara desah diakibatkan penyempitan pada beberapa bagian vocal tract. Aliran udara yang berasal dari tenggorokan dipaksa melewati daerah penyempitan tersebut dengan kecepatan yang cukup tinggi. 3. Suara letupan (Plosive/Stop Sound): Adanya penutupan pada bagian vocal tract (biasanya di bagian depan) mengakibatkan aliran udara berkumpul di bagian belakang sehingga menimbulkan tekanan yang lebih besar. Bagian vocal tract yang tertutup ini dibuka secara tibatiba untuk menghasilkan eksitasi letupan. Vokal (vowel) adalah bunyi bahasa yang arus udaranya tidak mengalami rintangan dan kualitasnya ditentukan oleh 3 faktor: tinggi-rendahnya posisi lidah, bagian lidah yang dinaikkan, dan bentuk bibir pada pembentukan vokal tersebut. Pada saat vokal diucapkan, bagian depan, tengah atau belakang lidah dapat Vocal Tract; terdiri dari pharynk, rongga mulut, dan rongga
dinaikkan atau diturunkan bersama rahang. Dalam bahasa Indonesia terdapat 5 vokal yaitu /a/ , /i/ , /u/ , /e/ , dan /o/. 2.2 Fonem Bahasa Indonesia Fonem adalah kesatuan bahasa terkecil yang membedakan arti. Dalam bahasa tulisan, fonem dilambangkan dengan huruf. Dengan kata lain, huruf adalah tulisan dari fonem [Basuki, 2000]. Suatu ucapan kata atau kalimat pada prinsipnya dapat dilihat sebagai urutan fonem, dan setiap fonem disimbolkan dengan suatu simbol yang unik.[Arman, 1999]. Fonem dibagi menjadi vokal dan konsonan. Bahasa Indonesia mempunyai 5 vokal yaitu : a, e, i ,o, u, dan 25 konsonan yaitu : b, c, d ,f , g , h, j , k, kh, l, m, n, ng, ny, p, q, r, s, sy, t, v, w, x, y, z. Konsonan kh, ng, ny dan sy adalah contoh fonem yang terdiri atas dua huruf. Selain itu dikenal pula istilah diftong, yaitu gabungan 2 vokal yang membentuk kesatuan bunyi, yaitu : au, ai, oi. 2.2.1 Persukuan Menurut Kamus Besar Bahasa Indonesia suku kata adalah struktur yang terjadi dari satu atau urutan fonem yang merupakan bagian kata. Setiap suku kata ditandai dengan sebuah vokal (termasuk diftong). Bahasa Indonesia mengenal beberapa pola umum suku kata, yaitu [Basuki, 2000] :
a) Vokal (V) contoh: a-nak, ba-u
g) Vokal-Konsonan-Konsonan (V-K-K) contoh: eks, ons h) Konsonan-Vokal-KonsonanKonsonan (K-V-K-K) contoh: pers, kon-teks
b) Vokal-Konsonan (V-K) contoh: an-da, da-un
c) Konsonan-Vokal (K-V) contoh: se-bab, man-di
i) Konsonan-Konsonan-Vokal-KonsonanKonsonan (K-K-V-K-K)
d) Konsonan-Vokal-Konsonan (K-V-K) contoh: contoh: lan-tai, ma-kan j) Konsonan-Konsonan-Konsonane) Konsonan-Konsonan-Vokal (K-K-V) contoh: pra-ha-ra, sas-tra Vokal (K-K-K-V) contoh: in-stru-men k) Konsonan-Konsonan-KonsonanVokal-Konsonan (K-K-K-V-K) contoh: struk-tur kom-pleks
f) Konsonan-Konsonan-Vokal-Konsonan (K-K-V-K) contoh: frik-si, kon-trak 2.3 Ciri Fisik Sinyal Suara
Ucapan manusia dihasilkan oleh suatu sistem produksi ucapan yang dibentuk oleh alat-alat ucap manusia. Proses tersebut dimulai dengan formulasi pesan dalam
otak pembicara yang kemudian diubah menjadi perintah-perintah yang diberikan kepada alat-alat ucap manusia. Sinyal ucapan merupakan sinyal yang stabil pada rentang waktu yang sangat singkat yaitu selama pengucapan sebuah fonem, dan kemudian berpindah ke keadaan stabil berikutnya saat ada perubahan ucapan. Untuk fonem vokal, sinyal suara dianggap bersifat periodis dan untuk fonem konsonan sinyal suara dianggap bersifat sama seperti derau putih (white noise). Hal ini ditunjukkan seperti pada gambar 2.2 Gambar 2.2 merupakan gambar sinyal suara ka yang dicuplik pada frekuensi cuplikan 44100 sampel per detik. Dari gambar tersebut dapat dilihat bahwa fonem konsonan yang berada pada bagian awal sinyal bersifat sama seperti derau, dan kemudian periodis pada bagian vokalnya. Namun segmentasi konsonan-vokal ini tidak berlaku eksak, artinya terdapat daerah-daerah yang tidak dapat dibedakan pada salah satu dari segmentasi tersebut. Salah satu penyebabnya adalah perubahan dari keadaan-keadaan alat ucap manusia yang tidak bersifat diskrit dari satu keadaan ke keadaan lainnya.
Sampel ke-n Gambar 2.2 contoh sinyal ucapan ka 2.4 Sistem Adaptif Sistem adaptif adalah sistem yang dapat menyesuaikan perilakunya sedemikian rupa untuk mempertahankan maupun meningkatkan unjuk kerjanya terhadap kondisi lingkungan yang berubah-ubah. Secara umum sistem adaptif dapat digambarkan seperti pada gambar 2.3 dan gambar 2.4 berikut:
Sinyal masukan
Prosessor
Sinyal keluaran
Data lingkungan
Algoritma Adaptif
Gambar 2.3 Sistem adaptif kalang terbuka
Gambar 2.3 di atas menunujukkan sistem adaptif kalang terbuka dimana sistem mengukur masukan dan data lingkungannya, mengaplikasikan informasi tersebut pada suatu formula atau algoritma komputasi, dan menggunakan hasilnya untuk mengendalikan pengaturan sistem [Widrow & Stearns, 1985]. Berbeda dengan sistem adaptif kalang terbuka, sistem adaptif kalang tertutup melibatkan eksperimen terhadap informasi masukan dan pengetahuan terhadap pengaturan yang menghasilkan unjuk kerja sistem yang maksimal. Sehingga apabila pada sistem adaptif kalang terbuka dianalogikan pengawas mengatur pengendali prosessor berdasar sinyal masukan dan data lingkungan, maka pada sistem adaptif kalang tertutup, sang pengawas juga melibatkan fungsi sinyal keluaran. Contoh aplikasi dari sistem adaptif kalang tertutup ini adalah sistem prediksi. Sistem adaptif kalang tertutup ditunjukkan pada gambar 2.4 di bawah ini:
Sinyal masukan
Prosessor
Sinyal keluaran
Algoritma Adaptif
Perhitungan performa
Data lingkungan
Gambar 2.4 Sistem adaptif kalang tertutup
Terdapat dua tipe masukan pada sistem adaptif, yaitu masukan jamak (multiple inputs) dan masukan tunggal (single input). Pada masukan jamak, semua elemen masukan dicuplik pada waktu ke-k, sementara pada masukan tunggal, elemen masukan dicuplik secara runtun pada titik k, k-1, k-2, dan seterusnya. [Widrow & Stearns, 1985] Keluaran Sistem adaptif merupakan penjumlahan dari seluruh masukan yang telah dikali oleh bobotnya masing-masing. Untuk masukan tunggal maupun jamak, hubungan masukan-keluaran ini dapat ditulis sebagai berikut:
Masukan tunggal :
y k = wlk xk l
l =0
(2.1)
Masukan jamak :
y k = wlk xlk
l =0
(2.2)
Dengan vektor bobot dinyatakan sebagai

Wk = [ wok w1k ... w Lk ]T (2.3) Dari persamaan bobot (2.3) di atas, persamaan (2.1) dan (2.2) dapat ditulis
dalam sebuah notasi vektor

T yk = X k Wk = WkT X k
(2.4) Bentuk umum dari sistem dengan masukan tunggal maupun jamak dapat
dilihat pada gambar 2.5 dan gambar 2.6 berikut.
x0
vektor sinyal masukan
w0
. . .
Vektor bobot y
x1 xL
w1
wL
Sinyal keluaran
Gambar 2.5 Sistem adaptif masukan jamak
z
wok
z 1
z 1
w1k
w2 k
wLk yk
Gambar 2.6 Sistem adaptif masukan tunggal Dari gambar 2.5 dan gambar 2.6 di atas dapat dilihat bahwa setiap masukan terhubung pada bobot yang dapat disetel (adjustable weights), kemudian terhubung ke sebuah penjumlah dan menghasilkan sebuah keluaran. Keluaran yang dihasilkan dari penyetelan bobot harus memiliki nilai yang sedekat mungkin dengan sinyal tanggapan yang diharapkan. Galat muncul dari selisih nilai keluaran dengan nilai yang diharapkan. Penyetelan bobot dimaksudkan untuk meminimalisasi nilai galat yang muncul tersebut. Prosedur dalam menyetel bobot disebut dengan penyetelan bobot atau prosedur adaptasi.
2.4.1 Algoritma LMS Algoritma Least Mean square (LMS) merupakan algoritma adaptif yang bekerja dengan cara meminimalisasi galat rataan kuadrat ( mean squared error). Algoritma ini banyak digunakan dalam algoritma pembelajaran karena
kesederhanaan dan kemudahan aplikasinya. Algoritma LMS dapat diaplikasikan pada masukan tunggal maupun jamak, kedua tipe system LMS ini ditunjukkan pada gambar (2.7) dan (2.8). Untuk kedua tipe masukan ini, galat dihitung menurut persamaan (2.5.).
T ek = d k X k Wk
(2.5)
Untuk X k = runtun masukan baik pada masukan jamak maupun tunggal, dan
ek2 ek w0 w0 . . = . = 2e . = -2e x k kk . . ek2 ek w0 w0
d k = tanggapan yang diinginkan (desired response).
Estimasi gradien dapat diperoleh secara sederhana melalui pendiferensialan dari nilai galat kuadrat rerata.
(2.6)
Nilai gradien ini digunakan untuk menyesuaikan nilai-nilai bobot pada sistem adaptif. Dengan menggunakan metode Dengan algoritma steepest descent (mencari nilai minima), nilai bobot diperbaiki melalui persamaan:
Wk +1 = Wk d dW
(2.7)
Wk +1 = Wk + 2ek X k
(2.8) Tanggapan yang diinginkan
vektor sinyal masukan
x0 k x1k x Lk
. . .
w0 k w1k wLk
yk
dk
error
Sinyal keluaran
ek
Gambar 2.7 Bentuk umum linear combiner
z
wok
z 1
z 1
w1k
w2 k
wLk
Tanggapan yang diinginkan +
yk
dk ek
Sinyal keluaran Gambar 2.8 linear combiner sebagai transversal filter 2.4.2 Skema Adaptif Prediktif
Prediktor adaptif merupakan suatu skema sistem adaptif yang mana tanggapan yang dikehendaki-nya (desired response) merupakan sinyal masukan saat ini sedangkan masukannya merupakan masukan yang ditunda. Selisih dari masukan dengan desired response ini menghasilkan galat yang oleh prosessor adaptif dikendalikan menjadi seminimal mungkin. Skema prediksi adaptif dapat digambarkan seperti pada gambar 2.9 di bawah ini:
xk
Keterangan Gambar:
xk
Tunda
xk m
Prosessor adaptif
ek
Gambar 2.9 Sistem Prediksi Adaptif
: Elemen ke-k dari masukan. : Elemen ke-k dari keluaran. : Elemen ke-k dari galat.
x
ek
Nilai y k dan ek pada skema prediksi ini mengikuti algoritma LMS yang telah dijelaskan pada sub-bab sebelumnya.
Gambar 2.10 merupakan contoh unjuk kerja dalam proses adaptasi untuk prediksi suatu sinyal masukan. Dari gambar tersebut, garis merah menyatakan sinyal asli dan garis berwarna biru merupakan sinyal hasil prediksi. Dari gambar tersebut dapat terlihat bahwa skema prediksi mampu mengikuti bentuk sinyal masukan, walaupun terdapat galat di setiap titiknya.
Sampel ke-n Gambar 2.10 perbandingan sinyal prediksi dengan sinyal asli 2.5 Algoritma K-nearest Neighbor (KNN) .Algoritma k-nearest neighbor merupakan algoritma pembelajaran terawasi (supervised) yang sangat sederhana dan oleh karena itu sering digunakan dalam pengklasifikasian data. Algoritma KNN mengklasifikasikan suatu data uji dengan cara mencari jarak terdekat dari data uji ke beberapa data terdekatnya. Dalam hal ini jumlah data
terdekat ditentukan oleh pengguna yang dinyatakan dengan k. Jarak yang digunakan merupakan jarak dalam bidang ecludian (bidang datar). Setelah data terdekat tersebut diketahui kemudian dilakukan voting mayoritas untuk menentukan kelas dari data uji tersebut. Gambar 2.11 merupakan contoh bagaimana algoritma KNN bekerja. Pada gambar tersebut terdapat sembilan data pelatihan yang termasuk dalam dua kelas. Empat buah data masuk pada kelas segitiga, dan lima data lainnya berada pada kelas persegi. Data lingkaran merupakan data uji yang ingin diketahui kelasnya. Jika memilih k=1, maka klasifikasi dilakukan dengan cara memilih data yang memiliki jarak terdekat dengan titik lingkaran. Jika k>1, maka klasifikasi dilakukan dengan cara memilih sejumlah k-data yang terdekat dengan data uji kemudian melakukan voting kelas mayoritas yang termasuk dalam k-data terdekat tersebut.
Gambar 2.11 Contoh klasifikasi k-nearest neighbor
Persamaan klasifikasi dapat ditulis sebagai berikut [Plannerer, 2005]: jika

= {1 , 2 ,..., v } merupakan set kelas dengan v merupakan jumlah kelas yang
digunakan, dan setiap kelas direpresentasikan oleh vektor anggotanya p k , , dengan
v
k = 0,1,,( k -1), dan jika x merupakan vektor target yang ingin diklasifikasi,
v
dan jarak antara vektor target dengan anggota suatu kelas dinotasikan sebagai
d ( x , p k ,v ) , maka jarak antara x dan v dapat difenisikan sebagai:
dwv x)( = min d x,({ pk, v )}

k
berikut: 2.6 Jarak Ecludian
(2.9) ; k = 0,1,,( k v -1)
Dengan menggunakan jarak kelas ini, tugas klasifikasi dapat ditulis sebagai
arg min{d v ( x )} x v v = v
(2.10)
Pengukuran jarak Ecludian merupakan pengukuran jarak standar antara dua vektor pada kawasan ciri dengan dimensi n. Jarak Ecludian sering juga disebut sebagai jarak pada bidang datar Persamaan ini dapat ditulis[Plannerer, 2005]:
n 2 d Euclid ( x , p ) = ( xi p i ) 2 i =1
(2.11.a)
Persamaan ini dapat pula ditulis dalam bentuk perkalian skalar
2 d Euclid ( x , p ) = ( xi p i ) t .( xi pi )
(2.11.b)
Dengan t menyatakan transpose vektor.
BAB III PERANCANGAN SISTEM & SIMULASI
3.1 Suku kata yang digunakan. Dalam bahasa Indonesia terdapat 11 jenis pola umum suku kata yang terbangun dari gabungan fonem vokal dan konsonan seperti yang sudah dijelaskan sebelumnya pada dasar teori bab 2.1.1. Dari sebelas jenis pola tersebut, penelitian ini hanya menggunakan jenis suku kata berpola Konsonan-Vokal sebagai contoh. Suku kata yang digunakan berjumlah 20 yaitu; ka, ke, ki, ko, ku, ma, me, mi, mo, mu, pa, pe, pi, po, pu, sa, se, si, so dan su. Suku kata lain dapat ditambahkan pada sistem dengan cara kerja yang sama. 3.1.1 Persukuan pola Konsonan-Vokal (K-V) Pada suku kata yang berpola K-V, fonem konsonan diucapkan sebelum fonem vokalnya. Fonem konsonan ini berdurasi singkat dan berenergi kecil, namun memiliki nilai informasi yang besar. Pada perancangan sistem pengenal suara ini, dilakukan pemisahan nilai bobot untuk elemen konsonan dan vokalnya. Komponen konsonan diambil pada bagian depan dari gelombang masukan dan komponen vokal diambil pada bagian akhir gelombang masukan. Bentuk gelombang suku kata berpola Konsonan-Vokal ini dapat dilihat pada gambar berikut.
Sampel ke-n Gambar 3.1 Sinyal suara ka Gambar 3.1 di atas merupakan ilustrasi sinyal suara untuk suku kata ka. Dari gambar tersebut dapat terlihat bagian konsonan terletak pada bagian awal sinyal. Bagian konsonan ini sangat singkat dibandingkan ukuran sinyalnya dan memiliki amplitudo yang kecil. Fonem konsonan sering dianggap bersifat sama seperti derau putih (white noise) [Becchetti & Ricotti, 1999]. Panjang sinyal berbeda-beda tergantung pada saat pengucapan, dan demikian halnya dengan panjang komponen konsonannya, sehingga untuk masukan ke sistem prediksi, sinyal hanya dibatasi hingga cuplikan ke-8000. Penentuan titik iterasi dilakukan dengan cara mengambil galat kuadrat di setiap titik sampel di setiap suku kata, sehigga terkumpul 800x(7995-(5 x orde)) data
galat kuadrat, tergantung orde yang digunakan. Data galat kuadrat tersebut lalu dicari rata rata per kolomnya dan diambil data yang terendah, data batas terendah itu dijadikan acuan penentuan data error mana saja yang digunakan dan mana yang tidak digunakan. Data galat kuadrat yang digunakan disimbolkan 0 dan tidak digunakan disimbolkan 1. Setelah semua data berubah jadi 0 dan 1 lalu dicari rata rata per kolomnya kembali, dan diambil yang terendah lagi dan dititik mana data yang terendah itu, disitulah pengambilan bobot pertama dilakukan. Titik pengambilan bobot kedua juga sama caranya, tetapi bobot awal ditentukan pada saat iterasi bobot pertama tadi dilakukan. Dan akhirnya, pada percobaan ini maximal ada 3 bobot yang dapat diambil yang nantinya akan diimplementasikan pada pelabelan di sub bab berikutnya. Dari perlakuan di atas, dihasilkan tiga titik iterasi pengambilan bobot yaitu di titik 861, 1365 dan 7950 pada orde 5. Pada orde yang berbeda tentunya akan berbeda. 3.2 Rancangan sistem pengenal suara. Blok pengenal yang digunakan merupakan sistem prediksi linear adaptif orde 5 yang berarti menggunakan 5 buah tunda yang mana setiap tunda akan dikalikan oleh sebuah nilai bobot yang berubah secara adaptif untuk memperoleh nilai galat yang minimum. Untuk mengetahui pengaruh dari nilai orde ( jumlah bobot) yang digunakan, akan diuji pula kemampuan sistem melakukan pengenalan menggunakan nilai orde yang berbeda-beda.
Pada skema prediksi yang digunakan, tunda dari sistem merupakan tunda cuplikan kelipatan lima. Tunda pertama merupakan tunda sebanyak 5 cuplikan, tunda kedua merupakan tunda sebanyak 10 cuplikan, tunda ketiga 15 cuplikan, tunda keempat 20 cuplikan dan tunda kelima sebanyak 25 cuplikan, dan demikian seterusnya. Sistem prediksi ini orde lima dapat digambarkan pada gambar 3.2 berikut.
Z-1
Z-2
Z-3
Z-4
Z-5
Gambar 3.2 Sistem prediksi adaptif orde lima

x k merupakan sinyal masukan yang berupa runtun k-nilai yang sekaligus
menjadi tanggapan yang dikehendaki. Sinyal x k akan ditunda sebanyak 5 kali yang mana masing-masing tunda akan dikali oleh masing-masing bobot yang nilainya berubah secara adaptif. Penjumlahan kelima nilai x k tertunda yang telah dikalikan bobot w masing-masing ini menghasilkan nilai keluaran y k yang merupakan prediksi terhadap nilai x k . Selisih antara nilai keluaran y k dengan x k merupakan nilai galat yang akan digunakan untuk memperbarui nilai bobot menurut persamaan (3.1) berikut
Wk +1 = Wk + 2ek X k
Dengan konstanta perolehan ditetapkan sebesar 0,52
(3.1)
Dari persamaan diatas, dapat dilihat bahwa perubahan nilai bobot dipengaruhi oleh galat yang muncul dari perhitungan sebelumnya. Galat yang muncul dihitung menurut persamaan (3.2) dan keluaran Yk diperoleh menurut persamaan (3.3)
ek = x k y k
y k = x k 1 w1 + x k 2 w2 + x k 3 w3 + x k 4 w4 + x k 5 w5
(3.2) (3.3) Pada iterasi ke-861, nilai bobot w1, w2, w3, w4 dan w5 akan diambil sebagai
data untuk mengklasifikasikan komponen konsonan awal. Membuktikan bahwa pengucapan konsonan hanya berlangsung sesaat dan berada pada awal suku kata, tetapi konsonan juga akan mengalami masa transisi ke vokal yang lebih stabil, yang dihitung berhenti pada sampel ke 1365, maka pada iterasi ke 1365, bobot w1 sampai w5 kembali diambil untuk diklarifikasi sebagai komponen konsonan akhir. Pada gambar 3.1 dapat dilihat garis batas pembagian komponen konsonan ini. Kemudian pada iterasi ke-7950, nilai bobot digunakan untuk mengklasifikasikan vokal dari suku kata yang diucapkan. Masing-masing fonem baik vokal maupun konsonan diberi label untuk klasifikasi dalam pembagian kelas. Pembagian kelas untuk konsonan dan vokal dapat dilihat pada tabel 3.1 berikut ini. Tabel 3.1 Label kelas konsonan dan vokal Konsonan akhir k/ kelas 8 Konsonan awal /k/ Kelas 5 Vokal /a/ Kelas 1
/p/ /m/ /s/
9 10 11
/p/ /m/ /s/
6 7 8
/e/ /i/ /o/ /u/
2 3 4 5
Dari tabel 3.1 di atas, dapat dipahami bahwa, dalam pelatihan sistem, suku kata ka akan mendapat label 8 5 1. Label 8 dan 5 merupakan label konsonan /k/ dan label 1 merupakan label vokal /a/. Suku kata mi mendapat label 10 7 3, suku kata su mendapat label 11 8 2, dan seterusnya. Begitu pula dalam pengujian, apabila data pengujian menunjukkan label 9 6 4 misalnya, maka data pengujian tersebut akan digolongkan kedalam suku kata po. 3.3 Langkah-langkah simulasi 3.3.1 Perekaman suara Suara direkam dengan menggunakan program aplikasi Cool Edit Pro, dan dicuplik dengan frekuensi 44100 sampel per detik, channel mono dan resolusi 16-bit seperti terlihat pada gambar 3.3 di bawah ini.
Gambar. 3.3 Pengaturan perekaman Cool Edit Pro Suara yang telah direkam disimpan dalam bentuk *.WAV dan diletakkan pada direktori yang sama dengan direktori program matlab yang akan digunakan untuk membaca suara tersebut. 3.3.2 Pelatihan Sinyal suara yang telah direkam sebelumnya, dibaca oleh matlab dengan perintah wavread dan kemudian diekstraksi nilai bobotnya menggunakan sistem prediksi adaptif. Kemudian data bobot tersebut diberi label sesuai kelasnya untuk membentuk data pelatihan yang akan digunakan untuk mengklasifikasikan data uji. Bagan pelatihan ini diberikan pada gambar 3.4 dibawah ini.
Pengolahan Sinyal suara masukan Data digital Ekstraksi bobot Vektor bobot Pelabelan konsonan & Vokal
Data Pelatihan
Gambar 3.4 Bagan proses pelatihan pengenalan suara Jumlah suara yang digunakan sebagai pelatihan bagi sistem pengenal suara ini adalah 40 buah untuk masing-masing suku kata. Sehingga untuk 20 suku kata yang digunakan akan menghasilkan data pelatihan mencapai 800 buah. Data ini kemudian diberi label sesuai kelasnya masing-masing seperti yang tercantum pada tabel 3.1 Data bobot yang didapat dari hasil pelatihan akan disimpan dalam format *.mat. Komponen konsonan awal dalam suku kata yang diucapkan disimpan dengan nama file latprekons.mat, komponen konsonan akhir disimpan dengan nama latkons.mat, sedangkan komponen vokalnya disimpan dengan nama file latvok.mat. Sehingga pada akhir pelatihan, setiap suku kata mendapatkan label pada satu kelompok kelas yang sama, seperti yang ditunjukkan pada tabel 3.2 berikut:
Tabel 3.2 Klasifikasi masing-masing suku kata No Suku kata 1 2 3 4 5 6 7 8 9 10 Ka Ke Ki Ko Ku Pa Pe Pi Po Pu Kelas 851 852 853 854 855 961 962 963 964 965 No 11 12 13 14 15 16 17 18 19 20 Suku kata Ma Me Mi Mo Mu Sa Se Si So Su Kelas 10 7 1 10 7 2 10 7 3 10 7 4 10 7 5 11 8 1 11 8 2 11 8 3 11 8 4 11 8 5
3.3.3 Pengujian Setelah tahap pelatihan selesai dilaksanakan maka akan didapat 800 data konsonan yang terbagi dalam 4 kelas yaitu /k/, /m/, /p/ dan /s/ dan 800 data vokal yang terbagi dalam 5 kelas, yaitu, /a/, /e/, /i/, /o/, dan /u/. Data inilah yang selanjutnya digunakan untuk menguji kemampuan sistem untuk mengenali suara yang diberikan kepadanya. Pengujian dilakukan dengan metode klasifikasi k-nearest neighbor (KNN) dengan nilai K=5. Hal ini berarti sistem akan mencari 5 data yang memiliki jarak terdekat dengan data uji dan kemudian melakukan voting untuk menentukan kelas dari data uji tersebut. Bagan untuk tahap pengujian ini dapat dilihat pada gambar 3.5 berikut:
Pengolahan Sinyal suara masukan Data digital Ekstraksi bobot Vektor bobot Pengklasifikasian Data Pelatihan
Pengenalan Suara
Gambar 3.5 Bagan pengujian pengenalan suara Dari gambar 3.5 diatas dapat dilihat bahwa dua langkah awal pengolahan sinyal suara tetap sama dengan pengolahan sinyal pada saat pelatihan. Perbedaan muncul pada langkah ketiga yaitu pengklasifikasian dengan metode KNN. Dengan membandingkan koordinat vektor bobot dengan data pelatihan yang dimiliki, maka suara uji akan dapat dikenali. Pengujian dilakukan sebanyak 20 kali untuk masing-masing suku kata sehingga total pengujian yang dilakukan sebanyak 400 kali. Dari pengujian tersebut dilihat berapa kali sistem berhasil dalam mengenali suara uji tersebut secara benar. 3.4 Pemrograman Matlab Perancangan sistem dalam Matlab dilakukan sebagai berikut:
Pertama, suara yang direkam disimpan dalam format *.WAV dibaca menggunakan perintah: a= wavread (namafile); a=a(1:8000) kemudian nilai orde ditentukan melalui masukan dari pengguna. Nilai orde ini digunakan untuk menentukan jumlah bobot yang digunakan. orde= input ('jumlah orde= '); for i=1:orde w(i)=1; end Untuk membangkitkan sinyal tunda, dilakukan dengan perintah sebagai berikut: tunda=b(k-(5*orde-5):5:k)'; data= fliplr(tunda); Dengan demikian, dihasilkan vektor tunda yang berdimensi sama dengan vektor bobot dan memiliki selisih lima antar elemennya. Algoritma LMS untuk mengekstraksi nilai bobot dilakukan dengan perintah sebagai berikut: a) Untuk komponen konsonan awal
for k= 1:861 t=b(k+5); y=data*w'; e(k)=t-y; w=w+2*mu*e(k)*data; end bobotprekons = w; b) Untuk komponen konsonan akhir for k= 861:1365 t=b(k+5); y=data*w'; e(k)=t-y; w=w+2*mu*e(k)*data; end bobotkons = w; c) Untuk komponen Vokal for k= 1365:7950 t=a(k+5); y=data*w'; e(k)=t-y; w=w+2*mu*e(k)*data;
end bobotvok = w; Nilai bobot awal w sebelumnya telah ditetapkan sama dengan 1, dan konstanta perolehan (gain) ditetapkan sama dengan 0,52. Untuk proses pelatihan, dilakukan pelatihan suara sebanyak masing-masing 40 kali, sehingga untuk 20 jenis suku kata akan dihasilkan 800 data nilai bobot yang kemudian diberi label sesuai kelasnya dengan perintah sebagai berikut: mprekons=[zeros(1,orde)]; mkons=[zeros(1,orde)]; mvok=[zeros(1,orde)]; for i = 1:800 a= datalat(:,(i)); [wprekons,wkons, wvok, e]=predictor2 (a,orde); bobotprekons = wprekons; mprekons= [mprekons; bobotprekons]; bobotkons = wkons; mkons= [mkons; bobotkons]; bobotvok= wvok; mvok=[mvok; bobotvok]; end [r,c]= size(mkons);
bprekons=[8*ones(1,200) 9*ones(1,200) 10*ones(1,200) 11*ones(1,200)]'; bkons=[5*ones(1,200) 6*ones(1,200) 7*ones(1,200) 8*ones(1,200)]'; bvok=[ones(1,40) 2*ones(1,40) 3*ones(1,40) 4*ones(1,40) 5*ones(1,40)... ones(1,40) 2*ones(1,40) 3*ones(1,40) 4*ones(1,40) 5*ones(1,40) ... ones(1,40) 2*ones(1,40) 3*ones(1,40) 4*ones(1,40) 5*ones(1,40) ones(1,40)... 2*ones(1,40) 3*ones(1,40) 4*ones(1,40) 5*ones(1,40)]'; mprekons=mprekons(2:r, 1:c); latprekons=[mprekons bprekons]; save latprekons mkons=mkons(2:r, 1:c); latkons=[mkons bkons]; save latkons mvok=mvok(2:r, 1:c); latvok=[mvok bvok]; save latvok Untuk proses pengujian, bobot konsonan dan vokal yang dihasilkan tidak diberi label, melainkan diklasifikasikan menggunakan algoritma KNN dengan jumlah k=5, perintah yang digunakan adalah sebagai berikut: prekon =load ('latprekons); j=prekon (1:800, 1:orde);
l=prekon (1:800, orde+1); prekonsonan= nearest_Neighbor(j,l, bobotprekons, 5); kon =load ('latkons); x= kon (1:800, 1:orde); y= kon (1:800, orde+1); konsonan= nearest_Neighbor(x,y, bobotkons, 5); vok =load ('latvok'); u= vok (1:800, 1:orde); o= vok (1:800, orde+1); vokal= nearest_Neighbor(u,o, bobotvok, 5); Perintah nearest_Neighbor berfungsi memanggil fungsi nearest_Neighbor yang berisikan perintah sebagai berikut: L= length(train_targets); Uc=unique(train_targets); if(L<K) error('seharusnya data L lebih panjang dari K') end N=size(test_patterns,1); test_targets=zeros(N,1); for i=1:N jar=(train_patterns- repmat(test_patterns(i,:),L,1)).^2;
dist=sum(jar'); [m, indices]= sort(dist); n=hist(train_targets(indices(1:K)),Uc); [m, best]=max(n); test_targets(i)=Uc(best); end Hasil pengelompokan nearest_Neighbor ini kemudian digunakan untuk menentukan suku kata yang diucapkan dengan menggunakan perintah sebagai berikut: suku= [prekonsonan konsonan vokal] Dari nilai suku inilah kemudian sistem mengenali suku kata yang diucapkan.
BAB IV
HASIL PERCOBAAN DAN PEMBAHASAN
4.1 Pemetaan Bobot Pada prinsipnya, sistem pengenalan suara ini memetakan bobot pada suatu sistem koordinat. Peletakan bobot pada sistem koordinat dipetakan per sampel suara pada sistem koordinat 2 dimensi. Karena untuk menjadikan orde sistem sebagai acuan nilai ordinat sangatlah tidak memungkinkan karena nilai orde yang lebih dari 3. Untuk skema prediksi orde lima, pemetaan bobot ditunjukkan pada gambar 4.1, 4.2 dan 4.3 dengan menggunakan data pengujian suku kata su sebagai contoh.
Gambar 4.1 Peta nilai bobot konsonan awal suku kata su Gambar 4.1 merupakan gambar sebaran lima bobot konsonan awal untuk 20 kali pengujian. Titik-titik pada satu garis vertikal merupakan nilai-nilai bobot dari satu buah sampel suara dan merupakan perwakilan sebuah titik koordinat pada bidang lima dimensi. Kesan bentuk rongga (tanpa nilai bobot) pada kisaran nilai +/-
1 merupakan indikator ciri yang bisa diidentifikasi secara khusus sebagai konsonan awal /s/.
Gambar 4.2 Peta nilai bobot konsonan akhir suku kata su Gambar 4.2 merupakan gambar sebaran lima bobot pada pengenalan komponen konsonan akhir sebagai pemerkaya ciri corak suku kata, demi tercapainya tujuan identifikasi suku kata yang akurat. Unsur fonem konsonan yang melekat pada pengucapan awal suku kata adalah alasan kenapa konsonan akhir ini disematkan pada identifikasi suku kata. Nampak pula rongga sekitar nilai 0.9-1, sebagai kemungkinan ciri khusus yang terlihat. Dari gambar 4.1 dan gambar 4.2, secara kasat mata dan perhitungan, bobot memiliki simbangan baku yang cukup besar, maka untuk memenuhi tujuan dari tugas akhir ini, ada beberapa tambahan pelabelan pada konsonan, tetapi tidak meninggalkan unsur komponen konsonan yang sebenarnya. Seperti contohnya ketika komponen /k/ yang seharusnya berlabel 8 5, akan memiliki beberapa kemungkinan
penambahan label, seperti label 8 6, karena label 8 6 mengandung unsur angka 8, walaupun 8 6 juga bisa dimasukkan pada label konsonan /p/, karena mengandung angka 6. Pelabelan di atas disesuaikan dengan hasil simulasi.
Gambar 4.3 Peta nilai bobot vokal akhir suku kata su Gambar diatas adalah pemetaan bobot vokal, ketidakstabilan nilai bobot seperti yang tertera pada gambar 6 tidak lantas menjadi satu satunya kendala untuk keakuratan pengenalan suku kata. Nilai bobot yang tidak menyentuh angka 0.9 bisa menjadi corak khas vokal /u/ ini. .Data hasil pengujian selengkapnya dapat dilihat pada lampiran I.
4.2 Hasil Pengujian Setelah melakukan pengujian dengan menggunakan masing-masing 20 data untuk setiap suku kata, didapat hasil percobaan yang menunjukkan bahwa sistem telah dapat melakukan tugas pengenalan dengan cukup baik. 4.2.1 Tingkat Keberhasilan Pengenalan Suku Kata Pada pengujian menggunakan 12 buah bobot, didapat tingkat keberhasilan pengenalan suku kata yang disajikan pada 4 buah tabel berikut: Tabel 4.3 Tingkat pengenalan suku kata kelompok /k/ Suku kata Kesalahan Presentase (%) ka 8 60 ke 2 90 ki 6 70 ko 2 90 ku 2 90 total 20 80
Tabel 4.3 Dari tabel 1 dapat dilihat bahwa tingkat keberhasilan pengenalan suku kata yang berkonsonan /k/ adalah 80%, dengan pengenalan suku kata terendah pada suku kata ka yaitu 60%, dan tertinggi pada suku kata ke,ko dan ku sebesar 90%. Presentasi keberhasilan suku kata berkonsonan /p/ pada jumlah orde yang sama terlihat di tabel di bawah ini.
Tabel 4.4 Tingkat pengenalan suku kata kelompok /p/ Suku kata Kesalahan Presentase (%) pa 2 90 pe 1 95 pi 0 100 po 1 95 pu 0 100 total 4 96
Tabel 4.4 menunjukan tingkat keberhasilan yang cukup tinggi pada suku kata berkonsonan /p/ yaitu 96%. Dengan presentase keberhasilan tertinggi pada suku kata pi dan pu sebesar 100% dan terendah pada suku kata pa sebesar 90%. Tebel 4.5 di bawah ini menunjukan presentasi keberhasilan suku kata berkonsonan /m/. Tabel 4.5 Tingkat pengenalan suku kata kelompok /m/ Suku kata Kesalahan Presentase (%) ma 0 100 me 0 100 mi 8 60 mo 1 95 mu 4 80 total 13 87
Presentasi keberhasilan tertitinggi dicapai suku kata ma dan me sebesar 100% dan terendah terdapat pada pengujian suku kata mi yaitu 60%. Dengan rata rata presentase keberhasilan sebesar 87%. Tabel 4.5 Tingkat pengenalan suku kata kelompok /s/ Suku kata Kesalahan sa 2 se 0 100 si 2 90 so 1 95 su 0 100 total 5 95
Presentase (%) 90
Tabel 4.5 berisi presentase keberhasilan pengenalan suku kata berkonsonan /s/, dengan rata rata presentase keberhasilan sebesar 95% dengan se dan su yang memiliki presentase pengenalan suku kata tertinggi sebesar 100% dan sa serta si yang memiliki presentase pengenalan suku kata terendah sebesar 90%. Dari hasil yang tersaji pada 4 buah tabel di atas, terlihat bahwa kelompok suku kata berawalan konsonan /p/ memiliki tingkat keberhasilan rata-rata tertinggi, yaitu 96%, sedangkan kelompok suku kata berawalan konsonan /k/ memiliki tingkat keberhasilan rata-rata terendah, yaitu mencapai 80%. 4.2.2 Tingkat Keberhasilan Pengenalan Fonem Ditinjau dari komponen fonem, tingkat keberhasilan sistem mengenali komponen konsonan maupun vokal disajikan pada dua buah tabel berikut: Tabel 4.6 Tingkat pengenalan komponen konsonan konsonan Kesalahan Presentase (%) /k/ 20 80 /p/ 2 98 /m/ 5 95 /s/ 5 95
Tabel 4.7 Tingkat pengenalan komponen vokal vokal Kesalahan Presentase (%) /a/ 0 100 /e/ 1 /i/ 7 /o/ 7 /u/ 0
98,75 91,25 91,25 100
Pembacaan konsonan /k/ memiliki tingkat kesalahan yang tinggi yaitu sebesar 20 kali gagal pengujian atau memiliki presentasi keberhasilan sebesar 80%, dan presentase keberhasilan pengenalan konsonan tertinggi ada pada konsonan /p/ yaitu sebesar 98%. Pembacaan vokal /i/ dan /o/ memiliki presentase keberhasilan yang rendah dalam pengenalannya dibandingkan dengan vokal vokal yang lain yaitu sebesar 91,25%, sedangkan presentase keberhasilan yang tertinggi diperoleh vokal /a/ dan /u/ yaitu sebesar 100%. Rata rata presentase keberhasilan pengenalan konsonan pada orde 12 adalah sebesar 92% dan vokal sebesar 96,25% 4.3 Pengujian dengan berbagai jumlah bobot Jumlah orde yang digunakan merupakan jumlah dimensi dalam proses klasifikasi k-nearest neighbor. Atau dalam k-nearest neighbor jumlah orde sangat menentukan dalam pengambilan keputusan, dengan semakin banyaknya data/bobot yang masuk maka akan semakin lama proses pengklasifikasiannya, karena otomatis akan menambah data yang akan dibandingkan. Di bawah ini adalah tabel pengaruh jumlah orde terhadap presentase keberhasilan pengenalan suku kata.
Tabel 4.8 Pengujian dengan berbagai nilai orde orde Rata rata presentasi keberhasilan (%) Ka - Ku 4 5 6 9 12 14 70 76 74 76 80 85 Pa - Pu 90 90 86 92 96 97 Ma - Mu 55 60 61 71 82 83 Sa - Su 92 84 85 86 95 96
Dari tabel 4.8 dapat dilihat bahwa kecenderungan positif nampak ketika penambahan bobot dilakukan, ketika penambahan ciri (bobot) dilakukan, maka semakin spesifik pula data suara yang kita maksud dan akan berakibat semakin akuratnya klasifikasi yang dilakukan k-nearest neighbor. Tabel lengkap tentang presentase keberhasilan setiap orde ada di Lampiran I
BAB V KESIMPULAN & SARAN
5.1 Kesimpulan Dari keseluruhan proses yang telah dilaksanakan dapat disimpulkan bahwa sistem prediksi adaptif dapat digunakan sebagai algoritma untuk identifikasi suara terutama untuk pengenalan suku kata dalam bahasa Indonesia. Tingkat keberhasilan sistem dalam mengenali fonem-fonem baik konsonan maupun vokal sudah cukup baik, walaupun masih perlu beberapa peningkatan terutama pada kemampuan pengenalan komponen konsonan. Sistem prediksi mengalami kesulitan dalam mengenali beberapa jenis konsonan karena rentang waktu pengucapan yang sangat singkat sehingga perubahan bobot masih dalam keadaan transient. Pemilihan nilai orde juga berpengaruh pada tingkat keberhasilan pengenalan. Semakin banyak orde yang digunakan, semakin besar pula tingkat keberhasilannya. 5.2 Saran Kesederhanaan serta kemudahan aplikasi sistem pengenalan suara
menggunakan metode prediksi adaptif memberi peluang sangat baik bagi pengembangan sistem ini ke depannya. Sistem prediksi adaptif tidak mensyaratkan adanya transformasi sinyal masukan kedalam kawasan fourier sehingga lebih mudah dipahami bagi orang awam sekalipun, namun tentu dalam perkembangan ke depan penggabungan tersebut mungkin saja dilakukan. Selain itu dengan masih banyaknya
alternatif cara untuk mengembangkan serta meningkatkan performa sistem, sistem ini dapat dikembangkan lebih lanjut untuk pengenalan beberapa pola suku kata lain serta kemudian dikembangkan untuk pengenalan kata hingga akhirnya dapat dikembangkan untuk pengenalan kalimat. Perbaikan kemampuan sistem dalam mengenali isyarat masukan dapat dilakukan dengan beberapa cara, diantaranya adalah dengan menambah jumlah sampel , menambah kelas konsonan, mengubah jumlah k-tetangga pada sistem klasifikasi, ataupun mengubah titik bobot penglasifikasi konsonan pada sistem prediksi, ataupun menggabungkan metode adaptif prediksi ini dengan metode lain, seperti misalnya teknik wavelet yang merupakan teknik yang sangat berkembang belakangan ini
DAFTAR PUSTAKA
Alan S. Willsky, Alan V. Oppenheim with S. Hamid , 1996. Signal and System (2nd edition), New Jersey : Prentice Hall. Basuki, T.A., 2000, Pengenalan Suku Kata Bahasa Indonesia Menggunakan Finite-State Automata, Majalah Integral, vol. 5 no. 2. Bayhaki, Achmad (2007). Penekanan Derau secara Adaptif pada Pengenalan Ucapan Kata. Makalah skripsi S1, Jurusan Teknik Elektro UNDIP. Beccheti, C. dan L.P. Riccoti, 1999, Speech Recogniton Theory and C++ Implementation, John Wiley & Sons Ltd, Chichester. Juang, B.H. dan R.L. Rabiner, 2004, Automatic Speech Recognition A Brief History of the Technology Development, Georgia Institut of Technology, Atlanta. Matlab 7.8.0 Help Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan, 1979, Pedoman Umum Ejaan Bahasa Indonesia Yang Disempurnakan. Widrow. B. dan S. D. Stearns, 1985, Adaptive Signal Processing, Prentice-Hall, New Jersey. http://lecturer.eepis-its.edu/~tribudi/LN_SIP_Prak/. Diakses tanggal 19 April 2011. http://www.youtube.com/user/UNSWelearning#p/c/09D3A5433313E ADB. Diakses tanggal 27 Mei 2011. http://www.youtube.com/user/UNSWelearning#p/c/A480D1979B10 D8F5. Diakses tanggal 1 Juni 2011.

Laporan Skripsi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Laporan Skripsi

Diunggah oleh

Hak Cipta:

Format Tersedia

PENGENALAN ISYARAT TUTUR SUKU KATA BAHASA INDONESIA MENGGUNAKAN SKEMA PREDIKSI ADAPTIF SKRIPSI

FAJAR NUGROHO 08/266647/ET/05972

Skripsi ini saya persembahkan kepada:

Bapa dan Tuhan kita Yesus Kristus

Kedua orang tua, dan nenek di rumah

Kakak dan adikku tercinta

Yogyakarta, 4 Juli 2011

Key words: adaptive prediction scheme, Speech Recognition, syllable recognition

KESIMPULAN DAN SARAN

BAB II DASAR TEORI

Gambar 2.1 Organ organ produksi suara.

a) Vokal (V) contoh: a-nak, ba-u

b) Vokal-Konsonan (V-K) contoh: an-da, da-un

c) Konsonan-Vokal (K-V) contoh: se-bab, man-di

Gambar 2.3 Sistem adaptif kalang terbuka

Gambar 2.4 Sistem adaptif kalang tertutup

Dengan vektor bobot dinyatakan sebagai

dalam sebuah notasi vektor

dilihat pada gambar 2.5 dan gambar 2.6 berikut.

Gambar 2.5 Sistem adaptif masukan jamak

ek2 ek w0 w0 . . = . = 2e . = -2e x k kk . . ek2 ek w0 w0

d k = tanggapan yang diinginkan (desired response).

(2.8) Tanggapan yang diinginkan

vektor sinyal masukan

Gambar 2.7 Bentuk umum linear combiner

Tanggapan yang diinginkan +

Gambar 2.9 Sistem Prediksi Adaptif

Gambar 2.11 Contoh klasifikasi k-nearest neighbor

Persamaan klasifikasi dapat ditulis sebagai berikut [Plannerer, 2005]: jika

dwv x)( = min d x,({ pk, v )}

(2.9) ; k = 0,1,,( k v -1)

Persamaan ini dapat pula ditulis dalam bentuk perkalian skalar

Dengan t menyatakan transpose vektor.

BAB III PERANCANGAN SISTEM & SIMULASI

Gambar 3.2 Sistem prediksi adaptif orde lima

Dengan konstanta perolehan ditetapkan sebesar 0,52

/p/ /m/ /s/

/p/ /m/ /s/

/e/ /i/ /o/ /u/

HASIL PERCOBAAN DAN PEMBAHASAN

98,75 91,25 91,25 100

BAB V KESIMPULAN & SARAN

Anda mungkin juga menyukai