Bab I

BAB I PENDAHULUAN 1.
1 Latar Belakang Berbicara adalah cara berkomunikasi yang paling utama dan merupakan bentuk yang paling alami dan efisien untuk pertukaran informasi antar manusia. Jadi, sangatlah masuk akal bahwa pengembangan future techonology saat ini mengarah pada pengembangan speech recognition bahasa manusia untuk Human Computer Interface. Speech recognition dapat didefinisikan sebagai proses pengubahan sinyal suara menjadi serangkaian kata dengan menggunakan algoritma yang telah diimplementasikan pada program komputer. Speech Recognition atau pengenalan suara adalah bidang ilmu komputer yang berhubungan dengan perancangan sistem komputer yang mampu mengenali kata yang diucapkan, teknologi ini memungkinkan komputer untuk
mengidentifikasi kata kata yang diucapkan oleh pembicara. Proses Speech Recognition merupakan salah satu fungsi dari
identifikasi suara. Identifikasi suara dapat menjadi nilai tambah dalam sebuah perintah di komputer, identifikasi suara merupakan cara komunikasi natural
antara manusia dan dapat menghasilkan antarmuka yang baik untuk mengontrol suatu sistem atau aplikasi, bahkan suatu mesin dapat memiliki kemampuan atau tingkah laku yang sama seperti manusia salah satunya adalah dapat mengenali suara seseorang secara langsung dan mengerti kata apa yang diucapkan oleh pembicaranya. Salah satu penerapannya adalah pada pengidentifikasian kata dimana pembicara melakukan sebuah perintah dengan ucapan pada program
komputer, dimana kata yang diucapkan sesuai dan terdapat pada daftar kata didalam database yang berisi record karakter seseorang yang telah tersedia. Dua hal yang menjadi pertimbangan-pertimbangan dalam mengidentifikasi suara yaitu, Inter Speaker Distance (ISD) dan Intra Speaker Variability (ISV). ISD adalah karakteristik antara pembicara yang dibedakan oleh faktor-faktor distribusi populasi dari kestabilan panjang ucapan pembicara dalam ruang parameter yang relevan. ISV disebabkan oleh ketergantungan random lafal pembicara, efek keletihan, kondisi badan yang sakit dalam pengucapan vokal dan kondisi lingkungan Dalam proses pengenalan suara untuk pengidentifikasian kata ini menggunakan suatu algoritma ekstraksi ciri yang disebut Mel Frequency Cepstral Coefficients (MFCC) , dimana MFCC merupakan salah satu metode analisis sinyal suara yang menyatakan ciri-ciri penting dari sinyal suara dalam bentuk koefisien - koefisien FCC. Sedangkan pengenalan polanya menggunakan metode Hidden Markov Model (HMM), dimana metode HMM ini suara dapat diasumsikan sebagai parameter acak dan dicari nilai probabilitas yang maksimum sehingga suara tersebut dapat dikenali dalam pemodelan HMM. Berdasarkan uraian permasalahan diatas maka perlu adanya analisis untuk membuat sebuah program speech recognition dari sebuah suara yang diucapkan yang dapat dikenali oleh suatu mesin, maka pada laporan penelitian tugas akhir ini mengambil topik Speech Recognition dengan Metode Mel Frequency Cepstrum Coefficients dan Hidden Markov Model berbasis Java .
1.2
Rumusan Masalah Berdasarkan latar belakang masalah yang telah dijelaskan di atas, maka
rumusan masalah dari penelitian ini adalah bagaimana membangun sebuah sistem pengenalan suara yang mampu menangkap sinyal suara dan melakukan proses pengenalan suara yang kemudian dirinci sebagai berikut : 1. Bagaimana merancang dan membangun sistem yang dapat menangkap sinyal suara dan mengubahnya menjadi sinyal digital? 2. Bagaimana merancang dan membangun sistem yang dapat memproses sinyal suara yang diinputkan dan melakukan proses pengenalan suara menggunakan algoritma ekstrasi ciri Mel Frequency Cepstral Coefficient yang kemudian dikenali dengan menggunakan pemodelan Hidden Markov Model? 3. Bagaimana sistem yang dibuat dapat mengenali suara yang dimasukkan? 1.3 Batasan Masalah Berdasarkan latar belakang yang telah diuraikan sebelumnya, maka dibuat batasan masalah agar ruang lingkup laporan penelitian ini jelas batasannya. Adapun batasan masalah yang dibuat adalah sebagai berikut : 1. Ada 5 kata yang akan diteliti dan menjadi sample dalam pengenalan kata ini, yaitu : aplikasi, komputer, teknologi, kualitas, dan formasi. 2. Pengucapan dilakukan sebanyak 10 kali oleh tiap pembicara. 3. Pengucapan dilakukan di tempat yang hening untuk mengurangi noise. 4. Setiap pengucapan dilakukan dengan kecepatan dan kekerasan yang berbeda, termasuk jarak pembicara dengan microphone .
5. Jumlah pembicara sebanyak 10 orang, terdiri dari 5 orang pria dan 5 orang wanita sehingga jumlah keseluruhan dari sample data dalam penelitian ini sebanyak 500 sample data. 6. Usia pembicara dibatasi antara 20 25 tahun. 7. Pembicara yang memasukkan suara dianggap dalam kondisi sehat. 8. Metode yang digunakan adalah Mel Frequency Cepstral Coefficients dan Hidden Markov Model (HMM). 9. Pengembangan perangkat lunak menggunakan metode Unified Process. 10. Bahasa pemrograman yang digunakan adalah Java. 11. Output yang dihasilkan adalah kata dikenali atau tidak dikenali. 1.4 Tujuan Secara umum tujuan dari pembuatan laporan tugas akhir ini adalah studi tentang konsep dan implementasi dari pengenalan suara. Secara spesifik tujuan penelitian tugas akhir ini adalah : 1. Membangun sistem yang dapat menangkap sinyal suara dan mengubahnya menjadi sinyal digital. 2. Membangun sistem yang dapat memproses sinyal suara dan melakukan proses pengenalan suara dengan menerapkan metode Mel Frequency Cepstral Coefficient (MFCC) dan HiddenMarkov Model (HMM). 3. Menguji kemampuan sistem pengenalan suara yang telah dibuat.
1.5
Manfaat Adapun manfaat dari penelitian ini adalah menghasilkan sebuah speech
recognition system yang mampu mengenali suara yang dimasukkan pembicara. Hasil penelitian ini juga diharapkan dapat menjadi kerangka dalam membangun sistem keamanan berbasis suara maupun sistem perintah suara (command voice) di masa yang akan datang. 1.6 Sistematika Penulisan Tugas akhir ini nantinya disusun dengan sistematika penulisan sebagai berikut : BAB I PENDAHULUAN Bab ini berisi uraian latar belakang, perumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, metode penelitian, sistematika penulisan dan tinjaun pustaka. BAB II LANDASAN TEORI Pada bab ini membahas tentang teori-teori yang menjadi acuan dalam pembuatan analisa dan pemecahan dari permasalahan yang dibahas, sehingga memudahkan penulis dalam menyelesaikan masalah. BAB III METODOLOGI PENELITIAN Bab ini berisi metode metode peneitian yang digunakan. Pengembangan perangkat lunak menggunakan metode Unified Process, sedangkan penyusuna laporan menggunakan studi literatur dengan mencasri informasi melalui berbagai media, baik cetak maupun elektronik.
BAB IV ANALISIS DAN PERANCANGAN SISTEM Bab ini berisi gambaran umum dari sistem, perancangan proses, pemodelan sistem menggunakan Unified Modelling Process. Serta desain database dan interface. BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM Bab ini berisi pembahasan mengenai implementasi analisis dan desain ke dalam bahasa pemrograman java dan pengujian aplikasi. BAB VI PENUTUP Bab ini berisi kesimpulan Tugas Akhir dan saran-saran sebagai bahan pertimbangan untuk pengembangan penelitian selanjutnya. 1.7 Tinjauan Pustaka Penelitian ini didasarkan pada penelitian sebelumnya mengenai speech recognition maupun penelitian yang menggunakan metode MFCC maupun HMM. Penelitian tersebut antara lain dilakukan oleh Badri Munawar (2010), Anna Dara Andriana (2011), Nurul Akromah (2013) serta Ganesh Tiwari, Madhav Pandey dan Manoj Shresta (2011) yang membahas mengenai speech recognition, MCFF maupun HMM. Salah satu penelitian sebelumnya yang mendasari penelitian ini adalah penelitian yang dilakukan oleh Badri Munawar yang berjudul Pengidentifikasian kata dengan menggunakan Metode Hidden Markov Model (HMM) melalui ekstraksi ciri Linear Predictive Coding (LPC). Penelitian tersebut bertujuan mengimplementasikan metode LPC dan HMM dalam proses pengidentifikasian kata, dengan tingkat keberhasilan 59,2 %.
Penelitian lain dilakukan oleh Anna Dara Andriana yang berjudul Perangkat lunak untuk membuka aplikasi pada komputer dengan perintah suara menggunakan metode Mel Frequency Cepstral Coefficients (MFCC). Penelitian tersebut bertujuan membuat aplikasi perintah suara dengan metode MFCC yang diimplementasikan ke dalam sistem pembuka aplikasi komputer. Penelitian ini menghasilkan tingkat keberhasilan 70, 5%. Dasar penelitian lainnya adalah penelitian yang dilakukan oleh Nurul Akromah yang berjudul Membangun sistem perintah suara pada aplikasi doa sehari hari berbasis Android. Penelitian ini bertujuan untuk memberikan kemudahan kepada pengguna android dalam mengakses aplikasi doa harian. Penelitian lainnya adalah penelitian yang berjudul Text-prompted remote speaker authentication yang dilakukan oleh Ganesh Tiwari, Madhav Pandey dan Manoj Shresta. Penelitian ini bertujuan membuat aplikasi login dengan
menggunakan perintah suara. Penelitian ini menggunakan metode, MFCC, VQ dan HMM.

Bab I

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Bab I

Diunggah oleh

Hak Cipta:

Format Tersedia

BAB I PENDAHULUAN 1.

Anda mungkin juga menyukai