Artikel PDF
Artikel PDF
ABSTRAK: Konversi teks menjadi suara (text to speech) merupakan perangkat lunak yang
dapat menyuarakan tulisan yang diinputkan oleh pemakai (user). Sistem konversi teks menjadi
suara tersusun atas dua sistem yaitu analisa teks dan penghasil suara percakapan. Untuk
mewujudkan program konversi teks mejadi suara tersebut, pada penelitian ini memanfaatkan
metode penggal kata Finite State Automata. Dengan mengimplementasikan metode Finite State
Automata pada Delphi, pada penelitian diperoleh aplikasi konversi teks menjadi suara dengan
input dan output bahasa Indonesia.
ABSTRACT: text to speech convertion is a software for voicing text that inputed by user. text to
speech convertion system’s arrenged into two systems they are natural language processing and
digital signal processing. To create text to speech convertion program’s, in this research use
spelling word method is Finite State Automata. By implementation of Finite State Automata
method into Delphi, was gotten an application of text to speech convertion with input and output
Indonesian language.
Salah satu perkembangan di bidang komputasi yang mengalami penelitian yang lama
adalah pensintesa ucapan. Pensintesa ucapan memiliki kinerja untuk menyuarakan tulisan yang
diinputkan oleh pemakai (user). sehingga untuk mewujudkan adanya pensintesa ucapan,
haruslah terdapat perangkat lunak yang seolah-olah membacakan tulisan kepada pemakai (user).
Seiring perkembangannya, pensintesa ucapan dengan input bahasa Inggris telah banyak
diciptakan karena mmayoritas perangkat keras telah dibekali dengan bahasa Inggris. Jika
kalimat yang diinputkan adalah bahasa Indonesia, output yang dihasilkan berupa bahasa Inggris.
Padahal output yang diharapkan berupa bahasa Indonesia.
Untuk mewujudkan konversi teks menjadi suara dengan input dan output bahasa
Indonesia, diperlukan adanya metode untuk mengonversi kalimat yang diinputkan berdasarkan
ketatabahasaan. Dari kalimat yang sesuai dengan ketatabahasaan digunakan untuk menciptakan
realisasi fonetik dari setiap fonem yang ada.
Hasil pada FSA tingkatan pertama dapat menjadi masukan pada transisi FSA tingkatan
kedua.
Keterangan:
q1 = mengenali blank/spasi
q2 = mengenali V
q3 = mengenali VK
q4 = mengenali K
q5 = mengenali KKV atau KKKV
q6 = mengenali KKVK atau KKKVK
q7 = mengenali KV
q8 = mengenali KVK
GOLDWAVE
Menurut Strombon (2007:4) goldwave adalah suatu perangkat lunak audio editor yang
cukup handal. Selain itu, goldwave dapat mengedit audio dari hal yang paling sederhana seperti
merekam sampai mengedit hal yang sangat kompleks seperti audio processing. Fitur-fitur yang
disediakan oleh GoldWave adalah sebagai berikut.
Mendukung hampir semua jenis format audio
Dapat memproses berapapun banyaknya audio yang diinginkan dengan batch processing
Dapat merekam audio dari source apapun yang mendukung kinerja PC
Dilengkapi dengan perintah dasar audio editing seperti cut, copy, trim, paste, replace,
overwrite, dan lain-lain.
Dilengkapi dengan puluh an audio efek variasi
Dapat mengatur equalizer sesuai yang diinginkan
Dapat mengcopy audio langsung dari CD
Dapat menganalisa audio berdasarkan frekuensi dan amplitude visualnya
HASIL
Aplikasi program konversi teks menjadi suara menghasilkan tabel sebagai berikut.
PEMBAHASAN
1. Tahap Perencanaan
Pada tahap ini, direncanakan bahwa input, output dan proses dari program ini adalah
sebagai berikut.
Input : teks/kalimat
Output : suara
Proses antara input teks dengan mendapatkan output suara membutuhkan proses yang tidak
singkat. Proses-proses tersebut sering disebut sebagai tahapan, tahapan-tahapan dapat dilihat
pada diagram berikut :
Input teks
Menghapus simbol-
simbol pada input teks
Pemenggalan suku
kata
Output (suara)
Perekaman suara
2. Tahap Pelaksanaan
Tahap pelaksanaan ini merupakan tahap terapan dari perencanaan yang telah dibuat.
Pelaksanaan dari proses yang telah direncanakan adalah sebagai berikut.
Menghapus Simbol-Simbol pada Input Teks
Simbol-simbol pada input teks terdiri dari (:), (;), (,), (.), (‘), (“), (?), (!), (@), (#), ($),
(%), (&), (*), ( ( ), ( ) ), ({), (}), ([), (]), (~), (/). Proses penghapusan simbol-simbol pada teks
yang telah diinputkan bertujuan agar terdapat keseragaman antara input teks dengan file suara
yang dibuat, sehingga mengurangi kemungkinan ketidakadaan data pada file suara.
Pada software Delphi, penghapusan simbol-simbol pada input teks memanfaatkan fungsi
delete(input.Text, letak simbol, jumlah simbol).
Pemenggalan Suku Kata
Pada proses pemenggalan suku kata ini terdapat dua macam metode yaitu menggunakan
metode Finite State Automata (FSA) dan pemenggalan suku kata berdasarkan pola umum
bahasa Indonesia. Berdasarkan dua metode tersebut diperoleh perbandingan sebagai berikut :
No Finite State Automata (FSA) No Pola umum bahasa Indonesia
Tingkat pertama 1 V
1 V* 2 VK
2 KV** 3 KV
Tingkat kedua 4 KVK
1 V* 5 KKV
2 VK 6 KKVK
3 VKK*** 7 VKK
4 KV** 8 KVKK
5 KVK 9 KKVKK
6 KKV 10 KKKV
7 KKVK 11 KKKVK
8 KKKV
9 KKKVK
Tingkat ketiga
1 VKK***
2 KVKK
3 KKVKK
Dari tabel tersebut disimpulkan bahwa metode menggunakan Finite State Automata
(FSA) ataupun pola umum bahasa Indonesia memiliki kesamaan dalam pemenggalan suku kata,
sehingga jika ketiga tingkatan pada metode Finite State Automata (FSA) digabungkan sama
dengan pola umum bahasa Indonesia.
Output Suara
Pada proses akhir yaitu output suara, suara yang dihasilkan dari proses rekaman
berekstensi .wav. Sehingga dalam aplikasi pada Delphi 7 memanfaatkan
sndPlaySound(lpszSoundName:PAnsiChar;uFlags:Cardinal). Selain itu, untuk mendapatkan
suku kata-suku kata yang telah dipenggal memanfaatkan fungsi split(const Delimiter:Char;
Input:String; const String:TString).
Perekaman Suara
File suara pada program aplikasi konversi teks menjadi suara ini diperoleh dari hasil
perekaman suara pada GoldWave. Proses pengambilan file suara adalah sebagai berikut.
1. Buka aplikasi GoldWave.
2. Klik rekam pada GoldWave (terletak pada tab control). Perekaman suara dapat
berbentuk persuku kata atau kumpulan dari suku kata.
3. Jika perekaman berbentuk kumpulan suku kata, maka langkah selanjutnya adalah
pemotongan kumpulan suku kata menjadi persuku kata. Cara pemotongannya adalah blok
suku kata yang diinginkan, kemudian klik trim (terdapat pada tab GoldWave). Pada
pemotongan suku kata, diusahakan terdapat ruang jeda dari suara suku kata. Hal ini
bertujuan agar saat program aplikasi konversi teks menjadi suara dapat terdengar secara
keseluruhan.
4. Jika perekaman berbentuk persuku kata, maka dapat diatur ruang jeda dari suara suku kata
seperti nomor 3.
5. Klik untuk menyimpan suara persuku kata dengan nama file seperti suara persuku
kata. Hal ini bertujuan untuk memudahkan pengambilan suara suku kata berdasarkan
penggal kata saat program aplikasi konversi teks menjadi suara dijalankan.
3. Tahap Akhir
Setelah melalui tahap perencanaan dan tahap pelaksanaan, pada tahap akhir ini
diharapkan semua rekaman suku kata yang berkaitan sudah tersimpan pada saat tahap
pelaksanaan. Sehingga untuk mengetahui data suku kata yang belum tersimpan diperlukan
pendataan suku kata-suku kata.
4. Perancangan Uji Coba Program
Pada tahap perancangan uji coba program ini, dilakukan pengujian untuk menguji
ketepatan pemenggalan kata dan kesesuaian suara yang dihasilkan. Uji coba program dilakukan
dengan jumlah teks sebanyak 50 sehingga akan diperoleh hasil uji sebanyak 100 dengan rincian
50 hasil uji penggal kata dan 50 hasil suara. Teks yang dipilih diusahakan mencakup semua kata
yang terdapat pada jenis-jenis pemenggalan kata seperti konsonan rangkap ditengah, konsonan
lebih dari dua di tengah, vokal rangkap di tengah, gugus konsonan, kata berimbuhan. Berikut
merupakan Tabel Rancangan Uji Kata.
Tabel 2. Rancangan Uji Kata
Penggal kata
No Teks Hasil penggal kata Keterangan Hasil suara
EYD
Hasil penggal kata menunjukkan hasil pemenggalan dari teks yang diinputkan. Hasil suara
menunjukkan hasil suara yang sesuai dengan hasil penggal kata dan data yang diinputkan.
KESIMPULAN
Berdasarkan uraian di atas, diperoleh kesimpulan sebagai berikut.
1. Tahapan – tahapan pada aplikasi konversi teks menjadi suara bahasa Indonesia adalah
menginputkan kalimat ke dalam program kemudian program akan menghapus simbol-simbol
yang terdapat pada kalimat yang diinputkan, jika kalimat yang diinputkan tidak mengandung
simbol tidak dilakukan proses apapun. Setelah proses penghapusan simbol, program akan
melakukan pemenggalan suku kata-suku kata dari kalimat hasil proses sebelumnya. Dari
hasil pemenggalan suku kata-suku kata kemudian disuarakan sehingga program
menghasilkan suara yang sesuai dengan hasil pemenggalan kata.
2. Metode yang digunakan untuk memenggal kata menjadi suku kata pada program aplikasi
konversi teks menjadi suara bahasa Indonesia adalah metode Finite State Automata (FSA).
Dalam menerapkan metode terebut pada Delphi memanfaatkan beberapa fungsi yaitu:
Insert
Delete
Copy
3. Untuk menyuarakan suku kata-suku kata pada program aplikasi konversi teks menjadi suara
bahasa Indonesia memanfaatkan fungsi
sndPlaySound(lpszSoundName:PAnsiChar;uFlags:Cardinal).
DAFTAR RUJUKAN
Arman, Arry Akhmad. 2003. Konversi dari Teks ke Ucapan.
(online)(http://indotts.melsa.net.id/Karakteristik Sinyal Ucapan.pdf) diakses pada tanggal
5 September 2012.
Arman, Arry Akhmad. 2003. Proses Pembentukan dan Karakteristik Sinyal Ucapan.
(online)(http://indotts.melsa.net.id/Karakteristik Sinyal Ucapan.pdf) diakses pada tanggal
5 September 2012.
Basuki, Thomas Anung. 2000. Pengenalan Suku Kata Bahasa Indonesia Menggunakan Finite
State Automata. Integral vol.5 no.2: hlm.67, (Online), dalam Integral
(http://home.unpar.ac.id/integral/Volume/Integral/No5/AnungFinal.pdf) diakses 23
Januari 2013.
Dermawan. 2005. Perancangan dan Pembuatan Perangkat Lunak Simple Word Processor with
Spell Checker and Word Suggestor (SWPSCWS) dengan Metode Non Deterministic
Finite Automata. Skripsi tidak diterbitkan. Surabaya: Universitas Kristen Petra.
Divisi Penelitian dan Pengembangan. 2002. Pemrograman Borland Delphi 7 Lengkap dengan
Contoh Aplikasi. Penerbit Andi: Yogyakarta.
Hamzah, Amir. 2009. Teori Bahasa dan Otomata, (Online),
(http://amir.dosen.akprind.ac.id/files/2012/09/TBO_FULL.pdf), diakses pada tanggal 5
Februari 2013.
Hollands, Roy. 1995. Kamus Matematika. Erlangga: Jakarta.
Kadir, Abdul. 2007. Pemrograman Database dengan Delphi 7 Menggunakan Access dan ADO.
Penerbit Andi : Yogyakarta.
Prasetyo, Bambang Eko. 2010. Perbandingan Algoritma Brute Force dan Algoritma Boyer
Moore dalam Pencocokan String pada File Teks. Skripsi tidak diterbitkan. Malang: UM.
Pusat Bahasa Departemen Pendidikan Nasional. 2008. Kamus Bahasa Indonesia. Pusat Bahasa:
Jakarta.
Strombon. 2007. GoldWave Manual, (online), (http://www.ahlalhdeeth.com), diakses pada
tanggal 27 Maret 2013.
Tjiputra, Sudarmono. 2003. Perangkat Lunak Text to Speech dalam Bahasa Indonesia dengan
Metode Phoneme Synthesis. Skripsi tidak diterbitkan. Surabaya: Universitas Kristen
Petra.
Tritoasmoro, Iwan Iwut. (iww@stttelkom.ac.id). 26 Februari 2013. Text to Speech Bahasa
Indonesia dengan Pembangkit Prosodi Menggunakan Metoda Multirate Reccurrent
Neural Network. E-mail kepada Isrokah (ochis91@gmail.com).
Waridah, Ernawati. 2008. EYD & Seputar Kebahasa-Indonesiaan. Kawan Pustaka: Jakarta
Selatan.