Anda di halaman 1dari 24

Sidang Terbuka Tugas Akhir

Sistem Sintesa Ucapan Alami Bahasa Melayu Pontianak Berbasis


HMM-Based Speech Synthesis System (HTS)

Oleh:
Erwin Guntoro
D1041141014

Program Studi Informatika


Fakultas Teknik
Universitas Tanjungpura
Sidang Terbuka Tugas Akhir

Sistem Sintesa Ucapan Alami Bahasa Melayu Pontianak Berbasis


HMM-Based Speech Synthesis System (HTS)

Dosen Pembimbing I: Dosen Pembimbing II:


Dr. Arif Bijaksana PN, S.T., M.T. Rudy Dwi Nyoto, S.T., M.Eng

Dosen Penguji I: Dosen Penguji II:


Dr. Herry Sujaini, S.T., M.T., Novi Safriadi, S.T., M.T.

Program Studi Informatika


Fakultas Teknik
Universitas Tanjungpura
Metode Penelitian

01 Latar Belakang

Metodologi Penelitian 06
02 Rumusan Masalah

Desain dan Perancangan 07


03 Tujuan Penelitian

Implementasi dan Pengujian 08


04 Pembatasan Masalah

Analisis dan Kesimpulan 09


05 Kajian Terkait
Latar Belakang

Bahasa Daerah Metode Statistika


Melayu Pontianak 1 4 Parametrik

Perkembangan
2 Masalah 5 HMM-Based Speech
Teknologi dan
Synthesis System
Pelestarian Budaya

Text-to-Speech 3 6 Platform Web


Rumusan Masalah 1
Pembatasan
Bagaimana mengimplementasikan
teknologi TTS dengan menggunakan
Masalah
HMM-Based Speech Synthesis System
(HTS) pada bahasa Melayu Pontianak 1. Platform : website
berbasis web ? 2. Korpus latih : 300 buah.
3. Jenis kalimat : kalimat deklaratif.
4. Toolkit HTS, Festival TTs, Festvox, dan
HTS_engine.
Tujuan Penelitian 2 5. Bersifat open-domain.
6. format teks : tanggal, waktu, angka,
membangun sebuah sistem sintesa alfabet.
ucapan bahasa alami bahasa Melayu 7. Jumlah inputan : maksimal 350 karakter.
Pontianak sehingga dapat mensintesa 8. Informasi prosodi: durasi dan fonem.
secara alami ucapan dari teks dalam
bahasa Melayu Pontianak.
Kajian Terkait Mumtaz B. Mustafa, Raja N. Ainon dan Roziati Zainnuddin (2010)
Fakultas Computer Science dan Information Technology
di Universitas Malaya.
EM-HTS: Real-Time HMM-Based Malay Emotional Speech Synthesis

Ntsako Baloyi (2012),


Faculty of Science, Agriculture Universitas Limpopo
A Text-To-Speech Synthesis System for Xitsonga Using Hidden Markov Models

Elok Anggrayni, Sekartedjo, dan Dhany Arifianto (2013),


Teknik Fisika di Institusi Teknologi Sepuluh Nopember (ITS)
Pembuatan Perangkat Basis Data untuk Sintesis Ucapan (Natural Speech Synthesis) Berbahasa
Indonesia Berbasis Hiddem Markov Model (HMM)

Elok Chyaingtyas, dan Dhany Arifianto (2015),


Teknik Fisika di Institut Tekonologi Sepuluh Nopember (ITS).
HMM-based Indonesian Speech Synthesis System with Declarative and Question Senteces Intonation
Metode Penelitian
Your Picture Here and Sent to Back

Skema kerja hts


Sesuai dengan
sistem yang
dibangun
Your Picture Here and Sent to Back

Diagram alir
Sistem
Your Picture Here and Sent to Back

Normalisasi Teks
Contoh kalimat :
“ saye& die pegi same -----
same ke kapal klotok
pada tanggal ---- $$ () 12-09-
2012 12:30 12 kali”
Your Picture Here and Sent to Back

Penghapusan
Token Tertentu
Sebelum proses:
“ saye& die pegi same -----
same ke kapal klotok
pada tanggal ---- $$ () 12-09-
2012 12:30 12 kali”

Setelah proses:
“ saye& die pegi same - same
ke kapal klotok pada tanggal -
12-09-2012 12:30 12 kali”
Your Picture Here and Sent to Back

Penambahan
Spasi pada token

Sebelum proses:
“ saye& die pegi same - same
ke kapal klotok pada tanggal -
12-09-2012 12:30 12 kali”

Setelah proses:
“ saye & die pegi same - same
ke kapal klotok pada tanggal -
12-09-2012 12:30 12 kali”
Your Picture Here and Sent to Back

Tokenisasi

Sebelum proses:
“ saye & die pegi same - same ke kapal klotok pada
tanggal - 12-09-2012 12:30 12 kali”

Setelah proses:
[“saye”, “&”, “die”, “pegi”, “same”, “-“, “same”, “ke”, “kapal”,
“klotok”, “pada”, “tanggal”, “-“, “12-09-2012”, “12:30”, “12”,
“kali”]
Your Picture Here and Sent to Back

Konversi
Token
Sebelum proses:
[“saye”, “&”, “die”, “pegi”, “same”, “-“,
“same”, “ke”, “kapal”, “klotok”, “pada”,
“tanggal”, “-“, “12-09-2012”, “12:30”,
“12”, “kali”]

Setelah proses:
[“saye”, “&”, “die”, “pegi”, “same”, “-“,
“same”, “ke”, “kapal”, “klotok”, “pada”,
“tanggal”, “-“, “duak belas September
duak ribu duak belas”, “jam duak
belas tige puloh menit”, “duak belas”,
“kali”]
Your Picture Here and Sent to Back

Pengecekan kamus data


Kumpulan teks sebelum:
[“saye”, “&”, “die”, “pegi”, “same”, “-“, “same”, “ke”, “kapal”, “klotok”,
“pada”, “tanggal”, “-“, “duak belas September duak ribu duak belas”,
“jam duak belas tige puloh menit”, “duak belas”, “kali”]

Kata diluar kamus data:


[“die”, “pada”, “tanggal”, “september”, “menit”]
Your Picture Here and Sent to Back
Penerapan Aturan
Letter-to-sound
Kata diluar kamus data:
[“die”, “pada”, “tanggal”,
“september”, “menit”]

Setelah proses:
(lex.add.entry 
'("die"    n ( ((d i e)0) )))
(lex.add.entry 
'("pada" n ( ((p a d a)0) ))) 
... 
(lex.add.entry 
'("menit"  n ( ((m e n i t)0) ))) 
Your Picture Here and Sent to Back

Pengabungan Teks
Sebelum proses:
[“saye”, “&”, “die”, “pegi”, “same”, “-“, “same”, “ke”, “kapal”, “klotok”,
“pada”, “tanggal”, “-“, “duak belas September duak ribu duak belas”,
“jam duak belas tige puloh menit”, “duak belas”, “kali”]

Setelah proses:
“saye dan die pegi same – same ke kapal klotok pada tanggal –
duak belas september duak ribu duak belas jam duak belas tige
puloh menit duak belas kali”
Pengujian Untuk menguji Tingkat
Kejelasan Hasil Sintesa

Sistem WER

Untuk menguji Tingkat


AB
Kemiripan Hasil Sintesa
Untuk memilih Hasil
CMOS Sintesa dengan Kualitas
terbaik

MOS

Untuk menguji
fungsionalitas Untuk menguji Tingkat
Black
sistem Box Kualitas Hasil Sintesa
Black Box
No. Jenis Format Format Contoh
1. Tanggal dd-mm-yyyy 12-01-1996, duak belas desember seribu sembilan ratus sembilan puluh enam
mm-dd-yyyy 01-12-1996, duak belas desember seribu sembilan ratus sembilan puluh enam
dd/mm/yyyy 05/02/2001, lima pebuari dua ribu satu
mm/dd/yyyy 05/02/2001, duak pebuari april dua ribu satu
mm-yyyy 12-2006, desember duak ribu enam
mm/yyyy 1/2006, januari duak ribu enam
2. Waktu hh:mm:ss 01:12:56, jam satu duak belas menit lima puluh detik
hh:mm 2:30, jam duak tige puloh menit
3. Pembacaan angka Panjang digit kurang dari 5 1000, seribu
sesuai nominal #,00 2,12, duak koma satu duak
#.00 2.12, duak koma satu duak
#.000,00 2.192,12, duak ribu serratus sembilan puloh duak koma satu dua
#,000.00 2,192.12, duak ribu serratus sembilan puloh duak koma satu dua
4. Pembacaan angka Panjang digit lebih dari 4 1012300, satu kosong satu duak tige kosong kosong
sesuai per digit Kombinasi digit dengan tanda 13-2006-12, duak belas duak ribu enam duak belas,
baca tertentu 13-100/12, tige belas seratus garing duak belas
MOS & CMOS

   
WER

  0 = “Mampu die ngasi motipasi masyarakat e supaye teros kerje keras


K
K1 = “mampu die kasi motipasi masalah supaye teros kerje keras”
Nr = [“mampu”, “die”, “ngasi”, “motipasi”, “masyarakat”, “e”, “supaye”, “teros”,
“kerje”, “keras”] = 10
I = [] = 0
S = [“masalah” => “masyarakat”] = 1
D = [“e”] = 1
Hasil Pengujian

Variasi hasil sintesa


X Y Z
Pengujian
(100 kalimat) (200 kalimat) (300 kalimat)
MOS 2.9375 3.5 3.55
CMOS 3.2 3.4625 3.5
Akurasi WER 26.790 % 56.376% 64.572%
AB 26% 26.7% 44.33%
Kesimpulan

1. Berdasarkan pengujian black-box,


• sistem dapat mengolah masukan dengan baik
• Sistem belum mampu membedakan fonem e dan ǝ
• Sistem belum mampu membedakan format tanggal dd/mm/yyyy dengan
mm/dd/yyyy

2. Berdasarkan hasil pengujian AB, MOS, CMOS, dan WER,


• Tingkat kealamian hasil sintesa (MOS) = sedang / cukup.
• Tingkat kemiripan hasil sintesa (CMOS) = sedang / cukup
• Tingkat kejelasan hasil sintesa (Akurasi WER) = 64,5 %
• Hasil sintesa dengan jumlah korpus 300 kalimat (AB) = hasil sintesa
dengan tingkat kualitas terbaik
• Semakin banyak korpus yang digunakan pada tahap pelatihan maka
semakin baik hasil suara sintesa yang dihasilkan.
Penelitian lebih lanjut (saran)

1. Penambahan Jumlah korpus latih serta tingkat penyebaran kata di


korpus.
2. Penambahan jumlah informasi prosodi seperti aksen, struktur kata dan
lain-lain.
3. Mengubah bagian front-end atau pengolahan linguistic.
4. Penambahan bentuk atau format teks seperti singkatan atau akronim,
halaman web, kata gaul dan lain-lain

Anda mungkin juga menyukai