Anda di halaman 1dari 23

Seminar Hasil Tugas Akhir

Sistem Sintesa Ucapan Alami Bahasa Melayu Pontianak Berbasis


HMM-Based Speech Synthesis System (HTS)

Oleh:
Erwin Guntoro
D1041141014

Program Studi Informatika


Fakultas Teknik
Universitas Tanjungpura
Seminar Hasil Tugas Akhir

Sistem Sintesa Ucapan Alami Bahasa Melayu Pontianak Berbasis


HMM-Based Speech Synthesis System (HTS)

Dosen Pembimbing I: Dosen Pembimbing II:


Dr. Arif Bijaksana PN, S.T., M.T. Rudy Dwi Nyoto, S.T., M.Eng

Dosen Penguji I: Dosen Penguji II:


Dr. Herry Sujaini, S.T., M.T., Novi Safriadi, S.T., M.T.

Program Studi Informatika


Fakultas Teknik
Universitas Tanjungpura
Daftar Isi

01 Latar Belakang

02 Rumusan Masalah

03 Tujuan Penelitian

04 Pembatasan Masalah

05 Kajian Terkait
Daftar Isi

06 Metodologi Penelitian

07 Desain dan Perancangan

08 Implementasi dan Pengujian

09 Analisis dan Kesimpulan


Latar Belakang

Bahasa Daerah Melayu Metode statistika


01 Pontianak 04 parametrik
Perkembangan teknologi
02 dan Pelestarian Budaya 05
HMM-Based Speech
Synthesis System

03 Text-to-speech
Rumusan Masalah
Bagaimana membangun sistem sintesa ucapan alami bahasa
01 Melayu Pontianak Berbasis HMM-Based Speech Synthesis
System (HTS) ?

02 05

03
Tujuan

Mengimplementasi TTS pada bahasa daerah Melayu Pontianak dengan


01
membangun sebuah sistem sintesa ucapan bahasa alami sehingga
dapat mensintesa secara alami ucapan dari teks yang diberikan dalam
Bahasa Melayu Pontianak
02 05

03
Pembatasan Masalah

1. Platform : website
01
2. Korpus latih : 300 buah.
3. Jenis kalimat : kalimat deklaratif.
4. Toolkit HTS, Festival TTs, Festvox, dan HTS_engine.
02
5. Bersifat open-domain. 05
6. format teks : tanggal, waktu, angka, alfabet.
7. Jumlah inputan : maksimal 250 karakter.
03
8. Informasi prosodi: durasi dan fonem.
Kajian terkait
No. Penulis Judul
1. Ntsako Baloyi (2012), Faculty of Science, A Text-To-Speech Synthesis System for Xitsonga Using
Agriculture Universitas Limpopo Hidden Markov Models

01
2. Elok Anggrayni, Sekartedjo, dan Dhany Arifianto Pembuatan Perangkat Basis Data untuk Sintesis Ucapan
(2013), Teknik Fisika di Institusi Teknologi (Natural Speech Synthesis) Berbahasa Indonesia
Sepuluh Nopember (ITS)

3.
02
Elok Chyaingtyas, dan Dhany Arifianto (2015),
Berbasis Hiddem Markov Model (HMM)
05
HMM-based Indonesian Speech Synthesis System with
Teknik Fisika di Institut Tekonologi Sepuluh Declarative and Question Senteces Intonation
Nopember (ITS).
 

4. 03
Mumtaz B. Mustafa, Raja N. Ainon dan Roziati EM-HTS: Real-Time HMM-Based Malay Emotional
Zainnuddin (2010) Fakultas Computer Science
dan Information Technology di Universitas Speech Synthesis
Malaya.
Metode Penelitian

01

02 05

03
Skema kerja hts
Sesuai dengan siste
m yang dibangun

01

02 05

03
Desain Perancangan

01

02 05
Diagram Konteks

03
Desain Perancangan

01

02 05

03
Diagram Overview
Desain Perancangan

01

02 05

03

Diagram Rinci proses 1.0


Desain Perancangan

01

02 05

03

Diagram alir penghapusan token tertentu


Desain Perancangan

01

02 05

03

Diagram alir penambahan spasi pada token tertentu


Desain Perancangan

01

02 05

03

Diagram alir konversi token


Desain Perancangan

01

02 05

03

Diagram alir penerapan aturan letter-to-sound


Implemetasi dan Pengujian
1. Pengujian Black Box
2. Pengujian MOS (Mean Opinion Score)
3. Pengujian CMOS (Comparasion MOS)
4. Pengujian AB
5. Pengujian WER (Word Error Rate)
Implemetasi dan Pengujian
Perhitungan MOS dan CMOS
   
Implemetasi dan Pengujian
Perhitungan WER
  0 = “Mampu die ngasi motipasi masyarakat e supaye teros kerje keras
K
K1 = “mampu die kasi motipasi masalah supaye teros kerje keras”
Nr = [“mampu”, “die”, “ngasi”, “motipasi”, “masyarakat”, “e”, “supaye”,
“teros”, “kerje”, “keras”] = 10
I = [] = 0
S = [“masalah” => “masyarakat”] = 1
D = [“e”] = 1
Implemetasi dan Pengujian

Variasi hasil sintesa


Pengujian X Y Z
MOS 2.9375 3.5 3.55
CMOS 3.2 3.4625 3.5
Akurasi WER 26.790 % 56.376% 64.572%
AB 26% 26.7% 44.33%
Analisis dan Kesimpulan
1. Pengujian Black Box, fungsionalitas dari sistem telah berjalan
dengan baik, kecuali pada fonem e dan ǝ
2. Pengujian MOS, tingkat kealamian hasil sintesa adalah cukup dan
semakin banyak korpus latih maka semakin tinggi tingkat kealamian
hasil sintesa
3. Pengujian CMOS, tingkat kemiripan hasil sintesa adalah cukup dan
semakin banyak korpus latih maka semakin tinggi tingkat kemiripan
hasil sintesa
4. Pengujian AB, hasil sintesa dengan jumlah korpus latih 300 buah
adalah hasil sintesa yang terbaik dari variasi hasil sintesa lain
dengan presentase 44.33%.
5. Pengujian WER (Word Error Rate), tingkat keakurasian paling tinggi
65% yaitu variasi sintesa dengan korpus latih 300 buah.

Anda mungkin juga menyukai