Perancangan Aplikasi Speech To Text Pada Bahasa Minangkabau Menggunakan Pocketsphinx
Perancangan Aplikasi Speech To Text Pada Bahasa Minangkabau Menggunakan Pocketsphinx
SKRIPSI
i
METODOLOGI PENELITIAN .............................................................................. 22
3.1 Alat Dan Bahan Yang Digunakan ................................................................ 22
3.1.1 Spesifikasi Perangkat Keras (Hardware) .............................................. 22
3.1.2 Spesifikasi Perangkat Lunak (Software) ............................................... 22
3.2 Analisa Sistem .............................................................................................. 23
3.2.1 Analisa Sistem Yang Berjalan .............................................................. 23
3.2.2 Analisa Sistem yang Diusulkan ............................................................ 23
3.3 Alur Kerja ..................................................................................................... 24
3.4.1 Tahap Pengumpulan Data ..................................................................... 24
3.4.2 Tahap Training ...................................................................................... 25
3.4.3 Tahap Implementasi Data Training Pada Android ............................... 28
3.4 Perancangan Sistem ...................................................................................... 29
3.4.1 Desain Context Diagram ....................................................................... 29
3.4.2 Hierarchy Chart .................................................................................... 30
3.4.3 DFD (Data Flow Diagram) .................................................................. 31
3.4.4 Desain Antarmuka ................................................................................. 36
3.4.5 Desain Logika Program......................................................................... 38
DAFTAR PUSTAKA ................................................................................................ 41
ii
DAFTAR TABEL
Hal
iii
DAFTAR GAMBAR
iv
BAB I
PENDAHULUAN
sekali tempat wisata di Sumatra Barat yang dapat dikunjungi oleh wisatawan.
Bukan hanya makanan yang terkenal, negeri nan elok ini juga terkenal dengan
kehidupan manusia karena ia menjadi alat komunikasi yang utama. Sebagai alat
komunikasi, bahasa meliputi kata, kumpulan kata, klausa dan kalimat yang
Bahasa Minangkabau ialah salah satu bahasa daerah yang digunakan oleh
Baso Minangkabau adalah suatu bahasa Austronesia yang dituturkan oleh Suku
1
2
Riau, serta di wilayah luar negeri meliputi Negeri Sembilan di Semenanjung Kra,
dan Singapura.
keindahan alam di Sumatra Barat, dikhawatirkan masih banyak warga yang belum
fasih dalam berbahasa asing dan akan kesulitan untuk berkomunikasi dengan
atau alat bantu seperti mesin penerjemah dan kamus dwibahasa. Namun solusi ini
tidak mudah dan tidak murah untuk disediakan, disebabkan biaya untuk menyewa
penerjemah yang mahal serta kamus bahasa daerah kebahasa asing juga belum
banyak tersedia. Oleh karena itu dibutuhkan alat atau media untuk membantu
Speech to text ialah suatu metode yang dapat mengubah suara kedalam
bentuk text atau tulisan. Hal ini memungkinkan komputer dapat mengerti bahasa
manusia melalui perintah suara tersebut dan proses data suara yang di gunakan
pada speech to text diubah terlebih dahulu menjadi sebuah data numerik sehingga
text dapat digunakan sebagai pengganti masukan berupa text lansung dan dapat
bidang tersebut. Salah satu contoh dari aplikasi yang memanfaatkan atau
menggunakan speech to text sebagai alat penejermah ialah Google Translate. Pada
aplikasi sistem tersebut dapat menerima masukan berupa suara sehingga sistem
dapat lansung menerjemahkan perkataan yang di ucapkan oleh kita dan dapat
mampu menerjemahkan bahasa daerah ke bahasa asing selain Bahasa Jawa dan
Bahasa Sunda.
2. Tidak adanya alat bantu penerjemah bagi warga Minangkabau untuk dapat
diantaranya:
4
1. Data yang dipakai adalah data suara dalam bentuk Bahasa Minangkabau.
3. Aplikasi yang dibangun menggunakan suara sebagai input dan text sebagai
wisatawan asing
LANDASAN TEORI
Deslianti dan Syahputra (2018) dalam penelitian nya yang berjudul ―Aplikasi
Dalam penelitian yang buat oleh Suryadharma, dkk (2014) yang berjudul
aplikasi yang tidak memerlukan akses internet untuk penggunaan nya sehingga
dapat digunakan dimana saja bagi wisatawan yang ingin mengetahui kata-kata
dalam bahasa Bali. Selain itu aplikasi juga ditujukan bagi pengguna android yang
Dalam jurnal lain oleh Guntara, dkk (2021), yang membahas tentang
Bahasa Sunda Pada Platform Mobile Android‖ mengatakan bahwa bahasa Sunda
5
6
sudah dianggap bahasa yang terancam punah karena berdasarkan penelitian yang
dilakukan Balai Bahasa Provinsi Jawa Barat, hanya 40% anak-anak Jawa Barat
yang tahu dan dapat berbicara bahasa Sunda. Sehingga dibuatlah sebuah aplikasi
terdahulu diatas terletak pada pebedaan kasus. Kasus yang akan penulis buat
Dasar teori bertujuan memberikan gambaran dari teori yang terkait dalam
perancangan sistem.
Minangkabau; aksara Jawi: ب ا سو )م ي ناڠ كاب او adalah suatu bahasa
di Provinsi Sumatra Barat terdiri atas lima dialek, yaitu (1) dialek
7
Pasaman, (2) dialek Agam-Tanah Datar, (3) dialek Lima Puluh Kota, (4)
dialek Koto Baru, dan (5) dialek Pancung Soal. Dialek Pasaman
Panjang, Padang Pariaman, Solok, Kota Solok, Solok Selatan, dan Pesisir
ciri kedaerahan) yang ada pada beberapa subdialek. Pada wilayah tutur
bahasa ini juga terdapat bahasa lain, yaitu bahasa Batak dialek
Minangkabau di Provinsi Aceh terdiri atas tiga dialek, yaitu (1) dialek
Tamiang, (2) dialek Sunting, dan (3) dialek Aneuk Jamee. Bahasa
Minangkabau di Provinsi Riau terdiri atas lima dialek, yaitu (1) dialek
Rokan, (2) dialek Kampar, (3) dialek Basilam, (4) dialek Indragiri, dan
2.2.2 Android
operasi atau OS, middleware dan aplikasi kunci yang berbasis Linux pada
Android Inc., pendatang baru yang membuat piranti lunak untuk ponsel.
Pertama yang mendapat dukungan penuh dari Google atau Google Mail
karena melalui hal tersebut saat ini Android telah berhasil menjadi salah
Android bergantung pada versi Linux 2.6 untuk layanan sistem inti seperti
game, chatting dan lain-lain, hal ini pulalah yang membuat smartphone
conference pada tanggal 16 Mei 2013. Ini merupakan tahap preview dari
versi 0.1 pada Mei 2013, dan memasuki tahap beta sejak versi 0.8 dan
mulai diliris pada Juni 2014. Versi rilis stabil yang pertama dirilis pada
Desember 2014, dimulai sejak versi 1.0. Sedangkan versi stabil yang
2.2.4 Python
interpretatif multiguna. Tidak seperti bahasa lain yang susah untuk dibaca
lebih mudah untuk memahami sintaks. Hal ini membuat Python sangat
Bahasa ini muncul pertama kali pada tahun 1991, dirancang oleh
seorang bernama Guido van Rossum. Sampai saat ini Python masih
Hanya dengan menuliskan kode print seperti yang diatas, kita sudah
Dibagian akhir kode pun, anda tidak harus mengakhirnya dengan tanda
semicolon (;)
diucapkan dari satu atau dua orang saja dan hanya bisa mengenal
terdapat jeda antar kata. Hanya sebagian kecil dari peralatan yang
antar kata.
2.2.6 CMUSphinx
pocketsphinx
menggunakan bahasa C.
2.2.7 Pocketsphinx
yang paling mungkin dari unit dalam sinyal yang diberikan disebut
terdapat dua proses tersebut maka diperlukan sphinx trainer dan sphinx
SphinxTrain.
3. Komponen Sphinxbase
Tabel dibawah ini menunjukkan simbol yang digunakan dalan dfd baik
dalam versi E.Yourdon dan De Marco maupun versi Chris Gane dan
Trish Sarson.
18
Bentuk
Nama Simbol Keterangan
Menurut
diagramnya.
2.2.9 Flowchart
Keterangan
Simbol Nama
program
false.
METODOLOGI PENELITIAN
Alat dan bahan yang digunakan dalam penelitian ini terdiri dari perangkat
2. Ram 4 GB
3. Hardisk 500 GB
berikut:
22
23
Sebelumnya belum ada sistem atau aplikasi yang bisa digunakan untuk
tersebut dituliskan dalam beberapa artikel atau kamus bahasa daerah. Hal
awalnya kosa kata anya berupa tulisan, seingga dengan sistem yang ini
pengguna dapat melakukan rekam suara pada aplikasi dan sistem akan
sudah benar.
Dalam alur kerja penelitian pada pembuatan aplikasi minang digital ini dibagi
menjadi 3 tahapan yaitu tahap pengumpulan data, tahap training dan tahap
dari suatu penelitian. Pada tahap ini programmer membutuhkan 2 buah data
yaitu data vocab (kosa kata) dan data speech (suara). Data vocab
merupakan data yang berisi tentang kumpulan kosa kata yang dikumpulkan
25
programmer sebanyak 100 kosa kata keseharian lalu disimpan kedalam file
dan data speech untuk menghasilkan output berupa data training yang akan
sistem operasi Linux dengan menggunakan tools Virtual Box, adapun alur
sampling rate. Semua file tersebut akan diinputkan dalam pocket sphinx.
file language model, file filler, file phone, file transcription, file ids dan
file WAV.
27
a. File Dictionary merupakan file yang berisi gabungan dari kata dan
transkripsi fonetik atau pemetaan dari kata itu sendiri yang disusun
BABA B AH B AH
yang akan dipanggil saat frasa atau kata diucapkan. Dalam tahap
<s> SIL
</s> SIL
<sil> SIL
d. File Phone merupakan file yang terdiri dari satu fonem pada tiap baris,
harus sesuai dengan fonem yang terdapat pada file dictionary ditambah
dengan file filler dan tidak boleh ada duplikasi dari fonem-fonem
AH
SIL
28
audio.
f. File Ids merupakan file yang berisi daftar nama rekaman (id ucapan)
satu per satu. File ids berisi path dalam sistem file ke direktori WAV.
File ids tidak boleh menyertakan ekstensi file audio dalam penulisannya.
record_ya/file_1
record_ya/file_2
yang terdiri dari file mdef, file feat.params, file mixture_weights, file
means, file noisedict, file transition_matrices dan file variances yang akan
1. Pada foder project pilih folder models –> src –> main –> assets –> sync.
2. Pada folder sync buat folder baru dan letakkan file-file dari data training
3. Pada folder sync buat file dictionary dengan ekstensi.dic dan file
database.
recognizer = SpeechRecognizerSetup.defaultSetup()
.setRawLogDir(assetsDir)
.getRecognizer();
recognizer.addListener(this);
recognizer.addGrammarSearch(DIGITS_SEARCH,
minangGrammar);
input berupa suara, kemudian sistem akan melakukan validasi antara suara
kosa kata.
proses-proses yang terdapat dalam sistem utama dimana semua sub sistem
yang berada dalam ruang lingkup sistem utama saling berhubungan satu
Pada gambar 3.5 diatas menjelaskan tentang proses yang terjadi pada
terdapat 2 level. Pada level pertama terdiri dari 3 proses yaitu proses input
Markov Model), pada level kedua terdiri dari sub proses pre-emphasis,
a. DFD level 1
DFD level 1 adalah proses keseluruhan yang ada pada aplikasi minang
simbol tertentu. Pada DFD sistem yang akan dibuat dapat dilihat seperti
gambar berikut.
Pada gambar 3.6 diatas adalah DFD level 1 pada aplikasi minang
digital, pada DFD level 1 ini pengguna melakukan input berupa data
suara, kemudian data suara akan masuk proses ektraksi ciri yang akan
diubah menjadi data mel cepstrum, data yang didapat pada proses
polanya dengan data phonetic pada database. Setelah didapat pola yang
cocok maka sistem akan mengirimkan hasil output berupa teks kata
Pada gambar 3.7 diatas adalah DFD level 2 proses 2 pada aplikasi
masuk akan di filter menjadi data suara yang lebih halus, kemudian sub-
proses framing and windowing dimana data suara akan dipecah menjadi
analisa suara. Sub-proses FFT akan mengubah data suara menjadi data
berikut.
berikut :
pengguna ucapkan.
Gambar 3. 10 Flowchart
40
Pada gambar 3.10 diatas pengguna dapat mulai melakukan input suara
dengan menekan tombol mic, sistem akan melakukan proses ekstraksi ciri
akan memberikan hasil berupa output kosa kata, apabila output kosa kata
sama dengan target kata yang tertera pada form maka akan muncul
notifikasi benar, dan apabila output kosa kata tidak sama dengan target,
maka akan muncul notifikasi salah dan sistem akan memutar audio
https://belajarpython.com/tutorial/apa-itu-python.
Budiani, Ninuk. 2000. Data Flow Diagram: Sebagai Alat Bantu Desain Sistem.
Departemen Keuangan.
Deslianti, Dwita & Syahputra, Nio. (2018). Aplikasi Speech To Text Bahasa
https://petabahasa.kemdikbud.go.id/infobahasa2.php?idb=15&idp=Sumatra%2
0Barat.
Proceeding of Engineering.1(1).
dari https://id.wikipedia.org/wiki/Bahasa_Minangkabau.
41