Anda di halaman 1dari 5

Pengubahan

Grafem
Ke Fonem
Bahasa
Jawa
Yohanes SuYantol
dan Sri iFrartaJ2
Elins Fisika FMIPA'
UGM'
SekiP Utara'
YogYakarta
E-mail : 1
)
v ant o6,usm'
a c' i d' 1
)
sh art a ti @'ugm'
ac' id
Abstrak
Grafemadalahsatuanterkecilsebagaipembedadalamsebuahsistemaksarasedangkanfonemadalah
adalah
kesatuan
bunyi yang terkecil
aufu.."u'in;;;;t"g
dapat mern-bedakan
makna' Dalam sistem sintesis
ucapan
dari teks p"rlrffire,
pengubahan
g;;i; menjadi-fone-'
Gtuf"rn
bahasa Jawa menggunakan
jika
menggukan
aksara l"*"""i"
i u'Ji au.r 20 i;;;;"r,
."dung.;ifca
menesunakan
aksara Lalin ada 5 vokal dan
22 konsonan.
Fonem b;h"r; l*u uau r0 r"k;;;;'tt"r"*r,
a^n i-r-"?i-uotal'
Pada makalah
ini dijelaskan
;ngu*ffi;;*it-
uurtu*u Jawa dalam aksara Latin menjadi
fonem'
Katu Kunci : grafem,
fonem,
bahasa Jawq' sintesis ucapan
PENDAHULUAN
Ucapan
adalah kegiatan
yang menghasilkan
suara dengan
"u.u
rntngubah
tekanan
udara dalam
;ir; aiimlusi
(Dutoit, 1997)' Sintesis
ucapal
adalah tiruan ucapan
manusia
sedangkan
slntesls
teks menjadi
ucapan adalah
konversi
otomatis
dari
il; ;;;fii ,r"upu' dengan
mengtodekal.
t:ks ke
dalam sinyal
yung
-"ngu*ndun
g info rmasi
.
I in guistik
il;;iilutut"
ot"t'-*esin'
Fungsi
utama dari
;it;;;
,i.,t"ris
teks
menjadi
ucagan
adalah
*ergubut
representasi
linguistik'
misalnya
deretan
ri*U""f
fonetii<, ke dalam mesin
penghasil
ucapan'
Sistesis teks menjadi
ucapan
melibatkan
proses
o"n"ri".rnut",un
dari
"
graphe'me
(huruf) menjadi
'f;;;;;.-
e;;
;
i, m e adalah Luruf dalam kamus
daftar
i"" t"O-itan
fonem adalah satuan terkecil
dari
;;;;
";r;
membedakan
satu kata dengan
lainnva'
;;k
'..-n"gto,,'"tsi
dari huruf menjadi
-
fonem'
Jt-*" ,i",."tis
teks menjadi
ucapan
melibatkan
modul
pengolah
bahasa alami
(natural language
-rr*"rrirn"-
NLP) untuk
menganalisis
teks dalam
fi;*;";r.liri,
ion"t, analisis
sintaktis'
analisis
r.ri"rit,
dan pembangkit
prosody'-Kalimat
yang
;;"h;lpt"ses
oleh
-mod"l
tersebut
kemudian
ai-"""t"t
sebagai
masukan
oleh modul
p-engolah
-rir.i J[i,.r @isital
signal
processing
- DSP)'
""''
-blirJn
J"'*ilti*it
ittem s intesi s teks menj adi
,"up*-liput
dibagi
menjaai
?
g:j't
{i'}
*:1ll
Xii' au" modul DSP' Modul
NLP mengkonversl
i.[t *"r:"ai
bentuk
yang mengaldung,
informasi
fl*tit,
-'intonmi,
t"iing..giun
nldu'.. O.un
durasi
;;;;.
Modul
DSP mJJproses
hasil dari modul
NLP menjadi
suara ucapan' Gambar
I menunjukkan
hubungan
modul NLP dan DSP'
Gambar
1: Modul dalam sistem sintesis teks menjadi
ucapan
Makalah
ini membahas
konversi
grafem
*."j;Jii;;;;
(grapheme to phoneme - G2P)
untuk
ffi;t;
ia*a. G-.af"*
(hurufl) dala-m
bahasa Jawa
;;;;;;;t;nakan
aksara Jawa
(Hanacaraka)
atau
ilffi;;,f:nu*ututu
terdiri atas 20 huruf
pokok
sedang
fonem Bahasa
Jawa ada l0'
GRAFEM
DALAM
BAHASA
JAWA
Grafem
adalah satuan
terkecil sebagai
pembeda
aufurn--r"U"uf,
sistem
aksara
(Pusat-Bahasa' )'
Dalam
iliilt, l"*^
awalnya
menggunakan
aksara,
Jawa'
Akso:;
i"*":it"
ditransliterasi
dalam
huruf Latin
;;#i";;t
tha/, lna/, lca/' ha/' lkal.',ldal,'
l,ta/' lsa/'
'i
i,' nJ,\oi,
i dhu/, 1ul,
lv al' l nv al' l
-mal'
l ga/' lba/'
'tiiii,
-T"e;l'
Selain
-
itu ada tanda-tanda vang
;;;"d-tebagai
representasi
vokal' huruf mati'
dan angka.
"-^'-V;fu
dalam aksara
Jawa ada lal' lil'
-lul'
lel'
rct, tot,"iotit/O/
dinamakan
'pepet'
"*l"l
'e'
vang
t"i'a"p"
pada kata sepuluh'
iedang
/e{
alymatan
liuil.,g'
uaurun
'e' yang terdapat
padakalasate'
Pada dasarnya
-seUuah
aksara
(huruf) Jawa
,n"*iutu,
,"Ut'ut'
suku kata..dalam
huruf Latin'
'K;;;il;;
suatu aksara
Jawa
ditulis sesuai
dengan
i*ri"n"""fisan
huruf Latin suatu suku kata atau
pengubahan Grarem ke r"l,TfltffiJ;il:
I
ss
berdasarkan
bunyi
pengucapannya
(Cahyono
and
Suyanto,2005).
FONEM
BAIIASA
JAWA
Fonem adalah kesatuan bunyi
yang terkecil
dalam sebuah bahasa
yang dapat membedakan
makna
(Pusat-Bahasa, )'
Fonetik
Qthonetics)
adalah
ilmu
.
yang
,.r"ry"iialn
bunli bahasa ianpa melihat fungsi bunyi
iJ t"tugui penrbeda makna dalam suatu bahasa'
Fonetik irenyelidiki bunyi bahasa aarl sy$yj tuturan
utu"
".;u.un.
Dalam fonetik
diselidiki
dan
dirumuskan secara teratur tentang hal ikhwal bunyi
bahasa. Bagaimana cara terbentuknya
bunyi; berapa
frekuensi,
-intensitas,
timbrenya
sebagai
-
getaran
,i*u; a^n bagaimana bunyi itu diterima
oleh telinga
(Marsono, 1999).
'
Secara umum bunyi bahasa dibedakan
menj{i
vokal, konsonan, dan semivokal'
Pembedaan
tnt
didasarkun
pada ada tidaknya
hambatan
.(proses
"*t"i"tO
pua utut bicara' Bunyi disebut vokal
jika
t"r:rairy" iia* t"4uai hambatan
pada alat bicara'
j"di
,ii* ada artikulasi.
Hambatan
untuk
vokal
hanya pada pita suara saja' Hambatan
yang hanya
terjadi puaa plta suara tidak lazim disebut artikulasi
(Marsono, 1999).
'
Bunyi disebut konsonan,
bila terjadinya
dibentuk dengan menghambat
arus udara
pada
sebagian alat bicata,
jadi ada artikulasi-
Proses
hamiatan atau artikulasi
ini dapat disertai dengan
bergetarnya
pita suara. Jika artikulasi
disertai dengan
berletamya
pita suara maka yang t:!1di adalah
konsonan bersuara. Jika artikulasi
tidak disertai
dengan bergetarnya
pita suara maka dihasilkan
konsonan tak bersuara'
Bunyi semi-vokal
ialah bunyi yang secara
praktis tennasuk konsonan tetapi saat diartikulasikan
telum membentuk
konsonan murni' Misalnya
bunyi
lwl
yang mempunyai
tempat artikulasi
bibir atas
e;g;, 6iuit uu*ut, atau bibir bawah dengan
gigi
atas.
Jumlah vokal bahasa Jawa sama dengan
jumlah
vokal bahasa Indonesia,
yaitu sepuluh: [i'
I' e' ' a'
'
o;
,
U, ul. Contoh kaii yang menggunakan
vokal
i"tt"Uut iapat dilihat pada Tabel 1 yang disusun
oleh Marsono
(1999)'
Secara
praktis biasanya
konsonan dibedakan
menurut
1. cara dihambat
(cara artikulasi);
2. tempat hambatan
(tempat artikulasi);
t. hubungan
posisional
antara
penghambat-
penghimbatnya
atau hubungan
antata
uttik lutot aktif dengan
Pasif;
4. bergetar tidaknYaPita
suara'
Konsonan
bahasa Jawa hasil pengolahan
dari
Marsono
(1999) terlihat
pada Tabel 2'
Tabel 1: Vokal bahasa Jawa dan contoh katanya
ln1
tulang rusuk
kecil
kulit
sakit
sabit
100
I
r".iir,1i:'3lrq?,i"'ke
Fonem Bahasa rawa
N( Kon9-
nm
Awal kata Tenqah kata Akilr kata
lontoh {rtl lotrtoh {di Contoh Ani
l.
3.
4.
5.
6.
'1.
8.
9.
10.
ll.
12.
13.
14.
15.
16.
11.
18.
19.
20.
2t.
22.
tpl
&l
trl
tdl
tl
tq1
lcl
Lil
tkl
tel
t?l
Im]
lnl
till
fl
trl
tfl
lvI
tsl
lz\
thl
kl
otP?
bapak
lawa
dawa
,rukul
dhzleg
(&
lala
tula
gula
ha|eng
nugla
n)at^
,8OnO
lali
Foto
wterm
segu
zakat
iawa
nda
sl8
gula
prpa
bapak
taw{
pmjag
tumbuh
dalug
c&
iala
matang
nmgka
nyata
begitu
lupa
foto
vetero
bkal
z*at
udm
agak
\Pa
sarr
tua
rada
cethak
ce/hak
w&
wEa
sala
iaca
salwat
sui
8ua
lulo
sugu
ba.li
tq6it
delalusi
rua
,j*uh
tulu
pm
butlr n4r
sab{
Bta
agak
legit-lmgit
dekat
brca
baja
timg
jag
seketika
sama
guM
licin
tdduk
pulmg
laGir
devaluci
N
rjuah
setia bmil
bagi
freteI
lawug
smbei
sey'
alu
sava,fi
l,*
teteP
papd
ana*
ulu
piw
iembata
n
anak
ikil
etu kali
Iekp
empat
piotu
mbal
sef
hutm
letih
plM
Tabel2:
Konsonan bahasa Jawa dan contoh katanya
Menurut Verhaar dalam (Marsono, 1999) bunyi
semi-vokal secara praktis termasuk konsonan tetapi
karena pada waktu diartikulasikan belum
membentuk konsonan murni, maka bunyi-bunyi itu
disebut semi-vokal. Dalam bahasa Jawa ada 2 semi-
vokal yaitu
[w]
dan
[y].
Keduanya tidak pemah
berada di akhir kata, tetapi hanya di awal dan tengah
kata saja. Tabel 3 menunjukkan 2 semi-vokal
tersebut beserta contohnya.
Tabel 3: Semi-vokal bahasa Jawa dan contoh
katanya
GRAFEM MENJADI FONEM DALAM
BAIIASA JAWA
Pengubahan dari grafem menjadi fonem
Grapheme to Phoneme - G2P adalah Proses
penetapan fonem berdasarkan huruf dari kata dalam
kalimat diperlukan dalam sistem pengubahan teks
menjadi ucapan (text-to-speech - ff$ untuk
menghasilkan pengucapan yang cocok dari kata
tersebut (Kee et a1.,2004).
Walaupun dimungkinkan untuk membuat
daftar fonem untuk setiap kata dalam suatu bahasa
yang dikerjakan oleh ahli bahasa tersebut, namun
metode ini akan memakan waktu, tergantung pada
bahasa, mudah terjadi kesalahan, dan tidak dapat
menangangi kata yang belum terdaftar (out of
vocabulary - OOn secara langsung. Dengan
demikian diperlukan sistem yang secara otomatis
menghasilkan bentuk fonetik dari setiap kata baik
yang ada dalam daftar maupun tidak. Metode yang
dapat diggnakan untuk transkripsi fonem antara lain
aturan fonologis (pendekatan berdasarkan aturan)
dan pengucapan dengan analogi (pendekatan
statistis) (Kee dkk, 2004).
Aturan fonologis adalah penerapan ide bahwa
pengucapan huruf atau diftong dapat diketahui
jika
konteksnya diketahui, yaitu huruf-huruf
disekitarnya. Bentuk aturan ini didasarkan pada
konsep fonologi generatif (Chomsky dan Halle, -):
Dari bentuk tersebut huruf B, dengan konteks I
di kiri dan C di kanan akan dihasilkan pengucapan
D. Aturan ini dapat dengan mudah diterapkan dalam
pemrograman bahasa tingkat tinggi rnenjadi bentuk
TF ... THEN.
Pengucapan dengan analogi pronunciation by
analogy - PbA menerapkan pengetahuan fonologis
yang didapat secara implisit pada kamus kata yang
dilengkapi dengan pengucapannya. Idenya adalah
bahwa pengucapan kata yang belum diketahui cara
pengucapannya dapat disusun dari pengucapan
penggalan kata yang sudah diketahui dari kata-kata
lain. Menurut R. I. Damper
0
ada 2PbA dasar yaitu
eksplisit dan implisit. Analogi eksplisit (Dedina and
Nusbaum, )
mensyaratkan kamus yang berisi daftar
kata dan cara pengucapannya.
Pada saat penentuan cara pengucapan dari kata
yang belum dikenal diperlukan komputasi proses
penggandengan. Pada analogi implisit (Sullivan and
Damper,
)
basisdata kamus disusun terlebih dahulu
untuk membangun basis pengetahuan fonologis,
yang nantinya basisdata ini digunakan sebagai acuan
saat dilakukan proses transkripsi fonemik. Contoh
PbA antara lain sistem grafem-ke-fonern (Andersen,
1996), pemodelan pengucapan (Byrne, 1998),
translasi huruf-ke-suara
(Pagel, 1998) dan
pemodelan teks-ke-fonem
(Suontausta dan
Hiikkinenen, 2000).
No- Konso-
nm
Awal kata Tengah kata Akhir kata
Contoh Arti lontoh Arti lontoh Ani
I
2
Iw.]
tvl
watu
yen
batu
kalau
aru
alru
abu
cantik
pengubahan
Grarem ke."ff,flXigjg
I
ror
Proses transkipsi
fonetik
secara-umum
adalah
sulit, tidak ,"-rru
g.rf".
i'r*
Jii."a*"'l:T:'i
lain pihak grafem
yung
'utnu
dapat
mempunyat
rimJir"r"iir yang b;beda gTuigu)'
tergantung
konteksnva. Dari
hasil
p"n"iitiunnyu
*:"^-.U*;
i;*ft;illr.un
tut'*u
pada proses
konverst
grafem menjadi
ro,,i*
'jikl.
mempethatikan
ionteksnya dapat mengurangi
ambiguitas'
Gambar 2: Hubungan
grafem
dan fonem
Hubungan
grafem
bahasa
J:Yi^j::g*
fonemnya dapat digambarkan
seperti
Gambar
2
dengan adalah aksara
sedang
adalah
tl*"1*"*'
"
aa" i aksara
berpatut'gun
dengan
I tonem'
""pi
t-"a"
-:"t"
gub"eun
beberapa
aKsara
t.tp;rfi;; oLG*
i simb-ot
fonem
atau.l
,aksara
mempunyai beberapa
simbol
fonem'
Beberapa
aksara yang b"rpurungui--J"ngutt
1 fonem
adalah
h/';#;'"d;
tnl,1l'-uefrasansan
dengan []'
'tt'
U"rpurung'un
a"ng* []'
dan
'dh
PerpTTcan
a.ngun'Ldj. Iatu aksara vang
dapat
*T::"**
dengan beberapa
t'*Uof
-fo""*
adalah
'k'
;;d;;r*;a-."e", [kl
atau [? ];
'e' berpasangan
dengan
[e], [e],
atau [];"u'
Ut'put*gan^de.ngan
[u1
atau
[U];
'a' berpasairgan
dengan [a]
atau.[];
'o'
b6":;tt"; dengan [ofatau
[]'
Daftar
selengkapnva
dapat dilihat
pada Tabel4'
Table 4: Tabel hubungan
grafem
(aksara)
dan fonem
Dengan
demikian
untuk
1 aksara
yang
hanya
u"rpl'r-Jni,.'*9:'l,qr"ro""t?il"*r.T"i[r#"1
eabungan
beberaPa
ax
i"""*"J"p"
dilakukan
pengubahan
langsung
dengan
ffi;ffi;;n
iuu"t
+''Nu"*un
untuk vang
lainnva
dioerlukan
pemahamana"
font"ftt
agar
dapat
dipilih
;o"n;;;^t
cocok
sesuai
konteks'
KESIMPULAN
Proses
pengubahan
grafem
ke
ion11-.
untuk
bahasa
Jawa
memerl'tun fr"*uhuman
konteks
unruk
mengurangi
ambi
guitas'
DAFTAR
PUSTAKA
I1l. Andersen,
O, Octob
er 1996'
Comparison
of
Two
rr""-si*ttut"A
APProaches
for
C.Jpn"*"-to-pt'on"*"
Conversion-'Ir'
Proc'
;;i;i,pue"'
r zoo-l
703' Philadelphia'
PA'
[2]'
Byrne,
W,Mry
iss8'
pton'nciation Modeling
Using
u duna-Labelled
.gotPut
for
Conversationut
if""tt'
\ttoq'itl:,n;
ln Proc'
lCASSP'pages
3 13-3 I 6' Seattle'
wa'
r3r'c';hv";;'
l,
1i-11J,f,Hl"i;,J'
J'';il::;
2005,
Transltl
lu*lu"
Uuaio
Teknika'
5(2):
I01-106'-'
[4].
chomskv,
-N
";;;'"Htiil'
v'
-'- The sound
Pattern
o1 nn*glish'
Harper
and
Row'
New
York'
t5l. Dedina,
M' J
and
Nusbaum'
H' C'
t"'
;*o'N6LrNcE;
u p'og'u*
for
pronunciation
Lv unurogv'
Con'piter
Speech
and
Language'
(5):55-64'
1.
2.
3.
4.
5.
6.
'7.
8.
9.
10.
11.
t2.
13.
14.
15.
16.
17.
lpl
[b]
ttl
tdl
I
rdl
Ic]
Lil
tkl
tel
i?l
Im]
In]
tnl
u
0l
tfl
p
b
t
d
th
dh
c
j
k
a
k
m
n
ny
ng
1
f
lvl
Isl
Lz)
thl
Ir]
[wl
tvl
til
ul
lel
lel
u
Ia]
tl
u
[o]
tul
S
Z
h
r
w
v
i
i
e
e
e
a
a
o
o
u
u
18.
19.
20.
21.
1',)
23.
24.
25.
26.
11
28.
29.
30.
31.
32.
33.
34.
35.
bahasa
Jawa
.
^^
I Pensubahan
Grafem
ke Fonem
Bahasa
Jawa
tuz
I
Yoh"urr., Suyanto
[6].
Dutoit, T, 1997, An Introduction to Test-To-
Speech Synthesis. Kluwer Academics
Publisher, The Netherlands.
[7].
Kee, T. Y, Seong, T. B, and Haizhou, L,2004.
Grapheme to Phoneme Conversion for
Standard Malay.
[8].
Marsono, 1999, Fonetik. Gadjah Mada
University Press, Yogyakarta.
[9].
Pagel, V, December 1998, Letter-to-Sound
Rules for Accented Lexicon Compression' Iu
Proc. ICSLP, pages 20151018, SYdneY,
Australia.
[0].
Pusat-Bahasa, Kamus Besar Bahasa Indonesia.
edisi III.
tlll.R.LDamper,
J. F. G.E, Pronunciation by
analogy: impact of implementational choices
on performance. Language and Speech, (a0):1-
23.
[12].
Sullivan, K. P.H and Damper, R.I, Novel-
word pronunciation: a cross language study.
Sp eech Communication,
(13):441452.
[13].
Suontausta, J and H[kkinenen, J, October
2000, Decision Tree Based Text-to-Phoneme
Mapping for Speech Recognition. ln Proc.
ICSLP,pages 83 1-834, Beijing,China.
CV PENULIS
l. Yohanes Suyanto, lulusan Sl Fisika UGM dan
52 Ilmu Komputer UI, bekerja sebagai dosen di
Program Studi Elekronika dan Instrumentasi
UGM.
2. Sri Hartati, lulusan S1 Fisika UGM, mendapat
gelar M.Sc. Dan Ph.D dari University of New
Brunswick Canada.
Pengubahan Grafem ke Fonem Bahasa ru*u
I 103
YohanesSuyantol
---

Anda mungkin juga menyukai