3 PB
3 PB
Abstract
(Title: Identification of Errors on English Engineering Translation Results to
Java Language: Semantic Study). This study uses linguistic principles to study the results
of English to Javanese translations using an online translation engine. In particular, this
study aims to identify translation errors and study them from a semantic perspective.
Data is obtained by entering ten thousand samples of English sentences into the Google
Translator translation engine which are then analyzed qualitatively. Analysis is focused
on the level of words and phrases. The results of the study show four main problems in
the semantic domain, namely the absence of lexicons, the inaccuracy of lexicons, word
ambiguity, and idiom phrases. Suggestions were given to improve the quality of Javanese
language SMT from a linguistic perspective, related to quantity, coverage, and quality of
corporate data.
88
89
2 I always take jungle formula spray, just Aku tansah njupuk semprotan rumus
thought the sunscreen with repellant jungle, mung ngira sunscreen karo
would help regards on the beach and repellent bakal bantuan regards ing pantai
general daytime movement lan umum dinagerakan
3 One of the first online cupcake stores in Salah siji saka toko cupcake online sing
the city has taken the rest of Indonesia paling anyar ing kutha iki wis ngilangi
by storm – now they even deliver to negara Indonesia kanthi bada- saiki malah
Bandung. dikirim menyang Bandung
Identifikasi Kesalahan terhadap Hasil Terjemahan ... (Avi Meilawati dan Emi Nursanti)
90
lam kalimat (1) kata tours dan beautiful tidak Wrong Translation
muncul sama sekali dalam BJ. Kedua, kata/ Dalam analisis banyak ditemukan ha-
frasa tersebut muncu tetap dalam bentuk lin- sil terjemahan yang jauh dari makna aslinya,
guistik yang sama. Kata snorkel (1), sunscreen sebagaimana disajikan pada Tabel2.
dan repellent (2), dan cupcake (3) merupakan Kata “Credit” dalam kalimat (4) ber-
contoh-contoh dari fenomena ini. beda dengan kredit dalam versi BJ. Demikian
Terdapat beberapa penyebab ketidak- juga dengan setting up dan yang tidak sepadan
munculan kata dalam TL. Yang paling utama dengan “nyetel”. Chillies yang seharusnya
adalah tidak adanya padanan kata tersebut da- diterjemahkan menjadi sambel juga diterjemah-
lam TL dan sulitnya menyesuaikan fitur makna. kan menjadi mangkok, sangat jauh dari makna
Dalam kalimat (1), kata snorkelling sulit dicari aslinya. Brings together seharusnya diterje-
padanannya dalam BJ. Sama halnya dengan mahkan menjadi ngumpulke bukan ndadekke.
sunscreen dan repellent (3) dan cupcake (3). Hal ini bisa disebabkan karena ketidak akurat-
Kata tours, beautiful, jungle dan regards (2) an parallel corpora atau data terjemahan dari
sebenarnya masih bisa dan cukup mudah dicari BI ke BJ. Kurang cermatnya proses terjemahan
padanan maknanya dalam BJ dengan cara me- dan pengecekan ulang terjemahan (proof read-
mahami konteks bahasa aslinya, namun input ing) bisa menjadi penyebab utama kesalahan
parralel corpora tidak lengkap sehingga tidak makna dalam hasil terjemahan
muncul dalam terjemahan.
Masalah ketidakmunculan kata/frasa Word Ambiguity
dalam TL bisa disebabkan oleh dua hal. Selain Ketidakakuratan data ini bisa juga di-
karena kurangnya jumlah data, kurangnya cak- sebabkan karena satu kata bisa saja bermakna
upan topik atau domain dari korpus data yang ambigu atau berbeda dantara TL dan SL, se-
dikumpulkan merupakan penyebab utama ke- perti yang disajikan pada Tabel 3.
tidaktersediaan kata yang dicari pengguna.
5 This type of grilled chicken originates Jenis pitik iki asal saka pulo Lombok, lan
from the island of Lombok, and it's misuwur banget karo pecinta ayam bakar
popular with spicy grilled chicken lovers ing saindheng ing Indonesia. Nalika aku
through out Indonesia. When I saw the weruh jumlah cangkir sing disemprotake
amount of chilies caked onto my ayam ing pitik Taliwang, aku sumurup, yen aku
bakar Taliwang, I knew I was in for a wis ngalami pengalaman pitik panggang
life-changing grilled chicken experience, sing urip, lan iki bener.
and it was true
6 Sri Mulyani chaired the World Bank Sri Mulyani mimpin Dewan Penasehat
Group's Advisory Council on Gender Group Bank babagan Gender lan
and Development, which brings together Pembangunan, sing ndadekke para
global leaders and experts on gender pemimpin global lan para ahli babagan
issues, including from the private sector. masalah gender, kalebu saka sektor
swasta.
Kata-kata bercetak miring dalam ka- expressions yang sangat kental dalam peng-
limat (7), (8), dan (9) merupakas kata yang gunaan behasa dalam konteks sehari-hari.
ambigu sebab dapat memiliki makna yang ber- Oleh karena itu, SMT tidak dapat memahami
beda sesuai dengan konteks penggunaannya. dan menerjemahkan frasa-frasa idiom seperti
interest dapat bermakna ketertarikan, bunga “raining cats dan dogs dalam kalimat (10)
(bank), dan kepentingan. Dalam (7) seharus- yang diterjemahkan secara literal. Contoh rinci
nya kata tersebut bermakna bunga bank namun disajikan pada Tabel 4.
diartikan menjadi kepentingan. Can dalam (8) Idiom tidak dapat diterjemahkan se-
harusnya bermakna kaleng dan bukan bisa. cara literal, oleh karena itu kita sangat perlu
Bank seharusnya bermakna hulu, dan bukan memahami konteksnya dalam SL. Tantangan
institusi keuangan bank. besar lainnya adalah sulitnya menemukan pa-
Dalam data base bisa saja, kata-kata danannya dalam TL. Yang terjadi biasanya
ambigu tersebut diterjemahkan secara benar adalah makna dipertahankan tetapi bentuk lin-
sesuai konteksnya, namun pertanyaannya ada- guistiknya berbeda. Idiom lagi bukan lagi ber-
lah apakah komputer mampu mengenali per- bentuk idiom dalam TL. Tabel 3, menunjukkan
bedaan makna ini? Kalimat yang dimasukkan contoh-contoh kesalahan penerjemahan idiom.
pengguna bisa sangat beragam dan kompleks. Perlu penelitian lebih lanjut untuk penerjemah-
an idiom ini.
Idiomatic Phrases Masalah-masalah diatas bermuara
Machine Translation tidak memiliki pada prinsip-prinisip linguistik yang tidak bisa
pengetahuan umum dan kemampuan mener- dilupakan dalam pemgembangan sebuah MT.
jemahkan sesuai dengan kenyataan di lapang- Prinsip-prinsip linguistik ini sangat berkaitan
an. Salah satunya adalah masalah-masalah dengan konteks penggunaan. Hal ini senada
kebahasaan yang berkaitan dengan idiomatic dengan penelitian-penelitian sebelumnya se-
Tabel 3. Kesalahan penerjemahan kata ambigu
Kalimat BI BJ
7 BNI Deposito is a term deposits that BNI Deposito minangka simpenan istilah
make your savings safe with an attractive sing nggawe tabungan sampeyan aman
interest rate. Benefit. Get a competitive kanthi tingkat kapentingan sing menarik.
interestrate. Mupangat. Njupuk tingkat kapentingan
sing kompetitif.
8
Do you have a soda can to recycle? Sampeyan duwe sodabisa kanggo daur-
ulang?
9 River banks play an important role in Bank-bank ing pinggir kali nggawa peran
causing flood in Jakarta. penting ing nyebabake banjir ing Jakarta
11 Some peoplesay that speaking Indonesian Sawetara wong ngomong yen basa
is justa piece of cake. Indonesia mung sepotong kue
12 I toldmy friend not to judge a book by its Aku ngomong kanca ora ngadili buku
cover. kanthi tutupe
Identifikasi Kesalahan terhadap Hasil Terjemahan ... (Avi Meilawati dan Emi Nursanti)
92
perti yang diungkapkan oleh Van Eydne entertainment, (g) bisnis, (h) politik, (i) fesy-
(2015): en dan gayahidup, (j) agama, (k) geografi, (l)
“… most of the hard problems of ma- agraria, (m) profesi/pekerjaan, (n) teknologi,
chine translation are of a linguistic na- (o) hukum, (p) kuliner (makanan dan minu-
ture. The choice of hardware and pro- man), (q) pariwisata, dan (r) sejarah. Ketiga,
gramming language(s), the definition quality: continuous editing. Untuk memper-
of a formalism and a user language, baiki kualitas hasil terjemahan perlu dilaku-
the incorporation of world knowledge kan proofreading data paralel dan editing atau
and statistical data, the maintenance feedback secara berkelanjutan baik oleh peng
of large dictionaries and terminology guna dan pengelola. Pengguna memiliki peran
collections are all interesting and dif- yang sangat penting untuk penyempurnaan ha-
ficult problems in their own right, but sil terjemahan.
whatever choices or solutions one pro-
poses in these areas, they will have to SIMPULAN
be integrated in a system – which – by Pendekatan statistik yang diguna-
necessity – deals with linguistic data, kan oleh machine translation system seperti
both monolingual and bilingual” (Van GT masih meninggalkan banyak masalah ke-
Eydne, 2015, p. vi) bahasaan dalam hasil terjemahannya. Jika
mempertahankan sistem statistik, untuk me-
Selain masalah linguistik murni, salah ningkatkan kualitas dan keakuratan hasil ter-
satu yang sangat tipikal dalam BJ adalah kontek jemahannya, corpora harus ditingkatkan baik
sosial budaya. Namun bahasan ini tidak akan secara kuantitas, coverage, maupun kualitas-
kami kupas tuntaas dalam tulisan ini. Kualitas nya. Secara kuantitas, jumlah data harus terus
dan konten terjemahan yang memperhitungkan ditambah dan domain data harus diperluas dan
konteks budaya Jawa. Bahasa Jawa memiliki dilengkapi. Secara kualitas, keakuratan terje-
keunikan konteks budaya yang berbeda dari ba- mahan data source language ke target lan-
hasa lain. Untuk memberikan hasil terjemahan guage harus ditingkatkan. Peningkatan kualitas
yang tepat konteks dan budaya, maka produk parallel corpora ini juga memberikan tantangan
SMT betul-betul memperhitungkan konteks yang sangat besar mengingat bahasa Jawa sa-
budaya dari teks yang diterjemahkan. ngat sarat dengan konteks sosial budaya.
Ada tiga prinsip yang kami ajukan un-
tuk memperbaiki kualitas SMT BI ke BJ dari DAFTAR PUSTAKA
perspektif semantik, yaitu: Quantity, Coverage, Bird, S & Chiang, D. (2012). Machine Transla-
and Quality. Pertama, quantity. Jumlah data tion for Language Preservation. Mum-
yang besar semakin besar jumlah data semakin bai.
baik kualitas terjemahan yang dihasilkan dan Halliday, MAK. (2004). An Introduction to
semakin lengkap kosa kata. Kedua, coverage. Functional Grammar. London: Arnold
Data sebaiknya mencakup area atau domain Publisher Hodder Headline Group.
yang beragam, sehingga semakin lengkap da- Van Eydne, F. (2015). Liuguistic Issues in Ma-
tanya. Paling tidak ada 18 domain data yang chine Translation. Bloomsbury Pub-
dapat dikumpulkan. Kedelapan belas domain lishing.
tersebut adalah: (a) kesehatan, (b) pendidikan, Weaver. (1955). Translation. In Machine
(c) ekonomi, (d) budaya, (e) seni, (f) hiburan/ Transliation of Language. Volume 14,
Cambridge: MIT Press