Anda di halaman 1dari 5

IDENTIFIKASI KESALAHAN TERHADAP HASIL TERJEMAHAN MESIN

BAHASA INGGRIS KE BAHASA JAWA: KAJIAN SEMANTIK

Avi Meilawati dan Emi Nursanti


Universitas Negeri Yogyakarta
email: avimeilawati@gmail.com

Abstract
(Title: Identification of Errors on English Engineering Translation Results to
Java Language: Semantic Study). This study uses linguistic principles to study the results
of English to Javanese translations using an online translation engine. In particular, this
study aims to identify translation errors and study them from a semantic perspective.
Data is obtained by entering ten thousand samples of English sentences into the Google
Translator translation engine which are then analyzed qualitatively. Analysis is focused
on the level of words and phrases. The results of the study show four main problems in
the semantic domain, namely the absence of lexicons, the inaccuracy of lexicons, word
ambiguity, and idiom phrases. Suggestions were given to improve the quality of Javanese
language SMT from a linguistic perspective, related to quantity, coverage, and quality of
corporate data.

Keywords: semantics, machine translator, Javanese, English, linguistics

PENDAHULUAN Sejauh ini belum ada penelitian yang


Machine Translation (MT) saat ini te- secara khusus menyoroti penerj­e­mahan online
lah banyak memberikan manfaat praktis dan BJ. Penelitian ini diawali dengan kegelisahan
keilmuan bagi masyarakat luas. Salah satu terhadap banyaknya kekurang­wajaran dalam
jenis MT, yaitu Statistical Machine Translation hasil penerjemahan BI ke BJ dalam GT. Seba-
(SMT), yang paling banyak digunakan secara gai peutur BJ, kami melihat banyak kesalahan
luas saat ini adalah Google Translator (GT). dalam berbagai level,baik semantik, sintaksis,
GT mengembangkan database yang sangat be- maupun pragmatik atau discourse. Pada tulisan
sar dengan cara meng­­kodifikasi dan mengana- ini kami lebih fokus pada analisis semantik ter-
lisis jutaan kalimat. Sistem SMT yang diba- hadap kesalahan-kesalahan tersebut.
ngun meng­­gunakan data monolingual corpora Weaver (1955) mengatakan bahwa
dan bilingual corpora. Berdasarkan parra­lel pendekatan semantik sangat diperlu­kan untuk
corpora ini sistem bekerja sedemikian rupa menciptakan human like translation atau pe-
sehingga dapat memberikan ha­sil terjemahan nerjemahan yang mende­kati ter­je­mahan ma-
sesuai dengan pasangan kalimat yang paling nusia. Namun demikian, pembuatan Semantic
mendekati (Bird & Chiang,2012). Machine Translation akan lebih sulit sebab
Saat ini 200 juta orang menggunakan akan membutuhkan lebih banyak ahli lingu­
GT setiap hari dan turut berperan me­nyem- is­tik dan programer dalam mewujudkannya.
purnakan hasil terjemahan. Mereka dapat mam- Dalam tulisan ini kami tidak akan membahas
beri feedback dan meng-edit hasil terjemahan Semantic Machine Translation, tetapi kami
dalam bahasa target dan hasil edit-an ini akan akan mengkaji, seperti yang Weaver (1995)
tersimpan dalam database GT. GT telah me- katakan, permasalahan semantik dalam hasil
ngakomodasi banyak bahasa di dunia, salah sa- terjemahan GT yang sudah ada. Kami berharap
tunya bahasa Jawa (BJ) ke bahasa Inggris (BI) dengan hasil penelitian ini, kami dapat mem-
dan sebaliknya. Penelitian ini merupakan pe- berikan pandangan-pandangan kritis dari sudut
nelitian awal yang mengkaji secara khusus as- pandang linguistik.
pek semantik dari terjemahan teks BI ke dalam Masalah semantik dalam penerjemah-
BJ. Dalam hal ini BI sebagai Source Language an sangat berkaitan dengan mea­ning transfer
(SL) dan BJ sebagai Target Language (TL). dari SL ke TL. Pada saat kita menganalisis dan

88
89

menerjemahkan kalimat, kita perlu melakukan- HASIL DAN PEMBAHASAN


nya “from the standpoint of how it creates and Kajian semantik pada hasil terjemahan on-
expresses meaning.” (Halliday, 2004, p.19). line
Ketidakstabilan makna sangat bisa terjadi kar- Makna merupakan masalah yang sa-
ena penerjemah tidak dapat mempertemukan ngat kompleks tetapi sangat menen­tukan kuali-
fitur kebahasaan dan konteks dari kata atau fra- tas dan keakuratan penerjemahan. Penerjemah-
sa dalam SL dan TL. Contoh dari kasus ini ada- an oleh manusia saja sa­ngat mungkin memiliki
lah kata ambigu, polisemy, dan oligosemy, dan masalah semantik, apalagi penerjemahan mesin
saat terdapat unsur sosial budaya yang melekat yang memiliki keterbatasan analisis makna.
dalam kata/frasa. Masalah semantik ini banyak Beberapa masalah semantik muncul
terjadi dalam machine translation, karena sa- dalam data yang dianalisis. Kami akan mendis-
ngat berkaitan dengan kualitas parralel cor- kusikan empat masalah umum dan yang me-
pora dan kemampuan komputer dalam mem- nganalisisnya dalam konteks terjemahan BI
bangun makna. ke BJ. Perlu digarisbawahi bahwa BJ memi-
liki keunikan kebahasaan dan pemaknaan kata/
METODE frasa yang mungkin tidak ditemukan dalam ba-
Data dikumpulkan dengan cara me- hasa lain.
masukkan dan menerjemahkan 5.000 kalimat
BI ke BJ menggunakan GT. Kalimat-kalimat No Parralel Data Found
ini kami dapatkan dari website-website di In- Banyak ditemukan dalam data adanya
donesia sehingga konteks kalimat dapat dipa- hasil terjemahan masih mengan­dung leksikon
hami dengan mudah. Data dianalisis secara BI. Hal ini disebabkan karena tidak adanya
kualitatif dan dikelompokkan kedalam katego- atau ditemukannya kata yang dicari dalam
ri yang muncul. Kategori-kategori ini muncul sistem. Tabel 1 menunjukkan contoh-contoh
selama proses analisis (emerging categories) tidak­leng­kapan leksikon. Dalam data ini, hasil
dan tidak ditentukan sebelumnya. Sebagai pe- terjemahan BJ masih mengandung unsul kata/
nelitian yang bersifat data-driven, berbagai frasa BI.
kategori bisa muncul. Untuk itu, kategori yang Temuan pertama, yaitu ketidakmun-
dianggap paling signifikan yang akan diangkat cualan kata dalam BJ, terjadi dalam dua bentuk.
dalam diskusi penelitian ini. Pertama, hilangnya kata/frasa dalam BJ. Da-
Tabel 1. Ketidaklengkapan kosa kata
Kalimat BI BJ
1 Padi has weeklyscheduled snorkeling Padi nduwe wisata snorkel [TOURS]
tours available to the beautiful island of sing dijadwalake saben minggu kanggo
Nusa Lembongan and Penida. [BEAUTIFUL] Pulo Nusa Lembongan
lan Penida sing ayu.

2 I always take jungle formula spray, just Aku tansah njupuk semprotan rumus
thought the sunscreen with repellant jungle, mung ngira sunscreen karo
would help regards on the beach and repellent bakal bantuan regards ing pantai
general daytime movement lan umum dinagerakan

3 One of the first online cupcake stores in Salah siji saka toko cupcake online sing
the city has taken the rest of Indonesia paling anyar ing kutha iki wis ngilangi
by storm – now they even deliver to negara Indonesia kanthi bada- saiki malah
Bandung. dikirim menyang Bandung

Identifikasi Kesalahan terhadap Hasil Terjemahan ... (Avi Meilawati dan Emi Nursanti)
90

lam kalimat (1) kata tours dan beautiful tidak Wrong Translation
muncul sama sekali dalam BJ. Kedua, kata/ Dalam analisis banyak ditemukan ha-
frasa tersebut muncu tetap dalam bentuk lin- sil terjemahan yang jauh dari makna aslinya,
guistik yang sama. Kata snorkel (1), sunscreen sebagaimana disajikan pada Tabel2.
dan repellent (2), dan cupcake (3) merupakan Kata “Credit” dalam kalimat (4) ber-
contoh-contoh dari fenomena ini. beda dengan kredit dalam versi BJ. Demikian
Terdapat beberapa penyebab ketidak- juga dengan setting up dan yang tidak sepadan
munculan kata dalam TL. Yang pa­ling utama dengan “nyetel”. Chillies yang seharusnya
adalah tidak adanya padanan kata tersebut da- diterjemahkan menjadi sambel juga diterjemah-
lam TL dan sulitnya menyesuaikan fitur makna. kan menjadi mangkok, sangat jauh dari makna
Dalam kalimat (1), kata snorkelling sulit dicari aslinya. Brings together seharusnya diterje-
pada­nan­­nya dalam BJ. Sama halnya dengan mahkan menjadi ngumpulke bukan ndadekke.
sunscreen dan repellent (3) dan cupcake (3). Hal ini bisa disebabkan karena ketidak akurat-
Kata tours, beautiful, jungle dan regards (2) an parallel corpora atau data terjemahan dari
sebenarnya ma­­sih bisa dan cukup mudah dicari BI ke BJ. Kurang cermatnya proses terjemahan
padanan maknanya dalam BJ dengan cara me- dan pengecekan ulang terjemahan (proof read-
mahami konteks bahasa aslinya, namun input ing) bisa menjadi penyebab utama kesalahan
parralel corpora tidak lengkap sehingga tidak makna dalam hasil terjemahan
muncul dalam terjemahan.
Masalah ketidakmunculan kata/frasa Word Ambiguity
dalam TL bisa disebabkan oleh dua hal. Selain Ketidakakuratan data ini bisa juga di-
karena kurangnya jumlah data, kurangnya cak- sebabkan karena satu kata bisa saja bermakna
upan topik atau domain dari korpus data yang ambigu atau berbeda dantara TL dan SL, se-
dikumpulkan merupakan penyebab utama ke- perti yang disajikan pada Tabel 3.
tidakterse­diaan kata yang dicari pengguna.

Tabel 2. Kesalahan penerjemahan kosa kata


Kalimat BI BJ
4 Widodo does not deserve all the blame Widodo ora pantes kanggo nyalahke
for the perilous state of Southeast Asia’s negara ekonomi Asia Tenggara. Nanging
biggest economy. But he has not earned dheweke durung entuk kredit kanggo
credit for setting up a turnaround, either nyetel turnaround, uga.

5 This type of grilled chicken originates Jenis pitik iki asal saka pulo Lombok, lan
from the island of Lombok, and it's misuwur banget karo pecinta ayam bakar
popular with spicy grilled chicken lovers ing saindheng ing Indonesia. Nalika aku
through out Indonesia. When I saw the weruh jumlah cangkir sing disemprotake
amount of chilies caked onto my ayam ing pitik Taliwang, aku sumurup, yen aku
bakar Taliwang, I knew I was in for a wis ngalami pengalaman pitik panggang
life-changing grilled chicken experience, sing urip, lan iki bener.
and it was true

6 Sri Mulyani chaired the World Bank Sri Mulyani mimpin Dewan Penasehat
Group's Advisory Council on Gender Group Bank babagan Gender lan
and Development, which brings together Pembangunan, sing ndadekke para
global leaders and experts on gender pemimpin global lan para ahli babagan
issues, including from the private sector. masalah gender, kalebu saka sektor
swasta.

diksi Volume 26, Nomor 2, September 2018


91

Kata-kata bercetak miring dalam ka- expressions yang sangat kental dalam peng-
limat (7), (8), dan (9) merupakas kata yang gunaan behasa dalam konteks sehari-hari.
ambigu sebab dapat memiliki makna yang ber- Oleh karena itu, SMT tidak dapat memahami
beda sesuai dengan konteks penggunaannya. dan menerjemahkan frasa-frasa idiom seperti
interest dapat bermakna ketertarikan, bunga “raining cats dan dogs dalam kalimat (10)
(bank), dan kepentingan. Dalam (7) seharus- yang diterjemahkan secara literal. Contoh rinci
nya kata tersebut bermakna bunga bank na­mun disajikan pada Tabel 4.
diartikan menjadi kepentingan. Can dalam (8) Idiom tidak dapat diterjemahkan se-
harusnya bermakna ka­leng dan bukan bisa. cara literal, oleh karena itu kita sangat perlu
Bank seharusnya bermakna hulu, dan bukan memahami konteksnya dalam SL. Tantangan
insti­tusi keuangan bank. besar lainnya adalah sulitnya menemukan pa-
Dalam data base bisa saja, kata-kata danannya dalam TL. Yang terjadi biasanya
ambigu tersebut diterjemahkan secara benar adalah makna diper­tahankan tetapi bentuk lin-
sesuai konteksnya, namun pertanyaannya ada- guistiknya berbeda. Idiom lagi bukan lagi ber-
lah apakah komputer mam­pu mengenali per- bentuk idiom dalam TL. Tabel 3, menunjukkan
bedaan makna ini? Kalimat yang dimasukkan contoh-contoh kesalahan penerjemahan idiom.
pengguna bisa sangat beragam dan kompleks. Perlu penelitian lebih lanjut untuk penerjemah-
an idiom ini.
Idiomatic Phrases Masalah-masalah diatas bermuara
Machine Translation tidak memiliki pada prinsip-prinisip linguistik yang tidak bisa
pengetahuan umum dan kemampuan mener- dilupakan dalam pemgembangan sebuah MT.
jemahkan sesuai dengan kenyataan di lapang- Prinsip-prinsip linguistik ini sangat berkaitan
an. Salah satunya adalah masalah-masalah dengan konteks penggunaan. Hal ini senada
kebahasaan yang berkaitan dengan idiomatic dengan penelitian-penelitian sebelumnya se-
Tabel 3. Kesalahan penerjemahan kata ambigu
Kalimat BI BJ
7 BNI Deposito is a term deposits that BNI Deposito minangka simpenan istilah
make your savings safe with an attractive sing nggawe tabungan sampeyan aman
interest rate. Benefit. Get a competitive kanthi tingkat kapentingan sing menarik.
interestrate. Mupangat. Njupuk tingkat kapentingan
sing kompetitif.
8
Do you have a soda can to recycle? Sampeyan duwe sodabisa kanggo daur-
ulang?

9 River banks play an important role in Bank-bank ing pinggir kali nggawa peran
causing flood in Jakarta. penting ing nyebabake banjir ing Jakarta

Tabel 4. Kesalahan penerjemahan frasa idiom


Kalimat BI BJ
10 Raining cats and dogs in Jakarta tonight. Kucing lan asu ing Jakarta bengi iki.

11 Some peoplesay that speaking Indonesian Sawetara wong ngomong yen basa
is justa piece of cake. Indonesia mung sepotong kue

12 I toldmy friend not to judge a book by its Aku ngomong kanca ora ngadili buku
cover. kanthi tutupe

Identifikasi Kesalahan terhadap Hasil Terjemahan ... (Avi Meilawati dan Emi Nursanti)
92

perti yang diungkapkan oleh Van Eydne entertainment, (g) bisnis, (h) politik, (i) fesy-
(2015): en dan gayahidup, (j) agama, (k) geografi, (l)
“… most of the hard problems of ma- agraria, (m) profesi/pekerjaan, (n) teknologi,
chine translation are of a linguistic na- (o) hukum, (p) kuliner (makanan dan minu-
ture. The choice of hardware and pro- man), (q) pariwisata, dan (r) sejarah. Ketiga,
gramming language(s), the definition quality: conti­nuo­us editing. Untuk memper-
of a formalism and a user language, baiki kualitas hasil terjemahan perlu dilaku-
the incorporation of world knowledge kan proof­reading data paralel dan editing atau
and statistical data, the maintenance feedback secara berkelanjutan baik oleh peng­
of large dictionaries and terminology guna dan pengelola. Pengguna memiliki peran
collections are all interesting and dif- yang sangat penting untuk penyempurnaan ha-
ficult problems in their own right, but sil terjemahan.
whatever choices or solutions one pro-
poses in these areas, they will have to SIMPULAN
be integrated in a system – which – by Pendekatan statistik yang diguna-
necessity – deals with linguistic data, kan oleh machine translation system seperti
both monolingual and bilingual” (Van GT masih meninggalkan banyak masalah ke-
Eydne, 2015, p. vi) bahasaan dalam hasil terje­mahannya. Jika
mempertahankan sistem statistik, untuk me-
Selain masalah linguistik murni, salah ningkatkan kualitas dan keakuratan hasil ter-
satu yang sangat tipikal dalam BJ adalah kontek jemahannya, corpora harus ditingkatkan baik
sosial budaya. Namun bahasan ini tidak akan secara kuan­titas, coverage, maupun kualitas-
kami kupas tuntaas dalam tulisan ini. Kualitas nya. Secara kuantitas, jumlah data harus terus
dan konten terjemahan yang memperhitungkan ditambah dan domain data harus diperluas dan
konteks budaya Jawa. Bahasa Jawa memiliki dilengkapi. Secara kualitas, keakuratan terje-
keunikan konteks budaya yang berbeda dari ba- mahan data source language ke target lan-
hasa lain. Untuk memberikan hasil terjemahan guage harus ditingkat­kan. Peningkatan kualitas
yang tepat konteks dan budaya, maka produk parallel corpora ini juga memberikan tantangan
SMT betul-betul memperhitungkan konteks yang sangat besar mengingat bahasa Jawa sa-
budaya dari teks yang diterjemahkan. ngat sarat dengan konteks sosial budaya.
Ada tiga prinsip yang kami ajukan un-
tuk memperbaiki kualitas SMT BI ke BJ dari DAFTAR PUSTAKA
perspektif semantik, yaitu: Quantity, Coverage, Bird, S & Chiang, D. (2012). Machine Transla-
and Quality. Pertama, quantity. Jumlah data tion for Language Preservation. Mum-
yang besar semakin besar jumlah data semakin bai.
baik kualitas terjemahan yang dihasilkan dan Halliday, MAK. (2004). An Introduction to
semakin lengkap kosa kata. Kedua, coverage. Functional Grammar. London: Arnold
Data sebaiknya mencakup area atau domain Publisher Hodder Headline Group.
yang beragam, sehingga semakin lengkap da- Van Eydne, F. (2015). Liuguistic Issues in Ma-
tanya. Paling tidak ada 18 domain data yang chine Translation. Bloomsbury Pub-
dapat dikumpulkan. Kedelapan belas domain lishing.
tersebut adalah: (a) kesehatan, (b) pendidikan, Weaver. (1955). Translation. In Machine
(c) ekonomi, (d) budaya, (e) seni, (f) hiburan/ Transliation of Language. Volume 14,
Cambridge: MIT Press

diksi Volume 26, Nomor 2, September 2018

Anda mungkin juga menyukai