Anda di halaman 1dari 18

TUGAS UAS

STATISTIKA & PROBABILITAS

Disusun Oleh :

Nama : Anita Septiani Putri

Npm : 2155201101

Semester : 3 (Tiga) 2021 REGULER

Matkul : Statistika & Probabilitas

Dosen : Yth.Ibu Muntahanah,M.Kom

Beserta Dosen Pengganti Yth.Bapak Yusa virginiawan

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH BENGKULU
2023
A.Pengertian Statistika
Apa yang dimaksud statistika, di bawah ini akan dijelaskan mengenai arti, definisi dan
pengertian statistika secara umum, menurut KBBI serta menurut teori dan pendapat para
ahli statistik.
a.Definisi Statistika Secara Umum
Pengertian statistika secara umum adalah ilmu yang mempelajari bagaimana
merencanakan, mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan
data. Secara singkat, arti statistika adalah ilmu yang berkaitan dengan data untuk diolah
dan diintepretasikan.
b.Arti Statistika Menurut KBBI
Pengertian statistika menurut KBBI (Kamus Besar Bahasa Indonesia) adalah ilmu
tentang cara mengumpulkan, menabulasi, menggolong-golongkan, menganalisis, dan
mencari keterangan yang berarti dari data yang berupa angka.
Secara singkat, statistika juga berarti pengetahuan yang berhubungan dengan
pengumpulan data, penyelidikan dan kesimpulannya berdasarkan bukti, berupa catatan
bilangan (angka-angka).
1.Pengertian Statistika Menurut Para Ahli Nasional
a.Menurut Sigit Nugroho (2007)
Pengertian statistika menurut Sigit Nugroho (2007) adalah hasil-hasil pengolahan
dan analisis data. Statistik dapat berupa mean, modus, median, dan sebagainya.
Statistik dapat digunakan untuk menyatakan kesimpulan data berbentuk bilangan
yang disusun dalam bentuk tabel atau diagram yang menggambarkan karakteristik data.
b.Menurut Siregar (2004)
Pengertian statistika menurut Siregar (2004) adalah ilmu yang mempelajari
cara- cara mendeteksi suatu objek, mendeskripsikan objek, dan menganalisis setiap
aspek-aspek yang mempengaruhi objek, untuk dismpulkan secara ilmiah tentang
keberadaan objek, sebagai pedoman sains atau pengambilan keputusan.
2.Pengertian Statistika Menurut Para Ahli Internasional
a.Menurut Marguerrite F. Hall (1892)
Pengertian statistika menurut Marguerrite F. Hall (1892) merupakan suatu teknik yang
digunakan untuk mengumpulkan data, menganalisa data dan menyimpulkan dan
mengadakan penafsiran data yang berbentuk angka.
b.Menurut Anderson & Bancrofi
Statistika merupakan ilmu dan seni mengembangkan dan menerapkan metoda
yang paling efektif untuk mengumpulkan, mentabulasi, menginterpretasi kan data
kuantitatif sedemikian rupa sehingga kemungkinan salah dalam kesimpulan dan
estimasi dapat diperkirakan dengan menggunakan penalaran induktif berdeasarkan
matematika probabilitas.
B.Pengertian Probabilitas
Probabilitas berasal dari kata probably , yaitu kemungkinan . Jadi probabilitas artinya
kemungkinan yang bisa terjadi pada suatu peristiwa. Tentu menggunakan pendekatan nalar
logis saja sinkron menggunakan batasan serta asumsi tertentu. karena intinya insan hanya
bisa menduga apa yang akan terjadi namun tidak mampu mengetahui apa saja yang
belum terjadi. namun menggunakan teori probabilitas ini kita dapat memprediksikan
perubahan yg akan terjadi di insiden tesebut dan juga peluang suatu peristiwa itu akan
terjadi lagi. Berbicara perihal manfaat asal probabilitas sangat bermanfaat buat
pengambilan keputusan yang sempurna, karena kehidupan di dunia tidak ada kepastian,
sehingga diharapkan buat mengetahui berapa akbar probabilitas suatu peristiwa akan
terjadi. Probabilitas dinyatakan pada nomor pecahan antara 0 hingga 1 atau pada
persentase.
1.Menurut Para Ahli Nasional
a.Menurut Susanti
Probabilitas adalah suatu nilai yang digunakan untuk mengukur tingkat terjadinya
suatu kejadian yang acak. Kata probabilitas itu sendiri sering disebut dengan peluang
atau kemungkinan. Probabilitas secara umum merupakan peluang bahwa sesuatu akan
terjadi .
b.Menurut Singgih
Probabilitas, merupakan besarnya kesempatan (kemungkinan) suatu peristiwa akan
terjadi. Besarnya kesempatan dapat ditulis dalam bentuk bilangan decimal, pecahan
atau persen.
2.Pengertian Probabilitas Menurut Para Ahli Internasional
a.Menurut Lind (2002)
Mendefinisikan probabilitas sebagai “Probabilitas adalah suatu ukuran tentang
kemungkinan suatu peristiwa yang akan terjadi di masa mendatang.
b.Menurut Hayter, 2012
Probabilitas merupakan salah satu ilmu yang menarik dan juga paling berguna pada
area matematika. Probabilitas merupakan ilmu dasar bagi inferensi statistik
melalui eksperimen dan analisis data. Melalui aplikasi untuk masalah seperti
penilaian realibilitas suatu sistem, interpretasi akurasi pengukuran, dan pemeliharaan
kualitas yang sesuai, teori probabilitas sangat relevan dengan ilmu teknik sekarang
ini.
1.Tiga hal krusial dalam mengungkapkan probabilitas:
a.Percobaan Pengamatan terhadap beberapa kegiatan atau proses yang memungkinkan
timbulnya paling sedikit dua insiden tanpa memperthatikan peristiwa mana yang akan
terjadi.
b.Peristiwa Kumpulan dari satu atau lebih yang akan terjadi yang terjadi pada sebuah
percobaan atau aktivitas
c.Hasil Suatu akibat dari sebuah percobaan. pada hasil ini semua insiden akan dicatat atau
dalam artian semua peristiwa yang akan terjadi dalam sebuah percobaan.
misalnya dalam mengikuti ujian semester maka hasil yang akan diperoleh terdapat
mahasiswa yang lulus dan ada yang tidak lulus. terdapat yang lulus memuaskan
terdapat yang tidak memuaskan
C.Contoh Jurnal INTERNASIONAL Statistika & Probabilitas beserta riview

JEPIN

(Jurnal Edukasi dan Penelitian Informatika)


ISSN(e): 2548-9364 / ISSN(p) : 2460-0741

Vol. 4
No. 2

Pengunaan Pivot Language pada


Della Widya Ningtyas , Herry Sujaini , Novi Safriadi
#1 #2 #3

#Program
Studi Informatika Universitas
DesemTanjungpura
be Jalan Prof. Dr. H. Hadari Nawawi,
Pontianak, Kalimantan Barat
Mesin Penerjemah Statistik Bahasa
Inggris ke Bahasa Melayu Sambas
1dellawidyaningtyas@gmail.com
2hs@untan.ac.id
3safriadi@informatics.untan.ac.id

Abstrak - Perbedaan kemampuan berbahasa dalam Melayu yang dituturkan oleh masyarakat asli kabupaten
masyarakat dapat menjadi penghalang pertukaran informasi, Sambas. Bahasa Melayu Sambas sendiri sampai saat ini
salah satu cara untuk menanggulanginya adalah dengan memang jauh dari kepunahan, dikarenakan penutur bahasa
memanfaatkan teknologi mesin penerjemah. Saat ini relatif masih banyak walaupun tidak diketahui secara
ini masih sulit menemukan korpus paralel bahasa Inggris – pasti berapa penutur bahasa Melayu Sambas.
bahasa daerah, sehingga digunakan bahasa Indonesia Perbedaan bahasa dapat menjadi penghalang pertukaran
sebagai bahasa perantara (pivot language) untuk informasi, maka saat ini sedang dikembangkan teknologi
mempermudah dalam pembuatan korpus paralel bahasa mesin penerjemah. Telah banyak dilakukan penelitian
Inggris – bahasa daerah. Tujuan dari penelitian ini adalah mengenai pengembangan mesin penerjemah statistik
untuk mengetahui pengaruh pivot language terhadap nilai bahasa Inggris ke bahasa Indonesia dan bahasa Indonesia
akurasi mesin penerjemah statistik bahasa Inggris ke bahasa ke bahasa daerah sehingga sudah banyak tersedia korpus
Melayu Sambas. Penelitian menggunakan korpus paralel paralel bahasa Inggris – bahasa Indonesia dan korpus
sebanyak 3000 baris kalimat. Pengujian dilakukan dengan dua paralel bahasa Indonesia – bahasa daerah. Namun saat ini
cara yaitu pengujian secara otomatis menggunakan BLEU masih sulit menemukan korpus paralel bahasa Inggris –
(Bilingual Evaluation Understudy). Pengujian dilakukan bahasa daerah, sehingga digunakan bahasa Indonesia
dengan membandingkan nilai akurasi sebagai Bahasa perantara (pivot language) untuk
terjemahandari mesin penerjemah Bahasa Inggris
mempermudah dalam memperoleh korpus paralel bahasa
Inggris – bahasa daerah. Terdapat beberapa penelitian
– Melayu Sambas dan mesin penerjemah Bahasa Inggris –
pivot language, yang dilakukan berkaitan dengan
Melayu Sambas dengan Bahasa Indonesia sebagai pivot
diantaranya penelitian tentang perbandingan metode pivot
language. Dari hasil pengujian yang telah dilakukan,
untuk mesin penerjemah statistic berbasis frasa [1],
penggunaan pivot language pada mesin penerjemah statistik
penelitian tentang penggunaan bahasa Inggris sebagai pivot
Bahasa Inggris - Bahasa Melayu Sambas dapat
language pada mesin penerjemah statistik bahasa Arab -
mempengaruhi akurasi terjemahan, terlihat terjadi Cina [2], penelitian tentang pentingnya pemilihan pivot
peningkatan nilai akurasi sebesar 5,015% dari nilai pengujian language untuk mesin penerjemah statistik dengan meneliti
semula yang didapatkan dari mesin penerjemah tanpa pivot bahasa selain bahasa Inggris sebagai pivot language [3],
dengan metode BLEU. Berdasarkan data tersebut penggunaan penelitian tentang menggunakan pivot language dalam
pivot language pada mesin penerjemah statistik bahasa Inggris mesin penerjemah statistik bahasa Cina – Spanyol dengan
– bahasa Melayu Sambas dapat meningkatkan nilai akurasi bahasa Inggris, bahasa Arab dan bahasa Prancis sebagai
terjemahan. pivot language [4], dan penelitian tentang pendekatan pivot
untuk memisahkan pola parafrase dari korpus bilingual [5].
Berdasarkan permasalahan di atas, maka akan
Kata kunci— Pivot Language, BLEU, Mesin dilakukan penelitian dengan mengimplementasikan pivot
Penerjemah Statistik language pada mesin penerjemah statistik bahasa Inggris
ke bahasa Melayu Sambas, dimana bahasa Indonesia
I.PENDAHULUAN digunakan sebagai pivot language. Selanjutnya dilakukan
Bahasa merupakan alat komunikasi yang digunakan uji akurasi penerjemahan untuk mengetahui seberapa
seseorang untuk menyampaikan ide, gagasan, konsep atau
perasaan kepada orang lain. Ragam bahasa yang dimiliki
setiap orang berbeda, hal ini yang terkadang menghalangi
pertukaran informasi karena orang lain tidak memahami
maksud dan tujuan yang ingin disampaikan.
Sebagai salah satu bahasa daerah yang ada di Kalimantan
Barat, bahasa Melayu Sambas adalah bahasa

Submitted 03-09-2018; Revised 13-12-2018; Accepted 17-12-2018


JEPIN (Jurnal Edukasi dan Penelitian Informatika), Vol. 4, No. 2, Desember 2018

besar pengaruh dari penggunaan bahasa Indonesia sebagai menggunakan SRILM menghasilkan
pivot language terhadap hasil terjemahan. Korespondensi : Della Widya Ningtyas

Berikut merupakan komponen yang digunakan dalam


pembangunan sistem ini.
A.Mesin Penerjemah Statistik
Mesin penerjemah statistik (MPS) atau Statistical
machine translation (SMT) adalah suatu paradigma dari
mesin penerjemah dimana penerjemahan dilakukan
berbasis model statistik dengan parameter-parameter yang
diturunkan dari analisis paralel korpus [6].
Ada beberapa pendekatan untuk machine
translation seperti pendekatan dengan
menggunakan aturan (rule- based machine
translation), pendekatan dengan menggunakan
contoh (example-based machine translation), dan
pendekatan dengan menggunakan model statistik
(statistical machine translation). Dalam mesin
penerjemah statistik, terdapat 3 komponen yang
terlibat dalam proses penerjemahan dari satu bahasa
ke bahasa lain yaitu: language model, translation
model, dan decoder [7].

Moses meupakan software open source yang


merupakan implementasi dari Mesin Penerjemah Statistik.
Moses digunakan untuk melatih model statistik teks
terjemahan dari bahasa sumber ke bahasa target. Saat
melakukan penerjemahkan bahasa, Moses membutuhkan
korpus dalam dua bahasa, bahasa sumber dan bahasa
target[8].
Secara umum, arsitektur mesin penerjemah statistik
Moses ditunjukkan pada Gambar 1.

Gambar. 1. Arsitektur mesin penerjemah statistik Moses [9]

Sumber data utama yang dipergunakan adalah


parallel corpus (korpus paralel) dan monolingual
corpus (monolingual korpus). Proses training
terhadap korpus paralel menggunakan GIZA++
menghasilkan translation model (TM). Proses
training terhadap bahasa target pada korpus paralel
ditambah dengan monolingual korpus bahasa target
Selanjutnya Moses digunakan sebagai mesin penerjemah
untuk menghasilkan bahasa target dari input kalimat
dalam bahasa sumber[10].
B.Case Folding
Case folding adalah tahapan mengubah huruf dalam
dokumen menjadi huruf kecil. Karakter selain huruf
dihilangkan dan dianggap pembatas (delimiter) [11].
C.Tokenizing
Tahap tokenizing adalah tahap pemotongan string

input berdasarkan tiap kata yang menyusunnya [12].


D.Pivot Language
Pivot language adalah bahasa yang digunakan sebagai
bahasa perantara terjemahan antara banyak bahasa. Pivot
language digunakan sebagai bahasa perantara terjemahan
antara bahasa yang berbeda. Untuk menerjemahkan
antara setiap pasangan bahasa A dan B, salah satu
diterjemahkan A ke bahasa pivot P, selanjutnya dari P ke
B [13].
E.Bilingual Evaluation Understudy (BLEU)
BLEU adalah sebuah algoritma yang berfungsi untuk
mengevaluasi kualitas dari sebuah hasil terjemahan yang
telah diterjemahkan oleh mesin dari satu bahasa alami ke
bahasa lain. Ide utama dibalik ini adalah “semakin dekat
terjemahan sebuah mesin dengan terjemahan manusia,
maka akan semakin baik[14].
BLEU mengukur modified n-gram precission score
antara hasil terjemahan otomatis dengan tejemahan
rujukan dan menggunakan konstanta yang
dinamakan brevity penalty [15]:

Gambar. 2. Rumus yang digunakan dalam


perhitungan nilai

BLE
U

language model (LM), sedangkan PoS model (PoS-M)


dihasilkan dari bahasa target pada korpus paralel
yang setiap katanya sudah ditandai dengan PoS. TM,
LM dan PoS-M digunakan untuk menghasilkan
decoder Moses.
KJeEtPerIaNng(Jaunr: nal Edukasi dan Penelitian Informatika), Vol. 4, No. 2, Desember 2018

BP = brevity penalty

c = jumlah kata dari hasil


terjemahan otomatisr = jumlah
kata rujukan
JEPIN (Jurnal Edukasi dan Penelitian Informatika), Vol. 4, No. 2, Desember 2018

Inggris, bahasa Indonesia dan bahasa Melayu Sambas. C.Implementasi Mesin Penerjemah
Jumlah korpus paralel yaitu 3000 pasang kalimat. Statistik BahasaInggris ke Bahasa Melayu
Sambas
B.Perancangan Mesin Penerjemah Statistik
Model bahasa digunakan sebagai sumber pengetahuan
Perancangan mesin penerjemah statistik yang akan dibuat berbasis teks dengan nilai-nilai probabilistik. Penelitian ini
dapat ditunjukkan pada Gambar 3 dan Gambar 4. menggunakan n-gram sebagai language model. Model
Bahasa dibangun dengan tool open source SRILM.
Bahasa Inggris Bahasa Melayu Berdasarkan Gambar 5 model bahasa menghasilkan n-
Sambas gram data yang terdiri dari n gram 1, n gram 2, n gram 3.
Unigram (n gram 1) mempunyai data satu token, bigram (n
Gambar 3 Perancangan Mesin Penerjemah Statistik
gram 2) mempunyai data dua token dan trigram (n gram 3)
mempunyai data tiga token dan masing-masing data dari n
gram disertakan nilai probabilitasnya.
Bahasa Melayu
Bahasa Inggris Bahasa Indonesia
Sambas
Gambar 4 Perancangan Mesin Penerjemah \data\
Statistik Menggunakan
ngram
Pivot Language 1=9832

Pada penelitian ini terdapat tiga mesin penerjemah ngram


statistik yang akan dibuat. Tahap pertama akan dibuat 2=40417
mesin translasi bahasa Inggris ke bahasa Melayu Sambas ngram
seperti yang ditunjukkan pada Gambar 3. Tahap kedua 3=2526 ade
menggunakan bahasa Indonesia sebagai pivot language juak
akan dibuat dua mesin yaitu mesin translasi bahasa Inggris \2-grams: ade
ke bahasa Indonesia dan mesin translasi bahasa Indonesia \3-grams: -1.522103
ke bahasa Melayu Sambas seperti yang ditunjukkan pada banyak urang Gambar. 5 Model bahasa
Gambar 4. dengan bahasa Melayu Sambas - kasal
1.248756 sebagai bahasatarget banyak urang
Pada penelitian ini digunakan 3000 kalimat yang dibagi
yang
atas 5 fold yang masing-masing berjumlah 600 kalimat
seperti yang diperlihatkan pada Tabel 1. Untuk sebuah Model translasi digunakan untuk memasangkan teks
percobaan diambil 1 buah fold untuk testing dan 4 buah input dalam bahasa sumber dengan teks output dalam
fold sisanya untuk training. Dengan kata lain, dari 3000 bahasa target. Model translasi dibangun dengan tool open
kalimat korpus paralel dibagi menjadi 600 kalimat untuk source Giza++. Proses pemodelan translasi oleh Giza++
testing dan 2400 kalimat untuk training seperti yang menghasilkan dokumen vocabulary corpus dan word
terlihat pada Tabel 2. Sehingga untuk sebuah data set alignment. Dokumen-dokumen tersebut terdapat 4 file
korpus paralel dilakukan 5 kali percobaan dan dari hasil yaitu “corpus, giza Inggris-Melayu Sambas, giza Melayu
kelima percobaan tersebut diambil nilai rata-ratanya. Sambas-Inggris dan model”. Pemodelan translasi oleh
Giza++ dapat dilihat pada Gambar 6 dan Gambar 7.
TABEL I.
1 UNK 0
PEMBAGIAN FOLD PADA KORPUS the 3637
2 , 2601
Fold Jumlah of 2024
P 1-600 5
3 to 1624
Gambar. 6 Dokumen vocabulary corpus bahasa Inggris
Q 601-1200 4
Angka 1 sampai 5 pada dokumen vocabulary
R 1201-1800 corpus
S 1801-2400
1 UNK , 0
T 2401-3000
dan 2598
TABEL II. 2 di 1411
1366
5
3 yang 1258
Mesi JUMLAH ESIN DENGAN MBAGIAN Trainin Gambar. 7 Dokumen vocabulary corpus bahasa Melayu
Mn Testin FOLD g 4 Sambas
1 PE P g QRST
merupakan uniq id untuk setiap data token, sedangkan
angka disebelah kanan token menunjukkan frekuensi
2 Q PRST kemunculan. Vocabulary corpus yang dihasilkan mesin
penerjemah bahasa Inggris-bahasa Melayu Sambas terdiri
3 R PQST

4 S PQRT
JEPIN (Jurnal Edukasi dan Penelitian Informatika), Vol. 4, No. 2, Desember 2018

token untuk bahasa Melayu Sambas. Dokumen alignment statistik bahasa Inggris – bahasa Melayu Sambas
dapat dilihat pada Gambar 8. mengalami peningkatan nilai BLEU sebesar 5,015%.
E.Analisis Hasil Pengujian
Berikut adalah contoh hasil terjemahan mesin
penerjemah statistik.
1.Kalimat masukan : among the dead were
two teenagegirls
Gambar. 8 Dokumen Alignment bahasa Inggris – bahasa Melayu a)di antare yang tewas adalah duak
Sambas remaja perempuan
b)para tewas ade di antare duak teenage
Dokumen alignment terdapat tiga baris kalimat. Baris perempuan
pertama berisi letak kalimat target (111) dalam korpus, c) 12,98%
panjang kalimat sumber (10), panjang kalimat target (13) d) di antare korban tewas adalah duak teenage
dan nilai alignment (1.19316e-12). Baris kedua perempuan
merupakan bahasa sumber dan baris ketiga merupakan e) 88,25%
alignment kalimat bahasa target terhadap kalimat bahasa 2.Kalimat masukan : president jokowi at the end of
sumber. Berdasarkan gambar tersebut kalimat bahasa target september 2015 has reviewed 500 hectares of
di-align ke kalimat bahasa sumber. Makna kata planting land in karawang regency , west java
”penumpang” ({ 5 }) pada kalimat bahasa target, di- align a)presiden jokowi pade akhir september 2015
ke kata kelima bahasa sumber yaitu “passengers”. telah meninjau lahan uji coba tanam seluas 500
hektar dikabupaten karawang , jawa barat
D.Pengujian Hasil Terjemahan
b)presiden jokowi pade akher september 2015
Pengujian hasil terjemahan dilakukan dengan pengujian udah reviewed 500 hektar kabon tanam di
otomatis BLEU. Mesin penerjemah statistik dibangun karawang regency , jawa barat
dengan dua tahap. Tahap pertama merupakan mesin c) 79,38%
penerjemah statistik bahasa Inggris ke bahasa Melayu d) presiden jokowi pade akher september 2015 udah
Sambas. Tahap kedua merupakan mesin penerjemah reviewed 500 hektar tanam lahan di kabupaten karawang
menggunakan bahasa Indonesia sebagai pivot language. , jawa barat
Pada tahap kedua ini dibangun dua mesin yaitu mesin e) 81,64%
penerjemah statistik bahasa Inggris ke bahasa Indonesia 3.Kalimat masukan : this surplus condition that makes
dan mesin penerjemah statistik bahasa Indonesia ke bahasa indonesia not import onion in 2016 , said amran
Melayu Sambas. sulaiman
Setelah membuat output berupa hasil terjemahan a) keadaan surplus itok yang muat indonesia
otomatis dari mesin penerjemah statistik, langkah daan mengimpor bawang merah pade 2016 ,
selanjutnya adalah mendapatkan nilai BLEU dari output nye amransulaiman
dengan cara membandingkan output tersebut dengan b)itok surplus condition yang muat indonesia
korpus bahasa target yang telah dibuat sebelumnya. Hasil daan impor bawang merah pade 2016 , jinye
pengujian terjemahan otomatis dapat dilihat pada Tabel 3. amran sulaiman
TABEL III. c) 90,76%
d) itok surplus kondisi yang muat indonesia daan
HASIL PENGUJIAN BLEU impor bawang merah pade 2016 , jinye amran sulaiman
e) 93,65%
MPS Inggris - Melayu MPS Inggris – Melayu 4.Kalimat masukan : two other hostages have been
Mesin Sambas Tanpa Pivot Sambas dengan Pivot
Language Language released earlier , and two are still detained
a) duak sandera laingnye dah kanak
1 21,16 22,55 bebaskan sebalomnye , dan duakk
2 23,09 24,68
maseh ditahan
3 24,79 25,04
4 15,84 16,8
b)duak laing sandera dah merilis awal ,
5 14,41 15,2 dan duakmaseh ditahan
Rata-rata 19,858 20,854 c) 72,47%
d) duak sandera laingnye dah merilis awal , dan duak
Berdasarkan Tabel 3 diperoleh nilai BLEU pada mesin maseh ditahan
penerjemah statistik Bahasa Inggris-bahasa Melayu e) 82,11%
Sambas dengan nilai rata-rata 19,858%. Nilai rata-rata 5.Kalimat masukan : he is believed to have
BLEU pada mesin penerjemah statistik bahasa Inggris- organized smuggling 1,500 people into australia
bahasa Melayu Sambas dengan pivot language adalah since 1999
20,854%. a) die diyakinek dah mengorganisir penyelundupan
Hasil perhitungan penilaian otomatis terhadap hasil 1.500 urang ke australia sejak 1999
terjemahan seluruh kalimat uji pada mesin penerjemah
JEPIN (Jurnal Edukasi dan Penelitian Informatika), Vol. 4, No. 2, Desember 2018

b)die itok diyakinek ngelakukan organized Indonesia sebagai bahasa perantara atau pivot language,
penyelundupan 1.500 urang ke australia sejak sehingga kualitas mesin penerjemah menjadi lebih baik.
1999
c) 88,25% III.KESIMPULAN
d) die itok diyakinek untok udah mengorganisir A.Kesimpulan
penyelundupan 1,500 urang ke australia sejak
Berdasarkan hasil implementasi dan hasil analisis
1999
e) 92,99% pengujian terhadap mesin penerjemah statistik bahasa
Keterangan : Inggris – bahasa Melayu Sambas disimpulkan bahwa: 1.
Mesin penerjemah statistik dapat
a): kalimat referensi diimplementasikan untuk menerjemahkan
b): terjemahan MPS tanpa pivot language bahasa Inggris ke bahasa Melayu Sambas.
c) : skor BLEU MPS tanpa pivot language d): 2. Terjadi peningkatan nilai akurasi mesin
terjemahan MPS dengan pivot language penerjemah statistik dengan metode BLEU yaitu
e) : skor BLEU MPS dengan pivot language sebesar 5,015%.
3. Penggunaan pivot language dapat
Nomor satu frase “among the dead” diterjemahkan oleh mempengaruhi peningkatan akurasi
mesin penerjemah statistik tanpa pivot language penerjemahan pada mesin penerjemah statistik
menghasilkan output “para tewas ade di antare” dan skor bahasa Inggris – bahasa Melayu Sambas.
BLEU sebesar 12,98%. Mesin penerjemah statistik dengan 4. Bahasa Indonesia sebagai pivot language dapat
pivot language memperbaiki hasil terjemahan tersebut direkomendasikan sebagai bahasa perantara
dengan menghasilkan skor BLEU sebesar 88,25% dan pada mesin penerjemah statistik bahasa Inggris
output yang dihasilkan “di antare korban tewas”. Kalimat (bahasa asing lainnya) ke bahasa daerah.
nomor dua frase “in karawang regency, west java”
diterjemahkan oleh mesin penerjemah statistik tanpa pivot B. Saran
language menghasilkan output “di karawang regency , jawa Saran yang dapat diberikan sebagai pengembangan dari
barat” dan skor BLEU sebesar 79,38%. Mesin penerjemah penelitian ini adalah sebagai berikut.
statistik dengan pivot language memperbaiki hasil
1. Perlu adanya teknik penanganan Out-of-
terjemahan tersebut dengan menghasilkan skor BLEU
Vocabulary (OOV) untuk menerjemahkan
sebesar 81,64% dan output yang dihasilkan “di kabupaten
kata- kata yang tidak terdapat dalam
karawang , jawa barat”. Kalimat nomor tiga
sehingga dapat vocabulary corpus
frase “this surplus condition” diterjemahkan oleh mesin
meningkatkan kualitas terjemahan mesin
penerjemah statistik tanpa pivot language menghasilkan
penerjemah statistik.
output “itok surplus condition” dan skor BLEU sebesar
90,76%. Mesin penerjemah statistik dengan pivot language REFERE
memperbaiki hasil terjemahan tersebut dengan NSI
menghasilkan skor BLEU sebesar 93,65% dan output yang
dihasilkan “itok surplus kondisi”. Kalimat nomor empat [1]Utiyama, Masao., Isahara, Hitoshi. 2007. A Comparison of
frase “two other hostages” diterjemahkan oleh mesin pivot Methods for Phrase-based Statistical Machine
penerjemah statistik tanpa pivot language menghasilkan Translation. Jepang,Proceedings of NAACL HLT, pages
output “duak laing sandera” dan skor BLEU sebesar 484–491.
72,47%. Mesin penerjemah statistik dengan pivot language [2]Habash, Nizar., Hu, Jun. 2009. Improving Arabic-Chinese
Statistical Machine Translation using English as Pivot
memperbaiki hasil terjemahan tersebut dengan Language. Proceedings of the Fourth Workshop on
menghasilkan skor BLEU sebesar 82,11% dan output yang Statistical Machine Translation , pages 173–181.
dihasilkan “duak sandera laingnye”. Kalimat nomor lima [3]Paul, Michael., Y, Hirofumi., S, Eiichiro., N,Satoshi. 2009.
frase “he is believed to have organized” diterjemahkan On the Importance of Pivot Language
oleh mesin penerjemah statistik tanpa pivot language Selection for Statistical Machine Translation. Proceedings of
NAACL HLT: Short Papers, pages 221–224.
menghasilkan output “die itok diyakinek ngelakukan
[4]Costa-jussa, Marta R., Henriquez, Carlos., Banchs, Rafael
organized” dan skor BLEU sebesar 88,25%. Mesin E. 2011. Enhancing Scarce-Resource Language
penerjemah statistik dengan pivot language memperbaiki Translation Through Pivot Combinations. Proceeding of the
hasil terjemahan tersebut dengan menghasilkan skor BLEU 5th International Joint Conference on Natural Language
sebesar 92,99% dan output yang dihasilkan “die itok Processing, pages 1361- 1265.
diyakinek untok udah mengorganisir”. [5]Zhao, Shiqi., W, Haifeng., Liu, Ting., Li, Sheng. 2008. Pivot
Approach for Extracting Paraphrase Patterns from Bilingual
Skor BLEU pada mesin penerjemah statistik dengan Corpora. Proceedings of ACL-08: HLT, pages 780–788.
pivot language lebih tinggi dari pada skor BLEU pada [6]Hadi, Ibnu. 2014. Uji Akurasi Mesin Penerjemah Statistik Bahasa
mesin penerjemah statistik tanpa pivot language karena Indonesia ke Bahasa Melayu Sambas dan Mesin Penerjemahan
kalimat hasil terjemahan memiliki terjemahan yang Statistik Bahasa Melayu Sambas ke Bahasa Indonesia.
Pontianak, JUSTIN Vol 3 No 1.
mendekati dengan kalimat referensi. Hal ini disebabkan [7]Manning, Christopher D. dan Schutze, Hinrich. 2000.
mesin penerjemah statistik menggunakan bahasa Foundations Of Statistical Natural Language Processing.
London : The MIT Press Cambridge Massachusetts.
[8]Hasbiansyah, Muhammad. 2016. Tuning for Quality Untuk Uji
Akurasi Mesin Penerjemah Statistik (MPS) Bahasa
Indonesia – Dayak Kanayatn. Pontianak , JEPIN Vol. 1 No.
1 2016.
[9]Sujaini, Herry., Negara, Arif Bijaksana Putra. 2015.
Analysis of Extended Word Similarity Clustering
based Algorithm on Cognate Language. Gujarat:
ESRSA Publications Pvt. Ltd.
[10] Y.Jarob, H. Sujaini dan N. Safriadi. 2016. Uji
Akurasi Penerjemahan Bahasa Indonesia – Dayak
Taman dengan Penandaan Kata Dasar dan
Imbuhan. JEPIN, Vol. 2 No. 2.

[11]Hasbiansyah , Muhammad. 2016. Tuning For


Quality Untuk Uji Akurasi Mesin Penerjemah
Statistik (MPS) Bahasa Indonesia - Bahasa Dayak
Kanayatn. Pontianak, JEPIN Vol 1 No 1 2016.
[12]Marlinda, Linda dan Rianto, Harsih. 2013.
Pembelajaran Bahasa Indonesia Berbasis Web
Menggunakan Metode Maximum Marginal
Relevance.Manajemen Informatika.
Jakarta: Sesindo
[13]Triawati, Candra. 2009. Metode Pembobotan
Statistical Concept Based untuk Klastering dan
Kategorisasi Dokumen Berbahasa Indonesia.
Jakarta: IT TELKOM
[14]Wu, Hua., Wang, Haifeng. 2007. Pivot language
Approach for Phrase-Based Statistical Machine
Translation. Proceedings of 45th Annual Meeting of
the Association for Computational Linguistics,
pages 856- 863.
Perbaikan Probabilitas [15]Mandira, Soni. 2016.
Lexical Model untuk Meningkatkan Akurasi Mesin
Penerjemah Statistik. Pontianak, JEPIN Vol 2 No 1
2016.
Hasil Riview Jurnal

JUDUL Pengunaan Pivot Language pada Mesin


Penerjemah Statistik Bahasa Inggris ke Bahasa
Melayu Sambas

VOLUME & HALAMAN Vol. 4 No. 2 Desember 2018


6 Halaman

TAHUN 2018

PENULIS Della Widya Ningtyas , Herry Sujaini ,


Novi Safriadi

RIVIEWER MUHAMMAD REZA BAGUS


KUSUMA

TANGGAL 1 JANUARI 2023

TUJUAN PENELITIAN Salah satu bahasa daerah yang ada di


Kalimantan Barat, bahasa Melayu Sambas
adalah bahasa Melayu yang dituturkan oleh
masyarakat asli kabupaten Sambas.
Perbedaan bahasa dapat menjadi penghalang
pertukaran informasi, maka saat ini sedang
dikembangkan teknologi mesin penerjemah.
Telah banyak dilakukan penelitian mengenai
pengembangan mesin penerjemah statistik
bahasa Inggris ke bahasa
Indonesia dan bahasa Indonesia ke
bahasa daerah sehingga sudah banyak tersedia
korpus paralel bahasa Inggris
– bahasa Indonesia dan korpus paralel
bahasa Indonesia – bahasa daerah.

METODE PENELITIAN Dilakukan penelitian dengan


mengimplementasikan pivot language pada
mesin penerjemah statistik bahasa Inggris ke
bahasa Melayu Sambas, dimana bahasa
Indonesia digunakan sebagai pivot language.
Selanjutnya dilakukan uji akurasi
penerjemahan untuk mengetahui seberapa
besar pengaruh dari penggunaan bahasa
Indonesia sebagai pivot language terhadap hasil
terjemahan. Berikut merupakan komponen
yang digunakan dalam pembangunan sistem
ini.
A.Mesin Penerjemah Statistik Mesin
penerjemah statistik (MPS) atau
Statistical machine translation
(SMT)
B.Case Folding
C.Tokenizing
D.Pivot Language Pivot language
E.Bilingual Evaluation Understudy
(BLEU)
D.Penerapan Statistika & Probabilitas diBerbagai Bidang :
a.Bidang Teknologi
Sistem Informasi Manajemen, sistem informasi manajemen adalah pengendalian internal suatu
bisnis yang meliputi pemanfaatan manusia, dokumen teknologi, dan, prosedur oleh akutansi
manajemen untuk mencapai tujuan suatu organisasi.
Sistem informasi manajemen mempunyai tiga tujuan umum, yang pertama adalah
menyediakan informasi yang dipergunakan di dalam perhitungan harga pokok jasa, produk,
dan tujuan lain yang diinginkan manajemen, yang kedua adalah menyediakan informasi yang
dipergunakan dalam perencanaan, pengendalian, pengevaluasian, dan perbaikan berkelanjutan,
dan yang terakhir adalah menyediakan informasi untuk pengambilan keputusan. Ketiga tujuan
tersebut menunjukkan bahwa manajer dan pengguna lainnya perlu memiliki akses ke informasi
akuntansi manajemen dan mengetahui bagaimana cara menggunakannya.
b.Bidang Pendidikan
Pentingnya Statistika & Probabilitas dalam Pendidikan disebut sebagai „esensi dan
pentingnya data untuk setiap bidang pencarian‟ tentang matematika, pendidikan dan
pembelajaran, perusahaan, penelitian ilmiah, sistem komputer, sejarah, dll., Sebagian besar
secara khusus signifikansi dan tugas data dalam studi penelitian instruksional.
Misalnya, adanya penilaian atau evaluasi dari guru ataupun dosen disetiap semester akan
membantu kita untuk mengevaluasi hasil belajar dan bisa menjadi dasar untuk terus
meningkatkan prestasi kita di setiap semester berikutnya. Data yang kita dapatkan tentunya
bisa berupa deskriptif atau narasi (data kualitatif) ataupun berupa angka-angka (data
kuantitatif).
Statistika akan sangat diperlukan ketika penelitian tersebut merupakan penelitian
kuantitatif, dimana data, informasi, atau hasil penelitian yang kita dapatkan atau kita miliki
merupakan data yang berupa angka-angka (data kuantitatif).
Salah satu contoh kasus penggunaan statistika yang terjadi dalam dunia pendidikan yaitu
pada saat siswa-siswi Sekolah Menengah Kejuruan yang melakukan Praktik Kerja Lapangan
(PKL) ataupun bisa juga disebut Praktik Kerja Industri (Prakerin).
c.Bidang Pertanian
Dalam dunia perikanan khususnya budidaya sama halnya dengan pembangunan disektor-
sektor lainnya tentunya juga membutuhkan data yang akurat dan berkelanjutan, agar
pembangunan bisa dirancang, dijalankan secara efektif serta tidak salah arah.
1.Sumber data dalam dunia perikanan.
Badan Pusat Statistik (BPS)
Kementerian Kelautan dan Perikanan (KKP) Unit Teknis
Dinas Kelautan dan Perikanan (DKP) Propinsi
Dinas Kelautan dan Perikanan (DKP) Kabupaten/Kota
Keluaran data akhir di KKP & BPS.
2.Jenis Data Statistik Perikanan Budidaya.
Data Statistik Produksi/Unit Ekonomi yaitu data mengenai hasil produksi ikan yang
dibudidaya, diantaranya yaitu:
Pembesaran Ikan
Pembenihan Ikan
Jenisnya data adalah:
Unit ekonomi : baik swasta dan pemerintah (Balai Benih)
Lahan
Kapasitas Produksi
Tenaga Kerja/Pembenih Ikan
Sarana produksi (induk, pakan, obat)\
Produksi = Volume (jenis dan ukuran), Nilai (jenis dan ukuran)
3.Data statistik Non Produksi yaitu data penunjang lainnya diluar produksi yang dapat
dijadikan acuan dalam menganalisa potensi dan kebutuhan penunjang budidaya diantaranya
yaitu:
Potensi Lahan
Sarana prasarana
Sertifikasi
Saluran
Pakan
Obat-obatan
d.Bidang Pemerintahan
Banda Pusat Statistik (BPS) merupakan salah satu lembaga kepemerintahan yang
menggunakan statistika didalamnya. Pengunaan statistika didalam BPS tidak murni statistik
saja, akan tetapi statistika ini berkaitan juga dengan demografi serta hal-hal yang berkaitan
dengan kepemerintahan. Contoh data BPS yang berkaitan dengan kepemerintahan adalah
jumlah pendapatan perkapita di Indonesia dan lainnya.\
Statistika pemerintahan digunakan juga dalam sensus penduduk, quick count atau
perhitungan cepat dalam pemilihan umum secara nasional maupun tidak, serta jajakan
pendapat atau polling.
Statistika yang dimiliki suatu negara bisa juga digunakan untuk menentukan haluan dari
suatu negara untuk mencapai kemakmuran, penentu kebijakan pembangunan pemerintahan,
memberikan keputusan pemerintahan secara bijak untuk kemajuan, mengungkapkan suatu
peristiwa kepemerintahan dan lainnya. Suatu negara yang baik biasanya membuat suatu
kesimpulan dengan statistik-statistik yang dimilikinya, kemudian statistik tersebut diolah
berdasarkan statistika. Jika kebijakan pemerintah tanpa didasari oleh statistik, kemungkinan
kebijakan tersebut hanya mementingkan kepentingan golongan dan kelompok tertentu.
Dampak kebijakan tanpa statistik dalam pemerintahan juga bisa berupa kehancuran sistem
pemerintahan atau kesejahteraan yang pemerintah tujukan untuk rakyat tidak tercapai dengan
baik dan tepat.
e.Bidang Farmasi
1.Peranan Statistika Probabilitas dalam Industri Farmasi
Statistika inferensia selalu dikaitkan ke pada keluarga distribusi probabilitas untuk
membangkitkan data. Oleh karena itu model-mode l dari statistika inferensia memberikan
ruang bagi faktor stokastik dan distribusi probabilitas tersebut dipergunakan untuk mendeteksi
adanya ketidakpastian untuk menarik suatu kesimpulan da ri parameter yang tidak diketahui.
Analisis statistika yang dikenal dalam kelompok ini adalah Inferential Data Analysis (IDA).
Definisi Statistika
Statistik adalah kumpulan keterangan yang disusu n atau disajikan dalam daftar atau gambar yang
melukiskan atau menggambarkan sesuatu. Oleh karena itu timbul berbagai sebutan statistik,
misalnya:
a.Statistik produksi obat
Data yang tersaji menggambarkan banyaknya produksi obat dari berbagai jenis barang yang telah
dihasilkan.
b.Statistik ekspor impor obat
Data yang tersaji menggambarkan banyaknya ek spor dan impor obat yang telah dilakukan.
c.Statistik penerimaan dan pengeluaran obat
Data yang tersaji menggambarkan banyaknya pe nerimaan dan pengeluaran obat dari suatu
perusahaan.
d.Statistik perdagangan obat
Data yang tersaji memberikan informasi me ngenai jenis dan volume perdagangan obat yang
telah dijalankan.

Anda mungkin juga menyukai