Anda di halaman 1dari 2

Nama : Haikal Limansah

Kelas : IF GAB 01
NIM : 1301170005

Kuis 5 NLP

SOAL 1 Aplikasi NLP: Mesin penerjemah


1.1 Jelaskan alasan mengapa mesin penerjemah merupakan sebuah task yang sulit, atau dengan
kata lain apa saja yang membuat mesin penerjemah sulit. Beri contoh-contohnya.
Jawaban :
1. Dikarenakan perbedaan kata. Contoh : Buku dalam B.Indonesia dan Book dalam B.Inggris
2. Perbedaan struktur antar bahasa. Contoh : Head-marking languages: relasi antara head dan
dependent umumnya dilakukan pada sisi head. Contoh pada Bahasa Inggris: the man’s house
3. Perbedaan urutan kata. Contoh : Bahasa SVO: kata kerja/verb cenderung ditemui di antara subyek
dan obyek, bahasa SOV: kata kerja/verb cenderung ditemui di akhir klausa dan Bahasa VSO: kata
kerja/verb cenderung ditemui di awal klausa.
4. Perbedaan morfologi. Contoh : Bahasa Inggris: in-come-ing -> incoming, Bahasa Indonesia: me-
rasa-kan -> merasakan.
5. Perbedaan gaya bahasa dan budaya. Contoh : Aksen

1.2 Jelaskan sedetail mungkin tentang Statistical Machine Translation menggunakan gambar di
bawah.
Jawaban :
Ide dasar : Mempelajari probabilistic (dari bahasa prancis ke inggris). Given (bahasa Prancis) yang
kemudian kita akan mencari yang sebaik baiknya kalimat dalam b.Inggris (mencari probabilitas yang
sebesar besarnya) untuk (y) <- kalimat bahasa inggris yang kita cari. Apabila kita menggunakan
teorema Bayes dimana argmax(y) merupakan bahasa target, model P(x|y) <- model translasi dan
model P(y) <- model bahasa.

1.3 Gambarkan arsitektur recurrent neural network untuk pembelajaran mesin (RNN MT). Berilah
penjelasan sedetail mungkin. RNN MT yg dijelaskan tsb tidak perlu dengan teknik attention. Antara
lain bisa dilihat di video https://youtu.be/i9qYuVaqFc4
Jawaban :

source sentence merupakan dasar paralel berbahasa prancis dan target sentences merupakan
kalimat berbahasa inggris. Melalui tahap encoder dan decoder. Dan merupakan sebuah satu
kesatuan (single system).
SOAL 2 Aplikasi NLP: Sistem tanya jawab (QA)
2.1 Jelaskan posisi proses reading comprehension dalam sebuah sistem tanya jawab factoid di
bawah. Jelaskan juga apa saja input dan out sebuah reading comprehension.
Jawaban : Pertanyaan diubah menjadi query kemudian search engine mengoutputkan kumpulan
dokumen yang relevan, kemudian diurutkan berdasarkan relevansinya. Inputnya sebuah pertanyaan
dan outputnya merupakan sebuah jawaban.

2.2 Jelaskan sedetail mungkin proses document retrieval. Apa saja input dan outputnya? Mengapa
document retrieval diperlukan sebelum reading comprehension?
Jawaban : Document retrieval adalah document IR (information retrieval) dimana inputnya adalah
sebuah query dan outputnya adalah sekumpulan dokumen yang diranking berdasarkan relevansinya
dengan query. Berfungsi agar passage lebih akurat.

2.3 Apa itu The Stanford Question Answering Dataset (SQuAD)? Beri sebuah contoh data SQuAD dan
berilah penjelasnya. Apa fungsi (digunakan untuk apa) SQuAD? Apa salah satu kelemahan utama
SQuAD 1.0?
Jawaban : SQuAD adalah kumpulan data pemahaman bacaan yang terdiri dari pertanyaan yang
diajukan oleh crowdworker pada kumpulan artikel Wikipedia, di mana jawaban untuk setiap
pertanyaan adalah segmen teks, atau rentang, dari bagian bacaan yang sesuai, atau pertanyaan
mungkin tidak dapat dijawab. Contoh data :

Anda mungkin juga menyukai