Major Assignments 1
Tugas Besar 1
I certify that this report assignment is my own work, based on my team or personal study
and that I have acknowledged all material and sources used in its preparation, whether they
be books, articles, reports, lecture notes, and any other kind of document.
Saya menyatakan bahwa laporan tugas ini adalah pekerjaan saya sendiri, berdasarkan studi
saya atau tim secara pribadi dan saya telah menuliskan semua materi dan sumber yang
digunakan dalam laporan ini, baik itu buku, artikel, laporan, catatan kuliah, dan lainnya.
Buatlah Video Q&A penjelasan mengenai jawaban pada Bagian A. Pada awal video diharapkan
untuk memperkenalkan diri dengan video tampak muka. Video diharapkan dapat dipuload ke
Youtube. Judul video di Youtube: Nama – Q&A Konsep Natural Language Processing.
Jawaban dari soal ini berupa tautan video Youtube.
💡 Dokumen dikumpulkan dalam bentuk .doc dengan format nama dokumen
TB1_NAMA_NIM ke Kantong Digital Tugas Besar 1 yang sudah disediakan.
Harap menggunakan template ini untuk menyelesaikan Tugas Besar 1 ini.
Jawaban:
A. Bagian A
1. Apa yang dimaksud dengan NLP?
Jawab:
Natural Language Processing (NLP) adalah penerapan ilmu komputer, khususnya
linguistik komputasional (computational linguistics), untuk mengkaji interaksi
antara komputer dengan bahasa (alami) manusia.
2. Selain segmentasi teks, apa tantangan pengolahan data atau riset di bidang NLP?
Jawab:
Disambiguasi makna kata (word sense disambiguation).
Ambiguitas sintaksis (syntactic ambiguity).
Masukan yang tak sempurna atau tak teratur (imperfect or irregular input).
Pertuturan (speech act).
8. Apa algoritma yang dapat digunakan untuk stemming teks bahasa Indonesia? Jelaskan.
Jawab:
Untuk melakukan stemming bahasa Indonesia kita dapat menggunakan library
Python Sastrawi yang sudah kita siapkan di awal. Library Sastrawi menerapkan
Algoritma Nazief dan Adriani dalam melakukan stemming bahasa Indonesia.
Algortima Nazief & Adriani merupakan algoritma untuk mengubah kata yang
memiliki sufiks, prefix dan atau konfiks menjadi bentuk kata dasar. Algoritma ini
menggunakan kamus kata dasar dan mendukung recoding, yakni penyusunan
kembali kata-kata yang mengalami proses stemming berlebih.
9. Apa tujuan dari word embeddings?
Jawab:
Word embeddings adalah proses konversi kata yang berupa karakter
alphanumeric kedalam bentuk vector. Setiap kata adalah vector yang
merepresentasikan sebuah titik pada space dengan dimensi tertentu. Dengan word
embedding, kata-kata yang memiliki properti tertentu, misalnya berada pada
konteks yang sama, atau memiliki semantic meaning yang sama berada tidak jauh
satu sama lain pada space tersebut.
B. Bagian B
Link youtube: https://youtu.be/FKPsTMLMbL8