NIM : 223190010
1. NLP memiliki 2 komponen dasar yaitu Natural Language Understanding dan Natural
Language Generation.
1) NLU merupakan cabang dari NLP yang bertujuan untuk mengembangkan
sistem yang dapat memahami bahasa manusia secara alami, termasuk
dalam bentuk lisan maupun tertulis.
Phonology adalah cabang linguistik yang mempelajari sistem
bunyi dalam suatu bahasa dan bagaimana bunyi-bunyi tersebut
digunakan untuk membentuk kata dan frasa.
Morphology adalah tahap dilakukan analisa untuk setiap kata dan
komponen yang dimiliki tiap kata termasuk token non kata seperti
spasi, tanda baca, tanda pemisah.
Lexical adalah proses pemahaman kata dan makna di dalam teks
dalam bahasa tertentu, dan kemudian digunakan dalam proses
pemrosesan bahasa selanjutnya seperti pengenalan suara,
penerjemahan mesin, atau analisis sentimen.
Syntactic adalah tahap ini sederetan kata disusun kedalam
struktur yang memperlihatkan bagaimana hubungan satu kata
dengan kata lainnya.
Semantic adalah tahap struktur deretan kata yang sudah
terbentuk akan diberi arti. Dengan kata lain pemetaan dibuat
antara struktur sintax dengan object yang berhubungan.
Discourse adalah tahap arti dari suatu kalimat disesuaikan dengan
kalimat-kalimat lain, karena arti dari suatu kalimat biasanya
berhubungan dengan kalimat sebelumnya dan kalimat
sesudahnya.
Pragmatik adalah struktur yang terbentuk menghasilkan
interpretasi ulang dari apa yang sudah dikatakan atau ditulis
sebelumnya dengan arti yang sebenarnya.
N-Gram merupakan model yang digunakan untuk memprediksi kata berikutnya yang
mungkin dari kata N-1 sebelumnya. Tahapan dari n-gram dapat dijelaskan sebagai
berikut: