Anda di halaman 1dari 44

ISKB361357

1
Informasi Mata Kuliah
Mata Kuliah : Pilihan, Natural Language Processing
Jumlah SKS : 3 Sks
Semester : VI
Mata Kuliah Prasayarat : Teori Bahasa Automata

2
Outline Pembelajaran

Pengantar NLP Sequence


Labelling

EDA Text Intro Machine


Learning

UTS Preprocessing BoW UAS


QnA System

Feature
TFIDF Algoritma
Extraction
Parsing
Text Classification
Word Embedding
& Naïve Bayes

3
Referensi Mata Kuliah
• Daniel Jurafsky & James H. Martin, Speech and Language Processing: An
Introduction to Natural Language Processing,
• Computational Linguistics, and Speech Recognition, 2nd Edition, Prentice Hall,
2008
• Jacob Einstein, Natural Language Processing, 2018
• Michael Collins, Course and Notes on Natural Language Processing

4
Komponen Penilaian
• Sikap dan Kehadiran : 10%
• Tugas : 20%
• UTS : 30%
• UAS/Project : 40%

Note:
• ada UTS tapi UAS kemungkinan besar project
• Durasi 1 bulan di akhir untuk Tugas Besar/Projek pengganti UAS (Presentasi: Penilaian kelompok dan
individu) + Diskusi dan Materi ringan

5
Kontrak Perkuliahan
❑Toleransi Keterlambatan Maksimal 15 Menit
❑Selama perkuliahan HP dalam Silent Mode
❑Pengumpulan tugas ditetapkan sesuai jadwal dan dilakukan sebelum
pembelajaran dimulai
❑Kecurangan selama perkuliahan baik dalam Absensi/kehadiran, tugas, dan ujian
dianggap tidak lulus (Nilai = E)

6
Koordinator Kelas
Koordinator kelas bertugas untuk mem-broadcast informasi dari saya kepada
teman-teman sekelasnya, seandainya saya tidak bisa menghadiri kelas atau
kepentingan lainnya

Nama :
No :

7
Tugas Pertama Koordinator Kelas
• Buat Grup WA kelas untuk Mata Kuliah NLP
• Pembuatan Akun GDrive untuk pengumpulan kolektif tugas dll
• Admin Akun: Dosen & Ketua kelas

8
9
Definisi
NLP

10
• NLP merupakan salah satu cabang ilmu AI yang berfokus pada pengolahan Bahasa
natural. Bahasa natural adalah Bahasa yang secara umum digunakan oleh
manusia dalam berkomunikasi satu sama lain.
• Isu yang sering muncul dalam pengolahan Bahasa adalah ambiguitas dan Bahasa
yang berantakan/tidak formal (tidak sesuai dengan aturan bahasa)

ML in NLP 11
NLP
• Tujuan NLP: membuat komputer melakukan tugas berguna yang
melibatkan Bahasa manusia, tugas seperti mengaktifkan komunikasi
manusia-mesin, meningkatkan komunikasi manusia-manusia, atau
sekedar melakukan pemrosesan teks atau ucapan yang berguna.
(Jurafsky dan Martin)
• NLP digunakan untuk komunikasi antara manusia dan computer
seperti Bahasa C dan C++ yang digunakan untuk membuat program.
• Bahasa yang diterima oleh computer butuh untuk diproses dan
dipahami terlebih dahulu supaya maksud dari user bisa dipahami
dengan baik oleh computer, contoh aplikasi Ok Google, bisa
berinteraksi langsung dengan suara manusia.
12
Communication
• Tujuandalam produksi dan pemahaman Bahasa alami adalah
komunikasi
• Komunikasi untuk pembicara:
• Intention: memutuskan kapan dan informasi apa yang harus dikirim
(generasi strategis). Mungkin memerlukan perencanaan dan
pertimbangan tentang tujuan dan keyakinan agen.
• Generation: menterjemahkan informasi yang akan dikomunikasikan
(dalam representasi logis internal atau “Bahasa pemikiran”) ke dalam
rangkaian kata dalam bahasa alami yang diinginkan (generasi taktis)
• Synthesis: mengeluarkan string dalam modalitas, teks, atau ucapan yang
diinginkan.

13
Communication (cont)
• Komunikasi untuk pembicara:
• Perception: memetakan modalitas input ke serangkaian kata,
missal pengenalan karakter optic (OCR) atau pengenalan
ucapan.
• Analysis: menentukan konten informasi string.
• Syntactic interpretation (parsing): temukan pohon parse (parse tree)
yang benar yang menunjukkan struktur frase string
• Semantic Interpretation: ekstrak arti (literal) dari string (bentuk logis)
• Pragmatic Interpretation: mempertimbangkan efek dari keseluruhan
konteks pada pengubahan makna literal sebuah kalimat.
• Incorporation: memutuskan apakah akan mempercayai konten
string dan menambahkannya ke pangkalan pengetahuan atau
tidak.
14
15
16
Bidang Ilmu NLP

17
Related Areas

• Artificial Intelligence
• Formal Language (Automata) Theory
• Machine Learning
• Linguistics
• Psycholinguistics
→ilmu yang mempersoalkan dan mendeskripsikan proses psikologis yang
menjadikan manusia dapat memahami dan menggunakan bahasa.
• Cognitive Science
→studi antardisiplin dan ilmiah tentang budi dan kecerdasan
• Philosophy of Language 18
Skalabilitas (semua Bahasa) 19
Why NLP?
◼ To interact with computing devices using human
(natural) languages. For example,
◼ Building intelligent robots (AI).

◼ Enabling voice-controlled operation.

◼ To access (large amount of) information and


knowledge stored in the form of human languages
quickly.

20
Cakupan NLP

Output
Input

Optical character recognition (OCR) 21


22
Level of Linguistic Knowledge

23
24
• Morfologi mempelajari seluk-beluk bentuk kata serta pengaruh perubahan-perubahan bentuk
kata terhadap golongan dan arti kata.
25
• Contoh :
Adik berangkat ke sekolah
pada pukul 7

Adik = Subjek
berangkat = Predikat
Sekolah = Objek
Pada pukul 7 = Keterangan

S-P-O-K 26
27
• Contoh :
“Ia memiliki kemampuan berpikir di
bawah rata-tata”.
• Artinya orang tersebut tidak pintar/
bodoh.

28
29
• Google, googling, di”google” aja

30
Tantangan yang dihadapi pada NLP yaitu :

Ambiguitas bahasa alami.

Representasi pengetahuan
adalah tugas yang sulit.

Terdapat berbagai tingkat


informasi dalam bahasa
kita.

Terdapat beragam aplikasi


untuk teknologi bahasa.

31
CONTOH APLIKASI NLP

32
33
Information Extraction
• Unstructured text to structured text/database entries

ML in NLP 34
35
36
37
38
Natural language instruction

39
40
41
42
http://nlpprogress.com/ 43
THANKS

44

Anda mungkin juga menyukai