Diajukan untuk memenuhi tugas kelompok pada mata kuliah AI for education
Dosen pengampu:
2021
KATA PENGANTAR
Puji syukur kami panjatkan kehadirat Allah SWT atas segala limpahan rahmat dan
karunianya, sehingga kami dapat menyelesaikan penyusunan makalah mengenai NATURAL
LANGUAGE PROCESSING ini sebaik mungkin. Tidak lupa kami ucapkan terima kasih
kepada Winda Setya, M.Sc./ Fadli Emsa Zamani, ST., M. KOM. sela ku dosen mata kuliah AI
for education.
Dalam makalah ini tentunya kami menyadari masih ada kekurangan, baik dalam materi
pembahasan maupun teknik pengetikan. Kami memohon maaf apabila dalam penulisan makalah
ini terdapat kekurangan, karena sejatinya kesempurnaan hanya milik ALLAH SWT.
Semoga makalah ini dapat dipergunakan sebagai salah satu acuan, petunjuk maupun
pedoman bagi pembaca dalam memahami NATURAL LANGUAGE PROCESSING Oleh
karena itu sumbangan saran, kritik dan pendapat yang sehat dan membangun sangatlah kami
harapkan.
Penulis
DAFTAR ISI
KATA PENGANTAR.............................................................................................................. ii
DAFTAR ISI............................................................................................................................ iii
BAB I PENDAHULUAN.......................................................................................................... 1
A. Latar Belakang ................................................................................................................ 1
B. Rumusan Masalah ........................................................................................................... 1
C. Tujuan Penulisan ............................................................................................................. 1
BAB II PEMBAHASAN ........................................................................................................... 5
A. Pemahaman Kalimat ....................................................................................................... 5
B. PARSING ....................................................................................................................... 7
C. SEMANTIK .................................................................................................................... 8
BAB III PENUTUPAN ........................................................................................................... 16
A. Kesimpulan ................................................................................................................... 16
DAFTAR PUSTAKA .............................................................................................................. 16
BAB I
PENDAHULUAN
Latar belakang
Metode Natural Language Processing (NLP) atau Pemrosesan Bahasa Alami adalah
pembuatan program yang memiliki kemampuan untuk memahami kemampuan manusia. Pada
prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang ingin
dikomunikasikan antar manusia. Bentuk utama representasinya adalah berupa suara/ucapan
(spoken language), tetapi sering pula dinyatakan dalam bentuk tulisan. Inti dari pemrosesan bahasa
alami adalah penguraian kalimat atau sering disebut dengan parser.Parser berfungsi untuk
membaca kalimat, kata demi kata dan menentukan jenis kata apa saja yang boleh mengikuti kata
tersebut. Dengan penerapan teknologi ini sebagai solusi untuk menghindari terjebak dalam
kemacetan, dan juga sebagai media untuk mempermudah mendapat informasi secara tepat dan
akurat dimana titik – titik area terjadi kemacetan yang memiliki tujuan mempersingkat mencapai
tujuan.
Dengan berkembangnya teknologi saat ini, jejaring sosial adalah situs di internet yang
memungkinkan para penggunanya untuk berintraksi dengan pengguna lainnya sehingga banyak
masyarakat yang memberikan informasi kemacetan yang dapat di akses langsung melalui
handphone para pengguna. Karena media dan jejaring sosial sudah setingkat dengan sumber berita
arus utama, informasi yang kita sampaikan di situs jejaring sosial sangat cepat menyebar. Dengan
cara mengirimkan tweet untuk menyebarkan informasi kemacetan diperlukannya pengolahan
informasi yang baik, Sehingga penulisan nama jalan harus sesuai dengan nama sebenarnya.
Rumusan masalah
Tujuan
PEMBAHASAN
A. Pemahaman Kalimat
Natural Language
Natural Language atau bahasa alami adalah bahasa yang dapat dimengerti dan dipahami
oleh seseorang pada lokasi tertentu, sebagai contoh bahasa alami dari orang Indonesia adalah
bahasa Indonesia. Bahasa alami biasa diajarkan orangtia pada anaknya ketika masih bayi. Seiring
bertambahnya usia anak, maka pemahaman terhadap bahasa tersebut semakin meningkat. Untuk
dapat mengetahui bahasa alami, perlu mengetahui susunan dari bahasa alami tersebut, sebagai
contoh untuk Bahasa Inggris, seseorang perlu mempelajari kosa kata Inggris, tata bahasa Inggris,
dan sebagainya.
Natural Language Processing
Natural Language Processing (NLP) dapat didefinisikan sebagai kemampuan suatu komputer
untuk memproses bahasa, baik lisan maupun tulisan yang digunakan oleh manusia dalam
percakapan sehari-hari. Untuk proses komputasi, bahasa harus direpresentasikan sebagai
rangkaian simbol yang memenuhi aturan tertentu. Secara sederhana, NLP adalah mencoba untuk
membuat komputer dapat mengerti perintah-perintah yang ditulis dalam standar bahasa manusia.
Terdapat beberapa alasan yang menyulitkan NLP (Arman, 2004), yaitu masalah ambiguity atau
makna ganda dan jumlah kosa kata (vocabulary) yang besar dan berkembang dari waktu ke waktu.
Berdasarkan alasan tersebut, NLP tidak mempedulikan bagaimana suatu kalimat dimasukkan ke
dalam komputer tetapi meng-copy informasi dari kalimat tersebut.
a.Parser
Elemen yang paling menentukan dalam NPL adalah parser. Parser merupakan bagian dari
program yang menganalisa input secara sintaksistik. Setiap kata dan bagian-bagian ujarannya
diidentifikasikan. Parser terdapat 3 (tiga) jenis, yaitu Parser State-Machine, Parser Context-Free
Recursive-Descent, dan Parser Noise-Disposal. Parser State Machine menggunakan keadaan yang
sesungguhnya dari kalimat untuk memprediksi tipe apa dari kata yang berlaku. Parser Context-
Free RecursiveDescent menggunakan production rule untuk menganalisa sebuah kalimat. Parser
Noise-Disposal merupakan jenis parser yang sangat umum digunakan dalam aplikasi yang berbasis
pada database. Contoh dari jenis parser ini misalkan terdapat query dalam bahasa alami sebagai
berikut, “lihatkan saya semua perusahaan dengan persediaan > 100” maka ke dalam bahasa SQL
akan menjadi “select perusahaan from table_perusahaan where persediaan > 100”.
• X → bY | Za
• Y → aY | b
• Z → bZ | ɛ
CFG adalah tata bahasa yang mempunyai tujuan sama seperti halnya tata bahasa regular yaitu
merupakan suatu cara untuk menunjukkan bagaimana menghasilkan suatu untai-untai dalam
sebuah bahasa. CFG perlu disederhankan dengan tujuan untuk melakukan pembatasan sehingga
tidak menghasilkan pohon penurunan yang memiliki kerumitan yang tak perlu atau aturan
produksi tak berarti. Berikut merupakan langkah-langkah dalam melakukan penyederhanaan CFG:
• Eliminasi ɛ-production
• Eliminasi unit production
• Eliminasi useless symbol
C. PARSING
Proses parsing tidak hanya dapat dilakukan dalam NLP, melainkan juga pada bidang lain
seperti pada pembuatan sebuah compiler. Metode-metode parsing yang dibahas berikut khusus
digunakan dalam NLP. Sebelumnya perlu diketahui arti dari istilah constituent, yaitu unsur-unsur
pembentuk kalimat yang dapat berdiri sendiri, contohnya noun phrase, verb phrase dan sebagainya
; dan istilah parser yaitu program yang melakukan proses parsing.
a. Top-down Parsing
Top-down parser bekerja dengan cara menguraikan sebuah kalimat mulai dari constituent
yang terbesar yaitu sampai menjadi constituent yang terkecil. Hal ini dilakukan terus-menerus
sampai semua komponen yang dihasilkan ialah constituent terkecil dalam kalimat, yaitu kata.
Sebagai contoh, dengan menggunakan contoh grammar di atas, dapat dilakukan proses top-down
parsing untuk kalimat “The dog chased the cat” yang ditunjukkan pada gambar 3. Dari gambar ini
terlihat bahwa top-down parser menelusuri setiap node pada parse tree secara pre-order. Beberapa
metode parsing yang bekerja secara topdown ialah:
o Top-down parser biasa
o Recursive-descent parser
o Transition-network parser
o Chart parser
Predikat parse berfungsi untuk melakukan proses parsing terhadap sebuah constituent tunggal
(misalnya s, np dan sebagainya), sedangkan parse_list berfungsi untuk melakukan proses parsing
terhadap sekumpulan constituent, misalnya [np,vp], [d,n] dan sebagainya. Parser akan dipanggil
dengan query parse(s,X,[]), dimana s berarti kalimat dan X ialah input kalimat yang berbentuk list
dari symbol. Sebagai contoh, untuk melakukan parsing terhadap kalimat
Makna kata buku adalah konsep buku yang tersimpan dalam otak kita dan dilambangkan
dengan kata buku. Gambar di samping menunjukkan bahwa di antara lambang bahasa dan konsep
terdapat hubungan langsung, sedangkan lambang bahasa dengan referen atau objeknya tidak
berhubungan langsung (digambarkan dengan garis putus-putus) karena harus melalui konsep.
Dengan demikian, dapat disimpulkan bahwa semantik mengkaji makna tanda bahasa, yaitu kaitan
antara konsep dan tanda bahasa yang melambangkannya.Semantik kebahasaan adalah kajian
tentang makna yang digunakan untuk memahami ekspresi manusia melalui bahasa. Bentuk lain
dari semantik mencakup semantik bahasa pemrograman, logika formal, dan semiotika. Semantik
berbeda dengan sintaksis, kajian tentang kombinatorik unit bahasa (tanpa mengacu pada
maknanya), dan pragmatik, kajian tentang hubungan antara simbol-simbol bahasa, makna, dan
pengguna bahasa.3 Grammar ialah aturan-aturan pembentukan suatu kalimat dalam sebuah bahasa,
atau yang biasa disebut tata bahasa. Dengan adanya grammar, parsing dapat dilakukan secara cepat
dengan hanya melakukan proses searching. Parser akan mencari aturan-aturan yang tepat untuk
membentuk struktur suatu kalimat. Salah satu contoh grammar yang sederhana untuk bahasa
Inggris ialah sebagai berikut:
Sentence = noun phrase + verb phrase
noun phrase = determiner + noun
verb phrase = verb + noun phrase
determiner = the, a
noun = dog, dogs, cat
verb = chased, see, sees
Grammar ini akan mampu menghasilkan sekumpulan kalimat bahasa Inggris yang
sederhana, seperti :
• The dog chased a cat
• The dog sees a cat
• The dogs sees a cat (nonvalid)
• A dogs chased a cat (nonvalid)
Proses pembentukan kalimat dari grammar disebut derivation. 4
5Arry Akhmad Arman. 2004. Teknologi Pemrosesan Bahasa Alami sebagai Teknologi Kunci untuk Meningkatkan
Cara Interaksi antara Manusia dengan Mesin. Hal 7-12
Indonesia untuk memberikan query masukan. Masukan yang diberikan adalah pertanyaan untuk
mendapatkan informasi atau data dari basisdata.Elemen pemroses bahasa terdiri dari penganalisis
leksikal, parser dan pembangkit kode atau perlakuan. Maier dan Warren dalam Hartati dan
Zuliarso menyatakan komponen pemrosesan bahasa alami terdiri dari scanner, parser, penterjemah
(translator), optimasi query dan pengevaluator query
Program aplikasi pengolah bahasa alami untuk query basisdata akademik dengan format data
XML adalah program aplikasi yang digunakan oleh staf administrasi akademik untuk membantu
pekerjaan pencarian data dalam format XML yang berkaitan dengan data akademik mahasiswa
dalam basisdata akademik. Dengan menggunakan program aplikasi ini, maka staf administrasi
akademik yang tidak mempunyai dasar pengetahuan SQL tetap dapat melakukan pencarian data
akademik dengan menggunakan bahasa alami yaitu bahasa Indonesia. Basisdata XML adalah
sistem perangkat lunak yang digunakan untuk menyimpan data yang membolehkan data untuk
diimpor, diakses dan diekspor dalam format XML. Basisdata XML mempunyai keunggulan lebih
baik dibandingkan dengan sistem basisdata relasional jika data yang akan disimpan berupa
dokumen. Dengan basisdata XML juga memungkinkan untuk melakukan penelusuran isi dokumen
masukan program aplikasi ini berupa sebuah kalimat tanya atau kalimat perintah dalam bahasa
Indonesia yang diketikkan ke dalam suatu antarmuka (form). Bentuk kalimat tanya atau kalimat
perintah harus sesuai dengan aturan produksi. Jika kalimat tanya / perintah yang dimasukkan
sesuai dengan aturan produksi dan data tersedia, maka data akan ditampilkan dalam bentuk tabel.
Jika kalimat tanya / perintah yang dimasukkan tidak sesuai dengan aturan produksi yang telah
ditetapkan, maka hasil yang ditampilkan adalah sebuah peringatan yang menyatakan bahwa format
kalimat yang dimasukkan salah.6
6Setyawan Wibisono. 2013. Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik dengan Format Data
Xml. Jurnal Teknologi Informasi DINAMIK Volume 18, No.1, Januari. Hal 65-67
BAB III
PENUTUP
A.KESIMPULAN
Natural Language Processing berperan penting untuk interaksi manusia dan AI. Dengan
semakin berkembangnya teknologi dan penelitian yang dilakukan di bidang ini, kita bisa melihat
lebih banyak lagi inovasi yang akan membuat mesin lebih pintar dalam memahami bahasa
manusia. Natural Language Processing (NLP) merupakan salah satu cabang ilmu AI yang
berfokus pada pengolahan bahasa natural. Bahasa natural adalah bahasa yang secara umum
digunakan oleh manusia dalam berkomunikasi satu sama lain. Bahasa yang diterima oleh
komputer butuh untuk diproses dan dipahami terlebih dahulu supaya maksud dari user bisa
dipahami dengan baik oleh komputer.
SARAN
Arry Akhmad Arman. 2004. Teknologi Pemrosesan Bahasa Alami sebagai Teknologi Kunci
untuk Meningkatkan Cara Interaksi antara Manusia dengan Mesin. Hal 7-12
Setyawan Wibisono. 2013. Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik
dengan Format Data Xml. Jurnal Teknologi Informasi DINAMIK Volume 18, No.1, Januari. Hal
65-67