Anda di halaman 1dari 17

MAKALAH

NATURAL LANGUAGE PROCESSING

Diajukan untuk memenuhi tugas kelompok pada mata kuliah AI for education

Dosen pengampu:

Winda Setya, M.Sc.

Fadli Emsa Zamani, ST., M. KOM.

Disusun oleh: Kelompok 4

Zakiya Siti Patiha (1212020277)

Zihan Mahira (1212020279)

Siti Halimah Salmahat (1212020243)

Ummu Aisyah Syifa’ul Qulub (1212020267)

PENDIDIKAN AGAMA ISLAM

FAKULTAS TARBIYAH DAN KEGURUAN

UNIVERSITAS ISLAM NEGERI SUNAN GUNUNG DJATI BANDUNG

2021
KATA PENGANTAR

Puji syukur kami panjatkan kehadirat Allah SWT atas segala limpahan rahmat dan
karunianya, sehingga kami dapat menyelesaikan penyusunan makalah mengenai NATURAL
LANGUAGE PROCESSING ini sebaik mungkin. Tidak lupa kami ucapkan terima kasih
kepada Winda Setya, M.Sc./ Fadli Emsa Zamani, ST., M. KOM. sela ku dosen mata kuliah AI
for education.

Dalam makalah ini tentunya kami menyadari masih ada kekurangan, baik dalam materi
pembahasan maupun teknik pengetikan. Kami memohon maaf apabila dalam penulisan makalah
ini terdapat kekurangan, karena sejatinya kesempurnaan hanya milik ALLAH SWT.

Semoga makalah ini dapat dipergunakan sebagai salah satu acuan, petunjuk maupun
pedoman bagi pembaca dalam memahami NATURAL LANGUAGE PROCESSING Oleh
karena itu sumbangan saran, kritik dan pendapat yang sehat dan membangun sangatlah kami
harapkan.

Bandung,10 NOVEMBER 2022

Penulis
DAFTAR ISI

KATA PENGANTAR.............................................................................................................. ii
DAFTAR ISI............................................................................................................................ iii
BAB I PENDAHULUAN.......................................................................................................... 1
A. Latar Belakang ................................................................................................................ 1
B. Rumusan Masalah ........................................................................................................... 1
C. Tujuan Penulisan ............................................................................................................. 1
BAB II PEMBAHASAN ........................................................................................................... 5
A. Pemahaman Kalimat ....................................................................................................... 5
B. PARSING ....................................................................................................................... 7
C. SEMANTIK .................................................................................................................... 8
BAB III PENUTUPAN ........................................................................................................... 16
A. Kesimpulan ................................................................................................................... 16
DAFTAR PUSTAKA .............................................................................................................. 16
BAB I
PENDAHULUAN
Latar belakang
Metode Natural Language Processing (NLP) atau Pemrosesan Bahasa Alami adalah
pembuatan program yang memiliki kemampuan untuk memahami kemampuan manusia. Pada
prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang ingin
dikomunikasikan antar manusia. Bentuk utama representasinya adalah berupa suara/ucapan
(spoken language), tetapi sering pula dinyatakan dalam bentuk tulisan. Inti dari pemrosesan bahasa
alami adalah penguraian kalimat atau sering disebut dengan parser.Parser berfungsi untuk
membaca kalimat, kata demi kata dan menentukan jenis kata apa saja yang boleh mengikuti kata
tersebut. Dengan penerapan teknologi ini sebagai solusi untuk menghindari terjebak dalam
kemacetan, dan juga sebagai media untuk mempermudah mendapat informasi secara tepat dan
akurat dimana titik – titik area terjadi kemacetan yang memiliki tujuan mempersingkat mencapai
tujuan.
Dengan berkembangnya teknologi saat ini, jejaring sosial adalah situs di internet yang
memungkinkan para penggunanya untuk berintraksi dengan pengguna lainnya sehingga banyak
masyarakat yang memberikan informasi kemacetan yang dapat di akses langsung melalui
handphone para pengguna. Karena media dan jejaring sosial sudah setingkat dengan sumber berita
arus utama, informasi yang kita sampaikan di situs jejaring sosial sangat cepat menyebar. Dengan
cara mengirimkan tweet untuk menyebarkan informasi kemacetan diperlukannya pengolahan
informasi yang baik, Sehingga penulisan nama jalan harus sesuai dengan nama sebenarnya.

Rumusan masalah

1. pengertian Natural Language Processing


2. Bagaimana cara kerja Natural Language Processing?

Tujuan

1. Untuk mengetahui apa itu pengertian Natural Language Processing


2. Untuk mengetahui cara kerja Natural Language Processing
BAB II

PEMBAHASAN

A. Pemahaman Kalimat
Natural Language
Natural Language atau bahasa alami adalah bahasa yang dapat dimengerti dan dipahami
oleh seseorang pada lokasi tertentu, sebagai contoh bahasa alami dari orang Indonesia adalah
bahasa Indonesia. Bahasa alami biasa diajarkan orangtia pada anaknya ketika masih bayi. Seiring
bertambahnya usia anak, maka pemahaman terhadap bahasa tersebut semakin meningkat. Untuk
dapat mengetahui bahasa alami, perlu mengetahui susunan dari bahasa alami tersebut, sebagai
contoh untuk Bahasa Inggris, seseorang perlu mempelajari kosa kata Inggris, tata bahasa Inggris,
dan sebagainya.
Natural Language Processing
Natural Language Processing (NLP) dapat didefinisikan sebagai kemampuan suatu komputer
untuk memproses bahasa, baik lisan maupun tulisan yang digunakan oleh manusia dalam
percakapan sehari-hari. Untuk proses komputasi, bahasa harus direpresentasikan sebagai
rangkaian simbol yang memenuhi aturan tertentu. Secara sederhana, NLP adalah mencoba untuk
membuat komputer dapat mengerti perintah-perintah yang ditulis dalam standar bahasa manusia.
Terdapat beberapa alasan yang menyulitkan NLP (Arman, 2004), yaitu masalah ambiguity atau
makna ganda dan jumlah kosa kata (vocabulary) yang besar dan berkembang dari waktu ke waktu.
Berdasarkan alasan tersebut, NLP tidak mempedulikan bagaimana suatu kalimat dimasukkan ke
dalam komputer tetapi meng-copy informasi dari kalimat tersebut.
a.Parser
Elemen yang paling menentukan dalam NPL adalah parser. Parser merupakan bagian dari
program yang menganalisa input secara sintaksistik. Setiap kata dan bagian-bagian ujarannya
diidentifikasikan. Parser terdapat 3 (tiga) jenis, yaitu Parser State-Machine, Parser Context-Free
Recursive-Descent, dan Parser Noise-Disposal. Parser State Machine menggunakan keadaan yang
sesungguhnya dari kalimat untuk memprediksi tipe apa dari kata yang berlaku. Parser Context-
Free RecursiveDescent menggunakan production rule untuk menganalisa sebuah kalimat. Parser
Noise-Disposal merupakan jenis parser yang sangat umum digunakan dalam aplikasi yang berbasis
pada database. Contoh dari jenis parser ini misalkan terdapat query dalam bahasa alami sebagai
berikut, “lihatkan saya semua perusahaan dengan persediaan > 100” maka ke dalam bahasa SQL
akan menjadi “select perusahaan from table_perusahaan where persediaan > 100”.

1 Jurnal Tematika VOL. 1, NO. 1, MARET 2013, ISSN: 2303 3878


b.Lexicon
Untuk menganalisis sintaksis, parser bekerja sama dengan lexicon. Lexicon berisi seluruh
kata yang dikenali oleh program. Lexicon dapat berisi pula ejaan setiap kata yang benar dan
merancang bagian ujarannya. Dalam implementasinya, parser merupakan alat untuk mencocokkan
pola. Setelah salah satu kata diidentifikasikan, parser melacak lexicon untuk membandingkan
setiap input kata dengan semua kata yang disimpan dalam database.
C. Understander dan Knowledge Base
Understander bekerja sama dengan basis pengetahuan untuk menentukan makna sebuah
kalimat. Tugas understander adalah menyusun struktur data yang berisi makna, memahami kalimat
input yang dimasukkan, dan menyimpannya ke dalam memori. Dalam rangka menentukan apa
yang dimaksudkan oleh input kalimat, sistem harus mengetahui kata-kata dan cara penyimpannya
agar menjadi statemen bermakna. Tujuan dari understander adalah memanfaatkan output dari
parser agar mengacu dari knowledge base. Apabila input kalimat berupa statemen, maka
understander menentukan maknanya dengan melihat kata-kata atau frasa-frasa yang ada dalam
basis pengetahuan.
d. Generator
Generator adalah input yang telah dimengerti untuk membuat output yang berguna. Struktur
data yang dihasilkan oleh understander kemudian mengawali tindakan atau langkah berikutnya.
Dalam bentuk paling sederhana, generator natural language memasukkan output jawaban standar
yang telah dimasukkan terlebih dahulu kepada user didasarkan pada makna yang sudah diringkas
dari input.
e. Database Language
Database Management Systems (DBMS) merupakan perantara bagi pengguna dengan
database yang tersimpan disk. Cara berinteraksi atau berkomunikasi antara pemakai dengan
database tersebut diatur dalam suatu bahasa khusus yang ditetapkan oleh perusahaan pembuat
DBMS. Bahasa khusus tersebut yang disebut dengan database language yang terdiri atas sejumlah
perintah yang diberikan oleh pengguna dan dikenali oleh DBMS untuk memproses suatu aksi
tertentu. Database language yang banyak dipakai adalah Structured Query Language (SQL).
B. CFG atau CONTEXT FREE GRAMMAR
CFG atau Context Free Grammar adalah tata bahasa formal di mana setiap aturan produksi
adalah dalam bentuk A → B di mana A adalah pemproduksi, dan B adalah hasil produksi.
Batasannya hanyalah ruas kiri adalah sebuah simbol variabel. Dan pada ruas kanan bisa berupa
terminal, symbol, variable ataupun ɛ, Contoh aturan produksi yang termasuk CFG adalah seperti
berikut ini:

• X → bY | Za
• Y → aY | b
• Z → bZ | ɛ
CFG adalah tata bahasa yang mempunyai tujuan sama seperti halnya tata bahasa regular yaitu
merupakan suatu cara untuk menunjukkan bagaimana menghasilkan suatu untai-untai dalam
sebuah bahasa. CFG perlu disederhankan dengan tujuan untuk melakukan pembatasan sehingga
tidak menghasilkan pohon penurunan yang memiliki kerumitan yang tak perlu atau aturan
produksi tak berarti. Berikut merupakan langkah-langkah dalam melakukan penyederhanaan CFG:

• Eliminasi ɛ-production
• Eliminasi unit production
• Eliminasi useless symbol

C. PARSING
Proses parsing tidak hanya dapat dilakukan dalam NLP, melainkan juga pada bidang lain
seperti pada pembuatan sebuah compiler. Metode-metode parsing yang dibahas berikut khusus
digunakan dalam NLP. Sebelumnya perlu diketahui arti dari istilah constituent, yaitu unsur-unsur
pembentuk kalimat yang dapat berdiri sendiri, contohnya noun phrase, verb phrase dan sebagainya
; dan istilah parser yaitu program yang melakukan proses parsing.
a. Top-down Parsing
Top-down parser bekerja dengan cara menguraikan sebuah kalimat mulai dari constituent
yang terbesar yaitu sampai menjadi constituent yang terkecil. Hal ini dilakukan terus-menerus
sampai semua komponen yang dihasilkan ialah constituent terkecil dalam kalimat, yaitu kata.
Sebagai contoh, dengan menggunakan contoh grammar di atas, dapat dilakukan proses top-down
parsing untuk kalimat “The dog chased the cat” yang ditunjukkan pada gambar 3. Dari gambar ini
terlihat bahwa top-down parser menelusuri setiap node pada parse tree secara pre-order. Beberapa
metode parsing yang bekerja secara topdown ialah:
o Top-down parser biasa
o Recursive-descent parser
o Transition-network parser
o Chart parser
Predikat parse berfungsi untuk melakukan proses parsing terhadap sebuah constituent tunggal
(misalnya s, np dan sebagainya), sedangkan parse_list berfungsi untuk melakukan proses parsing
terhadap sekumpulan constituent, misalnya [np,vp], [d,n] dan sebagainya. Parser akan dipanggil
dengan query parse(s,X,[]), dimana s berarti kalimat dan X ialah input kalimat yang berbentuk list
dari symbol. Sebagai contoh, untuk melakukan parsing terhadap kalimat

2 Jurnal Informatika Vol. 2, No. 1, Mei 2001: 13 – 22


"The dog chases the cat", maka query yang diberikan pada external goal Turbo Prolog ialah
sebagai berikut :
?- parse(s,[the,dog,chases,the,cat],[]) dan Prolog akan memberikan jawaban YES karena kalimat
tersebut sesuai dengan grammar yang ditunjukkan pada baris 11-15 oleh predikat rule.
b. Bottom-Up Parsing
Bottom-up parser bekerja dengan cara mengambil satu demi satu kata dari kalimat yang
diberikan, untuk dirangkaikan menjadi constituent yang lebih besar. Hal ini dilakukan terus-
menerus sampai constituent yang terbentuk ialah sentence atau kalimat. Dengan demikian metode
bottom-up bekerja dengan cara yang terbalik dari top-down. Cara kerja bottom-up parser
ditunjukkan pada gambar 4. Metode parsing yang bekerja secara bottom-up antara lain ialah
bottom-up parser biasa dan shift-reduce parser. Program 2 menunjukkan contoh implementasi
bottomup parser biasa dalam bahasa Turbo Prolog.
Perhatikan bahwa parser ini tidak membedakan antara rule (grammar) dan word (lexicon)
sehingga cara kerjanya sangat sederhana namun sangat "bodoh" karena akan terus mengulang-
ulang kesalahan yang sama. Kesederhanaan metode ini terletak pada predikat untuk parsing, yaitu
parse yang hanya memiliki sebuah argumen. Argumen ini berisi kalimat yang akan diparse dalam
bentuk list dari symbol. Kata-kata dari input kalimat akan dirangkaikan sambil mencari aturan
yang lebih luas, sampai tinggal sebuah simbol saja dalam list, yaitu s. Gabungan Top-Down dan
Bottom-Up Parsing Baik top-down parsing mapun bottom-up parsing memiliki kekurangan dan
kelebihannya masing-masing. Metode top-down mampu menangani grammar dengan empty
production (misalnya d ® 0) namun tidak dapat menangani grammar dengan left recursion
(misalnya np ® np conj np). Sedangkan metode bottom-up dapat menangani left recursion namun
tidak dapat menangani empty production.
Dengan demikian metode parsing yang terbaik ialah metode yang dapat menggabungkan
top-down dan bottom-up parsing. Ada beberapa metode yang dikembangkan yang
menggabungkan kedua metode ini, di antaranya ialah left-corner parsing serta Earley's parsing.
Cara kerja left-corner parsing ialah dengan mula-mula menerima sebuah kata, menentukan jenis
constituent apa yang dimulai dengan jenis kata tersebut, kemudian melakukan proses parsing
terhadap sisa dari constituent tersebut secara top-down. Dengan demikian proses parsing dimulai
secara bottom-up dan diakhiri secara topdown. Program 3 menunjukkan implementasi left-corner
parser dalam Turbo Prolog,sedangkan alur kerjanya ditunjukkan pada gambar 5.
D.Pengertian Semantik
Ada dua cabang utama linguistik yang khusus menyangkut kata, yaitu etimologi (studi
tentang asal usul kata) dan semantik (ilmu makna, studi tentang makna kata). Di antara kedua ilmu
itu, etimologi sudah merupakan disiplin ilmu yang lama mapan (established), sedangkan semantik
relatif merupakan hal yang baru. Kata semantik berasal dari bahasa Yunani sema yang artinya
tanda atau lambang (sign).“Semantik” pertama kali digunakan oleh seorang filolog Perancis

pengantar semantik (PENGERTIAN, HAKIKAT, JENIS) Surianti Nafinuddin


bernama Michel Breal pada tahun 1883. Kata semantik kemudian disepakati sebagai istilah yang
digunakan untuk bidang linguistik yang mempelajari tentang tanda-tanda linguistik dengan hal-
hal yang ditandainya. Oleh karena itu, kata semantik dapat diartikan sebagai ilmu tentang makna
atau tentang arti, yaitu salah satu dari tiga tataran analisis bahasa: fonologi, gramatika, dan
semantik (Chaer, 1994: 2). Semantik (dari bahasa Yunani: semantikos, memberikan tanda,
penting, dari kata sema, tanda) adalah cabang linguistik yang mempelajari arti/makna yang
terkandung pada suatu bahasa, kode, atau jenis representasi lain. Dengan kata lain, semantik adalah
pembelajaran tentang makna. Semantik biasanya dikaitkan dengan dua aspek lain: sintaksis,
pembentukan simbol kompleks dari simbol yang lebih sederhana, serta pragmatik, penggunaan
praktis simbol oleh komunitas pada konteks tertentu.
Kata semantik itu sendiri menunjukkan berbagai ide - dari populer yang sangat teknis. Hal
ini sering digunakan dalam bahasa sehari-hari untuk menandakan suatu masalah pemahaman yang
datang ke pemilihan kata atau konotasi. Masalah pemahaman ini telah menjadi subjek dari banyak
pertanyaan formal, selama jangka waktu yang panjang, terutama dalam bidang semantik formal.
Dalam linguistik, itu adalah kajian tentang interpretasi tanda-tanda atau simbol yang digunakan
dalam agen atau masyarakat dalam keadaan tertentu dan konteks.[3] Dalam pandangan ini, suara,
ekspresi wajah, bahasa tubuh, dan proxemics memiliki semantik konten (bermakna), dan masing-
masing terdiri dari beberapa cabang kajian. Dalam bahasa tertulis, hal-hal seperti struktur ayat dan
tanda baca menanggung konten semantik, bentuk lain dari bahasa menanggung konten semantik
lainnya. Sebuah kata, misalnya buku, terdiri atas unsur lambang bumyi yaitu [b-u-k-u] dan konsep
atau citra mental benda-benda (objek) yang dinamakan buku. Menurut Ogden dan Richards
(1923), dalam karya
klasik tentang “teori semantik segi tiga” , kaitan antara lambang, citra mental atau konsep,
dan referen atau objek dapat dijelaskan dengan gambar dan uraian sebagai berikut.
Makna kata buku adalah konsep buku yang tersimpan dalam otak kita dan dilambangkan dengan
kata buku. Gambar di samping menunjukkan bahwa di antara lambang bahasa dan konsep terdapat
hubungan langsung, sedangkan lambang bahasa dengan referen atau objeknya tidak berhubungan
langsung (digambarkan dengan garis putus-putus) karena harus melalui konsep. Dengan demikian,
dapat disimpulkan bahwa semantik mengkaji makna tanda bahasa, yaitu kaitan antara konsep dan
tanda bahasa yang melambangkannya. Dalam analisis semantik juga harus disadari, karena bahasa
itu bersifat unik, dan mempunyai hubungan yang sangat erat dengan masalah budaya maka,
analisis suatu bahasa hanya berlaku untuk bahasa itu saja, tetapi tidak dapat digunakan untuk
menganalisis bahasa lain. Umpamanya, kata ikan dalam bahasa Indonesia merujuk pada jenis
binatang yang hidup dalam air dan biasa dimakan sebagai lauk; dan dalam bahasa Inggris separan
dengan fish. Tetapi kata iwak dalam bahasa Jawa bukan hanya berarti ‘ikan’ atau ‘fish’, melainkan
juga berarti daging yang digunakan sebagai lauk.
Semantik kebahasaan adalah kajian tentang makna yang digunakan untuk memahami ekspresi
manusia melalui bahasa. Bentuk lain dari semantik mencakup semantik bahasa pemrograman,
logika formal, dan semiotika.
Kajian formal semantik bersinggungan dengan banyak bidang penyelidikan lain, termasuk
leksikologi, sintaksis, pragmatik, etimologi dan lain-lain, meskipun semantik adalah bidang yang
didefinisikan dengan baik dalam dirinya sendiri, sering dengan sifat sintetis Dalam filsafat bahasa,
semantik dan referensi berhubungan erat. Bidang-bidang terkait termasuk filologi, komunikasi,
dan semiotika. Kajian formal semantik karena itu menjadi kompleks. Semantik berbeda dengan
sintaksis, kajian tentang kombinatorik unit bahasa (tanpa mengacu pada maknanya), dan
pragmatik, kajian tentang hubungan antara simbol-simbol bahasa, makna, dan pengguna bahasa.
Dalam kosakata ilmiah internasional, semantik juga disebut semasiologi.
Pengertian Semantik Menurut Para Ahli
Berikut ini terdapat beberapa pengertian semantik menurut para ahli, terdiri atas:
a. Menurut Ferdinand de saussure (1966)
Mengemukakan semantik yaitu yang terdiri dari (1) komponen yang mengartikan, yang berwujud
bentuk-bentuk bunyi bahasa dan (2) komponen yang diartikan atau makna dari komponen yang
pertama itu. Kedua komponen ini adalah merupakan tanda atau lambang, sedangkan yang ditandai
atau atau yang dilambanginya adalah sesuatu yang berbeda diluar bahsa yang lazim disebut referen
atau hal yang ditunjuk.
b. Menurut Tarigan (1985: 2)
Mengatakan bahwa semantik dapat dipakai dalam pengertian luas dan dalam pengertian sempit.
Semantik dalam arti sempit dapat diartikan sebagai telaah hubungan tanda dengan objek-objek
yang merupakan wadah penerapan tanda-tanda tersebut.
c. Menurut Verharr (2001: 384)
Dapat dibedakan menjadi dua, yaitu semantik gramatikal dan semantik leksikal. Istilah semantik
ini digunakan para ahli bahasa untuk menyebut salah satu cabang ilmu bahsa yang bergerak pada
tataran makna atau ilmu bahsa yang mempelajari makna.
d. Menurut Chaer (2009: 6-11)
Semantik berdasarkan tataran atau bagian dari bahasa yang menjadi objek penyelidikan dapat
dibedakan menjadi empat, yaitu (1) semantik leksikal yang merupakan jenis semantik yang objek
penelitiannya adalah leksikon dari suatu bahsa, (2) semantik gramatikal yang merupakan jenis
semantik yang objek penelitiannya adalah makna-makna gramatikal dari tataran morfologi, (3)
semantik sintaksikal yang merupakan jenis semantik yang sasaran penyelidikannya bertumpu pada
hal-hal yang berkaitan dengan sintaksis, (4) semantik maksud yang merupakan jenis semantik yang
berkenaan dengan pemakaian bentuk-bentuk gaya bahsa, seperti metafora, ironi, litotes, dan
sebagainya.
e. Menurut Charles Morrist
Mengemukakan bahwa semantik menelaah “hubungan-hubungan tanda-tanda dengan objek objek
yang merupakan wadah penerapan tanda-tanda tersebut”.
f. Menurut J.W.M Verhaar; 1981:9
Mengemukakan bahwa semantik (inggris: semantics) berarti teori makna atau teori arti, yakni
cabang sistematik bahasa yang menyelidiki makna atau arti.
g. Menurut Lehrer; 1974: 1
Semantik adalah studi tentang makna. Bagi Lehrer, semantik merupakan bidang kajian yang sangat
luas, karena turut menyinggung aspek-aspek struktur dan fungsi bahasa sehingga dapat
dihubungkan dengan psikologi, filsafat dan antropologi.
h. Menurut Kambartel (dalam Bauerk, 1979: 195)
Semantik mengasumsikan bahwa bahasa terdiri dari struktur yang menampakan makna apabila
dihubungkan dengan objek dalam pengalaman dunia manusia.
i. Menurut Ensiklopedia britanika (Encyclopedia Britanica, vol.20, 1996: 313)
Semantik adalah studi tentang hubungan antara suatu pembeda linguistik dengan hubungan proses
mental atau simbol dalam aktifitas bicara.
j. Menurut Dr. Mansoer pateda
Semantik adalah subdisiplin linguistik yang membicarakan makna.
k. Menurut Abdul Chaer
Semantik adalah ilmu tentang makna atau tentang arti. Yaitu salah satu dari 3 (tiga) tataran analisis
bahasa (fonologi, gramatikal dan semantik).
l. Ferdinand de Saussure (1966)
Semantik terdiri dari:
-Komponen yang mengartikan, yang berwujud bentuk dan bunyi bahasa.
-Komponen yang diartikan atau makna dari komponen yang pertama itu.
m. Menurut Drs. Aminuddin, M.Pd
Semantik mengandung pengertian studi tentang makna dengan anggapan bahwa makna menjadi
bagian dari bahasa, maka semantic merupakan bagian dari linguistik.
A. SEMANTIK GRAMMAR
Kata semantik itu sendiri menunjukkan berbagai ide - dari populer yang sangat teknis. Hal
ini sering digunakan dalam bahasa sehari-hari untuk menandakan suatu masalah pemahaman yang
datang ke pemilihan kata atau konotasi. Masalah pemahaman ini telah menjadi subjek dari banyak
pertanyaan formal, selama jangka waktu yang panjang, terutama dalam bidang semantik formal.
Dalam linguistik, itu adalah kajian tentang interpretasi tanda-tanda atau simbol yang digunakan
dalam agen atau masyarakat dalam keadaan tertentu dan konteks. Dalam pandangan ini, suara,
ekspresi wajah, bahasa tubuh, dan proxemics memiliki semantik konten (bermakna), dan masing-
masing terdiri dari beberapa cabang kajian. Dalam bahasa tertulis, hal-hal seperti struktur ayat dan
tanda baca menanggung konten semantik, bentuk lain dari bahasa menanggung konten semantik
lainnya. Sebuah kata, misalnya buku, terdiri atas unsur lambang bumyi yaitu [b-u-k-u] dan konsep
atau citra mental benda-benda (objek) yang dinamakan buku. Menurut Ogden dan Richards
(1923), dalam karya klasik tentang “teori semantik segi tiga” , kaitan antara lambang, citra mental
atau konsep, dan referen atau objek dapat dijelaskan dengan gambar dan uraian sebagai berikut.
Citra mental/konsep buku
Lambang [b-u-k-u] Referen/objek

Makna kata buku adalah konsep buku yang tersimpan dalam otak kita dan dilambangkan
dengan kata buku. Gambar di samping menunjukkan bahwa di antara lambang bahasa dan konsep
terdapat hubungan langsung, sedangkan lambang bahasa dengan referen atau objeknya tidak
berhubungan langsung (digambarkan dengan garis putus-putus) karena harus melalui konsep.
Dengan demikian, dapat disimpulkan bahwa semantik mengkaji makna tanda bahasa, yaitu kaitan
antara konsep dan tanda bahasa yang melambangkannya.Semantik kebahasaan adalah kajian
tentang makna yang digunakan untuk memahami ekspresi manusia melalui bahasa. Bentuk lain
dari semantik mencakup semantik bahasa pemrograman, logika formal, dan semiotika. Semantik
berbeda dengan sintaksis, kajian tentang kombinatorik unit bahasa (tanpa mengacu pada
maknanya), dan pragmatik, kajian tentang hubungan antara simbol-simbol bahasa, makna, dan
pengguna bahasa.3 Grammar ialah aturan-aturan pembentukan suatu kalimat dalam sebuah bahasa,
atau yang biasa disebut tata bahasa. Dengan adanya grammar, parsing dapat dilakukan secara cepat
dengan hanya melakukan proses searching. Parser akan mencari aturan-aturan yang tepat untuk
membentuk struktur suatu kalimat. Salah satu contoh grammar yang sederhana untuk bahasa
Inggris ialah sebagai berikut:
Sentence = noun phrase + verb phrase
noun phrase = determiner + noun
verb phrase = verb + noun phrase
determiner = the, a
noun = dog, dogs, cat
verb = chased, see, sees
Grammar ini akan mampu menghasilkan sekumpulan kalimat bahasa Inggris yang
sederhana, seperti :
• The dog chased a cat
• The dog sees a cat
• The dogs sees a cat (nonvalid)
• A dogs chased a cat (nonvalid)
Proses pembentukan kalimat dari grammar disebut derivation. 4

3Surianti Nafinuddin. PENGANTAR SEMANTIK


4James Suciadi. 2001. STUDI ANALISIS METODE-METODE PARSING DAN INTERPRETASI SEMANTIK PADA NATURAL
LANGUAGE PROCESSING. JURNAL INFORMATIKA Vol. 2, No. 1, Mei. Hal 13-14
B.SISTEM PEMROSESAN BAHASA ALAMI
Pada prinsipnya bahasa alami adalah suatu bentuk representasi dari suatu pesan yang ingin
dikomunikasikan antar manusia. Bentuk utama representasinya adalah berupa suara/ucapan
(spoken language), tetapi sering pula dinyatakan dalam bentuk tulisan. Bahasa dapat dibedakan
menjadi: Bahasa Alami, dan Bahasa Buatan. Bahasa alami adalah bahasa yang biasa digunakan
untuk berkomunikasi antar manusia, misalnya bahasa Indonesia, Sunda, Jawa, Inggris, Jepang, dan
sebagainya. Bahasa buatan adalah bahasa yang dibuat secara khusus untuk memenuhi kebutuhan
tertentu, misalnya bahasa pemodelan atau bahasa pemrograman computer
Chomsky adalah orang yang pertama kali merepresentasikan bahasa sebagai rangkaian
simbol. Chomsky berhasil memperlihatkan bahwa bahasa apapun dapat direpresentasikan dengan
suatu cara yang universal. Pemikiran Chomsky yang merepresentasikan bahasa sebagai kumpulan
simbol-simbol dan aturan yang mengatur susunan simbol-simbol tersebut telah membuka peluang
untuk melakukan pemrosesan bahasa secara simbolik dengan teknologi komputer, sehingga
melahirkan bidang ilmu Natural Language Processing (NLP)
Dipandang dari sisi implementasi teknologinya, pemrosesan bahasa lisan dan tulisan adalah
sangat berbeda. Bahasa lisan lebih banyak melakukan pemrosesan bunyi atau suara, sedangkan
bahasa tulisan lebih banyak melakukan pemrosesan simbol-simbol tertulis. Sebagai akibatnya,
penelitian di bidang bahasa lisan pada awalnya lebih banyak dilakukan dalam bidang ”signal
processing”, sedangkan penelitian-penelitian untuk pemrosesan bahasa tulisan lebih banyak
dilakukan dalam bidang artificial intelligence” atau kecerdasan buatan yang pada prinsipnya
melakukan symbolic processing. Saat ini, teknologi yang berkaitan dengan pemrosesan bahasa
alami ini sering disebut sebagai ”speech and language technology”, “natural language processing
technology”, “human language technology”, atau dalam beberapa pertemuan ilmiah para peneliti
di bidang ini di Indonesia, menyepakati penggunaan istilah ”teknologi bahasa” untuk menyebut
teknologi ini. Dari segi keilmuan, bidang ini dikenal sebagai bidang ”natural language processing”
atau ”computational linguistic”.Suatu sistem pemrosesan bahasa alami secara lisan dapat dibentuk
dari tiga sub-sistem, yaitu sebagai berikut:
1) Sub-Sistem Natural Language Processing (NLP), berfungsi untuk melakukan
pemrosesan secara simbolik terhadap bahasa tulisan. Beberapa bentuk aplikasi sub-
sistem ini adalah translator bahasa alami (misalnya dari Bahasa Inggris ke Bahasa
Indonesia), sistem pemeriksa sintaks bahasa, sistem yang dapat ”menyimpulkan”
suatu narasi, dan sebagainya.
2) Sub-sistem Text to Speech (TTS), berfungsi untuk mengubah text (bahasa tulisan)
menjadi ucapan (bahasa lisan).
3) Sub-Sistem Speech Recognition (SR), merupakan kebalikan teknologi Text to
Speech, yaitu sistem yang berfungsi untuk mengubah atau mengenali suatu ucapan
(bahasa lisan) menjadi text (bahasa tulisan).
• Sistem Speech Recognition atau Sistem Pengenalan Ucapan adalah sistem yang
berfungsi untuk mengubah bahasa lisan menjadi bahasa tulisan. Masukan sistem
adalah ucapan manusia, selanjutnya sistem akan mengidentifikasikan kata atau
kalimat yang diucapkan dan menghasilkan teks yang sesuai dengan apa yang
diucapkan. Sistem Speech Recognition biasanya dapat dioperasikan pada dua mode
yang berbeda. Pertama adalah mode belajar. Pada mode ini, sistem akan dilatih
menggunakan sejumlah kata atau kalimat yang memenuhi suatu kriteria tertentu.
Setiap contoh kata atau kalimat ajar tersebut akan menghasilkan pola tertentu yang
akan dipelajari oleh sistem dan disimpan sebagai template atau referensi. Kedua
adalah mode produksi atau pengenalan ucapan. Pada mode ini, setiap kalimat yang
ingin dikenali akan dianalisis polanya. Berdasarkan hasil perbandingan dengan
template atau referensi, modul klasifikasi pola serta pengambil keputusan akan
mengidentifikasikan kata atau kalimat yang diucapkan tersebut. Pada prinsipnya,
teknik-teknik atau algoritma yang digunakan pada sistem Pengenal Ucapan tidak
bersifat sensitif terhadap bahasa.
• Sistem Text to Speech, Secara fungsional, Text to Speech atau TTS melakukan
proses sebaliknya dari sistem Pengenal Ucapan. Namun demikian pendekatan
implementasinya sama sekali berbeda. Artinya, komponen-komponen pembentuk
kedua sistem tersebut sama sekali berbeda. Pada dasarnya TTS adalah suatu sistem
yang dapat mengubah text menjadi ucapan. Suatu sistem pensintesa ucapan atau
Text to Speech pada prinsipnya terdiri dari dua sub sistem, yaitu:
1) Bagian Konverter Teks ke Fonem (Text to Phoneme), Bagian Konverter
Teks ke Fonem berfungsi untuk mengolah kalimat masukan dalam suatu
bahasa tertentu yang berbentuk teks menjadi urutan kode-kode bunyi yang
direpresentasikan.
2) Bagian Konverter Fonem ke Ucapan (Phoneme to Speech). 5

C.APLIKASI PENGOLAHAN BAHASA ALAMI


Bahasa adalah suatu sistem komunikasi yang mengatur tingkah laku manusia dalam bentuk
ekspresi ucapan dan tulisan yang menolong dalam mengkomunikasikan perasaan dan fikiran.
Dalam membentuk kata, kalimat alinea dan informasi tulisan lainnya, bahasa menggunakan suara,
tanda-tanda dan symbol-simbol. Apakah ia dalam bentuk ucapan atau tulisan, bahasa merupakan
media yang digunakan untuk mengkspresikan dan mengorganisasikan apa yang diketahui,
dipikirkan dan dirasakan.Pengolahan bahasa alami secara teoritis adalah pengembangan berbagai
teknik komputasi untuk menganalisis dan menampilkan teks dalam bahasa alami pada satu atau
lebih tingkat analisis linguistik untuk mencapai tujuan manusia dalam hal bahasa yaitu
menyelesaikan berbagai tugas atau aplikasi. Telah dilakukan penelitian query bahasa Indonesia
untuk basisdata akademik. Sistem yang dibuat adalah dengan menggunakan bahasa alami, bahasa

5Arry Akhmad Arman. 2004. Teknologi Pemrosesan Bahasa Alami sebagai Teknologi Kunci untuk Meningkatkan
Cara Interaksi antara Manusia dengan Mesin. Hal 7-12
Indonesia untuk memberikan query masukan. Masukan yang diberikan adalah pertanyaan untuk
mendapatkan informasi atau data dari basisdata.Elemen pemroses bahasa terdiri dari penganalisis
leksikal, parser dan pembangkit kode atau perlakuan. Maier dan Warren dalam Hartati dan
Zuliarso menyatakan komponen pemrosesan bahasa alami terdiri dari scanner, parser, penterjemah
(translator), optimasi query dan pengevaluator query

Program aplikasi pengolah bahasa alami untuk query basisdata akademik dengan format data
XML adalah program aplikasi yang digunakan oleh staf administrasi akademik untuk membantu
pekerjaan pencarian data dalam format XML yang berkaitan dengan data akademik mahasiswa
dalam basisdata akademik. Dengan menggunakan program aplikasi ini, maka staf administrasi
akademik yang tidak mempunyai dasar pengetahuan SQL tetap dapat melakukan pencarian data
akademik dengan menggunakan bahasa alami yaitu bahasa Indonesia. Basisdata XML adalah
sistem perangkat lunak yang digunakan untuk menyimpan data yang membolehkan data untuk
diimpor, diakses dan diekspor dalam format XML. Basisdata XML mempunyai keunggulan lebih
baik dibandingkan dengan sistem basisdata relasional jika data yang akan disimpan berupa
dokumen. Dengan basisdata XML juga memungkinkan untuk melakukan penelusuran isi dokumen

masukan program aplikasi ini berupa sebuah kalimat tanya atau kalimat perintah dalam bahasa
Indonesia yang diketikkan ke dalam suatu antarmuka (form). Bentuk kalimat tanya atau kalimat
perintah harus sesuai dengan aturan produksi. Jika kalimat tanya / perintah yang dimasukkan
sesuai dengan aturan produksi dan data tersedia, maka data akan ditampilkan dalam bentuk tabel.
Jika kalimat tanya / perintah yang dimasukkan tidak sesuai dengan aturan produksi yang telah
ditetapkan, maka hasil yang ditampilkan adalah sebuah peringatan yang menyatakan bahwa format
kalimat yang dimasukkan salah.6

6Setyawan Wibisono. 2013. Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik dengan Format Data
Xml. Jurnal Teknologi Informasi DINAMIK Volume 18, No.1, Januari. Hal 65-67
BAB III
PENUTUP
A.KESIMPULAN

Natural Language Processing berperan penting untuk interaksi manusia dan AI. Dengan
semakin berkembangnya teknologi dan penelitian yang dilakukan di bidang ini, kita bisa melihat
lebih banyak lagi inovasi yang akan membuat mesin lebih pintar dalam memahami bahasa
manusia. Natural Language Processing (NLP) merupakan salah satu cabang ilmu AI yang
berfokus pada pengolahan bahasa natural. Bahasa natural adalah bahasa yang secara umum
digunakan oleh manusia dalam berkomunikasi satu sama lain. Bahasa yang diterima oleh
komputer butuh untuk diproses dan dipahami terlebih dahulu supaya maksud dari user bisa
dipahami dengan baik oleh komputer.

SARAN

Demikianlah makalah mengenai Bagaimana NATURAL LANGUAGE PROCESSING Kami


menyadari makalah ini jauh dari kata sempurna, maka dari itu kritik dan saran yang membangun
dari pembaca sangat kami harapkan. Harapan kami, semoga makalah ini dapat bermanfaat bagi
pembaca.
DAFTAR PUSTAKA

Jurnal Tematika VOL. 1, NO. 1, MARET 2013, ISSN: 2303 3878


Jurnal Informatika Vol. 2, No. 1, Mei 2001: 13 – 22
https://socs.binus.ac.id/2018/12/20/penyederhanaan-context-free-grammar/
pengantar semantik (PENGERTIAN, HAKIKAT, JENIS) Surianti Nafinuddin
1
ames Suciadi. 2001. STUDI ANALISIS METODE-METODE PARSING DAN INTERPRETASI
SEMANTIK PADA NATURAL

LANGUAGE PROCESSING. JURNAL INFORMATIKA Vol. 2, No. 1, Mei. Hal 13-14

Arry Akhmad Arman. 2004. Teknologi Pemrosesan Bahasa Alami sebagai Teknologi Kunci
untuk Meningkatkan Cara Interaksi antara Manusia dengan Mesin. Hal 7-12

Setyawan Wibisono. 2013. Aplikasi Pengolah Bahasa Alami untuk Query Basisdata Akademik
dengan Format Data Xml. Jurnal Teknologi Informasi DINAMIK Volume 18, No.1, Januari. Hal
65-67

Anda mungkin juga menyukai