Disusun oleh :
Kelompok 1/Instrumentasi 5C
1
KATA PENGANTAR
Puji syukur penulis panjatkan ke hadirat Allah swt karena rahmat dan karunia-
Nya penulis dapat menyelesaikan makalah dengan judul “Implementasi Pengolahan
Bahasa Alami”.
Penulisan makalah ini dibuat untuk memenuhi tugas mata kuliah Sistem Pakar
di Sekolah Tinggi Meteorologi Klimatologi dan Geofisika. Penulisan makalah ini
memiliki banyak kendala dan kesulitan. Namun, penulisan makalah dapat selesai
berkat bimbingan, bantuan, saran, dan nasihat berbagai pihak, khususnya dosen
pengampu mata kuliah Sistem Pakar sehingga kendala dan kesulitan dapat teratasi
dengan baik.
Penulis menyadari bahwa makalah ini masih jauh dari sempurna dan masih
banyak kekurangan baik dari aspek kualitas maupun kuantitas. Oleh karena itu,
penulis sangat mengharapkan kritik dan saran yang membangun demi kesempurnaan
penelitian dalam makalah ini.
Selanjutnya dengan tulus penulis menyampaikan terima kasih kepada
berbagai pihak yang telah membantu hingga makalah ini dapat diselesaikan. Pihak-
pihak tersebut adalah:
1. Agus Tri Sutanto selaku dosen pengampuh mata kuliah Sistem Pakar.
2. Teman-teman kelas Instrumentasi V-C yang telah memberikan masukan dan
saran.
3. Berbagai pihak yang telah memberikan bantuan dan dorongan, serta berbagi
pengalaman pada proses penyusunan makalah ini.
Demikian, penulis berharap bahwa makalah ini dapat memberikan manfaat
dan memperluas wawasan bagi berbagai pihak.
Penulis
2
DAFTAR ISI
HALAMAN JUDUL................................................................................................1
KATA PENGANTAR...............................................................................................2
DAFTAR ISI............................................................................................................3
BAB 1......................................................................................................................5
BAB 2......................................................................................................................7
2.5 Grammar..........................................................................................................10
2.6 Parsing..............................................................................................................11
BAB 3....................................................................................................................24
3.1 Kesimpulan......................................................................................................24
3.2 Saran.................................................................................................................24
3
DAFTAR PUSTAKA.............................................................................................25
BAB I
4
PENDAHULUAN
5
Manfaat dari pembuatan makalah ini adalah sebagai berikut
1.4.1 Memberikan pengetahuan kepada para pembaca.
1.4.2 Menjadi sumber rujukan taruna-taruni dalam studi tentang pengolahan
bahasa alami.
BAB II
PEMBAHASAN
6
2.1 Peranan Pengetahuan dalam Bahasa
Komunikasi dengan bahasa alami (teks/ucapan) bergantung pada
pengetahuan dari domain pembicaraan
Pemahaman bahasa tidak hanya ditransmisi dari kata-kata; tapi
membutuhkan inferensi tentang tujuan dan asumsi-asumsi dari pembicara
dan tentang konteks interaksi
Implementasi dari program pemahaman bahasa alami membutuhkan
representasi sejumlah besar pengetahuan dan alasan-alasan
NP DET, N
7
VP V, NP
NP N
8
2.4 Proses Sintaksis
Proses sintaksis [2] atau disebut juga parsing, merupakan langkah dimana
kalimat masukan secara flat diubah ke dalam struktur hirarkis yang
berhubungan dengan unit-unit arti dalam kalimat
Proses sintaksis sangat berperan dalam pemahaman bahasa alami
dikarenakan:
Proses semantic harus beroperasi pada pilihan-pilihan kalimat. Jika
tidak ada tahap parsing sintaksis maka sistem semantic harus
memutuskan atas pilihannya sendiri. Jika parsing dilakukan, hal ini
akan membatasi pilihan-pilihan dari semantic
Tidak selalu dimungkinkan untuk mengekstrak arti kalimat tanpa
menggunakan fakta gramatikal
Semua sistem menggunakan dua komponen:
1. Representasi deklaratif, disebut grammar, fakta sintaksis tentang
Bahasa.
2. Prosedur, disebut parser, dimana membandingkan grammar dengan
kalimat-kalimat masukan untuk membentuk struktur yang dianalisis.
2.5 Grammar
Grammar direpresentasikan sebagai sekumpulan aturan-aturan produksi,
seperti pada gambar 1. Grammar merupakan suatu aturan yang
menentukan apakah suatu kumpulan kata dapat diterima sebagai kalimat
oleh bahasa tersebut. Sebuah grammar G dapat dibentuk dari 4 tuple
yaitu : symbol non terminal, symbol terminal, symbol awal dan aturan
penulisan atau rules. Definisinya adalah:
G = (vn, vt, s, p)
Sebagai contoh dapat kita lihat dari grammar G sederhana berikut ini:
DictJenis = {Kata_Benda, Kata_Kerja, Frasa_Benda, Frasa_kerja,
Keterangan}
DictKata = {Orang, Makan, telur, Ayam, Terbang, Tinggi}
9
Dengan aturan :
S Frasa_Benda Frasa_Kerja
Frasa_Benda Kata_Benda Kata_Benda
Frasa_Kerja Kata_Kerja Keterangan
Kata_benda {Orang, Telur, Ayam}
Kata_Kerja {Makan, Terbang}
Keterangan {Tinggi}
Dari grammar G dapat dibentuk kalimat :
Orang Makan Ayam
Ayam Terbang Tinggi
Orang Terbang Tinggi
Ayam Makan Orang
Dari grammar kita dapat mempelajari bahasa dari segi struktur dan bukan
dari segi makna bahasa itu sendiri.
Aturan pertama, ‘Sebuah kalimat terdiri atas kata benda (NP) diikuti kata
kerja (VP)’.
I menyatakan “atau/or’,
menyatakan string kosong
Simbol-simbol yang diperluas oleh aturan-aturan disebut nonterminal
symbols, sedangkan simbol-simbol yang berhubungan langsung dengan
string yang ditemukan pada kalimat masukan disebut terminal symbols.
10
Gambar 1. Grammar Untuk Bahasa Inggris
2.6 Parsing
Suatu proses menganalisa suatu kumpulan kata dengan memisahkan kata
tersebut dan menentukan struktur sintaksis dari tiap kata tersebut.
Gramatika yang dipakai juga sangat berkaitan dengan proses parsing apa
yang digunakan.
11
diterapkan untuk Bottom Up parser yaitu mencari dari simbol-simbol
terminal menuju ke arah pembentukan simbol awal s.
12
Prosedur yang menjalankan tes pada input saat itu dan pada
komponen kalimat yang telah diidentifikan
Prosedur-prosedur yang membangun struktur yang akan
membentuk bagian akhir dari analisis
13
7. Kerjakan tes kategori untuk melihat jika ‘file’ merupakan adjective. Tes
gagal
8. Kerjakan tes kategori untuk melihat jika ‘file’ merupakan noun. Tes
sukses, register NOUN diset ke ‘file’ dan lalu ke keadaan Q7.
9. Masuk ke PP
10. Kerjakan tes kategori untuk melihat ‘has’ merupakan preposition. Tes
gagal, sehingga keluar
11. Tidak ada lagi yang dikerjakan di Q7, lalu keluar dan kembali ke
struktur (NP(FILE(LONG)DEFINITE)), sehingga kembali ke keadaan Q1,
dengan register SUBJ diset ke struktur yang dikembalikan dan register
TYPE diset ke DCL
12. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan verb. Tes
sukses, sehingga register AUX diset ke NIL dan register V diset ke ‘has’.
Lanjut Q4
13. Masuk ke keadaan NP, dikarenakan kata ‘printed’ bukan determiner
ataupun noun murni, maka NP dikeluarkan
14. Masih tersisa input, berarti analisis belum selesai. Lalu diperlukan
backtracking.
15. Pilihan terakhir terdapat pada Q1, sehingga kembali ke Q1. Register
AUX dan V tidak diset
16. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan auxiliary. Tes
sukses sehingga ‘has’ diset ke register AUX dan lalu ke Q3.
17. Kerjakan tes kategori untuk melihat jika ‘printed’ merupakan verb. Tes
sukses, maka register V diset ke ‘printed’. Lanjut ke Q4.
18. Karena input telah habis, maka Q4 merupakan keadaan terakhir. Lalu
keluar dan kembali ke struktur
(S DCL (NP(FILE(LONG)DEFINITE))
HAS
(VP PRINTED))
Struktur ini merupakan output dari analisis.
14
dari tiga sub-sistem, yaitu sebagai berikut.
1) Sub-Sistem Natural Language Processing (NLP), berfungsi untuk
melakukan pengolahan secara simbolik terhadap bahasa tulisan.
Beberapa bentuk aplikasi sub- sistem ini adalah translator bahasa alami
(misalnya dari Bahasa Inggris ke Bahasa Indonesia), sistem pemeriksa
sintaks bahasa, sistem yang dapat ”menyimpulkan” suatu narasi, dan
sebagainya.
2) Sub-sistem Text to Speech (TTS), berfungsi untuk mengubah text
(bahasa tulisan) menjadi ucapan (bahasa lisan).
3) Sub-Sistem Speech Recognition (SR), merupakan kebalikan teknologi
Text to Speech, yaitu sistem yang berfungsi untuk mengubah atau
mengenali suatu ucapan (bahasa lisan) menjadi text (bahasa tulisan).
15
Gambar 4. Diagram Blok Sistem Pengenal Ucapan
16
sistem Pengenal Ucapan tidak bersifat sensitif terhadap bahasa. Artinya, sistem
yang sama dapat digunakan untuk bahasa apapun. Namun demikian,
kemampuan sistem untuk mengenali ucapan pada bahasa tertentu sangat
tergantung dari template atau referensi yang diperoleh melalui proses belajar di
dalam sistemnya itu sendiri. Untuk melatih sistem Pengenal Ucapan agar
dapat digunakan untuk suatu bahasa yang baru, maka diperlukan korpus untuk
melatih sistem tersebut. Korpus yang dimaksud adalah berupa rekaman ucapan
yang heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis
tertentu.
Semakin besar korpus yang digunakan untuk melatih sistem, akan
dihasilkan sistem Speech Recognition yang cenderung lebih handal. Sistem
yang handal, paling tidak harus dilatih dengan ratusan rekaman pembicara.
Semakin besar korpus yang digunakan untuk melatih sistem, akan
dihasilkan sistem Speech Recognition yang cenderung lebih handal. Sistem
yang handal, paling tidak harus dilatih dengan ratusan rekaman pembicara.
17
dari sistem Pengenal Ucapan. Namun demikian pendekatan implementasinya
sama sekali berbeda. Artinya, komponen-komponen pembentuk kedua sistem
tersebut sama sekali berbeda. Pada dasarnya TTS adalah suatu sistem yang
dapat mengubah text menjadi ucapan.
18
2) Jumlah kosa kata (vocabulary) dalam bahasa alami sangat besar dan
berkembang dari waktu ke waktu.
19
bahasa alami tersebut menjadi perintah bahasa formal yang dipahami
oleh komputer, yaitu ”dir *.* <ENTER>”.
3) Text Summarization, yaitu suatu sistem yang dapat ”membuat
ringkasan” hal-hal yang penting dari suatu wacana yang diberikan.
20
3) Online translator. Online translator yang dimaksud disini adalah
translator yang secara otomatis dapat menerjemahkan kalimat lisan dari
suatu bahasa alami (misalnya Bahasa Inggris) menjadi ucapan hasil
terjemahannya dalam bahasa alami lainnya (misalnya Bahasa Indonesia).
Online translator terdiri dari 3 bagian. Bagian pertama, speech
recognition, berfungsi untuk mengenali rangkaian kata dari bahasa sumber
menjadi teks dalam bahasa sumber. Bagian berikutnya adalah translator
teks ke teks. Hasil bagian kedua ini adalah kalimat bahasa tujuan yang
masih berupa teks. Bagian ketiga berupa sistem TTS dalam bahasa tujuan.
Aplikasi seperti ini mungkin untuk dikembangkan, karena teknologi
speech recognition sudah banyak dikembangkan. Translator bahasa pun
sudah banyak dikembangkan, termasuk translator Bahasa Inggris ke
Indonesia .
21
4) Talking email atau aplikasi lainnya. TTS juga memungkinkan
diintegrasikan dengan berbagai program aplikasi, seperti email, web
browser, aplikasi-aplikasi multimedia atau aplikasi-aplikasi
lainnya.
22
BAB III
PENUTUP
3.1 Kesimpulan
Tujuan dalam bidang Natural Language ini adalah melakukan proses
pembuatan model komputasi dari bahasa, sehingga dapat terjadi suatu
interaksi antara manusia dengan computer dengan perantaraan bahasa
alami.
Pengolahan Bahasa Alami (Natural Language Processing) mengenal
beberapa tingkat pengolahan yaitu Prosody, Phonology, Morphology,
Syntax, Semantics, Pragmatics dan World knowledge.
3.2 Saran
Melihat fenomena globalisasi serta banyaknya jumlah penduduk Indonesia,
maka pengembangan teknologi yang berkaitan dengan komunikasi dalam hal
ini bahasa alami menjadi sangat penting dan strategis. Teknologi ini dapat
digunakan untuk tujuan bisnis, pendidikan, kemanusiaan dan pelesetarian
budaya daerah di Indonesia.
23
Referensi :
1) http://www.unisbank.ac.id/ojs/index.php/fti1/article/viewFile/82/77
2) http://lecturer.eepis-its.edu/~entin/Kecerdasan%20Buatan/Buku/Bab
%205%20Natural%20Language%20Processing.pdf
24