Anda di halaman 1dari 24

TUGAS MAKALAH SISTEM PAKAR

IMPLEMENTASI PENGOLAHAN BAHASA ALAMI

Disusun oleh :

Kelompok 1/Instrumentasi 5C

1. Agung Nur Hidayat (PJ) 41.15.0057


2. Bayu Putra Pamungkas 41.15.0062
3. Diah Lestari 41.15.0063
4. Muhammad Ardy S 41.15.0075

PROGRAM STUDI INSTRUMENTASI

SEKOLAH TINGGI METEOROLOGI KLIMATOLOGI DAN


GEOFISIKA

TAHUN AJARAN 2017/2018

1
KATA PENGANTAR

Puji syukur penulis panjatkan ke hadirat Allah swt karena rahmat dan karunia-
Nya penulis dapat menyelesaikan makalah dengan judul “Implementasi Pengolahan
Bahasa Alami”.
Penulisan makalah ini dibuat untuk memenuhi tugas mata kuliah Sistem Pakar
di Sekolah Tinggi Meteorologi Klimatologi dan Geofisika. Penulisan makalah ini
memiliki banyak kendala dan kesulitan. Namun, penulisan makalah dapat selesai
berkat bimbingan, bantuan, saran, dan nasihat berbagai pihak, khususnya dosen
pengampu mata kuliah Sistem Pakar sehingga kendala dan kesulitan dapat teratasi
dengan baik.
Penulis menyadari bahwa makalah ini masih jauh dari sempurna dan masih
banyak kekurangan baik dari aspek kualitas maupun kuantitas. Oleh karena itu,
penulis sangat mengharapkan kritik dan saran yang membangun demi kesempurnaan
penelitian dalam makalah ini.
Selanjutnya dengan tulus penulis menyampaikan terima kasih kepada
berbagai pihak yang telah membantu hingga makalah ini dapat diselesaikan. Pihak-
pihak tersebut adalah:
1. Agus Tri Sutanto selaku dosen pengampuh mata kuliah Sistem Pakar.
2. Teman-teman kelas Instrumentasi V-C yang telah memberikan masukan dan
saran.
3. Berbagai pihak yang telah memberikan bantuan dan dorongan, serta berbagi
pengalaman pada proses penyusunan makalah ini.
Demikian, penulis berharap bahwa makalah ini dapat memberikan manfaat
dan memperluas wawasan bagi berbagai pihak.

Tangerang Selatan, November 2017

Penulis

2
DAFTAR ISI
HALAMAN JUDUL................................................................................................1

KATA PENGANTAR...............................................................................................2

DAFTAR ISI............................................................................................................3

BAB 1......................................................................................................................5

1.1 Latar Belakang...................................................................................................5

1.2 Rumusan Masalah..............................................................................................5

1.3 Tujuan Penulisan................................................................................................5

1.4 Manfaat Penulisan..............................................................................................6

BAB 2......................................................................................................................7

2.1 Peranan Pengetahuan dalam Bahasa..................................................................7

2.2 Bidang Pengetahuan Dalam Natural Language.................................................7

2.3 Pengolahan Bahasa Alami..................................................................................8

2.4 Proses Sintaksis..................................................................................................9

2.5 Grammar..........................................................................................................10

2.6 Parsing..............................................................................................................11

2.7 Automated Transition Network (ATN)............................................................13

2.8 Sistem Pengolahan Bahasa Alami....................................................................16

2.9 Sistem Speech Recognition..............................................................................16

2.10 Sistem Text to Speech....................................................................................19

2.11 Sistem Natural Language Processing.............................................................19

2.12 Aplikasi-aplikasi Teknologi Bahasa...............................................................21

BAB 3....................................................................................................................24

3.1 Kesimpulan......................................................................................................24

3.2 Saran.................................................................................................................24

3
DAFTAR PUSTAKA.............................................................................................25

BAB I
4
PENDAHULUAN

1.1 Latar Belakang


Bahasa sebagai bagian yang penting dari kehidupan manusia, dalam bentuk
tulis dapat merupakan catatan dari pengetahuan yang didapat oleh umat manusia
dari satu generasi ke generasi berikutnya sedangkan dalam bentuk lisan merupakan
sarana komunikasi antar individu dalam suatu masyarakat. Pemrosesan bahasa alami,
disingkat PBA atau NLP (natural language processing), adalah cabang ilmu komputer
dan linguistik yang mengkaji interaksi antara komputer dengan bahasa (alami)
manusia . NLP sering dianggap sebagai cabang dari kecerdasan buatan dan bidang
kajiannya bersinggungan dengan linguistik komputasional.
Tujuan dalam bidang Natural language ini adalah melakukan proses
pembuatan model komputasi dari bahasa, sehingga dapat terjadi suatu interaksi antara
manusia dengan komputer dengan perantara bahasa alami (bahasa sehari-hari).
Sebuah Natural Language System harus memperhatikan pengetahuan terhadap
bahasa itu sendiri, baik dari segi kata yang digunakan, bagaimana kata-kata tersebut
digabung untuk menghasilkan suatu kalimat, apa arti sebuah kata, apa fungsi sebuah
kata dalam sebuah kalimat dan sebagainya. Kita juga harus mempertimbangkan
kemampuan manusia untuk mengerti dan kemampuan untuk itu didapat dari
pengetahuan yang didapat secara terus menerus sewaktu hidup.

1.2 Rumusan Masalah


Adapun rumusan masalah dari makalah ini adalah sebagai berikut:
1.2.1 Apa yang dimaksud pengolahan bahasa alami?
1.2.2 Apa tujuan pengolahan bahasa alami?
1.2.3 Bagaimana tingkatan yang ada dalam pengolahan bahasa alami?

1.3 Tujuan Penulisan


1.3.1 Memberikan informasi tentang pengertian pengolahan bahasa alami.
1.3.2 Membantu memberikan informasi tujuan pengolahan bahasa alami.
1.3.3 Memberikan wawasan tentang tingkatan dalam pengolahan bahasa alami.

1.4 Manfaat Penulisan

5
Manfaat dari pembuatan makalah ini adalah sebagai berikut
1.4.1 Memberikan pengetahuan kepada para pembaca.
1.4.2 Menjadi sumber rujukan taruna-taruni dalam studi tentang pengolahan
bahasa alami.

BAB II

PEMBAHASAN

6
2.1 Peranan Pengetahuan dalam Bahasa
 Komunikasi dengan bahasa alami (teks/ucapan) bergantung pada
pengetahuan dari domain pembicaraan
 Pemahaman bahasa tidak hanya ditransmisi dari kata-kata; tapi
membutuhkan inferensi tentang tujuan dan asumsi-asumsi dari pembicara
dan tentang konteks interaksi
 Implementasi dari program pemahaman bahasa alami membutuhkan
representasi sejumlah besar pengetahuan dan alasan-alasan

2.2 Bidang Pengetahuan dalam Natural Language


Untuk mengatasi kompleksitas dari bahasa ini, didefinisikan tingkat analisis
bahasa alami :
1. Prosody, mengerjakan ritme & intonasi bahasa
2. Phonology, menguji suara yang dikombinasikan untuk membentuk bahasa
3. Morphology, mengenai komponen-komponen (morfem-morfem) yang
membentuk kata-kata. Termasuk aturan-aturan pengembangan formasi kata-
kata seperti efek dari prefix (un-, non-, anti-, dll), & sufiks (-ing, -ly, dll) yang
memodifikasi arti dari akar kata.
4. Syntax, pemahaman tentang urutan kata dalam pembentukan kalimat dan
hubungan antar kata tersebut dalam proses perubahan bentuk dari kalimat
menjadi bentuk yang sistematis. Meliputi proses pengaturan tata letak suatu
kata dalam kalimat akan membentuk kalimat yang dapat dikenali. Selain itu
dapat pula dikenali bagian-bagian kalimat dalam suatu kalimat yang lebih
besar. Sebagai contoh kalimat S dibentuk dari noun phrase (NP) dan verb
phrase (VP)
Sintaksis: yaitu S  NP, VP
Dan berikutnya:

NP  DET, N

7
VP  V, NP

NP  N

5. Semantics, pemetaan bentuk struktur sintaksis dengan memanfaatkan tiap


kata ke dalam bentuk yang lebih mendasar dan tidak tergantung struktur
kalimat. Semantik mempelajari arti suatu kata dan bagaimana dari arti kata –
arti kata tersebut membentuk suatu arti dari kalimat yang utuh.
6. Pragmatics, merupakan studi pada cara dimana bahasa digunakan & efeknya
pada si pendengar.
7. World Knowledge, mencakup arti sebuah kata secara umum dan apakah ada
arti khusus bagi suatu kata dalam suatu percakapan dengan konteks tertentu.
Selain yang sudah disebutkan di atas masih ada lagi satu masalah yang cukup
menantang dalam Natural Language yaitu ambiguitas atau makna ganda dari
suatu kata atau kalimat.

2.3 Pengolahan Bahasa Alami


Menurut Rich [2], pengolahan bahasa alami dapat dibagi atas beberapa proses:
1. Morphological analysis, dimana kata secara individu dianalisis ke dalam
komponen-komponennya dan yang bukan kata (seperti tanda baca)
dipisahkan dari kata
2. Syntactic analysis, urutan linier dari kata ditransformasikan ke dalam struktur
yang menunjukkan bagaimana kata saling berhubungan. Urutan kata yang
melanggar aturan bahasa dalam pengkombinasian kata, akan ditolak
3. Semantic analysis, dibuat mapping antara struktur sintaksis & objek dalam
domain kerja. Struktur dimana tidak ada mapping yang memungkinkan, akan
ditolak.
4. Discourse integration, dimana arti dari kalimat secara individu bergantung
pada kalimat-kalimat yang mendahului & mungkin dapat mempengaruhi arti
dari kalimat-kalimat yang mengikutinya
5. Pragmatic analysis, dimana struktur yang merepresentasikan apa yang
diucapkan, diintepretasikan kembali untuk menentukan apa arti sebenarnya.

8
2.4 Proses Sintaksis
 Proses sintaksis [2] atau disebut juga parsing, merupakan langkah dimana
kalimat masukan secara flat diubah ke dalam struktur hirarkis yang
berhubungan dengan unit-unit arti dalam kalimat
 Proses sintaksis sangat berperan dalam pemahaman bahasa alami
dikarenakan:
 Proses semantic harus beroperasi pada pilihan-pilihan kalimat. Jika
tidak ada tahap parsing sintaksis maka sistem semantic harus
memutuskan atas pilihannya sendiri. Jika parsing dilakukan, hal ini
akan membatasi pilihan-pilihan dari semantic
 Tidak selalu dimungkinkan untuk mengekstrak arti kalimat tanpa
menggunakan fakta gramatikal
 Semua sistem menggunakan dua komponen:
1. Representasi deklaratif, disebut grammar, fakta sintaksis tentang
Bahasa.
2. Prosedur, disebut parser, dimana membandingkan grammar dengan
kalimat-kalimat masukan untuk membentuk struktur yang dianalisis.

2.5 Grammar
 Grammar direpresentasikan sebagai sekumpulan aturan-aturan produksi,
seperti pada gambar 1. Grammar merupakan suatu aturan yang
menentukan apakah suatu kumpulan kata dapat diterima sebagai kalimat
oleh bahasa tersebut. Sebuah grammar G dapat dibentuk dari 4 tuple
yaitu : symbol non terminal, symbol terminal, symbol awal dan aturan
penulisan atau rules. Definisinya adalah:
 G = (vn, vt, s, p)
Sebagai contoh dapat kita lihat dari grammar G sederhana berikut ini:
DictJenis = {Kata_Benda, Kata_Kerja, Frasa_Benda, Frasa_kerja,
Keterangan}
DictKata = {Orang, Makan, telur, Ayam, Terbang, Tinggi}

9
Dengan aturan :
S  Frasa_Benda Frasa_Kerja
Frasa_Benda  Kata_Benda Kata_Benda
Frasa_Kerja  Kata_Kerja Keterangan
Kata_benda  {Orang, Telur, Ayam}
Kata_Kerja  {Makan, Terbang}
Keterangan  {Tinggi}
Dari grammar G dapat dibentuk kalimat :
Orang Makan Ayam
Ayam Terbang Tinggi
Orang Terbang Tinggi
Ayam Makan Orang
Dari grammar kita dapat mempelajari bahasa dari segi struktur dan bukan
dari segi makna bahasa itu sendiri.
 Aturan pertama, ‘Sebuah kalimat terdiri atas kata benda (NP) diikuti kata
kerja (VP)’.
 I menyatakan “atau/or’,
  menyatakan string kosong
 Simbol-simbol yang diperluas oleh aturan-aturan disebut nonterminal
symbols, sedangkan simbol-simbol yang berhubungan langsung dengan
string yang ditemukan pada kalimat masukan disebut terminal symbols.

10
Gambar 1. Grammar Untuk Bahasa Inggris

2.6 Parsing
 Suatu proses menganalisa suatu kumpulan kata dengan memisahkan kata
tersebut dan menentukan struktur sintaksis dari tiap kata tersebut.
Gramatika yang dipakai juga sangat berkaitan dengan proses parsing apa
yang digunakan.

 Bottom-Up Parsing gramatika yang dipakai akan lebih banyak bercabang


ke arah simbol non-terminal. Hal lain yang juga berkaitan erat dengan
proses parsing adalah kamus atau leksikon yang digunakan. Dalam
leksikon disimpan daftar kata yang dapat dikenali sebagai symbol terminal
dalam grammar dan informasi yang diperlukan untuk tiap kata tersebut
untuk proses parsing yang bersangkutan.

 Pendekatan dalam mengenali struktur suatu kalimat, proses parsing


dapat dibagi menjadi dua bagian besar yaitu Top Down parsing dan
Bottom Up parsing. Top Down parser memulai pemeriksaan dari simbol
awal s dan mencoba untuk mencari bentuk simbol terminal berikutnya
yang sesuai dengan jenis kata dari kalimat masukan. Cara sebaliknya

11
diterapkan untuk Bottom Up parser yaitu mencari dari simbol-simbol
terminal menuju ke arah pembentukan simbol awal s.

Gambar 2. Pohon Analisis Untuk Sebuah Kalimat

2.7 Automated Transition Networks (ATN)


 Automated Transition Network (ATN) merupakan prosedur top-down
parsing dimana bermacam-macam pengetahuan digabungkan ke sistem
analisis sehingga dapat beroperasi lebih efisien.
 ATN (seperti pada gambar 3) menyerupai finite-state machine dimana
klas label digabungkan pada garis berarah yang mendefinisikan transisi
antara suatu keadaan.
 Garis berarah ini dapat diberi label (dalam bahasa Inggris) dengan
 Kata-kata spesifik, seperti ‘in’
 Kategori-kategori kata, seperti ‘noun’
 Didorong ke jaringan lain untuk mengenali komponen lain pada
suatu kalimat, seperti jaringan untuk mengenali prepositional
phrase (PP) maka pada garis berarah ditanyakan noun phrase (NP)

12
 Prosedur yang menjalankan tes pada input saat itu dan pada
komponen kalimat yang telah diidentifikan
 Prosedur-prosedur yang membangun struktur yang akan
membentuk bagian akhir dari analisis

Gambar 3. Sebuah Jaringan ATN untuk Fragmen Bahasa Inggris

 Cara kerja ATN pada kalimat:

‘The long file has printed’

1. Mulai pada keadaan S


2. Masuk ke NP
3. Kerjakan tes kategori untuk melihat jika ‘the’ merupakan determiner
4. Tes sukses, maka register DETERMINER diset ke DEFINITE lalu ke
keadaan Q6
5. Kerjakan tes kategori untuk melihat jika ‘long’ merupakan adjective
6. Tes sukses, maka register ADJS ditambahkan ‘long’. Tetap tinggal di Q6

13
7. Kerjakan tes kategori untuk melihat jika ‘file’ merupakan adjective. Tes
gagal
8. Kerjakan tes kategori untuk melihat jika ‘file’ merupakan noun. Tes
sukses, register NOUN diset ke ‘file’ dan lalu ke keadaan Q7.
9. Masuk ke PP
10. Kerjakan tes kategori untuk melihat ‘has’ merupakan preposition. Tes
gagal, sehingga keluar
11. Tidak ada lagi yang dikerjakan di Q7, lalu keluar dan kembali ke
struktur (NP(FILE(LONG)DEFINITE)), sehingga kembali ke keadaan Q1,
dengan register SUBJ diset ke struktur yang dikembalikan dan register
TYPE diset ke DCL
12. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan verb. Tes
sukses, sehingga register AUX diset ke NIL dan register V diset ke ‘has’.
Lanjut Q4
13. Masuk ke keadaan NP, dikarenakan kata ‘printed’ bukan determiner
ataupun noun murni, maka NP dikeluarkan
14. Masih tersisa input, berarti analisis belum selesai. Lalu diperlukan
backtracking.
15. Pilihan terakhir terdapat pada Q1, sehingga kembali ke Q1. Register
AUX dan V tidak diset
16. Kerjakan tes kategori untuk melihat jika ‘has’ merupakan auxiliary. Tes
sukses sehingga ‘has’ diset ke register AUX dan lalu ke Q3.
17. Kerjakan tes kategori untuk melihat jika ‘printed’ merupakan verb. Tes
sukses, maka register V diset ke ‘printed’. Lanjut ke Q4.
18. Karena input telah habis, maka Q4 merupakan keadaan terakhir. Lalu
keluar dan kembali ke struktur
(S DCL (NP(FILE(LONG)DEFINITE))
HAS
(VP PRINTED))
Struktur ini merupakan output dari analisis.

2.8 SISTEM PENGOLAHAN BAHASA ALAMI

Suatu sistem pengolahan bahasa alami secara lisan dapat dibentuk

14
dari tiga sub-sistem, yaitu sebagai berikut.
1) Sub-Sistem Natural Language Processing (NLP), berfungsi untuk
melakukan pengolahan secara simbolik terhadap bahasa tulisan.
Beberapa bentuk aplikasi sub- sistem ini adalah translator bahasa alami
(misalnya dari Bahasa Inggris ke Bahasa Indonesia), sistem pemeriksa
sintaks bahasa, sistem yang dapat ”menyimpulkan” suatu narasi, dan
sebagainya.
2) Sub-sistem Text to Speech (TTS), berfungsi untuk mengubah text
(bahasa tulisan) menjadi ucapan (bahasa lisan).
3) Sub-Sistem Speech Recognition (SR), merupakan kebalikan teknologi
Text to Speech, yaitu sistem yang berfungsi untuk mengubah atau
mengenali suatu ucapan (bahasa lisan) menjadi text (bahasa tulisan).

Berbeda dengan kebanyakan sistem lain yang bersifat generik, teknik-teknik


yang digunakan dalam pengolahan bahasa alami bersifat sangat ‘language
dependent’. Suatu sistem atau teknik yang berlaku untuk suatu bahasa tidak
mudah diterapkan untuk bahasa lainnya.

2.9 Sistem Speech Recognition

 Sistem Speech Recognition atau Sistem Pengenalan Ucapan adalah


sistem yang berfungsi untuk mengubah bahasa lisan menjadi
bahasa tulisan.
 Masukan sistem adalah ucapan manusia, selanjutnya sistem akan
mengidentifikasikan kata atau kalimat yang diucapkan dan
menghasilkan teks yang sesuai dengan apa yang diucapkan.

Pada gambar 4. diperlihatkan konfigurasi tipikal suatu system


Pengenalan Ucapan. Sinyal ucapan (s(n)) pertama kali akan dilewatkan
pada bagian Penganalisis Ucapan untuk mendapatlan besaran-besaran atau
ciri-ciri yang mudah diolah pada tahap berikutnya. Untuk setiap ucapan
yang berbeda akan dihasilkan pola ciri yang berbeda.

15
Gambar 4. Diagram Blok Sistem Pengenal Ucapan

Penganalisis sintaks biasanya melakukan transformasi sinyal ucapan


dari domain waktu ke domain frekuensi. Pada domain frekuensi, untuk kurun
waktu yang singkat, setiap sinyal dapat terlihat memiliki ciri-ciri yang unik.
Namun demikian, pengucapan suatu unit bunyi ucapan (fonem) seringkali
bervariasi antar orang yang berbeda, juga terpengaruh oleh fonem-fonem
disekitarnya, kondisi emosi, noise, dan faktor-faktor lainnya.
Sistem Speech Recognition yang dapat mengenali seluruh kata dalam
suatu bahasa melakukan pengenalan untuk setiap unit bunyi pembentuk
ucapan (fonem), selanjutnya mencoba mencari kemungkinan kombinasi hasil
ucapan yang paling dapat diterima.
Sistem yang lebih sederhana adalah sistem yang hanya dapat mengenal
sejumlah kata yang jumlahnya terbatas. Sistem ini biasanya lebih akurat dan
lebih mudah dilatih, tetapi tidak dapat mengenal kata yang berada di luar kosa
kata yang pernah diajarkan.
Sistem Speech Recognition biasanya dapat dioperasikan pada dua mode
yang berbeda. Pertama adalah mode belajar. Pada mode ini, sistem akan dilatih
menggunakan sejumlah kata atau kalimat yang memenuhi suatu kriteria tertentu.
Setiap contoh kata atau kalimat ajar tersebut akan menghasilkan pola tertentu
yang akan dipelajari oleh sistem dan disimpan sebagai template atau referensi.
Kedua adalah mode produksi atau pengenalan ucapan. Pada mode
ini, setiap kalimat yang ingin dikenali akan dianalisis polanya. Berdasarkan
hasil perbandingan dengan template atau referensi, modul klasifikasi pola serta
pengambil keputusan akan mengidentifikasikan kata atau kalimat yang diucapkan
tersebut.
Pada prinsipnya, teknik-teknik atau algoritma yang digunakan pada

16
sistem Pengenal Ucapan tidak bersifat sensitif terhadap bahasa. Artinya, sistem
yang sama dapat digunakan untuk bahasa apapun. Namun demikian,
kemampuan sistem untuk mengenali ucapan pada bahasa tertentu sangat
tergantung dari template atau referensi yang diperoleh melalui proses belajar di
dalam sistemnya itu sendiri. Untuk melatih sistem Pengenal Ucapan agar
dapat digunakan untuk suatu bahasa yang baru, maka diperlukan korpus untuk
melatih sistem tersebut. Korpus yang dimaksud adalah berupa rekaman ucapan
yang heterogen dalam volume yang sangat besar serta memenuhi kriteria teknis
tertentu.
Semakin besar korpus yang digunakan untuk melatih sistem, akan
dihasilkan sistem Speech Recognition yang cenderung lebih handal. Sistem
yang handal, paling tidak harus dilatih dengan ratusan rekaman pembicara.
Semakin besar korpus yang digunakan untuk melatih sistem, akan
dihasilkan sistem Speech Recognition yang cenderung lebih handal. Sistem
yang handal, paling tidak harus dilatih dengan ratusan rekaman pembicara.

2.10 Sistem Text to Speech

Secara fungsional, Text to Speech atau TTS melakukan proses sebaliknya

17
dari sistem Pengenal Ucapan. Namun demikian pendekatan implementasinya
sama sekali berbeda. Artinya, komponen-komponen pembentuk kedua sistem
tersebut sama sekali berbeda. Pada dasarnya TTS adalah suatu sistem yang
dapat mengubah text menjadi ucapan.

2.11 Sistem Natural Language Processing

Seperti telah dijelaskan sebelumnya bahwa bahasa dapat dibedakan


menjadi bahasa alami dan bahasa buatan. Bahasa buatan dibuat untuk
memenuhi kebutuhan tertentu dan dirancang dengan hati-hati agar mematuhi
aturan-aturan yang diperlukan untuk kemudahan pengolahannya.

Di lain pihak, Bahasa alami tumbuh secara alami untuk


memenuhi kebutuhan komunikasi antar manusia. Bahasa alami tidak dirancang
dengan memperhatikan berbagai kendala untuk kemudahan pengolahan. Sebagai
akibatnya, pengolahan bahasa alami jauh lebih sulit dilakukan dibandingkan
dengan bahasa buatan. Bahkan, beberapa masalah mendasar dalam bahasa
alami masih belum terpecahkan hingga kini.

Pengolahan bahasa alami tidak mudah dilakukan. Beberapa alasan yang


menyulitkan pengolahan bahasa alami diantaranya adalah sebagai berikut.

1) Dalam bahasa alami, sering terjadi ambiguity atau makna ganda.


Fenomena ini terjadi pada berbagai level implementasi bahasa, mulai dari
simbol-simbol huruf dan tanda baca sebagai unit terkecil bahasa tulisan,
tingkat kata,
frasa, kalimat, bahkan paragraf. Simbol titik tidak selalu berfungsi sebagai
tanda akhir kalimat, tetapi dapat menjadi bagian dari singkatan (misalnya Ir.,
Dr., Jl.) atau bagian dari bilangan. Contoh lainnya, kata “bisa” mungkin
mempunyai pengertian “racun” atau “dapat”. Fenomena ini terjadi pula
dalam penentuan jenis kata (part of speech), misalnya kata
”advanced” dapat berfungsi sebagai kata kerja aktif (bentuk lampau), kata
kerja pasif, atau kata sifat.

18
2) Jumlah kosa kata (vocabulary) dalam bahasa alami sangat besar dan
berkembang dari waktu ke waktu.

Karakteristik-karakteristik tersebut menyebabkan sulitnya melakukan


pengolahan bahasa alami. Manusia sendiri menghadapi masalah ambiguitas
tersebut berdasarkan analisis konteks yang didukung pengetahuan yang
dimiliki di dalam otaknya. Mesin atau komputer yang tidak dilengkapi
pengetahuan seperti itu menjadi sulit melakukannya. Jika NLP diterapkan untuk
aplikasi bahasa lisan, kesulitan lainnya mungkin terjadi. Dalam bahasa lisan,
manusia sangat sering membentuk ucapan yang tidak sesuai dengan aturan-
aturan yang berlaku dalam bahasa yang digunakan.

Teknologi Natural Language Processing (NLP) atau Pengolahan Bahasa


Alami adalah teknologi yang memungkinkan untuk melakukan berbagai
macam pengolahan terhadap bahasa alami yang biasa digunakan oleh
manusia. Sistem ini biasanya mempunyai masukan dan keluaram berupa
bahasa tulisan (teks). NLP mempunyai aplikasi yang sangat luas. Beberapa
diantara berbagai kategori aplikasi NLP adalah sebagai berikut:
1) Natural Language Translator, yaitu translator dari satu bahasa alami
ke bahasa alami lainnya, misalnya translator bahasa Inggris ke bahasa
Indonesia, Bahasa Indonesia ke Bahasa Jawa dan sebagainya. Translator
bahasa alami bukan hanya kamus yang menerjemahkan kata per kata,
tetapi harus juga mentranslasikan sintaks dari bahasa asal ke bahasa
tujuannya.
2) Translator bahasa alami ke bahasa buatan, yaitu translator yang
mengubah perintah-perintah dalam bahasa alami menjadi bahasa
buatan yang dapat dieksekusi oleh mesin atau komputer. Sebagai contoh,
translator yang memungkinkan kita memberikan perintah bahasa alami
kepada komputer. Dengan system seperti ini, pengguna sistem dapat
memberikan perintah dengan bahasa sehari-hari, misalnya, untuk
menghapus semua file, pengguna cukup memberikan perintah ”komputer,
tolong hapus semua file !” Translator akan mentranslasikan perintah

19
bahasa alami tersebut menjadi perintah bahasa formal yang dipahami
oleh komputer, yaitu ”dir *.* <ENTER>”.
3) Text Summarization, yaitu suatu sistem yang dapat ”membuat
ringkasan” hal-hal yang penting dari suatu wacana yang diberikan.

2.12 Aplikasi-Aplikasi Teknologi Bahasa

Banyak manfaat yang dapat dicapai dari ketersediaan Aplikasi Teknologi


Bahasa,
khususnya untuk Bahasa Indonesia. Berikut ini adalah beberapa contoh
aplikasi yang dapat dikembangkan menggunakan teknologi bahasa.

1) Alat bantu membaca untuk tunanetra. Alat bantu membaca bagi


tunanetra mempunyai masukan berupa teks tercetak (misalnya buku)
dan mempunyai keluaran berupa ucapan dari teks tercetak yang
diberikan. Pada prinsipnya ada dua komponen utamanya, yaitu
bagian “pengenal karakter” yang menggunakan teknologi OCR (Optical
Character Recognition), serta bagian TTS. Dengan alat bantu ini, orang
tunanetra dapat membaca suatu buku atau dokumen. Bahkan, jika teks
yang ingin dibacakan sudah tersedia di dalam komputer, dengan
teknologi Text to Speech dapat langsung diucapkan.

2) Alat bantu bicara untuk tunawicara. Alat bantu membaca bagi


tunawicara mempunyai masukan posisi tangan yang dideteksi oleh
suatu sensor dan unit identifikasi. Rangkaian huruf yang
diidentifikasikan akan disusun membentuk suatu kata yang pada akhirnya
akan diumpankan pada bagian TTS.

20
3) Online translator. Online translator yang dimaksud disini adalah
translator yang secara otomatis dapat menerjemahkan kalimat lisan dari
suatu bahasa alami (misalnya Bahasa Inggris) menjadi ucapan hasil
terjemahannya dalam bahasa alami lainnya (misalnya Bahasa Indonesia).
Online translator terdiri dari 3 bagian. Bagian pertama, speech
recognition, berfungsi untuk mengenali rangkaian kata dari bahasa sumber
menjadi teks dalam bahasa sumber. Bagian berikutnya adalah translator
teks ke teks. Hasil bagian kedua ini adalah kalimat bahasa tujuan yang
masih berupa teks. Bagian ketiga berupa sistem TTS dalam bahasa tujuan.
Aplikasi seperti ini mungkin untuk dikembangkan, karena teknologi
speech recognition sudah banyak dikembangkan. Translator bahasa pun
sudah banyak dikembangkan, termasuk translator Bahasa Inggris ke
Indonesia .

21
4) Talking email atau aplikasi lainnya. TTS juga memungkinkan
diintegrasikan dengan berbagai program aplikasi, seperti email, web
browser, aplikasi-aplikasi multimedia atau aplikasi-aplikasi
lainnya.

5) Aplikasi Telephony. TTS dapat digunakan pada aplikasi telephony,


seperti sistem informasi billing atau sistem informasi lainnya yang
diucapkan secara lisan. TTS juga dapat digunakan untuk
konversi dari SMS (Short Message System) ke ucapan sehingga pesan
SMS dapat didengar. Dengan demikian memungkinkan untuk mendengar
pesan SMS sambil melakukan aktivitas yang menyulitkan untuk
membacanya, seperti sedang mengendarai mobil. Dengan TTS tersebut,
memungkinkan pula untuk meneruskan pesan SMS ke sistem telepon biasa
(PSTN). Speech Recognition memungkinkan pencarian informasi secara
lisan.

22
BAB III
PENUTUP
3.1 Kesimpulan
 Tujuan dalam bidang Natural Language ini adalah melakukan proses
pembuatan model komputasi dari bahasa, sehingga dapat terjadi suatu
interaksi antara manusia dengan computer dengan perantaraan bahasa
alami.
 Pengolahan Bahasa Alami (Natural Language Processing) mengenal
beberapa tingkat pengolahan yaitu Prosody, Phonology, Morphology,
Syntax, Semantics, Pragmatics dan World knowledge.
3.2 Saran
 Melihat fenomena globalisasi serta banyaknya jumlah penduduk Indonesia,
maka pengembangan teknologi yang berkaitan dengan komunikasi dalam hal
ini bahasa alami menjadi sangat penting dan strategis. Teknologi ini dapat
digunakan untuk tujuan bisnis, pendidikan, kemanusiaan dan pelesetarian
budaya daerah di Indonesia.

23
Referensi :
1) http://www.unisbank.ac.id/ojs/index.php/fti1/article/viewFile/82/77
2) http://lecturer.eepis-its.edu/~entin/Kecerdasan%20Buatan/Buku/Bab
%205%20Natural%20Language%20Processing.pdf

24

Anda mungkin juga menyukai