Makalah ini disusun untuk memenuhi tugas kelompok dalam mata kuliah
Kecerdasan buatan
Disusun oleh :
VA
TEKNIK INFORMATIKA
2019
1
DAFTAR ISI
BAB I : PENDAHULUAN
BAB II : PEMBAHASAN
A. Kesimpulan …………………………………………………………..
DAFTAR PUSTAKA
2
BAB I
PENDAHULUAN
A. Latar Belakang
macam aspek bahasa dan pengembangan pada sistem yang luas. NLP
berdasarkan aturan yang ada pada bahasa yang dijadikan objek pemrosesan
kasus deteksi plagiarisme salah satu proses yang diperlukan adalah proses
suatu tuturan dari sebuah tingkatan atau macam Bahasa menjadi yang lain
kembali suatu teks dalam bentuk yang lain, dengan maksud untuk dapat
namun mengandung pesan yang sama. Hal yang membuat proses pengenalan
frasa-frasa yang berbeda bentuk namun memiliki makna yang sama. Misalnya
infiks, dan konfiks pada struktur bahasa sehingga sulit untuk menyocokan kata
3
yang berkaitan. Untuk menghadapi permasalah diatas maka dibutuhkan
keduanya memiliki arti sama atau tidak. Pendekatan yang dilakukan untuk
terbaik untuk dataset bahasa Indonesia. Data hasil preprocessing tersebut lalu
fitur baru dari data set tersebut. Fitur yang pertama adalah fitur sintaktik yang
merupakan hasil dari perhitungan jarak antara dua kalimat, perhitungan jarak
kedua adalah fitur semantik, fitur ini menghitung kemiripan pasangan kalimat
dataset tersebut dibagi menjadi dua bagian yaitu data training dan data testing.
Setelah data selesai dibagi, maka dilakukan diskritisasi nilai fitur dengan
Distribution Probability.
4
dependency-nya melalui suatu Directed Acyclic Graph(DAG) [4]. Ada empat
akibat, yang ketiga bayesian networks sejalan dengan teknik bayesian statistik
B. Rumusan Masalah
C. Tujuan Penulisan
D. Sistematika Penulisan
5
BAB 1 PENDAHULUAN
tujuan penulisan
BAB IV PENUTUP
6
BAB II
PEMBAHASAN
A. Landasan Teori
7
visual, atau taktil, sebagai contohnya, tulisan grafis, braille, atau siulan.
membentuk urutan yang dikenal sebagai kata atau morfem, dan suatu
dan penggunaan yang lebih luas daripada sistem komunikasi hewan yang
diketahui.
8
sosial dan komunikatif tertentu. Bahasa diproses pada banyak lokasi yang
berbeda pada otak manusia, terutama di area Broca dan area Wernicke.
dan anak-anak sudah dapat berbicara secara fasih kurang lebih pada umur
tiga tahun. Penggunaan bahasa telah berakar dalam kultur manusia. Oleh
bahasa yang diturunkan dari leluhur yang sama dikenal sebagai rumpun
bahasa.
melingkupi Arab, Amhar, Somali, dan Hebrew; dan bahasa Bantu, yang
melingkupi Swahili, Zulu, Shona, dan ratusan bahasa lain yang digunakan
sejak awal abad ke-21 kemungkinan akan punah pada tahun 2100.
9
Pemrosesan bahasa alami, disingkat PBA atau NLP (natural language
interaksi antara komputer dengan bahasa (alami) manusia [1]. NLP sering
Turing mengusulkan tes yang sekarang disebut dengan Turing Test. Tes
Turing adalah sebuah tes yang mengukur kemampuan mesin (dalam hal ini
dengan manusia dan mesin yang akan dites. Semua peserta dipisahkan satu
sama lain. Jika juri tidak bisa membedakan antara manusia dan mesin,
10
sebelumnya. Pada tahun 1950, Alan Turing menerbitkan sebuah artikel
berjudul " Mesin Komputasi dan Kecerdasan " yang mengusulkan apa
Inggris. Para penulis mengklaim bahwa dalam tiga atau lima tahun,
kemajuan nyata jauh lebih lambat, dan setelah laporan ALPAC pada tahun
1966, yang menemukan bahwa penelitian selama sepuluh tahun telah gagal
dikembangkan.
bekerja di " blok dunia " terbatas dengan kosakata terbatas, dan ELIZA ,
11
data yang dapat dimengerti komputer. Contohnya adalah MARGIE
dan semakin banyak, penelitian telah berfokus pada model statistik , yang
seperti itu umumnya lebih kuat ketika diberi input asing, terutama input
12
yang mengandung kesalahan (seperti yang sangat umum untuk data dunia
diintegrasikan ke dalam sistem yang lebih besar yang terdiri dari beberapa
subtugas.
diproduksi oleh Parlemen Kanada dan Uni Eropa sebagai hasil dari
sesuai. Namun, sebagian besar sistem lain bergantung pada korpora yang
oleh sistem ini, yang (dan sering terus menjadi) batasan utama dalam
metode pembelajaran yang lebih efektif dari jumlah data yang terbatas.
tersebut dapat belajar dari data yang belum dianotasi tangan dengan
dan tidak beranotasi. Secara umum, tugas ini jauh lebih sulit
yang kurang akurat untuk sejumlah data input yang diberikan. Namun, ada
sejumlah besar data yang tidak dianotasi yang tersedia (termasuk, antara
13
lain, seluruh konten World Wide Web ), yang sering kali dapat
14
Pada masa-masa awal, banyak sistem pemrosesan bahasa dirancang
dengan mengkodekan tangan satu set aturan: seperti menulis tata bahasa
Sejak apa yang disebut "revolusi statistik" pada akhir 1980-an dan
analisis korpora besar contoh dunia nyata yang khas ( corpus (jamak,
atau komputer ).
bobot bernilai nyata ke setiap fitur input. Model semacam ini memiliki
15
Sistem yang didasarkan pada algoritma pembelajaran mesin
diarahkan.
16
banyak data untuk dimasukkan ke sistem pembelajaran mesin
Berikut ini adalah daftar dari beberapa tugas yang paling sering
diteliti dalam pemrosesan bahasa alami. Beberapa dari tugas ini memiliki
gabungan kata fon (yang berarti bunyi) dan logi (yang berarti
17
Fonologi terdiri dari 2 (dua) bagian, yaitu Fonetik dan Fonemik.
lain: fona, fonem, vokal, dan konsonan. Fona adalah bunyi ujaran
membedakan arti.
18
fonem berbeda dengan huruf. Variasi ini terdiri dari: vokal, konsonan,
huruf hidup.
udara keluar dengan rintangan. Dalam hal ini, yang dimaksud dengan
2. Morfologi
untuk membedakan satu kata dengan lainnya. Pada tingkat ini juga
dapat dipisahkan antara kata dan elemen lain seperti tanda baca.
Going (word)
Go (root)
Ing (suffix)
19
Kata understand :
Stand (prefix)
Stand (root)
3. Sintaksis
Meliputi proses pengaturan tata letak suatu kata dalam kalimat akan
membentuk kalimat yang dapat dikenali. Selain itu dapat pula dikenali
bagian - bagian kalimat dalam suatu kalimat yang lebih besar. Sebagai
contoh kalimat S dibentuk dari noun phrase (NP) dan verb phrase (VP)
Ø S -> NP,VP
Dan berikutnya :
Ø NP -> DET,N
Ø VP -> V,NP
bahasa.
2. Lemmatization
bentuk kamus dasar dari sebuah kata yang juga dikenal sebagai
lemma.
3. Segmentasi morfologis
20
tergantung pada kompleksitas morfologi (yaitu struktur kata) dari
dan oleh karena itu sering mungkin untuk mengabaikan tugas ini
yang mungkin.
4. Penandaan bagian-of-speech
penerbangan"); "set" dapat berupa kata benda , kata kerja atau kata
sifat ; dan "keluar" dapat menjadi salah satu dari setidaknya lima
itu. Bahasa Cina rentan terhadap ambiguitas seperti itu karena ini
21
tidak mudah disampaikan melalui entitas yang digunakan dalam
5. Parsing
sebagian besar akan tampak sama sekali tidak masuk akal bagi
stokastik .
kalimat )
kalimat sering ditandai dengan titik atau tanda baca lain, tetapi
7. Stemming
22
Proses mengurangi infleksi kata-kata (atau kadang-kadang
8. Segmentasi kata
batas kata dengan cara seperti itu, dan dalam bahasa-bahasa itu
penambangan data.
9. Ekstraksi terminologi
diberikan.
4. Semantik
tiap kata ke dalam bentuk yang lebih mendasar dan tidak tergantung
dari arti kata - arti kata tersebut membentuk suatu arti dari kalimat
23
yang utuh. Dalam tingkatan ini belum tercakup konteks dari kalimat
tersebut.
1. Semantik leksikal
2. Semantik distribusi
3. Mesin penerjemah
paling sulit, dan merupakan anggota dari kelas masalah yang secara
untuk nama yang tepat, seperti orang atau tempat, dan apa tipe dari
jenis entitas yang dinamai, dan dalam kasus apa pun seringkali
dari sebuah kalimat juga ditulis dengan huruf kapital, dan entitas
24
ditulis dengan huruf besar. Selain itu, banyak bahasa lain dalam
skrip non-Barat (mis. Bahasa Cina atau Arab ) tidak memiliki huruf
besar sama sekali, dan bahkan bahasa dengan huruf besar mungkin
25
7. Pengenalan karakter optis (OCR)
yang sesuai.
8. Menjawab pertanyaan
kompleks. [16]
pemasaran.
26
Diberikan potongan teks, pisahkan ke dalam segmen yang
masalah ini, kami biasanya diberikan daftar kata dan indra kata
seperti WordNet .
5. Pragmantik
system
6. Discourse Knowledge
terhadap kata ganti orang dan untuk mengartikan aspek sementara dari
informasi.
7. World Knowledge
apakah ada arti khusus bagi suatu kata dalam suatu percakapan dengan
konteks tertentu.
27
5. Aplikasi Dalam Bidang Natural Languague
Secara umum, Jenis aplikasi yang bisa dibuat dalam bidang ilmu
application.
2. Machine Translation
Contoh :
1. Google Translate
28
Google Terjemahan[1] (bahasa Inggris: Google
penerjemahan selanjutnya.
29
Menurut Och, untuk mengembangkan sistem
tersebut yang terdiri lebih dari satu juta kata dan dua
paralel.
30
Jenis Dialogue-Based Application
Contohnya adalah :
1. Siri
31
tidak seperti perangkat lunak pengenalan suara
aplikasi iOS yang tersedia di App Store oleh Siri Inc, Siri
2. Google Assistant
32
Google Assistant adalah asisten virtual yang
33
perangkat lunak pada bulan April 2017, Google Assistant
Indonesia.
34
3. Microsoft Cortana
35
4. Bixby Samsung
36
menjadikannya produk non-mobile pertama yang
dan lemari es. Selain itu, pihak ketiga akan diizinkan untuk
Pengembang Samsung.
Home".
37
landmark. "Bixby Home" adalah daftar informasi vertikal
38
Pada 20 Februari 2019 Samsung mengumumkan
5. Chatbot
dalam hal ini dapat dilihat fungsi program sebagai suatu jenis
39
Meskipun banyak bots yang tampaknya dapat
atau pola kata-kata yang paling mirip dari basis data tekstual.
40
berupa tanggapan yang telah dipersiapkan atau diprogram,
41
mengidentifikasi area bantuan yang dibutuhkan pengguna,
pada pengguna.
42
bahasa pemrograman yang disebut sebagai AIML yang
penalaran logis.
Messenger.
43
Portal online populer seperti eBay dan PayPal juga
1. Duolingo
44
dari beberapa AI terbaik yang ada, namun seiring
2. Gymbot
latihan kamu
3. Cleverbot
4. Chatterbot
45
Digunakan untuk menghasilkan respon otomatis
dengan manusia.
5. Prisma
46
pratinjau yang berguna dimana memungkinkan kamu
1. Parser
setiap kata
3. Output Translator
lainnya
47
7. Analisis NLP
a) Leksikal
b) Sintak
dengan grammar)
8. Knowledge Base
Yakni salah satu dari bagian utama dalam aplikasi kecerdasan buatan
ini terpenting dari suatu basis pengetahuan adalah kualitas informasi yang
yang ditulis dengan baik dan dijaga untuk selalu mutakhir, memiliki
system pengammbilan (mesin pencari) yang baik, serta format isi dan
besar, deskripsi dari data tersebut (metadata) dan serangkaian besar aturan-
48
Untuk mengelola suatu basis pengetahuan, dibutuhkan suatu system
sebagai berikut :
pengetahuan
49
BAB III
PENUTUP
A. Kesimpulan
Anda
50
DAFTAR PUSTAKA
https://id.wikipedia.org/wiki/Bahasa
https://id.wikipedia.org/wiki/Proses
https://id.wikipedia.org/wiki/Bahasa_alami
https://sis.binus.ac.id/2016/12/15/12113/
51