Anda di halaman 1dari 12

Peer Ditinjau Karya

Membangun sebuah AIML


Chatter
Bot Knowledge-Base
mulai dari FAQ yang dan
sebuah Daftar Istilah
Giovanni De Gasperis
Dipartimento Ingegneria Elettrica e Informazione,
Universit'dell degli Studi dell'Aquila
giovanni.degasperis@univaq.it

Kata Kunci: chatter bot interaksi komputer manusia

Abstrak
Chatter bot yang program perangkat lunak yang meniru percakapan
manusia dan dapat menunjukkan-seperti perbualan tentang perilaku
manusia dalam domain pengetahuan terbatas jika dilukis dengan benar.
AIML, Kecerdasan Buatan Markup Language (Bahasa Markup Hiperteks),
adalah sebuah dikenal XML untuk membangun menciap bahasa diperolehi
bot alas pengetahuan, dalam konteks pertimbangan berbasis kasus dan pola
tekstual algoritma yang sesuai. Metodologi desain yang akan menjelaskan
berdasarkan sebuah algoritma novel untuk secara otomatis menghasilkan
AIML alas pengetahuan mulai dari sebuah pertanyaan yang sering diajukan
file teks bebas dan sebuah istilah-istilah glosarium.
Demonstran yang dibuat chatter bot menggunakan bahasa Italia akan
ditampilkan.

Journal of e-Learning dan Masyarakat dengan


Ilmu Pengetahuan
Vol. 6, n. 2, mungkin tahun 2010 (mukasurat 75
- 83) ISSN: 1826-6223 | eISSN: 1971-8829

Giovanni
GasperisKarya
- Membangun
sebuah
AIML Chatter
Peer De
Ditinjau
- Vol. 6,
n. 2, mungkin
tahunBot Knowledge-Base mulai dari FAQ yang dan sebuah Daftar
Istilah
2010

1 Introduction
Dalam '60-'70 s agen perbualan tentang pertama dilaksanakan, ELIZA
(1966) dan menangkis kritikan (1972) (Gzeldere & Franchi, 1995). Mereka
berdasarkan pengakuan kata kunci atau frasa yang diberikan dalam masukan
dan pada satu set korintus- merespons pra-diatur dan pra-programmed
jawaban output, sehingga dapat dianggap percakapan intelligent.
Antarmuka pengguna multimodal Modern (Pirrone et al., 2008) terdiri dari
sebuah pseudo- bahasa alam interpreter yang percakapan manusia agar
pekerjaanya untuk membuat pengguna merasa nyaman selama pengambilan
informasi. Dalam percakapan ini dilakukan oleh sebuah chatter bot
(Wikipedia, 2009) berdasarkan pengetahuan AIML-base dan AIML
interpreter (AIML, 2005). Pengetahuan-base (KB) dari sebuah chatter bot
perbualan tentang agent terbuat dari pasangan pola dan template, yang dapat
dihubungkan secara semantik dan/atau secara rekursif melalui koneksi srai.
A.L.I.C.E., dalam berbagai versi, adalah yang paling terkenal Inggris
generalist- berbicara chatter bot. A.L.I.C.E. saat ini menggunakan teknikteknik pencocokan pola yang sama dengan yang digunakan oleh ELIZA sejak
1966.
Di antara berbagai Alicebots, baru-baru ini mengumumkan SpellBinder
Wallace (Wallace, 2009) oleh layanan web yang menciap-bot dasar
pengetahuan ini dapat dibuat menggunakan risalah karakter film, berasimilasi
kepribadian mereka dan cara-cara berbicara. Palsu yang lucu dan menarik
James T Kirk tersedia untuk berinteraksi dengan, lahir dari semua risalah Star
Trek yang asli serial TV.
Model dapat berhubungan dengan pertimbangan berbasis kasus jaringan
semantik (Smid,
2002) dan diatasi menggunakan pola tekstual-algoritma yang sesuai (Wallace,
2007). Dalam KB dapat mewakili graphically menggunakan grafik seperti
yang ditunjukkan pada gambar 1.

76

76

Pohon Ara. 1 - khususnya di dalam KB representasi grafik berpusat pada pertanyaan Q1.
Dalam grafik pola-node (P) dan template (T), dan pemotongnya P-T asosiasiasosiasi dan T-P recursions semantik. Grafik mewakili P-T FAQ yang dihasilkan
oleh dan file glosarium dijelaskan dalam karya.

2 Knowledge-Base Metodologi Desain


Pertanyaan yang sering diajukan mengatur menentukan secara semantik
pengetahuan domain ke obrolan bot yang diberikan. Dalam bentuk file teks
mereka dengan mudah untuk menulis dan untuk memperoleh karena mereka
sering tersedia di situs web banyak. Glossaries teks ini, sebaliknya, kurang
umum, tetapi dapat berasal dari banyak sumber daya online yang tersedia,
berkat kemampuan untuk mengaitkan ketentuan diberikan dengan
pengetahuan domain.
Semua pengetahuan yang berhubungan dengan domain yang menarik
adalah secara tegas dan im- plicitly disertakan dalam file glosarium dan
FAQ. Jadi membuat metode yang tersedia untuk mengekstrak semua
pengetahuan yang mungkin FAQ dari dan file glosarium dapat titik awal
yang penting untuk proses untuk menghasilkan sebuah menjawab ahli
perangkat lunak tentang domain pengetahuan yang sama, seperti yang
ditunjukkan pada gambar 2.

Pohon Ara 2 - alur kerja dari chatter bot proses generasi

Diberikan FAQ file teks TFAQ,dalam format di mana sebuah pertanyaan


ini dikaitkan ke jawaban relatif, dan file glosarium TGLO, dalam format di
mana sebuah istilah glosarium dikaitkan ke definisi masing-masing, untuk
mendapatkan akurat
Menjawab chatter bot pada akhir proses menghasilkan, langkah-langkah
berikut harus diselesaikan:
1. Definisi kumpulan kata dummy
Tergantung pada domain pengetahuan:
2. Definisi set domain entri polyrhematic tertentu
3. Definisi chatter bot algoritma generasi
Di mana dummy berarti kata-kata hanya digunakan sebagai sintaktis
pemegang rekening, tetapi dengan struktur nol atau rendah tingkat semantik;
polyrhematic kalimat entri yang dibuat oleh suatu urutan dari kata-kata yang
berkaitan dengan satu entiti semantik. Dua set yang digunakan dalam
kombinasi untuk filter keluar tidak kata-kata yang bermakna sebelum
membangun pola yang disetel untuk generasi AIML. Kemampuan
komputasi teknik bidang linguistik dapat digunakan untuk memotong setel
kata-kata; mereka akan sangat berguna untuk mengenali kata dummy, yang
biasanya setara dengan kata-kata yang paling sering yang dapat cal- cutated
diberikan satu set berbicara bahasa Corporation, agar tidak memasukkan
mereka dalam database AIML.

2.1 definisi data input


Data diorganisir sebagai berikut:
FAQ FILE Fdi:
Q <SPACE> <question text>
<SPACE> <menjawab Text>
Glosarium FILE Gdi:
G <SPACE> <item teks (polyrhematic>)
D <SPACE> <definition Text>
Setel dari kata-kata dummy Ddi:
File teks dengan sebuah kata untuk setiap saluran.
Entri Polyrematic setel Pdi:
File teks dengan sebuah entri polyrhematic (beberapa kata-kata s) untuk setiap
saluran.

3 Chatter bot algoritma pembuat


Memberikan masukan yang diberikan oleh {Fdi,Gdalam,Ddalam,Pdi}, algoritma akan
output
Kompatibel dengan 1.0.1 AIML(file XML) Zkeluar grafik (AIML, 2005). Dalam gen
AIMLOutput yang ditentukan dapat kemudian digunakan sebagai pengetahuan dasar
pertanyaan menjawab
Chatter bot, sedang diproses oleh AIML interpreter/reasoner apa pun.

3.1 FAQ Generasi-AIML


Algoritma pembuat yang telah dikembangkan dengan Python lan
pemrograman- mengukur pengetahuan yang mengakibatkan tentang 500
baris kode. Langkah-langkah utama dapat dirangkum sebagai berikut:
Algoritma yang 1: Algoritma Generasi AIML Utama
F1. mengekstrak semua daftar kategori yang relevan dari pertanyaan FAQ Fdi
F2. menghitung kemungkinan cabang
F3. mengekstrak jawaban
F4. Buat AIML, yaitu Zkeluar grafik

3.1.1 langkah-langkah terperinci F1

Satu kategori, seperti yang didefinisikan dalam AIML, adalah beberapa


pola-pola- template. Pola perlu bertepatan dengan satu atau beberapa kata
yang diambil dari pertanyaan menggunakan siripnya sehingga mereka dapat
ditemukan dalam pertanyaan pengguna dan sesuai dengan

Jawaban yang tepat dari file FAQ, seperti tercatat pada algoritma 2.
Algoritma yang 2 Generasi kategori AIML:
Menentukan Dw sebagai kata-kata
dummy setel
mendefinisikan Pw sebagai
polyrhematic entri untuk pertanyaan
alla FAQ q dalam Fdalam melakukan
Daftar membangun L dari kata-kata yang bermakna wsaya
(mis. Filter keluar semua wsaya di Dw dan gunakan waku dalam Pw)
Memulai sebuah kosongkan daftar kategori C
Untuk semua kata waku dalam L melakukan
Menambahkan wsaya di C digabungkan dengan semua yang lain diambil
2 oleh 2
Akhir UNTUK
Membangun sebuah daftar kategori M dengan semua kata-kata yang bermakna
ditemukan dalam q
Akhir
Menambahkan C dan M untuk daftar kategori setel Sc
UNTUK

3.1.2 langkah-langkah terperinci F2


Metode ini, yang ditunjukkan pada algoritma F2, yang diperlukan untuk
menghitung semua kemungkinan cabang dari kategori yang keluar yang
dapat menyebabkan jawaban yang berbeda. Ini akan digunakan nanti sebagai
informasi untuk membuat kode AIML, seperti yang ditunjukkan pada
algoritma
3.
Algoritma yang 3: Pengambilan kategori cabang
Biarkan keluar menjadi peta kamus output mengindeks sebuah kategori untuk daftar bilangan
Untuk semua daftar kategori Cl di Sc melakukan
Sebuahsaya adalah untuk menjawab pertanyaan yang Qaku dihasilkan Cl
Untuk semua kategori ci di Cl melakukan
Menambahkan
integer saya ke keluar[csaya daftar ]
Akhir UNTUK
Akhir
UNTUK
Kembali Keluar

Dalam implementasinya, struktur data kamus yang kuat yang


didefinisikan
dalam
bahasa
ular
sanca,
di
sini keluar[<category>] sangat penting selama calcu- lation daripada
kategori' cabang.

3.1.3 langkah-langkah terperinci F4


Metode ini akhirnya menghasilkan file AIML FAQ, mencoba untuk
menangkap semua dari kata-kata yang bermakna dari hukuman pengguna
dan mereka yang cocok dengan sajian ."- ningful kata-kata FAQ pertanyaan.

Ia menghasilkan SRAI recursions yang didefinisikan oleh AIML 1.0.1


(AIML standar, 2005).

3.2 Generasi-AIML GLOSARIUM


Generasi Glosarium AIML sangat mudah: untuk masing-masing item
glosarium

Disaring dengan dummy dan polyrhematic mengatur definisi yang dikaitkan


dengan relatif definisi glosarium.
Algoritma yang 4: output generasi grafik Zout dan AIML akhir
Untuk semua pertanyaan Qsaya lakukan
Diberikan daftar kategori Cl dihasilkan dari Qsaya
Biarkan Tsebuah menjadi AIML template SRAI yang berisi teks jawaban
Untuk semua kategori Cl di Cl melakukan
Jika Cl adalah kombinasi dua perkataan kemudian
Membuat semua tepi mungkin (SRAI) untuk Tsebuah
Lain jika Cl telah hanya satu cabang kemudian
Membuat (SRAI tepi) untuk Tsebuah
Jika Cl hanyalah satu kata kemudian
Membuat (SRAI tepi) untuk item glosarium
Akhir JIKA
Akhir
Akhir
JIKA
UNTUK
Akhir
UNTUK

4 AIML PKP2B mencapai lebih


Generasi chatter bot AIML generasi termasuk dari file FAQ dan dari file
glosarium. Juga mengurangi kebutuhan AIML yang akan dibuat dipandu oleh
kata-kata dummy setel, sehingga setiap kalimat pengguna memasukan
selama percakapan yang akan berkurang untuk suatu urutan dari kata-kata
yang bermakna yang dapat cocok dengan FAQ AIML dan pengetahuan
AIML GLOSARIUM-base, untuk mencari jawaban yang tepat ke
ditanyakan.

5 studi kasus dari sebuah bahasa Italia menjawab bot


Studi Kasus dirancang untuk dapat sederhana untuk menjaga agar
ukuran kecil dari data, khususnya setelah grafik visualisasi. Ia terdiri dari
dua pertanyaan Q1 dan q2.
Chatter bot sederhana dapat dibuat dengan menggunakan file data input berikut:

FAQ 5.1
Q datang si crea menciap-bot pbb con il linguaggio AIML?
Sebuah Prima devi imparare il linguaggio e aku suoi
principali co- strutti. Devi prima aver Ovviamente imparato
l'XML perche' ne e' suo derivato PBB. Tra aku costrutti
sintattici pi potenti ti sug- gerisco sesungguhnya SRAI, che
ti permette di connettere pola coppie- tra loro, template
datang ad esempio caso dei sinonimi Channel Members. Poi devi
costruire bene la base di conoscenza dalam AIML e darla dalam
pasto sebuah pandorabots.com.

Q datang si Amerika Serikat menciap-bot pbb?


Sebuah Per usare il menciap-bot devi inviare aku AIML presso
file server pbb ove sia residente interprete AIML PBB. Devi
editare Quindi una pagina contenga aku campi che HTML
codificati per la domanda e la risposta verso l'utente secara
langsung spirit.

5.2 file Glosarium


G chatter bot
D menciap-bot pbb e' perangkat lunak pbb che simula una
conversazione dalam linguaggio naturale
G AIML
D AIML, Kecerdasan Buatan Markup Language (Bahasa Markup
Hiperteks), e' il linguag- gio per la definizione di una
tipologia di chatter bot Channel Members introdotto 2000 da
Richard Wallace
G Alice
D E' il miglior menciap-bot conosciuto basato su AIML
G Richard Wallace
D Dr. Richard Wallace e' l'inventore del linguaggio AIML e
del chatter bot Alice

5.3 dibuat dasar pengetahuan


Diberikan 5 baris teks dari file FAQ, output terdiri dari 195 kategori.
Daftar Istilah terdiri dari 19 kategori file, terdiri dari 4 asli entri glosarium
dan kombinasi arti meminta kata-kata. Kategori yang tidak dapat ditampilkan
di sini untuk kekurangan ruang. Mereka dapat meminta untuk penulis melalui
email. Dibuat menciap-bot tersedia online.

Kesimpulan-kesimpulan
Sebuah metodologi untuk mengembangkan secara otomatis sebuah AIML
menjawab chatter bot untuk telah ditunjukkan FAQ. Aplikasi mungkin dalam
e-learning dapat untuk fasilitator- negara interaksi dengan navigasi pengguna
atau pengguna melalui materi pengajaran melalui asisten digital manusia
melalui sebuah berbicara avatar. Misalnya, dalam sebuah tipikal sesi
pembelajaran jarak jauh isi modul belajar dapat summa- rized dalam sebuah
daftar istilah dan tanya jawab, siswa dapat menggunakan online bahan
pembelajaran dalam cara konvensional, tetapi dia juga dapat berinteraksi
dengan asisten digital, diimplementasikan melalui metodologi yang
disebutkan di atas, sehingga siswa dapat meminta teks bebas pertanyaan
tentang orang-orang isi, jika mereka dapat diungkapkan melalui sebuah
sistem pertanyaan dan jawaban.
Aplikasi lainnya dapat dikembangkan dalam robotics pribadi dan

Pseudo sistem bahasa alami yang perlu berinteraksi dalam multimodal cara
(Pirrone & Cannella, 2008).

Referensi
Pirrone R., Cannella V., R.G. (2008), Gaiml: Bahasa baru untuk verbal dan interaksi
grafis dalam chatbots. Dalam: Konferensi Internasional pada kompleks, cerdas,
dan Perangkat Lunak Sistem Intensif, 2008, 715-720.
Banyaknya Penulis (2009), entri Chatterbot. http://en.wikipedia.org/wiki/Chatterbot
(November 2009) Wikipedia.
1.0.1 AIML acuan (2005), http://www.alicebot.org/TR/2005/WD-aiml (2005),
Alice Kecerdasan Buatan Foundation.
Wallace R. (2009), Pandorabots mengumumkan ketersediaan bespoke pandorabots
spellbinder
service.
Halaman
Web
(Oktober
2009)
Pandorabots.com, http://pandorabots. com/pandora/pics/spellbinder/index.html.
P.I. Smid K. (2002), perbualan tentang karakter virtual untuk situs web. Dalam: Prosiding
Animasi komputer 2002, Jenewa, Swtizerland (2002) 240.
Wallace R. (2007), Pola AIML yang cocok dengan bahasa. http://www.alicebot.org/
Dokumentasi/yang cocok dengan.html (2007), Alice Kecerdasan Buatan
Foundation. Gelar B.A., Atwell Shawar E. R. A. (2008), Faqchat sebagai
pengambilan informasi sistem.
http://www.comp.leeds.ac.uk/andyr/research/papers/ltc05-f a q c h a t . p d f ( 2
0 0 8 ) FAQchat.
De
Gasperis
G.
(2009),
Bahasa Italia
contoh
dibuat
menciapbot. http://www.pandorabots. com/kotak Pandora/talk?botid=f0a3e607de36aa16
(2009) Host pada pandorabots.com.
Gzeldere G., Franchi S. (1995), dialog dengan personaliti berwarna-warni AI
awal. http://www.stanford.edu/group/SHR/4-2/text/dialogues.html (24 Juli 1995).

Anda mungkin juga menyukai