An Amygdala-Inspired Classical Conditioning Model Implemented On An FPGA For Home Service Robots
An Amygdala-Inspired Classical Conditioning Model Implemented On An FPGA For Home Service Robots
Diterima 27 Oktober 2020, diterima 8 November 2020, tanggal terbit 16 November 2020, tanggal versi terkini 8 Desember 2020.
Pengenal Objek Digital 10.1109/ ACCESS.2020.3038161
3Pusat Penelitian Perangkat Keras AI Neuromorfik, Institut Teknologi Kyushu, Fukuoka 808-0196, Jepang
ABSTRAK Penelitian ini mengembangkan sistem cerdas robot layanan rumah tangga yang meniru fungsi otak manusia yang dapat
mengelola pengetahuan umum yang dapat diterapkan pada lingkungan apa pun dan pengetahuan lokal yang mencerminkan
lingkungan spesifiknya. Pembelajaran mendalam efektif untuk memperoleh pengetahuan umum karena kinerja pembelajaran
mendalam bergantung pada jumlah pelatihan dan data pelatihan besar yang dapat diakses untuk pengetahuan tersebut; namun,
pembelajaran mendalam tidak efektif untuk memperoleh pengetahuan lokal karena tidak ada data pelatihan yang besar untuk
pengetahuan tersebut. Oleh karena itu, kami mengusulkan model dan sistem pembelajaran yang terinspirasi dari otak untuk
memperoleh pengetahuan lokal menggunakan data pelatihan kecil. Kami fokus pada amigdala karena pengkondisian rasa takut
klasiknya efektif untuk pelatihan menggunakan data pelatihan kecil. Kami mengusulkan model pengkondisian klasik yang terinspirasi
dari amigdala yang terdiri dari beberapa peta yang mengatur dirinya sendiri (inti lateral) dan jaringan saraf yang terhubung
sepenuhnya (inti pusat), meniru fungsi dan struktur amigdala. Model yang diusulkan diterapkan pada tugas robot pelayan di restoran,
dan model tersebut dapat mempelajari preferensi pelanggan hanya setelah beberapa interaksi manusia-robot. Kami mempercepat
komputasi model dan mengurangi konsumsi daya dengan mengusulkan algoritma berorientasi perangkat keras untuk model dan
desain perangkat keras digitalnya dan mengimplementasikannya dalam susunan gerbang yang dapat diprogram di lapangan
XCZU9EG. Algoritma yang berorientasi pada perangkat keras mengurangi operasi perkalian dan fungsi eksponensial yang
memerlukan sumber daya perangkat keras yang besar. Performa perangkat keras yang dioperasikan pada 150 MHz 1.273 kali lebih
cepat dibandingkan implementasi perangkat lunak pada Arm Cortex-A53, dan konsumsi daya chip sebesar 5,009 W.
ISTILAH INDEKS Amygdala, pengkondisian klasik, field programmable gate array (FPGA), perangkat keras, robot layanan rumah.
I. PENDAHULUAN sistem. Secara umum, robot layanan rumah harus memperoleh dua jenis
Baru-baru ini, karena populasi yang menua dan berkurangnya angkatan pengetahuan, yaitu pengetahuan umum, yang berlaku di semua lingkungan,
kerja, robot layanan rumah [1] telah menarik banyak perhatian. Robot dan pengetahuan lokal, yang hanya berlaku di lingkungan tertentu.
semacam itu harus mendukung ingatan manusia dan membantu
pengambilan keputusan manusia saat bekerja dan tinggal bersama Misalnya, untuk menanggapi permintaan pemilik untuk membawakan
pemiliknya di lingkungan rumah tangga; oleh karena itu, sistem cerdas ''teh hijau'', robot harus memiliki pengetahuan umum tentang apa itu ''teh
seperti otak diperlukan. Oleh karena itu, kami mengembangkan sistem hijau''. Pembelajaran mendalam (DL) [2] adalah alat yang ampuh untuk
yang meniru fungsi otak manusia. Penelitian ini berfokus pada fungsi memperoleh pengetahuan umum karena sejumlah besar data pelatihan
perolehan pengetahuan secara cerdas tentang pengetahuan umum dapat disiapkan. Pengenalan gambar adalah
contoh umum tugas yang memerlukan perolehan pengetahuan umum.
Editor rekanan yang mengoordinasikan peninjauan naskah ini dan Jaringan saraf dalam telah banyak digunakan dalam tugas pengenalan
menyetujuinya untuk diterbitkan adalah Yiming Huo . gambar
212066 Karya ini dilisensikan di bawah Lisensi Creative Commons Attribution 4.0. Untuk informasi lebih lanjut, lihat https://creativecommons.org/licenses/by/4.0/
JILID 8, 2020
Machine Translated by Google
Y. Tanaka dkk.: Model Pengkondisian Klasik Terinspirasi Amygdala yang Diimplementasikan pada FPGA untuk Robot Layanan Rumah
data pelatihan substansial tersedia untuk memberikan hasil yang canggih [3] – dengan pengkondisian rasa takut [9] – [13]. Pengkondisian rasa takut adalah sebuah tipe
[5]. Dengan demikian, penelitian sebelumnya telah mengusulkan pengkondisian klasik, yang terkenal dengan Pavlovian
penggunaan DL untuk robot layanan rumah [6]–[8]. anjing [15] di mana seekor anjing belajar dari pengalaman yang berulang-ulang; itu
Namun pengetahuan lokal secara kualitatif berbeda. Untuk anjing menerima makanan setiap kali ia mendengar suara bel,
Misalnya, jika pemilik meminta robot untuk membawa ''itu'', maka dan oleh karena itu, ia mengasosiasikan suara bel dengan makanan.
robot harus memahami arti lokal dari ''itu.'' DL berkinerja buruk dalam perolehan Pendekatan pengkondisian klasik efektif untuk memperoleh
pengetahuan lokal karena pengetahuan lokal dari pengalaman.
kinerjanya bergantung pada ukuran kumpulan data pelatihan,
dan kumpulan data pengetahuan lokal dalam jumlah besar tidak dapat diperoleh.
Sebaliknya, manusia dengan mudah memperoleh pengetahuan lokal
(misalnya, preferensi dan adat istiadat keluarga), yang memerlukan kontak
minimal dengan lingkungan untuk melakukannya. Demikian pula,
robot layanan rumah harus dapat dengan cepat mendapatkan lokal
pengetahuan hanya melalui sejumlah kecil manusia-robot
interaksi. Oleh karena itu, kami mengusulkan sistem yang terinspirasi dari otak itu
dapat memperoleh pengetahuan lokal, selain DL, dari beberapa orang
GAMBAR 1. Mekanisme pengkondisian rasa takut.
interaksi manusia-robot. Kami secara khusus fokus pada amigdala, yaitu area
otak yang berhubungan dengan klasik
pengondisian rasa takut [9]–[13], yang efektif untuk pelatihan Gambar 1 menunjukkan mekanisme pengkondisian rasa takut. Selama
sedikit data. pengkondisian rasa takut, masukan rangsangan sensorik diklasifikasikan sebagai salah satunya
Untuk membangun sistem cerdas menjadi robot layanan rumah, rangsangan tak terkondisi (AS) atau rangsangan terkondisi (CS). KITA
kita harus mempertimbangkan keterbatasan dan kekuatan komputasi menyebabkan tanggapan tanpa syarat, sedangkan CS netral dan
konsumsi. Dalam sistem robot servis rumah, bermacam-macam melewati berbagai area otak: thalamus, neocortex,
program perangkat lunak dijalankan secara bersamaan; dengan demikian, membongkar dan dan hipokampus. Rangsangan ini kemudian dimasukkan ke dalam suatu bagian
percepatan program efektif. Meskipun unit pemrosesan grafis (GPU) sering amigdala disebut nukleus lateral (LA) melalui dua
digunakan untuk mempercepat komputasi, unit tersebut cenderung memiliki jalur [11]. Salah satunya adalah jalur langsung dari thalamus
konsumsi daya yang tinggi, sangat parah. di mana informasi sensorik disampaikan dengan cepat, dan yang lainnya
mengganggu penggunaan robot layanan rumah, yang seharusnya hanya adalah jalur tidak langsung melalui korteks tempat informasi
menggunakan sedikit daya. Oleh karena itu, GPU modern tidak cocok untuk itu disampaikan secara perlahan. Pada jalur langsung, fitur rangsangan sensorik
robot layanan rumah. dimasukkan ke dalam LA. Pada jalur tidak langsung,
Kami menyediakan sistem dengan pemrosesan cepat dan daya rendah pengenalan objek, konsep, dan konteks dimasukkan ke dalamnya
konsumsi dengan merancang dan mengimplementasikan yang cerdas LA. Oleh karena itu, LA merupakan bagian yang mengintegrasikan CS dari
sistem menjadi array gerbang yang dapat diprogram lapangan (FPGA). Itu berbagai wilayah otak. Apalagi neuron yang bereaksi
perangkat keras pada FPGA berjalan pada frekuensi yang lebih rendah daripada perangkat lunak
rangsangan tertentu terletak berdekatan satu sama lain [11], [16]. Itu
pada unit pemrosesan pusat (CPU) dan GPU. Misalnya, LA mengkondisikan CS ke AS [17]. Setelah terintegrasi, rangsangan
jaringan saraf konvolusional [3] diimplementasikan pada FPGA dimasukkan ke dalam bagian amigdala yang disebut pusat
lebih cepat dan mengonsumsi daya lebih sedikit dibandingkan dengan yang inti (CE). Setelah pengkondisian, CE mengeluarkan respons terkondisi (CR)
diterapkan pada GPU tertanam [14]. Oleh karena itu, perangkat keras tersebut bahkan jika CS dimasukkan ke dalam amigdala
tanpa kami.
dapat mengimplementasikan sistem dengan pemrosesan cepat dan daya rendah
konsumsi. Singkatnya, proses pengkondisian rasa takut di
Dalam penelitian ini, kami mengusulkan model pengkondisian klasik amigdala melibatkan pengenalan stimulus sensorik dan pengkondisian CS ke
meniru struktur dan fungsi amigdala biologis. Selain itu, kami mengusulkan AS. Dalam pengenalan stimulus sensorik, CS adalah
implementasi integrasi skala besar (VLSI) dari model kami menggunakan diklasifikasikan berdasarkan fitur rangsangan tanpa sinyal yang diawasi. Oleh
FPGA. karena itu, amigdala dapat mengklasifikasikan hal-hal yang tidak diketahui
Makalah ini disusun sebagai berikut. Bagian II menjelaskan rangsangan sensorik menggunakan sistem pengenalan yang mengatur dirinya sendiri.
teori amigdala biologis dan studi terkait Dalam proses pengondisian, amigdala mempelajari hubungan-hubungan tersebut
model amigdala, dan Bagian III menjelaskan usulan model pengkondisian antara CS dan AS. Sebagai hasil dari proses tersebut, amigdala dapat
klasik kami dan implementasi perangkat kerasnya. Bagian IV menjelaskan memprediksi nilai emosional dari rangsangan sensorik yang ada
korteks. Model tersebut melakukan pengkondisian rasa takut antara input sederhana dibandingkan dengan tuntutan kompleks yang dibebankan pada
pendengaran sebagai CS dan AS. robot layanan rumah.
Morén dan Balkenius [19] mengusulkan model hubungan antara amigdala Rizzi dkk. [29], [30] mengusulkan model pembelajaran ketakutan sadar
dan korteks orbitofrontal yang mengontrol kepunahan [22]. Bagian korteks situasi (SAFEL). Untuk memprediksi situasi yang mengancam, model SAFEL
orbitofrontal dari model menghambat bagian amigdala dan dapat mencapai mempelajari apakah situasi tersebut bersifat permusuhan. Model ini terdiri dari
efek pemusnahan dalam pengondisian rasa takut. amigdala, hipokampus, dan modul memori kerja. Modul amigdala digunakan
sebagai pemicu untuk mempelajari situasi yang tidak menyenangkan; ia
Izhikevich [20] mengusulkan model neuron spiking untuk pengkondisian menerima stimulus dari lingkungan dan menilai apakah stimulus tersebut tidak
klasik dan instrumental. Model yang diimplementasikan oleh model neuron menyenangkan.
Izhikevich [23] menggunakan aturan pembelajaran plastisitas yang bergantung Jika modul amigdala menilai bahwa stimulus tersebut bersifat permusuhan,
pada waktu lonjakan yang dimodulasi oleh dopamin. Studi ini mensimulasikan modul tersebut mengeluarkan sinyal adrenalin ke dalam modul hipokampus
model yang terdiri dari 1.000 neuron dan mengungkapkan bahwa model yang menyangga rangsangan sensorik untuk menentukan apakah rangsangan
tersebut dapat memecahkan masalah imbalan distal [24] di mana imbalan yang disangga itu bersifat permusuhan. Ketika modul hipokampus menerima
diberikan setelah tindakan yang memicu imbalan. sinyal adrenalin dari modul amigdala, modul tersebut menganggap stimulus
rangkaian waktu (didefinisikan sebagai suatu situasi) tepat sebelum menerima
Li dkk. [21] mengusulkan model neuron spiking untuk perolehan dan sinyal adrenalin, sebagai situasi yang tidak menyenangkan. Situasi permusuhan
pemusnahan memori rasa takut. Model ini didasarkan pada neuron ketakutan, tersebut kemudian disimpan dalam modul memori kerja. Setelah itu, model
persisten, dan kepunahan di amigdala dan korteks prefrontal medial. Studi ini SAFEL dapat memprediksi situasi permusuhan dengan mengacu pada modul
menjelaskan bahwa jaringan yang melibatkan amigdala dan korteks prefrontal memori kerja. Dalam model ini, model amigdala diimplementasikan melalui
menunjukkan efek kepunahan penguatan parsial [25] – [27], di mana memori tipe FCNN. Estimasi permusuhan didasarkan pada pengondisian klasik dari
rasa takut yang diperoleh melalui pasangan parsial CS dan AS lebih tahan rangsangan permusuhan (seperti AS) dan rangsangan netral (seperti CS).
terhadap kepunahan dibandingkan yang diperoleh melalui pasangan penuh. Pengondisian klasik dilaksanakan dengan pembelajaran asosiatif. Meskipun
konsep modul amigdala didasarkan pada penelitian LeDoux, namun penelitian
ini tidak mempertimbangkan struktur amigdala yang ditunjukkan pada EMA
Meskipun penelitian-penelitian ini mengusulkan model ketakutan dan [28]; oleh karena itu, memprediksi ketidaksukaan dari rangsangan yang tidak
pengkondisian klasik, tujuan penelitian-penelitian ini berbeda dengan tujuan diketahui merupakan hal yang menantang. Selain itu, mereka tidak
penelitian kami. Mereka bertujuan untuk menerapkan model yang masuk akal mengimplementasikan model tersebut pada perangkat keras.
secara biologis, sedangkan kami bertujuan untuk mengembangkan sistem
akuisisi pengetahuan lokal untuk robot layanan rumah. Dari sudut pandang
aplikasi robot, kita memerlukan pengenalan stimulus sensorik, yang merupakan
proses penting dalam ketakutan dan pengondisian klasik. Selain itu, kita AKU AKU AKU. MODEL
harus mempertimbangkan biaya komputasi sistem karena sumber daya dan
YANG DIUSULKAN Dalam penelitian ini, untuk menerapkan sistem akuisisi
daya komputasi dalam sistem robot terbatas.
pengetahuan lokal pada robot layanan rumah, kami fokus pada konsep
amigdala di mana LA dan CE didasarkan pada pengkondisian klasik daripada
sepenuhnya meniru amigdala biologis. Kami mengikuti konsep EMA [28]
C. MODEL APLIKASI ROBOT
karena memiliki sistem pengenalan stimulus sensorik yang diterapkan oleh
Beberapa penelitian yang melibatkan model amigdala yang diterapkan pada
SOM yang dapat menerima beberapa jenis CS. Selain itu, kami memperluas
robot telah diusulkan [28] – [30]. Sonoh dkk. [28] mengusulkan model ekspresi
fungsi model untuk mengadaptasi tugas-tugas kompleks untuk robot layanan
emosional amigdala (EMA), yang terdiri dari peta pengorganisasian diri (SOM)
rumah.
[31] dan jaringan saraf yang terhubung sepenuhnya (FCNN). SOM merupakan
model LA, sedangkan FCNN merupakan model CE. Neuron di SOM dengan
vektor referensi serupa terletak di proksimal.
A.STRUKTUR
Fitur SOM dimaksudkan untuk meniru fitur LA. Eksperimen dengan EMA yang Kami mengusulkan model pengkondisian klasik yang diilhami oleh amigdala
diterapkan dalam FPGA mencapai perilaku pengkondisian klasik antara sinyal [32], [32]. Gambar 2 menunjukkan struktur model (sisi kanan gambar), yang
dari sensor warna (seperti CS) dan sinyal dari sensor sentuhan (seperti AS). terdiri dari beberapa SOM sebagai LA (dua SOM ditunjukkan pada Gambar 2)
dan FCNN sebagai CE.
Misalnya, ketika EMA secara bersamaan menerima ''merah'' dan ''tamparan'' Kami mengganti SOM tunggal EMA dengan beberapa SOM yang dapat
dari sensor, ia mengkondisikan rangsangan ini. dianggap sebagai lapisan jaringan SOM yang dalam [33].
Setelah pengkondisian, EMA mengeluarkan respons ''takut'' bahkan jika EMA Model secara bersamaan menerima AS dan beberapa CS.
menerima stimulus ''merah'' tanpa ''ditampar''. Model ini mencakup konsep CS ini dimasukkan ke dalam dan diklasifikasikan oleh SOM, dan hasil klasifikasi
amigdala di mana LA mengklasifikasikan rangsangan sensorik dan kemudian diubah sebagai vektor dan digabungkan.
mempelajari hubungan antara CS dan AS. Karena diperkenalkannya SOM bernama. Vektor-vektor tersebut kemudian dimasukkan ke dalam FCNN,
sebagai LA, model tersebut dapat memprediksi respons emosional, meskipun mempelajari hubungan antara US dan vektor-vektor tersebut (mode pelatihan).
model tersebut menerima CS yang tidak diketahui. Namun, tugasnya tetap ada Setelah itu, model mengeluarkan CR meskipun model hanya menerima CS
(mode inferensi).
2 2
hai,j = exp(ÿd /2ÿ prop), i,j (2)
2 2, (3)
di,j = (i ÿ ic) + (j ÿ jc)
GAMBAR 2. Model pengkondisian klasik dan bagian persepsi. kata lain, satu neuron pada posisi (i, j) di SOM mengeluarkan nilai skalar hi,j .
Variabel di,j adalah jarak dari neuron pemenang ke posisi
(i, j). Selain itu, ÿprop menunjukkan lebar fungsi Gaussian. Semua vektor
Sebagai uji kasus, kami menerapkan model tersebut pada robot yang
keluaran SOM digabungkan sebagai
bekerja di restoran. Untuk ini, kami menambahkan bagian persepsi untuk
interaksi manusia-robot (sisi kiri Gambar 2). Ketika robot menerima perintah, ia
mencoba mengambil informasi dari objek yang dipesan melalui bagian persepsi. H = {h1, . . . , hK }. (4)
Informasi objeknya adalah AS. Secara bersamaan, robot mengambil informasi Vektor gabungan H ÿ R M
(M = I × J × K) dimasukkan ke
tentang wajah pelanggan dan lokasi robot melalui bagian persepsi sebagai CS.
dalam FCNN. FCNN mengeluarkan vektor yang mewakili kemungkinan apa
Model mempelajari hubungan antara AS dan CS dalam mode pelatihan. Setelah
yang diinginkan pelanggan. Vektor keluaran FCNN, y ÿ R dihitung melalui
mode pelatihan ini, model dapat memprediksi apa yang diinginkan pelanggan L
persamaan berikut: ,
hanya dengan menggunakan CS dalam mode inferensi.
aku = f (H · v aku
), (5)
M
dimana yl adalah elemen dari vektor keluaran y. vl ÿ R vektor bobot adalah a
B.ALGORITMA (9)
Pada penelitian ini keluaran dari bagian persepsi dimasukkan ke dalam model
di mana tl adalah sinyal yang diawasi. Dengan kata lain, tl adalah elemen dari
LA dan CE pada perangkat keras. L
vektor AS, t ÿ R . ÿ adalah kecepatan pembelajaran.
Mode inferensi diterapkan seperti yang dijelaskan di sini. (k = 1, . . . ,K)
N
Jika beberapa vektor CS xk ÿ R dengan diberikan, C. ALGORITMA BERORIENTASI PERANGKAT KERAS
K adalah bilangan CS (K = 2 dalam kasus model pengkondisian klasik yang
Untuk mengimplementasikan model pengkondisian klasik ke dalam FPGA,
ditunjukkan pada Gambar 2) dan N adalah dimensi vektor, maka CS dimasukkan
diperlukan algoritma berorientasi perangkat keras yang mengurangi sumber
ke dalam SOM. Modul LA ini terdiri dari K SOM. Jadi, xk dimasukkan ke dalam
k daya perangkat keras karena terbatasnya sumber daya FPGA.
SOM. Di setiap SOM, neuron pemenang dengan vektor referensi yang paling
Secara khusus, pengurangan operasi perkalian algoritma diperlukan karena
mirip dengan vektor masukan dipilih berdasarkan persamaan berikut:
terbatasnya pengali dalam irisan FPGA (digital signal processor (DSP)). Dalam
kasus FPGA XCZU9EG [34], perangkat target dalam penelitian ini, terdapat
2.520 irisan DSP, 274.080 tabel pencarian (LUT), dan 548.160 flip flop (FF).
(ic, jc) = arg min i,j xkÿ wi ,j, (1) Selain itu, fungsi eksponensial harus dihindari karena memerlukan sumber
daya perangkat keras yang besar. Di sini, kami mengembangkan yang
N
dimana wi,j ÿ R adalah salah satu vektor referensi SOM. berorientasi pada perangkat keras
Neuron di setiap SOM terletak pada dua dimensi
dalam unit pembaruan untuk menghitung vektor bobot yang diperbarui. Hasil
komputasi unit pembaruan disimpan dalam RAM untuk vektor bobot.
IV. EKSPERIMEN
A. PREFERENSI BELAJAR DARI
GAMBAR 11. Perangkat keras unit pohon penambah. BEBERAPA INTERAKSI MANUSIA-ROBOT
Kami memverifikasi bahwa model pengkondisian klasik yang
Gambar 11 menunjukkan unit pohon penambah. Unit pohon diusulkan dapat mempelajari preferensi pelanggan melalui beberapa
penambah mencakup register M(= I × J × K) dan M 2 penambah. interaksi manusia-robot. Kami menerapkan model pada robot layanan
Setiap penambah menerima dua nilai dan menghasilkan keluaran rumah (TOYOTA HSR [7], [35]) untuk percobaan ini. Bagian persepsi
penjumlahan kedua nilai tersebut. Output dari penambah dihubungkan model diimplementasikan melalui Web Speech API [36] sebagai
ke paruh pertama register. Untuk menghitung operasi tambahan dari pengenalan suara, YOLOv2 [37] sebagai pengenalan visual objek,
semua nilai yang disimpan dalam register, pertama-tama, register dan lokalisasi dan pemetaan simultan sebagai deteksi tempat.
diinisialisasi dengan keluaran dari unit operasi perkalian. Dengan menggunakan kamera dan telepon mikro yang terpasang
Kemudian, perhitungan menggunakan penambah diulangi log2 M pada robot, model tersebut mengambil CS dan US (Gbr. 13). Kami
kali. Perhatikan bahwa jumlah keluaran dari satuan operasi perkalian menyiapkan dua jenis vektor untuk setiap CS, yaitu gambar wajah
M harus pangkat dua; jika tidak, register dummy diinisialisasi dengan (saluran RGB 64 × 64 piksel) yang mewakili pelanggan A dan B dan
nol dan penambah dummy dua vektor (tiga dimensi).
Gambar 14 menunjukkan probabilitas objek yang diperkirakan oleh TABEL 2. Pemanfaatan logika perangkat keras yang diusulkan.
model dari situasi selama interaksi manusia-robot.
Dalam setiap situasi baru, tiga atau empat interaksi diperlukan oleh model
untuk mendukung objek yang terurut dengan benar, yang menunjukkan
kemampuan model untuk beradaptasi dengan situasi baru hanya melalui
beberapa interaksi manusia-robot.
Selain itu, untuk memverifikasi performa generalisasi model, kami
menyiapkan 1.000 gambar wajah per pelanggan yang mewakili wajah
yang diambil dari berbagai arah, yang dibagi menjadi 750 gambar untuk Selanjutnya, kami memverifikasi efek dari algoritma berorientasi
pelatihan dan 250 gambar untuk validasi. Pada interaksi manusia-robot perangkat keras yang diusulkan dengan merancang dan mensintesis
dalam mode pelatihan, sebuah gambar dipilih secara acak dari 750 gambar fungsi perangkat keras menggunakan algoritma asli dari model dan
pelatihan. Gambar dan vektor yang mewakili tempat dimasukkan ke dalam bilangan floating-point. Kami merancang dua jenis implementasi perangkat
model. Setelah setiap interaksi, kami memasukkan 250 gambar validasi keras: implementasi sekuensial dan paralel. Dalam implementasi
dan menempatkan vektor situasi ke dalam model untuk memverifikasi sekuensial, komputasi perangkat keras dieksekusi secara berurutan.
tingkat akurasinya sehubungan dengan gambar validasi. Gambar 15 Dalam implementasi paralel, komputasi perangkat keras dijalankan secara
menunjukkan tingkat akurasi paralel. Kami menetapkan frekuensi clock 150 MHz di kedua implementasi.
Setelah pra-pelatihan, kami menjalankan tes pengkondisian klasik pada TABEL 6. Perkiraan kekuatan chip.
Untuk Arm Cortex-A53 dan Intel Core i5, kami mengimplementasikan model
pengkondisian klasik menggunakan C++. Untuk CPU di Jet-son TX2, kami
mengimplementasikannya menggunakan Python dan NumPy [40].
Selain itu, kami mengganti komputasi model oleh NumPy dengan komputasi
oleh CuPy [41] untuk mengeksekusinya pada GPU di Jetson TX2. Kami
menetapkan mode Jetson TX2 sebagai Max-N di mana semua inti di Jetson
TX2 tersedia. Tabel 4 menunjukkan rata-rata waktu eksekusi perangkat
lunak, dan Tabel 5 menunjukkan rata-rata waktu eksekusi perangkat keras.
Seperti yang ditunjukkan dalam tabel ini, perangkat keras lebih cepat
daripada perangkat lunak bahkan pada GPU. Waktu eksekusi perangkat
GAMBAR 19. Hasil pengukuran implementasi FPGA: Tingkat akurasi model keras termasuk waktu transfer data. Kami mengukur waktu eksekusi logika
pengkondisian klasik sehubungan dengan gambar validasi selama interaksi
manusia-robot. model saja, dengan mengimplementasikan fungsi perangkat keras yang
tidak menghitung apa pun kecuali menerima CS tiruan dan mengembalikan
Selain itu, untuk memverifikasi kinerja generalisasi perangkat keras CR tiruan. Kami mengukur waktu eksekusi perangkat keras kosong, yang
yang diusulkan, kami menggunakan uji generalisasi yang sesuai dengan diukur ketika frekuensi clock untuk transfer data dioperasikan pada 150
pengujian pada eksperimen A. Gambar 19 menunjukkan tingkat akurasi MHz.
model sehubungan dengan validasi
TABEL 7. Perbandingan penelitian sebelumnya tentang model amigdala untuk aplikasi robot.
Kami mengukur konsumsi daya perangkat keras (baik seluruh perangkat (Gbr. 16) dan pelajari kombinasi US dan CS dengan beberapa iterasi pelatihan
keras maupun perangkat keras kosong). Tabel 6 menunjukkan kekuatan chip (Gbr. 18).
yang diperkirakan oleh Vivado. Seperti yang ditunjukkan dalam tabel, FPGA, Meskipun Xilinx Vitis AI [42] dapat mengimplementasikan model berbasis
termasuk perangkat keras yang diusulkan, mengonsumsi 5,009 W. kerangka DL, seperti Keras, TensorFlow, dan Caffe, ke dalam FPGA yang
menggantikan variabel floating-point dengan variabel fixed-point, algoritma
berorientasi perangkat keras yang kami usulkan lebih efektif dalam
mengimplementasikan modelkan ke dalam FPGA karena mengganti operasi
V. PEMBAHASAN A.
perkalian dan fungsi eksponensial dengan operasi bit-shift secara drastis
MODEL
mengurangi sumber daya perangkat keras. Vitis AI tidak dapat mencapai
Tabel 7 menunjukkan perbandingan penelitian sebelumnya mengenai model algoritma yang efektif.
amigdala untuk aplikasi robot. Dibandingkan dengan EMA [28], model yang
diusulkan dapat diterapkan pada tugas yang lebih kompleks. EMA mengambil Karena kami menggunakan SOM dengan neuron 8 × 8 dalam penelitian ini,
informasi tunggal dari lingkungan untuk CS; oleh karena itu, pendekatan ini penggunaan variabel titik tetap delapan bit sudah cukup untuk menghitung
tidak dapat menangani kombinasi berbagai faktor dalam lingkungan. Selain algoritma SOM dan menyelesaikan tugas. Selain itu, meskipun perangkat keras
itu, EMA tidak dapat digunakan jika faktor-faktor yang berhubungan dengan SOM dengan lebih banyak neuron diperlukan dalam beberapa tugas, kita
AS tidak diketahui. Namun, model kami mengambil informasi penting dari dapat dengan mudah mengubah lebar bit semua variabel untuk beradaptasi
lingkungan untuk CS. Oleh karena itu, model kita dapat menangani kombinasi dengan tugas lain karena perangkat keras tersebut memiliki parameter.
faktor-faktor dalam lingkungan, artinya model kita dapat digunakan meskipun Tabel 4 dan 5 menunjukkan bahwa perangkat keras yang diusulkan
kita tidak mengetahui faktor mana yang berhubungan dengan AS. dioperasikan pada 150 MHz adalah 1.273 kali, 111.4 kali, 214.3 kali, dan 94.73
kali lebih cepat dibandingkan perangkat lunak yang dijalankan pada Arm
Cortex-A53, Intel Core i5 4670K, CPU Jetson TX2, dan GPU Jetson TX2,
Dibandingkan dengan model amigdala di SAFEL [29], [30], model yang masing-masing. Temuan ini mengungkapkan bahwa komputasi perangkat
kami usulkan lebih berguna untuk aplikasi robot karena mencakup fungsi LA, keras yang diusulkan lebih efektif dibandingkan perangkat lunak, bahkan pada
CE, dan bagian persepsi. GPU. Selain itu, SDSoC memperkirakan latensi mode pelatihan pada perangkat
Dengan memperkenalkan model LA, model kami dapat menerima rangsangan keras sebesar 15.395 CLK. Dengan demikian, waktu eksekusi ideal perangkat
yang tidak diketahui. Misalnya, model terlebih dahulu mempelajari situasi di keras tanpa transfer data adalah 6,67 ns/CLK × 15,395 CLK = 102,6 µs.
mana pelanggan laki-laki muda dan pelanggan perempuan tua muncul. Ketika Selain itu Tabel 5 juga menunjukkan bahwa waktu eksekusi logika adalah
pelanggan wanita muda muncul, neuron yang terletak di antara neuron pria 197.4 µs - 90.7 µs = 106.7 µs jika waktu transfer data diabaikan.
muda dan neuron wanita tua akan bereaksi. Misalkan ada hubungan antara
usia, jenis kelamin, dan preferensi, model kami dapat memperkirakan preferensi
pelanggan yang tidak diketahui.
VI. KESIMPULAN
memerlukan 4.718.592 operasi perkalian. Oleh karena itu, algoritma yang disederhanakan digunakan untuk implementasinya.
diusulkan efektif untuk mengurangi sumber daya perangkat keras (Tabel 3).
Selain itu, meskipun perangkat keras diimplementasikan menggunakan
algoritma berorientasi perangkat keras yang disederhanakan, perangkat keras Dalam penelitian selanjutnya, kami bertujuan untuk mengintegrasikan model
model dapat mengatur sendiri vektor referensi modul LA. yang terinspirasi dari amigdala dengan model lain yang terinspirasi dari otak.
Model yang diusulkan telah diintegrasikan dengan bagian persepsi, yang
disebut sebagai model neokorteks. Selanjutnya dengan mengenalkan hippocampus
dan model korteks entorhinal dan mengintegrasikannya dengan model, fungsi [21] Y. Li, K. Nakae, S. Ishii, dan H. Naoki, ''Kepunahan memori ketakutan yang bergantung
pada ketidakpastian dalam model sirkuit saraf amigdala-mPFC,'' PLOS Comput. Biol.,
memori episodik menggunakan representasi tempat dan waktu dapat
jilid. 12, tidak. 9 September 2016, Pasal. TIDAK. e1005099.
diwujudkan. [22] ET Rolls, ''Sebuah teori emosi dan kesadaran, dan penerapannya untuk memahami dasar
saraf emosi,'' dalam The Cognitive Neuro-sciences, 1995, hlm. 1091–1106.
UCAPAN TERIMA KASIH
Artikel ini didasarkan pada hasil yang diperoleh dari proyek yang ditugaskan [23] EM Izhikevich, ''Model sederhana dari neuron spiking,'' IEEE Trans. saraf
Jaringan, jilid. 14, tidak. 6, hlm. 1569–1572, November 2003.
oleh Organisasi Pengembangan Teknologi Industri dan Energi Baru (NEDO).
[24] CL Hull, Prinsip Perilaku: Pengantar Teori Perilaku.
New York, NY, AS: D. Appleton-Century, 1943.
[25] DW Leonard, ''Efek penguatan parsial dalam pengkondisian permusuhan klasik pada
REFERENSI kelinci dan manusia.,'' J. Fisiol Komparatif. Psikologi., jilid. 88, tidak. 2, hal.596–608,
[1] L. Iocchi, D. Holz, J. Ruiz-del-Solar, K. Sugiura, dan T. van der Zant, ''RoboCuphome: 1975.
Analisis dan hasil kompetisi yang berkembang untuk robot domestik dan layanan,'' Artif. [26] RA Rescorla, ''Penguatan parsial mengurangi perubahan asosiatif yang dihasilkan oleh
Intell., jilid. 229, hlm. 258–281, Desember 2015. [Online]. Tersedia: http:// nonpenguatan,'' J. Experim. Psikologi. Perilaku Hewan. Proses, vol. 25, tidak. 4, hal.
www.sciencedirect. com/science/article/pii/S0004370215001174 [2] GE Hinton, S. 403–414, 1999.
Osindero, dan Y.-W. Teh, ''Algoritme pembelajaran [27] NJ Mackintosh, Psikologi Pembelajaran Hewan. New York, NY,
cepat untuk jaring keyakinan yang mendalam,'' Neural Comput., vol. 18, tidak. 7, hlm. 1527– AS: Akademik, 1974.
1554, Juli 2006. [28] S. Sonoh, K. Horio, S. Aou, dan T. Yamakawa, ''Model ekspresi emosional yang terinspirasi
[3] Y. Lecun, L. Bottou, Y. Bengio, dan P. Haffner, ''Pembelajaran berbasis gradien diterapkan oleh amigdala,'' Int. J.Inovasi. Komputasi, Inf. Kontrol, jilid. 5, hlm. 1147–1160, Mei 2009.
pada pengenalan dokumen,'' Proc. IEEE, jilid. 86, tidak. 11, hal.2278–2324, 1998.
[29] C. Rizzi Raymundo dan CG Johnson, ''Mekanisme plastisitas sinaptik buatan untuk
[4] A. Krizhevsky, I. Sutskever, dan GE Hinton, ''Klasifikasi ImageNet dengan jaringan saraf pengkondisian klasik dengan jaringan saraf,'' dalam Kemajuan dalam Jaringan Syaraf
konvolusional dalam,'' di Proc. NIPS, jilid. 1, 2012, hlm.1097–1105. Tiruan—ISNN, vol. 8866. Cham, Swiss: Springer, 2014, hlm.213–221.
[5] J. Redmon dan A. Angelova, ''Deteksi genggaman waktu nyata menggunakan jaringan [30] C. Rizzi Raymundo, CG Johnson, dan PA Vargas, ''Ketakutan belajar untuk pengambilan
saraf konvolu-sional,'' di Proc. IEEE Int. Konf. Robot. Otomatis. (ICRA), Mei 2015, hlm. keputusan yang fleksibel di robocup: Sebuah diskusi,'' di Piala Dunia Robot.
1316–1322. Cham, Swiss: Springer, 2017.
[6] S. Hori, Y. Ishida, Y. Kiyama, Y. Tanaka, Y. Kuroda, M. Hisano, Y. Imamura, T. Himaki, Y. [31] T. Kohonen, ''Pembentukan peta fitur topologi yang benar secara mandiri,'' Biol. Cybern., jilid.
Yoshimoto, Y. Aratani, K. Hashimoto, G. Iwamoto , H. Fujita, T. Morie, dan H. Tamukoh, 43, tidak. 1, hal.59–69, 1982, doi: 10.1007/BF00337288.
''Makalah deskripsi tim Hibikino-MusashiHome 2017,'' 2017, arXiv:1711.05457.
[32] Y. Tanaka dan H. Tamukoh, ''Implementasi perangkat keras model amigdala yang
[On line]. Tersedia: http://arxiv.org/abs/1711.05457 terinspirasi otak,'' di Proc. IEEE Int. Gejala. Sistem Sirkuit. (ISCAS), Mei 2019, hlm.1–5.
[7] T. Ono, Y. Tanaka, Y. Ishida, Y. Abe, K. Kanamaru, D. Kamimura, K. Nakamura, Y.
Nishimura, S. Tokuno, Y. Mii, M. Yamauchi, Y. Uemura , T. Hashimoto, Y. Nakamura, I. [33] T. Shinozaki, ''Pembelajaran terawasi umpan depan yang terinspirasi secara biologis untuk
Uchino, D. Kanaoka, T. Hanyu, K. Tsukamoto, T. Morie, dan H. Tamukoh, ''Makalah jaringan peta yang mengatur dirinya sendiri secara mendalam,'' di Proc. Lokakarya NIPS Mewakili.
deskripsi tim Hibikino-MusashiHome 2020,'' 2020, arXiv: 2005.14451. [On line]. Tersedia: Mempelajari. Artif. biologi. Jaringan Syaraf. (MLINI), 2016, hlm.1–7.
http://arxiv.org/abs/2005.14451 [8] Y. Ishida dan H. Tamukoh, ''Pembuatan kumpulan [34] Zynq UltraScale+ MPSoC. Diakses: 26 Oktober 2020. [Online]. Tersedia: https://
data semi-otomatis untuk deteksi dan www.xilinx.com/products/silicon-devices/soc/zynq-ultrascale-mpsoc.html
pengenalan objek serta evaluasinya pada robot layanan domestik,'' J. Robot. Mechtron., jilid.
32, tidak. 1, hlm.245–253, Februari 2020. [35] T. Yamamoto, K. Terada, A. Ochiai, F. Saito, Y. Asahara, dan K. Murase, ''Pengembangan
robot pendukung manusia sebagai platform penelitian manipulator seluler domestik,''
[9] L. Weiskrantz, ''Perubahan perilaku terkait dengan ablasi kompleks amyg-daloid pada ROBOMECH J. , jilid. 6, tidak. 1 Desember 2019.
monyet.,'' J. Comparative Physiol. Psikologi., jilid. 49, tidak. 4, hal.381–391, 1956. [36] G. Shires dan H. Wennborg, ''Spesifikasi API ucapan web,'' Grup Komunitas W3C,
Laporan Akhir, 2012.
[10] JE LeDoux, Otak Emosional: Dasar Misterius Kehidupan Emosional. New York, NY, AS: [37] J. Redmon dan A. Farhadi, ''YOLO9000: Lebih baik, lebih cepat, lebih kuat,'' di Proc.
Simon dan Schuster, 1996. Konferensi IEEE. Hitung. Vis. Pengenalan Pola. (CVPR), Juli 2017, hlm.6517–6525.
[11] JP Aggleton, Amygdala: Analisis Fungsional. Oxford, Inggris: Universitas Oxford. Pers,
2000. [38] Lingkungan Pengembangan SDSoC. Diakses: 26 Oktober 2020. [Online].
[12] ET Rolls, Penjelasan Emosi. Oxford, Inggris: Universitas Oxford. Pers, 2005. Tersedia: https://www.xilinx.com/products/design-tools/software-zone/sdsoc.html
[13] EA Phelps dan JE LeDoux, ''Kontribusi amigdala terhadap pemrosesan emosi: Dari model
hewan hingga perilaku manusia,'' Neuron, vol. 48, tidak. 2, hlm. 175–187, Oktober 2005. [39] Sintesis Tingkat Tinggi Vivado. Diakses: 26 Oktober 2020. [Online]. Tersedia: https://
www.xilinx.com/products/design-tools/vivado/integration/esl-design.html [40] TE Oliphant,
[14] H. Nakahara, H. Yonekawa, T. Fujii, M. Shimoda, dan S. Sato, ''GUIN-NESS: Kerangka kerja A Guide to NumPy,
jaringan saraf dalam binerisasi berbasis GUI untuk pemrogram perangkat lunak,'' IEICE vol. 1. New York, NY, AS: Trelgol Publishing, 2006.
Trans. Inf. Sistem., jilid. E102.D, tidak. 5, hal.1003–1011, 2019.
[41] R. Okuta, Y. Unno, D. Nishino, S. Hido, dan C. Loomis, ''Cupy: Pustaka yang kompatibel
[15] IP Pavlov, Refleks Terkondisi: Investigasi Aktivitas Fisiologis Korteks Serebral. Oxford, dengan numpy untuk perhitungan GPU nvidia,'' di Proc. Sistem ML. Bengkel NIPS,
Inggris: Universitas Oxford. Pers, 1927. 2017, hal. 151.
[16] J. LeDoux, C. Farb, dan D. Ruggiero, ''Organisasi topografi neuron di thalamus akustik [42] Vitis AI. Diakses: 26 Oktober 2020. [Online]. Tersedia: https://www. xilinx.com/products/
yang memproyeksikan ke amigdala,'' J. Neurosci., vol. 10, tidak. 4, hlm. 1043–1054, design-tools/vitis/vitis-ai.html
April 1990.
[17] E. Tsvetkov, WA Carlezon, FM Benes, ER Kandel, dan VY Bolshakov, ''Pengkondisian
rasa takut menghalangi peningkatan transmisi sinaptik prasinaptik yang diinduksi LTP
di jalur kortikal ke amigdala lateral,'' Neuron, vol. 34, tidak. 2, hlm. 289–300, April 2002.
YUICHIRO TANAKA (Anggota Mahasiswa Pascasarjana,
IEEE) menerima gelar BE dan ME dari Institut Teknologi
[18] JL Armony, D. Servan-Schreiber, JD Cohen, dan JE LeDoux, ''Model jaringan saraf
pengondisian rasa takut yang dibatasi secara anatomis.,'' Perilaku. Ilmu Saraf, jilid. Kyushu, masing-masing pada tahun 2016 dan 2018, di mana
109, tidak. 2, hal.246–257, 1995. ia saat ini sedang mengejar gelar Ph.D. gelar dengan Sekolah
[19] J. Morén dan C. Balkenius, ''Model komputasi pembelajaran emosional di amigdala,'' Pascasarjana Ilmu Hayati dan Teknik Sistem. Sejak 2019, ia
dalam Proc. Hewan Animat, Int ke-6. Konf. Simulasi Beradaptasi. Perilaku, 2000, juga menjadi Research Fellow di Japan Society for the
hlm.115–124. Promotion of Science (JSPS). Ia juga merupakan Anggota
[20] EM Izhikevich, ''Memecahkan masalah penghargaan distal melalui hubungan STDP dan Mahasiswa IEICE.
sinyal dopamin,'' Cerebral Cortex, vol. 17, tidak. 10, hlm. 2443–2452, Oktober 2007.
TAKASHI MORIE (Anggota, IEEE) menerima gelar BS dan HAKARU TAMUKOH (Anggota, IEEE) menerima gelar B.Eng.
MS di bidang fisika dari Universitas Osaka, Osaka, Jepang, gelar dari Miyazaki University, Jepang, pada tahun 2001, dan
masing-masing pada tahun 1979 dan 1981, dan Dr.Eng. gelar M.Eng. dan Ph.D. gelar dari Kyushu Institute of Technology,
dari Hokkaido University, Sapporo, Jepang, pada tahun 1996. Jepang, masing-masing pada tahun 2003 dan 2006. Beliau
adalah Peneliti Pasca-doktoral di Pusat Program Unggulan
Dari tahun 1981 hingga 1997, beliau menjadi anggota Staf Abad 21, Institut Teknologi Kyushu, dari April 2006 hingga
Peneliti di Nippon Telegraph and Tele-phone Corporation September 2007.
(NTT). Dari tahun 1997 hingga 2002, beliau menjadi Associate
Professor di Departemen Teknik Elektro, Universitas Beliau menjabat sebagai Asisten Profesor di Universitas
Hiroshima, Higashihiroshima, Jepang. Sejak tahun 2002, Pertanian dan Teknologi Tokyo dari Oktober 2007 hingga
beliau menjadi Profesor di Graduate School of Life Science and Systems Engineering, Kyushu Januari 2013. Saat ini beliau menjabat sebagai Associate Professor di Sekolah Pascasarjana
Institute of Technology, Kitakyushu, Jepang. Minat penelitiannya mencakup implementasi Ilmu Hayati dan Rekayasa Sistem, Institut Teknologi Kyushu. Minat penelitiannya meliputi
VLSI pada jaringan saraf dan perangkat nano fungsional baru. sistem kompleks perangkat keras/perangkat lunak, desain perangkat keras digital, jaringan
saraf, komputasi lunak, dan robot layanan rumah. Ia juga anggota IEICE, SOFT, JNNS, JSAI,
dan RSJ.