An Amygdala-Inspired Classical Conditioning Model Implemented On An FPGA For Home Service Robots

Machine Translated by Google
Diterima 27 Oktober 2020, diterima 8 November 2020, tanggal terbit 16 November 2020, tanggal versi terkini 8 Desember 2020.
Pengenal Objek Digital 10.1109/ ACCESS.2020.3038161
Pengkondisian Klasik yang Terinspirasi Amygdala

Model Diimplementasikan pada FPGA untuk
Robot Layanan Rumah
YUICHIRO TANAKA 1,2, (Anggota Mahasiswa Pascasarjana, IEEE),

TAKASHI MORIE 1,3, (Anggota, IEEE), DAN
HAKARU TAMUKOH 1,3, (Anggota, IEEE)
1Sekolah Pascasarjana Ilmu Hayati dan Rekayasa Sistem, Institut Teknologi Kyushu, Fukuoka 808-0196, Jepang
2 Masyarakat Jepang untuk Promosi Ilmu Pengetahuan, Tokyo 102-0083, Jepang
3Pusat Penelitian Perangkat Keras AI Neuromorfik, Institut Teknologi Kyushu, Fukuoka 808-0196, Jepang
Penulis koresponden: Yuichiro Tanaka (tanaka.yuichiro483@mail.kyutech.jp)
Pekerjaan ini didukung oleh JSPS KAKENHI di bawah Hibah 19J11524.
ABSTRAK Penelitian ini mengembangkan sistem cerdas robot layanan rumah tangga yang meniru fungsi otak manusia yang dapat
mengelola pengetahuan umum yang dapat diterapkan pada lingkungan apa pun dan pengetahuan lokal yang mencerminkan
lingkungan spesifiknya. Pembelajaran mendalam efektif untuk memperoleh pengetahuan umum karena kinerja pembelajaran
mendalam bergantung pada jumlah pelatihan dan data pelatihan besar yang dapat diakses untuk pengetahuan tersebut; namun,
pembelajaran mendalam tidak efektif untuk memperoleh pengetahuan lokal karena tidak ada data pelatihan yang besar untuk
pengetahuan tersebut. Oleh karena itu, kami mengusulkan model dan sistem pembelajaran yang terinspirasi dari otak untuk
memperoleh pengetahuan lokal menggunakan data pelatihan kecil. Kami fokus pada amigdala karena pengkondisian rasa takut
klasiknya efektif untuk pelatihan menggunakan data pelatihan kecil. Kami mengusulkan model pengkondisian klasik yang terinspirasi
dari amigdala yang terdiri dari beberapa peta yang mengatur dirinya sendiri (inti lateral) dan jaringan saraf yang terhubung
sepenuhnya (inti pusat), meniru fungsi dan struktur amigdala. Model yang diusulkan diterapkan pada tugas robot pelayan di restoran,
dan model tersebut dapat mempelajari preferensi pelanggan hanya setelah beberapa interaksi manusia-robot. Kami mempercepat
komputasi model dan mengurangi konsumsi daya dengan mengusulkan algoritma berorientasi perangkat keras untuk model dan
desain perangkat keras digitalnya dan mengimplementasikannya dalam susunan gerbang yang dapat diprogram di lapangan
XCZU9EG. Algoritma yang berorientasi pada perangkat keras mengurangi operasi perkalian dan fungsi eksponensial yang
memerlukan sumber daya perangkat keras yang besar. Performa perangkat keras yang dioperasikan pada 150 MHz 1.273 kali lebih
cepat dibandingkan implementasi perangkat lunak pada Arm Cortex-A53, dan konsumsi daya chip sebesar 5,009 W.
ISTILAH INDEKS Amygdala, pengkondisian klasik, field programmable gate array (FPGA), perangkat keras, robot layanan rumah.
I. PENDAHULUAN sistem. Secara umum, robot layanan rumah harus memperoleh dua jenis
Baru-baru ini, karena populasi yang menua dan berkurangnya angkatan pengetahuan, yaitu pengetahuan umum, yang berlaku di semua lingkungan,
kerja, robot layanan rumah [1] telah menarik banyak perhatian. Robot dan pengetahuan lokal, yang hanya berlaku di lingkungan tertentu.
semacam itu harus mendukung ingatan manusia dan membantu
pengambilan keputusan manusia saat bekerja dan tinggal bersama Misalnya, untuk menanggapi permintaan pemilik untuk membawakan
pemiliknya di lingkungan rumah tangga; oleh karena itu, sistem cerdas ''teh hijau'', robot harus memiliki pengetahuan umum tentang apa itu ''teh
seperti otak diperlukan. Oleh karena itu, kami mengembangkan sistem hijau''. Pembelajaran mendalam (DL) [2] adalah alat yang ampuh untuk
yang meniru fungsi otak manusia. Penelitian ini berfokus pada fungsi memperoleh pengetahuan umum karena sejumlah besar data pelatihan
perolehan pengetahuan secara cerdas tentang pengetahuan umum dapat disiapkan. Pengenalan gambar adalah
contoh umum tugas yang memerlukan perolehan pengetahuan umum.
Editor rekanan yang mengoordinasikan peninjauan naskah ini dan Jaringan saraf dalam telah banyak digunakan dalam tugas pengenalan
menyetujuinya untuk diterbitkan adalah Yiming Huo . gambar
212066 Karya ini dilisensikan di bawah Lisensi Creative Commons Attribution 4.0. Untuk informasi lebih lanjut, lihat https://creativecommons.org/licenses/by/4.0/
JILID 8, 2020
Y. Tanaka dkk.: Model Pengkondisian Klasik Terinspirasi Amygdala yang Diimplementasikan pada FPGA untuk Robot Layanan Rumah
data pelatihan substansial tersedia untuk memberikan hasil yang canggih [3] – dengan pengkondisian rasa takut [9] – [13]. Pengkondisian rasa takut adalah sebuah tipe
[5]. Dengan demikian, penelitian sebelumnya telah mengusulkan pengkondisian klasik, yang terkenal dengan Pavlovian
penggunaan DL untuk robot layanan rumah [6]–[8]. anjing [15] di mana seekor anjing belajar dari pengalaman yang berulang-ulang; itu
Namun pengetahuan lokal secara kualitatif berbeda. Untuk anjing menerima makanan setiap kali ia mendengar suara bel,
Misalnya, jika pemilik meminta robot untuk membawa ''itu'', maka dan oleh karena itu, ia mengasosiasikan suara bel dengan makanan.
robot harus memahami arti lokal dari ''itu.'' DL berkinerja buruk dalam perolehan Pendekatan pengkondisian klasik efektif untuk memperoleh
pengetahuan lokal karena pengetahuan lokal dari pengalaman.
kinerjanya bergantung pada ukuran kumpulan data pelatihan,
dan kumpulan data pengetahuan lokal dalam jumlah besar tidak dapat diperoleh.
Sebaliknya, manusia dengan mudah memperoleh pengetahuan lokal
(misalnya, preferensi dan adat istiadat keluarga), yang memerlukan kontak
minimal dengan lingkungan untuk melakukannya. Demikian pula,
robot layanan rumah harus dapat dengan cepat mendapatkan lokal
pengetahuan hanya melalui sejumlah kecil manusia-robot
interaksi. Oleh karena itu, kami mengusulkan sistem yang terinspirasi dari otak itu
dapat memperoleh pengetahuan lokal, selain DL, dari beberapa orang
GAMBAR 1. Mekanisme pengkondisian rasa takut.
interaksi manusia-robot. Kami secara khusus fokus pada amigdala, yaitu area
otak yang berhubungan dengan klasik
pengondisian rasa takut [9]–[13], yang efektif untuk pelatihan Gambar 1 menunjukkan mekanisme pengkondisian rasa takut. Selama
sedikit data. pengkondisian rasa takut, masukan rangsangan sensorik diklasifikasikan sebagai salah satunya
Untuk membangun sistem cerdas menjadi robot layanan rumah, rangsangan tak terkondisi (AS) atau rangsangan terkondisi (CS). KITA
kita harus mempertimbangkan keterbatasan dan kekuatan komputasi menyebabkan tanggapan tanpa syarat, sedangkan CS netral dan
konsumsi. Dalam sistem robot servis rumah, bermacam-macam melewati berbagai area otak: thalamus, neocortex,
program perangkat lunak dijalankan secara bersamaan; dengan demikian, membongkar dan dan hipokampus. Rangsangan ini kemudian dimasukkan ke dalam suatu bagian
percepatan program efektif. Meskipun unit pemrosesan grafis (GPU) sering amigdala disebut nukleus lateral (LA) melalui dua
digunakan untuk mempercepat komputasi, unit tersebut cenderung memiliki jalur [11]. Salah satunya adalah jalur langsung dari thalamus
konsumsi daya yang tinggi, sangat parah. di mana informasi sensorik disampaikan dengan cepat, dan yang lainnya
mengganggu penggunaan robot layanan rumah, yang seharusnya hanya adalah jalur tidak langsung melalui korteks tempat informasi
menggunakan sedikit daya. Oleh karena itu, GPU modern tidak cocok untuk itu disampaikan secara perlahan. Pada jalur langsung, fitur rangsangan sensorik
robot layanan rumah. dimasukkan ke dalam LA. Pada jalur tidak langsung,
Kami menyediakan sistem dengan pemrosesan cepat dan daya rendah pengenalan objek, konsep, dan konteks dimasukkan ke dalamnya
konsumsi dengan merancang dan mengimplementasikan yang cerdas LA. Oleh karena itu, LA merupakan bagian yang mengintegrasikan CS dari
sistem menjadi array gerbang yang dapat diprogram lapangan (FPGA). Itu berbagai wilayah otak. Apalagi neuron yang bereaksi
perangkat keras pada FPGA berjalan pada frekuensi yang lebih rendah daripada perangkat lunak
rangsangan tertentu terletak berdekatan satu sama lain [11], [16]. Itu
pada unit pemrosesan pusat (CPU) dan GPU. Misalnya, LA mengkondisikan CS ke AS [17]. Setelah terintegrasi, rangsangan
jaringan saraf konvolusional [3] diimplementasikan pada FPGA dimasukkan ke dalam bagian amigdala yang disebut pusat
lebih cepat dan mengonsumsi daya lebih sedikit dibandingkan dengan yang inti (CE). Setelah pengkondisian, CE mengeluarkan respons terkondisi (CR)
diterapkan pada GPU tertanam [14]. Oleh karena itu, perangkat keras tersebut bahkan jika CS dimasukkan ke dalam amigdala
tanpa kami.
dapat mengimplementasikan sistem dengan pemrosesan cepat dan daya rendah
konsumsi. Singkatnya, proses pengkondisian rasa takut di
Dalam penelitian ini, kami mengusulkan model pengkondisian klasik amigdala melibatkan pengenalan stimulus sensorik dan pengkondisian CS ke
meniru struktur dan fungsi amigdala biologis. Selain itu, kami mengusulkan AS. Dalam pengenalan stimulus sensorik, CS adalah
implementasi integrasi skala besar (VLSI) dari model kami menggunakan diklasifikasikan berdasarkan fitur rangsangan tanpa sinyal yang diawasi. Oleh
FPGA. karena itu, amigdala dapat mengklasifikasikan hal-hal yang tidak diketahui
Makalah ini disusun sebagai berikut. Bagian II menjelaskan rangsangan sensorik menggunakan sistem pengenalan yang mengatur dirinya sendiri.
teori amigdala biologis dan studi terkait Dalam proses pengondisian, amigdala mempelajari hubungan-hubungan tersebut
model amigdala, dan Bagian III menjelaskan usulan model pengkondisian antara CS dan AS. Sebagai hasil dari proses tersebut, amigdala dapat
klasik kami dan implementasi perangkat kerasnya. Bagian IV menjelaskan memprediksi nilai emosional dari rangsangan sensorik yang ada
eksperimen yang mengevaluasi awalnya netral.
model yang diusulkan dan perangkat kerasnya. Bagian V menyediakan

diskusi, dan Bagian VI menyimpulkan makalah ini. B. MODEL BERDASARKAN AMYGDALA BIOLOGIS
Beberapa penelitian tentang ketakutan dan model pengkondisian klasik
II. AMYGDALA berdasarkan amigdala biologis telah
A. KONDISI KLASIK diusulkan [18] – [21]. Armoni dkk. [18] mengusulkan model amigdala untuk
Amigdala ada di sistem otak otak dan baik-baik saja pengkondisian rasa takut dengan mempertimbangkan hubungan antara
dikenal sebagai bagian pemrosesan emosi, khususnya yang terkait amigdala, thalamus pendengaran, dan sistem pendengaran.
JILID 8, 2020 212067

korteks. Model tersebut melakukan pengkondisian rasa takut antara input sederhana dibandingkan dengan tuntutan kompleks yang dibebankan pada
pendengaran sebagai CS dan AS. robot layanan rumah.
Morén dan Balkenius [19] mengusulkan model hubungan antara amigdala Rizzi dkk. [29], [30] mengusulkan model pembelajaran ketakutan sadar
dan korteks orbitofrontal yang mengontrol kepunahan [22]. Bagian korteks situasi (SAFEL). Untuk memprediksi situasi yang mengancam, model SAFEL
orbitofrontal dari model menghambat bagian amigdala dan dapat mencapai mempelajari apakah situasi tersebut bersifat permusuhan. Model ini terdiri dari
efek pemusnahan dalam pengondisian rasa takut. amigdala, hipokampus, dan modul memori kerja. Modul amigdala digunakan
sebagai pemicu untuk mempelajari situasi yang tidak menyenangkan; ia
Izhikevich [20] mengusulkan model neuron spiking untuk pengkondisian menerima stimulus dari lingkungan dan menilai apakah stimulus tersebut tidak
klasik dan instrumental. Model yang diimplementasikan oleh model neuron menyenangkan.
Izhikevich [23] menggunakan aturan pembelajaran plastisitas yang bergantung Jika modul amigdala menilai bahwa stimulus tersebut bersifat permusuhan,
pada waktu lonjakan yang dimodulasi oleh dopamin. Studi ini mensimulasikan modul tersebut mengeluarkan sinyal adrenalin ke dalam modul hipokampus
model yang terdiri dari 1.000 neuron dan mengungkapkan bahwa model yang menyangga rangsangan sensorik untuk menentukan apakah rangsangan
tersebut dapat memecahkan masalah imbalan distal [24] di mana imbalan yang disangga itu bersifat permusuhan. Ketika modul hipokampus menerima
diberikan setelah tindakan yang memicu imbalan. sinyal adrenalin dari modul amigdala, modul tersebut menganggap stimulus
rangkaian waktu (didefinisikan sebagai suatu situasi) tepat sebelum menerima
Li dkk. [21] mengusulkan model neuron spiking untuk perolehan dan sinyal adrenalin, sebagai situasi yang tidak menyenangkan. Situasi permusuhan
pemusnahan memori rasa takut. Model ini didasarkan pada neuron ketakutan, tersebut kemudian disimpan dalam modul memori kerja. Setelah itu, model
persisten, dan kepunahan di amigdala dan korteks prefrontal medial. Studi ini SAFEL dapat memprediksi situasi permusuhan dengan mengacu pada modul
menjelaskan bahwa jaringan yang melibatkan amigdala dan korteks prefrontal memori kerja. Dalam model ini, model amigdala diimplementasikan melalui
menunjukkan efek kepunahan penguatan parsial [25] – [27], di mana memori tipe FCNN. Estimasi permusuhan didasarkan pada pengondisian klasik dari
rasa takut yang diperoleh melalui pasangan parsial CS dan AS lebih tahan rangsangan permusuhan (seperti AS) dan rangsangan netral (seperti CS).
terhadap kepunahan dibandingkan yang diperoleh melalui pasangan penuh. Pengondisian klasik dilaksanakan dengan pembelajaran asosiatif. Meskipun
konsep modul amigdala didasarkan pada penelitian LeDoux, namun penelitian
ini tidak mempertimbangkan struktur amigdala yang ditunjukkan pada EMA
Meskipun penelitian-penelitian ini mengusulkan model ketakutan dan [28]; oleh karena itu, memprediksi ketidaksukaan dari rangsangan yang tidak
pengkondisian klasik, tujuan penelitian-penelitian ini berbeda dengan tujuan diketahui merupakan hal yang menantang. Selain itu, mereka tidak
penelitian kami. Mereka bertujuan untuk menerapkan model yang masuk akal mengimplementasikan model tersebut pada perangkat keras.
secara biologis, sedangkan kami bertujuan untuk mengembangkan sistem
akuisisi pengetahuan lokal untuk robot layanan rumah. Dari sudut pandang
aplikasi robot, kita memerlukan pengenalan stimulus sensorik, yang merupakan
proses penting dalam ketakutan dan pengondisian klasik. Selain itu, kita AKU AKU AKU. MODEL
harus mempertimbangkan biaya komputasi sistem karena sumber daya dan
YANG DIUSULKAN Dalam penelitian ini, untuk menerapkan sistem akuisisi
daya komputasi dalam sistem robot terbatas.
pengetahuan lokal pada robot layanan rumah, kami fokus pada konsep
amigdala di mana LA dan CE didasarkan pada pengkondisian klasik daripada
sepenuhnya meniru amigdala biologis. Kami mengikuti konsep EMA [28]
C. MODEL APLIKASI ROBOT
karena memiliki sistem pengenalan stimulus sensorik yang diterapkan oleh
Beberapa penelitian yang melibatkan model amigdala yang diterapkan pada
SOM yang dapat menerima beberapa jenis CS. Selain itu, kami memperluas
robot telah diusulkan [28] – [30]. Sonoh dkk. [28] mengusulkan model ekspresi
fungsi model untuk mengadaptasi tugas-tugas kompleks untuk robot layanan
emosional amigdala (EMA), yang terdiri dari peta pengorganisasian diri (SOM)
rumah.
[31] dan jaringan saraf yang terhubung sepenuhnya (FCNN). SOM merupakan
model LA, sedangkan FCNN merupakan model CE. Neuron di SOM dengan
vektor referensi serupa terletak di proksimal.
A.STRUKTUR
Fitur SOM dimaksudkan untuk meniru fitur LA. Eksperimen dengan EMA yang Kami mengusulkan model pengkondisian klasik yang diilhami oleh amigdala
diterapkan dalam FPGA mencapai perilaku pengkondisian klasik antara sinyal [32], [32]. Gambar 2 menunjukkan struktur model (sisi kanan gambar), yang
dari sensor warna (seperti CS) dan sinyal dari sensor sentuhan (seperti AS). terdiri dari beberapa SOM sebagai LA (dua SOM ditunjukkan pada Gambar 2)
dan FCNN sebagai CE.
Misalnya, ketika EMA secara bersamaan menerima ''merah'' dan ''tamparan'' Kami mengganti SOM tunggal EMA dengan beberapa SOM yang dapat
dari sensor, ia mengkondisikan rangsangan ini. dianggap sebagai lapisan jaringan SOM yang dalam [33].
Setelah pengkondisian, EMA mengeluarkan respons ''takut'' bahkan jika EMA Model secara bersamaan menerima AS dan beberapa CS.
menerima stimulus ''merah'' tanpa ''ditampar''. Model ini mencakup konsep CS ini dimasukkan ke dalam dan diklasifikasikan oleh SOM, dan hasil klasifikasi
amigdala di mana LA mengklasifikasikan rangsangan sensorik dan kemudian diubah sebagai vektor dan digabungkan.
mempelajari hubungan antara CS dan AS. Karena diperkenalkannya SOM bernama. Vektor-vektor tersebut kemudian dimasukkan ke dalam FCNN,
sebagai LA, model tersebut dapat memprediksi respons emosional, meskipun mempelajari hubungan antara US dan vektor-vektor tersebut (mode pelatihan).
model tersebut menerima CS yang tidak diketahui. Namun, tugasnya tetap ada Setelah itu, model mengeluarkan CR meskipun model hanya menerima CS
(mode inferensi).
212068 JILID 8, 2020

grid (I × J grid), dan posisi neuron di setiap SOM direpresentasikan menggunakan

indeks (i, j) (i = 1, . . . ,I;j = 1, . . .
, J). Indeks (ic, jc) mewakili posisi neuron pemenang. Kemudian, SOM
dapat mengeluarkan vektor yang bergantung pada posisi neuron pemenang.
Vektor keluaran dari SOM hk ÿ R dihitung sebagai
saya × J
2 2
hai,j = exp(ÿd /2ÿ prop), i,j (2)
2 2, (3)
di,j = (i ÿ ic) + (j ÿ jc)
dimana hi,j adalah elemen dari vektor keluaran hk . Dengan
GAMBAR 2. Model pengkondisian klasik dan bagian persepsi. kata lain, satu neuron pada posisi (i, j) di SOM mengeluarkan nilai skalar hi,j .
Variabel di,j adalah jarak dari neuron pemenang ke posisi
(i, j). Selain itu, ÿprop menunjukkan lebar fungsi Gaussian. Semua vektor
Sebagai uji kasus, kami menerapkan model tersebut pada robot yang
keluaran SOM digabungkan sebagai
bekerja di restoran. Untuk ini, kami menambahkan bagian persepsi untuk
interaksi manusia-robot (sisi kiri Gambar 2). Ketika robot menerima perintah, ia
mencoba mengambil informasi dari objek yang dipesan melalui bagian persepsi. H = {h1, . . . , hK }. (4)
Informasi objeknya adalah AS. Secara bersamaan, robot mengambil informasi Vektor gabungan H ÿ R M
(M = I × J × K) dimasukkan ke
tentang wajah pelanggan dan lokasi robot melalui bagian persepsi sebagai CS.
dalam FCNN. FCNN mengeluarkan vektor yang mewakili kemungkinan apa
Model mempelajari hubungan antara AS dan CS dalam mode pelatihan. Setelah
yang diinginkan pelanggan. Vektor keluaran FCNN, y ÿ R dihitung melalui
mode pelatihan ini, model dapat memprediksi apa yang diinginkan pelanggan L
persamaan berikut: ,
hanya dengan menggunakan CS dalam mode inferensi.
aku = f (H · v aku
), (5)
M
dimana yl adalah elemen dari vektor keluaran y. vl ÿ R vektor bobot adalah a
Meskipun, dalam penelitian ini, kami menggunakan struktur yang ditunjukkan

yang sesuai dengan neuron l (l = 1, . . . , L),
pada Gambar 2, yang mencakup dua SOM dan tiga bagian persepsi, SOM dan
dan f adalah fungsi aktivasi. Sebagai fungsi aktivasi dapat digunakan fungsi
bagian persepsi dapat diperluas. Misalnya, selain wajah dan tempat pelanggan,
identitas, Sigmoid, dan Softmax.
waktu pelanggan melakukan pemesanan dapat digunakan sebagai CS. Jika
Dalam mode pelatihan, vektor referensi SOM diperbarui melalui pembelajaran
model menerima wajah, tempat, dan waktu sebagai CS, model dapat
kompetitif tanpa pengawasan, yang dapat direpresentasikan sebagai
mempelajari dan memprediksi preferensi pelanggan bergantung pada tempat
dan waktu. Dibandingkan dengan EMA [28], model yang diusulkan lebih
2 2
menguntungkan karena dapat mempertimbangkan kombinasi beberapa faktor wi,j = ÿ(xk ÿ wi,j)exp(ÿd /2ÿ belajar), i,j (6)
dalam lingkungan. Secara khusus, model yang ditunjukkan pada Gambar 2 baru lama
dengan saya, j + wi,j, = w i,j (7)
memprediksi apa yang diinginkan pelanggan berdasarkan kombinasi wajah dan
tempat. Lebih jauh lagi, dengan menetapkan berbagai faktor di lingkungan dimana ÿ adalah kecepatan pemelajaran dan ÿlearn adalah lebar fungsi Gaus-
sebagai CS, kita dapat menggunakan model tersebut meskipun kita tidak sian; vektor bobot FCNN diperbarui oleh aturan delta.
mengetahui faktor mana yang memicu US.
vl = ÿÿ(yl ÿ tl)f (H · v lama baru + vl, v = v ll aku

)H, (8)
B.ALGORITMA (9)
Pada penelitian ini keluaran dari bagian persepsi dimasukkan ke dalam model
di mana tl adalah sinyal yang diawasi. Dengan kata lain, tl adalah elemen dari
LA dan CE pada perangkat keras. L
vektor AS, t ÿ R . ÿ adalah kecepatan pembelajaran.
Mode inferensi diterapkan seperti yang dijelaskan di sini. (k = 1, . . . ,K)
N
Jika beberapa vektor CS xk ÿ R dengan diberikan, C. ALGORITMA BERORIENTASI PERANGKAT KERAS
K adalah bilangan CS (K = 2 dalam kasus model pengkondisian klasik yang
Untuk mengimplementasikan model pengkondisian klasik ke dalam FPGA,
ditunjukkan pada Gambar 2) dan N adalah dimensi vektor, maka CS dimasukkan
diperlukan algoritma berorientasi perangkat keras yang mengurangi sumber
ke dalam SOM. Modul LA ini terdiri dari K SOM. Jadi, xk dimasukkan ke dalam
k daya perangkat keras karena terbatasnya sumber daya FPGA.
SOM. Di setiap SOM, neuron pemenang dengan vektor referensi yang paling
Secara khusus, pengurangan operasi perkalian algoritma diperlukan karena
mirip dengan vektor masukan dipilih berdasarkan persamaan berikut:
terbatasnya pengali dalam irisan FPGA (digital signal processor (DSP)). Dalam
kasus FPGA XCZU9EG [34], perangkat target dalam penelitian ini, terdapat
2.520 irisan DSP, 274.080 tabel pencarian (LUT), dan 548.160 flip flop (FF).
(ic, jc) = arg min i,j xkÿ wi ,j, (1) Selain itu, fungsi eksponensial harus dihindari karena memerlukan sumber
daya perangkat keras yang besar. Di sini, kami mengembangkan yang
N
dimana wi,j ÿ R adalah salah satu vektor referensi SOM. berorientasi pada perangkat keras
Neuron di setiap SOM terletak pada dua dimensi
JILID 8, 2020 212069

algoritma untuk model pengkondisian klasik dan diimplementasikan

menggunakan bilangan fixed-point atau integer, karena implementasi
perangkat keras yang menggunakan bilangan floating-point memerlukan
sumber daya perangkat keras yang lebih besar dibandingkan dengan yang
menggunakan bilangan fixed-point dan integer.
Pada (1), jarak vektor xkÿwi,j dihitung. Dalam kasus algoritma SOM
asli, norma L2, xk ÿ wi,j2 = n=1 (xk,n ÿ wi,j,n) sering digunakan untuk jarak.
N 2
Namun, norma L2 mencakup , operasi perkalian yang harus dikurangi
untuk implementasi perangkat keras. Jadi, alih-alih menggunakan norma GAMBAR 3. Perangkat keras model pengkondisian klasik.
L2, kita menggunakan norma L1, xk ÿ wi,j1 = n=1 |xk,n ÿ wi,j,n|, yang tidak
N
memerlukan perkalian apa pun. Dalam algoritme, kami menggunakan
bilangan bulat delapan bit sebagai variabel untuk xk dan wi,j .
Persamaan (2), (3), dan (6) menggunakan berbagai operasi perkalian

dan fungsi eksponensial. Kami mengganti operasi perkalian dan fungsi
eksponensial ini dengan operasi bit-shift. Algoritma ini dioperasikan
berdasarkan persamaan berikut:
GAMBAR 4. Perangkat keras modul LA.

hai,j = 2 ÿDi,j , (10)
Di,j = |i ÿ ic| + |j ÿ jc|, wi,j = 2 ÿ (11)
(A+Di,j) (xk ÿ wi,j), (12) 1) MODUL LA

baru old +
(13) Gambar 4 menunjukkan konfigurasi perangkat keras modul LA. Modul LA
dengan saya, j dengan A wi,j, = w i,j
memiliki neuron I × J , dan semua perhitungan neuron dijalankan secara
adalah bilangan bulat positif dan 2ÿA adalah learning rate yang sesuai dengan ÿ pada (6). Dalam (10) dan
paralel. Modul LA mencakup memori akses acak (RAM) untuk vektor
(12), kita menggunakan pangkat dua, bukan fungsi eksponensial. Pangkat dua dapat direpresentasikan referensi wi,j dan beberapa unit komputasi, termasuk unit komputasi norma
sebagai operasi pergeseran bit aritmatika. Dalam (10), kita menggunakan bilangan titik tetap delapan bit
(Norm), unit pemilihan pemenang (Winner), unit komputasi jarak (Dist), unit
dengan dua bit bagian bilangan bulat dan enam bit bagian desimal sebagai variabel untuk hi,j .
keluaran (Output). ), dan perbarui unit (Update). Unit komputasi norma
menghitung norma L1 xk ÿ wi,j1 yang memuat xk dari port input, dan wi,j
dari RAM. Hasil perhitungan dimasukkan ke dalam unit pemilihan pemenang.
Dalam (3), jarak Euclidean di,j digunakan. Alternatifnya, kita Unit pemilihan pemenang memilih neuron pemenang dengan xk ÿwi,j1
menggunakan jarak Manhattan Di,j . Ciri penting persamaan ini
terkecil dan mengeluarkan indeks pemenang (ic, jc). Indeks pemenang
adalah tidak memerlukan operasi perkalian. dimasukkan ke dalam unit perhitungan jarak. Unit komputasi jarak
menghitung jarak antara neuron sendiri dan neuron pemenang Di,j = Di +

Selain bagian LA, kami tidak mengubah algoritma bagian CE yang Dj .
ditunjukkan pada (5) dan (8). Kita menghindari penggunaan bilangan titik-
mengambang dengan menggunakan bilangan titik tetap delapan-bit
dengan dua bit bagian bilangan bulat dan enam bit bagian desimal sebagai Jarak secara bersamaan dimasukkan ke
variabel untuk vl . Selain itu, kami menggunakan fungsi dalam unit keluaran dan pembaruan. Unit keluaran menghitung vektor hk
identitas sebagai fungsi aktivasi f untuk menghindari fungsi eksponensial, Dalam kasus tersebut
menggunakan jarak Di,j . mode pelatihan, unit
seperti pada fungsi Sigmoid dan Softmax. pembaruan menghitung vektor referensi yang diperbarui. Unit pembaruan
secara bersamaan dapat menghitung beberapa elemen vektor. Hasil
D. IMPLEMENTASI PERANGKAT KERAS
komputasi dari unit pembaruan disimpan dalam RAM untuk vektor referensi.
Dengan menggunakan algoritma berorientasi perangkat keras yang
diusulkan, kami merancang perangkat keras khusus untuk model
pengkondisian klasik. Gambar 3 menunjukkan seluruh konfigurasi perangkat
keras model, yang terdiri dari modul K LA dan modul CE.
Vektor xk sebagai CS dimasukkan ke dalam modul LA. Perhitungan modul
LA dijalankan secara paralel secara bersamaan.
Setiap modul LA mengeluarkan hk , dan semua vektor keluaran
digabungkan menjadi H. Vektor gabungan H dimasukkan ke dalam
modul CE. Modul CE mengeluarkan vektor y sebagai CR. Dalam mode GAMBAR 5. Perangkat keras unit komputasi norma.
pelatihan, vektor t, seperti US, dimasukkan ke dalam modul CE.
Kemudian, modul CE memperbarui vektor bobotnya, dan modul LA Gambar 5 menunjukkan unit perhitungan norma. Sub pada gambar
memperbarui vektor referensi. menunjukkan elemen pemrosesan untuk pengurangan, Abs adalah a
212070 JILID 8, 2020

elemen pemrosesan untuk absolusi, dan Tambah adalah elemen pemrosesan

untuk penambahan. Persegi panjang pada gambar menunjukkan register.
Unit penghitungan norma secara berurutan menerima elemen dari vektor
masukan xk dan vektor referensi wi,j , masing-masing direpresentasikan
sebagai xk,n dan wi,j,n, pada gambar. Pertama, pengurangan elemen-elemen
tersebut (xk,n ÿ wi,j,n) dihitung.
Kemudian, nilai absolut dari pengurangan |xk,n ÿ wi,j,n| dihitung dan
diakumulasikan untuk menghitung norma L1 xk ÿ n=1 |xk,n ÿ wi,j,n|. Secara
N
disimpan bersamaan, hasil dari wi,j1 = pengurangan (xk,n ÿ wi,j,n)
dalam register, dan nilai dalam register dimasukkan ke dalam unit pembaruan
untuk menghitung vektor referensi yang diperbarui.
GAMBAR 7. Perangkat keras unit komputasi jarak.
GAMBAR 6. Perangkat keras unit seleksi pemenang.
Gambar 6-(a) menunjukkan unit pemilihan pemenang. Comp pada gambar

adalah pembanding yang menerima norma L1 dengan indeks dari dua unit
komputasi norma dan mengembalikan norma L1 yang lebih kecil beserta GAMBAR 8. Perangkat keras unit keluaran.
indeksnya. Unit pemilihan pemenang mencakup register I ×J , diilustrasikan
sebagai persegi panjang pada gambar, dan (I × J) 2 pembanding. Output dari

komparator dihubungkan ke paruh pertama register. Untuk memilih pemenang,
adalah 8. Kemudian, 1.0 adalah bit kanan yang digeser dengan nilai jenuh untuk
register pertama diinisialisasi dengan output (norma L1) dari unit perhitungan
menghitung hi,j .
norma dan indeksnya. Kemudian, perhitungan menggunakan pembanding
diulangi log2 (I × J) kali. Perhatikan bahwa jumlah neuron I × J harus pangkat
dua. Jika tidak, register dummy diinisialisasi dengan nilai maksimum variabel
dan pembanding ditambahkan.
Gambar 6-(b) menunjukkan unit pemilihan pemenang yang dibuka sepanjang

waktu. Seperti yang ditunjukkan oleh warna merah pada gambar, norma L1
terkecil dan indeksnya disimpan di elemen pertama register.
Gambar 7 menunjukkan satuan perhitungan jarak yang menerima indeks
pemenang (ic, jc). Pertama, pengurangan indeks pemenang dan indeks sendiri,
ic ÿ i, i ÿ ic, jc ÿ j, dan j ÿ jc dihitung secara bersamaan. Untuk menghitung nilai
GAMBAR 9. Perangkat keras unit pembaruan LA.
absolut Di = |ic ÿ i| dan Dj = |jc ÿ j|, baik ic ÿ i atau i ÿ ic dan jc ÿ j atau jÿjc dipilih
berdasarkan pembanding. Kemudian, unit penghitungan jarak mengeluarkan
jarak dari neuron pemenang Di dan Dj . Gambar 9 menunjukkan unit pembaruan modul LA. Unit pembaruan menerima
jarak Di , Dj , dan koefisien pembelajaran A dan menambahkan nilai-nilai ini.
Kemudian, nilai tambah jenuh dalam rentang dari 0 hingga BIT _WIDTH_W,
Gambar 8 menunjukkan unit keluaran; Sat menggambarkan elemen yang merupakan lebar bit variabel wi,j .
pemrosesan untuk saturasi, dan Shift menggambarkan elemen pemrosesan Dalam penelitian ini, BIT _WIDTH_W adalah 8. Unit pembaruan
untuk operasi bit-shift. Unit keluaran menerima jarak dari pemenang Di dan Dj juga menerima (xk,n ÿ wi,j,n) dari unit perhitungan norma, dan nilainya sedikit
dan menambahkan nilai-nilai ini. Jarak jenuh dalam rentang dari 0 hingga BIT digeser ke kanan. Nilai yang digeser wi,j,n dimasukkan ke dalam RAM untuk
_WIDTH_H, yang merupakan lebar bit variabel hi,j . vektor referensi dan ditambahkan ke wi,j,n.
Dalam penelitian ini, BIT _WIDTH_H
JILID 8, 2020 212071

GAMBAR 12. Perangkat keras unit pembaruan CE.

GAMBAR 10. Perangkat keras modul CE.
akan ditambahkan. Gambar 11-(b) menunjukkan unit pohon

2) MODUL CE
penambah yang dibuka sepanjang waktu. Seperti yang ditunjukkan
Gambar 10 menunjukkan konfigurasi perangkat keras modul CE. Modul CE oleh warna merah pada gambar, hasil operasi tambahan semua nilai
memiliki L neuron (L adalah dimensi US), dan semua komputasi neuron
disimpan di elemen pertama register.
dijalankan secara paralel. Modul CE mencakup RAM untuk vektor bobot vl dan Gambar 12 menunjukkan unit pembaruan modul CE, dimana Mult
beberapa unit komputasi, seperti unit operasi perkalian (Mult), unit pohon pada gambar adalah pengali. Pengganda menerima dua nilai dan
penambah (Adder), unit komputasi selisih (Diff), dan unit pembaruan (Update). menghasilkan perkalian kedua nilai tersebut. Unit pembaruan
Unit operasi perkalian menghitung perkalian berdasarkan elemen dari H dan menerima yl ÿ tl dari unit komputasi perbedaan, dan ÿ adalah
vl . Jadi, hasil komputasinya adalah elemen M(= I × J × K). Hasil komputasi kecepatan pemelajaran. Nilai-nilai tersebut dimasukkan ke dalam
dimasukkan ke dalam unit pohon penambah yang menjumlahkan keluaran pengganda. Unit pembaruan juga menerima Hm dan menghitung
dari unit operasi perkalian untuk menghitung yl = H · v Dalam kasus mode operasi perkalian Hm dan ÿ(yl ÿ tl). Output dari unit pembaruan vl,m
pelatihan, hasil komputasi dari unit pohon penambah dimasukkan ke dalam
dimasukkan ke dalam RAM agar vektor bobot dapat diperbarui.
perhitungan selisih unit yang menerima sinyal yl dan sinyal yang diawasi tl dan
menghitung perbedaannya yl ÿ tl . Terakhir, perbedaannya dimasukkan ke
aku .
dalam unit pembaruan untuk menghitung vektor bobot yang diperbarui. Hasil
komputasi unit pembaruan disimpan dalam RAM untuk vektor bobot.
GAMBAR 13. Interaksi manusia-robot dalam percobaan.
IV. EKSPERIMEN
A. PREFERENSI BELAJAR DARI
GAMBAR 11. Perangkat keras unit pohon penambah. BEBERAPA INTERAKSI MANUSIA-ROBOT
Kami memverifikasi bahwa model pengkondisian klasik yang
Gambar 11 menunjukkan unit pohon penambah. Unit pohon diusulkan dapat mempelajari preferensi pelanggan melalui beberapa
penambah mencakup register M(= I × J × K) dan M 2 penambah. interaksi manusia-robot. Kami menerapkan model pada robot layanan
Setiap penambah menerima dua nilai dan menghasilkan keluaran rumah (TOYOTA HSR [7], [35]) untuk percobaan ini. Bagian persepsi
penjumlahan kedua nilai tersebut. Output dari penambah dihubungkan model diimplementasikan melalui Web Speech API [36] sebagai
ke paruh pertama register. Untuk menghitung operasi tambahan dari pengenalan suara, YOLOv2 [37] sebagai pengenalan visual objek,
semua nilai yang disimpan dalam register, pertama-tama, register dan lokalisasi dan pemetaan simultan sebagai deteksi tempat.
diinisialisasi dengan keluaran dari unit operasi perkalian. Dengan menggunakan kamera dan telepon mikro yang terpasang
Kemudian, perhitungan menggunakan penambah diulangi log2 M pada robot, model tersebut mengambil CS dan US (Gbr. 13). Kami
kali. Perhatikan bahwa jumlah keluaran dari satuan operasi perkalian menyiapkan dua jenis vektor untuk setiap CS, yaitu gambar wajah
M harus pangkat dua; jika tidak, register dummy diinisialisasi dengan (saluran RGB 64 × 64 piksel) yang mewakili pelanggan A dan B dan
nol dan penambah dummy dua vektor (tiga dimensi).
212072 JILID 8, 2020

TABEL 1. Situasi yang ditentukan.
vektor one-hot) yang mewakili tempat A dan B. Kami juga mendefinisikan

empat situasi (Tabel 1). Dengan menggunakan situasi A sebagai contoh,
setiap kali pelanggan A berada di tempat A, objek A diurutkan (menunjukkan GAMBAR 15. Tingkat akurasi model pengkondisian klasik sehubungan dengan
gambar validasi selama interaksi manusia-robot.
bahwa preferensi dalam situasi A adalah objek A). Model tersebut menerima
US dan CS dari situasi yang ditentukan dan mempelajari hubungan antara
US dan CS. Pertama, model menerima AS dan CS situasi A sepuluh kali,
model selama interaksi dan menunjukkan bahwa model tersebut
setelah itu situasinya diubah. Kemudian, model tersebut menerima US dan
mengadaptasi semua situasi dalam sepuluh interaksi manusia-robot.
CS dari situasi B sepuluh kali, diikuti dengan prosedur yang sama untuk
situasi C dan D. B. IMPLEMENTASI PERANGKAT KERAS
Kami merancang dan mengimplementasikan perangkat keras khusus
Kami menggunakan perangkat lunak model untuk percobaan ini. Dalam
model pengkondisian klasik ke dalam FPGA. Perangkat targetnya adalah
percobaan ini, algoritma berorientasi perangkat keras tidak diterapkan, dan
XCZU9EG FPGA [34], dan lingkungan pengembangannya adalah Xilinx
semua variabel berupa bilangan floating-point 32-bit.
SDSoC 2018.3 [38].
Fungsi aktivasi pada (5) adalah fungsi Softmax. Dengan demikian, keluaran
Kami menetapkan hyperparameter struktur model sebagai berikut:
CE adalah probabilitas. jumlah SOM di LA adalah K = 2, dimensi vektor referensi SOM adalah N =
12, 288(= 64×64×3), ukuran SOM di LA adalah I×J = 8×8, dan jumlah
neuron di CE adalah L = 3.
Kami merancang perangkat keras menggunakan Vivado HLS [39] dan

mendeskripsikan komputasi model sebagai fungsi perangkat keras dan
mensintesis fungsi perangkat keras. Kami mengukur pemanfaatan logika
perangkat keras yang dioperasikan pada 150 MHz. Tabel 2 menunjukkan
pemanfaatan logika perangkat keras; pemanfaatannya kurang dari 100%.
Dengan demikian, perangkat keras model yang diusulkan dapat
diimplementasikan pada FPGA XCZU9EG. Pemanfaatan BRAM maksimal
pada beberapa jenis sumber daya perangkat keras. Slack negatif terburuk
dan hold slack terburuk pada perangkat keras masing-masing adalah 0,568
GAMBAR 14. Probabilitas prediksi objek selama interaksi manusia-robot. ns dan 0,01 ns.
Gambar 14 menunjukkan probabilitas objek yang diperkirakan oleh TABEL 2. Pemanfaatan logika perangkat keras yang diusulkan.
model dari situasi selama interaksi manusia-robot.
Dalam setiap situasi baru, tiga atau empat interaksi diperlukan oleh model
untuk mendukung objek yang terurut dengan benar, yang menunjukkan
kemampuan model untuk beradaptasi dengan situasi baru hanya melalui
beberapa interaksi manusia-robot.
Selain itu, untuk memverifikasi performa generalisasi model, kami
menyiapkan 1.000 gambar wajah per pelanggan yang mewakili wajah
yang diambil dari berbagai arah, yang dibagi menjadi 750 gambar untuk Selanjutnya, kami memverifikasi efek dari algoritma berorientasi
pelatihan dan 250 gambar untuk validasi. Pada interaksi manusia-robot perangkat keras yang diusulkan dengan merancang dan mensintesis
dalam mode pelatihan, sebuah gambar dipilih secara acak dari 750 gambar fungsi perangkat keras menggunakan algoritma asli dari model dan
pelatihan. Gambar dan vektor yang mewakili tempat dimasukkan ke dalam bilangan floating-point. Kami merancang dua jenis implementasi perangkat
model. Setelah setiap interaksi, kami memasukkan 250 gambar validasi keras: implementasi sekuensial dan paralel. Dalam implementasi
dan menempatkan vektor situasi ke dalam model untuk memverifikasi sekuensial, komputasi perangkat keras dieksekusi secara berurutan.
tingkat akurasinya sehubungan dengan gambar validasi. Gambar 15 Dalam implementasi paralel, komputasi perangkat keras dijalankan secara
menunjukkan tingkat akurasi paralel. Kami menetapkan frekuensi clock 150 MHz di kedua implementasi.
JILID 8, 2020 212073

TABEL 3. Pemanfaatan logika dan latensi dari tiga jenis implementasi

perangkat keras.
Tabel 3 menunjukkan pemanfaatan logika dan latensi perhitungan.

Pemanfaatan logika dan latensi implementasi paralel merupakan
nilai perkiraan oleh Xilinx Vivado dan SDSoC karena sumber daya
perangkat keras yang diperlukan melebihi sumber daya pada
perangkat target dan perangkat keras tidak memenuhi batasan
waktu. Oleh karena itu, perangkat keras tidak dapat diimplementasikan GAMBAR 16. Hasil pengukuran implementasi FPGA: Vektor referensi sebelum dan
pada FPGA. Dalam implementasi sekuensial, pemanfaatan logika, sesudah pra-pelatihan.
kecuali LUTRAM dan BRAM, lebih kecil dibandingkan perangkat

keras yang diusulkan karena unit pemrosesan tunggal
diimplementasikan pada perangkat keras dan dieksekusi secara
berurutan untuk menghitung beberapa elemen vektor. Namun,
SDSoC memperkirakan latensi perangkat keras ini sebesar
62.159.985 CLK, sedangkan latensi perangkat keras yang diusulkan
adalah 15.395 CLK. Oleh karena itu, penerapan sekuensial tidak
efektif. Dalam implementasi paralel, pemanfaatan logika lebih besar
dibandingkan perangkat keras yang diusulkan. Latensi perangkat
keras ini diperkirakan sebesar 95.426 CLK, yang juga lebih tinggi
dari latensi perangkat keras yang diusulkan.
C. KEMAMPUAN PERANGKAT KERAS

Kami mengeksekusi perangkat keras yang diusulkan pada FPGA. Pertama,
kami menjalankan mode pra-pelatihan, memasukkan CS ke LA selama
beberapa iterasi untuk mendapatkan vektor referensi terorganisir dari SOM. GAMBAR 17. Hasil pengukuran implementasi FPGA: Kesalahan SOM di LA antara
vektor referensi neuron pemenang dan data selama pra-pelatihan.
Dalam mode pra-pelatihan, gambar wajah yang digunakan dalam
eksperimen A dimasukkan ke dalam LA untuk wajah. Vektor tiga dimensi,
yang elemennya merupakan nilai acak dari bilangan bulat delapan bit,
dimasukkan ke dalam LA untuk mencari tempat. Kami menetapkan A di (12) sebagai 1.
Dalam kasus SOM untuk wajah, gambar validasi yang digunakan
Gambar 16 menunjukkan vektor referensi sebelum dan sesudah 500
dalam eksperimen A digunakan sebagai data untuk menghitung
iterasi pra-pelatihan. Karena kita mengimplementasikan dua SOM pada
kesalahan. Dalam kasus SOM untuk tempat, vektor one-hot yang
perangkat keras, dua jenis vektor referensi (k = 1, 2) diilustrasikan pada
mewakili tempat A dan B digunakan sebagai data untuk menghitung
gambar. Dalam Gambar. 16-(c) dan 16-(d), masing-masing vektor referensi
kesalahan. Kesalahan SOM di LA Lk ke-k dihitung sebagai berikut:
direpresentasikan sebagai persegi panjang warna RGB karena warna RGB
juga merupakan vektor tiga dimensi dari bilangan bulat delapan bit. Gambar.
1 P 1
16-(a) dan 16-(c) menunjukkan bahwa vektor referensi awal adalah nol, Luka = xk (p) ÿ wic,jc 1, (14)
P N
dan Gambar. Gambar 16-(b) dan 16-(d) menunjukkan bahwa SOM di LA hal=1
diatur sendiri oleh pra-pelatihan. Perhatikan bahwa karena perbedaan
dalam dimensi dan distribusi data, peta yang diatur sendiri antara SOM dimana xk (p) adalah data validasi ke-p dan P adalah jumlah total
berbeda secara signifikan. data validasi. Selama pra-pelatihan, kesalahan berkurang dan
menyatu. Perhatikan bahwa nilai kesalahan maksimum yang
Gambar 17 menunjukkan kesalahan SOM antara vektor referensi diperbolehkan adalah 255 karena vektor masukan dan referensi
neuron pemenang dan data selama pra-pelatihan. adalah nilai bilangan bulat delapan bit.
212074 JILID 8, 2020

gambar selama interaksi dan menunjukkan bahwa perangkat keras

menyesuaikan semua situasi dalam sepuluh interaksi robot manusia.
TABEL 4. Waktu eksekusi perangkat lunak.
TABEL 5. Hasil pengukuran implementasi FPGA: Waktu eksekusi

perangkat keras.
GAMBAR 18. Hasil pengukuran implementasi FPGA: Output CE selama pengkondisian

klasik.
Setelah pra-pelatihan, kami menjalankan tes pengkondisian klasik pada TABEL 6. Perkiraan kekuatan chip.
FPGA, di mana kami secara bersamaan melakukan US dan CS. Kombinasi

US dan CS didefinisikan pada Tabel 1.
Pertama, AS dan CS situasi A diberikan sepuluh iterasi. Kemudian, AS dan
CS situasi B juga diberikan hal yang sama untuk sepuluh iterasi. Prosedur
serupa diikuti untuk situasi C dan D. Kita menetapkan A pada (12) sebagai
4, dan ÿ pada (9) sebagai 0,1. Gambar 18 menunjukkan keluaran CE D. KINERJA PERANGKAT KERAS
selama uji pengkondisian klasik pada FPGA. Pada awal pengujian, keluaran Kami mengukur kecepatan pemrosesan perangkat keras. FPGA XCZU9EG
objek A meningkat, dan keluaran lainnya menurun secara monoton. yang digunakan dalam percobaan ini adalah FPGA system-on-chip (SoC),
Kemudian, situasinya diubah pada iterasi kesepuluh, dan output untuk yang mengintegrasikan sistem pemrosesan (PS) dan logika yang dapat
objek B meningkat untuk beradaptasi dengan situasi tersebut. Demikian diprogram (PL). Dalam percobaan ini, perangkat keras yang diusulkan
pula, situasinya berubah pada iterasi ke-30, dan output untuk objek C mulai diimplementasikan pada PL. Software pada PS meneruskan data masukan
meningkat. Hasil eksperimen ini menunjukkan bahwa meskipun perangkat ke PL dan menerima hasil komputasi dari PL. Kami mengukur waktu
keras diimplementasikan menggunakan algoritma berorientasi perangkat eksekusi mode pelatihan dari awal input data hingga akhir penerimaan hasil
keras yang disederhanakan, perangkat keras model tersebut mampu komputasi. Pengoperasian perangkat keras diulang sebanyak 500 kali.
mempelajari kombinasi CS dan US (juga dianggap sebagai preferensi Untuk perbandingan antara kecepatan pemrosesan perangkat keras dan
pelanggan) dengan beberapa iterasi pelatihan. perangkat lunak, kami mengimplementasikan perangkat lunak dan
mengeksekusinya pada PS di FPGA (Arm Cortex-A53), Intel Core i5 4670K,
dan CPU di NVIDIA Jetson TX2 (Nvidia Denver dan Arm Cortex- A57).
Untuk Arm Cortex-A53 dan Intel Core i5, kami mengimplementasikan model
pengkondisian klasik menggunakan C++. Untuk CPU di Jet-son TX2, kami
mengimplementasikannya menggunakan Python dan NumPy [40].
Selain itu, kami mengganti komputasi model oleh NumPy dengan komputasi
oleh CuPy [41] untuk mengeksekusinya pada GPU di Jetson TX2. Kami
menetapkan mode Jetson TX2 sebagai Max-N di mana semua inti di Jetson
TX2 tersedia. Tabel 4 menunjukkan rata-rata waktu eksekusi perangkat
lunak, dan Tabel 5 menunjukkan rata-rata waktu eksekusi perangkat keras.
Seperti yang ditunjukkan dalam tabel ini, perangkat keras lebih cepat
daripada perangkat lunak bahkan pada GPU. Waktu eksekusi perangkat
GAMBAR 19. Hasil pengukuran implementasi FPGA: Tingkat akurasi model keras termasuk waktu transfer data. Kami mengukur waktu eksekusi logika
pengkondisian klasik sehubungan dengan gambar validasi selama interaksi
manusia-robot. model saja, dengan mengimplementasikan fungsi perangkat keras yang
tidak menghitung apa pun kecuali menerima CS tiruan dan mengembalikan
Selain itu, untuk memverifikasi kinerja generalisasi perangkat keras CR tiruan. Kami mengukur waktu eksekusi perangkat keras kosong, yang
yang diusulkan, kami menggunakan uji generalisasi yang sesuai dengan diukur ketika frekuensi clock untuk transfer data dioperasikan pada 150
pengujian pada eksperimen A. Gambar 19 menunjukkan tingkat akurasi MHz.
model sehubungan dengan validasi
JILID 8, 2020 212075

TABEL 7. Perbandingan penelitian sebelumnya tentang model amigdala untuk aplikasi robot.
Kami mengukur konsumsi daya perangkat keras (baik seluruh perangkat (Gbr. 16) dan pelajari kombinasi US dan CS dengan beberapa iterasi pelatihan
keras maupun perangkat keras kosong). Tabel 6 menunjukkan kekuatan chip (Gbr. 18).
yang diperkirakan oleh Vivado. Seperti yang ditunjukkan dalam tabel, FPGA, Meskipun Xilinx Vitis AI [42] dapat mengimplementasikan model berbasis
termasuk perangkat keras yang diusulkan, mengonsumsi 5,009 W. kerangka DL, seperti Keras, TensorFlow, dan Caffe, ke dalam FPGA yang
menggantikan variabel floating-point dengan variabel fixed-point, algoritma
berorientasi perangkat keras yang kami usulkan lebih efektif dalam
mengimplementasikan modelkan ke dalam FPGA karena mengganti operasi
V. PEMBAHASAN A.
perkalian dan fungsi eksponensial dengan operasi bit-shift secara drastis
MODEL
mengurangi sumber daya perangkat keras. Vitis AI tidak dapat mencapai
Tabel 7 menunjukkan perbandingan penelitian sebelumnya mengenai model algoritma yang efektif.
amigdala untuk aplikasi robot. Dibandingkan dengan EMA [28], model yang
diusulkan dapat diterapkan pada tugas yang lebih kompleks. EMA mengambil Karena kami menggunakan SOM dengan neuron 8 × 8 dalam penelitian ini,
informasi tunggal dari lingkungan untuk CS; oleh karena itu, pendekatan ini penggunaan variabel titik tetap delapan bit sudah cukup untuk menghitung
tidak dapat menangani kombinasi berbagai faktor dalam lingkungan. Selain algoritma SOM dan menyelesaikan tugas. Selain itu, meskipun perangkat keras
itu, EMA tidak dapat digunakan jika faktor-faktor yang berhubungan dengan SOM dengan lebih banyak neuron diperlukan dalam beberapa tugas, kita
AS tidak diketahui. Namun, model kami mengambil informasi penting dari dapat dengan mudah mengubah lebar bit semua variabel untuk beradaptasi
lingkungan untuk CS. Oleh karena itu, model kita dapat menangani kombinasi dengan tugas lain karena perangkat keras tersebut memiliki parameter.
faktor-faktor dalam lingkungan, artinya model kita dapat digunakan meskipun Tabel 4 dan 5 menunjukkan bahwa perangkat keras yang diusulkan
kita tidak mengetahui faktor mana yang berhubungan dengan AS. dioperasikan pada 150 MHz adalah 1.273 kali, 111.4 kali, 214.3 kali, dan 94.73
kali lebih cepat dibandingkan perangkat lunak yang dijalankan pada Arm
Cortex-A53, Intel Core i5 4670K, CPU Jetson TX2, dan GPU Jetson TX2,
Dibandingkan dengan model amigdala di SAFEL [29], [30], model yang masing-masing. Temuan ini mengungkapkan bahwa komputasi perangkat
kami usulkan lebih berguna untuk aplikasi robot karena mencakup fungsi LA, keras yang diusulkan lebih efektif dibandingkan perangkat lunak, bahkan pada
CE, dan bagian persepsi. GPU. Selain itu, SDSoC memperkirakan latensi mode pelatihan pada perangkat
Dengan memperkenalkan model LA, model kami dapat menerima rangsangan keras sebesar 15.395 CLK. Dengan demikian, waktu eksekusi ideal perangkat
yang tidak diketahui. Misalnya, model terlebih dahulu mempelajari situasi di keras tanpa transfer data adalah 6,67 ns/CLK × 15,395 CLK = 102,6 µs.
mana pelanggan laki-laki muda dan pelanggan perempuan tua muncul. Ketika Selain itu Tabel 5 juga menunjukkan bahwa waktu eksekusi logika adalah
pelanggan wanita muda muncul, neuron yang terletak di antara neuron pria 197.4 µs - 90.7 µs = 106.7 µs jika waktu transfer data diabaikan.
muda dan neuron wanita tua akan bereaksi. Misalkan ada hubungan antara
usia, jenis kelamin, dan preferensi, model kami dapat memperkirakan preferensi
pelanggan yang tidak diketahui.
VI. KESIMPULAN
Dalam penelitian ini, kami mengusulkan model pengondisian klasik yang

B.PERANGKAT KERAS terinspirasi dari amigdala yang mempelajari preferensi setelah beberapa kali
Dengan menggunakan algoritma berorientasi perangkat keras yang diusulkan, interaksi manusia-robot yang berulang. Kami menerapkan model pada FPGA
perangkat keras modul LA tidak memerlukan pengganda apa pun. Jika kita dengan mengusulkan algoritma berorientasi perangkat keras yang mengurangi
mengimplementasikan model pengkondisian klasik dengan struktur yang sama operasi perkalian lebih dari 6.000.000 kali. Dengan menggunakan algoritme
dengan model pada percobaan, dengan tidak menggunakan algoritma yang berorientasi perangkat keras, kami merancang perangkat keras khusus untuk
berorientasi pada perangkat keras, maka modul LA memerlukan 6.291.840 model pada FPGA XCZU9EG yang 1.200 kali lebih cepat dibandingkan
operasi perkalian: (1) memerlukan 1.572.864 operasi perkalian, (2) memerlukan perangkat lunak pada CPU Arm Cortex-A53. Perangkat keras dapat mempelajari
128 operasi perkalian, (3) memerlukan 256 operasi perkalian, dan (6) preferensi melalui beberapa iterasi pelatihan, meskipun algoritma yang
memerlukan 4.718.592 operasi perkalian. Oleh karena itu, algoritma yang disederhanakan digunakan untuk implementasinya.
diusulkan efektif untuk mengurangi sumber daya perangkat keras (Tabel 3).
Selain itu, meskipun perangkat keras diimplementasikan menggunakan
algoritma berorientasi perangkat keras yang disederhanakan, perangkat keras Dalam penelitian selanjutnya, kami bertujuan untuk mengintegrasikan model
model dapat mengatur sendiri vektor referensi modul LA. yang terinspirasi dari amigdala dengan model lain yang terinspirasi dari otak.
Model yang diusulkan telah diintegrasikan dengan bagian persepsi, yang
disebut sebagai model neokorteks. Selanjutnya dengan mengenalkan hippocampus
212076 JILID 8, 2020

dan model korteks entorhinal dan mengintegrasikannya dengan model, fungsi [21] Y. Li, K. Nakae, S. Ishii, dan H. Naoki, ''Kepunahan memori ketakutan yang bergantung
pada ketidakpastian dalam model sirkuit saraf amigdala-mPFC,'' PLOS Comput. Biol.,
memori episodik menggunakan representasi tempat dan waktu dapat
jilid. 12, tidak. 9 September 2016, Pasal. TIDAK. e1005099.
diwujudkan. [22] ET Rolls, ''Sebuah teori emosi dan kesadaran, dan penerapannya untuk memahami dasar
saraf emosi,'' dalam The Cognitive Neuro-sciences, 1995, hlm. 1091–1106.
UCAPAN TERIMA KASIH
Artikel ini didasarkan pada hasil yang diperoleh dari proyek yang ditugaskan [23] EM Izhikevich, ''Model sederhana dari neuron spiking,'' IEEE Trans. saraf
Jaringan, jilid. 14, tidak. 6, hlm. 1569–1572, November 2003.
oleh Organisasi Pengembangan Teknologi Industri dan Energi Baru (NEDO).
[24] CL Hull, Prinsip Perilaku: Pengantar Teori Perilaku.
New York, NY, AS: D. Appleton-Century, 1943.
[25] DW Leonard, ''Efek penguatan parsial dalam pengkondisian permusuhan klasik pada
REFERENSI kelinci dan manusia.,'' J. Fisiol Komparatif. Psikologi., jilid. 88, tidak. 2, hal.596–608,
[1] L. Iocchi, D. Holz, J. Ruiz-del-Solar, K. Sugiura, dan T. van der Zant, ''RoboCuphome: 1975.
Analisis dan hasil kompetisi yang berkembang untuk robot domestik dan layanan,'' Artif. [26] RA Rescorla, ''Penguatan parsial mengurangi perubahan asosiatif yang dihasilkan oleh
Intell., jilid. 229, hlm. 258–281, Desember 2015. [Online]. Tersedia: http:// nonpenguatan,'' J. Experim. Psikologi. Perilaku Hewan. Proses, vol. 25, tidak. 4, hal.
www.sciencedirect. com/science/article/pii/S0004370215001174 [2] GE Hinton, S. 403–414, 1999.
Osindero, dan Y.-W. Teh, ''Algoritme pembelajaran [27] NJ Mackintosh, Psikologi Pembelajaran Hewan. New York, NY,
cepat untuk jaring keyakinan yang mendalam,'' Neural Comput., vol. 18, tidak. 7, hlm. 1527– AS: Akademik, 1974.
1554, Juli 2006. [28] S. Sonoh, K. Horio, S. Aou, dan T. Yamakawa, ''Model ekspresi emosional yang terinspirasi
[3] Y. Lecun, L. Bottou, Y. Bengio, dan P. Haffner, ''Pembelajaran berbasis gradien diterapkan oleh amigdala,'' Int. J.Inovasi. Komputasi, Inf. Kontrol, jilid. 5, hlm. 1147–1160, Mei 2009.
pada pengenalan dokumen,'' Proc. IEEE, jilid. 86, tidak. 11, hal.2278–2324, 1998.
[29] C. Rizzi Raymundo dan CG Johnson, ''Mekanisme plastisitas sinaptik buatan untuk
[4] A. Krizhevsky, I. Sutskever, dan GE Hinton, ''Klasifikasi ImageNet dengan jaringan saraf pengkondisian klasik dengan jaringan saraf,'' dalam Kemajuan dalam Jaringan Syaraf
konvolusional dalam,'' di Proc. NIPS, jilid. 1, 2012, hlm.1097–1105. Tiruan—ISNN, vol. 8866. Cham, Swiss: Springer, 2014, hlm.213–221.
[5] J. Redmon dan A. Angelova, ''Deteksi genggaman waktu nyata menggunakan jaringan [30] C. Rizzi Raymundo, CG Johnson, dan PA Vargas, ''Ketakutan belajar untuk pengambilan
saraf konvolu-sional,'' di Proc. IEEE Int. Konf. Robot. Otomatis. (ICRA), Mei 2015, hlm. keputusan yang fleksibel di robocup: Sebuah diskusi,'' di Piala Dunia Robot.
1316–1322. Cham, Swiss: Springer, 2017.
[6] S. Hori, Y. Ishida, Y. Kiyama, Y. Tanaka, Y. Kuroda, M. Hisano, Y. Imamura, T. Himaki, Y. [31] T. Kohonen, ''Pembentukan peta fitur topologi yang benar secara mandiri,'' Biol. Cybern., jilid.
Yoshimoto, Y. Aratani, K. Hashimoto, G. Iwamoto , H. Fujita, T. Morie, dan H. Tamukoh, 43, tidak. 1, hal.59–69, 1982, doi: 10.1007/BF00337288.
''Makalah deskripsi tim Hibikino-MusashiHome 2017,'' 2017, arXiv:1711.05457.
[32] Y. Tanaka dan H. Tamukoh, ''Implementasi perangkat keras model amigdala yang
[On line]. Tersedia: http://arxiv.org/abs/1711.05457 terinspirasi otak,'' di Proc. IEEE Int. Gejala. Sistem Sirkuit. (ISCAS), Mei 2019, hlm.1–5.
[7] T. Ono, Y. Tanaka, Y. Ishida, Y. Abe, K. Kanamaru, D. Kamimura, K. Nakamura, Y.
Nishimura, S. Tokuno, Y. Mii, M. Yamauchi, Y. Uemura , T. Hashimoto, Y. Nakamura, I. [33] T. Shinozaki, ''Pembelajaran terawasi umpan depan yang terinspirasi secara biologis untuk
Uchino, D. Kanaoka, T. Hanyu, K. Tsukamoto, T. Morie, dan H. Tamukoh, ''Makalah jaringan peta yang mengatur dirinya sendiri secara mendalam,'' di Proc. Lokakarya NIPS Mewakili.
deskripsi tim Hibikino-MusashiHome 2020,'' 2020, arXiv: 2005.14451. [On line]. Tersedia: Mempelajari. Artif. biologi. Jaringan Syaraf. (MLINI), 2016, hlm.1–7.
http://arxiv.org/abs/2005.14451 [8] Y. Ishida dan H. Tamukoh, ''Pembuatan kumpulan [34] Zynq UltraScale+ MPSoC. Diakses: 26 Oktober 2020. [Online]. Tersedia: https://
data semi-otomatis untuk deteksi dan www.xilinx.com/products/silicon-devices/soc/zynq-ultrascale-mpsoc.html
pengenalan objek serta evaluasinya pada robot layanan domestik,'' J. Robot. Mechtron., jilid.
32, tidak. 1, hlm.245–253, Februari 2020. [35] T. Yamamoto, K. Terada, A. Ochiai, F. Saito, Y. Asahara, dan K. Murase, ''Pengembangan
robot pendukung manusia sebagai platform penelitian manipulator seluler domestik,''
[9] L. Weiskrantz, ''Perubahan perilaku terkait dengan ablasi kompleks amyg-daloid pada ROBOMECH J. , jilid. 6, tidak. 1 Desember 2019.
monyet.,'' J. Comparative Physiol. Psikologi., jilid. 49, tidak. 4, hal.381–391, 1956. [36] G. Shires dan H. Wennborg, ''Spesifikasi API ucapan web,'' Grup Komunitas W3C,
Laporan Akhir, 2012.
[10] JE LeDoux, Otak Emosional: Dasar Misterius Kehidupan Emosional. New York, NY, AS: [37] J. Redmon dan A. Farhadi, ''YOLO9000: Lebih baik, lebih cepat, lebih kuat,'' di Proc.
Simon dan Schuster, 1996. Konferensi IEEE. Hitung. Vis. Pengenalan Pola. (CVPR), Juli 2017, hlm.6517–6525.
[11] JP Aggleton, Amygdala: Analisis Fungsional. Oxford, Inggris: Universitas Oxford. Pers,
2000. [38] Lingkungan Pengembangan SDSoC. Diakses: 26 Oktober 2020. [Online].
[12] ET Rolls, Penjelasan Emosi. Oxford, Inggris: Universitas Oxford. Pers, 2005. Tersedia: https://www.xilinx.com/products/design-tools/software-zone/sdsoc.html
[13] EA Phelps dan JE LeDoux, ''Kontribusi amigdala terhadap pemrosesan emosi: Dari model
hewan hingga perilaku manusia,'' Neuron, vol. 48, tidak. 2, hlm. 175–187, Oktober 2005. [39] Sintesis Tingkat Tinggi Vivado. Diakses: 26 Oktober 2020. [Online]. Tersedia: https://
www.xilinx.com/products/design-tools/vivado/integration/esl-design.html [40] TE Oliphant,
[14] H. Nakahara, H. Yonekawa, T. Fujii, M. Shimoda, dan S. Sato, ''GUIN-NESS: Kerangka kerja A Guide to NumPy,
jaringan saraf dalam binerisasi berbasis GUI untuk pemrogram perangkat lunak,'' IEICE vol. 1. New York, NY, AS: Trelgol Publishing, 2006.
Trans. Inf. Sistem., jilid. E102.D, tidak. 5, hal.1003–1011, 2019.
[41] R. Okuta, Y. Unno, D. Nishino, S. Hido, dan C. Loomis, ''Cupy: Pustaka yang kompatibel
[15] IP Pavlov, Refleks Terkondisi: Investigasi Aktivitas Fisiologis Korteks Serebral. Oxford, dengan numpy untuk perhitungan GPU nvidia,'' di Proc. Sistem ML. Bengkel NIPS,
Inggris: Universitas Oxford. Pers, 1927. 2017, hal. 151.
[16] J. LeDoux, C. Farb, dan D. Ruggiero, ''Organisasi topografi neuron di thalamus akustik [42] Vitis AI. Diakses: 26 Oktober 2020. [Online]. Tersedia: https://www. xilinx.com/products/
yang memproyeksikan ke amigdala,'' J. Neurosci., vol. 10, tidak. 4, hlm. 1043–1054, design-tools/vitis/vitis-ai.html
April 1990.
[17] E. Tsvetkov, WA Carlezon, FM Benes, ER Kandel, dan VY Bolshakov, ''Pengkondisian
rasa takut menghalangi peningkatan transmisi sinaptik prasinaptik yang diinduksi LTP
di jalur kortikal ke amigdala lateral,'' Neuron, vol. 34, tidak. 2, hlm. 289–300, April 2002.
YUICHIRO TANAKA (Anggota Mahasiswa Pascasarjana,
IEEE) menerima gelar BE dan ME dari Institut Teknologi
[18] JL Armony, D. Servan-Schreiber, JD Cohen, dan JE LeDoux, ''Model jaringan saraf
pengondisian rasa takut yang dibatasi secara anatomis.,'' Perilaku. Ilmu Saraf, jilid. Kyushu, masing-masing pada tahun 2016 dan 2018, di mana
109, tidak. 2, hal.246–257, 1995. ia saat ini sedang mengejar gelar Ph.D. gelar dengan Sekolah
[19] J. Morén dan C. Balkenius, ''Model komputasi pembelajaran emosional di amigdala,'' Pascasarjana Ilmu Hayati dan Teknik Sistem. Sejak 2019, ia
dalam Proc. Hewan Animat, Int ke-6. Konf. Simulasi Beradaptasi. Perilaku, 2000, juga menjadi Research Fellow di Japan Society for the
hlm.115–124. Promotion of Science (JSPS). Ia juga merupakan Anggota
[20] EM Izhikevich, ''Memecahkan masalah penghargaan distal melalui hubungan STDP dan Mahasiswa IEICE.
sinyal dopamin,'' Cerebral Cortex, vol. 17, tidak. 10, hlm. 2443–2452, Oktober 2007.
JILID 8, 2020 212077

TAKASHI MORIE (Anggota, IEEE) menerima gelar BS dan HAKARU TAMUKOH (Anggota, IEEE) menerima gelar B.Eng.
MS di bidang fisika dari Universitas Osaka, Osaka, Jepang, gelar dari Miyazaki University, Jepang, pada tahun 2001, dan
masing-masing pada tahun 1979 dan 1981, dan Dr.Eng. gelar M.Eng. dan Ph.D. gelar dari Kyushu Institute of Technology,
dari Hokkaido University, Sapporo, Jepang, pada tahun 1996. Jepang, masing-masing pada tahun 2003 dan 2006. Beliau
adalah Peneliti Pasca-doktoral di Pusat Program Unggulan
Dari tahun 1981 hingga 1997, beliau menjadi anggota Staf Abad 21, Institut Teknologi Kyushu, dari April 2006 hingga
Peneliti di Nippon Telegraph and Tele-phone Corporation September 2007.
(NTT). Dari tahun 1997 hingga 2002, beliau menjadi Associate
Professor di Departemen Teknik Elektro, Universitas Beliau menjabat sebagai Asisten Profesor di Universitas
Hiroshima, Higashihiroshima, Jepang. Sejak tahun 2002, Pertanian dan Teknologi Tokyo dari Oktober 2007 hingga
beliau menjadi Profesor di Graduate School of Life Science and Systems Engineering, Kyushu Januari 2013. Saat ini beliau menjabat sebagai Associate Professor di Sekolah Pascasarjana
Institute of Technology, Kitakyushu, Jepang. Minat penelitiannya mencakup implementasi Ilmu Hayati dan Rekayasa Sistem, Institut Teknologi Kyushu. Minat penelitiannya meliputi
VLSI pada jaringan saraf dan perangkat nano fungsional baru. sistem kompleks perangkat keras/perangkat lunak, desain perangkat keras digital, jaringan
saraf, komputasi lunak, dan robot layanan rumah. Ia juga anggota IEICE, SOFT, JNNS, JSAI,
dan RSJ.
212078 JILID 8, 2020

An Amygdala-Inspired Classical Conditioning Model Implemented On An FPGA For Home Service Robots

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

An Amygdala-Inspired Classical Conditioning Model Implemented On An FPGA For Home Service Robots

Diunggah oleh

Hak Cipta:

Format Tersedia

Machine Translated by Google

Pengkondisian Klasik yang Terinspirasi Amygdala

YUICHIRO TANAKA 1,2, (Anggota Mahasiswa Pascasarjana, IEEE),

Penulis koresponden: Yuichiro Tanaka (tanaka.yuichiro483@mail.kyutech.jp)

Pekerjaan ini didukung oleh JSPS KAKENHI di bawah Hibah 19J11524.

eksperimen yang mengevaluasi awalnya netral.

model yang diusulkan dan perangkat kerasnya. Bagian V menyediakan

JILID 8, 2020 212067

212068 JILID 8, 2020

grid (I × J grid), dan posisi neuron di setiap SOM direpresentasikan menggunakan

dimana hi,j adalah elemen dari vektor keluaran hk . Dengan

Meskipun, dalam penelitian ini, kami menggunakan struktur yang ditunjukkan

vl = ÿÿ(yl ÿ tl)f (H · v lama baru + vl, v = v ll aku

JILID 8, 2020 212069

algoritma untuk model pengkondisian klasik dan diimplementasikan

Persamaan (2), (3), dan (6) menggunakan berbagai operasi perkalian

GAMBAR 4. Perangkat keras modul LA.

Di,j = |i ÿ ic| + |j ÿ jc|, wi,j = 2 ÿ (11)

(A+Di,j) (xk ÿ wi,j), (12) 1) MODUL LA

menghitung jarak antara neuron sendiri dan neuron pemenang Di,j = Di +

212070 JILID 8, 2020

elemen pemrosesan untuk absolusi, dan Tambah adalah elemen pemrosesan

GAMBAR 7. Perangkat keras unit komputasi jarak.

GAMBAR 6. Perangkat keras unit seleksi pemenang.

Gambar 6-(a) menunjukkan unit pemilihan pemenang. Comp pada gambar

sebagai persegi panjang pada gambar, dan (I × J) 2 pembanding. Output dari

Gambar 6-(b) menunjukkan unit pemilihan pemenang yang dibuka sepanjang

JILID 8, 2020 212071

GAMBAR 12. Perangkat keras unit pembaruan CE.

akan ditambahkan. Gambar 11-(b) menunjukkan unit pohon

GAMBAR 13. Interaksi manusia-robot dalam percobaan.

212072 JILID 8, 2020

TABEL 1. Situasi yang ditentukan.

vektor one-hot) yang mewakili tempat A dan B. Kami juga mendefinisikan

Kami merancang perangkat keras menggunakan Vivado HLS [39] dan

JILID 8, 2020 212073

TABEL 3. Pemanfaatan logika dan latensi dari tiga jenis implementasi

Tabel 3 menunjukkan pemanfaatan logika dan latensi perhitungan.

kecuali LUTRAM dan BRAM, lebih kecil dibandingkan perangkat

C. KEMAMPUAN PERANGKAT KERAS

212074 JILID 8, 2020

gambar selama interaksi dan menunjukkan bahwa perangkat keras

TABEL 4. Waktu eksekusi perangkat lunak.

TABEL 5. Hasil pengukuran implementasi FPGA: Waktu eksekusi

GAMBAR 18. Hasil pengukuran implementasi FPGA: Output CE selama pengkondisian

FPGA, di mana kami secara bersamaan melakukan US dan CS. Kombinasi

JILID 8, 2020 212075

Dalam penelitian ini, kami mengusulkan model pengondisian klasik yang

212076 JILID 8, 2020

JILID 8, 2020 212077

212078 JILID 8, 2020

Anda mungkin juga menyukai