Abstract
The technology used to help blind people has been developed using various technologies such as an ultrasonic
sensor in the form of sonar system in the form of belts and watches. The sonar vision works based on the principle of
reflecting a wave with a frequency of 20,000 Hz so that it can be used to determine the distance of an object in a
range of up to 3 meters. However, the sonar system cannot identify the object. Computer Vision emerges as one
of the most promising solutions. This article focused on developing blind visual aid using a convolutional neural
network (CNN) to identify an object. The CNN is instilled on the raspberry pi equipped with a camera. The output
is an audio signal about the object and its position refer to the users
I. INTRODUCTION
Selama ini teknologi untuk membantu para tunanetra telah dikembangkan, diantara berbagai teknologi yang
digunakan yaitu teknologi sensor ultrasonik. Penelitian mengenai sensor ultrasonik sebagai alat bantu tunanetra
ini telah dikembangkan yaitu diantaranya adalah dibuat sebuah alat yang bernama sonar vision dalam bentuk sabuk
dan jam tangan . Teknologi sonar vision ini bekerja berdasarkan prinsip pantulan suatu gelombang dengan
frekuensi sebesar 20.000 Hz sehingga dapat digunakan untuk mengetahui jarak suatu benda dalam kisaran hingga
jarak 3 meter. Kelemahan metode ini masih mengalami kendala dalam mengidentifikasi suatu benda. Solusi
berbasis Computer Vision muncul sebagai salah satunya opsi yang paling menjanjikan. Computer Vision adalah
bidang ilmiah interdisipliner yang membahas bagaimana komputer dapat dibuat untuk memperoleh pemahaman
tingkat tinggi dari gambar atau video digital. Pada penelitian sebelumnya telah dikembangkan juga penggunaan
computer vision sebagai alat bantu visual tunanetra yaitu “Visual Assistance for Blind using Image Processing”
Pada penelitian tersebut lebih difokuskan pada pendeteksian objek menggunakan raspberry pi sebagai kontroller
yang menerima gambar dari kamera pi, pengguna perlu menggunakan perintah bicara ketika dia membutuhkan
objek dan dipandu oleh ouput audio untuk memandu pengguna apakah posisi objek berada disebelah kanan, kiri
dan tengah. Kelemahan dari penelitian tersebut kita tidak dapat mengetahui secara tepat posisi dari objek yang
dicari. Berdasarkan pada permasalahan diatas kami melakukan penelitian ini, yaitu dibuat alat bantu visual untuk
tunanetra yang dapat mendeteksi halangan dan mengidentifikasi objek serta mengetahui dengan tepat posisi dari
objek yang dicari. Pada penelitian ini kami akan memadukan teknologi pengolahan citra digital dan jaringan syaraf
tiruan menggunakan metode Convolutional Neural Network dengan memanfaatkan Raspberry Pi sebagai
kontroller. Metode Jaringan Syaraf Tiruan dipilih karena memiliki kemampuan untuk menciptakan suatu pola
pengetahuan melalui pengaturan diri atau kemampuan belajar (self organizing). Diharapkan dengan memadukan
teknologi pengolahan citra digital dan jaringan syaraf tiruan dengan pengolah data mini pc Raspberry pi dapat
dibuat alat bantu visual yang dapat membantu tunanetra untuk mengidentifikasi benda lebih cepat dan akurat,
sehingga mengurangi ketergantungan para tunanetra terhadap orang disekitarnya.
B. Python
Bahasa pemrograman python adalah bahasa pemrograman tinggi yang dapat melakukan eksekusi sejumlah
instruksi multi guna secara langsung (interpretatif) dengan metode orientasi objek (Object Oriented Programming)
serta menggunakan semantik dinamis untuk memberikan tingkat keterbacaan syntax. Sebagai bahasa
pemrograman tinggi, python dapat dipelajari dengan mudah karena sudah dilengkapi dengan manajemen memori
otomatis (pointer). Syntax python dapat dijalankan dan ditulis untuk membangun aplikasi di berbagai sistem
operasi diantaranya yaitu Linux/Unix, Microsoft Windows, Mac OS, and Android. Python diklaim mampu
memberikan kecepatan dan kualitas untuk membangun aplikasi bertingkat (Rapid Application Development). Hal
ini didukung oleh adanya library dengan modul-modul baik standar maupun tambahan misalnya NumPy, SciPy,
dan lain-lain. Python juga mempunyai komunitas yang besar sebagai tempat tanya jawab Python digunakan di
berbagai bidang pengembangan, diantaranya digunakan sebagai media pembelajaran pemograman karena sangat
mudah dan hemat untuk dipelajari sebagai Object Oriented Programming dibandingkan bahasa lainnya seperti
MATLAB, C++, dan C#. Kedua Python dapat digunakan untuk membangun interface sebuah aplikasi. Tersedia
library untuk membuat GUI menggunakan python, misalnya Qt, win32extension, dan GTK+.
Proses ini dilakukan untuk semua bagian dari gambar, dengan menggunakan filter yang sama. Dengan kata
lain, setiap bagian gambar akan memiliki faktor pengali yang sama, atau dalam konteks neural network disebut
sebagai weights sharing. Hasil yang didapat dari proses diatas adalah sebuah activation map. Untuk mendapat
representasi gambar yang lebih baik, proses konvolusi diulang dengan filter yang berbeda untuk
menghasilkan activation map lain.
Dengan kata lain, kami mulai dengan gambar besar dan kami berakhir dengan array yang sedikit lebih kecil
yang merekam bagian mana dari gambar asli kami yang paling menarik.
4. Downsampling
The result of Step 3 was an array that maps out which parts of the original image are the most interesting. But
that array is still pretty big:
Proses konvolusi dan pooling dapat diulang beberapa kali hingga menghasilkan sebuah Convolutional Neural
Network. Diantara convolutional layer dan pooling layer umumnya terdapat activation layer (e.g. ReLU,
tanH, etc.) yang banyak ditemukan pada artificial neural network.
Gambar 8. Proses convolutional neural network mulai dari awal hingga akhir
III. RESEARCH METHODS
Desain Pengembangan Alat Bantu Visual Untuk Orang Buta Berdasarkan Convolutional Neural Network terdiri
dari perancangan perangkat keras (hardware) dan perancangan perangkat lunak (sofware). Pada penelitian ini,
metode yang digunakan yaitu Convolutional Neural Network ( CNN) adalah salah satu model dari deep learning,.
Kamera sebagai sensor gambar yang berfungsi menangkap gambar, microphone sebagai input berupa perintah
suara, sound speaker sebagai output audio untuk memandu pengguna, power bank berfungsi sebagai catu daya,
dan Raspberry pi 3 sebagai controller utama mengolah data gambar dan perintah suara serta mengeluarkan ouput
berupa audio. Gambar di bawah ini adalah blok diagram dari Desain Pengembangan Alat Bantu Visual Untuk
Orang Buta Berdasarkan Convolutional Neural Network .
Mini camera
usb
Headset
Microphone
Power Bank
START
Take Speech
Input from
user
Reset
Video To Frame
Object
Detection
Base on CNN
Algorithma For
posisition of object
Audio Output
Cent Object is in
er center
Audio Output
Right Object is in right
Audio Output
Left Object is in left
Sistem yang dibuat fokus pada deteksi objek dan posisi objek . Sistem ini dibuat seperti
kacamata. Kamera Pi yang terhubung ke Raspberry Pi menangkap video dan ini dikonversi
menjadi bingkai oleh prosesor. Pemakai perlu memberikan perintah bicara ketika ia
membutuhkan objek. Input ucapan dikenali dan sistem memandu pengguna ke objek
melalui output audio