Jbptunikompp GDL s1 2006 Kandairawa 3448 Human - de e
Jbptunikompp GDL s1 2006 Kandairawa 3448 Human - de e
Oleh:
KANDA IRAWAN
10101221
knd_nfs@yahoo.com
Abstrak
Dalam penelitian ini penulis akan membangun sistem deteksi manusia yaitu sistem yang
dapat menyimpulkan bahwa objek yang dideteksi adalah manusia. Jika berhasil
dideteksi, alarm akan berbunyi dan sistem akan mencatat log. Penulis hanya
menggunakan sebuah webcam sebagai alat sensor serta dua tahap pemrosesan yaitu
segmentasi dan klasifikasi. Segmentasi menggunakan mean shift dan klasifikasi
menggunakan JST backpropagation. Sistem akan diimplementasikan menggunakan C+
+, VB 6 dan library OpenCV. Hasil akhirnya adalah menguji kecepatan proses
pendeteksian sehingga dapat dijadikan acuan untuk mengembangkan sistem yang lebih
kompleks.
Kata kunci: JST backpropagation, kecerdasan buatan, deteksi manusia, webcam.
Abstract
In this research, the author will build the human detection system that is the system
which can conclude that object have been detected is human. If detected successfully,
the alarm will on and system will write the log. The author is only use a webcam as a
sensor device and two stages of processing there are segmentation and classification.
The segmentation using mean shift and classification using backpropagation artificial
neural network. System will be implemented using C++, VB 6 and OpenCV library. The
result is for examining the speed of detection process so that can be reference to develop
system which more complicated.
Keywords: backpropagation neural network, artificial intelligence, human detection, webcam.
1
2. Pemantauan hanya pada ruangan terbatas
(indoor) dan memiliki cahaya konstan/tetap.
3. Webcam dalam keadaan statis (stationary) dan
ditempatkan secara horizontal berhadapan
dengan objek.
4. Sistem akan diimplementasikan menggunakan
Visual C++ 6 dan library OpenCV dengan
interface Visual Basic.
5. Perancangan sistem melalui pendekatan
berorientasi objek menggunakan notasi UML
(Unified Modeling Language).
2. Landasan Teori
2.1 Kecerdasan Buatan
Kecerdasan buatan (AI = Artificial Intelligence)
didefinisikan sebagai kecerdasan yang ditunjukkan
oleh suatu sistem atau entitas buatan. Sistem ini
umumnya adalah komputer. Kecerdasan diciptakan
dan dimasukkan ke dalam komputer yang
bertujuan agar dapat melakukan pekerjaan seperti
yang dapat dilakukan manusia
2
Gambar 3 Segmentasi menggunakan mean shift Secara umum sistem deteksi manusia ini
Kelebihan metode ini adalah dapat digunakan memiliki input real time dari webcam dan 2 buah
untuk preprocessing pada sistem yang memiliki pemrosesan yaitu segmentasi dan klasifikasi
input real time. Sedangkan kelemahannya terletak sehingga menghasilkan output berupa kesimpulan
dari komputasi yang rumit. bahwa objek yang terdeteksi adalah manusia.
2.4 Jaringan Syaraf Tiruan (JST)
JST adalah sistem pemroses informasi yang
memiliki karakteristik mirip dengan jaringan syaraf
biologi (Gambar 4). JST dibentuk sebagai
generalisasi model matematika dari jaringan syaraf
biologi [8].
Gambar 5 Gambaran umum sistem
3.2 Analisis JST
Mengingat bahwa manusia bersifat dinamis, maka
arsitektur JST yang akan dibangun merupakan tugas
yang kompleks. Oleh karena itu diperlukan “mesin
penghitung” yang dapat melakukan proses iterasi
dengan jumlah neuron bergantung pada percobaan
(trial and error).
1. Jumlah Neuron input
Gambar 4 Susunan sel syaraf biologi Input JST berasal dari proses segmentasi 62 x 56
Komponen utama JST meniru susunan sel syaraf pixel = 3472 atau hasil dari proses yang ditampilkan
biologi yaitu neuron yang terdiri dari dendrites pada kamera virtual segmentasi.
(sebagai input), tubuh sel (cell body) disebut juga
soma dan axon (sebagai output). JST ditentukan
oleh 3 hal, yaitu: (1) Arsitektur jaringan; (2)
Metode pembelajaran; dan (3) Fungsi aktivasi.
1. Arsitektur Jaringan
Pola hubungan antar neuron pada JST disebut
arsitektur jaringan. Secara umum terdapat tiga
buah arsitektur JST yaitu: perceptron (single layer),
MLP (multilayer perceptron) yang memiliki Gambar 6 Matriks untuk input neuron
minimal satu buah layer tersembunyi (hidden) 2. Jumlah output layer
antara lapisan input dan output serta recurrent Lapisan output terdiri dari 3472 buah neuron
network yang memiliki feedback loop. dengan pixel aktif ditentukan sesuai dengan pola
2. Metode pembelajaran inputnya yaitu ukuran pattern 62x56 pixel. Semua
Metode pembelajaran (learning) atau pelatihan neuron yang keluar akan disesuaikan bobotnya
adalah metode untuk menentukan bobot dengan pola tubuh manusia pada neuron output.
penghubung (weight.) Salah satu metode Yaitu untuk menghasilkan klasifikasi “manusia”.
pembelajaran yang digunakan dalam pengenalan 3. Jumlah lapisan tersembunyi (hiden layer)
pola atau klasifikasi objek adalah backpropagation. Jumlah hiden layer ditentukan sebanyak 1500 untuk
Metode backpropagation merupakan pelatihan JST meringankan kinerja prosesor. Misalnya untuk
dengan supervisi (supervised) yaitu terdapat melatih satu citra.
sejumlah pasangan data (masukan – target
keluaran) yang dipakai untuk melatih jaringan
hingga diperoleh bobot yang diinginkan.
3. Fungsi Aktivasi
Fungsi aktivasi menentukan apakah neuron akan
mengalami aktivasi atau tidak. Argumen fungsi
aktivasi adalah net masukan (kombinasi linier Gambar 7 Visualisasi nilai pola pada matriks
masukan dan bobotnya.) Jika net = xi wi , maka Pada Gambar 7-a merupakan data hasil
thresholding (citra statis); Gambar 7-b perbesaran
fungsi aktivasinya adalah f (net)=f ( xi wi ). pixel, Gambar 7-c nilai pixel bilevel.
Salah satu fungsi aktivasi adalah sigmoid bipolar.
3. Analisis dan Perancangan Sistem
3.1 Analisis Sistem
3
Gambar 10 Asumsi untuk sistem
4. Implementasi dan Pengujian Sistem
4.1 Implementasi
Pola untuk pelatihan JST diambil secara
konvensional dari area proses segmentasi pada
aplikasi yang dicapture kemudian diresize karena
ukuran dari citra yang akan diproses harus sama
dengan jumlah panjang dan lebar dari input neuron,
yaitu 62 x 56. Gambar 11 merupakan beberapa citra
Gambar 8 Arsitektur JST yang akan diuji (bilevel) untuk pola pelatihan JST.
Neuron X1 s.d X3472 merupakan input pattern
sedangkan Z1 s.d Z1500 adalah hidden layer
(masih dalam pengujian) dan Y1 s.d. Y3472 output
pattern. Fungsi aktivasi yang digunakan adalah
bipolar sigmoid menghasilkan jangkauan antara -1 Gambar 11 Citra untuk pola pelatihan
dan 1.
3.3 Perancangan Sistem
Asumsi untuk aktor (pengguna) sistem adalah
operator yang bertugas untuk mengaktifkan dan
menghentikan sistem sehingga bila digambarkan
diagram use case-nya seperti pada Gambar 9.
4
Uji ke- Estimasi jarak ke Terdeteksi Waktu Keterangan
webcam (meter) (Ya/Tidak) (menit)
1 0,1 T >1 Tampil pesan error
2 1 Y 2 Tanpa gerakan (diam)
3 1,5 T 5 Pinggang hingga kepala tertangkap
webcam
4 2 Y 1 Bergerak memutar
5 3 T 3 Menghadap webcam
6 3 T 4 -
7 1 Y >1 Hanya kepala yang tertangkap webcam
8 4 T 1 Pinggang hingga kepala tertangkap
webcam
9 2 Y 2 Bergerak perlahan
10 1 T 3 -
Dari beberapa pengujian sebelumnya, hasil pada pengujian pertama di mana jarak objek
tabel di atas merupakan yang terbaik pada sistem (manusia) ke webcam adalah 0,1 meter.
pendeteksian manusia ini. Dengan demikian 5.2 Saran
keakuratan sistem hanya sebesar 40%. Namun hal Setelah melakukan penelitian menggunakan
ini membuktikan bahwa artificial neural network classifier JST, maka penulis dapat memberikan
atau JST dapat digunakan pada sistem real-time di saran untuk pengembangan sistem lebih lanjut.
mana data input berasal dari webcam secara 1. Untuk membangun sistem real-
kontinu tiap detik. time diperlukan perangkat keras (hardware)
5 Kesimpulan dan Saran khusus seperti mainframe sehingga
5.1 Kesimpulan pemrosesan iterasi JST dapat berlangsung
Berdasarkan hasil pengujian sistem dan dengan cepat hal ini terlihat pada jumlah
analisis secara menyeluruh maka dapat ditarik neuron pada lapisan tersembunyi yang
beberapa kesimpulan sebagai berikut: digunakan yaitu sebanyak 1500 neuron.
1. Posisi terbaik yang dapat dideteksi oleh 2. Perlu ditambahkan beberapa buah
sistem adalah berjarak maksimal 2 meter dari classifier misalnya klasifikasi warna kulit,
webcam. Hal ini ditunjukkan pada percobaan deteksi wajah dan JST yang telah dikoreksi
kedua, keempat, ketujuh dan kesembilan, parameternya baik bobot awal, threshold,
sistem dapat mendeteksi manusia dengan jumlah neuron pada lapisan input, lapisan
waktu maksimal selama 2 menit. tersembunyi (hiden layer) dan jumlah neuron
2. Mengingat bahwa persentase pada lapisan output serta integrasi dari
keberhasilan sebesar 40%, sistem beberapa classifier tersebut sehingga dapat
pendeteksian manusia ini kurang berhasil dari menghasilkan sistem pendeteksian manusia
segi kecepatan oleh karena itu perlu diadakan yang mantap (the robust of human detection
kajian ulang mengenai jumlah neuron dan system).
pelatihannya serta proses segmentasi yang 3. Pada sistem “cerdas” untuk
dilakukan. pengawasan (surveillance) baik indoor
3. Jika jarak objek (manusia) sangat dekat maupun outdoor yang lebih kompleks dan
dengan webcam, maka sistem akan rumit, diperlukan sebuah kamera yang
menampilkan pesan error yang mengacu pada memiliki resolusi tinggi yang dapat mengatur
file HD.dll, ini disebabkan karena rutin pada kontras dan luminans secara otomatis
file dynamic link library menggunakan sehingga para developer dapat berfokus pada
OpenCV yang direkomendasikan untuk bagian inti proses untuk mengembangkan
prosesor intel. Hal ini dapat dilihat pada hasil sistem behavior understanding.
5
Referensi
[10] Nugroho, Adi. Rational Rose Untuk
[1] A. Maxwell, Bruce. Computer Vision Pemodelan Berorientasi Objek. Informatika,
Lecture. Department of Engineering, Bandung. 2005.
Swarthmore College,
http://www.palantir.swarthmore.edu/maxwel [11] Picardi, Massimo and Jan, Tony. Recent
l/classes/e27/S01/E27_S01_Lectures.pdf, 5 Advances in Computer Vision. American
April 2006. Institute of Physics.
http://www.aip.org/tip/INPHFA/vol-9/iss-
[2] Achmad, Balza dan Firdausy, Kartika. 1/p18.pdf. 5 April 2006.
Teknik Pengolahan Citra Digital
Menggunakan Delphi. Ardi Group, [12] Raharjo, Budi. Pemrograman C++.
Yogyakarta. 2005. Informatika, Bandung. 2006.
[3] Agustian, Ivan. Motion Berbasiskan [13] Russell, James. Detecting Humans in Video
Segmentasi Gambar Dimanfaatkan Untuk Footage Using Multiple Classifiers.
Deteksi Gerak Ditinjau dari Aspek Rasio http://www.csse.uwa.edu.au/~eunjung/James
dan Arah Gerak. Unpublished Paper. Teknik R/jamesRthesis.pdf. 5 April 2006.
Informatika UNIKOM, Bandung. 2006.
[14] Stergiou, Chirtos dan Siganos, Dimitrious.
[4] Dharwiyanti, Sri and Wahono, R. Satria. Neural Networks.
Pengantar Unified Modeling Language http://www.doc.ic.ac.uk/~nd/surprise_96/jour
(UML). IlmuKomputer.Com. nal/vol4/cs11/report.html, 29 Maret 2006.
http://ilmukomputer.com/umum/yanti-
uml.php, 23 April 2006. [15] Sutopo, Ariesto Hadi. Analisis Dan Desain
Berorientasi Objek. J & J Learning,
[5] EC4041 Pengolahan Citra dan Pengenalan Yogyakarta. 2002.
Pola. Konsep Pengenalan Pola Secara
Digital. Departemen Teknik Elektro, ITB. [16] Wikipedia the free encyclopedia. Computer
2004. Vision.
http://en.wikipedia.org/wiki/Computer_visio
[6] Hariyanto, Bambang. Rekayasa Sistem n, 23 April 2006.
Berorientasi Objek. Informatika, Bandung,
2004.
BIODATA
[7] Hendra, Ade. Rekayasa Sistem Pengamanan Kanda Irawan. Lahir di Ciamis, 26 Juni 1982.
Ruang Berbasis Video. Unpublished Paper. Lulus Madrasah Aliyah Negeri (MAN) Cipasung
Teknik Informatika UNIKOM, Bandung. Tasikmalaya tahun 2001 dan melanjutkan kuliah di
2005. Universitas Komputer Indonesia (UNIKOM)
Bandung.
[8] Kristanto, Andri. Jaringan Syaraf Tiruan
(Konsep Dasar, Algoritma dan Aplikasi). Tahun 2005 penulis melakukan penelitian IT dan
Gaya Media, Yogyakarta. 2004. kerja praktek di divisi marketing PT. Indosat, Tbk
Cabang Bandung selama 1 bulan (30 Mei s.d. 28
[9] Kusumadewi, Sri. Artificial Intelligence Juni.)
(Tenik dan Aplikasinya). Graha Ilmu,
Yogyakarta. 2003.