ROBOT
rRDII'YRII
\/tsr
Ir l\ll
M.'RYUTI
#
t
t
t
* }
PUSTAKAAN
ARSIPAN
TAWATTN4UR
,29.8
FAD il
r.3
t
,@
@cnaHArLMU
ROBOT
VISI
ROBOT VISI
,,1,i ':. {
Oleh : FadlisYah '.ro 4
I
M. SaYuti . !:::? ,, ,'.
il
KATA PENGANTAR
,. - 'i.i':t' .:) |
,.,,,.-*-",.".".*".,.
EdisiPertama 2 0> ' t?T
Cetakan Pertama,2009
lBfr(?1zorz
Hak Cipta O 2009 Pada Penulis,
Hak Cipta dilindungi undang-undang. Dilarang memperbanyak atau
memindahkan sebagian atau seluruh isi buku ini dalam bentuk apa engan mengucapkan puji dan syukur kehadirat
pun, secara elektronis maupun mekanis, termasuk memfotokopi,
merekam, atau dengan teknik perekaman lainnya, Allah SWT, di mana atas rahmat dan karunia-
tanpa izin tertulis dari penerbit. Nya Penulis telah dapat menyelesaikan huku
yang berjudul "ROBOT VlSf'.
/'"'
DAFTAR ISI
KATA PENCANTAR v
DAFIAR lsl
vii
BAB 1 "KEHIDUPAN"AWAT ROBOT I
BAB 2 STUDIAWAI INTERAKSIMANUSIA
ROBOT PEER.TGPEER 11
2.1 Pengenalan t1
2.1.1 proyek HRI peer-topeer 11
2.1.2 Sistem operasi HRI 12
2.2 Evaluasiawal 't5
59
7.2.2 Pembelajaran model
Pendahuluan
5.1
62
jaringan Markov 91
5.2 Melihat segalanYa
7.2.3 Melibatkan pose dalam model
5.2.1 Sensorjangkauan right-stripe 62
jaringan Markov 93
5.2.2 Omnikamera aliran oPtis 64
7.3 Pemodelanprobabilitas multiple-frame 95
5.3 Mendeteksi pergerakan dan pergerakan
66
7.3.1 Batasan temporal gS
lanjutan objek
7.3.2 lnferensi 96
VISUAL HULL CONSTRUCTION 71
BAB 6 BAB B PENCANTAR PENGOLAHAN
Pendahuluan 71
6.1 CITRA VIDEO (V!P) SUATU
6.2 Latar belakang 74
PENDEKATAN DATAM ROBOTVISION 101
6.2.1 Skenario SFS 74
8.1 Pendahuluan 1OZ
6.2.2 Visual Hull 75
8.2 Pengolahan citra pada robot mobile 102
6.3 Visual hull construction 76
8.2.1 Komputer visi dan pengolahan
6.3.1 Komputasi visual hull dengan
citra 103
irisan batas kerucut 76
8.2.2 Robot visi 104
6.3.2 Konstruksi dari pengaproksi-
masian visual hull dengan BAB 9 VISUAL SERVOING 107
pengklasifikasian voxel 77 9.1 Pendahuluan 107
6.4 Visual hull construction dari si/houette 9.2 Pemodelan formasi citra catad ioptric
"noise" pada waktu nYata 7B sentral 109
6.4.1 KecePatan dan keakuratan 9.3 Tracking dan kontrol 114
metode visual hull construction 9.4 Matri ks Jacobian catad ioptr i c 116
berbasis voxel 7B
10.1
CITRA STEREO
DAN DIFERENSIAL
Pendahuluan
- FORMULASI DISKRIT
119
119
1Salo, /
1O.2 Estimasi pergerakan 120 .KEHIDUPAN"
10.3 Pendekatan diferensial 121 AWAL ROBOT
1O.4 Formulasidiskrit 124
BAB 11 ESTIMASI POSE UNTUK SISTEM
CATADIOPTRIC SENTRAL:
PENDEKATAN ANALITIS 127
11.1 Pendahuluan 127
11 "2 Formasi citra catadioptric 128
11.3 Estimasi pose 131
11.3.1 Estimasi rotasi 132 One machine can do the work of a hundred ordinary
11.3.2 Estimasi translasi 134 men, but no machine con do the workof one
'11.4 Eksperimen 137 extroordinory mon
1 1.5 Kesimpulan 139 (Elbert Hubbard)
Robot Visi
persepsi baku di kalangan manusia pada umumnya,
dan untuk itu, definisi diberikan oleh Robot lnstitute of
setelah film robot Jerman, Metropolis, pada tahun 1926
America, "A robot is a reprogrammable multi-functional
dibuat, dan dipertontonkan di New York World's Fair
manipulator designed to move materials, parts, tools, or
pada tahun 1939, yang ceritanya diperankan oleh robot
specialized devices, through variable programmed
Electro yang dapat berjalan sebagaimana manusia dan
motions for the pertormance of a variety of tasks."
ditemani anjingnya Sparko. Dan mungkin juga kita masih
Definisi yang lain adalah, "A robot is reprogram-mable
ingat sebuah film ruang angkasa Star Wars dengan
general-purpose manipulator with external sensors that
robotnya C3PO, yang dirilis tahun 1977.feieipi jika kita
can perform various assembly tasks." Berdasarkan definisi
bandingkan robot-iobot imajinatif yang hadir di beberapa
terakhir ini, sebuah robot harus memiliki syarat
"intelligence," yang mana secara normal dapat kita
film tersebut, dengan robot-robot industri yang
sebenarnya, maka akan timbul pertanyaan pada diri kita,
katakan syarat "inte/Iigence" tersebut sangat berkaitan erat
"Apakah sudah secanggih itukah robot-robot yang telah
dengan algoritma pemrograman komputer untuk aplikasi
dikeluarkan oleh industri dunia?." Di dalam lilm "Artificial
kontrol dan sistem sensor.
lntelligence," yan1 dirilis beberapa tahun yang lalu,
Kata robot sendiri dikenalkan di dalam bahasa menceritakan bagaimana robot "anak kecil" yang
lnggris pada ahun 1921 oleh seorang aftis, Karel Capek dilengkapi emosional seperti manusia, merindukan peran
dalam perannya pada drama satire, R.U.R. (Rossum's ibu yang dapat menyayangi dan memperlakukan dirinya
Universal Robots). Di dalam drama tersebut, robot+obot (robot "anak kecil") sebagaimana anak manusia lainnya
berperan sebagai suatu mesin yang menyerupai fisik yang normal. Apakah telah sejauh inikah kontribusi yang
rnanusia, dan memiliki kemampuan bekerja yang tidak telah diberikan oleh ilmuwan-ilmuwan robot dunia
kenal lelah. Pada awalnya, robot dipabrikasi untuk terhadap robot ciptaannya, dan seberapa mungkinkah ini
nreningkatkan produksi perusahaan dengan mengganti- dapat direalisasikan ?.
Robot Visi
"Kehidupn" Awol Robot
jenis "master-slave" yang dirancang untuk menghasilkan adalah peran sebuah komputer yang melakukan sharing
suatu pergerakan tangan dan lengan yang dapat dipercaya dengan manipulator untuk menghasilkan suatu mesin
yang dilakukan oleh seorang operator, dalam hal ini yang dapat berpikir atau mengambil beberapa keputusan
manusia. Manipulator omaster" tersebut dikendali-kan secara otomatis menghadapi berbagai tugas atau kerja
oleh seorang user melalui sederetan pergerakkan, yang variatif. Tidak seperti mesin automasi biasa, robot
sementara manipulator "slave" menduplikasi unit tersebut dapat diprogram dan dirancang ulang dengan
umastef' sedekat mungkin. Kemudian, manipulator biaya yang relatif rendah, untuk melakukan tugas-tugas
mekanis terkontrol tersebut diberikan suatu timbal balik sesuai kebutuhan manufaktur.
gaya, untuk mengkopling secara mekanis pergerakan dari
Pada tahun 1960-an, kefleksibelan mesin (robot)
unit "master" dan "slave" dengan tujuan operator dapat
mampu ditingkatkan secara signifikan dengan menginte.
merasakan suatu gaya seakan-akan mereka bekerja grasikan suatu sistem sensor pada mesin (robot). Awal dari
mengembangkan di antara manipulator "slave" dan
dekadeini, H. A. Ernst (1962) mengumumkan suatu
lingkungannya. Di pertengahan tahun'1950 kopling proyek pengembangan sebuah computer-controlled
mekanis telah tergantikan oleh tenaga hidrolik dan
mechanical hand dengan sebuah sensor tactile, yang
elektris, yang penerapannya pada beberapa manipulator
disebut MH-l, suatu perangkat yang dapat "merasakan,,
sepefti, Ceneral Electric's Handyman dan, Minotaur I
beban, dan memanfaatkan informasi tersebut untuk
yang diciptakan oleh Ceneral Mills.
mengontrol tangan (han&machine) supaya beban dapat
Proyek manipulator master-slave secara cepat ditumpuk tanpa bantuan dari operator. Dan proyek ini
diikuti oleh perkembangan sistem-sistem berkaitan yang merupakan contoh peftama dari sebuah robot yang dapat
lebih mampu bekerja secara otomatis, dan beroperasi mengadaptasikan sifat-sifat atau prilakunya di dalam suatu
secara repetitif. Dalam pertengahan tahun 1950, Ceorge lingkungan yang tidak terstruktur. Sistem manipulasinya,
C. Devol merancang suatu perangkat yang dia sebut terdiri dari sebuah manipulator ANL modelS dengan 6
" program med articul ated transfer device," sebagai sebuah denjat kebebasan yang dikendalikan oleh sebuah kom-
manipulator yang memiliki operasi yang dapat diprogram puter TX-O melalui suatu perangkat antarmuka (interface).
(dirubah) dan diikuti oleh sebarisan pergerakan yang Program riset ini kemudian menjadi bagian dari proyek
dapat ditr:ntukan dengan memberikan beberapa instruksi MAC, dengan penambahan sebuah kamera televisi
di dalam program pada sistem tersebut. Pengembangan terhadap manipulator sebagai awal dari riset "machine
lebih jauh dari konsep tersebut, dilakukan oleh Devol dan perception." Di dalam periode yang sama pula, Tomovic
Joseph F. Engelberger, yang telah berjasa membuka dan Boni ('1962) telah mengembangkan suatu prototipe
sejarah awal robot industri, yang diperkenalkan oleh tangan manusia yang dilengkapi sebuah sensor tekanan
Unimation lnc. pada tahun 1959. Kuncidari perangkat ini yang berfungsi menyeleksi keputusan pada berbagai
.otrtiiln 27Oo
Gri0f*r mountrnr
mSce
2.1 Pengenalan
2.7.1 Proyek HRI peer-topeer
14 Robot Visi
Studi Awal lnteraksi lvlanusio-Robot 15
pengelasan (astronot dan robonaut), pemeriksaan hasil
pengelasan (Kl0). Adapun rincian waktu yang diperlukan
oleh masing-masing agen yang disajikan di dalam bentuk
tabel dapat dilihat pada tabel berikur
BespLtNg oere
li
1OO"/o
80"/"
60%
400/o
2Oo/o
(B) oo/"
12'rro",567
100%
,Lt nmr@bbo
80% hd]dilMm$*d
60%
o
E
- 40o/o
(Og. tttondtrr/
3.1 Pengenalan
3.1.1 Seiarah robot sosial
erkembangan sebuah robot setalu diinspirasikan
photoaxis positif, adalah sebagai indikasi bahwa robot- mana komunitas semut sosial mampu menghasilkan ber-
robot telah melakukan interaksi dengan cara<ara sosial bagai pola tingkah laku dan struktur fisik yang kompleks
yang umum, walaupun tanpa komunikasi eksplisit atau secara kolektif, walaupun masing-masing individu sering
rekognisi mutual. muncul sebagai "pekerja tunggal."
3.1.2 Robot sosial dan penanaman nilai-nilai Untuk melengkapi keempat poin di atas, di sini
sosial: konsep dan definisi dapat kita tambahkan tiga kelas sebagai berikut:
Robot pada masyarakat terindividual telah me Socially situated. Robots that are surrounded by a
nunjukkan jangkauan sifat dan tingkah laku yang luas, hal sxial environment that they perceive and react to.
ini dapat kia simpulkan dengan mengabaikan Socially situated robots must be able to distinguish
keberadaan robot-robot lainnya, manusia, atau keduanya between other sxial agents and various obieds in
pada lingkungan tersebut. Breazeal mendefinisikan empat the environment.
kelas dari robot sosial berdasa*an keadaan (1) sebagai- Socially embedded. Robots that are: (a) situated in a
mana kemampuan robot dapat mendukung model sosial social environment and interact with other agents
yang dikaitkan terhadap robot sosial tersebut, dan (2) and humans; (b) strudurally coupled with their social
kompleksitas skenario interaksi yang dapat didukung. environment; and (c) at least partially aware of
Srcially evocative. Robots that rely on the human h u m an i nte rac. i o n al stru ctu re s (e. g., tu r ntaki n g).
tendenqr to anthropomorphize and capitalize on - Socially intelligent. Robots that show aspects of
felings evoked when humans nurttJre, care, or human style social intelligence, based on deep
involved with their "creation". models of human cognition and socialcompetence.
3.2.3.1 Morfologi
?
I
,E
g
gE
3.2.3.3 Anthropomorphi c
40 RobotVisi
Robot lnteroktif secora bslal 4t
Robot yang dirancang untuk 'Health Care',
point" yang mampu mengambil alih perhatian manusia.
misalkan, diperlukan untuk membantu para pasien yang
Severinson-Eklund, 2002, memaparkan kegunaan dari
sudah manula, atau tidak mampu berjalan, memindahkan
sebuah karakter mekanis yang berukuran kecil, 'CERO",
para pasien, dan lain-lain. Dan untuk itu, fitur-fitur lain
sebagai sebuah robot yang representatif dan interaktif
yang ada di luar robot sangat diperlukan, seperti "ruang
Gambar 3.5). cargo" dan " handle bar.'
3.2.3.6 Fungsional
P
Gambar 3.8 Aibo ERS-200 (top) and ER5-300 series
Gambar 3.1O (a) SDR4X (Sony), (b) P3 (Honda)
(SonY)
-{ I
i,i
44 Robot Visi 1
i ,
cal Report No. 32, Northwestern University, 1992, E. 3.2.4.2Emosi sebagai mekanisme terkontrol
Hudlicka, lncreasing SIA architecture realism by
Emosi dapat digunakan sebagai presedens kontrol
modeling and adapting to affect and personality. ln K.
diantara berbagai mode tingkah laku yang berbeda,
Dautenhahn et al., eds., Socially lntelligent Agents:
mengkoordinasikan perencanaan, dan sebagai pemacu
Creating Relationships with Computers and Robots,
pembelajaran dan adaptasi terhadap lingkungan tugas-
Kluwer, 2002, W. Reilly, Believable social and emoti-
nya, lebih-lebih jika lingkungan yang dihadapinya sulit
onal agents, Ph.D. fhesis, Computer Science, Carne-
untuk diprediksi. Untuk itu berbagai pendekatan dirumus-
gie Mellon lJniversity, 1996, l. Velasquez, Modeling
kan dengan mengadopsikan kondisi atau keadaan emosi
emotions and other motivations in synthetic agents,
in: Proceedings of the Fourteenth Nation al Conferen- dari berbagai hewan yang menggunakan instingnya
dalam menghadapi lingkungannya, misalkan insting pada
ce on Artificial tntelligence, 1997, J. Velasquez, A
computational framework for emotion-based control,
hewan dalam melarikan diri dari keadaan yang
berbahaya, mencari *Lk"n"n, dan lain-lain.
in: Proceedings of the work'shop on grounding emo-
tions in adaptive systems, Conference on Simulation Beberapa peneliti, telah melakukan investigasi ter-
of Adaptive Behavior, 1998. Beberapa arsitektur yang hadap manfaat emosi di dalam interaksi interaksi ma-
diajukan menyandarkan pada berbagai teori emosi- nusia-robot. Suzuki telah mendeskripsikan suatu arsitektur
onal, atau secara khusus, dapat kita katakan toeri ten- yang memungkinkan interaksi memberi dampak per-
tang bagaimanakah emosi didefinisikan dan dihasil- ubahan terhadap "state'! emosi dari robot dan pemodifi-
kan. Dan arsitektur yang lain dirancang dengan suatu kasian respon gerak dari robot tersebut. Breazeal juga
cara ad-hoc, untuk pendapat terakhir didukung oleh mendiskusikan bagaiamana emosi dapat mempengaruhi
Nourbakhsh dan kawan-kawan, yang merincikan operasi Kismet's motivational system dan bagaimana
suatu sistem berbasis mesin state fuzzy, yang pengaruhnya terhadap proses penginteraksian manusia-
dibangun oleh sederetan evaluasi formatif dan siklus robot. Dan Nourbakhsh mendiskusikan bagaimana
perancangan. perubahan "mood" dapat memacu perubahan sikap yang
berbeda pada Sage (a museum tour robot).
ln terms of expression, some robos are only
capable of displaying emotion in a limited way, such as 3.2.4.3 Speech
indiv:idually aduated lips or flashing lights (usually LEDs).
Speech merupakan metode yang sangat efektif
Other robos have many active degrees of freedom and
untuk mengkomunikasikan emosi. Berbagai parameter
can thus provide richer movement and gestures. Kismet,
utama yang mengendalikan muatan emosi antara lain:
for example, has controllable eyebrow, ears, eyeballs,
"loudness, pitch (level, variation, range), dan
eyelids, a mouth with two lips and a panltilt neck-
prosody." Murray dan Arnott berpendapat bahwa efek
k
berbagai ekpresi, dan pergerakan face layaknya seorang
manusia.
mSce
ffi
Gambar 3.14 Face robot "saya"
(Science University of Tokyo)
4.1 Pendahuluan
ada bab ini kita akan mendeskripsikan sebuah
sensor visi komputasional VLSI analog untuk
kegunaan perhitungan daerah dan sentroid dari
berbagai objek intensitas terkode. Daerah dan lokasi (x, y)
dari objek dibaca secara langsung pada tiga pin analog,
sebagai suatu citra hasil pensensoran, operasi low-latency
melakukan penyesuaian untuk aplikasi uacking seperti
tracking untuk objek mata atau kepala, dan sebuah
prototipe sel 43x43 diimplementasikan pada teknotogi
CMOS 2p, di mana masing-masing sel/pixel berukuran an-pendekatan konservatif lebih menekankan kinerjanya
471tx471t dengan fill-factor sebesar 30%. hanya pada citra yang memiliki objek dengan latar yang
bertolak-belakang tingkat keabuannya dengan tingkat
keabuan obfek yang akan ditracking, dan untuk citra-citra
yang memiliki susunan objek dan background yang lebih
e
L komplek, maka diperlukan suatu pendekatan pen-
al)
C
yang lebih handal. Untuk citra yang
segrnentasian
E nremiliki susunan warna yang lebih kompleks, Standley
E memperkenalkan suatu metode pensegmentasian objek
4
dari backgroundnya dengan mengurangi nilai-nilai
treshold yang didefinisikan berdasarkan suatu keadaan
citra tertentu dari sebuah photocurrent pada masing
masing pixel dalam citra yang akan disegmentasikan.
to holizontal bus
b)
tak lama kemudian, chrp melakukan proses selanjutnya Uji coba berbagai pola yang dilakukan adalah dengan
hingga terbentuknya sebuah objek yang tidak nol dalam memilih dua sampel pola disk, overlapping dan non-
citra biner. Dari citra biner yang telah terbentuk terakhir, overlapping, dengan berbagai intensitas yang variatif (lihat
chip secara kontinu mengkalkulasikan daerah dan sen- gambar 4.3 dan gambar 4.4).
troid dari penyebaran berbagai pixel yang tidak nol,
menggunakan metode pemroyeksian dan 'twa I D
resistive grids.'
Gambar 4.5 Berbagai funtuk gelombang yang dihasilkan "The weokest link in many m&ile rfuts is perception. ln
order to build robts tlnt ore reliable and depndoble aN
untuk penguiian furbagai pola pada gambar 4.3 dan
mfe, we need to build rfuts thot can see. Perception is
gambar 4.4
becoming a solved pr$lem for certain constroined
environments. &,tt for rofuts working antdors, and at high
Cambar 4.5 menunjukkan bentuk gelombang untuk
speeds, and in close proximity to Nqle, perception is sfi{l
ketiga sampel disk, yang dimonitor menggunakan sebuah
ircomplete. Our robots need to *e objects; to detect
scope digiul. motion; and to detect which of thosr- objec:ts ore people. tn
the current state of the art, this requires multipte sensors
ceEgr) ond multiple means of interpretation,
5.1 Pendahuluan
da beberapa alasan sebuah mobilerobot tidak
dapat kita handalkan: error pada mekani(
kegagalan aktuator, kegagalan pada perencana-
an, kerusakan sistem komputer, dan lain-lain. Kebanyak-
an kekurangan-kekurangan tersebut terjadi pada ingkung-
I
58 Robot Visi
pemberhentian bus ke kantor, robot eksperimen yang akan lebih luas juga atau tidak terbatas pada lingkungan-
bertugas di museum dan stasiun kereta api. Tetapi saat ini, lingkungan yang suddh paten (rintangan-rintangan yang
mesin+nesin robot tersebut dapat lebih terjamin dan tidak mungkin muncul pun sudah dikondisikan, pencahayaan
perlu lagi dikuatirkan terhadap error atau kegagalan yang tidak begitu variatif, kondisi cuaca yang tetap, dan lain-
biasa terjadi, peluang untuk terjadi error atau .kegagalan lain).
tersebut semakin kecil. Tetapi untuk sistem ConneXXion,
orangrang dapat memilih, kendaraan tanpa sopir atau t '!i
? 4 *
bus konvensional dengan kapasitas terbatas yang hanya :
i
';'j
$
s
i 't
! F ;i
mampu menjemput penumpang yang mana saja yang 2 "E 5
!
;i j
pertama tiba di perhentian bus, permasalahan di sini lebih Dirt":rDrrkti obi{r r IrE !-Lira
Ft:nil:e:ttn iLlr}i
menekankan istilah "pengadaptasian" saja. Permasalahan Dgrtc: ob'{r r foDaof:r o o a a
(.ris::r n:'e:i it :! i:r l.?:a a
terakhir tersebut, untuk sistem ConneXXion, menjadi D:re=ce Ir':j*: ;r
a a a a a a o a a
kabar yang tidak baik bagi perusahaan yang bergerak di Dqret t a b:rttle rprroo*ss ir:r r-r
DilE{tob'{t rofoil ud E I o t t o t a e !
bidang perancangan robot untuk aplikasi kenderaan D{ttaE! '- rlori-j rr'eiY,' a t t e t I t
fI,i !]crir n']E oca:uird a a a a a a
atraktil tetapi kabar yang baik untuk para pengkaji atau I?Cr E 00'(t t!:t!o!:LF; De:t;t':ill
penelitidi bidang ilmu robot. I.}:6!It:e::r'l bor.uaF t a
D*:it oi'r ro E ri:br !:d a O a t a I t a
Citrs:l o'q:{r or dE ldErr} a o t
Ada dua karakteristik yang harus diintegrasikan, Dqlut u ob'rtt r-ror:tq rrierrrr'
Psos.i:e rrh io:odm' a t
agar aplikasi di atas dapat berlangsung sukses seperti yang Dgticr ob :r:o ue:ri: iidt t t t t t t I 3 a
t t t t t a a
diharapkan: { -r[:ir rt Br ri oo :idnat t a a
altit o!(Du! teraltl
1
t. Lingkungan harus terkondisikan, tujuannya agar F*:g*e lrue uCcrer a
Drr:roh {t oD ina rri iEft I a a a I o t I O t
robot dapat dengan mudah mendeteksi segala (:rsr$ o';;*r e: ror irrrs
a a o o a
rintangan-rintangan yang muncul setiap saat, dan D:re=,H eir o:Jef, tx
a a o a a a
2. Robot harus bergerak dengan pelan, dengan gerak alxl ir(le s iffi hE itEi J
Psoacs irr NftEs! t
robot yang tidak begitu cepat, maka akan memudah- D*txt ob'ut ro nr ra: t a t a t a a o o t
kan robot untuk membuat keputusan yang sederhana
Ci$::rr:ie:r i; iE i:! LL t t t a
En:ur E* o'l;sr x
rhr.r'r Biil. "h. r: m. ,rf rmF ! o o a a t o
ketika rintangan-rintangan tersebut muncul. Pada f otal !f,aobff of fu(liolr '{ppon!d
t0 t0 lt 0 6 I ll ll l0 I9 6
prinsipnya rintangan dapat dengan mudah dideteksi,
bil4 rintangan tersebut juga mudah disensor dan
disegmentasikan oleh robot. Gambar 5.1 Fungsi vs berbagaisensor untuk skenario
berkenderaan di kota
Kajiankia dalam bab ini adalah persepsi. Pada riset
yang lebih luas, wilayah kerja lingkungan yang diteliti
62 RobotVisi 63
Ada berbagai permasalahan dengan sensor
jangkauan right-stripe dan diantaranya adalah sulitnya objek yang sama. Secara visual, dapat dilihat pada gambar
untuk sensor bekerja secara efektif di siang hari yang 5.4.
begitu cerah, dikarenakan laser yang sulit mendeteksi
suatu objek pada citra yang memiliki background yang
cerah, dan untuk permasalahan ini Thorpe menggunakan
beberapa pendekatan paralel untuk membuat laser lebih
mudah melakukan pendeteksian:
a bandpass filter that closely matches the
Filtering:
put over the camera
laser is
Shuttering: the laser is fired in a pulse of a few
microseconds, and the camera's elearonic shufter is Cambar 5.4 Kiri, citradariomnikamera. Kenderaan dapat
opened for the same interval dilihat pada bagian kanan citra. Kanan, ciua yang telah
lmage subtraction: For a stationary scene, it is easy to diperbai ki, dikonversikan menjadi koordi nat sel i ndris,
collea two images, one with the laser on and one kotak pada bagian atas menunjuklcan porsiyang
with it off, and subtrad images. For a moving scene, diharapkan, posisi citra sesuai seakan akan tqpat
implementing this process requires image-splitting berhadapan dengan kenderaan kita,
optics or image registration.
u RotutWd
Robot: Pt-.rsr;psr 65
menggunakan sebuah ladar pada kenderaan NaVLab 8
yang dirancangnya, lalu kenderaan tersebut dikendarai
mengelilingi kampus CMU dengan melalui berbagaijalan
yang terdapat disekitarnya untuk mengumpulkan data
range. Untuk masing-masing frame data rangg Thorpe
peftama-tama melakukan pensegmentasian peta range
menjadi objek ,terkait. Untuk masing-masing objek,
Thorpe melakukan perbandingan keadaan objek dengan
\, daftar pergerakan objek yang sedang berlangsung dan
memisahkan keseluruhan titiktitik yang berhubungan
dengan pergerakan objek temebut. Untuk langkah utama
kedua, Thorpe dan kawan*awan memanfaatkan algo
ritma ICP (lterative Closest Points) untuk mendaftarkan
Gambar 5.6 Peta yang dihasilkan dari aliran optis,
titik-titik yang bukan kategori "non-moving" dengan peta
berbagai segmen garis men unj u kkan posisi kenderaan
yangtelah dikalkulasi dan yang muncul pada setiap lokal yang dibentuk dari hasil pendeteksian sebelumnya,
frame. Masingmasing posisi obiek dikalkulasikan sebagai
untuk menghitung posisi relatif kenderaan. Untuk
memprediksi bentuk (keadaan struktur) dari kenderaan
irisan terdekat dari lima garis penglihatan dari penjejakan
tersebut, Thorpe menggunakan filter lGlman.
optis. Langkah berikutnya adalah melakukan filter pada
posisi yangterkalkula5i pada berbagai pengamatan, untuk Setelah dilakukan peregistrasian pada dua frame
mengurangi sebaran titik pada lokasi rata-rata yang ditemukan, maka kia gunakan suatu algoritma
pendetekian pergerakan objek dan pose objek yang telah
5.3 Mendeteksi pergerakan dan dikalkulasikan untuk memisahkan sebarang objek yang
pergerakan lanjutan objek bergerak dari objek stasionernya. Dari hasil scanning
sebelumnya, telah diketahui yang mana daerahdaerah
Pendeteksian objek sangat diperlukan tetapi tidak
yang seharusnya tidak diduduki, dan jika ketahui ada
cukup hanya pendeteksian rija. Peftanyaan yang sung-
suatu objek yang mendiami atau melalui daer:ah tersebut,
guh ingin kia jawab disini bukan dimanakah posisi objek
maka ini berarti telah terjadinya suatu perpindahan. Hasil
tersebut sekarang?, tetapi kemanakah objek tersebut akan
selanjutnya bergerak?. Untuk itu, Thorpe menggunakan
dari pelokalisasian dan pemetaan relatif objek
ditunjukkan pada gambar 5.7.
pengolahan ladar untuk menjelajahi dan memprediki
pergerakan objek serta mengklasifikasikan objek secara
terbatas. Dalam ujicobanya, Thorpe dan kawan-kawan
Robot: Persepsi 67
66 Robot Visi
Gamhar 5.7 Lokalinsidan penletaan
Gannbar 5.9 Pendereksian pejalan kaki, sejumlah titik_titik
yang ditandai oleh tanda panah memiliki funtuk dan
karalaeri stik seorang peialan kaki
gOSC
Robt: Persepsi
69
'lSdh 6
VISUAL HULL CONSTRUCTION
6.1 Pendahuluan
bentuk objek 3D telah menjadi
suatu topik yang utama dan aktif di dalam sub
bidang komputer visi. Berbagai pendekatan algo
ritmis untuk pengestimasian telah banyak diajukan dalam
dua dekade terakhir ini yang diantaranya seperti yang
diungkapkan oleh L. C. Roberts. dalam penelitiannya
M ach i ne perception of th re*d i me nsi onal so/ids, pada
tahun '1977, H. H. Baker. Depth from Edge-and
lntensity-Based Stereo, pada tahun '1981, W. N. untuk mempercepat konstruksi dari VH, De Bonet dan
Martin dan J. K. Aggarwal, Volumetric descriptions of Viola memperluas ide rekonstruksi voxel yang
obiects from multiple views, 1983, P. Ciblin dan R" diaplikasikan terhadap objek transparan sebagai
Weiss, Reconstruction of surface from profiles, (ln penerapan konsep Roxels, Buehler menggunakan VH
Proceedings of lmage lJnderstanding Workshop), sebagai basis geometris penafsiran citra, dan lain-lain.
1987, C. Tomasi dan T. Kanade, Shape and motion Dengan jumlah riset yang memanfaatkan pendekatan
from image streams under orthography, 1992, A. SFS tersebut, maka, (dapat kita katakan) SFS merupa-
Faugeras, fhree-Dimensional Computer Visian: A kan metode standar dan populer yang digunakan
Ceometric Viewpoint, MIT Press, 1993, F. Rander, P.J. untuk pengestimasian bentuk objek.
Narayanan, dan T. Kanade, Virtualized reality:
Constructing time-varying virtual worlds from real Estimasi bentuk menggunakan SFS memiliki
world events, (ln Proceedings of IEEE Visualization beberapa keunggulan yang diantaranya adalah si/houfte
'97), 1997, S. Seitz dan C.R. Dyer. Photorealistic mudah dibaca dan diperoleh, secara khusus dalam
lingkungan yang indoor (terkondisikan/di dalam ruangan)
scene reconstruction by voxel coloring, (ln Procee-
dings of CVPR91, 1997, E. Boyer dan M. Berger. 3D
dimana posisi bayangan hanya mengalami sedikit per-
surface reconstruction using occluding contours, ubahan (pergeseran) dan kamera dalam keadaan statis.
1997, dan K.N. Kutulakos dan S. Seitz. A theory of lmplementasi dari SFS juga masih relatif terkondisikan
shape by space carving, 2000. Diantara keseluruhan
dibandingkan dengan berbagai metode lainnya seperti
pendekatan-pendekatan yang telah disebutkan di atas, metode multi-baseline stereo dan metode space carving.
ada suatu pendekatan yang disebut "Visual Hull (VH) Visual Hull terkonstruksi dari SFS merupakan batas-batas
construction" atau juga sering diistilahkan Shape From atas dari sebuah objek, dan hal ini dapat kita katakan
Si/houttes (SFS), suatu metode yang mengestimasikan sebagai sifat konservatif yang melekat untuk berbagai
bentuk dari sebuah objek berdasarkan keadaan aplikasi seperti menghindari rintangan di dalam ma-
bayangan gelap objek tersebut. Metode SFS ini nipulasi robot dan analisa visibilitas dalam navigasi, yang
diperkenalkan oleh Baumgart dalam disertasi Ph.D- mana lebih memerlukan batas-batas atas dari objek
dari pada batas-batas dalamnya.
nya yang berjudul Ceometric Modelling for Computer
Vision, Universitas Stanford, pada tahun '1974" Pada SFS memiliki keterbatasan dalam berbagai hal
saat ini, berbagai variasi dari SFS, representasi VH dan sepefti, pengkonsumsian waktu yang boros untuk ber-
aplikasinya telah banyak muncul di dalam berbagai bagai aplikasi pada waktu nyata, sensitif terhadap error
karya ilmiah atau riset yang diantaranya, Aggarwal pada pengektrakian si/houtte dan kalibrasi kamera,
telah menggunakan voxel sebagai suatu representasi sehingga kita sulit untuk menghindari berbagai noise yang
dari VH, Potmbsil memanfaatkan struktur data oktree terjadi pada citra yang diambil, lebihlebih, VH yang
74 RobotVisi
t Visual Hull Construction 75
sebagai sebuah volume terbesar yang mungkin yang
mendefinisikan secara tepat {5,f , Vk = 1,......, K}.
l.DividethespaceofinterestintoNxlx:\dircretet'oxelsr.ro. n=1,......,Yr.
2. Initialize all the ,\:t voxels as inside voxels.
3. Pedom:
]
penandaan yang salah pada silhouefte -nya yang
4. The approxiuate visual hufl *, is reprtseuted by the uuiou of all the itside voxets.
diakibatkan oleh keadaan noise dari cita originalnya
^10
a
r!5
f'ir
ifi i',
r
Eto
t0 5
2o t0
e,0 ^&
^,
a E{ *Ga
ir E a! Im
te
I E u a
l4 lO B* e.{ fo
r0
-?a
s
_s !s
o
o 4
ic
I
rs
$
(d)&+td+kdz. a'Bz
il:
d_
!0
!i
l6 !o
I
f,'* Ee
tril
U
9m 1m
s
4
82 Robot Visi
Visual HuU Construction
83
F
Ada dua keuntungan dalam menggunakilll ,,1,1I
7
pertama, waktu yimg diperlukan lebih ,,,t,,l
a
dibandingkan pendekatan langsung, kedua, rtnlori ;,rrrp
Gambar 6.6 Modifikasi visual hull construdion berbasis Kita asumsikan pixel-pixel adalah saling lepas sitrr ,,.rrn,r
berada di luar Z
secara teoritis adalah ekivalen tr.rlr,rrl.r;,
6.4.2 Algoritma fast visual hull construction pengujian suatu area proyeksi dengan
berbasis voxel menggunakan Sparse Pixel
e
pixel.l)r.rrr,,rr,
kata lain, formulasi
Occupancy Test (SPOT)
Untuk mengaplikasikan implementasi langsung PGA)=lr-.Gy'(l-6r-)
dari prosedur (1) proyeksi voxel, dan (2) pengujian
silhouene yang tumpang tindih, maka kita mbmerlukan
dan
N3Z jumlah memori dan N3Z jumlah pengujian untuk
K-1
sebuah voxel yang memiliki volume N"vNxN. Dikarena-
kan alasan keperluan memori dan jumlah pengujian yang
P(rR) = pI 0- p),
l=o
besar yang menyebabkan operasi begitu lambat dan
dan grafik pada gambar 6.5 adalah valid untuk polu{,ur.r
mahal, mak4 diperlukan suatu program yang handalyang
lisaan SPOT, dengan syarat kita harus mengp;;urtrl.rrr
lebih murah di dalam pengoperasiannya dan dengan
peran Z dengan Q. pemilihan
kebutuhan memori yang lebih sedikit, Pendekatan e semata-mata h,rrry.r
tersebut disebut juga Sparse Pixel Occupancy lest atau mempeftimbangkan lkeadaan kecepatan, memori, rl.rn
disingkat SPOT. lde dari pendekatan SPOT diilustrasikan akurasi. Di dalam aplikasi waktu nyata kata-k?ta rr1r,11
pada gambar 6.6. lebih dibutuhkan daripada kualitas, sehingga nil.rr ( )
7.1 Pendahuluan
i dalam interface perseptual manusia-mesin,
manusia melakukan komunikasi dengan korn-
puter menggunakan bahasa tubuh atau berbagai
pola gerak tertentu. Kebanyakan aktivitas peneliti lebih
memfokuskan pada rekognisi dan tracking dari per-
ffi RotutVisi
gerakan dan pola gerak khusus tubuh manusia. Selain posisi dari face (menggunakan sistem pendeteksian face),
daripada rekognisi aktivitas rutin manusia, seperti berjalan dan asumsi pose.
misalkan, pola isyarat tubuh bagian atas manusia juga
Tujuan kita di sini adalah untuk memperoleh posisi
memainkan peranan penting dalam komunikasi, dan juga
dari sendi-sendi tubuh berdasarkan citra yang diamati.
sebagai alat ukur yang penting untuk pemahaman intensi
Pada bingkai kerja Bayesian, diberikan fitur citra x,
dan interaksi. Dalam bab ini, kita akan membahas tentang
suatu sistem pendeteksian gerakan atau isyarat tubuh konfigurasi tubuh sebagai ft dapat diperkirakan sebagai:
bagian atas manusia secara otomatis. h=rrrg maxp(hlx)
dimana
P(hl x) = cP(xl h)P(h)
pada kajian bab ini, konfigurasi tubuh h terdiri dari
berbagai posisi dari sendi-sendi tubuh (1,2,...,N) yang
didenotasikan sebagai (s,,sr,....,s,). pff,l merupakan
fungsi probabilitas a priori dari konfigurasi tubuh bagian
(a) 0) atas h.
P(x lh) merupakan fungsi kemungkinan, dan
Gambar 7.1 (a) Pendetekian gerakan manusia dan P(h I x) merupakan probabilitas posterior.
analisis gerak isyarat, (b) suatu pemodelan jaringan
Markov dengan statestate teftentu dan node pengukuran
7.2.1 Pemodelan jaringan Markov
\ t*t
/*a *Jf*T
I il\ (b)
Fungsi 4(x; ls) direpresentasikan oleh berbagai koneksi
antara node state
modeljaringan Markov.
N, dan node pengukaran M, di dalam
ffiffi ffi
Gambar 7.2 (a) Pemodelan iaringan Markov untutk tubuh
Secara praktis, 4(x; lsi) dihitung dengan meng-
akumulasikan petunjuk atau isyarat gerakan dalam ruas
citra yang tidak terkait dengan suatu fungsi probabilitas.
Maka, kita perlu mengkonversikan pengukuran "energy,
menjadi pengukuran probabilitas. Untuk suatu body ioint
bagian atas, bulatan putih merupakan node state, bulatan i, fungsi kemungkinan 4(xi ls;) dihitung sebagai
yang hitam merupakan node pengukuran, (b) pemodelan
manusia kartun dan (c) hasil pendeteksrarr pergerakan fi(xi lsi) = Ce"P(-E)
tubuh bagian atas
dimana E merupakan fungsi oenergy'yang dihitung
Berdasarkan definisi node state, maka tidak ada sebagai
dapat kita definisikan ruas-ruas citra yang berkorespon- 7.2.2 Pembelaiaran model jaringan Markov
densi terhadap wrist, elbow, dan shou/der iornt sebagai
lower arm, upryr arm, dan shoulder girdle secara ber- Jaringan Markov mendekomposisi permasalahan
turut-turut. Selanjutnya rualruas citra tersebut dimodel- inferensi Bayesian menjadi state.state lokal dan
kan dalam bentuk manusia kartun, sepefti yang ditunjuk-
pengukuran tertentu. Dalam jaringan Markov, kita
kan pada gambar 7.2(b). memanfaatkan pengukuran probabilitas lokal seperti
P,(x, ls,)e,(x; ls;) aan p,i\,ils,7) untuk menyimputkan
Kita denotasikan state pada node i sebagai s,, dan
posisi sendi tubuh (body ioint) (s1,s2,....,sry). penam-
pengamatan pada node pengukuran terkait M; sebagai
bahan lain, untuk menghitung fungsi kemungkinan
xi. Seperti telah dijelaskan sebelumnya, s; berkaitan 4(r, lr,) maka kita terlebih dahulu mengestimasikan
dengan posisi sendi. Kita hitung x, dengan mengakumu-
dimana N, merupakan jumlah posisi sampel. Selanjut- Anggap sikap tubuh (body pose) sebagai z, maka
nya kia dapat menggunakan strategi boatrapping untuk persamaan
mengestimasi Pry(s; I s1). P(h I x) = cP(x lh)P(h)
akan menjadi
Untuk masing-masing pasangan posisi body ioint
P(h,ulx) = cP(x lh,u)P(h lu)P(u)
(r,,rr) yang bukan konfigurasi tetapan tubuh manusia
yang valid, dapat dilakukan pengurangan probabilitas Berbagai pose yang berbeda, u,akan menimbul-
dengan: kan distribusi probabilitas h yang berbeda pula. Secara
umum, untuk pose yang berbeda K, P(u) dapat
94 Robot Visi
Pe ndete ksi an Ge rakan Tubuh 95
I
1'''*' (t',,s,1*') juga dikatakan sebagai fungsi penentuan Dynamic Programming, untuk mengaplikasikan
jarak Caussian antara s,l dan.s,l*r. Parameter kovarians Dynamic Programming terlebih dahulu kita harus meng-
o
aproksimasikan model jaringan Markov seperti yang
dapat ditentukan secara empiris.
diilustrasikan pada gambar 7.5, sebagai suatu mega-state
7"3.2 lnferensi ,(r,St) seperti yang diilustrasikan pada gambar 7.6. St
Pada sub materi ini, kita akan memaparkan alge merepresentasikan suatu kombinasi berbagai posisi body
ritma inferensi yang diimplementasikan di dalam model
ioint, 5' = (r{,s1,...,rfu) pada frame ker. Selanjutnya
jaringan Markov untuk aplikasi multi-frame. Untuk itu,
kita menghitung fungsi kemungkinan masing-mhsing
maka kita memiliki dua pendekatan: Be/ief propagation
(BP), dan Dynamic Programming (DP)yang diambil untuk
mega-state, P(x lM(t,5t), dan berbagai probabilitas
menyelesaikan permasalahan inferensi Bayesian di dalam transisi di antara berbagai mega-state tersebut. Kita
jaringan. definiskan fungsi probabilitas Caussian untuk jarak rata-
rata antara seluruh posisi body joint di dalam frame I dan
Belief Propagation merupakan suatu algoritma
iteratif yang berdasarkan message passing, dan untuk me
f+l sebagaiberikut:
m HE
I
M(r-1, S'' )
H
Gambar 7.6 Aproksimasidengan rantai Markov dalam
model jaringan Markov untuk aplikasi multiple-lrame,
sebagai pendeteksran gerakan tubuh bagian atas manusia
m m&
Pe nd e te ki an Ge rokan Tubuh 99
98 Robot Visi
@ TSdh S
@
Gambar 7.9 Hasil inferensi pergerakan, ada 2 error yang
muncul pada baris ketiga yang disebabkan oleh iarak
"For robot perception, video comeros are very valuable
pergel angan tangan yang berdekatan dal am gambar,
sensors,but the computer vision methds applied to extroct
sehingga membingungkan pemrograman information from comera images are usually
computationatly expensive. lntegrating computer vision
methods into a robot control architecture requires to
fulonce exploitation of camero images with the need to
preserve reoctivity and robustness. We claim that better
software support is needed in order to facilitate and
simplifu the opplicotion of computer ision aN image
processing methds on outonomans mobile robots. ln
Cambar 7.1o Error yang disebabkan oleh oklusi particulor, such supprt must address a simplified
specificotion of imoge prxessing architectures, control ond
grlScra slnchronimtion issues of imoge processing steps, ond the
integration of the image processing mochinery into the
overoll robot control architecture. This pper introduces
the video image processing (VIP) framework, a software
framework for multithreaded control flow modeting in
robot vision."
Parameterization. Melakukan parameterisasi untuk Gambar 8.2 Aplikasi parameter dan konfigurasi
satu atau lebih operator pengolahan citra yang dilibatkan, managementtoolkit untuk sistem robot visi
9.1 Pendahuluan
esin visi memberikan suatu pengukuran
berbagai keadaan dunia tanpa perlu melalui
suatu "kontak fisik", memperluas kemam-
puan dan jangkauan robot untuk beroperasi lebih optimal
di dalam wilayah dan keadaan kerjanya, yang mungkin
tidak terkontrol secara akurat. Aplikasi visual-servoing
dapat menjadi salah satu solusi untuk menjangkau segala-
nya dengan kemampuan penglihatan yang lebih luas. Jadi
tujuan dari bab ini adalah membahas secara mendetail
konsep dan pengimplementasian dari aplikasi visual-
servoing, keuntungan, dan hambatan dari penerapannya.
112 RobotVisi
Visual krvoing 113
9.3 Tracking
4
dan kontrol
Cambar 9.1 menunjukkan perpindahan sebuah
objek yang rigid yang diamati oleh sebuah sensor
catadioptric sentral. Frame referensi Rb ditambahkan
pada tubuh objek yang bergerak, R merupakan matriks
rotasi di antara R, dan R dengan 7 merupakan posisi maka titik X diproyeksikan di dalam
x, =fi(X)pada
bidang citra catadioptric. Perpindahan sebuah objek
Q di dalam koordinat sensor, maka tujuan kita di sini
mengindikasikan perubahan pose dari objek tersebut
adalah untuk mengestimasikan pose dari objek yang yang dapat dideskripsikan sebagai pasangan kinematis
bergerak tersebut, dengan koordinat-koordinat
v). Pertimbangkan matriks 3x6 t^ =W I /] di
5 = (ro,
!L,rt,........,x8) dari sekumpulan n titik dari objek
mana X merupakan matriks yang tidak simetris dari
tersebut.
X dan I merupakan matriks identitas 3x3. Kecepatan
3D dari titik , berkaitan dengan perpindahan objek yang
setara dengan X = -r,d. Lebih-lebih jika -I, merupakan
matriks Jacobian dari fungsi f, dan J r = J,J
^
makS
kecepatan terkait dalam bidang citra cakdioptrrc adalah
x,=J16.
[-]-,t;l [t]l
Gambar 9.3 Estimasipose iteratif, I
merupakan matrils ,=l.,,oi
identitas 2nx2n dan garis yang putusputus
l=l,i ls=,s
berkorespondensi dengan perulangan timbal-bal ik L-r -or] Ltl
Andaikan X, mewakili titik generik model objek, Andaikan 3 = ft;,1,r,...,ii) menjadi sekumpulan
jika pose (R,f)diketahui maka posisi titik 3D di dalam titik model yang diproyeksikan di dalam citra berdasarkan
koordinat sensor adalah X = RXt + f. Dari persamaan estimasi por" (R,f) saat sekarang dan s =fi;,*7,...,*i|
merupakan posisi sebenarnya. Vektor E didefinisikan
sebagai f =s-3 dan bergantung pada error estimasi
Persamaan -cilpl I
,*,?*nffd*tr*rtt
p(r+o -+)
[-]-r;l [rl.l
,, =|w,,,*#fu,,)li :u-91
'L:;,;;]=L;l]"'
3ri;:l
membentuk hubungan antara error citra yang diukur E ".-li,,i,
;r
dan error d pada estimasi pose tubuh objek yang rigid. [; ;.] Lrl
Cp
(x)'
I
z*4[x\v'*z' .'l
r,(x)=l y I
lz*e,[F.r+z', )
Hasil yang dicapai adalah
Gambar 9.4 Dua baris hasil tracking. Baris pertam4
, I pz + 1(Y2 + 22) -(xY -x(p + fz)l obiek berpindah menuju ke kamera. pada baris kedua,
't; = o(z +-W
I
I grt -(pz + t(x2 + z'z)) 1'(p + fz) ) objek yang sama berpindah sejaiar dengan bidang citra
TSelc 'f 0
ESTIMASI PERGERAKAN 3D
DARI CTTRA STEREO-
FORMULASI DISKR,IT DAN
DIFERENSIAL
10.1 Pendahuluan
etode untuk penyelesaian masalah gerak
(pergerakan) dapat dik.lasifikasikan menjadi
metode kontinyu (diferensial) dan rnetode
diskrit. Kedua metode menggunakan sebarisan citra yang
bersifat temporal. Metodemetode yang terdahulu sering
dikatakan diskrit dikarenakan aplikasi metode tersebut
dalam memanfaatkan fitur-fitur objek dan kaitan fitur-fitur
tersebut terhadap waktu yang diasumsikan telah
diketahui, sebaliknya, metode diferensial menggunakan
aliran optis yang kontinu.
Titik-titik di dalam ruang 3D akan direpresen- Kedalaman sebuah titik pada waktu /' merupakan
rasikan oleh koordinat vektor P: [X Y Z[. Posisi I
kedalaman titik pada waktu ditambah suatu displac+
kamera dengan kamera lainnya adalah paralel dan ment pada arah Z - Y, , atau dapat dieskpresikan sebagai:
dipisahkan oleh baseline b" Vektor aliran dalam bidang
Vz=2,*2,.v"+Zr.v,
citra direpresentasikan oleh vt= (4,rt) untuk citra kiri
v'= ({,ri) untukcitra kanan.
dimana Z(x,y,t) merupakan suatu kedalaman
dan
pada waktu yang diberikan t, Z*,Zy dan Z,
Kita pertimbangkan suatu pergerakan yang rigid.
Andaikan Z merupakan kecepatan total 3D dari sebuah
merupakan turunan spatial-temporal dari Z(x,y,t), dan
titik P " Sebarang pergerakan yang rigicl dapat u, dan v, merupakan komponen-komponen aliran optis.
diekspresikan oleh suatu komponen translasi yang Formulasi tersebut sering juga diistilahkah sebagai DCCE
diberikan s*bagai t = [t, ty t.f dan komponen rotasi linier, Depth Change Constraint Equation.
Z Z_f
A=i'-U'-;5
(e) l/s ecm - iweariug &) f? emc - iocteaifug
&e arylitude of di:place- uoizz irdi:garity Bila kita hitung persarnaan diferensial tempora!
-E!:Ei
persamaan di atas, maka kita akan memperoleh:
Vz = Z, + Z*.v* + Z, .v,
(c) tt aru - iacrea:i:re (dl ,g
e:r,u - iacr"a3iEg
roi:e ialrelc<itie: the aq:Itude of riiFlac-
rent kecepatan pada citra dapat clitentukan oleh suatu relasi
yang diketahui dengan parameter pergerakan, sehingga
kita peroleh:
tZ"
J7 a
f or
21,fr,+rz,
17_
-z,t -
----Z-- -)
,1,
-fZr*i@*rZ*+UZ,y)
(e) flx ersr - ir:crea:ing (S lly errq " i$Ea3iDg f 2,, + i@ + r2,,, + yZr)
tbe::oqrlinrde of rti:place-
DSDT
ib* euplitude ofdiqilece'
IlBt rZ, * yZ*,1
Gambar 1O.2 Analisis error dalam citra sintetis di mana / merupakan vektor dengan enam parameter
pergerakan yang akan diestimasikan.
Vr-Binocular Flow Consvaint, koordinat x pada P
adalah xt pada citra kiri dan xr pada citra kanan. Parameter pergerakan, Binocular Flow Con-
straint, kecepatan 3D dalam arah Z dapat diekspresi-
I t O]'At I
nxlaztt -Qzr\t
1 -oxatl
di mana kia dapat gantikan koordinat titik-titik 3D X l-slyat oaAt I l
dan Idengan persamaan inversi proyeksi perspektifnya.
dan parameter pergerakan secara translasi adalah:
lO. Formulasi diskrit | =V-''T
Vz- DCCE diskrit, persamaan DCCE di dalam di mana Z merupakan matriks yang diperoleh dari suatu
forrnulasi diskrit adalah:
bentuk tertutup dari tralectory titik di dalam pergerakan
Vz:Zt*Zr-L,+Z,-L,, yang rigid.
v, *ff{a'_ct)
Pararneter pergerakan, formulasi diskrit berdasar-
kan ekspresi P'= R .P +T dan perluasannya, maka dapat
kita bentuk suatu relasi antara parameter pergerakan
diskrit (R dan I) dan titik-titik 3D P dan P'. Untuk
TSeb / /
ESTIMASI POSE SISTEM
CAIADIOPTRIC SENTRAL:
(a) Relative error of l'g (b) Relatile error of 17
rvith increasiog displace-
mant
with increasi,rg displace-
meut
PENDEKATAN ANALMS
11.1 Pendahuluan
stimasi pose merupakan salah satu isu yang sangat
penting dalam bidang komputer visi, dari aplikasi
untuk navigasi robot hingga rekonstruksi citra.
(c) Relat*"c error of 1'7 (d) Relative error of O1,
witb incre.rsiug rotatron rvith increasing rotatrou Pada umumnya sistem estimasi pose didasari pada
kamera perspektif standar, yang telah diakui memiliki
Cambar 1O.4 Analisis error di dalam citra riil keunggulan di dalam menjangkau hampir keseluruhan
sifat-sifat geometris. Di balik keunggulan tersebu! sistem
c8(s9C) tersebut memiliki juga kelemahan terutama pada
jangkauan sudut pandang yang sangat terbatas, yang
dapat menjadi fasilitas yang tidak begitu memadai dalam
penggunaannya pada berbagai sistem mobil robot. Untuk
mengatasi kelemahan tersebut, diimplementasikanlah
suatu sistem panorami( yang memanfaatkan sifat-sifat
cermin untuk menjangkau segala sudut pandang yang
tidak dapat dijangkau oleh kamera konvensional standar.
Bukan berarti tidak ada celah, sistem panoramik juga me.
miliki ketidaknyamanan di dalam, (1) sifat-sifat proyektif
geometris yang tidak begitu mudah diaplikasikan, dan (2)
rt
e[,, = 1x*,y*,261,'l) e P3 Pru^ = (xru*,Y6p,za2-) eT2
dan hanya satu sinar proyeksi p"u^, maka fungsi f( )
adalah injektif dan mempunyaisebuah invers f-r( ),
f-lgc1= (I.r- . Xrr*,Lrr^ . y.r^,Xr"^ . zr^^ -
nlrt-iMjr( )
EY
zrr-'E*W
'"cam -
Cambar 11.2 Llrutan model L)emetaan general
Transformasi yang non-linier dari sinar proyeksi Sinar proyeksi p dapat dikomputasikan sebagai:
p menjadi p,o^ didefinisikan sebagai fungsi f O,
p = f-1(Hi1.pi*c)
Pru* = Mrl(P)
Pi,,s =H. f(n I t -rie*) Posisi empat titik dalam koordinat alam harus
dipilih untuk memudahkan pengkomputasian.
H. = K.'R.'M,-
P114y = (xg,yg,zg)T
R.obot Visi
x30 Estimasi Pose untuk Sistem Catadioptric Sentrol 131
Pzw =(xo,Yo + L,zs)T
?vi.p; : R.P*i I
xi.R-t.pi = l.i.Rx(- Olnr(- \')Rz(- 0)'p; = P*;
Gambar 1 1.t S in ar-s i n ar p royefl;* d i gu n akan u nt u k
Sinar-sinar tersebut direpresentasikan pada gambar
11.3. Untuk memuclahkan manipulasi aljabar, titik
seNanjutnya yang herbeda yang berasal darititik terakhir Catatan, persamaan terakhir merepresentasikan 3
yang cliperoleh ciari hasil perotasian pada sekeliling persamaan, dan, dengan empat titik, kita akan memiliki
sumbu Z, akan digunakan, sehingga: 12 persamaan yang lain, dan 8 variabel yang tidak
pi'= (.xi' ,yi,zi )' = t<rt'glP,
diketahui: 1r,1r,),r,1t,0,V,L,W . Persamaan dalam
y dan ( dapatditulis sebagai berikur
sehingga persamaan,
x-Xl* _y*yw
Untuk menghitung ty dan @ ,0 dibutuhkan, yang y,
nlrw -T x yt* -Ty
=7,:1w__
Z1r* -T,
'
d i peroleh dengan mensubstitusi kan persamaan :
ke dalanr persamaan:
_ :r-JF!.-
,"r r ..r +t"r2.ur *ria.; r - t'27.:E L+7]22'ut * r
r
i- itu ''z:l'i-:
:
tllt rrr.t r*r'rr.yr {-rla.: r
83. z4 - *4. rS -?l-.'Utu'
,lll
a, . u3 -u1 .t3
yang beririsan dengan bidang z=zt*+d, maka kita
peroleh pusat cermin L = (x ! r,) di tlalam koordinat
", ",
sehingga diperoleh: alam adalah sebagai:
(
tan?, A.cmd+B.sind
1I rane = n-co60+E.sin0
I =
-:-7:-:-
a"e -'v--
= frff4|
t
sehingga persamaan kuadratik pada d dapat
diekspresikan sebagai : Gambar 11.4 Vekor dengan titik kedua
p,,12+q.rtfr=0
p = (r - cor2.r) . (u, + r,. + r) 11.4 Eksperimen
t\
q= -').(t -cos2").(", *6,+ l). Nilai-nilai baku yang ditentukan sebagai definisi
I [r:*
[ -;r:r,,,)-F b.(!z* - yr,"i f (:ru, -:r,, l]
.[a. awal di dalam sistem adalah:
[ ,.=.1.(r3,, -rr*]t lt,(y2o, -yI,,)+(;!,, - r,",)]3 -cosro. p : ,l(1. pr : I0]r, d :
I .(r'+ r,1+ r) , [{r.,,, -',u,)3 * (ys* - u,u,)} + (.r,,, - r,*)'] [0, 10; 10o
d: 20o, r,i : I0o, 7: [300, Io0, ?001r
u = "ir''rf is'vrt"is''r.6= 'lr.'r+'ie vr+'l:r.=r
r$t.'l'lrl2-vl+rlg-!I Ig;.'l*rrr.vq*nilr..l
Cambar 1 1.5 merepresentasikan berbagai error di
.l
rJalam strclut n.rtasi, dan gamkrar 1.6 merepresentasikan
selanjutnya titik Z = (x",y",2" ) duprt dihitung. error di dalanr translasi. Pada kedua kasus, koonlinat-
koordinat citra mengalarni pengkorupsian yang
clisebabkan oieh Causslan white noise, dengan trertragai
varians.
135 Robot Visi Estimasi Pose untuk Sistem Cotadiaptric Sentral 137
11.5 Kesimpulan
Metode yang telah dipaparkan di atas adalah sangat
berguna untuk berbagai aplikasi yang. membutuh-kan
perhitungan transformasi antara sistem koordinat alam
e
E dan sistem koordi nat catadioptric.
I r,5
,o8C
l{oire Vari.@
138 RobotVisi
Estimasi Pose untuk Sistem CatadioptricSentrol 139
DAFTAR PUSTAKA
K, Stubbs, P. Hinds, dan D. Wettergreen., 2006. Nuno Congalves, Helder Ara0jo. 2OO2. Estimation af 3D
Challenges to Ctounding in Huina*Robot Motion from Stereo lmages-Differential and
Collaboration: Errors and Mircommunications in Discrete Formulations, IROS'2O02-IEEURSJ
Remote Exploration Robotics, tech. report CMU-RI- lnternational Conference on lntelligent Robots and
TR{G32, Robotics lnstitute, Carnegie Mellon Systems, Lausanne, Switzerland
University, 1-17 Par( Unsang., Chen, Hong., dan Jain, Anil K., 2005. 3D
Lu, Xiaoguang., Jain, Anil K., dan Colbry, Dirk., 2006. Model-Assisted Face Rxognition in Vido, Journal
Matching 2.5D Face Scans to 3D Mdels, IEEE of Computer Science
Transaction on Pattem Analysis and Machine Park, Unsang., dan Jain, Anil K., 2006. iD Face
lntelligence Vol 28, No. 1, 3143
Reconstruction from Stereo Video, Journal of
Lu, Xiaoguang., dan Jain, Anil K., 2006. Deformation Computer Science
Mdellingfor Robust iD Face Matching, Journal of Peng Kung., Liming Chen., Su, Ruan., dan Kukharev,
Computer Science Ceorgy., 2005. A Robust Algorithm for Eye
Lu, Xiaoguang., Chen, Hong., dan Jain, Anil K., 2006. Detection on Cray lntensity Face without
Multimodal Facial Cender and Ethnicity Spectacles, JCS&T Vol. 5, No. 3, 127-132
tdentification, Joumal of Computer Science
Qian Yu, Helder Araujo, Hong Wang. 2003. Stereo
Lu, Xiaoguang., dan Jain, Anil K., 2006. Ethnicity Vision Eased Rea/ Iime abstacle Deteaion for
ldentification from Face lmages, Journal of Urban Environmen6 ICAR'2@3-1lth lnt. Conf.
Computer Science on Advanced Robotics, Coimbra, Portugal.
N. Duta and A.K. Jain., 1998. Leaming the Human Face Sugimoto, Akihiro., Kimur4 Mitsuhiro., dan Matsuyama,
Concept in Black and White lmages, Proc. 14th Takashi., 2005. Detxting Human Heads with
lnt'1. Conf. Pattem Recognition, Brisbane, pp. 1365- Their Orientation, Electronics Letters on Computer
1367 Vision and lmage Analysis 5(3)
N. GonEalves, H. Araujo. 2003. Mirror 5h4pe Recovery T.W. Fong, l. Nourbakhsh, dan K. Dautenhahn., 2002. A
From lmage Curues and lntrinsic Parameters: Survey of Socially lnteractive Robots: Concepg
Rotationally Symmetric and Conic Mirrors, Design, and Applications, tech. report CMU-RI-TR-
T.W. Fong, J. Scholtz, J. Shah, L. Flueckiger, C. Kunz, D. Cuo, Cuodong., 2006. Face, Expression, and lris
l-ees, t. Schreiner, M. Siegel, L" Hiatt, l. Recognition Using Learned-Based Appro.,t'tr'-s,
Nourbakhsh, R. Simmons, R. Ambrose, R.. Burridge, Ph.D's' Dissertation, Computer Science University
B. Antonishek, M. Bugajska, A. Schultz, dan J.C. of Wisconsin-Madison, USA
Trafton., 2006. A Preliminary Study of Peer-to-Peer
Hsu, Rein-Lein.,2OO2. Face Det&.ion and Modelling for
Human-Robot lnteraction, lnter'national Recognition, Ph.D's Dissertation, Depatment of
Conference on Systems, Man, and Cybernetics,
Computer Science & Engineering Michigan State
IEEE
University, USA
lJu, Hans., Kaufmann, Ulrich., Mayer, Cerd., dan P" Chang", 2003. Robust Tracking and Structure from
Kraetzschmar, Cerhard K., -. VIP-A Framework-
Motion with Sampling Method, doctoral
Based Approach to Robot Vision, Advanced
disseftation, tech. report CMU-RI-TR42-33,
Robotic System
Robotics nstitute, Carnegie Mel lon Un iversity
I
V. Brajovic., 200'l . An Obiect Tracking Computational S. lba., 2004. lnteractive Multi-Modal Robot
Sensor, SPIE Proceedings Vol. 4019: Critical Programming, doctoral dissertaticl'-:, tech. report
Technologies for the Future of Computing, SPIE
CMU-Rl-'tR{4-50, Robotics lnstitute, Carnegie
Mellon University
Daftar Dissertasi Y. Tsin., 2003. Kernel Correlation as an Affinity Measure
C. Dima., 2O06. Active Learning for Outdoor Perception,
in Point-sampled Vision Problems, doctoral
doctoral dissertation, tech. report CMU-RI-TR-OG dissertation, tech. report CMU-R|-TR-03-36,
Robotics nstitute, Carnegie.Mel lon U n iversity
28, Robotics lnstitute, Carnegie Mellon University
I
. c8@ro
Robot Visi