10 - Perception

LECTURE NOTES
Artificial Intelligence
Minggu 10
Perception
LEARNING OUTCOMES
LO3: Mengaplikasikan berbagai teknik pada agen pada saat bertindak dalam domain
yang tidak pasti
LO4: Mengaplikasikan berbagai algoritma pembelajaran untuk menyelesaikan masalah
OUTLINE MATERI
• Pembentukan Citra
• Operasi Pengolahan Citra Dasar
• Pengenalan Object
• Rekonstruksi objek 3D
• Simpulan
ISI MATERI
1. Pembentukan Citra
Persepsi memberi agen informasi tentang lingkungan agen dengan cara menafsirkan
respons sensor agen. Sebuah sensor mengukur beberapa aspek lingkungan dalam
bentuk yang dapat digunakan sebagai input oleh agen. Sensor yang dimiliki agen
dapat sesederhana sakelar, yang berfungsi memberi informasi kondisi on/off atau
bisa juga serumit mata. Untuk penglihatan agen, model sensor dapat dibagi menjadi
dua komponen:
o Model objek yang menggambarkan objek dalam bentuk visual seperti orang,
bangunan, pohon, mobil. Model ini juga mencakup model geometris 3D yang
dihasilkan oleh (CAD), atau object yang ditangkap oleh mata manusia.
o Model rendering menggambarkan proses fisik, geometris, dan statistik yang
menghasilkan stimulus dari lingkungan agen. Misalnya, objek putih di bawah
cahaya redup mungkin muncul dengan warna yang sama dengan objek hitam di
bawah cahaya terang
Pembentukan citra dari sensor agen dapat dilihat dari beberapa proses
a) Kamera pinhole
Sensor gambar mengumpulkan cahaya yang tersebar dari objek dalam sebuah
tempat dan membuat gambar dua dimensi. Pada mata manusia, bayangan
terbentuk di retina, yang terdiri dari dua jenis sel: sekitar 100 juta sel batang,
yang peka terhadap cahaya pada berbagai panjang gelombang, dan 5 juta sel
kerucut. Geometri dan gambar paling mudah dipahami dengan kamera pinhole.
Sistem koordinat tiga dimensi pada kamera pinhole P (X, Y, Z). Proses
pembentukan citra terjadi saat P diproyeksikan ke titik P’ pada bidang gambar
dengan koordinat (x, y, z). Jika f adalah jarak dari kamera pinhole ke bidang
bayangan, maka dengan segitiga sebangun, kita dapat menurunkan persamaan
berikut:
Persamaan ini mendefinisikan proses pembentukan gambar yang dikenal sebagai

proyeksi perspektif.
Setiap elemen peka cahaya dalam bidang gambar di bagian belakang kamera
pinhole menerima cahaya dari area sempit yang melewati pinhole. Jika pinhole
cukup kecil, hasilnya adalah gambar terfokus. Proses proyeksi berarti bahwa
objek yang besar dan jauh terlihat sama dengan objek yang lebih kecil di
dekatnya sehingga gambar yang diproyeksikan terbalik.
b) Lensa
Mata vertebrata dan kamera modern menggunakan sistem lensa untuk
mengumpulkan cahaya yang cukup sambil menjaga gambar tetap fokus. Lensa
dapat memfokuskan cahaya dari lokasi objek terdekat ke lokasi terdekat di
bidang gambar. Namun, sistem lensa memiliki kedalaman yang terbatas: Lensa
hanya dapat memfokuskan cahaya pada titik-titik yang berada dalam kisaran
kedalaman (berpusat di sekitar bidang fokus). Objek di luar rentang ini akan
menjadi tidak fokus dalam gambar. Untuk menggerakkan bidang fokus, lensa
dapat diubah bentuknya, dalam kamera, lensa bergerak maju mundur.
Lensa mengumpulkan cahaya yang meninggalkan titik point dan mengarahkan

semuanya untuk sampai pada satu titik pada bidang gambar. Pemfokusan
berfungsi untuk titik-titik yang terletak dekat dengan bidang fokus di ruang
angkasa; titik lain tidak akan terfokus dengan baik. Di kamera, elemen sistem
lensa bergerak untuk mengubah bidang fokus, sedangkan di mata, bentuk lensa
diubah oleh otot-otot khusus.
c) Cahaya dan Bayangan

Sebagian besar permukaan memantulkan cahaya melalui proses refleksi difusi.
Refleksi difusi menyebarkan cahaya secara merata ke seluruh arah meninggalkan
permukaan, sehingga kecerahan permukaan difusi tidak bergantung pada arah
tampilan. Kain, cat, permukaan kayu kasar, tumbuh-tumbuhan, dan batu kasar
dapat menyebarkan cahaya. Cermin tidak dapat menyebarkan, karena apa yang
Anda lihat tergantung pada arah di mana Anda melihat cermin. Perilaku cermin
dikenal sebagai refleksi specular. Beberapa permukaan seperti logam, plastik,
atau lantai basah dapat menampilkan sedikit refleksi specular-yang disebut
spekularitas. Sebuah permukaan difusi yang diterangi oleh sumber cahaya titik
yang jauh akan memantulkan sebagian kecil dari cahaya yang dikumpulkannya;
pecahan ini disebut albedo difusi. Kertas putih dan salju memiliki albedo tinggi,
sekitar 0,90, sedangkan beludru hitam datar dan arang memiliki albedo rendah
sekitar 0,05 (yang berarti 95% cahaya yang masuk diserap dalam serat beludru
atau pori-pori arang). Hukum kosinus Lambert menyatakan bahwa kecerahan
patch difusi diberikan oleh
di mana adalah albedo difus, I0 adalah intensitas sumber cahaya dan θ adalah
sudut antara arah sumber cahaya dan permukaan normal.
2. Operasi dasar Pengolahan Citra

a) Deteksi tepi
Tepi adalah garis lurus atau kurva pada bidang gambar di mana terdapat
perubahan "signifikan" dalam kecerahan gambar. Deteksi tepi hanya berkaitan
dengan gambar. Bagaimana cara mendeteksi tepi dalam gambar? Tepi
berhubungan dengan lokasi dalam gambar di mana kecerahan mengalami
perubahan tajam, jadi idenya adalah membedakan gambar dan mencari tempat di
mana turunan I '(x) magnitutnya bernilai besar.
Salah satu cara untuk menghaluskan gambar adalah dengan menetapkan rata-rata
setiap piksel yang bertetangga dengan filter Gaussian.
Penerapan filter Gaussian menggantikan intensitas I(x0, y0) dengan jumlah
keseluruhan piksel (x, y), dari I(x, y) Nσ(d), di mana d adalah jarak dari (x0, y0 )
ke (x,y). Fungsi h adalah konvolusi dari dua fungsi f dan g (dilambangkan f*g)
jika kita memiliki
Fungsi penghalusan dicapai dengan mengonversi gambar dengan Gaussian,

I*Nσ. Untuk mengoptimalkan komputasi, kita dapat menggabungkan operasi
penghalusan dan deteksi tepi menjadi satu operasi. Ini adalah teorema bahwa
untuk setiap fungsi f dan g, turunan dari konvolusi, (f*g) , sama dengan
konvolusi dengan turunan, (f*g). Jadi, kita bisa mengonvolusikan gambar
dengan turunan dari fungsi penghalusan, N’σ.
Dalam ruang dua dimensi, tepi dapat berada pada sembarang sudut θ. Dengan
memperhatikan kecerahan gambar sebagai fungsi skalar dari variabel x, y,
gradiennya adalah vector.
b) Segmentasi Citra
Segmentasi adalah proses memecah gambar kedalam bagian piksel yang sama.
Setiap piksel gambar dapat dikaitkan dengan properti visual tertentu, seperti
kecerahan, warna, dan tekstur. Ada dua pendekatan untuk segmentasi, satu
berfokus pada pendeteksian batas-batas wilayah ini, dan yang lainnya pada
pendeteksian wilayah itu sendiri. Kurva batas yang melalui sebuah piksel (x,y)
akan memiliki orientasi. Berdasarkan fitur dari lingkungan lokal, akan dihitung
probabilitas Pb(x, y, ) bahwa memang ada kurva batas pada piksel itu sepanjang
orientasi itu. Perharikan sebuah piringan bundar yang berpusat di (x, y), dibagi
menjadi dua setengah piringan dengan diameter yang berorientasi pada θ. Jika ada
batas di (x, y, θ) kedua setengah piringan mungkin diharapkan berbeda secara
signifikan dalam kecerahan, warna, dan teksturnya.
3. Pengenalan Object
Penampakan adalah bentuk objek cenderung terlihat seperti apa. Beberapa kategori objek,
misalnya, bola bisbol tampilannya agak sedikit berbeda dengan bola lainnya tetapi
semua objek dalam kategori bola terlihat hampir sama dalam sebagian besar
keadaannya. Kategori objek lain—misalnya, rumah atau penari balet—sangat
bervariasi. Sebuah rumah dapat memiliki ukuran, warna, dan bentuk yang berbeda
dan dapat terlihat berbeda dari sudut yang berbeda. Seorang penari terlihat berbeda
dalam setiap pose, atau ketika lampu panggung berubah warna. Berdasarkan hal
tersebut objek dapat dibedakan dengan melihat histogram lokal yang bertujuan untuk
melihat apakah ada bagian tertentu tetapi lokasi detailnya tersembunyi. Banyak objek
menghasilkan pola yang jauh lebih kompleks daripada wajah. Ini karena beberapa
efek dapat memindahkan fitur di sekitar gambar objek.
o Foreshortening, Object yang dilihat secara miring menyebabkan pola akan
terdistorsi secara signifikan.
o Aspect, Object akan terlihat berbeda jika dilihat dari arah yang berbeda. Bahkan
benda sederhana seperti donat memiliki beberapa aspek; dilihat dari samping
bentuknya seperti lonjong pipih.
o Oklusi, beberapa sudut pandang akan berakibat pada beberapa bagian object tidak
terlihat. Objek dapat menghalangi satu sama lain, atau bagian dari suatu objek
dapat menutupi bagian lain, efek yang dikenal sebagai self-oklusi.
o Deformasi, di mana derajat kebebasan internal objek mengubah penampilannya.
Misalnya, orang dapat menggerakkan lengan dan kaki mereka, menghasilkan
berbagai konfigurasi tubuh yang sangat luas.
4. Rekonstruksi ruang 3D
Gambar 2D dapat direpresentasikan dalam ruang 3D menggunakan beberapa
metode. Secara umum yang biasa digunakan adalah:
o Gerakan,
o Kontur.
Gerakan
Jika kamera bergerak relatif terhadap ruang tiga dimensi, gerakan nyata yang
dihasilkan dalam gambar, aliran optik, dapat menjadi sumber informasi untuk
pergerakan kamera dan kedalaman skema 3D. Persamaan yang menghubungkan
aliran optik dengan kecepatan translasi T dan kedalaman dalam skema 3D adalah .
di mana Z(x, y) adalah koordinat z dari titik dalam skema yang sesuai dengan titik
pada gambar di (x, y). Perhatikan bahwa kedua komponen aliran optik, vx(x, y) dan
vy(x, y), adalah nol pada titik x = Tx/Tz, y = Ty/Tz.
Kontur
Perhatikan gambar. Gambar dapat memberikan persepsi yang jelas tentang bentuk
dan tata letak tiga dimensi. Kontur tertutup, seperti kontur perbukitan. Satu sisi kontur
lebih dekat dengan kita, dan sisi lain lebih jauh. Ketika satu objek menutupi objek
lain, kontur objek yang lebih jauh terputus, dengan asumsi bahwa objek yang lebih
dekat buram, sebuah T-junction dihasilkan dari keadaan tersebut. Posisi di bidang
tanah juga akan memberikan kontur yang berbeda dengan berbagai objek yang berada
diudara.
SIMPULAN
1. Proses pembentukan citra dipahami dengan baik dalam aspek geometris dan
fisiknya.
2. Untuk mengekstrak informasi visual yang diperlukan untuk tugas manipulasi,
navigasi, dan pengenalan, representasi perantara harus dibangun.
3. Algoritma dasar pengolahan citra digital mengekstrak fitur dari gambar, seperti
deteksi tepi dan segmentasi citra.
4. Ada berbagai isyarat dalam gambar yang memungkinkan seseorang memperoleh
informasi tiga dimensi: gerakan, dan analisis kontur. Masing-masing isyarat ini
bergantung pada asumsi lingkungan fisik untuk memberikan interpretasi yang
tidak ambigu.
DAFTAR PUSTAKA
1. Stuart Russell, Peter Norvig,. 2010. Artificial intelligence : a modern

approach. PE. New Jersey. ISBN:9780132071482, Chapter 22-23

10 - Perception

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

10 - Perception

Diunggah oleh

Hak Cipta:

Format Tersedia

LECTURE NOTES

Persamaan ini mendefinisikan proses pembentukan gambar yang dikenal sebagai

Lensa mengumpulkan cahaya yang meninggalkan titik point dan mengarahkan

c) Cahaya dan Bayangan

2. Operasi dasar Pengolahan Citra

Fungsi penghalusan dicapai dengan mengonversi gambar dengan Gaussian,

1. Stuart Russell, Peter Norvig,. 2010. Artificial intelligence : a modern

Anda mungkin juga menyukai