Artificial Intelligence
Minggu 10
Perception
Artificial Intelligence
LEARNING OUTCOMES
LO3: Mengaplikasikan berbagai teknik pada agen pada saat bertindak dalam domain
yang tidak pasti
LO4: Mengaplikasikan berbagai algoritma pembelajaran untuk menyelesaikan masalah
OUTLINE MATERI
• Pembentukan Citra
• Operasi Pengolahan Citra Dasar
• Pengenalan Object
• Rekonstruksi objek 3D
• Simpulan
Artificial Intelligence
ISI MATERI
1. Pembentukan Citra
Persepsi memberi agen informasi tentang lingkungan agen dengan cara menafsirkan
respons sensor agen. Sebuah sensor mengukur beberapa aspek lingkungan dalam
bentuk yang dapat digunakan sebagai input oleh agen. Sensor yang dimiliki agen
dapat sesederhana sakelar, yang berfungsi memberi informasi kondisi on/off atau
bisa juga serumit mata. Untuk penglihatan agen, model sensor dapat dibagi menjadi
dua komponen:
o Model objek yang menggambarkan objek dalam bentuk visual seperti orang,
bangunan, pohon, mobil. Model ini juga mencakup model geometris 3D yang
dihasilkan oleh (CAD), atau object yang ditangkap oleh mata manusia.
o Model rendering menggambarkan proses fisik, geometris, dan statistik yang
menghasilkan stimulus dari lingkungan agen. Misalnya, objek putih di bawah
cahaya redup mungkin muncul dengan warna yang sama dengan objek hitam di
bawah cahaya terang
Pembentukan citra dari sensor agen dapat dilihat dari beberapa proses
a) Kamera pinhole
Sensor gambar mengumpulkan cahaya yang tersebar dari objek dalam sebuah
tempat dan membuat gambar dua dimensi. Pada mata manusia, bayangan
terbentuk di retina, yang terdiri dari dua jenis sel: sekitar 100 juta sel batang,
yang peka terhadap cahaya pada berbagai panjang gelombang, dan 5 juta sel
kerucut. Geometri dan gambar paling mudah dipahami dengan kamera pinhole.
Sistem koordinat tiga dimensi pada kamera pinhole P (X, Y, Z). Proses
pembentukan citra terjadi saat P diproyeksikan ke titik P’ pada bidang gambar
dengan koordinat (x, y, z). Jika f adalah jarak dari kamera pinhole ke bidang
bayangan, maka dengan segitiga sebangun, kita dapat menurunkan persamaan
berikut:
Artificial Intelligence
Setiap elemen peka cahaya dalam bidang gambar di bagian belakang kamera
pinhole menerima cahaya dari area sempit yang melewati pinhole. Jika pinhole
cukup kecil, hasilnya adalah gambar terfokus. Proses proyeksi berarti bahwa
objek yang besar dan jauh terlihat sama dengan objek yang lebih kecil di
dekatnya sehingga gambar yang diproyeksikan terbalik.
b) Lensa
Mata vertebrata dan kamera modern menggunakan sistem lensa untuk
mengumpulkan cahaya yang cukup sambil menjaga gambar tetap fokus. Lensa
dapat memfokuskan cahaya dari lokasi objek terdekat ke lokasi terdekat di
bidang gambar. Namun, sistem lensa memiliki kedalaman yang terbatas: Lensa
hanya dapat memfokuskan cahaya pada titik-titik yang berada dalam kisaran
kedalaman (berpusat di sekitar bidang fokus). Objek di luar rentang ini akan
menjadi tidak fokus dalam gambar. Untuk menggerakkan bidang fokus, lensa
dapat diubah bentuknya, dalam kamera, lensa bergerak maju mundur.
Artificial Intelligence
pecahan ini disebut albedo difusi. Kertas putih dan salju memiliki albedo tinggi,
sekitar 0,90, sedangkan beludru hitam datar dan arang memiliki albedo rendah
sekitar 0,05 (yang berarti 95% cahaya yang masuk diserap dalam serat beludru
atau pori-pori arang). Hukum kosinus Lambert menyatakan bahwa kecerahan
patch difusi diberikan oleh
di mana adalah albedo difus, I0 adalah intensitas sumber cahaya dan θ adalah
sudut antara arah sumber cahaya dan permukaan normal.
Salah satu cara untuk menghaluskan gambar adalah dengan menetapkan rata-rata
setiap piksel yang bertetangga dengan filter Gaussian.
Artificial Intelligence
Penerapan filter Gaussian menggantikan intensitas I(x0, y0) dengan jumlah
keseluruhan piksel (x, y), dari I(x, y) Nσ(d), di mana d adalah jarak dari (x0, y0 )
ke (x,y). Fungsi h adalah konvolusi dari dua fungsi f dan g (dilambangkan f*g)
jika kita memiliki
Dalam ruang dua dimensi, tepi dapat berada pada sembarang sudut θ. Dengan
memperhatikan kecerahan gambar sebagai fungsi skalar dari variabel x, y,
gradiennya adalah vector.
b) Segmentasi Citra
Segmentasi adalah proses memecah gambar kedalam bagian piksel yang sama.
Setiap piksel gambar dapat dikaitkan dengan properti visual tertentu, seperti
kecerahan, warna, dan tekstur. Ada dua pendekatan untuk segmentasi, satu
berfokus pada pendeteksian batas-batas wilayah ini, dan yang lainnya pada
pendeteksian wilayah itu sendiri. Kurva batas yang melalui sebuah piksel (x,y)
akan memiliki orientasi. Berdasarkan fitur dari lingkungan lokal, akan dihitung
probabilitas Pb(x, y, ) bahwa memang ada kurva batas pada piksel itu sepanjang
orientasi itu. Perharikan sebuah piringan bundar yang berpusat di (x, y), dibagi
menjadi dua setengah piringan dengan diameter yang berorientasi pada θ. Jika ada
batas di (x, y, θ) kedua setengah piringan mungkin diharapkan berbeda secara
signifikan dalam kecerahan, warna, dan teksturnya.
Artificial Intelligence
3. Pengenalan Object
Penampakan adalah bentuk objek cenderung terlihat seperti apa. Beberapa kategori objek,
misalnya, bola bisbol tampilannya agak sedikit berbeda dengan bola lainnya tetapi
semua objek dalam kategori bola terlihat hampir sama dalam sebagian besar
keadaannya. Kategori objek lain—misalnya, rumah atau penari balet—sangat
bervariasi. Sebuah rumah dapat memiliki ukuran, warna, dan bentuk yang berbeda
dan dapat terlihat berbeda dari sudut yang berbeda. Seorang penari terlihat berbeda
dalam setiap pose, atau ketika lampu panggung berubah warna. Berdasarkan hal
tersebut objek dapat dibedakan dengan melihat histogram lokal yang bertujuan untuk
melihat apakah ada bagian tertentu tetapi lokasi detailnya tersembunyi. Banyak objek
menghasilkan pola yang jauh lebih kompleks daripada wajah. Ini karena beberapa
efek dapat memindahkan fitur di sekitar gambar objek.
o Foreshortening, Object yang dilihat secara miring menyebabkan pola akan
terdistorsi secara signifikan.
o Aspect, Object akan terlihat berbeda jika dilihat dari arah yang berbeda. Bahkan
benda sederhana seperti donat memiliki beberapa aspek; dilihat dari samping
bentuknya seperti lonjong pipih.
o Oklusi, beberapa sudut pandang akan berakibat pada beberapa bagian object tidak
terlihat. Objek dapat menghalangi satu sama lain, atau bagian dari suatu objek
dapat menutupi bagian lain, efek yang dikenal sebagai self-oklusi.
o Deformasi, di mana derajat kebebasan internal objek mengubah penampilannya.
Misalnya, orang dapat menggerakkan lengan dan kaki mereka, menghasilkan
berbagai konfigurasi tubuh yang sangat luas.
Artificial Intelligence
4. Rekonstruksi ruang 3D
Gambar 2D dapat direpresentasikan dalam ruang 3D menggunakan beberapa
metode. Secara umum yang biasa digunakan adalah:
o Gerakan,
o Kontur.
Gerakan
Jika kamera bergerak relatif terhadap ruang tiga dimensi, gerakan nyata yang
dihasilkan dalam gambar, aliran optik, dapat menjadi sumber informasi untuk
pergerakan kamera dan kedalaman skema 3D. Persamaan yang menghubungkan
aliran optik dengan kecepatan translasi T dan kedalaman dalam skema 3D adalah .
di mana Z(x, y) adalah koordinat z dari titik dalam skema yang sesuai dengan titik
pada gambar di (x, y). Perhatikan bahwa kedua komponen aliran optik, vx(x, y) dan
vy(x, y), adalah nol pada titik x = Tx/Tz, y = Ty/Tz.
Kontur
Perhatikan gambar. Gambar dapat memberikan persepsi yang jelas tentang bentuk
dan tata letak tiga dimensi. Kontur tertutup, seperti kontur perbukitan. Satu sisi kontur
lebih dekat dengan kita, dan sisi lain lebih jauh. Ketika satu objek menutupi objek
lain, kontur objek yang lebih jauh terputus, dengan asumsi bahwa objek yang lebih
dekat buram, sebuah T-junction dihasilkan dari keadaan tersebut. Posisi di bidang
tanah juga akan memberikan kontur yang berbeda dengan berbagai objek yang berada
diudara.
Artificial Intelligence
SIMPULAN
1. Proses pembentukan citra dipahami dengan baik dalam aspek geometris dan
fisiknya.
2. Untuk mengekstrak informasi visual yang diperlukan untuk tugas manipulasi,
navigasi, dan pengenalan, representasi perantara harus dibangun.
3. Algoritma dasar pengolahan citra digital mengekstrak fitur dari gambar, seperti
deteksi tepi dan segmentasi citra.
4. Ada berbagai isyarat dalam gambar yang memungkinkan seseorang memperoleh
informasi tiga dimensi: gerakan, dan analisis kontur. Masing-masing isyarat ini
bergantung pada asumsi lingkungan fisik untuk memberikan interpretasi yang
tidak ambigu.
Artificial Intelligence
DAFTAR PUSTAKA
Artificial Intelligence