Object detection Apakah sebuah objek ada pada scene? Jika begiru, dimana
batasan-batasannya..?
Recognation Menempatkan label pada objek.
Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan
yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi.
Cabang ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu
menghasilkan sistem intelijen visual (Visual Intelligence System). Computer Vision adalah
kombinasi antara Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya
dapat dilihat pada gambar 1. Pengolahan citra merupakan proses awal dari computer vision,
sedangkan pengenalan pola merupakan proses menginterpretasikan citra.
Untuk menunjang tugas computer vision, maka terdapat beberapa fungsi pendukung
ke dalam sistem ini, antara lain :
1. Image Acqusition
Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan
amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik,
sedangkan amplitude berkaitan dengan tingginya sinyal listrik yang dihasilkan)
merepresentasikan detail ketajaman (brightness) pada scene.
Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya
dan membaginya menjadi ratusan garis horizontal yang sama.
Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analogtodigital
converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer.
ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk
informasi sinyal
Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data raw
yang akan diproses.
2. Image Processing
Sinyalsinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada
dalam image.
Sedangkan noise adalah segala bentuk interferensi, kekurang pengaburan, yang terjadi
pada sebuah objek.
3. Image Analysis
Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari
objek melalui suatu proses investigasi.
Sebuah program komputer akan mulai melihat melalui bilangan biner yang
merepresentasikan informasi visual untuk mengidentifikasi fiturfitur spesifik dan
karekteristiknya.
Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas
batasan objek dalam image.
Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua
objek yang spesifik.
Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang
berbeda dengan salah satu batasnya.
4. Image Understanding
Ini adalah langkah terakhir dalam proses computer vision, yang mana sprsifik objek
dan hubungannya di identifikasi.
Pada bagian ini akan melibatkan kajian tentang teknik-teknik artificial intelligent.
Understanding berkaitan dengn template matching yang ada dalam sebuah scene.
1. Bidang perdagangan
(a) Pembacaan kode barang (bar code) yang tertera pada barang (umum digunakan
di pasar swalayan/supermarket).
(b) Mengenali huruf/angka pada suatu formulir secara otomatis.
2. Bidang militer
(a) Mengenali sasaran peluru kendali mela lui sensor visual.
(b) Mengidentifikasi jenis pesawat musuh.
3. Bidang kedokteran
(a) Pengolahan citra sinar X untuk mammografi (deteksi kanker payudara)
(b) NMR (Nuclear Magnetic Resonance)
(c) Mendeteksi kelainan tubuh dari foto sinar X.
(d) Rekonstruksi foto janin hasil USG
4. Bidang biologi
Pengenalan jenis kromosom melalui gambar mikroskopik
5. Komunikasi data
Pemanfaatan citra yang ditransmisi.
6. Hiburan
Pemaanfaatan video (MPEG)
7. Robotika
Visualy-guided autonomous navigation
8. Pemetaan
Klasifikasi penggunaan tanah melalui foto udara/LANDSAT
9. Geologi
Mengenali jenis batu-batuan melalui foto udara/LANDSAT
10. Hukum
(a) Pengenalan sidik jari
(b) Pengenalan foto narapidana.
1. 3D, 8. stereo,
2. contours 9. synthetic data generators,
3. display tools 10. texture,
4. features 11. toolkits,
5. ocr 12. tracking,
6. mathematical toolkits, 13. misc.
7. pattern recognition,
5.1 Biometriks
BIOMETRIKS 3
Gambar 1.3 menampilkan suatu modul enrollment dan verifikasi dari suatu sistem
biometriks khusus.
Fitur Warna
Selain bentuk dan textur, warna merupakan salah satu image contents yang
sering digunakan pada kebanyakan sistem CBIR. Model warna (color model) adalah
sebuah cara untuk merepresentasikan warna yang diindera manusia dalam
komputasi. Model warna yang digunakan saat ini dapat digolongkan ke dalam dua
kategori: hardware-oriented dan user-oriented. Model warna hardware-oriented
banyak digunakan untuk warna alat-alat. Misalnya model warna RGB (red, green,
blue), biasa digunakan untuk warna monitor dan kamera. Model warna CMY (cyan,
magenta, yellow), digunakan untuk warna printer; dan warna YIQ digunakan untuk
penyiaran tv warna. Sedangkan model warna yang user-oriented termasuk HLS,
HCV, HSV, MTM, dan CIE-LUV, didasarkan pada tiga persepsi manusia tentang
warna, yaitu hue (keragaman warna), saturation (kejenuhan), dan brightness
(kecerahan).
Berikut penjenjelasan ringkas tentang berbagai macam model atau format
warna:
a) Format warna RGB
Format ini digunakan untuk menghasilkan warna di monitor dan televisi tabung yang
menggunankan gelombang elektromagnetik. Sebuah titik ditembak dengan spektrum
R, G dan B.
b) Format warna HSV atau HSI atau HSL
Format ini merupakan format warna alamiah dengan mempertimbangkan bahwa
spektrum warna adalah sebuah koordinat polar seperti warna pantulan yang jatuh di
mata manusia. Format ini sangat baik untuk membedakan warna-warna yang
'terlihat'.
c) Format warna CIE
Format warna ini adalah varians dari RGB dengan normalisasi spektrum, sehingga
sifat orthogonalitas dari masing-masing komponen warna lebih dijamin. FOrmat ini
merupakan standard dalam QBIC
d) Format warna YCrCb
Format warna ini disebut juga dengan warna chrominant. Format ini banyak
digunakan dalam skin-detection.
e) Format warna CMYK
Format warna ini adalah penghasil warna pada cat atau tinta. Format warna ini yang
digunakan oleh mesin cetak.
Color Histogram
Color histogram adalah representasi distribusi warna dalam sebuah gambar
yang didapatkan dengan menghitung jumlah pixel dari setiap bagian range warna,
secara tipikal dalam dua dimensi atau tiga dimensi.
Color Quantization
Dalam pembuatan histogram, nilai RGB yang punya range dari 0 sampai 255
akan punya kemungkinan kombinasi warna sebesar 16777216 (didapat dari: 255 x
255 x 255). Pada proses komputasi, tentu saja ini proses yang menghabiskan
banyak waktu (time consuming).
Masalah tersebut dapat diatasi dengan color quantization (kuantisasi warna),
yaitu suatu prosedur untuk mengurangi kemungkinan jumlah warna. Dengan cara
ini, jumlah warna yang besar tadi bisa dikurangi, sehingga proses yang dibutuhkan
akan semakin mudah.
Pencarian dengan CBIR ternyata tidak hanya melibatkan satu atau dua
gambar saja, namun melibatkan lebih banyak lagi (ratusan atau lebih). Oleh karena
itu, untuk lebih mempercepat proses pencarian, gambar-gambar tadi dikelompokkan
terlebih dahulu menjadi bebarapa cluster berdasarkan kesamaan histogramnya
(clustering). Teknik clustering ini bisa menggunakan algoritma K-Means, Algoritma
Genetika, FGKA [2] dan sebagainya . Selanjutnya, pencarian dapat dilakukan
dengan membandingkan histogram sample gambar dengan nilai-nilai pusat cluster
(centroid) tersebut.
OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas
yakni pengenal pola otomatis (automatic pattern recognition). Dalam pengenal pola
otomatis, sistem pengenal pola mencoba mengenali apakah citra masukan yang
diterima cocok dengan salah satu citra yang telah ditentukan. Sistem ini misalnya
dipakai untuk mendeteksi sidik jari, tandatangan, bahkan wajah seseorang.
1. Data Capture
Data capture merupakan proses konversi suatu dokumen (hardcopy)
menjadi suatu file gambar (BMP).
2. Preprocessing
Preprocessing merupakan suatu proses untuk menghilangkan bagian-
bagian yang tidak diperlukan pada gambar input untuk proses selanjutnya.
Beberapa contoh preprocessing adalah noise filtering.
3. Segmentation
Segmentasi adalah proses memisahkan area pengamatan (region)
pada tiap karakter yang akan dideteksi.
4. Normalization
Normalization adalah proses merubah dimensi region tiap karakter dan
ketebalan karakter. Algoritma yang digunakan pada proses ini adalah
algoritma scaling dan thinning.
5. Feature Extraction
Feature Extraction adalah proses untuk mengambil ciri-ciri tertentu dari
karakter yang diamati.
6. Recognition
Recognition merupakan proses untuk mengenali karakter yang diamati
dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri
karakter yang ada pada database.
7. Postprocessing
Pada umumnya proses yang dilakukan pada tahap ini adalah proses
koreksi ejaan sesuai dengan bahasa yang digunakan.
software pendukung
1. bcWebCam
2. OmniPage
3. DTKBarcode
4. LuxandBlinkSetup
DAFTAR PUSTAKA
Pedram Azad, Tilo Gockel, Rdiger Dillmann ; Computer Vision Principles and
Practice
http://juliocaesarz.blogspot.com/2010/11/computer-vision.html