Anda di halaman 1dari 18

A.

Pengertian Komputer Vision

Computer vision merupakan proses otomatis yang mengintegrasikan sejumlah besar


proses untuk persepsi visual, seperti akuisisi citra, pengolahan citra, pengenalan dan membuat
keputusan. Computer vision mencoba meniru cara kerja sistem visual manusia (human vision)
yang sesungguhnya sangat kompleks. Untuk itu, computer vision diharapkan memiliki
kemmpuan tingkat tinggi sebagaiman human visual. Kemampuan itu diantaranya adalah:

Object detection Apakah sebuah objek ada pada scene? Jika begiru, dimana
batasan-batasannya..?
Recognation Menempatkan label pada objek.

Description Menugaskan properti kepada objek.

3D Inference Menafsirkan adegan 3D dari 2D yang dilihat.

Interpreting motion Menafsirkan gerakan.

Computer Vision sering didefinisikan sebagai salah satu cabang ilmu pengetahuan
yang mempelajari bagaimana komputer dapat mengenali obyek yang diamati/ diobservasi.
Cabang ilmu ini bersama intelijensia semu (Artificial Intelligence) akan mampu
menghasilkan sistem intelijen visual (Visual Intelligence System). Computer Vision adalah
kombinasi antara Pengolahan Citra dan Pengenalan Pola yang hubungan antara ketiganya
dapat dilihat pada gambar 1. Pengolahan citra merupakan proses awal dari computer vision,
sedangkan pengenalan pola merupakan proses menginterpretasikan citra.

B. Proses dalam Computer Vision

Untuk menunjang tugas computer vision, maka terdapat beberapa fungsi pendukung
ke dalam sistem ini, antara lain :

Proses penangkapan citra/gambar (image acquisition)


Proses pengolahan citra (image processing)

Analisa data citra (image analysis)

Proses pemahaman data citra (image understanding)


Proses-proses dalam Computer Vision :

1. Image Acqusition

Keluaran dari kamera adalah berupa sinyal analog, dimana frekuensi dan
amplitudonya (frekuensi berhubungan dengan jumlah sinyal dalam satu detik,
sedangkan amplitude berkaitan dengan tingginya sinyal listrik yang dihasilkan)
merepresentasikan detail ketajaman (brightness) pada scene.
Kamera mengamati sebuah kejadian pada satu jalur dalam satu waktu, memindainya
dan membaginya menjadi ratusan garis horizontal yang sama.

Tiaptiap garis membuat sebuah sinyal analog yang amplitudonya menjelaskan


perubahan brightness sepanjang garis sinyal tersebut.

Karena komputer tidak bekerja dengan sinyal analog, maka sebuah analogtodigital
converter (ADC), dibutuhkan untuk memproses semua sinyal tersebut oleh komputer.

ADC ini akan mengubah sinyal analog yang direpresentasikan dalam bentuk
informasi sinyal

tunggal ke dalam sebuah aliran (stream) sejumlah bilangan biner.

Bilangan biner ini kemudian disimpan di dalam memori dan akan menjadi data raw
yang akan diproses.

2. Image Processing

Tahapan berikutnya computer vision akan melibatkan sejumlah manipulasi utama


(initial manipulation) dari data binary tersebut.
Image processing membantu peningkatan dan perbaikan kualitas image, sehingga
dapat dianalisa dan di olah lebih jauh secara lebih efisien.

Image processing akan meningkatkan perbandingan sinyal terhadap noise (signalto


noise ratio = s/n).

Sinyalsinyal tersebut adalah informasi yang akan merepresentasikan objek yang ada
dalam image.
Sedangkan noise adalah segala bentuk interferensi, kekurang pengaburan, yang terjadi
pada sebuah objek.

3. Image Analysis

Image analysis akan mengeksplorasi scene ke dalam bentuk karateristik utama dari
objek melalui suatu proses investigasi.
Sebuah program komputer akan mulai melihat melalui bilangan biner yang
merepresentasikan informasi visual untuk mengidentifikasi fiturfitur spesifik dan
karekteristiknya.

Lebih khusus lagi program image analysis digunakan untuk mencari tepi dan batas
batasan objek dalam image.

Sebuah tepian (edge) terbentuk antara objek dan latar belakangnya atau antara dua
objek yang spesifik.

Tepi ini akan terdeteksi sebagai akibat dari perbedaan level brightness pada sisi yang
berbeda dengan salah satu batasnya.

4. Image Understanding

Ini adalah langkah terakhir dalam proses computer vision, yang mana sprsifik objek
dan hubungannya di identifikasi.
Pada bagian ini akan melibatkan kajian tentang teknik-teknik artificial intelligent.

Understanding berkaitan dengn template matching yang ada dalam sebuah scene.

Metoda ini menggunakan program pencarian (search program)dan teknik


penyesuaian pola (pattern matching techniques).

Beberapa aplikasi yang dihasilkan dari Computer Vision antara lain :


1. Robotic navigation and control
2. Medical Image Analysis measurement and interpretation of many types of images
3. Industrial Inspection measurement, fault checking, process control
4. Optical Character Recognition text reading
5. Remote Sensing land use and environmental monitoring
6. Psychology, AI exploring representation and computation in natural vision
Pengolahan Citra (Image Processing) merupakan bidang yang berhubungan dengan
proses transformasi citra/gambar (image). Proses ini bertujuan untuk mendapatkan kualitas
citra yang lebih baik. Sedangkan Pengenalan Pola (Pattern Recognition) berhubungan
dengan proses identifikasi obyek pada citra atau interpretasi citra. Proses ini bertujuan untuk
mengekstrak informasi/pesan yang disampaikan oleh gambar/citra.
Untuk mendukung tugas dari computer vision, akan ada beberapa fungsi pendukung yang
ditambahkan ke dalam sistem ini, yaitu:

Proses penangkapan citra/gambar (image acquisition)


Proses pengolahan citra (image processing)

Analisa data citra (image analysis)

Proses pemahaman data citra (image understanding)

C. Hirarki Pada Computer Vision

Gambar2. Proses Pada Computer Vision


Hirarki pada computer vision ada 3 tahap, yaitu:

Pengolahan Tingkat Rendah (Image to image) Menghilangkan noise, dan


peningkatan gambar (enchament image).
Pengolahan Tingkat Menengah (Image to dimbolic) Kumpulan garis / vektor yang
merepresentasikan batas sebuah obyek pada citra.

Pengolah Tingkat Tinggi (Simbolic to simbolic) Representasi simbolik batas- batas


obyek menghasilkan nama obyek tersebut.
Sebelum membuat aplikasi computer vision, maka perlu dibuat pertimbangan dan
perancangannya. Pertimbangan dan perancangan tersebut dapat dilakukan dalam 3 tahap,
yaitu:
a. Informasi apa yang ingin diperoleh dan bagaimana informasi tersebut dimanifestasikan ke
dalam citra.
b. Pengetahuan apa yang diperlukan untuk memperoleh informasi.
Untuk menentukan hubungan antara intensitas piksel dan sifat-sifat citra diperlukan suatu
model, misalnya adalah:
Scene model: jenis features, textures, smoothness.
Illumination model: posisi dan karakteristik sumber cahaya serta sifat-sifat reflektansi
permukaan obyek .
Sensor model: posisi dan kinerja optik dari kamera yang digunakan, noise dan distorsi pada
proses dijitasi .
c. Kecepatan pemrosesan dan representasi pengetahuan.

D. Computer Vision dan Hubungannya dengan


Pengolahan Citra
Pengolahan citra adalah pemrosesan citra, khususnya dengan menggunakan komputer,
menjadi citra yang kualitasnya lebih baik. Sebagai contoh, citra burung nuri pada Gambar 1.2
(a) tampak agak gelap, lalu dengan operasi pengolahan citra kontrasnya diperbaiki sehingga
menjadi lebih terang dan tajam (b). Umumnya, operasi-operasi pada pengolahan citra
diterapkan pada citra bila
[JAI89]:
1. perbaikan atau memodifikasi citra perlu dilakukan untuk meningkatkan kualitas
penampakan atau untuk menonjolkan beberapa aspek informasi yang terkandung di dalam
citra,
2. elemen di dalam citra perlu dikelompokkan, dicocokkan, atau diukur,
3. sebagian citra perlu digabung dengan bagian citra yang lain.
Di dalam bidang komputer, sebenarnya ada tiga bidang studi yang berkaitan dengan
data citra, namun tujuan ketiganya berbeda, yaitu:
1. Grafika Komputer (computer graphics).
2. Pengolahan Citra (image processing).
3. Pengenalan Pola (pattern recognition/image interpretation).
Hubungan antara ketiga bidang (grafika komputer, pengolahan citra, pengenalan pola)
ditunjukkan pada Gambar 1.3.

Pengolahan citra merupakan proses awal (preprocessing) pada computer vision,


sedangkan pengenalan pola merupakan proses untuk menginterpretasi citra. Teknik-teknik di
dalam pengenalan pola memainkan peranan penting dalam computer vision untuk mengenali
objek. Jika dihubungkan dengan grafika komputer, maka computer vision merupakan
kebalikannya. Grafika komputer membentuk (sintesis) citra, sedangkan computer vision
mengoraknya (analisis). Pada masa awal kedua bidang ini, tidak ada hubungan antara
keduanya, tetapi beberapa tahun belakangan kedua bidang tersebut berkembang semakin
dekat. Computer vision menggunakan representasi kurva dan permukaan dan beberapa teknik
lain dari grafika komputer, sedangkan grafika komputer menggunakan teknik -teknik di
dalam computer vision untuk memuat citra realistik (virtual reality) [JAI95].

Pengolahan citra mempunyai aplikasi yang sangat luas dalam berbagai


bidang kehidupan. Di bawah ini disebutkan beberapa aplikasi dalam beberapa
bidang [MEN89].

1. Bidang perdagangan
(a) Pembacaan kode barang (bar code) yang tertera pada barang (umum digunakan
di pasar swalayan/supermarket).
(b) Mengenali huruf/angka pada suatu formulir secara otomatis.

2. Bidang militer
(a) Mengenali sasaran peluru kendali mela lui sensor visual.
(b) Mengidentifikasi jenis pesawat musuh.

3. Bidang kedokteran
(a) Pengolahan citra sinar X untuk mammografi (deteksi kanker payudara)
(b) NMR (Nuclear Magnetic Resonance)
(c) Mendeteksi kelainan tubuh dari foto sinar X.
(d) Rekonstruksi foto janin hasil USG

4. Bidang biologi
Pengenalan jenis kromosom melalui gambar mikroskopik

5. Komunikasi data
Pemanfaatan citra yang ditransmisi.

6. Hiburan
Pemaanfaatan video (MPEG)

7. Robotika
Visualy-guided autonomous navigation
8. Pemetaan
Klasifikasi penggunaan tanah melalui foto udara/LANDSAT

9. Geologi
Mengenali jenis batu-batuan melalui foto udara/LANDSAT

10. Hukum
(a) Pengenalan sidik jari
(b) Pengenalan foto narapidana.

4. Aplikasi Computer Vision


Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan
model untuk pembangunan sistem visi komputer. Aplikasi pada visi komputer
mencakup berbagai macam sistem, yaitu:

1. Pengendalian proses (misalnya, sebuah robot industri atau kendaraan


otonom).
2. Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang
menghitung).

3. Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan


gambar urutan).

4. Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar


medis / topografis).

5. Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia


komputer).

6. Sub-domain visi komputer meliputi adegan rekonstruksi, acara deteksi,


pelacakan video, pengenalan obyek, belajar, pengindeksan, gerak estimasi,
dan gambar restorasi.
Gambar3. Hasil Proses Computer Vision Pada Shape Recovery Dan Cell
Segementation
Kategori software pendukung :

1. 3D, 8. stereo,
2. contours 9. synthetic data generators,
3. display tools 10. texture,
4. features 11. toolkits,
5. ocr 12. tracking,
6. mathematical toolkits, 13. misc.
7. pattern recognition,

5.Contoh Penerapan Computer Vision

5.1 Biometriks

Secara tradisional, password (suatu keamanan berbasis knowledge) dan kartu ID


(suatu keamanan berbasis token) biasanya digunakan untuk membatasi akses terhadap
suatu sistem, sehingga sistem hanya dapat digunakan oleh individu tertentu yang sah.
Bagaimanapun, keamanan sistem dapat secara mudah diterobos ketika password dari
sistem tersebut telah diketahui oleh pihak pihak yang tidak berwenang atau kartu ID
dapat diakses juga jika kartu tersebut dicuri oleh penggunapengguna yang tidak sah.
Password yang sederhana mungkin mudah ditebak oleh para pengguna yang tidak
berwenang, sementara password yang rumit akan mengalami kesulitan bagi individu yang
sah di dalam mengingat kodekode yang dibuat oleh dirinya sendiri. Untuk mengatasi
gangguangangguan verfikasi sistem secara tradisional, maka para ilmuwan pada saat ini
menawarkan suatu metode yang lebih terjamin di dalam memberikan keamanan di dalam
mengakses suatu sistem, metode tersebut diistilahkan metode biometriks. Biometriks
dapat dikatakan sebagai suatu sistem

pengidentifikasian (verifikasi) individual secara otomatis dengan memanfaatkan


keadaan atau keunikan fisiologi manusia atau perilaku individual tertentu yang memiliki
keunikan tertentu. Dengan memanfaatkan biometriks kita dapat membangun suatu
keamanan dari suatu identitas yang berbasiskan who you are bukan what you posses
seperti keamanan sistem tradisional yang sering melekat pada sistem keamanan ID card,
atau what you remember seperti pada sistem yang menggunakan password. Sistem
biometriks telah membentuk suatu identitas personal dengan menggunakan sidik jari,
hand- geometry, iris, retina, face, hand vein, facial thermograms, signature, voiceprint,
gaya berjalan (gait), palmprint, dan lain lain (lihat gambar 1.1).

BIOMETRIKS 3
Gambar 1.3 menampilkan suatu modul enrollment dan verifikasi dari suatu sistem
biometriks khusus.

Suatu sistem biometriks yang sederhana, memiliki empat modul utama :


1. ModulSensor yang bertugas menangkap (capture) data
biometriks dari user secara individual.
2. Modul Ekstraksi Fitur, datadata yang diperoleh selanjutnya
diproses untuk mengekstraksi nilainilai fitur.
3. ModulMatching, nilainilai fitur selanjutnya dibandingkan
dengan nilainilai fitur template.
4. ModulDecision-Making, pada tahap ini klaim kepemilikan yang sah atau tidak, sudah
ditentukan oleh sistem biometriks.
5.2 Content-based retrieval image (CBIR)

Content-based image retrieval (CBIR), adalah suatu aplikasi computer vision


yang digunakan untuk melakukan pencarian gambar-gambar digital pada suatu
database. Yang dimaksud dengan "Content-based" di sini adalah: bahwa yang
dianalisa dalam proses pencarian itu adalah actual contents (kandungan aktual)
sebuah gambar. Istilah content pada konteks ini merujuk pada warna, bentuk,
tekstur, atau informasi lain yang didapatkan dari gambar tersebut.
Proses umum dari CBIR adalah pada gambar yang menjadi query dilakukan
proses ekstraksi feature (image contents), begitu halnya dengan gambar yang ada
pada sekumpulan gambar juga dilakukan proses seperti pada gambar query.
Parameter feature gambar yang dapat digunakan untuk retrieval pada system ini
dapat berupa histogram, susunan warna, teksture, dan shape, tipe spesifik dari
obyek, tipe event tertentu, nama individu, lokasi, emosi.

Fitur Warna

Selain bentuk dan textur, warna merupakan salah satu image contents yang
sering digunakan pada kebanyakan sistem CBIR. Model warna (color model) adalah
sebuah cara untuk merepresentasikan warna yang diindera manusia dalam
komputasi. Model warna yang digunakan saat ini dapat digolongkan ke dalam dua
kategori: hardware-oriented dan user-oriented. Model warna hardware-oriented
banyak digunakan untuk warna alat-alat. Misalnya model warna RGB (red, green,
blue), biasa digunakan untuk warna monitor dan kamera. Model warna CMY (cyan,
magenta, yellow), digunakan untuk warna printer; dan warna YIQ digunakan untuk
penyiaran tv warna. Sedangkan model warna yang user-oriented termasuk HLS,
HCV, HSV, MTM, dan CIE-LUV, didasarkan pada tiga persepsi manusia tentang
warna, yaitu hue (keragaman warna), saturation (kejenuhan), dan brightness
(kecerahan).
Berikut penjenjelasan ringkas tentang berbagai macam model atau format
warna:
a) Format warna RGB
Format ini digunakan untuk menghasilkan warna di monitor dan televisi tabung yang
menggunankan gelombang elektromagnetik. Sebuah titik ditembak dengan spektrum
R, G dan B.
b) Format warna HSV atau HSI atau HSL
Format ini merupakan format warna alamiah dengan mempertimbangkan bahwa
spektrum warna adalah sebuah koordinat polar seperti warna pantulan yang jatuh di
mata manusia. Format ini sangat baik untuk membedakan warna-warna yang
'terlihat'.
c) Format warna CIE
Format warna ini adalah varians dari RGB dengan normalisasi spektrum, sehingga
sifat orthogonalitas dari masing-masing komponen warna lebih dijamin. FOrmat ini
merupakan standard dalam QBIC
d) Format warna YCrCb
Format warna ini disebut juga dengan warna chrominant. Format ini banyak
digunakan dalam skin-detection.
e) Format warna CMYK
Format warna ini adalah penghasil warna pada cat atau tinta. Format warna ini yang
digunakan oleh mesin cetak.

HSV dan RGB


Model warna RGB merupakan yang paling banyak digunakan pada
systemCBIR. Pada model ini, warna direpresentasikan menjadi tiga warna primer,
yaitu: red, green, dan blue . Nilai masing-masing warna primer itu berkisar antara 0 -
255. Sedangkan HSV (hue, saturation, value) merupakan model warna yang
diturunkan dari RGB. Literatur menunjukkan bahwa performa HSV ternyata lebih
baik dalam membedakan warna jika dibandingkan dengan RGB.

Color Histogram
Color histogram adalah representasi distribusi warna dalam sebuah gambar
yang didapatkan dengan menghitung jumlah pixel dari setiap bagian range warna,
secara tipikal dalam dua dimensi atau tiga dimensi.
Color Quantization
Dalam pembuatan histogram, nilai RGB yang punya range dari 0 sampai 255
akan punya kemungkinan kombinasi warna sebesar 16777216 (didapat dari: 255 x
255 x 255). Pada proses komputasi, tentu saja ini proses yang menghabiskan
banyak waktu (time consuming).
Masalah tersebut dapat diatasi dengan color quantization (kuantisasi warna),
yaitu suatu prosedur untuk mengurangi kemungkinan jumlah warna. Dengan cara
ini, jumlah warna yang besar tadi bisa dikurangi, sehingga proses yang dibutuhkan
akan semakin mudah.

Pencarian dengan CBIR ternyata tidak hanya melibatkan satu atau dua
gambar saja, namun melibatkan lebih banyak lagi (ratusan atau lebih). Oleh karena
itu, untuk lebih mempercepat proses pencarian, gambar-gambar tadi dikelompokkan
terlebih dahulu menjadi bebarapa cluster berdasarkan kesamaan histogramnya
(clustering). Teknik clustering ini bisa menggunakan algoritma K-Means, Algoritma
Genetika, FGKA [2] dan sebagainya . Selanjutnya, pencarian dapat dilakukan
dengan membandingkan histogram sample gambar dengan nilai-nilai pusat cluster
(centroid) tersebut.

5.3 Optical Character Recognition (OCR)


OCR (Optical Character Recognition) adalah sebuah sistem komputer yang
dapat membaca huruf, baik yang berasal dari sebuah pencetak (printer atau mesin
ketik) maupun yang berasal dari tulisan tangan. Adanya sistem pengenal huruf ini
akan meningkatkan fleksibilitas ataupun kemampuan dan kecerdasan sistem
komputer. Dengan adanya sistem OCR maka user dapat lebih leluasa memasukkan
data karena user tidak harus memakai papan ketik tetapi bisa menggunakan pena
elektronik untuk menulis sebagaimana user menulis di kertas. Adanya OCR juga
akan memudahkan penanganan pekerjaan yang memakai input tulisan seperti
penyortiran surat di kantor pos, pemasukan data buku di perpustakaan, dll. Adanya
sistem pengenal huruf yang cerdas akan sangat membantu usaha besar-besaran
yang saat ini dilakukan banyak pihak yakni usaha digitalisasi informasi dan
pengetahuan, misalnya dalam pembuatan koleksi pustaka digital, koleksi sastra
kuno digital, dll.

OCR dapat dipandang sebagai bagian dari pengenal otomatis yang lebih luas
yakni pengenal pola otomatis (automatic pattern recognition). Dalam pengenal pola
otomatis, sistem pengenal pola mencoba mengenali apakah citra masukan yang
diterima cocok dengan salah satu citra yang telah ditentukan. Sistem ini misalnya
dipakai untuk mendeteksi sidik jari, tandatangan, bahkan wajah seseorang.

Ada banyak pendekatan yang dapat dipakai untuk mengembangkan


pembuatan pengenal pola otomatis antara lain memakai pendekatan numerik,
statistik, sintaktik, neural dan, aturan produksi (rule-based). Secara umum metode-
metode tersebut dapat digolongkan menjadi dua kelompok metode yakni metode
berbasis statistik dan metode berbasis struktur. Dalam metode yang berbasis
statistik, setiap pola ditransformasi ke dalam vektor yang memakai ukuran dan
karakteristik tertentu. Karakteristik ini seringkali lebih bersifat statistik misalnya
distribusi pixel ataupun jarak pixel. Sedang dalam metode yang berbasis struktur,
setiap pola yang diproses dinyatakan sebagai gabungan beberapa struktur
elementer. Pengenalan selanjutnya dilakukan dengan mencocokkan komposisi
struktur elementer dengan struktur yang sudah disimpan memakai aturan tertentu
misalnya memakai pendekatan teori bahasa formal dan automata.

1. Data Capture
Data capture merupakan proses konversi suatu dokumen (hardcopy)
menjadi suatu file gambar (BMP).
2. Preprocessing
Preprocessing merupakan suatu proses untuk menghilangkan bagian-
bagian yang tidak diperlukan pada gambar input untuk proses selanjutnya.
Beberapa contoh preprocessing adalah noise filtering.
3. Segmentation
Segmentasi adalah proses memisahkan area pengamatan (region)
pada tiap karakter yang akan dideteksi.
4. Normalization
Normalization adalah proses merubah dimensi region tiap karakter dan
ketebalan karakter. Algoritma yang digunakan pada proses ini adalah
algoritma scaling dan thinning.
5. Feature Extraction
Feature Extraction adalah proses untuk mengambil ciri-ciri tertentu dari
karakter yang diamati.
6. Recognition
Recognition merupakan proses untuk mengenali karakter yang diamati
dengan cara membandingkan ciri-ciri karakter yang diperoleh dengan ciri-ciri
karakter yang ada pada database.
7. Postprocessing
Pada umumnya proses yang dilakukan pada tahap ini adalah proses
koreksi ejaan sesuai dengan bahasa yang digunakan.

software pendukung
1. bcWebCam
2. OmniPage
3. DTKBarcode
4. LuxandBlinkSetup

DAFTAR PUSTAKA

Pedram Azad, Tilo Gockel, Rdiger Dillmann ; Computer Vision Principles and
Practice

Blogger ; Pengantar Pengolahan Citra

IlmuKomputer.com ; Penggunaan Color Histogram Dalam Image Retrieval


http://www.scribd.com/doc/14598876/-Komputer-Visi-Biometriks-Fadlisyah

http://juliocaesarz.blogspot.com/2010/11/computer-vision.html

Anda mungkin juga menyukai