Anda di halaman 1dari 10

Komputer Vision

Visi Komputer adalah ilmu dan teknologi mesin yang melihat, di mana lihat dalam hal ini berarti bahwa mesin mampu mengekstrak informasi dari gambar yang diperlukan untuk menyelesaikan tugas tertentu. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori di balik sistem buatan bahwa ekstrak informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, pandangan dari beberapa kamera, atau data multi-dimensi dari scanner medis. Sebagai disiplin teknologi, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Contoh aplikasi dari visi komputer mencakup sistem untuk: * Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom). * Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung). * Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan). * Modeling benda atau lingkungan (misalnya, inspeksi industri, analisis citra medis atau model topografi). * Interaksi (misalnya, sebagai input ke perangkat untuk interaksi komputermanusia). Komputer visi berkaitan erat dengan kajian visi biologis. Bidang studi visi biologis dan model proses fisiologis di balik persepsi visual pada manusia dan hewan lainnya. Komputer visi, di sisi lain, studi dan menggambarkan proses diimplementasikan dalam perangkat lunak dan perangkat keras di belakang sistem visi buatan. pertukaran Interdisipliner antara visi biologi dan komputer telah terbukti bermanfaat bagi kedua bidang. Komputer visi, dalam beberapa hal, invers grafis komputer. Sementara komputer grafis menghasilkan data gambar dari model 3D, visi komputer sering menghasilkan model 3D dari data citra. Ada juga kecenderungan kombinasi dari dua disiplin, misalnya, sebagaimana dibahas dalam realitas ditambah. Sub-domain dari visi komputer termasuk adegan rekonstruksi, deteksi

event, pelacakan video, pengenalan obyek, belajar, indexing, estimasi gerak, dan pemulihan citra.

Negara seni Komputer visi adalah bidang beragam dan relatif baru belajar. Pada harihari awal komputasi, sulit untuk memproses set bahkan cukup besar data citra. Tidak sampai akhir 1970-an bahwa penelitian lebih terfokus lapangan muncul. Komputer visi mencakup berbagai topik yang sering berhubungan dengan disiplin lain, dan akibatnya tidak ada perumusan standar "masalah visi komputer". Selain itu, tidak ada rumusan standar tentang bagaimana komputer masalah penglihatan harus diselesaikan. Sebaliknya, terdapat banyak sekali metode untuk memecahkan berbagai tugas visi komputer yang terdefinisi dengan baik, dimana metode sering sangat tugas spesifik dan jarang dapat digeneralisir rentang aplikasi yang luas. Banyak metode dan aplikasi yang masih dalam keadaan penelitian dasar, tetapi metode semakin banyak menemukan cara mereka ke produk komersial, di mana mereka sering merupakan bagian dari sistem yang lebih besar yang dapat menyelesaikan tugas-tugas kompleks (misalnya, di bidang medis gambar, atau pengendalian mutu dan pengukuran dalam proses industri). Pada kebanyakan aplikasi praktis visi komputer, komputer adalah pra-diprogram untuk menyelesaikan tugas tertentu, namun metode berdasarkan pembelajaran yang sekarang menjadi semakin umum. Bidang-bidang terkait Hubungan antara visi komputer dan berbagai bidang lainnya Banyak kesepakatan kecerdasan buatan dengan perencanaan otonom atau musyawarah untuk sistem robotical untuk menavigasi melalui lingkungan. Pemahaman yang rinci tentang lingkungan ini diperlukan untuk menavigasi melalui mereka. Informasi tentang lingkungan dapat diberikan oleh sistem visi komputer, bertindak sebagai sensor visi dan memberikan informasi tingkat tinggi tentang lingkungan dan robot. Kecerdasan buatan dan topiktopik berbagi komputer visi lain seperti pengenalan pola dan teknik pembelajaran. Akibatnya, visi komputer kadang-kadang dilihat sebagai bagian dari bidang kecerdasan buatan atau ilmu bidang komputer secara umum. Fisika merupakan bidang lain yang terkait erat dengan visi komputer. sistem visi Komputer bergantung pada sensor gambar yang mendeteksi radiasi elektromagnetik yang biasanya dalam bentuk baik cahaya tampak

atau infra-merah. Sensor dirancang dengan menggunakan fisika solid-state. Proses di mana cahaya merambat dan mencerminkan off permukaan dijelaskan menggunakan optik. sensor gambar canggih bahkan meminta mekanika kuantum untuk memberikan pemahaman lengkap dari proses pembentukan gambar. Selain itu, berbagai masalah pengukuran fisika dapat diatasi dengan menggunakan visi komputer, untuk gerakan misalnya dalam cairan. Bidang ketiga yang memainkan peran penting adalah neurobiologi, khususnya studi tentang sistem visi biologis. Selama abad terakhir, telah terjadi studi ekstensif dari mata, neuron, dan struktur otak dikhususkan untuk pengolahan rangsangan visual pada manusia dan berbagai hewan. Hal ini menimbulkan gambaran kasar, namun rumit, tentang bagaimana "sebenarnya" sistem visi beroperasi dalam menyelesaikan tugas-tugas visi tertentu yang terkait. Hasil ini telah menyebabkan subfield di dalam visi komputer di mana sistem buatan yang dirancang untuk meniru pengolahan dan perilaku sistem biologi, pada berbagai tingkat kompleksitas. Juga, beberapa metode pembelajaran berbasis komputer yang dikembangkan dalam visi memiliki latar belakang mereka dalam biologi. Namun bidang lain yang terkait dengan visi komputer pemrosesan sinyal. Banyak metode untuk pemrosesan sinyal satu-variabel, biasanya sinyal temporal, dapat diperpanjang dengan cara alami untuk pengolahan sinyal dua variabel atau sinyal multi-variabel dalam visi komputer. Namun, karena sifat spesifik gambar ada banyak metode dikembangkan dalam visi komputer yang tidak memiliki mitra dalam pengolahan sinyal satu-variabel. Sebuah karakter yang berbeda dari metode ini adalah kenyataan bahwa mereka adalah non-linear yang bersama-sama dengan dimensi-multi sinyal, mendefinisikan subfield dalam pemrosesan sinyal sebagai bagian dari visi komputer. Selain pandangan yang disebutkan di atas pada visi komputer, banyak topik penelitian yang terkait juga dapat dipelajari dari sudut pandang matematika murni. Sebagai contoh, banyak metode dalam visi komputer didasarkan pada statistik, optimasi atau geometri. Akhirnya, bagian penting dari lapangan dikhususkan untuk aspek pelaksanaan visi komputer, bagaimana metode yang ada dapat diwujudkan dalam berbagai kombinasi perangkat lunak dan perangkat keras, atau bagaimana metode ini dapat dimodifikasi untuk mendapatkan kecepatan pemrosesan tanpa kehilangan terlalu banyak kinerja . Bidang yang paling erat kaitannya dengan visi komputer pengolahan citra, analisis citra dan visi mesin. Ada yang signifikan tumpang tindih dalam

berbagai teknik dan aplikasi yang menutupi. Ini berarti bahwa teknik-teknik dasar yang digunakan dan dikembangkan dalam bidang ini kurang lebih sama, sesuatu yang dapat diartikan sebagai hanya ada satu lapangan dengan nama yang berbeda. Di sisi lain, tampaknya perlu untuk kelompok penelitian, jurnal ilmiah, konferensi dan perusahaan untuk menyajikan atau memasarkan diri sebagai milik khusus untuk salah satu bidang dan, karenanya, berbagai penokohan yang membedakan masing-masing bidang dari yang lain telah disajikan. Karakterisasi berikut akan muncul yang relevan tetapi tidak harus diambil sebagai universal diterima:

* Pengolahan citra dan analisis citra cenderung untuk fokus pada gambar 2D, bagaimana mengubah satu gambar yang lain, misalnya, dari operasi pixel-bijaksana seperti peningkatan kontras, daerah operasi seperti ekstraksi tepi atau penghapusan noise, atau transformasi geometri seperti memutar gambar. karakterisasi ini menunjukkan bahwa pengolahan gambar / analisis tidak memerlukan asumsi atau menghasilkan interpretasi tentang isi gambar. * Visi Komputer cenderung untuk berfokus pada adegan 3D diproyeksikan ke satu atau beberapa gambar, misalnya, bagaimana merekonstruksi struktur atau informasi lain tentang adegan 3D dari satu atau beberapa gambar. Komputer visi sering mengandalkan pada asumsi yang lebih kompleks atau kurang tentang adegan digambarkan dalam gambar. * Visi Mesin cenderung untuk fokus pada aplikasi, terutama di bidang manufaktur, misalnya, visi robot otonom berbasis dan sistem untuk inspeksi berbasis visi atau pengukuran. Ini berarti bahwa teknologi sensor gambar dan teori kontrol sering terintegrasi dengan pengolahan data citra untuk mengontrol robot dan bahwa pemrosesan real-time ditekankan dengan cara implementasi efisien dalam hardware dan software. Hal ini juga menyiratkan bahwa kondisi eksternal seperti pencahayaan dapat dan sering lebih terkontrol dalam visi mesin daripada di visi komputer umum, yang dapat memungkinkan penggunaan algoritma yang berbeda. * Ada juga bidang pencitraan yang disebut yang terutama berfokus pada proses menghasilkan gambar, tapi kadang-kadang juga berkaitan dengan pengolahan dan analisis gambar. Sebagai contoh, pencitraan medis berisi banyak bekerja pada analisis data gambar dalam aplikasi medis. * Akhirnya, pengenalan pola adalah bidang yang menggunakan berbagai

metode untuk mengekstrak informasi dari sinyal pada umumnya, terutama didasarkan pada pendekatan statistik. Sebuah bagian penting dari bidang ini dikhususkan untuk menerapkan metode ini untuk data citra. Aplikasi untuk visi computer Salah satu bidang aplikasi yang paling menonjol adalah computer vision medis atau pengolahan citra medis. Daerah ini dicirikan oleh ekstraksi informasi dari data citra untuk tujuan membuat diagnosis medis pasien. Secara umum, data citra dalam bentuk gambar mikroskop, gambar X-ray, gambar angiografi, gambar ultrasonik, dan gambar tomografi. Contoh informasi yang dapat diekstraksi dari data gambar tersebut deteksi tumor, arteriosclerosis atau perubahan memfitnah lainnya. Hal ini juga dapat pengukuran dimensi organ, aliran darah, dll area aplikasi ini juga mendukung penelitian medis dengan memberikan informasi baru, misalnya, tentang struktur otak, atau tentang kualitas perawatan medis. Sebuah wilayah aplikasi kedua dalam visi komputer di industri, kadangkadang disebut visi mesin, dimana informasi ini diekstraksi untuk tujuan mendukung proses manufaktur. Salah satu contohnya adalah kendali mutu dimana rincian atau produk akhir yang secara otomatis diperiksa untuk menemukan cacat. Contoh lain adalah pengukuran posisi dan orientasi rincian yang akan dijemput oleh lengan robot. Mesin visi juga banyak digunakan dalam proses pertanian untuk menghilangkan bahan makanan yang tidak diinginkan dari bahan massal, proses yang disebut sortir optik. Militer aplikasi mungkin salah satu daerah terbesar untuk visi komputer. Contoh jelas adalah deteksi tentara musuh atau kendaraan dan bimbingan rudal. Lebih sistem canggih untuk panduan mengirim rudal rudal ke daerah daripada target yang spesifik, dan pemilihan target yang dibuat ketika rudal mencapai daerah berdasarkan data citra diperoleh secara lokal. konsep modern militer, seperti "kesadaran medan perang", menunjukkan bahwa berbagai sensor, termasuk sensor gambar, menyediakan kaya set informasi tentang adegan tempur yang dapat digunakan untuk mendukung keputusan strategis. Dalam hal ini, pengolahan otomatis data yang digunakan untuk mengurangi kompleksitas dan informasi sekering dari sensor ganda untuk meningkatkan keandalan. Artis Konsep Rover di Mars, sebuah contoh dari kendaraan darat tak berawak. Perhatikan kamera stereo yang terpasang di atas Rover.

Salah satu area aplikasi yang lebih baru adalah kendaraan otonom, yang meliputi submersibles, kendaraan darat (robot kecil dengan roda, mobil

atau truk), kendaraan udara, dan kendaraan udara tak berawak (UAV). Tingkat berkisar otonomi dari sepenuhnya otonom (berawak) kendaraan untuk kendaraan di mana sistem visi berbasis komputer mendukung driver atau pilot dalam berbagai situasi. Sepenuhnya otonom kendaraan biasanya menggunakan visi komputer untuk navigasi, yakni untuk mengetahui mana itu, atau untuk menghasilkan peta lingkungan (SLAM) dan untuk mendeteksi rintangan. Hal ini juga dapat digunakan untuk mendeteksi peristiwa-peristiwa tugas tertentu yang spesifik, e. g., sebuah UAV mencari kebakaran hutan. Contoh sistem pendukung sistem peringatan hambatan dalam mobil, dan sistem untuk pendaratan pesawat otonom. Beberapa produsen mobil telah menunjukkan sistem otonomi mengemudi mobil, tapi teknologi ini masih belum mencapai tingkat di mana dapat diletakkan di pasar. Ada banyak contoh kendaraan otonom militer mulai dari rudal maju, untuk UAV untuk misi pengintaian atau bimbingan rudal. Ruang eksplorasi sudah dibuat dengan kendaraan otonom menggunakan visi komputer, e. g., NASA Mars Exploration Rover dan Rover ExoMars ESA. Khas tugas visi computer Masing-masing dari area aplikasi yang dijelaskan di atas menggunakan berbagai tugas visi komputer, lebih atau kurang baik pasti pengukuran masalah atau masalah pemrosesan, yang dapat diselesaikan dengan menggunakan berbagai metode. Beberapa contoh tugas visi komputer biasa disajikan di bawah ini. Pengakuan Masalah klasik dalam visi komputer, pengolahan gambar, dan visi mesin adalah menentukan apakah atau tidak data gambar berisi beberapa objek tertentu, fitur, atau kegiatan. Tugas ini biasanya dapat diselesaikan kokoh dan tanpa usaha oleh manusia, namun masih belum memuaskan dipecahkan dalam visi komputer untuk kasus umum: objek sewenangwenang dalam situasi sewenang-wenang. Metode yang ada untuk menangani masalah ini bisa di terbaik mengatasinya hanya untuk objek tertentu, seperti objek geometris sederhana (misalnya, polyhedra), wajah manusia, dicetak atau karakter yang ditulis tangan, atau kendaraan, dan dalam situasi tertentu, biasanya dijelaskan dalam hal pencahayaan yang jelas, latar belakang, dan pose objek relatif terhadap kamera. varietas yang berbeda dari masalah pengakuan dijelaskan dalam literatur: * Obyek pengakuan: satu atau beberapa pra-ditentukan atau objek belajar atau kelas objek dapat dikenali, biasanya bersama dengan posisi mereka

dalam gambar 2D atau 3D pose dalam adegan. * Identifikasi: Sebuah contoh individu objek diakui. Contoh: identifikasi wajah orang tertentu atau sidik jari, atau identifikasi dari sebuah kendaraan tertentu. * Deteksi: data gambar dipindai untuk kondisi tertentu. Contoh: mendeteksi sel abnormal mungkin atau jaringan dalam gambar medis atau deteksi dari sebuah kendaraan di jalan tol sistem otomatis. Deteksi berdasarkan perhitungan relatif sederhana dan cepat kadang-kadang digunakan untuk mencari daerah yang lebih kecil data citra yang menarik yang dapat dianalisa lebih lanjut oleh lebih menuntut komputasi teknik untuk menghasilkan sebuah interpretasi yang tepat.

Beberapa tugas khusus berdasarkan pengakuan ada, seperti:

* Content berbasis image retrieval: menemukan semua gambar dalam satu set gambar yang lebih besar yang memiliki konten yang spesifik. Konten tersebut dapat ditetapkan dengan cara yang berbeda, misalnya dalam hal relatif kesamaan gambar target (beri aku semua gambar yang mirip dengan gambar X), atau dalam hal kriteria pencarian tingkat tinggi diberikan sebagai input teks (memberi saya semua gambar yang berisi banyak rumah, yang diambil selama musim dingin, dan tidak memiliki mobil di dalamnya). * Pose estimasi: memperkirakan posisi atau orientasi objek tertentu relatif terhadap kamera. Sebuah contoh aplikasi untuk teknik ini akan membantu lengan robot dalam mengambil objek dari sabuk konveyor dalam situasi jalur perakitan. * Optical pengenalan karakter (OCR): mengidentifikasi karakter dalam gambar teks dicetak atau tulisan tangan, biasanya dengan tujuan untuk pengkodean teks dalam format yang lebih setuju untuk mengedit atau pengindeksan (misalnya ASCII). Analisis gerak Beberapa tugas yang berhubungan dengan estimasi gerakan di mana suatu urutan gambar diproses untuk menghasilkan perkiraan kecepatan baik pada setiap titik dalam gambar atau dalam adegan 3D, atau bahkan dari kamera yang menghasilkan gambar. Contoh tugas tersebut adalah:

* Egomotion: menentukan gerak kaku 3D (rotasi dan translasi) dari kamera dari urutan gambar yang dihasilkan oleh kamera. * Pelacakan: mengikuti pergerakan dari satu set (biasanya) lebih kecil dari poin bunga atau objek (misalnya, kendaraan atau manusia) dalam urutan gambar. * Aliran Optical: untuk menentukan, untuk setiap titik dalam gambar, bagaimana titik yang bergerak relatif terhadap bidang gambar, yaitu, gerak yang tampak jelas.Gerakan ini adalah hasil kedua bagaimana titik 3D yang terkait bergerak dalam adegan dan bagaimana kamera bergerak relatif ke TKP.

Scene rekonstruksi Mengingat satu atau (biasanya) gambar lebih dari adegan, atau video, adegan rekonstruksi bertujuan komputasi model 3D dari TKP. Dalam kasus yang paling sederhana model bisa menjadi set 3D poin. metode yang lebih canggih menghasilkan model permukaan 3D lengkap. Gambar restorasi Tujuan dari restorasi citra penghapusan noise (sensor noise, blur, dll) dari gambar.Pendekatan paling sederhana untuk menghilangkan kebisingan adalah berbagai jenis filter seperti filter low-pass atau filter median. metode yang lebih canggih mengasumsikan model bagaimana struktur gambar lokal terlihat seperti, model yang membedakan mereka dari kebisingan. Dengan pertama-tama menganalisis data citra dalam hal struktur gambar lokal, seperti garis atau tepi, dan kemudian mengendalikan penyaringan berdasarkan informasi lokal dari tahap analisis, tingkat kebisingan yang lebih baik penghapusan biasanya diperoleh dibandingkan dengan pendekatan sederhana. Sebuah contoh dalam bidang ini adalah inpainting tersebut. Komputer visi system Organisasi sistem visi komputer sangat tergantung aplikasi. Beberapa sistem adalah aplikasi yang berdiri sendiri yang memecahkan suatu pengukuran tertentu atau masalah deteksi, sementara yang lain merupakan sub-sistem desain yang lebih besar yang, misalnya, juga

mengandung sub-sistem untuk kontrol aktuator mekanik, perencanaan, database informasi, manusia antarmuka mesin, dll Pelaksanaan spesifik sistem visi komputer juga tergantung apakah fungsinya adalah praditentukan atau jika beberapa bagian dari itu bisa dipelajari atau diubah selama operasi. Namun demikian, fungsi khas yang ditemukan dalam sistem computer vision banyak.

* Akuisisi Image: Sebuah gambar digital yang dihasilkan oleh satu atau beberapa sensor gambar, yang, selain berbagai jenis kamera peka cahaya, termasuk sensor jarak, perangkat tomografi, radar, kamera ultra-sonic, dll Tergantung pada jenis sensor, data gambar yang dihasilkan adalah gambar 2D biasa, volume 3D, atau urutan gambar. pixel Nilai biasanya sesuai dengan intensitas cahaya dalam satu atau beberapa spektral band (gambar abu-abu atau gambar warna), tetapi juga dapat dihubungkan dengan berbagai tindakan fisik, seperti kedalaman, penyerapan atau pantulan gelombang sonik atau elektromagnetik, atau resonansi magnetik nuklir. * Pre-processing: Sebelum metode visi komputer dapat diterapkan pada data citra untuk mengekstrak beberapa bagian spesifik informasi, biasanya diperlukan untuk mengolah data dalam rangka untuk memastikan bahwa itu memenuhi asumsi tertentu tersirat oleh metode ini. Contohnya adalah

o-sampling dalam rangka untuk memastikan bahwa gambar sistem koordinat benar. o Pengurangan kebisingan dalam rangka untuk memastikan bahwa kebisingan sensor tidak memperkenalkan informasi palsu. peningkatan Kontras o untuk memastikan bahwa informasi yang relevan dapat dideteksi. o Skala-ruang representasi untuk meningkatkan struktur citra pada skala yang tepat. * Fitur ekstraksi: Image fitur pada berbagai tingkat kompleksitas yang diekstraksi dari data gambar. Contoh umum dari fitur tersebut

o Lines, pinggiran dan pegunungan. o bunga poin Localized seperti sudut, gumpalan atau poin. Lebih banyak fitur kompleks mungkin berhubungan dengan tekstur, bentuk atau gerakan. Deteksi segmentasi: Pada beberapa titik dalam proses keputusan dibuat tentang gambar mana yang poin atau wilayah gambar yang relevan untuk diproses lebih lanjut. Contohnya adalah Pemilihan serangkaian tertentu titik bunga Segmentasi satu atau beberapa citra daerah yang berisi objek tertentu yang menarik. Tingkat tinggi pengolahan: Pada langkah ini masukan biasanya satu set kecil data, misalnya satu set poin atau wilayah gambar yang dianggap mengandung suatu objek tertentu. Pengolahan transaksi yang tersisa dengan, misalnya: Verifikasi bahwa data model berbasis memuaskan dan asumsi aplikasi spesifik. estimasi parameter aplikasi tertentu, seperti obyek menimbulkan atau objek ukuran. Klasifikasi benda terdeteksi ke dalam kategori yang berbeda.