Chapter 4

Gambar dan Grafik
Gambar adalah sebuah perwakilan spasial dari sebuah objek, adegan dua dimensi atau tiga
dimensi atau gambar lain. Itu bisa berbentuk nyata atau virtual. Sebuah gambar bisa diartikan
secara abstrak sebagai fungsi berkelanjutan yang biasanya mendefinisikan wilayah persegi
panjang sebuah bidang. Misalnya, untuk sensor optik atau grafis, sebuah gambar biasanya
sebanding dengan energi radiasi yang diterima dalam pita elektromagnetik yang sensitif
terhadap sensor atau detektor. Dalam hal ini, gambar tersebut disebut gambar intensitas. Untuk
sensor alat pengukur jarak sasaran (rangefinder), garmbar adalah fungsi garis jarak pandang
dari posisi sensor ke objek di dunia tiga dimensi; gambar seperti itu disebut gambar rentang.
Untuk sensor sentuhan, gambar sebanding dengan sensor dari deformasi sensor yang
disebabkan oleh permukaan dari di sekitar objek.
Gambar yang direkam bisa dalam bentuk foto, sinyal video analog atau format digital. Dalam
pengelihatan komputer, gambar biasanya gambar yang direkam seperti video, gambar digital
atau foto. Dalam grafis komputer, gambar selalu gambar digital. Dalam aplikasi multimedia,
semua format bisa dipresentasikan.
4.1 Konsep Dasar

Sebuah gambar dapat dianggap sebagai fungsi dengan nilai-nilai yang dihasilkan dari intensitas
cahaya di setiap titik di atas wilayah planar. Untuk operasi komputer digital, fungsi ini perlu
disampel pada interval waktu tertentu. Pengambilan sampel mengukur intensitas nilai fungsi
ini menjadi tingkat diskrit.
4.1.1 Penggambaran Gambar Digital

Gambar digital digambarkan oleh matriks nilai numerik yang masing-masing menggambarkan
nilai intensitas terkuantisasi. Ketia I adalah matriks dua dimensi, maka I(r,c) adalah nilai
intensitas pada posisi yang sesuai dengan baris r dan kolom c dari matriks.
Titik-titik di mana sebuah sampel dikenal sebagai picture elements (elemen gambar), yang
biasa disingkat pixels (piksel). Nilai piksel dari gambar intensitas disebut gray scale levels
(tingkat skala abu-abu) (dalam hal ini kode "warna" dari gambar). Intensitas pada setiap piksel
diwakili oleh bilangan bulat dan ditentukan dari gambar kontinu dengan rata-rata di lingkungan
kecil di sekitar lokasi piksel. Jika hanya ada dua nilai intensitas, misalnya, hitam dan putih,
mereka diwakili oleh angka 0 dan 1; gambar semacam itu disebut gambar bernilai biner. Ketika
bilangan bulat 8-bit digunakan untuk menyimpan setiap nilai piksel, tingkat abu-abu berkisar
dari 0 (hitam) hingga 255 (putih). Contoh gambar seperti itu ditunjukkan pada Gambar 4.1.
Ini hal yang umum menggunakan kisi-kisi untuk pengambilan sampel persegi dengan piksel
yang berjarak sama di kedua sisi kisi-kisi. Jarak antara titik-titik kisi-kisi jelas memengaruhi
akurasi gambar asli yang digambarkan, dan menentukan seberapa banyak detail yang bisa
dipecahkan. Resolusi tergantung pada sistem pencitraan juga.
Gambar digital seringkali sangat besar. Sebagai contoh, misalkan kita ingin mengambil sampel
dan mengukur gambar (garis-525) televisi biasa (NTSC) menggunakan VGA (Video Graphics
Array), sehingga dapat ditampilkan ulang tanpa degradasi yang nyata. Kita harus menggunakan
matriks 640 x 480 piksel, di mana setiap piksel diwakili oleh bilangan bulat 8-bit.
Penggambaran piksel ini memperbolehkan 256 level abu-abu diskrit. Oleh karena itu,
spesifikasi gambar ini memberikan susunan 307.200 angka 8-bit, dan total 2.457.600 bit.
Dalam banyak kasus, diperlukan pengambilan sampel yang lebih.
4.1.2 Format Gambar

Ada berbagai jenis format gambar dalam literatur. Kami akan mempertimbangkan format
gambar yang keluar dari pengambil bingkai gambar, mis., Format gambar yang diambil, dan
format saat gambar disimpan.
Format Gambar yang Diambil
Format gambar ditentukan oleh dua parameter utama: resolusi spasial, yang ditetapkan sebagai
piksel X piksel dan pengkodean warna, yang ditentukan oleh bit per piksel. Kedua nilai
parameter tergantung pada perangkat keras dan perangkat lunak untuk input/output gambar.
Sebagai contoh, kami akan menyajikan format gambar yang didukung pada komputer SPARC
dan IRIS.
Untuk pengambilan gambar pada SPARCstation, VideoPizTMcard dan perangkat lunaknya
[Sun90] dapat digunakan. Resolusi spasial adalah 320 x 240 piksel. Warna dapat dikodekan
dengan 1-bit (format gambar biner), 8-bit (warna atau skala abu-abu) atau 24-bit (warna-RGB).
Pengambilan bingkai video lainnya adalah Parallaz XVideo, yang mencakup penyangga
bingkai 24-bit dan resolusi 640 x 480 piksel. Kit multimedia baru di SPARCstations baru
termasuk SunVideoTMcard (Sun Microsystems, Inc.), kamera video berwarna dan CDware
untuk disk CD-ROM. SPARCstation 10 M menawarkan manipulasi gambar 24-bit. Kartu
Video Sun yang baru adalah kartu yang diambil dan kompresi dan teknologinya mengambil
dan mengompresi 30 frame/detik dengan waktu sebenarnya di bawah sistem operasi Solaris
2.3. Lebih lanjut, Video Sun menawarkan pengambilan dan kompresi video pada resolusi (320
x 240) piksel dalam beberapa format [Moo94]:
CellB 30 fps (frame per second)
JPEG 30 fps
MPEG1 I frames 30 fps
MPEG IP frames 17 fps
Capture YUV 30 fps
Capture RGB-8 30 fps
Capture RGB-24 12 fps
IRISTMstations menyediakan gambar berkualitas tinggi melalui, misalnya, add-on Indigo
Video atau digitizer video Indy VideoTM dan perangkat lunak yang sesuai [Roy94]. Board
video IRIS VINOTM hanya didukung pada sistem IndyTM. Itu tidak termasuk kompresi gambar.
VINO menawarkan resolusi gambar 640 x 480 piksel dengan kecepatan sekitar empat frame
per detik. Kecepatan dapat ditingkatkan dengan biaya resolusi. format yang dihasilkan adalah
format RGB dan YUV (dijelaskan dalam Bagian 5.1.1.).
Format Gambar Tersimpan
Saat kita menyimpan gambar, kita menyimpan susunan nilai dua dimensi, di mana setiap nilai mewakili
data yang terkait dengan piksel dalam gambar. Untuk bitmap, nilai ini adalah digit biner. Untuk gambar
berwarna, nilainya mungkin koleksi dari:
- . Tiga angka mewakili intensitas komponen warna merah, hijau dan biru pada piksel tersebut.
-. Tiga angka yang merupakan indeks ke tabel intensitas merah, hijau dan biru.
-. Satu angka yang merupakan indeks ke tabel warna tiga kali lipat.
-. Indeks ke sejumlah struktur data lain yang dapat mewakili warna, termasuk sistem warna
XYZ.
-. Empat atau lima sampel spektral untuk setiap warna.
Selain itu, setiap piksel mungkin memiliki informasi lain yang terkait dengannya; misalnya,
tiga angka yang menunjukkan normal di permukaan yang digambar pada piksel itu. Dengan
demikian, kami menganggap gambar sebagai terdiri dari kumpulan saluran Merah, Hijau dan
Biru (saluran RGB), yang masing-masing memberikan beberapa informasi tunggal tentang
piksel dalam gambar.
Jika ada ruang penyimpanan yang cukup, akan lebih mudah untuk menyimpan gambar dalam
bentuk RGB tiga kali lipat. Jika tidak, ada baiknya mencoba mengompres saluran dengan
beberapa cara. Saat kita menyimpan gambar dengan cara konvensional, sebagai kumpulan
saluran, informasi tentang setiap piksel, mis., nilai setiap saluran pada setiap piksel, harus
disimpan. Informasi lain dapat dikaitkan dengan gambar secara keseluruhan, seperti lebar dan
tinggi, serta kedalaman gambar, nama pencipta, dll. Kebutuhan untuk menyimpan properti
tersebut telah mendorong penciptaan format yang fleksibel seperti RIFF (Resource Intercharge
File Format) dan BRIM (berasal dari RIFF) [Mei83], yang digunakan dalam sistem basis data
nilai atribut umum. RIFF termasuk format untuk bitmap, gambar vektor, animasi, audio dan
video. Di BRIM, sebuah gambar selalu memiliki bidang lebar, tinggi, pencipta dan sejarah,
yang menjelaskan pembuatan gambar dan modifikasi untuk itu.
Beberapa format file gambar saat ini untuk menyimpan gambar termasuk GIF (Graphical In-
terchange Format), X11 Bitmap, Sun Rasterfile, PostScript, IRIS, JPEG, TIFF (Tagged Image
File Format) dan lainnya.
4.1.3 Format Grafik

Format gambar grafik ditentukan melalui grafik primer dan atributnya. Untuk kategori grafik
primer termasuk garis, persegi panjang, lingkaran, dan elips, string teks yang menentukan
objek dua dimensi (2D) dalam gambar grafis atau, misalnya, polyhedron, menentukan objek
tiga dimensi (3D). Paket grafis menentukan primer mana yang didukung. Atribut seperti bentuk
garis, lebar garis, dan warna memengaruhi hasil gambar grafis.
grafik primer dan atributnya mewakili tingkat yang lebih tinggi dari penggambaran gambar,
mis. gambar grafis tidak digambarkan melalui matriks piksel. Tingkat representasi yang lebih
tinggi ini perlu dikonversi pada beberapa titik proses gambar ke tingkat yang lebih rendah dari
representasi gambar; misalnya, ketika gambar akan ditampilkan. Keuntungan dari level primer
yang lebih tinggi adalah pengurangan data yang akan disimpan per satu gambar grafis, dan
manipulasi gambar grafis yang lebih mudah. Kerugiannya adalah langkah konversi tambahan
dari primer grafis dan atributnya ke penggambaran melalui pikselnya. Beberapa paket grafik
seperti SRGP (Simple Raster Graphics Package) menyediakan konversi seperti itu, mis.,
Mereka mengambil grafik primer dan atribut grafis dan menghasilkan bitmap atau pixmap.
Bitmap adalah susunan nilai piksel yang memetakan satu per satu ke piksel di layar; informasi
piksel disimpan dalam 1 bit, sehingga kita mendapatkan gambar biner. Pixmap adalah istilah
yang lebih umum menggambarkan gambar multi-bit-per-piksel. Sistem warna kelas bawah
memiliki delapan bit per piksel, memungkinkan pilihan 256 warna secara bersamaan. Sistem
yang lebih mahal memiliki 21 bit per piksel, memungkinkan pilihan 16 juta warna. Penyegaran
buffer dengan 32 bit per piksel dan resolusi layar 1280 x 1024 piksel tersedia bahkan di
komputer personal. Dari 32 bit per piksel, 24 bit dikhususkan untuk menggambarkan warna
dan 8 bit untuk tujuan kontrol. Selain itu, buffer dengan 96 bit (atau lebih) per piksel tersedia
pada resolusi 1280 x 1024 pada sistem kelas atas [FDFH92). SRGP tidak mengubah gambar
grafis menjadi primer dan atribut setelah menghasilkan bitmap/pixmap. Dalam hal ini, setelah
fase konversi, format grafik disajikan sebagai format gambar digital.
Paket seperti PHIGS (Programmer's Hierarchical Interactive Graphics System) dan GKS
(Graphical Kernel System) [FDEH92] mengambil gambar grafis yang ditentukan melalui
primer dan atribut, menghasilkan gambar grafis dalam bentuk pixmap dan setelah
penggambaran gambar, terus bekerja berdasarkan penggambaran objek primer/atribut. Dalam
hal ini, format gambar grafis disajikan setelah fase generasi sebagai suatu struktur, yang
merupakan pengelompokan logis dari primer, atribut, dan informasi lainnya.
4.2 Pemrosesan Gambar Komputer

Grafik komputer menyangkut sintesis bergambar objek nyata atau imajiner dari model berbasis
komputer. Bidang terkait pemrosesan gambar menangani proses pengubahan: analisis adegan,
atau rekonstruksi model dari gambar objek 2D atau 3D. Pada bagian berikut, kita menjelaskan
prinsip-prinsip dasar sintesis gambar (generasi) dan analisis gambar (pengenalan). Literatur
tentang grafik komputer dan pemrosesan gambar menyajikan informasi lebih lanjut dan
terperinci [FDF H92, KR82, Nev82, HS92].
4.2.1 Sintesis Gambar

Sintesis gambar adalah bagian integral dari semua antarmuka pengguna komputer dan sangat
diperlukan untuk memvisualisasikan objek 2D, 3D, dan dimensi yang lebih tinggi. Area yang
beragam seperti sains pendidikan, teknik, kedokteran, periklanan, dan hiburan semuanya
bergantung pada grafik. Mari kita lihat beberapa sampel yang representatif:
o Antarmuka Pengguna
Aplikasi yang berjalan pada komputer personal dan workstation memiliki antarmuka pengguna
yang bergantung pada sistem jendela desktop untuk mengelola beberapa aktivitas secara
bersamaan, dan pada fasilitas titik-dan-klik untuk memungkinkan pengguna memilih item
menu, ikon, dan objek di layar.
o Otomasi Kantor dan Penerbitan Elektronik
Penggunaan grafik untuk pembuatan dan penyebaran informasi telah meningkat pesat sejak
munculnya penerbitan desktop pada komputer personal. Otomasi kantor dan penerbitan
elektronik dapat menghasilkan dokumen cetak tradisional dan dokumen elektronik yang berisi
teks, grafik tabel, dan bentuk grafik lain yang digambar atau dipindai. Sistem Hypermedia yang
memungkinkan jaringan penjelajahan dari dokumen multimedia yang saling terkait
berkembang biak.
o Simulasi dan Animasi untuk Visualisasi dan Hiburan Ilmiah
Film animasi yang diproduksi komputer dan tampilan perilaku objek nyata dan simulasi yang
berubah-waktu menjadi semakin populer untuk visualisasi ilmiah dan teknik. Kita dapat
menggunakannya untuk mempelajari entitas matematika abstrak dan model dari fenomena
seperti aliran fluida, relativitas dan reaksi nuklir dan kimia. Karakter kartun akan semakin
dimodelkan dalam komputer sebagai deskripsi bentuk 3D yang gerakannya dikendalikan oleh
komputer daripada oleh angka yang digambar secara manual oleh kartunis. Iklan televisi yang
menampilkan logo terbang dan tipuan visual yang lebih eksotis telah menjadi hal biasa, seperti
halnya efek khusus yang elegan dalam film.
Grafis komputer interaktif adalah cara paling penting untuk menghasilkan gambar sejak
penemuan fotografi dan televisi; ia memiliki keuntungan tambahan bahwa kita dapat membuat
gambar tidak hanya benda konkret, objek "dunia nyata", tetapi juga benda abstrak dan sintetik
seperti permukaan matematika pada 4D.
Dinamika dalam Grafik
Grafik tidak terbatas pada gambar statis. Gambar dapat bervariasi secara dinamis; misalnya,
pengguna dapat mengontrol animasi dengan menyesuaikan kecepatan, porsi adegan total yang
dilihat, jumlah detail yang ditampilkan, dll. Oleh karena itu, dinamika adalah bagian integral
dari grafik (grafik dinamis). Banyak teknologi grafis interaktif berisi perangkat keras dan
perangkat lunak untuk dinamika gerakan yang dikontrol pengguna dan dinamika pembaruan:
. Dinamika Gerak
Dengan dinamika gerak, objek dapat dipindahkan dan diaktifkan sehubungan dengan pengamat
stasioner. Objek juga bisa tetap diam dan pemandangan di sekitarnya bisa bergerak. Dalam
banyak kasus, objek dan kamera bergerak. Contoh tipikal adalah simulator penerbangan yang
berisi platform mekanis, yang mendukung kokpit tiruan dan layar tampilan. Komputer
mengontrol gerakan platform, pengukur, dan dunia simulasi dari objek diam dan bergerak yang
dilalui oleh pilot.
. Dinamika Pembaruan
Pembaruan dinamika adalah perubahan aktual dari bentuk, warna, atau properti lain yang
dilihat objek. Sebagai contoh, sebuah sistem bisa menampilkan perubahan bentuk dari struktur
pesawat dalam penerbangan dalam menanggapi manipulasi operator dari banyak mekanisme
kontrol. Semakin halus perubahan, semakin realistis dan bermakna hasilnya. Grafik dinamis
dan interaktif menawarkan sejumlah besar mode yang dapat dikontrol pengguna yang dapat
digunakan untuk menyandikan dan mengkomunikasikan informasi, misalnya, bentuk 2D atau
3D objek dalam gambar, skala abu-abu atau warna dan variasi waktu dari properti ini.
Kerangka Sistem Grafik Interaktif
Gambar dapat dihasilkan oleh kartu digitizer video yang menangkap sinyal analog NTSC
(PAL) dan membuat gambar digital. Gambar digital semacam ini digunakan, misalnya, dalam
pemrosesan gambar untuk pengenalan gambar dan dalam komunikasi untuk konferensi video.
Pada bagian ini kita berkonsentrasi pada pembuatan gambar melalui sistem grafis. Kita
membahas secara lebih rinci pembuatan gambar dan video melalui digitizers video di Bab 5.
Gambar grafis dihasilkan menggunakan sistem grafis interaktif. Contoh dari sistem grafis
seperti itu adalah SRGP, yang meminjam fitur dari paket grafik raster QuickDrawergerer Apple
[RHA + 85] dan X Window SystemTM[SGN88] dari MIT untuk output, dan dari GKS dan
PHIGS untuk input. Kerangka kerja konseptual tingkat tinggi yang paling banyak sistem grafis
interaktif terdiri dari tiga komponen perangkat lunak: model aplikasi, program aplikasi dan
sistem grafis, dan komponen perangkat keras: perangkat keras grafis.
Model aplikasi mewakili data atau objek yang akan digambarkan pada layar; disimpan dalam
database aplikasi. Model ini biasanya menyimpan deskripsi primer yang menentukan bentuk
komponen objek, atribut objek dan hubungan konektivitas yang menggambarkan bagaimana
komponen-komponen tersebut saling bersesuaian. Model ini khusus untuk aplikasi dan dibuat
secara independen dari sistem tampilan tertentu. Oleh karena itu, program aplikasi harus
mengubah deskripsi bagian model ke prosedur apa pun yang memanggil atau memerintahkan
sistem grafis yang digunakan untuk membuat gambar. Proses konversi ini memiliki dua fase.
Pertama, program aplikasi melintasi database aplikasi yang menyimpan model untuk
mengekstraksi bagian dilihat, menggunakan beberapa sistem seleksi atau permintaan. Kedua,
geometri yang diekstraksi diletakkan dalam format yang dapat dikirim ke sistem grafis.
Program aplikasi menangani input pengguna. Ini menghasilkan tampilan dengan mengirim ke
komponen ketiga, sistem grafis, serangkaian perintah output grafis yang berisi deskripsi
geometris rinci tentang apa yang harus dilihat dan atribut yang menggambarkan bagaimana
objek harus muncul.
Sistem grafis bertanggung jawab untuk benar-benar menghasilkan gambar dari penjelasan
detail untuk melewati input pengguna ke program aplikasi untuk pengolahan. Sistem grafis
merupakan komponen perantara antara program aplikasi dan perangkat keras layar. Ini efek
transformasi output dari objek dalam model aplikasi ke tampilan model. Secara simetris, ia
memengaruhi transformasi input dari aksi pengguna ke input program aplikasi yang
menyebabkan aplikasi melakukan perubahan pada model dan/atau gambar. Sistem grafis
biasanya terdiri dari satu set subrutin output yang sesuai dengan berbagai primer, atribut, dan
elemen lainnya. Ini dikumpulkan di perpustakaan atau paket sub-grafis grafik. Program aplikasi
menentukan primitif geometri dan atribut untuk subrutin ini, dan subrutin kemudian
menggerakkan perangkat tampilan tertentu dan menyebabkannya menampilkan gambar.
Pada tingkat perangkat keras, komputer menerima input dari perangkat interaksi dan
mengeluarkan gambar untuk menampilkan perangkat.
Untuk menghubungkan kerangka kerja konseptual tingkat tinggi ini dengan model kami yang
ditunjukkan pada Gambar 1.1, model aplikasi dan program aplikasi dapat mewakili aplikasi
serta bagian antarmuka pengguna pada Gambar 1.1. Sistem grafis mewakili abstraksi
pemrograman dengan dukungan dari sistem operasi untuk terhubung ke perangkat keras grafis.
Perangkat keras grafis milik area perangkat pada Gambar 1.1; oleh karena itu, ini adalah fokus
utama dari diskusi berikut.
Perangkat Keras Grafik – Input
Teknologi input saat ini memberi kita mouse di mana-mana, tablet data, dan panel sentuh yang
peka sentuhan yang dipasang di layar. Input lebih bagus perangkat yang memasok, selain lokasi
layar (z, y), 3D dan nilai input dimensi tinggi (derajat kebebasan), menjadi umum, seperti track-
ball, space-ball, atau data kaos tangan.
Track-balls dapat dibuat untuk merasakan rotasi tentang sumbu vertikal selain itu tentang dua
sumbu horizontal. Namun, tidak ada hubungan langsung antara gerakan tangan dengan
perangkat dan gerakan terkait dalam ruang 3D.
space-ball adalah bola kaku yang mengandung regangan pengukur. Pengguna mendorong atau
menarik bola ke segala arah, memberikan terjemahan dan orientasi 3D. Dalam hal ini, arah
gerakan sesuai dengan upaya pengguna untuk memindahkan bola kaku, meskipun tangan tidak
benar-benar bergerak.
Data kaos tangan merekam posisi dan orientasi tangan serta gerakan jari. Kaos tangan ini
dilapisi sensor kecil dan ringan. Setiap sensor terdiri dari kabel serat optik pendek dengan
Light-Emitting Diode (LED) di satu ujung dan transistor foto di ujung lainnya. Selain itu, posisi
tiga dimensi dan sensor orientasi Polhelmus 3SPACE merekam gerakan tangan. Mengenakan
kaos tangan data, pengguna dapat menangkap benda, memindahkan dan memutar, lalu
melepaskannya, sehingga memberikan interaksi yang sangat alami dalam 3D [ZLB + 87].
Komunikasi audio juga memiliki potensi yang menarik karena memungkinkan input bebas
genggam dan output alami dari instruksi sederhana, umpan balik, dan sebagainya.
Perangkat Keras Grafik – Output
Teknologi keluaran saat ini menggunakan tampilan raster, yang menyimpan tampilan primitif
dalam buffer penyegaran dalam piksel komponennya. Arsitektur tampilan raster ditunjukkan
pada Gambar 4.2. Di beberapa tampilan raster, ada pengontrol tampilan perangkat keras yang
menerima dan menafsirkan urutan perintah output. Secara sederhana, sistem yang lebih umum
(Gambar 4.2), seperti yang ada di komputer personal, pengontrol layar hanya ada sebagai
komponen perangkat lunak dari paket perpustakaan grafik, dan penyegaran buffer tidak lebih
dari sepotong memori CPU yang dapat dibaca oleh subsistem tampilan gambar (sering disebut
pengendali video) yang menghasilkan gambar aktual di layar.
Gambar lengkap pada tampilan raster dibentuk dari raster, yang merupakan kumpulan garis
raster horizontal, masing-masing baris piksel individu; raster dengan demikian disimpan
sebagai matriks piksel yang menggambarkan seluruh area layar. Seluruh gambar dipindai
secara berurutan oleh pengontrol video. Pemindaian raster ditunjukkan pada Gambar 4.3. Pada
setiap piksel, intensitas sinar diatur untuk mencerminkan intensitas piksel; dalam sistem warna,
tiga balok dikontrol - satu untuk setiap warna primer (merah, hijau, biru) sebagaimana
ditentukan oleh tiga komponen warna dari nilai masing-masing piksel (lihat Bagian 5.1).
Sistem grafis raster memiliki karakteristik lain. Untuk menghindari kerlipan gambar, kecepatan
refresh 60 Hz atau lebih tinggi digunakan saat ini; seluruh gambar 1024 baris dengan 1024
piksel masing-masing harus disimpan secara eksplisit dan bitmap atau pixmap dihasilkan.
Grafik raster dapat menampilkan area yang diisi dengan warna atau pola solid, mis., gambar
realistis objek 3D. Lebih lanjut, proses refresh tidak tergantung pada kompleksitas gambar
(jumlah poligon, dll.) Karena perangkat kerasnya cukup cepat untuk membaca setiap piksel
dalam buffer pada setiap siklus penyegaran.
Dithering
Pertumbuhan grafik raster telah menjadikan warna dan skala abu-abu sebagai bagian integral
dari grafik komputer sementara. Warna suatu objek tidak hanya bergantung pada objek itu
sendiri, tetapi juga pada sumber cahaya yang menerangkannya, pada warna daerah sekitarnya
dan pada sistem visual manusia. Apa yang kita lihat pada televisi hitam-putih atau monitor
layar adalah cahaya achromatic. Cahaya Achromatic ditentukan oleh kualitas atribut cahaya.
Kualitas cahaya ditentukan oleh parameter intensitas dan cahaya. Misalnya, jika kita memiliki
perangkat hardcopy atau layar yang hanya dua tingkat, yang berarti mereka hanya
menghasilkan dua tingkat intensitas, maka kita ingin memperluas rentang intensitas yang
tersedia.
Solusinya terletak pada kemampuan mata kita untuk integrasi spasial. Jika kita melihat area
yang sangat kecil dari jarak pandang yang cukup besar, mata kita rata-rata detail halus dalam
area kecil dan hanya merekam intensitas keseluruhan area. Fenomena ini dieksploitasi dalam
teknik yang disebut halftoning, atau clustered-dot ordered dithering (halftoning
approximation). Setiap unit resolusi kecil dicetak dengan lingkaran tinta hitam yang
wilayahnya sebanding dengan kegelapan 1-I (1=Intensitas) dari area dalam foto asli. Perangkat
keluaran grafis dapat mendekati lingkaran area variabel reproduksi halftone. Misalnya, area 2
x 2 piksel tampilan dua tingkat dapat digunakan untuk menghasilkan lima tingkat intensitas
yang berbeda dengan mengorbankan separuh resolusi spasial di sepanjang masing-masing
sumbu. Pola-pola, yang ditunjukkan pada Gambar 4.4, dapat diisi oleh area 2 x 2, dengan
jumlah piksel 'on' sebanding dengan intensitas yang diinginkan. Pola-pola tersebut dapat
diwakili oleh dither matriz. Teknik ini digunakan pada perangkat yang tidak dapat
menampilkan titik-titik individual (mis., printer laser). Ini berarti bahwa perangkat ini buruk
dalam mereproduksi piksel 'on' yang terisolasi (titik-titik hitam pada Gambar 4.4). Semua
piksel yang ‘on' untuk intensitas tertentu harus berdekatan dengan piksel 'on' lainnya.
Tampilan CRT mampu menampilkan titik-titik individual; oleh karena itu, persyaratan
pengelompokan dapat dilonggarkan dan didispersi-titik dapat digunakan. teknik dither juga
dapat digunakan untuk menambah jumlah warna yang tersedia, dengan mengorbankan resolusi.
Pertimbangkan tampilan warna dengan tiga bit per piksel, satu untuk merah, hijau dan biru.
Kita dapat menggunakan area pola 2 x 2 untuk mendapatkan 125 warna sebagai berikut: setiap
pola dapat menampilkan lima intensitas untuk setiap warna, dengan menggunakan pola
halftone pada Gambar 4.4, menghasilkan 5x5x5=125 kombinasi warna.
4.2.2 Analisis Gambar

Analisis gambar berkaitan dengan teknik untuk mengekstraksi deskripsi dari gambar yang
diperlukan untuk metode analisis adegan tingkat tinggi. Dengan sendirinya, pengetahuan
tentang posisi dan nilai piksel tertentu hampir tidak menyampaikan informasi yang terkait
dengan pengenalan suatu objek, deskripsi bentuk objek, posisi atau orientasinya, pengukuran
jarak apa pun pada objek atau apakah objek tersebut berada. cacat. Oleh karena itu, teknik
analisis gambar termasuk perhitungan kecerahan dan warna yang dirasakan, pemulihan parsial
atau lengkap tiga dimensi data dalam adegan, lokasi diskontinuitas yang berkaitan dengan
objek dalam adegan dan karakterisasi sifat-sifat daerah seragam dalam gambar.
Analisis gambar penting di banyak arena: foto-foto pengawasan udara, gambar-gambar televisi
pemindaian lambat dari bulan atau planet-planet yang dikumpulkan dari pesawat antariksa,
gambar-gambar televisi yang diambil dari sensor visual robot industri, gambar sinar-X dan
tomografi aksial komputer (CAT) memindai. Subareas pemrosesan gambar meliputi
peningkatan gambar, deteksi dan pengenalan pola, serta analisis adegan dan visi komputer.
Peningkatan gambar berkaitan dengan peningkatan kualitas gambar dengan menghilangkan
noise (piksel asing atau hilang) atau dengan meningkatkan kontras.
Deteksi pola dan pengakuan berhubungan dengan mendeteksi dan mengklarifikasi pola standar
dan menemukan distorsi dari pola-pola ini. Contoh yang sangat penting adalah teknologi
Optical Character Recognition (OCR), yang memungkinkan untuk input massal yang
ekonomis dari halaman typeset, karakter yang diketik atau bahkan dicetak dengan tangan.
Tingkat akurasi pengenalan tulisan tangan tergantung pada perangkat input. Satu kemungkinan
adalah bahwa pengguna mencetak karakter dengan perangkat pemosisian berkelanjutan,
biasanya tablet stylus (lingkungan berbasis pena), dan komputer mengenalinya (pengenalan
online). Ini lebih mudah daripada mengenali karakter yang dipindai karena tablet merekam
urutan, arah, dan terkadang kecepatan serta tekanan goresan, dan algoritme pengenalan pola
dapat mencocokkan faktor-faktor ini dengan templat tersimpan untuk setiap karakter. Pengenal
dapat mengevaluasi pola tanpa mempertimbangkan bagaimana pola telah dibuat (pengenalan
karakter statis) atau dapat fokus pada goresan, tepian goresan atau kecepatan menggambar
(pengenal dinamis). Seorang recog nizer dapat dilatih untuk mengidentifikasi berbagai gaya
pencetakan blok. Parameter setiap karakter dihitung dari sampel yang diambil oleh pengguna.
Arsitektur untuk mesin pengenalan karakter berorientasi objek (AQUIRE), yang mendukung
pengenalan online dengan kemampuan statis dan dinamis gabungan, dijelaskan dalam
[KW93b] Pengenal karakter komersial dijelaskan dalam [WB85, BW86].
merekonstruksi analisis Pemandangan 3D dan visi komputer menangani mengenali bau
pemandangan dari beberapa gambar 2D. Contohnya adalah robot industri yang merasakan
ukuran relatif, bentuk, posisi dan warna objek.
Pengenalan Gambar
Untuk sepenuhnya mengenali suatu objek dalam suatu gambar berarti mengetahui bahwa ada
kesepakatan antara proyeksi sensorik dan gambar yang diamati. Bagaimana objek muncul
dalam gambar berkaitan dengan konfigurasi spasial dari nilai-nilai piksel. Kesepakatan antara
konfigurasi spasial yang diamati dan proyeksi sensorik yang diharapkan membutuhkan
kemampuan berikut:
o Menyimpulkan secara eksplisit atau implisit posisi dan orientasi objek dari konfigurasi ruang.
o Konfirmasikan bahwa kesimpulannya benar.
Untuk menyimpulkan posisi (misalnya cawan) objek, orientasi, dan kategori atau kelas dari
konfigurasi spasial tingkat abu-abu, diperlukan kemampuan untuk menyimpulkan piksel mana
yang merupakan bagian dari objek. Selanjutnya, dari antara piksel yang merupakan bagian dari
objek, diperlukan kemampuan untuk membedakan fitur objek yang diamati, seperti tanda
khusus, garis, kurva, permukaan atau batas (mis., Tepi cawan). Fitur-fitur ini sendiri diatur
dalam hubungan spasial pada gambar dan objek.
Kesimpulan analitik bentuk objek, posisi dan orientasi tergantung pada pencocokan fitur
gambar yang membedakan (dalam 2D, titik, segmen garis atau wilayah) dengan fitur objek
yang sesuai (dalam 3D, titik, segmen garis, segmen busur, atau lengkungan atau permukaan
planar).
Jenis objek, latar belakang, sensor pencitraan, dan sudut pandang sensor semuanya menentukan
apakah masalah pengenalannya mudah atau sulit. Sebagai contoh, misalkan objek tersebut
adalah bidang planar putih dengan latar belakang hitam yang seragam, seperti yang ditunjukkan
pada gambar digital (Tabel 4.1). Ekstraktor fitur sudut sederhana dapat mengidentifikasi titik
sudut yang membedakan, seperti yang ditunjukkan pada gambar simbolik (Tabel 4.2).
Kecocokan antara fitur sudut gambar dan fitur sudut obyektif terarah. Hubungkan saja sudut-
sudut kotak gambar ke sudut kotak object dalam urutan searah jarum jam, mulai dari
korespondensi yang berubah-ubah. Kemudian, gunakan titik yang sesuai untuk menetapkan
orientasi sensor relatif terhadap bidang persegi. Jika kita mengetahui ukuran kotak, kita dapat
sepenuhnya dan analitis menentukan posisi dan orientasi kotak relatif terhadap posisi dan
orientasi kamera. Di contoh sederhana ini, satuan piksel diubah menjadi satuan kecocokan
antara sudut gambar dan sudut obyektif. Unit kecocokan kemudian ditransformasikan ke unit
posisi obyektif dan orientasi relatif terhadap sistem koordinat alami sensor.
Di sisi lain, proses transformasi mungkin sulit. Mungkin ada berbagai objek kompleks yang
perlu dikenali. Sebagai contoh, beberapa objek mungkin termasuk bagian dari objek lain,
bayangan dapat terjadi atau pantulan objek mungkin bervariasi, dan latar belakang mungkin
sibuk.
Jenis unit transformasi mana yang harus digunakan tergantung pada sifat spesifik tugas
penglihatan, kompleksitas gambar dan jenis informasi sebelumnya yang tersedia.
Pengenalan komputer dan inspeksi objek adalah, secara umum, prosedur kompleks yang
membutuhkan berbagai langkah yang secara berturut-turut mengubah data ikonik menjadi
pengenalan informasi. Metodologi pengenalan harus memberi perhatian besar pada pengenalan
ulang masing-masing dari enam langkah berikut: pemformatan gambar, pengkondisian,
pelabelan, pengelompokan, ekstraksi dan pencocokan (Gambar 4.5).
Tahap-Tahap Pengenalan Gambar
Kami akan memberikan ikhtisar singkat tentang langkah-langkah pengenalan, tetapi analisis
yang lebih dalam dari langkah-langkah ini dapat ditemukan dalam literatur visi komputer,
seperti [Nev82, HS02], dll.
Pemformatan gambar berarti mengambil gambar dari kamera dan membawanya ke bentuk
digital. Ini berarti bahwa kita akan memiliki representasi digital dari suatu gambar dalam
bentuk piksel. (Pixel dan format gambar dijelaskan dalam Bagian 4.1.1. Dan 1.1.2.) Contoh
gambar yang diamati ditunjukkan pada Gambar 4.6.
Pengkondisian, pelabelan, pengelompokan, ekstraksi dan pencocokan merupakan suatu
deklarasi kanonik dari masalah pengenalan gambar, setiap langkah menyiapkan dan mengubah
data untuk memfasilitasi langkah selanjutnya. Berdasarkan aplikasinya, kita mungkin harus
menerapkan urutan langkah-langkah ini pada lebih dari satu tingkat proses pengenalan dan
deskripsi. Ketika langkah-langkah ini bekerja pada level mana saja dalam proses transformasi
unit, mereka menyiapkan data untuk transformasi unit, mengidentifikasi unit level lebih tinggi
berikutnya dan menafsirkannya. Lima langkah transformasi, secara lebih rinci, adalah:
1. Pengkondisian
Pengkondisian didasarkan pada model yang menunjukkan gambar yang diamati terdiri dari
pola informatif yang dimodifikasi oleh variasi yang tidak menarik yang biasanya menambah
atau melipatgandakan pola informatif. Pengkondisian memperkirakan pola informatif
berdasarkan gambar yang diamati. Dengan demikian pengkondisian menekan kebisingan, yang
dapat dianggap sebagai variasi tidak acak acak yang mempengaruhi semua pengukuran.
Pengkondisian juga dapat melakukan normalisasi latar belakang dengan menekan variasi
sistematis atau pola yang tidak menarik. Pengkondisian biasanya diterapkan secara seragam
dan tidak tergantung konteks.
2. Pelabelan
Pelabelan didasarkan pada model yang menunjukkan pola informatif memiliki struktur sebagai
pengaturan kejadian spasial, setiap kejadian spasial menjadi satu set piksel yang terhubung.
Pelabelan menentukan dalam jenis kejadian spasial apa setiap pixel masuk.
Contoh operasi pelabelan adalah deteksi tepi. Deteksi tepi adalah bagian penting dari proses
pengenalan. Teknik deteksi tepi menemukan diskontinuitas lokal di beberapa atribut gambar,
seperti intensitas atau warna (mis., Deteksi tepi piala). Diskontinuitas ini menarik karena
mereka cenderung terjadi pada batas objek. Suatu tepi dikatakan terjadi pada suatu titik dalam
gambar jika beberapa atribut gambar berubah nilainya secara tidak kontinu pada titik itu.
Contohnya adalah intensitas tepi. Tepi yang ideal, dalam satu dimensi, dapat dipandang sebagai
langkah perubahan intensitas; misalnya, langkah antara piksel bernilai tinggi dan bernilai
rendah (Gambar 4.7). Jika langkah terdeteksi, tetangga piksel bernilai tinggi dan bernilai
rendah diberi label sebagai bagian dari tepi. Sebuah contoh dari suatu gambar (Gambar 4.6.)
setelah deteksi tepi ditunjukkan pada Gambar 4.8.
Deteksi tepi mengenali banyak sisi, tetapi tidak semuanya signifikan. Oleh karena itu, operasi
pelabelan lain harus terjadi setelah deteksi tepi, yaitu thresholding (ambang batas).
Thresholding menentukan tepi mana yang harus diterima dan mana yang tidak boleh; operasi
thresholding hanya menyaring tepi signifikan dari gambar dan memberi label mereka. Tepi
lainnya dihilangkan. Thresholding gambar dari Gambar 4.8 disajikan pada Gambar 4.9.
Jenis lain dari operasi pelabelan meliputi penemuan sudut dan identifikasi piksel yang
berpartisipasi dalam berbagai bentuk primer.
3. Pengelompokan
Operasi pelabelan memberi label jenis peristiwa spasial primitif tempat piksel berpartisipasi.
Operasi pengelompokan mengidentifikasi peristiwa dengan mengumpulkan bersama atau
mengidentifikasi set piksel terhubung maksimum yang masuk dalam jenis kejadian yang sama.
Ketika pembaca mengingat deteksi tepi intensitas yang dilihat sebagai perubahan langkah
intensitas (Gambar 4.7), tepi diberi label sebagai tepi langkah, dan operasi pengelompokan
merupakan penghubung tepi langkah.
Operasi pengelompokan, di mana ujung-ujungnya dikelompokkan menjadi garis, disebut line-
fitting (pemasangan garis). Gambar yang dikelompokkan sehubungan dengan garis
ditunjukkan pada Gambar 4.10. Lagi pemasangan garis pengelompokan operasi dilakukan pada
gambar yang ditunjukkan pada Gambar 4.8.
Operasi pengelompokan melibatkan perubahan struktur data logis. Gambar yang diamati,
gambar yang dikondisikan dan gambar yang berlabel adalah semua struktur data gambar
digital. Bergantung pada implementasinya, operasi pengelompokan dapat menghasilkan baik
struktur data gambar di mana setiap piksel diberi indeks yang terkait dengan peristiwa spasial
yang menjadi tempatnya atau struktur data itu adalah kumpulan set. Setiap set sesuai dengan
kejadian spasial dan berisi pasangan posisi (baris, kolom) yang berpartisipasi dalam kejadian
tersebut. Dalam kedua kasus, perubahan terjadi dalam struktur data logis. Entitas yang diminati
sebelum pengelompokan adalah piksel; entitas yang diminati setelah pengelompokan adalah
kumpulan piksel.
4. Ekstraksi
Operasi pengelompokan menentukan set entitas baru, tetapi mereka dibiarkan terbuka dalam
arti bahwa satu-satunya hal yang mereka miliki adalah identitas mereka. Operasi ekstraksi
menghitung untuk setiap kelompok piksel daftar properti. Contoh properti mungkin termasuk
pusat massa, area, orientasi, momen spasial, momen nada abu-abu, momen nada spasial-abu-
abu, lingkaran terbatas, dalam lingkaran pencungkil, dan sebagainya. Properti lain mungkin
tergantung pada apakah grup dianggap suatu daerah atau busur. Jika grup adalah suatu wilayah,
jumlah lubang mungkin merupakan properti yang berguna. Jika grup adalah busur,
kelengkungan rata-rata mungkin merupakan properti yang berguna.
Ekstraksi juga dapat mengukur hubungan topologi atau spasial antara dua atau lebih
pengelompokan. Misalnya, operasi ekstraksi dapat membuat eksplisit bahwa dua
pengelompokan menyentuh, atau secara spasial dekat, atau bahwa satu pengelompokan berada
di atas yang lain.
5. Pencocokan
Setelah selesainya operasi ekstraksi, peristiwa yang terjadi pada gambar telah diidentifikasi dan
diukur, tetapi peristiwa dalam dan dari dirinya sendiri tidak memiliki arti. Arti dari peristiwa
spasial yang diamati muncul ketika organisasi perseptual telah terjadi sedemikian sehingga
seperangkat peristiwa spasial tertentu dalam organisasi spasial yang diamati jelas merupakan
contoh gambar dari beberapa objek yang sebelumnya diketahui, seperti kursi atau huruf A.
Sekali obyek atau set bagian-bagian objek telah dikenali, pengukuran (seperti jarak antara dua
bagian, sudut antara dua garis atau luas bagian objek) dapat dibuat dan terkait dengan toleransi
yang diizinkan, seperti halnya dalam inspeksi skenario. Ini adalah operasi pencocokan yang
menentukan interpretasi dari beberapa rangkaian peristiwa gambar yang terkait,
menghubungkan peristiwa-peristiwa ini dengan beberapa objek tiga dimensi atau bentuk dua
dimensi yang diberikan.
Ada berbagai macam operasi pencocokan. Contoh klasiknya adalah pencocokan templat, yang
membandingkan pola yang diperiksa dengan model tersimpan (templat) dari pola yang
diketahui dan memilih yang paling cocok.
4.2.3 Transmisi Gambar

Transmisi gambar memperhitungkan transmisi gambar digital melalui jaringan komputer. Ada
beberapa persyaratan pada jaringan ketika gambar ditransmisikan: (1) Jaringan harus
mengakomodasi transportasi pecah data karena transmisi gambar pecah (Pecahan ini
disebabkan oleh ukuran gambar yang besar.); (2) Transmisi gambar membutuhkan transportasi
yang andal; (3) Ketergantungan waktu bukan karakteristik dominan gambar berbeda dengan
transmisi audio/video.
Ukuran gambar tergantung format representasi gambar yang digunakan untuk transmisi. Ada
beberapa kemungkinan:
o Transmisi data gambar mentah
Dalam hal ini, gambar dihasilkan melalui digitizer video dan ditransmisikan dalam format
digitalnya. Ukurannya dapat dihitung dengan cara berikut:
Ukuran = resolusi spasial x kuantisasi piksel
Misalnya, pengiriman gambar dengan resolusi 640 x 480 piksel dan kuantisasi piksel 8 bit per
piksel memerlukan transmisi 307.200 byte melalui jaringan.
o Transmisi data gambar terkompresi
Dalam hal ini, gambar dihasilkan melalui digitizer video dan dikompresi sebelum transmisi.
Metode seperti JPEG atau MPEG, yang dijelaskan dalam Bab 6, digunakan untuk memperkecil
ukuran gambar. Pengurangan ukuran gambar tergantung pada metode kompresi dan tingkat
kompresi.
o Transmisi data gambar simbolik
Dalam hal ini, gambar direpresentasikan melalui representasi data simbolik sebagai primitif
gambar (mis., representasi geometrik 2D atau 3D), atribut dan informasi kontrol lainnya.
Metode representasi gambar ini digunakan dalam grafik komputer. Ukuran gambar sama
dengan ukuran struktur, yang membawa informasi simbolik yang ditransmisikan dari gambar.

Chapter 4

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Chapter 4

Diunggah oleh

Hak Cipta:

Format Tersedia

Gambar dan Grafik

4.1 Konsep Dasar

4.1.1 Penggambaran Gambar Digital

4.1.2 Format Gambar

4.1.3 Format Grafik

4.2 Pemrosesan Gambar Komputer

4.2.1 Sintesis Gambar

4.2.2 Analisis Gambar

4.2.3 Transmisi Gambar

Anda mungkin juga menyukai