Anda di halaman 1dari 22

1.

Representasi
1.1. Apa itu gambar?
Gambar digital dapat dikenali sebagai representasi diskrit dari pengaruh dat untuk
informasi ruang (layout) dan intensitas (warna) . gambar juga dapat diketahui sebagai sinyal
multidimensi.
1.1.1. Layout Gambar
Diskrit 2 dimensi (2-D), gambar digital I(m,n) mewakili respon dari beberapa sensor
(atau secara sederhana nilai dari beberapa perhatian) pada sebuah seri dari posisi yang telah
ditentukan (m=1,2,,M); n=1,2,,N) dalam koordinat kartesian 2-D diperoleh dari sinyal ruang
berkelanjutan I9x,y) melalui proses sampling yang megacu pada diskritisasi. Diskritisasi terjadi
dengan semacam tipe dari sensor gambar (seperti kamera CCD) dan efek dasar rata-rata sinyal
berkelanjutan diatas wilayah kecil (biasanya berbentuk kotak) sinyal pada domain penerima.
Meskipun gambar yang akan dibahas adalah gambar diskrit namun kadang secara teori
kita harus memperlakukan sinyal sebagai sinyal kontinyu : I (x,y). kenyataannya kadang ini
mengijinkan kita untuk menggunakan teknik integral dan kalkulus differensial untuk mengerti isi
gambar dan untuk memanipulasi secara efektif dan memprosesnya.

Analisis matematika dari gambar diskrit memandu formulasi aljabar linear yang lebih baik pada
beberapa contoh.
Nilai pixel individual pada kebanyakan gambar sebenarnya sesuai dengan respon fisik
pada ruang 2-D yang nyata (contohnya pada penerimaan intensitas optic pada gambar dari
kamera atau intensitas ultrasonic pada transceiver). Tetapi kita juga bebas untuk memahami
gambar pada ruang abstrak dimana koordinat sesuai pada sesuatu daripada pada ruang fisiknya
dan kita juga dapat memperluas perkiraan dari suatu gambar pada 3 atau lebuh dimensi. Sebagai
contoh, aplikasi gambar medis kadang menggunakan rekonstruksi gambar 3-D penuh untuk
organ internal dan time sequence dari gambar seperti itu (sepertu pada detak jantung) dapt
diperlakukan juga sebagai gambar 4-D yang memiliki 3 koordinat. Kita mempertimbangkan
bahwa gambaran 3-D sering berhubungan dengan volume. Dalam contoh ini pixel 3-D
ditunjukkan sebagai voxels (volumetric pixel) yang menggambarkan lokasi ruang terkecil pada
volume 3-D sebagai perlawanan pada gambar 2-D.

1.1.2 Warna Gambar


Sebuah gambar mengandung satu atau lebuh warna yang menentukan intensitas atau
warna dalam lokasi pixel particular I (m,n).
Pada kasus yang paling sederhana, setiap lokasi pixel memiliki nilai numerik yang
mempresentasikan level sinyal pada gambar. Konversi dari angka ke tampilan yang sebenarnya
diperoleh menggunkan colour map. Colour map memiliki arti warna pada setiap level nilai
numerik pada gambarnya untuk memberikan penampakan visual. Kebanyakan colour map
berwarna keabu-abuan, yang memiliki warna keabuan dari hitam (nol) sampai ke putih
(maksimum) sesuai dengan level sinyal.

Warna keabuan cocok dengan gambar-gambar yang berifat intens, seperti gambar yang
hanya memperlihatkan intensitas sinyal sebagai satu-satunya hasil pada setiap point dari wilayah
gambar.
Pada intensitas tertentu, tampilan intensitas gambar akan lebih baik saat menggunakan
false-colour map. Salah satu alasan penggunaan false-colour map adalah fakta bahwa
penglihatan manusia hanya sensitive pada 40 jenis warna keabuan dalam range warna hitam
putih, dimana densitifitas kita menjadi lebih baik. False colour juga dapat menonjolkan atau
menunjukkan fitur atau strukur, sehingga memberikan kemudahan bagi para pengobservasi.
Biasanya dimanfaatkan pada gambar medis dan astronomi.
Figure 1.2 memperlihatkan tampilan gambar astronomi yang memiliki intensitas warna
keabuan dan false-colour map.pada contoh colour map jet ini telah dilakukan pada warna
struktur yang lebih cerah dan detail yang lebih baik dari suatu gambar untuk penglihatan manusia
menggunakan skala warna linear yang memiliki range dari biru gelap (nilai intensitas rendah)
sampai merah gelap (nilai intensitas tinggi). Arti dari colour map seperti mengartikan warna ke
dalam bentuk angka, dan dapat berguna oleh pengguna. Meskipun mapping antara nilai intensitas
dan warna keabuan tapak hampir sama (linear), ada beberapa situasi dimana mapping nonlinear
antara keduanya bisa lebih baik.
Gambar dengan warna keabuan memiliki nilai pada setiap pixelnya, juga memiliki
spectrum warna yang dapat didefinisikan sebagai 3 vektor, yaitu komponen (R,G,B) pada setiap
pixel. Warna menggambarkan kombinasi linear dari warna dasar atau nilai dan gambar bisa
mengandung 3 wilayag 2-D.

1.2 Resolusi dan Kuantitas


Ukuran grid pixel 2-D bersama-sama dengan ukuran data yang disimpan untuk setiap
gambar individu pixel menentukan resolusi dan warna spasial kuantisasi gambar.
Kekuatan representasional (atau ukuran) dari suatu gambar didefinisikan oleh resolusi.
Itu resolusi sumber gambar (misalnya kamera) dapat ditentukan dalam tiga kuantitas resolusi
spasial Kolom (C) oleh baris (R) dimensi gambar mendefinisikan jumlah pixelsused untuk
menutupi ruang visual yang ditangkap oleh image.This berkaitan dengan sampling sinyal gambar
dan kadang-kadang disebut sebagai pixel atau digital resolusi gambar. Hal ini sering dikutip
sebagai C? R (mis 640? 480, 800? 600, 1024? 768, dll). Resolusi temporal Untuk menangkap
systemsuch terus menerus video, ini adalah jumlah foto yang diambil dalam periode waktu
tertentu. Hal ini umumnya dikutip dalam frame per detik (Fps), di mana masing-masing gambar
individu disebut sebagai frame video (mis umum siaran TV beroperasi pada 25 fps; 25-30 fps
cocok untuk pengawasan visual yang paling; lebih tinggi kamera frame-rate yang tersedia untuk
spesialis capture ilmu / rekayasa). Bit resolusi ini mendefinisikan jumlah kemungkinan nilai
intensitas / warna yang pixel mungkin memiliki dan berkaitan dengan kuantisasi dari informasi
gambar. Misalnya biner image memiliki hanya dua warna (hitam atau putih), gambar skala abu-
abu umumnya memiliki 256 tingkat abu-abu yang berbeda mulai dari hitam menjadi putih
sementara untuk gambar warna itu tergantung pada rentang warna yang digunakan. Resolusi bit
umumnya dikutip jumlah biner bit yang diperlukan untuk penyimpanan pada tingkat kuantisasi
tertentu, misalnya biner 2 bit, skala abu-abu adalah 8 bit dan warna (paling sering) adalah 24 bit.
Rentang nilai pixel mungkin mengambil sering disebut sebagai rentang dinamis dari
suatu gambar. Hal ini penting untuk mengenali bahwa resolusi sedikit gambar tidak selalu sesuai
dengan resolusi dari sistem berasal pencitraan. Sebuah fitur umum dari banyak kamera adalah
keuntungan otomatis, di mana minimum dan respon maksimum atas gambar lapangan merasakan
dan kisaran ini secara otomatis dibagi menjadi beberapa nyaman bit (yaitu digital ke tingkat N).
Dalam kasus seperti itu, resolusi sedikit gambar biasanya kurang dari bahwa yang, pada
prinsipnya, dicapai oleh perangkat. Sebaliknya, orang buta, konversi disesuaikan dari sinyal
analog menjadi angka yang diberikan bit, misalnya 21665 536 tingkat diskrit, tidak, tentu saja,
menyiratkan bahwa benar resolusi perangkat pencitraan secara keseluruhan sebenarnya 16 bit.
Hal ini karena tingkat keseluruhan kebisingan (yaitu fluktuasi acak) di sensor dan dalam rantai
pengolahan selanjutnya mungkin menjadi berkekuatan yang mudah melebihi tingkat digital
tunggal. Sensitivitas dari pencitraan Sistem demikian fundamental ditentukan oleh suara, dan ini
membuat kebisingan faktor kunci dalam menentukan jumlah level kuantisasi yang digunakan
untuk digitalisasi. Tidak ada gunanya digitalisasi gambar ke sejumlah besar bit jika tingkat
kebisingan hadir dalam sensor gambar tidak menjamin itu.

1.2.1 Bit-pesawat splicing


Pentingnya visual bit pixel individu dalam sebuah gambar dapat dinilai dalam subjektif
tapi cara yang bermanfaat dengan teknik bit-plane splicing.
Untuk menggambarkan konsep, bayangkan sebuah gambar 8-bit yang memungkinkan
nilai integer dari 0 255. Hal ini dapat konseptual dibagi menjadi delapan pesawat gambar yang
terpisah, masing-masing sesuai
dengan nilai-nilai sedikit diberikan di semua piksel citra. Bit.
Pesawat pertama terdiri pertama dan bit yang paling signifikan dari informasi
(intensity128), kedua, paling kedua bit signifikan (intensity64) dan sebagainya. Menampilkan
masing-masing pesawat bit berturut-turut, kami mungkin melihat apakah ada struktur yang
terlihat di dalamnya.
Pada Gambar 1.3, kita menunjukkan pesawat sedikit 8-bit skala abu-abu gambar dari
descending ban mobil dari bit yang paling signifikan untuk sedikit signifikan. Hal ini jelas bahwa
dua atau tiga bit paling signifikan tidak mengkodekan informasi visual banyak berguna (itu
adalah, pada kenyataannya, sebagian besar kebisingan). Urutan gambar di sebelah kanan pada
Gambar 1.3 menunjukkan efek pada aslinya gambar berturut-turut pengaturan pesawat bit ke nol
(dari yang pertama dan paling signifikan terhadap paling signifikan). Dalam cara yang sama, kita
melihat bahwa ini bit terakhir tidak muncul untuk mengkodekan setiap Struktur terlihat. Dalam
kasus khusus ini, oleh karena itu, kita dapat berharap bahwa hanya mempertahankan lima paling
bit signifikan akan menghasilkan gambar yang praktis visual identik dengan asli. Analisis
semacam bisa membawa kita ke metode yang lebih efisien pengkodean gambar menggunakan bit
yang lebih sedikit - metode kompresi gambar. Kami akan membicarakan hal ini ke depan sebagai
bagian dari kami Pemeriksaan format penyimpanan gambar.

1.3 Format gambar


sudut pandang Fromamathematical, setiap bermakna 2-D array nomor dapat dianggap sebagai
gambar. Dalam dunia nyata, kita perlu untuk secara efektif menampilkan gambar,
menyimpannya (sebaiknya

kompak), mengirimkan mereka melalui jaringan dan mengenali bentuk data numerik sebagai
sesuai dengan gambar. Ini telah menyebabkan pengembangan citra digital standar format. Dalam
istilah sederhana, format gambar terdiri dari file header (berisi informasi tentang bagaimana
sebenarnya data gambar disimpan) dan nilai-nilai pixel numerik yang sebenarnya diri. Ada
sejumlah besar format gambar yang diakui sekarang ada, kencan kembali selama lebih dari 30
tahun penyimpanan gambar digital. Beberapa yang paling umum 2-D Format gambar yang
tercantum pada Tabel 1.1. Konsep lossy dan lossless kompresi rinci dalam Bagian 1.3.2.
Seperti yang disarankan oleh sifat yang tercantum dalam Tabel 1.1, format gambar yang
berbeda umumnya cocok untuk aplikasi yang berbeda. gambar GIF adalah format penyimpanan
gambar yang sangat dasar terbatas hanya 256 tingkat abu-abu atau warna, dengan yang terakhir
ditetapkan melalui peta warna dalam header file sebagai dibahas sebelumnya. Sebaliknya, format
JPEG biasa mampu menyimpan hingga 24-bit RGB warna gambar, dan sampai 36 bit untuk
aplikasi pencitraan medis / ilmiah, dan paling banyak digunakan untuk tingkat konsumen
pencitraan seperti kamera digital. umum lainnya format ditemui termasuk format bitmap dasar
(BMP), yang berasal dari pengembangan dari sistem operasi Microsoft Windows, dan format
PNG baru, dirancang sebagai pengganti yang lebih kuat untuk GIF. TIFF, Format menandai file
gambar, merupakan format file yang menyeluruh dan beradaptasi mampu menyimpan berbagai
gambar yang berbeda bentuk data. Secara umum, fotografi-jenis gambar yang lebih cocok
terhadap JPEG atau TIF penyimpanan, sementara gambar terbatas warna / detail (mis logo,
gambar garis, teks) yang paling cocok untuk GIF atau PNG (per TIFF), sebagai lossless, format
yang penuh warna, disesuaikan dengan mayoritas persyaratan penyimpanan gambar.

1.3.1 Jenis Data Gambar


Pilihan format gambar yang digunakan dapat ditentukan oleh tidak hanya isi gambar,
tetapi juga sebenarnya gambar tipe data yang diperlukan untuk penyimpanan. Selain bit resolusi
gambar yang diberikan dibahas sebelumnya, sejumlah jenis gambar yang berbeda juga ada
gambar biner adalah 2-D array yang menetapkan satu nilai numerik dari set f0; 1g untuk setiap
pixel dalam gambar. Ini kadang-kadang disebut sebagai gambar logis: berkorespondensi hitam
nol ( 'off' atau 'background' pixel) dan berkorespondensi putih untuk satu ( 'on' atau 'Latar' pixel).
Karena tidak ada nilai-nilai lain yang diperbolehkan, gambar-gambar ini dapat diwakili sebagai
bit-stream sederhana, tetapi dalam prakteknya mereka direpresentasikan sebagai 8-bit gambar
bulat di format gambar yang umum. Sebuah fax (atau faksimili) gambar adalah contoh dari citra
biner.
Intensitas atau abu-abu-skala gambar 2-D array yang menetapkan satu nilai numerik
untuk setiap pixel yang merupakan perwakilan dari intensitas pada titik ini. Sebagaimana dibahas
sebelumnya, rentang nilai pixel dibatasi oleh resolusi sedikit gambar dan gambar tersebut
disimpan sebagai gambar N-bit integer dengan format yang diberikan.
RGB atau benar-warna gambar 3-D array yang menetapkan tiga nilai numerik untuk
setiap pixel, setiap nilai sesuai dengan (RGB) channel gambar merah, hijau dan biru komponen
masing-masing. Secara konseptual, kita mungkin menganggap mereka sebagai tiga yang
berbeda, 2-D pesawat sehingga mereka dimensi C oleh R oleh 3, di mana R adalah jumlah baris
gambar dan C jumlah kolom gambar. Umumnya, gambar tersebut disimpan sebagai berurutan
bilangan bulat dalam rangka channel berturut (mis R0G0B0, R1G1B1,...) yang kemudian diakses
(Seperti dalam Matlab) oleh IDC; R; channel koordinat dalam array 3-D. warna lain
representasi yang akan kita bahas nanti sama-sama disimpan menggunakan 3-D array yang
Konsep, yang juga dapat diperpanjang (mulai numerik dari 1 dengan array Matlab) untuk empat
atau lebih dimensi untuk mengakomodasi informasi gambar tambahan, seperti alpha
(transparansi) channel (seperti dalam kasus format gambar PNG).
Gambar floating-point berbeda dari jenis gambar lainnya yang telah kita bahas. Menurut
definisi, mereka tidak menyimpan nilai warna integer. Sebaliknya, mereka menyimpan floating-
point nomor yang, dalam kisaran tertentu yang ditetapkan oleh floating-point presisi dari
bitresolution gambar, mewakili intensitas. Mereka mungkin (umumnya) merupakan pengukuran
nilai selain intensitas sederhana atau warna sebagai bagian dari image ilmiah atau medis.
Floating gambar titik umumnya disimpan dalam format gambar TIFF atau lebih khusus, domain-
spesifik Format (mis DICOM medis). Meskipun penggunaan gambar floating-point meningkat
melalui penggunaan high dynamic range dan stereo fotografi, format file yang mendukung
penyimpanan mereka saat ini tetap terbatas.
Gambar 1.4 menunjukkan contoh dari jenis data gambar yang berbeda kita membahas
dengan contoh dari format gambar yang sesuai digunakan untuk penyimpanan. Meskipun
mayoritas gambar kita akan Pertemuan dalam teks ini akan menjadi tipe data integer, Matlab,
sebagai data berbasis matriks umum alat analisis, tentu saja dapat digunakan untuk mengolah
data citra floating-point.

1.3.2 Kompresi Gambar


Pertimbangan utama lainnya dalam memilih format penyimpanan gambar kompresi.
Sementara mengompresi gambar bisa berarti tidak memakan penyimpanan disk kurang dan dapat
ditransfer melalui jaringan dalam waktu kurang, beberapa teknik kompresi digunakan
mengeksploitasi apa yang dikenal sebagai lossy compression.Lossyinformation from theimage
compression operates by removing redundant.
Sebagai contoh bit-plane mengiris dalam Bagian 1.2.1 (Gambar 1.3) menunjukkan,
adalah mungkin untuk menghapus beberapa informasi dari sebuah gambar tanpa ada perubahan
jelas dalam nya visual yang
penampilan. Pada dasarnya, jika informasi tersebut secara visual berlebihan maka transmisi
adalah tidak perlu untuk apresiasi dari gambar. The formof informasi yang dapat dihapus pada
dasarnya dua kali lipat. Mungkin dalam hal detail gambar baik (seperti dalam contoh bit-
mengiris) atau mungkin melalui pengurangan jumlah warna / tingkat abu-abu dengan cara yang
tidak terdeteksi oleh mata manusia.
Beberapa format gambar yang telah kita disajikan, menyimpan data dalam seperti bentuk
kompresi (Tabel 1.1). Penyimpanan gambar di salah satu format kompresi mempekerjakan
berbagai prosedur algoritmik untuk mengurangi data gambar mentah untuk gambar setara yang
muncul identik (atau setidaknya hampir) tetapi membutuhkan penyimpanan kurang. Hal ini
penting untuk membedakan antara kompresi yang memungkinkan gambar asli yang akan
direkonstruksi sempurna dari berkurang Data tanpa kehilangan informasi gambar (kompresi
lossless) dan disebut lossy teknik kompresi yang mengurangi volume penyimpanan (kadang-
kadang secara dramatis) di mengorbankan beberapa kehilangan detail dalam gambar asli seperti
yang ditunjukkan pada Gambar 1.5, lossless dan teknik kompresi lossy digunakan dalam format
gambar yang umum dapat secara signifikan mengurangi jumlah informasi gambar yang perlu
disimpan, tapi dalam kasus lossy kompresi ini dapat menyebabkan penurunan yang signifikan
dalam kualitas gambar.
Kompresi lossy juga biasa digunakan dalam penyimpanan video karena volume yang
lebih besar sumber data yang terkait dengan urutan besar frame gambar. hilangnya informasi ini,
sendiri merupakan bentuk kebisingan diperkenalkan ke citra sebagai artefak kompresi, dapat
membatasi efektivitas image enhancement kemudian dan analisis.

Dalam hal pengolahan citra praktis di Matlab, perlu dicatat bahwa imagewritte
untuk mengajukan dari Matlab dalam format kompresi lossy (misalnya JPEG) tidak akan
disimpan sebagai tepat Matlab representasi gambar itu dimulai sebagai. nilai-nilai piksel citra
akan diubah dalam gambar Proses output sebagai akibat dari kompresi lossy. Ini bukan kasus
jika lossless a teknik kompresi digunakan. Sebuah Matlab latihan yang menarik adalah berpose
untuk pembaca di Latihan 1.4 untuk menggambarkan ini Perbedaan antara penyimpanan dalam
format JPEG dan format file PNG.

1,4 Spasi Warna


Aswas brieflymentioned dalam pembahasan sebelumnya ofimage jenis, representasi
warna di Animage dicapai dengan menggunakan kombinasi saluran warna satu ormore yang
dikombinasikan untuk formthe warna yang digunakan dalam gambar. representationwe yang
digunakan untuk menyimpan warna, menentukan jumlah dan sifat dari saluran warna, umumnya
dikenal sebagai ruang warna.
Dianggap sebagai entitas matematika, gambar benar-benar hanya satu set spasial
terorganisir angka dengan setiap lokasi pixel ditujukan sebagai IDC; RTH. Grey-skala
(intensitas) atau biner gambar 2-D array yang menetapkan satu nilai numerik untuk setiap pixel
yang merupakan perwakilan dari
intensitas pada saat itu. Mereka menggunakan ruang warna single-channel yang baik terbatas
pada 2-bit (binary) atau intensitas (skala abu-abu) ruang warna. Sebaliknya, RGB atau gambar
yang benar-warna yang 3-D array yang menetapkan tiga nilai numerik untuk setiap pixel, setiap
nilai sesuai dengan komponen merah, hijau dan biru masing-masing.

1.4.1 RGB
RGB (atau warna sejati) gambar 3-D array yang kita dapat mempertimbangkan
konseptual tiga berbeda pesawat 2-D, salah satu yang sesuai dengan masing-masing tiga merah
(R), hijau (G) dan biru (B) channel warna. RGB adalah ruang warna yang paling umum
digunakan untuk representasi citra digital karena nyaman sesuai dengan tiga warna primer yang
dicampur untuk display pada monitor atau perangkat serupa.
Kita bisa dengan mudah memisahkan dan melihat komponen merah, hijau dan biru dari
warna asli image, seperti yang ditunjukkan pada Gambar 1.6. Penting untuk dicatat bahwa warna
biasanya hadir dalam bayangan nyata hampir selalu perpaduan komponen warna dari ketiga
saluran. SEBUAH Kesalahpahaman yang umum adalah bahwa, misalnya, barang yang dianggap
biru hanya akan muncul di saluran biru dan sebagainya. Sementara item dianggap sebagai biru
pasti akan muncul terang di saluran biru (yaitu mereka akan berisi lebih banyak cahaya biru
dibanding warna lain) mereka juga akan memiliki komponen yang lebih ringan dari warna merah
dan hijau.
Jika kita mempertimbangkan semua warna yang dapat diwakili dalam representasi RGB,
kemudian kami menghargai bahwa ruang warna RGB pada dasarnya adalah sebuah ruang warna
3-D (cube) dengan sumbu R, G dan B (Gambar 1.7). Setiap sumbu memiliki yang sama rentang
0! (Ini adalah skala untuk 0-255 untuk 1 umum 1 byte per channel warna, 24-bit representasi
gambar). Warna hitam menempati asal kubus (posisi D0; 0; 0th), sesuai dengan adanya tiga
warna; putih menempati sudut yang berlawanan (posisi D1; 1; 1th), menunjukkan jumlah
maksimum semua tiga warna. Semua warna lain dalam kebohongan spektrum dalam kubus ini.
Ruang warna RGB didasarkan pada bagian dari spektrum elektromagnetik yang terlihat
untuk manusia (yaitu kisaran terus menerus dari panjang gelombang dalam kisaran perkiraan.

400-700 nm). Mata manusia memiliki tiga jenis reseptor warna lebih yang memiliki terbatas (dan
seragam) serap untuk masing-masing panjang gelombang merah, hijau dan biru. Ini sebabnya,
seperti yang akan kita lihat nanti, warna abu-abu-skala mengubah menggunakan kombinasi
nonlinear saluran RGB.
Dalam pengolahan citra digital kita menggunakan RGB disederhanakan (berdasarkan
CIE standar warna 1931) yang dioptimalkan dan dibakukan terhadap tampilan grafis. Namun,
masalah utama dengan RGB adalah bahwa itu adalah perseptual nonlinier. Dengan kita ini
berarti bahwa bergerak dalam arah tertentu dalam RGB warna kubus (Gambar 1.7) tidak tentu
menghasilkan warna yang perseptual konsisten dengan perubahan di masing-masing saluran.
Misalnya, mulai dari putih dan mengurangkan komponen biru menghasilkan kuning; sama,
mulai dari merah dan menambahkan komponen biru menghasilkan warna pink. Untuk ini
Alasannya, ruang RGB secara inheren sulit bagi manusia untuk bekerja dengan dan alasan
tentang karena itu tidak terkait dengan cara alami kita melihat warna. Sebagai alternatif dapat
kita gunakan Warna representasi persepsi seperti HSV.

1.4.1.1 RGB menjadi konversi gambar skala abu-abu


Kami dapat mengkonversi dari ruang warna RGB ke citra skala abu-abu menggunakan
transformasi sederhana. konversi Grey-skala adalah langkah awal dalam banyak algoritma
analisis citra, karena pada dasarnya menyederhanakan (yaitu mengurangi) jumlah informasi
dalam gambar. Meskipun skala abu-abu gambar berisi informasi kurang dari gambar warna,
mayoritas penting, featurerelated
Informasi dipertahankan, seperti tepi, daerah, gumpalan, persimpangan dan sebagainya.
algoritma deteksi fitur dan pengolahan kemudian biasanya beroperasi pada greyscale dikonversi
versi gambar. Seperti yang bisa kita lihat dari Gambar 1.8, masih mungkin untuk membedakan
antara apel merah dan hijau di skala abu-abu.
Gambar warna RGB, Icolour, diubah menjadi abu-abu skala, Igrey skala, menggunakan berikut
transformasi:

mana dn; MTH indeks piksel individu dalam gambar skala abu-abu dan dn; m; CTH yang
channel individu di lokasi pixel dn; MTH dalam gambar warna untuk saluran c di r merah, biru
saluran g gambar b dan hijau. Seperti terlihat dari Persamaan (1.1), gambar skala abu-abu adalah
dasarnya jumlah tertimbang dari saluran warna merah, hijau dan biru. Pembobotan koefisien (a,
b dan g) ditetapkan secara proporsional dengan respon persepsi mata manusia untuk masing-
masing saluran warna merah, hijau dan biru dan Memastikan bobot standar keseragaman
(standar televisi NTSC, a0.2989, b0.5870 dan g 0.1140). Manusia mata secara alami lebih
sensitif terhadap cahaya merah dan hijau; karenanya, warna-warna ini diberikan lebih tinggi
pembobotan untuk memastikan bahwa keseimbangan intensitas relatif dalam gambar skala abu-
abu yang dihasilkan mirip dengan gambar warna RGB. Contoh melakukan konversi skala abu-
abu di Matlab diberikan pada Contoh 1.6. Konversi RGB ke abu-abu-skala adalah mengubah
citra noninvertible: warna sejati informasi yang hilang dalam konversi tidak dapat langsung
sembuh.
1.4.2 Ruang Warna Perseptual
Ruang warna persepsi adalah cara alternatif yang mewakili warna gambar yang benar
dengan cara yang lebih alami untuk persepsi manusia dan pemahaman tentang warna dari RGB
perwakilan. Banyak representasi warna alternatif ada, tetapi di sini kita berkonsentrasi pada Hue,
Saturation dan Nilai (HSV) ruang warna populer dalam aplikasi analisis citra.
Perubahan dalam ruang warna ini mengikuti warna gradient perseptual diterima. Dari
perspektif analisis citra, memungkinkan pemisahan warna dari pencahayaan untuk lebih besar
gelar. Gambar RGB dapat diubah menjadi HSV ruang warna representasi sebagai ditunjukkan
pada Gambar 1.9.
Masing-masing tiga parameter tersebut dapat diartikan sebagai berikut:
H (hue) adalah panjang gelombang dominan warna, misalnya merah, biru, hijau
S (saturasi) adalah 'kemurnian' warna (dalam arti jumlah cahaya putih dicampur dengan
itu)
V (value) adalah kecerahan warna (juga dikenal sebagai luminance)

HSV representasi dari gambar 2-D juga sebagai array 3-D yang terdiri dari tiga saluran dh; s;
VTh dan setiap lokasi pixel dalam gambar, IDN, MTH, berisi dh; s; VTh triplet yang dapat
diubah kembali ke RGB untuk tampilan warna asli. Dalam Matlab HSV pelaksanaan masing-
masing h, s dan v dibatasi dalam kisaran 0! 1. Misalnya, warna biru (atas cone, Gambar 1.9)
mungkin memiliki nilai h0.9, kejenuhan dari s0.5 dan Nilai v1 membuatnya menjadi hidup,
cerah langit biru. Dengan memeriksa saluran warna individual gambar di ruang HSV, kita dapat
melihat bahwa objek gambar lebih konsisten terkandung di lapangan rona yang dihasilkan dari
dalam saluran representasi RGB, meskipun kehadiran kondisi pencahayaan yang berbeda-beda
lebih adegan (Gambar 1.10). Akibatnya, ruang HSV umumnya digunakan untuk berbasis warna

segmentasi citra menggunakan teknik yang dikenal sebagai mengiris warna. Sebagian dari rona
roda warna (sepotong kerucut, Gambar 1.9) adalah terisolasi sebagai rentang warna yang
menarik, benda yang memungkinkan dalam rentang warna yang akan diidentifikasi dalam
gambar. Ini kemudahan pemilihan warna di ruang warna HSV juga menghasilkan digunakan
secara luas sebagai pilihan metode pemilihan warna di antarmuka grafis komputer dan sebagai
metode menambahkan warna palsu gambar (Bagian 1.1.2).
Rincian RGB konversi gambar HSV di Matlab diberikan dalam Latihan 1.6.

1.5 Gambar di Matlab


Setelah memperkenalkan dasar-dasar representasi gambar, sekarang kita beralih ke
praktis aspek buku ini untuk menyelidiki tahap awal manipulasi gambar menggunakan Matlab.
Tersebut disajikan sebagai sejumlah contoh bekerja dan latihan lebih lanjut untuk pembaca.

1.5.1 Membaca, menulis dan query gambar


Membaca dan menulis gambar dicapai sangat sederhana melalui imread dan imwrite
fungsi. Fungsi-fungsi ini mendukung semua format gambar yang paling umum dan membuat /
ekspor 2-D / array 3-Dimage tepat dalam lingkungan Matlab. Fungsi imfinfo dapat digunakan
untuk query gambar dan membangun semua properti yang penting, termasuk jenisnya, format,
ukuran dan kedalaman bit.
1.5.2 Tampilan Dasar Gambar
Matlab menyediakan dua fungsi dasar untuk tampilan gambar: imshow dan imagesc.
Sementara imshow mensyaratkan bahwa 2-D array yang ditentukan untuk tampilan sesuai
dengan tipe data gambar (Intensitas mis / warna gambar dengan rentang nilai 0-1 atau 0-255),
imagesc menerima masukan array dari setiap Matlab jenis penyimpanan (uint 8, uint 16 atau
ganda) dan rentang numerik. Fungsi yang terakhir ini kemudian skala rentang input data dan
menampilkannya menggunakan saat ini / default peta warna. Kami tambahan dapat mengontrol
fitur layar ini menggunakan Fungsi colormap.
Dalam rangka untuk menunjukkan perbedaan antara dua fungsi kita sekarang mencoba tampilan
data gambar tidak dibatasi
Jika kita ingin menampilkan beberapa gambar bersama-sama, ini yang terbaik dicapai oleh
subplot yang fungsi. Fungsi ini menciptakan sebuah mosaik dari sumbu mana beberapa gambar
atau plot dapat ditampilkan.

1.5.3 nilai piksel Mengakses


Matlab juga mengandung built-in image viewer interaktif yang dapat diluncurkan dengan
menggunakan Fungsi imview. tujuannya adalah sedikit berbeda dari dua lainnya: itu adalah
grafis, gambar penampil yang ditujukan terutama untuk pemeriksaan gambar dan sub-wilayah
dalam mereka
1.5.4 Konversi jenis gambar
Matlab juga berisi dibangun di fungsi untuk mengkonversi jenis gambar yang berbeda. Disini
kita memeriksa konversi ke skala abu-abu dan tampilan individu RGB saluran warna Froman
gambar.

Anda mungkin juga menyukai