Citra (image) adalah kombinasi antara titik, garis, bidang, dan warna yang menciptakan
suatu imitasi dari suatu objek–biasanya bisa objek fisik atau manusia. Citra bisa berwujud
Dalam dunia desain digital, citra terbagi menjadi 2 jenis yaitu citra vector dan citra bitmap.
Citra vector adalah citra yang menampilkan matematis computer. Pengunaan citra vector ini
digunakan oleh aplikasi editing gambar seperti Adobe Illustrator, CorelDRAW, Corel Exchange,
dan Flash. Citra vector juga banyak digunakan untuk membuat logo dan gambar yang memiliki
detail tinggi. Karena citra vector tidak bergantung pada ukuran. Sedangkan citra bitmap
merupakan citra yang di dalamnya terdapat kotak/grid yang menyimpan piksel. Citra bitmap
memiliki resolusi tetap dan apabila resolusi diubah akan mempengaruhi kualitas citra. Citra yang
menggunakan data bitmap memiliki bobot file yang besar karena terdiri dari ragam warna yang
tersimpan dimasing-masing pikselnya. Contoh format file citra bitmap adalah BMP, GIF, JPEG,
JPG, PNG, TIFF, dan PSD. Ukuran citra bitmap yang besar akan mempengaruhi proses
transmisi atau pengiriman citra tersebut melalui jaringan komputer. Seperti contoh citra bitmap
24-bit berdimensi 1024 x 768 piksel membutuhkan memori penyimpanan sekitar 2 Mb. Sehingga
semakin besar ukuran suatu citra maka kecepatan transmisinya juga semakin lambat dan
Oleh karena itu, saat ini telah dikembangkan banyak teknik untuk mereduksi ukuran citra
digital tersebut dengan mengurangi tingkat redudansi datanya yang disebut Kompresi. Melalui
kompresi dengan algoritma yang tepat dapat mengubah ukuran citra dengan sedikit perubahan
kualitas citra tanpa menghilangkan informasi di dalamnya. Terdapat dua jenis kompresi citra
yaitu lossless dan lossy compression. Kompresi lossless adalah kompresi yang citra hasil
kompresinya identik dengan citra aslinya sedangkan lossy kompresi adalah citra digital hasil
kompresi tidak identik dengan citra asli karena terdapat informasi yang hilang saat proses
kompres-dekompresi.
Berhubungan dengan kompresi citra, dibab ini kita akan menjelaskan standar kompresi citra
yang terdiri dari empat bagian yaitu: The JPEG Standard, The JPEG2000 Standard, The JPEG-
JPEG adalah standar kompresi citra yang dikembangkan oleh Joint Photographic Experts
Group, yang secara resmi diterima sebagai standar internasional pada tahun 1992. JPEG
merupakan metode kompresi citra lossy dengan mengunakan metode pengkodean transformasi
pengamatan utama:
Konten gambar yang berguna berubah relatif lambat diseluruh gambar yaitu: nilai
intensitas tidak biasa bervariasi banyak beberapa kali di area kecil misalnya dalam 8 × 8
blok gambar. Frekuensi spasial menunjukkan berapa kali nilai piksel berubah di seluruh
blok gambar. DCT memformalkan gagasan ini dengan ukuran seberapa banyak konten
gambar berubah dalam kaitannya dengan jumlah siklus gelombang kosinus per blok.
untuk kehilangan komponen frekuensi spasial yang sangat tinggi daripada kehilangan
abu-abu ("hitam dan putih") daripada untuk warna. subsampling chroma (4: 2: 0)
Setiap gambar dibagi menjadi 8 × 8 blok. DCT 2D diterapkan untuk setiap gambar blok f
(i, j), dengan output menjadi koefisien DCT F (u, v) untuk setiap blok. Namun, menggunakan
• Kuantisasi.
^ F(u , v)
F (u , v)=round
Q (u , v)
F (u, v) mewakili koefisien DCT, Q (u, v) adalah entri "matriks kuantisasi", dan Fˆ (u,
Langkah kuantisasi adalah sumber utama untuk loss dalam kompresi JPEG.
Masuknya Q (u, v) cenderung memiliki nilai lebih besar ke arah sudut kanan
bawah. Ini bertujuan untuk memperkenalkan lebih banyak loss pada frekuensi
spasial yang lebih tinggi - praktik yang didukung oleh Pengamatan 1 dan 2.
Tabel 9.1 dan 9.2 menunjukkan nilai Q (u, v) default yang diperoleh dari studi
RLC bertujuan untuk mengubah nilai-nilai Fˆ (u, v) menjadi set {#-zeros-toskip , next
non-zero value}. Untuk membuatnya paling mungkin mencapai nol jangka panjang:
vektor.
Gambar 9.4 Zig zag scan pada JPEG
Koefisien DC dikodekan secara terpisah dari yang AC. Differential Pulse Code
gambar pertama adalah 150, 155, 149, 152, 144, maka DPCM akan menghasilkan
• Pengodean entropi.
SIZE menunjukkan berapa banyak bit yang diperlukan untuk mewakili koefisien, dan
AMPLITUDE berisi bit yang sebenarnya. Dalam contoh yang kami gunakan, kode
(8, 10010110), (3, 101), (3, 001), (2, 11), (4, 0111).
SIZE adalah kode Huffman karena SIZE yang lebih kecil muncul lebih sering.
AMPLITUDE bukan kode Huffman, nilainya dapat berubah secara luas sehingga
pengkodean manusia tidak memiliki manfaat yang cukup besar.
Gambar 9.5 Detail pengkodean entropi dasar — kategori Size
digunakan adalah:
Mode Sequential adalah mode JPEG default, secara implisit seperti dijumlahkan
dalam diskusi sejauh ini. Setiap gambar tingkat abu-abu atau komponen gambar
Mode Progresif adalah Progresif JPEG menghasilkan versi gambar dengan kualitas
rendah dengan cepat, diikuti oleh lintasan berkualitas lebih tinggi. Terbagi atas dua
(spektrum frekuensi spasial) dari koefisien DCT: komponen AC yang lebih tinggi
koefisien DCT dikodekan secara bersamaan tetapi dengan bit yang paling signifikan
Gambar yang dikodekan pada resolusi terendah pada dasarnya adalah gambar filter
low-pass terkompresi, sedangkan gambar pada resolusi yang lebih tinggi secara
lebih rendah). Mirip dengan JPEG Progresif, gambar JPEG Hierarkis dapat
Lossless JPEG adalah mode JPEG yang sangat istimewa yang memang tidak
mode lossy lainnya. Di sisi lain, ini memenuhi kebutuhan khusus, dan standar JPEG-
LS yang dikembangkan kemudian secara khusus ditujukan untuk kompresi gambar
tanpa kehilangan
9.1.2 Bitsream JPEG
Di sini, frame adalah gambar, sebuah hasil scan akan melewati piksel (mis.,
Komponen merah), segmen adalah sekelompok blok, dan satu blok terdiri dari 8 × 8
piksel.
• Frame header
- Jumlah komponen
• Scan header
gambar subjektif.
2. Untuk memberikan fungsionalitas tambahan yang kurang dalam standar JPEG saat
ini.
Kompresi bit-rate rendah: Standar JPEG saat ini menawarkan kinerja rate- distorsi
yang sangat baik dalam mid dan high bit-rates. Namun pada laju bit di bawah 0,25
bpp, distorsi subyektif menjadi tidak dapat diterima. Ini penting jika kami berharap
untuk menerima gambar pada perangkat dimana pun yang mendukung web kami.
Kompresi Lossless dan Lossy: Saat ini tidak ada standar yang dapat memberikan
Gambar besar: Standar baru akan memungkinkan resolusi gambar yang lebih besar
dari 64K x 64K tanpa ubin. Ini dapat menangani ukuran gambar hingga 232-1.
Arsitektur Dekompresi Tunggal: Standar JPEG saat ini memiliki 44 mode, banyak di
antaranya adalah aplikasi spesifik dan tidak digunakan oleh sebagian besar dekoder
JPEG.
dan Internet.
Transmisi Progresif: Standar baru memberikan skalabilitas kualitas dan resolusi yang
mulus dari bit-rate rendah ke tinggi. Target bit-rate dan resolusi rekonstruksi tidak
Interest (ROI) yang dapat dikodekan dengan kualitas unggul dari pada gambar
lainnya.
Pencitraan yang dihasilkan Komputer: Standar JPEG saat ini dioptimalkan untuk
pencitraan alami dan tidak berkinerja baik pada pencitraan yang dihasilkan komputer.
menggabungkan data tambahan non-gambar sebagai bagian dari file. Ini mungkin
Selain itu, JPEG2000 mampu menangani hingga 256 kanal informasi sedangkan
Dioptimalkan (EBCOT) algoritma yang mempartisi setiap subband LL, LH, HL, HH
yang dihasilkan oleh transformasi wavelet menjadi blok kecil yang disebut "blok
kode".
Bitstream terpisah yang dapat diskalakan dihasilkan untuk setiap blok kode.
dihasilkan untuk transformasi wavelet diskrit 2D pertama kali dipartisi menjadi blok
kode kecil,
biasanya 64 × 64, atau ukuran lain tidak kurang dari 32 × 32. Kemudian algoritma
EBCOT menghasilkan bitstream yang sangat skalabel untuk setiap blok kode Bi.
Pada Gambar 9.7 misalkan si [k] = si [k1, k2] antara blok kode kecil sampel
sub-band, dengan k1 dan k2 indeks baris dan kolom. (Dengan definisi ini, sub-band
HL high-pass horizontal harus diubah sehingga k1 dan k2 akan memiliki makna yang
konsisten dengan sub-band lainnya. Transposisi ini berarti bahwa sub-band HL dapat
diperlakukan dengan cara yang sama seperti sub-band LH, HH, dan LL dan
zona mati yang ditunjukkan pada Gambar 9.8 yang dirumuskan sebagai berikut:
di mana δβi adalah ukuran langkah untuk sub-band βi, yang berisi blok kode
dalam blok kode, diikuti oleh bit yang paling signifikan berikutnya νp (maks − 1) ii
9.8 Pengukur zona mati. Panjang zona mati adalah 2δ. Nilai-nilai di dalam zona mati dikuantisasi
menjadi 0
berturut-turut lebih kecil. Setara dengan pengkodean setiap blok satu bitplane
sekaligus.
Blok selanjutnya dibagi menjadi urutan 16 × 16 sub blok. Signifikansi sub-
satu tingkat pada suatu waktu. Struktur pohon dibangun dengan mengidentifikasi sub
blok dengan simpul daun, yaitu, Bi0 [j] = Bi [j]. Level yang lebih tinggi dibangun
1. Pengkodean Zero: Digunakan untuk mengkode koefisien pada setiap bitplane yang
belum signifikan.
setelah sampel melakukan transisi dari tidak signifikan menjadi signifikan selama
operasi pengkodean nol atau run-length coding. Karena memiliki empat horizontal
dan vertikal, masing-masing dari yang mungkin sesuai, positif, atau negatif, ada 34 =
Bit tanda χi [k] dari sampel yang berdekatan mengandung dependensi substansial.
−χi [k]. hai [k] menjadi 0 jika kedua tetangga horizontal tidak signifikan, 1 jika
−1 jika setidaknya satu tetangga horizontal negatif. i [k] didefinisikan sama untuk
tetangga vertikal. Jika χˆi [k] adalah prediksi tanda, simbol biner yang dikodekan
· χˆi [k].
4. Perbaikan magnitude: digunakan untuk menghitung nilai vp i [k], memberikan apa
yang v [k] ≥ 2p + 1
. Hanya tiga model konteks yang digunakan untuk perbaikan
perbaikan pertama diterapkan pada si [k]. Model konteks bergantung pada nilai dari
variabel ini yang berubah: vpi [k] dikodekan dengan konteks 0 jika ˜ σ [k] = hi [k] =
Untuk memastikan bahwa setiap blok kode memiliki bitstream yang disematkan
dengan baik, pengkodean dari setiap bitplane p berlangsung dalam empat lintasan
garis pindaian, sampel tidak signifikan dan sampel yang tidak memenuhi persyaratan
lingkungan dilewati. Untuk sub-band LH, HL, dan LL, persyaratan lingkungan
adalah bahwa setidaknya satu tetangga horizontal harus signifikan. Untuk subband
HH, persyaratan lingkungan adalah bahwa setidaknya satu dari empat tetangga
memasukkan sampel yang memiliki setidaknya satu signifikan tetangga segala arah.
3) Magnitude Refinement Pass: Lewat ini mengkodekan sampel yang sudah signifikan
tetapi belum dikodekan dalam dua lintasan sebelumnya. Sampel semacam itu
dan primitif pengkodean run-length yang sesuai. Jika sampel ditemukan signifikan,
Gambar di atas menunjukkan tata letak kode pass dan kode quad-tree di
setiap
bitplane p, Sp muncul tepat sebelum pass kode final Pp 4, bukan pass kode awal Pp
1. Ini menyiratkan bahwa sub-blok yang menjadi signifikan untuk pertama kalinya
Tujuan:
Untuk setiap bitstream tertanam dari blok kode Bi distorsi keseluruhan gambar
dimana Dni i adalah distorsi dari blok kode Bi yang memiliki titik potong ni. Untuk
setiap blok kode Bi, distorsi dihitung oleh
di mana Rmax adalah bit-rate yang tersedia. Untuk beberapa λ, setiap set titik
Lereng distorsi tingkat yang diberikan oleh rasio adalah benar-benar menurun.
informasi blok.
Lapisan kualitas Q1 berisi awal byte masing-masing blok kode Bi dan lapisan
Kuantitas adalah titik pemotongan yang sesuai dengan ambang batas distorsi λq
Tujuan:
Daerah tertentu dari gambar mungkin berisi penting informasi, sehingga harus
koefisien dalam ROI sehingga mereka ditempatkan ke dalam bit-pesawat yang lebih
tinggi.
Selama proses coding tertanam, bit yang dihasilkan ditempatkan di depan non-ROI
bagian dari gambar. Sehubungan Dengan Itu, berikan bit-rate yang dikurangi, ROI
akan diterjemahkan dan sebelum sisa gambar halus. Satu hal yang perlu diperhatikan
adalah bahwa terlepas dari penskalaan, decoding penuh dari bitstream akan
menghasilkan rekonstruksi dari kabel yang akan dibongkar dengan data tertinggi
yang tersedia. Gambar 9.11 menunjukkan efek pengkodean wilayah penting sebagai
bpp, (b) 0,5 bpp, (c) 0.6bpp, dan (d) 0,7 bpp.
kategori. Gambar uji yang digunakan ditampilkan di situs web buku teks. Untuk
setiap gambar, kami mengkompres menggunakan JPEG dan JPEG2000, pada empat
bitrate: 0,25 bpp, 0,5 bpp, 0,75 bpp, dan 1,0 bpp. Gambar 9.12 menunjukkan plot
rata-rata PSNR dari gambar dalam setiap kategori terhadap bitrate. Kami melihat
perbandingan kualitatif dari hasil kompresi, mari kita pilih satu gambar dan tampilkan
hasil dekompresi untuk kedua algoritma menggunakan bitrate rendah (0,75 bpp) dan
bitrate terendah (0,25 bpp). Dari hasil pada Gambar 9.13, bahwa seharusnya jelas
lebih sedikit.
berbeda jenis gambar. (a) Citra alam, (b) Citra yang dihasilkan komputer, (c)
Citra Medis
Gambar. 9.13. Perbandingan JPEG dan JPEG2000. (a) Citra Asli, (b) JPEG (kiri) dan
JPEG2000 (kanan) gambar dikompresi pada 0,75 bpp. (c) JPEG (kiri) dan JPEG2000
JPEG-LS dalam standar ISO / ITU saat ini digunakan untuk lossless atau
"Nyaris tanpa kehilangan" kompresi gambar nada kontinu. Ini adalah bagian dari
upaya ISO yang lebih besar yang ditujukan untuk kompresi yang lebih baik pada
peningkatan kecil dalam kompresi ditawarkan oleh algoritma yang lebih kompleks.
adalah untuk mengambil keuntungan dari struktur dalam sumber input - probabilitas
bersyarat ities.
C A d
B X
Gambar 9.14 JPEG-LS Context Model.
elektronik. Terutama digunakan untuk mengkode gambar yang dipindai dari cetakan
atau teks tertulis, teks yang dihasilkan komputer, dan faksimili misi.
9.4.1 The JBIG Standard
dengan resolusi yang semakin tinggi. JBIG adalah standar pengkodean yang
Standar kompresi lossless ini digunakan terutama untuk mengkode gambar yang
dipindai dari teks yang dicetak atau tulisan tangan, teks yang dihasilkan komputer,
progresif, dalam arti bahwa bitstream yang dihasilkan berisi serangkaian gambar
resolusi yang semakin tinggi. Standar ini juga dapat digunakan untuk kode grayscale
dan warna gambar dengan mengkodekan setiap bitplane secara independen, tetapi ini
Standar kompresi JBIG memiliki tiga mode operasi yang terpisah: progresif,
mode progresif. Satu-satunya perbedaan adalah bahwa data dibagi menjadi beberapa
strip dalam mode ini. Mode sekuensial perkembangan tunggal hanya memiliki
lapisan resolusi terendah. Oleh karena itu, seluruh gambar dapat dikodekan tanpa
referensi ke lapisan resolusi tinggi lainnya. Kedua mode ini dapat dilihat sebagai
kasus khusus mode progresif. Karena itu, diskusi kami hanya membahas mode
progresif.Encoder JBIG dapat didekomposisi menjadi dua komponen: • Resolusi-
Pada JBIG terdapat Encoder lapisan resolusi terendah, Dimana Gambar input
masing setara dalam fungsi, kecuali bahwa gambar input mereka memiliki resolusi
yang berbeda. Beberapa implementasi standar JBIG dapat memilih untuk secara
rekursif menggunakan salah satu penyandi fisik tersebut. Gambar dengan resolusi
ini
agak lebih sederhana daripada encoders resolusi-reduksi dan diferensial, karena
secara eksplisit dirancang untuk kompresi gambar lossy, lossless, dan lossy to
lossless. Tujuan desain untuk JBIG2 bertujuan tidak hanya untuk memberikan
kompresi lossless yang unggul dimana kinerja melebihi standar yang ada tetapi juga
pada memasukkan kompresi lossy pada rasio kompresi yang jauh lebih tinggi, dengan
Fitur unik JBIG2 adalah kualitas progresif dan konten progresif. Dengan
kualitas yang progresif, kami maksudkan bahwa bitstream berperilaku serupa dengan
standar JBIG, di mana kualitas gambar berkembang dari kualitas yang lebih rendah
ke yang lebih tinggi (atau mungkin tanpa kerugian). Di sisi lain, konten yang
Encoder JBIG2 menguraikan input bi-level gambar ke daerah atribut yang berbeda
berbeda.
Seperti pada standar kompresi gambar lainnya, hanya bitstream JBIG2, dan
tindakan yang sebenarnya diambil. Fitur lain dari JBIG2 yang membedakannya dari
standar kompresi gambar lainnya adalah bahwa ia dapat mewakili beberapa halaman
kompresi yang unggul melalui pengkodean berbasis model, di mana model yang
berbeda dibangun untuk tipe data yang berbeda dalam suatu gambar, mewujudkan
1. https://id.scribd.com/document/413220691/Chapter-9-Image-Compression-Standards, Diakses
2.