Anda di halaman 1dari 6

202131125 Siti Nurul Maghfirah L.

Nama : Siti Nurul Maghfirah L.


NIM : 202131125
Kelompok 8
Translate halaman 191 – 195

3 KEHILANGAN PENGKODEAN GAMBAR

Skema kompresi pertama dirancang untuk mengompresi gambar digital untuk


penyimpanan tujuan, dan didasarkan pada teknik pengkodean lossless. Dibandingkan
dengan teknik lossy, kompresi lossless murni hanya dapat mencapai jumlah kompresi
yang sedikit, sehingga penggunaannya agak terbatas dalam praktik saat ini. Namun,
aplikasi tertentu perlu menyimpan gambar dalam bentuk lossless misalnya, industri film
merender gambar dan urutan gambar asli selalu disimpan dalam bentuk lossless untuk
dilestarikan kualitas gambar. Gambar-gambar ini digunakan untuk membuat film, yang
didistribusikan ke bioskop. Gambar terkompresi lossless dapat diadopsi lebih lanjut
untuk pasar tertentu di mana: gambar mungkin mengalami penurunan kualitas dengan
skema lossy seperti distribusi digital melalui DVD dan penggunaan dalam proyektor
digital. Skema kompresi gambar lossless sesuai dengan format BMP, TIFF, GIF, dan
PICT, antara lain.

3.1 Pengodean Gambar Berdasarkan Panjang Jalan

Run length encoding (RLE) mungkin merupakan salah satu skema pengkodean lossless
paling awal yang diterapkan pada gambar, dan digabungkan dalam format sebelumnya
seperti BMP, TIFF, dan RLA pada PC dan PICT pada mesin Macintosh. Seperti yang
dijelaskan sebelumnya bab, metode ini hanya mengganti lari piksel yang sama dengan
nilai piksel atau indeks bersama dengan frekuensi. Meskipun ada skema yang lebih baik
daripada BMP dan RLA, ini kadang-kadang masih digunakan untuk kompatibilitas
format antara berbagai perangkat lunak pencitraan. TIFF (Tagged Image File Format)
dirancang agar dapat diperluas dengan menyediakan skema kompresi yang digunakan di
header, sehingga TIFF dapat disesuaikan untuk memanfaatkan RLE atau algoritma
kompresi lain yang didukung.
202131125 Siti Nurul Maghfirah L.

3.2 Pengodean Gambar Berbasis Kamus (GIF, PNG)

Algoritma pengkodean berbasis kamus, seperti LZW, bekerja dengan mengganti kode
yang lebih pendek untuk pola nilai piksel yang lebih panjang yang terjadi pada gambar.
Kamus kata kode dan indeks dibangun tergantung pada pola piksel yang terjadi pada
gambar. Ini teknik ini digunakan oleh standar GIF dan PNG. Namun, satu perbedaannya
adalah alih-alih menggunakan algoritma LZW pada piksel awal dalam gambar, itu
dilakukan pada kumpulan warna yang diindeks. Saat mengompresi menggunakan GIF,
Anda biasanya menyediakan ukuran palet, misalnya, 8 bit, yang sesuai dengan jumlah
maksimal 256 warna. 256 warna terbaik kemudian dipilih sebagai warna palet dan nilai
piksel gambar diganti dengan indeks yang paling mewakili nilai piksel asli dari palet.
Algoritma LZW kemudian diterapkan pada indeks. Format GIF awalnya dikembangkan
oleh UNISYS Corporation dan merupakan salah satu format kompresi pertama yang
memungkinkan transfer gambar di Internet.

3.3 Pengodean Berbasis Prediksi

Teknik prediksi standar seperti DPCM atau variannya yang dimodifikasi menjadi 2D
dapat digunakan untuk memprediksi nilai piksel di lingkungan. Kesalahan antara nilai
sebenarnya dan prediksi mereka kemudian dapat dikodekan entropi untuk mencapai
kompresi. Yang tidak rugi mode JPEG bekerja dengan menggunakan skema prediktif
yang mengeksploitasi redundansi dalam dua ukuran. Diberikan nilai piksel X,
mekanisme prediksi berdasarkan sebelumnya piksel tetangga yang digunakan digunakan
untuk memprediksi nilai X. Selisih D(i,j) antara nilai asli dan nilai prediksi dihitung.
Mengulangi proses ini untuk semua piksel menghasilkan gambar kesalahan, yang
memiliki entropi lebih rendah daripada gambar asli dan dapat secara efektif dikodekan
entropi. Prosesnya diilustrasikan pada Gambar 7-4, di mana piksel dengan nilai X
ditampilkan, dan nilai prediksi diperoleh dari tetangga A, B, dan C tergantung pada
aturan prediksi, yang mungkin satu dimensi atau dua dimensi.

Skema lossy mampu mencapai tingkat kompresi yang jauh lebih tinggi. Di
sebagian besar kasus, distorsi yang disebabkan oleh teknik lossy dapat diterima untuk
rasio kompresi yang diinginkan. Teknik dan standar kompresi gambar lossy yang
populer akan dibahas selanjutnya. Dalam hampir semua kasus, kuantisasi lossy diikuti
202131125 Siti Nurul Maghfirah L.

oleh langkah lossless dari pengkodean entropi berdasarkan skema statistik seperti
Huffman atau kode aritmatika.

Gambar 7-4 Proses pengkodean lossless berdasarkan prediksi dalam standar JPEG. Indeks
menunjukkan bagaimana nilai X diprediksi oleh kombinasi A, B, dan C. Prediksi indeks 1, 2, dan 3
adalah prediktor 1D, sedangkan 4, 5, 6, dan 7 adalah prediktor 2D.

4 TRANSFORM KODE GAMBAR

Pengkodean berbasis transformasi generik diilustrasikan pada Gambar 6-14 sebelumnya


bab. Selain itu, kompresi gambar beroperasi dengan melakukan pengkodean entropi
setelah komputasi transformasi dan kuantisasi koefisien transformasi. Ini adalah
ditunjukkan pada Gambar 7-5. Encoder melanjutkan dalam tiga langkah: transformasi
komputasi, kuantisasi koefisien transformasi, dan pengkodean entropi dari nilai
terkuantisasi. Dekoder hanya memiliki dua langkah: langkah dekode entropi yang
meregenerasi koefisien transformasi terkuantisasi dan langkah transformasi terbalik
untuk merekonstruksi gambar. Langkah kuantisasi yang ada di encoder adalah penyebab
utama kerugian.

Transformasi harus merupakan fungsi yang dapat dibalik secara matematis yang
mengambil input citra domain spasial untuk menghasilkan representasi domain
frekuensinya. Contoh dari transformasi ini termasuk Discrete Fourier transform (DFT)
dan Discrete Cosine transform (DCT). Representasi domain frekuensi juga merupakan
gambar yang pikselnya mewakili koefisien domain frekuensi. Kami sekarang
menjelaskan bagaimana pipa berbasis transformasi generik yang ditunjukkan pada
Gambar 7-5 telah diadaptasi dalam standar kompresi JPEG yang populer.

Input Terkompresi
Mengubah Kuantisasi Entropi
gambar aliran kecil
pengkodean

Direkonstruksi transformasi penguraian aliran bit


gambar terbalik entropi terkompresi
202131125 Siti Nurul Maghfirah L.

Gambar 7-5 Jalur penyandian dan penguraian kode berbasis transformasi. Pengkodean terdiri dari tiga langkah:
perhitungan transformasi, kuantisasi koefisien transformasi, dan entropi yang mengkode transformasi terkuantisasi
koefisien. Proses decoding melakukan kebalikannya.

4.1 Pengodean Gambar DCT dan Standar JPEG

Standar JPEG didasarkan pada teknik pengkodean gambar transformasi yang


memanfaatkan: Transformasi Kosinus Diskrit (DCT). DCT dipilih oleh komunitas
JPEG karena distribusi energi domain frekuensi yang baik untuk gambar alam, serta
kemudahannya adopsi untuk komputasi berbasis perangkat keras yang efisien. Untuk
memahami bagaimana kompresi terjadi di pipa JPEG, sangat penting bahwa perilaku
DCT dipahami dengan baik. Bagian 8 menjelaskan rumus DCT dan cara kerja intuitif di
baliknya. Selain itu, Bab 2 menjelaskan aspek representasi domain frekuensi untuk
gambar. Seluruhnya Pipa encoder JPEG digambarkan pada Gambar 7-6. Deskripsi
langkah demi langkah menunjukkan aliran data yang tepat dan evaluasi yang terjadi
dalam mode dasar kompresi JPEG. Selain mengompresi menggunakan mode dasar, ada
juga mode progresif JPEG dibahas di Bagian 7. Semua mode kompresi JPEG dimulai
dengan mengubah gambar representasi menjadi representasi komponen YCrCb. Ruang
warna YCrCb sangat mirip dengan ruang warna YUV yang dijelaskan pada Bab 2.
Masing-masing komponen Y, Cr, dan Cb diperlakukan secara independen dengan
memecahnya menjadi 8 8 blok. Dalam mode dasar, blok dipindai dalam urutan garis
pindai dari kiri ke kanan dan atas ke bawah, masing-masing menjalani perhitungan
DCT, kuantisasi koefisien frekuensi, dan, akhirnya, pengkodean entropi.

Fitur yang menonjol dari setiap langkah diringkas dalam daftar berikut:

o Gambar apa pun dapat diambil sebagai input, tetapi selalu terlebih dahulu
dikonversi ke YcrCb format untuk memisahkan chrominance gambar dari
pencahayaan.
o Representasi YCrCb mengalami subsampling 4:2:0, di mana saluran
chrominance Cr dan Cb disubsampel menjadi seperempat ukuran aslinya.
Subsampling didasarkan pada eksperimen psikovisual, yang menunjukkan
bahwa sistem visual manusia lebih sensitif terhadap pencahayaan, atau
intensitas, daripada warna.
202131125 Siti Nurul Maghfirah L.

o Selanjutnya, masing-masing saluran (Y, Cr, dan Cb) diproses secara independen.
Setiap saluran adalah dibagi menjadi 8x8 blok. Komunitas JPEG memilih
ukuran blok ini setelah banyak eksperimen pada gambar nada yang alami dan
berkelanjutan. Rata-rata, 8x8 ukuran tampaknya menjadi area yang paling
optimal untuk korelasi spasial dan spektral bahwa kuantisasi DCT dapat
memanfaatkan. Ukuran yang lebih kecil meningkatkan jumlah blok dalam
gambar, dan ukuran yang lebih besar mengurangi korelasi yang terlihat di antara
piksel. Jika lebar gambar (tinggi) bukan kelipatan 8x8, balok batas mendapatkan
diisi dengan nol untuk mencapai ukuran yang dibutuhkan. Blok diproses secara
mandiri.
o Setiap 8 8 blok (untuk semua saluran) mengalami transformasi DCT, yang:
mengambil sampel gambar f(x,y) dan menghitung koefisien frekuensi F(u,v)
sebagai dijelaskan dalam Bagian 8. Perhitungan DCT dari sampel 8 8 blok
ditampilkan pada Gambar 7-7. Gambar f(x,y) dan nilai intensitas numeriknya
ditunjukkan pada kiri atas. Bagian tengah menunjukkan transformasi DCT yang
dihitung F(u.v). Meskipun nilainya adalah bilangan real, tabel menunjukkan
nilai DCT yang dibulatkan ke bilangan bulat terdekat untuk kekompakan dalam
penggambaran. Plot 3D menunjukkan DCT nilai dalam 3D. Dari jumlah
tersebut, koefisien pertama, yaitu koefisien di lokasi diberikan oleh indeks (0,0),
biasanya yang tertinggi, dan disebut koefisien DC. Status khusus untuk koefisien
DC ini disengaja karena sebagian besar
YCrCb
komponen
202131125 Siti Nurul Maghfirah L.

Input
gambar konversi
Y Cr Cb

Untuk setiap
komponen

Untuk setiap
kotak

Gambar 7-6 Pipa kompresi JPEG. Lihat sisipan warna dalam buku teks ini untuk versi penuh
warna dari gambar ini
energi dalam foto-foto alam terkonsentrasi di antara frekuensi terendah.
Koefisien yang tersisa disebut koefisien AC.
o Selanjutnya, koefisien DCT F(u,v) dikuantisasi menggunakan tabel kuantisasi
yang disediakan oleh JPEG. Tabel ini ditunjukkan di sudut kanan atas pada
Gambar 7-7. Setiap nomor pada posisi (u,v) memberikan ukuran interval
kuantisasi untuk F(u,v) yang sesuai nilai. Nilai tabel kuantisasi mungkin tampak
acak, tetapi, pada kenyataannya, mereka adalah berdasarkan evaluasi
eksperimental dengan subjek manusia, yang telah menunjukkan bahwa frekuensi
rendah dominan dalam gambar, dan sistem visual manusia lebih sensitif
terhadap kerugian dalam rentang frekuensi rendah. Sejalan dengan itu, angka-
angka dalam area frekuensi rendah (sudut kiri atas tabel) lebih kecil dan
bertambah seiring Anda bergerak menuju koefisien frekuensi tinggi di tiga sudut
lainnya.

Anda mungkin juga menyukai