KATA PENGANTAR
Maha Kuasa atas limpahan Rahmat-Nya sehingga buku saduran dengan judul
Buku ini disusun hanya untuk kalangan sendiri yaitu UPT Pelatihan Kerja
Instruktur agar tidak ketinggalan dengan kemajuan teknologi yang semakin hari
Penulis juga mengucapkan banyak terima kasih atas dukungan semua pihak yang
telah mendukung pembuatan buku ini sehingga buku ini dapat terselesaikan.
Semoga buku ini bermanfaat bagi penulis maupun pembaca lainnya untuk
Penulis,
DAFTAR ISI
KATA PENGANTAR..........................................................................i
DAFTAR ISI...................................................................................ii
BAB I PENDAHULUAN...................................................................1
1.1 Latar Belakang..........................................................................1
1.2 Tujuan.....................................................................................1
BAB II KOMPRESI DATA................................................................3
2.1 Kompresi..................................................................................3
2.2 Metode Kompresi Data..............................................................5
2.3 Algoritma Kompresi.................................................................10
2.3.1 Algoritma Shannon-Fano Encoding.....................................11
2.3.2 Algoritma Huffman Coding.................................................12
2.3.3 Algoritma Adaptive Huffman Coding...................................19
2.3.4 Algoritma DCT (Discrete Cosinus Transform)......................20
BAB III KOMPRESI CITRA (GAMBAR).........................................22
3.1 Kompresi Gambar....................................................................23
3.2 Prinsip-Prinsip Kompresi..........................................................24
3.3 Discrete Cosine Transform.......................................................25
3.4 Proses JPEG............................................................................26
3.5 Kuantisasi...............................................................................27
3.6 Entropi Encoding.....................................................................28
DAFTAR PUSTAKA.......................................................................30
COVER BUKU YANG DISADUR.....................................................31
DAFTAR ISI BUKU YANG DISADUR.......................................................33
merupakan pengurangan ukuran suatu berkas menjadi ukuran yang lebih kecil
suatu berkas yang berukuran besar dan data di dalamnya mengandung banyak
berkas dengan ukuran yang lebih kecil lebih cepat daripada berkas yang memiliki
ukuran besar. Kompresi juga penting manakala suatu data di- stream melalui
sebuah jaringan. Jadi inti dari kompresi ini adalah untuk mencapai kondisi yang
lebih efisien.
I.2 Tujuan
sehingga peserta pelatihan akan terarah sesuai dengan tujuan dari proses
latihan.
II.1 Kompresi
yang lebih kecil dari aslinya. Pengompresian berkas ini sangat menguntungkan
manakala terdapat suatu berkas yang berukuran besar dan data di dalamnya
Saat ini terdapat berbagai tipe algoritma kompresi, antara lain : Huffman,
LIFO, LZHUF, LZ77 dan variannya (LZ78, LZW, GZIP), Dynamic Markov
Misalnya terdapat kata "Hari ini adalah hari Jum'at. Hari Jum'at adalah hari
yang menyenangkan". Jika kita telaah lagi, kalimat tersebut memiliki pengulangan
karakter seperti karaktek pembentuk kata hari, hari Jum'at, dan adalah. Dalam
teknik sederhana kompresi pada perangkat lunak, kalimat di atas dapat diubah
tersebut menjadi karakter awal dalam kalimat. Pengubahan karakter menjadi lebih
menggunakan utilitas dekompresi. Dalam jenis ini, sistem operasi tidak tahu
Contoh dari sistem kompresi data yang cukup terkenal adalah PKZIP,
program.
pengiriman data kepada klien, sebab pengiriman berkas dengan ukuran yang lebih
kecil lebih cepat daripada berkas yang memiliki ukuran besar. Kompresi juga
Berdasarkan tipe peta kode yang digunakan untuk mengubah pesan awal
(isi file input) menjadi sekumpulan codeword, metode kompresi terbagi menjadi
a. Metode statik : menggunakan peta kode yang selalu sama. Metode ini
berubah dari waktu ke waktu. Metode ini disebut adaptif karena peta
dalam file input, lalu mengkodekan satu simbol dalam satu waktu,
dimana simbol yang lebih sering muncul diberi kode lebih pendek
Huffman.
nyata telah redundansi data statistik. Sebagai contoh, dalam teks bahasa
Inggris, 'e' huruf jauh lebih umum daripada huruf 'z', dan probabilitas
bahwa 'q' huruf akan diikuti oleh huruf 'z' sangat kecil. Kompresi jenis lain,
disebut kompresi lossy data atau persepsi coding , adalah mungkin jika
halus dalam terang daripada variasi warna. JPEG kompresi gambar yang
mungkin.
Namun, algoritma kompresi lossless data akan selalu gagal untuk kompres
beberapa file, memang, setiap algoritma kompresi tentu akan gagal untuk
kompres data tidak berisi pola-pola yang jelas. Upaya untuk kompres data
ekspansi, seperti yang akan mencoba untuk menekan semua tapi yang
Dalam prakteknya, data lossy kompresi juga akan datang ke titik di mana
lossy, seperti misalnya selalu mengeluarkan byte terakhir dari sebuah file,
25.888888888
25.[9]8
Diartikan sebagai, "25 poin 9 delapan", string aslinya diciptakan sempurna,
hanya ditulis dalam bentuk yang lebih kecil. In a lossy system, using Dalam
26
Sebaliknya, data asli pasti hilang, di manfaat dari file yang lebih kecil.
1. Faktor kompresi
dikompres sama atau tidak sama dengan file yang telah dikompres).
Tidak ada metode kompresi yang paling efektif untuk semua jenis file.
2. Kualitas
3. Kompleksitas
4. Interactivity
yang menghasilkan codeword biner untuk setiap simbol unik yang terdapat pada
data file.
efisien.
Pada lima belas tahun terakhir, Huffman Coding telah digantikan oleh
aliran simbol masukan dengan sebuah angka keluaran single floating-point. Lebih
banyak bit dibutuhkan dalam angka keluaran, maka semakin rumit pesan yang
diterima.
indeks dalam susunan kata di kamus. Apabila token lebih kecil dari susunan kata,
Teknik coding Shannon Fano merupakan salah satu algoritma pertama yang
tidak panjang, sehingga kode tersebut bersifat unik dan dapat didekodekan.
• Encode setiap simbol asli dari sumber menjadi urutan biner yang
dalam blok biner berdasarkan pajang variable. Cara seperti ini disebut
sebagai fixed to variable-length coding. Ide dasar dari cara Huffman ini
adalah memetakan mulai simbol yang paling banyak terdapat pada sebuah
urutan sumber sampai dengan yang jarring muncul menjadi urutan biner.
berarti harus terdapat satu cara untuk memecahkan urutan biner yang
ide dari Huffman Coding adalah memilih panjang codeword dari yang paling
dekodekan secara unik dengan H(x) minimum, dan optimum pada keunikan
langkah pertama.
berdiri sendiri
Input.
Set C = {c[1], c[2], ..., c[n]} dengan konfigurasi nilai simbol, c[i] = nilai (a[i]), 1 <= i <=
n.
Output.
Code H(A,C) = {h[1], h[2], ..., h[n]} dengan konfigurasi (biner) codewords, dimana h[i]
Goal.
Contoh:
II.3.2.1.1.1 Sample-1
Alphabet a b c d e f g h i
Input
Costs 10 15 5 15 20 5 15 30 5
Codewords 001 010 00000 011 101 00001 100 11 0001
Output
Weighted path length 10*3 15*3 5*5 15*3 20*3 5*5 15*3 30*2 5*4 = 355
II.3.2.1.1.2 Sample-2
Alphabet a b c d e f g h i
Input
Costs 3 21 2 1 8 34 1 13 5
Codewords 000001 01 0000001 00000000 0001 1 00000001 001 00001
Output
Weighted path length 3*6 21*2 2*7 1*8 8*4 34*1 1*8 13*3 5*5 = 220
a. Kode Huffman
kode yang lebih pendek. Sistem kode yang paling banyak digunakan adalah
kode ASCII. Dengan kode ASCII, setiap karakter dikodekan 8 bit biner.
A 3 3/7 0
B 1 1/7 110
C 2 2/7 10
D 1 1/7 111
01000001010000100100000101000011010000110100010001000001
0110010101110
Jadi dengan menggunakan kode Huffman ini, jumlah bit yang dibutuhkan
dipresentasikan dengan kode yang lebih pendek dari pada kode untuk
simbol lain. Kode dari setiap simbol tidak boleh merupakan awalan dari
asalnya).
7/7.
Daun pada pohon Huffman menyatakan simbol yang digunakan dalam teks
atau pesan. Kode setiap simbol dengan memberi label 0 pada setiap cabang
(sisi) kiri dan label 1 untuk setiap cabang kanan. Pohon Huffman untuk
ABCD, 7/7 1
teknologi kompresi data citra 17
0
0 0 1 1
A,3/ CBD,
C,2/ B,1/ BD, 2/7 D,1/
7 4/7
Gambar Pohon Huffman untuk pesan ‘ABACCDA’
Dengan membuat lintasan dari akar ke daun, akan dihasilkan kode untuk
Perhatikan bahwa simbol yang paling sering muncul memiliki kode dengan
jumlah bit minimum. Perhatikan pula bahwa tidak ada simbol yang kodenya
merupakan kode awalan untuk simbol yang lain. Dengan cara ini, kode
yang dikenal dengan algoritma FGK. Versi terbaru dari adaptive Huffman
optimalnya pada saat itu. Dalam hal ini, Adaptive Huffman Code merespon
Keuntungan lain dari sistem ini adalah kebutuhan transmisi data, data akan
lewat hanya sekali (tanpa statistic table). Tentu saja, metode one-pass
tidak akan menarik apabila jumlah bit yang ditransmisikan lebih besar dari
metoda two-pass. Namun, performa dari metode ini, dalam ruang lingkup
jumlah bit yang ditransmisikan, dapat lebih baik daripada static Huffman
dari metode adaptive dapat lebih buruk daripada metode static. Metode
adaptive Faller, Gallager dan Knuth merupakan dasar dari UNIX utility
mencapai 30-40%.
Apa itu DCT(Discrete Cosinus Transform)? DCT adalah salah satu algoritma
kosinus, dimana algoritma ini melakukan konversi data dari bentuk spasial
bersangkutan. Pada dasarnya DCT akan mengubah detil warna dari gambar
aslinya, pada operasi DCT ini nilai yang digunakan merupakan nilai real.
Ada dua persamaan yang bias digunakan yaitu DCT1 dimensi yang
Persamaan DCT 1
Keterangan :
Keterangan :
Keterangan :
Kompresi citra (gambar) sangat penting untuk transmisi yang efisien dan
gambar yang didapat sangatlah besar dan dapat menempati banyak ruang dalam
elemen untuk menyimpan, dan sebuah gambar dengan dimensi 640 x 480 piksel
memiliki warna mencapai hampir satu juta. Mengunduh file-file dari internet bisa
sangat memakan waktu. Data citra terdiri dari sebagian besar dari data
untuk kompresi citra telah menjadi sangat diperlukan. Karakteristik umum dari
sebuah gambar adalah bahwa pixel tetangga sangat berkorelasi dan karena itu
berkurang. Dua prinsip dasar yang digunakan dalam kompresi gambar adalah
sumber sinyal dan menghilangkan penyimpangan nilai piksel yang tidak terlihat
oleh mata manusia. JPEG dan JPEG 2000 adalah dua teknik penting yang
kompresi citra biner untuk Grup 3 komunikasi faksimili. Sejak itu, komite lainnya
dan standar yang telah dibentuk untuk menghasilkan standar de jure (seperti
manfaat, seperti: (1) memudahkan pertukaran file gambar antara perangkat yang
berbeda dan aplikasi, (2) penggunaan kembali hardware dan software yang telah
ada untuk array produk yang lebih luas, (3) adanya tolok ukur dan data referensi
Kebutuhan untuk kompresi citra menjadi jelas ketika jumlah bit per
gambar yang dihasilkan dihitung dari tingkat sampling yang khas dan contoh
1. Resolusi yang rendah, kualitas TV, warna gambar video yang memiliki
mm-6: 5000 x 6000 piksel, 12 bit/ pixel hampir berisi 360x 10 6 data
mengambil gambar tunggal, yang tidak dapat diterima untuk kebanyakan aplikasi.
Jumlah bit yang diperlukan untuk mewakili informasi dalam gambar dapat
antara nilai piksel tetangga; (ii) spektral redundansi, yang terjadi karena korelasi
antara nilai warna yang berbeda atau band spektral, (iii) redundansi temporal,
yang terjadi karena korelasi antara frame yang berbeda. Penelitian kompresi
gambar bertujuan untuk mengurangi jumlah bit yang diperlukan yang mewakili
Redundansi data adalah isu sentral yang ada dalam kompresi gambar
masing unit dalam gambar asli dan dikompresi, maka kompresi CR rasio dapat
didefinisikan sebagai
CR = n1/n2;
sebagai
RD = 1-1/CR;
2. Jika n1>> n1, maka CR → ∞ dan karenanya RD> 1 yang berarti cukup
piksel dengan kedalaman 6 sampai 24 bit dengan kecepatan yang wajar dan
terkompresi yang berkualitas relatif miskin dalam penampilan tetapi masih cocok
gambar yang sangat tinggi yang masih jauh lebih kecil dari data yang tidak
terkompresi.
untuk membuang informasi bahwa mata manusia tidak dapat dengan mudah
melihat. Sedikit perubahan dalam warna tidak dianggap baik oleh mata manusia,
karena itu encoding lossy JPEG cenderung menjadi lebih hemat dengan bagian
skala abu-abu gambar dan menjadi lebih dangkal dengan warna. DCT
transform dependent yang lain, DCT memiliki banyak keuntungan: (1) Telah
mempaket semua informasi dalam koefisien yang paling sedikit, (3) Meminimalkan
penampilan blok seperti yang disebut memblokir artefak yang terjadi ketika batas
Dimana u,v=0,1,2,3,……………,N-1
Dimana :
2. Nilai-nilai pixel dari berbagai gambar hitam dan putih adalah antara 0-255 tapi
DCT dirancang untuk bekerja pada nilai-nilai piksel mulai dari -128 sampai
127. Oleh karena itu setiap blok dimodifikasi untuk bekerja dalam kisaran.
dengan DCT matriks di sebelah kiri dan transpos dari matriks DCT di sebelah
kanannya.
III.5 Kuantisasi
tunggal. Ketika jumlah simbol diskrit dalam urutan tertentu berkurang, urutan
lossless.
ditransformasi oleh matriks kuantisasi yang digunakan. Nilai dari matriks yang
di dekat sudut kiri atas memiliki frekuens iyang lebih rendah, mata manusia lebih
gambar.
untuk menghasilkan string panjang nol. Setelah blok dikonversi menjadi spektrum
mengubahnya menjadi array satu dimensi linier, atau vektor dari 64 nilai,
dari frekuensi yang meningkat. Karena frekuensi yang lebih tinggi lebih cenderung
menjadi nol setelah kuantisasi, hal ini cenderung ke grup dengan nilai nol pada
singkat ke blok-blok input dengan probabilitas tinggi dan code word panjang
kemungkinan, dan mengulangi proses ini sampai ada hanya satu karakterter sisa.
Dengan demikian sebuah pohon kode dihasilkan dan kode Huffman diperoleh dari
OFFSET.
Petrus, Santoso. 2001. “Studi kompresi data dengan metode Aritmathic Coding”.
Petra.