Anda di halaman 1dari 9

1.

Definisi komprsi Data

Kompresi data adalah proses pengkodean (encoding) informasi


dengan menggunakan bit yang lebih sedikit dibandingkan dengan kode
yang sebelumnya dipakai dengan menggunakan skema pengkodean
tertentu. Kompresi data, terutama ntuk proses komunikasi, dapat bekerja
jika kedua pihak antara pengirim dan penerima data komunikasi memiliki
skema pengkodean yang sama.

Kompresi data hanya mungkin untuk dilakukan apabila data yang


direpresentasikan dalam berntuk normal mengandung informasi yang
tidak dibutuhkan.

Ketika data tersebut sudah ditampilkan dalam format yang


seminimal mungkin, maka data tersebut sudah tidak akan bisa dikompresi
lagi.

2. Jenis data yang dapat dikompresi

2.1 Kompresi data tipe Text


Didalam representasi data pada komputer, text merupakan
kumpulan dari karakter/simbol yang dapat dibaca baik oleh manusia
maupun oleh komputer. Satu buah karakter/simbol biasanya berukuran
1 byte / 8 bit. Untuk melakukan kompresi data jenis text, kita harus
menggunakan metode lossless compression karena data berjenis text harus
dapat dikembalikan ke bentuk semula secara utuh untuk dapat kembali
dibaca. Metode kompresi RLE (Run Length Encoding) dan Huffman
Coding adalah metode kompresi untuk data berjenis text.
Huffman Coding
Kompresi dengan algoritma Huffman Coding dilakukan dengan
cara :
1. Hitung frekuensi kemunculan setiap simbol.
2. Pilih dua buah simbol dengan frekuensi terkecil, lalu gabungkan
dalam satu tangkai.
3. Ulangi langkah kedua hingga tidak ada lagi tangkai yang dapat
digabungkan.
Misalnya, terdapat sebuah pesan : “ABABAAAADDDCCCFBB”.
Pesan tersebut berukuran 17 byte (termasuk spasi). Pertama, kita akan
menghitung kemunculan setiap karakter :
Simbol Kemunculan

A 6

B 4

C 3

D 3

F 1

Pilih dua buah simbol dengan frekuensi terkecil, yaitu simbol F dan D, lalu
gabungkan.
Simbol Kemunculan

A 6

B 4

C 3

(D,F) 4

Pilih kembali dua buah simbol dengan frekuensi terkecil, lalu gabungkan.
Ulangi hal ini hingga tidak dapat lagi digabungkan.
Simbol Kemunculan

A 6

B 4

(C,(D,F)) 7

Simbol Kemunculan

(A,B) 10

(C,(D,F)) 7
Simbol Kemunculan

((A,B), (C,(D,F))) 17

Pembentukan pohon Huffman :

Dari pohon diatas, maka huruf ‘D’ dapat kita kodekan dengan : 000. Berikut
ini merupakan tabel lengkap hasil pengkodean seluruh simbol :
Simbol Kode

A 10

B 11

C 00

D 010

F 011
Berdasarkan tabel diatas, maka “ABABAAAADDDCCCFBB”
dapat kita kodekan menjadi seperti berikut :
101110111010101001001001000000001101111. Data hasil kompresi
berukuran 29 bit / 4 byte. Dengan demikian, kita telah menghemat
sebanyak 13 byte (76%).

2.2  Kompresi data tipe Image


Kompresi pada jenis data Image biasanya dilakukan dengan
metode kompresi lossy compression dimana terdapat beberapa informasi
yang dihilangkan untuk mengurangi ukuran dari informasi yang ada.
Contoh penerapan kompresi data pada Image
adalah JPEG dan Quantizing Compression.
Teknik kompresi Quantizing Compression bersifat lossy dan
digunakan untuk mereduksi data dengan asumsi bahwa perubahan data
tidak akan berpengaruh banyak pada informasi. Kompresi ini
dilakukan dengan menggunakan matrik kuantisasi.
Contoh :

Hasil Reduksi :
Sedangkan untuk tipe data JPEG, kompresi data dapat dilakukan
dengan tiga buah model :
a) Sequential: kompresi dilakukan secara top-down, left-
right menggunakan proses single-scan dan algoritma
Huffman Encoding 8 bit secara sekuensial.
b)  Progressive: kompresi dilakukan dengan multiple-scan secara
progresif, sehingga kita dapat mengira-ira gambar yang akan kita
download.
c) Hierarchical: super-progressive mode, dimana image akan dipecah-
pecah menjadi sub image yang disebut frame. Frame pertama akan
membentuk image dalam resolusi rendah hingga berangsur-angsur ke
resolusi tinggi.

2.3 Kompresi data tipe Audio


Kompresi data jenis audio juga biasanya bersifat lossy. Salah satu
implementasi dari kompresi data audio adalahMP3. MP3 merupakan
salah satu format file audio yang sangat sering kita temui. MP3 didapat
dari proses kompresi data hasil rekaman dan memanfaatkan kelemahan
pendengaran manusia dalam proses kompresinya. Kompresi data pada file
MP3 dilakukan dengan cara :
1. Menghilangkan informasi-informasi audio yang tidak dapat didengar
oleh manusia (frekuensi suara yang diluar jangkauan indera
pendengaran manusia).
2. Manusia tidak mampu mendengarkan suara pada frekuensi tertentu
dengan amplitude tertentu jika pada frekuensi di dekatnya terdapat
suara dengan amplitude yang jauh lebih tinggi. Oleh karena itu,
informasi audio tersebut tidak perlu dikodekan.
3. Terkadang dual-channel stereo mengirimkan informasi yang sama.
Informasi tersebut cukup ditempatkan dalam salah satu channel saja
dengan ditambah beberapa informasi tertentu.
2.4 Kompresi data tipe Video
Video dapat dikompresi dengan metode lossless
compression maupun lossy compression. Dengan menggunakanlossless
compression seperti huffman coding atau arithmetic coding, maka data
video dapat dikembalikan secara utuh seperti semula. Data video juga
dapat dikompresi dengan menggunakan metode lossy compression,
contohnya dengan menghilangkan beberapa frame pada video tersebut.
Video memiliki format yang beragam, dan masing-masing format
tersebut menggunakan codec yang berbeda dan memiliki skema kompresi
yang berbeda pula. Salah satu format file video hasil kompresi
adalah MPEG.
3. Jenis kompresi data
3.1 Kompresi Lossless
Kompresi data yang menghasilkan file data hasil kompresi yang
dapat dikembalikan menjadi file data asli sebelum dikompresi secara utuh
tanpa perubahan apapun. Kompresi data lossless bekerja dengan
menemukan pola yang berulang di dalam pesan yang akan dikompres
tersebut dan melakukan proses pengkodean pola tersebut secara efisien.
Kompresi ini juga dapat berarti proses untuk mengurangi redundancy.
Kompresi jenis ini ideal untuk kompresi teks.
Algoritma yang termasuk dalam metode kompresi lossless
diantaranya adalah teknik dictionary coding dan huffman coding.
3.2 Kompresi Lossy
Kompresi data yang menghasilkan file data hasil kompresi yang
tidak dapat dikembalikan menjadi file data sebelum dikompresi secara
utuh. Ketika data hasil kompresi di-decode kembali, data hasil decoding
tersebut tidak dapat dikembalikan menjadi sama dengan data asli tetapi
ada bagian data yang hilang.
Oleh karena itu kompresi jenis ini tidak baik untuk kompresi data
yang kritis seperti data teks. Bentuk kompresi seperti ini sangat cocok
untuk digunakan pada file-file gambar, suara, dan film. Contoh
penggunaan kompresi lossless adalah pada format file JPEG, MP3, dan
MPEG.
4. Teknik kompresi data
4.1 Teknik Dictionary Coding
Teknik dictionary coding adalah teknik kompresi yang dilakukan
dengan cara mencari string yang sama di dalam dictionary buffer dan
look-ahead buffer. Apabila ditemukan string yang sama, maka akan
dikeluarkan sebuah token yang isinya mewakili informasi string tersebut.
Karena ukuran token tersebut lebih kecil daripada ukuran string yang
diwakilinya, maka akan terjadi kompresi.
4.2 Huffman Coding
Ide dasar dari cara Huffman ini adalah memetakan mulai
simbol yang paling banyak terdapat pada sebuah urutan sumber
sampai dengan yang jarang muncul menjadi urutan biner. Dalam
variable-length coding, sinkronisasi merupakan suatu masalah. Ini berarti
harus terdapat satu cara untuk memecahkan urutan biner yang diterima
kedalam suatu codeword.
Contoh penggunaan algoritma Huffman coding adalah:
Jika kita memiliki kalimat: “example of huffman coding”, maka
hal pertama yang harus dilakukan adalah menghitung probabilitas dari
tiap-tiap simbol. Hasilnya dapat diilhat pada tabel II-3.
Tabel II-3. Hasil perhitungan peluang kemunculan simbol.

Dengan melakukan prosedur sesuai dengan algoritma Huffman, maka akan


didapatkan Huffman tree sebagai berikut:
Dengan adanya Huffman tree seperti pada gambar 2.6, maka
ketika mengkodekan codeword yang digunakan adalah codeword sesuai
dengan posisi pada Hufman tree. Sebagai contoh, untuk spasi akan
dikodekan dengan codeword “1000”, sedangkan untuk huruf g akan
dikodekan dengan codeword “11111”.
4.3 Data Training Set
Data training set adalah data-data yang dipakai sebagai bahan
untuk mengevaluasi kinerja program kompresi yang telah dibuat. Data-
Data tersebut berasal dari sumber yang berbeda-beda dan memiliki skala
penggunaan yang berbeda pula.
Data yang paling baik untuk evaluasi adalah data yang telah dipilih
dan distandardisasi berdasarkan ilmu probabilistik dan statistika.
4.4 Program Kompresi Existing
1. WinZip
2. WinRAR
3. Compress
4. Gzip
5. Prediction by Partial Matching
6. Pack
5.      Format file hasil kompresi
Sebenarnya, format file hasil kompresi dapat dibuat sesuai dengan
keinginan pembuat software kompresi, seperti yang terdapat pada
software Winzip yang akan menghasilkan format hasil
kompresi ZIP dan Winraryang dapat menghasilkan format hasil
kompresi berekstensi RAR.

Anda mungkin juga menyukai