Bab 2
Bab 2
LANDASAN TEORI
2.2 Terminologi
Dalam bidang kompresi data ada sejumlah istilah atau terminologi yang
umum dipakai dalam tulisan-tulisan ilmiah. Dari sekian banyak terminologi itu
yang paling banyak digunakan adalah compression, decompression, compression
ratio dan compression factor.
Compression adalah proses kompresi atau pemampatan berkas agar
ukurannya menjadi lebih kecil. Proses ini diperlukan sewaktu berkas akan
disimpan atau akan dikirim ke tempat lain melalui jaringan. Apabila berkas
tersebut akan dipakai lagi, misalnya ditampilkan di layar monitor atau dijalankan
oleh aplikasi multimedia, maka perlu dikembalikan ke format semula. Proses
pengembalian berkas yang sudah dikompres kedalam ukuran semula ini disebut
dengan istilah decompression.
Untuk mengukur seberapa baik unjuk kerja suatu metode kompresi data,
digunakan istilah Compression Ratio (CR) dan Compression Factor (CF).
Compression Ratio adalah rasio atau perbandingan antara ukuran file sesudah
dikompres dengan ukuran file sebelum dikompres (Salomon, 2004, hal. 10), yang
secara matematis dapat ditulis seperti pada Persamaan 1.
Karakter ke (n) dan karakter ke (n+1) adalah kombinasi dua buah karakter
yang pada proses kompresi disubstitusi dengan sebuah karakter khusus. Karakter
pengganti ini harus tidak muncul pada file tersebut agar tidak menimbulkan
kesalahan sewaktu diadakan dekompresi.
Proses dekomprersi merupakan kebalikan dari proses kompresi, yaitu
mensubstitusi karakter khusus dengan dua buah kombinasi karakter yang sudah
ditentukan sebelumnya. Proses dekompresi metode diatomic encoding dapat
dilihat pada Gambar 2.
File teks dari setiap bahasa memiliki kombinasi yang berbeda-beda. Pada
nonadaptive diatomic encoding, kombinasi dua buah karakter yang akan
disubstitusi ditentukan berdasarkan penelitian sebelumnya. Metode ini mungkin
tidak akan memberikan nilai CR terbaik karena setiap file belum tentu memiliki
kombinasi karakter yang sama. Kombinasi dua karakter yang paling banyak
muncul di suatu file belum tentu banyak muncul di file lain. Selain itu karakter
pengganti yang dipilih dapat terjadi akan muncul di suatu file.
Untuk memperbaiki kelemahan ini, metode diatomic encoding dibuat
adaptive dengan cara, untuk setiap file dicari kombinasi dua buah karakter dengan
kemunculan paling tinggi dan juga karakter khusus penggantinya. Setelah
kombinasi tersebut ditemukan, kemudian dilakukan substitusi dengan sebuah
karakter khusus yang juga sudah ditemukan. Alur logika dari metode adaptive
diatomic encoding dapat dilihat pada Gambar 3.
Pada waktu hasil kompresi disimpan, informasi tentang dua buah karakter
yang dikombinasi dan karakter penggantinya harus disertakan dalam file tersebut.
Dengan cara ini maka untuk setiap file hasil kompresi selalu ditambah dengan 3
buah karakter.