Anda di halaman 1dari 20

TI9143 – Kompresi Data

PENGANTAR KOMPRESI DATA


Teori Informasi
Entropy
Kompresi Intuitif
Dosen Pengampu
Lukas Chrisantyo, S.Kom., M.Eng.

How to reach me?


• lukaschris@ti.ukdw.ac.id
• Telegram @lukaschris
Korespondensi online dengan file hanya via email.
Materi dan penilaian diupload di Moodle, penilaian akhir
diupload di e-class.
Kontrak Perkuliahan
Silakan perhatikan RPS di e-class.
Latar Belakang
Informasi semakin banyak

Orang ingin mendapatkan informasi dengan cara yang


paling mudah dan cepat
Latar Belakang
Revolusi teknologi komunikasi

Semua orang dituntut untuk bisa saling bertukar data


dengan cara yang paling mudah dan cepat.
Problem
Redundansi
Batasan storage
Batasan kualitas jaringan komunikasi
Kebutuhan untuk
MEMPERKECIL UKURAN DATA
dengan tetap mengutamakan data bisa
dibaca kembali dengan utuh.
Kompresi Data
The process of encoding information
using fewer bits (or other information-bearing units) than an
unencoded representation would use,
through use of specific encoding schemes. (Solomon, 2010)

Kebutuhan untuk
MENGIDENTIFIKASI DATA
dan menggunakan struktur yang ada di
dalam data untuk memperkecil ukuran
data.
Data
• Teks: karakter dengan mapping tertentu (misal ASCII)
• Image/Citra: data warna pixel
• Suara: sample
• Video: citra dalam jumlah banyak + data suara
Inti Kompresi: Mengolah Redundansi
Identifikasi pola data, misal frekuensi kemunculan sebuah data

Jika pola tersebut sering muncul (redundan), dapatkah dia


digantikan dengan bentuk/kode yang lebih singkat?
Teknik Kompresi “Tidak Sengaja”
• Morse Code: melihat frekuensi
kemunculan sebuah karakter
• For efficiency, the length of each
character in Morse is approximately
inversely proportional to its
frequency of occurrence in English.
Thus, the most common letter in
English, the letter "E," has the shortest
code, a single dot.
Teknik Kompresi “Tidak Sengaja”
• Braille character: melihat
frekuensi kemunculan
karakter dan kata
Compression Realms
LOSSLESS LOSSY
Saat didekompresi, data kembali ke Saat didekompresi, data tidak
bentuk semula kembali ke bentuk semula, tapi
secara keseluruhan masih terwakili
15.888888888 → 15.[9]8 15.888888888 → 16
Cocok untuk data tekstual dan Cocok untuk data yang spasial yang
redundansi dengan pola yang bisa memiliki keberagaman nilai yang
dimodelkan/dipetakan dengan tinggi
metode tertentu
Dicocokkan harus sama bit per bit Mempertahankan persepsi kualitas
Persepsi Lossy
Persepsi Lossy
 WAV vs. MP3 / AAC / M4A
 AVI uncompressed vs. MP4 / MKV / 3GP

Pada titik tertentu, indra manusia tidak bisa membedakan mana


yang compressed, mana yang uncompressed.
Teknik Kompresi Berdasar Input
Static: Algoritma baku diterapkan pada konten data yang akan
dikompres.
Adaptive: A data compression technique that dynamically
adjusts the algorithm used based on the content of the data
being compressed.
Pengukuran Kompresi
𝑈𝑛𝑐𝑜𝑚𝑝𝑟𝑒𝑠𝑠𝑒𝑑 𝑆𝑖𝑧𝑒
𝐶𝑜𝑚𝑝𝑟𝑒𝑠𝑠𝑖𝑜𝑛 𝑅𝑎𝑡𝑖𝑜 =
𝐶𝑜𝑚𝑝𝑟𝑒𝑠𝑠𝑒𝑑 𝑆𝑖𝑧𝑒
Contoh file 10 MB dikompres jadi 2 MB, maka CR = 5:1

𝐶𝑜𝑚𝑝𝑟𝑒𝑠𝑠𝑒𝑑 𝑆𝑖𝑧𝑒
𝑆𝑝𝑎𝑐𝑒 𝑆𝑎𝑣𝑖𝑛𝑔𝑠 = 1 −
𝑈𝑛𝑐𝑜𝑚𝑝𝑟𝑒𝑠𝑠𝑒𝑑 𝑆𝑖𝑧𝑒
Untuk contoh file yang sama, maka SS = 80%
Alur Kompresi

Pemodelan: melihat karakteristik data input, lihat bagaimana pola


redundansi dan kemungkinan-kemungkinan yang dapat terjadi, kemudian
tentukan pengkodean mana yang akan digunakan.
Pengkodean: menuliskan kode ke data output berdasarkan algoritma
pengkodean yang dipilih
Alur Kompresi

Contoh kompresi yang menggunakan pemodelan: Shannon-Fano, Huffman


Contoh kompresi tanpa pemodelan: Run-Length Encoding
Penentuan Metode Kompresi
• kompleksitas algoritma kompresi
• kebutuhan memory
• kecepatan algoritma
• data yang terkompres → rasio kompresi
• hasil kompresi vs. data asli → fidelity
Berlanjut ke topik
berikutnya...

Anda mungkin juga menyukai