Anda di halaman 1dari 6

Teknik Kompresi Lossless dan Lossy pada Audio

Moszes Angga, Newman Florindo, Eternal Dean R

Fakultas Pasca Sarjana Institut Teknologi TELKOM

Abstrak

Kompresi audio merupakan salah satu solusi yang cukup populer untuk digunakan terkait
dengan masalah storage dan akses real time. Teknik kompresi digunakan se-optimal mungkin
dengan memperhatikan beberapa aspek sehingga menghasilkan teknik kompresi yang lossless
dan lossy. Untuk kebutuhan sehari – hari teknik lossy banyak digunakan, mengingat rasio
kompresi yang besar sehingga sangat berpengaruh pada aspek storage dan keterbatasan
kemampuan telinga manusia.

Pada teknik kompresi lossless terdapat teknik Free Lossless Audio Codec (FLAC) yang
memanfaatkan tingginya korelasi antara sampel pada audio. Sedangkan pada teknik kompresi
lossy terdapat LPC, CELP, MPEG. merupakan teknologi kuno yang digunakan untuk suara
manusia. Pada makalah ini akan membahas prinsip-prinsip dasar dalam kompresi audio
khususnya pada teknik FLAC dan LPC yang secara garis besar mewakili teknik kompresi
lossless dan lossy.
Kata Kunci: kompresi, FLAC, MP3, audio

1. Pendahuluan Rasio = (F-Fterkompresi) X 100 %.......... (1)


F
Tujuan dari kompresi data adalah Dimana F adalah ukuran file asli dan
mengecilkan ukuran file audio tanpa Fterkompresi adalah ukuran file yang
merubah informasi dari data tersebut. terkompresi.
Walaupun kenyataannya pada teknik
kompresi lossy ada berberapa data yang Pada kompresi lossless, hasil kompresi
tidak dapat dikembalikan ke semula. Seperti dapat dikembalikan ke data semula oleh itu
pada teknik kompresi pada umumnya, rasio kompresi pada teknik kompresi
kompresi audio baik lossy maupun lossless, lossless tidak terlalu besar atau cenderung
memanfaatkan adanya redudansi informasi kecil. Sedangkan pada teknik kompresi
dengan dengan pengkodea, pengenalan lossy memanfaat kan keterbatasan manusia
pola maupun prediksi linear seperti pada misalnya pada pendengaran, maka dari itu
kompresi audio [1}. Kompresi dilakukan ratio kompresi cukup besar.
pada saat pembuatan file audio dan pada
saat distribusi audio tersebut. Pada makalah ini akan dibahas tentang
teknik kompresi lossless khususnya FLAC
Rasio kompresi adalah ukuran persentase pada bagian 2. Dan teknik kompresi lossy
data yang telah berhasil dimampatkan. Bila khususnya MP3 pada bagian 3. Sedangkan
rasio kompresi adalah 50 %, artinya 50 % kesimpulan pada bagian 4.
data semula telah berhasil dimampatkan.
Sehingga secara matematis dapat
rumuskan sebagai berikut;
2. Teknik Kompresi Lossless Free Lossless Audio Codec (FLAC)

Kompresi lossless merupakan metoda Format FLAC memanfaatkan tingginya


kompresi data yang memungkinkan data korelasi antar sample pada data audio
asli dapat disusun kembali dari data hasil yang menggunakan prediksi linear untuk
kompresi maka rasio kompresi pun tidak mengkonversi sample menjadi deretan
dapat terlalu besar untuk memastikan angka yang disebut residu, yang
semua data dapat dikembalikan ke bentuk kemudian disimpan dengan Golomb-
semula. Kompresi lossless untuk data audio Rice coding.
mirip dengan algoritma kompresi lossless
generik, dengan rasio kompresi 50 % Ada beberapa tahapan dalam kompresi
sampai 60 %, meskipun dapat mencapai 35 LPAC;
% pada data musik orchestra atau paduan
suara yang tidak terlalu banyak noise [1]. i. Blocking

Ada dua tahap utama dalam kompresi Blok dalam FLAC mengacu pada
lossless pada data audio, yaitu prediction deretan sample pada beberapa
dan residual coding. Prediction adalah channel. Ukuran blok dapat berbeda-
proses dimana hanya nilai dari sample beda, bergantung pada beberapa
pertama yang disimpan. Nilai dari sample- faktor termasuk sample rate. Ukuran
sample lain ditentukan oleh nilai sample blok ini mempengaruhi rasio
sebelumnya. Dengan asumsi bahwa setiap kompresi secara langsung.
sample suara yang berdekatan tidak Jika ukuran blok terlalu kecil, maka
memiliki perbedaan nilai yang sangat besar. dibutuhkan banyak frame sehingga
Sample hasil prediksi tentu tidak sama banyak bit akan terbuang untuk
persis dengan sample yang sebenarnya. menyimpan frame header.
Untuk memastikan kompresi bersifat
lossless, selisih antara sample hasil prediksi Jika terlalu besar, karakteristik sinyal
dengan sample original harus disimpan. audio akan terlalu bervariasi
Selisih ini disebut dengan residu. Untuk sehingga sulit menemukan predictor
lebih menghemat tempat, residu ini juga yang optimal.
disimpan secara terkodekan. Inilah yang
disebut dengan residual coding. FLAC membatasi ukuran blok antara
16 hingga 65535 sample / blok.
Kompresi lossless utamanya digunakan
untuk pengarsipan, dan penyuntingan. ii. Interchanel Decorelation
Untuk keperluan pengarsipan. Maka
kompresi lossless selalu digunakan Untuk data stereo, seringkali banyak
dalam sound engineering. Selain kedua korelasi antara channel kiri dan
kegunaan itu, kompresi lossless juga biasa kanan. Dengan demikian terdapat
digunakan oleh para audiophile, yaitu beberapa metode penyimpanan
penggemar musik yang senang channel ke dalam blok sebagai
mendengarkan musik dengan kualitas berikut:
tinggi dengan perangkat keras yang
berkualitas tinggi pula. Data audio yang • Independent, kedua channel
terkompresi secara lossless juga dikodekan terpisah.
digunakan untuk menghasilkan data audio • Mid-side, menyimpan rata-
versi lossy untuk didistribusikan. rata sinyal kedua channel
sebagai
Pada makalah ini akan dibahas format
teknik kompresi lossless FLAC
• Mid channel dan selisih
antara channel kiri dengan iv. Tahapan Residual Coding
kanan sebagai side channel.
• Left-side, menyimpan channel Prediktor tidak dapat mendeskripsikan
kiri dan side channel. sinyal dengan persis, oleh karena itu
• Right-side, menyimpan perlu disimpan selisih antara sinyal asli
channel kanan dan side dengan sinyal hasil prediksi - residu.
channel. Efektivitas prediksi dapat terlihat dari
ukuran residu yang dibutuhkan.
iii. Tahapan Prediction
Residu disimpan dengan salah satu
Encoder mencari aproksimasi dari dua cara rice coding:
deskripsi matematis dari sinyal pada
setiap blok. Ukuran deskripsi lebih • Menggunakan satu parameter
kecil dari ukuran sinyal. untuk seluruh residu,
didasarkan pada variasi nilai
Metode prediksi ini dikenali oleh
residu.
encoder maupun decoder sehingga
• Residu dibagi dalam beberapa
pada hasil kompresi cukup disertakan
bagian, dengan parameter
parameter prediksi. 4 metode dlm
sendiri yang ditentukan dari
prediction:
nilai rata-rata residu pada setiap
• Verbatim, Sinyal prediksi bagian.
adalah nol, sehingga residu
sama dengan sinyal yang
sebenarnya (tidak ada 3. Teknik Kompresi Lossy
kompresi).
• Constant, Metode ini Prinsip dasar kompresi lossy pada data
digunakan jika dalam channel audio memanfaatkan teori psikoakustik,
tertentu pada suatu blok yaitu keterbatasan pendengaran manusia.
terdapat digital silence / nilai Telinga manusia hanya dapat menangkap
yang konstan. suara dalam rentang 20Hz hingga 20000Hz,
• Fixed linear prediction. maka dalam kompresi lossy, data suara di
• FIR linear prediction. luar rentang tersebut tidak disimpan. Lebih
dalam lagi, suara dengan frekuensi tinggi
hanya dapat didengar oleh telinga manusia
jika memiliki amplitudo yang tinggi juga.
Oleh karena itu, noise pada data audio
(yang biasanya memiliki amplitude rendah)
dapat ‘disembunyikan’ dengan cara
disimpan pada rentang frekuensi tinggi.
metode untuk mengkompresi data dan men-
dekompresinya, dimana data yang
diperoleh mungkin berbeda dari yang
aslinya tetapi cukup dekat perbedaanya,
penurunan (perbedaan) kualitas data
disebut compression artefacts.

Kompresi lossy pada data audio


sangat banyak digunakan, baik secara
Gambar 1. Linear Prediction langsung (misalnya pada mp3 player)
maupun secara tidak langsung
(terkandung dalam DVD video, televisi
digital, video streaming, dan sebagainya).
Kompresi ini digunakan konsumen audio,
sebab dengan rasio kompresi yang
sangat tinggi (5% hingga 20%) kualitas
suara masih cukup baik. Di tangan audio
engineer ,sedikit penurunan kualitas dapat
berpengaruh secara beruntun pada
proses engineering, oleh sebab itu produksi
data audio tidak menggunakan kompresi
lossy.

Untuk data audio secara umum, format Gambar 3. Frame header MP3 secara visual
yang sangat populer adalah MP3 yang
merupakan bagian dari MPEG yang
menangani layer audio (MPEG layer III), Tabel 1. Karateristik file header
AAC yang merupakan pengembangan lebih
lanjut, serta OGG. Untuk data speech,
terdapat beberapa format seperti A-law/µ-
law yang digunakan pada telepon, AMR
pada GSM, AMR-WB untuk CDMA, dan
sebagainya.

Teknik Kompresi MP3

MP3 merupakan format yang menarik


karena bisa mempertahankan kualitas
suara sementara memiliki ukuran
yang tidak terlalu besar. Teknologi ini
dikembangkan oleh seorang insinyur
Institut Fraunhofer di Jerman,
Karlheinz Brandenburg. MP3 terdiri
dari banyak sekali frame ,dimana
setiap frame mengandung sebagian Berikut adalah karateristik MP3;
detik dari data audio yang
berguna,yang siap dikonstruksi ulang • Bit rate terbatas, maksimum
oleh decoder. Yang dimasukkan ke 320 kbit/s (beberapa encoder
setiap bagian awal dari frame data dapat menghasilkan bit rate
adalah “header frame”,yang yang lebih tinggi, tetapi sangat
mengandung 32 bit meta-data yang sedikit dukungan untuk mp3-
berhubungan dengan frame data yang mp3 tersebut yang memiliki bit
masuk. rate tinggi
• Resolusi waktu yang
digunakan mp3 dapat menjadi
terlalu rendah untuk sinyal-
sinyal suara yang sangat
transient, sehingga dapat
Gambar 2. Data yg mendeskripsikan bentuk menyebabkan noise.
structural dari frame tsb. Data inilah yg • Resolusi frekuensi terbatasi
disebut header dari frame oleh ukuran window yang
panjang kecil, mengurangi [3]. Critical Band
efisiensi coding.
• Tidak ada scale factor band Critical band merupakan daerah
untuk frekuensi di atas 15,5 atau frekuensi tertentu dimana
15,8 kHz. pendengaran manusia lebih peka
• Mode jointstereo dilakukan pada pada frekuensi-frekuensi rendah,
basis per frame. sehingga alokasi bit dan alokasi sub-
• Delay bagi encoder/decoder band pada filter critical band lebih
tidak didefinisikan, sehingga banyak dibandingkan frekuensi lebih
tidak ada dorongan untuk tinggi.
gapless playback (pemutaran
audio tanpa gap). Tetapi,
beberapa encoder seperti LAME
dapat menambahkan metadata
tambahan yang memberikan
informasi kepada MP3 player
untuk mengatasi hal itu.
Gambar 5. Critical Band
Sedangkan ada beberapa model dalam
teknik kompresi MP3; [4]. Joint Stereo

[1]. Model Psikoakustik Terkadang dual channel stereo


mengirimkan informasi yang sama.
model yang menggambarkan Dengan menggunakan joint stereo,
karakteristik pendengaran manusia informasi yang sama ini cukup
memiliki batas frekuensi 20 Hz s/d ditempatkan dalam salah satu
20 kHz, dimana suara yang memiliki channel saja dan ditambah dengan
frekuensi yang berada di bawah informasi tertentu. Dengan teknik ini
ambang batas ini tidak dapat bitrate dapat diperkecil.
didengar oleh manusia, sehingga
suara seperti itu tidak perlu
dikodekan.
4. Kesimpulan
[2]. Auditory Masking
Teknik kompresi audio lossless dan lossly
Manusia tidak mampu
memiliki perbedaan pada rasio
mendengarkan suara pada frekuensi
kompresinya, hal ini terjadi karena pada
tertentu dengan amplitudo tertentu
teknik lossless data yang dikompresi dapat
jika pada frekuensi di dekatnya
dikembalikan secara utuh ke data yg
terdapat suara dengan amplitudo
semula, sedangkan pada teknik lossly
yang jauh lebih tinggi
hanya sebagian data saja yang
dikembalukan ke data semual. Untuk
penggunaan sehari-hari teknik lossly sering
digunakan karena aspek storage dan
keterbatasan pendengaran manusia.

Gambar 4. Auditory Masking


Refensi
[1]. Satrio Adi Rukmono, Kompresi Data
Audio, Kompresi Data Audio, ITB
[2]. Alastair Porter, Free Lossless Audio
Codec, 2011
[3]. Willy Setiawan, Penggunaan Kode
Huffman dalam Kompresi Audio, 2009

Anda mungkin juga menyukai