Abstrak
Kompresi audio merupakan salah satu solusi yang cukup populer untuk digunakan terkait
dengan masalah storage dan akses real time. Teknik kompresi digunakan se-optimal mungkin
dengan memperhatikan beberapa aspek sehingga menghasilkan teknik kompresi yang lossless
dan lossy. Untuk kebutuhan sehari – hari teknik lossy banyak digunakan, mengingat rasio
kompresi yang besar sehingga sangat berpengaruh pada aspek storage dan keterbatasan
kemampuan telinga manusia.
Pada teknik kompresi lossless terdapat teknik Free Lossless Audio Codec (FLAC) yang
memanfaatkan tingginya korelasi antara sampel pada audio. Sedangkan pada teknik kompresi
lossy terdapat LPC, CELP, MPEG. merupakan teknologi kuno yang digunakan untuk suara
manusia. Pada makalah ini akan membahas prinsip-prinsip dasar dalam kompresi audio
khususnya pada teknik FLAC dan LPC yang secara garis besar mewakili teknik kompresi
lossless dan lossy.
Kata Kunci: kompresi, FLAC, MP3, audio
Ada dua tahap utama dalam kompresi Blok dalam FLAC mengacu pada
lossless pada data audio, yaitu prediction deretan sample pada beberapa
dan residual coding. Prediction adalah channel. Ukuran blok dapat berbeda-
proses dimana hanya nilai dari sample beda, bergantung pada beberapa
pertama yang disimpan. Nilai dari sample- faktor termasuk sample rate. Ukuran
sample lain ditentukan oleh nilai sample blok ini mempengaruhi rasio
sebelumnya. Dengan asumsi bahwa setiap kompresi secara langsung.
sample suara yang berdekatan tidak Jika ukuran blok terlalu kecil, maka
memiliki perbedaan nilai yang sangat besar. dibutuhkan banyak frame sehingga
Sample hasil prediksi tentu tidak sama banyak bit akan terbuang untuk
persis dengan sample yang sebenarnya. menyimpan frame header.
Untuk memastikan kompresi bersifat
lossless, selisih antara sample hasil prediksi Jika terlalu besar, karakteristik sinyal
dengan sample original harus disimpan. audio akan terlalu bervariasi
Selisih ini disebut dengan residu. Untuk sehingga sulit menemukan predictor
lebih menghemat tempat, residu ini juga yang optimal.
disimpan secara terkodekan. Inilah yang
disebut dengan residual coding. FLAC membatasi ukuran blok antara
16 hingga 65535 sample / blok.
Kompresi lossless utamanya digunakan
untuk pengarsipan, dan penyuntingan. ii. Interchanel Decorelation
Untuk keperluan pengarsipan. Maka
kompresi lossless selalu digunakan Untuk data stereo, seringkali banyak
dalam sound engineering. Selain kedua korelasi antara channel kiri dan
kegunaan itu, kompresi lossless juga biasa kanan. Dengan demikian terdapat
digunakan oleh para audiophile, yaitu beberapa metode penyimpanan
penggemar musik yang senang channel ke dalam blok sebagai
mendengarkan musik dengan kualitas berikut:
tinggi dengan perangkat keras yang
berkualitas tinggi pula. Data audio yang • Independent, kedua channel
terkompresi secara lossless juga dikodekan terpisah.
digunakan untuk menghasilkan data audio • Mid-side, menyimpan rata-
versi lossy untuk didistribusikan. rata sinyal kedua channel
sebagai
Pada makalah ini akan dibahas format
teknik kompresi lossless FLAC
• Mid channel dan selisih
antara channel kiri dengan iv. Tahapan Residual Coding
kanan sebagai side channel.
• Left-side, menyimpan channel Prediktor tidak dapat mendeskripsikan
kiri dan side channel. sinyal dengan persis, oleh karena itu
• Right-side, menyimpan perlu disimpan selisih antara sinyal asli
channel kanan dan side dengan sinyal hasil prediksi - residu.
channel. Efektivitas prediksi dapat terlihat dari
ukuran residu yang dibutuhkan.
iii. Tahapan Prediction
Residu disimpan dengan salah satu
Encoder mencari aproksimasi dari dua cara rice coding:
deskripsi matematis dari sinyal pada
setiap blok. Ukuran deskripsi lebih • Menggunakan satu parameter
kecil dari ukuran sinyal. untuk seluruh residu,
didasarkan pada variasi nilai
Metode prediksi ini dikenali oleh
residu.
encoder maupun decoder sehingga
• Residu dibagi dalam beberapa
pada hasil kompresi cukup disertakan
bagian, dengan parameter
parameter prediksi. 4 metode dlm
sendiri yang ditentukan dari
prediction:
nilai rata-rata residu pada setiap
• Verbatim, Sinyal prediksi bagian.
adalah nol, sehingga residu
sama dengan sinyal yang
sebenarnya (tidak ada 3. Teknik Kompresi Lossy
kompresi).
• Constant, Metode ini Prinsip dasar kompresi lossy pada data
digunakan jika dalam channel audio memanfaatkan teori psikoakustik,
tertentu pada suatu blok yaitu keterbatasan pendengaran manusia.
terdapat digital silence / nilai Telinga manusia hanya dapat menangkap
yang konstan. suara dalam rentang 20Hz hingga 20000Hz,
• Fixed linear prediction. maka dalam kompresi lossy, data suara di
• FIR linear prediction. luar rentang tersebut tidak disimpan. Lebih
dalam lagi, suara dengan frekuensi tinggi
hanya dapat didengar oleh telinga manusia
jika memiliki amplitudo yang tinggi juga.
Oleh karena itu, noise pada data audio
(yang biasanya memiliki amplitude rendah)
dapat ‘disembunyikan’ dengan cara
disimpan pada rentang frekuensi tinggi.
metode untuk mengkompresi data dan men-
dekompresinya, dimana data yang
diperoleh mungkin berbeda dari yang
aslinya tetapi cukup dekat perbedaanya,
penurunan (perbedaan) kualitas data
disebut compression artefacts.
Untuk data audio secara umum, format Gambar 3. Frame header MP3 secara visual
yang sangat populer adalah MP3 yang
merupakan bagian dari MPEG yang
menangani layer audio (MPEG layer III), Tabel 1. Karateristik file header
AAC yang merupakan pengembangan lebih
lanjut, serta OGG. Untuk data speech,
terdapat beberapa format seperti A-law/µ-
law yang digunakan pada telepon, AMR
pada GSM, AMR-WB untuk CDMA, dan
sebagainya.