Anda di halaman 1dari 7

KOMPRESI DATA AUDIO LOSSLESS DAN LOSSY

Kuncoro Triandono Mukti1 and Anggunmeka Luhur Prasasti2


Computer Engineering,
Telkom University
Bandung, Indonesia
1
kuncoroteem@gmail.com, 2 anggunmeka@gmail.com

Abstrak— Audio merupakan salah satu lossless, hasil kompresi dapat dikembalikan seperti
data multimedia yang berkembang pesat, data asli tanpa ada perubahan, maka rasio kompresi
terutama pada industri music yang semakin pun tidak dapat terlalu besar untuk memastikan
maju membuat banyak sekali format audio yang semua data dapat dikembalikan ke bentuk semula.
berukuran besar, seperti halnya data gambar Sedangkan Lossy compression adalah skema
maupun video, data audio juga memerlukan kompresi yang bersifat menghilangkan beberapa
kompresi untuk isu storage dan keperluan informasi yang ada pada data asli sehingga bila
pengaksesan secara real time melalui jaringan dilakukan proses dekompresi maka data
komputer. Ukuran audio yang lebih kecil akan keluarannya tidak akan persis sama dengan data asli.
mengurangi delay time sehingga pengiriman data Keduanya memanfaatkan keterbatasan indera
akan lebih cepat. Pemampatan data umumnya manusia yang hanya dapat menangkap (perceive)
diterapkan pada mesin komputer, hal ini kondisi lingkungannya dalam rentang tertentu,
dilakukan karena setiap simbol yang berdasarkan frekuensi-nya suara dibagi menjadi 4
dimunculkan pada komputer memiliki nilai bit- kelompok diantaranya pendengaran telinga manusia
bit yang berbeda. Pemampatan data digunakan yaitu antara 20 Hz hingga 20000 Hz.
untuk mengurangkan jumlah bitbit yang
Salah satu format audio yang cukup populer
dihasilkan dari setiap simbol yang muncul.
adalah FLAC dan MP3. Dari segi kualitas, jelas
Dengan pemampatan ini diharapkan dapat
FLAC lebih baik dibandingkan dengan MP3 [15].
mengurangi (memperkecil ukuran data) dalam
Namun, pada kenyataannya khususnya di Indonesia
ruang penyimpanan. Mirip dengan kompresi
sendiri masyarakatnya lebih banyak memilih untuk
gambar, ada dua macam teknik kompresi data
mendengarkan format MP3 (MPEG-1 Audio Layer
pada audio, yaitu lossy dan lossless. Untuk
3) dikarenakan ukuran nya yang kecil. Jika kita
konsumsi sehari-hari, kompresi lossy lebih
bandingkan dengan format MP3, format FLAC ini
banyak digunakan karena rasio kompresi yang
memang memerlukan ruang yang cukup besar. Jika
dihasilkan besar atau ukuran audio yang
suatu data audio berkualitas CD Audio
dihasilkan sangat kecil. Makalah ini membahas
menggunakan sampling rate 44,1 kHz, 16 bit per
prinsip-prinsip dasar dalam kompresi data audio
sample, 2 kanal (stereo), maka total media
dan membandingkan beberapa algoritma
penyimpanan data audio per detik adalah sekitar
kompresi data audio berdasarkan penelitian
176.400 Byte sehingga untuk durasi 60 detik (1
terdahulu.
menit) diperlukan 10,584 MB. Jika rata-rata durasi
Keywords— Audio Compression, dalam satu lagu sekitar 4 menit, maka dibutuhkan
Lossless, Lossy. tempat sekitar 42,336 MB untuk menyimpan 1 lagu
dimana 1 CD hanya dapat menyimpan kurang lebih
I. INTRODUCTION 16 lagu.

Seperti teknik kompresi pada umumnya, Saat ini terdapat banyak algoritma kompresi,
kompresi data audio, baik lossy maupun lossless, antara lain Dynamic Markov Compression (DMC),
memanfaatkan adanya redundansi informasi dengan Run Length Encoding (RLE), Lempel Ziv Welch
pengkodean, pengenalan pola, maupun prediksi (LZW), Arithmetic coding, Huffman Code, Rice
linear seperti pada kompresi video. Pada kompresi Code, Golomb Code, BW Transform, dan lain-lain.
Berdasarkan beberapa penelitian terdahulu musik dengan kualitas tinggi dengan perangkat
Algoritma Huffman lebih cepat dalam melakukan keras yang berkualitas tinggi pula. Data audio yang
kompresi, dan baik dalam kompresi audio, menurut terkompresi secara lossless juga digunakan untuk
[11] Algoritma Huffman lebih baik, cepat, dan menghasilkan data audio versi lossy untuk
menghasilkan PSNR yang tinggi dari Arithmetic didistribusikan. Saat ini, dengan semakin murahnya
coding dalam melakukan kompresi. Dan menurut media penyimpanan data digital dan bandwidth,
[12] Hasil kompresi Huffman lebih baik kompresi lossless pun menjadi semakin populer di
dibandingkan LZW dan DMC pada kasus file biner, kalangan konsumen.
file multimedia, file gambar dan file hasil kompresi.
2.1.2. Prinsip dasar kompresi lossless
Pada makalah ini pertama akan dijelaskan
dasar teori dari kompresi lossless dan lossy, Ada dua tahap utama dalam kompresi lossless
selanjutnya algoritma yang dapat digunakan untuk untuk data audio, yaitu prediction dan coding.
melakukan kompresi, lalu membandingkan hasil Prediction memanfaatkan sample-sample
penelitian yang telah dilakukan. sebelumnya untuk memprediksi sample berikutnya.
Kemudian selisih antara sample hasil prediksi
II. METHODS dengan sample sebenarnya dikodekan (coding).
Untuk setiap format, biasanya perbedaan hanya
Kompresi data adalah proses mengkodekan terdapat pada teknik prediction dan/atau coding.
informasi menggunakan bit atau information-
bearing unit yang lain yang lebih rendah daripada Beberapa format audio yang mendukung
representasi data yang tidak terkodekan dengan kompresi lossless diantaranya Shorten, sedangkan
suatu sistem enkoding tertentu, terdapat 2 teknik yang masih umum digunakan saat ini adalah Free
kompresi yaitu Lossless dan Lossy. Berikut Lossless Audio Codec (FLAC), Apple Lossless,
merupakan penjelasan mengenai Lossless, Lossy MPEG-4 ALS, Monkey's Audio, WavPack, dan
serta algoritma pengkompresian data audio. True Audio. Setiap format memiliki langkah atau
tahap yang berbeda-beda pada pengkompresiannya
2.1. LOSSLESS sebagai contoh pada makalah ini akan dijelaskan
proses kompresi pada format FLAC dan MPEG-4
Kompresi lossless pada data audio berarti ALS.
bahwa hasil kompresi dari data tersebut dapat di
dekompres untuk menghasilkan data yang sama 2.1.2.1. Audio kompresi pada FLAC
persis dengan data asli, tanpa ada penurunan kualitas
sama sekali. Kompresi lossless untuk data audio Format FLAC dikeluarkan oleh Xiph.Org
agak mirip dengan algoritma kompresi lossless Foundation dengan memanfaatkan tingginya
generik, dengan rasio kompresi sekitar 50% hingga korelasi antar sample pada data audio. FLAC
60%, meskipun dapat mencapai 35% pada data menggunakan prediksi linear untuk mengkonversi
musik orkestra atau paduan suara yang tidak terlalu sample menjadi deretan angka yang disebut residu,
banyak noise. yang kemudian disimpan dengan Golomb-Rice
coding. Rasio kompresi yang dihasilkan sebesar
2.1.1. Kegunaan kompresi lossless 40% sampai dengan 50%.

Kompresi lossless utamanya digunakan Proses kompresi dilakukan dengan beberapa


untuk pengarsipan, dan penyuntingan. Untuk tahapan yaitu :
keperluan pengarsipan, tentu kualitas yang
diinginkan adalah kualitas terbaik. Begitu juga  Blocking, Blok dalam FLAC mengacu
dengan penyuntingan. Menyunting data yang pada deretan sample yang merentang pada
terkompresi secara lossy menyebabkan turunnya beberapa channel. Ukuran blok dapat
kualitas suara pada setiap penyimpanan. Maka berbeda-beda, bergantung pada beberapa
kompresi lossless selalu digunakan dalam sound faktor termasuk sample rate. Ukuran blok
engineering. Selain kedua kegunaan itu, kompresi ini mempengaruhi rasio kompresi secara
lossless juga biasa digunakan oleh para audiophile, langsung. Jika ukuran blok terlalu kecil,
yaitu penggemar musik yang senang mendengarkan maka dibutuhkan banyak frame sehingga
banyak bit akan terbuang untuk sinyal asli dengan sinyal hasil prediksi.
menyimpan frame header. Jika terlalu Selisih ini disebut residu. Efektivitas
besar, karakteristik sinyal audio akan prediksi dapat terlihat dari ukuran residu
terlalu bervariasi sehingga sulit yang dibutuhkan. Residu ini dismipan
menemukan predictor yang optimal. FLAC dengan salah satu dari dua cara rice coding:
membatasi ukuran blok antara 16 hingga o menggunakan satu parameter untuk
65535 sample per blok. seluruh residu. Parameter ini
 Interchannel Decorrelation, Untuk data didasarkan pada variansi nilai residu.
stereo, seringkali banyak korelasi antara o Residu dibagi-bagi ke dalam beberapa
channel kiri dan kanan. Dengan demikian bagian kontigu dengan panjang yang
terdapat beberapa metode penyimpanan sama, dengan setiap bagian memiliki
channel ke dalam blok sebagai berikut: parameter sendiri yang ditentukan
o Independent, kedua channel dari nilai rata-rata residu.
dikodekan terpisah.
o Mid-side, menyimpan rata-rata sinyal 2.1.2.2. Audio kompresi pada MPEG-4 ALS
kedua channel sebagai mid channel
dan selisih antara channel kiri dengan Operasi pada MPEG-4 Audio Lossless Coding
kanan sebagai side channel. (Moving Pictures Expert Group) mirip dengan
o Left-side, menyimpan channel kiri FLAC. Perbedaannya antara lain untuk coding
dan side channel. residu, ALS menggunakan Golomb-Rice atau Block
o Right-side, menyimpan channel Gilbert Moore Coding. MPEG-4 mendukung
kanan dan side channel kombinasi lossy dengan lossless pada MPEG-4 SLS
(Scalable to Lossless). Rasio Kompresi yang
Pada kasus tertentu Left dan Right dihasilkan sebesar 50% sampai dengan 60%.
merupakan metode yang paling efisien
[15]. Proses kompresi tidak terlalu berbeda dengan
FLAC hanya saja berbeda pada bagian Prediction
 Prediction, Selanjutnya encoder mencari dan Residual Coding, berikut merupakan
aproksimasi deskripsi matematis dari tahapannya:
sinyal pada setiap blok. Ukuran deskripsi
ini umumnya jauh lebih kecil daripada  Blocking
ukuran sinyal itu sendiri. Metode prediksi  Interchannel Decorrelation
ini diketauhi oleh encoder maupun decoder o Independent
sehingga pada hasil kompresi cukup o Mid-side
disertakan parameter prediksi. Ada empat o Left-side
metode yang digunakan FLAC untuk o Right-side
prediction:  Prediction menggunakan Linear Predictive
o Verbatim, Sinyal prediksi adalah nol, Coding (LPC), LPC merupakan teknik
sehingga residu sama dengan sinyal kompresi kuno yang digunakan untuk suara
yang sebenarnya (tidak ada manusia (speech). Pada LPC terdapat
kompresi). sebuah model analitis dari pita suara
o Constant, Metode ini digunakan jika manusia. Data audio dibandingkan dengan
dalam channel tertentu pada suatu model ini, kemudian yang disimpan
blok terdapat digital silence atau nilai hanyalah parameter untuk membangkitkan
yang konstan. Encoding yang suara yang mirip menggunakan model
digunakan adalah run-length. tersebut. Kualitas suara yang dibangkitkan
o Fixed linear prediction buruk sehingga tidak digunakan lagi pada
o FIR linear prediction saat ini.
 Residual coding menggunakan Golomb-  Residual coding menggunakan Block
Rice Coding, saat prediktor tidak dapat Gilbert Moore Coding (BGMC), Pada
mendeskripsikan sinyal dengan persis, oleh BGMC, residu dibagi lagi menjadi dua
karena itu perlu disimpan selisih antara kategori, yaitu yang berada di area tengah
dari distribusi dan yang berada di luar area
tersebut. Residu yang berada di luar  Voc File Compression. Teknik ini sangat
kemudian dikurangi lagi dengan nilai sederhana, yaitu menghapus sample
residu maksimum agar semua residu sample yang hening (tidak ada suara)
berada di area tengah distribusi, kemudian seperti jeda antar paragraf pada sebuah
dikodekan dengan rice coding. pidato ataupun keheningan sejenak pada
beberapa bagian dari lagu.
2.1.3. Algoritma kompresi lossless  Linear Predictive Coding (LPC), Code
Excited Linear Predictor (CELP).
 Huffman Code  CELP merupakan pengembangan lebih
 Golomb Code lanjut, dengan model analitis yang lebih
 Rice Code kompleks untuk menghasilkan rasio
 Tunstall Code kompresi yang lebih besar dan kualitas
 Arithmetics Code suara yang lebih baik. Sedikit mirip dengan
 Dictionary Code kompresi lossless, pada CELP selisih
 Run-Length Code antara suara original dengan model analitis
 Burrows-Wheeler Transform juga disimpan dalam bentuk yang
terkompresi juga.
2.2. LOSSY  ADPCM. Sederhananya, sample pertama
disimpan secara utuh, sedangkan untuk
Teknik kompresi dimana data hasil dekompresi sample-sample berikutnya, yang disimpan
tidak sama dengan data sebelum kompresi namun adalah selisih dengan sample sebelumnya,
sudah “cukup” untuk digunakan. Contoh: Mp3, yang umumnya tidak terlalu besar.
streaming media, JPEG, MPEG, dan WMA.  MPEG. Teknik inilah yang memanfaatkan
Kelebihan dari metode ini yaitu ukurannya yang teori psikoakustik. Jika suara tidak dapat
lebih kecil dibandingkan dengan Lossless. Pada didengar telinga manusia, maka bagian
kompresi lossy untuk data audio akan terjadi suara tersebut tidak perlu dikodekan. Selain
penurunan kualitas jika hasil kompresi dicoba untuk itu, yang masih berhubungan dengan
di-dekompresi. Penurunan kualitas ini disebut psikoakustik adalah noise shaping. Sinyal
dengan compression artefacts. dengan frekuensi tinggi hanya dapat
didengar manusia jika memiliki volume
2.2.1. Kegunaan kompresi lossy yang besar, oleh karena itu noise
'disembunyikan' di area frekuensi tinggi ini
Kompresi lossy pada data audio sangat banyak dengan volume kecil.
digunakan, baik secara langsung (misalnya pada
mp3 player) maupun secara tidak langsung Beberapa format audio yang mendukung
(terkandung dalam DVD video, televisi digital, kompresi lossy diantaranya format yang sangat
video streaming, dan sebagainya). Kompresi ini populer adalah MP3 yang merupakan bagian dari
digunakan oleh para penikmat musik, sebab hasil MPEG yang menangani layer audio (MPEG layer
rasio kompresi yang sangat tinggi antara 0% sampai III), AAC yang merupakan pengembangan lebih
dengan 100% dengan kualitas suara yang masih lanjut, serta OGG. Untuk data speech, terdapat
“cukup” baik. beberapa format seperti A-law/µ-law yang
digunakan pada telepon, AMR pada GSM, AMR
2.2.2. Prinsip dasar kompresi lossy WB untuk CDMA, dan sebagainya.

Utamanya, kompresi lossy pada data audio 2.1.3. Algoritma kompresi lossy
memanfaatkan psikoakustik, yang berkaitan dengan
daya tangkap telinga manusia terhadap suara.  Skalar Quantization
Telinga manusia hanya dapat menangkap suara  Vector Quantization
dengan frekuensi di antara 20Hz hingga 20000Hz.
Namun masih ada beberapa teknik dasar lainnya
dalam kompresi lossy untuk data audio, yaitu:
III. RESULTS AND DISCUSSION

Tabel 1. Perbandingan Hasil Kompresi Audio Lossless dan Lossy

Format Compression Results


No Algorithm Type
(%)
Source Results
*.aac *.aac 3%
*.flac *.flac 1%
[1] Huffman Lossless *.midi *.midi 1% - 35%
*.mp3 *.mp3 1% - 3%
*.wav *.wav 10% - 27%
Huffman
[2] Lossy *.flac *.mp3 90% - 95%
Shift Coding
*.mp3 *.mp3 1%
[3] Huffman Lossless *.wav *.wav 17%
*.wma *.wma 2%
[4] Huffman Lossless *.wav *.wav 20% - 40%

*.mp3 *.mp3 2.4%


[5] Arithmethic Lossy
*.wav *.wav 11%
*.aif *.aic 18.443%
*.au *.aic 27.589%
[6] Arithmethic Lossy
*.mid *.aic 31.819%
*.wav *.aic 36.741%
Huffman - - 40.56%
[7] Lempel-Ziv Welch Lossless
- - 51.47%
(LZW)
Run Length *.mp3 *.mp3 0.46 %
[8] Lossless
Encoding (RLE) *.wav *.wav 13.83 %
Lempel-Ziv Welch
[9] Lossless *.mp3 *.wav 3.73% - 29,56%
(LZW)
Huffman Shift
[10] Lossless *.wav *.wav 14,87%
Coding

Pada penelitian [1], pengujian dilakukan


proses kompresi dan dekompresi pada 30 data
sampel untuk melihat hasil rasio dan waktu dapat
dilihat pada tabel 2, setelah dilakukan pengujian
didapatkan kesimpulan jika rasio kompresi tertinggi
hingga terendah pada format data uji dapat diurutkan
sebagai berikut midi, wav, mp3, aac, flac.

Berbeda dengan penelitian [1], [3], [4], [7] yang


hanya menggunakan algoritma Huffman, pada
penelitian [2] digunakan al qgoritma Huffman Shift
Coding, dengan tujuan untuk melakukan kompresi
lossy didapatkan hasil yang sangat memuaskan
dengan rasio kompresi mencapai 90% dapat dilihat
pada tabel 3.
Tabel 3. Hasil uji coba kompresi Huffman shift V. REFERENCE
Coding
[1] Rendra Warsita, Rahmat Agus Setiawan,
Yoannita. 2015, Rancang Bangun Aplikasi
Kompresi Audio Berbasis Android
Menggunakan Algoritma Huffman.

[2] Luthfi Firmansyah. 2016. Data Audio


Compression Lossless FLAC Format to
Lossy Audio MP3 format with Huffman
Shift Coding Algorithm. 2016 Fourth
International Conference on Information
and Communication Technologies
(ICoICT)

[3] Ari Wibowo. 2007, Kompresi Data


menggunakan Algoritma Huffman. Batam.

Lalu pada penelitian [5], [6] menggunakan [4] Hari Purwanto. 2015, Penerapan
Arithmethic Coding untuk melakukan kompresi Algoritma Huffman pada Kompresi file
Lossy hanya mendapatkan rasio kompresi tertinggi WAV. JURNAL VOL.2, No.2-40-59
sebesar 31.819% pada format *.wav. sedangkan Universitas Suryadarma.
pada penelitian [7], [9] algoritma yang digunakan
[5] Uswatun Hasanah, IMPLEMENTASI
yaitu Lempel-Ziv Welch (LZW) dengan kompresi
ALGORITMA ARITHMETIC CODING
lossless. Didapatkan hasil rasio kompresi tertinggi PADA KOMPRESI FILE AUDIO VIA
51.47%. dan dari semua algoritma yang diajukan FTP ( FILE TRANSFER PROTOCOL ).
dibandingkan dengan Run Length Encoding (RLE) Skripsi 2017.
pada penelitian [8] hanya mendapatkan rasio
kompresi 0.46% saja. [6] Yahya Fathoni Amri, 2012. Analisis
Kinerja Kompresi File audio
menggunakan Algoritma Arithmethic
IV. CONCLUSSION
Coding dengan bilangan integer.
Dari beberapa penelitian terdahulu yang telah [7] Rhen Anjerome Bedruz, Ana Riza F.
dilakukan dapat diambil kesimpulan jika saat ini Quiros, 2015. Comparison of Huffman
algoritma yang paling sering digunakan yaitu Algorithm and Lempel-Ziv Algorithm for
Huffman Coding pada kompresi Lossless, dengan Audio, Image and Text Compression. 8th
majunya teknologi penyimpanan data saat ini IEEE International Conference
berbagai kompresi lossless mulai dikembangkan Humanoid, Nanotechnology, Information
Technology Communication and Control,
dikarenakan harga penyimpanan yang dapat
Environment and Management
dibilang sudah mulai relatif murah dan demi (HNICEM)
mendapatkan kenyamanan saat mendengarkan
musik. [8] Aditya Rahandi, Dian rachmawati, Sajadin
Sembiring, 2012. Analisis dan
Dari berbagai format yang dijadikan objek Implementasi Kompresi File Audio
pengujian didapatkan kesimpulan jika format *.wav Dengan Menggunakan Algoritma Run
merupakan format yang memiliki hasil kompresi Length Encoding (RLE). Jurnal Online
Program Studi S1Ilmu Komputer, Vol 1,
terbaik dibandingkan dengan format lainnya.
No 1 (2012).

Jika dikelompokan berdasarkan jenis dan [9] Erwin Dwika Putra, Dedy Abdullah. 2016.
algoritmanya, kompresi Lossless paling cocok Analisis Perbandingan Kompresi Gambar
menggunakan Lempel-Ziv Welch (LZW) yang telah (*.bmp) dan Audio (*.wav) Menggunakan
dibuktikan oleh penelitian [7], sedangkan Lossy Algoritma Lempel Ziv Welch (LZW),
menggunakan algoritma Huffman Shift Coding Bengkulu. Amplifier Vol. 6 No. 2, Mei
2016
yang mencapai rasio kompresi lebih dari 90% [7].
[10] Prasetyo, Galang Bagus, (2013) Kompresi
File Audio Wave Menggunakan Algoritma
Huffman Shift Coding. Sarjana thesis,
Universitas Brawijaya.

[11] Venkatasekhar D., Aruna P 2012, A Fast


Fractal Image Compression Using
Huffman Coding. Dept of Computer
Science & Engg., Annamalai University,
Annamalai Nagar, India.

[12] Sutoyo T. 2009, Teori Pengolahan Citra


Digital. Andi, Yogyakarta.

[13] Daryanto, T. (2005). Sistem Multimedia


dan Aplikasinya. Yogyakarta: Graha Ilmu.

[14] Benjamin, A. (2010). Music Compression


Algorithms and Why You Should Care.
Alexander Benjamin.

[15] Satrio Adi Rukmono.2009, Kompresi


Data Audio. Bandung

Anda mungkin juga menyukai