PENDAHULUAN
Kebutuhan akan kapasitas penyimpanan yang besar nampaknya makin penting. Kebutuhan
ini, disebabkan oleh data yang harus disimpan makin lama semakin bertambah banyak,
khususnya bagi penggemar musik atau audio lainnya. Para penggemar tersebut umumnya sangat
membutuhkan kapasitas yang sangat besar, untuk menyimpan semua data dan file-file
musik/audio. Penyimpanan tersebut bukan hanya dialokasikan pada satu tempat saja. Tapi
mereka juga akan menyimpan data atau file-file tersebut pada tempat yang lain.
Meskipun yang disimpan tersebut sama, hal ini berguna untuk backup data. Backup perlu
dilakukan karena tidak ada yang menjamin suatu data pada tempat penyimpanan didalam
komputer tidak akan mengalami kerusakan. Alangkah banyaknya kapasitas penyimpanan yang
harus disediakan untuk menampung ribuan audio tersebut. Untunglah data-data tersebut dapat
dimampatkan (compress) terlebih dahulu sehingga tempat yang dibutuhkan di memori semakin
sedikit dan waktu yang dibutuhkan untuk berkomunikasi lebih pendek, sehingga kegagalan
dalam manipulasi data lebih sedikit.
Seperti halnya data gambar maupun video, data audio juga memerlukan kompresi untuk
isu storage dan keperluan pengaksesan secara real time melalui jaringan komputer. Namun,
untuk data audio tidak dapat digunakan teknik kompresi untuk data generik. Penggunaan
algoritma demikian menyebabkan buruknya kualitas suara, rasio kompresi yang tidak terlalu
besar (sekitar 87%), dan algoritma demikian tidak dirancang untuk keperluan pengaksesan
secara real time.
Mirip dengan kompresi gambar, ada dua macam teknik kompresi data audio,
yaitu lossydan lossless. Untuk konsumsi sehari-hari, teknik kompresi yang lossy lebih banyak
digunakan karena rasio kompresi yang besar, dan penurunan kualitas data audio pun tidak dapat
terlalu ditangkap oleh keterbatasan telinga manusia.
Audio merupakan representasi digital, analog dan elektrikal akan suatu suara. Ketika
mendengar, diperlukan sumber suara dan penerima. Sebuah sumber suara akan mengirimkan
sinyal kepada pendengar hingga menghasilkan sebuah suara. Sinyal yang dikirimkan adalah
sebuah data analog dari sebuah gelombang suara. Sinyal-sinyal tersebut akan dikirim ke otak dan
diterjemahkan hingga kita bisa mengerti suara tersebut. Untuk menerjemahkan suara dalam
komputer, kita harus mengolah data ke dalam bentuk digital, memilahnya, dan mengelolanya
hingga menghasilkan sebuah informasi. Salah satu cara yang bisa digunakan adalah dengan
merepresentasi sinyal elektrik gelombang suara menjadi data numerik yang berlainan. Sinyal
analog menghasilkan tegangan yang bervariasi secara terus-menerus. Untuk mengolah sinyal ke
dalam bentuk digital, kita dapat secara berkala mengukur tegangan sinyal dan mencatat rata-rata
nilai numerik. Proses ini disebut sampling.
Dalam ilmu komputer, digital audio merupakan sebutan untuk kemampuan teknologi
untuk menyimpan, merekam, dan merekayasa ulang suara melalui encoding process dalam
bentuk digital. File-file audio bisa dijalankan dengan berbagai macam aplikasi, aplikasi yang
terkenal adalah Winamp, Aimp, iTunes, Jet Audio, dll.
Kompresi audio/video adalah salah satu bentuk kompresi data yang bertujuan untuk mengecilkan
ukuran file audio/video dengan metode :
Lossly compression format, adalah format auido dengan teknik kompresi yang cukup
kuat yang akan menekan besar file hingga ukuran yang cukup kecil, namun kualitas audio
yang mengalami penurunan akibat kehilangan data-data dalam proses encodingnya.
Contoh: *.MP3, *.WMA dan *.AAC
Lossless compression format, merupakan format audio dengan teknik kompresi yang
cukup, sehingga besar file dapat ditekan namun dengan penurunan sedikit kualitas audio
pula. Contoh: *.FLAC
Kompresi dilakukan pada saat pembuatan file audio/video dan pada saat distribusi file
audio/video tersebut.
Kendala kompresi audio:
Perkembangan sound recording yang cepat dan beranekaragam
Losless audio codec tidak mempunyai masalah dalam kualitas suara, penggunaannya dapat
difokuskan pada :
Kecepatan kompresi dan dekompresi
Derajat kompresi
Dukungan hardware dan software
Lossy audio codec penggunaannya difokuskan pada :
Kualitas audio
Faktor kompresi
Kecepatan kompresi dan dekompresi
Inherent latency of algorithm (penting bagi real-time streaming)
Dukungan hardware dan software
Metode Transformasi
Menggunakan algoritma seperti MDCT (Modified Discreate Cosine Transform)
untuk mengkonversikan gelombang bunyi ke dalam sinyal digital agar tetap dapat
didengar oleh manusia (20 Hz s/d 20kHz) , yaitu menjadi frekuensi 2 s/d 4kHz dan 96
dB.
Metode Waktu
Menggunakan LPC (Linier Predictive Coding) yaitu digunakan untuk speech
(pidato), dimana LPC akan menyesuaikan sinyal data pada suara manusia, kemudian
mengirimkannya ke pendengar. Jadi seperti layaknya komputer yang berbicara dengan
bahasa manusia dengan kecepatan 2,4 kbps
2.4 Teknik Kompresi Audio dengan Format MPEG (Moving Picture Expert Group)
MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2
Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio. Nilai
0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD
Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel >
1,4 Mbits/sec yang hanya terdiri dari suara saja.
Untuk ratio kompresi 6:1 untuk 16 bit stereo dengan frekuensi 48kHz dan bitrate 256
kbps CBR akan menghasilkan ukuran file terkompresi kira-kira 12.763 KB, sedangkan
ukuran file tidak terkompresinya adalah 75.576 KB
4. Joint stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan menggunakan
joint stereo, informasi yang sama ini cukup ditempatkan dalam salah satu channel saja dan
ditambah dengan informasi tertentu. Dengan teknik ini bitrate dapat diperkecil.
Filter Bank, adalah kumpulan filter yang berfungsi memfilter masukan pada frekuensi
tertentu, sesuai dengan critical band yang telah didefinisikan. Filter yang dipakai adalah
gabungan dari filter bank polyphase dan Modified Discrete Cosine Transform (MDCT).
Perceptual Model, dapat menggunakan filter bank terpisah atau penggabungan antara
perhitungan nilai energi dan filter bank utama. Keluaran model ini adalah nilai masking treshold.
Apabila noise berada dibawah masking treshold, maka hasil kompresi tidak akan dapat
dibedakan dari sinyal aslinya.
Quantization/Coding, merupakan proses kuantisasi setelah sinyal disampling. Proses ini
dilakukan oleh power-law quantizer, yang memiliki sifat mengkodekan amplitudo besar dengan
ketepatan rendah, dan dimasukkannya proses noise shaping. Setelah itu nilai yang telah
dikuantisasi dikodekan menggunakan Huffman Coding.
Encoding Bitstream, merupakan tahap terakhir dimana bit-bit hasil pengkodean sampling
sinyal disusun menjadi sebuah bitstream.
Selama beberapa tahun terakhir format populer untuk audio informasi, termasuk WAV,
AU, AIFF, VQF, dan MP3. Semua ini didasarkan pada penyimpanan nilai tegangan sampel dari
sinyal analog, tetapi semua rincian informasi diformat dalam cara yang berbeda dan semua
menggunakan berbagai teknik kompresi untuk satu tingkat atau lainnya.
1. WMA
WMA (Windows Media Audio) adalah format yang ditawarkan oleh Microsoft. Format ini
di desain khusus untuk digunakan pada Windows Media Player yang ada pada sistem operasi
windows.
Kelebihan :
File WMA bisa dijalankan pada media player lain juga walaupun berada pada
sistem operasi yang lain.
Sangat disukai vendor musik online karena dukungannya terhadap Digital Rights
Management (DRM). DRM (Digital Rights Management ) adalah fitur yang mendukung
pencegahan terhadap pembajakan musik.
Memiliki kualitas musik lebih baik dibandingkan MP3 dan AAC.
Format WMA cukup populer dan didukung oleh piranti keras dan piranti lunak.
Kekurangan :
File wma memiliki ukuran yang cukup besar karena teknik kompresi kurang dilakukan
dengan maksimal. Format audio wma biasanya tidak digunakan di internet karena ukuran
file yang besar.
2. Format CD
Adalah proses mengubah amplitudo gelombang bunyi ke dalam waktu interval tertentu
(disebut juga sampling) sehingga menghasilkan representasi digital dari suara PRESENTASI
SUARA
Kelebihan :
File dengan format .cda ini dapat langsung dijalankan dengan melalui CD-R
Kekurangan :
File .cda sendiri tidak mempunyai informasi kode modulasi apapun sehingga jika dicopy
ke harddisk, file tersebut akan menjadi tidak dapat di-play atau dimainkan.
Dibutuhkan software khusus untuk mengubah dari format .cda menjadi format lain yang
dapat disimpan di computer.
Kelebihan :
Kekurangan :
File yang sudah dikompres tidak bisa di kembalikan ke bentuk awal, karena ada beberapa
data yang hilang.
Lisensi AAC tidak gratis.
Kelebihan :
Suara bagus, karena tidak dikompres.
format WAV mudah untuk diubah dan dikompresi ke format MP3 atau lainnya jika
diperlukan.
Mampu dimainkan pada semua operasi seperti Windows atau Mac, serta browser
populer.
Kekurangan :
File AIFF merupakan format file audio standar yang digunakan untuk menyimpan data
suara untuk PC dan perangkat audio elektronik lainnya, yang dikembangkan oleh Apple pada
tahun 1988. Standar dari file AIFF adalah uncompressed code pulse-modulation (PCM), namun
juga ada varian terkompresi yang dikenal sebagai AIFF AIFF-C atau aifc, dengan berbagai
kompresi codec.
Audio Interchange File Format [.AIF] - Merupakan format standar Macintosh. - Software
pendukung: Apple QuickTime Audio CD [.cda] - Format untuk mendengarkan CD Audio - CD
Audio stereo berkualitas sama dengan PCM/WAV yang memiliki sampling rate 44100 Hz, 2
Channel (stereo) pada 16 bit. - Durasi = 75 menit dan dynamic range = 95 dB.
Kelebihan :
Kekurangan :
tidak bisa diputar pada windows karena product aiff hanya mendukung untk MAC OS
memiliki ukuran yang cukup besar sehingga format aiff jarang digunakan pada internet
Pada awalnya, format MP3 ini dikembangkan oleh seorang Jerman bernama Karlheinz
Brandenburg, memakai pengodean Pulse Code Modulation (PCM). Prinsip yang dipergunakan
oleh MP3 adalah mengurangi jumlah bit yang diperlukan dengan menggunakan model
psychoacoustic untuk menghilangkan komponen-komponen suara yang tidak terdengar oleh
manusia – sehingga adapat digolongkan file audio dengan kompresi lossy.
Pada tahun 1991, file MP3 distandarisasi dan tahun 1994 hingga akhir tahun 2000,
popularitas dari MP3 semakin meningkat dengan semakin mudahnya akses Internet. Munculnya
software untuk menjalankan file MP3 seperti Winamp di tahun 1997 yang dikembangkan oleh
Nullsoft, dan player console untuk Linux, mp123, juga membuat file MP3 semakin digemari.
Merupakan format audio yang sering digunakan yang biasa digunakan sebagai output file
audio.
MP3 memiliki kapasitas yang lumayan kecil.
Kekurangan :
Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate
yang lebih tinggi, tetapi sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki
bit rate tinggi).
Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal
suara yang sangat transient, sehingga dapat menyebabkan noise.
Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi
efisiensi coding.
Tidak ada scale factor band untuk frekuensi di atas 15,5 atau 15,8 kHz.
Mode jointstereo dilakukan pada basis per frame.
Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk
gapless playback (pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME,
dapat menambahkan metadata tambahan yang memberikan informasi kepada MP3 player
untuk mengatasi hal ini.
Dalam sebuah MP3 Player ada beberapa komponen yang sangat penting. Dua di antaranya
adalah codec, firmware, serta converter. Converter tugasnya adalah mengonversi data digital
menjadi analog atau sebaliknya mengonversi sinyal analog menjadi data digital yang terdiri dari
bilangan satu dan nol saja. Sedangkan codec adalah sebuah algoritma yang digunakan untuk
mengompresi maupun dekompresi file oleh converter itu sendiri.
Pada sebuah MP3 Player yang paling sederhana setidaknya terdapat satu converter, yaitu
mengonversi data digital menjadi analog dengan sebuah codec serta sebuah software atau
firmware yang mengaplikasikan codec pada converter. Player yang paling sederhana ini hanya
mampu memainkan file dengan satu format saja yaitu MP3, tanpa dapat melakukan aplikasi lain.
Sedangkan player yang mampu melakukan beberapa hal sekaligus. Misalnya merekam suara
juga, maka di dalamnya terdapat tambahan converter yang bertugas untuk mengonversi sinyal
analog menjadi digital. Bila player yang Anda miliki dapat memainkan lebih dari satu format itu
tandanya player tersebut memiliki lebih dari satu codec.
Merupakan standar yang dibuat oleh perusahaan alat-alat music elektronik berupa
serangkaian spesifikasi agar berbagai instrument dapat berkomunikasi.
Dengan menggunakan format MIDI, perangkat elektronik seperti keyboard dan computer dapat
melakukan sinkronisasi satu sama lain.
Cara kerja MIDI pada instrument keyboard sama seperti sebuah komputer. Personal
Computer (PC) yang anggotanya terdiri dari CPU, Monitor, dan keyboard controller yang
terpisah dan memiliki fungsinya masing-masing. Keyboard yang memiliki fungsi untuk
mengendalikan apa saja yang diinginkan oleh pengguna komputer, CPU berperan sabagai otak
komputer yang menerima perintah dari keyboard controller sedangkan layar monitor memiliki
fungsi untuk menampilkan hasil dari segala pekerjaan yang dilakukan oleh pengguna komputer.
Sama seperti sebuah komputer instrument keyboard digital memiliki beberapa controller
(tuts), sumber bunyi (sound modul/generatorl), amplifier yang berfungsi sebagai penguat suara,
adan speaker yang berfungsi untuk monitor bunyi. Bentuk fisik ketiganya terpisah dan dapat
berkomunikasi menggunakan jack MIDI. Antara keyboard dengan pengahasil suara dapat
berkomunikasi dengan menggunakan kabel MIDI. Wujud dari komunikasi tersebut berupa
berupa perintah MIDI yang dikirim dari suatu alat ke alat lainnya jadi, MIDI tidak mengeluarkan
suara.
Kelebihan :
Jenis instrumen musik bisa diubah sesukanya tanpa harus merekam ulang data lagu
Ukuran filenya sangat kecil (5 menit lagu full orchestra ukurannya bisa hanya 50 Kb)
Tidak membutuhkan komputer yang 'powerful'
Kekurangan :
Ogg adalah format multimedia gratisan yang dirancang untuk streaming dan penyimpanan
yang effiesien. Format ini dikembangkan oleh Xiph.org Foundation. Begitu pula Vorbis yang
merupakan codec audio gratisan. Vorbis biasanya dipasang bersama Ogg, sehingga muncullah
yang namanya Ogg Vorbis.
Kelebihan :
Kekurangan :
Audio Converter digunakan untuk mengkonversi jenis file audio (MP3, WAV, WMA, dll) ke
jenis lain dari file audio. Jika tidak dapat mengedit atau convert file audio tertentu maka sebagian
software tidak dapat membaca file audio tersebut.
Free Studio
Format Input: AAC, AC3, AIF, AIFF, ALAC, AMR, APE, ASF, AU, CAF, CUE, FLAC,
M4B, MKA, MP2, MP3, MPC, OGG, RA, RAM, RM, RMM, RMVB, SHN , SPX, TTA, WAV,
dan WMA
Format Output: AAC, ALAC, AMR, FLAC, OGG, M4B, M4R, MP3, WAV, dan WMA
Format Input : 3GA, AAC, ACT, AIF, AIFC, AIFF, AMR, APE, ASF, AU, CAF, CDA,
DART, DCT, DS2, DSS, DVF, FLAC, GSM, M4A, M4R, MID, Depkes, MP2 , MP3, MPC,
mPGA, MSV, OGA, OGG, QCP, RA, RAM, RAW, RCD, REC, RM, RMJ, SHN, SMF, SPX,
VOC, VOX, WAV, WMA, dan Virginia Barat
Format Output : AAC, AC3, AIFC, AIF, AIFF, AMR, APE, AU, CAF, CDA, FLAC, GSM,
M3U, M4A, M4R, MP3, MPC, OGG, PLS, RAW, SPX, VOX, WAV, WMA , dan WPL.
Sekarang kita akan melakukan sebuah ujicoba dengan mengkompresi sebuah audio dengan
menggunakan software Audacity.
Kemudian tulis nama dan type file baru yang telah di kompresi
1. Alfarisi, Salman. 2012. Model Pertemuan Ke-3 Perkuliahan Multimedia dan Animasi.
Universitas Mercubuana.
2. http://beeshoot.weebly.com/my-blog/jenis-format-audio
3. http://www.omninerd.com/articles/How_Audio_Compression_ Works
4. http://en.wikipedia.org/wiki/Audio_file_format