Anda di halaman 1dari 4

A.

DAFTAR ISTILAH
 LPC (Linear Predictive Codec): memodelkan sumber suara untuk mencapai kompresi
yang baik.
 codec adalah kependekan dari codec-decoder yang juga memiliki arti lain yaitu
compressor-decompressor. codec merupakan sebuah cara untuk mengkompres video,
audio, maupun gambar dengan ukuran sesuai ketentuan.
 quantize: merupakan proses pengubahan sinyal sample dari nilai yang bersifat continous
menjadi nilai yang bersifat diskrit ke nilai bulat terdekat.
 frekuensi: adalah jumlah getaran yang terjadi dalam waktu satu detik atau banyaknya
gelombang/getaran listrik yang dihasilkan tiap detik.
 amplitudo sinyal: merupakan ukuran tinggi rendahnya tegangan dari sinyal analog.
 sensivitas telinga bergantung pada frekuensi dan yang paling sensitif adalah dalam
kisaran 2-5 KHz.
 frekuensi hanya terdengar jika melebihi ambang sensitivitas
 suara harus lebih keras dari minimum normal amplitude
 setelah mendengar suara yang keras, telinga menjadi tuli terhdap suara yang lebih tenang
di rentang frekuensi yang sama untuk waktu yang singkat
 PCM (Pulse Code Modulation) adalah salah satu teknik memproses suatu sinyal analog
menjadi sinyal digital melalui kode-kode pulsa.
 DCT ( Discrete Cosine Transform) adalah salah satu algoritma yang dapat digunakan
untuk melakukan kompresi sinyal ataupun gambar.
 Frame adalah bingkai atau bagian pinggir. Frame juga dapat diartikan sebagai satuan
terkecil dalam video.
 Encoding adalah proses konversi informasi dari suatu sumber (objek) menjadi data, yang
selanjutnya dikirimkan ke penerima atau pengamat, seperti pada sistem pemrosesan data..
 Bitrate
 MP3
 Stereo
 Mono
 Hybrid
 Decoder
 Encoder
 AAC (Adavanced Audio Codec)
 WMA (Windows Media Audio)
 MPEG 2
 5.1 surround sound
 temporal Noise Shaping(TNS)
 Bit-Stream
 Entropi
 Redundansi
 MDCT ( Modified Discrete Cosine Transform) adalah solusi untuk masalah pengkodean
berlebih, yang menggunakan operator proyeksi pada tumpang tindih sehingga informasi
di jendela berurutan saling ortogonal.
B. LANGKAH PENGKODEAN AUDIO MPEG
1. sampel audio sebagai PCM (terdiri dari 16 bit linier). 12 set dan 32 sampel
2. Gunakan bank filter untuk membagi sinyal menjadi 32 pita frekuensi.
Bank filter adalah serangkaian filter bandpass yang memisahkan sinyal input menjadi
beberapa komponen, masing-masing membawa sub-band frekuensi tunggal dari sinyal
asli. memetakan sampel domain waktu menjadi 12 nilai untuk masing-masing 32 subband
frekuensi.
3. Tentukan daya di setiap subband
4. Gunakan model psikoakustik untuk memprediksi masking untuk setiap subband
model psikoakustik adalah model yang menggambarkan karakteristik pendengaran
manusia.
 Jika daya di subband di bawah ambang batas, jangan dikodekan.
 Jika tidak, tentukan jumlah bit yang diperlukan untuk mengkodekan subband
sedemikian rupa sehingga noise kuantisasi berada di bawah ambang batas
masking [Satu bit kuantisasi lebih sedikit menghasilkan ~6dB noise]
C. LAPISAN AUDIO MPEG
Layer 1: Filter tipe DCT dengan satu frame dan spread frekuensi yang sama per pita.
Model psikoakustik hanya menggunakan penyembunyian frekuensi.
Layer 2: Menggunakan tiga frame dalam filter (1152 sampel). Pengkodean faktor skala
dan sampel yang lebih ringkas.
Layer 3: Filter pita kritis yang lebih baik digunakan (frekuensi tidak sama) Model
psikoakustik mencakup efek penyembunyian temporal. Mempertimbangkan redundansi
stereo Huffman encoding sampel terkuantisasi.
D. PENGKODEAN HUFFMAN
Pengkodean panjang variabel, dengan kode yang paling sering menggunakan bit
paling sedikit dan kode yang lebih jarang menggunakan lebih banyak bit. Terbukti
optimal. Encoding dilakukan dengan membangun pohon encoding. Pohon dibangun dari
bawah ke atas, berdasarkan frekuensi karakter Mulailah dengan lima subpohon terpisah:
Misal : abjad lima huruf, A,B,C,D,E dengan frekuensi di Pengkodean panjang variabel,
dengan kode yang paling sering menggunakan bit paling sedikit dan kode yang lebih
jarang menggunakan lebih banyak bit. Terbukti optimal. Dari teksnya".
E. MEMPERBAIKI PENGKODEAN BITRATE DALAM MP3
Tujuannya adalah untuk mengkodekan pada bitrate tetap. Misalnya 128Kb/s.
Tidak dapat secara langsung mengalokasikan bit ke subband karena pengkodean
Huffman (tidak tahu berapa banyak bit yang akan dihasilkan). Gunakan pendekatan
berulang untuk mengubah faktor skala yang digunakan dalam kuantisasi setiap subband.
F. STEREO MP3
Beberapa mode stereo:
 Mono
 Kode setiap saluran secara terpisah.

Stereo bersama:

 Kode mean + perbedaan.


 Untuk frekuensi rendah, hanya kode yang berarti (Anda tidak dapat mendengar
stereo pada frekuensi rendah)
G. DEKODER MP3
 Tidak perlu model psikoakustik di dekoder .
 Encoder yang ditingkatkan dapat meningkatkan kualitas untuk decoder apa pun.
H. DILUAR MP3
 MP3 tidak lagi canggih.
 Kebanyakan codec yang lebih baru mengikuti prinsip umum yang sama.
 MPEG 2 Advanced Audio Codec (AAC)
 Ogg Vorbis
 Windows Media Audio (WMA)
I. MPEG 2 AAC
AAC berasal dari MP3. Perbedaan utama:
 5.1 Suara Sekitar
 Filter bank yang lebih baik:
 MP3 menggunakan bank filter hybrid untuk alasan kompatibilitas mundur.
 MPEG -2 AAC menggunakan Modified Discrete Cosine Transform.
 Temporal Noise Shaping (TNS):
 Membentuk distribusi derau kuantisasi dalam waktu dengan prediksi dalam
domain frekuensi.
 Membantu dengan sinyal suara.
 Kontrol resolusi kuantisasi yang lebih baik - laju bit yang diberikan dapat digunakan
lebih efisien.
 Format bit-stream: informasi yang akan ditransmisikan mengalami pengkodean
entropi untuk menjaga redundansi serendah mungkin.
J. OGG VORBIS
 Bebas paten, kualitas serupa dengan AAC.
 Seperti AAC , MDCT digunakan untuk mengubah ke domain frekuensi.
 Model psikoakustik yang digunakan untuk menentukan tingkat kebisingan
(amplop efek penyembunyian) di seluruh pita frekuensi. Termasuk penyembunyian
kebisingan simultan.
 Lantai kebisingan dikurangi dari komponen MDCT.
 Lantai kebisingan dan residu MDCT dikodekan secara terpisah menggunakan
algoritme kuantisasi vektor berbasis buku kode.
K. WINDOW MEDIA AUDIO
 Codec berbasis MDCT, sangat mirip dengan AAC dan Ogg.
 Frekuensi dan penyembunyian temporal, lalu kuantisasi ulang.
 Perbedaan utama:
 Lebih banyak ukuran blok untuk dipilih (dapat ditukar dengan temporal vs presisi
frekuensi lebih baik).
 Penggunaan pengkodean Huffman yang berbeda:
o Mantissa kode Huffman independen dan eksponen nilai frekuensi
terkuantisasi titik-mengambang.
 Pengkodean stereo tengah/samping.
o Kode L+R (tengah) dan LR (samping) secara terpisah.

Anda mungkin juga menyukai