Anda di halaman 1dari 12

BAB I

PENDAHULUAN

1.1 Teknik Video Coding


Perkembangan teknologi di bidang multimedia khususnya dalam
pengolahan gambar bergerak atau sering disebut video encoding/decoding sangat
pesat dan bersaing dalam kualitas gambar dan suara.
Dimana telah ditandai dengan munculnya beberapa standart CODEC dari
beberapa perusahaan yang berkompeten dalam bidang digital video processing
seperti :
a.
b.
c.
d.
e.
f.

MPEG1 (motion picture experts group, multimedia coding standart 1)


MPEG2 (motion picture experts group, multimedia coding standart 2)
MPEG4 (motion picture experts group, advanced multimedia coding)
H261 ( joint video team video coding standart)
H263 ( joint video team video coding standart)
H264 ( joint video team advanced video coding standart)

Dalam implementasi teknologi ini di gunakan dalam berbagi bidang


industri multimedia seperti digital television, internet streaming video, dan
DVD(digital versatile disk)- video.
Video kompersi telah menjadi komponen penting dalam media broadcast
dan media entertainment. Kesuksesan digital TV dan DVD-video pada 10 tahun
yang lalu berbasis pada MPEG-2 standart akan tetapi teknologi yang telah di
buktikan masih belum effektif. Sehingga standart CODEC telah di gantikan oleh
MPEG-4 dan H.264 dengan technique compression yang complex serta efektif
dalam kekuatan prosesing digital video.
1.2 Sejarah MPEG-4
MPEG-4, diperkenalkan pada akhir 1998, adalah sebuah nama dari sebuah
grup coding standar audio dan video dan teknologi yang berhubungan yang
disetujui oleh Moving Picture Experts Group (MPEG) ISO/IEC. Kegunaan utama
bagi standar MPEG-4 adalah internet (streaming media) dan CD, videophone, dan
televisi broadcast.
MPEG-4 format file spesifikasi telah dibuat atas dasar dari spesifikasi
format QuickTime diterbitkan pada tahun 2001. MPEG-4 format file, versi 1
1

diterbitkan pada tahun 2001 sebagai ISO / IEC 14496-1:2001, yang merupakan
revisi dari MPEG-4 Bagian 1: Sistem spesifikasi yang diterbitkan pada tahun
1999 (ISO / IEC 14496-1:1999). Pada tahun 2003, versi pertama dari format file
MP4 direvisi dan diganti dengan MPEG -4 Bagian 14: MP4 format file (ISO / IEC
14496-14:2003), secara umum disebut sebagai MPEG-4 format file versi 2. Pada
tahun 2005 diperkenalkan MPEG-4 Bagian 10 yang dikenal sebagai
H.264/MPEG-4 AVC, pengembangan ISO / IEC 14496-10.
MPEG-4 menyerap banyak fungsi dari MPEG-1 dan MPEG-2 dan standar
berhubungan lainnya, menambahkan fungsi baru seperti dukungan VRML
(extended) untuk perenderan 3D, file komposit berorientasi objek (termasuk
audio, video, dan VRML), dukungan spesifikasi-luar Manajemen Hak Cipta
Digital dan banyak interaktivitas lainnya.
Format MPEG-4 sangat tepat untuk memampatkan format video yang
besar,seperti .avi atau .vob karena konsep dasar dari kompresi MPEG-4 adalah
mengompres file ketika menyimpan video,lalu ketika video tersebut diputar,codec
MPEG-4 akan mengembangkan lagi ukuran file ini, jadi tingkat penurunan
kualitas video maupun audio menjadi sangat minimal dengan ukuran kompresi
file yang maksimal.
Kelebihan MPEG-4 adalah bisa melakukan kinerja MPEG-1, MPEG-2 dan
standar lainnya. Fungsi tambahannya yaitu mendukung VRML (Virtual Reality
Modeling Language) untuk rendering 3D. yang paling penting adalah MPEG-4
mampu melakukan fungsi interaktif dalam audio.
Untuk audio, kinerja dan kualitas MPEG-4 di kenal sebagai Advance
Audio coding (AAC). AAC ini adalah inti dari MPEG-4, 3GPP dan 3 GPP2. ACC
menyediakan kemampuan untuk memadatkan format suara menjadi lebih kecil
tetapi kualitasnya jauh lebih baik daripada format lain seperti MP3. Dengan
kualitas yang hampir setara dari CD Audio. AAC di kembangkan oleh group
MPEG termasuk didalamnya Dolby, Fraunhofer , AT & T, Sony dan Nokia.
Perusahaan ini juga mengembangkan Dolby Digital. Karena kualitasnya yang
bagus, banyak produsen audio yang memakai ACC. Adapun keunggulan ACC dari
MP3 yaitu:

1. Meningkatkan pemadatan audio ke kualitas yang lebih baik dengan ukuran file
yang lebih kecil.
2. Mendukung audio multichannel, sampai 48 saluran frekuensi.
3. Resolusi suara yang lebih tinggi sampai 96 kHz. Dengan 128 Kbps (kilo byte
per second) AAC mengalahkan MP3 di tingkatan yang sama. Bahkan pada
tingkatan 98 Kbps, AAC jauh lebih baik dari MP3 di 128 Kbps.
4. Meningkatkan efisiensi decoding dengan mengurangi energy pemrosesan.
1.3 Kelebihan MPEG-4
Pertama, MPEG-4 mampu memberi kualitas yang sama baiknya seperti
MPEG-2 dengan bitrate yang jauh lebih kecil dari MPEG-2. Efisiensi tinggi ini
didapat berkat teknologi Scalable Video Coding. Dengan bitrate yang kecil berarti
file size-nya juga menjadi kecil, hingga sebuah file video yang dibuat memakai
MPEG-4 hanya memiliki file size seperempat dari video yang dibuat memakai
MPEG-2. sehingga sekeping DVD dapat menampung beberapa film yang
dikompres memakai format MPEG-4 dengan kualitas yang tetap baik.
Kedua, MPEG-4 menghasilkan gambar yang lebih baik daripada MPEG-2
pada pemakaian bit rate yang rendah. Pada kompresi MPEG-2, kualitas gambar
hanya dapat dipertahankan apabila kita memakai pilihan bit rate tinggi, dan begitu
nilai bit rate diturunkan maka kualitasnya akan langsung turun. Namun MPEG-4
mampu memberi kualitas gambar lebih baik pada bit rate rendah sehingga cocok
untuk ruang simpan yang terbatas seperti pada peranti genggam.
Tabel 1.1 Bit Rate for MPEG-4

MPEG-4 secara umum dapat memberikan kualitas gambar yang lebih baik
dan mampu mengurangi artefak atau noise akibat proses kompresi. Teknik-teknik

baru diperkenalkan disini untuk memperbaiki kualitas gambar, seperti Multipicture inter-picture prediction, Lossless macroblock coding, Increased precision
in motion estimation dan deblocking filter baru.
Selain itu, MPEG-4 dapat diimplementasikan pada bermacam perangkat
dengan berbagai format dari streaming melalui jaringan 3G beresolusi QCIF
dengan 15 fps hingga full High Definition video beresolusi 1920 x 1080 dengan
60 fps. Oleh karena itu format ini akan dapat dinikmati oleh pemakai telepon
genggam, internet, Set-top-boxes, hingga HD-DVD.
Tabel 1.2 Macam-macam Perangkat yang dapat diimplementasikan MPEG-4

1.4 Standarisasi Kompresi Video Moving Pictures for Digital Storage Media
(MPEG-4)
MPEG-4 merupakan standar untuk kompresi video, transport, dan object
oriented framework yang didesain untuk mendukung aplikasi video digital
konvensional maupun interaktif yang mempunyai bit rate berkisar dari 5 Kbps
hingga 4 Mbps. MPEG-4 menyediakan fungsi-fungsi baru untuk content

authoring dan peningkatan fleksibilitas. MPEG-4 menggabungkan gambar alami


dengan gambar sintetis, mendukung interaksi tingkat tinggi dengan user, dan
mengakomodasi semua tipe dan teknologi jaringan. MPEG-4 menggabungkan dua
set algoritma inti, yaitu VLBV core (Very Low Bit rate Video) yang didesain
untuk bit rate 4,8 hingga 64 Kbps hingga 4 Mbps. Standar MPEG-4
memungkinkan jangkauan aplikasi yang sangat luas seperti interactive mobile
multimedia communications, close circuit Tv (cctv), videophone, mobile
audiovisual communications, multimedia electronic mail, remote sensing,
electronic newspaper, interactive multimedia databases, multimedia videotext,
games, interactive computer imagery, sign language captioning. Setiap objek
dalam layer disegmentasi ke dalam sejumlah bentuk citra yang dinamakan VOP
(Video Object Plane). VOP berurutan yang dimiliki oleh objek fisik yang sama
dinamakan Video Object (VO). Pengkodean VOP untuk masing-masing VO
diperlakukan sama dengan teknik pengkodean MPEG-2.

1.5 Metode Pengkodean Bentuk MPEG4


Salah satu hal yang membedakan MPEG4 dengan standar pengkodean
video yang lain adalah pengkodean video object (VO) berbentuk sembarang.
Frame yang berisi VO disebut Video Object Plane (VOP). Karena mengikuti
pendekatan berbasis objek, aliran bit MPEG4 memuat informasi tekstur, gerakan,
dan bentuk sebuah VO. Beberapa VO dan informasi komposisi dimultiplex,
sehingga decoder menerima semua informasi untuk mendekodekan VO tersebut
dan menyusunnya menjadi gambar video, sebagaimana diilustrasikan pada
Gambar 1.2, Interaktivitas dan fleksibilitas untuk aplikasi video dan multimedia
ini tidak ditemukan dalam standar pemgkodean sebelum MPEG4.

Gambar 1.2 Dekomposisi frame menjadi objekobjek visual


Pada kasus bentuk biner, informasi bentuk dibagi menjadi 1616 binary
alpha blocks (BAB). Blokblok ini berisi kombinasi nilai antara bentuk
transparan dan buram (opaque). Blok yang transparan atau opaque ditandai
dengan level MB. Untuk blok yang memiliki lokasi transparan maupun opaque,
MPEG4 mendefinisikan lima mode pengkodean tambahan yang merupakan
kombinasi antara kompensasi gerakan dan pengkodean aritmatika berbasis
konteks (contextbased arithmetic encoding CAE). Modemode ini ditandai
oleh penggunaan VLC (Variable Length Code) yang bergantung pada mode
pengkodean MBMB yang mengelilingi blok tersebut, yaitu:
1. Tanpa vektor gerakan, tanpa update bentuk
2. Tanpa vektor gerakan, update bentuk (interCAE)
3. Vector gerakan, tanpa update bentuk
4. Vektor gerakan, update bentuk (interCAE)
5. Intra-shape (intraCAE)

1.5.1

Mode INTRA
Pengkodean bentuk pertama didasarkan pada CAE intraVOP. Pada

pendekatan ini, MB diproses sesuai susunan scanline. Template 10 pixel


digunakan unruk mendefinisikan konteks nilai bentuk. Template ini ditunjukan
pada Gambar 1.3. dan diperluas sejauh dua pixel ke sebelah kiri, kanan, dan atas
dari pixel yang akan didekodekan. Jadi, konteks bergantung pada MB sekarang
dan informasi bentuk yang didekodekan sebelumnya. Nilainilai bentuk di
sebelah kanan MB sekarang belum diketahui. Untuk pixel yang belum terdefinisi,
nilainya diset sama dengan nilai terdekat dalam MB. Setelah perhitungan konteks,
peluang bahwa lokasi tersebut transparan (atau opaque) ditentukan dengan operasi
lookup table. Tabel ini didefinisikan dalam spesifikasi MPEG4 dan berisi nilai

peluang untuk 1024 konteks yang mungkin. Setelah itu, blok dikodekan dengan
menggunakan nilai peluang dan kode aritmatika.

Gambar 1.3 Template yang menunjukan konteks untuk pixel

1.5.2

Mode INTER
Jika metode pengkodean bentuk intraVOP selalu dilakukan langsung,

maka empat mode pengkodean bentuk tambahan lainnya (mode iiv) terdapat
pada VOP yang diprediksi (misalnya VOPP, B, dan sprite terbatas pada global
motion compensation S (GMC)). Kompensasi gerakan digunakan untuk estimasi
awal suatu BAB. Untuk menghitung estimasi ini, encoder memberi tanda apakah
nilai diferensial atau absolut yang diterapkan. Jika diferensial diterapkan, Moving
Vector MV direcover dengan cara menjumlahkan nilai selisih dengan nilai
estimasi yang diturunkan dari BAB tetangga ataupun informasi luminansi pada
lokasi yang sesuai (pemilihan MV yang sesuai dispesifikasikan dalam standar
MPEG4).
1.5.3

Pengkodean Lossy
Selain

pengubahan

mode

pengkodean,

mekanisme

tambahan

dispesifikasikan untuk mengontrol mutu dan laju bit informasi bentuk biner.
Metode pertama, MB dapat dikodekan dengan resolusi lebih rendah. Setelah
mengurangi resolusi dengan faktor dua atau empat, BAB 88 atau 44 yang
dihasilkan kemudian dikodekan dengan menggunakan mode kompresi yang
tersedia. Pada sisi penerima, BAB resolusi rendah tesebut didekodekan dan
7

diupsampling menggunakan filter adaptif. Filter memetakan nilai bentuk tunggal


menjadi blok nilai bentuk 22. Sebagaimana didefinisikan dalam standar MPEG
4, filter bergantung pada sembilan pixel yang mengelilingi nilai bentuk. Untuk
recover data bentuk dari BAB 44, prosedur interpolasi diterapkan dua kali.
1.5.4

Skalabilitas Spasial
Selain mengurangi resolusi BAB, terdapat dua pilihan lain yang dapat

mempengaruhi laju bit dan mutu informasi bentuk. Pertama, efisiensi CAE
bergantung pada orientasi dari informasi bentuk. Untuk meningkatkan efisiensi
ini, encoder dapat melakukan transpose BAB sebelum pengkodean. Ini harus
diberitahukan kepada decoder, yang kemudian akan mentranspose BAB setelah
langkahlangkah

decoding.

Sebagai

pilihan

kedua,

skalabilitas

spasial

diperkenalkan pada MPEG4 versi 2. Pada metode ini terdapat lapis dasar dan
lapis penguat. Lapis dasar didekodekan dengan menggunakan salah satu metode
yang telah dibahas di atas. Sedangkan lapis penguat akan memperhalus informasi
bentuk dari lapis dasar.
1.5.5

Error Resilience untuk Bentuk MPEG-4


Pengkodean bentuk bergantung pada kombinasi antara prediksi gerakan

dan spasial agar representasi data menjadi efisien. Dalam lingkungan yang
cenderung banyak error, hal ini mengakibatkan peningkatan kepekaan terhadap
derau kanal dan paket loss. Ketika mode error resilience diaktifkan, modifikasi
pada pengkodean bentuk dapat mengurangi kepekaan terhadap kesalahan
transmisi. Perubahan dilakukan pada komputasi CAE. Pada mode nonresilience,
konteks yang digunakan untuk pengkodean aritmatika bergantung pada data
bentuk MB sekarang dan tetangga. Untuk, memperkecil potensi kehilangan paket,
MPEG4 memodifikasi konteks CAE ketika encoder menghidupkan mode error
resilience.
Metode kedua untuk melindungi data dari bentuk adalah partisi data.
Pendekatan ini memisahkan informasi tekstur dari header MB, informasi bentuk
biner, dan MV. Penanda resinkronisasi (penanda gerakan) mempertegas
perbatasan antara kedua komponen tersebut. Ada dua keuntungan dari pendekatan

ini. Pertama, kesalahan data tekstur tidak mempengaruhi dekoding bentuk. Kedua
partisi data mendukung unequal error protection, yang dapat digunakan untuk
meningkatkan perlindungan terhadap informasi gerakan dan bentuk.
Metode terakhir dalam spesifikasi MPEG4 adalah penyisipan header
paket video. Header ini muncul secara periodik dalam aliran bit. Header berfungsi
sebagai penanda resingkronisasi dan menunjukan awal MB. Selain itu, header
berisi informasi untuk decoding MB, bahkan jika MB sebelumnya hilang. Header
paket video juga menyediakan informasi redundan yang diambil dari header VOP.
Dalam praktek, hal ini membantu decoding VOP yang header-nya rusak. Akan
tetapi, ini hanya mungkin jika tidak terdapat informasi bentuk dalam aliran bit.
Ketika pengkodean bentuk digunakan, decoder lebih rentan terhadap kesalahan
dalam header VOP, karena didalamnya terdapat informasi mengenai ukuran dan
lokasi spasial dari suatu bentuk.
1.6 MPEG-4 video coding
Proyek MPEG-4 dimulai sebagai standar untuk kompresi video pada bitrate
yang sangat rendah. Setelah bekerja pada proyek ini selama dua tahun, anggota
komite, menyadari bahwa pesatnya perkembangan aplikasi multimedia dan
layanan akan memerlukan standar kompresi yang lebih, direvisi pendekatan
mereka. Alih-alih standar kompresi, mereka memutuskan untuk mengembangkan
satu set alat ("Toolbox") untuk menangani objek AV.

Gambar 1.4 MPEG-4, an object base multimedia coding standard


1.6.1

Object-based Video Coding


Karena tujuan utama dari MPEG-4 visual untuk keperluan coding, MPEG-

4 hanya menyediakan konvensi standar untuk menggambarkan vos, sehingga


semua decoder compliant akan dapat mengekstrak vos bentuk apapun dari
bitstream disandikan, yang diperlukan. Decode vos kemudian dapat mengalami
manipulasi lebih lanjut sesuai untuk aplikasi di tangan.

Gambar 1.5 An MPEG-4 video encoder splits the video into VOs as required by
the application
Video MPEG-4 juga mendukung berbasis sprite coding dalam kasus video
alami, di mana besar hasil gambar komposit dari campuran piksel milik berbagai
instansi temporal objek video. VOP A dapat dianggap sebagai hanya bagian dari
sprite yang terlihat pada suatu saat waktu tertentu.

1.6.2

Coding of VOPs
Sebuah objek video yang alami terdiri dari urutan VOPs 2D. Yang efisien

coding dari VOPs eksploitasi baik redudansi temporal dan spasial. Jadi
representasi kode dari VOP yang meliputi bentuk, gerakan, serta teksturnya. VOS

10

dikompres dengan coding VOPs sesuai mereka menggunakan skema pengkodean


hibrida agak mirip dengan standar MPEG sebelumnya. Rincian teknik coding
VOP ditunjukkan pada gambar. Teknik ini diimplementasikan dalam hal
macroblocks. VOP encoder dasarnya terdiri dari dua skema encoding: satu untuk
bentuk, dan satu untuk tekstur.
1.6.3

VOP shape coding


Untuk pengkodean bentuk biner, kotak berlari persegi panjang ini

kemudian dibagi menjadi blok 16 x 16 sampel (selanjutnya disebut sebagai blok


bentuk) dan proses encoding dan decoding dilakukan blok demi blok. Selain itu,
grayscale informasi bentuk dikodekan menggunakan blok berbasis gerakkompensasi DCT mirip dengan yang digunakan untuk tekstur coding, sehingga
lossy coding saja.
1.6.4 VOP texture coding
Dalam kasus VOPs intra (I-VOPs), istilah "tekstur" mengacu pada
informasi yang ada dalam nilai-nilai abu-abu atau kroma piksel yang membentuk
VOP tersebut. Dalam kasus VOPs diprediksi (B-VOPs dan P-VOPs), kesalahan
sisa setelah kompensasi gerak dianggap sebagai informasi tekstur. Standar video
MPEG-4 juga menggunakan versi yang disesuaikan dari Transformasi (DCT)
metode kosinus diskrit berbasis blok untuk kode informasi tekstur dari sebuah
VOP berbentuk sewenang-wenang. The VOP tekstur dibagi menjadi macroblocks
ukuran 16 x 16. Tentu saja, ini berarti bahwa blok sepanjang batas VOP mungkin
tidak jatuh sepenuhnya pada VOP, yaitu, beberapa piksel dalam blok batas
mungkin bukan milik VOP tersebut. Blok batas tersebut diperlakukan berbeda
dari blok non-batas.
1.6.5

Motion-compensated coding
Estimasi gerak untuk tekstur dan abu-abu bentuk skala dilakukan dengan

menggunakan nilai pencahayaan. Algoritma ini terdiri dari tiga langkah berikut :
(1). Padding of the reference VOP
(2). Full-search polygon matching with single-pixel accuracy
(3). Polygon matching with half-pel accuracy

11

Standar MPEG-4 belum banyak digunakan dan digunakan, karena fakta


bahwa itu adalah tugas besar untuk membuat semua MPEG-4 bagian yang
kompatibel, mulai dari video, software referensi struktur sintetis (grafis-seperti),
audio, sistem, bitstreams tes, manajemen hak digital, dan sebagainya.

Macroblock basic coding unit pada algoritma MPEG.


16x16 pixel segment dalam sebuah frame. Macroblock
terdiri dari 4 luminance, 1 Cr, dan 1 Cb.

12

Anda mungkin juga menyukai