PENGENALAN
David Martin/720574
IP BB & Metro Network Development - CSD
Divisi Network of Broadband
I.
Latar Belakang
Seiring dengan meningkatnya teknologi infrastruktur telekomunikasi dan tersedianya akses ke
jaringan broadband yang semakin terjangkau, penggunaan data multimedia khususnya video digital
semakin meningkat di seluruh dunia. Penerapan video digital sangat beragam, meliputi siaran TV
digital, video streaming, video DVD, hingga teleconferece dan pendidikan jarak jauh.
Untuk mengefisienkan proses transmisi maupun penyimpanan video digital, diperlukan suatu
mekanisme video encoding dan decoding. Saat ini dikenal beberapa standar kompresi video. Dalam
tulisan ini, akan dibahas suatu metode kompresi video digital terkini, yang dikenal sebagai HEVC
(High Efficiency Video Coding).
II.
Permasalahan
Data video digital merupakan data yang berukuran sangat besar jika dibandingkan dengan data teks
maupun audio. Sebagai contoh, sebuah video digital tanpa kompresi dengan resolusi 640x480,
kedalaman warna 24 bit dan frame rate 30 fps dengan durasi 1 jam (3600 detik) akan mempunyai
nilai-nilai berikut:
Dapat dibayangkan berapa besar media penyimpanan maupun media transmisi yang diperlukan
untuk video tanpa kompresi. Dengan demikian untuk aplikasi praktis, mutlak diperlukan mekanisme
kompresi video digital.
III.
Pembahasan
HEVC merupakan sebuah standar internasional untuk kompresi video yang dikembangkan oleh
working group ISO/IEC MPEG (Moving Picture Experts Group) and ITU-T VCEG (Video Coding Experts
Group), dipublikasikan bersama sebagai ISO/IEC 23008-2 dan Rekomendasi ITU-T H.265. Kompresi
video merupakan merupakan proses mengubah video digital ke dalam format yang memerlukan
kapasitas yang lebih kecil ketika disimpan maupun ditransmisikan, sehingga merupakan teknologi
esensial untuk aplikasi-aplikasi semacam televisi digital, DVD-video, video conference dan internet
video streaming. Standardisasi kompresi video memungkinkan produk dari pabrikan berbeda untuk
David Martin/720574
berinteroperasi. Sebuah encoder mengkonversi video ke dalam format terkompresi dan sebuah
decoder mengkonversi video yang terkompresi kembali ke dalam bentuk tanpa konversi.
HEVC ditujukan untuk memberikan peningkatan dalam hal kompresi video setingkat di atas standar
sebelumnya. Standar H.264/AVC sebagai pendahulu HEVC, diterbitkan pada 2003. Sejak saat itu
penggunaan video digital semakin tersedia di mana saja. Istilah High definition telah menjadi acuan
dari berbagai perangkat dan aplikasi.
HEVC dikembangkan untuk menjawab trend kebutuhan berikut:
Penggunaan video digital yang meluas, dengan resolusi yang meningkat yang pada akhirnya
menambah beban pada kapasitas network.
Meningkatkan resolusi video di atas kualitas HD, yang pada gilirannya akan semakin menambh
beban network dan penyimpanan.
Melanjutkan peningkatan pada kapasitas pemrosesan. Pada tahun 2013, perangkat ponsel atau
tablet biasanya telah mempunyai kemampuan pemrosesan di atas komputer desktop keluaran
tahun 2003.
Atas dasar pemikiran mengenai isu-isu di atas, sebuah standar kompresi video baru yang
menggunakan kapasitas komputasional yang lebih tinggi yang memungkinkan penanganan yang
lebih efisien dari video beresolusi tinggi merupakan tawaran solusi yang menarik. Dengan HEVC,
diharapkan untuk dapat mentransmisikan atau menyimpan video dengan lebih efisien dibandingkan
dengan teknologi terdahulu, seperti H.264. Ini berarti:
Pada ukuran dan kualitas gambar yang sama, urutan video HEVC akan memakan penyimpanan
atau kapasitas transmisi yang lebih kecil dibandingkan dengan urutan video H.264 yang setara.
Pada penyimpanan atau bandwidth transmisi yang sama, kualitas dan/atau resolusi dari urutan
video HEVC akan lebih tinggi dibandingkan urutan video H.264
David Martin/720574
Proses prediksi dan melakukan operasi pengurangan prediksi terhadap terhadap unit
Entropy encoding
David Martin/720574
Standar HEVC mendefinisikan syntax atau format dari video sequence yang terkompresi dan
metode decoding-nya. Desain aktual dari sebuah encoder tidak distandardisasi.
3.1.1
Partitioning
HEVC mendukung partisi urutan video yang sangat fleksibel. Setiap frame dari urutan
dibagi menjadi daerah berbentuk persegi atau bujur sangkar (disebut Unit/ Blok).
Masing-masing Unit diprediksi dari data yang sudah dikodekan sebelumnya. Setelah
prediksi, informasi residual ditransformasikan dan dilakukan entropy encoding.
Setiap frame video atau gambar yang dikodekan dipartisi dalam Tile dan/atau Slice, yang
kemudian dipartisi lebih lanjut kedalam Coding Tree Unit (CTU). CTU adalah unit dasar
dari coding, berukuran hingga 64 x 64 pixel, pada standar sebelumnya dikenal sebagai
Macroblok.
Sebuah Coding Tree Unit dapat dibagi-bagi menjadi area berbentuk bujursangkar yang
dikenal sebagai Coding Unit (CU) dengan menggunakan struktur quadtree. Setiap CU
diprediksi menggunakan Inter atau Intra prediction dan ditransformasikan menggunakan
satu atau lebih Transform Unit.
Gambar 3. Gambar, slice, Coding Tree Unit (CTU), Coding Units (CU)
David Martin/720574
Gambar 4 menunjukkan sebuah frame video yang dipartisi ke beberapa slice, dengan 1
buah slice yang di-highlight dengan warna biru. Slice tersebut mengandung 6 buah CTU
64x64.
Gambar 4. Slices dan Coding Tree Unit dalam sebuah frame video
Gambar 5 menunjukkan close-up dari CTU yang di-highlight di Gambar 4. CTU 64x64
dibagi menjadi empat area 32x32, dengan CU di kiri atas di-highlight. Pada kuadran
lainnya, area 32x32 dibagi lagi menjadi CU 16x16 atau 8x8.
3.1.2
Prediction
Frame-frame video dikodekan menggunakan Intra atau Inter prediction. Gambar 6
menunjukkan frame video atau gambar yang dikodekan. Gambar pertama (0) dikodekan
hanya menggunakan Intra prediction, menggunakan spatial prediction dari area lain di
gambar yang sama. Gambar-gambar di urutan selanjutnya diprediksi menggunakan satu,
dua atau lebih gambar referensi, menggunakan Inter dan/atau Intra prediction untuk
tiap Prediction Unit (PU). Sumber prediksi untuk tiap gambar ditunjukkan oleh panah.
Setiap Coding Unit (CU) dipartisi ke dalam satu atau lebih Prediction Unit (PU), di mana
setiap PU diprediksi menggunakan Intra atau Inter prediction.
Intra prediction: Setiap PU diprediksi dari data bertetangga di gambar yang sama,
menggunakan prediksi DC (nilai rata-rata untuk PU), prediksi planar (memuat
permukaan datar pada PU) atau prediksi direksional (mengekstrapolasi dari data yang
bertetangga)
Inter prediction: Setiap PU diprediksi dari data di satu atau dua gambar referensi
(sebelum atau sesudah gambar saat ini pada urutan tampilan), menggunakan motion
compensated prediction. Untuk komponen luma, motion vector dapat mencapai
quarter-sample resolution.
Gambar 7 menunjukkan 2 contoh PU. CTU pada tengah gambar diprediksi menggunakan
1 buah PU 64x64. Semua sampel dalam PU ini diprediksi menggunakan motion
David Martin/720574
compensated inter prediction dari 1 atau 2 frame referensi. Pada sebelah kanan
ditunjukkan sebuah PU 8x16, yang merupakan bagian dari struktur prediksi untuk CU
32x32.
3.1.3
David Martin/720574
sebelah kanan-bawah, tidak ada data residual yang tersisa setelah proses prediksi, transform
dan kuantisai, sehingga tidak ada koefisien transformasi yang dikodekan.
3.1.4
Entropy Coding
Aliran bit HEVC yang dikodekan terdiri atas koefisien transform terkuantisasi, informasi
prediksi seperti jenis prediksi dan motion vector, informasi partisi dan data header
lainnya. Semua elemen ini di-encode menggunakan metode Context Adaptive Binary
Arithmetic Coding (CABAC)
David Martin/720574
IV.
4.2 Saran
Dengan keunggulan kompresi maupun kualitas gambar, HEVC dapat menjadi solusi untuk
keterbatasan bandwidth maupun peningkatkan kualitas video UseeTV sebagai produk Tripleplay yang disediakan oleh PT. Telkom.
Referensi
1. Richardson, Iain E. 2013. HEVC: An introduction to High Efficiency Video Coding.
2.
http://www.dvrconnection.com/dcistore/PDFs/technical/Digital%20video%20technology.pdf
David Martin/720574