Anda di halaman 1dari 9

NAMA : ARLISA KRISNA

KELAS : JTD 3A
NO. ABSEN : 03

SOAL UTS VIDEO 2019


1) Berdasarkan dua format pemindaian raster berikut : pemindaian progressif
menggunakan 30 frame/detik, 400 lines/frame dan pemindaian interlaced menggunakan
60 fields/second, 200 lines/field. Untuk setiap format pemindaian, tentukan :
a. Line rate keseluruhan (lines/second)
 Progressive Scan
30*400=12000 lines/s.
 Interlaced Scan
60*200=12000 lines/s.
b. Frekuensi temporal maksimum yang mungkin (jumlah siklus per detik) dari
sinyal possible temporal frequency (number of cycles per second) of the signal
 Progressive Scan
Frekuensi sementara maksimum terjadi ketika ketika frame berturut-
turut bergantian antara hitam dan putih, dengan frekuensi sementara:
frame rate/2 =15 cycles/s
 Interlaced Scan
Frekuensi sementara maksimum terjadi ketika ketika frame berturut-
turut bergantian antara hitam dan putih, dengan frekuensi sementara:
field rate/2 =30 cycles/s
c. Frekuensi vertical maksimum yang mungkin (jumlah siklus per tinggi
gambar) dari sinyal
 Progressive Scan
Frekuensi vertikal maksimum adalah ketika garis berurutan bergantian
antara hitam dan putih dengan:
Frekuensi 400/2=200 cylces/picture-height
 Interlaced Scan
Frekuensi vertikal maksimum adalah ketika garis berurutan bergantian
antara hitam dan putih dengan:
Frekuensi 200/2=100 cylces/picture-height
d. Frekuensi maksimum yang dimungkinkan (jumlah siklus per detik) dalam
bentuk gelombang ID dari sinyal raster, dengan asumsi rasio aspek gambar 1:
 Progressive Scan
Frekuensi maksimum dari 1D tingkat gelombang:
sampling rate/2=400*200*30/2=1200000 cycles/s
 Interlaced Scan
Frekuensi maksimum dari 1D tingkat gelombang:
sampling rate/2=200*200*60/2=1200000 cycles/s
e. Berdasarkan hasil yang didapat, jelaskan pro dan kontra dari format
pemindaianRaster scan dapat mendukung resolusi temporal yang lebih tinggi
namun lebih rendah resolusi vertikal. Dan Faktor Kell tidak perlu digunakan
karena yang diminta hanyalah frekuensi maksimum sinyal, bukan frekuensi
maksimum yang dapat didukung oleh sistem.

2) NTSC color TV system


a. Gambar 2(a) menunjukkan diagram blok yang disederhanakan dari
pemancar TV berwarna NTSC. Jelaskan fungsi masing-masing komponen secara
singkat. Gambarlah kotak putus-putus pada gambar ini untuk memasukkan semua
komponen yang terdiri dari modulator QAM yang menggandakan sinyal I dan Q
bersama-sama.
Audio FM modulator
4.5MHz

R(t) Y(t)
LPF1
0-4.2MHz

I(t)
LPF2
G(t) 0-1.5MHz
RGB to Y

+ BPF  VSB
-/2 2-4.2MHz
Q
I

B(t) Q(t) To transmit antenna


LPF3
0-0.5MHz

Acos(2fct)

Konverter RGB ke YIQ mengubah sinyal asli dari RGB ke koordinat


YIQ. Tiga low pass filter (LPF1, LPF2, LPF3) mengikat setiap sinyal sesuai
dengan bandwidth yang diharapkan dan pita frekuensi yang dialokasikan.
Kotak putus-putus mengimplementasikan fungsi QAM, yang
melipatgandakan komponen I dan Q menjadi sinyal tunggal pada frekuensi
sub-carrier warna fc.
BPF adalah filter bandpass, yang membatasi sinyal I dan Q multipleks ke
kisaran 2-4,2MHz. Ini diperlukan karena pada fc=3,58MHz, sinyal multipleks
akan memiliki bandwidth 3,58-1,5=2,08 hingga 3,58+1,5=5,08MHz karena
bandwidth sinyal I adalah 1,5MHz.
Tanpa BPF, sinyal multipleks akan mengganggu sinyal audio. BPF ini
pada dasarnya membiarkan sinyal Q apa adanya, tetapi memotong beberapa
sideband atas dari sinyal I. Modulator FM menggeser sinyal audio ke
frekuensi subcarrier audio 4,5MHz. Kemudian audio yang dimodulasi, sinyal
Y dan sinyal I dan Q multipleks ditambahkan bersama-sama. Akhirnya ada
melalui modulator VSB, yang memodulasi sinyal gabungan ke frekuensi
pembawa gambar yang ditunjuk dan menghilangkan sebagian besar band sisi
bawah.
b. Gambar 2 (b) menunjukkan diagram blok yang disederhanakan dari penerima TV
berwarna NTSC. Secara singkat, jelaskan fungsi masing-masing komponen. Gambarlah
kotak putus-putus pada gambar untuk memasukkan semua komponen yang terdiri dari
demodulator QAM yang memisahkan sinyal I dan Q.
Audio
FM demodulator To
Composite video speaker
LPF1 Y(t) R(t)
0-4.2MHz
BPF, 4.4-4.6 MHz

BPF, 0- 4.2 MHz

+ I(t)

monitor
_  LPF2 G(t)
0-1.5MHz

Q to RGB

To
-/2 Y
I B(t)
LPF3
0-0.5MHz
Q(t)
VSB Demodulator

2Acos(2fct)

From antenna
Demodulator VSB membawa sinyal yang diterima dari frekuensi pembawa
gambar ke baseband. BPF di sebelah kiri mengekstrak sinyal audio, BPF di sebelah
kanan mengekstrak sinyal video komposit. Sinyal audio yang diekstraksi masih pada
frekuensi sub-carrier audio. Demodulator FM membawa sinyal audio kembali ke
baseband, yang kemudian dikirim ke speaker. LPF1 mengekstrak sinyal luminance (Y)
dari sinyal video komposit. Perbedaan antara video komposit dan sinyal Y yang
diekstraksi adalah sinyal I dan Q multiplexing. Kotak putus-putus
mengimplementasikan demodulator QAM dan memisahkan sinyal I dan Q dan
membawa masing-masing kembali ke baseband-nya. Konverter YIQ ke RGB mengubah
komponen YIQ menjadi komponen RGB, yang kemudian dikirim ke monitor.
3) Gambar 3 (a) di bawah ini menunjukkan dua frame video yang saling terkait
a. Hasilkan data lapangan yang terkait dengan setiap frame. Tuliskan
hasil anda dalam grafik yang disediakan pada gambar 3 (b).

b. Deinterlace bidang 1 dari frame 2 menggunakan bidang rata-rata.


Tuliskan bidang deinterlaced tersebut. Untuk menghemat waktu, anda hanya perlu
mengisi baris kedua di bidang 1 dari frame

c. Sekarang coba garis rata-rata. Tuliskan bidang deinterlaced.


d. Secara umum, metode mana yang lebih baik untuk jenis konten bagian apa?
Secara umum, garis rata-rata lebih baik untuk adegan bergerak cepat dengan
pola vertikal, dan rata-rata bidang lebih baik untuk adegan bergerak lambat.
e. Untuk video dari fs frame/detik, WxH piksel/frame, apa jumlah operasi yang dibutuhkan
per detik untuk mencapai half-pel EBMA jika kita menggunakan ukuran blok BxB,
berbagai pencarian –R ke R dalam arah horizontal dan vertical?
(hitung satu pengurangan dan ambil nilai absolut, dan jumlah dua angka sebagai satu
operasi. Abaikan perhitungan yang diperlukan untuk menginterpolasi kerangka target pada
awalnya. Jelaskan alasannya secara singkat. Ekspresikan hasil anda dalam hal parameter
fs , W, H, B, R). parameter apa ( diantara fs , W, H, B, R) yang memengaruhi akurasi
gambar yang diprediksi dan mengapa
Perbandingan dengan setiap blok kandidat membutuhkan operasi N1
= B^2. Dengan rentang pencarian –R hingga R dalam akurasi setengah pel, ada N2
= ((2R + 1) * 2) ^ 2 kandidat untuk setiap blok gambar dalam sebuah bingkai,
dengan total operasi untuk setiap blok gambar adalah N3 = (( 2R + 1) * 2) ^ 2 B ^
2. Bingkai ukuran WxH memiliki N4 = W / B * H / B blok. Oleh karena itu jumlah
total operasi untuk satu frame adalah N5 = N4 * N3 = W * H * ((2R + 1) * 2) ^
2. Dengan frame rate fs, jumlah operasi per detik adalah N5 * fs = fs * W * H * ((2R
+ 1) * 2) ^ 2. Ukuran blok dan rentang pencarian memengaruhi akurasi
prediksi. Biasanya, ukuran blok yang lebih kecil (B) dan rentang pencarian yang
lebih besar (R) mengarah ke prediksi yang lebih akurat. Tetapi R yang lebih besar
juga mengarah pada lebih banyak perhitungan. Frame fs juga mempengaruhi
akurasi. Ketika fs tinggi, gerakan antara frame yang berdekatan kecil, dan prediksi
lebih akurat. 

4) Pengkodean video dan estimasi gerakan:


a. Apa manfaat utama menggunakan prediksi temporal kompensasi gerak dalam video
coding, dibandingkan dengan kode video frame secara langsung? Apa saja masalah karena
prediksi temporal kompensasi gerak?
Dengan prediksi temporal terkompensasi gerak, hanya mengkode kesalahan
prediksi dan vektor gerakan. Kesalahan prediksi umumnya memiliki varian yang
secara signifikan lebih kecil daripada sinyal asli, dan dapat dikodekan dengan bit
lebih sedikit daripada sinyal asli. Salah satu masalah utama dengan menggunakan
prediksi temporal adalah jika beberapa bit yang dikodekan dalam satu frame rusak
selama transmisi, frame yang didekodekan untuk frame ini akan salah. Bahkan jika
sinyal kesalahan prediksi untuk frame berikut diterima dengan benar, frame yang
didekodekan akan salah karena ini didekodekan berdasarkan pada frame referensi
yang salah. Ini dikenal sebagai propagasi kesalahan transmisi. Beberapa masalah lain
termasuk biaya komputasi tinggi untuk estimasi gerakan dan kesulitan dalam akses
acak.
b. Usulkan beberapa cara untuk mengurangi perhitungan estimasi gerak menggunakan
EBMA (mungkin dengan mengorbankan akurasi prediksi).
Untuk rentang pencarian dan ukuran langkah yang diberikan, salah satu
cara untuk mengurangi kompleksitas adalah dengan pencarian pertama dengan
ukuran langkah besar dalam rentang pencarian yang ditentukan untuk menemukan
vektor gerak kandidat awal. Kemudian cari di lingkungan kecil kandidat awal ini
dengan langkah yang ditentukan.
c. EBMA mengamsumsikan piksel dalam suatu blok mengalami perubahan yang sama dari
satu frame ke yang lain. Berikan contoh ketika asumsi ini tidak akurat.
Ketika sebuah blok berisi bagian-bagian dari dua objek yang berbeda
dengan gerakan yang berbeda, asumsi ini tidak akurat.
d. Apa perbedaan antara prediksi temporal searah dan prediksi temporal dua arah? Apa
manfaat dari prediksi temporal dua arah? Berikan contoh ketika prediksi dua arah dari
sebelumnya dan prediksi frame yang jelas akan mengungguli prediksi satu arah frame
sebelumnya. Apa kerugian yang terkait dengan prediksi dua arah?
Prediksi searah prediksi frame saat ini dari frame masa lalu. Prediksi dua
arah memprediksi kerangka saat ini baik dari kerangka masa lalu dan kerangka
masa depan (yang sebelumnya diberi kode), dan menggunakan rata-rata
tertimbang dari kedua prediksi tersebut. Prediksi dua arah secara umum lebih
akurat, karena berisi prediksi uni-directional sebagai kasus khusus. Salah satu
contoh di mana prediksi dua arah akan mengungguli prediksi satu arah adalah
ketika ada perubahan adegan, sehingga frame saat ini benar-benar berbeda dari
frame sebelumnya, tetapi frame masa depan mirip dengan frame saat
ini. Kerugian dari prediksi dua arah meliputi keterlambatan pengodean dan
kerumitan

5) Standart pengkodean video


a. Jelaskan dua fitur yang tergabung dalam standar pengkodean video H.263 yang
membantu meningkatkan efisiensi pengkodean atas standar pengkodean video H.261
sebelumnya.
 Menggunakan estimasi gerakan akurasi half-pel, bukan integer-pel.
 Ukuran blok variabel untuk kompensasi gerak. (memungkinkan blok 16x16
untuk dibagi menjadi 4 blok 8x8, dan memperkirakan vektor gerak untuk setiap
blok 8x8 secara terpisah. Ini bermanfaat ketika blok 16x16 mencakup dua objek
yang bergerak secara berbeda).
b. Mengapa MPEG-1 dan MPEG-2 menggunakan struktur GOP dengan I-frame periodik?
Untuk konferensi video atau aplikasi telepon video, dapatkan encoder memasukkan I-
frame secara berkala? Apa masalahnya?
Struktur GOP memungkinkan akses acak, yang penting untuk penyiaran
video, streaming vid.
c. Apa itu pengkodean scalable? Mengapa bermanfaat untuk aplikasi streaming video?
Pengkodean berskala menghasilkan , untuk setiap kelompok bingkai
video, aliran bit yang dapat dipotong baik pada titik mana pun atau pada beberapa
titik tertentu. Ketika pengguna menerima bit stream terpotong, ia akan melihat
kualitas video yang lebih rendah (baik dalam resolusi spasial, laju bingkai temporal,
atau akurasi warna, atau kombinasi dari semuanya) . Dalam aplikasi streaming
video, video yang sama sering diminta oleh pengguna dengan bandwidth akses yang
berbeda atau kemampuan decoding / tampilan. Tanpa pengkodean berskala,
beberapa versi video ini harus dikodekan pada laju bit yang berbeda, dengan
resolusi spasial / temporal yang berbeda. Dengan pengkodean yang skalabel, hanya
satu bit stream yang dapat diukur yang perlu dibuat. Berdasarkan pada bandwidth
yang tersedia dan kemampuan decoding / tampilan pengguna, hanya sebagian dari
aliran bit yang perlu dikirimkan. Dalam aplikasi broadcast / multicast, aliran bit
lengkap akan dikirim ke pohon multicast, tetapi node pohon yang berbeda dapat
memilih untuk mengirimkan hanya sebagian dari aliran bit tergantung pada
bandwidth yang tersedia di bawah simpul itu. 
d. Apa itu pengkodean berbasis objek? Apa tiga jenis informasi yang ditentukan untuk
setiap objek? Standar mana yang menggunakan pengkodean berbasis objek?
Pengkodean berbasis objek mengacu pada pengkodean objek bergerak
berbeda yang mungkin ada dalam video secara terpisah, sehingga decoder dapat
mengakses bit untuk objek yang berbeda secara terpisah. Coder dapat memilih
untuk mendekodekan objek tertentu tetapi tidak yang lain, atau menampilkan
objek yang diterjemahkan dengan sudut pandang berbeda. Tiga jenis informasi
yang ditentukan untuk setiap objek adalah: bentuk, gerakan, tekstur (variasi
warna). MPEG-4 menggunakan pengkodean berbasis objek.

Anda mungkin juga menyukai