9781119114956.ch5 (1) .En - Id

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.
com
5
Dari Analog ke Digital
Pratinjau Pertanyaan
● Bagaimana sinyal analog diubah menjadi sinyal digital?

● Apa yang dimaksud dengan frekuensi sampling dan laju Nyquist?
● Apa perbedaan antara audio CD dan audio MP3?
● Bagaimana gambar diam diubah menjadi data diskrit? Bagaimana kode sumber video?
● Bagaimana standar MP3 dan MPEG terkait?
Tujuan pembelajaran
● Prinsip dan teknik untuk konversi sinyal analog ke digital

● Pengkodean sumber untuk memastikan jumlah bit minimal digunakan untuk mewakili
informasi sinyal
● Prinsip di balik pengkodean sumber suara
● Prinsip di balik pengkodean sumber audio
● Prinsip di balik pengkodean sumber gambar dan video
Teknologi dan Manajemen Telekomunikasi Broadband, Edisi pertama. Riaz Esmailzadeh. ©

2016 Riaz Esmailzadeh. Diterbitkan 2016 oleh John Wiley & Sons, Ltd.
Situs Web Pendamping: www.wiley.com/go/BTTM
Dari Analog ke Digital 99
Catatan Sejarah1
Asal-usul Teori Sampling dapat ditelusuri hingga penemuan telegrafi dan upaya untuk memaksimalkan
pemanfaatan jalur telegraf. Karena ada batasan seberapa cepat operator telegraf dapat memasukkan
pesan, muncul pertanyaan apakah mungkin menggunakan saluran yang sama oleh dua atau lebih
operator telegraf. Ini berlaku untuk multiplexing dua atau lebih panggilan telegraf pada sirkuit yang
sama dan dikenal sebagai time division multiplexing (TDM). Usulan untuk TDM telegrafi tercatat sejak
tahun 1848, hanya 4 tahun setelah sistem telegraf Morse secara resmi beroperasi. Sakelar putar
(komutator) menghubungkan saluran telegraf ke beberapa operator secara bergantian, dan sakelar
putar yang cocok pada penerima mendistribusikan aliran ganda yang masuk ke operator yang
mendengarkan. Komutator 'mengambil sampel' input dari operator: dan kecepatan pengambilan sampel
harus diatur ke tingkat tertentu untuk memastikan data telegraf yang dikirimkan oleh setiap operator
ditangkap sepenuhnya. Pengaturan kecepatan komutator didasarkan pada praktik, dengan sedikit teori
yang dirumuskan.
Pentingnya teknologi TDM tumbuh dengan penemuan telepon dan kebutuhan akan saluran berkapasitas
tinggi yang menghubungkan pertukaran telepon. Pada tahun 1903, William Miner mematenkan komutator
berputar seperti yang ditunjukkan pada Gambar 5.1. Tantangannya lagi adalah untuk mengatur kecepatan
komutator 'sampling' agar suara yang direproduksi memiliki kualitas yang dapat diterima, karena komutator
yang berputar lambat menghasilkan reproduksi suara yang terdistorsi. Penambang menunjukkan melalui coba-
coba bahwa 'hasil terbaik [diperoleh] dengan kecepatan 4300 per detik'. Miner menyimpulkan bahwa
pengambilan sampel perlu dilakukan pada dua kali komponen frekuensi atas suara – frekuensi suaranya
disaring sedikit di atas 2 kHz. Ini adalah pertama kalinya laporan dibuat tentang laju pengambilan sampel yang
optimal untuk sinyal suara.
Tantangan untuk merumuskan solusi teoretis adalah menentukan laju pengambilan sampel yang
diperlukan. Pada tingkat seperti itu penerima akan dapat menginterpolasi sampel yang diterima dan
merekonstruksi sinyal asli. Itu intuitif bahwa laju pengambilan sampel harus sebanding dengan frekuensi
sinyal tertinggi. Selain itu, telah ditunjukkan oleh praktisi bahwa laju pengambilan sampel harus
setidaknya dua kali frekuensi tertinggi. Dasar teoretis untuk laju pengambilan sampel ini ditemukan
melalui karya independen beberapa ilmuwan pada tahun 1920-an, termasuk H. Nyquist
8 4kan
7 5kan
2
6 3 3kan
6kan
5
4 7kan
8kan
Gambar 5.1 Komutator pengambilan sampel suara penambang seperti yang digambar dalam aplikasi patennya. Sumber: Ref. [2]
1 Catatan Sejarah ini didasarkan pada makalah Lukas [1].

100 Teknologi dan Manajemen Telekomunikasi Broadband
bekerja untuk Bell Laboratories di AS, R. Hartley juga bekerja di Bell Laboratories, dan V. Kotelnikov
bekerja di Moscow Power Engineering Institute, Rusia. Para peneliti ini membuktikan apa yang
telah diketahui oleh para praktisi, bahwa laju pengambilan sampel dua kali frekuensi tertinggi
sudah cukup untuk reproduksi sinyal yang tepat.
Dengan formulasi dan publikasi teorema sampling, telah dicatat oleh
matematikawan bahwa J. Lagrange telah merumuskan prinsip mendekati sinyal kontinu
dengan sampel diskrit sedini 1765.
HD Luke, dalam makalahnya tentang perkembangan historis Teorema Sampling [1],
menceritakan kontribusi yang dibuat oleh individu dan bidang pengetahuan/seni yang berbeda.
Dia menyimpulkan:
“Banyaknya nama berbeda yang dikaitkan dengan teorema pengambilan sampel dalam literatur – Shannon,
Nyquist, Kotelnikov, Whittaker, hingga Someya – memunculkan … diskusi tentang asal-usulnya. Namun, sejarah
ini juga mengungkapkan proses yang sering terlihat dalam masalah teoretis dalam teknologi atau fisika: pertama
para praktisi mengajukan aturan praktis, kemudian para ahli teori mengembangkan solusi umum, dan akhirnya
seseorang menemukan bahwa para matematikawan telah lama memecahkan masalah matematika yang
dikandungnya, tetapi dalam 'isolasi yang luar biasa'” [1].
★★★★★
Gambar 5.2 menunjukkan diagram blok telekomunikasi. Sumber menghasilkan informasi yang dibawa ke
penerima. Dalam komunikasi digital biner, informasi sumber perlu diubah menjadi serangkaian 1 dan 0
yang kemudian dimodulasi secara digital dan dikirim melalui media. Proses konversi ini dikenal sebagai
pengkodean sumber, dan mungkin berlaku untuk informasi analog seperti suara, audio dan video, atau
mungkin berlaku untuk aliran data terpisah seperti teks atau angka. Proses pengkodean sumber, yang
merupakan fokus dari bab ini, mencakup sinyal analog ke sinyal digital yang setara. Dalam banyak kasus
itu juga menghilangkan redundansi dan menghasilkan aliran data dengan ukuran yang mendekati
entropi sumber seperti yang dapat dirasakan oleh penerima manusia.
Sejumlah teknik pengkodean sumber ada, diklasifikasikan berdasarkan efisiensinya vis-à-vis

entropi sumber informasi. Karena peralatan telekomunikasi perlu saling beroperasi, pilihan teknik
pengkodean sumber biasanya ditentukan oleh standar internasional. Keputusan standar
umumnya didasarkan pada kinerja teknis dari teknik pengkodean sumber serta masalah bisnis
seperti kompleksitas peralatan dan kompatibilitas ke belakang. Hak kekayaan intelektual,
pembatasan paten dan semacamnya juga merupakan pertimbangan penting. Mungkin juga ada
pertimbangan kebijakan: pengembangan internasional
Data Pesan Pesan

sumber pembuat kode pemancar
Penularan
infrastruktur/
saluran
Data Pesan Pesan
tenggelam
dekoder penerima
Gambar 5.2 Diagram blok telekomunikasi

standar membutuhkan kolaborasi dari badan standardisasi nasional. Umumnya pasar untuk sebagian besar, jika
tidak semua, produk telekomunikasi bersifat global, dan oleh karena itu banyak lembaga nasional perlu
mengambil bagian dan menyetujui standar tersebut.
Bab ini membahas bagaimana terus menerus analog informasi dapat direpresentasikan dalam diskrit
digital bentuk, dan bagaimana representasi tersebut dapat dilakukan dengan jumlah bit yang minimal.
Kami menunjukkan bahwa mekanisme untuk mewakili sinyal tersebut mengikuti prinsip yang
dikembangkan oleh Shannon seperti yang dijelaskan dalam Bab 4. Teknik pengkodean sumber populer
untuk sinyal data, suara, audio, gambar dan video dijelaskan. Kami mendemonstrasikan bagaimana
teknik ini digunakan dalam penyimpanan informasi populer dan aplikasi komunikasi seperti program zip,
voice over internet protocol (VoIP), ponsel, pemutar MP3, fotografi digital, dan perekaman video.
Sinyal Analog
Amplitudo fenomena alam dan bentuk gelombang berubah sebagai fungsi waktu.
Suhu, kelembapan, kecepatan angin, kelembapan tanah, dan elektrokardiogram,
semuanya naik dan turun seiring waktu. Beberapa mungkin berubah lebih lambat dan
beberapa mungkin berubah lebih cepat daripada yang lain, tetapi semua berubah
sebagai fungsi waktu dan secara terus menerus. Gambar 5.3 adalah sebuah contoh: ini
menunjukkan tingkat suhu di Adelaide pada hari-hari musim panas yang khas. Suhu
minimum dan maksimum historis, atau suhu puncak dan palung, di musim panas khas
Adelaide adalah antara suhu terendah 5 °C dan hingga 48 °C. Pada hari tersebut, suhu
berubah antara minimum 27,2 °C dan maksimum 35,2 °C. Dapat dilihat bahwa aktivitas
seismik berubah lebih cepat dibandingkan dengan suhu, karena puncak dan palung
lebih sering terjadi selama periode pengukuran.
Setiap sinyal dapat direkam dan direpresentasikan dalam analog sebagai bentuk gelombang kontinu.
Sinyal juga dapat ditransmisikan ke lokasi yang jauh menggunakan teknologi telekomunikasi analog.
Sinyal sama-sama dapat direpresentasikan, dan dikomunikasikan, sebagai aliran angka diskrit yang
mewakili amplitudo sinyal pada interval pengukuran tertentu. Rangkaian angka ini kemudian dapat
ditransmisikan ke lokasi yang jauh dalam bentuk diskrit menggunakandigital
45
40
35
30
25
20
Suhu (°C)
15
10
5
0
0:00 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 18:00 20:00 22:00 24:00
Waktu
Gambar 5.3 Grafik suhu untuk Adelaide

Tabel 5.1 Tabel suhu – diambil sampelnya setiap jam
Waktu 0:00 1:00 2:00 3:00 4:00 5:00 6:00 7:00 8:00 9:00 10:00 11:00 12:00 13:00 14:00 15:00 16:00 17:00 18:00 19:00 20:00 21:00 22:00 23:00 24:00
Suhu (°C) 19,9 18,9 18,4 17,3 16,9 16,8 16,1 16,5 20,2 23,9 30,3 32,1 33,9 35,1 34,9 35,5 35,8 38 36,2 35,3 32,9 31,3 29,9 28,8 28,9
Tabel 5.2 Tabel suhu – diambil sampelnya setiap 2 jam
Waktu 0:00 2:00 4:00 6:00 8:00 10:00 12:00 14:00 16:00 18:00 20:00 22:00 24:00
Suhu (°C) 19,9 18,4 16,9 16,1 20.2 30.3 33.9 34.9 35.8 36.2 32.9 29.9 28.9
teknologi telekomunikasi. Misalnya, grafik suhu pada Gambar 5.3 dapat ditampilkan sebagai serangkaian
angka yang sesuai dengan pengukuran reguler setiap setengah jam. Hal ini ditunjukkan pada Tabel 5.1.
Proses pengukuran pada selang waktu tertentu dikenal sebagaicontoh, dan frekuensi pengambilan
sampel, dalam hal ini sekali setiap jam, dikenal sebagai tingkat pengambilan sampel atau frekuensi
pengambilan sampel.
Grafik suhu yang sama dapat direpresentasikan sebagai satu set angka diskrit yang sesuai dengan
pengukuran setiap 2 jam, dan ditunjukkan pada Tabel 5.2.
Dapat dikatakan bahwa kedua representasi tersebut cukup setara dalam informasi yang mereka sampaikan.
Namun, jika kedua representasi seperti yang ditunjukkan pada Tabel 5.1 dan Tabel 5.2 adalah setara, maka jelas
Tabel 5.2 lebih efisien karena membutuhkan lebih sedikit titik data untuk menyampaikan informasi suhu yang
sama. Oleh karena itu penting untuk menentukan frekuensi sampling yang diperlukan untuk mewakili sinyal
analog tertentu untuk memastikan bahwa:semua informasi disimpan secara efisien. Contoh lain yang
ditunjukkan pada Gambar 5.4 adalah klip suara. Amplitudo suara manusia adalah analog, bentuk gelombang
kontinu. Bentuk gelombang seperti itu juga dapat diambil sampelnya secara berkala dan direpresentasikan
sebagai serangkaian bilangan diskrit.
Representasi dari sinyal analog menggunakan set angka diskrit dikenal sebagai
representasi digital; dan proses sebagai konversi analog ke digital (singkatnya A ke D).
Proses sebaliknya dikenal sebagai konversi digital ke analog (D ke A).
Seperti disebutkan di atas, frekuensi pengambilan sampel harus cukup cepat untuk secara
akurat mewakili sinyal analog. Seperti yang ditunjukkan di atas dalam contoh suhu (Tabel 5.1
dan Tabel 5.2) pengambilan sampel juga harus efisien dan menggunakan jumlah bit
minimum dalam representasinya. Gambar 5.5(a) menunjukkan bagian dari sinyal analog
dengan panjang 1 detik. Sinyal memiliki tiga puncak dan dua lembah, dan oleh karena itu
dapat diperkirakan memiliki frekuensi ~3 Hz, meskipun dapat dicatat bahwa laju puncak dan
lembah meningkat dari waktu ke waktu. Sinyal disampel secara berkala pada laju sampling
40 Hz pada Gambar 5.5(b), dan representasi diskrit yang dihasilkan ditunjukkan pada
Gambar 5.5(c). Representasi tampaknya merupakan replika dekat dari bentuk gelombang
analog. Representasi lain ditunjukkan pada Gambar 5.
1 detik
Gambar 5.4 Klip suara satu detik sebagai bentuk gelombang suara domain waktu
(B) (C)
1 1
Amplitudo
Amplitudo
Waktu 1 detik Waktu 1 detik
–1 –1
(A) (D)
1 1
Amplitudo
Amplitudo
–1 –1
Gambar 5.5 Sinyal analog dan representasi diskritnya dengan laju sampling 40 dan 20 Hz
Jelas bahwa Gambar 5.5(d) lebih efisien karena membutuhkan setengah dari jumlah
sampel untuk mewakili sinyal analog. Namun, itu tidak mewakili sinyal analog sedekat
Gambar 5.5(c). Apakah karena itu representasi yang sama akuratnya? Ini mengarah pada
pertanyaan apakah ada frekuensi sampling minimum di mana semua informasi dari sinyal
analog dapat dipertahankan dalam representasi digitalnya.
Teorema Nyquist2
Tingkat pengambilan sampel yang diperlukan diberikan oleh teorema Nyquist. Seperti dijelaskan dalam
Catatan Sejarah, Harry Nyquist, seorang ilmuwan di Bell Laboratories, meneliti topik transmisi sinyal
telegraf melalui saluran telepon. Tujuannya adalah untuk menentukan tingkat tercepat yang
memungkinkan telegram dapat dikirim melalui saluran telepon terbatas pita. Untuk menentukan ini dia
2 Teorema ini juga dikenal sebagai teorema Nyquist-Shannon. Beberapa ilmuwan lain dianggap telah sampai pada hasil
yang sama secara independen.
(A) (B)
1 1
Amplitudo
Amplitudo
–1 –1
Gambar 5.6 Bentuk gelombang analog ke digital menggunakan laju sampling 10 Hz
diperlukan untuk menemukan bagaimana sinyal analog dan sinyal diskrit terkait satu sama lain dalam hal pita
transmisi yang diperlukan [3].
Nyquist menunjukkan bahwa untuk representasi digital dari sinyal band-limited, sampling harus
dilakukan pada tingkat lebih dari dua kali komponen frekuensi terbesar. Mengingat laju Nyquist, dan
pengukuran sinyal yang tepat pada titik pengambilan sampel, sinyal analog dapat direpresentasikan
dengan sempurna dalam bentuk digital.
Kondisi band-limited penting karena sinyal mungkin memiliki komponen frekuensi tinggi. Sebagai contoh, suara
manusia memiliki komponen frekuensi yang sebagian besar berada pada kisaran 300–3400 Hz, seperti terlihat pada
Gambar 5.4. Namun, beberapa komponen frekuensi yang lebih tinggi memang ada, terutama untuk orang yang memiliki
suara lebih tinggi. Namun, karena saluran telekomunikasi terbatas pada pita, praktik normalnya adalah menyaring sinyal
analog ke dalam pita terbatas tersebut dengan menghapus semua komponen frekuensi yang lebih tinggi. Untuk suara,
ini berarti membatasi suara hingga 4000 Hz. Sementara pemfilteran yang lebih tinggi dapat menghasilkan reproduksi
fidelitas yang lebih tinggi, hal itu harus mengorbankan bit rate ekstra. Oleh karena itu teorema Nyquist mengamanatkan
bahwa sinyal suara harus diambil sampelnya pada kecepatan lebih besar dari 2 × 4000 = 8000 Hz. Jika kita
mengasumsikan bahwa komponen frekuensi tertinggi dari sinyal analog pada Gambar 5.5(a) adalah 5 Hz, maka laju
pengambilan sampel dapat serendah 10 Hz, yang akan menghasilkan representasi diskrit seperti yang ditunjukkan pada
Gambar 5.6. Perhatikan bahwa representasi ini sama akuratnya dengan Gambar 5.5(c) dan (d). Artinya, pengambilan
sampel pada tingkat yang lebih tinggi tidak menghasilkan keuntungan apa pun untuk proses konversi analog ke digital.
Seperti yang telah dibahas sebelumnya, telekomunikasi adalah ilmu dan teknologi untuk
menyampaikan informasi ke lokasi yang jauh. Dari sudut pandang ini, bentuk gelombang analog kontinu
atau bilangan diskrit adalah ekuivalen. Yaitu, pengiriman bentuk gelombang analog pada Gambar 5.6(a)
dan rangkaian angka berikut {0.913410317, 0.662541770, 0.137126512, 0.543347179,
0.980775131, 0.398801013, 0.823661318, 0.286615541, 0.917042669, 0.995046175}
bekerja sama.
Keakuratan representasi diskrit namun dibatasi oleh berapa banyak digit yang digunakan.
Misalnya, mengirim {0.913410317, 0.662541770, 0.137126512, 0.543347179, 0.980775131,
0.398801013, 0.823661318, 0.286615541, 0.917042669, 0.995046175} lebih akurat daripada mengirimkan
informasi yang sama yang dibulatkan menjadi hanya tiga digit {0.913, 0.663, 0.137, 0.543,
0.981, 0.399, 0.824, 0.287, 0.917, 0.995} untuk mewakili sinyal analog dari Gambar 5.6(a).
(A) (B)
1 1 1111
1110
1101
1100
1011
1010
Amplitudo
Amplitudo
1001
1000
0111
0110 Waktu
Waktu 1 detik
0101
0100
0011
0010
0001
0000
–1 –1
Gambar 5.7 Kuantisasi ke dalam tingkat biner
Kesalahan yang dimasukkan ke dalam representasi digital diskrit dikenal sebagai noise kuantisasi.
Tingkat akurasi yang diperlukan umumnya ditentukan oleh aplikasi yang menggunakan informasi
yang diterima, dan/atau oleh standar yang berlaku.
Dalam prakteknya, transmisi digital dilakukan dengan menggunakan bilangan biner (yaitu hanya
menggunakan 0 dan 1) daripada desimal. Level sinyal dikonversi ke bilangan biner menggunakan
sejumlah level kuantisasi. Hal ini ditunjukkan pada Gambar 5.7. Di sini, rentang maksimum-minimum dari
sinyal input (−1 hingga 1) dibagi menjadi 16 level, setiap level diwakili oleh bilangan biner dalam rentang
0000 hingga 1111. Setiap sampel diskrit kemudian diubah menjadi bilangan biner berdasarkan
amplitudo sinyal. Sinyal analog kemudian dapat ditransmisikan menggunakan bit biner sebagai {1111,
1101, 1001, 0011, 0000, 0100, 1110, 1010, 0000, 1111}. Penerima dapat mereproduksi sinyal analog
dengan pengetahuan tentang laju pengambilan sampel, tingkat kuantisasi, dan rentang minimum-
maksimum.
Keakuratan representasi digital jelas tergantung pada jumlah level kuantisasi. Contoh pada Gambar
5.7 menggunakan 16 level, yang menghasilkan tingkat akurasi tertentu sementara beberapa informasi
hilang. Di sini sampel pertama dan terakhir keduanya diwakili oleh 1111, sedangkan amplitudonya jelas
berbeda. Hal ini dapat diatasi melalui peningkatan tingkat kuantisasi, yang meningkatkan tingkat akurasi
dan mengurangi kebisingan kuantisasi. Namun peningkatan ini mengorbankan ukuran data yang lebih
besar yang mungkin membutuhkan waktu lebih lama untuk dikirim. Oleh karena itu, dua faktor
menentukan jumlah tingkat kuantisasi. Salah satunya adalah akurasi yang diperlukan untuk aplikasi
tertentu. Yang lainnya adalah kapasitas sistem telekomunikasi dan struktur perangkat yang terkait serta
protokol. Dalam prakteknya ukuran juga ditentukan oleh standar peralatan. Sistem komputer biasanya
menggunakan memori dan struktur pemrosesan berdasarkan unit satu atau lebih byte, di mana setiap
byte adalah 8 bit. Oleh karena itu, level kuantisasi dirancang untuk menghasilkan digit biner kelipatan 8
bit. Suara misalnya menggunakan 256 level kuantisasi, dan menghasilkan 8 bit per sampel (28 = 256).
Musik (seperti dalam compact disc, CD) menggunakan 65.536 level kuantisasi, dan menghasilkan 16 bit
per sampel (216 = 65 536).
Selanjutnya, batas level kuantisasi dapat diatur untuk menghasilkan probabilitas kemunculan sinyal yang sama dalam
setiap pita. Ini biasanya menghasilkan tingkat kuantisasi yang lebih halus pada amplitudo yang lebih rendah dan tingkat
yang lebih kasar pada magnitudo yang lebih tinggi. Contohnya diberikan dalam kaitannya dengan digitalisasi sinyal suara
di bawah ini.
Mengapa Digital?
Meskipun mampu mereproduksi sinyal analog dengan sempurna, representasi digital masih kurang
sempurna dalam praktiknya karena dua alasan. Salah satunya adalah karena penyaringan yang
diperlukan untuk membatasi bandwidth sinyal, yang membuang beberapa informasi. Yang lainnya
adalah representasi sampel sinyal yang tidak sempurna karena tingkat kuantisasi yang terbatas, yang
dapat menyebabkan penurunan kualitas reproduksi. Ini sebagian menjelaskan mengapa para pecinta
piringan hitam (analog) telah lama mengeluhkan kualitas CD musik (digital) yang lebih rendah. Jadi
mengapa digital begitu populer?
Ada sejumlah alasan teknis dan bisnis, tetapi alasan teknis yang paling penting adalah
kemampuan komunikasi digital untuk menghilangkan dampak kebisingan termal.
Dampak kebisingan bersifat kumulatif: ditambahkan ke sinyal pada setiap tahap penerimaan saat
berlangsung melalui sistem telekomunikasi. Misalnya, panggilan suara dapat melalui beberapa
pertukaran antara penelepon dan pihak yang dipanggil seperti yang diilustrasikan pada Gambar 5.8.
Perangkat elektronik di setiap tahap menambah noise pada sinyal, dan hasil kumulatifnya bisa sangat
besar. Kualitas panggilan telepon jarak jauh memburuk semakin banyak pertukaran yang dilaluinya.
Dampak kebisingan dapat ditunjukkan dengan mempertimbangkan bentuk gelombang analog pada Gambar
5.9. Jumlah noise yang ditambahkan pada setiap tahap (dari atas ke bawah) adalah noise dengan kekuatan yang
sama dengan sepersepuluh dari sinyal. Dapat dilihat bahwa ketika noise terakumulasi, sinyal analog semakin
terdistorsi.
Kebisingan yang ditambahkan adalah sinyal acak. Meskipun penyaringan dan pemrosesan lainnya
dapat mengurangi daya kebisingan, mereka tidak dapat sepenuhnya menghapusnya. Akibatnya,
kebisingan terakumulasi pada setiap tahap, dan menurunkan kualitas sinyal. Panggilan telepon jarak
jauh analog terkenal berisik. Kontras kualitas suara antara panggilan jarak jauh dan panggilan lokal
begitu besar sehingga orang biasa mengatakan bahwa panggilan itu begitu jelas 'seolah-olah seseorang
sedang berbicara di seberang kota'. Namun komunikasi digital memungkinkan bebas noisereproduksi
sinyal. Perhatikan sinyal biner digital dan noise pada Gambar 5.10. Sementara derau tidak dapat dihitung
dan dihilangkan, sinyal yang diterima dapat dideteksi apakah 1 atau 1 (menunjukkan 0) ditransmisikan.
Ketika keputusan telah dibuat, sinyal dapat direproduksi tanpa noise. Dengan cara ini akumulasi
kebisingan dihentikan.
Namun, telekomunikasi digital tidak kebal terhadap kebisingan. Jika tingkat kebisingan aditif
tinggi, deteksi sinyal mungkin menjadi salah. Gambar 5.11 dan Gambar 5.12 menunjukkan
masalah ini. Ketika kekuatan sinyal dibandingkan dengan power noise (SNR) rendah, beberapa bit
mungkin salah terdeteksi. Hal ini memunculkan parameter penting dalam telekomunikasi digital,
yaitu berapa banyak kesalahan yang diterima saat tingkat kebisingan meningkat. Parameter ini
dikenal sebagai bit error rate (BER).
Elektronik Menukarkan Menukarkan

Σ Σ Σ
Kebisingan Kebisingan Kebisingan
Gambar 5.8 Kebisingan ditambahkan pada setiap tahap panggilan telepon

1.5
0,5
– 0,5
–1
– 1,5
1.5
0,5
– 0,5
–1
– 1,5
1.5
0,5
– 0,5
–1
– 1,5
1.5
0,5
– 0,5
–1
– 1,5
Waktu
Gambar 5.9 Dampak kumulatif kebisingan

Digital 1 1 1 1
sungai kecil
–1 –1 –1 –1 –1
Amplitudo
Kebisingan
sinyal
Gabungan
sinyal
Waktu
Gambar 5.10 Data digital dan noise tambahan (rasio sinyal terhadap noise, SNR = 10 dB)
Digital 1 1 1 1
sungai kecil
–1 –1 –1 –1 –1
Amplitudo
Kebisingan
sinyal
Gabungan
sinyal
Waktu
Gambar 5.11 Data digital dan kebisingan tambahan lebih lanjut (SNR = 3 dB)
Digital 1 –1 1 1 –1 –1 –1 –1 1
sungai kecil
Amplitudo
Kebisingan
sinyal
Gabungan
sinyal
Waktu
Gambar 5.12 Data digital dan bahkan lebih banyak noise tambahan (SNR = 10 dB)
Tingkat Kesalahan Bit
BER adalah rasio bit yang terdeteksi secara salah dengan jumlah total bit yang
ditransmisikan. Dalam kasus kebisingan termal, BER ditarik terhadap SNR. Daya kebisingan
dihasilkan secara lokal dan merupakan fungsi dari suhu dan bandwidth. Oleh karena itu,
ketika daya sinyal yang diterima berkurang karena kehilangan jalur atau atenuasi lainnya,
SNR berkurang. SNR yang lebih rendah menyebabkan sinyal yang diterima lebih terdistorsi,
yang kemudian menghasilkan deteksi data yang salah yang lebih tinggi. Grafik SNR tipikal
untuk skema modulasi digital umum digambarkan pada Gambar 5.13. Grafik menunjukkan
bahwa jika rasio daya sinyal terhadap daya derau adalah satu (0 dB), kemungkinan
penerimaan yang salah adalah ~7%, tetapi jika daya sinyal lima kali (7 dB) lebih besar dari
derau, maka kemungkinan penerimaan yang salah dikurangi menjadi ~ 0,08%.
Keuntungan Bisnis A sampai D
Popularitas telekomunikasi digital bukan hanya hasil dari keunggulan teknologi dibandingkan analog,
yang sebenarnya dapat diperdebatkan karena representasi sempurna dari sinyal analog tidak mungkin
karena kehilangan kuantisasi. Namun, ketahanan terhadap kebisingan memberikan keuntungan penting
untuk representasi digital seperti yang dibahas di atas. Yang tidak kalah pentingnya adalah keuntungan
bisnis/ekonomi dari telekomunikasi digital.
Hukum Moore [4] meramalkan bahwa kecepatan mikroprosesor meningkat dua kali lipat setiap 18
bulan. Prediksi ini telah berlangsung selama 30 tahun terakhir atau lebih. Selama periode yang sama,
biaya pemrosesan tersebut juga menurun dengan rasio yang sama atau lebih. Karena mikroprosesor
bekerja dengan baik dengan sinyal digital, biaya pemrosesan digital dan perangkat penyimpanan telah
menurun secara signifikan dibandingkan perangkat analog. Teknologi digital juga memudahkan
integrasi sistem informasi antara bisnis dan mitra dagang.
1.0E + 00
1.0E – 01
Tingkat kesalahan bit (BER)
1.0E – 02
1.0E– 03
1.0E – 04
1.0E – 05
– 10 –9 –8 –7 –6 –5 –4 –3 –2 -1 0 1 2 3 4 5 6 7 8 9 10
Rasio sinyal terhadap noise (SNR) dalam dB
Gambar 5.13 Kurva BER khas

Ada juga kerugian untuk komunikasi digital. Dua di antaranya dicatat di atas, yaitu hilangnya
kualitas karena derau penyaringan dan kuantisasi. Salah satu kompleksitas penting yang terkait
dengan komunikasi digital adalah kebutuhan untuk mengikuti protokol yang terdefinisi dengan
baik. Transmisi informasi dalam semburan 1 dan 0 harus distandarisasi sehingga mesin dapat
saling memahami. Ini termasuk ukuran representasi sinyal dalam bentuk biner, tingkat
kuantifikasi dan batas-batasnya, deteksi dan penanganan kesalahan, ukuran bingkai data, dan
sebagainya. Standarisasi rinci seperti itu kontras dengan komunikasi analog di mana standar
terutama diperlukan untuk tujuan pensinyalan dan pengaturan panggilan.
Studi Kasus 5.1: Jaringan Digital Layanan Terpadu

Komunikasi suara dalam bentuk digital sudah umum dalam berbagai bentuk saat ini.
Telepon seluler bersifat digital, demikian pula aplikasi voice over IP seperti Skype. Namun,
ini baru terjadi baru-baru ini dan sebagian besar sistem ini berasal dari pertengahan hingga
akhir 1990-an. Standar komunikasi suara digital utama pertama, Layanan Terpadu untuk
Jaringan Digital (ISDN) baru dikembangkan pada 1980-an. ISDN dirancang untuk membawa
suara digital melalui kabel telepon tembaga twisted pair dan diharapkan pada akhirnya
menggantikan standar telepon analog.
ISDN menggunakan digitalisasi bentuk gelombang dari sinyal suara. Ini memfilter suara
pada 4 kHz, dan mengambil sampelnya pada kecepatan Nyquist 8 kHz. Setiap sampel
dikuantisasi menggunakan 8 bit, sesuai dengan 28 = 256 level kuantisasi, menghasilkan bit
rate 64 kbps (kilobit per detik). Digitalisasi tersebut ditunjukkan untuk memberikan
komunikasi suara berkualitas tinggi dengan persyaratan pemrosesan sinyal minimal.
Pasangan kawat tembaga bengkok terbukti mampu mendukung kecepatan transmisi 144
kbps melalui jarak jauh, sehingga menyediakan dua saluran telepon 64 kbps (disebut
saluran Bearer atau B) dan saluran data dan sinyal 16 kbps (disebut saluran Data atau D) ke
pelanggan. Konektivitas data 16 kbps dari rumah dianggap cukup untuk sebagian besar
aplikasi pelanggan, yang pada saat itu mencakup komputasi jaringan dan mesin faks.
Koneksi dasar ini disebut Basic Rate Interface (BRI) 2B+D [5].
Standar ISDN yang pertama diterbitkan melalui CCITT (Comité Consultatif International
Téléphonique et Télégraphique), yang kemudian diberi nama ITU-T, sebuah badan Perserikatan
Bangsa-Bangsa. Standar membayangkan tingkat transmisi yang lebih tinggi dari 30B (2,048 Mbps
atau operator E1) dan 23B+D (1,544 Mbps atau operator T1) untuk aplikasi komunikasi data bisnis.
Sebagian besar operator nasional mengantisipasi layanan ISDN untuk menjadi arus utama, dan
memulai proses perencanaan. (Pekerjaan pertama penulis setelah lulus dari universitas pada
Januari 1988 adalah dalam kelompok di Telstra yang ditugaskan untuk merencanakan peluncuran
jaringan ISDN di Australia.)
Standar ISDN dirancang untuk menggantikan layanan telepon analog ke tempat
pelanggan. Peluncuran sistem baru ini membutuhkan peralatan digital baru di lokasi
pelanggan dan bursa lokal. Sejumlah operator di seluruh dunia mulai membangun jaringan
ISDN dan pada awal hingga pertengahan 1990-an banyak yang beroperasi. Operator Jepang
NTT memasang telepon umum ISDN dengan slot konektivitas data. Proposisi nilai ISDN
adalah suara digital berkualitas lebih tinggi serta konektivitas data. Pada akhir 1990-an,
tautan ISDN 64 kbps secara aktif dipasarkan untuk konektivitas data sebagai
internet menjadi lebih populer. Namun, pertumbuhan layanan internet dan kebutuhan
mereka akan tingkat transmisi yang jauh lebih tinggi di satu sisi, dan perkembangan
standar Digital Subscriber Links (DSL) di sisi lain membuat ISDN sebagai layanan komunikasi
data menjadi usang. Sementara untuk layanan telepon, hubungan antar-pertukaran telah
menjadi digital, sedangkan hubungan antara tempat pelanggan dan pertukaran lokal
sebagian besar tetap analog. Sistem ISDN gagal menemukan aplikasi yang sesuai dan
sedang dihapus.
Pertanyaan Studi Kasus
● Mengapa standar ISDN dikembangkan?

● Apa motivasi operator dalam meluncurkan sistem ISDN?
● Apa elemen teknologi-bisnis-kebijakan yang diperlukan untuk keberhasilan ISDN?
● Apa yang Anda lihat sebagai alasan kegagalan ISDN? Mungkinkah ini sudah diramalkan?
● Kalau dipikir-pikir, apa yang akan Anda lakukan secara berbeda?
Pengkodean Sumber Data
Proses konversi analog ke digital tidak mempertimbangkan kandungan informasi dari sinyal
analog sebagaimana ditentukan oleh teori informasi. Akibatnya, redundansi dalam aliran data
diskrit tetap ada dan jumlah bit yang ditransmisikan yang mewakili sinyal bisa lebih dari yang
diperlukan. Sejumlah teknik pengkodean sumber telah dikembangkan yang mengurangi jumlah
bit yang dibutuhkan dan meningkatkan efisiensi transmisi.
Pengkodean Sumber
Pengkodean sumber data diskrit umumnya membutuhkan algoritma lossless, yang dapat dilakukan dengan
teknik panjang tetap atau panjang variabel. Namun, sumber informasi analog hanya dapat direpresentasikan
secara digital sebagai nilai perkiraan, karena representasi diskrit yang tepat membutuhkan ukuran data yang tak
terbatas. Tingkat kehilangan informasi tergantung pada apakah kode mengikuti bentuk gelombang sinyal
analog atau menganalisis bentuk gelombang analog menjadi bagian-bagian yang kemudian dikodekan dan
disintesis di penerima.
Pengodean Sumber Suara
Teknik pengkodean suara dapat mengikuti bentuk gelombang analog atau menggunakan sintesis sinyal.
Pengkodean bentuk gelombang dimulai dengan konversi analog ke digital dan dapat diikuti dengan
kompresi lebih lanjut menggunakan teknik seperti pengkodean entropi. Pengkodean sintesis dimulai dari
fisiologi manusia dan generasi suara, dan bagaimana bagian-bagian komponennya dapat diwakili oleh
serangkaian angka diskrit. Teknik pengkodean bentuk gelombang utama termasuk modulasi kode pulsa
(PCM) yang digunakan dalam ISDN dan modulasi kode pulsa diferensial adaptif (ADPCM) yang digunakan
dalam sejumlah standar termasuk Sistem Telepon Handy-Personal Jepang (PHS). Sejumlah teknik
pengkodean sintesis ada yang banyak digunakan dalam aplikasi VoIP dan telepon seluler.
8
7
6
Amplitudo
5
4
3
2
1
Waktu
0
–1
–2
–3
–4
–5
–6
–7
–8
Gambar 5.14 Kuantisasi pengkodean suara logaritmik
Kami akan membahas standar pengkodean Adaptive Multi-Rate (AMR) yang digunakan dalam
standar 3G dan 4G telekomunikasi nirkabel.
Modulasi Kode Pulsa

Standar ISDN menggunakan teknik modulasi khusus yang disebut Pulse Code Modulation (PCM). Teknik ini adalah
pengkodean sumber gelombang konversi A ke D murni. Suara disampel pada 8 kHz dan dikuantisasi pada 8 bit per
sampel, menghasilkan tingkat pengkodean sumber 64 kbps. Tingkat kuantisasi sebagian besar didistribusikan secara
logaritmik dengan tingkat yang lebih halus (lebih banyak) pada amplitudo yang lebih kecil dan tingkat yang lebih kasar
(lebih sedikit) pada amplitudo yang lebih tinggi seperti yang diilustrasikan pada Gambar 5.14. Distribusi tingkat kuantisasi
ini meningkatkan jangkauan dinamis suara, memberikan akurasi lebih untuk sinyal yang lebih kecil dan kurang untuk
sinyal yang lebih besar. Teknik kuantisasi seperti itu mengurangi sinyal terhadap rasio distorsi karena noise berdampak
pada sampel sinyal yang lebih kecil.
Modulasi Kode Pulsa Diferensial Adaptif

PCM yang dijelaskan di atas adalah bentuk perspektif teori informasi yang tidak efisien karena
tidak memperhitungkan korelasi antara sampel tetangga. Dalam prakteknya sampel berturut-
turut dari sinyal analog sangat berkorelasi dan oleh karena itu teknik yang mendekorasi saling
ketergantungan ini dapat mengurangi jumlah bit yang diperlukan untuk mewakili sinyal.
Salah satu metode tersebut adalah hanya menyandikan perbedaan antara dua sampel berurutan. Hal
ini diilustrasikan pada Gambar 5.15. Perbedaan antara sampel berurutan dapat dikodekan dengan bit
yang lebih sedikit karena rentang sinyal jauh lebih kecil daripada rentang sinyal keseluruhan (karena
tidak bervariasi antara dua interval pengambilan sampel berurutan).
1
Amplitudo
Waktu
–1
Gambar 5.15 Pengkodean diferensial
Perbedaan antara dua sampel suara yang berurutan dapat dikodekan entropi karena rentang nilai
yang mungkin lebih kecil dan dipahami dengan baik. Sampel standar ADPCM diwakili oleh 4 bit, dan oleh
karena itu kecepatan pengkodean total sama dengan 8000 × 4 = 32 kbps. Baik pengkodean PCM dan
ADPCM menggunakan konversi A ke D dan tidak memiliki kerugian.
Pengkodean Sintesis
Kelas alternatif pengkodean suara adalah melalui analisis suara ke dalam komponennya. Metode ini
bersifat lossy karena beberapa informasi hilang dalam proses pengkodean sumber. Pengkodean sintesis
menggunakan fakta bahwa generasi suara manusia terjadi karena suara yang diciptakan oleh pita suara
kita yang kemudian dibentuk menjadi ucapan saat bergerak melalui saluran vokal kita (tenggorokan dan
mulut). Pidato kita terdiri dari suara 'buzzer' yang dihasilkan oleh pita suara yang bergetar, dan suara
'mendesis' dan 'letusan' saat udara melewati pita suara yang tidak bergerak dan dibentuk oleh lidah,
bibir, dan tenggorokan kita. Dekoder suara menemukan intensitas dan nada suara buzzer dan residu
sinyal ketika suara buzzer disaring [6].
Perhitungan nilai filter dilakukan melalui proses sintesis seperti diilustrasikan pada Gambar 5.16. Di
sini, buku kode yang mewakili berbagai kemungkinan nada, intensitas, dan residu digunakan untuk
mensintesis suara yang mirip dengan suara input setiap 20 ms. Sebuah loop umpan balik menyesuaikan
parameter filter sampai suara yang disintesis dan suara yang sebenarnya berbeda minimal. Angka-angka
yang mewakili parameter nada, intensitas dan filter ditransmisikan ke penerima yang kemudian
mensintesis suara yang diterima.
Asli
pidato
sinyal
+
Pidato -
Buku kode
filter
Ke kata kode berikutnya
Perseptual
Menghitung
menimbang
kesalahan
faktor
Gambar 5.16 Pengkodean analisis suara
Tabel 5.3 Sejumlah codec suara yang umum digunakan dan aplikasinya
Kode suara Aplikasi Kecepatan bit (kbps)
G.729 VoIP 8
PCM ISDN 64
ADPCM VoIP 32
AMR Standar 3G dan 4G nirkabel 4.75–12.2
Pita Lebar AMR Standar 3G dan 4G nirkabel 6.6–23.85
Proses sintesis mereproduksi komponen suara dan melewatinya melalui filter dengan parameter dari
informasi yang diterima. Teknik pengkodean suara ini dapat menghasilkan tingkat kompresi yang sangat
tinggi, dan digunakan di banyak aplikasi. Contohnya adalah AMR, teknologi kode suara yang digunakan
dalam standar GSM, 3G dan 4G. AMR mengkodekan suara dengan kecepatan variabel dari 12,2 kbps
hingga 4,75 kbps, menunjukkan kompresi yang signifikan dibandingkan dengan kecepatan digital penuh
64 kbps. Namun ini datang dengan mengorbankan kualitas suara, yaitu, semakin rendah bit rate
semakin tinggi hilangnya informasi. Hilangnya informasi menyebabkan penurunan kualitas suara. Selain
itu, penurunan kualitas menjadi lebih menonjol ketika terjadi kesalahan penerimaan. Pengkodean suara
lossless 64 kbps sangat kuat dengan adanya kesalahan penerimaan yang besar karena kualitasnya tidak
menurun secara signifikan. Namun, aliran berkode 4,75 kbps dapat menjadi tidak dapat dipahami
dengan sangat cepat karena kesalahan transmisi meningkat.
Sejumlah voice coder telah dikembangkan oleh sejumlah organisasi dan distandarisasi oleh ITU. Tabel
5.3 mencantumkan sejumlah codec yang umum digunakan dan aplikasinya. Kebanyakan codec
mengubah aliran suara yang difilter pada 4 kHz, kecuali untuk AMR Wideband (AMR-WB) yang
mengkodekan aliran suara yang difilter pada 7 kHz [7].
Perbandingan Teknik Pengodean Suara

Seperti dibahas di atas, teknik pengkodean suara yang berbeda menghasilkan bit rate yang berbeda, dan
oleh karena itu persyaratan transmisi. Jelas tarif yang lebih rendah bermanfaat dari sudut pandang bisnis
karena sumber daya transmisi dapat digunakan lebih efisien. Namun, ini berkurang
Tabel 5.4 Kualitas persepsi sejumlah codec suara [10]
AMR pita sempit AMR pita lebar
Tingkat (kbps) MOS Tingkat (kbps) MOS
4.75 2.8 6.60 3.2

6.70 3.1 8.85 3.5
7.40 3.2 12.65 4.0
10.20 3.3 15.85 4.1
12.20 3.4 18.25 4.2
tingkat transmisi datang dengan mengorbankan kualitas suara perseptual. Sejumlah ukuran kualitas
suara yang menginformasikan trade-off ini telah distandarisasi. Salah satu ukuran tersebut adalah
evaluasi persepsi kualitas pidato (PESQ) skala yang membandingkan skema pengkodean suara yang
berbeda dengan patokan referensi analog bersih [8]. Metode lain adalah mean opinion score (MOS) yang
rata-rata persepsi pendengar pada skala 1 (buruk) sampai 5 (sangat baik). Tabel 5.4 menunjukkan
perbandingan MOS tipikal untuk beberapa kode suara. Seperti yang diharapkan, kualitas persepsi
menurun karena bit rate yang lebih rendah digunakan untuk mewakili suara. Codec AMR pita lebar baru
juga dapat memiliki kualitas reproduksi suara yang jauh lebih baik dan digunakan dalam standar nirkabel
baru seperti 4G voice over LTE (VoLTE) [9].
Kualitas panggilan yang lebih rendah umumnya menghasilkan komunikasi yang tidak memuaskan dan dapat
mengakibatkan pemutusan panggilan lebih awal, sehingga mengurangi potensi pendapatan operator. Memang telah
ditunjukkan bahwa panggilan telepon cenderung bertahan lebih lama jika kualitas suaranya tinggi, dan lebih pendek jika
kualitasnya rendah [11]. Pengkodean tingkat adaptif memungkinkan operator jaringan untuk menggunakan skema
pengkodean sumber kualitas terbaik selama periode lalu lintas rendah untuk memberikan kualitas persepsi setinggi
mungkin. Ketika jaringan macet, tingkat pengkodean dapat dikurangi untuk mengakomodasi lebih banyak panggilan.
Studi Kasus 5.2: Skype

Skype pada dasarnya adalah aplikasi VoIP, diluncurkan pada tahun 2003 untuk
memungkinkan telepon peer-to-peer. Awalnya dirancang untuk komunikasi komputer
pribadi (PC)-ke-PC, peningkatan telah dibuat untuk mengaktifkan pesan instan, telepon
telepon-PC, aplikasi seluler, telekonferensi, dan telepon video. Selanjutnya, Skype telah
memasuki pasar hotspot WiFi, dan diperkirakan akan memberikan akses kepada pelanggan
Skype ke 2 juta hotspot secara global. Per Agustus 2013, jumlah pelanggan lebih dari 300
juta [12]. Telepon Skype PC-ke-PC, atau teknologi VoIP, tetap gratis dan telah menjadi
alasan utama di balik pertumbuhan pelanggannya. Layanan VoIP sudah ada jauh sebelum
Skype. Layanan VoIP pertama ditawarkan pada pertengahan 1990-an, dan standar VoIP ITU
H.323 diterbitkan pada tahun 1996 [13]. Pada awal 2000-an beberapa layanan VoIP ada,
khusus ditujukan untuk pasar korporasi. Sebuah ekosistem layanan muncul untuk
mengelola layanan VoIP berkualitas tinggi: misalnya Genista Corporation tempat penulis
bekerja pada awal 2000-an mengembangkan alat untuk mengukur kualitas persepsi
komunikasi VoIP. Namun, ukuran pasar VoIP tetap cukup kecil sampai Skype diperkenalkan.
Penawaran Skype sangat revolusioner dalam beberapa hal. Salah satu caranya adalah antarmuka pengguna
yang sederhana yang memudahkan siapa saja untuk menggunakan layanan ini. Cara kedua adalah protokol peer-
to-peer yang memungkinkan untuk menempatkan dan menerima panggilan dari belakang perusahaan
firewall, dan yang memfasilitasi database pelanggan online yang terdesentralisasi, sebuah
protokol yang telah digunakan oleh pendiri Skype Friis dan Zenstrom untuk situs berbagi file
musik KaZaa. Namun, faktor yang paling penting adalah codec suara yang digunakan untuk
mentransfer suara analog ke aliran digital. Kualitas suara sangat bagus dibandingkan dengan
layanan telepon analog internasional. Ditambah dengan fakta bahwa seseorang dapat melakukan
panggilan internasional gratis dengan mudah. Skype sukses besar: segera diakuisisi oleh
perusahaan lelang online eBay pada tahun 2006 seharga $2,6 miliar untuk meningkatkan platform
penjualan peer-to-peer mereka. Perusahaan telah berubah dan Skype sekarang dimiliki oleh
Microsoft setelah kesepakatan senilai $8,5 miliar pada tahun 2012 kembali ditujukan untuk
meningkatkan aplikasi Microsoft seperti pesan internet dan email.
Skype dilaporkan menggunakan sejumlah codec suara
termasuk G.711 (64 kbps), G.729 (8 kbps), SVOPC (16 kbps) Lapisan konten dan layanan
dan AMR-WB (16 kbps). Pengkodean sumber suara

berkualitas tinggi telah menjadi salah satu faktor terpenting Lapisan ritel konektivitas
dalam mempertahankan basis pelanggan Skype dan

Lapisan infrastruktur
kesuksesan yang berkelanjutan.
Skype juga menawarkan layanan telepon ke dan dari
telepon rumah dan telepon seluler melalui layanan Skype- Pelanggan/Pengguna akhir
out/Skype-in. Skype dan perusahaan sejenis seperti Viber,

WhatsApp dan WeChat dikenal sebagai layanan over-the-top (OTT). Perusahaan-perusahaan ini
aktif di lapisan konten dan layanan ekosistem telekomunikasi pita lebar. Mereka memanfaatkan
infrastruktur broadband yang dijual secara eceran oleh ISP dan menggantikan layanan yang
secara tradisional disediakan oleh operator telepon dan seluler. Pendapatan yang hilang dari
penyedia layanan OTT bisa sangat signifikan: dilaporkan bahwa lebih dari sepertiga panggilan
suara internasional sekarang dilakukan melalui platform Skype (Gambar 5.17) [14].
Pertanyaan Studi Kasus
● Mengapa penyerapan pasar VoIP lambat?

● Bagaimana Skype berhasil membangun layanan VoIP dan menarik pelanggan?
● Bagaimana layanan Skype-out dan Skype-in membantu tujuan strategis?
● Mengapa Skype memasuki pasar hotspot WiFi?
● Menurut Anda mengapa Microsoft mengakuisisi Skype?
600 35,0%
Lalu lintas telepon internasional

500 30,0%
Pangsa Skype (%)
25,0%
400
Berbagi Skype
Miliar menit
20,0%
300
15,0%
200
10,0%
100 5.0%
0 0,0%
2005 2006 2007 2008 2009 2010 2011 2012
Tahun
Gambar 5.17 Pangsa Skype dari telepon internasional (berdasarkan data dari TeleGeography [14])
Pengodean Audio
Mirip dengan suara, audio analog dikodekan dengan kode sumber lossless dan lossy. Beberapa
teknik pengkodean lossless ada, dengan yang paling banyak digunakan adalah standar CD.
Pengkode MP3 adalah teknik pengkodean audio lossy yang paling terkenal.
Standar CD
Mirip dengan suara, tingkat konversi A ke D sinyal audio juga ditentukan oleh kemampuan manusia untuk
merasakan suara. Suara yang dapat didengar manusia berada dalam rentang frekuensi 20–20.000 Hz, dan oleh
karena itu konversi A ke D harus mengambil sampel suara lebih besar dari 2 × 20.000 sampel per detik untuk
memastikan semua frekuensi yang dapat didengar ditangkap. Selain itu, telinga manusia sangat sensitif
terhadap suara tingkat energi rendah dan tinggi dan jangkauan yang dapat didengar adalah dari 109 ke 104
tekanan bola atmosfer, kisaran 1013, atau 130 dB. Karena jangkauannya jauh lebih luas dibandingkan dengan
suara, audio membutuhkan tingkat kuantisasi yang jauh lebih banyak dibandingkan dengan 256 tingkat yang
digunakan untuk suara.
Standar CD menetapkan laju pengambilan sampel pada 44.100 sampel per detik, sedikit di atas
rentang frekuensi yang dapat didengar, untuk mengakomodasi suara digital untuk perekam video
analog yang kemudian digunakan [15]. Untuk mengakomodasi rentang suara, standar menggunakan 216
= 65 536 tingkat kuantisasi. Oleh karena itu, kecepatan bit perekaman CD adalah 44 100 sampel/s * 16
bit/ sampel * 2 (untuk perekaman stereo) sama dengan 1,411 Mbps. Untuk 60 menit musik, jumlah total
bit yang diperlukan dihitung sebagai berikut:
1,411 Mbps* 3600 s 5,08 gigabit 620 megabita MB 1 kilobita 1024 bit .
Ukuran CD
CD audio awalnya dirancang untuk memiliki diameter 11,5 cm, sama dengan panjang diagonal
pita audio kompak. Ukuran ini menyediakan kapasitas audio sekitar 60 menit musik. Ukurannya
ditingkatkan menjadi diameter 12 cm saat ini karena seorang eksekutif di Sony memutuskan
bahwa CD harus dapat berisi rekaman favoritnya dari simfoni ke-9 Beethoven, yang berdurasi
74 menit (membutuhkan 760 MB) [15].
Codec Audio Tanpa Rugi Gratis
Korelasi antara sampel audio digital tetangga dapat digunakan untuk mengurangi jumlah bit yang
diperlukan untuk mewakili sinyal audio tanpa kehilangan informasi. Free lossless audio codec (FLAC)
adalah salah satu teknik pengkodean audio yang dapat memampatkan audio digital hingga 50–60%.
Sebuah decoder FLAC dapat menyusun kembali audio digital tanpa kehilangan informasi [16].
Standar MP3
Sistem pengkodean audio sumber dirancang sebagai bagian dari proyek pengkodean video
digital, dan distandarisasi oleh Moving Pictures Expert Group (MPEG). MPEG-1, rilis standar
pertama berisi tiga codec audio, MPEG-1 Audio Layers I, II dan III. Ini lebih baik
dikenal sebagai MP1, MP2 dan MP3, masing-masing. Ketiga standar tersebut adalah pengkodean audio yang
lossy, yaitu audio yang disandikan bukanlah konversi A ke D dari sinyal audio analog input.
MP1 mengkodekan audio dengan pengambilan sampel pada 32, 44.1 dan 48 kHz dan menghasilkan output
dengan kecepatan variabel dari 32 hingga 448 kbps. Itu digunakan dalam kaset kompak digital, produk yang
sekarang dihentikan. MP2 juga mengkodekan audio analog dengan pengambilan sampel pada 32, 44,1 dan 48
kHz, dan menghasilkan aliran audio digital terkompresi dengan kecepatan variabel antara 32 kbps dan 384 kbps.
MP2 adalah bagian dari standar penyiaran audio digital (DAB) dan penyiaran video digital (DVB) dan umumnya
digunakan untuk perekaman profesional oleh stasiun radio. Standar MP2 juga digunakan dalam sistem video CD
(VCD).
Dari ketiga standar audio MPEG-1 MP3 adalah yang paling populer dikenal dan digunakan. Ini memiliki
aplikasi dalam pengkodean audio untuk merekam, menyimpan dan berbagi musik dan digunakan di sebagian
besar pemutar musik portabel. Ini juga biasa digunakan untuk streaming musik. Mirip dengan standar kompresi
suara seperti AMR, MP3 juga menganalisis sinyal audio dengan membagi sinyal input menjadi sub-band dari
banyak frekuensi yang berbeda. Encoder kemudian menyaring informasi yang secara persepsi tidak signifikan:
suara apa pun yang tidak dapat dirasakan oleh sistem pendengaran manusia akan dibuang. Misalnya jika
frekuensi tertentu dari suatu sinyal memiliki amplitudo yang besar, sinyal tersebut dapat menutupi frekuensi
tetangganya yang memiliki amplitudo lebih rendah. Fenomena ini dikenal sebagai auditory masking.
Pengkodean informasi terselubung tersebut tidak diperlukan karena telinga kita tidak dapat mendengarnya.
Dengan menggunakan prinsip ini, source coder MP3 dapat mengurangi jumlah bit yang digunakan hanya
dengan memberikan informasi yang secara persepsi signifikan bagi telinga manusia [17]. Informasi sub-band
selanjutnya dikodekan Huffman untuk meminimalkan jumlah bit yang digunakan. Standar MP3 menetapkan laju
sampling 16, 22.05, 24, 32, 44.1 dan 48 kHz, dan menghasilkan laju bit dalam rentang 32-320 kbps. Kecepatan bit
ini menunjukkan pengurangan yang signifikan dibandingkan dengan kecepatan pengkodean CD audio 1,411
Mbps.
Perlu dicatat bahwa encoder audio seperti MP3 bekerja dengan cara yang berbeda dengan encoder
suara seperti AMR. Pembuat kode suara menganalisis pembangkitan sinyal suara oleh sistem vokal
manusia untuk mengkodekannya secara efisien. Sebaliknya, pembuat kode audio menganalisis
bagaimana sistem pendengaran kita merasakan audio untuk mengkodekannya secara efisien. Standar
MPEG di mana MP3 menjadi bagiannya diratifikasi secara global melalui Organisasi Internasional untuk
Standardisasi (ISO). Secara umum standar menentukan format output bidang data dari encoder MP3,
dan pengoperasian decoder. Oleh karena itu, vendor yang berbeda bebas untuk meningkatkan kualitas
pengkodean audio, selama dekoder standar dapat memutar ulang audio yang dikodekan. Ini
memastikan bahwa pemutar MP3 mana pun dapat memutar ulang rekaman audio oleh pembuat enkode
MP3 vendor lain.
Tabel 5.5 menunjukkan daftar standar kompresi audio lossless yang umum digunakan dan
Tabel 5.6 memberikan daftar standar kompresi lossy. Daftar lengkap semua codec audio dapat
ditemukan dalam literatur [18, 19, 20, 21, 22].
Tabel 5.5 Standar kompresi lossless
Codec audio tanpa rugi Aplikasi Kecepatan bit Standar
CD Penyimpanan/pemutaran 1411 kbps IEC 60908

ALAC Penyimpanan/pemutaran 50–60% dari CD Sumber Terbuka Apple
FLAC Penyimpanan/pemutaran 50–60% dari CD Format Terbuka XIPH.ORG
Tabel 5.6 Standar kompresi lossy
Codec audio yang hilang Aplikasi Kecepatan bit (kbps) Standar
MP3 (MPEG-1 Penyimpanan/pemutaran/ 32–320 ISO/IEC 11172-3 ISO/

dan MPEG-2) mengalir IEC 13818-3
AAC (MPEG-2 Penyimpanan/pemutaran/ 32–320 ISO/IEC 13818-7 ISO/
dan MPEG-4) mengalir IEC 14496-3
Vorbis Penyimpanan/pemutaran/ 45–500 Format Terbuka XIPH.ORG
mengalir
media jendela Penyimpanan/pemutaran/ 24–768 Kepemilikan Microsoft
audio (WMA) mengalir
Studi Kasus 5.3: iTunes

Teknologi MP3 dikembangkan di perusahaan Jerman Fraunhofer-Gesellshaft, dan paten
Jerman pertama mereka dikeluarkan pada tahun 1989. Teknologi ini diintegrasikan ke
dalam standar MPEG-1 pada tahun 1992 dan diterbitkan setahun kemudian. Kemampuan
kompresi tinggi sistem MP3 dan kualitas audio yang direproduksi relatif tinggi
menghadirkan alternatif perekaman dan pemutaran audio yang kredibel dibandingkan
standar CD. Produk perangkat lunak segera dikembangkan dan musik MP3 pertama dan
pemutar MP3 portabel muncul di pasar pada tahun 1999 [23]. Namun, produser musik
besar tidak menjual musik dalam format MP3 karena penyalinan file dan kesulitan
manajemen hak digital (DRM). Sementara berbagi file MP3 pada platform seperti Napster
dan kemudian KaZaa mendapatkan popularitas sekitar pergantian abad, pasar utama untuk
produk ini tidak didirikan.
Pada Januari 2001, Apple Inc. memperkenalkan iTunes untuk merekam musik, serta
mengonversi audio digital (CD) ke dalam format MP3. Ini segera diikuti pada bulan Oktober
2001 dengan pengenalan produk iPod untuk menyimpan dan memutar file MP3. Ini menjadi
pemutar musik MP3 populer pertama, didukung oleh merek terkenal dan platform di mana
musik dapat diproduksi dan dibeli. Selain itu, strategi Apple dalam memisahkan album
musik menjadi lagu-lagu individual dan menjualnya dengan harga serendah 99 melalui
platform iTunes melengkapi produk iPod mereka. Platform iTunes dan iPod menjadi sangat
populer dalam waktu yang sangat singkat.
Steve Jobs terkenal mempromosikan iPod sebagai pemutar musik portabel yang dapat membawa
1000 lagu. Dengan kualitas audio yang cukup tinggi, keunggulan kompetitif iPod dibandingkan pemutar
CD portabel sangat bagus. Pasar CD serta pemutar CD telah sangat menyusut sejak puncaknya pada
tahun 2000.
Apple telah membangun kesuksesan platform musik iTunes dengan menambahkan fitur
lebih lanjut seperti metadata file musik (seperti informasi tentang musik dan sampul CD),
dan video seperti film dan program TV. Selanjutnya, program radio sekarang umumnya
'podcast' dalam format MP3. Dengan dirilisnya iPhone pada tahun 2007, platform iTunes
telah digunakan untuk streaming musik dan video, dan manajemen aplikasi.
Apple kini menjadi pemain utama dalam ekosistem komunikasi

Lapisan konten dan layanan
telekomunikasi broadband sebagai penyedia konten karena
penggunaan teknologi MP3 yang strategis. Keuntungan utama MP3
dibandingkan CD adalah ukuran file yang jauh lebih kecil dengan Lapisan ritel konektivitas
mengorbankan beberapa penurunan kualitas. Pengkodean sumber

yang efisien yang ditawarkan oleh MP3 dimanfaatkan dan dikemas Lapisan infrastruktur
dengan cara yang dapat diterima oleh produser musik dan mudah
digunakan oleh konsumen. Keberhasilan berikutnya dari perangkat
Pelanggan/Pengguna akhir
iPhone dan iPad sebagian karena iPod dan MP3.
Pertanyaan studi kasus
● Mengapa standar MP3 dikembangkan?

● Apa alasan utama lambatnya penggunaan perangkat MP3?
● Mengapa Apple bisa mempopulerkan MP3? Bagaimana konsep platform yang dimediasi jaringan dapat
diterapkan?
● Bagaimana platform iTunes berkembang?
● Bagaimana Apple menjadi pemain di lapisan konten dan layanan ekosistem broadband?
Pengodean Gambar
Sebuah gambar digital terdiri dari piksel warna yang berbeda (Gambar 5.18). Seperti yang dibahas dalam Bab 4,
jumlah warna yang mungkin diambil oleh sebuah piksel menentukan berapa banyak bit yang diperlukan untuk
mewakili sebuah piksel. Misalnya jika 256 kemungkinan warna ada maka 8 bit (28 = 256) diperlukan untuk
mewakili satu piksel. Jika gambar tersebut memiliki dimensi 40 × 40 piksel, maka jumlah total bit yang diperlukan
untuk mewakili gambar ini adalah 40 * 40 * 8 = 12.800 bit. Teknik pengkodean seperti itu digunakan misalnya
dalam bitmap tidak terkompresi (menghasilkan file dengan ekstensi .bmp).
Gambar 5.18 Piksel yang membentuk gambar

Pengkodean berbasis piksel tidak terlalu efisien karena tidak memperhitungkan korelasi antara
warna piksel tetangga. Selain itu, tidak memperhitungkan konten perseptual gambar. Misalnya,
sistem visual manusia tidak peka terhadap transisi warna piksel yang cepat dan oleh karena itu
informasi persepsi yang tidak penting dapat dibuang dengan sedikit atau tanpa dampak visual.
Sementara teknik seperti itu menyebabkan hilangnya beberapa informasi, kejelasan persepsi
gambar dapat direproduksi secara dekat. Berdasarkan prinsip ini, sejumlah teknik pengkodean
gambar telah dikembangkan untuk memfasilitasi kompresi lossless dan lossy, sehingga
menghasilkan pengurangan jumlah bit yang diperlukan untuk mewakili gambar secara signifikan.
Pengodean Gambar Tanpa Rugi
Pengkodean gambar lossless dimungkinkan jika korelasi antara piksel yang berdekatan
dipertimbangkan. Teori informasi mengajarkan bahwa konten informasi total dari suatu gambar dapat
dihitung dengan probabilitas bahwa suatu piksel individu mengambil warna tertentu, dijumlahkan
dengan jumlah total piksel. Metode pengkodean entropi kemudian dapat menghasilkan pesan kode yang
efisien. Jika seseorang dapat menghitung probabilitas bahwa suatu piksel mengambil warna tertentu,
maka pesan kode yang efisien dapat dihasilkan.
Seperti yang dapat diamati dari Gambar 5.18, probabilitas bahwa suatu piksel mengambil warna tertentu
sangat berkorelasi dengan warna piksel tetangganya. Misalnya, piksel abu-abu kemungkinan besar berada di
sebelah piksel berwarna abu-abu lain yang serupa.
Salah satu cara untuk mendekorasi citra adalah dengan menghitung selisih antara piksel tetangga.
Kita bisa mulai dari piksel kiri atas, perhatikan warnanya dan berikan kode tertentu. Piksel berikutnya
memiliki warna yang sedikit berbeda, perbedaannya dapat diukur dan diberi kode. Seseorang dapat
bergerak melintasi sumbu horizontal dan vertikal dan mengukur perbedaan warna piksel, menetapkan
kode untuk perbedaan tersebut dan mengompilasinya ke dalam file yang mewakili informasi gambar.
Metode pengkodean seperti itu dapat secara signifikan lebih efisien daripada ketika korelasi piksel tidak
dipertimbangkan. Ukuran gambar yang dikodekan dapat dikurangi lebih lanjut jika teknik pengkodean
entropi, seperti pengkodean Huffman, digunakan untuk mengkodekan nilai perbedaan antar-piksel. Ini
adalah prinsip di balik pengkodean gambar Portable Network Graphic (. format file png) metode untuk
kompresi gambar lossless. Kompresi PNG berguna untuk gambar di mana variasi piksel-ke-piksel kecil
atau nol, seperti teks atau gambar grafik, misalnya untuk dump layar komputer seperti yang ditunjukkan
pada Gambar 5.19.
Gambar 5.19 Dump layar dari layar penulis saat teks sedang diketik
Pengodean Gambar Rugi
Gambar seperti Gambar 5.19 dapat dikompresi dengan tingkat efisiensi yang besar. Namun, banyak
gambar seperti foto alam biasanya memiliki transisi piksel yang besar dan oleh karena itu pengkodean
diferensial lossless tidak menghasilkan kompresi yang signifikan. Kompresi lebih lanjut dicapai jika
beberapa kerugian dapat ditoleransi.
Mirip dengan audio dan suara, teknik kompresi lossy memperhitungkan kemampuan persepsi
manusia. Mata kita dapat membedakan transmisi warna kecil di seluruh piksel tetapi transisi
frekuensi tinggi tidak dirasakan dengan baik. Kompresi gambar pada prinsipnya dilakukan dengan
menghapus data yang dianggap tidak penting ini.
Proses identifikasi dan penghilangan komponen frekuensi tinggi dari suatu citra dilakukan
dalam domain frekuensi. Pertama gambar ditransformasikan dari domain spasial ke domain
frekuensi, kemudian transisi frekuensi yang lebih tinggi diidentifikasi dan dihapus sesuai dengan
tingkat kompresi yang diinginkan.
Representasi domain frekuensi dari citra spasial dilakukan melalui teknik discrete cosinus transformation
(DCT). DCT pada dasarnya menerjemahkan gambar ke dalam jumlah dari banyak kemungkinan transisi piksel.
Gambar 5.20 menunjukkan gambar skala abu-abu 8x8 piksel. Gambar ini dapat direpresentasikan sebagai
jumlah kemungkinan transisi skala abu-abu 8 piksel seperti yang ditunjukkan pada Gambar 5.21.
Teknik DCT mengubah citra domain spasial Gambar 5.20 menjadi nilai berbobot semua komponen
frekuensi seperti yang ditunjukkan pada Gambar 5.21. File gambar dapat direpresentasikan dalam dua
cara. Salah satunya adalah dalam domain spasial di mana skala abu-abu setiap piksel ditemukan. Cara
lain adalah dalam domain frekuensi di mana bobot setiap transisi frekuensi ditemukan. Keduanya sama-
sama mewakili citra yang sama [24].
Gambar 5.22 menunjukkan dua gambar. Gambar 5.22(a) memiliki sedikit transisi hitam ke putih: ia memiliki
informasi yang relatif lebih sedikit dan dapat dikodekan dengan bit yang relatif lebih sedikit. Gambar 5.22(b)
memiliki lebih banyak transisi dan dikodekan menggunakan file yang lebih besar. Encoder lossy dapat
menghapus beberapa komponen frekuensi tinggi ini tanpa mengurangi kualitas persepsi reproduksi gambar
secara signifikan. Gambar di sebelah kanan adalah gambar yang dihasilkan DCT dalam domain frekuensi. Seperti
yang diharapkan, Gambar 5.22(c) memiliki informasi frekuensi tinggi yang lebih sedikit, dan titik-titik putih
terkonsentrasi di bagian kiri atas gambar. Gambar 5.22(d) menunjukkan frekuensi yang lebih tinggi di seluruh
hasil DCT [25].
Representasi domain frekuensi memfasilitasi kompresi gambar yang hilang. Misalnya gambar
mungkin memiliki transisi frekuensi tinggi kecil yang signifikan, yang ditunjukkan di sudut kanan
bawah Gambar 5.21. Ini dapat dibuang dengan sedikit kehilangan kualitas persepsi. Semakin
banyak komponen frekuensi tinggi yang dapat dihapus, menghasilkan file berukuran lebih kecil
tetapi dengan kualitas yang lebih rendah. Contoh gambar dengan tiga tingkat kompresi
ditunjukkan pada Gambar 5.23. Seperti yang dapat dilihat, ketajaman tepi hilang karena semakin
banyak transisi frekuensi tinggi yang dihilangkan.
8×8
Gambar 5.20 Gambar skala abu-abu 8 × 8 piksel. Sumber: https://commons.wikimedia.org/wiki/File:

Letter‑a‑8×8.png
Gambar 5.21 Kumpulan kemungkinan transisi skala abu-abu 8 piksel. Sumber: https://commons.wikimedia. org/
wiki/File:DCT‑8x8.png
(A) (C)
(B) (D)
Gambar 5.22 Dua gambar dengan jumlah transisi skala abu-abu yang berbeda. Sumber: Ref. [25]
Gambar 5.23 Tiga tingkat kompresi, dengan ukuran file (dari kiri ke kanan) sebesar 83,2, 9,5 dan 4,8 kilobyte.
Sumber: Ref. [26]
Pengodean Video
Karena sinyal video hanyalah urutan gambar, pengkodean video menggunakan teknik pengkodean gambar
seperti yang dijelaskan di atas. Pengkodean video juga memanfaatkan kesamaan temporal antara bingkai
gambar berurutan untuk mengurangi jumlah bit yang diperlukan untuk mengkodekan gambar bergerak.
Konversi video A ke D jika memungkinkan, tidak praktis. Siaran TV analog menggunakan bandwidth 6–
8 MHz. Menggunakan pengkodean digital PCM dengan 224 rentang kuantisasi akan menghasilkan:
8*2*24 = 384 Mbps. DVD dapat menyimpan 4,5 gigabyte data, dan pada kecepatan ini dapat
menyediakan penyimpanan selama 94 detik video digital. Bahkan transmisi frame gambar individu tidak
praktis. Jika gambar dikodekan dengan 500 kilobyte, video 30 frame/s membutuhkan kecepatan
transmisi 15 Mbps.
Karena bingkai gambar berurutan sangat berkorelasi, pengkodean video perlu mendekorasi gambar-
gambar ini untuk mengurangi jumlah total bit yang diperlukan. Oleh karena itu, prinsipnya mirip dengan
pengkodean diferensial yang dijelaskan dalam kaitannya dengan pengkodean suara, audio dan gambar:
setelah gambar dikodekan, gambar berikutnya dapat dikodekan dengan menghitung perbedaannya dari
gambar awal.
Semua standar ini mengkodekan video dengan memproduksi tiga jenis bingkai melalui prediksi
dan pengkodean diferensial berdasarkan teknologi DCT dan pengkodean diferensial temporal
(antar-bingkai). Tiga jenis frame dispesifikasikan: intra-coded frames (I-frames), predictive-coded
frames (P-frames), dan bi-directionally predictive-coded frames (Bframes). I-frame pada dasarnya
adalah file JPEG menggunakan teknologi DCT. Data I-frame tidak tergantung pada frame
sebelumnya atau berikutnya. P-frame secara temporal beberapa frame setelah I-frame dan
dihitung melalui proses diferensial prediktif: data untuk P-frame dihitung dengan
mengekstrapolasi data I-frame. Karena ekstrapolasi tidak sepenuhnya akurat, perbedaan antara
nilai aktual dan nilai ekstrapolasi dihitung, dikodekan, dan ditransmisikan sebagai nilai bingkai-P.
Karena perbedaannya umumnya dalam ukuran yang lebih kecil, ini memberikan lebih banyak
kompresi karena P-frame memanfaatkan informasi I-frame. Dalam prakteknya beberapa P-frame
diekstrapolasi dan dihitung secara diferensial.
B-frame mewakili informasi untuk frame antara I- dan P-frame. Data mereka dihitung
berdasarkan prediksi dan pengkodean diferensial. Interpolasi antara I- dan P-frame dibuat untuk
memperkirakan data B-frame. Sekali lagi karena nilai aktual dan estimasi tidak sama persis,
perbedaan antara keduanya dikodekan dan ditransmisikan sebagai B-frame. Hubungan
perhitungan antara I-, P- dan B-frame diilustrasikan pada Gambar 5.24.
SayaBBPBBPBB SayaBBPBBPBB Saya
Gambar 5.24 Hubungan antara I-, P- dan B-frame
Tabel 5.7 Standar dan aplikasi kompresi video MPEG umum
Codec Standar Aplikasi
MPEG-1 H.261 CD Video DAB

MPEG-2 H.262 DVD, DVD Blu-Ray DVB
Blu-Ray DVD
Streaming video (YouTube, Vimeo, dll.)
MPEG-4 H.264 Video telephony (mis. FaceTime)
Siaran HDTV
XAVC (4K)
MPEG-H H.265 Pengkodean video efisiensi tinggi 8K TV definisi ultra tinggi
Sejumlah standar pengkodean video telah dikembangkan sejak tahun 1988 dalam
kelompok MPEG di bawah naungan ITU [27]. Standar-standar ini telah berperan dalam
memfasilitasi konferensi video, TV digital, telepon video dan aplikasi streaming video. Daftar
standar utama dan aplikasinya ditunjukkan pada Tabel 5.7.
★★★★★
Meskipun sinyal-sinyal alami bersifat kontinu dan analog, sinyal-sinyal tersebut dapat direpresentasikan
secara terpisah dan praktis untuk dianggap 'alami' oleh seorang pengamat manusia. Representasi sinyal
diskrit atau digital memungkinkan pelestarian dan pemrosesan informasi yang lebih baik dan
memungkinkan realisasi batas kapasitas telekomunikasi teoretis. Selain itu, dengan mempertimbangkan
kemampuan persepsi kami yang terbatas, representasi dan pemrosesan digital memungkinkan
representasi sinyal analog yang efisien namun dapat diterima. Ini adalah beberapa prinsip di balik
transformasi digital masyarakat kita baru-baru ini.
Tinjau Pertanyaan
1. Menurut Anda mengapa laju pengambilan sampel dikenal sebagai laju Nyquist meskipun ada kontribusi dari
banyak ilmuwan sebelum perumusannya?
2. Apa itu sampling rate dan bagaimana cara menghitungnya?
3. Apa yang dimaksud dengan tingkat kuantisasi dan faktor-faktor apa saja yang dipertimbangkan dalam penentuannya?
4. Bagaimana transmisi digital dibandingkan dengan analog? Mengapa digital menjadi populer?
5. Mengapa terjadi kesalahan dalam komunikasi digital?
6. Hitung sampling rate untuk musik audio, mengingat telinga kita bisa mendeteksi suara hingga 20 kHz.
Apa yang Anda lakukan jika musik memiliki komponen frekuensi hingga 25 kHz?
7. Bagaimana teori informasi diterapkan untuk layanan yang ditujukan untuk subjek manusia?
8. Apa perbedaan antara pengkodean bentuk gelombang dan pengkodean sintesis?
9. Apa manfaat bisnis dari kode AMR? Mengapa ada 8 tarif kode yang berbeda?
10. Apa itu kode AMR-WB dan mengapa dikembangkan? Apa aplikasi mereka?
11. Apa keuntungan bisnis menggunakan Skype untuk panggilan telepon jarak jauh? Bagaimana
teknologi pengkodean sumber memungkinkan ini?
12. Apa saja parameter dalam menentukan voice coder yang akan digunakan untuk suatu aplikasi?
13. Bagaimana ukuran dan kapasitas CD diputuskan?
14. Bagaimana sintesis audio dikodekan? Apa bedanya dengan pengkodean sintesis suara?
15. Berikan contoh source coder audio lossless dan lossy? Apa aplikasi untuk masing-masing?
16. Bagaimana MP3 dikembangkan dan perbedaan bisnis apa yang dihasilkannya?
17. Apa dampak pengambilan keputusan kebijakan internasional dalam standar pengkodean video? Mengapa
pemerintah nasional menyerahkan pengambilan keputusan kepada badan-badan ini?
18. Mengapa warna piksel tetangga dan korelasi lumina penting dalam pengkodean gambar?
19. Bagaimana teknik kompresi gambar lossless bekerja?
20. Bagaimana teknik kompresi gambar lossy bekerja?
21. Bagaimana teori informasi berguna dalam pengkodean gambar dan video?
Referensi
[1] Luke, HD (1999) Asal Usul Teorema Pengambilan Sampel. Majalah Komunikasi IEEE.
[2] Penambang, WM (1903) Telepon Multipleks. Paten AS 745 734 (26 Februari).
[3] Antoniou, A. (2007) Tentang Akar Pemrosesan Sinyal Digital—Bagian II. Sirkuit IEEE dan Majalah Sistem
(Kuartal Keempat).
[4] Moore, GE (1965) Menjejalkan Lebih Banyak Komponen ke Sirkuit Terpadu. Majalah Elektronik.
[5] Decina, M. dan Scace, E. (1986) Rekomendasi CCITT pada ISDN: Sebuah Tinjauan. Jurnal IEEE tentang Area Terpilih
dalam Komunikasi.
[6] http://www.data-compression.com/speech.html, diakses 21 Agustus 2015.
[7] Seri ITU G untuk AMR.
[8] ITU. Rekomendasi ITU-T P.862. http://www.itu.int/rec/T-REC-P.862, diakses 21 Agustus 2015.
[9] Tanaka, I. dan Koshimizu, K. (2012) Ikhtisar Profil GSMA VoLTE. Jurnal Teknis Docomo NTT.
[10] Holma, H. dan Toskala, A. (2005) WCDMA untuk UMTS: HSPA Evolution and LTE, 3rd edition, John Wiley &
Sons, Ltd.
[11] ITU. R-Model dalam Rekomendasi ITU G-107. http://www.itu.int/ITU‐T/recommendations/rec.aspx?id=9730, diakses
21 Agustus 2015.
[12] http://blogs.skype.com/2013/08/28/skype-celebrates-a-decade-of-meaningful-conversations/, diakses 21 Agustus
2015.
[13] ITU. Rekomendasi ITU-T H.323. http://www.itu.int/rec/T-REC-H.323/en/, diakses 21 Agustus 2015.
[14] http://www.telegeography.com/press/press-releases/2013/02/13/the-bell-tolls-for-telcos/index.html, diakses 21
Agustus 2015.
[15] Intip, HB (2010) Munculnya Compact Disc. Majalah Komunikasi IEEE (Januari).
[16] https://xiph.org/flac/comparison.html, diakses 21 Agustus 2015.
[17] Watanabe, K. (2008-2009) Metode Pengukuran Kualitas Audio Perseptual Objektif. Teknologi Siaran no. 35.
[18] http://en.wikipedia.org/wiki/Lossy_compression#Audio, diakses 21 Agustus 2015.

[19] http://msdn.microsoft.com/en‐us/library/windows/desktop/gg153556(v=vs.85).aspx, diakses 21 Agustus 2015.
[20] Yayasan Xiph.Org. (2015) Spesifikasi Vorbis I. http://www.xiph.org/vorbis/doc/Vorbis_I_spec.html,
diakses 21 Agustus 2015.
[21] http://mpeg.chiariglione.org/, diakses 21 Agustus 2015.

[22] MacOSForge.org. Kodek Audio Apple Lossless. http://alac.macosforge.org/, diakses 21 Agustus 2015.
[23] http://inventors.about.com/od/mstartinventions/a/MPThree.htm, diakses 21 Agustus 2015.
[24] http://dvd‐hq.info/data_compression.php, diakses 21 Agustus 2015.
[25] Khayam, SA (2003) Diskrit Cosinus Transform (DCT): Teori dan Aplikasi. http://www.lokminglui. com/
DCT_TR802.pdf, diakses 21 Agustus 2015.
[26] http://en.wikipedia.org/wiki/JPEG#mediaviewer/File:JPEG_example_JPG_RIP_100.jpg, diakses 21 Agustus
2015.
[27] ITU. Seri ITU-TH: Sistem Audiovisual dan Multimedia. http://www.itu.int/net/itu‐t/sigdb/spevideo/ Hseries‐
s.htm, diakses 21 Agustus 2015.

9781119114956.ch5 (1) .En - Id

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

9781119114956.ch5 (1) .En - Id

Diunggah oleh

Hak Cipta:

Format Tersedia

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

● Bagaimana sinyal analog diubah menjadi sinyal digital?

● Prinsip dan teknik untuk konversi sinyal analog ke digital

Teknologi dan Manajemen Telekomunikasi Broadband, Edisi pertama. Riaz Esmailzadeh. ©

1 Catatan Sejarah ini didasarkan pada makalah Lukas [1].

Sejumlah teknik pengkodean sumber ada, diklasifikasikan berdasarkan efisiensinya vis-à-vis

Data Pesan Pesan

Gambar 5.2 Diagram blok telekomunikasi

Gambar 5.3 Grafik suhu untuk Adelaide

Tabel 5.2 Tabel suhu – diambil sampelnya setiap 2 jam

Waktu 1 detik Waktu 1 detik

Waktu 1 detik Waktu 1 detik

Waktu 1 detik Waktu 1 detik

Gambar 5.6 Bentuk gelombang analog ke digital menggunakan laju sampling 10 Hz

Gambar 5.7 Kuantisasi ke dalam tingkat biner

Elektronik Menukarkan Menukarkan

Kebisingan Kebisingan Kebisingan

Gambar 5.8 Kebisingan ditambahkan pada setiap tahap panggilan telepon

Gambar 5.9 Dampak kumulatif kebisingan

Tingkat Kesalahan Bit

Keuntungan Bisnis A sampai D

Gambar 5.13 Kurva BER khas

Studi Kasus 5.1: Jaringan Digital Layanan Terpadu

Pertanyaan Studi Kasus

● Mengapa standar ISDN dikembangkan?

Pengkodean Sumber Data

Pengodean Sumber Suara

Gambar 5.14 Kuantisasi pengkodean suara logaritmik

Modulasi Kode Pulsa

Modulasi Kode Pulsa Diferensial Adaptif

Gambar 5.15 Pengkodean diferensial

Ke kata kode berikutnya

Gambar 5.16 Pengkodean analisis suara

Kode suara Aplikasi Kecepatan bit (kbps)

Perbandingan Teknik Pengodean Suara

Tabel 5.4 Kualitas persepsi sejumlah codec suara [10]

AMR pita sempit AMR pita lebar

Tingkat (kbps) MOS Tingkat (kbps) MOS

4.75 2.8 6.60 3.2

Studi Kasus 5.2: Skype

dan AMR-WB (16 kbps). Pengkodean sumber suara

dalam mempertahankan basis pelanggan Skype dan

out/Skype-in. Skype dan perusahaan sejenis seperti Viber,

Pertanyaan Studi Kasus

● Mengapa penyerapan pasar VoIP lambat?

Lalu lintas telepon internasional

Codec Audio Tanpa Rugi Gratis

Tabel 5.5 Standar kompresi lossless

Codec audio tanpa rugi Aplikasi Kecepatan bit Standar

CD Penyimpanan/pemutaran 1411 kbps IEC 60908

Tabel 5.6 Standar kompresi lossy

Codec audio yang hilang Aplikasi Kecepatan bit (kbps) Standar

MP3 (MPEG-1 Penyimpanan/pemutaran/ 32–320 ISO/IEC 11172-3 ISO/

Studi Kasus 5.3: iTunes

Apple kini menjadi pemain utama dalam ekosistem komunikasi

mengorbankan beberapa penurunan kualitas. Pengkodean sumber

Pertanyaan studi kasus

● Mengapa standar MP3 dikembangkan?

Gambar 5.18 Piksel yang membentuk gambar

Pengodean Gambar Tanpa Rugi

Pengodean Gambar Rugi

Gambar 5.20 Gambar skala abu-abu 8 × 8 piksel. Sumber: https://commons.wikimedia.org/wiki/File:

SayaBBPBBPBB SayaBBPBBPBB Saya