REPRESENTASI SUARA

REPRESENTASI DAN
KOMPRESI DATA SUARA

(AUDIO)
M4 - TEKNOLOGI MULTIMEDIA
APA ITU SUARA?
Suara adalah bunyi yang dapat didengar, yang memiliki gelombang tertentu. Suara juga
adalah pemampatan mekanis atau gelombang longitudinal yang merambat melalui
medium. Medium atau zat perantara ini dapat berupa zat cair, padat, gas. Jadi, gelombang
bunyi dapat merambat misalnya di dalam air, batu bara, atau udara.
Jenis suara di dalam Multimedia:

Pidato
Musik
Efek Suara
Paduan Suara
Bentuk Gelombang
FORMAT FILE AUDIO
Ada tiga kelompok utama dari format file audio:

Uncompressed format audio, seperti WAV, AIFF, AU atau raw header-less PCM.
Format dengan kompresi lossless, seperti FLAC, Audio (nama file ekstensi APE), shorten,
TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4
DST , Windows Media Audio, Lossless (WMA Lossless).
Format dengan lossy compression, seperti MP3, Vorbis, Musepack, AAC, ATRAC dan
lossy Windows Media Audio (WMA).
KARAKTERISTIK
GELOMBANG SUARA
Berikut adalah karaktersitik dari Gelombang
Suara:
Frekuensi
Tingkat di mana suara diukur
Jumlah siklus per detik atau Hertz (Hz)
Menentukan nada suara yang terdengar oleh
telinga kita
Nada tinggi suara → frekuensi yang lebih
tinggi, suara lebih jelas dan tajam Contoh lain bentuk Gelombang
KARAKTERISTIK GELOMBANG SUARA
Amplitudo: Analog to Digital Converter (ADC):
Sebuah ADC adalah sebuah alat yang mengubah sinyal
Intensitas sound atau kenyaringan
analog menjadi sinyal digital.
Intensitas sound atau kenyaringan Suatu sinyal analog merupakan nilai kontinu.
Selain itu, semua suara memiliki Hal ini dapat memiliki nilai tunggal pada skala terbatas.
durasi dan suara musik yang Sebuah sinyal digital adalah sebuah nilai diskrit.
Memiliki nilai terbatas (biasanya integer)
berurutan disebut irama.
Sebuah ADC disinkronisasikan ke beberapa jam.
Ini akan memonitor sinyal analog kontinu di tingkat
menetapkan dan mengubah apa yang dilihatnya ke nilai
diskrit pada saat tertentu dalam waktu.
Proses untuk mengkonversi analog ke suara digital
disebut Sampling. Gunakan PCM (Pulse Code
Modulation).
Ketika Anda menyajikan gelombang suara sebagai
angka, proses ini disebut digitalisasi dan hasilnya akan
menjadi digital audio.
KOMPRESI
AUDIO
Kompresi audio adalah salah satu bentuk kompresi data yang bertujuan untuk
mengecilkan ukuran file audio dengan metode :
Lossly compression format, adalah format auido dengan teknik kompresi
yang cukup kuat yang akan menekan besar file hingga ukuran yang cukup
kecil, namun kualitas audio yang mengalami penurunan akibat kehilangan
data-data dalam proses encodingnya. Contoh: *.MP3, *.WMA dan *.AAC.
Lossless compression format, merupakan format audio dengan teknik
kompresi yang cukup, sehingga besar file dapat ditekan namun dengan
penurunan sedikit kualitas audio pula. Contoh: *.FLAC.
KENDALA KOMPRESI AUDIO
Kompresi dilakukan pada saat Losless audio codec tidak Lossy audio codec
pembuatan file audio/video dan mempunyai masalah penggunaannya
pada saat distribusi file dalam kualitas suara, difokuskan pada :
audio/video tersebut. penggunaannya dapat Kualitas audio
difokuskan pada : Faktor kompresi
Kendala kompresi audio: Kecepatan kompresi dan Kecepatan kompresi dan
Perkembangan sound dekompresi. dekompresi.
recording yang cepat dan Derajat kompresi. Inherent latency of
beranekaragam. Dukungan hardware dan algorithm (penting bagi
Nilai dari audio sample software. real-time streaming).
berubah dengan cepat Dukungan hardware dan
software.
METODE KOMPRESI AUDIO
Metode Transformasi Metode Waktu

Menggunakan algoritma seperti MDCT Menggunakan LPC (Linier Predictive
(Modified Discreate Cosine Transform) Coding) yaitu digunakan untuk speech
untuk mengkonversikan gelombang (pidato), dimana LPC akan menyesuaikan
bunyi ke dalam sinyal digital agar tetap sinyal data pada suara manusia,
dapat didengar oleh manusia (20 Hz kemudian mengirimkannya ke
s/d 20kHz) , yaitu menjadi frekuensi 2 pendengar. Jadi seperti layaknya
s/d 4kHz dan 96 dB. komputer yang berbicara dengan bahasa
manusia dengan kecepatan 2,4 kbps.
TEKNIK KOMPRESI AUDIO DENGAN
FORMAT MPEG (MOVING PICTURE
EXPERT GROUP)
MPEG-1 menggunakan bandwidth 1,5 Mbits/sec untuk audio dan video, dimana 1,2
Mbits/sec digunakan untuk video sedangkan 0,3 Mbits/sec digunakan untuk audio. Nilai
0,3 Mbits/sec ini lebih kecil dibandingkan dengan bandwidth yang dibutuhkan oleh CD
Audio yang tidak terkompres sebesar 44100 samples/sec x 16 bits/sample * 2 channel >
1,4 Mbits/sec yang hanya terdiri dari suara saja.
Untuk ratio kompresi 6:1 untuk 16 bit stereo dengan frekuensi 48kHz dan bitrate 256 kbps
CBR akan menghasilkan ukuran file terkompresi kira-kira 12.763 KB, sedangkan ukuran
file tidak terkompresinya adalah 75.576 KB.
MPEG-1 audio mendukung frekuensi dari 8kHz, 11kHz, 12kHz, 16kHz, 22kHz, 24 kHz, 32
kHz, 44kHz, dan 48 kHz. Juga mampu bekerja pada mode mono (single audio channel),
dual audio channel, stereo, dan joint-stereo Algoritma MPEG Audio.
EXPERT GROUP)
Menggunakan filter untuk membagi sinyal audio: misalnya pada 48 kHz, suara dibagi
menjadi 32 subband frekuensi.
Memberikan pembatas pada masing-masing frekuensi yang telah dibagi-bagi, jika tidak
akan terjadi intermodulasi (tabrakan frekuensi).
Jika sinyal suara terlalu rendah, maka tidak dilakukan encode pada sinyal suara tersebut.
Diberikan bit parity yang digunakan untuk mengecek apakah data tersebut rusak atau
tidak (yang mungkin disebabkan oleh gangguan / noise), apabila rusak, maka bit tersebut
akan digantikan bit yang jenisnya sama dengan bit terdekatnya.
EXPERT GROUP)
Teknik Kompresi Audio

KOMPRESI Asal-usul MP3 dimulai dari penelitian IIS-FHG (Institut Integriette
Schaltungen-Fraunhofer Gesellschaft), sebuah lembaga
AUDIO MP3 penelitian terapan di Munich, Jerman dalam penelitian coding
audio perceptual.
Penelitian tersebut menghasilkan suatu algoritma yang menjadi

standard sebagai ISO-MPEG Audio Layer-3 (MP3).
Tabel Kemampuan Kompresi

Header
FILE MP3 berfungsi sebagai tanda pengenal bagi file MP3 agar
dapat dibaca oleh MP3 player yang berukuran 4 byte
TERDIRI Beberapa karakteristik yang dibaca komputer adalah bit
ATAS 2 ID, bit layer, bit sampling frequency dan bit mode.
BAGIAN
DATA
Data Audio
berisi data file mp3.
Header
File MP3
BEBERAPA KARAKTERISTIK DARI MP3
MEMANFAATKAN KELEMAHAN
PENDENGARAN MANUSIA.
1. Model psikoakustik
Model psikoakustik adalah model yang menggambarkan karakteristik
pendengaran manusia.
Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi

20 Hz s/d 20 kHz, dimana suara yang memiliki frekuensi yang berada di bawah
ambang batas ini tidak dapat didengar oleh manusia, sehingga suara seperti
itu tidak perlu dikodekan.
2. Auditory masking
Manusia tidak mampu mendengarkan suara pada frekuensi tertentu dengan
amplitudo tertentu jika pada frekuensi di dekatnya terdapat suara dengan amplitudo
yang jauh lebih tinggi.
Grafik Frekuensi MP3

3. Critical band
Critical band merupakan daerah frekuensi tertentu dimana pendengaran manusia
lebih peka pada frekuensi-frekuensi rendah, sehingga alokasi bit dan alokasi sub-
band pada filter critical band lebih banyak dibandingkan frekuensi lebih tinggi.
Critical Band Width

4. Joint stereo
Terkadang dual channel stereo mengirimkan informasi yang sama. Dengan
menggunakan joint stereo, informasi yang sama ini cukup ditempatkan dalam salah
satu channel saja dan ditambah dengan informasi tertentu. Dengan teknik ini bitrate
dapat diperkecil.
BEBERAPA PERSYARATAN DARI
SUATU ENCODER/DECODER MP3
Ukuran file terkompresi harus

sekecil mungkin.
Kualitas suara file yang telah
terkompresi haruslah sedekat
mungkin dengan file asli yang
belum dikompresi.
Tingkat kesulitan rendah, sehingga
dapat direalisasikan dengan
aplikasi yang mudah dibuat dan
perangkat keras yang ‘sederhana’
dengan konsumsi daya yang
rendah.
PENJELASAN MPEG/AUDIO ENCODER
Filter Bank
kumpulan filter yang berfungsi memfilter masukan pada frekuensi tertentu, sesuai
dengan critical band yang telah didefinisikan. Filter yang dipakai adalah gabungan dari
filter bank polyphase dan Modified Discrete Cosine Transform (MDCT).
Perceptual Model, dapat menggunakan filter bank terpisah atau penggabungan antara
perhitungan nilai energi dan filter bank utama. Keluaran model ini adalah nilai masking
treshold. Apabila noise berada dibawah masking treshold, maka hasil kompresi tidak
akan dapat dibedakan dari sinyal aslinya.
PENJELASAN MPEG/AUDIO ENCODER
Quantization/Coding
proses kuantisasi setelah sinyal disampling. Proses ini dilakukan oleh power-law
quantizer, yang memiliki sifat mengkodekan amplitudo besar dengan ketepatan rendah,
dan dimasukkannya proses noise shaping. Setelah itu nilai yang telah dikuantisasi
dikodekan menggunakan Huffman Coding.
Encoding Bitstream
tahap terakhir dimana bit-bit hasil pengkodean sampling sinyal disusun menjadi sebuah
bitstream.
FORMAT AUDIO
WMA
WMA (Windows Media Audio) adalah format yang ditawarkan oleh Microsoft. Format ini di desain
khusus untuk digunakan pada Windows Media Player yang ada pada sistem operasi windows.
Kelebihan
File WMA bisa dijalankan pada media player lain juga walaupun berada pada sistem operasi yang lain.
Sangat disukai vendor musik online karena dukungannya terhadap Digital Rights Management (DRM). DRM
(Digital Rights Management ) adalah fitur yang mendukung pencegahan terhadap pembajakan musik.
Memiliki kualitas musik lebih baik dibandingkan MP3 dan AAC.
Format WMA cukup populer dan didukung oleh piranti keras dan piranti lunak.
Kekurangan
File wma memiliki ukuran yang cukup besar karena teknik kompresi kurang dilakukan dengan maksimal.
Format audio wma biasanya tidak digunakan di internet karena ukuran file yang besar.
FORMAT AUDIO
CD
Adalah proses mengubah amplitudo gelombang bunyi ke dalam waktu interval tertentu (disebut
juga sampling) sehingga menghasilkan representasi digital dari suara PRESENTASI SUARA.
Kelebihan
File dengan format .cda ini dapat langsung dijalankan dengan melalui CD-R.
Kekurangan
File .cda sendiri tidak mempunyai informasi kode modulasi apapun sehingga jika dicopy ke harddisk, file
tersebut akan menjadi tidak dapat di-play atau dimainkan.
Dibutuhkan software khusus untuk mengubah dari format .cda menjadi format lain yang dapat disimpan di
computer.
FORMAT AUDIO
Format Advanced Audio Coding (AAC)
AAC adalah singkatan dari Advanced Audio Coding. Format ini merupakan bagian standar Motion
Picture Experts Group (MPEG), sejak standar MPEG-2 diberlakukan pada tahun 1997. Sample rate
yang ditawarkan sampai 96 KHz dua kali MP3.
Cara Kerja
Bagian-bagian sinyal yang tidak relevan dibuang.
Menghilangkan bagian-bagian sinyal yang redundan.
Dilakukan proses MDCT (Modified Discret Cosine Transform) berdasarkan tingkat kompleksitas sinyal.
Adanya penambahan Internal Error Connection.
Kemudian sinyal disimpan atau dipancarkan.
FORMAT AUDIO
Format Advanced Audio Coding (AAC)
Kelebihan
Sample ratenya antara 8 Hz – 96 kHz.
Memiliki 48 channel.
Suara lebih bagus untuk kualitas bit yang rendah (dibawah 16 Hz).
AAC mampu memperdengarkan kualitas suara yang lebih baik ketimbang Mp3.
Kekurangan
File yang sudah dikompres tidak bisa di kembalikan ke bentuk awal, karena ada beberapa data yang hilang.
Lisensi AAC tidak gratis.
FORMAT AUDIO
Format Waveform Audio (WAV)
WAV merupakan format file audio yang dikembangkan oleh Microsoft dan IBM sebagai standar untuk
menyimpan file audio pada PC, dengan menggunakan coding PCM (Pulse Code Modulation. File WAV adalah file
audio yang tidak terkompres sehingga seluruh sampel audio disimpan semuanya di media penyimpanan dalam
bentuk digital. Karena ukurannya yang besar, file WAV jarang digunakan sebagai file audio di Internet.
Kelebihan
Suara bagus, karena tidak dikompres.
format WAV mudah untuk diubah dan dikompresi ke format MP3 atau lainnya jika diperlukan.
Mampu dimainkan pada semua operasi seperti Windows atau Mac, serta browser populer.
Format WAV banyak digunakan oleh handphone, sehingga popularitas hampir menyamai file MP3
Kekurangan
Ukuran memori Besar, sehingga memakan storeage hadisk.
Susah dishare melalui internet karena ukurannya yang besar.
FORMAT AUDIO
Format Audio Interchange File Format (AIFF)
File AIFF merupakan format file audio standar yang digunakan untuk menyimpan data suara
untuk PC dan perangkat audio elektronik lainnya, yang dikembangkan oleh Apple pada tahun
1988. Standar dari file AIFF adalah uncompressed code pulse-modulation (PCM), namun juga ada
varian terkompresi yang dikenal sebagai AIFF AIFF-C atau aifc, dengan berbagai kompresi codec.
Audio Interchange File Format [.AIF] - Merupakan format standar Macintosh. - Software
pendukung: Apple QuickTime Audio CD [.cda] - Format untuk mendengarkan CD Audio - CD Audio
stereo berkualitas sama dengan PCM/WAV yang memiliki sampling rate 44100 Hz, 2 Channel
(stereo) pada 16 bit. - Durasi = 75 menit dan dynamic range = 95 dB.
FORMAT AUDIO
Format Audio Interchange File Format (AIFF)
Kelebihan
Memiliki suara yang bagus.
Kekurangan
tidak bisa diputar pada windows karena product aiff hanya mendukung untk MAC OS.
memiliki ukuran yang cukup besar sehingga format aiff jarang digunakan pada internet.
FORMAT AUDIO
Format MPEG Audio Layer 3 (MP3)
Pada awalnya, format MP3 ini dikembangkan oleh seorang Jerman bernama Karlheinz
Brandenburg, memakai pengodean Pulse Code Modulation (PCM). Prinsip yang dipergunakan
oleh MP3 adalah mengurangi jumlah bit yang diperlukan dengan menggunakan model
psychoacoustic untuk menghilangkan komponen-komponen suara yang tidak terdengar oleh
manusia – sehingga adapat digolongkan file audio dengan kompresi lossy.
Pada tahun 1991, file MP3 distandarisasi dan tahun 1994 hingga akhir tahun 2000, popularitas
dari MP3 semakin meningkat dengan semakin mudahnya akses Internet. Munculnya software
untuk menjalankan file MP3 seperti Winamp di tahun 1997 yang dikembangkan oleh Nullsoft,
dan player console untuk Linux, mp123, juga membuat file MP3 semakin digemari.
FORMAT AUDIO
Format MPEG Audio Layer 3 (MP3)
Kelebihan
Merupakan format audio yang sering digunakan yang biasa digunakan sebagai output file audio.
MP3 memiliki kapasitas yang lumayan kecil.
Kekurangan
Bit rate terbatas, maksimum 320 kbit/s (beberapa encoder dapat menghasilkan bit rate yang lebih tinggi, tetapi
sangat sedikit dukungan untuk mp3-mp3 tersebut yang memiliki bit rate tinggi).
Resolusi waktu yang digunakan mp3 dapat menjadi terlalu rendah untuk sinyal-sinyal suara yang sangat
transient, sehingga dapat menyebabkan noise.
Resolusi frekuensi terbatasi oleh ukuran window yang panjang kecil, mengurangi efisiensi coding.
Tidak ada scale factor band untuk frekuensi di atas 15,5 atau 15,8 kHz.
Mode jointstereo dilakukan pada basis per frame.
Delay bagi encoder/decoder tidak didefinisikan, sehingga tidak ada dorongan untuk gapless playback
(pemutaran audio tanpa gap). Tetapi, beberapa encoder seperti LAME, dapat menambahkan metadata
tambahan yang memberikan informasi kepada MP3 player untuk mengatasi hal ini.
FORMAT AUDIO
Cara kerja MP3
Dalam sebuah MP3 Player ada beberapa komponen yang sangat penting. Dua di antaranya
adalah codec, firmware, serta converter. Converter tugasnya adalah mengonversi data digital
menjadi analog atau sebaliknya mengonversi sinyal analog menjadi data digital yang terdiri dari
bilangan satu dan nol saja. Sedangkan codec adalah sebuah algoritma yang digunakan untuk
mengompresi maupun dekompresi file oleh converter itu sendiri.
Pada sebuah MP3 Player yang paling sederhana setidaknya terdapat satu converter, yaitu
mengonversi data digital menjadi analog dengan sebuah codec serta sebuah software atau
firmware yang mengaplikasikan codec pada converter. Player yang paling sederhana ini hanya
mampu memainkan file dengan satu format saja yaitu MP3, tanpa dapat melakukan aplikasi lain.
Sedangkan player yang mampu melakukan beberapa hal sekaligus. Misalnya merekam suara
juga, maka di dalamnya terdapat tambahan converter yang bertugas untuk mengonversi sinyal
analog menjadi digital. Bila player yang Anda miliki dapat memainkan lebih dari satu format itu
tandanya player tersebut memiliki lebih dari satu codec.
FORMAT AUDIO
Format MIDI
Merupakan standar yang dibuat oleh perusahaan alat-alat music elektronik berupa serangkaian
spesifikasi agar berbagai instrument dapat berkomunikasi. Dengan menggunakan format MIDI,
perangkat elektronik seperti keyboard dan computer dapat melakukan sinkronisasi satu sama
lain.
Interface MIDI terdiri dari 2 komponen yaitu :

Perangkat keras, merupakan hardware yang terhubung dengan peralatan (keyboar/computer).
Data format yang mengandung pengkodean informasi (spesifikasi instrument, awal/akhir nada, frekuensi dan
volume suara).
FORMAT AUDIO
Cara kerja MIDI
Cara kerja MIDI pada instrument keyboard sama seperti sebuah komputer. Personal Computer
(PC) yang anggotanya terdiri dari CPU, Monitor, dan keyboard controller yang terpisah dan
memiliki fungsinya masing-masing. Keyboard yang memiliki fungsi untuk mengendalikan apa
saja yang diinginkan oleh pengguna komputer, CPU berperan sabagai otak komputer yang
menerima perintah dari keyboard controller sedangkan layar monitor memiliki fungsi untuk
menampilkan hasil dari segala pekerjaan yang dilakukan oleh pengguna komputer.
Sama seperti sebuah komputer instrument keyboard digital memiliki beberapa controller (tuts),
sumber bunyi (sound modul/generatorl), amplifier yang berfungsi sebagai penguat suara, adan
speaker yang berfungsi untuk monitor bunyi. Bentuk fisik ketiganya terpisah dan dapat
berkomunikasi menggunakan jack MIDI. Antara keyboard dengan pengahasil suara dapat
berkomunikasi dengan menggunakan kabel MIDI. Wujud dari komunikasi tersebut berupa berupa
perintah MIDI yang dikirim dari suatu alat ke alat lainnya jadi, MIDI tidak mengeluarkan suara.
FORMAT AUDIO
Format MIDI
Kelebihan
Jenis instrumen musik bisa diubah sesukanya tanpa harus merekam ulang data lagu
Ukuran filenya sangat kecil (5 menit lagu full orchestra ukurannya bisa hanya 50 Kb)
Tidak membutuhkan komputer yang 'powerful'
Kekurangan
Kualitas suara instrumen musiknya tergantung dari soundcard/instrumen MIDI yang dipakai.
Efek MIDI yang tersedia sangat terbatas seperti reverb, chorus dsb
FORMAT AUDIO
Format OGG
Ogg adalah format multimedia gratisan yang dirancang untuk streaming dan penyimpanan yang
effiesien. Format ini dikembangkan oleh Xiph.org Foundation. Begitu pula Vorbis yang
merupakan codec audio gratisan. Vorbis biasanya dipasang bersama Ogg, sehingga muncullah
yang namanya Ogg Vorbis.
Kelebihan
Merupakan codec audio gratisan
Menghemat penyimpanan memori, karena kapasitas rendah.
Kekurangan
Masih sedikit player yang mendukung format ini.
Audio OGG juga telah melalui proses kompresi dengan menghilangkan file-file suara yang tidak diperlukan,
jadi suara yang dihasilkan tidak terlalu bagus.
AUDIO Fungsi
CONVERTER
Audio Converter digunakan untuk mengkonversi jenis file audio (MP3,
WAV, WMA, dll) ke jenis lain dari file audio. Jika tidak dapat mengedit
atau convert file audio tertentu maka sebagian software tidak dapat
membaca file audio tersebut.
CONTOH APLIKASI AUDIO
CONVERTER/EDITOR
Nero Wave
Audacity Free Studio WavePad OcenAudio
Editor
TAHANK YOU

REPRESENTASI SUARA

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

REPRESENTASI SUARA

Diunggah oleh

Hak Cipta:

Format Tersedia

REPRESENTASI DAN

KOMPRESI DATA SUARA

Jenis suara di dalam Multimedia:

Ada tiga kelompok utama dari format file audio:

Metode Transformasi Metode Waktu

Teknik Kompresi Audio

Penelitian tersebut menghasilkan suatu algoritma yang menjadi

Tabel Kemampuan Kompresi

Salah satu karakteristik pendengaran manusia adalah memiliki batas frekuensi

Grafik Frekuensi MP3

Critical Band Width

Ukuran file terkompresi harus

Interface MIDI terdiri dari 2 komponen yaitu :

Anda mungkin juga menyukai