Percepcija zvuka
Frekvencija (f) [Hz] visina: 20 log (f/fr) [Mel]
Jednake rastue korake frekvencije primeujemo kao sve manje i manje korake rasta visine zvuka ujno podruje 20 Hz do 20 kHz
Amplituda (A) [Pa] intenzitet (I) [W/m] glasnoa: 20 log (I/Ir) [dB] (Ir je granica ujnosti)
Jednake rastue korake amplitude (intenziteta) primeujemo kao sve manje i manje korake rasta jaine odnosno glasnoe zvuka
Izvori zvuka
Prirodni analogni
Ljudski glas (govor, pevanje) Glasanje ivotinja Muziki instrumenti Prirodni zvuci, npr. um mora, vetar, grmljavina, ...
Codec, coder + decoder = ureaj koji kodira i dekodira, odnosno komprimira i dekomprimira audio i video
3.Kodiranje
irokopojasni (AM radio, ISDN; videokonferencija; B = 7 kHz) Zvuk visokog kvaliteta (FM radio, televizija; B = 15 kHz) Zvuk visoke tanosti (CD kvalitet; B = 20 kHz)
Svaki kanal 20 Hz 20 kHz fu = 44,1 kHz, 16 bita po uzorku Kanal 30 Hz 15 kHz fu = 32 kHz, 16 bita po uzorku
Kanjenje
Algoritamsko kanjenje u koderu na izvoru koliko traje kodiranje Kod dekodiranja koliko traje dekodiranje? Sinhronizacija sa ostalim medijima u multimedijalnoj aplikaciji
Otpornost na gubitke
Posebno vano za prenos preko mree
Primena na ostale zvukove koji nisu govor, npr. fax i modemske signale, muziku Sloenost (hw/sw) Cena izvoenja
Objektivne metode
Novije objektivne metode temelje se na poznavanju ljudskog sluha raunaju izoblienje zvunog signala sa percepcijskim teinskim faktorima
Ideja: izoblienja koje uho vie uje imaju vei teinski faktor od onih manje primetnih ili neprimetnih
Maskiranje zvuka
Na osnovu poznavanja karakteristika govora tj. fiziolokih karakteristika govornog trakta, moe se napraviti model.
Parametri modela se raunaju na osnovu stvarnih uzoraka Prenose se samo parametri a govor se rekonstruie (sintetizuje) na osnovu modela U najnovijim koderima (npr. MPEG-4 SA) ova ideja se proiruje i na druge zvukove
Koderi govora
PCM
Uzorkovanje na 8 kHz, nelinearna kvantizacija po logaritamskoj karakteristici prema A-zakonu (Evropa) ili -zakonu (SAD, Japan) Prednosti:
Jednostavan Visok kvalitet (MOS 4.3) Malo kanjenje (1 uzorak)
Mane:
64 kbits/s nije malo Nema mehanizma za kontrolu i ispravljanje greaka (nije dobar kandidat za internet telefoniju)
ADPCM - karakteristike
Osim tipine brzine od 32 kbit/s, zavisno od broja bita za kodiranje greke, standard specifikuje i brzine 40 kbit/s (5 bita), 24 kbit/s (3 bita) i 16 kbit/s (2 bita) Prednosti:
Nema algoritamskog kanjenja Prenosi i modemske i fax signale bez degradacije
Mane:
Velika brzina (postoje bolja resenja na manjim brzinama) Osetljiv na gubitke
Primena: kuni beini telefon DECT (Digital European Cordless Telephony) standard Primena u irokopojasnom koderu: preporuka ITU-T G.722 Wideband (7 kHz) audio codec by Subband ADPCM (SB-ADPCM)
64 (56, 48) kbits/s ISDN aplikacije, telekonferencija
Postiu se vrlo male brzine Prvi koderi, npr. LPC-10 su bili loijeg kvaliteta, razvijeni za sisteme ograniene namene, npr. robotika, sigurna telefonija Noviji koderi, npr. CELP na malim brzinama postiu dobar kvalitet ali su raunski sloeniji
Pobuda: periodini impulsni signal Parametri modela: Frekvencija pobude Jaina pobude Zvuni/bezvuni glas Koeficijenti filtera Npr. LPC-10 na 2,4 kbit/s Frekvencija uzorkovanja: 8 kHz Daljina frejma: 180 uzoraka = 22,5 ms
Zvuni/bezvuni glas
AMDF nema jasnih minimuma za bezvune glasove Bezvuni glasovi: manja amplituda signala
Jaina pobude
Koren srednje vrednosti kvadrata signala
Koeficijenti filtera
Metoda najmanjeg kvadrata greke
Preporuk ITU-T G.723.1 Dual rate speech coder for multimedia communications trensmitting at 5.3 and 6.3 kbit/s
5,3 i 6,3 kbit/s, MOS 3,8 Pogodan za internet telefoniju
MPEG Audio
MPEG-1
Dva audio kanala Fu = 44,1 kHz (isto kao CD), 32 kHz, 48 kHz (isto kao DAT) Brzine od 8-16 kbit/s do 320 kbit/s MPEG Audio Layer I, II, III: nivoi kodiranja rastue sloenosti Koristi se percepcijsko kodiranje
MPEG-2
Isti osnovni koder kao MPEG-1 Pet audio kanala + niskofrekventni kanal Uz MPEG-1 jo i fu = 16 kHz, 22,05 kHz, 24 kHz AAC Advanced Audio Codec, dodat kasnije
MPEG-4
AAC, dva kodera za govor, strukturirani audio, ...