p
ŝ(n) = ak s(n k ) (9)
k 1
s(n) Z Z Z Z
s(n-p)
a1 X a2 X a3 X ap X
ŝ(n)
Note que con este modelo se está prediciendo un dato de valor real en el tiempo n, usando
los valores de los pesos de los valores anteriores, esto de forma gráfica puede ser
representado tal cual se muestra en la figura 6.6. Por lo tanto, en su forma más simple, es
válido afirmar que se puede diseñar un filtro que puede estimar el dato en el tiempo n
usando solamente el dato anterior en n – 1, por lo que:
ŝ(n) = ae s(n 1) (10)
N 1
= (s(n) a s(n k ))
n 0
e
2
12)
Para obtener el coeficiente a e la condición es que la derivada parcial del error con respecto
a a k sea igual a cero (0), lo que nos lleva a tener a e como una relación de los valores de
autocorrelación de las muestras o función s(n). De ahí la necesidad de realizar el cálculo de
los coeficientes de autocorrelación de s(n) para ser utilizados en el cálculo de los
coeficientes de predicción.
N 1
dET2
0 2 ( s(n) ae s(n 1)) s(n 1) 13)
dae n 0
N 1
1
N
s(n)s(n 1) Css(1)
ae N 1
n 0
14)
1
s(n 1)s(n 1)
Css(0)
N n 0
Para generalizar los resultados para los p coeficientes de a e , es necesario primero tener en
cuenta que (11) y (13) nos muestran que el resultado del error es ortogonal al dato:
x(n)
-aex(n-1)
Realicemos el trabajo de una forma más general, para lo cual tendremos en cuenta a (8) y
(9), para hacer la predicción lineal para un modelo de pa e coeficientes y p valores
anteriores de datos con respecto al tiempo n.
p
ŝ(n) = ak s(n k ) (15)
k 1
Tal que:
p
s(n) = a k s(n k ) e(n) ŝ(n)+e(n) (16)
k 1
ŝ(n)
p
S ( z ) ak z k S ( z ) E ( z ) Ŝ(z) + E(z) (17)
k 1
E( z) E( z)
S(z) (18)
p
A( z )
1 a k z k
k 1
donde,
p
A( z ) 1 ak z k - (19)
k 1
La expresión (16) se realiza como un filtro AR tipo hacia delante (forward), según
mostramos a continuación:
e(n) s(n)
E(z) S(z)
+
ŝ(n)
Ŝ(z)
2
N 1 N 1
p N 1
ET2= e ( n) = ( s (n) ŝ(n)) s (n) a k s (n k )
2 2
(20)
n 0 n 0 n 0 k 1
Donde s(n) son los datos ventaneados.
dET2
0 , para k = 1, 2,…, p (21)
dak
a Css(i k ) Css(i) ,
k 1
k i = 1, 2,…, p (23)
Donde:
N 1 k
1
Css(k )
N
s ( n) s ( n k )
n 0
(24)
La ecuación (23) representa un conjunto de ecuaciones de orden p, las cuales pueden ser
resueltas usando técnicas matriciales:
Los argumentos de los coeficientes de autocorrelación son reales y pares, por lo que los
términos arriba y debajo de la diagonal son reemplazados por términos con argumentos
positivos. Ej. Css(-1) = Css(1). El resultado es una matriz simétrica tipo Toeplitz.
Una ecuación adicional para el cálculo de a k en función del error cuadrático total, error de
predicción, puede ser escrita:
p
ET2 Css(0)a0 ak Css(k ) (26)
k 1
Aquí se asume a 0 1 .
De nuevo se asume que los argumentos de los coeficientes de autocorrelación son positivos,
al igual que se consideró para los términos de la ecuación (25) y calculados según (24).
Con la consideración de adición de (26), y considerando a k = a p , la ecuación (25) se
extiende:
Cómo se explicó en el trabajo Azul 172 [ ], los términos a k de la ecuación (23) pueden ser
hallados mediante el algoritmo de Levinson Durbin, de forma recursiva.
Vector resultante: a p a 0 , a1 , , a p .
Algoritmo de Levinson-Durbin
m
cm 1
m
m1 m (1 cm2 1 )
a m1,m 0
for k 1 to m 1 do
ak ,m1 ak ,m cm1am1k ,m
end loop k
end loop m
Observe:
1. Los términos a0,n son unos (1).
2. Debido al trabajo de cálculo en cada iteración, los términos a#,n son diferentes. Ej.
a1,1 <> a1,2.
3. Los valores de las columnas son el resultado del vector a p de los coeficientes LPC
a p a 0 , a1 , , a p para cada iteración.
4. Una característica de los coeficientes LPC a p , es que son compatibles con la respuesta de
un filtro ‘todo polos’ y que al aplicar la respuesta del filtro al dominio de la frecuencia, se
acomoda exactamente a la envolvente de la respuesta de frecuencia del segmento de
señal de voz bajo análisis. A más coeficientes a p , más empieza a aproximarse la respuesta
espectral del filtro a la respuesta de f/2 coeficientes espectrales de la señal. Podemos
observar cómo los picos de frecuencias encontradas se corresponden, lo cual es de gran
ayuda para detectar su presencia en las señales.
Este modelo es llamado de predicción lineal (LPC) o auto recursivo (AR) [D. G. Childers, 2000,
Makhoul, 1975].
G
Ecuación de respuesta impulsiva p
1 ai
i 1
Esta característica de los coeficientes a p es la que posibilita su uso como vector de patrones para
el reconocimiento de un segmento de voz en lugar de los coeficientes de respuesta espectral de
Fourier H (w) , ya que con mucho menos coeficientes, se puede clasificar un segmento de voz.
En la figura 2, se muestra el comportamiento de la respuesta de frecuencia de la señal ventaneada
versus la respuesta en frecuencia para diferentes valores del vector a p . Obsérvese como la
envolvente de la respuesta | H ( w) | dB es aproximada en función de la cantidad de coeficientes
que se calculan. La respuesta para p=15, es la más recomendada en este caso ya que fs = 12800
Hz.
El diseño de un filtro todo polos es muy utilizado para el tratamiento de señales con ruido aditivo
gaussiano, a partir de la señal original se calculan los coeficientes a p y este filtro todo polos se le
aplica a la señal original, con ello quedan atenuadas las componentes de frecuencias que no
portan información relevante. Una práctica muy usada en análisis de señales sismográficas, para
detección de yacimientos de petróleo. También se usa en Neurofisiología, señales EEG, para
detectar los ritmos alfa, beta y delta.
‘0’
Cálculo de Cálculo de
|H(w))| H(w)dB
rceps=real(ifft(log(abs(fft(x)))))
Otra respuesta interesante para el caso de señales de voz, es que tomando los valores cepstrales que
se encuentran por debajo del pico a partir del origen y en una cantidad no muy alta, máximo 40
valores, al aplicarles a los coeficientes CPP el cálculo de H ( w) dB , se observa que la respuesta se
corresponde con la envolvente de la transformada H ( w) dB del segmento de señal bajo análisis, que
es la respuesta a la información inteligente que la señal de voz porta, producida por la modulación
en el tracto vocal; y si se toman los componentes después del pico, obtenemos como respuesta
H ( w) dB la parte de la señal de voz que se corresponde con la excitación del tracto vocal. Ambas
respuestas están juntas en la señal de voz, pero la más importante es la de la envolvente que es
donde está la información consciente del habla. De ahí que los coeficientes cepstrales iniciales
forman parte del repertorio de parámetros que se utilizan para el reconocimiento de voz [Furui,
1991]