Anda di halaman 1dari 24

Anlisis acstico

Hay que tener conocimiento


El anlisis acstico es una
de cules son los parmetros
forma til para explorar la
que vamos a utilizar y de su
voz
significado.

Lo ms importante es que la
persona que use el anlisis Esto nos obliga, como paso
acstico como forma de previo, a algo necesario:
exploracin vocal sepa lo que saber si hay o no un
quiere hacer y lo que est problema vocal.
haciendo
Ventajas
Cuantificarloscomponentesvocales
causantesdeladisfona,conloque
Identificarloscomponentesvocales puedeestablecerse una estadificacin de
causantesdeladisfona,para la disfona. En este sentido, al anlisis
aumentarlaprecisin del diagnstico. acstico se le ha querido dar una
significacin semejante a la de la
audiometra en la patologa del odo.

Sencillezenlautilizacindelos
equipos,poniendoalalcancedeuna
Valorarlaevolucindeladisfona granmayorade personas los recursos
conlostratamientos,detodotipo, necesarios para hacer anlisis acsticos
aplicadostantoa corto como a largo vocales. A esto hay que aadir la
plazo. Esta valoracin nos permitir universalizacin del ordenador personal,
poder hacer cambios en el tratamiento. que facilita enormemente el clculo de
los parmetros que antes haba que
medir a mano.
Desventajas

Laemisinvocalporpartedel
pacientepuedenotenersiempre
Inutilidadsinoserealizaconun
lasmismascaractersticas, y por ello es
abordajeclnicoglobal.Lapropia
posible encontrar diferencias incluso
facilidaddelanlisis acstico puede
entre dos exploraciones consecutivas.
llegar a crear confusin cuando no se
sta es la principal diferencia con la
sabe matizar e interpretar los hallazgos.
audiometra, en la cual el paciente tiene
que reconocer una seal, no emitirla.
Mtodo de obtencin
La seal microfnica consiste en la recogida
Es muy importante que el lugar donde se
de la seal fsica de la presin sonora
realice la captura de la seal este
emitida desde los labios por un micrfono,
insonorizado, o al menos estar aislado, con
su conversin en una seal elctrica
unas condiciones semejantes a las de la
analgica y su posterior digitalizacin
audiometra. Hemos de tener en cuenta no
mediante una tarjeta de sonido digital a la
slo el ruido ambiental
que se conecta el micrfono.

La seal vocal que suele usarse de muestra


consiste en la emisin de una vocal
Una vez que las circunstancias del ambiente sostenida, generalmente la /a/, con un tono
son idneas, hemos de procurar que la y una intensidad confortables. Hay que
grabacin se realice de una manera capturar una fonacin estable de al menos
estndar, con el fin de minimizar las dos segundos, para lo cual se recomienda
diferencias entre exploraciones. hacer grabaciones de tres segundos. En caso
de grabar una frase, sta debe ser
fonticamente compensada.
Parmetros del anlisis acstico

Parmetrosquecaracterizanlafuentedeexcitacin
vocal:la frecuenciafundamental o tono, la amplitud o
intensidad, y el espectro (relacin entre la intensidad y la
frecuencia).
Parmetrosqueestudianeltractovocal:elruido
espectral,lafrecuenciadelosformantesy la envolvente
del espectro.
Parmetros de Frecuencia

Representa el nmero de veces que las


Corresponde al componente frecuencia La laringe humana es capaz de producir una
cuerdas vocales se abren y cierran por
(armnico) ms bajo de la seal amplia gama de frecuencias (rango vocal),
segundo, y se expresa en ciclos por segundo
microfnica. que vara en funcin de la edad y del sexo.
o Hz.

La percepcin psicoacstica del hecho fsico


de la frecuencia es el tono vocal. El tono
percibido no depende nicamente de la F0,
Los valores normales son de unos 125 Hz ya que otros parmetros, como la
para el hombre, 250 Hz para la mujer y 350 intensidad o la composicin espectral,
Hz en la infancia. tambin desempean un papel, aunque
secundario. Cuando aumenta la F0 el tono
se hace ms agudo, y cuando disminuye se
hace ms grave.
Alteraciones en frecuencia
La F0 puede variarse de forma
La perturbacin de la frecuencia voluntaria cambiando la
(comnmente denominada entonacin de una frase, pero
jitter)se refiere a las variaciones esa variacin no es la que
involuntarias de la F0 que estudia el jitter: Este mide la
suceden de un ciclo a otro. variacin de la F0 entre un ciclo
vocal y el siguiente

Las causas de estas


perturbaciones son diversas y
Representa tambin una medida
siempre hay que tenerlas en
de estabilidad de la fonacin.
mente al interpretar los
resultados.
Neurolgicas:porfaltadecontroldelsistemanerviososobre
losmsculosvocales.
Aerodinmicas:cuandohayundefectodecierreglticoque
puedeprovocarunescape de aire que haga vibrar irregularmente
las cuerdas.
Mecnicas:cuandohayasimetrasenlamasadelascuerdaso
cambiosenlaspropiedades biomecnicas de stas se produce una
gran alteracin en el jitter.
Jitter relativo: mide la variacin interciclos en
Jitter absoluto: mide la variacin interciclos en
porcentaje, con lo cual no se ve afectado por la
unidades de tiempo. Se ve afectado por la F0
F0 y no hay diferencias segn el sexo. Se
del individuo y, por tanto, hay claras diferencias
expresa en porcentaje porque es el resultado
segn el sexo.
de un cociente, y su media es de 0,974 %.

RAP(relative average perturbation):se promedia


la diferencia de tres en tres ciclos, con lo cual se
consigue obviar los fenmenos de variacin del PPQ(pitch period perturbation quotient):mide
tono que se producen de manera peridica. la variabilidad de la frecuencia fundamental
Presenta menos variabilidad que los analizando grupos de cinco ciclos, y por tanto
parmetros previos. Es la medida que tiene una se suavizan an ms las diferencias. Su media
mayor concordancia con el concepto de jitter. es de 0,571 %.
Su media es de 0,59 %, y al igual que el jitter
relativo no muestra diferencias segn el sexo.
Parmetros de intensidad

La intensidad se define como la


Su valor depende fundamentalmente
amplitud de la variacin de la presin
de la amplitud de la vibracin de las
sonora producida al transmitirse la voz
cuerdas vocales y de la presin
en el medio areo, y se expresa en
subgltica.
decibelios (dB).

Al igual que la frecuencia fundamental,


Cuando estos factores aumentan,
la intensidad vara de forma
tambin aumenta la intensidad de la
involuntaria durante el habla, pero
voz. Los factores que inducen una
esta variacin es normal y til para la
disminucin de la intensidad incluyen
correcta interpretacin de los
un soporte respiratorio inadecuado, un
mensajes que se quiere hacer llegar al
cierre gltico incompleto y unas
interlocutor, y no es ste el mbito del
cuerdas vocales poco flexibles.
estudio de las perturbaciones.
Se determina, al igual que el
jitter, a partir de sonidos
La perturbacin de la amplitud
voclicos mantenidos sin
(shimmer)mide la variabilidad
variaciones voluntarias.
de la amplitud ciclo a ciclo.
Representa tambin una medida
de la estabilidad de la fonacin.

Una pequea variacin ciclo a


ciclo es normal, pero una
El shimmer se relaciona de
variabilidad excesiva indica una
modo inverso con la intensidad
posible patologa; sin embargo,
vocal (disminuye al aumentar la
al igual que el jitter, no ha
intensidad).
podido vincularse con una
afeccin determinada.
Shimmer absoluto: a diferencia del jitter,no presenta diferencias por sexo al no haber
diferencias en la intensidad entre ellos, pero s hay diferencias entre los distintos sujetos, por
lo que es un parmetro muy variable y sus valores de normalidad tienen un rango muy
amplio.

Shimmer relativo: compara ciclo a ciclo sus amplitudes. Se expresa en porcentaje y su valor
medio es de 7 %. No hay diferencias segn el sexo.

APQ(amplitude perturbation quotient)y sAPQ (smoothed APQ):promedian las diferencias


encontradas en grupos de 5 en 5 pulsos glticos y de 55 en 55, respectivamente.
Parmetros de ruido

El ruido espectral se muestra como puntos, con menor o mayor densidad, entre
los armnicos. En el espectrograma, especialmente en el de banda estrecha, en
lo primero que debemos fijarnos es en la agudeza con que se perfilan los
trazados horizontales de la F0 y los armnicos.

En las voces normales hay una gran riqueza de armnicos (negro) y escaso ruido
interarmnico (gris), lo cual refleja un buen cierre gltico. Por el contrario, en las
voces disfnicas, con predominio del componente areo y turbulencias, las lneas
de los armnicos estn mal delimitadas y hay mucho ruido entre ellas
HNR (harmonic to noise ratio) medio Mide la relacin entre el componente peridico que se repite a lo
largo del tiempo (armnicos) y el que aparece de manera anrquica y sin un patrn definido (ruido),
separndolos como si de dos ondas distintas se tratara y comparando posteriormente la intensidad de
ambas una respecto a la otra. Los valores observados presentan una media de 25,641.

NNE (normaliced noise energy) Trasforma en una distribucin normal los valores de la intensidad del
ruido encontrado en la muestra analizada. Presenta valores negativos, y los ms cercanos a cero son los
ms patolgicos.

NHR (noise to harmonic ratio) Es la media del cociente de la energa inarmnica entre 1.500 y 4.500 Hz
y la armnica entre 70 y 4.500 Hz. Selecciona las frecuencias en las cuales busca el componente
inarmnico. Se expresa en porcentaje y los valores obtenidos son de 0,126 %, sin diferencias entre
ambos sexos.
Oscilograma
El plano de proyeccin es el de Esto da lugar a una onda peridica
amplitud frente a tiempo. La con una forma modificada, pero
altura en cada instante de cada con el mismo periodo que la
punto en la figura proyectada es la frecuencia fundamental. El
suma de las elongaciones de cada periodo puede apreciarse por la
una de las tres sinusoides que la separacin temporal de los
componen (no la superposicin). mximos.

Esta grfica permite observar, por


ejemplo en el caso de una vocal,
el periodo glotal y por tanto el
tono (frecuencia de la vibracin
glotal) y la amplitud de la seal
(valor mximo), entre otras
caractersticas.
Espectrograma
Espectrograma (power spectrum):el plano de
proyeccin es el de amplitud frente a Una vez elegido el instante de la proyeccin, el
frecuencia. Las tres sinusoides proyectadas espectro de rayas obtenido corresponde slo a
sobre este plano aparecen como un conjunto de la seal promediada, que est incluida dentro
tres rayas verticales con sus correspondientes de un entorno de tiempo alrededor de ese
amplitudes en su correcta posicin, y instante, no de todo el tiempo transcurrido.
equidistantes en la escala de frecuencias.

Por tanto, el espectrograma nicamente tiene


sentido para intervalos reducidos de tiempo o
ventanas de anlisis de la seal. Este tipo de
representacin permite una visin, dentro de un
corto espacio de tiempo, del nmero y la
paridad de los armnicos, del perfil espectral y,
por tanto, del nmero y la posicin de las zonas
del espectro de mayor amplitud de los
armnicos, que definen a los formantes.
Grados segn Yanagihara

Grado I: Los componentes armnicos se mezclan con componentes de ruido, principalmente


en la regin de los formantes de las vocales

Grado II: Los componentes de ruido predominan sobre los armnicos del segundo formante.
Adems, hay ligeros componentes de ruido de alta frecuencia por encima de los 3 kHz.

Grado III: El segundo formante se remplaza en su totalidad por ruido. El componente de ruido
de alta frecuencia intensifica su energa y expande su rango

Grado IV: El primer formante pierde sus componentes peridicos y se observan componentes
de ruido. En las altas frecuencias se intensifica an ms el ruido.
Praat : Es un programa diseado inicialmente para proyectos de Se trata de un software que permite hacer anlisis
investigacin en voz. Se trata de uno de los programas ms completos acstico, sntesis articulatoria, procesamiento estadstico
que existen en la red. Es de libre distribucin, de cdigo abierto, de los datos, edicin y manipulacin de seales de audio.
multiplataforma y libre. Fue desarrollado en la Universidad de Otra de sus cualidades es que el usuario puede crear sus
Amsterdam por Paul Boersma y David Weenink en el ao 1992, y se
actualiza constantemente con mejoras implementadas por los autores, propias rutinas e incluso aadirlas a los mens del
algunas de ellas sugeridas por los usuarios. programa. Por tratarse de un programa especializado, sus
interfaces requieren cierto adiestramiento e informacin
terica. Admite los sistemas operativos Macintosh,
Windows, Linux, Free BSD, SGI, Solaris y HPUX. Slo est
disponible en ingls. Incluye un men de ayuda y un
tutorial de fcil lectura y muy prctico.
Anagraf
El mismo permite visualizar y cuantificar todas las caractersticas del habla. Tanto de los sonidos
percibidos como los no percibidos. Los sonidos no percibidos pueden contener medidas de
duracin, intensidad y frecuencia menores a los umbrales perceptuales o poseer diferencias
menores a los umbrales apenas perceptibles.
La cuantificacin de los sonidos se realiza en funcin del contexto, posicin en la palabra/oracin y
si posee acento o no. Las mediciones permiten realizar perfiles prototpicos con los cuales es
posible comparar las realizaciones no convencionales respecto del valor medio.

El anlisis permite adems obtener el espectro de largo plazo para evaluar la calidad vocal (voz
apagada vs. brillante), medir los ndices de perturbacin de la voz: Jitter1,Shimmer1 (ambos por
falta de control en la fonacin), relacin armnico ruido y grado de aprovechamiento de la
energa. La medicin del grado de fonacin desde la categora dura o tensa hasta la hiperelajada
se observa en los ataques vocales con o sin escape de aire y con o sin golpe gltico en el contorno
de energa. El sistema Anagraf permite la transcripcin y la manipulacin de los parmetros
prosdicos y la sntesis con los parmetros modificados.
Bibliografa
Cobeta I.,(2013), Patologa de la voz. Editorial Marge Mdica Book.,
Barcelona, Espaa