Evaluación Clínica de La Voz PDF

Librería Editorial
Licenciado en Fonoaudiología (Universidad Nacional de La Plata).

Doctorando en Fonoaudiología (Universidad del Museo Social
Argentino). Maestrando en Investigación Biomédica (Universidad
Nacional de La Plata).
Investigador del Grupo de Investigaciones en Técnica Vocal –
Laboratorio para el estudio de la experiencia musical (LEEM), Facultad
de Bellas Artes (UNLP). Miembro del comité editorial de la Revista
GITEV. Miembro de Pan-American Vocology Association (PAVA).
Miembro activo de la Sociedad Argentina de la Voz.
Coach Vocal. Especialista Integral en Terapia Vocal. Músico
Instrumentista (Conservatorio Superior de Música - Jujuy. Instituto
Superior de Música - Universidad Nacional de Tucumán). Director de
orquesta - Licenciatura en Música (Universidad Nacional de la Plata).
Autor del Libro "Fonoaudiología en Locución" (2015).
Consultorio privado dedicado a la tarea clínica y terapéutica vocal,
entrenamiento de la Voz Profesional, y rehabilitación de patologías
vocales.
Lic. en fonoaudiología (UNT), Doctoranda en Fonoaudiología UMSA,

Cantante Profesional, Coach Vocal. Especialista Integral en Terapia
Vocal. Certificada en 3 programas de rehabilitación vocal: LMRVT,
CSCFT, AIV. Miembro de Pan- American Vocology Association (PAVA).
Docente de la Facultad de Medicina de Univ. Nac. de Tuc. en la Cátedra
de Metodología de la Investigación. Profesora del Conservatorio
Provincial de Música de Tucumán en la Asignatura Anatomía y Fisiología
de la Voz – Canto Lírico. Docente Invitada en Licenciatura en
Fonoaudiología de UNT, en la cátedra de Diagnóstico y Terapéutica de
la Fonación.
Dedicada a la Clínica Vocal. Rehabilitación de patologías vocales, y
Entrenamiento de Voces Profesionales. Investigadora de UNT,
integrante de proyectos pertenecientes a la misma. Dirección y Jurado
evaluador de trabajos de investigación en fonoaudiología, medicina y
áreas afines.
Fonoaudióloga egresada de la Universidad del Valle. Especialista en
Foniatría - Universidad Católica de Manizales. Magíster en Ciencias
Biomédicas - Universidad del Valle. Doctoranda en Fonoaudiología –
Universidad Museo Social Argentino.
Docente e investigadora de la Facultad de Salud - Universidad del Valle.
Integrante del Grupo de investigación Cátedra en Discapacidad y
Rehabilitación- Categoría C de Colciencias.
Profesional con experiencia a nivel asistencial en el área de Voz, Habla y
disfagia - Centro Médico Imbanaco - Cali - Colombia.
Certificada en diversos programas de rehabilitación vocal, tales como
Lessac – Madsen Resonant Voice Therapy, Casper – Stone Confidential
Flow Therapy, Adventures in Voice, entre otros.
Principal experiencia en Docencia Universitaria, asesoría, consultoría,
actividades de educación continua y de investigación.
Licenciada en Fonoaudiología (USC) Centro Universitario San Camilo,

São Paulo- Brasil. Especialista en Voz (CEFAC) Centro de Especialización
en Fonoaudiología Clínica, São Paulo – Brasil. Doctoranda en
Fonoaudiología (UMSA) Universidad del Museo Social Argentino.
Fonoaudióloga del Hospital de Clínicas Asunción – Paraguay. Docente
de la Universidad Católica Nuestra Señora de la Asunción en las cátedras
de Ortofonía, Patología Vocal, Practica Supervisada y Tesis I y II.
Dedicada a la Clínica Vocal. Rehabilitación de patologías vocales,
entrenamiento de voces profesionales.
Miembro activo de la Sociedad Paraguaya de Fonoaudiología.
Perteneciente a la comisión directiva desde el 2011 al 2016. Miembro
adherente de la Sociedad Paraguaya de Otorrinolaringología.
1
1
Rodrigo Maximiliano Jerez
3
Ma. Priscilla Portillo Mongelli
Jăcĕre 4
Objetividad y subjetividad en Fonoaudiología 4
¿Métodos objetivos, sujetos subjetivos? 6
La síntesis 8
Referencias Bibliográficas 10
13
13
Entrevista y primera observación 14

Ficha fonoaudiológica 17
Medidas y conceptos en relación a la capacidad y utilización aérea
17
Medidas aerodinámicas 21
Mediciones relacionadas al tono y la frecuencia 25
Medidas relacionadas al volumen y la intensidad 28
Valoración perceptual de la producción vocal 29
Referencias bibliográficas 33
39
39
Ma. Esperanza Sastoque Hernández
Laringoscopia indirecta 40
Endoscopia laríngea 41
Videoestroboscopia 45
Interpretación de los hallazgos en la Videoestroboscopia 47
Videoquimografía (VKG) 49
57
57
Ondas simples y ondas complejas 57

Gráficos y recursos visuales para el Análisis Acústico 62
Medidas de perturbación 69
Medidas de Ruido 71
Instrumental necesario 72
Procedimiento para la obtención de muestras 79
Análisis de datos 81
93
93
Criterios y parámetros 93
117
117
Consideraciones Generales sobre el Ciclo Glotal 119

Utilización de la EGG 120
Generalidades sobre el Funcionamiento de la EGG 122
Especificaciones de los Dispositivos 124
Procedimiento 126
Parámetros Electroglotográficos 127
Análisis Cualitativo en la EGG 129
Análisis Cuantitativo en la EGG 134
La Síntesis 139
147
147
Utilización de la Medición de Parámetros Aerodinámicos 147

Generalidades sobre las Características y Funcionamiento de los
Sistemas de Evaluación Fonatoria y Aerodinámica 149
Procedimiento para evaluación de Medidas Aerodinámicas 151
Parámetros Aerodinámicos 153
La Síntesis 160
167
167
Mónica Fretes
Fisiología Laríngea 169

Fundamentos y consideraciones de la EMGL 172
Indicaciones 174
Procedimientos para la exploración muscular 174
Interpretación de la EMGL 179
187
187
199
199
Mónica Fretes
Caso 1 199
Caso 2 201
Caso 3 203
Caso 4 205
Caso 5 207
Caso 6 209
215

INTRODUCCIÓN
“La voz es el instrumento más bello, pero el
más difícil de tocar”
(Richard Strauss)
La evaluación clínica constituye el inicio de todo proceso de

abordaje en los tratamientos fonoaudiológicos, ya que, a través de un
grupo de consideraciones pertinentes, se puede realizar el primer trazado
de un camino específico que conduce a la habilitación, recuperación o
mejoría del estado del paciente.
En clínica vocal este no es un aspecto menor, debido a que, si no
se realizan los procedimientos debidos, la evaluación pierde consistencia,
y puede dar lugar a ciertos errores en la recolección o interpretación de
datos (cualitativos - cuantitativos), una cuestión que a largo plazo puede
entorpecer el devenir del quehacer terapéutico.
En este proceso, una audición aguda y sensible al fenómeno
vocal es fundamental. El desarrollo de un oído clínico es sumamente
necesario e incluso, antes del advenimiento de los nuevos métodos de
exploración cuantificables, éste representaba el único y más valioso
elemento de pericia. Hoy no se descarta su importancia y confiabilidad,
pero en el afán de “objetivizar” la información obtenida (el instrumento o
al evaluador mismo), se complementa esta examinación con una serie de
datos interpretables y codificables frutos de las herramientas de
medición/evaluación que desarrollaremos en el presente libro.
Por ello, tan importante como saber tratar eficazmente a un
paciente, es saber evaluarlo, y a la vez, corroborar esta información por
medio de instrumentos externos, como lo son los estudios por imagen o
aquellos que se enmarcan en el contexto del Laboratorio de la Voz:
electroglotogafía, análisis acústico de la voz, medidas aerodinámica
instrumentales, exploración neurofisiológica de la laringe, entre otros.
¿Para qué evaluamos entonces? Para realizar un seguimiento
minucioso de las características fonatorias que trae nuestro paciente,
para estudiar la incidencia que los factores externos o internos tienen
sobre la voz, para determinar posibles causas de una enfermedad vocal y
de su manifestación más evidente (disfonía), y – lo más importante –,
para esgrimir un abordaje lo más adecuado posible, según lo requiera
cada una de las personas que acuden a nosotros en pos de salud vocal.
De esta manera, puede el lector ir delimitando ya el perfil de este
libro.
No es un compendio de maniobras terapéuticas, sin embargo,
expone las orientaciones clínicas necesarias para conducir un correcto
abordaje. No es un tratado específico de anatomía o fisiología de la voz,
mas en cada prueba, se describen los conocimientos relacionados que
hacen posible el sonido vocal. No es un libro sobre patologías vocales, no
obstante, contiene las lecturas pertinentes acerca de los procesos
patológicos, lo que redunda en una completa comprensión de los
mismos.
En síntesis, no es un libro más que pretende abarcar hasta el
último tema sobre voz, sino un material indicado que, desde la evaluación
clínica, se proyecta hacia diversas miradas y puede iluminar pesquisa,
saber y tratamiento.
Abordaremos, entonces, en primer lugar, la naturaleza de las
denominaciones Objetivo – Subjetivo y Cuantificable – Cualificable
poniendo en consideración tanto al evaluador como a los métodos
mismos. ¿A qué nos referimos al hablar de métodos objetivos? ¿El
evaluador es siempre subjetivo? ¿Obtendríamos resultados
verdaderamente confiables basándonos solo en instrumentos
cuantificables?
Luego, para no dejar de lado la tradición que nos precedió,
detallaremos aquellas formas que nos sirven y han servido desde siempre
a la exploración de la voz en el quehacer diario.
A los dos temas anteriores, les seguirán una serie de capítulos
dedicados a los nuevos (algunos no tan nuevos, aunque sí poco conocidos
o poco usados) métodos de exploración. Una mirada sensible sobre los
estudios por imágenes (Cap. 3), una descripción minuciosa sobre Análisis
Acústico de la Voz (Cap. 4), detalles útiles sobre medidas aerodinámicas
instrumentales (Cap. 7), una mirada crítica sobre electroglotografía (Cap.
6) y una concienzuda revisión sobre exploración neurofisiológica de la
laringe (Cap. 8).
¿En qué casos se aplican? ¿Cuál es el procedimiento más
adecuado? ¿Qué resultados arrojan estos estudios? ¿Cómo leerlos e
interpretarlos? Sobre estos interrogantes nos detendremos en cada uno
de ellos.
Los últimos dos capítulos estarán destinados a la síntesis de
datos y a determinar de la manera más detallada posible índices o valores
de discapacidad o incapacidad vocal.
No esperamos sea éste un libro de recetas ni de instrucciones
frías y mecánicas, más bien establecemos como objetivo último el hecho
de permitirle al fonoaudiólogo interesado, captar la esencia de cada
instrumento y ponerlo al servicio de su clínica diaria mejorando cada una
de las experiencias de evaluación y optimizando sus tratamientos en
pertinencia y eficacia.
CAPÍTULO 1
“La voz es un dato objetivo y objetivable, pero es
también un deseo de comunicación, una experiencia
íntima de lo vivido, un reflejo de las emociones”.
(Cori Casanova, 2009)
La discusión sobre los paradigmas de objetividad y subjetividad no

es reciente, ni novedosa. Desde el momento mismo en que algunas
disciplinas comenzaron a defender su cientificidad, se pusieron en juego
estos conceptos con el propósito de calificar de alguna manera el carácter
del conocimiento que estas disciplinas proponían.
La búsqueda constante de la “objetividad” en las ciencias es un
camino muy extenso que ha derivado en muchas apreciaciones, quizás
hasta polémicas, sobre las definiciones de ciertos procedimientos, e
incluso sobre la “lectura” de los parámetros obtenidos.
En relación al conocimiento, los términos “objetivo” y “subjetivo”
tratan de distinguir lo permanente de lo efímero, lo seguro de lo
cambiante, lo estable de lo variable. Lo cierto es que sujeto y objeto no
pueden ser separados con tanta facilidad, ni con tanta placidez. Entre sí
son contingentes, no excluyentes.
No es el objeto del presente libro indagar sobre los momentos
históricos que han motivado y moldeado tal o cual paradigma en ciencia,
pero sí es necesario conocer que a lo largo del desarrollo de la
fonoaudiología como tal, ocurrieron paralelamente avances en todas las
disciplinas, y a través de ellos es que fue posible la creación de
herramientas tecnológicas que facilitan hoy observar y/o medir de forma
mucho más precisa la voz, la audición, el procesamiento lingüístico, entre
otras cosas.
Jăcĕre
Las palabras subjetivo/subjetividad y objetivo/objetividad, así
como sus sustantivos sujeto y objeto, se construyen alrededor de un
mismo verbo: jacere. Este vocablo, traducido al español como arrojar, en
conjunción con determinados prefijos terminan de definir la vigencia de
cada concepto.
Entonces, cuando hablamos de objetivo/objetividad, ¿a qué nos
estamos refiriendo? A la condición de no seguir la propia voluntad, sino
“arrojarse”, posicionándose delante del fenómeno de análisis sin
concepciones previas.
Subjetivo/subjetividad, en cambio, hace referencia a la cualidad
que retiene la evaluación en el propio criterio y somete o sujeta la realidad
de análisis a uno mismo.
Objetividad y subjetividad en Fonoaudiología

Si nos remitimos históricamente al nacimiento de nuestra
disciplina, es innegable que la Fonoaudiología es una ciencia
absolutamente humana, arraigada y modificada a lo largo de la historia.
Sus formas de expandirse y de reconstruirse obedecen a necesidades e
ideologías socio-culturales, y básicamente se enfocan desde la
concepción de salud/enfermedad imperante según el momento de la
historia al que nos referimos.
Aún hoy sus formas terapéuticas, objetivos y metodologías mutan
para dar lugar a nuevas representaciones, nuevos propósitos y nuevas
estrategias de carácter continuo y dinámico. Es conocido ante ello que
nuestra disciplina fue confrontando la mirada social y cultural sobre el
quehacer profesional, y no es puro azar que hoy podamos alcanzar un
nivel técnico y científico equiparable a cualquier otra del área médica.
Sobre ello, son muchos los profesionales que han luchado, que han
pensado, que han trabajado y que siguieron ideales de transformación,
teniendo siempre como premisa el bien de la persona que acude a
nosotros para restablecer o mejorar cualquier aspecto de la comunicación
humana. Todo ello permitió elevar el nivel profesional que hoy es posible
alcanzar, como así también la calidad de atención y la respuesta integral
sobre la salud que hoy poseemos.
No debemos olvidar los orígenes de la fonoaudiología, y por ello
recordamos que ésta fue una disciplina auxiliar de la medicina, que se
desprendió de la otorrinolaringología (ORL). En Argentina, surgió a partir
de la necesidad del médico ORL de completar su labor semiológica,
terapéutica, clínica y/o quirúrgica con tareas de evaluación y
rehabilitación de patologías de audición, voz y lenguaje. En aquel
momento los médicos contaron con la colaboración de profesoras de
sordos, quienes luego se convirtieron en las primeras fonoaudiólogas1. En
esta manera de concebir la profesión se compartían algunas
características del enfoque biomédico, ya que eran los médicos quienes
guiaban a los fonoaudiólogos en su tarea. Aún hoy, a los fonoaudiólogos,
les cuesta no categorizar según este modelo.
Con el paso del tiempo, las terapéuticas utilizadas en la profesión
y su aporte a la clínica de patologías diversas, fue vinculándose a diversas
ciencias que permitieron la adopción de múltiples paradigmas que
también contemplaban otras características del ser humano (psicología,
psicopedagogía, fisiatría, etc.), permitiendo ampliar los horizontes de la
fonoaudiología, más allá del ámbito médico.
Hoy la fonoaudiología es definida en muchos lugares del mundo
como “la ciencia que tiene por objeto de estudio a la comunicación humana
en lo que se refiere a su desarrollo y alteraciones, en correspondencia con los
aspectos relacionados con la función auditiva periférica y central, la función
vestibular, la función cognitiva, el lenguaje escrito y oral, el habla, la
fluencia y la voz, las funciones orofaciales y la deglución” (Martínez & cols.,
2006). Esta es una definición que al analizarla detenidamente evidencia
la evolución del alcance de nuestra labor profesional, como así también
de la concepción de la fonoaudiología como ciencia.
Actualmente es una profesión interdisciplinaria, puesto que
desde su campo de acción puede aportar a muchas disciplinas de la
misma manera que otras disciplinas han aportado a ésta. Una prueba de
ello es que aún hoy la profesión se encuentra inserta en comunidades
académicas desde diversos lugares: algunas la incluyen dentro de
“ciencias de la salud”, “ciencias médicas”, “ciencias biológicas”, “ciencias
humanas”, “ciencias sociales”, o “ciencias fonoaudiológicas”. Ello en
parte podría seguir siendo el vestigio del paradigma biomédico que
origina nuestra profesión, y que aún persiste en muchos lugares.
Más allá de cualquier “rótulo” que pudiera tener la profesión, en
todos los casos es la encargada de restablecer la comunicación. Y es
justamente a la comunicación que debemos remitirnos, y sobre ello no
debemos perder la óptica. Posibilitar la comunicación de los seres
humanos no es sólo una necesidad relacionada a la salud, sino un
mandato imperante para la interacción con el mundo circundante, una
necesidad para vivir.
Es, por tanto, una cuestión extremadamente importante el
crecimiento de la fonoaudiología como ciencia, para dar cada vez
respuestas de mayor complejidad. Pero, ¿cómo se logra esto?
Los caminos a seguir son diversos, aunque todos llevan a un
mismo objetivo común. El objetivo siempre será mejorar la calidad de
vida de las personas a través del desarrollo profesional, y los caminos para
llegar a ello pueden ser diversos, pero siempre con la mirada puesta en
contribuir al crecimiento integral de la fonoaudiología como tal.
Una forma de observar claramente el enorme avance
tecnológico que las ciencias han desarrollado, es mirando todas las
herramientas creadas y actualmente utilizadas en las diferentes áreas de
la comunicación. Ante ello, la evaluación de la voz no es una excepción, y
claramente pueden mencionarse procedimientos e instrumentales
desarrollados tanto para la evaluación como para la intervención
quirúrgica, e incluso en la rehabilitación de la voz. Estos elementos
denominados desde ciertos puntos de vista como de “mirada objetiva”
permiten extender los alcances en la atención del paciente, ampliando
enormemente el abanico de posibilidades en dichos campos para dar
soluciones adaptadas a cada necesidad, y cada vez con un mayor grado
de precisión diagnóstica, procedimental, pronóstico y terapéutica.
En el caso de la voz particularmente, la importancia de estas
mediciones radica en que permite “bajar a tierra” información que era
abstracta hasta el momento, siendo una forma de convertir a papel o en
una pantalla (e incluso de forma numérica) la información que antes sólo
podía obtenerse desde lo perceptual sumado a todos aquellos
parámetros que pueden ser medidos cuantitativamente con los cuales es
posible realizar una interpretación y valoración de la producción vocal
(Cecconello, 2012).
¿Métodos objetivos, sujetos subjetivos?

Sin embargo, es válido interrogarse en este punto. ¿Son tan
objetivos como dicen ser aquellos métodos exploratorios que brindan
datos duros? ¿Son realmente subjetivas las apreciaciones del profesional
que se guía por su conocimiento y experiencia en el caso de la evaluación
en el ámbito de la voz? ¿Cuál es la verdadera proporción de cada
elemento en uno y otro aspecto?
Contamos con instrumentos que gozan de mayor precisión y
determinación en cuanto a datos y valores (numéricos o visuales); no
obstante, carecen de sentido sin un intérprete que obtenga de ellos
conclusiones consistentes basadas en la experiencia y un conocimiento
pormenorizado del proceso vocal.
Ningún dato es tan objetivo ni elaborado como para prescindir
de la interpretación “subjetiva” del evaluador. Es aquí en donde, por lo
general, se incurre en el error al hablar de evaluación objetiva. La
asimilación de lo cuantificable con lo objetivo es “ciertamente” falaz, ya
que el dato y su relevancia estriba en gran proporción en el sujeto que
evalúa por varias razones. Si bien la información, alrededor de esta
búsqueda no se construyen del todo, el grado de confiabilidad de los
mismos depende mucho del procedimiento previo que se lleve a cabo.
Configurar inadecuadamente la captación de la señal acústica, colocar en
la posición equivocada los electrodos de superficie o carecer del
instrumental específico e indispensable que permita una prueba
consistente falsea ciertos datos.
Por más tecnología que haya, aún el instrumental no se maneja
por sí solo. Para ello se requiere del instrumentador. De igual manera pasa
con los resultados. La información provista por éstos muere de no ser por
aquel que se forma en la interpretación de los mismos. Para llevar a cabo
esta tarea, el intérprete es más objetivo que nunca, pone en juego no solo
su experiencia, sino la experiencia de todos aquellos que se dedican a la
misma labor, y que han generado como precedentes la suficiente
evidencia científica para dar rigor y confiabilidad a los procedimientos
desarrollados y con ello sus debidas interpretaciones. En este punto,
también estamos abordando una conceptualización erróneamente
marcada en el imaginario colectivo sobre la tecnicidad en el campo de
ejercicio del fonoaudiólogo o del “fonoaudiólogo como un mero técnico”,
y es aquí donde serviría replantear los conceptos paradigmáticos que
subyacen a ello, para dar el lugar que corresponde a dicha tarea, por ser
muy valiosa en el avance profesional.
Interpretar datos no es “decir lo que me parece” sino
fundamentar de la manera más sólida posible el conocimiento que se
posee para desarrollar la lectura adecuada de la información que se
obtiene en base a las evaluaciones que se realizan.
De igual manera, una correspondencia unívoca entre cualificable
y subjetivo no es del todo real. Las definiciones cualitativas de un
experimento definen fuertemente el devenir de la evaluación, permiten
una lectura más amplia y abarcativa de la situación, y circunscriben el
problema sin dejar de lado los elementos que a él se relacionan.
El oído no puede decirnos si el valor de jitter es de 1 o 1,4 ni puede
asegurar que el pico del formante 2 (F2) se encuentra a 1324 Hz, es
incapaz de predecir el momento de la caída en la curva
electroglotográfica (EGG) y no tiene la habilidad de desentrañar si en el
proceso fonatorio el músculo tiroaritenoideo (TA) se contrajo
proporcionalmente al cricotiroideo (CT), o si los músculos
cricoaritenoideos posteriores (CAP) se relajaron adecuadamente según lo
necesitaban los cricoaritenoideos laterales (CAL). Sin embargo, nadie
sería capaz de afirmar que una audición entrenada es completamente
obsoleta para acercarse fuertemente a un tipo u otro de patología vocal,
o que no sirve para realizar valoraciones sobre calidad vocal. Nadie
dudaría del reconocimiento que un oído adiestrado hace de voces nasales
o estridentes, e incluso de defectos técnicos mínimos en el caso de voces
profesionales.
Mas entonces, ¿qué programa cuantifica el grado de esfuerzo
vocal? ¿Qué programa pondera al dedillo las características tímbricas de
una voz? ¿Cómo se da cuenta un transductor de energía que esa voz tiene
fatiga o no? ¿Qué estudio por imagen reconoce voces que requieren
tratamiento y cuáles no?
Podríamos bosquejar respuestas muy aproximadas para todas
estas preguntas, los avances son constantes y cada día se descubre algo
nuevo, pero no existe ninguna respuesta taxativa que asegure que la
objetividad-cuantificación de los métodos de evaluación, suplan a la
valoración perceptual-cualitativa que realiza un oído preparado.
La síntesis
Ya lo decíamos antes, a raíz del desarrollo tecnológico y
electrónico, los métodos e instrumentos de exploración han sufrido
cambios insalvables que demandan de nuestra actualización y formación
constante.
Cada uno de los procedimientos que se describen a lo largo de
este libro son valiosísimos de cara a la clínica vocal. Sorprendente en
todos los casos es el ingenio del hombre por desentrañar ciertos procesos
que aún nos resultan un tanto difíciles de entender. Sin embargo, ninguno
de los métodos que aquí presentamos es capaz de reemplazar al valor
agregado que aporta una puntillosa percepción auditiva.
De la misma manera en que se volvió necesario capacitarse en
los procedimientos y la adquisición de nuevas habilidades, así también
debe ser el esfuerzo invertido en el entrenamiento perceptual al que
debemos someter a nuestro oído. No olvidemos que, por más discusión
establecida, la objetividad parcial de los datos solo se completa con la
objetividad ganada del sujeto que evalúa.
No se debe dejar librada la suerte de una evaluación o de un
tratamiento a una fotografía, video, curva o valor numérico. Describir un
estado o una alteración es tan importante como conocerla y reconocerla
en un marco mucho mayor dado por el contexto patológico que
buscamos desentrañar.
Este no es un libro que tratará sobre el desarrollo de la
percepción auditiva en la evaluación vocal, entendemos que el lector, es
inquieto en estas cuestiones y tiene recorrido o habrá de transitar su
propio camino. En cambio, desarrollaremos todas aquellas herramientas
que contribuyen y complementan mucho de lo que el oído ya sabe.
Si de algo sirve la experiencia del autor, vale la sucinta respuesta
a la pregunta, ¿cómo desarrollar esta percepción tan preciada de la que
hablamos y sobre la que de seguro volveremos una y otra vez más
adelante?
En primer lugar, conociendo. El fonoaudiólogo especialista en
voz debe ser un estudioso constante del proceso vocal. No puede tener
solo una idea de lo que sucede alrededor de la voz, sino que debe poder
recrear en su mente de qué manera éste se completa, cuáles son las
posibles razones fisiológicas de su alteración y cuál es el fenómeno
audible que desencadena.
En segundo lugar, escuchando/observando. La especificidad de
nuestra tarea nos exhorta a reconstruir y combinar simultáneamente en
el imaginario fisiológico los procesos de escucha a la par del desarrollo de
la tarea fonatoria. Para ello, debemos proporcionarle a nuestro oído
modelos de todo tipo. La escucha y observación no solo de voces
patológicas, sino también de voces profesionales, enriquece las
posibilidades al momento de emitir un juicio sobre tal o cual voz.
Sabemos que, para cada sonido, hay un mecanismo que lo genera.
Debemos ser capaces entonces de descifrarlo auditivamente.
En tercer lugar, equivocándose. Las correspondencias no
siempre son uniformes. Pero la repetición reduce el error. Mientras más
voces sopesemos, tanto más se agudizará nuestro sentido. Es un
entrenamiento diario y cada valoración suma posibilidades de estar más
cerca de la realidad que se nos presenta.
El método (herramienta o instrumento) cuantifica, pero quien
verdaderamente califica, es el sujeto. Sin esta síntesis, el proceso de
evaluación está incompleto.
Referencias Bibliográficas
Cecconelo, L. (2012). Aplicación del Análisis Acústico en la Clínica Vocal –
Trabajando con Anagraf. Buenos Aires, Argentina. Editorial
Akadia. 1° ed.
Corominas, J. (1987). Breve diccionario etimológico de la lengua
castellana. Editorial Gredos. Madrid. 3° ed.
Maciá Soler, L. (2014). Investigación cualitativa. Elsevier. Barcelona.
Marchesan de Queiroz, I. (2002). Fundamentos de fonoaudiología.
Editorial Médica Panamericana. Buenos Aires.
Martínez, L., Cabezas, C., Labrar, M., & Hernández, R. (2006). La
logopedia en Iberoamérica. In XXV Congreso de Logopedia,
Foniatría y Audiología.
Perelló, J. (2007). Diccionario de logopedia. Ediciones Lebón. Barcelona.
3° ed.
Polgar, S. et al. (2014). Introducción en investigación en ciencias de la
salud. Elsevier. Barcelona.
CAPÍTULO 2
“La tradición es la transmisión del fuego,
no la adoración de las cenizas”
(G. Chesterton)
Desde tiempos antiguos, la voz ha sido objeto de estudio, y el

oído, el explorador por excelencia. No es extraño pensar entonces que los
cantantes y profesores de canto hayan sido los primeros y más curiosos
evaluadores en esta área.
Más allá del desarrollo de una destreza auditiva adecuada para el
reconocimiento del fenómeno vocal, los diversos profesionales de la voz
han tratado de estructurar su evaluación, con el objeto de recoger la
información suficiente para completar del mejor modo posible una
evaluación de la voz.
La exploración convencional, entonces, comprende una serie de
pasos y estrategias utilizados para evaluar este basto fenómeno de
manera inmediata dentro de la clínica diaria sin la ayuda de grandes
instrumentos que provean datos puntillosamente cuantificables. Este
tipo de evaluación puede orientar nuestro primer diagnóstico, corroborar
los datos proporcionados por el médico ORL o entrar en conflicto con
aquel, dependiendo de la experticia de cada evaluador.
Es importante distinguir, previo a la evaluación, las
consideraciones que motivan al paciente/cliente a llegar a la consulta.
Bien puede ser una evaluación inicial de cara a explorar el estado vocal
antepuesto al comienzo de un entrenamiento o tratamiento profesional
de su propia voz, bien puede estar motivado por la sencilla razón de
presentar un estado alterado.
¿Cuál es esa serie de materiales que podemos incluir en este
grupo al que denominamos de exploración convencional? En el presente
capítulo serán descriptos aquellos recursos que aportan información
sobre la fisiología y el estado vocal general, presentando los posibles
resultados según las investigaciones y la relación clínica interpretable.
Entrevista y primera observación
Desde el momento en que el paciente ingresa a nuestro
consultorio y saluda, nos disponemos a evaluar. Escuchamos su voz y
aquellos que estamos entrenados en la tarea, empezamos a ponderar una
suerte de ficha imaginaria que considera la calidad vocal en general
comparada con modelos previos, fruto de nuestra experiencia y bagaje
clínico.
A veces no hace falta ni siquiera preguntar qué sucede ya que el
sonido vocal “habla” por sí solo. Otras veces, los pacientes llegan
consultando por factores ajenos a la voz, dado que ni siquiera detectan
las fallas vocales como algo fuera de lo común.
¿Qué debemos preguntar? ¿Hacia dónde dirigir nuestra
atención? ¿Sobre qué aspectos profundizar? ¿Qué relevancia puede tener
realizar preguntas sobre el sistema endócrino o el sistema auditivo
durante el interrogatorio? Solo por dar algunos interrogantes de ejemplo.
Sabemos que la voz es un fenómeno sumamente complejo que
involucra varios sistemas para su producción, y otros tantos cuyo impacto
(a veces más directo, otras veces no tanto), debe ser tenido en cuenta.
Entonces, más allá de una receta con preguntas (que no están de más
para aquellos que se dan a esta tarea por primera vez), orientaremos al
lector en el por qué considerar y no dejar de lado ningún aspecto.
En primer lugar, cuatro sistemas son los fundamentales para la
producción vocal: respiratorio, fonatorio, resonancial y articulatorio. Por
lo tanto, es determinante la integridad de cada uno de ellos. Las
alteraciones a nivel del sistema respiratorio tendrán un impacto directo
según se encuentren afectadas las vías aéreas inferiores o superiores. Si
hablamos del primer grupo (vías aéreas inferiores), las dificultades
estarán planteadas en relación a la capacidad, dosificación y control del
aire tanto inspirado como espirado. Puede haber compromiso bronquial,
pulmonar, pleural o traqueal con cuadros tan diversos como neumonía (o
su secuela), bronquitis, enfermedad pulmonar obstructiva crónica
(EPOC) o algún grado de insuficiencia pulmonar. Por otro lado, la
afectación de las vías aéreas superiores condiciona directamente el
funcionamiento del sistema de resonancia. Rinitis o sinusitis afectan la
viscosidad de las paredes del tracto vocal; amigdalitis o la presencia de
vegetaciones adenoideas limitan los espacios en donde el sonido debe
reflejarse.
El sistema articulatorio, por su parte, puede modular nuestra voz
dentro de un enorme rango de posibilidades. El movimiento planificado
y coordinado de las estructuras que lo componen hace posible el lenguaje
oral. La alteración de estos segmentos entorpece la inteligibilidad de la
palabra en el plano comunicativo. Además, puede ser un factor
condicionante para el desarrollo de otras funciones como la masticación
o la deglución.
En un segundo grupo, se puede incluir a aquellos sistemas que
de una u otra manera establecen o regulan el resultado final de la
fonación: sistema nervioso y sistema auditivo. Como todo órgano de
nuestro cuerpo, el funcionamiento de la laringe está regulado por el
sistema nervioso central (centros de control nervioso a nivel del cerebro)
y sistema nervioso periférico (Par craneal X y vías que de éste se
desprenden). Una falla en el origen de la señal o a nivel de transmisión
produce un deterioro o pérdida de control, lo que en algunos casos hace
que la laringe deje de responder al aíre espirado por su falta de
movimiento y aproximación a la línea media. En otros casos, por la misma
razón, el mecanismo de producción no solo se ve impedido, sino que
además los alimentos pueden invadir las vías aéreas inferiores
produciendo infecciones que impactan sobre el sistema respiratorio. El
sistema auditivo, en cambio, ejerce un control distinto sobre la voz, ya
que éste es quien toma la señal sonora que luego se procesará en los
centros auditivos y de asociación de la corteza. La información que
aporta, es relevante para establecer un tono e intensidad esperables en la
voz de las personas de acuerdo a su propio perfil. En los profesionales de
la voz (locutores, cantantes y actores, sobre todo) existe una imagen
mental vocal muy desarrollada gracias a este sistema y a la búsqueda que
realiza el profesional en pos del desarrollo de su voz.
Finalmente, podemos describir un tercer grupo de sistemas que,
de manera más encubierta, inciden en la producción vocal: sistema
postural (también conocido como músculo-esquelético), digestivo y
endócrino. Las alteraciones en el sistema postural pueden tener impacto
sobre el sistema respiratorio y su fisiología; posturas inadecuadas
condicionan el espacio y desplazamiento muscular durante la dinámica
respiratoria. Las funciones digestiva y fonatoria no son del todo
compatibles, dado que en buena medida una deja sin efecto a la otra. Así
mismo, durante el proceso digestivo, se vive una especie de letargo que
disminuye claramente el tono muscular general, incluyendo el de los
pliegues vocales, lo que aumenta en esos momentos, la demanda para
cumplir naturalmente la función vocal. Es sabido de igual manera, que
durante la fonación es imposible ingerir alimentos y las vías deben estar
despejadas para la articulación de la palabra. El último sistema, tan
importante como los anteriores, es el endócrino. Su funcionamiento,
arroja al torrente sanguíneo enormes cantidades de sustancias que son
asimiladas en todo el cuerpo. Nuestro organismo las necesita como
energía para el desarrollo y metabolismo global; particularmente, en el
caso de la progesterona (en la mujer) o la testosterona (en el varón), para
el desarrollo de caracteres sexuales secundarios tales como la voz. Una
alteración en la producción o cantidad de estos o de otros fluidos, puede
ocasionar desequilibrios en algunas de las cualidades del sonido vocal.
De más está decir, que un desajuste estructural o funcional a
nivel del generador sonoro (laringe), alterará su funcionamiento y la
producción final audible que deseamos evaluar. Este aspecto será
desarrollado con mayor profundidad en los capítulos siguientes.
Lo que sigue a continuación es una suerte de guía o sugerencia
que puede ayudar a colegas en la tarea de evaluar voces. Se contempla
un posible interrogatorio que para nada agota las verdaderas
posibilidades que pueden ir apareciendo en el desarrollo del mismo. La
práctica asidua y recurrente irá dotando de experiencia al profesional y
delimitando el terreno para cada entrevista.
¿Tuvo o tiene problemas

Edad
hormonales?
¿Realiza tareas vocales de

¿Afecciones broncopulmonares?
manera sistemática? ¿Cuál lleva
¿Alergias?
a cabo con mayor frecuencia?
¿Desempeña otros trabajos

¿Problemas de audición?
durante la semana?
¿Durante cuántas horas? ¿En qué

¿Problemas vocales?
turno trabaja?
¿Usa la voz durante sus horas de

¿Estuvo o está en tratamiento
trabajo? ¿Cuánto? ¿Cómo puede
por alguna de las enfermedades
describir su voz después de la
antes mencionadas?
tarea vocal?
¿Cómo es su ambiente de ¿Estuvo o está en tratamiento

trabajo? fonoaudiológico?
¿Cuántas horas duerme por la

¿Fuma?
noche habitualmente?
¿Participa en coros? ¿En qué

¿Cuántas horas duerme después
cuerda canta? ¿Estudió canto
de un trabajo vocal arduo?
alguna vez?
¿Toma algo antes, durante o ¿Alguna vez recibió pautas de

después de cantar? cómo cuidar la voz y manejarla?
Ficha fonoaudiológica2
El uso de una ficha de evaluación, previamente confeccionada,
puede llegar a ser útil en casos donde el terapeuta aún no está del todo
familiarizado con la atención a pacientes con manifestaciones vocales, o
en casos donde la consulta es cuantiosa y la atención debe ser más bien
ágil. Resulta práctica para el registro rápido de datos y la posterior
búsqueda de la información de cada paciente.
Algunos aspectos de la ficha pueden ser completados en el
devenir de la entrevista, en cambio, otros requieren un contexto
evaluativo específico que será detallado a lo largo de este capítulo.
La ficha fonoaudiológica puede o no detener su atención tan solo
en características vocales o en el conjunto morfo-funcional (sistema
estomatognático o función deglutoria, por ejemplo) interviniente en la
creación de nuestro objeto de análisis, la voz.
Aunque más abajo dejamos un modelo (Tabla 1), sepa el lector
que ésta puede confeccionarse de la manera más libre y creativa posible,
con los elementos que se crean conveniente, justificados en la
información que cada profesional quiera o pueda recabar en relación a sus
puntos de interés y las exigencias del paciente.
Medidas y conceptos en relación a la capacidad y utilización aérea

Sabiendo que la fuente primigenia del sonido es el soplo
espiratorio, una medición de los volúmenes aéreos interactuantes en
nuestro sistema puede brindarnos datos sustanciales sobre el fenómeno
vocal.
Es importante, antes de seguir avanzando, tener claridad sobre
ciertos conceptos relacionados al acto respiratorio e intercambio gaseoso
que de él se desprenden.
Capacidades y Volúmenes pulmonares

Las capacidades y volúmenes pulmonares (Figura 1) son
cantidades virtuales de aire expresadas en mililitros. ¿Por qué hablamos
de cantidades virtuales? Dado que el pulmón no presenta
compartimentos fisiológicamente particulares para el almacenamiento
de aire, la diferenciación de los mismos es solo una alegoría en relación al
modo y circunstancia en el que se presenta.
Ficha Foniátrica N°
Datos del paciente
Nombre y Apellido: Fecha de consulta:
Fecha de nacimiento: Edad:
Profesión/Ocupación:
Motivo de consulta:
Estudios previos – Antecedentes médicos:
Antecedentes familiares:
Enfermedades (alergias, problemas respiratorios, tiroides, etc.)
Breve descripción del problema
Evaluación de los aspectos respiratorios
Frecuencia
Modo Patrón/Tipo respiratorio
respiratoria
Permeabilidad nasal
Coordinación
Tiempo Máximo Fonatorio
Pneumofonorespiratoria
Evaluación de los aspectos vocales
Tono Intensidad
Timbre Resonancia característica
Escala de evaluación perceptual
RASAT(I) o GRBAS(I)
Voice Handicap Index
Tabla 1
Figura 1. Espirograma
de los volúmenes y
capacidades
pulmonares
Estos valores aportan datos sobre el funcionamiento del sistema

respiratorio en relación a su trabajo ventilatorio, quizás en algunos casos
poco nos dicen acerca de la función fonatoria, pero claro está que la
información en relación al control y manejo del aire será de utilidad para
la tarea de la que nos encargamos.
La medición de la mayoría de estos volúmenes se obtiene a
través de un espirómetro, un instrumento inocuo y para nada invasivo,
aunque no se descarta el uso de métodos por reacciones químicas (post
mortem) o de corte más agresivos con válvulas de presión.
Alrededor de estas nociones y según el autor que se tome en
consideración, los nombres podrán variar sin mayores cambios en la
concepción global de cada uno.
 La capacidad pulmonar total (CPT) comprende la sumatoria
de la capacidad vital más el volumen residual. Este contenido,
en realidad, habla muy poco acerca del uso y eficiencia del aire
durante la función vocal. El valor esperable para un hombre
adulto normal ronda los 6000 ml, en una mujer 4200 ml y en un
niño algo menos aún, dependiendo del peso y la talla de cada
uno.
 La capacidad vital, por otro lado, vincula el volumen de reserva
inspiratoria, el volumen corriente y el volumen de reserva
espiratoria (4800 ml en el hombre y 3100 ml en la mujer).
 El volumen circulante o corriente es el volumen de gas que se
moviliza durante un ciclo respiratorio normal. Tiene estrecha
relación con la capacidad vital, ya que éste sería el volumen
puesto en juego en cada actividad vocal. Se calcula que un
adulto sano efectúa en promedio 12 respiraciones por minuto, y
con cada inspiración y espiración moviliza alrededor de 500ml de
aire hacia el interior y el exterior de los pulmones (Tortora &
Derrickson, 2013). De acuerdo a si se esté cantando, actuando,
bailando o realizando algún deporte, el mismo variará
considerablemente ya que se ajusta a las demandas y
requerimientos del cuerpo.
 El volumen de reserva inspiratoria (VRI) es el volumen de gas
registrado durante una inspiración profunda (3100 ml en un
hombre y 1900 ml en una mujer promedios).
 El volumen de reserva espiratoria (VRE) es el volumen de gas
registrado después de una espiración forzada, previa
inspiración normal. Tanto el VRI como el VRE en esta instancia
no se evalúan en relación plena con la voz.
 El volumen residual es el volumen de gas que queda después
de una espiración máxima (inutilizable para fonación).
Tiempo máximo de soplo (TMS) o Tiempo máximo espiratorio

(TME)
Como su nombre lo indica, el tiempo máximo de soplo mide la
duración extrema de una espiración forzada luego de una inspiración
profunda. Para ello se necesita un simple cronómetro y la consigna al
paciente es: tome todo el aire que pueda, retenga y suelte el aire hasta que
crea haber vaciado los pulmones por completo.
Si bien podríamos asociar entre sí los conceptos de TMS y
capacidad vital espiratoria, la relación es limitada y solo deja entrever una
vinculación poco precisa. No es posible generar proporciones entre sus
resultados ya que la forma en la que se expele el aire es infinitamente
variable y depende de diversos factores.
Según el paciente sea hombre, mujer o niño, habrá valores
comunes que servirán como parámetros de evaluación (Tabla 2). Esta
discriminación nos hace pensar que la contextura física (peso y talla de la
persona, sobre todo) es un ingrediente condicionante para esta prueba.
Hombre 25 – 30 segundos
Tabla 2 (Ptacek et al., Mujer 25 – 30 segundos

1963; Tait et al., 1980)
Niño 10 segundos
Con estos valores, podemos establecer también cierta
dependencia solapada entre los factores temporales y aquellos que
reflejan el volumen aéreo. Mientras más prolongado sea el soplo
espiratorio en segundos, es posible que exista mayor caudal de aire
disponible (ml), una adecuada dosificación de la columna aérea o ambas
cosas.
Valores disminuidos, según el sexo y la edad, pueden dar cuenta
de algún desequilibrio a nivel pulmonar, bronquial, laríngeo (Adrián et al.,
2003; Rodríguez Parra et al., 2009) o simplemente funcional relacionado
con un pobre uso de la musculatura inspiratorio o espiratoria.
Modo respiratorio
Se considera al modo respiratorio como sinónimo de la vía por
la cual ingresa el aire al sistema. El modo puede ser: Nasal (ingreso del
aire por la nariz), bucal/oral (ingreso por la boca), o mixto (ingreso por la
nariz y la boca indistintamente).
En estado de reposo se espera una activación del modo nasal,
mientras que en el uso de la respiración para la voz hablada o cantada el
modo mixto aparece casi de forma natural.
Por otro lado, una respiración bucal/oral sistemática, es
considerada patológica, la cual puede estar asociadas a alteraciones a
nivel de las vías superiores del sistema respiratorio (obstrucción nasal o
faríngea) y repercutir directamente durante la construcción morfológica
del macizo facial.
Medidas aerodinámicas3
A diferencia de las medidas – simplemente – aéreas, los valores
aerodinámicos ponen en evidencia la relación del aire expelido con el
generador acústico (laringe). Ejemplo de ello son: coordinación fono-
respiratoria, tiempo máximo fonatorio (TMF) o las pruebas llamadas de
eficiencia fonatoria.
Coordinación fono-respiratoria
Es la sincronización que existe entre la musculatura laríngea
implicada en la fonación y el proceso de expulsión de aire. Dicho de otra
forma, es la coordinación que debe existir entre el acto aductor y tensor
de los pliegues vocales y la exhalación.
Se relaciona con la administración y el control del aire inspirado
al hablar. Por ejemplo, una persona que continúa articulando palabras
aún después de haberse quedado sin aire, tiene una coordinación
deficiente, y es frecuente observarlo en niños ansiosos o mujeres
embarazadas que aún no terminan de incorporar sus limitaciones aéreas.
A la vez, esta noción, dado el vínculo correspondiente, nos
permite realizar una descripción y clasificar los inicios vocales en:
 I.V. Normal: como sinónimo de coordinación fono-respiratoria.
 I.V. Duro (también llamado golpe glótico): los pliegues vocales
se aducen con solidez antes de que el aire sea propulsado desde
los pulmones. Cuando éste encuentra la resistencia a nivel
glótico, golpea en forma brusca para vencer esa dureza. Estos se
separan y por la misma firmeza mantenida, colapsan entre sí
nuevamente.
 I.V. Blando: por el contrario, aquí primero el aire es expelido y a
medida que va saliendo, son los pliegues vocales quienes al
ofrecerle una resistencia paulatina van cortando el flujo y
transformándolo en voz. Existe un momento en donde el sonido
vocal se confunde con el ruido turbulento del gas expulsado, hasta
que la aducción es completada y el escape desaparece. A veces,
este comportamiento persiste, el cierre no llega a ser perfecto y el
ruido es constante (voces patológicamente disfónicas) (Jerez,
2015).
Tiempo máximo fonatorio (TMF)

Es la medida que cuantifica en segundos la emisión vocal
realizada después de una inspiración profunda. El tiempo máximo
fonatorio tiene relación directa con la capacidad vital (CV) y la eficiencia
del cierre glótico.
En relación a la consigna brindada al paciente, deberemos
pedirle que realice una inspiración profunda, una breve pausa seguida de
una emisión lo más estable y pareja posible en un tono cómodo a una
intensidad cómoda.
Un TMF disminuido se traduce en defecto de cierre por
incompetencia glótica, lesiones del borde libre, capacidad pulmonar
pobre, mala dosificación o una combinación de alguna de las anteriores.
Un TMF aumentado, puede no tener significancia clínica, aunque
también puede ser signo de fonación prolongada por hiperfunción con un
flujo aéreo bajo.
En la tabla que sigue, encontraremos valores estándares según
sea para una población de mujeres u hombres.
Mujeres Hombres
Hirano et al. (1968) 15 – 25 segundos 25 – 35 segundos
< 4 años: 8,9

< 4 años: 7,5 segundos
segundos
Entre 4 y 12 años: 14,9
Entre 4 y 12 años: 17,1
segundos
Adaptado de Casado segundos
& Adrián Adultos: 21,3
Adultos: 25,9
segundos
segundos
> de 65 años: 13,5
> de 65 años: 14,7
segundos
segundos
Índice s/z – s/e

Evalúa la capacidad transductora que posee el órgano laríngeo;
es decir, mide cuán eficazmente “convierte” una columna de aire,
proveniente de los pulmones, en sonido.
Este índice se calcula por medio de la razón entre el tiempo
máximo de soplo /s/ y el tiempo máximo fonatorio con el fonema /z/ o /e:/
(dependiendo del autor que se considere). /s/ en este caso, representa el
soporte aéreo pulmonar; mientras que /z/ o /e:/ miden la fuente de
fricción glótica (pliegues vocales).
Soporte aéreo pulmonar

Índice s/z = =1
Fuente de fricción glótica
En principio, se espera que los tiempos sean muy similares, para

ambos sonidos en voces normales, aunque /z/ puede estar levemente
aumentado (mayor en varios segundos que /e:/). De ahí que un índice
normal no siempre sea igual a 1, sino un tanto mayor.
Las situaciones que pueden presentarse alrededor de esta
prueba son varias. Puede que ambos valores de sustentación sean bajos;
en ese caso podríamos pensar en un compromiso a nivel respiratorio, ya
que el flujo en general se encuentra limitado.
Si el valor de /z/ se encuentra disminuido pero el de /s/ es normal
o simplemente mayor, puede haber disminución de la aducción glótica
por hipofunción o algún tipo de alteración estructural que impida un
cierre completo y el escape consecuente de aire. En estos casos el índice
será mayor a 1,2.
Si el valor de /z/ es mayor que /s/, puede ser indicio de
hiperfunción o hiperaducción de los pliegues vocales. Un cierre
exagerado de la válvula laríngea permitiría salir menos cantidad de aire
durante la conversión acústica. El índice, en situaciones similares sería
menor a 1.
La tabla que se exhibe a continuación, resume lo expuesto.
Condición Índice Implicancia clínica
Condición normal o flujo

Normal 1,5
aéreo limitado
Valores según García Tapia Defecto de cierre por

U., Cobeta Marco, 1996 Valores
> 1,5 incompetencia glótica
mayores
Lesiones del borde libre
Valores Sin significación clínica

< 1,5
menores para los autores citados
Cociente fonatorio
Esta medida relaciona la capacidad vital (CV) con el tiempo
máximo fonatorio (TMF); expresa por medio de un cociente matemático
el vínculo entre cantidad de aire y duración de la emisión vocal. Por lo
tanto, a mayor capacidad vital, mayor cociente fonatorio; en cambio, a
mayor TMF, menor cociente fonatorio.
Este índice puede ser obtenido por medio de un espirómetro
(para la CV) y un cronómetro (para el TMF), aunque también puede ser
medido a través de un neumotacógrafo, como se verá más adelante.
Los valores estándares propuestos son 145 ml/s para hombres y
137 ml/s para mujeres (Jackson Menaldi & Núñez, 2013). Las diferencias
del coeficiente fonatorio son considerablemente variables entre sujetos
normales, lo que expone un rango no menos variable para sujetos con
patologías vocales. Cuando se comparan estos datos con la función
glótica antes o después de una intervención quirúrgica o técnicas de
entrenamiento vocal, estas medidas pueden convertirse en útiles
herramientas para el seguimiento de los efectos terapéuticos
(Dejönckere, 2010).
Pruebas de eficiencia de velo
Al producir un fonema vocálico, el velo del paladar asciende,
bloqueando la cavidad nasal, impidiendo que el aire sonorizado se irradie
por las fosas nasales. De esta manera, dicho proceso se completa casi
íntegramente en la boca.
Cuando existe algún indicio perceptual y se sospecha, de que el
aire está escapando por la nariz, se aplica esta prueba denominada de
eficiencia de velo, que explora la funcionalidad de esta válvula.
Se le pide al paciente que emita la vocal /a:/ o /e:/ y se coloca el
espejo de Glatzel por debajo de los orificios nasales. Si este se empaña,
será indicio de que parte del sonido vocal se difunde por medio de la
cavidad nasal y se interpretará que existe la posibilidad de disfunción a
nivel velar.
La voz, en este tipo de pacientes, puede resultar ciertamente
nasal, estridente o brillante. Esta prueba también puede ser útil para
detectar casos menos evidentes de fisura submucosa.
Mediciones relacionadas al tono y la frecuencia

Quizás muchos de ustedes se estén preguntando, ¿por qué
hablar de tono y frecuencia por separado? ¿Acaso ambos vocablos no
responden a un mismo concepto? Pues no. La frecuencia en este caso, se
condice con el parámetro físico medido con alta precisión en ciclos por
segundos4. En tanto que tono hace referencia a la frecuencia específica
que coincide con un sonido temperado, es decir, aquella que sintoniza con
un sonido musical (Basso, 2001).
Tono Medio Hablado

De entre la serie de tonos próximos a los cuales oscila la fonación
durante el habla espontánea, existe uno al que la voz más recurre o sobre
el que vuelve con más insistencia. Ese tono será el denominado, tono
medio hablado o tono habitual.
Un simple teclado y un oído afinado es todo lo que se necesita
para hallar la gama tonal conversacional alrededor de la cual se encuentra
la voz del paciente. Lo esperable es que durante un diálogo espontáneo
la persona utilice entre 4 a 5 tonos, en torno a Si1 para el hombre y La2
para la mujer (Figura 3)5.
Similar a la idea de tono medio hablado es la de tono óptimo de
habla. Éste último es al que toda voz eufónica debe aspirar. Ambos
pueden o no ser coincidentes. Lo ideal es que así suceda. Sin embargo,
¿de qué manera corroborar la exactitud entre uno y otro? Llevamos al
paciente hacia el tono más grave que pueda producir y de 4,5 a 6 tonos
por encima se espera encontrar el tono óptimo de ese hablante.
Si el tono de habla es el ideal, se dice que la voz se produce de un
modo eficaz, con un grado cómodo de tensión laríngea y mínimo
esfuerzo. Se cree que esta serie de tonos, de ser los ideales, coincidirían
con el o los tonos, “predeterminados” biológicamente que obedecen a
características anatómicas y fisiológicas laríngeas de cada persona
(Perelló et al., 1975).
La desviación del tono óptimo es un posible signo de disfunción.
Si éste se encuentra descendido, es decir, si oímos la voz del paciente más
bien grave, se puede pensar en un tipo de emisión quizás débil, pliegues
un tanto engrosados y algo flácidos.
En cambio, si el tono se encuentra aumentado (agudo),
podríamos suponer la existencia de un mecanismo hiperfuncional,
pliegues rígidos y una ondulación mucosa ciertamente limitada.6
Fonetograma
Del griego phoonee (voz) y graphein (escribir), como su nombre
lo indica, el fonetograma (Figura 2) es el gráfico que permite ubicar,
conocer y describir el conjunto de tonos capaces de ser producidos por
un mismo instrumento laríngeo.
Dentro de este gran conjunto de tonos al que denominaremos
Campo Vocal, es posible distinguir agrupaciones fónicas, algunas
generadas con mayor o menor comodidad, otras derivadas de tal o cual
mecanismo, y de la misma manera, establecer los límites tonales
tomando los conceptos de rango/extensión tonal y tesitura. Estas son
medidas que interesan más a cantantes y actores (quizás locutores
también), pero no está de más explorarlas sobre la generalidad.
Mientras el rango/extensión contempla la medición de toda la
gama tonal capaz de ser producida por una misma fuente sin tener en
cuenta las circunstancias en las cuales se genera ni el dominio y calidad
que caracteriza a cada emisión vocal, la tesitura reúne a todo el grupo
tonal sobre el que se ejerce un control preciso no sólo en afinación, sino
también en intensidad y timbre. Podemos asimilar de esta manera los
conceptos de rango/extensión tonal y campo vocal.
Sabemos también que no existe una única modalidad fonatoria
para producir la extensa gama de sonidos vocales; por ello, indagar sobre
la presencia de registros vocales durante la confección del campo vocal,
nos permite saber hasta dónde se han desarrollado ciertas destrezas a
nivel del sistema fonador.
Figura 2.
Fonetograma
obtenido con
el programa
VRRRP
Para la confección del campo vocal ya no resulta necesario

buscar tono por tono, intensidad por intensidad. En el protocolo de
valoración básica de la voz propuesto por el Comité de Foniatría de la
European Laryngological Society (ELS) (Dejönckere et al., 2001) se
resume el fonetograma a solo tres elementos: frecuencia máxima,
frecuencia mínima e intensidad mínima (relacionada con la presión
umbral de fonación7) dado que son los puntos más sensibles a los
cambios en la calidad vocal (Ma et al., 2007).
Antes la medición era posible a través de un teclado y un
sonómetro, hoy esos instrumentos han quedado obsoletos frente a la
cantidad de programas de computadora que ofrecen esta opción a sólo
un clic de distancia.
Uno de los programas gratuitos a los que el lector puede
acceder es el VRRRP, un fonetograma en tiempo real. Si bien se necesita
un sonómetro para su calibración y carece de las opciones de captura y
reproducción, resulta muy útil para conocer a grandes rasgos el campo
vocal y la gama tonal utilizada por el paciente. Es una buena herramienta
para aquellos que sufren “sordera” al tono y un interesante recurso
pedagógico para la docencia.8
Quiebres vocales o tonales

En voces muy inestables es común escuchar y observar cortes o
quiebres, cambios involuntarios y abruptos del tono que generalmente se
desplaza hacia los tonos agudos.
Durante la pubertad los quiebres son considerados normales,
afectando en mayor medida a hombres que a mujeres por el cambio de
tesitura propio de la muda vocal.
La presencia de estos quiebres como indicador patológico, se
puede relacionar con cansancio vocal, tensión, tono desplazado o dejar
en evidencia los primeros estadios de una alteración de origen
neurológica. Son ejemplo también de ello la disfonía de tipo espasmódica
o en casos de movimiento paradójico de cuerdas vocales.
Temblores vocales
Son aquellas variaciones constantes e involuntarias de
intensidad y/o del tono de velocidad más o menos rápida, que se
producen en la emisión de la voz. Tiene el efecto de un muy mal vibrato,
pudiéndose confundir con él.
Este aspecto más específico se contempla en alteraciones
neurológicas; a veces también es un reflejo de exceso de tensión en la
producción de la emisión. El tremor esencial, es un buen ejemplo de
advertir.
Medidas relacionadas al volumen y la intensidad

Así como frecuencia y tono no son lo mismo, intensidad y
volumen tampoco lo son. Por lo tanto, la medición del volumen e
intensidad responde a dos magnitudes muy bien diferenciados. La
primera (volumen) depende del oyente y de la impresión que del
fenómeno obtenga, en cambio, la segunda (intensidad) es una medida
derivada del estímulo físico.
Intensidad Vocal
¿A qué nos referimos al hablar de medida derivada en el párrafo
anterior? La intensidad en realidad no es el concepto más inmediato ni
cercano al que se asocia la energía acústica, sino una conversión que pasa
por presión dinámica y nivel de presión sonora (NPS) para llegar
finalmente al de intensidad.
Este parámetro objetivo, está relacionado con el grado de fuerza
con que se emite una voz, se mide en decibeles (dB) y depende además
de varios factores fisiológicos vocales.
Normalmente en condiciones óptimas, un susurro presenta
alrededor de 30 dB, el habla conversacional 60 dB y la voz proyectada 80
dB. Si la voz es extremadamente intensa posiblemente se deba a un sobre
esfuerzo del aparato fonador y ciertas compensaciones alternas;
mientras que, si la intensidad es muy débil y el timbre se escucha con
escape de aire, hay que incluir la posibilidad de un mal cierre glótico bien
sea de origen funcional u orgánico.
Sonoridad Vocal
Además de la magnitud física, definida anteriormente, existe
una magnitud psicofísica: la sonoridad. Su unidad es el son e intenta
cuantificar la percepción del sonido, aunque sin éxito inmediato en la
práctica clínica. Si bien somos capaces de identificar entre sonidos
intensos y débiles, no podemos decir cuán intensos o cuán débiles son con
la precisión esperada (cantidad de sones).
Por lo general, en el consultorio, evaluamos la sonoridad en
débil, media e intensa; mientras que además se observa si la misma está
asociada con compensaciones musculares inadecuadas o algún tipo de
esfuerzo.
Se le puede pedir al paciente que hable, lea o cuente números y
paralelamente vaya aumentando la sonoridad de su voz. De esta manera
se puede advertir si posee o no la capacidad de producir un volumen
elevado y de qué manera lo hace. Si el procedimiento se realiza sobre un
mismo tono sostenido, se obtendrá el efecto conocido como Kaiser o
messa di voce debido a su parecido con la indicación musical que lleva este
nombre.
La sonoridad intensa mide la resistencia glótica. Valora
indirectamente la capacidad de lograr una máxima presión subglótica, el
rendimiento de las cavidades de resonancia, la acción del apoyo
respiratorio y, en general, el manejo técnico vocal que permita lograr una
sonoridad extrema en forma correcta.
La sonoridad débil, en cambio, sopesa el grado de relajación que
alcanza la musculatura laríngea y su relación con los umbrales mínimos
de fonación.
Valoración perceptual de la producción vocal

Finalmente, si bien una apreciación subjetiva del timbre puede
ser solo estimativa y aproximada en términos de brillante, estridente,
oscura, aterciopelada y cuantas impresiones visuales se le ocurran al
lector, se han propuesto dos escalas de corte más objetivo para
cuantificar ciertos aspectos relacionados a la resultante sonora final.
Ambas escalas hoy se encuentran vigentes y su confiabilidad ha sido
probada en repetidas ocasiones.
GRBAS
Esta primera escala, denominada por sus siglas en inglés, fue
propuesta por la Sociedad de Foniatría y Logopedia de Japón en el año
1969. Luego de la difusión realizada por Hirano (1981) en su libro Clinical
Examination of Voice, el uso de la misma se amplió y extendió a Europa y
América.
Cada una de las iniciales representa un aspecto a evaluar y se
puntúan de 0 (cero) a 3 (tres) dependiendo del grado de afectación o
compromiso. 0 (cero) para normal o ausencia de alteración y 3 (tres) para
grave.
 G (grade), antes se hablaba de grado de disfonía o ronquera
(Hirano, 1981), hoy se asocia al grado de calidad vocal global,
integrado por todos los componentes alterados (Dejörckere,
2000).
 R (roughness), se refiere a la rasposidad o aspereza.
 B (breathiness), valora la presencia de ruido de aire en la voz.
 A (astenic), evidencia la debilidad tímbrica, y
 S (stein) puntúa la característica de la constricción o grado de
tensión.
RASAT
Esta segunda escala, en principio no tan distinta a la anterior, fue
propuesta por Pinho & Pontes (2002), buscando resolver un aspecto
quizás no advertido en la GRBAS.
Los autores de la RASAT sostienen que el aspecto Grade (Grado
de disfonía) de la anterior, no cuantifica solo el comportamiento de la
fuente sino además del filtro, por lo tanto, no es del todo precisa para
evaluar solo la fuente glótica. De hecho, el nombre completo propuesto
para la RASAT es “Escala de evaluación perceptiva de la fuente glótica
RASAT”.
Con este criterio, modificaron el aspecto Grade por Ronquera,
creando una nueva escala para la cual:
 R (ronquera), obedece a una irregularidad vibratoria de la
mucosa de los pliegues vocales durante la fonación (Isshiki,
1980).
 A (aspereza), relacionada a la rigidez de la mucosa, que
también causaría cierta irregularidad vibratoria dependiendo
de la presencia o no de alteraciones laríngeas.
 S (soplo), presencia de ruido aéreo.
 A (astenia), relacionada a hipofunción de los pliegues vocales o
poca energía en la emisión.
 T (tensión), esfuerzo vocal debido a un aumento de actividad
en la musculatura extrínseca de la laringe.
La incorporación del parámetro Inestability/Inestabilidad (I) en

ambas escalas (GIRBAS y RASATI, correspondientemente) es más
reciente. En el primer caso, sería usado como sinónimo de tremor vocal
según lo sugirió Piccirilo et al. (1998), aunque Pinho (2014) asegura que
inestabilidad, en este caso, debe ser relacionada con la fluctuación de los
parámetros vocales referidos con anterioridad, según como se usa en la
RASAT.
Figura 3.
Frecuencias
de
afinación
del piano
Referencias bibliográficas
Alió, M. (1993). Reflexiones sobre la voz. Barcelona. Editorial Climent. 2°
ed.
Pabon, J.P.H. (1988). Automatic phonetogram recording supplemented
with acoustical voice quality parameters. Journal of Speech and
Hearing Research. 31: 710-722.
Bacot MC., Facal ML., Villazuela G. (2005). El uso adecuado de la voz.
Buenos Aires. Editorial Akadia. 1° ed.
Barmat de Mines A., Ramos L., Balderione F., Parente S. (2011). El poder
creativo de la voz en el uso profesional. Buenos Aires. Editorial
Akadia. 1° ed.
Bassols, V. (2000). Bilan clinique de la voix. Encycl Méd Chir (Editions
Scientifiques et Médicales Elsevier SAS, Paris, tous droits réservés),
Oto-rhino-laryngologie. 20: 753A: 10 - 12.
Bustos Sánchez, I. (2013). Intervención logopédica en los trastornos de la
voz. Barcelona. Editorial Paidotribo.
Carding P., Carlson E., Epstein R., Mathieson L., Shewell C. (2000). Formal
perceptual evaluation of voice quality in United Kingdom.
Logopaedic Phoniatric Vocology. 25: 133-138.
Carding P., Horsley I. (1992). An evaluation study of voice therapy in
nonorganic dysphonia. European Journal of Disordered
Communication. 27 (2): 137- 158.
Casado Morente J., Pérez Izquierdo A. (2009). Trastornos de la voz: del
diagnóstico al tratamiento. Málaga. Ediciones Aljibe.
Chan, K.M. (2011). Auditory-Perceptual Voice Evaluation: A Practical
Approach. In Handbook of Voice Assessments, Ma, E. and Yiu, E.
San Diego: Singular Publishing Inc.
Cobeta I., Núñez F., Fernández S. (2013). Patología de la Voz. Ponencia
Oficial de la Sociedad Española de Otorrinolaringología y
Patología Cérvico – Facial (SEORL PCF). Editorial Marge Médica
Books. 1° ed. Barcelona – España.
Colton RH., Casper JK., Hirano, M. (1996). Understanding Voice Problems:
A physiological perspective of diagnosis and treatment. Baltimore:
Lippincott Williams & Wilkins. 2° ed.
Costa HO., Duprat A., Eckley C., Silva MAA. (2000). Caracterização do
Profissional da Voz para o Laringologista. Revista Brasileira de
Otorrinolaringología. 66 (2) P- 1: 129-134.
De Bodt MS., Van de Heyning PH., Wuyts F L., Lambrechts L. (1996). The
perceptual evaluation of voice disorders. Acta
Otorhynolaryngologie Belgique. 50: 283-91.
Dejonckere, P H. et al. (2001). A basic protocol for functional assessment
of voice pathology, especially for investigating the efficacy of
(phonosurgical) treatments and evaluating new assessment
techniques. Guideline elaborated by the Committee on Phoniatrics
of the European Laryngological Society (ELS). Eur Arch
Otorhinolaryngol. 258: 77 – 82.
Farías, P. (2007) Ejercicios para restaurar la función vocal: observaciones
clínicas. Editorial Akadia. 1° ed. Buenos Aires – Argentina.
Fernández Gonzáles, S. & cols. (2006). La Historia de la Voz. Revista
Médica de la Universidad de Navarra. 50 (3): 9 – 13.
Fernández González, S. (2006). Voces especiales. Revista Médica de la
Universidad de Navarra. 50 (3): 5 – 6.
González, JN. (1981). Fonación y alteraciones de la laringe. Buenos Aires.
Editorial Médica Panamericana.
Hirano, M. (1981). Clinical Examination of Voice. Springer – Verlag. Wien –
New York, United States.
Hirano, M. (1989). Objective evaluation of the human voice: clinical
aspects. Folia Phoniatrica et Logopaedica. 41: 89 – 144.
Jackson Menaldi, MC. (1992) La Voz Normal. Editorial Médica
Panamericana.
Jackson Menaldi, MC. (2002). La voz patológica. Editorial Médica
Panamericana.
Jones SM., Carding PN., Drinnan MJ. (2006). Exploring the relationship
between severity of dysphonia and voice-related quality of life.
Clinical Otolaryngology. 31(5): 411 – 417.
Kempster GB., Gerratt BR., Verdolini AK., Barkmeier-Kraemer J., Hillman
RE. (2009). Consensus auditory-perceptual evaluation of voice:
development of a standardized clinical protocol. American Journal
of Speech and Language Pathology. 18: 124 – 132.
Kreiman J., Gerratt B. (1998). Validity of rating scale measures of voice
quality. Journal of the Acoustic Society of America. 104: 1598 –
1608.
Le Huche F., Allali A. (2003). La Voz. Tomo I. Anatomía y fisiología de los
órganos de la voz y del habla. Barcelona. Editorial Masson S. A
Lucha López, M. & cols. (2000). Aproximación a un método postural: La
reducación postural global (RPG). Terapia Manual Venezolana. 1
(4): 21 – 26.
McCallion, M. (2008). El libro de la voz. Un método para preservar la voz
y dotarla de la máxima expresividad. Editorial Urano.
Morrison M., Ramage L. (1996). The management of voice disorders.
California: Singular Publishing.
Pabon, JPH. (1991). Objective acoustic voice-quality parameters in the
computer phonetogram. Journal of Voice. 5: 203 – 216.
Pabon, JPH. (1988). Automatic phonetogram recording supplemented with
acoustical voice quality parameters. Journal of Speech and Hearing
Research. 31: 710 – 722.
Perelló J. & col. (1975). Canto – Dicción (Foniatría estética). Barcelona.
Editorial Científico Médica.
Pinho S., Pontes P. (2008). Músculos Intrínsecos da Laringe e Dinamica
Vocal. Serie Desvendando os segredos da voz – Volumen I. Río de
Janeiro. Editorial Revinter Ltda.
Pihno S., Tsuji D., Bohadana S. (2006). Fundamentos em Laringologia e
voz. Río de Janeiro. Editorial Revinter Ltda.
Rehder M I., Branco A. (2011). Disfonia e disfagia. Interface, Atualizaçao e
Pratica Clínica. Río de Janeiro. Editorial Revinter Ltda.
Scivetti AR., Garraza AM. (1999). Educación, reeducación y rehabilitación
de la voz. Secuencias terapéuticas. Universidad de San Luis. San
Luis.
Scivetti AR., Garraza AM. (1997). El fenómeno vocal. San Luis. Editorial
Universitaria San Luis.
Segre R., Naidich S. (1981). Principios de foniatría para alumnos y
profesionales de canto y dicción. Buenos Aires: Editorial Médica
Panamericana.
Sundberg, J. (1987). The Science of the Singing Voice. Northem. Illinois
University Press.
Titze I., Scherer R. (1985). Vocal fold physiology. Biomechanics, acoustics
and phonatory control. The Denver Center for the Performing Arts.
Denver, Colorado.
Vila-Rovira et. al. (2011). Indicadores fonorrespiratorios de normalidad y
patología en la clínica vocal. Revista de Investigación en
Logopedia. 1: 35 – 55.
Wuyts F., et al. (2000). The dysphonia severity index: An objetive measure
of vocal quality based on a multiparameter approach. Journal of
Speech, Language and Hearing Reaserch. 43: 796 – 809.
Yanagihara N., Koike Y., Von Leden H. (1966). Phonation and Respiration.
Function Study in Normal Subjects. Folia Phoniatrica. 18: 323 –
340.
CAPÍTULO 3
Al estudiar la exploración morfo-funcional de la laringe es
inevitable referirse al origen de la técnica para visualizar la principal
estructura del proceso de producción de la voz. El español Manuel
Patricio García, considerado padre de la Laringología, cantante y maestro
de canto, realizó aportes importantes a la enseñanza del canto,
discriminó los conceptos de registro y calidad del timbre, estableció los
conceptos de voz cerrada, voz oscura, voz abierta y voz clara, y enseñó la
posición baja de la laringe y el “tono cubierto” durante el canto. Fue el
primer investigador de la laringe, pues en 1854 descubrió el uso del espejo
de odontología en el estudio visual de la laringe y llevó a cabo la primera
evaluación dinámica de la fonación (Fernández & Ruba, 2008). Cuatro
años después Johann N. Czermack, profesor de fisiología de la
Universidad de Pest, aplicaría a la exploración clínica la técnica de García
sustituyendo la iluminación solar por la luz artificial (Le Huche & Allali,
1993).
Desde entonces y hasta la actualidad, la exploración morfo-
funcional de la laringe a través de estudios por imágenes se ha realizado
de manera habitual en la valoración clínica de la voz y los métodos de
evaluación han evolucionado hasta alcanzar una avanzada tecnología.
Sin embargo, no hay un solo método de exploración que sea óptimo para
todos los pacientes con alteraciones de la voz, por lo cual es importante
conocer las características específicas de la estructura y función de cada
persona, el momento de la valoración en la evolución de la alteración,
además de las ventajas y desventajas cada una de las técnicas, con el fin
de encontrar y adaptar el método apropiado, teniendo en cuenta la
relación costo-beneficio para el adecuado diagnóstico clínico.
La exploración morfo-funcional de la laringe consiste en la
visualización de la laringe a través de instrumentos ópticos que permiten
la valoración anatómica y dinámica de los pliegues vocales y las
estructuras relacionadas. Las técnicas tradicionalmente utilizadas son la
Laringoscopia indirecta (también llamada Laringoscopia refleja), la
Endoscopia laríngea (con endoscopio rígido o flexible), la Laringo-
estroboscopia y la videoquimografía. Estos métodos permiten en
diferente medida la visualización de la estructura laríngea, el análisis
detallado de la vibración, el comportamiento de los pliegues vocales
durante la fonación y la descripción de la actividad glótica y supraglótica
(Casado, 2002; Fernández & Ruba, 2008; Jackson Menaldi, 2002).
Laringoscopia indirecta
La Laringoscopia indirecta fue la primera técnica utilizada en la
Laringología y la forma básica de exploración de la laringe. Aún en la
actualidad, en la clínica diaria, se hace uso del espejo laríngeo para llevar
a cabo este procedimiento que facilita al clínico el primer acercamiento a
la valoración estructural. Requiere del uso de una luz frontal y el espejo
laríngeo número 6, 7 u 8 cuyos diámetros son de 21, 23 y 25 milímetros
respectivamente (Fernández & Ruba, 2008). El paciente se sienta frente
al evaluador quien tracciona la lengua hacia afuera con una gasa, coloca
el espejo en la cavidad orofaríngea en un ángulo de 45°, apoyado sobre el
velo del paladar y elevando la úvula. Se le pide al paciente vocalizar el
fonema /i/ durante algunos segundos mientras el otorrinolaringólogo
visualiza la estructura y función laríngea. Ocasionalmente, el paciente
requiere de la aplicación de un anestésico en la zona velo faríngea para
disminuir el reflejo de náusea y facilitar la prueba (Figura 4).
Figura 4.
Procedimiento
Laringoscopia
Indirecta
Este procedimiento tiene como ventajas la facilidad de realizarla

en el consultorio de forma rápida, la exploración cómoda para el paciente,
la esterilización simple y la economía de la prueba dado que no requiere
de equipos de alta tecnología. Sus desventajas incluyen la dificultad de
algunos pacientes para tolerar la valoración por el aumento del reflejo de
náusea o por condiciones anatómicas complejas (como la forma de la
epiglotis o el cuello corto), no permite la grabación de la prueba en video
y la voz que se produce es de forma atípica por la posición elevada de la
laringe y la extensión de la lengua, lo que dificulta la visualización de la
comisura anterior de los pliegues vocales (Casado, 2002; Jackson
Menaldi, 2002).
Los hallazgos de la laringoscopia indirecta le permiten al médico
otorrinolaringólogo dar un diagnóstico inicial de la estructura laríngea
identificando si hay o no presencia de lesiones en los pliegues vocales,
pero no facilita el diagnóstico diferencial de las mismas. Ofrece una
información limitada sobre la función laríngea de cierre y apertura (en
fonación y respiración respectivamente) ya que la exploración no se da en
condiciones fisiológicas para la fonación. Sin embargo, este diagnóstico
inicial le posibilita al Fonoaudiólogo establecer una hipótesis diagnóstica
a partir de la relación entre la valoración estructural y funcional con las
características acústico-perceptuales de la voz. Generalmente, se
requiere la confirmación del diagnóstico a través de otros procedimientos
de valoración laríngea como la fibroendoscopia o la estroboscopia
laríngea, seleccionadas de acuerdo al criterio médico.
Endoscopia laríngea
A partir de la década de los años sesenta, la aparición de la fibra
óptica permitió el avance en la valoración laríngea, haciendo posible la
observación tanto de la anatomía como de la dinámica de la laringe. Estos
sistemas hacen posible obtener el registro de la imagen y el sonido en
tiempo real y se utilizan combinados con el registro y grabación de las
imágenes y el sonido, facilitando la documentación visual y auditiva de la
exploración de la función laríngea. Dependiendo del tipo de equipo que
se utilice, existen dos tipos de endoscopios para dicha valoración: la
endoscopia flexible mediante fibra óptica o fibroendoscopia y el
endoscopio rígido o telelaringoscopia (Fernández & Ruba, 2008).
Fibroendoscopia
Los fibroendoscopios son sistemas de endoscopia compuestos
por dos haces de fibras ópticas flexibles que constituyen un dispositivo a
modo de cable, con diámetros de 3,2 a 4 mm (Fernández & Ruba, 2008;
Faedda & M.S., 2010). Uno de los haces está destinado a la transmisión
de la imagen, el otro cumple la función de transmitir la luz procedente de
una fuente. La eficacia óptica del fibroendoscopio depende de la calidad,
número, diámetro y longitud de las fibras ópticas que lo componen; sin
embargo, sus propiedades ópticas son inferiores a las del
telelaringoscopio por presentar menor poder de magnificación,
iluminación reducida y menor resolución de sus imágenes (Fernández &
Ruba, 2008). El sistema hace posible la “incurvación” del extremo distal
que permite maniobrar el dispositivo para su ingreso a la región que se
desea explorar (Fosas nasales o estoma de traqueostomía), por lo cual se
considera un examen invasivo (Casado, 2002; Núñez - Maldonado -
Suárez, 2000).
La vía de introducción de la fibra óptica es la nasal, con previa
preparación del paciente, haciendo posible la visualización de estructuras
tales como las fosas nasales, el cavum, la rinofaringe, el velo del paladar
y el tracto vocal, tanto en reposo como durante las funciones de fonación,
respiración, el habla y el canto (Figura 5). Adicionalmente, es posible la
evaluación de las funciones del esfínter velofaríngeo, la función vocal y de
manera parcial, la fase faríngea de la deglución bajo circunstancias
fisiológicas normales y la recolección simultánea de datos a través de
otros estudios como la electroglotografía (EEG) (Ver Capítulo 6) o el
análisis acústico de la voz (Ver Capítulo 4). En este sentido, estas
características hacen que la fibroendoscopia sea de utilidad en la
valoración de las alteraciones funcionales de la voz superior a la que
aporta el telelaringoscopio (Fernández & Ruba, 2008; Faedda & M.S.,
2010).
Figura 5.
Procedimiento
Fibroendocopia
Este procedimiento se inicia con la preparación del paciente en

posición sedente, con la cabeza dirigida hacia el frente y el mentón abajo.
Se coloca anestesia tópica en la fosa nasal para disminuir la molestia del
paso de la fibra. Ocasionalmente, se hace necesaria la combinación del
anestésico con un vasodilatador. La inserción de la fibra óptica se realiza
por el piso de la fosa nasal, se dirige hacia atrás buscando la coana y se le
pide al paciente que respire para facilitar la relajación del velo del paladar
y la incurvación del extremo del fibroscopio para dirigirlo hacia la faringe.
En este punto, la ubicación de la fibra permite la visualización de los
movimientos del esfínter velofaríngeo, su suficiencia y competencia en
las funciones de fonación relacionadas con las características del timbre
de la voz y el adecuado cierre durante la deglución. Algunos autores
hacen uso de esta técnica como un instrumento para la retro-
alimentación visual de los movimientos velofaríngeos durante el habla
(Ysunza & Pamplona, 2002; Karnell & Moon, 2014).
Para continuar la exploración, el fibroscopio se puede ubicar por
encima de la entrada a la laringe desde donde es posible describir la
estructura laríngea en reposo (durante la respiración) y la descripción del
tipo de cierre laríngeo y la actividad supraglótica, que incluye la aducción
de los pliegues ventriculares y la contracción anteroposterior de las
estructuras supragóticas durante la fonación. Esta función se valora con
la producción de los fonemas /a/ o /i/, la conversación fluida, la emisión de
sílabas continuas /ji, ji, ji/, el rango de frecuencias durante la producción
de glisandos y el canto (Morrison & Rammage, 1996).
Como otros procedimientos de valoración laríngea, la
fibroendoscopia presenta algunas desventajas tales como el menor
grado de magnificación de la imagen, la iluminación reducida y le menor
resolución de la misma. Sin embargo, cuando todo el sistema está bien
acoplado y es manejado con agilidad por parte del médico, la prueba
permite describir la forma del cierre laríngeo, la valoración de las
“disfonías funcionales” sin alterar el comportamiento real de la laringe y
la detección de lesiones del borde libre de los pliegues vocales sin facilitar
su diagnóstico diferencial (Fernández & Ruba, 2008). Adicionalmente,
puede contar con sistemas de grabación que facilitan la revisión de la
prueba tantas veces como sea necesario.
Telelaringoscopia
El endoscopio rígido, también llamado telelaringoscopio está
formado por un tubo recto de aproximadamente 1 centímetro de
diámetro y 20 centímetros de longitud en cuyo extremo se ubica un lente
con una angulación de 70° o 90° (Morrison & Rammage, 1996). Los
endoscopios de última generación cuentan con un dispositivo de
conexión a una cámara de video que permite la proyección de la imagen
en una pantalla de televisión que incrementa el tamaño y la calidad de la
imagen, además de la maniobrabilidad del endoscopio por parte del
clínico (Fernández & Ruba, 2008).
Como todos los procedimientos, requiere de la explicación al
sujeto de evaluación sobre la forma de ejecución del examen. La
exploración se lleva a cabo en una situación no fisiológica dado que se
debe traccionar la lengua hacia afuera el tiempo que dure la prueba lo que
genera incomodidad para el paciente. El endoscopio se introduce
suavemente en la cavidad oral y se ubica por encima de la lengua y sin
tocar el velo del paladar, hasta visualizar adecuadamente los pliegues
vocales. En ocasiones es necesaria la utilización de un spray anestésico
con lidocaína para evitar el reflejo nauseoso. Se instruye adecuadamente
al paciente para alternar la respiración con la fonación de la vocal /i/
mantenida, con emisión a distintas alturas tonales y con distintas
intensidades (Figura 6). Cuando se usa un lente de 70° es necesaria una
ligera extensión del cuello y de la cabeza hacia atrás, posición que facilita
la exploración por parte del clínico.
Figura 6. Procedimiento
Telelarinogoscopia
Las ventajas de este procedimiento están relacionadas con sus

características ópticas, como la claridad y magnificación de la imagen,
que proporcionan una mejor visualización de la estructura de los pliegues
vocales y sus posibles lesiones. Al igual que la fibroendoscopia, puede
contar con sistemas de grabación para garantizar la revisión de la prueba
las veces que sea necesario. Una de las desventajas es el empañe del lente
que se puede evitar con procedimientos como humectación del lente con
la saliva o líquido anti-empañamiento o colocando aire caliente sobre el
lente.
Videoestroboscopia
Para lograr una mayor comprensión de este procedimiento es
preciso tener claridad sobre sus principios básicos. Primero, es necesario
entender la fisiología fonatoria abordada desde las variadas teorías que
explican los mecanismos de la voz. El aire que sale de los pulmones y pasa
a través de la glotis produce la ondulación de la mucosa de los pliegues
vocales y a su vez, un movimiento de apertura y cierre denominado “ciclo
vocal” o “ciclo vibratorio” el cual se repite muchas veces. El ciclo vibratorio
presenta de manera intercalada una fase de cierre en la cual los pliegues
se unen por el efecto de la elasticidad y de la disminución de la presión
subglótica, y una fase de apertura en la cual dicha presión separa los
pliegues vocales (Figura 7). La sucesión de ciclos vibratorios produce la
señal sonora que presenta una frecuencia fundamental dada por el
número de contactos en un período de tiempo y una intensidad definida
por la fuerza del contacto de los pliegues vocales (Jiang – Lin – Hanson,
2000; Núñez B, 2008).
Figura 7.
Representación del
ciclo vibratorio
(Fuente: Núñez, 2011)
Otro principio básico en esta técnica ha sido descrito a partir de

la Ley de Talbot: cuando una imagen incide en la retina, permanece en
ella durante 0,2 segundos, esto se denomina persistencia de la imagen. El
movimiento de apertura y cierre de los pliegues vocales se repite desde
100 ciclos/segundos en un hombre hasta 280 ciclos/s en un niño,
fenómeno que no puede ser captado fácilmente en cada una de sus fases
por el ojo humano. Si este movimiento se ilumina con una serie de
destellos de luz o flashes de manera sincrónica a la frecuencia de cierre y
apertura de los pliegues vocales, se produce una ilusión óptica que
permite ver dicho movimiento en cámara lenta (Cobeta, Núñez, &
Fernández, 2013).
La estroboscopia laríngea, también llamada
laringoestroboscopia, se ha convertido en uno de los métodos más útiles
de los que se dispone para el diagnóstico de los trastornos de la voz, al
permitirnos observar con precisión y detalle las alteraciones de la
ondulación de la mucosa y la situación del borde libre del pliegue vocal.
Su reproducción a 25 imágenes por segundo permite la visión enlentecida
del ciclo vibratorio completo y nos ofrece una imagen compuesta de éste,
obtenida por la iluminación intermitente de varios ciclos consecutivos. Lo
que vemos en realidad es la suma de fragmentos del ciclo vibratorio que
difieren ligeramente entre sí y que, presentados consecutivamente,
generan la impresión visual de un ciclo completo (Fernández González -
Sánchez Ferrandis - Vázquez de la Iglesia - Rey Martínez, 2006).
La laringe es una estructura de fácil acceso para la valoración por
parte de los clínicos a través de procedimientos que permiten su
visualización (anteriormente descritos). Sin embargo, en muchos casos
se hace necesario recurrir a la apreciación a través de videoestroboscopia
laríngea cuando se desea ampliar la evaluación estructural y funcional del
patrón vibratorio, especialmente útil para el diagnóstico diferencial de
nódulos, pólipos y quistes de pliegues vocales, visualización de
alteraciones cicatriciales, sulcus vocalis y de pequeñas lesiones que no se
identifican en el diagnóstico inicial, incluyendo el cáncer laríngeo
(Jackson Menaldi, 2002). La estroboscopia proporciona una imagen más
clara del funcionamiento de los pliegues vocales, y de la estructura
anatómica adyacente, gracias a la tecnología que con cámaras de video
de alta definición brindan una mayor resolución espacial de la función
fonatoria, captando los movimientos de la onda mucosa de los pliegues
vocales, lo que permite un análisis inmediato y también un registro
permanente para la comparación con otro examen realizado
posteriormente.
La videoestroboscopia juega un papel central en las decisiones
de diagnóstico, terapia y procedimientos quirúrgicos, durante el manejo
y tratamiento de los trastornos de la voz teniendo en cuenta “dos
fenómenos visuales: la percepción sin parpadeos de la luz y la percepción de
movimiento aparente” (Mehta & Hillman, 2010). Este muestreo de los
movimientos de los pliegues vocales varía según el fabricante, los
sistemas de KayPENTAX desencadenan una fuente de luz de xenón para
iluminar la laringe con duración de flash de 5 microsegundos, el sistema
ATMOS parpadea un diodo con una fuente de luz (LED) y el sistema
JEDMED emplea una fuente de luz constante, llevando a cabo el
muestreo estroboscópico electrónicamente del sensor de imagen a la
cámara (Mehta & Hillman, 2012).
Para la ejecución de la estroboscopia laríngea se ubica al
paciente en posición sedente, con la cabeza ligeramente levantada. Para
la adecuada visualización de la glotis, se utiliza un endoscopio rígido cuyo
lente puede tener una angulación de 70° o 90º. Se realiza el mismo
procedimiento que en la telelaringoscopia, introduciéndolo en la cavidad
oral, ubicado por encima de la lengua y sin tocar el velo del paladar, hasta
visualizar los pliegues vocales. Se solicita al paciente realizar la fonación
de la vocal /i/ mantenida inicialmente en el tono habitual de habla del
usuario, con frecuencia e intensidad cómodas y posteriormente a
distintas alturas tonales. La señal de la frecuencia fundamental es
recogida a través de un micrófono o un electroglotógrafo ubicado en el
cuello, a la altura del cartílago tiroideo con el fin de registrar la vibración
cordal. El dispositivo convierte la señal eléctrica en señal acústica, la cual
regula la cadencia del destello de la lámpara estroboscópica, permitiendo
el efecto del movimiento cordal en cámara lenta. Las imágenes tomadas
a través del endoscopio se digitalizan a través de una videocámara para
realizar un análisis detallado del movimiento laríngeo (Figura 8).
Figura 8. Ejecución de la
Video estroboscopia.
Fuente: Sastoque y cols,
2016. Centro Médico
Imbanaco. Cali, Colombia.
Interpretación de los hallazgos en la Videoestroboscopia

A continuación, se describen los parámetros fundamentales para
la evaluación de la estroboscopia de acuerdo a diferentes autores
(Casado, 2002; Cobeta Marco, A. & García López, 2008; Kelley – Colton –
Casper – Paseman – Brewer, 2011; Mehta & Hillman, 2012; Banjara –
Mungutwa – Singh & Gupta, 2012; Printza – Triaridis & Themelis, 2012;
Fernández & Ruba, 2008; Cobeta – Núñez & Fernández, 2013).
 Frecuencia fundamental de la emisión vocal: es el número de ciclos
vibratorios de los pliegues vocales por segundo. La F0 es registrada
en la pantalla del estroboscopio al igual que sus variaciones durante
la prueba. Su unidad de medida son los ciclos por segundos o Hertz
(Hz).
 Borde libre de los pliegues vocales: se valora la suavidad y rectitud
del borde libre caracterizándolo como liso y recto o rugoso e
irregular.
 Cierre glótico: la oclusión de la glotis es dada por el movimiento de
aducción de los pliegues vocales durante la fonación. En
condiciones normales el ciclo vibratorio se caracteriza por un cierre
glótico completo. En la voz de pecho la fase de cierre puede ser
prolongada y en voces cuchicheadas o en la voz de falsete es
considerado normal el cierre incompleto. Ante la presencia de
lesiones en el borde libre del pliegue vocal, el cierre glótico toma
generalmente la forma en “reloj de arena”. Otras formas de cierre
glótico incompleto son los cierres posterior, anterior, irregular,
fusiforme o longitudinal. El cierre incompleto está relacionado con
la parálisis en abducción de los pliegues vocales uni o bilateral, que
ocasiona una pérdida de aire, fatiga y voz soplada con disminución
del volumen.
 Fase de cierre: este parámetro permite calificar el predominio de
las fases del ciclo vibratorio (abierta o cerrada). La fase de cierre
tiende a ser abierta en voces sopladas o de comportamientos
hipotónicos, y con predominio de fase cerrada en voces de
comportamientos hipertónicos.
 Amplitud: se refiere al grado de desplazamiento lateral de la onda
mucosa con respecto a la línea media de la glotis. Este parámetro
se valora de manera independiente para cada pliegue vocal con el
fin de determinar si existe asimetría en la amplitud, lo que indicaría
que las propiedades biomecánicas son diferentes entre ambos
pliegues vocales. La amplitud será mayor cuando la presión
subglótica sea mayor y, por lo tanto, se aumente la intensidad.
Estará disminuida cuando se aumente la frecuencia, el pliegue
vocal sea más rígido y cuando presente mayor masa (en caso de
lesiones como sulcus vocalis, cicatrices, nódulos o pólipos). La
disminución de la amplitud de la onda mucosa es el método más
fiable para la detección del sulcus vocalis.
 Onda mucosa: es el grado de ondulación de la mucosa que se
propaga a través del pliegue vocal, desde la subglotis hasta la glotis
y parte superior del mismo. El grado de ondulación depende de la
visco-elasticidad o de la rigidez del tejido de la cubierta del pliegue
vocal. Se describirá como onda mucosa aumentada cuanto mayor
sea la presión subglótica, por ejemplo, en la fonación intensa,
cuando el pliegue vocal esté flácido o cuando el epitelio del pliegue
vocal esté aumentado como en el edema de Reinke o en la
degeneración polipoidea. La onda mucosa estará disminuida
cuando la mucosa esté menos rígida por la presencia de lesiones o
cicatrices. Será ausente cuando esté asociada a fibrosis, cicatrices
amplias o lesiones profundas como los carcinomas.
 Periodicidad o Regularidad: es el grado en que los ciclos vibratorios
sucesivos se parecen entre sí. Este parámetro se clasifica como
periódica o aperiódica en lesiones como edemas, cicatrices,
leucoplaquias o carcinomas.
 Simetría: permite describir el desplazamiento y aproximación de
los pliegues vocales para encontrarse en la línea por medio de sus
movimientos de apertura y cierre, los cuales deben ser
coordinados. Se encuentra asimetría en la mayoría de lesiones que
comprometen el borde libre de los pliegues.
 Actividad supraglótica: este aspecto valora el grado de actividad de
las estructuras laríngeas por encima de la glotis como el complejo
ariepiglótico o las bandas ventriculares. Se describe el movimiento
de las bandas ventriculares cuando existen mecanismos
compensatorios durante la fonación de comportamiento
hipertónico.
A partir del análisis de los aspectos anteriormente descritos, la
estroboscopia laríngea facilita el diagnóstico diferencial de las disfonías
funcionales, lesiones orgánicas, cicatrices vocales, parálisis, asimetrías de
los pliegues vocales u otras patologías y características específicas.
Además, permite escuchar la voz de un paciente mientras
simultáneamente se observa el movimiento de los pliegues vocales,
facilitando la descripción del estado o calidad de la función vocal (Mehta,
Deliyski, & Quatieri, 2011).
La videoestroboscopia es un examen fundamental para
identificar dichas patologías, sin embargo, se reconocen las dificultades
subjetivas en la interpretación de las imágenes estroboscópicas por
diferentes evaluadores, razón por lo cual es importante realizar otros
exámenes complementarios como la electroglotografía y evaluaciones
que den cuenta de las características fonatorias, acústicas y
aerodinámicas, para de esta forma dar un diagnóstico más preciso de las
diferentes patologías vocales (Banjara – Mungutwar – Singh & Gupta,
2012; Kelley – Colton – Casper – Paseman & Brewer, 2011).
Videoquimografía (VKG)
La Videoquimografía o Videokimography (VKG) es un
procedimiento considerado dentro de las videoendoscopías, y permite la
visualización de la vibración de los pliegues vocales a través del uso de
una cámara de alta velocidad que es capaz de obtener 7.812,5 registros
fotográficos por segundo, posibilitando el análisis de las características
de cada ciclo vibratorio que componen la vibración cordal (Hiroshi Tsuji &
Ubirajara Semes, 1998). La imagen final es capaz de mostrar la onda
mucosa en el borde superior e inferior, en una sucesión de ciclos con gran
detalle (Svec & Schutte, 1996).
Fue diseñado por Svec & Schuttle (1996), y a diferencia de la
videoestroboscopia posibilita también la visualización de las vibraciones
aperiódicas. Su utilidad actualmente es en la clínica y en investigación
(Svec & Schutte, 1996; Wittenberg – Tigges – Mergell - Eysholdt, 2000;
Fric – Sram – Svec, 2006; Qiu & Schutte, 2006; Lohscheller – Svec –
Döllinger, 2013; Vydroba – Svec – Sram, 2015) y se utiliza como un
examen complementario a la exploración estroboscópica.
Esta cámara de alta velocidad puede generar de forma
simultánea dos tipos de imágenes:
a. Imágenes de una laringoscopia estándar, donde pueden verse
claramente las estructuras laríngeas (Figura 9a), o
b. Quimografía, revelando detalles de la vibración de los pliegues
vocales (Figura 9b).
Se puede regular la alternancia entre ambos modos a través del
uso de un pedal de conversión.
Figura 9.
Videokimografía
La VKG es una herramienta muy valiosa para reconocer el
funcionamiento anormal de los pliegues vocales durante cada ciclo
vibratorio, comprendiendo mejor la naturaleza del desorden vocal y
realizando un aporte de alto impacto en el diagnóstico de ciertas
patologías vocales. Es particularmente útil en casos donde la estructura
de los pliegues vocales no presenta anormalidades, pero la voz si presenta
alteraciones (Vidrova, Svec & Sram, 2015).
Banjara H., Mungutwar V., Singh D., Gupta A. (2012). Demographic and
Videostroboscopic Assessment of Vocal Pathologies. Indian J
Otolaryngol Head Neck Surg. 64 (2): 151 – 157.
Casado, J. (2002). La Evaluación Clínica de la Voz: Fundamentos Médicos
y Logopédicos. España: Editorial Aljibe.
Cobeta Marco IA., García López I. (2008). Evaluación clínica de la
Fonación. Laboratorio de voz. En C. Suárez Nieto, Tratado de
Otorrinolaringología y Cirugía de cabeza y cuello. Madrid: Médica
Panamericana. 3 (3): 2545 – 2567.
Cobeta I., Núñez F., Fernández S. (2013). Exploración funcional por la
imagen: Estroboscopia. En I. Cobeta F., Núñez F., Fernández S.
Patología de la voz. Barcelona: Marge Médica Books. 1° ed. 1:
146 – 158.
Faedda, MS. (2010). Diagnóstico por imagem em fonoaudiología. Rio de
Janeiro: Revinter.
Fernández González S., Sánchez Ferrandis N., Vázquez de la Iglesia F.,
Rey Martínez J. (2006). Técnicas digitales para la valoración
laringoscópica. Revista de Medicina Universidad de Navarra. 50
(3): 19 – 30.
Fernández S., Ruba S. (2008). Exploración visual de la laringe. En C.
Suárez Nieto, Tratado de Otorrinolaringología y Cirugía de
cabeza y cuello. Editorial Médica Panamericana. 2° ed. 3 (170):
2519 – 2544.
Fric M., S.F. (2006). Voice registers, vocal folds vibration patterns and their
presentation in videokymography; Proceedings acoustics High
Tratas 06. En T. University. (Ed.), 33rd International Acoustical
Conference – EAA Symposium, Strbske Pleso, Slovakia. 1: 42 – 45.
Hiroshi Tsuji D., H. S. (2008). Videoquimografría de Laringe: novo
método de avaliacao da vibracao cordal. Arq Fund
Otorrinolaringol., 2(4): 136 – 140.
Jackson Menaldi, MC. (2002). La Voz Patológica. Buenos Aires,
Argentina: Editorial Panamericana.
Jiang J., Lin E., Hanson D. (2000). Vocal fold physiology. The
Otolaryngologic Clinics of North Americ. 33: 699 – 718.
Karnell M., Moon J. (2014). Technical Advances Toward an Endoscopic–
Phototransducer Approach to Investigation of Velopharyngeal
Physiology. Journal of Speech, Language, and Hearing Research.
57: 2152 – 2161.
Kelley RT., Colton RH., Casper J., Paseman A., Brewer D. (2011).
Evaluation of Stroboscopic Signs. Journal of Voice. 25 (4): 490 –
495.
Le Huche F., Allali A. (1993). La voz. Anatomía y Fisiología. Patología.
Terapéutica. Tomo II. España: Masson, S.A.
Lohscheller J., Svec J., Döllinger M. (2013). Vocal fold vibration amplitude,
open quotient, speed quotient and their variability along glottal
length: Kymographic data from normal subjects. Logoped
Phoniatr Vocol. (38): 182 – 192.
Mehta DD., Hillman RE. (2012). Current role of stroboscopy in laryngeal
imaging. Curr Opin Otolaryngol Head Neck Surg. 20 (6): 429–436.
Mehta DD., Deliyski DD., Hillman RE. (2010). Why laryngeal stroboscopy
really works: Clarifying misconceptions surrounding Talbot’s law
and the persistence of vision. J Speech Lang Hear Res. 53 (5): 1263
– 1267.
Mehta DD., Deliyski DD., Quatieri TF. (2011). Automated measurement of
vocal fold vibratory asymmetry from high-speed videoendoscopy
recordings. J Speech Lang Hear Res. 54(1): 47 – 54.
Morrison M., Rammage L. (1996). Tratamiento de los trastornos de voz.
Barcelona, España: Editorial Masson.
Nuñez, BF. (2008). Función Fonatoria. En C. Suárez Nieto, Tratado de
Otorrinolaringología y Cirugía de cabeza y cuello. Madrid:
Médica Panamericana. 3: 2503 – 2517.
Núñez BF., Maldonado FM., Suárez NC. (2000). Cuidados y rehabilitación
del paciente traqueotomizado. Asturias: Servicio de
Publicaciones de la Universidad de Oviedo.
Printza A., Triaridis S., Themelis C., Constantinidis J. (2012). Stroboscopy
for benign laryngeal pathology in evidence based health care.
16(4): 324 – 328.
Qiu Q., Schutte H. (2006). A new generation videokymography for routine
clinical vocal fold examination. Laryngoscope. (116): 1824 – 1828.
Svec J., Schutte H. (1996). Videokimography: high-speed line scanninf of
vocal fold vibration. Journal of Voice. 10 (2): 201 – 205.
Vydrova J., Svec J., Sram F. (2015). Videokimography (VKG) in Laryngologic
Practice. Journal MHM. 3 (1): 87 – 95.
Wittenberg T., Tigges M., Mergell P., Eysholdt U. (2002). Functional
imaging of vocal fold vibration: digital multislice high-speed
kymography. Journal of Voice. 14: 422 – 442.
Ysunza A., Pamplona M. d. (2002). Diagnóstico y tratamiento de los
trastornos de articulación en el niño con paladar hendido.
México: Editorial Porrúa, S.A.
CAPÍTULO 4
El análisis acústico de la voz se ha convertido en una de las
formas de evaluación más difundidas y extendidas, incluido en el
conjunto Laboratorio de la voz.
Sus utilidades son diversas y su accesibilidad lo hace cada vez
más cercano a la pesquisa vocal de rutina. No solo se usa como
herramienta para el diagnóstico, sino también para el seguimiento de
tratamientos terapéuticos y/o quirúrgicos; se aplica en fonoaudiología
forense para la detección de hablantes; es útil para visualizar el trabajo y
evolución en voces profesionales, y proporciona una retroalimentación
visual posible de ser usada durante la terapia vocal.
Antes de darnos a la tarea de lectura-interpretación de gráficos
y datos, es necesario salvar posibles distancias en relación a la física
acústica, ya que muchos conceptos son inherentes a esta disciplina y es
preciso tener la claridad suficiente para evitar confusiones y aprovechar
al máximo este recurso.
Ondas simples y ondas complejas

Estamos rodeados por una cantidad infinita de ondas de todo
tipo, pero hemos sido creados con receptores capaces de decodificar una
cantidad limitada. Entre las ondas de luz y las ondas magnéticas, se
encuentran las ondas sonoras. En la naturaleza existen sonidos por
doquier y de la naturaleza misma es que tomamos estos estímulos para
estudiarlos y conocerlos. Es así que la voz no es un sonido cualquiera, sino
uno capaz de ser producido por un complejo mecanismo generado en
nuestro propio cuerpo.
La voz que podemos llegar a escuchar proveniente de cualquier
persona sobre el planeta tiene identidad propia, por decirlo de alguna
manera. Sin embargo, no siempre somos conscientes de cuáles son los
verdaderos rasgos que confieren inconfundible apariencia a las voces de
aquellos que conocemos.
En primer lugar, acústicamente hablando, el sonido vocal (o
cualquier sonido proveniente de nuestro entorno cotidiano) no es un
único elemento indiferenciado, sino el resultado de la suma de infinitas
ondas denominadas armónicos. Los armónicos o sobretonos (ondas
simples) son funciones senoidales, múltiplos enteros entre sí, que se
conjugan de tal manera, que de su síntesis surgen los sonidos que
conocemos y oímos (ondas complejas).
Este principio, quizás matemáticamente complicado, pero
sencillo en palabras, denominado Teorema de Fourier, puede ser
enunciado de la siguiente manera: Toda función periódica [onda
compleja], puede descomponerse en una suma de sinusoides armónicas, de
amplitudes y fases adecuadas [ondas simples]. O, dicho de otro modo:
Toda función periódica [onda compleja] puede construirse a partir de una
suma de sinusoides cuyas frecuencias formen una serie armónica [ondas
simples]. Cada sinusoide debe poseer la adecuada amplitud y fase, que se
determinará de la función periódica a sintetizar (Basso, 2001).
En segundo lugar, cuando el sonido se abre paso ante nuestros
oídos, no solo nos informa de su naturaleza, origen e identidad, sino que
además trae consigo cualidades decodificables por nuestro sistema
auditivo. Estos parámetros comunes a cualquier sonido son: frecuencia,
intensidad y timbre.9
La unidad que cuantifica la frecuencia se denomina Herz (Hz) o
hercio. Esta medida representa la cantidad de ciclos por una unidad de
tiempo convencional que, en este caso por la rapidez con la que se da la
perturbación, es el segundo. Por medio de ella podemos conocer el
comportamiento del generador acústico: la laringe.
Figura 10. Espectro sonoro.

La primera línea vertical
dentro del gráfico (de
izquierda a derecha) es el
primer armónico,
frecuencia fundamental o
f0. Las líneas restantes que
decrecen
proporcionalmente son los
denominados armónicos.
El movimiento del oscilador (pliegues vocales), en presencia del
aire espirado, perturba el medio tantas veces como ciclos por segundo
detalla la frecuencia. El número absoluto de Hz determinará el valor de lo
que se conoce como frecuencia fundamental o f0, y esta información
será obtenida de la primera onda simple de la serie armónica, según dos
sencillas razones: el primer armónico o fundamental de la serie, es el
mínimo común múltiplo de todas las ondas subsecuentes, por lo tanto,
incluye en sí mismo a las restantes; la segunda razón, es porque no
presenta pérdida de energía como los que a él suceden (Figura 10).
La cantidad de Hz originados en la fuente, puede ser
perceptualmente asimilada con lo que se describe como altura tonal o
tono10, es decir, a cada frecuencia forjada por el generador se le buscará
un parecido o análogo dentro de la escala tonal musical (Basso, 2001).
Ésta (la altura tonal) depende fuertemente de la periodicidad del
estímulo. Mientras mayor periodicidad exista, mayor será la
correspondencia tonal audible. Mientras menor periodicidad caracterice
a la onda, mayor perturbación ruidosa se escuchará.
Existen valores de referencias alrededor de los cuales se ubica
tonalmente la voz de acuerdo al sexo y la edad del sujeto. Los valores
expuestos en la Tabla 3 son un reflejo de ello.
Sexo Masculino Sexo Femenino

Edad Media f0 (Hz) Edad Media f0 (Hz)
7 294 7 281
8 297 8 288
10 270 11 238
11 227 19 217
Tabla 3. Valores de
14 242 20-29 224 frecuencia
fundamental
19 117 30-40 196 propuestos según el
sexo y la edad
Adulto 132 40-50 189
(Adaptado de
20-29 120 60-69 200 Colton, Casper &
Hirano, 1996)
30-39 112 70-79 202
40-49 107 80-94 200
50-59 118
60-69 112
70-79 132
80-89 146
Es importante también aclarar que no todos los armónicos de la
serie poseen igual importancia perceptual. Los seis primeros se destacan
nítidamente porque están separados por un intervalo que supera el ancho
de banda crítico11. A partir del séptimo armónico, la distancia es cada vez
menor entre ellos, las bandas críticas se solapan entre sí y el aporte a la
sonoridad total decrece significativamente.
La intensidad es el parámetro acústico que busca expresar la
cantidad de energía que del estímulo original se irradia o la variación de
presión que la perturbación genera, según como se interprete. El control
de la intensidad a nivel vocal, está dado por la presión de aire proveniente
de los pulmones, la aducción glótica y la acción del tracto vocal ejercida
sobre el estímulo sonoro. La unidad de medida utilizada en el análisis
acústico para expresar esta cualidad, es el decibel (dB).
Esta variación, ya sea de presión o de energía, es lo que muchas
veces mal llamamos volumen, y su sensación corresponde al concepto de
sonoridad. En la Tabla 4, se entregan valores normales de intensidad
vocal según la actividad del hablante.
Voz cuchicheada 20-30 dB
Voz confidencial 40-50 dB
Voz coloquial 50-60 dB a un metro de distancia

Tabla 4. Valores
normales de intensidad
según la actividad del Voz proyectada 60-70 dB
hablante (Adaptado de
Cobeta, Núñez y Voz de apremio, de
Fernández, 2013) 70-90 dB
exclamación
Grito 100 dB
Gran Ópera 120 dB
Finalmente, el timbre es la característica más compleja ya que

involucra numerosos elementos que no percibimos ni somos capaces de
disociar de la concentración sonora vocal. Para entender esta cualidad,
desde el punto de vista acústico, debemos regresar al concepto de onda
simple (armónico) y sumar a él el de tracto vocal y formantes, ya que de
ellos obtendremos buena parte de la respuesta.
A nivel glótico, se obtiene una señal inicial equilibrada y
proporcional (Figura 11a), la energía de los sobretonos decrece a un ritmo
de 12dB por octava por lo que no hay bandas de frecuencias reforzadas a
lo largo del espectro. Sin embargo, cuando éste llega a inmediaciones del
tracto vocal, la distribución de la energía a lo largo de los armónicos
cambia, aparecen focos espectrales reorganizados y la señal resultante
más distinta a la que se generó en la fuente (Figura 11c). La teoría que
define la relación entre fuente glótica y tracto vocal se denomina Fuente-
Filtro (Fant, 1960).
10.a 10.b
Figura 11. Espectro sonoro original (sin filtrar),

representación del comportamiento acústico del
filtro, señal filtrada.
10.c
Este proceso de transformación acústica, permite la

identificación de aquello que mencionamos en el párrafo anterior como
“focos espectrales”, de aquí en adelante, Formantes (F). ¿Cómo
definiríamos entonces a estos nuevos componentes?
Los formantes son una propiedad adquirida del tracto vocal,
frecuencias propias de resonancia que obedecen directamente al largo,
ancho y viscosidad natural del mismo. Se puede identificar un número
infinito dentro del espectro. Su presencia y definición hablan de un
proceso acústico enriquecido o deficiente.
Aquellos que más información aportan para la inteligibilidad de
la palabra y el reconocimiento de las vocales, son los formantes 1 y 2. El
formante 1 (F1) está relacionado directamente con la posición de apertura
y cierre de la boca (comportamiento mandibular). Cuando hay mayor
apertura, la frecuencia de F1 aumenta; cuando la apertura disminuye, la
frecuencia lo hace directamente proporcional. En tanto que el formante
2 (F2) se modifica según la forma del cuerpo de la lengua. Cuando la
lengua comprime la parte anterior del tracto la frecuencia de F2 aumenta,
en cambio, si comprime la parte posterior, F2 disminuye (Figura 12).
F3, F4 y F5 tienen relación directa con la característica tímbrica y
la altura espectral. Por tratarse de frecuencias más elevadas, no existe
tanta dependencia en relación a los órganos de la articulación, sino más
bien están subordinadas a las constricciones o acortamientos propias del
tracto vocal en su conjunto (Sundberg, 2015).
Figura 12. Carta de

formantes. Tracto
vocal. Polígono
vocálico
En los programas de análisis acústico, es posible observar el

comportamiento de las cualidades mencionadas, conocer el valor
absoluto en alguno de sus puntos o un promedio de ellos a lo largo de
toda su extensión. No obstante, el único parámetro que no se visualiza
categóricamente es el timbre.
Gráficos y recursos visuales para el Análisis Acústico

Durante el análisis acústico, son numerosos los gráficos y
recursos visuales con los que nos podemos llegar a encontrar. Cada cual
presenta un tipo de información distinta y es preciso saber hacer una
correcta lectura de cada uno de ellos.
El primer gráfico, y más frecuente de ver en los programas de
edición de sonido, es el oscilograma12 (Figura 14). Posee dos ejes (vertical
y horizontal); el eje de las ordenadas [y] establece niveles para la amplitud
(energía) y el de las abscisas [x], circunscribe el tiempo. La curva graficada
a lo largo de estos ejes representa el movimiento de la partícula a través
del tiempo, a la que se le aplicó una cierta cantidad de energía (Figura 13).
La línea 0 (cero), ubicada equidistante de los extremos de [y], representa
la quietud o punto de equilibrio.
El contorno que dibuja la curva presente en un oscilograma,
puede tomar valores positivos que alcanzan una máxima amplitud dada
en el punto más alejado de la línea 0 –cero- (máxima compresión de las
partículas de aire), para luego desandar el camino hacia valores negativos
(máxima rarefacción o descompresión de las partículas de aire),
regresando a su punto de partida.
Figura 13. Movimiento de

una partícula a través del
tiempo
Figura 14. Oscilograma. Trazando una

línea que una todos los puntos del
gráfico de abajo, se obtiene como
resultado la curva de Un ciclo
(derecha)
Este camino descrito por la curva en cuestión, que parte de un

punto de equilibrio, hacia otro de máximo valor positivo, de allí a un punto
de máximo valor negativo y llega nuevamente a su punto de armonía, es
lo que se denomina ciclo. Y el tiempo en que un ciclo tarda en
completarse, se llama período (P).
Conociendo el valor del período (P) es posible determinar la
frecuencia de un sonido, y viceversa; conociendo el valor de la frecuencia,
es posible conocer el valor del período, según se observa en la Figura 15.
Figura 15. Período y

frecencia de una
onda
El segundo tipo de gráfico más frecuente en análisis acústico se

denomina espectrograma, una suerte de negativo fotográfico del sonido
audible.
Sobre el eje de las abscisas se ubica la variable tiempo, no
obstante, a diferencia del oscilograma, el eje de las ordenadas representa
la frecuencia en Hz; y el valor 0 (cero) no se encuentra a medio camino
sobre el eje [y], sino en la intersección de ambos, en el extremo inferior
izquierdo. La claridad u opacidad del gráfico (escala de grises) da somera
cuenta de la intensidad con la que se presentan los estímulos a lo largo de
todo el espectro sonoro.
Existen dos clases de espectrogramas (dos tipos de filtros
visuales) según como se mire, y hay autores que reconocen que sólo el
análisis de éstos, puede proporcionar información suficiente para tratarlo
como una prueba más, distinta dentro del conjunto de herramientas de
evaluación. Lo que se ha dado a llamar espectrografía (Núñez Batalla y
Suárez Nieto, 1999).
Los dos tipos de espectrogramas que encontramos se
denominan de banda estrecha, también llamado de banda angosta
(Figura 16), y de banda ancha (Figura 17).
El gráfico de banda estrecha o angosta, parece desenvolverse
de modo horizontal. Cada una de las estrías paralelas, continuas y
equidistantes es la representación de los componentes armónicos del
sonido. Se dice por ello, que este gráfico tiene buena resolución
frecuencial, pero mala resolución temporal.
Figura 16.
Espectrograma de
banda estrecha
El gráfico de banda ancha, presenta estrías más bien verticales

y cada una hace referencia a los pulsos glóticos. Observando con
detenimiento, también es posible identificar nubes delgadas y
constantes dispuestas en un plano horizontal, estas son los denominados
formantes. Este gráfico, a diferencia del anterior, tiene buena resolución
temporal, aunque mala resolución frecuencial.
Figura 17.
Espectrograma de
banda ancha
Basado en las representaciones anteriores, Cecconello (2012)

estableció una clasificación para las disfonías de acuerdo al
comportamiento espectrográfico que se observe (Tabla 5).
Estas categorías no son mucho más diferentes a las propuestas
por Yanagihara (1967), o Núñez Batalla et al. (2004) para el caso de voces
asténicas (Ver Capítulo 5). De esta manera y por separado, Cecconello y
Yanagihara toman un criterio similar, teniendo en cuenta el grado de
acumulación de ruido sobre todo alrededor de las frecuencias de F1 y F2,
niveles de ruido por encima de los 3000 Hz y la pérdida de componentes
armónicos de alta frecuencia.
Banda de frecuencia
Tipo de disfonía Descripción
afectada
Ausencia de
0-5000 Hz Afonía estructura
armónica
Solo presenta
500-5000 Hz Alteración severa frecuencia
fundamental
Tabla 5. Clasificación de Alteración

las disfonías, adaptado 1000/1500-5000 Hz moderada a
de Cecconello, 2012
severa
Alteración
2000/2500-5000 Hz
moderada
Alteración
3000-5000 Hz
moderada a leve
3500/4000-5000 Hz Alteración leve
Alteración
4500-5000 Hz
mínima
El último de los gráficos que nos parece importante destacar es

el espectro sonoro, la representación de una pequeñísima porción de
señal. No existe un único tipo de espectro, y de entre los diversos que
encontramos tenemos espectro FFT (Fast Fourier Transform), LCP
(Linear Predictive Coding), Cepstrum, Autocorrelación y Espectro medio
o LTAS (Long term average spectrum). Entre los mencionados, solo
describiremos los dos primeros y el último debido a su rápida lectura y
obtención de acuerdo a los programas con los que se trabaje.
En cada uno de los anteriores, el eje vertical estratifica la
intensidad en decibeles (dB), y en el eje horizontal se distribuye
proporcionalmente la frecuencia (Hz). Estos gráficos extraen la
información en un punto determinado de la señal, es por eso que no
cuentan con valores temporales.
En el espectro FFT (Figura 18), al igual que en el espectrograma
de banda estrecha, se pude observar cada una de las ondas simples
(armónicos) en forma de picos verticales contiguos, pudiendo medir su
valor en intensidad y frecuencia con suma precisión.
Figura 18. Espectro FFT

o Fourier Fast Trasform
(Transformada rápida
de Fourier) para la
vocal /i:/
El espectro LCP (Figura 19), en simultáneo con el espectrograma

de banda estrecha, permite el seguimiento de los formantes. Dado que
estos no tienen una relación proporcional entre sí, la curva no es del todo
igual. En este gráfico cada formante está representado por un ascenso,
un pico y una caída alrededor de un grupo de frecuencias.
Figura 19. Espectro

LPC o Linear Predict
Coding para la vocal
/i:/
La Figura 20 es una combinación de los anteriores presentados

en un mismo cuadro. Se puede observar la coincidencia de frecuencia e
intensidad entre armónicos y formantes.
El espectro LTAS (Figura 21) a diferencia de los anteriores, es un
promedio de todas las secciones de la onda, una colección de espectros
momentáneos que revelan la contribución de la fuente glótica y del filtro
en la resultante vocal.
En efecto, los picos o regiones de mayor concentración de
energía del LTAS, están fuertemente relacionados con la percepción de
diferentes cualidades vocales (Hammarberg et al., 1986; Sundberg, 1987;
Leino, 1993), y aquellos parciales armónicos de la región más aguda, son
de extrema importancia para nuestra apreciación del timbre.
Figura 20. Espectro FFT y

LPC superpuestos para la
vocal /i:/
Figura 21. Espectro LTAS

o Long Term average
spectrum (Espectro
medio de largo término)
Muchos por la similaridad de los términos espectro y

espectrograma confunden los análisis respectivos. Es importante
recordar entonces, que el análisis espectrográfico se realiza con base en
el estímulo sonoro en su totalidad, en cambio, el análisis del espectro solo
permite objetivar una porción mínima del fenómeno.
Además de los gráficos mencionados, los programas de análisis
acústico (en su mayoría), poseen un recurso inmediato para la
identificación y caracterización de la intensidad y frecuencia a lo largo de
todo el estímulo. Esta ayuda visual se expresa en forma de contornos
(Figura 22). De color verde o amarillo el contorno de intensidad, y de color
azul el de frecuencia (en PRAAT). Según se trate de voces más o menos
sanas o patológicas, los contornos serán más o menos regulares, estables
y continuos.
Figura 22. En
PRAAT:
Oscilograma
(arriba). Contorno
de intensidad
(verde) y
frecuencia (azul)
(abajo).
Medidas de perturbación
Además de los elementos considerados hasta ahora (frecuencia
fundamental, intensidad, timbre, formantes y gráficos de diversos tipos),
existen otros datos que pueden ser obtenidos mediante los softwares que
luego describiremos. Son las denominadas medidas o índices de
perturbación.
Jitter, Shimmer y Harmonic Noise Ratio (HNR) son las más
conocidas y tenidas en cuenta para cuantificar las variaciones mínimas
dadas a nivel acústico. A pesar de su uso corriente, su grado de
confiabilidad desciende en el análisis de voces muy alteradas o patologías
vocales severas que den como resultado señales aperiódicas.
El jitter puede ser definido como aquella perturbación de la
frecuencia considerada ciclo a ciclo (Figura 23). La consonancia se analiza
entre períodos o grupos de ciclos contiguos, comparándose las
diferencias, y obteniendo así un índice que refleja la uniformidad de ellas
entre sí. Cuando jitter está alterado, demuestra una elevación de la
aperiodicidad, a pesar de no definir estrictamente la etiología de la
disfonía.
Debe ser medido por medio de vocales sostenidas, siempre
indicando cual fue la analizada. Su valor puede llegar a sufrir influencia
tanto del sexo como de la edad, dejando en evidencia, cierta variabilidad
entre los ciclos glóticos.
Un índice jitter por encima de lo esperado (alterado), podría ser
consecuencia de una falta de control de vibración a nivel de los pliegues
vocales, o ser indicio de la existencia de lesiones que afectan el borde libre
o la lámina propia.
Figura 23. Análisis

del jitter
El shimmer, por su parte, es la perturbación de la amplitud

considerada ciclo a ciclo (Figura 24). Se analiza de manera análoga al
índice Jitter y arroja un valor que refleja la disparidad vertical de la onda.
Durante su recorrido (desde el borde libre de las cuerdas vocales
hasta su irradiación por boca y/o nariz), la señal sonora puede presentar
variaciones, bien sea debido al control de la salida de aire o a
modificaciones en la intensidad durante la emisión. Por tanto, cuando
mayor es el valor de shimmer, mayor la cantidad de ruido presente en la
emisión.
Figura 24. Análisis

del shimmer
Su valor también sufre la interferencia del sexo y la edad,
alterándose en presencia de lesiones de masa o edemas difusos (Behlau
et al., 2001). Tiende a ser elevado en disturbios laríngeos, presentando
valores mayores cuando se analizan frecuencias graves y de baja
intensidad. Se altera en situaciones de reducción de resistencia glótica,
como ocurre en casos de hendidura o parálisis de cuerda vocal.
Medidas de Ruido
Las medidas basadas en la relación entre energía armónica y
energía de ruido tienen una extensa aplicación en el laboratorio de la voz,
debido a su evidente relación entre ellas y los procesos patológicos
devenidos disfonías.
El Harmonic to Noise Ratio (HNR), pondera la presencia de los
componentes armónicos en relación a los niveles de ruido natural de la
emisión. Es una medida tenida en cuenta para las valoraciones de la
calidad vocal. A diferencia de los índices anteriores, que deben estar por
debajo de un estándar para considerarse normal, el HNR debe
encontrarse por encima, y mientras mayor su número, mejor calidad
vocal. Esta medida es útil para medir la eficacia del tratamiento y permite
distinguir la clasificación entre voz normal y con alteraciones (Yumoto et
al., 1982).
El Noise to Harmonic Ratio (NHR), en cambio, es la medida
recíproca de la anterior. Incluye toda la energía inarmónica, o de ruido,
que se produce en la fonación desde orígenes diversos: irregularidades en
los períodos vibratorios, subarmónicos o ruido por turbulencia (González
et al., 2002).
Por último, la amplitud de cepstrum mide el grado de
periodicidad de la señal de más baja frecuencia en relación a otros
componentes periódicos o ruidosos presentes (Rabiner y Schafer, 1978;
Cecconello, Farías y Gurlekian, 2008).
Todas y cada una de las medidas anteriores valoradas en forma
conjunta incrementan el nivel de confiabilidad en la medición de la señal
acústica a través del análisis acústico de la voz. Reconocemos también,
que estos no son los únicos índices, pero sí los más comúnmente
utilizados en relación a su significancia clínica.
A continuación, ofrecemos una tabla (Tabla 6) de valores

normalizados para el programa gratuito PRAAT13. Sin embargo, éstos no
deben ser tomados necesariamente como vigentes para toda la urbe.
Cada programa, sin importar de cual se trate, necesita de la
estandarización de sus valores para la población en la que pueda ser
usado.
Recomendamos al profesional diligente la confección de sus
propias tablas e índices de normalidad en relación a su población habitual.
Éstas resultarán de gran ayuda al momento de informar los resultados
obtenidos.
Harmonic Noise
Vocal /a/ Jitter Shimmer
Ratio (HNR)
Tabla 6. Medidas de
perturbación. Valores
normales y límites para el Valores límites 1,04 3,18 12
análisis con PRAAT
Normal 0,63 1,99 16,5
Instrumental necesario
Para el desarrollo y aplicación de esta evaluación es necesario un
conjunto de artefactos del que vale la pena hacer mención, ya que,
dependiendo de sus características, los resultados y datos a analizar serán
más o menos confiables.
De “afuera hacia dentro” (en orden de captación de la señal)
tendremos: micrófono, preamplificador, placa de sonido – interface – y
programa digital de análisis acústico.
Micrófonos
Un micrófono, dicho de la manera más sencilla, es un dispositivo
capaz de convertir un tipo de información en otra. En este caso, energía
acústica en pulsos eléctricos intermitentes pasibles de ser codificados por
el software de trabajo elegido (digitalización).
De más está decir, que no cualquier micrófono es pertinente para
la tarea en cuestión. Éste debe contar con ciertas características que lo
hacen distinto de un simple micrófono de escritorio o de uno para hacer
karaoke.
Los micrófonos, frente al estímulo reaccionan o responden de
determinada manera según la frecuencia, intensidad y dirección de
donde provenga el sonido. Esta programación frente a la respuesta es a
lo que se debe prestar atención a la hora de adquirir uno como
herramienta para un futuro laboratorio de la voz.
En relación a la frecuencia, debe poseer un rango de captación
de entre 0 (cero) y 10.000 Hz como mínimo, para el caso de la voz hablada
(si supera este límite, mucho mejor aún) y debe ofrecer una respuesta
plana a lo largo del espectro. Es decir, debe permitir una
captación/recepción idéntica en intensidad para cada una de las
frecuencias que incorpora dentro de sus límites. Esto es lo más adecuado
para aplicaciones en las que la fuente de sonido debe ser reproducida sin
cambios o coloración en relación al sonido original (Figura 25).
Figura 25. Respuesta

plana de un
micrófono. Este tipo
de representación
suele estar presente
en los manuales de
uso de los micrófonos
Con respecto a la direccionalidad, los micrófonos pueden

clasificarse en tres grandes grupos según su diagrama de captación:
Direccionales, bidireccionales y omnidireccionales.
Los direccionales tienen su mejor respuesta cuando la fuente
sonora se encuentra frente a ellos. Los hay cardioides e hipercardioides.
Un micrófono cardioide (Figura 26) tiene la máxima sensibilidad en su
parte frontal y la mínima en la trasera. Esto le ofrece cierto aislamiento
contra sonidos no deseados del ambiente y hace que sea más resistente
que los micrófonos omnidireccionales a la realimentación. Resultan
particularmente adecuados para escenarios con mucho ruido.
Figura 26. Micrófono

de Direccionalidad
cardioide
Los micrófonos hiper o supercardioides (Figura 27) ofrecen un
patrón de captura más estrecho que los anteriores. Tienen un gran nivel
de rechazo del ruido ambiente, pero también captan algo de la señal
procedente directamente de detrás de ellos. Éstos son los más adecuados
a la hora de captar fuentes sonoras individuales en entornos con mucho
ruido y son los más resistentes a los problemas de realimentación.

de direccionalidad
hipercardioide
Los bidireccionales (Figura 28) son micrófonos con un patrón de

captación polar en forma de ocho (si se los mira desde arriba), es decir, es
sensible a sonidos procedente de delante y de atrás, pero no de los
laterales.

con Mapa
bidireccional
Finalmente, los micrófonos omnidireccionales (Figura 29) tienen

una salida o sensibilidad igual en todos los ángulos, lo que implica que es
capaz de captar sonidos procedentes de todas las direcciones. Por este
motivo, este tipo de micrófonos no han de ser orientados hacia una
dirección concreta, lo que resulta a veces especialmente útil, pero tiene la
desventaja de que no pueden ser alejados de fuentes no deseadas.
Los micrófonos de condensador direccionales cardioides se
encuentran entre los preferidos para realizar estudios sobre voz (Wong,
1995; Baken & Orlikoff, 2000; Svec & Granqvist, 2010; Cecconello, 2012).

con mapa
omnidireccional
Por otra parte, los cables de conexión no son un simple

aditamento más. Conocidas comúnmente como Cannon, las conexiones
XLR son las más recomendadas (Figura 30). Estos cables son usados
principalmente para aplicaciones de cableado electrónico profesional de
audio y video, ya que la pérdida de información es menor y la fidelidad del
sonido se conserva a lo largo del proceso de digitalización.
Figura 30. Cables

XLR o Cannon
Preamplificadores
La función del preamplificador es ajustar los niveles relativos de
voltaje provenientes del micrófono (alrededor de 1mV) al llamado, nivel de
línea estándar (1 V), el cual permite al sonido ser capturado por un
dispositivo de grabación tipo (grabación digital o computadora) (Svec et
al., 2010).
Encontramos preamplificadores por doquier, pero donde mayor
importancia tienen es en el mundo de la grabación, dado que son el
primer eslabón de la cadena de procesamiento (la del micrófono es la
captación y la conversión) y tienen un efecto directo sobre el carácter del
sonido, es decir, pueden alterar la señal, introducir distorsión o ser
absolutamente cristalino. Su calidad influye mucho en cosas tan
importantes como la respuesta en frecuencia, el piso de ruido, la
distorsión total de la señal, entre otras.
Es por ello que, al momento de adquirir uno, se debe elegir un
pre-amplificador adecuado para cada tarea y estos deben cumplir con
ciertos estándares mínimos de manera de no afectar negativamente el
resultado final. A saber, bajo ruido propio a altos niveles de amplificación,
una relación señal/ruido de al menos 90 dB, transparencia, libre de
interferencias de radiofrecuencias y una respuesta plana en frecuencia,
tal como también se especificó con el micrófono.
Placas de sonido
La interfaz de audio o placa de sonido, es un dispositivo para
grabar y reproducir música y sonidos desde una computadora. Todas las
computadoras de uso doméstico, ya sean portátiles o de escritorio,
actualmente vienen con una interfaz de audio, aunque rudimentaria,
aprovechable en aplicaciones de internet y reproducción de audio o
sonidos de juegos; sin embargo, no son aptas para el uso profesional en
el caso del análisis acústico de la voz. Es por ello que la adquisición de una
placa externa es altamente recomendable para esta tarea.
La razón para el uso de las mismas dentro del laboratorio de la
voz consiste en hacer que las aplicaciones multimedia de audio
(programas de grabación o análisis) puedan gestionar del modo más
adecuado la información recibida.
Condiciones ambientales
Con respecto a las características del ambiente circundante,
siempre es recomendable que sea más bien silencioso. El silencio
absoluto es solo un ideal en atmósferas cubiertas de partículas. Existen
investigaciones que sugieren un nivel óptimo de ruido entre 30-35 dB para
realizar este tipo de tareas (Sapaly, J. en Jackson Menaldi, 1992), aunque,
de no alcanzar este umbral se puede mejorar la captación con una
configuración alterna en el micrófono según éste lo permita.
Ya sea en cámaras sonoamortiguadas o no, los niveles de ruido
deben ser siempre bajos para no contaminar la señal vocal durante su
procesamiento digital. Si el ruido ambiente es elevado y queda registrado
simultáneamente con el sonido que se busca analizar, los datos que se
puedan extraer de él y su valoración correspondiente no serán confiables.
Algunos autores sugieren que las dimensiones de la sala no
deben ser ni muy pequeñas ni muy grandes (40 m3 aproximadamente)
para evitar fenómenos de reflexión, y los materiales que recubren las
paredes deben ser más bien absorbentes para no prolongar el tiempo de
reverberación.
Otros autores, por el contrario, recomiendan que los espacio
sean pequeños, similares a las cabinas de audiología y que los equipos de
procesamiento se ubiquen fuera de él para que los posibles ruidos
provenientes del circuito eléctrico no se cuelen en la señal.
Software
Existe actualmente una larga lista de herramientas digitales para
realizar esta evaluación. Más allá de las recomendaciones que el autor
pueda hacer, dejamos a consideración del lector la elección de la misma.
Softwares pagos
 VoceVista Pro versión, versión completa del programa VoceVista de
G. Nair, adaptado por D. Miller y H. Schutte con electroglotograma.
Resulta ideal para el estudio y la pedagogía de la voz cantada,
aunque también es muy útil para el análisis y la rehabilitación de la
patología vocal. www.vocevista.com
 VOXMETRIA. Software para Análisis de Voz y Calidad Vocal.
Coordinación: Dra. Mara Behlau. VoxMetria es un software
específico para Análisis de Voz y Calidad Vocal, con una gran
variedad de funciones y parámetros, permitiendo al fonoaudiólogo
realizar el acompañamiento, análisis y comparaciones entre archivos
de un mismo paciente o entre diferentes modelos de voz.
www.profala.com/ctsvoxmetriaesp.htm
 ANAGRAF. Este sistema fue desarrollado por el Laboratorio de
Investigaciones Sensoriales (L.I.S.) dependiente del CONICET
(Buenos Aires, Argentina), dirigido por el Dr. Jorge Gurlekian. El
mismo permite visualizar y cuantificar todas las características del
habla de manera rápida.
 Multispeech (MS), programa de Kay Elemetrics completo, aunque de
difícil aprendizaje, permite diseñar y personalizar la rehabilitación.
Complementa el CSL (Computerized Speech Laboratory), equipo de
software y hardware muy completo, o el Visi-Pitch IV pensado para
cualquier tipo de patología de la comunicación, tanto para
diagnóstico, terapia de biofeedback como juegos vocales.
www.kayelemetrics.com
 Dr. Speech: Speech Therapy, Real Time de Triger Elemetrics. Es un
programa de software acústico muy completo, útil para habla y voz.
Se pueden adquirir módulos complementarios por separado
(electroglotografía, estroboscopia, entre otros) y montar en la
misma plataforma todas las utilidades. www.drspeech.com
Softwares de acceso libre

 PRAAT, programa de análisis fonético muy completo, pero de difícil
manejo de Paul Boersma, de la University of Amsterdam.
www.fon.hum.uva.nl/praat/
 VoceVista Audio (VV) versión 3.0, programa modificado por D. Miller,
con ventanas de oscilograma, espectrograma y/o espectros. Graba
y reproduce la voz, ideal para la voz cantada. Permite comparar las
voces distintas frente a la del sujeto control, además graba y
reproduce sonidos pregrabados. www.vocevista.com
 Wavesurfer v.1.8.5, programa muy visual y ameno, permite configurar
para cada paciente un entorno de ventanas y preferencias a medida,
ideal para el análisis del habla, aunque algo rebuscado en su
manipulación. www.speech.kth.se/wavesurfer/
 Frequency Analyzer, programa muy simple con oscilograma y
sonograma a tiempo real, la versión 2.0 también posee grabadora,
útil en pedagogía del habla y de la voz. www.relisoft.com/freeware/
La mayoría de los programas descritos en este apartado,

permiten observar cada uno de los parámetros explicados a lo largo de
este capítulo.
El lector interesado podrá profundizar sobre aquel que le
interese dirigiéndose a los vínculos proporcionados y a partir de allí
obtener sus propias conclusiones, evaluando sus posibilidades en cuanto
a viabilidad, accesibilidad y alcances.
Otros programas útiles

 SpeechPitch, de Visualization Software de LLC, resulta un programa
simple, de fácil manejo, con sonograma a tiempo real como base,
aunque no permite revisar ni escuchar el material sonoro grabado.
Es útil para visualizar la frecuencia fundamental programada para el
paciente, el histograma de frecuencias y el sonograma básico.
www.aptrio.com/Education/Language/speechpitch-5332.htm
 Sona-Speech I, II y Sona-Match, I, II versiones reducidas del MS, con
programas de feedback y juegos interesantes y útiles adaptados a
varias patologías foniátricas. www.kayelemetrics.com
 Metrónomo v. 2.0, útil en los problemas de ritmo del habla
www.softonic.com/s/metronomo
 Aldo’s Pianito 2.1 de Aldo Vargas, un piano digital con grabadora en la
que preparar ejercicios cantados, ideal para quien no dispone de
instrumento dónde comparar la voz cantada con sonidos tonales.
www.aldovargas.com
Por supuesto que existen muchos más programas útiles no solo

para el análisis sino también para la rehabilitación de la voz, habla y
lenguaje (SFSWASP, SPECTROGRAM, WINSIGAD, WINPITCH). La lista
aquí ofrecida para nada quiere agotar las posibilidades de búsqueda del
lector.
Procedimiento para la obtención de muestras

Si bien carecemos de un protocolo único para la aplicación de
este instrumento, hay ciertos elementos comunes que hacen posible un
consenso:
a. Ajustes para la grabación: con un ambiente silencioso y el
micrófono puesto en su lugar, solo nos queda dejar lista la
configuración digital bajo la cual la señal será procesada.
a. Velocidad de muestreo (sample rate o, simplemente, sample):
44.100 Hz.
Las velocidades de muestreo indica el número de capturas
digitales que se toman en una señal de audio cada segundo. Esta
velocidad determina el intervalo de frecuencias de un archivo de
audio. Cuanto más alta sea la velocidad de muestreo, más se
asemejará la forma de la onda digital a la forma de la onda
analógica original. Las velocidades de muestreo bajas limitan el
intervalo de frecuencias que pueden grabarse, lo que algunas
veces da como resultado una grabación que no representa
correctamente el sonido original.
Para reproducir una frecuencia determinada, la velocidad de
muestreo ha de ser al menos el doble de la frecuencia que se
espera digitalizar (Nyquist frecuency o Teorema del muestreo).
Por ejemplo, los CD tienen una velocidad de muestreo de 44.100
muestras por segundo, por lo que pueden reproducir hasta
22.050 Hz, sobrepasando por poco el límite de audición humano
(20 KHz).
b. Canales de salida: Mono(fónico)
Una señal monofónica es aquella que ha sido captada y grabada
con un solo micrófono. Al reproducir el estímulo a través de
altavoces o auriculares, la señal se duplica, pero oímos lo mismo
por ambas vías, ya sea por izquierda o por derecha. Este tipo de
configuraciones se utiliza para anular la espacialidad u
orientación de la fuente.
c. Cuantificación (bits): 16 bits.
Al igual que la velocidad de muestreo determina el rango de
frecuencia, la profundidad de bits determina el rango dinámico.
Cuando se muestrea una onda de sonido, se asigna a cada
muestra el valor de amplitud más cercano a la amplitud de la
onda original. Una profundidad de bits más alta proporciona más
valores de amplitud posibles, lo que produce un rango dinámico
más grande, una base de ruido inferior y mayor fidelidad.
b. Vocalizaciones: al momento de realizar la prueba, se le puede
solicitar al paciente simples emisiones vocálicas o habla
encadenada. En caso de tratarse de vocales, estas deben ser
aisladas y grabarse una a la vez; la duración debe oscilar entre los 3
y 5 segundos, y se recomienda no brindarle modelos al paciente
para evitar imitaciones. Pedir cambios tonales en diferentes
registros, es una buena fuente de información así también como los
glissandos14. Si se graba una muestra de habla encadenada, esta
debe ser lo más fluida y espontánea posible, a veces se utilizan
secuencias de palabras como los días de la semana o lo meses del
año.
c. Dirección y distancia del micrófono: mucho se ha debatido al
respecto. Sobre la dirección, hay quienes sugieren colocar el
micrófono en línea recta delante de la boca del sujeto, otros
prefieren colocar el micrófono a 45° - 70° por debajo de la línea de
la boca para evitar el impacto y distorsión de los fonemas explosivos
durante la captación de habla. En relación a la distancia, algunos
autores sugieren 10 cm, otros sostienen que 15 cm son mejor, o un
puño, o hasta 30 cm. Esto depende en gran parte del micrófono, del
ambiente, de la experiencia y la práctica del evaluador.
De admitirse cualquiera de las indicaciones anteriores, éstas

deben repetirse sistemáticamente en cada captura para sostener cierta
meticulosidad en la forma y regularidad en los resultados.
Análisis de datos
Una vez reunida toda la información se procederá a una lectura
e interpretación global de los datos obtenidos. Cada uno de los índices,
valores o medidas puede convertirse eventualmente en información
altamente vinculante a la función vocal y sus potenciales desequilibrios.
Las posibilidades son infinitas. Lo que ofrecemos en el siguiente
cuadro es una reducción pedagógica circunscripta y adapta al lenguaje
escrito.
PARÁMETRO FUNCIÓN ANÁLISIS

FÍSICO LARÍNGEA CUALITATIVO/CUANTITATIVO
¿Rango esperado para la persona?
Relacionada al Comparación con valores de
Frecuencia referencia según sexo y edad
comportamiento
fundamental y vibración de los Aumentada o disminuida
(F0) pliegues vocales Observación del contornos de
frecuencia
Relativo a las Aumentado/Alterado
variaciones
Jitter vibratorias de los
Disminuido/Normal
pliegues vocales Posible indicio de patología
¿Coherente con la actividad del

Coordinación hablante? Comparación con valores
entre aducción esperables
Intensidad glótica y soplo Aumentada o disminuida
espiratorio Falta de continuidad en el contorno.
Variaciones rápidas y repetidas
Aumentado/Alterado
Disminuido/Normal
Disminución de la
Shimmer resistencia glótica Ruido inter-armónico o ruido por
armónicos en determinados
momentos de la emisión
Integridad o pérdida en determinado
rango de frecuencia
Inherente a un ¿Ruido inter-armónico?
Configuración efectivo y ¿Subarmónicos?
armónica eficiente cierre Clasificación de las disfonías
glótico (Yanagihara et al., 1967; Cecconello,
2012). Clasificación de la hipofunción
(Núñez Batalla et al., 2004)
PARÁMETRO FUNCIÓN ANÁLISIS
FÍSICO LARÍNGEA CUALITATIVO/CUANTITATIVO
Aumentado/Normal
Relacionado con
Disminuido/Alterado
el cierre glótico y
HNR la función de filtro En combinación con otros índices, es
del tracto vocal útil para valorar la calidad vocal
(Jerez, 2015)
Aumentado/Alterado
Relacionado con
Disminuido/Normal
el cierre glótico y
NHR la función de filtro Una lectura en conjunto con otros
del tracto vocal índices permite la distinción entre
voces normales y patológicas
Grado de Aumentado/Alterado
Amplitud del
periodicidad a Disminuido/Normal
cepstrum nivel de la fuente Posible indicio de patología
Comportamiento Frecuencia del F fuera de los valores
Configuración del tracto vocal en esperados
Formántica relación al sonido
laríngeo Formante difuso, energía disminuida
En el próximo capítulo, contemplaremos las posibilidades sobre

la manera de realizar una síntesis entre éstos, los estudios por imágenes
y el oído clínico.
Si bien algunos temas han quedado fuera de este capítulo, el lector

cuenta con una cuantiosa bibliografía a la que se puede acercar sin ningún
temor, por medio de la cual podrá desarrollar el área que más le interese.
Alonso JB., Ferrer MA., de León J., Travieso CM. (2006). Cuantificación de
la calidad de la voz para su evaluación clínica por medio del
análisis acústico. IV Jornadas en Tecnología del Habla. 203-208.
Basso, G. (2009). Percepción auditiva. Buenos Aires. Universidad
Nacional de Quilmes Editorial.
Basso, G. (2001ª). Análisis acústico. La transformada de Fourier en la
música. La Plata. Editorial Al Margen.
Boersma P., Kovačić G. (2006). Spectral characteristics of three styles of
Croatian folk singing. Journal of the Acoustical Society of
America. 119: 1805 – 1816.
Boersma P., Weenink D. (2013). Praat: doing phonetics by compute.
Version 5.3.57. Descargado el 27 de octubre de 2013. Disponible
en: http://www.praat.org/
Borzone de Manrique, A. (1980). Manual de fonética acústica. Buenos
Aires: Editorial Hachette.
Carson C.; Ingrisano D., Eggleston K. (2003). The effect of noise on
computeraided measures of voice: a comparison of CSpeechSP and
the Multi-Dimensional Voice Program software using the CSL
4300B module and Multi-Speech for Windows. Journal of Voice. 17:
12 – 20.
Cecconello, LA. (2012). Aplicación del análisis acústico en la clínica vocal.
Trabajando con Anagraf. Buenos Aires: Editorial Akadia.
Cecconello LA., Farías P., Gurlekian J., Elisei N. (2009). El cepstrum como
indicador de la calidad vocal. XIX ENT World Congress. Sao
Paulo, Brasil.
Cecconello LA., Farías P., Gurlekian J., Elisei N. (2010). III El cepstrum
como indicador de la calidad vocal. Encuentro Nacional de
Investigación en Fonoaudiología. Institución Universitaria
Iberoamericana y ASOFON.
Cecconello LA., Gurlekian J. (2009). Espectro promedio de largo plazo en
niños. 2° Manual de la Asociación Argentina de
Otorrinolaringología y Fonoaudiología Pediátrica. 2: 88 – 100.
Cobeta I., Nuñez F., Fernandez S. (2013) Patología de la Voz. Ponencia
Choi SH., Lee JY., Sprecher AJ., Jiang JJ. (2012). The Effect of Segment
Selection on Acoustic Analysis. Journal of Voice. 26(1): 1 – 17.
Colton RH., Casper JK., Hirano M. (1996). Understanding Voice Problems:
A physiological perspective of diagnosis and treatment. Baltimore:
Lippincott Williams & Wilkins. 2° ed.
Costa Beber. B., Cielo CA. (2011). Caracteristicas vocais acústicas de
homens com voz e laringe normal. Rev. CEFAC. 13 (2): 340 – 351.
Cox N.B., Ito MR., Morrison MD. (1989). Data labeling and sampling
effects in harmonic-to-noise ratios. Journal of the Acoustic Society
of America. 85(5): 2165 – 2178.
Del Pino P., Díaz JA., Jiménez C., Rothman HB. (2004). Identificación de
algunos parámetros espectrales que determinan la calidad de la
voz. Revista INGENIERÍA UC. 11 (3): 7 – 16.
Del Pino P., Granadillo I., Miranda M., Jiménez C., Díaz JA. (2008). Diseño
de un sistema de medición de parámetros característicos y de
calidad de señales de voz. Reviste INGENIERÍA UC. 15 (2): 13 –
20.
Dejonckere PH., Giordano A., Schoentgen J., Frag S., Bocchi L., Manfredi
C. (2012). To what degree of voice perturbation are jitter
measurements valid? A novel approach with synthesized vowels
and visuo-perceptual pattern recognition. Computer Methods and
Programs in Biomedicine Journal. 7: 37 – 42.
De Krom, G. (1993). A cepstrum-based technique for determining a
harmonics-tonoise ratio in speech signals. Journal of Speech and
Hering Research. 36: 254 – 266.
Deliyski D., Shaw H., Evans M., Vesselinov R. (2006). Regression tree
approach to studying factors influencing acoustic voice analysis.
Folia Phoniatrica et Logopaedica. 58: 274 – 288.
Deliyski D., Shaw H., Evans M. (2005). Influence of sampling rate on
accuracy and reliability of acoustic voice analysis. Logopaedic
Phoniatric Vocology. 30: 55 – 62.
Elisei, NG. (2012). Análisis acústico de la voz normal y patológica
utilizando dos sistemas diferentes: ANAGRAF y
PRAAT. Interdisciplinaria, Ciudad Autónoma de Buenos
Aires. 29 (2).
Elisei NG., Pérez Ibáñez ME., Girimonte P. (2011). Evaluación del espectro
medio de largo plazo en estudiantes de locución. Jornadas
científicas de Ciencias de la Salud. Facultad de Medicina.
Elisei NG., Girimonte P. (2012). Cuantificación de la calidad vocal en
función del entrenamiento en locutores. I Congreso
Iberoamericano de Voz Profesional y Clínica Vocal. Universidad
de Chile, Facultad de Medicina. Santiago de Chile.
Elvira Garcia W., Roseano P., Fernandez Planas AM. (2014). Ltas
differences. Praat script. Descargado el 23 de setiembre de 2013.
[online]. Disponible en: de http://stel.ub.edu/labfon/en
Fant, G. (1970). Acoustic theory of speech production with calculations
based on X-ray studies of Russian articulations. The Hague:
Mouton.
Ferrand, CT. (1995). Effects of practice with and witout knowledge of
results on jitter and shimmer levels in normally speaking women.
Journal of Voice. 9 (4): 419 – 423.
Gil, J. (2014). Más allá del “efecto CSI”: avances y metas en fonética
judicial. En Y. Congosto, M. L. Montero Curiel, & A. Salvador
(eds.), Fonética Experimental, Educación Superior e
Investigación. Madrid: Arco Libros. I: 63 – 112.
González J., Cervera T., Miralles JL. (2002). Análisis acústico de la voz:
fiabilidad de un conjunto de parámetros multidimensionales.
Acta Otorrinolaringol Esp. 53: 256 – 268.
Guzmán M., Malebran MC., Zavala P., Saldívar P., Muñoz D. (2013).
Cambios acústicos de la voz como signos de fatiga vocal en
locutores de radio: resultados preliminares. Acta
Otorrinolaringol Esp.
Harmegnies B., Bruyninckx M., Llisterri J., Poch D. (1991). Effects of
language change in voice quality in bilingual speakers. Corpus
content effects. En Eurospeech 1991. Proceedings of the 2nd
European conference onspeech communication and technology.
Genova, Italy. 1: 165 – 168.
Harrington J., Palethorpe S., Watson C.I. (2007). Age-related changes in
fundamental frequency and formants: a longitudinal study of
four speakers. In Proceedings of InterSpeech. Munchen, DE.
New York.
Horii, Y. (1982). Jitter and shimmer differences among sustained vowel
phonations. Journal of Speech and Hearing Research. 25: 12 – 14.
Howard, DM. (2009). Acoustics and psychoacoustics. UK, Elsevier
Editorial.
Panamericana.
Jerez, RM. (2015). Valoración objetiva de la calidad vocal en estudiantes
de locución. III° Congreso Regional de Fonoaudiología. La Plata,
Buenos Aires.
Jiménez J., Díaz JA., Jiménez C., Fasanella M. (2010). Uso y aplicaciones
de los métodos de cálculo de la frecuencia fundamental y de la
calidad objetiva de la señal de voz. Revista Ingeniería UC.
Universidad de Carabobo. Valencia, Venezuela. 17 (1): 55 – 60.
Johnson, K. (2003). Acoustics and Auditory Phonetics. 2nd Edition.
Malden: Blackwell.
Karnell MP., Chang A., Smith A., Hoffman HT. (1997). Impact of signal
type of validity on voice perturbation measures. NCVS Status and
Progress Report. 11: 91 – 94.
Kasuya H., Ogawa S., Mashima K., Ebihara S. (1986). Normalized noise
energy as na acoustic measure to evaluate pathologic voice.
Journal of the Acoustic Society of America. 80 (5): 1329 – 1334.
Kent RD., Read C. (1992). The Acoustics Analysis of Speech. San Diego:
Singular Publishing.
Kent, RD. (1993). Vocal tract acoustics. Journal of Voice. 7 (2): 97 – 117.
Kreiman J., Gerratt B., Antoñanzas-Barroso N. (2007). Measures of the
glottal source spectrum. Journal of Speech Language and Hearing
Research. 50: 595 – 610.
Linville SE., Korabic EW., Rosera M. (1990). Intraproduction variability in
jitter measures from elderly speakers. Journal of Voice. 4: 45 – 51.
Lopes L., Vaz-Freitas S., Sousa R., Matos J., Abreu F., Ferreira A. (2008).
A medida HNR: sua relevância na análise da voz e sua estimação
precisa. Apresentação nas I Jornadas de Tecnologia e Saúde.
Guarda: 30 de abril.
Majewski W., Hollien, H. (1974). Euclidean distance between long term
speech spectra as a criterion for speaker identification. Speech
Communication Seminar, 1: 1 – 3.
Malebran M. Saldívar P. (2010). Elaboración de un perfil vocal para un
grupo de locutores radiales chilenos. Primer Congreso
Iberoamericano de Voz Cantada y Hablada.
Manfredi C., Giordano A., Schoentgen J., Frag S., Bocchi L., Dejonckere
PH. (2012). Perturbation measurements in highly irregular voice
signals: Performances/validity of analysis software tools.
Computer Methods and Programs in Biomedicine Journal. 7: 409 –
416.
Manwa L., Chen Y., Chan EYK. (2010). Cantonese and English Produced
by Proficient Cantonese- English Bilingual Speakers – A Long-
Term Average Spectral Analysis. Journal of Voice. 26 (4): 171 –
176.
Marusso, AS. (2005). Principios básicos da teoría acústica de producao da
fala. Rev. Est. Ling., Belo Horizonte. 13 (1): 19 – 43.
Mathews M., Pierce J. (1980). Harmony and nonharmonic partials. Journal
of the Acoustical Society of American. 68.
McCoy, S. (2006). Your voice: an inside view. Inside view press. Princeton,
USA.
McDermott, JH. (2012). Auditory Preferences and Aesthetics: Music,
Voices, and Everyday Sounds. Neuroscience of Preference and
Choice. 1: 227 – 256.
Michaelis D., Gramss T., Strube HW. (1997). Glottal-to-noise excitation
ratio – a new measure for describing pathological voices. Acustica
– Acta Acustica. 83: 700 – 706.
Mitev P., Hadjitodorov S. (2000). A method for turbulent noise estimation
in voiced signals. Journal of Medical and Biological Engineering
Computers. 38: 625 – 631.
Molina N., Méndez M. (2006). Características acústicas objetivas de la
nasalidad. Revista de la Federación Argentina de Sociedades de
Otorrinolaringología. 60 (2): 119 – 122.
Molina de Figueiredo R., Bernales M. (1999). Reconocimiento de
hablantes basado en el espectro a largo tiempo. En Actas del VI
Simposio Internacional de Comunicación Social. Santiago de
Cuba: Centro de Lingüística Aplicada. 1372 – 1378.
Moon KR., Chung SM., Park HS., Kim HS. (2012). Materials of Acoustic
Analysis: Sustained Vowel Versus Sentence. Journal of Voice.
26(5): 563 – 565.
Mörner M., Fransson F., Fant G. (1963). Voice register terminology and
standard pitch.
Nikolov Z., Deliyski D., Drumeva L. Boyanov B. (1989). Computer system
for diagnostics of pathological voices. Proceedings of the 21st
Congress International of Logopedics and Phoniatrics. 1: 973 – 976.
Nishio M., Niimi S. (2008). Changes in speaking fundamental frequency
characteristics with aging. Folia Phoniatrica et Logopaedica. 60:
120 – 127.
Nittrouer S., McGowan RS., Milenkovic PH., Beehler D. (1990). Acoustic
measurements of men`s and women`s voices. Journal of Speech
Language and Hearing Research. 33: 761 – 775.
Nolan, F. J. (1983). The Phonetic Bases of Speaker Recognition.
Cambridge: Cambridge University Press.
Nordenberg M., Sundberg J. (2003). Effect on LTAS of vocal loudness
variation. TMH Quarterly Progress Status Report, 1/2001.
Núñez Batalla F., Corte Santos P., Sequeiros Santiago G., Señaris
González B., Suárez Nieto C. (2004). Evaluación perceptual de la
disfonía: correlación con los parámetros acústicos y fiabilidad.
Acta Otorrinolaringol Esp. 55: 282 – 287.
Olszewski AE., Shenm LB., Jiang JJ. (2011). Objective Methods of Sample
Selection in Acoustic Analysis of Voice. Annals of Otology,
Rhinology and Laryngology. 120 (3): 155 – 161.
Orlikoff RF., Kahane JC. (1991). Influence of mean sound pressure level on
jitter and shimmer measures. Journal of Voice. 5: 113 – 119.
Parsa V., Jamieson DG. (2001). Acoustic discrimination of pathological
voice: sustained vowels versus continuous speech. Journal of
Speech Language and Hearing Research.44: 327 – 339.
Pereira, JC., Montagnoli AN. (1999). Análise Acústica dos Sinais de Voz.
Sebenta. São Carlos: EESC/USP.
Pierce, J. (1991). Periodicity and pitch perception. Journal of the Acoustical
Society of American, 90 (1).
Pittam, J. (1987). The long term spectral measurement of voice quality as
a social and personality marker: A review. Language and Speech.
30: 1 – 12.
Pruzansky, S. (1963). Pattern-matching Procedure for Automatic Talker
Recognition. Journal of the Acoustical Society of America. 35:
354 – 358.
Qi Y., Hillman RE. (1997). Temporal and spectral estimations of
harmonics-to-noise ratio in human voice signals. Journal of the
Acoustic Society of America. 102: 537 – 543.
Qi Y., Milstein C., Hillman RE. (1999). The estimation of signal-to-noise
ratio in continuous speech for disordered voices. Journal of the
Rabinov CR., Kreiman J., Gerratt B., Bielamowicz S. (1995). Comparing
reliability of perceptual ratings and acoustic measures of jitter.
Journal of Speech and Hearing Research. 38: 26 – 32.
Robison C., Bounous B., Bailey R. (1994). Vocal beauty: a study proposing
its acoustical definition and relevant causes in classical baritones
and female belt singers. NATS J. 51: 19 – 30.
Sacheri, S. (2012). Ciencia en el arte del canto. Buenos Aires: Editorial
Akadia. 1° ed.
Sader RC., Hanayama EM. (2004). Considerações teóricas sobre a
abordagem acústica da voz infantil. Revista CEFAC. 6 (3): 312 –
318.
Schoentgen, J. (1989). Jitter in sustained vowels and isolated sentences
produced by dysphonic speakers. Speech Communication Journal.
8 (1): 61 – 79.
Sethares, WA. (1998). Tuning, Timbre, Spectrum, Scale. Londres. Springer-
Verlag.
Smits I., Ceuppens P., De Bodt M. (2005). A Comparative Study of Acoustic
Voice Measurements by Means of Dr. Speech and Computerized
Speech Lab. Journal of Voice. 19 (2): 187 – 196.
Speyer R., Wieneke GH., Dejonckere PH. (2004). The use of acoustic
parameters for the evaluation of voice therapy for dysphonic
patients. Acta Acoustica united with Acoustica. 90: 520 – 527.
Spielman JL., Staar AC., Hunter EJ. (2006). Recommendations for the
creation of a recording laboratory. Iowa City: National Center for
Voice and Speech.
Sundberg, J. (1970). The acoustic of the singing voice.
Takahashi H., Koike Y. (1976). Some perceptual dimensions and acoustical
correlates of pathologic voices. Acta Oto-Laryngologica. 338: 2 –
22.
Tavares EL., Martins RH. (2007). Vocal Evaluation in Teachers With or
Without Symptoms. Journal of Voice. 21(4): 407 – 414.
Teager HM., Teager SM. (1990). Evidence for nonlinear sound production
mechanisms in the vocal tract. In Speech Production and Speech
Modeling. Hardcastle, W.J. and Marchal, A. Dordrecht: Kluwer.
Titze IR. (1993). Standards in acoustic analysis of voice. Journal of Voice. 8
(1): 1 – 7.
Titze IR., Winholtz WS. (1993). Effect of microphone type and placement
on voice perturbation measurements. Journal of Speech and
Hearing Research. 36 (6): 1177 – 1190.
Vasiliakis M., Stylianau Y. (2009). Voice pathology detection based on
short-term jitter estimations in running speech. Folia Phoniatrica
et Logopaedica. 61 (3): 153 – 170.
Vieira VP., De Biase N., Pontes P. (2005). Análise Acústica e Perceptivo-
Auditiva vs Coaptação Glótica em Alteração Estrutural Mínima.
Acta ORL. 1: 6 – 12.
Vogel AP., Maruff P., Snyder PJ., Mundt JC. (2009). Standardization of
pitch-range settings in voice acoustic analysis. Behavior Research
Methods. 41 (2): 318 – 324.
Vogel AP., Morgan AT. (2009). Factors affecting the quality of sound
recording for speech and voice analysis. International Journal of
Speech- Language Pathology. 11 (6): 431 – 437.
Waugh, I. (2000). Digital Audio Recording. Kent: PC Publishing.
Wertzner HF., Schreiverm S., Amaro L. (2005). Analysis of fundamental
frequency, jitter, shimmer and vocal intensity in children with
phonological disorders. Brazilian Journal of Otorhinolaryngology.
71: 582 – 588.
Wong DY., Lange R., Titze IR., Guo CG. (1995). A qualitative study of
mechanisms of jitter-induced shimmer in the voice. Journal of the
Acoustic Society of America. 97 (5): 3421 – 3421.
340.
Yiu, E.M.-L. (1999). Limitations of perturbation measures in clinical acoustic
voice analysis. Asia Pacif Journal of Speech, Language and
Hearing. 4: 157 – 168.
Yumoto E., Gould WJ., Baer T. (1982). Harmonics-to-noise ratio as an index
of the degree of hoarseness. Journal of the Acoustic Society of
America. 71(6): 1544 – 1549.
Zalewski J., Majewski W., Hollien, H. (1975). Cross-correlation between
Long-Term Speech Spectra as a criterion for speaker identification.
Acoustics. 34: 20 – 24.
CAPÍTULO 5
Habiendo realizado hasta aquí una primera mirada sobre
algunos de los procedimientos de evaluación, estamos en condiciones de
acceder a una lectura más pormenorizada en relación a la interpretación
y aportes clínicos.
La búsqueda de un imaginario visual correspondiente con una
respuesta sonora integrada ha sido el gran objetivo de muchos, ya que de
esta manera se puede alcanzar un mejor entendimiento de los procesos
patológicos y establecer medidas terapéuticas adecuadas para cada
situación (Awan & Roy, 2009; Camargo & Madureira, 2010; Ma & Yiu,
2011).
Correlacionar las medidas acústicas con las medidas perceptivas
y, además, con los mecanismos fisiológicos de la producción vocal es una
tarea compleja (Batalla et al., 2004; Choi et al., 2012), debido a que una
dimensión o parámetro específico de la calidad vocal posee una o más
pistas acústicas o visuales para su recepción.
Se sabe que ninguna forma de evaluación reemplaza a otra,
todas son complementarias y constructivas en este proceso. Y
reconocemos que la voz humana es un fenómeno multidimensional que
requiere especial atención en cada instancia de análisis. Es por ello, que
la evaluación vocal tampoco puede ser reducida bajo una única óptica.
En este capítulo brindamos al lector herramientas que puedan
ayudarlo a construir desde su quehacer profesional, ese ideal que
combina una mirada juiciosa, un oído sensible y una lectura fina de datos,
todos ellos relacionados al fenómeno vocal.
Criterios y parámetros
Si bien fueron descriptas en el capítulo 2, tomaremos como
punto de partida las escalas de evaluación perceptual GRBAS(I) y
RASAT(I). De ellas, cada uno de los ítems evaluados será punto de análisis
y detenimiento para la expansión de las ideas que consideramos más
representativas al respecto.
GRBAS Grade - Roughness Breathness Astenic Stein
RASAT - Ronquera Aspereza Soplo Astenia Tensión
G (Grade – Grado de disfonía o calidad vocal general)

Si de disfonía se trata, deberemos establecer una primera causa.
En términos sencillos, podemos hablar de la presencia de una alteración
orgánica que afecte el normal desenvolvimiento de la función vocal, o de
una alteración funcional propiamente sin ningún tipo de componente
orgánico.
El grupo de alteraciones que genera cambios estructurales es
muy diverso y su impacto depende del tamaño, ubicación del mismo o
manejo de la voz que haga el paciente. En cambio, si hablamos de
alteraciones funcionales, dos son los grupos más representativos:
hipofuncionales (por defecto) e hiperfuncionales (por exceso).
Como se puede observar, este parámetro es sumamente
abarcativo. Por lo tanto, la resultante sonora puede ser igual de variable
y estar integrada por diferentes elementos combinados. ¿Cómo se oye,
entonces, una disfonía? ¿Es posible percibir un grado determinado en
voces alteradas? La respuesta a esta pregunta debe ser muy versátil y
contemplar una enormidad de elementos.
Una voz disfónica puede “sonar” desviada de su tono óptimo. En
el caso de una mujer diríamos que puede asemejarse a la voz de un
hombre (edema, en fumadoras), y en el caso de un hombre parecerse a la
voz de una mujer o niño (puberfonía o muda vocal incompleta). La
intensidad puede resultar a veces muy elevada, como si estuvieran
gritando, lo que podría relacionarse a una hiperfunción; o verse afectada
por algún tipo de sonido alterno que limita la conversión acústica y en
consecuencia los niveles de intensidad (hipofunción en voces débiles).
Este sonido paralelo que “suena”, en algunos casos, simultáneamente
con la voz puede parecerse al de un soplido o ruido turbulento como el
que se genera durante la pronunciación del fonema /h/ en inglés (voz
soplada), o puede oírse similar a una fricción generada por el frotamiento
de dos superficies ásperas, como una lija raspando una pared, si vale el
ejemplo (voz áspera).
Muchos asimilan los conceptos ronquera y disfonía como si
fueran indistintos; sin embargo, no es así. Disfonía es un término amplio
que no solo da cuenta del funcionamiento de la fuente, sino también de
procesos que ocurren en el filtro. Ronquera, en cambio, es un aspecto
bien definido que refiere a un comportamiento determinado a nivel
glótico (Ishiki et al., 1969), y quienes lo describen, coinciden en que el
sonido que se genera es similar al de una suave /r/ interpuesta al sonido
vocal.
Los parámetros acústicos, en cualquiera de las situaciones
anteriores, estarán alterados. En relación al grado general de disfonía, Ma
& Yiu (2006), en su investigación concluyeron que el TMF, el área del
fonetrograma y el jitter realizan una correcta predicción sobre los niveles
generales de alteración vocal. En tanto que Piccirillo et al. (1998)
aseguran que la combinación de presión subglótica estimada, variaciones
de frecuencia, flujo de airea nivel de los labios y TMF, se correlacionan
moderadamente con el grado general de disfonía.
Martens et al. (2007), establecieron relación entre jitter y grado
general de alteración. Gioavnni et al. (1996) asocian las medidas de Jitter
y HNR a voces disfónicas. Mientras que Wolfe et al. (1995) relaciona la
medida de shimmer aislado con la evaluación perceptual de la disfonía.
Además, Awan & Roy (2005) sostienen que el Shimmer puede funcionar
como una medida predictiva aislada de Jitter y HNR para el medir el grado
de alteración general. En tanto que las medidas de cepstrum se
correlacionan con medidas perceptivas de disfonía y soplo de forma más
evidente que otras (Hillenbrand et al., 1996).
Frente a un análisis morfo-funcional de esta situación, se puede
observar alteraciones en el borde libre (nódulos, pólipos, quistes),
desequilibrios en el cierre glótico (hendiduras de forma variable),
ausencia o variaciones en las fases de apertura y cierre (parálisis
laríngeas). La onda mucosa puede estar reducida (procesos cicatrizales),
ausente (cordectomía parcial) o exagerada (edemas), la amplitud de la
misma disminuida o aumentada; y dependiendo del caso habrá más o
menos periodicidad y simetría mecánica.
Nódulos bilaterales
Cordectomía –
cuerda vocal
izquierda
R (Ronquera)
La ronquera es un parámetro definido por Ishiki (1969), como
irregularidad vibratoria de los pliegues vocales debido a la aparición de
tres posibles elementos. A saber: 1) presencia aislada de hendidura
glótica (menor a 0,05 mm2), 2) presencia aislada de alteraciones
orgánicas en la mucosa vibratoria o 3) una combinación de las anteriores.
En términos sencillos, la ronquera aparece como sinónimo de
anormalidad vibratoria en la cumplimentación del fenómeno vocal.
Ya lo decíamos más arriba. Los conceptos de disfonía y ronquera
no son del todo asimilables. Sin embargo, las características acústicas que
identifican a la ronquera pueden resultar igual de variadas que el
parámetro anterior.
Eady y Baylor (2006), analizaron los resultados de la clasificación
perceptual a través de una escala visual analógica, concluyendo que el
shimmer es el parámetro que más se asocia a ronquera en muestras de
habla encadenada. Martens et al. (2007), por su parte, en un estudio sobre
correspondencia perceptual y acústica, también establecieron una fuerte
relación entre el índice de perturbación shimmer y la ronquera. De esta
manera, la presencia de Shimmer alterado se corresponde con procesos
fonatorios caracterizados por irregularidad, inestabilidad leve o
aperiodicidad (Awan & Roy, 2005).
El análisis espectrográfico no muestra presencia de armónicos a
lo largo de todo el espectro, siendo más común en este tipo de voces la
disminución del número de sobretonos con un trazado menos definido,
debido a la posible presencia de ruido y, en algunos casos, variaciones de
la frecuencia fundamental (Pontes et al., 2002). Este último, es un valor
también a tener en cuenta, ya que en la generalidad f 0 se presenta
descendido, siendo más evidente en mujeres que en varones.
Debido a la aperiodicidad acústica, que también
mencionábamos, no es infrecuente encontrar, además ruido
interarmónico o subarmónicos que entorpecen la nitidez de la señal.
Hiraoka et al. (1984) aseguran por su parte, que es posible
distinguir espectrográficamente, la diferencia entre voces normales y
roncas, de acuerdo a la intensidad de los armónicos presentes.
¿Cómo se oye la ronquera? La percepción tiende a traducir el
estímulo auditivo de ronquera, como rugosidad, debido a esa misma
irregularidad que se describía al principio relacionada con cierta anarquía
vibratoria a nivel fisiológico. Ejemplo claro de ello, pueden ser las voces
de fumadores de larga data que no en pocas ocasiones llegan a desarrollar
algún tipo de edema o en caso de pólipo de cuerda vocal (dependiendo
de las características del mismo). Hay autores que sostienen que el
parámetro ronquera, es interdependiente de las cualidades de soplo y
aspereza, por lo que la resultante sonora sería una combinación de
ambas.
Edema
Pólipo
Si acompañamos los resultados anteriores con el análisis morfo-

funcional, podríamos observar posibles alteraciones de masa en el borde
libre de los pliegues vocales. Estos cambios estructurales fomentan la
irregularidad y asimetría vibratoria interponiéndose durante el proceso
fonatorio, impidiendo su normal desarrollo. Por esta misma razón la
intensidad vocal suele verse incrementada. El impedimento hace que se
necesite mayor presión para lograr el movimiento necesario que
produzca voz.
Además, podríamos hallar los desequilibrios en el cierre glótico
mencionados por Ishiki et al., (1969) (hendidura menor a 0,05 mm2),
acompañados de una onda mucosa más bien exagerada (edema) o
desproporcionada. La amplitud por esta misma razón podría estar
aumentada debido a los cambios en la cantidad de masa.
Si el proceso fonatorio se acompaña de algún tipo de
compensación, la sensación de rugosidad o ronquera puede llegar a ser
provocada por la participación de las bandas ventriculares a nivel de la
supraglotis.
R (Roughness) – A (Aspereza)
Descripta también como una impresión acústica de irregularidad
vibratoria a nivel de los pliegues vocales, la aspereza es otro de los
parámetros a puntuar dentro de las escalas GRBAS y RASAT. Frente a
esta característica, los patrones vibratorios se observan inestables y
sensibles especialmente a la presión glótica, lo que provoca en algunos
casos voz diplofónica (Awan & Roy, 2005).
En estas voces, es común observar que la frecuencia
fundamental se encuentra aumentada, siendo más notorio en el sexo
masculino que en el femenino. La presencia de armónicos a lo largo del
espectro se reduce hasta los 2000-2500 Hz, mutando a ruido o
simplemente desapareciendo por encima de este límite (Pontes et al.,
2002), favoreciendo al incremento simultáneo y proporcional de la altura
espectral.
Una mayor intensidad en estas voces, no logra compensar el
déficit, sino que aumenta la sensación de perturbación y hace más
evidente los parámetros alterados (Deal & Emanuel, 1978).
En relación al análisis de medidas acústicas, Emanuel & Austin
(1981) concluyeron que todas las medidas conocidas (jitter, shimmer,
HNR y F0) diferencian significativamente las voces perceptualmente
normales y ásperas. Mientras que, Butha et al. (2004), luego de sus
estudios correlacionaron NHR con grado general de disfonía y aspereza.
Una voz áspera, entonces, se oye con un dejo de fricción, como
si dos superficies solidas se frotaran entre sí. Esta imagen no deja de
reflejar el posible comportamiento fisiológico, dado que el agente de
fricción, en este caso el aire, frota simultáneamente dos superficies
rígidas, pliegues vocales y/o bandas ventriculares. Las voces ásperas
pueden aparecer también en voces con fatiga muscular en proceso de
compensación (Boucher, 2008).
Cicatriz
Sulcus
En el caso de las voces ásperas, la mucosa de los pliegues vocales

se presenta rígida o poco flexible (asociado a falta de hidratación o
desgaste desmedido, en voces perceptualmente normales). La amplitud
vibratoria de los pliegues está ciertamente reducida y la ondulación
mucosa disminuida.
Las alteraciones estructurales son igualmente posibles, algunas
de ellas (cicatriz o sulcus) pueden modificar la función vocal por
disrupción de las propiedades biomecánicas de la lámina propia,
reduciendo la flexibilidad del tejido (Choi et al., 2012). También existen
ciertos desequilibrios en el cierre glótico y la periodicidad del fenómeno
de ondulación es variable.
B (Breathness) – S (Soplo)
Alrededor de la percepción de este parámetro se crea un flujo
aéreo turbulento debido al cierre glótico incompleto durante el ciclo vocal
o por un comportamiento vibratorio irregular (Núñez Batalla & Suárez
Nieto, 1999).
El análisis acústico refleja la aparición de componentes de ruido
(señal no periódica) relacionados a dicho flujo aéreo excedente en el
proceso de conversión, además de una pérdida de los armónicos de alta
frecuencia debido a que la fase de cierre glótico del ciclo vocal,
probablemente se encuentre acortada o incompleta.
Hildebrand et al. (1996), notaron que los valores de cepstrum se
correlacionan con las medidas perceptivas de grado general de alteración
vocal y soplo. En otros estudios sobre pacientes con parálisis unilateral,
Heman-Ackah et al. (2002) relacionaron positivamente la medida HNR
con grado de alteración vocal y soplo en habla encadenada y vocales
sostenidas.
Por su parte, Dogan et al. (2007) estudiaron 40 casos de voces de
asmáticos y no asmáticos, analizaron cualitativamente y encontraron
diferencias significativas entre ambos grupos. En mujeres los valores de
HNR, Jitter y Shimmer se mostraron alterados, en tanto que, para
hombres, solo shimmer evidenció cambios notorios. Las modificaciones
en ambos sexos, según este estudio, pudieron ser correlacionadas con
voces perceptualmente sopladas y roncas.
Hendidura
La observación detenida del comportamiento espectrográfico

para esta cualidad perceptual, permite la confección de una clasificación
ya conocida, y aún vigente, dispuesta por Yanagihara (1967).
Los tres elementos que determinan sus 4 grados de severidad son:
1) Componentes de ruido en el formante principal de cada vocal (F1 y F2),
2) Componentes de ruido de alta frecuencia encima de los 3000 Hz; y 3)
Pérdida de componentes armónicos de alta frecuencia.
Grado I.
La composición
espectral describe
alternancia entre
componentes
armónicos y de ruido,
principalmente en la
región de los
formantes vocálicos.
Grado II.
Existen tenues
componentes de ruido
por encima de los
3000 Hz. La mayor
interferencia
predomina sobre los
armónicos del
segundo formante.
Grado III.
El segundo formante
es reemplazado por
ruido en su totalidad.
La interferencia a
altas frecuencias,
intensifica su energía
y extiende su rango.
Grado IV.
El primer formante
pierde sus
componentes
periódicos y este
lugar es ocupado por
ruido. En las altas
frecuencias se vuelve
aún más intenso.
La característica perceptual de este parámetro es una voz
rodeada de un componente aéreo similar a un soplido constante. La
altura espectral desciende, a medida que aumenta el grado de afectación
debido a la pérdida del elemento periódico en las frecuencias altas.
El análisis morfo-funcional arroja desequilibrios en el cierre
glótico, razón principal a la que se atribuye el escape aéreo. Pueden existir
cambios en la estructura del borde libre y/o desequilibrios funcionales. La
onda mucosa puede mostrarse reducida, y la amplitud vibratoria
limitada, aunque periódica y simétrica (dependiendo el tipo de
patología).
A (Astenic – Astenia)
En las versiones abreviadas de la GRBAS (GRB) o en la RBH15
éste y el siguiente ítems desaparecen del anagrama, ya que se
consideran, en primer lugar, parámetros no del todo confiables al
momento de su descripción, en segundo lugar, son capaces de anularse
mutuamente, es decir, en presencia de astenia no habrá tensión, y si se
detecta tensión no habrá astenia; y en última instancia, no hacen
referencia a características audibles de la voz, sino al estado muscular
que hace posible su aparición. Tanto las voces asténicas como tensas,
variando su grado de afectación, pueden describirse simultáneamente
en términos de roncas, sopladas o ásperas.
La voz asténica (débil), está relacionada naturalmente a
hipofunción de los músculos que intervienen en proceso de generación
de voz. El resultado es un sonido con poca energía, de intensidad débil
(característica más evidente). A diferencia del soplo, las voces asténicas,
por lo general, no tienen componente de ruido.
Núñez Batalla et al. (2004), sostienen que la cualidad astenia, se
relaciona psicoacústicamente con falta de armónicos, bajos valores de
HNR y altos valores de jitter, debido a la falta de tensión a nivel de los
pliegues vocales. Una clasificación basada en sus características
espectrográficas, nos permite una mejor visualización de los
componentes acústicos.
La voz asténica, por otro lado, puede estar relacionada con
alteraciones de tipo neurológicas (miastenia gravis o esclerosis lateral
amiotrófica – ELA), laríngeas (presbifonías) o psicógenas (trastornos de
conversión).
Tipo I.
Ausencia de armónicos por
encima de 4000 Hz e intensidad
moderada en los componentes
espectrales por debajo de esta
medida.
Tipo II.
Se afectan los componentes
periódicos por encima de 3500
Hz, ausencia de armónicos
entre el primer y segundo
formante, y disminución de
general de intensidad.
Tipo III.
El gráfico espectral se torna
cada vez más tenue y la
desaparición del segundo
formante se hace evidente.
Solo quedan componentes
definidos por debajo de los
1000 Hz.
Tipo IV.
La mayor parte del espectro
armónico ha desaparecido,
incluido el primer formante.
Solo se conservan los primeros
sobretonos.
Es posible que el análisis morfo-funcional no evidencie
alteraciones en el borde libre, aunque sí desequilibrios relacionados a una
ineficaz aducción y a un mal manejo de la presión subglótica.
Una fase de apertura más larga que la fase de cierre, una onda
mucosa limitada y la amplitud de la misma disminuida, hacen de éste un
sonido característico.
S (Stein) – T (Tensión)
Esta propiedad responde a cierto grado de esfuerzo vocal debido
a un aumento de actividad en la musculatura intrínseca y/o extrínseca de
la laringe. Por lo general, este tipo de mecanismo se desencadena, luego
de la instalación de algún impedimento para el normal desarrollo de la
fisiología vocal.
Acústicamente el factor jitter presenta una relación
directamente proporcional a la tensión, es decir, a mayor jitter mayor,
percepción de tensión. Esto puede ser útil para diferenciar acústicamente
las voces hipo e hiperfuncionales (Klingholtz & Martin, 1985). Esta
cualidad también se correlaciona con un nivel espectral en todas las
bandas de frecuencias del LTAS, especialmente de 2000 a 5000 Hz
(Núñez et al., 2004).
En estos casos se observa con detenimiento y se valora el grado
de actividad de las estructuras laríngeas, sobre todo por encima de la
glotis. El complejo ariepiglótico o las bandas ventriculares son
susceptibles de participar en el proceso de generación de voz
ocasionando alteraciones generales en el estado vocal (ronquera, soplo,
aspereza).
Hiperfunción vocal
Un análisis morfo-funcional no arrojaría necesariamente

alteraciones estructurales, aunque sí en un primer momento, un borde
libre rígido ante el paso de flujo aéreo y un aumento evidente de la
presión subglótica a modo de compensación o esfuerzo.
Podrían observarse desequilibrios por defecto en el cierre
glótico, onda mucosa más bien limitada y de amplitud reducida, con una
mecánica vibratoria asimétrica y aperiódica. No en pocos casos, se
describe la participación y movimiento de las bandas ventriculares
durante la fonación en voces tensas o hiperfuncionales.
Parámetro Análisis Morfo-

Impresión auditiva Análisis Acústico
perceptual funcional
Desviación del tono

El TMF, área del Alteraciones en el
óptimo. La intensidad
fonetrograma (Ma & Yiu borde libre,
aumentada (en casos
(2006), presión desequilibrios en el
de hiperfunción), o
subglótica, variaciones de cierre glótico,
disminuida afectada
frecuencia y flujo de aire ausencia o
por algún tipo de
(Piccirillo et al., 1998) variaciones en las
sonido alterno
realizan una correcta fases de apertura y
(hipofunción en voces
predicción sobre los cierre.
Grade / débiles).
niveles generales de
Grado de La onda mucosa
Puede haber ruido alteración.
disfonía puede estar reducida,
similar al de un
Jitter (Martens et al., ausente o exagerada,
soplido o sonido
2007), Shimmer (Wolfe et la amplitud de la
turbulento, o
al., 1995; Awan & Roy, misma disminuida o
también oírse similar
2005) y HNR (Gioavnni et aumentada; y
a una fricción
al., 1996) alterados. dependiendo del caso
generada por el
Medida de Cepstrum habrá más o menos
frotamiento de dos
alterada (Hillenbrand et periodicidad y
superficies ásperas
al., 1996) simetría mecánica
(voz áspera)
Sensación de Shimmer alterado, como

Posibles alteraciones
rugosidad debido a parámetro de mayor
de masa en el borde
irregularidad o asociación (Eady y
libre de los pliegues
anarquía vibratoria. Baylor, 2006; Martens et
vocales. Irregularidad
al., 2007) con procesos
Tono descendido e y asimetría vibratoria.
caracterizados por
intensidad vocal inestabilidad o Desequilibrios en el
Ronquera aumentada. aperiodicidad (Awan & cierre glótico (Ishiki
En hiperfunción, la Roy, 2005). et al., 1969), onda
sensación de mucosa más bien
Pobreza armónica,
rugosidad puede ser exagerada o
debido a la presencia de
provocada por desproporcionada.
ruido. Variaciones de la
interposición de las Amplitud
frecuencia fundamental
bandas ventriculares. aumentada.
(Pontes et al., 2002).
Se oye con un dejo de F0 aumentada. La Mucosa rígida o poco

fricción. Patrones presencia de armónicos flexible. Amplitud
vibratorios inestables y en el espectro se vibratoria reducida y
sensibles a la presión reduce hasta los 2000- ondulación mucosa
glótica, provoca en 2500 Hz (Pontes et al., disminuida.
algunos casos voz 2002). Incremento de la Las alteraciones
diplofónica (Awan & altura espectral. estructurales reducen
Aspereza / Roy, 2005).
Jitter, shimmer, HNR y la flexibilidad del
Roughness
El sonido áspero F0 diferencian tejido (Choi et al.,
pueden aparecer significativamente las 2012).
también en voces con voces normales y Existen desequilibrios
fatiga muscular en ásperas (Emanuel & en el cierre glótico y
proceso de Austin (1981). NHR la periodicidad de la
compensación alterado (Butha et al., ondulación es
(Boucher, 2008). 2004). variable.
Desequilibrios en el
Componentes de ruido
cierre glótico. Pueden
Voz rodeada de un en el espectrograma y
existir cambios en la
componente aéreo pérdida de armónicos
estructura del borde
debido a un flujo de de alta frecuencia.
libre y/o
aire excedente en el HNR (Heman-Ackah et desequilibrios
Soplo / proceso de conversión. al., 2002), Jitter y funcionales. La onda
Breathness
La altura espectral Shimmer alterados mucosa puede
desciende, a medida (Dogan et al., 2007). mostrarse reducida, y
que aumenta el grado la amplitud vibratoria
Medidas de Cepstrum
de afectación. limitada
alteradas (Hildebrand
(dependiendo del
et al., 1996).
tipo de patología).
Falta de armónicos,
Relacionada a Es posible que no
bajos valores de HNR y
hipofunción. Sonido evidencie
altos valores de jitter,
con poca energía, de alteraciones en el
debido a la falta de
intensidad débil. borde libre, aunque sí
tensión a nivel de los
desequilibrios
La voz asténica puede pliegues vocales
relacionados a una
estar relacionada (Núñez Batalla et al.,
ineficaz aducción y a
Astenia / también a alteraciones 2004).
un mal manejo de la
Astenic de tipo neurológicas
Una clasificación presión subglótica.
(miastenia gravis o
basada en sus
esclerosis lateral Fase de apertura más
características
amiotrófica – ELA), larga que la fase de
espectrográficas, nos
laríngeas (presbifonías) cierre, onda mucosa
permite una mejor
o psicógenas limitada y amplitud
visualización de los
(trastornos de de la misma
componentes
conversión) disminuida.
acústicos.
El jitter está relacionado No necesariamente

Voz apretada o tiesa,
directamente al grado de relacionado a
con inicio vocal duro,
tensión, a mayor jitter alteraciones
propiedad que
mayor, percepción de estructurales.
responde a cierto
tensión. Esto permite
grado de esfuerzo Borde libre rígido y un
diferenciar
vocal. aumento de la presión
acústicamente las voces
Tensión / Este tipo de hipo e hiperfuncionales subglótica.
Stein mecanismo se (Klingholtz & Martin, Desequilibrios por
desencadena, luego 1985). defecto en el cierre
de la instalación de glótico, onda mucosa
Nivel espectral en todas
algún impedimento limitada y de amplitud
las bandas de frecuencias
para el normal reducida, con una
del LTAS, especialmente
desarrollo de la mecánica vibratoria
de 2000 a 5000 Hz
fisiología vocal. asimétrica y aperiódica.
(Núñez et al., 2004).
Todo lo expuesto hasta aquí, deja en claro que no existen

categorías estrictas y unívocas para correlacionar los parámetros
perceptuales, acústicos y morfo-funcionales. Es por esta misma razón,
que el análisis de los parámetros aislados carece de utilidad para describir
el comportamiento vocal y debe ser evitado (Michaelis et al., 1998;
Camargo & Madureira, 2009).
El abordaje integrado debe destacarse y ser un modelo a seguir,
en el sentido de considerar todos aquellos recursos de que se dispongan
para la evaluación.
Anders L., Hollien H., Hurme P., Sonninnen A., Wendler J. (1988).
Perceptual evaluation of hoarseness by several classes of listeners.
Araújo SA., Grellet M., Pereira JC., Rosa MO. (2002). Normatização de
medidas acústicas da voz normal. Revista Brasileira de
Otorrinolaringología. 68: 540 – 544.
Askenfelt AG., Hammarberg B. (1986). Speech Waveform perturbation
analysis: a perceptual-acoustic comparison of seven measures.
Journal of Speech and Hearing Research. 29: 50 – 64.
Awan SN., Roy N. (2005). Acoustic prediction of voice type in women with
functional dysphonia. Journal of Voice. 19: 268 – 282.
Batalla FN., Santos PC., Santiago GS., González BS, Nieto CS. (2004).
Evaluación perceptual de la disfonía: correlación con los
parámetros acústicos y fiabilidad. Acta Otorrinolaringológica
Española. 55 (6): 282 – 287.
Behlau, M. (2004). Consensus auditory-perceptual evaluation of voice
(CAPE-V), ASHA 2003. Revista da Sociedade Brasileira de
Fonoaudiología. 9 (3): 187 – 189.
Bele, IV. (2005). Reliability in Perceptual Analysis of Voice Quality. Journal
of Voice. 19 (4): 555 – 573.
Bielamowicz S., Kreiman J., Gerratt BR., Dauer MS., Berke GS. (1996).
Comparison of voice analysis systems for perturbation
measurement. Journal of Voice. 39: 126 – 134.
Bhuta T., Patrick L., Garnett JD. (2004). Perceptual Evaluation of voice
quality and its correlation with acoustic measurements. Journal of
Voice. 18: 299 – 304.
Boucher, VJ. (2008). Acoustic Correlates of Fatigue in Laryngeal Muscles:
Findings for a Criterion-Based Prevention of Acquired Voice
Pathologies. Journal of Speech Language and Hearing Research.
51: 1161 – 1170.
Brindle BR., Morris HL. (1979). Prevalence of voice quality deviations in the
normal adult populations. Journal of Communication Disorders.
12: 439 – 45.
Brochmann M., Storck C., Cardin PN., Drinnan MJ. (2008). Voice loudness
and gender effects on jitter, shimmer in healthy adults. Journal of
Speech Language and Hearing Research. 51: 1152 - 1160.
Brown WS., Morris RJ., Michel JF. (1990). Vocal jitter and fundamental
frequency characteristics in aged, female professional singers.
Journal of Voice. 4: 135 – 141.
Burnett TA., Senner JE., Larson CR. (1997). Voice F0 responses to
pitchshifted auditory feedback: a preliminary study. Journal of
Voice. 11 (2): 202 – 211.
Camargo, ZA. (1996). Parâmetros Vocais e Configurações Laríngeas na
Fonação de Indivíduos Submetidos às Laringectomias Parciais
Verticais. Dissertação de Mestrado. Pontifícia Universidade
Católica de São Paulo.
Camargo ZA., Madureira S. (2009). Dimensões Perceptivas das
Alterações de Qualidade Vocal e Suas Correlações aos Planos da
Acústica e da Fisiología. D.E.L.T.A. 25 (2): 285 – 317.
Choi SH., Zhang Y., Jiang JJ., Bless DM., Welham NV. (2012). Nonlinear
Dynamic-Based Analysis of Severe Dysphonia in Patients with
Vocal Fold Scar and Sulcus Vocalis. Journal of Voice. 26 (5): 566 –
576.
Dedivitis RA., Barros APB., Queija DS., Alexandre JC., Rezende WT.,
Corazza VR., et al. (2004). Interobserver perceptual analysis of
smokers’ voice. Clinics Otolaryngology Allied Sciences. 29: 124 –
127.
Dejonckere, PH. (1995). Principal components in voice pathology. Journal
of Voice. 4: 96 – 105.
Dejonckere PH., Bradley P., Clemente P., et al. (2001). A basic protocol for
functional assessment of voice pathology, especially for
investigating the efficacy of (phonosurgical) treatments and
evaluating new assessment techniques. European Archives of
Otorhynolaryngology. 258: 77 – 82.
Dejonckere PH., Lebacq J. (1996). Acoustic, perceptual, aerodynamic and
anatomical correlations in voice pathology. ORL Journal for oto-
rhino-laryngology and its related specialities. 58 (6): 326 – 332.
Dejonckere PH., Obbens C., Demoor GM., Wienecke GH. (1993).
Perceptual evaluation of dysphonia: Reliability and relevance.
Dejonckere PH., Remacle M., Fresnel-Elbaz E., Woisnard V., Crevier-
Buchman L., Millet B. (1996). Differentiated perceptual evaluation
of pathological voice quality reliability and correlations with
acoustic measurements. Revue de Laryngologie Otologie
Rhinologie. 117: 219 – 224.
Eadie TL., Doyle F. (2005). Classification of Dysphonic Voice: Acoustic and
Auditory-Perceptual Measures. Journal of Voice. 19: 1 – 14.
Eskenazi L., Childers DG., Hicks DM. (1990). Acoustics correlates of vocal
quality. Journal of Speech and Hearing Research. 33: 298 – 306.
Feijoo S., Hernández C. (1990). Short-term stability measures for the
evaluation of vocal quality. Journal of Speech and Hearing
Research. 33: 324 – 334.
Finizia C., Dotevall H., Lundström E., Lindström J. (1999). Acoustic and
Perceptual Evaluation of Voice and Speech Quality. Archives of
otolaryngologyhead & neck surgery. 125: 157 – 163.
Fröhlich M., Michaelis D., Strube HW., Kruse E. (2000). Acoustic voice
analysis by means of the hoarseness diagram. Journal of Speech
and Hearing Research. 43: 706 – 720.
Fukazawa T., El-Assuooty A., Honjo I. (1988). A new index for evaluation
of the turbulent noise in pathological voice. Journal of the
Garrett, CG. (1999). Hoarseness. Medice-Clinics of North America. 83: 115
– 123.
Gerratt BR., Kreiman J., Antonnanzaz-Barroso N., Berke GS. (1993).
Comparing internal and external standards in voice quality
judgments. Journal of Speech and Hearing Research. 36: 14 – 20.
Giovanni A., Robert D., Estublier N., Teston B., Zanaret M., Cannoni M.
(1996). Objective evaluation of dysphonia: Preliminary results of a
device allowing simultaneous acoustic and aerodynamic
measures. Folia Phoniatrica et Logopaedica. 48: 175 – 185.
González J., Cervera T., Miralles JL. (2002). Acoustic voice analysis:
Reliability of a set of multi-dimensional parameters. Acta
Otorrinolaringológica Española. 53 (4): 256 – 268.
Hakkesteegt MM., Brocaar MMP., Wieringa MH., Feenstra L. (2008). The
Relationship Between Perceptual Evaluation and Objective
Multiparametric Evaluation of Dysphonia Severity. Journal of
Voice. 2: 138 – 145.
Halberstam, B. (2004). Acoustic and perceptual parameters relating to
connected speech are more reliable measures of hoarseness than
parameters relating to sustained vowels. ORL. 66: 70 – 73.
Hammarberg B., Fritzell B., Gauffin J., Sundberg J. (1986). Acoustic and
perceptual analysis of vocal dysfunction. Journal of Phonetics. 14:
533 – 547.
Hammarberg B., Gauffin J. (1995). Perceptual and acoustics characteristics
of quality differences in pathological voices as related to
physiological aspects. En Vocal Fold Physiology, Fujimura, O. and
Hirano, M. 283-303. San Diego: Singular Publishing Group Inc.
Heman-Ackah YD., Heuer RJ., Michael DD., et al. (2003). Cepstral peak
prominence: a more reliable measure of dysphonia. Journal of
Speech Language and Hearing Research. 112: 324 – 333.
Hillenbrand, J. (1988). Perception of aperiodicities in synthetically
generated voices. Journal of the Acoustic Society of America. 83:
2361 – 2371.
Hillenbrand J., Cleveland RA., Erickson RL. (1994). Acoustic correlates of
breathy vocal quality. Journal of Speech and Hearing Research. 37:
769 – 778.
Hillenbrand J., Houde RA. (1996). Acoustic correlates of breathy vocal
quality: dysphonic voices and continuous speech. Journal of
Speech and Hearing Research. 39: 311 – 321.
Hillman R., Montgomery W., Zeitels S. (1997). Appropriate use of objective
measures of vocal function in the multidisciplinary management of
voice disorders. Current Opinion Otolaryngology Head Neck
Surgery. 5: 172 – 175.
Hirano, M. (1981). Clinical examination of voice. Vienna: Springer-Verlag.
Hirano M., Bless DM. (1997). Exame Videoestroboscópico da laringe. Porto
Alegre: Artes Médicas.
Hirano M., Hibi S., Terasawa R., Fujiu M. (1986). Relationship between
aerodynamic, vibratory, acoustic and psychoacoustic correlates in
dysphonia. Journal of Phonetics. 14: 445 – 456.
Hiroto, I. (1967). Hoarseness: viewpoints of voice physiology. Japonese
Journal of Logopedics & Phoniatrics. 8: 1 – 9.
Howard DM., Abberton E., Fourcin A. (2012). Disordered voice
measurement and auditory analysis. Speech Communication
Journal. 54(5): 611 – 621.
Isshiki N., Okamura H., Tanabe M., Morimoto M. (1969). Differential
diagnosis of hoarseness. Folia Phoniatrica et Logopaedic. 21: 9 –
19.
Jones TM., Trabold M., Plante F., Cheetham BM., Earis JE. (2001).
Objective assessment of hoarseness by measuring jitter. Clinical
Otolaryngology. 26 (1): 29 – 32.
Koufmann J., Blalock D. (1998). Vocal Fatigue and Dysphonia in The
Professional Voice User: Bogart-Bacall Syndrome. Laryngoscope.
98:493 – 498.
Kreiman J., Gerratt B., Antoñanzas-Barroso N. (2006). Analysis and
Synthesis of Pathological Voice Quality. Los Angeles: Bureau of
Glottal Affairs of the University of California.
Lee CK., Childers DG. (1991). “Some acoustical, perceptual and
physiological aspects of vocal quality. San Diego: Singular.
Ma EP., Yiu EM. (2005). Suitability of acoustic perturbation measures in
analyzing periodic and nearly periodic voice signals. Folia
Phoniatrica et Logopaedica. 57(1): 38 – 47.
Ma EP., Yiu EM. (2006). Multiparametric Evaluation of Dysphonic Severity.
Journal of Voice. 20: 380-390.
Martin DP., Fitch J., Wolfe VI. (1995). Pathological voice type and the
acoustic prediction of severity. Journal of Speech and Hearing
Research. 38: 765 – 771.
Maryn Y., Corthals P., DeBodt M., Van Cauwenberge P. (2009).
Perturbation measures of voice: A comparative study between
Multi- Dimensional Voice Program and Praat. Folia Phoniatrica et
Logopaedica. 61: 217 – 226.
Mehta DD., Hillman RE. (2008). Voice assessment: updates on perceptual,
acoustic, aerodynamic and endoscopic imaging methods. Current
Opinion in Otolaryngology Head and Neck Surgery. 16: 211 – 15.
Michaelis D., Frölich M., Strube HW. (1998). Selection and combination of
acoustic features for the description of pathologic voices. Journal
of the Acoustic Society of America. 103: 1628 – 1638.
Oliveira, IB. (2004). Qualidade Vocal: Correlatos acústicos,
perceptivoauditivos e fisiológicos. Revista Sociedade Brasileira de
Fonoaudiologia. Suplemento Especial.
Orlikoff RF., Dejonckere PH., Dembowski J., Fitch J., Gelfer MP., Gerratt
BR., et al. (1999). The perceived role of voice perception on clinical
practice.” Phonoscope. 2: 89 – 106.
Piccirillo JF., Painter C., Fuller D., Fredrickson JM. (1998). Multivariate
analyses of objective vocal function. Annals of Otology, Rhinology
and Laryngology. 107: 107 – 112.
Pinho SM., Pontes P. (2002). Escala de Avaliação Perceptiva da Fonte
Glótica: RASAT. Vox Brasilis. 3: 11 – 13.
Pinho SM., Pontes P. (2008). Músculos intrínsecos da Laringe e Dinâmica
Vocal. (Série Desvendando os Segredos da Voz). Rio de Janeiro:
Revinter. Parte I.
Pinho S., Tsuji D., Bohadana S. (2006). Fundamentos em Laringologia e
Voz. Rio de Janeiro: Editora Guanabara Koogan, S.A.
Sakata T., Kubota N., Yonekawa H., Imaizumi A., Niimi S. (1994). GRBAS
evaluation of running speech and sustained phonations. Annual
Bulletin – Research Institute of Logopedics and Phoniatrics. 28: 51
– 56.
Shrivastav, R. (2006). Multidimensional scaling of breathy voice quality:
individual differences in perception. Journal of Voice. 20: 211 – 222.
Shrivastav R., Camacho A. (2010). A computational model to predict
changes in breathiness resulting from variations in aspiration noise
level. Journal of Voice. 24 (4): 395 – 405.
Speyer R., Wieneke GH., Dejonckere PH. (2004). Documentation of
progress in voice therapy: perceptual, acoustic and
laryngoestroboscopic findings pretherapy and posttherapy.
Uloza V., Verikas A., Bacauskiene M., Gelzinis A., Pribuisienne R., Keseta
M., Saferis V. (2011). Categorizing Normal and Pathological
Voices: Automated and Perceptual Categorization. Journal of
Voice. 25: 700 – 708.
Wolfe V., Cornell R., Palmer C. (1991). Acoustic correlates of pathologic
voice types. Journal of Speech, Language and Hearing Research.
34: 509 – 516.
Wolfe V., Fitch J., Cornell R. (1995). Acoustic prediction of severity in
commonly occurring voice problems. Journal of Speech, Language
and Hearing Research. 38 (2): 273 – 279.
Wolfe V., Martin D. (1997). Acoustic correlates of dysphonia: type and
severity. Journal of Communication Disorders. 30: 403 – 416.
Wuyts FL., De Bodt MS., Molenberghs G., Remacle M., Heyler L., Millett
B. (2000). The Dysphonic Severity Index: an objective measure of
vocal quality based on a multiparameter approach. Journal of
Speech, Language and Hearing Research. 43: 796 – 809.
Wuyts FL., De Bodt MS., Van de Heyning PH. (1999). Is the Reliability of a
Visual Analog Scale Higher Than an ordinal Scale? As Experiment
with the GRBAS Scale for the Perceptual Evaluation of Dysphonia.
Journal of Voice. 13 (4): 508 – 517.
Yamasaki R., Leão SHS., Madazio G., Padovani M., Azevedo R., Behlau
M. (2008). Correspondência entre Escala Analógico-Visual e a
Escala Numérica na Avaliação Perceptivo-Auditiva de Vozes. In
XVI Congresso Brasileiro de Fonoaudiologia. Outubro; Campos de
Jordão – SP.
Yamauchi E.J., Imaizumi S., Maruyama H., Haji T. (2010). Perceptual
evaluation of pathological voice quality: a comparative analysis
between the RASATI and GRBASI scales. Logopedics Phoniatrics
Vocology. 35 (3): 121 – 8.
Yanagihara N. (1967). Significance of Harmonic Changes and Noise
Components in Hoarseness. Journal of Speech and Hearing
Research 10: 531 – 541.
Yiu EM., Ng CY. (2004). Equal appearing interval and visual analogue
scaling of perceptual roughness and breathiness. Clinical
Linguistics & Phonetics. 18 (3): 211 – 229.
Yu P., Ouaknine M., Giovanni A. (2001). Objective voice analysis for
dysphonic patients: a multiparametric protocol including acoustic
and aerodynamic measurements. Journal of Voice. 15: 529 - 542.
Yu P., Revis J., Wuyts FL., Zanaret M., Giovanni A. (2002). Correlation of
instrumental voice evaluation with perceptual voice analysis using
a modified visual analogue scale. Folia Phoniatrica et Logopaedica.
54: 271 – 281.
Yumoto, E. (1983). The quantitative evaluation of hoarseness. Archives of
otolaryngology - head & neck surgery. 109 (1): 48 – 52.
Yumoto E., Gould W.J., Baer T. (1982). Harmonics-to-noise ratio as an
index of the degree of hoarseness. Journal of the Acoustic Society
of America. 71(6): 1544 – 1549.
Yumoto E., Sasaki Y., Okamura H. (1984). Harmonics-to-noise ratio and
psychological measurement of the degree of harshness. Journal of
Speech and Hearing Research. 27 (1): 2 – 6.
CAPÍTULO 6
“La EGG es un examen sencillo, rápido y
eficiente para medir el funcionamiento
glótico” (Vaca & Cobeta, 2013)
Dentro de la Evaluación morfo – funcional de la laringe existen

diversos métodos de visualización indirecta de la vibración de los pliegues
vocales, los cuales son denominados como Glotografías. Suelen
distinguirse cinco tipos distintos de glotografía: Electroglotografía (EGG),
Fotoglotografía (FGG), Glotografía mediante Ecografía, la Glotografía
Inversa y la Ultrasonoglotografía (Cecconello, 2011; Casado, 2002).
Algunos autores incluyen además dentro de esta evaluación al
Electrodiagnóstico Laríngeo, donde se evalúa la capacidad motora de
los músculos implicados en la fonación. Dentro del electrodiagnóstico se
encuentran la Neuromiografía, Reflexomiografía, y la Electromiografía
Laríngea (Ver Capítulo 8), de creciente uso en la clínica vocal en la
actualidad (Casado, 2002).
La Electroglotografía (EGG) es un método no invasivo de
evaluación de la función laríngea, precisamente del patrón vibratorio de
los pliegues vocales durante el proceso fonatorio, y permite valorar
particularmente el grado de contacto entre ellos durante cada ciclo
glotal. Actualmente es utilizada como una técnica complementaria de
valoración del cierre glótico en la evaluación objetiva de la voz, junto al
análisis acústico y las medidas aerodinámicas de la fonación (Vaca &
Cobeta, 2013).
En 1957, Fabre describe por primera vez este procedimiento
utilizando la aplicación de un método basado en el fenómeno de
impedancia aplicado al examen de la función laríngea, y lo denominó
como “electroglotografía”, mencionando que permitiría la exploración
fisiológica en la producción del sonido con gran detalle, sin tener que
ingresar ningún dispositivo dentro de la cavidad oral de los pacientes
(citado por Baken, 1992). A partir de allí, el electroglotógrafo como tal fue
modificando sus características iniciales y se presentó como un
dispositivo disponible en ciertos países, particularmente para la
exploración del comportamiento glotal, el mecanismo respiratorio, y en
el caso de ciertos trastornos específicos del habla. El método fue
rápidamente reclutado como una herramienta de investigación, y es
Adrian Fourcin en la Universidad College de Londres quién se convierte en
el principal impulsor de la utilización del mismo durante el proceso de
rehabilitación de los trastornos de la voz y del habla (Baken, 1992). Desde
aquel momento, la electroglotografía ha sido utilizada entonces para la
investigación y para la clínica, en voces patológicas, en voces normales e
incluso en exámenes sobre voz profesional hablada y cantada. Esto ha
posicionado a la EGG como una prueba sumamente importante dentro
de algunos protocolos de evaluación estructural y funcional, tanto en la
detección de alteraciones vocales, como en el seguimiento terapéutico o
el entrenamiento de voces sanas.
Son muchos los autores que definen y describen a la EGG a lo
largo de las últimas seis décadas, pero tomaremos a Le Huche & Allali
(1994) quienes se refieren a la misma como “un procedimiento que
permite estudiar la función laríngea en condiciones fisiológicas de habla
espontánea, sin ningún aparato que moleste al paciente”. Según
Rothenberg & Mahshie (1988) el término electroglotografía es aceptado
como el nombre genérico para designar a un dispositivo a través del cual
se pueden visualizar los movimientos de los pliegues vocales mediante
una corriente eléctrica muy pequeña que pasa por el cuello a nivel del
cartílago tiroideo en la laringe, usando dos o más electrodos de superficie
en el cuello (Figura 31).
Figura 31. Electrodos

de superficie colocados
en el cuello
La EGG ha sido sustentada tanto en la clínica como en

investigación como un método objetivo y de alto impacto en la
descripción de las características del ciclo glotal. A nivel mundial, sólo en
los últimos 15 años mencionaremos, por ejemplo, a Miller & Schutte
(1991); Rothenberg (1992); Svec, Schutte & Miller (1996); Peterson,
Barkmeier, Verdolini & Hoffman (1994); Gaskill & Erickson (2008);
Laukkanen, Titze, Hoffman & Finnegan (2008); Zagólski (2009); Avelino
(2010); Vaca & Cobeta (2013); Tang, Zhang, Qin, Wang & Wan (2013);
Calvache & Guzmán (2013); Calvache Mora (2015), entre otros.
Consideraciones Generales sobre el Ciclo Glotal
Resulta necesario profundizar sobre la dinámica de la producción
vocal antes de describir las especificaciones en relación a la EGG.
El sonido de la voz es producto de un mecanismo sumamente
complejo en el que intervienen diferentes niveles (Farías, 2007), y donde
se producen entre algunos de los fenómenos más significativos la
apertura y cierre de la glotis. Este movimiento de apertura y cierre integra
lo que se denomina como “ciclo glotal”, explicado de forma extensa por
múltiples autores (Rothenberg 1988; Titze 1990; Baken 1992; Andrade
Miranda & Godino Llorente, 2005; Gómez Vilda et al., 2007; Osma Ruiz et
al., 2009; Cecconello, 2011; Gómez Vilda, 2014; Dosal González, 2014).
El ciclo glotal está conformado por dos grandes momentos o
fases a describir:
 Fase Abierta: cuando los pliegues vocales no se encuentran
unidos entre sí.
 Fase Cerrada: cuando los pliegues vocales se encuentran
unidos entre sí.
A su vez, dentro de estas dos grandes fases, es posible sub-dividir

4 etapas: fase abierta (A), fase en cierre (EC), fase cerrada (C), fase en
apertura (EA).
Pero, ¿cómo se produce este fenómeno? Esto ha sido explicado

desde diversas teorías, y se sabe que es causado por múltiples factores,
entre ellos el flujo de aire, las propiedades geométricas y las
características biomecánicas de los pliegues vocales (Tao & Jiang, 2009).
El aire alojado en los pulmones genera una determinada presión
subglótica que permite la aducción de los pliegues vocales hacia la línea
media, implicando una contracción muscular de los mismos. Esa presión
de aire, por debajo de los pliegues, vence la resistencia de la fuerza
mioelástica y el aire comienza a ser espirado, y por lo tanto estos generan
una vibración; es decir, si analizamos este fenómeno desde un corte
transversal se puede observar un proceso increíblemente coordinado.
Primero se abren lentamente los bordes inferiores de los
pliegues vocales por acción de la presión de aire subglótica, y esta onda
se propaga de forma vertical desde la región inferior a la superior,
provocando la apertura de los bordes superiores. Este movimiento
subsecuente de los bordes inferiores y luego los superiores se reinicia
continuamente en forma cíclica durante la fonación (Figura 32).
Figura 32. Ciclo

Glotal (Fases) –
Efecto Bernoulli
Utilización de la EGG
La electroglotografía es capaz de indicar: por un lado, sobre el
momento donde la glotis se cierra y cuando se abre en cada ciclo glotal; y
además la forma o patrón que utiliza para su realización. Esto incorpora
información sumamente valiosa que puede ser complementada con la
obtenida, por ejemplo, en estudios de imagen laringoscópica (como la
nasofibroscopía, o la estroboscopía), el análisis acústico de la señal
sonora (Ver capítulo 4), e incluso de las mediciones aerodinámicas (Ver
capítulo 7). Todo ello puede ser conjugado a través de un análisis
coordinado aportando información muy detallada sobre el
funcionamiento en el proceso vocal, evidenciando de esta manera el
comportamiento específico de todos aquellos patrones biomecánicos
implicados para tal fin, en situaciones determinadas y bajo condiciones
específicas.
Diversos autores se han referido a la EGG y su utilidad dentro de
la evaluación y la terapéutica de la voz normal y la patológica. Su uso ha
sido reconocido para el seguimiento de deficiencias vocales de tipo
funcional y orgánico a partir de intervenciones quirúrgicas y/o
terapéuticas (Zagólski & Carlson, 2002); también se ha reportado
evidencia de la EGG en la clínica vocal utilizando la retroalimentación de
los sujetos para la optimización fonatoria, tanto en voces patológicas
(Herbst, Howar & Schlömicher-Thier, 2010), como en voces normales con
la utilización de diferentes registros (Paul, Kumar, Chatterje &
Mukherjee, 2011), e inclusive en voz cantada (Gaskill & Erickson, 2008;
Miller 2008). Se ha mencionado también a la EGG con el uso
suplementario de un transductor de presión intranasal colocado debajo
del velo del paladar (Perlman & Liang, 1991) brindando información
adicional sobre aspectos medibles en deglución.
Es importante mencionar que se han realizado trabajos sobre
EGG en la valoración de la Voz Esofágica en casos de Laringectomía
(Fernández Baillo, Gómez, Scola, Ramírez, 2005), siendo casos en los que
el estudio acústico se ve limitado por las características de la señal, pero
si se aplica EGG se obtienen valores de F0 relacionados a la vibración de
las paredes del esófago y faringe de forma sencilla (Vaca & Cobeta, 2013).
Como se puede observar sus utilizaciones son múltiples, pero,
¿porque resulta tan fascinante el uso de la electroglotografía en
particular? Esto se encuentra descripto por autores como Baken (1992),
Titze (1990), Le Huche & Allali (1994) y pasaremos a detallarlo a
continuación:
 Es una evaluación de tipo objetiva y permite de forma no
invasiva obtener información relevante sobre los patrones de
contacto a nivel glótico.
 Es una señal esencialmente libre de influencia supraglótica, y
puede ser de enorme valor para conocer patrones
diferenciados en relación a la fuente – filtro en la producción
vocal.
 Su forma de onda permite además obtener de manera sencilla
la frecuencia fundamental de la voz.
 Por último y de gran importancia, permite indagar aspectos
relacionados a la función de los pliegues vocales que no se
pueden obtener a través del análisis acústico como ser el
cociente de contacto.
Ahora bien, la medición cuantitativa del contacto en los pliegues

vocales resulta un elemento atractivo, pero no es la única medición
cuantificable que puede realizarse a través de la EGG, ya que se pueden
analizar además otros parámetros como el cociente de apertura o nivel
de criterio; y es posible también realizar estimaciones cualitativas a partir
de la forma de onda (waveform) describiendo diversos fenómenos
importantes en la producción vocal.
La onda obtenida es una representación gráfica del contacto de
los pliegues vocales y puede utilizarse para describir la duración (fases de
apertura y cierre), y los modelos de contacto respecto del ciclo glótico. En
general, la EGG tiene un interés descriptivo al proporcionar índices de
regularidad en términos de período y de amplitud de la onda, así como
índices de contacto entre los mismos. Cabe mencionar que
profundizaremos sobre todo esto en el segmento dedicado a parámetros
electroglotográficos.
Limitaciones: algunos autores se refieren a las limitaciones de la EGG
considerando:
 El lugar de los electrodos sobre las alas tiroideas, la distancia y
el ángulo son cruciales para la obtención de una onda
electroglotográfica válida.
 La señal electroglotográfica puede alterarse simplemente por
movimientos de cabeza o ascensos de la laringe durante la
deglución.
 No se puede obtener señal electroglotográfica en cuellos de
personas con abundante tejido graso subcutáneo, ya que ello
reduce la conductividad de la energía eléctrica que se precisa
para la EGG.
 Las laringes de dimensiones anatómicas muy reducidas
podrían ser causa de una insuficiente amplitud de la onda
electroglotográfica.
Generalidades sobre el Funcionamiento de la EGG

Para poder describir con claridad el funcionamiento de la EGG se
hace imprescindible revisar principios elementales de la Física, y aplicar
estos principios para una adecuada transducción biológica de los mismos
en el mecanismo de la producción vocal.
Como ya se mencionó anteriormente, para realizar la
electroglotografía se colocan electrodos a nivel del cartílago tiroideo,
pasando entre ellos una pequeña corriente eléctrica. Esos electrodos
generan un flujo eléctrico que se describe a través de la Ley de Ohm
(Bueche & Hecht, 2000), pero para comprender aún mejor este flujo
eléctrico a continuación desarrollaremos la electrodinámica que es la que
permite el movimiento de las cargas eléctricas.
Movimiento de cargas eléctricas: la electrización de un cuerpo consiste
en poner en movimiento de emigración o inmigración cargas eléctricas
elementales. El material a través del cual se produce la electrificación
debe ser lo suficientemente conductor para la adecuada circulación de
cargas. Este transporte de energía genera un flujo determinado de la
misma, que también está definido desde la velocidad del movimiento de
cargas.
Para comprender mejor este movimiento de cargas eléctricas, es
necesario saber que la intensidad de la corriente es la cantidad de carga
que atraviesa un conductor por una unidad de tiempo (Cristiani, 2014).
Los electrodos utilizados en la EGG generan un flujo eléctrico, el
cual pasa a través de un conductor y es proporcional a la tensión que se
aplica al mismo, generando (en condiciones normales) cierto
impedimento al flujo de electrones, siendo esta propiedad la resistencia,
la cual debe ser baja para ser considerado como un cuerpo que sea muy
buen conductor. Claramente si el voltaje se produce con una corriente
constante, la resistencia aumenta de forma constante. Si se utiliza una
corriente de tipo alterna también se produce este impedimento para el
paso del flujo en el voltaje denominándose de forma general como
impedancia, y se encuentra descripto en muchas de las definiciones
halladas sobre la EGG.
Cuando ocurren modificaciones relacionadas al tejido, en
consecuencia, también se modifica la impedancia y la conductancia en
los mismos. Existe una explicación sobre este fenómeno: si una corriente
está pasando por una estructura cuya resistencia aumenta y disminuye,
el voltaje a través de dicha estructura aumentará y disminuirá.
En el caso de la EGG todos estos principios físicos son aplicados
a un material biológico (como lo es en este caso la laringe,
particularmente los pliegues vocales) teniendo en cuenta principalmente
que las estructuras biológicas son buenos conductores de electricidad.
Además, existe cierta relación entre el grado de resistencia que oponen
sus estructuras con su composición química, y la resistencia en cualquier
estructura varía también según modificaciones de su forma.
Cuando existe aumento de la impedancia eléctrica los pliegues
vocales se encuentran en fase abierta disminuyendo la conductancia, y
cuando estos se aproximan durante la fase de cierre disminuye la
impedancia eléctrica (la energía se transmite de un electrodo a otro) y
aumenta la conductancia entre los mismos.
Según lo anteriormente mencionado, para poder medir esta
resistencia la corriente debe fluir a través de un sistema (lo cual es
descripto por la Ley de Ohm), pero cuando la resistencia se aplica a
tejidos vivos surgen además algunos otros interrogantes que se
relacionan con las circunstancias y las restricciones que este fenómeno
produce aplicado al funcionamiento real de la laringe; por ejemplo se
podrían mencionar las interferencias creadas por la presencia de excesivo
tejido graso perilaríngeo, lo cual no permite obtener ondas
electroglotográficas confiables.
Dentro de las circunstancias implicadas en el procedimiento de
la EGG, surge casi siempre en algunos profesionales que realizan dicho
procedimiento, como en los sujetos a quienes se aplica el mismo, un
interrogante: ¿Cuál es la cantidad de voltaje que voy a recibir? ¿Podría ello
causarme algún daño?, por lo cual Vaca & Cobeta (2013) indican que la
corriente de los electrodos debe tener una intensidad máxima de 10 mA
(mili-Amperio), con una diferencia de potencial menor de 1 V (Voltio),
evitando así la sensación del paso de corriente.
Por lo tanto, la cantidad de corriente utilizada en el caso de la
EGG es aproximadamente de 0,5 Wtts (Vatios) y no podría causar ningún
tipo de daño, ya que la magnitud de la corriente eléctrica es muy
pequeña. En relación a ello, algunos autores aconsejan ajustar la
intensidad de la corriente utilizada para obtener un buen registro de la
onda electroglotográfica, aunque este ajuste no es posible con todos los
dispositivos disponibles actualmente.
Si la intensidad de la corriente eléctrica es baja se genera el
transporte de la misma de forma variable según el material en el cual se
aplica, pero si la misma es demasiado intensa provoca una reacción del
tejido lo cual no es el objetivo de la EGG. Esto en cambio sería material de
estudio si nos referimos a campos relacionados con la
electroestimulación de tejidos.
Además de la magnitud de la corriente eléctrica utilizada se debe
tener en cuenta también la frecuencia. Los actuales equipos de EGG
cuentan con filtros de alta y baja frecuencia que permiten mejorar la
fiabilidad en las características de las ondas obtenidas, y el análisis
numérico derivado de las mismas. Según Miller (2008) la señal utilizada
debe ser de alta frecuencia, entre 2 a 5 MHz típicamente, encontrando
sutiles diferencias en estos valores con otros autores.
Especificaciones de los Dispositivos

Para la evaluación electroglotográfica es necesario el uso de una
interfaz que permita el registro de las modificaciones en la actividad
glótica. Existen diferentes empresas que fabrican este dispositivo para la
evaluación electroglotográfica, tales como: Electroglottograph by Donald
Miller – VoceVista (Figura 33), Electroglottograph – KAY PENTAX CSL,
Electroglottograph – lingWAVES (WEVOSYS – Germany),
Electroglottograph – Dr. Speech, EG2-PCX2 – Glottal Enterprises, entre
los más difundidos.
La interfaz captura la señal digitalizada de la onda
electroglotográfica, y permite la visualización mediante un software
específico que facilita la lectura de la curva y sus parámetros cuantitativos
derivados. Se utiliza para ello una corriente máxima de 10 mA y filtro de
paso alto. Sus componentes son:
Figura 33. PhD. Donald
Miller – Vocevista Pro /
Evaluación
Electroglotográfica
http://ncvs.org/2013_Singers
Workshop.php
 Electrodos (Figura 34).

 La interfaz que permite la conversión de la señal para poder ser
analizada por un software específico (Figura 35).
 Cables de Conectividad desde la interfaz del EGG a la
computadora (Figura 35).
Figura 34. Colocación

de Electroglotógrafo –
Glottal Enterprises
http://www.glottal.com/
Electroglottographs.html#gal
Figura 35.
Electroglotógrafo y
elementos de
conectividad – Glottal
Enterprises
Electroglottographs.html#gal
Procedimiento
Se deben considerar los siguientes pasos para la grabación de la
señal:
a. Colocar los electrodos de superficie a ambos lados de la escotadura
del cartílago tiroideo, a la altura teórica de los pliegues vocales. Se
recomienda el uso de una fina capa de gel en los electrodos para
mejorar la conducción.
Es indispensable colocarlos en el lugar adecuado de las alas
tiroideas teniendo en cuenta la distancia y el ángulo óptimo para el
paso de la corriente eléctrica entre ambos, pero también es
fundamental que la superficie donde se colocan los electrodos se
encuentre limpia. Para ello se puede pasar un algodón embebido en
alcohol a los fines de asegurar que la zona se encuentre
completamente preparada, e incluso en muchos casos se aconseja
utilizar una fina capa de gel de transducción para mejorar la
visualización de la señal electroglotográfica.
b. Los electrodos deben encontrarse bien ajustados, y esto se logra a
través de una banda de velcro que permite un ajuste preciso a la
dimensión del cuello (Figura 36). Algunas marcas incluyen una
banda de velcro extra para complementar en casos de cuellos de
mayores dimensiones.
La intensidad de corriente eléctrica en la mayoría de los dispositivos
viene regulada con una intensidad máxima de 10 mA, con una
diferencia de potencial (entre ambos electrodos) menores a 1 V.
Por otro lado, se debe constatar en las propiedades del dispositivo
que el registro se realice en 2 canales, a 16 bits, con una frecuencia
de muestreo de 44.100 Hz. El filtro utilizado es de paso alto para
mejorar la fiabilidad de la señal (2 a 5 MHz). La ganancia puede ser
un aspecto más relativo, ya que puede depender de la intensidad
del hablante o de la tarea asignada por el evaluador.
Figura 36. Colocación de

Electrodos y Banda de Velcro
c. Con los electrodos debidamente colocados, y la cinta de velcro bien
ajustada se le pide al sujeto la emisión de la tarea fonatoria
asignada, que pueden ser en general vocales sostenidas (Figura 37).
Se utilizan también estas emisiones en diferentes registros, incluso
en diferentes intensidades para conocer las variaciones de la onda
Figura 37. Tareas

Fonatorias con
Vocales /a/ - /o/ -
/u/
Cuando se termina de utilizar el EGG, se deben limpiar los

electrodos con un algodón embebido en alcohol.
Parámetros Electroglotográficos
La electroglotografía permite conocer las fases de apertura y
cierre relacionadas al ciclo glotal, describiendo con bastante detalle los
patrones de cierre durante el contacto entre ambos. Es importante
destacar como bien lo menciona Calvache (2015) que a través de la EGG
no es posible obtener información precisa de lo que ocurre con los
pliegues vocales durante la fase abierta. Además, Vaca & Cobeta (2013)
resaltan el hecho de que a través de la EGG no es posible distinguir la
causa de la irregularidad en el contacto, ni tampoco la extensión de la
apertura glótica.
La señal obtenida a través del electroglotógrafo se denomina
electroglotograma. Existen dos modelos clásicos de representación de
la onda electroglotográfica:
Onda electroglotográfica de Rothenberg: la fase de cierre se refleja con
una disminución de la impedancia, y por lo tanto una deflexión de la onda
hacia abajo (Figura 38).
Figura 38. Onda
Electroglotográfica de
Rothenberg
Onda electroglotográfica de Fourcin - Registro Lx: Fourcin llama registro

Lx a la onda donde la fase de cierre en los pliegues vocales produce una
deflexión de la señal hacia arriba reflejando mayor conductividad y
contacto.
La onda LX es proporcional a la superficie de contracto entre
ambos pliegues vocales, y el análisis debe realizarse tanto cualitativa
como cuantitativamente.
Entre los parámetros que deben tenerse en cuenta durante el
análisis cualitativo se mencionan, por ejemplo: la amplitud, la regularidad
y la simetría y la forma de la Onda. Esta debe analizarse cualitativamente
de acuerdo a los momentos en las fases del ciclo glotal (Figura 39).
Figura 39. Onda

Electroglotográfica
Lx – Fases del Ciclo
Glotal
Se examina de la siguiente forma: cuando los pliegues vocales se

encuentran en fase abierta la conductancia es baja, ésta comienza a
aumentar (Pendiente de Ascenso) a medida que los mismos comienzan a
aproximarse llegando a su pico máximo cuando los pliegues vocales se
encuentran en fase de cierre (denominada como “rodilla” de la curva), y
partir de allí la conductancia comienza nuevamente a disminuir
(Pendiente de Descenso) a medida que los pliegues comienzan a
separarse hasta retornar a la fase de apertura. Todo ello permite
visualizar aumentos y descensos consecutivos en la amplitud de la onda
(Figura 40).
Figura 40.
Momentos de ciclo
glotal en la onda
EGG
Análisis Cualitativo en la EGG

De acuerdo a su forma es posible describir 4 tipos de onda EGG:
Curva con Ensanchamiento del Pulso Glotal (Pulse Widening): el
ensanchamiento del pulso se correlaciona con la aducción de los pliegues
vocales (Figura 41).
Figura 41.
Interpretación de la
señal
electroglotográfica
– Pulse Widening
(Titze,1990)
Curva con Pico Sesgado (Peak Skewing): se produce una mayor

convergencia de la glotis, con la eliminación gradual vertical a lo largo de
esta convergencia (Figura 42).
Figura 42.
señal
electroglotográfica –
Peak Skewing (Titze,
1990)
Curva en Falda Abultada (Skirt Bulging): se visualiza una superficie medial

arqueada en la rodilla de la curva, y una caída progresiva en las pendientes
de la onda. Ese incremento en la rodilla de la curva puede estar vinculado
a algún tipo de superficie engrosada en el borde libre de los pliegues
vocales (Figura 43).
Figura 43.
señal
electroglotográfica –
Skirt Bulging (Titze,
1990)
Curva en Falda de Rampa (Skirt Ramping): se produce la eliminación
gradual vertical. Existe un ángulo muy pequeño entre la porción superior
e inferior. Se producen cambios rápidos en el contacto durante el inicio y
el final, y cambios lentos en el momento intermedio. Cuando existe un
incremento en la fase vertical se produce una onda triangular, más que
rectangular (Figura 44).
Figura 44.
Interpretación de
la señal
electroglotográfica
– Skirt Ramping
(Titze, 1990)
También podrían obtenerse formas de onda combinadas de

acuerdo a estas cuatro características principales. Vaca & Cobeta (2013)
describen de forma aproximada algunas formas de onda según la
patología vocal específica (Figura 45):
Figura 45.
Patologías Vocales
(Vaca & Cobeta,
2013)
La forma de onda en la EGG también se ve influenciada por el

mecanismo fonatorio empleado (registro). El uso de diversos registros
modifica el patrón de contacto en los pliegues vocales, e incluso en un
mismo registro es posible observar modificaciones de amplitud en la
onda de acuerdo al uso de una voz ligera, o más bien pesada.
En voces donde se percibe mayor intensidad de la voz el cociente
de contacto es mayor, y por tanto se puede observar una curva del estilo
de falda abultada (skirt bulging), como en el ejemplo 1, donde el cociente
de contacto asciende a 54% y se presenta con una frecuencia
fundamental de 432 Hz (Figura 46).
Figura 46. Ejemplo 1
En cambio, cuando la voz se emite en una frecuencia un poco

más elevada, como en el ejemplo 2, se observa una curva que se
corresponde a una falda de rampa (skirt ramping), en donde el cociente de
contacto desciende a un 37% y se presenta con una frecuencia de 784 Hz
(Figura 47).
Figura 47. Ejemplo 2
En el ejemplo 3 se puede ver cómo se producen las variaciones

en la frecuencia fundamental, su relación con el cociente de contacto, y
las modificaciones en la forma de onda (Figura 48). En casos de voces
patológicas que suponen un defecto en el cierre glótico el cociente de
contacto disminuye.
Figura 48.
Ejemplo 3
Las variaciones en la forma de onda según los registros fueron

caracterizadas de la siguiente forma (Pérez Sanz, 2011):
Registro Pulso: la onda Lx refleja ciclos irregulares en amplitud y en
duración, generalmente agrupado en pares.
Registro Modal: la fase total de contacto es relativamente larga, una
pendiente de ascenso corta, y una pendiente de descenso más larga,
describiendo de forma marcada la “rodilla” de la onda, conformando una
onda asimétrica.
Registro Elevado: el registro elevado o “falsetto” se caracteriza por su
escasa intensidad electroglotográfica. Se pueden emitir diversos tipos de
falsetto, aunque es común encontrar un pico redondeado, con una onda
mucho más simétrica que en registro modal.
Análisis Cuantitativo en la EGG

Es posible obtener múltiples valores cuantitativos de la
Electroglotografía, dependiendo eso del equipo utilizado y sus
mediciones disponibles. Se mencionan a continuación las principales.
Cociente de Contacto – Contact Quotient (CQ):

Dentro del análisis cuantitativo de la electroglotografía, uno de
los parámetros que ha generado mayor interés es el Cociente de Contacto
o Contact Quotient (CQ). EL CQ es el porcentaje de tiempo de cada ciclo
vibratorio en el que los pliegues permanecen juntos. Tiene relación
directa con la aducción de los pliegues vocales, y es inversamente
proporcional al cociente de apertura (OQ).
De acuerdo con los trabajos de investigación realizados hasta el
momento, el CQ ha demostrado ser fiel a los patrones de contacto de las
cuerdas vocales y de la periodicidad de la vibración de las cuerdas vocales.
Figura 49. Gráfico Ciclo

Glotal: en el punto 1 Fase
cerrada – 2 y 3 Fase en
Apertura – 4 Fase Abierta
– 5 y 6 Fase en Cierre.
Se considera que para producir una voz de gran calidad se deben

producir ciertos fenómenos relacionados a la medición del CQ:
 Debe existir una proporción relativamente importante de la fase de
cierre en el ciclo glotal, para producir una elevada presión
subglótica, que a su vez genera una voz de mayor sonoridad.
 Los pliegues vocales deben encontrarse en fase de cierre para que
el tracto vocal sea un resonador mucho más eficiente, ya que el
sonido no se disipa a la cavidad torácica y solo puede ser
enriquecido según las dimensiones y acomodaciones del tracto
vocal.
 La fase de cierre también es capaz de reflejar el modo de vibración
de los pliegues vocales. Cuando nos referimos al modo, estamos
refiriéndonos a los diferentes mecanismos fonatorios utilizados en
los diversos registros. Esto es posible analizarlo no sólo desde el
cociente de contacto como un patrón numérico, sino más
específicamente con el análisis de la forma de onda de la curva
Se considera al CQ en porcentajes de tiempo de contacto de

cada ciclo vibratorio de los pliegues vocales de 0% a 100%, considerando
valores cercanos a 0% cuando existe un contacto escaso (o nulo), y a
medida que se acrecientan los porcentajes se produce un mayor tiempo
de aducción de los mismos durante cada ciclo glotal.
Los valores normales del CQ varían de acuerdo al fonema
empleado y de otros factores relacionados a las características del equipo
EGG; pero en general se considera para emisiones en registro modal
valores aproximados a 40% (Vaca & Cobeta, 2013). Howard (2009)
menciona que se consideran como valores de normalidad de 40% a 60%,
indicando que por encima de ese valor se produce una fonación muy
apretada.
Cociente de Apertura – Open Quotient (OQ)

Es el cociente obtenido a partir del tiempo durante el cual los
pliegues vocales se encuentran en fase de apertura durante cada ciclo
glotal, teniendo una relación inversa con el CQ.
Existen estudios que muestran las variaciones en el cociente de
apertura según la frecuencia y la intensidad de la emisión, a partir de lo
cual se ha establecido que, en general, el cociente de apertura se
incrementa con frecuencias altas tanto en mujeres como en hombres
(Henrich, et al., 2005). En relación a ello, existe una relación directa del
OQ con el mecanismo laríngeo utilizado durante la producción vocal.
También se ha reportado que el OQ aumenta cuando disminuye la
intensidad vocal. Es decir:
A través del OQ es posible también estimar una relación directa
con el flujo transglótico (Iseli & Alwan, 2004), por lo tanto: a mayor
cociente de apertura existe un mayor flujo transglótico.
En casos de patologías vocales se podría realizar un análisis

según el patrón funcional de la siguiente forma:
Periodo Total – T (period)

Es el intervalo de tiempo considerado entre cada fase de cierre,
es decir, la duración total de cada ciclo glotal. Se mide en segundos
(Figura 50). Algunos autores refieren que éste parámetro no posee
interés especial en sí mismo (Pérez Sanz, 2011), sino que su medida y
análisis sirven para la obtención y evaluación de la frecuencia
fundamental y del cociente de contacto (CQ).
La regularidad o semejanza entre los ciclos es un indicador de
cierta estabilidad en el proceso biomecánico de la emisión vocal (Casado,
2002). Por lo tanto, en el caso de patologías vocales que alteran las
propiedades mecánicas de los pliegues vocales, o parámetros
relacionados a la presión subglótica (SGP), se modifica la periodicidad de
los ciclos glotales y en consecuencia la señal acústica.
Figura 50. Onda

EGG – Tiempo y
Amplitud
Nivel de Criterio – Criterion Level (CL)

Es el porcentaje obtenido a partir de la impedancia del ciclo
analizado. Se calcula de forma automática a partir de un cociente entre la
amplitud mínima y máxima de la señal, siendo su nivel estándar un 35%
(Rothenberg & Mahshie, 1988), pero encontrándose variaciones de
acuerdo a diferentes autores: 20% en voz relajada, 50% en voz normal, y
80% en voz apretada (Sapienza et al., 1998). Los porcentajes obtenidos
podrían modificarse además de acuerdo a las propiedades de cada equipo
en particular (Figura 51).
Figura 51. Onda EGG – Nivel de Criterio (CL)

Índice de Contacto – Contact Index (CI)
El índice de contacto es un valor relativo a la simetría del
contacto en los pliegues vocales, que indica el grado de asimetría que
presenta la onda (Orlikoff, 1991). Este índice fue reportado en casos
donde se ha encontrado relación entre el grado de asimetría con la
tonicidad de los pliegues vocales, siendo sensible a la ondulación en el
plano vertical (Hirano, 1981).
Se realiza para ello un cálculo: diferencia de duración en la

pendiente de ascenso y de la duración en la pendiente de descenso, sobre
el tiempo total de contacto.
El resultado obtenido en condiciones normales es un valor
negativo que oscila de -0,6 a -0,4. Si el valor obtenido es -1 en general es
indicador de una pendiente de ascenso demasiado corta, en cambio un
valor de 1 es indicador de una pendiente de descenso demasiado corta. Si
se obtiene 0 se indica una onda perfectamente simétrica (Pérez Sanz,
2011). Según Orlikoff (1991) estos valores tienen una relación inversa con
la intensidad de la voz: es decir que en valores cercanos a -1 se presenta
una mayor intensidad, y en valores cercanos a 1 una menor intensidad;
aunque no se ha encontrado la suficiente evidencia para establecer una
relación estable entre dichos parámetros.
Frecuencia Fundamental – Fundamental Frecuency (F0)

Se trata de la cantidad de ciclos que se producen por segundo.
Se considera en Hertz (Ver Capítulo 4).
Otros Índices
Existen además otros parámetros que pueden ser analizados a
través de la EGG como el Jitter (Ver Capítulo 4). Cabe mencionar que
muchos de ellos no se encuentran disponibles en todos los dispositivos de
EGG, y es por ello que no se han especificado en esta exposición.
La Síntesis
Durante la EGG se miden las modificaciones en las fases de
apertura y cierre durante el ciclo glotal. Para ello se utilizan electrodos
colocados sobre la piel a nivel del cartílago tiroides. La impedancia
disminuye cuando la conductancia en los tejidos aumenta, y esto se
produce cuando la superficie de contacto entre los pliegues vocales
aumenta. Por lo tanto, la electroglotografía (EGG) puede medir
cuantitativamente y cualitativamente índices de contacto, apertura,
regularidad, amplitud y simetría, entre otros parámetros.
Se destaca la importancia de la medición electroglotográfica en
el sentido de que es capaz de aportar información de fenómenos
asociados a la fuente sonora.
La biomecánica de los pliegues vocales es responsable del origen
sonoro, y por ello, si éste no tiene un funcionamiento normal difícilmente
esto pueda compensarse con todas aquellas características que
enriquecen la voz en su paso por el tracto vocal o filtro.
La descripción del comportamiento dinámico de los pliegues
vocales puede resultar útil en la detección de patologías del aparato
fonador, como así también en defectos técnicos de voces profesionales
que pueden incluso ser casi imperceptibles para el oído humano.
Además, y para concluir, no debe olvidarse que la EGG es una
herramienta más dentro de la evaluación de la voz, y por este motivo
siempre se aconseja que sea utilizada de forma complementaria a otros
procedimientos y protocolos, para determinar de forma fehaciente las
posibilidades vocales de la persona evaluada. De esta manera será
posible abordar al paciente desde la estrategia más adecuada y adaptada
posible.
Andadre Miranda G., Godino Llorente J. (2005). Seguimiento automático
de la apertura glotal a partir de imágenes digitales de alta
velocidad usando correlación cruzada adaptativa. Universidad
Politécnica de Madrid. Disponible en:
https://www.researchgate.net/profile/Gustavo_Andrade_Miran
da/publication/272418840_Seguimiento_automatico_de_la_ap
ertura_glotal_a_partir_de_imagenes_digitales_de_alta_velocid
ad_usando_correlacion_cruzada_adaptativa/links/54e3b80a0cf
2b2314f5e9a6f.pdf
Avelino, H. (2010). Acoustic and Electroglottographic analyses of
nonpathological, nonmodal phonation. Journal of Voice. 24 (3):
270 – 280.
Baken, RJ. (1992). Electroglottography: Special Article. Journal of Voice. 6
(2): 98 – 110.
Bueche FJ., Hecht E. (2000). Física General – SCHAUM. MC Graw – Hill.
Disponible en:
dspace.ucbscz.edu.bo/dspace/bitstream/123456789/18697/1/10
813.pdf
Calvache C., Guzmán M. (2013). Variaciones en el cociente de contacto
glótico, durante y después de diferentes ejercicios con TVSO en
sujetos normales y con disfonía [en prensa].
Calvache Mora, CA. (2015). Objetividad de la Electroglotografía.
Aplicaciones Clínicas e investigativas en la Voz. Revista de
Logopedia, Foniatría y Audiología. 35: 134 – 142.
Casado JC., Adrián JA. (2002). La Evaluación Clínica de la Voz. Editorial
Aljibe.
Cecconello, LA. (2011). Correlación de patrones vibratorios de los
Pliegues Vocales valorados mediante metodología invasiva y no
invasiva. Revista FASO. 18 (1): 63 – 6.
Cristiani, HE. (2014). Bases de Matemática y Física para audiólogos.
Editorial Akadia. 1° ed. Buenos Aires – Argentina.
Dosal González, R. (2014). Producción de la Voz y el Habla: La Fonación.
UCREA Académico – Escuela Universitaria de Enfermería.
Repositorio Abierto de la Universidad de Cantabria. Disponible
en: http//:repositorio.unican.es/xmlui/handle/10902/5583
Gaskill C., Erickson M. (2008). The effect of a voiced lip trill on estimated
glottal closed quotient. Journal of Voice. 22: 634 – 643.
Gómez Vilda P., Fernández Baillo R., Nieto A., Díaz F., Fernández
Camacho F., Rodellar V., Martínez R. (2007). Evaluation of voice
pathology based on the estimation of vocal fold biomechanical
parameters. Journal of Voice. 21 (4): 450 – 476.
Gómez Vilda, PG. (2014). Pasado, presente y future del Análisis acústico
de la Calidad de la Voz. De: Fonolaringología. Editorial Amplifón
Ibérica – SAU L´Hospitalet de Llobregat. Barcelona, España. 1:
217 – 235.
Henrich N., d´Alessandro C., Doval B., Castellengo M. (2005). Glottal open
quotient in singing: Measurements and correlation with laryngeal
mechanisms, vocal intensity, and fundamental frecuency. Journal
Acous. Soc. Am. 117 (3): 1417 – 1430.
Herbst C., Howard D., Schlümicher – Their J. (2010). Using
Electoglottographic real-time feedback to control posterior glottal
adduction during phonation. Journal of Voice. 24: 72 – 85.
New York.
Howard, D. (2009). Electroglottography / Electrolaryngography. The
Larynx. Plural Press. San Diego, United States.
Iseli M., Alwan A. (2004). An Improved Correction Formula for the
estimation of Harmonic Magnitudes and its application to Open
Quotient Estimation. ICASSP. I: 669 – 672.
Laukkanen A., Titze I., Hoffman H., Finnegan E. (2008). Effects of a
semiocluded vocal tract on laryngeal muscle activity and glottal
adduction in a single female subject. Folia Phoniatr Logop. 60: 298
– 311.
Le Huche F., Allali A. (1994). La Voz. Editorial Masson. 1° ed.
Miller, DG. (2008). Resonance in Singing – Voice Building through Acoustic
Feedback. Editorial Inside View Press. 1° ed. Princeton - Estados
Unidos.
Miller D., Schutte H. (1991). Electroglottographic evaluation of age and
gender effects during sustained phonation and connected speech.
Orlikoff, R. (1991). Assesment of the Dynamic of Vocal Fold Contact from
Electroglottogram: data from Normal Male Subjects. Journal
Speech Hear Res. 34 (5): 1066 – 1072.
Osma Ruiz V., Sáenz Lechón N., Godino Llorente J., Fraile R. (2009).
Detección del espacio glotal en imágenes laríngeas mediante
transformada Watershed y Merging JND. Archivo Digital de la
Universidad Politécnica de Madrid. Disponible en:
http://oa.upm.es/3397/1/INVE_MEM_2008_54784.pdf
Paul N., Kumar S., Chatterjee I., Mukherjee B. (2011). Electroglottographic
parameterization of the effects of gender, vowel and phonatory
registers on vocal fold vibratory patterns: An Indian perspective.
Indian Journal of Otolaryngology, Head, Neck Surgery. 63: 27 – 31.
Pérez Sanz, C. (2011). Ajustes Laríngeos y Estilos de Fonación en Radio y
TV. Universidad Complutense de Madrid – Instituto Universitario
de Investigación Ortega y Gasset. Tesis de Grado.
Perlman A., Liang H. (1991). Frecuency response of the Fourcin
Electroglottograph and measurement of temporal aspects of the
swallow: preliminary observations. Dysphagia. 6: 88 – 93.
Peterson KL., Barkmeier JM., Verdolini Marston K., Hoffman HT. (1994).
Comparison of Aerodynamic and Electroglottographic Parameters
in Evaluating Clinically Relevant Voicing Patterns. Annals of
Otology Rhinology and Laryngology. 103 (5): 335 – 346.
Rothenberg M., Mahshie JJ. (1988). Monitoring Vocal Fold Abduction
Through vocal fold contact area. Journal of Speech, Languagem an
Hearing Research. 31 (3): 338 – 351.
Rothenberg, M. (1992). A multichannel Electroglottograph. Journal of
Voice. 6: 36 – 43.
Sapienza C., Stathopoulos E., et al. (1998). Approximtions of open quotient
and speed quotient from glottal airflow and EGG waveforms:
effects of measurement criteria and sound pressure level. Journal
of Voice. 12 (1): 31 – 43.
Svev JC., Schutte HK., Miller DG. (1996). A Subharmonic vibratory pattern
in normal vocal folds. Journal of Speech and Hearing Research. 39
(1): 135 – 143.
Tao C., Jiang JJ. (2009). Effects of mucosal loading on vocal fold vibration.
Chaos. 19 (2): 023113.
Tang S., Zhang Y., Qin X., Wang S., Wan M. (2013). Measuring body layer
vibration of vocal folds by high-frame-rate ultrasound
synchronized with modified Electroglottograph. The Journal of the
Acoustical Society of America. 134: 528 – 538.
Titze, IR. (1990). Interpretation of the Electroglottographic Signal. Journal
of Voice. 4 (1): 1 – 9.
Vaca M., Cobeta I. (2013). Electroglotografía. En: Patología de la Voz:
Cobeta I. / Núñez F. / Fernández S. (Capítulo 9.4). Ponencia
Oficial – Sociedad Española de Otorrinolaringología y Patología
Cérvico – Facial. SEORL PCF. Editorial Marge – Medica Books.
Barcelona – España.
Zagólski, O. (2009). Electroglottographic in ederly patients with vocal fold
palsy. Journal of Voice. 27: 506 – 511.
Zagólski O., Carlson E. (2002). Electroglottographic mesurements of
glottal function in vocal vocal fold paralysis in women. Clinical
Otolaryngology Alled Sciences. 27: 246 – 253.
CAPÍTULO 7
“La valoración aerodinámica es importante,
porque el sustrato de la voz es el aire”
(Fernández & Núñez, 2013)
Para comprender mejor los elementos analizados durante la

medición aerodinámica, debemos pensar simplemente en la producción
de la voz. Encontraremos allí, casi de forma implícita, muchos de los
parámetros que tendremos en cuenta para la evaluación de la misma.
La voz es producida cuando la presión subglótica provocada por
un volumen pulmonar de aire es exhalada, venciendo la resistencia glótica
de los pliegues vocales que están aducidos, causando que estos sean
activados y originando así, a su vez, un flujo de aire que los pone en
oscilación. Cuando los pliegues vocales oscilan, se emiten pulsos de aire
desde la glotis para generar la energía acústica que es percibida como voz
luego de pasar por ciertas modificaciones ocurridas dentro del tracto
vocal.
Ciertamente poseemos un transductor natural, nuestra laringe,
y por lo tanto (como un transductor) es posible emanar a través de ella
energía acústica (representada por el sonido en sí mismo), y energía
aerodinámica, ya que para producir el sonido es fundamental la presencia
de aire como origen en el proceso fonatorio.
Las medidas aerodinámicas instrumentales de la fonación
constituyen un método clínico de evaluación para obtener información
acerca de la función vocal de forma no invasiva (Figura 52). Estas son
consideradas objetivas conjuntamente con el análisis acústico de la voz y
la electroglotografía (Casado & Adrián, 2002).
Utilización de la Medición de Parámetros Aerodinámicos

Es importante destacar que la utilidad en la medición de estos
parámetros no es algo nuevo (Rothenberg 1973, Smitheran & Hixon 1981,
Rothenberg, 1982).
Figura 52. Evaluación de
las medidas
aerodinámicas
http://www.glottal.com/Aerovie
w.html#gal
Existe evidencia incluso de varias décadas atrás que mencionan

por ejemplo que es posible identificar patrones de hiperfuncionalidad en
voces normales a través del estudio aerodinámico de la presión
subglótica, el flujo transglótico y la resistencia glótica (Hilman et al., 1989,
1990) por ser indicadores directos de la fisiología laríngea.
La utilización de las medidas aerodinámicas ha sido reportada
desde diversas ópticas, y con diversas caracterizaciones: Titze (1992) se
refiere al concepto de Eficiencia Vocal (Vocal Efficiency – VE) encontrando
dentro de ese mismo concepto: poder acústico, poder aerodinámico, y
fonación fácil. Otros autores como Jackson Menaldi (1992), o Farías
(2007) se refieren a las nociones conceptuales relacionadas a la eficiencia
de cierre, y a la habilidad fonatoria mencionado algunos de estos
parámetros. Esto hace que la medición aerodinámica resulte
actualmente un factor importante dentro de la evaluación objetiva de la
voz.
Las medidas aerodinámicas reflejan el comportamiento
vibratorio de los pliegues vocales o de la configuración de los mismos, y
son capaces de mostrar cambios en los valores normativos cuando se
evalúan voces con patrones de hiperfuncionalidad o hipofuncionalidad
(Hillman 1989, 1990); e incluso en personas con voz sana que producen
diferentes calidades vocales (Peterson et al. 1994, Grillo & Verdolini
2008). También es importante destacar que se han estudiado parámetros
aerodinámicos como la presión subglótica siendo elementos capaces de
reflejar la conducción de la fuerza dirigida desde la tráquea al espacio
glótico en el inicio de la vibración de los pliegues vocales (Rosenthal,
2013).
Como puede interpretarse hasta aquí, las utilidades clínicas son
múltiples: aportan información significativa y clara sobre las estructuras
y funcionalidad de los pliegues vocales, determinando de esta forma
indicios de patrones de normalidad o anormalidad funcional, y también
permiten documentar la evolución de cada paciente a lo largo del proceso
de la terapia vocal (como el resto de las mediciones objetivas).
Generalidades sobre las Características y Funcionamiento de los Sistemas de

Evaluación Fonatoria y Aerodinámica
Para el registro aerodinámico de las señales del habla es
necesario el uso de una interfaz específica (como lo es también en el caso
del análisis acústico, y la electroglotografía). Existen diferentes modelos
de dispositivos para la evaluación aerodinámica según la empresa que los
fabrica, tales como: Phonatory Aerodynamic System - PAS (KayPENTAX
Aerophone, 2007), Transducer Electronics System (Glottal Enterprises MS-
110, 2007), Mouthpiece (EVA2 – Aerodynamic Sensor, 2009), o
Neumotachograph Mask (Rothemberg Mask, 1973), entre los más
difundidos.
Las emisiones vocales son captadas a través sensores de presión
intraoral, flujo oral, y flujo nasal para la obtención de registros
aerodinámicos en lo que se conoce como neumotacógrafo. El
neumotacógrafo (o “interfaz análoga/digital”, por permitir la
transformación de las señales) es el encargado de convertir la señal
análoga a una digital, posibilitando de esta manera ser visualizada y
cuantificada por un software específico que posibilita su lectura.
Los componentes de los sistemas de medición aerodinámica
son:
- Una máscara conectada a un sensor (el neumotacógrafo) de
flujo oral y nasal (Figura 53, Figura 54, Figura 55, Figura 56).
Figura 53.
Máscara para
evaluación
aerodinámica –
PAS KayPENTAX
https://pentaxmedical.c
om/pentax/en/99/1/
Phonatory-
Aerodynamic-System-
PAS-Model-6600/
- Un tubo (muy pequeño) conectado a ese sensor, para poder

determinar presión intraoral, que en general se encuentra
dentro de la máscara anteriormente mencionada (Figura 56 – c
y d).
- Cables para conectar los sensores a la interfaz (Figura 57).
- Cable USB para conectar la interfaz a la computadora utilizada.
Figura 54. Máscara

para evaluación
aerodinámica –
Glottal Enterprises
http://www.glottal.com/Ae
roview.html#gal
Figura 55.
Mouthpiece – EVA2
http://www.sqlab.fr/evaSe
nsUK.htm
Figura 56. Máscara

de Rothenberg
Fuente: Cobeta I., Núñez
F., Fernández S. Patología
de la Voz (pág. 183)
Figura 57. Cables de
Conectividad – Glottal
Enterprises
http://www.glottal.com/Aerovie
w.html#gal
Procedimiento para evaluación de Medidas Aerodinámicas

Se deben considerar los siguientes pasos para la grabación de la
señal:
a. Colocar la máscara de flujo y el tubo de presión intraoral (si fuera
necesario para la función fonatoria examinada). En este momento
es esencial asegurarse de que la oclusión entre el rostro del paciente
y la máscara sea lo más hermética posible (Figura 58), para no
modificar ningún tipo de presión (ni por ingreso, ni por escape de
aire).
Es importante que la calibración del neumotacógrafo sea adecuada
cada vez que examinamos un sujeto, para ello, y según la marca y
modelo con el que se trabaje, existen diversos dispositivos anexos
que permiten la calibración de presiones en el transductor antes de
comenzar con la evaluación de cada sujeto. Para la calibración de
los sensores se activa un dispositivo anexo que genera un flujo de
aire a un nivel constante (ya sea automático o manual). Luego se
debe revisar que el registro de flujo se encuentre a un nivel óptimo,
o punto de equilibrio (Figura 59, Figura 60).
Por otro lado, se debe constatar que la frecuencia de muestreo
(Sample Rate) sea la que se utiliza como estándar (en general viene
configurado en el software de esa manera) la cual suele estar entre
11.000 Hz (mínima) y 22.000 Hz (máxima), siendo el filtrado (Filter
Rate) de 4.000 Hz. La ganancia puede ser un aspecto más relativo,
pues puede depender de la intensidad del hablante o de la tarea
asignada por el evaluador.
Figura 58. Posición de
Máscara para Evaluación
http://www.swordmedical.ie/produ
ct/phonatory-aerodynamic-system/
Figura 59. Dispositivo

para calibración de
sensores - KayPENTAX
http://www.swordmedical.ie/wp-
content/uploads/2014/02/ Phonatory-
Aerodynamic_System_ Brochure.pdf
Figura 60. Dispositivo

para calibración de
sensores – Glottal
Enterprises
Aeroview.html#gal
b. Con la máscara debidamente ocluida se le pide al sujeto las

diferentes tareas asignadas, que pueden ser emisiones mantenidas
de vocales, sílabas, frases determinadas, e incluso canciones (todo
ello debe ajustarse a los parámetros aerodinámicos que buscamos).
Ahora bien, es necesario, como ya se mencionó, que el

neumotacógrafo se encuentre correctamente calibrado, pero igualmente
importante es la limpieza del mismo, dado que es un dispositivo que se
utiliza con una máscara directamente en el rostro de la persona evaluada.
Para la limpieza de la máscara se suele emplear alcohol y
algodón. La máscara debe ser embebida de alcohol y esperar su
evaporación para poder nuevamente ser usada. En el caso de los tubos
para el registro de presión intraoral en general son descartables (ya que
deben ser introducidos entre los labios), es decir que una vez utilizados
deben ser descartados y reemplazados por uno nuevo estéril.
Parámetros Aerodinámicos
A través de los diferentes dispositivos antes referidos es posible
obtener diversos parámetros aerodinámicos según la marca y el modelo
del instrumento (Figura 61); y cabe mencionar que existen dispositivos
que permiten inclusive hasta 22 tipos de determinaciones, aunque
algunas de ellas son derivadas de las que se indican como principales.
Las medidas detalladas a continuación pueden obtenerse con el
neumotacógrafo, citando las más utilizadas en la evaluación clínica y en
investigación.
Figura 61.
Evaluación
Aerodinámica
Flujo Transglótico – Mean Flow Rate (MFR)

El aire fluye entre los pliegues vocales durante la fonación. Se
denomina velocidad del flujo de aire a la velocidad con la que un
determinado volumen de aire se desplaza durante una unidad de tiempo
específica. En el caso del flujo transglótico, este aire se desplaza desde la
región infraglótica a la supraglótica. Uno de los valores obtenidos a través
del neumotacógrafo referidos al flujo Transglótico es el Flujo Medio
Aéreo o Mean Flow Rate (MFR). Este valor se obtiene con el volumen total
de aire usado, dividido por la duración de la fonación en segundos:
Por lo tanto, para obtener los valores de flujo transglótico - MFR

siempre se presentan dos unidades de medición: mililitros (para el
volumen) / segundos (para la duración). Los valores aceptados como
normales para el MFR en adultos varían entre 40 a 200 ml/seg. (Hirano,
1981). Yanagihara et al. (1966) encuentran valores de norma estándar
según el sexo de 115 ml/seg para los hombres, y de 100 ml/seg para las
mujeres. Cabe mencionar que los valores anteriormente expresados son
considerados en voces evaluadas en registro modal. Por tanto, sería
conveniente no aplicar los mismos para evaluaciones en registro pulso o
elevado, donde los valores del MFR se modifican, ya que los principios
mecánicos y configuración en la producción vocal son distintos.
Fernández & Núñez (2013) establecen valores normales de flujo
medio aéreo para distintas intensidades, y con diferentes frecuencias
(Tabla 7). La tarea fonatoria solicitada en este caso es la emisión de la
sílaba /pa/:
Fonación /pa/ Flujo medio aéreo
F0 normal e intensidad confortable 120 ml/s
Tabla 7. Flujo Medio F0 baja e intensidad confortable 105 ml/s

Aéreo (Fernández &
Núnez, 2013 – pág.
184) F0 alta e intensidad confortable 92 ml/s
F0 normal e intensidad baja 145 ml/s
F0 normal e intensidad alta 200 ml/s
Se entiende entonces que el MFR se encuentra influenciado por

la frecuencia y por la intensidad como puede observarse en las
variaciones de los valores de la tabla 1.
El MFR se incrementa (aumenta en sus valores) en ciertos
desórdenes laríngeos donde los pacientes presentan perceptualmente un
gran escape de aire en la voz, debido a un cierre glótico incompleto. En
esos casos, es probable encontrar descensos en los valores de la Presión
Subglótica, es decir que MFR y presión subglótica (SGP) son
inversamente proporcionales:
Presión Subglótica – Subglottal Pressure (SGP)

La presión subglótica es definida como la energía que se
encuentra por debajo de los pliegues vocales, y se mide en centímetros
(cm) de H2O a través del neumotacógrafo. La misma puede ser abreviada
como Ps y/o como Psub, o con sus siglas en inglés SGP o Subglottal
Pressure.
La SGP es generada por los pulmones, el diafragma y los
músculos intercostales; y varía directamente con las modificaciones en la
frecuencia (Fo) e intensidad vocal (SPL), aunque esta relación no es lineal
y se modifica según los individuos (Jackson Menaldi, 1992).
En la mayoría de los casos reportados de normalidad en la SGP
durante la fonación mencionan valores que oscilan entre 5 a 10 cm de
H2O, aproximadamente de 5.000 a 10.000 dinas/cm2. Isshiki (1964) fue
uno de los primeros en reportar a la SGP como un elemento fundamental
en el conocimiento de la producción vocal, utilizando el estudio
aerodinámico del proceso fonatorio. También Rubin et al. (1967),
Faaborg – Andersen (1967), Titze & Sundberg (1992), Griffin (1995),
Cleveland (1997), Iwarsson et al. (1998) investigaron a la presión
subglótica y su relación con las variaciones de frecuencia, pero
fundamentalmente destacan a la SGP como uno de los factores más
importantes en el control de la intensidad de la voz. Según Farías (2007)
la presión subglótica influye poco en la frecuencia fundamental con
escasa significación clínica, pero sí tiene influencia sobre la intensidad de
la voz, aunque esta relación no es siempre lineal ya que además se debe
considerar en el incremento de intensidad de la voz a la amplitud de las
vibraciones de los pliegues vocales. Se entiende, por tanto, que ante
emisiones de mayor intensidad es necesario que se produzcan
modificaciones en la fuerza aerodinámica con una mayor contracción de
la musculatura abdominal y torácica (lo que indica mayor SGP), pero
además debería ocurrir un aumento en la superficie de contacto de los
pliegues.
En el cuadro a continuación podemos observar algunos factores
relacionados al aumento en la presión subglótica:
> Intensidad (SPL)

> Superficie (espesor) de contacto de pliegues
> SGP vocales
> Amplitud de vibración
Claramente estas relaciones interfactoriales, pueden sufrir

sutiles modificaciones inter-individuos, que pueden originarse en
características propias a cada sujeto, rasgos de personalidad, preparación
técnica y física en general, y por sobre todo en la indemnidad (anatómica
y funcional) de todos los sistemas que intervienen en la producción vocal.
Resistencia Glótica – Laryngeal Resistance

La Resistencia Glótica es la oposición que interponen los
pliegues vocales al paso del aire, desde la región infraglótica a la región
supraglótica. La resistencia glótica o resistencia laríngea se describe
como el cociente entre la presión y el flujo de aire.
La unidad de medición para la resistencia glótica es:
Algunos autores reportan como valores promedio de

normalidad a 20 cmH2O x ml/seg., aunque estos valores pueden
modificarse o estar influenciados por factores como la edad, sexo, o la
indemnidad laríngea. Igualmente es necesario mencionar que existe
cierta variabilidad en relación a los valores normativos. Por ejemplo,
Fernández & Núñez (2013) mencionan valores de normalidad de la
resistencia glótica para diferentes intensidades y diferentes frecuencias
(Tabla 8):
Resistencia Glótica
F0 normal e intensidad confortable 38,83 cm H2O x ml/s
F0 baja e intensidad confortable 55,29 cm H2O x ml/s Tabla 8. Resistencia

Glótica (Fernández &
Núñez, 2013 – pág.
F0 alta e intensidad confortable 34,12 cm H2O x ml/s 184)
F0 normal e intensidad baja 57,35 cm H2O x ml/s
F0 normal e intensidad alta 93,67 cm H2O x ml/s
Según Rosenthal (2013) medidas aerodinámicas tales como la

resistencia glótica, la presión subglótica y el flujo transglótico,
proporcionan indicadores directos de la fisiología de la laringe.
Ante modificaciones de intensidad durante el proceso de la
fonación (por incremento de la misma) la presión subglótica aumenta,
aumenta el cociente de contacto de los pliegues vocales, aumenta la
resistencia glótica, y de forma inversamente proporcional a todo ello
disminuye el flujo transglótico. La resistencia glótica se convierte, por
tanto, en un importante factor que actúa en el control de la intensidad de
la voz; la mayor resistencia de los pliegues vocales crea un gradiente de
presión que es lo que finalmente vence la oposición de los pliegues. En los
casos de patologías que involucran una deficiencia en el cierre glótico, ya
sea por alteraciones en la movilidad de los pliegues vocales, como por la
presencia de alteraciones estructurales en los mismos, se produce una
disminución en la resistencia glótica, menor cociente de contacto,
acompañado de una disminución de la presión subglótica y un aumento
del flujo tranglótico.
Umbral Mínimo de Fonación – Phonation Threshold Pressure (PTP)

El umbral mínimo de fonación - PTP es la mínima presión
subglótica para iniciar y mantener la oscilación de los pliegues vocales. La
unidad de medición para PTP es en cm de H2O, por ser una medida
basada en la presión subglótica, y se consideran como valores de
normalidad entre 3 – 6 cm H2O en seres humanos y modelos de fonación
(Titze, 1991).
Enflo & Sundberg (2009) refieren que la medida de PTP es una
herramienta muy valiosa para la clínica, dado que aumenta cuando
existen lesiones en los pliegues vocales, o cuando se produce una
reducción de la hidratación en los mismos, o incluso ante la presencia de
fatiga vocal. Puede servir también como una medida cuantitativa de la
evolución clínica del paciente. Estos autores introducen el concepto de
Umbral de Presión de Colisión (Collision Threshold Pressure – CTP) como
un derivado del PTP, registrando sensibilidades similares en relación a los
cambios en el tejido de los pliegues vocales. La definición conceptual del
CTP menciona específicamente a la cantidad de presión pulmonar
mínima necesaria para iniciar y mantener la fonación. Los valores
propuestos de normalidad por los autores son de 2 a 6 cm H2O.
El PTP también ha sido investigado por diversos autores como
un indicador objetivo de posibles cambios en la viscosidad de los tejidos
vocales, relacionados a la aparición de fatiga vocal (Salomon & diMattia
2000, Titze 1988). Para ello se han realizado estudios con medidas
estroboscópicas y aerodinámicas, donde describen ciertos fenómenos
físicos y fisiológicos que podrían asociarse a la fatiga vocal: aumento en
la velocidad del flujo transglótico, menor resistencia glótica, descenso de
la presión subglótica, todo ello asociado a un cierre glótico incompleto
con una disminución significativa del tiempo máximo fonatorio (Kelchner
et al. 2003, Vilkman 2000).
Nivel de Presión Sonora – Sound Pressure Level (SPL)

El nivel de presión sonora o Sound Pressure Level corresponde al
concepto de intensidad y se mide en decibeles (dB). En este caso el nivel
de presión sonora se refiere a la intensidad de la voz durante una emisión
vocal determinada. Para ello es fundamental el nivel óptimo de SGP y la
amplitud de vibración de los pliegues vocales, pero además de todas las
características de funcionamiento a nivel de la fuente recientemente
mencionadas, también participan todas las estructuras del filtro para
enriquecer ese sonido, mejorando el timbre vocal y dándole a la voz un
nivel de presión sonora mucho más elevado tras su paso por los
resonadores de forma eficaz.
Los niveles SPL dependen de la SGP, pero además se debe tener
en cuenta que se relacionan con los cambios en el patrón de contacto de
los pliegues vocales, siendo que una mayor intensidad produce en general
un aumento en la superficie de contacto de los pliegues vocales (en el
sentido vertical, o sea el espesor de los mismos). Claro que, como se
mencionó anteriormente, estos factores pueden darse desde otros
mecanismos en los casos de voces sin entrenamiento, con
compensaciones funcionales, y/o con patologías vocales específicas.
Tiempo Máximo Fonatorio – Maximum Phonation Time (TMF)

El Tiempo Máximo fonatorio es el tiempo máximo durante el
cual el paciente es capaz de mantener una emisión sostenida. Se evalúa
con una vocal sostenida en una frecuencia e intensidad confortables tras
una inspiración profunda (Hirano 1981, Neiman & Edeson 1981). La
unidad de medición para este parámetro son los segundos. Es decir, se
evalúa el tiempo de la emisión, y se recomienda realizar la emisión en tres
ensayos para obtener un valor promedio.
El TMF se puede evaluar con diferentes vocales: en general se
toma la vocal /a/, pero también pueden utilizarse la vocal /i/, y la /u/
(vértices del triángulo de Helwag). Los valores normativos sobre el
tiempo de fonación presentan una alta variabilidad (Rodríguez Parra et
al. 2009, Wuyts et al. 2000). A continuación, mencionamos algunos
autores:
Farías (2007) considera como valores de normalidad: en mujeres
15 a 25 seg., y en hombres 25 s 35 seg., mencionando además que se
encuentran valores diferenciados según la edad, es decir que en niños es
esperable un valor aproximado a los 10 segundos (Jackson Menaldi,
1992). Estos valores expresados para adultos en mujeres y hombres son
considerados de “excelencia” para otros autores (Colton 1996, Gamboa
2001, Morrison 1996, Planas Morales & Villalba 2003), quienes sugieren
un valor promedio de 15 segundos en mujeres, y 20 segundos en
hombres. Shigemori (citado por Farías, 2007) sugiere que los valores
menores a 10 segundos (en adultos) son considerados anormales, sin
embargo, este valor depende de la capacidad del soplo espiratorio.
Cobeta, Núñez & Fernández (2013) incluyen al TMF dentro de la
Valoración de la Eficiencia Vocal (junto al índice s/e, volúmenes, escalas y
fonetograma). Allí, Jackson Menaldi & Núñez mencionan las siguientes
variaciones del tiempo máximo de fonación según la edad y el sexo (Tabla
9), propuestas por Kent (1997):
Hombres Media
3 – 4 años 8,9 ± 2,1 seg.
5 – 12 años 17,7 ± 4,1 seg.
Adultos 25,9 ± 7,4 seg.
Ancianos 14,7 ± 6,2 seg. Tabla 9. Tiempo Máximo

Fonatorio (Jackson
Menaldi & Núñez, 2013 –
Mujeres Media pág. 126)
3 – 4 años 7,5 ± 1,8 seg.
5 – 12 años 14,9 ± 3,8 seg.
Adultas 21,3 ± 5,6 seg.
Ancianas 13,5 ± 5,7 seg.

Farías (2007) asume una escala de severidad en relación a las
disfonías utilizando el TMF. Describe lo siguiente:
- Disfonías Leves: de 10 a 15 segundos.
- Disfonías Moderadas: alrededor de 10 segundos.
- Disfonías Severas: menor de 10 segundos.
El TMF es un claro indicador sobre la eficiencia del cierre glótico

y del control respiratorio, y se relaciona de forma directa con la SGP, e
inversamente con la medida del MFR (cuando el TMF disminuye, el flujo
transglótico aumenta y la presión subglótica baja). En el caso de
disturbios vocales, se debe tener en cuenta si la patología genera
patrones hiperfuncionales o hipofuncionales (según sus características
estructurales y/o funcionales). Cabe mencionar que el TMF es una medida
aerodinámica que puede evaluarse aun cuando no se posee ningún
sistema para la medición aerodinámica y eso lo convierte en un
parámetro accesible a todos los profesionales, siendo además un
indicador de mucha relevancia clínica. Solo se necesita un cronómetro
porque la unidad de medición son los segundos.
Existen mediciones derivadas del tiempo máximo fonatorio que
pueden servir de complemento para el mismo, como por ejemplo el
índice s/z (Bonne, 1971) o el s/a (García Tapia & Cobeta, 1996) propuesto
para idiomas latinos, siendo un indicador relacionado a la eficiencia
fonatoria (citado por Farías, 2007). También son ampliamente utilizadas
las mediciones de la capacidad vital, o el cociente de fonación (Jackson
Menaldi, 1992), los cuales no se han referido en el presente capítulo (ver
capítulo 2) ya que se han descripto sólo aquellas medidas instrumentales
que pueden ser obtenidas a través del neumotacógrafo.
La Síntesis
Como se puede observar existe una interrelación en la
descripción de cada uno de los parámetros mencionados, siendo el
origen de todo este fenómeno maravilloso un elemento tan elemental
para la vida como lo es el aire.
Es imposible entonces pensar a estas medidas como algo
“diferente” a los principios que manejamos de forma cotidiana en la
clínica vocal con cada uno de nuestros pacientes. Se hace por ello
sumamente importante profundizar el entendimiento sobre la fisiología
normal del sistema en la producción vocal desde una perspectiva
aerodinámica, pero de igual forma es indispensable poseer un
diagnóstico preciso, y la descripción de las condiciones anatómica –
funcional – dinámica del paciente en relación al proceso de fonación que
indiquen de forma clara el tipo de afección que presenta el mismo, para
trabajar también sobre el ajuste de los patrones biomecánicos
respectivos. Para ello es imprescindible una exploración morfo –
funcional competente (por parte del médico laringólogo), y una
evaluación funcional – dinámica exhaustiva (por parte del
fonoaudiólogo).
Claro que no existen patologías que puedan desequilibrar sólo
un parámetro, pero entendiendo la articulación de todos estos
fenómenos, se hace más sencillo y concreto el trazado del proceso de
rehabilitación en cualquier tipo de disturbio vocal.
Confiamos en que este capítulo sirva como una herramienta
que contribuya a la interpretación, o el discernimiento de todos estos
elementos implicados en la voz, entendidos como un fenómeno
aerodinámico. Para ello, no se debe perder de vista a un agente central
en todo este proceso, siendo un componente fundamental para la vida,
pero a su vez sumamente simple y asequible: “el aire”.
Boone, D. (1971). The Voice and Voice Therapy. Engewwod Cliffs. Prentice
– Hall.
Casado JC., Adrián JA. (2002). La Evaluación Clínica de la Voz. Editorial
Aljibe.
Cleveland TF., Stone RE., Sundberg J., Iwarsson J. (1997). Estimated
subglottal pressure in six professional country singers. Journal of
Voice. 11 (4): 403 – 409.
Cobeta I., Nuñez F., Fernandez S. (2013) Patología de la Voz. Ponencia
Colton RH., Casper JK. (1996). Understanding Voice Problems: A
physiological perspective of diagnosis and treatment. Baltimore:
Lippincott Williams & Wilkins (2° ed).
Enflo L., Sundberg J. (2009). Vocal Fold collision threshold pressure: ¿an
alternative to phonation threshold pressure? Log Phon Voc. 34 (4):
210 – 217.
Faaborg – Andersen K., Yanagihara N., Von LH. (1967). Vocal pitch and
intensity regulation. A comparative study of electrical activity in
the cricothurold muscle and the airflow rate. Arch Otolaryngol. 85
(4): 448 – 454.
Fernández S., Núñez F. (2013). Estudio Aerodinámico de la Función
Vocal. En: Patología de la Voz: Cobeta I. / Núñez F. / Fernández
S. (Capítulo 9.1). Ponencia Oficial – Sociedad Española de
Otorrinolaringología y Patología Cérvico – Facial (SEORL PCF).
Editorial Marge – Medica Books. Barcelona – España.
Gamboa J., Jiménez Jiménez EJ., Mate MA., Cobeta I. (2001).
Alteraciones de la Voz causadas por enfermedades
neurológicas. Revista de Neurología. 33 (2): 154 – 161.
García Tapia R., Cobeta I. (1996). Diagnóstico y Tratamiento de los
Trastornos de la Voz. Ponencia Oficial de la Sociedad Española
de ORL y Patología Cérvico – Facial. Editorial Garsi Madrid.
Griffin B., Woo P., Colton R., Casper J., Brewer D. (1995). Physiological
characteristics of the supported singing voice. A preliminary study.
Journal of Voice. 9 (1): 45 – 56.
Grillo EU., Verdolini K. (2008). Evidence for distinguishing pressed, normal,
resonant, and breathy voice qualities by laryngeal resistance and
vocal efficiency in vocally trained subjects. Journal of Voice. 22 (5):
546 – 552.
Hilman RE., Holmberg EB., Perkell JS., Walsh M., Vaughan C. (1989).
Objetive assessment of vocal hyperfunction: an experimental
framework and initial results. Journal Speech Hear Res. 32 (2): 373
– 392.
Hilman RE., Holmberg EB., Perkel JS., Walsh M., Vaughan C. (1990).
Phonatory Function Associated with Hyperfunctionally Related
Vocal Fold Lesions. Journal of Voice. 4 (1): 52 – 63.
New York.
Isshiki, N. (1964). Regulatory Mechanism of Vocal Intensity Variation.
Journal of Speech and Hearing Research. 128 (7): 17 – 29.
Iwarsson J., Thomasson M., Sundberg J. (1998). Effects of lung volume on
the glottal voice souce. Journal of Voice. 12 (4): 424 – 433.
Panamericana.
Kelchner LN., Lee L., Stemple JC. (2003). Laryngeal function and vocal
fatigue after prolonged reading in individuals with unilateral vocal
fold paralysis. 17: 513 – 528.
Kent RD. (1997). The Speech sciences. Singular Publishing Group. San
Diego – Estados Unidos.
Neiman GS., Edeson B. (1981). Procedural aspects of eliciting maximum
phonation time. Folia Phoniatrica et Logopaedica. 33 (5): 285 –
293.
Peterson KL., Barkmeier JM., Verdolini Marston K., Hoffman HT. (1994).
Comparison of Aerodynamic and Electroglottographic Parameters
in Evaluating Clinically Relevant Voicing Patterns. Annals of
Otology Rhinology and Laryngology. 103 (5): 335 – 346.
Planas Morales S., Villalba X. (2003). Assesing in theaching practice: results
from the aplication of acoustic parameters. Proceding of the 15 th
International Congress of Phonetic Scienses. Barcelona - España.
Rodriguez Parra MJ., Adrian JA., Casado JC. (2009). Voice Therapy used to
tet a basic protocol for multidimensional assesment of dysphonia.
Journal of Voice. 23 (3): 304 – 318.
Rosenthal, A. (2013). Aerodynamic and Acoustic Features of Vocal Effort.
Journal Speech Languaje Pathology – Theses. 2 (1): 1 – 51.
Rothenberg, M. (1973). A new inverse – filtering technique for deriving the
glottal air flow waveform during voicing. Journal Acoust Soc Am.
53 (6): 1632 – 1645.
Rothenber, M. (1982). Interpolating subglottal pressure form oral pressure.
Journal Speech Hear Disord. 47 (2): 219 – 223.
Rubin HJ., LeCover M., Vennard W. (1967). Vocal Intensity, subglottic
pressure and air flow relationships in singers. Folia Phoniatr
(Basel). 19 (6): 393 – 413.
Salomon NP., diMattia MS. (2000). Effects of a vocally fatiguing task and
systemic hydration on phonation threshold pressure. Journal of
Voice. 14: 341 – 362.
Smitheran JR., Hixon TJ. (1981). A clinical method for estimating laryngeal
airway resistance during vowel production. Journal Speech Hear
Disord. 46 (2): 138 – 146.
Titze, IR. (1988). The physics of small amplitude oscillation of the vocal
folds. Journal Acoust Soc Am. 83: 1536 – 1552.
Titze, IR. (1991). Phonation Threshold Pressure: A missing link in glottal
aerodynamics. Journal Acoust Soc Am. 91 (5): 2926 – 2935.
Titze IR., Sundberg J. (1992). Vocal Intensity in speakers and singers.
Journal Acoust Soc Am. 91 (5): 2936 – 2946.
Titze IR., Sundberg J. (1992). Vocal Intensity in speakers and singers.
Journal Acoust Soc Am. 91 (5): 2936 – 2946.
Vilkman, E. (2000). Voice Problems at work: a challenge for accupational
safety and health arrangement. Folia Phoniatr Logop. 52: 120 –
125.
Wuyts FL., De Bodt M., Molenberghs G., Remacle M., Heylen L., Millet B.,
et al. (2000). The dysphonia severity index: an objective measure
of vocal quality based on a multiparameter approach. Journal of
Speech, Language, and Hearing Research. 43 (3): 796 – 809.
340.
CAPÍTULO 8
El electrodiagnóstico es una rama de la medicina que puede
aportar datos clínicos objetivos útiles para el diagnóstico de diversos
padecimientos que afectan a los sistemas nerviosos central y periférico
(Ysunza & Perusquía Ortega, 2007). Recientemente se han abierto las
posibilidades de realizar estudios neurofisiológicos laríngeos, con la
implementación de la electromiografía laríngea, la neuroconducción del
nervio vago y los potenciales motores (Correa, Otárola, & Del Lago,
2000). En este capítulo abordaremos la electromiografía laríngea.
Este instrumento diagnóstico consiste en el registro de la
actividad muscular eléctrica, es decir, permite el estudio de la actividad
electrofisiológica de los músculos esqueléticos in vivo, a través de la
utilización de electrodos de inserción (agujas) que se fijan en el vientre de
los mismos y registran los potenciales mioeléctricos (Ysunza & Perusquía
Ortega, 2007; de Oliveira et al., 2002; Correa, Otárola, & Del Lago, 2000).
La electromiografía laríngea, es una herramienta utilizada de
forma conjunta con la exploración clínica en el diagnóstico y el
tratamiento de las alteraciones del movimiento laríngeo que cursan
habitualmente con disfonía, permite evaluar el estado neuromuscular de
la laringe, proporcionando información acerca de la localización de la
lesión, el tiempo de evolución y el pronóstico de recuperación. Los
resultados de la prueba orientan en la selección de otras herramientas
diagnósticas y en la decisión del momento y tipo de tratamiento (García-
López et al., 2012) (Figura 62).
Weddel, en 1944, fue quien introdujo el uso de la técnica en la
fisiología laríngea (Canals et al., 2001) y realizó los primeros informes de
electromiografía, presentando registros normales y patológicos de la
musculatura intrínseca de la laringe (Correa, Otárola, & Del Lago, 2000;
García-López et al., 2012). Ya en los años 50, los primeros trabajos
publicados fueron los de Faaborg-Andersen & Buchtal.
Figura 62. Objetivos de
la electromiografía
laríngea.
Actualmente, la EMGL no es utilizada de forma rutinaria por la

mayor parte de los otorrinolaringólogos que valoran patologías laríngeas,
a pesar de considerar que esta evaluación podría ser llevada a cabo como
un procedimiento habitual en la exploración clínica con un mínimo de
disconfort para el paciente (Canals et al., 2001; García-López et al., 2012).
Como está citado anteriormente, la EMGL es un procedimiento
que evalúa la integridad del sistema nervioso y muscular de la laringe, el
mismo presenta ventajas y desventajas en su aplicación, las cuales están
expresadas en la Tabla 10.
VENTAJAS DESVENTAJAS
Proporciona información acerca

de la localización de la lesión.
Es una evaluación invasiva.
Aporta datos relacionados al
La EMG laríngea se realiza en
Tabla 10. Ventajas y
tiempo de evolución de la
quirófano.
desventajas de la disfonía y al pronóstico de
aplicación de la EMGL recuperación. Aprendizaje / Experiencia.
Sirve de guía para la inyección de No se recomienda realizar el
la toxina botulínica en los procedimiento a pacientes con
músculos laríngeos. infecciones locales o disturbios
de la coagulación.
Es una herramienta eficaz para la
investigación en laringología.
Fisiología Laríngea
Para una mejor comprensión de la EMGL es necesario recordar
algunos conceptos básicos acerca de la anatomía y fisiología laríngea.
La laringe es un órgano complejo, responsable de diversas e
importantes actividades fisiológicas (protección, respiración y fonación).
El control de las funciones laríngeas evolucionó filogenéticamente de un
simple reflejo a una red neuronal interdependiente, en diversos niveles
del sistema nervioso (Behlau, Azevedo, & Madazio, 2008; Núñez Batalla
et al., 2012; Imamura, Hiroshi Tsuji, & Ubirajara, 2006).
La voz humana tiene un marcado control cortical, por ser una
actividad eminentemente voluntaria. Como otros sistemas motores
voluntarios, la vía neuromuscular de la producción de la voz y el habla se
inicia en el giro pre-central, donde las fibras nerviosas son denominadas
tractos o vías; ya en el sistema nervioso periférico, esas fibras reciben el
nombre de nervios (Figura 63).
Se reconocen cuatro divisiones del sistema motor: circuitos de
control, constituidos por los ganglios basales y el cerebelo; las vías de
activación indirecta; vías de activación directa, y las vías finales comunes
o uniones mioneurales, descriptas de forma esquemática en la Tabla 11.
(Behlau, Azevedo, & Madazio, 2008; Núñez Batalla et al., 2012).
En el cuello, el nervio vago desciende dentro de un paquete
neurovascular junto con la arteria carótida y la vena yugular interna. Una
de sus ramas, el nervio laríngeo, se origina en el trayecto siguiendo
diferentes recorridos hacia la izquierda y derecha. El nervio laríngeo
recurrente derecho desciende hasta la altura de la vena subclavia de ese
lado, para regresar por el surco traqueoesofágico. El nervio laríngeo
recurrente izquierdo pasa entre el arco aórtico para alcanzar el surco
traqueoesofágico ipsilateral; posteriormente se divide en dos ramas,
anterior y posterior, que inervan todos los músculos de la laringe excepto
el cricotiroideo, el cual recibe su inervación de la rama externa del nervio
laríngeo superior, rama predominantemente motora directa del vago,
cuya emergencia se encuentra cerca del ganglio nodoso (Ysunza et al.,
2008).
El ramo interno del nervio laríngeo superior inerva
ipsilateralmente la mucosa de la supraglotis hasta el nivel de los pliegues
vocales. Debajo de los pliegues vocales la sensación de la mucosa es
conducida por el nervio laríngeo recurrente ipsilateral. Los componentes
sensitivos del nervio laríngeo superior y del nervio laríngeo recurrente
incluyen representaciones de receptores de mucosa responsables por la
captación de estímulos químicos, térmicos, táctiles, de presión y
propioceptivos de articulaciones y músculos.
Figura 63. Esquema de la topografía neural para la producción vocal, del córtex a la laringe
La vía eferente común de los reflejos laríngeos comprende la

participación del núcleo ambiguo en el tronco cerebral, donde se
encuentran las motoneuronas responsables por la inervación de la
musculatura intrínseca de la laringe (Imamura, Hiroshi Tsuji & Ubirajara,
2006). El neurotransmisor acetilcolina es el mediador liberado en la
terminación nerviosa para desencadenar el potencial de acción que
contrae al músculo.
Aunque los músculos intrínsecos de la laringe se clasifican
clásicamente en aductores y abductores, sus funciones son más
complejas al contraerse simultáneamente músculos antagonistas
durante la función vocal, observándose distintos patrones de activación
muscular dependiendo del propósito de la acción (Núñez Batalla; 2012).
MECANISMO NEUROLOGICO CENTRAL DE LA PRODUCCIÓN VOCAL
SISTEMA MOTOR
Los principales son los circuitos de control de los ganglios de

la base y los del cerebelo, estos son responsables de la
integración y la coordinación de la información sensorial y
de las vías de activación directa e indirecta.
Circuitos de Lesiones en los ganglios de base pueden presentarse como
control hipocinesia16 (presente en la enfermedad de Parkinson) o
hipercinesia17 ( observada en la distonia focal laríngea ).
Lesiones en el cerebelo producen marcha atáxica, nistagmo,
hipotonía, temblor de movimientos e incoordinación
ipsilateral de la lesión.
Vía extrapiramidal, posee un origen difuso en el córtex

cerebral.
Su principal función es la de actuar como moderador de las
Vías de
vías motoras finas, además de estar asociado
activación Tabla 11. Sistema
indirectamente a los movimientos voluntarios, al equilibrio y
indirecta Motor descripto por
la postura.
Daube, Reagan &
Lesiones en este sistema se manifiestan de diversas formas, Sandok (1986)
pero generalmente afectan el tono muscular y los reflejos. (Behlau, Azevedo, &
Madazio, 2008)
Neurona motora superior, tracto o vía piramidal, tiene su

origen en cada hemisferio, es decir, inerva a la neurona
motora inferior en ambos lados del cuerpo.
Vías de Estas vías influyen los movimientos controlados
activación conscientemente.
directa
Lesiones en esta vía pueden ocasionar pérdida o reducción
de los movimientos voluntarios de manera menos agresiva
que los presentes en alteraciones de las vías finales
comunes.
Neurona motora inferior.

Su función básica es la de estimular la contracción y los
movimientos del órgano en cuestión a través de los nervios
Vías finales cranianos y espinales.
comunes Para la voz, están constituidos por los nervios laríngeos,
(ramificación del X par).
Alteraciones en esta vía producen debilidad muscular,
parálisis y consecuentemente atrofia muscular.
A través de un estudio fisiológico-histoquímico combinado, se
ha demostrado que las fibras musculares en músculos esqueléticos de
tipo 1 son de contracción lenta, sin embargo, más resistentes a la fatiga;
mientras que las fibras de tipo 2 son de contracción rápida, pudiendo ser
resistentes o no a la fatiga. De esta forma, de acuerdo a las proporciones
de fibras tipo 1 o 2 de un músculo se puede definir sus propiedades
contráctiles.
Los músculos Tiroaritenoideo (TA), Cricoaritenoideo Lateral
(CAL) e Interaritenoideo (AA) son músculos rápidos, con alta proporción
de fibras tipo 2, mientras que los músculos Cricotiroideo (CT) y
Cricoaritenoideo Posterior (CAP) son músculos más lentos y resistentes a
la fatiga, dada su mayor proporción de fibras tipo 1. Fisiológicamente es
interesante que los músculos aductores sean rápidos para permitir una
protección adecuada de las vías aéreas. La protección de la vía aérea es
un evento efímero que no exige músculos con alta resistencia a la fatiga.
Por otro lado, el CAP está activo continuamente, durante los
movimientos respiratorios, no necesita ser rápido, pero sí resistente a la
fatiga; de la misma forma el CT, más activo durante la fonación debe
presentar características contráctiles semejantes al CAP (Imamura,
Hiroshi Tsuji & Ubirajara, 2006).
La voz es el producto de la vibración ondulatoria de la mucosa
del borde libre de los pliegues vocales expuesta al flujo de aire que
atraviesa la glotis. La función de los músculos de la laringe estriba en
poner en contacto ambos pliegues vocales en la línea media y exponer la
mucosa del borde libre al flujo aéreo, a la que le otorgan mayor o menor
tensión a lo largo, como la cuerda de una guitarra. La mucosa del borde
libre de los pliegues vocales inicia así una serie de aperturas y cierres,
denominados ciclos glóticos (Moreno, López & Poch, 2005; McFarland,
2008; Mogaró, 2004).
Fundamentos y consideraciones de la EMGL

El examen consiste en evaluar la integridad del sistema motor
laríngeo a través de la acción de los potenciales de acción generados por
las unidades motoras18 de la musculatura intrínseca de la laringe (Eckley,
2002). Tras la orden originada en la corteza cerebral, el nervio transmite
un impulso eléctrico que se transforma en una señal química a nivel de la
unión neuromuscular, los electrodos utilizados detectan los impulsos
eléctricos del músculo y los transforman en una señal visual y auditiva que
puede ser interpretada (García López, 2014). Un electrodo graba
potenciales de acción de 2 a 20 fibras musculares dentro de un radio de 1
mm de la punta de la aguja (Eckley, 2002).
Durante la actividad motora, que se genera por contracción
muscular voluntaria, aparecen potenciales de acción de unidad motora
denominados PUM. A estos potenciales se les estudia su morfología,
amplitud, frecuencia y número (Ysunza & Perusquía Ortega, 2007) así
como la presencia de actividad espontánea patológica y de las
sincinesias19 (de Oliveira et al., 2002), siendo que los parámetros que
ofrecen las informaciones más valiosas se encuentran al inicio y al final de
la actividad muscular (Colton, Casper & Leonard, 2010) (Figura 64).
La amplitud del PUM es proporcional al número de fibras
activadas sincrónicamente y pertenecientes a la unidad motora. La
duración, a su vez, es proporcional al territorio de dicha unidad, así como
al grado de sincronía con que las fibras musculares son activadas (Eckley,
2002).
Cuando un músculo se contrae levemente, unas cuantas de sus
unidades motoras comienzan a disparar a baja frecuencia. A medida que
la fuerza de contracción se incrementa, la frecuencia de disparo de estas
unidades activas aumenta hasta que llega a una cierta frecuencia cuando
se “reclutan” unidades adicionales.
Como ejemplo, podemos citar casos en los que existe
denervación20, donde aparecen potenciales de acción de unidad motora
de gran amplitud, polifásicos, y su número y frecuencia se reducen
significativamente. Esta reducción en frecuencia y número se denomina
reclutamiento disminuido (Figura 64 B).
Figura 64. EMGL con

potenciales eléctricos
captados del musculo en
el trazado superior y
canal de la voz en el
trazado inferior (de
Oliveira et al., 2002). A.
Reclutamiento normal.
B. Reclutamiento
disminuido. Actividad
Espontánea: onda
positiva. D. Potenciales
polifásicos de baja
amplitud
Indicaciones
La prescripción más establecida, aparte de su uso terapéutico
para guiar la inyección de toxina botulínica, es el diagnóstico de la
inmovilidad laríngea y más concretamente su papel en el diagnóstico
diferencial entre la fijación mecánica y la lesión neurógena o verdadera
parálisis de los pliegues vocales. (García-López et al., 2012). Además, en
casos de enfermedad de neurona motora que afecte la laringe o
miopatías que estén involucrando músculos laríngeos o bien luxación de
cartílago aritenoides (Ysunza & Perusquía Ortega, 2007).
Otras indicaciones hacen referencia al diagnóstico diferencial
entre:
 los trastornos orgánicos y funcionales secundarios a mala
técnica vocal;
 lesiones neurogénicas y fijación mecánica de la laringe
secundaria a subluxación o luxación del cartílago aritenoides
post-intubación;
 lesiones neurogénicas y miogénicas
 parálisis cordales centrales y periféricas
 la evaluación de las disfonías laríngeas o disfonías espasmódicas
(Correa, Otárola, & Del Lago, 2000)
Procedimientos para la exploración muscular

Existen tres tipos de abordaje en la electromiografía laríngea: la
superficial, la trans-oral y la percutánea.
 Superficial: los electrodos de registro son colocados sobre la piel
del paciente (Correa, Otárola, & Del Lago, 2000).
 Trans-oral: los pliegues vocales se punzan con electrodos
introducidos por la boca, se utiliza una pinza portaelectrodos con
la cual se inserta el electrodo de gancho en el musculo a ser
explorado (Canals et al., 2001).
 Percutánea: es la más utilizada (para realizar este
procedimiento, el paciente es posicionado en decúbito supino
con hiperextensión cervical leve, se identifican y marcan los
cartílagos tiroides y cricoides. Se puncionan los músculos
cricotiroideo y tiroaritenoideo derecho e izquierdo, a través de la
piel “a ciegas”, utilizando una aguja monopolar estéril de 37mm
para registro y referencia superficial de disco ubicada en el
mentón (Correa, Otárola, & Del Lago, 2000).
Figura 65. EMGL
Percutánea
Se recomienda la utilización de un electromiógrafo de dos

canales, uno para la obtención de los potenciales de acción y otro para la
grabación de la voz; y de ser posible, también debe ser incorporado un
sistema de audio, ya que con eso es posible que sean oídos los disparos
de las descargas eléctricas de los músculos que están siendo evaluados.
En relación a los tipos de electrodos; los más utilizados para la
EMGL son los concéntricos y los monopolares. Las agujas concéntricas
(Figura 66) incluyen un sensor interior de plata proporcionando registros
exactos y confiables. Poseen puntas ultra agudas, facilitando la
penetración cutánea y reduciendo significativamente el dolor para el
paciente. Equipadas de un cabezal ranurado que permite una sujeción
firme y cómoda, con una marca de índice táctil para indicar la posición de
registro.
Figura 66. Agujas

Concéntricas
Por su parte, los electrodos monopolares (Figura 67) ofrecen un

bajo nivel de resistencia a la penetración, gracias a la punta aguda de
forma cónica y a una cubierta suave que reduce la fricción durante la
inserción y durante la prueba dentro del músculo, contribuyendo a una
mayor comodidad. Las agujas monopolares tienen un cabezal
ergonómico de forma cóncava y pequeñas ranuras para facilitar una
sujeción firme y cómoda.
Los electrodos de gancho son menos utilizados, pues producen
mayor lesión muscular y dificultades para movilizarlos luego de la
inserción (Eckley, 2002).
Para mayor seguridad, la EMG se realiza en quirófano, con el
paciente despierto, en decúbito supino y la cabeza en extensión (García-
López et al., 2012). Sin embargo, gracias a los avances tecnológicos, el
procedimiento puede ser realizado, en ambulatorio con mayor agilidad y
rapidez, con el paciente sentado, estando la laringe de manera más
fisiológica (Canals et al., 2001).
Figura 67. Agujas

monopolares
Fuente:
http://www.rctec.cl/productos/
electromiografia?page=2
Todos los procedimientos se llevan a cabo con la presencia de un

especialista en otorrinolaringología, quien realiza la inserción de los
electrodos en los músculos laríngeos y un especialista en neurofisiología
clínica, encargado del registro con el dispositivo de electromiografía
(García-López et al., 2012). Se sugiere evaluar siempre el lado sano, en
casos de sospecha de lesión unilateral, para poder comparar la actividad
eléctrica que servirá de control para la evaluación (Eckley, 2002).
Para guiar la inserción de la aguja del electrodo se consideran los
siguientes parámetros anatómicos: el cartílago tiroides, el cartílago
cricoides el espacio y la membrana cricotiroideas, el borde inferior del
cartílago tiroides y el cuerno inferior del cartílago tiroides. La localización
de la membrana o espacio cricotiroideo puede ser dificultosa en pacientes
traqueostomizados, obesos, o que sufrieron otras cirugías o traumas
laríngeos (Eckley, 2002).
Musculo Cricotiroideo
Para alcanzar el músculo cricotiroideo (CT), inervado por el
nervio laríngeo superior, la aguja atraviesa la piel a nivel de la línea media
desde el borde superior del cartílago cricoides dirigiéndose en sentido
lateral, a 45◦ aproximadamente hacia la vertiente externa del ala tiroidea
hasta que se identifica actividad eléctrica (García-López et al., 2012). La
aguja pasará por el musculo esternocleidomastoideo, hasta llegar al CT,
que se encuentra aproximadamente a 1cm de profundidad.
Una vez ubicado el electrodo, se solicita al paciente que emita
una /i/ prolongada en frecuencia grave y en seguida en frecuencia aguda.
Con este procedimiento se observa si el electrodo está bien posicionado,
ya que, en el músculo con inervación preservada, la actividad eléctrica
debería aumentar de forma significativa y rápida (Eckley, 2002). Otra
forma de confirmar la posición del electrodo es solicitando al paciente
que emita un tono, generalmente en escala musical.
Además, para descartar que el electrodo se encuentre en un
músculo extrínseco, basta con indicar al paciente que gire o levante la
cabeza. En estos movimientos el músculo cricotiroideo permanece
inactivo por lo que no debe haber incremento de actividad muscular, al
contrario de lo que ocurriría si el electrodo se encontrara en un músculo
extrínseco (Canals et al., 2001).
Figura 68.
Procedimiento
de
electromiografía
laríngea para los
músculos
tiroaritenoideo y
cricotiroideo
(Correa, Otárola,
& Del Lago,
2000)
Músculo Tiroaritenoideo
El músculo tiroaritenoideo se puede alcanzar por varios métodos
(Figura 69): atravesando la piel y la membrana cricotiroidea a nivel de
línea media para entrar en la luz laríngea y desde ahí avanzar superior y
lateralmente hasta alcanzar el músculo, o atravesando directamente el
ala tiroidea de lateral a medial a nivel de la línea vocal.
La primera técnica tiene el inconveniente de provocar tos y la
segunda resulta muy complicada en caso de calcificación del cartílago,
por lo que se recomienda una tercera vía que consiste en atravesar la piel
en línea media a nivel del borde superior del cartílago cricoides, y desde
allí, dirigirse por el tejido celular subcutáneo con una inclinación lateral de
45◦ hacia el borde inferior del cartílago tiroides. Una vez alcanzado este,
se pasa con la aguja por debajo del mismo hasta el músculo vocal a través
del cono elástico sin entrar en la glotis, lo que evita estimular los
receptores neurosensoriales de la mucosa laríngea.
Esta vía produce mínimas molestias al paciente y no es necesario
utilizar ningún anestésico (García-López et al., 2012). La confirmación de
la correcta colocación de los electrodos para el músculo tiroaritenoideo
es representada por silencio durante la respiración y actividad motora
(activación de PUM) con la fonación (emisión de la /i/ sostenida) (García-
López et al., 2012).
Figura 69. Métodos para alcanzar el músculo TA
Musculo Cricoaritenoideo Posterior

Existen dos vías de abordaje para el músculo cricoaritenoideo
posterior: la primera, atravesando la membrana cricotiroidea a nivel de
línea media y la luz glótica para llegar al músculo a través de la lámina del
cartílago cricoides a uno y otro lado; y la segunda, rotando la laringe y
atravesando la piel a nivel del borde posterior del ala tiroidea en su mitad
inferior y dirigiéndose hacia el sello cricoideo hasta encontrar el músculo.
La confirmación de la correcta colocación de los electrodos, en
este caso es representada por actividad motora en respiración y silencio
en fonación (García-López et al., 2012).
En general, los registros de la actividad muscular se dividen en:
registro de actividad insercional, causada por la inserción del electrodo de
aguja, y registro de actividad espontánea, en reposo. Para realizar esta
medición se debe esperar que cese la actividad insercional causada por la
introducción del electrodo que provoca una estimulación mecánica o
lesión de las fibras musculares. Por último, el registro de actividad motora
(Ysunza & Perusquía Ortega, 2007).
Interpretación de la EMGL
Para la interpretación de la EMGL es necesario conocer tres
parámetros básicos: la presencia, disminución o ausencia de
reclutamiento, la morfología de los PUM y la presencia o ausencia de
actividad espontánea (García-López et al., 2012; Eckley, 2002).
En reposo se debe observar la presencia o ausencia de actividad
espontánea de denervación (fibrilaciones, ondas positivas). En actividad
motora voluntaria, en cambio, presencia o ausencia de PUM, parámetros
de los PUM (amplitud, duración, morfología) y existencia de sincinesias
(García-López et al., 2012).
El reclutamiento es la activación ordenada, secuencial y
progresiva de unidades motoras de forma creciente durante la
contracción muscular voluntaria. En la EMGL, el reclutamiento describe
el número relativo de PUM que funcionan durante la activación de los
pliegues vocales. En circunstancias normales, varios PUM se disparan
durante la activación muscular máxima. Ese número disminuye cuando
hay pérdida de fibras nerviosas, ofreciendo, por lo tanto, informaciones
precisas del grado de inervación del músculo evaluado.
Las características de los PUM facilitan el diagnóstico y el
pronóstico de enfermedades neuromusculares, por ejemplo. Los
potenciales en naciente, son unidades motoras polifásicas pequeñas con
baja amplitud y larga duración, estas expresan finos brotes de axones
regenerados que se van ligando a fibras musculares desnervadas y
atróficas. Estas indican regeneración.
Ondas gigantes polifásicas de gran amplitud traducen
neuropatías crónicas en las que un proceso de larga duración, en el que
un número reducido de axones regenerados, inervará un gran número de
placas motoras. Si este tipo de ondas se encuentra en pacientes con
parálisis de pliegues vocales, indica que ya se completó la regeneración
neural y que no habrá regresión de la patología.
Presencia de actividad espontanea en el trazado
electromiográfico, caracterizado por fibrilaciones, ondas positivas,
mioquimia21 y disparos repetitivos complejos, sugieren degeneración
activa o reciente (de semanas a pocos meses). En enfermedades
progresivas, la presencia de esta actividad indica que la misma está en
proceso; y en casos de lesiones o traumas, la actividad espontanea puede
indicar que ocurrió una denervación y que puede o no ocurrir una
recuperación parcial o total.
Koufman et al. (2001) establecieron cinco clases de trazados
electromiográficos basados en los parámetros de reclutamiento, PUM y
actividad espontánea, expresados en la siguiente tabla.
TRAZADOS
DIAGNÓSTICO PRONÓSTICO
ELECTROMIOGRÁFICOS
1. EMGL normal
Reclutamiento y
morfología 2. Fijación de
CLASE pliegue vocal
normales de la
I (en caso de
onda, sin actividad
espontánea inmovilidad
de ccvv)
Reclutamiento
disminuido con 1. Lesión sub aguda Buen pronóstico, sin
PUM pequeños con indicios de embargo, no se
CLASE
polifásicos (ondas reinervación garantiza una
II
nacientes) sin (parálisis laríngea recuperación neural
actividad aguda) completa.
espontanea.
Reclutamiento
No hay pronóstico
disminuido con
de mejoría, ya que el
CLASE PUM gigantes 1.Paralisis de ccvv
proceso de
III polifásicos, sin crónica
regeneración se
actividad
terminó.
espontánea
No es posible
determinar el
Reclutamiento pronóstico, se
disminuido con 1. Denervación necesita esperar
CLASE PUM polifásicos unos meses para
IV gigantes, con 2. Recuperación reevaluar y
actividad parcial determinar el
espontanea. tratamiento y/o
procedimiento
quirúrgico.
Mal pronóstico.
Sin reclutamiento,
con presencia de En estos casos la
CLASE regeneración
actividad motora » Denervación
V aberrante puede
espontanea , sin
PUM resultar en
sincinesias.
En resumen, la EMGL es especialmente útil para evaluar
desordenes de la neurona motora inferior, de los nervios periféricos, de la
unión neuromuscular y del músculo, por lo tanto, es un instrumento
importante para diferenciar neuropatías (parálisis y paresias), de
inmovilidad laríngea (causada por anquilosis, luxación de la articulación
cricoaritenoidea o sinéquias de la comisura anterior) o miopatías y
enfermedades funcionales (disfonías psicógenas) de enfermedades
orgánicas.
También es utilizada para localizar nervios y músculos laríngeos
en los casos de distonias para la inyección de toxina botulínica y
recientemente ha sido utilizada en procedimientos quirúrgicos como en
tiroidectomías para localizar y preservar los nervios laríngeos.
Behlau M., Azevedo R., Madazio, G. (2008). Anatomía de Laringe e
Fisiología da Produçaao Vocal. En M. Behlau, Voz. O livro do
Especialista. Sao Paulo: Revinter.
Canals P., López Catalá F., Villoslada C., Marco Peiró A., Marco Algarra, J.
(2001). Electromiografía Laríngea: Aplicaciones y Técnica.ORL-
DIPS. 28 (3): 132 – 137.
Colton R., Casper J., Leonard R. (2010). Anamnese, Exame e Avaliaçao. En
R. Colton, J. Casper, R. Leonard, & M. Behlau (Ed.),
Compreendendo os Problemas da Voz: Uma perspectiva fisiológica
no diagnóstico e tratamento das disfonias (F. Lobo, & T. Vaiano,
Trads.). Revinter.
Correa G., Otárola F., Del Lago J. (2000). Electromiografía
Laríngea. Revista Otorrinolaringología y Cirugía de Cabeza y
Cuello. 60: 91 – 98.
De Oliveira O., De Biase N., Behlau M., Melo E. (2002). Paralisias
Laríngeas. En C. A. Herrerías de Campos, H. O. de Olival Costa,
C. A. Herrerias de Campos, & H. O. de Olival Costa
(Edits.), Tratado de Otorrinolaringologia. Sâo Paulo, Brasil: Roca.
4: 477 – 493.
Dedivitis, R. (2002). Anatomía da Laringe. En R. Dedivitis, & A. P.
Brandao, Métodos de Avaliaçao e Diagnóstico de Laringe e Voz.
Sao Paulo: Lovise. 1: 5 – 37.
Eckley, C. (2002). Uso da Eletromiografía Laríngea na Prática Clínica. En
R. B. Dedivitis, Métodos de Avaliaçao e Diagnóstico de Laringe e
Voz. Sao Paulo: Lovise. 1 177 – 184.
García López, I. (2014). Utilidad de la electromiografía Laríngea en los
trastornos de la voz. Tesis Doctoral. Madrid, España: Universidad
Autónoma de Madrid. Departamento de Cirugía.
García-López I., Santiago-Pérez S., Peñarrocha-Teres J., Palacio A.,
Gavilán J. (2012). Electromiografía laríngea en el diagnóstico y
tratamiento de los trastornos de la voz. Acta
Otorrinolaringológica Española. 63 (6): 458 – 464.
Imamura R., Hiroshi Tsuji D., Ubirajara L. (2006). Fisiologia da Laringe. En
S. Pinho, D. Hiroshi, & S. Bohadana, Fundamentos em
Laringologia e Voz. Rio de Janeiro: Revinter. 1: 1 – 20.
Koufman J., Postma G., Whang C. (2001). Diagnostic laryngeal
electromyography: the wake forest experience 1995-
1999.Otolaryngology Head Neck Surgery. 1: 603 – 606.
Madruga E., Hiroshi D. (2006). Histología e ultra-estrutura da prega vocal
humana. En S. Pinho, D. Hiroshi, & S. Bohadana, Fundamentos
em Laringologia e Voz. Rio de Janeiro: Revinter. 1: 21 – 32.
McFarland, D. (2008). Sistema Fonatorio. En D. McFarland, Atlas de
Anatomía en Ortofonía, Lenguaje y Deglución. Paris: Elsevier
Masson. 1: 79 – 105.
Mogaró, S. (2004). Anatomía de la Laringe. En V.
Diamante, Otorrinolaringología y Afecciones Conexas. Buenos
Aires: El Ateneo. 1_ 412 – 417.
Moreno M., López J., Poch J. (2005). Anatomía y fisiología de la laringe.
Exploración Laríngea. En J. Poch, Otorrinolaringología y
Patología Cervicofacial. Buenos Aires. Editorial Médica
Panamericana. 1: 253 – 274.
Núñez Batalla F., Díaz JP., Costales M., Moreno C., Suárez C. (2012).
Neurolaringología. Acta Otorrinolaringológica Española. 63(2):
132 – 140.
Silvia M. Rebelo Pinho, DH. (2006). Fundamentos em Laringologia e
Voz. Rio de Janeiro, Brasil: Revinter.
Ysunza A., Perusquía Ortega E. (2007). Electro-diagnóstico. Revisión
actualizada. Acta Médica Grupo Ángeles. 5 (2): 73 – 80.
Ysunza A., Landeros L., Pamplona M C., Silva J A., Prado H., Fajardo G.
(2008). El papel de la electromiografía laríngea en la parálisis de
la cuerda vocal. Gaceta Médica Mexicana. 144 (4): 303 – 308
CAPÍTULO 9
“Observar las discrepancias en la percepción vocal
podrían condicionar el éxito en la Terapia Vocal”
(Núñez & Mate, 2013)
Dentro de la evaluación integral de la voz de un paciente, es

imprescindible conocer cuál es la percepción del mismo sobre su propia
voz. El impacto de un trastorno vocal puede tener diversos matices en
cada sujeto particular, y por tanto un mismo trastorno vocal podría
producir diferentes grados en el deterioro de la calidad de vida, aun
presentando varios sujetos una misma patología.
Para evaluar este deterioro en la calidad de vida, podrían
utilizarse diversas estrategias o instrumentos desde diferentes abordajes,
entre ellos se pueden mencionar, por ejemplo, el Voice Related Quality of
Life - VRQL (Hogikyan & Sethuraman, 1999), Vocal Performance
Questionare - VPQ (Carding, Horsley & Docherty, 1999), el Voice
Participation Profile – VPP (Ma & Yiu, 2001), y la Voice Symptom Scale –
VSS (Deary, Wilson & Carding, 2003).
Núñez & Mate (2013) hacen una descripción extensa sobre las
posibilidades en relación a la valoración subjetiva de la voz relacionado
con la calidad de vida, y expresan algo que resulta sumamente valioso al
momento de elegir el instrumento para este tipo de valoraciones. Según
ellos para que estos instrumentos sean útiles en la clínica deben cumplir
una serie de condiciones:
 Ser apropiados: deben ser adecuados o convenientes al fin que
se destina.
 Ser interpretables: deben poder hacer legibles la información
que se propone mostrar.
 Tener fiabilidad: el instrumento debe tener la capacidad para
proporcionar la misma medición en diferentes ocasiones (bajo
las mismas circunstancias.
 Tener validez y sensibilidad: la validez está dada cuando el
instrumento mide la/s variable/s que se propone medir, y para
ello debe tener validez de contenido, de criterio de evaluación,
y de constructo de la herramienta. La sensibilidad, en cambio,
está representada por la capacidad del instrumento para
detectar específicamente el deterioro de la calidad de vida
relacionado a la voz patológica, y especificidad cuando la
herramienta permite detectar sutiles variaciones entre sujetos
sanos.
 Ser sencillo: no presentar dificultad o complicación para su
aplicación.
 Ser rápido: permitir su aplicación en poco tiempo.
 Ser de fácil puntuación: que permita puntuar de forma sencilla,
lo cual deriva de la validez, sensibilidad y especificidad en la
herramienta.
 Producir datos relevantes: los datos son relevantes cuando
cumplen todos los criterios mencionados. Se relacionan
directamente con la fiabilidad, la validez, y la sensibilidad en
particular; pero abarca globalmente a todos los elementos
mencionados.
El uso de una u otra herramienta en general se basa en las

preferencias del terapeuta y su experiencia con éstas en la aplicación
clínica diaria.
Una de las herramientas más difundidas actualmente, validada
además al español y adaptada en varias versiones, que actualmente
pueden ser aplicadas por el terapeuta vocal es el Vocal Handicap Index.
Previo al mismo, la Disability Scale (Koschkee, 1993) también permitía
determinar el grado de discapacidad vocal percibida por el individuo en
su casa, trabajo y vida social. Jackson Menaldi (1992) se refiere a la misma
como un Índice de Discapacidad Vocal con utilidades relacionadas a la
autopercepción en el pre y post tratamiento. Farías (2007) lo incluye y
desarrolla dentro del protocolo sugerido en la valoración del riesgo Vocal
(Tabla 12).
El Vocal Handicap Index (VHI) o Índice de Discapacidad Vocal es
un cuestionario de 36 preguntas desarrollado por Jacobson et al. (1997),
con el fin de cuantificar el impacto percibido por un sujeto afectado por
un trastorno vocal. Su uso se ha extendido en distintos idiomas como el
portugués (Guimaraes & Abberton, 2004), chino (Lam et al., 2006), o
polaco (Pruszewics et al., 2004). Además, el VHI ha sido también
adaptado para poblaciones con características específicas, e incluso con
versiones que han sido validadas en formatos abreviados.
Índice de Discapacidad Vocal (Koschkee, 1993)
Trabajo: mis problemas vocales afectan mi trabajo

7 6 5 4 3 2 1
Normal Mínimo Suave Moderado Significante
Severo Profundo
Vida Social: mis problemas vocales afectan mi vida social

7 6 5 4 3 2 1 Tabla 12

Severo Profundo
Vida Familiar: mis problemas vocales afectan mi vida familiar o

responsabilidades hogareñas
7 6 5 4 3 2 1
Severo Profundo
Se pueden destacar: Vocal Handicap Index – 10 (VHI – 10) de

Rosen – Lee – Osborne et al., 2004; Voice Handicap Index – Partner (VHI
– P) de Zraick – Risner – Smith Olinde – Gregg – Johnson & Mc Weeny,
2007; e incluso Pedriatic Voice Handicap Index (p – VHI) de Zur – Cotton
– Kelchner – Baker – Weinrich & Lee, 2007.
Posteriormente, ante la necesidad de una escala que se adaptara
a las necesidades y percepción de la voz profesional cantada, se creó en
2007 el Índice de Discapacidad Vocal para Cantantes o Singing Voice
Handicap Index (S - VHI) de Cohen – Jacobson – Garret – et al., 2007.
VHI – 30: La versión original traducida al español (Núñez-Batalla, Corte-

Santos, Señaris-González, et al., 2007) contiene 30 ítems organizados en
tres grupos o dominios, denominados como sub-escalas o dominios:
física, funcional, y emocional. Este cuestionario ha sido validado
psicométricamente con una alta fiabilidad en sus resultados.
Utiliza para sus puntuaciones frecuencias: nunca (0), casi nunca
(1), algunas veces (2), casi siempre (3), y siempre (4). Consta de una serie
de afirmaciones que generan un puntaje entre 0 a 120. Con ello se pueden
obtener diferentes grados de discapacidad vocal, e incluso es capaz de
arrojar éstos diferenciados según cada uno de sus dominios.
Dominio Funcional
Dominio Físico
Dominio Emocional
Interpretación de resultados del VHI - 30:
 Índice de Discapacidad (en cada dominio):
o Leve: menor a 20 puntos en un dominio.
o Moderada: 21 a 30 puntos en un dominio.
o Severa: más de 30 puntos en un dominio.
Una puntuación de 5 o menor indica normalidad.
 Índice de Discapacidad Vocal (global):
o Leve: menor a 30 puntos en total.
o Moderada: 31 a 60 puntos en total.
o Severa: 61 a 90 puntos en total.
o Grave: 91 a 120 puntos en total.
Una puntuación de 10 o menor indica normalidad.
El VHI – 10 es una representación abreviada con propiedades

psicométricas similares al VHI – 30, por lo cual permite un estudio mucho
más rápido de la valoración del deterioro de la calidad de vida relacionado
a la voz (Rosen, Lee, Orborne et al., 2007). Los puntajes obtenidos con el
VH-10 van de 0 a 40 puntos.
Interpretación de los resultados del VHI-10:

 Índice de Discapacidad Vocal Leve: 0 a 10 puntos.
 Índice de Discapacidad Vocal Moderada: 11 a 20 puntos.
 Índice de Discapacidad vocal Severa: 21 a 30 puntos.
 Índice de Discapacidad Vocal Grave: 31 a 40 puntos.
Núñez-Batalla, Corte-Santos, Señaris-González, et al. (2007)
demuestran una fuerte coherencia interna y fiabilidad test-retest para la
evaluación en español del VHI-30 y del VHI-10. Su validez y fiabilidad
quedó demostrada con la obtención de correlaciones significativas entre
las puntuaciones totales y la severidad de la disfonía que el paciente
percibe. La coherencia interna demostró valores alfa de Cronbach de
μ=0,93 y μ=0,86 respectivamente (0= fiabilidad nula, 1= fiabilidad total).
Singing Voice Handicap Index (S-VHI) (Tabla 13) fue desarrollado por
Cohen – Jacobson – Garret et al. (2007) con un cuestionario de 36
preguntas que se encuentran adaptadas especialmente para la
autovaloración de los cantantes. Se contemplan dentro del S-VHI los
aspectos físicos, emocionales, sociales y económicos. Este último punto
es tenido en cuenta en esta escala por ser un eje que se resiente de forma
muy sensible en el caso de estos profesionales de la voz, ya que, ante la
presencia de un trastorno, es su fuente de trabajo quien también se ve
afectada. La adaptación y validación al español fue realizada por García-
López, Núñez-Batalla, Gavilán-Bouzas, Górriz-Gil (2010). Las
puntuaciones totales del mismo van desde 0 a 144 puntos en total.
La puntuación del cuestionario de los cantantes sanos no tiende
a cero, sino que tiene una media de 28,4 ± 18,5 puntos.
Es sumamente interesante mencionar que la valoración de la voz
cantada tiende a tener valores basales altos. Según los autores que
desarrollaron y validaron esta escala esto se debe a la importante
exigencia de esta población en relación con su estado vocal. Los
cantantes suelen ser perfeccionistas con su instrumento, y esto
acrecienta los puntajes ante sutiles diferencias en la emisión propia de la
voz.
La adaptación y validación del S-VHI al español posee una buena
fiabilidad test – re-test (r=0,63, p=0,000), presentando alta consistencia
interna y una fiabilidad muy importante (Alfa de Crombach: α=0,966).
Pedriatric Vocal Handicap Index (pVHI) es un cuestionario de 23 preguntas

que deben ser contestadas por los padres de los niños con alteraciones
vocales (Zur, Cotton, Kelchner, Baker, Weinrich, & Lee, 2007). Contiene 3
sub-escalas o dominios: funcional, físico, emocional. Es una herramienta
que ha demostrado su validez, consistencia interna y fiabilidad test – re-
test para el uso en la edad pediátrica (Pearson= 0,95; 0,77; 0,79; y 0,82),
encontrándose una alta correlación entre los resultados reportados del
VHI y pVHI. A través del pVHI se evalúa el impacto de la calidad de la voz
del niño en la comunicación global, el desarrollo, la educación, la vida
social y la vida familiar.
Tabla 13. Singing Voice Handicap Hindex (S-VHI)
Vocal Handicap Index – Partner (VHI – P) es un cuestionario destinado a

conocer la percepción de la persona que convive con el paciente
disfónico, por lo cual las preguntas del VHI fueron reformuladas (Zraick,
Risner, Smith-Olinde, Gregg, Johnson, Mc Weeny, 2007). Al igual que en
la versión clásica del VHI se presentan 3 sub-escalas o dominios: físico,
funcional, emocional. A través del VHI-P es posible conocer aspectos
generales de la función física, salud general, vitalidad, aspectos sociales,
emocionales y salud mental del paciente a través de la percepción de
aquellos que acompañan al mismo.
Síntesis
Como puede advertirse a partir de la información expuesta, se
han desarrollado a lo largo de las últimas décadas una variedad de
instrumentos válidos, confiables y específicos en la valoración del
deterioro de la calidad de vida relacionado al estado vocal, tanto desde la
autovaloración como de la percepción de las personas que rodean al
paciente, e incluso desde la perspectiva del evaluador. Esto podría indicar
que esa información posee un vínculo muy poderoso en el desarrollo y el
éxito de la terapia vocal.
Existen además ciertos elementos que debe tenerse en cuenta al
momento de aplicar cualquier tipo de herramienta: en primer lugar no se
debe olvidar nunca que en la utilización de escalas subjetivas de
percepción entran en juego además aspectos psicológicos, los culturales
e individuales que podrían provocar que una misma escala funcione de
formas diversas en distintos momentos del tiempo o en lugares
geográficos diferentes; y en segundo lugar, como ya lo hemos
mencionado en algunos puntos del presente libro, se sugiere siempre
complementar y comparar los resultados de múltiples herramientas para
arribar finalmente a un panorama general del paciente y su trastorno
vocal.
Canding P., Horsley IA., Docherty GJ. (1999). A Study of the effectiveness
of voice therapy in the treatment of 45 patients with nonorganic
dysphonia. Journal of Voice. 1: 72 – 104.
Cohen SM., Jacobson BH., Garret CG., et al. (2007). Creation and
Validation of the Singing Voice Handicap Index. Ann Otol Rhinol
Laryngol. 116: 402 – 406.
Deary IJ., Wilson JA., Carding PN, MacKenzie K. (2003). VoiSS: A patient
– derived Voice Symptom Scale. Journal Psychom Res. 54: 483 –
489.
García-López I., Núñez Batalla F., Gavilán Bouzas J. (2010). Validación de
la Versión en Español del Índice de Discapacidad Vocal (S-VHI)
para el Canto. Acta Otorrinolaringológica Española. 61 (4): 247 –
254.
Guimaraes I., Abberton E. (2004). An investigation of the Voice Handicap
Index with speakers Portuguese: preliminary data. Journal of
Voice. 18: 71 – 82.
Hogikyan ND., Sethurama G. (1999). Validation of an instrument to
measure Voice – Related Quality of Life (V-RQOL). Journal of
Voice. 13: 557 – 569.
Jacobson BH., Jonson A., Grywalski C., et al. (1997). The Voice Handicap
Index (VHI): development and validation. Am J Speech Lang
Pathol. 6: 66 – 70.
Panamericana.
Koschkee, DC. (1993). Voice Disability Index. University of Wisconsin
Hospital and Clinics. Madison, Wisconsin. United States.
Lam PKY., Chan KM., Ho WK., Kwong E., Yiu EM., Wie WI. (2006). Cross
– cultural adaptation and validation of the chinese voice handicap
index – 10. Laryngoscope. 116: 1192 – 1198.
Ma EP., Yiu EM-L. (2001). Voice activities and participation profile:
assessing the impact of voice disorders on daily activities. Journal
Speech Lang Hear Res. 44: 511 – 524.
Núñez F., Mate MA. (2013). Historia Clínica y Valoración Subjetiva de la
Voz (calidad de vida en relación con la voz). En: Patología de la
Voz: Cobeta I. / Núñez F. / Fernández S. (Capítulo 5). Ponencia
Oficial – Sociedad Española de Otorrinolaringología y Patología
Cérvico – Facial. SEORL PCF. Editorial Marge – Médica Books.
Barcelona – España.
Núñez – Batalla F., Corte – Santos P., Señaris – González B., et al. (2007).
Adaptación y Validación del Índice de Discapacidad Vocal (VHI-
30) y su versión abreviada (VHI-10) al español. Acta
Otorrinolaringol Esp. 58: 386 – 392.
Pruszewicz A., Obrebowski A., Wiskirska – Wonzika B., Wojnowski W.
(2004). Complex voice assessment: Polish version of the Voice
Handicap Index (VHI). Otolaryngol Pol. 58: 547 – 549.
Rosen C., Lee AS., Osborne J., et al. (2004). Development and Validation
of the Voice Handicap Index – 10. Laryngoscope. 114: 1549 – 1456.
Zraick RI., Risner BY., Smith-Olinde L., Gregg BA., Johnson FL., Mc
Weeny EK. (2007). Patient versus Partner Perception of Voice
Handicap. Journal of Voice. 21: 485 – 494.
Zur KB., Cotton S., Kelchner L., Baker S., Weinrich B., Lee L. (2007).
Pedriatric Voice Handicap Index (p – VHI): a new tool for evaluating
pediatric dysphonia. Int Journal Pediatr Otorhinolaryngol. 71: 77 –
82.
CAPÍTULO 10
Una vez obtenido ese gran caudal de datos, ¿qué hacer con ellos?
¿cómo interpretarlos? ¿qué lectura puede surgir? ¿Hacia dónde nos
conducen?
En este capítulo presentaremos ocho casos extraídos de la
consulta de cada uno de los autores y sobre cada uno realizaremos la
valoración correspondiente. Esperamos que el análisis aquí ofrecido
auxilie al lector en la comprensión y desenvolvimientos de las
herramientas detalladas a lo largo del libro.
Caso 1
Locutora profesional, conductora de un magazine televisivo y
profesora de educación física de 34 años (en ningún momento
desempeñó las tres tareas de forma simultánea). Presenta disfonía de
larga data sin diagnóstico ORL hasta el momento de la consulta. Realizó
tratamiento fonoaudiológico con anterioridad, pero de manera
discontinua.
Durante la primera entrevista la paciente manifiesta no recordar
el momento preciso en que apareció su disfonía; aunque no la relaciona a
medicamento, malos hábitos, falta de higiene vocal, momentos de estrés
o algún tipo de factor iatrogénico.
Pruebas aplicadas
Al iniciar la evaluación, su TMF es de 9 seg. Un posible indicador
de mala conversión aérea; y su Índice s/z de 1,7, termina de corroborar el
dato anterior: un soplo normal sostenido, pero al momento de interponer
la voz, la energía se agota rápidamente.
Se realiza evaluación acústica con la vocal /a/ sostenida a un tono
cómodo a una intensidad cómoda. Su F0 habitual, aunque un poco
elevada, podría considerarse normal (276 Hz); sin embargo, en cada una
de las tomas se observó tensión en los músculos del cuello. Las medidas
de perturbación y ruido se exponen a continuación.
Índices de Perturbación y
Valor Obtenido Valor Normal
Ruido (Praat)
Shimmer 3,21% 1,99%
Jitter 1,16% 0,63%
NHR (ruido/armónicos) 12,94 dB 16,5 dB
Las curvas de intensidad y frecuencias son más bien estables,

mas al principio de la emisión se observa un pequeño énfasis, posible
signo de inicio vocal duro. Su rango tonal fue bastante limitado y en
determinadas zonas, durante la ejecución del glissando, su voz se oía
ronca.
Luego de cierta insistencia, concurrió a examen ORL, sin

embargo, el diagnóstico confirmó ausencia de patología orgánica, y en
palabras del médico “solo tenés que hablar más fuerte para que se te
escuche mejor”.
Resolución del caso
La paciente inició tratamiento 2 veces por semana durante el
primer mes, basado principal en técnicas de relajación y masaje
circumlaríngeo para descender la tensión de los músculos del cuello; y
ejercicios con voz cantada para favorecer la elasticidad del tejido cordal.
La disfonía empezó a ceder luego de la 4ta sesión y la calidad de
su voz mejoró lo que constituyó una buena fuente de motivación para la
permanencia en el tratamiento.
Al cabo de tres meses la paciente fue dada de alta, aunque
mantiene controles periódicos de una vez al mes.
Caso 2
Cantautor de música popular de estilo pop. Sexo masculino. 23
años de edad.
Al momento de la primera consulta se encuentra con mucha
demanda de recitales y en proceso de grabación de su siguiente disco.
Fuma de forma esporádica, pero posee hábitos de alimentación e
hidratación bastante balanceados. No posee formación vocal
sistemática, no tomó clases de canto anteriormente.
El cantante consulta por la sensación de “vacíos tonales” en
ciertos rangos de su voz cantada, refiriendo que siente algún grado de
esfuerzo al abordar algunos sectores de su repertorio.
Consulta al médico Otorrinolaringólogo para evaluación a través
de nasofibrolaringoscopía. El informe ORL no presenta anormalidades.
Se realiza evaluación vocal:
Medición del Tiempo Máximo Fonatorio (TMF): se evalúa con la
vocal /a/ sostenida, con un resultado de 12 segundos. El TMF se encuentra
descendido, y más aun considerando que se trata de un cantante que
precisa de un alto rendimiento vocal. El índice s/z no arroja resultados
patológicos.
Análisis Acústico: se realizó el análisis sobre la vocal /a/ sostenida
en registro modal a una intensidad confortable. Se obtuvo una frecuencia
fundamental media de 136,880 Hz., lo cual se encuentra con un valor
normal para su sexo y su edad (Behlau et al., 2004). Índices de
perturbación y ruido:
Índices de Perturbación y
Valor Obtenido Valor Normal
Ruido (Praat)
Shimmer 2,861% 1,99%
Jitter 0,561% 0,63%
En la descripción de la curva de energía y frecuencia se observa:

 Ataque: existe un pico en la curva de energía, mostrando un
ataque brusco en la emisión.
 Cuerpo: la energía se presenta irregular, y se puede observar
que la curva melódica en cambio se encuentra conservada.
 Filatura: descendida de forma abrupta y con bastantes
irregularidades.
Los tres parámetros analizados se relacionan con incoordinación
fono-respiratoria.
En el espectrograma se observan armónicos graves definidos y
armónicos agudos con presencia de ruido (a partir de los 3900 Hz aprox.).
Se evalúa también la emisión con un glissando, presentándose
un quiebre del sonido en el pasaje de registro elevado, a registro modal.
Se encuentra una frecuencia mínima de 85 Hz (aprox. Fa 1) y una
frecuencia máxima de 412 Hz (aprox Sol# 3), por lo que clasifica como
Barítono según su extensión fisiológica (Jacskson Menaldi, 2002). El
quiebre se percibe entre Mi 3 – Fa 3 durante el descenso tonal. No puede
mantener la emisión con intensidad suave.
Se sugiere al paciente tomar clases sistemáticas de canto, y se
comienza a trabajar en entrenamiento vocal: se indican medidas de
higiene vocal, se trabaja sobre alineación postural, respiración, y
ejercitación de tracto vocal semi-ocluido (emisiones sostenidas,
variaciones de intensidad, glissando). Se realizan sesiones con 1
frecuencia semanal, a lo largo de 2 meses.
Los resultados obtenidos fueron

El paciente concurrió a clases de canto, y a sesiones foniátricas
por un período de 2 meses. Siente su voz mucho más clara y liviana, y
posee un mejor manejo de su respiración.
El TMF se modificó a 20 segundos. En el análisis acústico se
obtienen valores similares, excepto en la emisión del glissando donde se
encontraron variaciones favorables. Se obtuvo una extensión de 76 Hz
(Re# 1) a 480 Hz (Si 3) y no se perciben quiebres en el pasaje de registro
elevado a modal.
Sugerencias
Se sugiere al paciente continuar con clases de canto y sesiones
foniátricas.
Caso 3
Joven de 20 años de edad, acude al consultorio con la siguiente
queja: “terminé el colegio y no puedo empezar a trabajar por mi voz, mi
papá dice que si no mejoro no sabe qué va a hacer de mi vida, porque
tengo que empezar a trabajar…”. El paciente además refiere dificultades
en la comunicación con sus pares, pasa la mayor parte del tiempo en su
casa viendo televisión y tiene pocos amigos.
A la evaluación, el paciente presentaba calidad vocal agudizada,
intensidad vocal aumentada, articulación exagerada y el valor del TMF
para la vocal /a/ sostenida de 7 segundos, este resultado es considerado
alterado y con una importante disminución para la edad y sexo
correspondientes al paciente.
Para realizar el análisis acústico se toma la señal de la vocal /a/
sostenida, donde se observa que los valores de pitch (199 Hz)
corresponden al rango de voz femenina, el jitter con variación de 1 % y
shimmer con variación de 8,5%.
Según informe médico, posterior a la realización de la
laringoscopia rígida se constata cuerdas vocales móviles, sin lesiones y
aritenoides congestivas.
A través de la evaluación vocal tanto otorrinolaringológica como
fonoaudiológica se llegó al diagnóstico de PUBERFONIA o Trastorno de
la Muda Vocal.
En la siguiente tabla se puede observar el proceso de
recuperación del paciente, donde el TMF, notablemente disminuido
durante la evaluación, llega a parámetros adecuados para la edad del
paciente.
Proceso
Parámetros Evaluados Evaluación Alta
Terapéutico
TMF 7 seg 10 seg 15 seg
Pitch 199Hz 101 Hz 105 Hz
Jitter 1% 2% 0,6%
Shimmer 8,5% 18% 5%
Con relación al pitch inicial de 199 Hz, característico de

emisiones femeninas, observamos su descenso a valores esperados para
la edad y el sexo, correspondientes a los 105 Hz.
En cuanto a los valores de Jitter y Shimmer, notamos una
importante variación durante el proceso terapéutico, encontrándose muy
elevado, sin embargo, esto podría deberse a la gran inestabilidad vocal
que se produce al intentar mantener un nuevo registro llegando a
estabilizarse al momento del alta.
Caso 4
Docente de escuela primaria de 35 años de edad. Es
alfabetizadora, trabaja dentro del aula con grupos de alumnos y en forma
individual con niños con dificultades de aprendizaje dentro de la misma
escuela. Fumadora habitual con pocos hábitos de higiene vocal
incorporados (no bebe agua más que con infusiones, su dieta no es muy
balanceada y no descansa lo suficiente).
Consulta por una disfonía moderada que data de principio de año
(ella acude al consultorio recién en junio) con períodos intermitentes de
afonía.
Se realiza la medición del Tiempo Máximo Fonatorio (TMF) para
la vocal /a/ sostenida, lo que da un resultado de 8 segundos. Descendido
según los valores de referencia, lo que podríamos relacionar a un cierre
glótico incompleto.
El índice s/z arroja un resultado de 1,33. Aunque algunos autores
consideren que por debajo de 1,5 no tienen significación patológica,
combinando la información obtenida, es posible pensar que la
dosificación no es la adecuada, que la propulsión del aire es brusca lo que
reduce simultáneamente los valores de /s/ y /z/.
El análisis acústico realizado también sobre la vocal /a/
sostenida, reveló una frecuencia media de 162 Hz. Un tanto grave para
una mujer de 35 años, aunque la curva de frecuencia se haya mostrado
bastante estable. Su extensión tonal va de Fa2 - 175 Hz (mínimo) a Re#3
– 311 Hz (máximo). 11 Semitonos, presentando una extensión tonal
acortada y descendida sin presencia de falsete.
La descripción de la curva de energía permite observar:
 Inicio: el pico en la curva de energía nos muestra un inicio
con golpe glótico.
 Cuerpo: irregular, desciende la energía rápidamente.
 Filatura: descendida con caída abrupta.
Los tres parámetros analizados se relacionan con incoordinación
fono-respiratoria.
Las medidas de perturbación Jitter y Shimmer, y medidas de
ruido HNR están alteradas.
Índices de Perturbación y Valor Obtenido Valor Normal

Ruido (Praat)
Shimmer 3,704% 1,99%
Jitter 1,13% 0,63%
En los espectrogramas se visualizan armónicos graves definidos

y armónicos agudos con presencia de ruido relacionado con una posible
presencia de soplo en la emisión.
En el espectrograma de banda ancha se aprecian los cinco
formantes característicos de la vocal /a/. Los dos primeros un tanto
dispersos. F1 se encuentra descendido en relación con los parámetros
promedio normales (Aronson et al., 2001) esto puede relacionarse con
componente nasal en la emisión. No hay presencia de subarmónicos.
Según la clasificación de Yanagihara estaríamos frente a un caso
de disfonía Grado II.
El diagnóstico médico para la consulta del mes de junio fue
(textual) nódulo o pólipo en cuerda vocal derecha con pequeño edema en
cuerda vocal izquierda. Aunque algo impreciso, coincide en la limitación
del movimiento, cierre glótico parcial y algo de esfuerzo durante la
producción.
Durante el tratamiento se usó masoterapia en zona peri laríngea.

Además del armado de una rutina de calentamiento vocal con ejercicios
de tracto semiocluido, vibración lingual en tono cómodo sostenido y
glissandos ascendentes y descendentes. Ejercitar el apoyo costo
diafragmático abdominal con ejercitación vocal y material específico que
aporte a la paciente.
En septiembre regresó a consulta con ORL, obteniendo un nuevo
diagnóstico: Cuerda vocal derecha nódulo edematoso con pequeño
engrosamiento en su borde libre. Impronta en cuerda vocal izquierda de
aspecto levemente fibroso. Asimetría cordal. Cierre glótico incompleto.
Se sostuvo tratamiento por dos meses más, además de las
recomendaciones de hidratación constante durante el uso vocal. Control
del volumen en el aula y en la vida diaria, y alternancia en el uso de la voz
con periodos de descanso.
Caso 5
Cantante de música popular. Sexo masculino. 28 años de edad.
Concurre a evaluación foniátrica para mejorar sus posibilidades
vocales al cantar, no presenta patología vocal ni antecedentes de
disfonía.
El cantante posee una buena conducta alimenticia, no tiene
reflujo, no fuma. No ha tomado nunca clases de canto de forma
sistemática.
Se realiza evaluación vocal
En la medición del TMF de 22 segundos. Este valor se considera
un valor promedio de normalidad según el sexo (Shigemori citado por
Farías, 2007).
Evaluación Funcional Objetiva: se realiza análisis acústico y se
obtiene una frecuencia fundamental F0 de 220,21 Hz. Este valor se
encuentra elevado en relación a valores de normalidad (Behalu et al.,
2004). Índices de Perturbación y Ruido se encuentran dentro de los
valores de normalidad (Praat).
Se evalúa a través de electroglotografía y se obtiene un cociente
de contacto (CQ) de 44% con un nivel de criterio de 30%, además el índice
de contacto (CI) da como resultado una curva simétrica.
En la descripción de la curva de energía y frecuencia se observa:
 Ataque: es normal.
 Cuerpo: la energía se presenta regular con un descenso al final,
y se puede observar que la curva melódica está conservada.
 Filatura: descendida al final de la emisión.
Los tres parámetros analizados indican una buena coordinación

fono-respiratoria.
En el espectrograma se observan armónicos graves y agudos
definidos, con la presencia de un vibrato muy sutil al final de la emisión.
Se evalúa la emisión de un glissando a intensidad normal, y se
observa una extensión de 112 Hz (La 1) a 540 Hz (Do 4), por lo que se
clasifica como Tenor según su extensión fisiológica (Jackson Menaldi,
2002).
Se trabaja con el cantante en indicaciones para la realización de
un Calentamiento Vocal adecuado para sus necesidades. Se realiza
calentamiento vocal técnico: vocalizaciones por terceras y quintas,
glissando, vibración de labios (todo el calentamiento se realiza dentro de
su rango de tesitura).
Los resultados obtenidos luego del calentamiento fueron

Luego de la realización del calentamiento vocal se evaluó
nuevamente al cantante y se encontró un TMF de 25 segundos. Este valor
se considera normal según Farías (2007), y como un valor de excelencia
según Planas Morales & Villalba (2003).
Evaluación Funcional Objetiva: se obtiene una frecuencia
fundamental F0 de 227,96 Hz., es decir que la F0 se ha incrementado de
forma sutil. Índices de Perturbación y Ruido se encuentran dentro de los
valores de normalidad (Praat).
Se evalúa a través de electroglotografía y se obtiene un cociente
de contacto (CQ) de 59% con un nivel de criterio de 32%, además el índice
de contacto (CI) da como resultado una curva simétrica. Los valores del
CQ se han incrementado, aunque siguen estando dentro de los rangos de
normalidad, por lo cual se entiende que el cierre glótico ha mejorado
porque presenta mayor tiempo de aducción.
Cabe destacar que se usó además una escala de autovaloración
perceptual, con una escala análoga visual. Allí el cantante indicó una
mejora del 75% entre el pre – post calentamiento, relacionando esto a la
sensación de facilidad y vibración del sonido. Se aplicó además S-VHI y se
obtuvo una puntuación de 18, lo cual se considera dentro de lo esperable
en cantantes sanos.
Sugerencias
Se sugiere realizar calentamiento vocal siempre antes de realizar
su actividad profesional, y tomar clases de canto con un maestro
adecuado a sus necesidades.
Caso 6
Menor de 5 años de edad, acude al servicio de
Otorrinolaringología y luego al de Fonoaudiología por presentar un
cuadro de disfonía de 5 meses de evolución, que no mejora con
medicación, inicialmente tratado con corticoides.
Durante la anamnesis, los padres refieren que el menor es hijo
único de la pareja, además de ser el primer nieto para ambas familias. El
menor está escolarizado y pasa más tiempo con los abuelos maternos. En
relación a los hábitos vocales, grita constantemente, llora para conseguir
lo que quiere, toma bebidas muy frías, y práctica futbol, desde hace unos
meses, donde también grita mucho, según los padres.
A través de la nasofibrolaringoendoscopia, se constata hiato
glótico (hendidura) triangular posterior, con presencia de nódulos en
ambas cuerdas vocales y aritenoides congestivas.
Durante la evaluación fonoaudiológica es posible observar
mucha tensión a nivel del cuello durante la fonación, calidad vocal áspera
moderada. Con relación al TMF medido a través de la vocal sostenida /a/,
se obtiene un valor de 2,5 seg. disminuido para la edad, siendo que lo
esperado seria de 5 seg, conforme a la clasificación de Behlau & Pontes,
quienes refieren que los niños deberían presentar un TMF de tantos
segundos como años tiene el paciente, por ejemplo, un niño de 6 años
con TMF de 6 segundos. La relación s/z obtenida es de 1,2 lo que indica
hipercontraccion glótica.
Valores de
Parámetros Evaluados Evaluación
referencia
TMF 2,5 seg 5 seg
Pitch 280 Hz 300 Hz
Jitter 1,2 % 1%
Shimmer 13% 3%
Con relación al análisis acústico, los parámetros de pitch 283 Hz,

Jitter 1,2% y shimmer 13%, se encuentran todos alterados, y
corresponden a la tensión y a la lesión observada en cuerdas vocales, lo
que resulta en una calidad vocal áspera.
El menor se encuentra aún en proceso de tratamiento, con
diagnóstico de disfonía con presencia de Nódulos en ambos pliegues;
siendo que las primeras indicaciones fueron relacionadas a los hábitos
vocales perjudiciales y cómo empezar a manejarlos dentro y fuera de la
casa.
EPÍLOGO
Desde el espejo de García a las imágenes laríngeas de alta
resolución, desde las simples pruebas aerodinámicas hasta el
instrumental más sofisticado, las herramientas de evaluación han ido
cambiando y lo seguirán haciendo.
Hoy nos toca actualizar puntillosamente estas ideas que otrora
fueron solo imaginación, mientras otras se siguen gestando en la
búsqueda de la eficacia y exactitud.
Si antes estaba sólo el oído entrenado… hoy, además, la
evaluación clínica convencional aporta su cuota de significancia. Su
validez, probada en innumerables ocasiones, hace que hasta en los
contextos más precarios se pueda evaluar adecuadamente el estado de
una voz. Sin embargo, cada vez se hace más necesario “demostrar” y
respaldar con evidencia los criterios asumidos a la hora de emitir un
diagnóstico o iniciar un tratamiento.
Antes el espejo de García… hoy los estudios morfológicos-
funcionales, entre los que se enmarca la estroboscopia. Ésta constituye la
oportuna herramienta que traduce en imágenes encadenadas el
complejo desenvolvimiento del fenómeno vocal. Es el recurso que se
reconoce como el necesario para el respaldo de la evaluación clínica. No
obstante, aún se espera seguir perfeccionando este instrumento para
hacerlo cada vez más accesible aumentando el beneficio y disminuyendo
los costos.
Antes solo un número limitado de apreciaciones perceptuales…
hoy el análisis acústico de la voz, se erige como uno de los elementos que
ha llegado para quedarse. El sistema de tratamiento acústico de la voz,
brinda la posibilidad no solo de oír sino también de observar el sonido,
permitiendo construir la relación necesaria entre percepción auditiva y
datos numéricos. Es bastante accesible para su adquisición, empero, su
manejo no es del todo sencillo y es uno de los recursos más susceptibles
al avance tecnológico.
Antes la impresión visual de los estudios por imágenes… hoy la
Electroglotografía puede dar fiel reflejo de lo que escapa a nuestros ojos.
Esta metodología de observación indirecta facilita la medición de
parámetros que se desprenden de una lectura minuciosa del ciclo glótico.
Es un instrumento muy interesante para la investigación, mas en
Latinoamérica, no ha tenido la difusión y aceptación suficiente que la
haga familiar en los consultorios de quienes se dan a la tarea de evaluar la
voz.
Antes las simples medidas aerodinámicas… hoy el complejo
dispositivo que explora exiguamente las características aero-fonatorias
involucradas en el proceso de generación e irradiación vocal. Su costo no
lo hace tan cotidiano; sin embargo, confiamos en que con el tiempo podrá
hacerse accesible para el uso, no sólo científico, sino también clínico y
funcional a las necesidades reales.
Antes una aguda observación clínica basada en maniobras
exploratorias… hoy una avanzada medición de potenciales (conducción
eléctrica) puestos en juego para la exploración neurofisiológica de la
laringe. A pesar de ser un estudio que el fonoaudiólogo no puede llevar
adelante, el conocimiento e interiorización sobre el mismo permite
ampliar las condiciones evaluativas en equipos multidisciplinarios.
Claro que ninguno de los instrumentos aquí tratados es
autosuficiente. Sólo de la combinación de ellos surge verdadera claridad
en el diagnóstico. Y hemos podido ir observando a lo largo de este libro,
que más allá de las ambiciones del instrumento de evaluación o del
evaluador, las fronteras entre Objetivo y Subjetivo se desdibujan y borran
dando lugar a una nueva lectura y concepción que integra experiencia
clínica y evidencia científica.
Todo parece indicar que los recursos tecnológicos se seguirán
abriendo paso entre las herramientas de evaluación más avanzadas, sin
embargo, ningún análisis podrá prescindir de la presencia de un
profesional capacitado.
Agradecimientos
Un objetivo cumplido no es final del camino, sino el inicio de

nuevos pasos que nos llevarán aun más lejos.
A mi familia, en especial a mis segundas mamás y papás:

Nona Olga, Nona Juana†, Nona Antonia†, Tía Vivi, Tia Patri, Nono
Emilio y Nono Cesar†… por aquella maravillosa infancia en la que
sin darme cuenta se me enseñó que la vida es amor, trabajo y
dedicación… por esas incontables e incansables horas de juego y
cariño… por esos momentos inolvidables que siempre valdrá la
pena recordar.
A mi mama Ester, a mi hermana Emi y a mi papá Cacho†…
por sus enseñanzas, por su presencia y apoyo incondicional en
cada locura y ocurrencia, en todo momento.
A mi pequeña familia, Aylén y ese angelito tan inquieto que
patea y patea cada día más… por su paciencia y entendimiento, por
el tiempo resignado para este gran proyecto.
A mis colegas Priscilla, Esperanza y Mónica por haber
formado parte de este gran proyecto, dejando en estas páginas la
más alta calidad humana y profesional… además de reniegos,
sudor y regaños.
A mis amigos, fuente de inspiración y experimentación…
por estar siempre pendientes y atentos.
A mis profesores, alumnos y pacientes de quienes aprendo
a diario, cuyas enseñanzas se ven reflejadas aquí.
Un nuevo recorrido empieza…
Maxi
Agradecimientos
Quisiera agradecer en primer lugar a Dios por darme

siempre la oportunidad de cumplir grandes objetivos para mí en la
vida. Esto no hubiese sido posible sin el apoyo de Mi Amada
Familia: mi esposo Juan Manuel, mis hijas Abril y Rocío que
resignaron muchas de sus horas del tiempo que tenemos juntos
para apoyar este sueño que hoy se hace realidad. Agradezco
siempre a mis queridas hermanas Sofía, Pía, Milagros, y a mis
padres Juana y Vicente por ser incondicionales conmigo en todo
sentido.
Este libro es fruto también de un proceso de aprendizaje
en el cual no puedo olvidar a todos mis maestros que con amor me
han dado las herramientas para crecer; y a mis compañeros en este
proyecto y a la vez grandes amigos: Maximiliano, Esperanza y
Mónica… cada cual forma parte especial de este camino que cada
día me sorprende más y más con nuevos horizontes.
No quiero en este instante olvidar a nadie, solo gracias a la
vida y los amigos que ella me brinda, de quienes aprendo día a día
en todos los aspectos de mi vida; y por supuesto a cada uno de mis
pacientes que son uno de los motores más importantes en la
búsqueda de crecimiento profesional, y me ayudan a aprender de
ellos todos los días.
¡La vida es un aprendizaje con sus aciertos y errores…

de todo ello se aprende, y eso es vivir!
Priscilla
Agradecimientos
A mi familia por todos los momentos que cedieron y me

permitieron alejarme de ellos para concentrarme en el trabajo.
Al Programa Académico de Fonoaudiología de la
Universidad del Valle que me dio la formación que me ha permitido
una visión diversa del mundo.
A los equipos interdisciplinarios con los cuales desarrollo
mi tarea, porque el intercambio también es una forma de crecer.
A mis compañeros de academia y amigos.
A mis pacientes y alumnos que me enseñan cada día y me
animan a seguir adelante.
Esperanza
Agradecimientos
A mi marido, mis hijos y mis padres.

Agradezco el apoyo incondicional de mis padres que
siempre impulsaron mis proyectos para que lleguen a buen puerto.
A mis hijos, por ser la luz y la fortaleza para seguir
luchando.
A mi amado esposo, por ser un pilar importante en mi vida.
Y a mis colegas, por permitir que este sueño se haga
realidad.
Mónica Fretes

Evaluación Clínica de La Voz PDF

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Evaluación Clínica de La Voz PDF

Diunggah oleh

Hak Cipta:

Format Tersedia

Librería Editorial

Licenciado en Fonoaudiología (Universidad Nacional de La Plata).

Lic. en fonoaudiología (UNT), Doctoranda en Fonoaudiología UMSA,

Licenciada en Fonoaudiología (USC) Centro Universitario San Camilo,

Ma. Priscilla Portillo Mongelli

Entrevista y primera observación 14

Ondas simples y ondas complejas 57

Consideraciones Generales sobre el Ciclo Glotal 119

Utilización de la Medición de Parámetros Aerodinámicos 147

Fisiología Laríngea 169

Referencias Bibliográficas 195

Ma. Priscilla Portillo Mongelli

Rodrigo Maximiliano Jerez

La evaluación clínica constituye el inicio de todo proceso de

La discusión sobre los paradigmas de objetividad y subjetividad no

Objetividad y subjetividad en Fonoaudiología

¿Métodos objetivos, sujetos subjetivos?

Desde tiempos antiguos, la voz ha sido objeto de estudio, y el

¿Tuvo o tiene problemas

¿Realiza tareas vocales de

¿Desempeña otros trabajos

¿Durante cuántas horas? ¿En qué

¿Usa la voz durante sus horas de

¿Cómo es su ambiente de ¿Estuvo o está en tratamiento

¿Cuántas horas duerme por la

¿Participa en coros? ¿En qué

¿Toma algo antes, durante o ¿Alguna vez recibió pautas de

Medidas y conceptos en relación a la capacidad y utilización aérea

Capacidades y Volúmenes pulmonares

Datos del paciente

Nombre y Apellido: Fecha de consulta:

Fecha de nacimiento: Edad:

Estudios previos – Antecedentes médicos:

Enfermedades (alergias, problemas respiratorios, tiroides, etc.)

Breve descripción del problema

Evaluación de los aspectos respiratorios

Evaluación de los aspectos vocales

Timbre Resonancia característica

Escala de evaluación perceptual

Voice Handicap Index

Estos valores aportan datos sobre el funcionamiento del sistema

Tiempo máximo de soplo (TMS) o Tiempo máximo espiratorio

Tabla 2 (Ptacek et al., Mujer 25 – 30 segundos

Tiempo máximo fonatorio (TMF)

Hirano et al. (1968) 15 – 25 segundos 25 – 35 segundos

< 4 años: 8,9

Índice s/z – s/e

Soporte aéreo pulmonar

En principio, se espera que los tiempos sean muy similares, para

Condición Índice Implicancia clínica

Condición normal o flujo

Valores según García Tapia Defecto de cierre por

Valores Sin significación clínica

Mediciones relacionadas al tono y la frecuencia

Tono Medio Hablado

Para la confección del campo vocal ya no resulta necesario

Quiebres vocales o tonales

Medidas relacionadas al volumen y la intensidad

Valoración perceptual de la producción vocal

La incorporación del parámetro Inestability/Inestabilidad (I) en

Este procedimiento tiene como ventajas la facilidad de realizarla

Este procedimiento se inicia con la preparación del paciente en

Las ventajas de este procedimiento están relacionadas con sus