www.elsevier.es/otorrino
ARTÍCULO ORIGINAL
a
Servicio de Otorrinolaringología, Hospital Universitario Central de Asturias, Oviedo, España
b
Grado de Logopedia, Facultad de Psicología, Universidad de Oviedo, Oviedo, España
0001-6519/$ – see front matter © 2013 Elsevier España, S.L. Todos los derechos reservados.
http://dx.doi.org/10.1016/j.otorri.2013.12.004
Document downloaded from http://www.elsevier.es, day 19/03/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
KEYWORDS Acoustic voice analysis using the Praat program: Comparative study with the Dr.
Sound spectrogram; Speech program
Acoustic analysis;
Praat; Abstract
Dr. Speech Introduction and objectives: The European Laryngological Society (ELS) basic protocol for
functional assessment of voice pathology includes 5 different approaches: perception, videos-
troboscopy, acoustics, aerodynamics and subjective rating by the patient. In this study we
focused on acoustic voice analysis.
The purpose of the present study was to correlate the results obtained by the commercial
software Dr. Speech and the free software Praat in 2 fields:
1. Narrow-band spectrogram (the presence of noise according to Yanagihara, and the presence
of subharmonics) (semi-quantitative).
2. Voice acoustic parameters (jitter, shimmer, harmonics-to-noise ratio, fundamental fre-
quency) (quantitative).
Material and methods: We studied a total of 99 voice samples from individuals with Reinke’s
oedema diagnosed using videostroboscopy. One independent observer used Dr. Speech 3.0 and
a second one used the Praat program (Phonetic Sciences, University of Amsterdam).
The spectrographic analysis consisted of obtaining a narrow-band spectrogram from the pre-
vious digitalised voice samples by the 2 independent observers. They then determined the
presence of noise in the spectrogram, using the Yanagihara grades, as well as the presence of
subharmonics. As a final result, the acoustic parameters of jitter, shimmer, harmonics-to-noise
ratio and fundamental frequency were obtained from the 2 acoustic analysis programs.
Results: The results indicated that the sound spectrogram and the numerical values obtained
for shimmer and jitter were similar for both computer programs, even though types 1, 2 and 3
voice samples were analysed.
Conclusions: The Praat and Dr. Speech programs provide similar results in the acoustic analysis
of pathological voices.
© 2013 Elsevier España, S.L. All rights reserved.
Media DS Media DS
Jitter (%) 0,722 1,0 0,595 0,786 0,005 0,856 (,2-,7)
Shimmer (%) 3,810 3,433 3,820 3,412 0,926 0,903 (,7-,9)
HNR 20,35 6,430 20,39 6,152 0,911 0,784 (,7-,8)
F0 (Hz) 175,15 48,10 169,95 49,26 0,092 0,740 (,6-,9)
CI: intervalo de confianza; DS: desviación estándar; ICC: intervalo intraclases.
Los resultados obtenidos en el análisis acústico de las resultado indica una correlación casi completa entre ambas
voces pueden verse tanto en la tablas 1 y 2 como en las observaciones.
figuras 1 y 2. Además, el análisis de subarmónicos mostró coincidencia
en 93 casos (94%), con un índice kappa de 0,873 (p = 0,05).
Análisis espectrográfico
Discusión
En la tabla 3 se exponen la estadística descriptiva de los
hallazgos espectrográficos de ambos programas. En este estudio se exponen las similitudes entre un programa
En la clasificación de las voces en la escala de Yanagihara comercial (Dr. Speech de Tiger Electronics) y un programa
hubo concordancia entre ambos observadores en 94 de los gratuito de análisis acústico de la voz (Praat) mediante el
99 casos (96%), con un Índice kappa de 0,940 (p = 0,03). Este análisis de muestras vocales de 3 seg de duración de una
5 20
4
Shimmer (P)
15
Jitter (P)
3
10
2
5
1
0 0
0 1 2 3 4 5 0 5 10 15 20
Jitter (DS) Shimmer (DS)
30
250
25
20
200
HNR (P)
F0 (P)
15
150
10
5 100
Jitter Shimmer
2
4
1
2
Differences
Differences
0 0
–2
–1
–4
–2
0 1 2 3 4 5 0 5 10 15 20
Means Means
HNR F0
20
20
10
10
Differences
Differences
0 0
–10
–10
–20
–20
5 10 15 20 25 30 100 150 200 250
Means Means
Figura 2 Gráficos de Bland-Altman para las variables acústicas, que muestran la concordancia entre los datos obtenidos mediante
ambos programas.
vocal sostenida /e/ obtenidas de 99 pacientes diagnostica- hecho hace necesario que se estudien series de personas
dos de edema de Reinke. sanas con el objeto de establecer los valores normativos para
Existen antecedentes de estudios que han analizado las el programa Praat, tarea que no ha sido hasta el momento
diferencias en los resultados de las medidas de perturbación llevada a cabo15 .
entre programas de análisis acústico12---14 . En este trabajo Tras estudiar las medidas de perturbación este trabajo
se aborda adicionalmente la espectrografía, analizando los investigó las similitudes y diferencias entre ambos progra-
resultados de la clasificación del ruido y de la presencia de mas en la espectrografía. Los trazados espectrográficos de
subarmónicos entre ambos programas. banda estrecha se analizaron de acuerdo a la clasificación de
En nuestro trabajo se observa que el jitter presenta una Yanagihara y observando la presencia de subarmónicos. Se
menor correlación entre ambos programas, hallazgo que se pone de manifiesto una elevada concordancia entre obser-
ha comprobado también en otros estudios, donde se observa vadores en el análisis espectrográfico con ambos programas,
que aunque se encuentran fuertes similitudes en los resul- tanto en la escala de Yanagihara, con una correlación casi
tados de la frecuencia fundamental entre los programas, completa, como en los subarmónicos. Los resultados mos-
las medidas de perturbación presentan unas correlaciones traron una coincidencia casi absoluta, con lo que se puede
menos significativas, especialmente en las de la frecuen- concluir que el análisis espectrográfico es absolutamente
cia. El hecho de que las perturbaciones de amplitud tengan comparable entre los distintos programas. Este hallazgo
mejores correlaciones que las de frecuencia se explica era esperado porque los programas producen una imagen o
porque el jitter es mucho más dependiente del exacto espectrograma que para su interpretación exige la califica-
emplazamiento de los límites de las ondas que en el caso ción por parte del examinador, y no un algoritmo matemático
del shimmer. Mientras que errores mínimos en la localiza- que resulte en un resultado numérico.
ción de los límites de la onda añaden de forma intensa ruido El contar con esta ventaja en la espectrografía permite
a las medidas de la perturbación de frecuencia, el efecto de comparaciones entre los resultados de distintos programas,
tales errores supone menos detrimento en las medidas de siempre que los criterios de calificación de las gráficas sean
perturbación de amplitud, dado que generalmente no son comunes. Hay que tener en cuenta que el análisis acústico
de tanta magnitud como para eliminar de forma completa de la voz debe contar necesariamente con esta técnica para
el pico de un ciclo12,14 . De esta forma se explica que los estu- el estudio de las voces que excedan el 5% de perturbación
dios que comparan los resultados entre distintos programas, en frecuencia o amplitud, voces que corresponderían al tipo
entre los que se incluye el presente, encuentren correlacio- ii de Titze. Según este autor6 es útil clasificar, en primer
nes débiles o moderadas en la perturbación de frecuencia y lugar, las voces en 3 tipos: las voces tipo 1 son práctica-
moderadas o fuertes en la perturbación de amplitud. Este mente periódicas; las voces tipo 2 contienen aperiodicidad,
Document downloaded from http://www.elsevier.es, day 19/03/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
subarmónicos o roturas de la voz; las voces tipo 3 son caóti- con mínimos requisitos de equipamiento y fácilmente mane-
cas. Por tanto, recomienda comenzar la evaluación de la voz jables contribuye a la mejora de la calidad de la asistencia
patológica con la realización de un análisis espectrográfico al paciente.
con el fin de determinar los métodos de estudio más idó- Derivado de este trabajo, y para poder emplear en el
neos para cada caso en particular, y tanto el espectrograma ámbito clínico el programa Praat, es necesario que se estu-
hallado con el Dr. Speech como con el Praat sirven para este dien series de personas sanas con el objeto de establecer los
fin. valores normativos del mismo, tarea que no ha sido hasta el
Las medidas de perturbación a corto plazo no son fiables momento llevada a cabo.
si las voces contienen intermitencias, fuertes subarmónicos
o modulaciones16 , por lo que las voces tipo 2 y tipo 3 solo
pueden ser estudiadas a través de un método de clasifica- Conclusiones
ción perceptual (GRBAS), y por un método visual como el
espectrograma. Por muy patológica que sea la voz siempre El espectrograma obtenido con el programa Praat es compa-
se dispondrá de un gráfico en el que veremos representado rable al hallado con el programa Dr. Speech.
el ruido, los armónicos, los subarmónicos y los segmentos de Se encuentran correlaciones débiles o moderadas en la
vacíos de señal8 . perturbación de frecuencia, y moderadas o fuertes en la
En cambio, las voces tipo 1 son las que sí pueden anali- perturbación de amplitud.
zarse por medio de los parámetros de perturbación a corto
plazo (jitter, shimmer, HNR) de manera fiable16 .
Conflicto de intereses
Con este estudio de la correlación de los resultados obte-
nidos por 2 programas de análisis acústico, uno comercial
Los autores declaran no tener ningún conflicto de intereses.
(Dr. Speech) y otro gratuito (Praat), pretendemos apoyar
con evidencias el uso de este último, lo que supondría dis-
frutar de algunas de las siguientes ventajas: el programa Bibliografía
Dr. Speech está diseñado para el sistema operativo Windows
95/NT/98/2000/XP y no se puede utilizar con otros sistemas 1. Eskenazi L, Childers DG, Hicks DM. Acoustic correlates of vocal
operativos. En cambio, el Praat se puede utilizar tanto para quality. J Speech Hear Res. 1990;33:298---306.
Windows como para Macintosh, el sistema operativo libre 2. Dejonckere PH, Remacle M, Fresnel-Elbaz E, Woisard V, Crevier-
Linux y otros sistemas como FreeBSD, SGI, Solaris, HPUX, Buchman L, Millet B. Differentiated perceptual evaluation
lo cual facilita su instalación en cualquier equipo, sin tener of pathological voice quality: Reliability and correlations
que disponer de un sistema operativo concreto. El Programa with acoustic measurements. Rev Laryngol Otol Rhinol.
Praat es un software de código abierto (en inglés open source 1996;117:219---24.
software u OSS), es decir, está licenciado de tal manera que 3. Hirano M. Clinical examination of voice. Vienna: Springer; 1981.
4. Kreiman J, Gerratt B. Measuring vocal quality. En: Kent RD, Ball
los autores exponen de forma abierta el código fuente, los
MJ, editores. Voice quality measurement. San Diego: Singular
algoritmos utilizados en el programa para cada parámetro Publishing Group; 2000. p. 73---101.
son de dominio público, no tienen derechos de autor, y esto 5. Werth K, Voigt D, Döllinger M, Eysholdt U, Lohscheller J. Clinical
les permite a los usuarios utilizar, cambiar y mejorar el soft- value of acoustic voice measures: A retrospective study. Eur
ware. De este modo, gracias a la colaboración entre autores Arch Otorhinolaryngol. 2010;267:1261---71.
y usuarios el programa se desarrolla más rápidamente que 6. Titze IR. National Center for Voice and Speech. Denver: Works-
un programa comercial. El programa Praat es gratuito, por hop on acoustic voice analysis. Summary statement; 1994.
lo que se encuentra disponible para todos los profesionales 7. Yanagihara N. Significance of harmonic changes and noise
de la voz, ya se encuentren en instituciones o en gabinetes components in hoarseness. J Speech Hear Res. 1967;10:
particulares. 531---41.
8. Núñez Batalla N, Suarez Nieto C. Espectrografía clínica de
Según el estudio de Rodríguez-Parra et al.17 el 62% de
la voz. Universidad de Oviedo. Servicio de Publicaciones;
los servicios de ORL españoles no disponen de laboratorio 1999.
de voz, a pesar de que actualmente puede considerarse 9. Boersma P, Weenink D. Phonetic Sciences Holanda: Univer-
esencial en la evaluación y tratamiento de pacientes con sity of Amsterdam [consultado 9 Dic 2013]. Disponible en:
alteraciones vocales y para la investigación clínica de esos http://www.fon.hum.uva.nl/praat/
trastornos18 . 10. Titze IR, Liang H. Comparison of F0 extraction methods for high-
La función vocal es multidimensional3 y por tanto su eva- precision voice perturbation measurements. J Speech Hear Res.
luación también tiene que ser multidimensional, incluyendo: 1993;36:1120---33.
percepción, análisis acústico, videoestroboscopia, aerodiná- 11. Awan SN, Scarpino SE. Measures of vocal F0 from continuous
mica y autovaloración del paciente19 . Así pues, el hecho de speech samples: An interprogram comparison. J Speech Lang
Pathol Audiol. 2004;28:122---31.
disponer de programas gratuitos fiables debería favorecer su
12. Bielamowicz S, Kreiman J, Gerratt BR, Dauer MS, Berke GS.
extensión tanto en instituciones públicas como en consultas Comparison of voice analysis systems for perturbation measu-
privadas con bajo presupuesto. rement. J Speech Hear Res. 1993;39:126---34.
Esto es importante sobre todo para los profesionales que 13. Karnell MP, Hall KD, Landahl KL. Comparison of fundamental fre-
trabajan de manera autónoma. El número de pacientes con quency and perturbation measurements among three analysis
trastornos de la voz que suele acudir a una consulta privada systems. J Voice. 1995;9:383---93.
de logopedia en relación con otras afecciones, no suele jus- 14. Smits I, Ceuppens P, de Bodt MS. Comparative study of acoustic
tificar la inversión económica en un programa comercial, voice measurements by means of Dr. Speech and computerized
pero la existencia de programas gratuitos válidos, fiables, speech lab. J Voice. 2005;19:187---96.
Document downloaded from http://www.elsevier.es, day 19/03/2018. This copy is for personal use. Any transmission of this document by any media or format is strictly prohibited.
15. Maryn Y, Corthals P, de Bodt M, Van Cauwenberge P, Deliyski manejo de los problemas de la voz. Acta Otorrinolaringol Esp.
D. Perturbation measures of voice: A comparative study bet- 2006;57:109---14.
ween multi-dimensional voice program and Praat. Folia Phoniatr 18. Dejonckere PH. Valoración perceptual y de laboratorio de la
Logop. 2009;61:217---26. disfonía. Otolaryngol Clin North Am. 2000;33:677---94.
16. Núñez Batalla F, Santos Corte P, Sequeiros Santiago G, Señaris 19. Dejonckere PH, Crevier-Buchman L, Marie JP, Moerman M,
González B, Suárez Nieto C. Evaluación perceptual de la disfo- Remacle M, Woisard V. European Research Group on the Larynx.
nía: correlación con los parámetros acústicos y fiabilidad. Acta Implementation of the European Laringological Society (ELS)
Otorrinolaringol Esp. 2004;55:282---7. basic protocol for assessing voice treatment effect. Rev Laringol
17. Rodríguez-Parra MJ, Casado JC, Adrián JA, Buiza JJ. Estado Otol Rhinol (Bord). 2003;124:279---83.
actual de los servicios ORL españoles. Heterogeneidad en el