Anda di halaman 1dari 372

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/305258864

Metodología y aplicaciones en la investigación en traducción e interpretación


con corpus / Methodologies and applications in corpus-based Translation and
Interpreting Studies

Book · January 2015

CITATIONS READS
0 2,182

6 authors, including:

María Teresa Sánchez Nieto Susana Alvarez Alvarez


Universidad de Valladolid Universidad de Valladolid
20 PUBLICATIONS   8 CITATIONS    9 PUBLICATIONS   21 CITATIONS   

SEE PROFILE SEE PROFILE

Verónica Arnáiz-Uzquiza María Teresa Ortego Antón


Universidad de Valladolid Universidad de Valladolid
10 PUBLICATIONS   11 CITATIONS    35 PUBLICATIONS   12 CITATIONS   

SEE PROFILE SEE PROFILE

Some of the authors of this publication are also working on these related projects:

INTERPRETING, COLLABORATIVE LEARNING View project

INTERPRETA 2.0: aplicación de herramientas TIC para la enseñanza-aprendizaje de la interpretación View project

All content following this page was uploaded by María Teresa Sánchez Nieto on 13 July 2016.

The user has requested enhancement of the downloaded file.


MARÍA TERESA SÁNCHEZ NIETO – SUSANA ÁLVAREZ ÁLVAREZ– VERÓNICA ARNÁIZ-UZQUIZA
TERESA ORTEGO ANTÓN – LETICIA SANTAMARÍA CIORDIA – ROSA FERNÁNDEZ MUÑIZ
(editoras)

Metodología y aplicaciones
en la investigación en traducción
e interpretación con corpus
Methodologies and applications in corpus-based and
corpus-driven Translation and Interpreting research

Universidad de Valladolid
Metodología y aplicaciones
en la investigación en traducción
e interpretación con corpus
Methodologies and applications in corpus-based and
corpus-driven Translation and Interpreting research
Serie: LINGÜÍSTICA Y FILOLOGÍA, nº 83

Metodología y aplicaciones en la investigación en traducción e interpretación


con corpus = Methodologies and applications in corpus-based and corpus-
driven Translation and Interpreting research / editoras María Teresa Sánchez
… [et al.]. - Valladolid : Ediciones Universidad de Valladolid, [2015]

1 DVD - (Lingüística y Filología ; 83)


ISBN 978-84-8448-823-1

1.Traducción e interpretación – Investigación I. Sánchez Nieto, María Teresa


II.Universidad de Valladolid, ed. III. España. Ministerio de Economía y
Competitividad IV.Serie

81’26
MARÍA TERESA SÁNCHEZ NIETO – SUSANA ÁLVAREZ ÁLVAREZ– VERÓNICA ARNÁIZ-UZQUIZA
TERESA ORTEGO ANTÓN – LETICIA SANTAMARÍA CIORDIA – ROSA FERNÁNDEZ MUÑIZ
editoras

Metodología y aplicaciones
en la investigación en traducción
e interpretación con corpus
Methodologies and applications in corpus-based and
corpus-driven Translation and Interpreting research
Con la colaboración de:

LOS AUTORES, VALLADOLID, 2015


EDICIONES UNIVERSIDAD DE VALLADOLID

ISBN: 978-84-8448-823-1
Dep. Legal: VA-202-2015

Realiza: Los autores


NetyTec – Soria
Gráficas Gutiérrez Martín – Valladolid

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComercial –
SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original ni la gene-
ración de obras derivadas.
Índice / Contents
Prólogo de los editores............................................................................................. 11
Editors’ preface ......................................................................................................... 13
INTRODUCCIÓN
INTRODUCTION
Testimonios de la evolución de los estudios traductológicos basados en corpus
durante la última década (2003-2013).................................................................... 17
Testimonies of the evolution of corpus-based Translation Studies in the last decade
(2003-2013) ............................................................................................................... 31
M.ª Teresa Sánchez, Susana Álvarez, Verónica Arnaiz, María Teresa Ortego, Leticia
Santamaría y Rosa Fernández
PARTE I LA CARACTERIZACIÓN DE LA LENGUA TRADUCIDA
PART I THE CHARACTERIZATION OF TRANSLATED LANGUAGE
La singularidad de la onomatopeya japonesa en la lengua traducida y no
traducida
[The uniqueness of Japanese onomatopoeias in translation and non-translation]
Daniel Ruiz Martínez y Chie Motoki ......................................................................... 47
Pana y terciopelo en la literatura vasca traducida y no traducida. Aspectos
lingüístico-estilísticos resultantes de la comparación de dos corpus
[Corduroy and velvet in translated and non-translated Basque literature. Linguistic
and stylistic aspects resulting from the comparison of two corpora]
Isabel Etxeberria Ramírez ......................................................................................... 63
El traductor y el inmigrante. Tres traducciones de La vida es un caravasar de
Emine Sevgi Özdamar
[The translator and the immigrant.Three translations of Emine Sevgi Özdamar’s Life
is a Caravasar]
Philippe Humblé ........................................................................................................ 91
Les expressions idiomatiques dans les versions roumaines du Rouge et le noir
[Idioms in Le rouge et le noir Romanian translations]
Anca-Andreea Brăescu ............................................................................................ 105
Estudios de la traducción basados en corpus. Aspectos metodológicos para el
análisis de estilo
[Corpus-based Translation Studies. Methodological aspects for analysis of style]
Ariel Novodvorski .................................................................................................... 117

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
8 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

Un corpus para la historia de la traducción: Officina Barezzi y la edición


sinóptica de las traducciones españolas del Dei delitti e delle Pene de Cesare
Beccaria
[Corpora for the History of Translation: Officina Barezzi and the synoptic edition of
Beccaria's On Crimes and Punishments translations into Spanish]
Carmen Castillo Peña y Raffaella Tonin ................................................................. 139
PARTE II ESTUDIOS DE INTERPRETACIÓN Y LA RAMA APLICADA DE LOS ESTUDIOS
TRADUCTOLÓGICOS BASADOS EN CORPUS

PART II INTERPRETING STUDIES AND THE APPLIED BRANCH OF CORPUS-BASED


TRANSLATION AND INTERPRETING STUDIES
Corpus y formación de intérpretes: un estudio exploratorio
[Corpora and interpreter training: an exploratory study]
Sílvia Araújo y Ana Correia .................................................................................... 165
El uso de corpus en la formación de intérpretes en los servicios públicos en
casos de violencia de género en España
[Corpus and training of public service gender violence interpreting in Spain]
Raquel Lázaro Gutiérrez y María del Mar Sánchez Ramos .................................... 183
Aplicabilidad del uso de corpus a la docencia en interpretación. La herramienta
Universaldoctor Project en la formación del intérprete en el ámbito sanitario
[Applicability of Corpora to Academic Training in Interpreting. The use of
Universaldoctor Project in the Training of Interpreters in Healthcare Settings]
Leticia Santamaría Ciordia y Rosa Fernández Muñiz ............................................ 197
PARTE III CORPUS Y ESTUDIOS APLICADOS
PART III CORPORA AND APPLIED RESEACH
Desarrollo de un glosario bilingüe sobre un corpus virtual de ofertas alojativas
[Building a virtual corpus-based bilingual accommodation glossary]
Karina Socorro Trujillo y Ramsés Narciso Cabrera Olivares ................................ 221
Corpus de textos audiovisuales frente a corpus de textos escritos. La traducción
de micropíldoras de aprendizaje
[Audiovisual Corpora Vs Written Corpora. Translating Knowledge Pills]
Verónica Arnáiz-Uzquiza, Susana Álvarez Álvarez y Alfredo Corell Almuzara ..... 237
Los equivalentes de la informática en los diccionarios generales bilingües:
¿Utopía o realidad?
[Computing Equivalents in General Bilingual Dictionaries: a Reality or a Utopia?
María Teresa Ortego Antón y Purificación Fernández Nistal ................................ 251
ÍNDICE / CONTENTS 9

Análisis cualitativo de textos con un programa CAQDAS


[Qualitative text analysis with a CAQDAS]
Karin Vilar Sánchez ................................................................................................ 271
Metodología para evaluar la localización web en España. Primeros resultados
aplicados a un corpus de sitios web de pymes agroalimentarias andaluzas
[A methodology for evaluating web localization in Spain: initial results from a corpus
of websites for andalusian agri-food SMEs]
Ana Medina Reguera y Cristina Ramírez Delgado ................................................. 293
PARTE IV COMPILACIÓN Y CLASIFICACIÓN DE RECURSOS
PART IV RESSOURCE CREATION / SET-UP AND RESSOURCE CLASSIFICATION
EHUskaratuak: un corpus de traducciones académicas en una lengua
minoritaria
[EHUskaratuak: a corpus of academic translations in a minority language]
Gidor Bilbao Telletxea y Jesus Mari Makazaga Eizaguirre ................................... 323
Propuesta de clasificación de corpus textuales
[Proposal of textual corpora classification]
Goretti Faya Ornia .................................................................................................. 339
Les corpus dans le cadre de la maîtrise en traduction
[The use of corpora in the context of MA seminars in translation studies]
Teresa Tomaszkiewicz ............................................................................................. 357

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


Prólogo de los editores
Estimado lector, estimado investigador:
Como equipo de editores queremos dirigir brevemente tu atención hacia el as-
pecto quizá más llamativo de la publicación que tienes ante ti: su formato mul-
timedia.
La doble naturaleza del contenido que queríamos publicar (texto y vídeo) acon-
sejaba este formato de publicación. El presente DVD contiene un libro en el que
hemos editado una selección de los trabajos presentados en el I Coloquio Her-
mēneus, titulado «Los estudios de traducción e interpretación basados en cor-
pus: de lo local a lo global». Estos trabajos han sido sometidos a un proceso de
revisor por pares, cuyos árbitros forman parte del comité científico del I Colo-
quio Hermēneus. El libro se completa con un anexo multimedia, integrado por
las grabaciones de la práctica totalidad de conferencias plenarias y ponencias
que tuvieron lugar en el Coloquio, editadas por el Servicio de Medios Audiovi-
suales de la Universidad de Valladolid 1 El anexo ofrece al lector/ investigador
un valor añadido, al recoger el sustrato original del que nacen los trabajos escri-
tos.
Al elegir el libro multimedia como formato conseguimos dar cobertura en un
único soporte a dos acontecimientos científicos: la publicación científica tradi-
cional y la reunión científica que hace posible dicha publicación.
Por otra parte, el formato de libro electrónico enriquecido nos asiste especial-
mente bien en nuestro compromiso con la difusión del conocimiento científico,
compromiso que adquirimos al recibir una subvención en la convocatoria de
2013 de la Fundación Española para la Ciencia y la Tecnología (FECyT) del
Ministerio de Economía y Competitividad para organizar y celebrar el I Colo-
quio Hermēneus. Desde el primer momento quisimos proporcionar a los inves-
tigadores la posibilidad de difundir su conocimiento por una vía doble: como
texto y como grabación de su presentación. Las ventajas son claras: Desde el
punto de vista del contenido, la presentación grabada permite a los interesados
en la materia un acceso rápido a los contenidos desarrollados con mayor ampli-
tud en el texto escrito. La grabación puede funcionar así como puerta de acceso
al texto o como complemento al mismo. Poniendo caras al conocimiento lo
humanizamos y, en última instancia, favorecemos el contacto y el diálogo entre
los investigadores. Por su parte, el investigador puede justificar por partida do-
ble, ante la agencia de evaluación pertinente, la difusión del conocimiento que

1
Quisiéramos agradecer el estupendo trabajo llevado a cabo por su director, Juan Carlos Aragón
Vasco, que ha estado al frente de la parte técnica del proyecto de edición audiovisual.

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
12 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

ha generado, puesto que artículo y vídeo constituyen dos objetos diferentes a los
que se puede hacer referencia por separado.
Nuestro compromiso con la difusión de los contenidos generados en el Colo-
quio y acomodados en la presente publicación se complementa, además, con
otras tres medidas:
1. La difusión de las grabaciones de ponencias y conferencias plenarias a
través de la lista de reproducción «Coloquios Hermēneus» del canal ins-
titucional de la Universidad de Valladolid en Youtube AudiovisualesU-
Va, enlazada también al sitio web de la Revista Hermēneus
(<http://hermeneus.blogs.uva.es>), que auspició el encuentro que posi-
bilitó esta publicación;
2. El alojamiento en breve de los capítulos del libro y los vídeos de ponen-
cias u conferencias en el repositorio institucional UVaDoc, gestionado
por el Servicio de Bibliotecas de la Universidad de Valladolid. UVaDoc
garantiza el acceso a texto completo de los capítulos del libro y propor-
ciona a cada uno de los objetos una URL permanenente o permalink.
De esta manera, textos y grabaciones se identifican de manera unívoca
y quedan mejor posicionados en los buscadores.
3. El enlace a las grabaciones de las ponencias en la página de cada autor
dentro del blog del Coloquio (http://coloquiohermeneus.blogs.uva.es),
donde los propios autores pueden gestionar los comentarios y preguntas
sobre los contenidos expuestos.
Los textos individuales y el libro multimedia en su conjunto se publican con una
licencia Creative Commons del tipo Reconocimiento – NoComercial –
SinObraDerivada (by-nc-nd, no se permite un uso comercial de la obra original
ni la generación de obras derivadas). Esta decisión entendemos que permite la
difusión segura de la obra y sus partes, tanto por parte de los autores de cada
capítulo como por terceros.
Esperamos que la publicación que tienes ante ti resulte de tu agrado y provecho.

El equipo editorial
Editors’ preface
Dear readers and researchers,
The Editorial Board would like to draw your attention to a somewhat unusual
feature of the publication that you are holding: its multimedia format.
In our view, the two-fold nature of the contents (texts and videos) made this
format a natural choice. Firstly, this DVD-ROM contains the book Corpus-
Based Translation and Interpreting Studies: from the Local to the Global,
which comprises an edited selection of the papers presented at the I Hermēneus
Conference, held at the Faculty of Translation and Interpreting of the University
of Valladolid in Soria (Spain) on 26-27 March 2014. These papers have been
peer-reviewed by reviewers on the scientific committee of the I Hermēneus
Conference. The book is complemented by a multimedia appendix, containing
the recordings of the four plenary sessions and most of the papers presented at
the Conference. The recordings have been carefully edited by the Multimedia
Service of the University of Valladolid2. The multimedia appendix offers an
added value, as it recreates the original context from which the written papers
derive. By choosing the multimedia book format, we have managed to bring
together two scientific events –i. e. the traditional scientific publication on the
one hand, and the scientific seminar which gave rise to the aforementioned pub-
lication, on the other.
Secondly, the enriched multimedia book format proves most useful in regard to
our commitment to the dissemination of scientific knowledge, a commitment
that we made when we received funding to organize the aforementioned con-
ference from the Spanish Foundation for Science and Technology (FECyT,
Ministry for Economy and Competitiveness) in its 2013 call for applications for
funding. Since the beginning, we have pursued the idea of making it easier for
researchers taking part in our Conference to disseminate their work through two
different channels: in the traditional printed format and in an audio-visual for-
mat, in the form of recordings of their presentations. The advantages are clear:
The recorded presentation allows quick access to the concepts, which are devel-
oped in greater depth in the written text. The video can thus serve as a gateway
to the text or simply as a complement to it. If we put a face to a piece of scien-
tific research, we humanize it and, no less importantly, we facilitate contact and
dialogue between researchers. Furthermore, researchers can have their scientific
output evaluated by making reference to two different publications: the book
chapter and the recorded presentation.

2
Special thanks are due to its director, Juan Carlos Aragón Vasco, who was in charge of the
technical aspects of the audiovisual editing project, for his thoughtful work.

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
14 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

Our commitment to the dissemination of the contents produced at the Confer-


ence and included in this multimedia book is complemented by three further
measures:
The dissemination of the recorded presentations through the “Coloquios
Hermēneus” playlist on the University of Valladolid’s institutional channel
(AudiovisualesUVa). A link to this playlist is also included in the Hermēneus.
Journal of Translating and Interpreting blog (http://www5.uva.es/hermeneus/).
The incorporation of the book chapter and the videos as separate items into the
institutional UVaDoc repository, which is managed by the the University of
Valladolid’s Library Services. UVaDoc guarantees full-text access to the book
chapters as well as to the videos, and provides every issue with a permalink.
Those items can therefore be unambiguously identified and better placed in
search engines.
The recordings are embedded in the authors’ pages on the conference website,
where authors themselves can manage the questions and comments on the top-
ics that they present.
The individual chapters and the multimedia book as a whole are published un-
der a Creative Commons Licence (Attribution-NonCommercial-NoDerivs -CC
BY-NC-ND), which allows third-party downloading and sharing of the content
as long as users credit the authors. Amending the content or using it for com-
mercial purposes are not, however, allowed). This licence guarantees safe dis-
tribution and dissemination of the book and its parts by their authors and by
third-parties.
We hope that all our readers will enjoy and find reading and browsing the con-
tent beneficial.
The Editorial Board
INTRODUCCIÓN
INTRODUCTION

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
Testimonios de la evolución de los estudios traduc-
tológicos basados en corpus durante la última dé-
cada (2003-2013)

1. Una realidad caleidoscópica


El cariz a primera vista caleidoscópico de esta obra no es sino buena muestra de
la evolución de la disciplina de los estudios traductológicos basados en corpus
durante su segunda década de existencia (2003-2013). Laviosa (2014) describe
esta década como un periodo en el que la rama descriptiva de la disciplina se ha
caracterizado por el mantenimiento del interés por los universales de la traduc-
ción y la caracterización de la lengua traducida –en este último caso con un
interés particular por el estudio del comportamiento de los traductores, y espe-
cialmente los literarios–, así como por la consolidación de la relación entre los
estudios de traducción e interpretación y la lingüística contrastiva por medio de
los corpus. Dentro de la rama aplicada de la disciplina, Laviosa subraya la con-
tribución de los corpus en esta decada a «una cultura de la investigación en edu-
cación» (Laviosa 2014) 3, la creación de nuevos y numerosos corpus, con la
aparición de los primeros corpus de interpretación y la investigación correspon-
diente y, finalmente, el uso de los corpus como recursos para la evaluación de la
calidad y el desarrollo de las herramientas de traducción asistida por ordenador.
Otro rasgo que ha caracterizado el cierre de esta segunda década delimitada por
Laviosa (2014) es la aparición de voces críticas que apuntan a la necesidad de
una mayor transparencia metodológica en la investigación con corpus en gene-
ral y sobre los universales de traducción en particular. Un ejemplo de esta pos-
tura lo encontramos en Sutter et al. (2012), en la introducción al número 13 de
Across Languages and Cultures. Marco (2014), por su parte, sintetiza y analiza
magistralmente esas voces críticas e insinúa caminos para encauzar la futura
investigación en estudios traductológicos basados en corpus teniendo en cuenta
la valiosa reflexión que proporcionan esas críticas.
El propósito de esta introducción es mostrar cómo los trabajos que se recogen
en esta obra encajan perfectamente en la representación de esta década de con-
solidación de los estudios traductológicos basados en corpus llevada a cabo por
Laviosa (2014). En las siguientes líneas proporcionamos una breve clasificación
de las aportaciones, que describiremos y comentaremos con mayor profundidad
en los apartados 2 a 6 de esta introducción.

3
La traducción es nuestra.

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
18 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

(i) Dentro de la rama descriptiva de los estudios traductológicos basados en


corpus, este volumen recoge estudios sobre indicadores para la investigación de
la lengua traducida (Ruiz y Motoki, Etxeberria), estudios sobre el estilo de tra-
ductores literarios (Novodvorski, Humblé) y trabajos que abordan el comporta-
miento traductor (Tonin y Castillo, Chretariu-Braescu). Por lo que respecta a la
rama aplicada, destaca el hecho de que tres de los cuatro trabajos incluidos en
este volumen con reflexiones y propuestas para la didáctica pertenezcan a los
estudios de interpretación (Sánchez y Lázaro, Santamaría y Fernández, Araújo
y Correia), siendo el estudio de Trujillo y Cabrera el único dedicado a la didác-
tica de la traducción (turístico-comercial, en este caso). Todavía dentro de la
rama aplicada queremos llamar la atención sobre el trabajo de corpus aplicados
a la (meta)lexicografía, enfocado a la evaluación de diccionarios generales bi-
lingües (Ortego y Fernández).
(ii) En la práctica totalidad de los trabajos aquí recogidos se percibe un marcado
interés por explicitar los detalles metodológicos. De hecho, el trabajo de No-
vodvorski está enteramente dedicado a la exposición paso a paso de la metodo-
logía empleada en su tesis doctoral. Destacan asimismo en este sentido los tra-
bajos de Vilar, Ortego y Fernández, Tonin y Castillo – estos últimos con su
metodología corpus-driven aplicada a la historia de la traducción– así como las
aportaciones de Ruiz y Motoki, Sánchez y Lázaro y Humblé. Dentro de los
aspectos metodológicos, el trabajo de Novodvorski es un ejemplo de cómo el
lingüista-traductólogo desarrolla su propio sistema de etiquetado en función de
su interés investigador. Asimismo, queremos destacar dentro de esta instantánea
de una «realidad caleidoscópica» la convivencia de enfoques cualitativos y
cuantitativos dentro de la investigación con corpus: La aportación de Humblé
ejemplifica cómo ciertos análisis cuantitativos (concretamente aquí la relación
type/token) pueden dar pistas para posteriores vías de investigación de corte
cualitativo. Por su parte, Vilar hace uso de una metodología cualitativa y mues-
tra cómo el análisis cualitativo con herramientas CAQDAS se constituye en el
caso de corpus pequeños como alternativa al etiquetado de las concordancias (o
in-corpus annotation en la terminología de Smith et al., 2008). Por último, en
Tonin y Castillo vemos cómo el corpus (las ediciones sinópticas) no es el único
objeto de análisis cualitativo, sino que junto a este se analizan también otros
objetos diferentes, en este caso los paratextos de las ediciones, que permiten una
explicación de las causas y efectos de ciertos rasgos de las traducciones. El tra-
bajo de estas autoras demuestra que la llamada a la combinación de métodos
cuantitativos y cualitativos formulada por Olohan (2002) ha dado su fruto a lo
largo de esta década.
(iii) Por lo que respecta a la creación de recursos, y en correspondencia con el
análisis de Laviosa (2014), en este volumen encontramos trabajos que informan
sobre la creación de corpus, ya sea para describirlos o bien para informar sobre
INTRODUCCIÓN 19

el proceso de su compilación o los fines para los que fueran compilados. En


ocasiones, la información técnica que aportan los autores de los trabajos sobre
el proceso de compilación de sus respectivos corpus es muy inspiradora y ayuda
a su replicabilidad en otros contextos de investigación (Araújo, Novodvorski).
La gama de corpus considerados abarca desde los corpus ad hoc de referencia
especializados (Arnaiz et al.) hasta grandes proyectos de acceso libre (Bilbao y
Makazaga, Tonin y Castillo, Araújo y Correia) o aún en proceso de análisis
(Medina y Ramírez) o incluso de compilación (Sánchez y Lázaro). De estos
recursos ya creados o en proceso de creación, dos de ellos son corpus específi-
cos de interpretación (Sánchez y Lázaro, Araújo y Correia).
(iv) Corpus de interpretación: De los tres trabajos que incluye el presente volu-
men sobre corpus de interpretación, uno de ellos está dedicado a la interpreta-
ción de conferencias (Araújo y Correia), y los otros dos a la interpretación en
las instituciones públicas (Lázaro y Sánchez, Santamaría y Fernández). La in-
corporación de los corpus a los estudios de interpretación fue analizada por
Shlesinger en su artículo de 1998 y está recibiendo un importante impulso en
nuestros días, como demuestra el volumen de Straniero y Falbo, publicado en
2012. Los trabajos de Lázar y Sánchez y Santamaría y Fernández suponen una
novedad importante puesto que están dedicados a una modalidad de interpreta-
ción cuya investigación hasta ahora los corpus no habrían hecho entrada. Desta-
ca en este contexto el interesante comentario que Santamaría y Fernández hacen
de un recurso lingüístico-informático que, si bien no es un corpus en sentido
estricto, sí está basado en un corpus de ejemplos y puede ser aprovechado en la
docencia de la interpretación en las instituciones públicas médicas.
(v) Si bien Laviosa, en su caracterización de la última década dentro de los es-
tudios traductológicos basados en corpus, aludía a la existencia de recopilacio-
nes de corpus (como el sitio web de Federico Zanettin 1 o la lista comentada de
corpus de Richard Xiao 2), nosotros hemos observado que en este periodo ha
comenzado a darse cierto grado de reflexión sobre los corpus en sí, ejemplifica-
da en trabajos como Ahmad (2008) y Borja (2008) o Zanettin (2012), por citar
solo algunos. Esta reflexión surge muy probablemente como resultado de la
proliferación de nuevos y muy diferentes corpus, fruto, a su vez, de los avances
técnicos que permiten su compilación, almacenamiento, análisis y explotación.
La reflexión parece desarrollarse en torno a dos ejes: la clasificación y la eva-
luación de corpus, observándose paralelismos en otras disciplinas hermanas,
como p. ej. Rojo (2010) o Briz y Albelda (2009) dentro de la lingüística del
corpus aplicada a los estudios hispánicos. En este volumen, los trabajos de Go-
retti Faya, Teresa Tomaszkiewicz, así como el de Bilbao y Makazaga se inserta-
rían dentro de esta corriente.
(vi) Una última tendencia de la que da testimonio este volumen es la de los cor-
pus en contextos interdisciplinares: Medina y Ramírez han compilado un corpus

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


20 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

de sitios web localizados cuyo análisis puede arrojar conclusiones útiles para
otras disciplinas, como el comercio electrónico y el análisis de mercados en este
caso. Por otra parte Tomaszkiewicz incluye una interesante reflexión final sobre
la posibilidad e incluso la necesidad de analizar un mismo corpus con herra-
mientas de varias disciplinas diferentes a las de la propia traductología.
Finalmente, y antes de pasar a introducir en detalle el contenido de este volu-
men, quisiéramos llamar la atención precisamente sobre la etiqueta «estudios
traductológicos basados en corpus» (v. Sánchez y Lázaro en este volumen). El
lector familiarizado con este tipo de investigación advertirá que la denomina-
ción «estudios de traducción basados en corpus» está más generalizada que la
propuesta por Sánchez y Lázaro y empleada aquí. Sin embargo, dado el crecien-
te protagonismo de los estudios de interpretación que recurren a corpus, demos-
trado aquí con la presencia de tres trabajos, consideramos que la etiqueta pro-
puesta por Sánchez y Lázaro hace más justicia a la realidad investigadora actual
dentro de la disciplina.

2. La caracterización de la lengua traducida


El estudio de Daniel Ruiz y Chie Motoki, «La singularidad de la onomatope-
ya japonesa en la lengua traducida y no traducida», demuestra el fructífero
debate que está surgiendo en torno a la hipótesis de los elementos únicos, que
inicialmente fue planteada en estudios con el par de lenguas inglés y finés
(Tirkkonen-Condit, 2004), puesta a prueba en un contexto de formación de tra-
ductores también en este par de lenguas (Eskola, 2004), y más recientemente en
los pares de lenguas inglés-español (Martínez Vilinsky, 2012). Los autores se
adentran en un terreno nunca hollado, como es el estudio de la lengua traducida
japonesa a partir de textos originales españoles, utilizando la onomatopeya ja-
ponesa como indicador. Trabajar en general con corpus comparables del japo-
nés, y en particular con unidades léxicas como la onomatopeya japonesa, plan-
tea una serie de retos metodológicos nada despreciables. Los autores detallan
estos retos en su trabajo, que ellos entienden como un primer estudio explorato-
rio. Sus primeras conclusiones les llevan a acuñar el interesante concepto de
«falta de estímulo semántico» (y no tanto de estímulo léxico) en los textos es-
pañoles para explicar la menor presencia de onomatopeyas en los textos japone-
ses traducidos del español (v. pag. 61). Pese a su carácter exploratorio, este
trabajo resulta muy original en lo que respecta a las explicaciones propuestas
para el fenómeno descrito.
También de la caracterización de la lengua traducida, si bien esta vez del euske-
ra, se ocupa Isabel Etxeberria en su trabajo titulado «Pana y terciopelo en la
literatura vasca traducida y no traducida. Aspectos lingüístico-estilísticos
resultantes de la comparación de dos corpus». Se trata de un trabajo que par-
INTRODUCCIÓN 21

te de la teoría del polisistema de Even-Zohar (1990) y se lleva a cabo en un


corpus monolingüe comparable de prosa vasca, Ereduzko Prosa Gaur
(http://www.ehu.es/euskara-orria/euskara/ereduzkoa/), convenientemente des-
crito por la atora a partir de la pág. 66, y que le posibilita comparar textos vas-
cos originales y traducidos. Etxeberria busca caracterizar la lengua traducida de
un sistema literario «joven, periférico y débil», en el que la traducción desem-
peña, por tanto, un papel importante, con un «30-35 % de la producción edito-
rial vasca actual » (pág. 64). Su objetivo es identificar «qué rasgos pudieran
estar influyendo en el desarrollo léxico, morfosintáctico y estilístico de la len-
gua vasca» a través de las traducciones que pasan a formar parte del polisistema
literario vasco. Para ello, Etxeberria desarrolla una metodología muy ajustada,
muy original y, sobre todo, muy claramente expuesta, que comprende (1) la
identificación de indicadores organizados en grupos para analizar cuatro facto-
res: precisión semántica, diversidad y riqueza léxicas, usos lingüísticos exclusi-
vos del euskera y binomios préstamo vs. vocablo eusquérico), (2) la investiga-
ción de dichos indicadores en el corpus de textos traducidos y textos originales
y (3) el análisis de los resultados. Entendemos que la metodología que emplea la
autora es mixta: En la medida en la que observa los datos de los corpus para
formular conclusiones podría calificarse como corpus-driven (motivada en cor-
pus); no obstante, en un nivel superior la metodología es corpus-based (basada
en corpus), puesto que la autora trata de probar la hipótesis formulada a partir
de los presupuestos de la teoría del polisistema (v. para la distinción entre am-
bas metodologías Tognini Bonelli (2001:17), Marco y Van Lawick (2009) o
Saldanha (2009), entre otros). En cuanto a las conclusiones, Etxeberria observa
un mayor ajuste a la norma en la literatura vasca traducida que en la original, así
como una «mayor tendencia a la precisión, el detalle y el matiz» semántico en el
euskera traducido (pág. 88), amén de otras cuestiones interesantes que atañen a
los textos originales.
Varias contribuciones se ocupan del estudio del estilo traductor y el comporta-
miento de los traductores literarios, con el apoyo de corpus o de técnicas de la
lingüística del corpus. Philippe Humblé, en su inspirador estudio – «El traduc-
tor y el inmigrante. Tres traducciones de Emine Sevgi Özdamar La vida es
un caravasar»– aplica estas técnicas al estudio de la traducción de novelas es-
critas por inmigrantes, en las que lo que ha venido denominándose genérica-
mente «acento» es parte de la identidad del autor, y, por tanto, es objeto de un
uso estilístico. Humblé operacionaliza la relación type/token para el estudio de
la traducción del «acento», y nos permite comprender cómo el análisis cuantita-
tivo abre vías para investigaciones cualitativas posteriores: Los resultados del
estudio cuantitativo le permiten establecer unos datos objetivos iniciales y for-
mular sobre ellos hipótesis subsiguientes, impulsando así la espiral del proceso
investigador.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


22 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

Desde un planteamiento metodológico diferente, puesto que trabaja con un cor-


pus de muestras y, por tanto, desde una perspectiva cualitativa, Andreea-Aanca
Braescu-Chretariu estudia varias traducciones de un mismo original con el fin
de determinar el comportamiento de los traductores literarios y también de eva-
luar la calidad de las diferentes traducciones. En «Les expressions idiomati-
ques dans les versions roumaines du Rouge et le noir», Braescu-Chretariu
muestra el tratamiento de los fraseologismos por parte de los cinco traductores
rumanos que se han enfrentado a la obra sthendaliana a lo largo del último siglo.
La autora concluye que la dosificación en ocasiones exagerada de los fraseolo-
gismos en las traducciones comporta el riesgo de acercar demasiado el texto
origen a la cultura meta, y detecta también dificultades a la hora de tratar en la
traducción un rasgo típico de la lengua literaria de Sthendal como es la elipsis
en las expresiones idiomáticas.
La contribución de Ariel Novodvorski, «Estudios de la Traducción basados
en Corpus. Aspectos metodológicos para el análisis de estilo», se centra no
tanto en resultados como en cuestiones metodológicas. El autor nos hace partí-
cipes de su inquietud: «Aún se hace necesaria la definición de un cuadro teóri-
co-metodológico más preciso para la investigación de los perfiles estilísticos de
la traducción» (p. 118). Como reacción a esta falta de definición, nos revela
paso a paso la metodología utilizada en su propio estudio. Los parámetros que
Novodvorski operacionaliza («perspectiva», pág.120) para analizar el estilo
traductor son el uso de la puntuación, las cursivas y los paratextos, además de la
«clavicidad» o keyness (pág. 118) y la traducción del discurso referido. El autor
explica también paso a paso las técnicas y procedimientos utilizados (compila-
ción de los corpus, etiquetados, etc.), resumidos en una relación en la pág. 119.
Novodvorski emplea un corpus paralelo bilingüe de tres obras de Ernesto Sába-
to y sus traducciones al portugués brasileño. Llama la atención la adecuación
inteligente de las herramientas informáticas a los fines investigadores, así como
el desarrollo de su propio sistema de anotación, que desempeña un papel esen-
cial en el estudio de las variables «discurso referido» y «puntuación».
La aportación de Castillo y Tonin, «Un corpus para la historia de la traducción:
Officina Barezzi y la edición sinóptica de las traducciones españolas del Dei
delitti e delle Pene de Cesare Beccaria», resultará de interés para aquellos inves-
tigadores de la historia de la traducción, y particularmente «la historia de la
mediación cultural entre Italia y España» (p. 140), que deseen observar ejem-
plos de cómo combinar metodologías motivadas en corpus (corpus-driven) con
herramientas y técnicas habituales en historia de la traducción, como el estudio
de los paratextos. Officina Barezzi es un portal que aloja corpus paralelos, con-
cretamente la «edición digital sinóptica de primeras traducciones de obras signi-
ficativas para la cultura italiana y española» (p. 140). Se trata de un proyecto
ambicioso, ejemplo de creación de nuevos recursos libres para la comunidad, en
INTRODUCCIÓN 23

formato electrónico y accesible, siguiendo el más puro espíritu de las humani-


dades digitales. Este trabajo incluye interesantes consideraciones sobre decisio-
nes metodológicas importantes, como la selección de las ediciones para la edi-
ción sinóptica de las traducciones. Pero sin duda, uno de los puntos destacados
de este trabajo reside en cómo las autoras explicitan y ejemplifican los dos po-
sibles acercamientos al estudio comparado del método traductor a partir del
material compilado en Officina Barezzi: (1) del paratexto al corpus (método
deductivo), extrayendo conclusiones de la lectura de los paratextos y buscando
ejemplos que confirmen dichas conclusiones, o bien (2) del corpus al paratexto
(método inductivo), deduciendo de la comparación de traducciones el método
empleado por cada traductor y confirmando las hipótesis en los paratextos.

3. Estudios de interpretación y la rama aplicada de los estudios


traductológicos basados en corpus
En «Corpus y formación de intérpretes: un estudio exploratorio», Araújo y
Correia presentan Per-Fide/EPIC, un corpus multimodal de interpretación si-
multánea bilingüe y bidireccional (EN-en /PT-pt) como extensión del corpus
Per-Fide (http://per-fide.ilch.uminho.pt), así como los resultados de un análisis
exploratorio que da indicios de cómo se puede explotar el corpus con fines in-
vestigadores, pero también, y sobre todo, formativos. Las autoras defienden que
en didáctica de la interpretación simultánea sería conveniente complementar el
paradigma cognitivo con aportaciones de la lingüística contrastiva: A partir de
ejemplos extraídos del corpus Per-Fide/EPIC delimitan áreas especialmente
problemáticas en interpretación simultánea en general y entre portugués e inglés
en particular (relaciones anafóricas, tiempo/aspecto/modo, cohesión interfrásti-
ca, papeles semánticos de los argumentos), que podrían ser objeto de estudio en
la clase de interpretación simultánea. Con estos análisis contrastivos sobre la
producción del intérprete el alumno podría «desarrollar la conciencia metalin-
güística» (p. ¡Error! Marcador no definido.) así como para «identificar idio-
sincrasias de los idiomas» (p. ¡Error! Marcador no definido.). Creemos que el
valor de los testimonios de interpretación que contiene el corpus, que, además
de ser auténticos, son multimodales, reside no solo en la autenticidad de los
datos, sino en su disponibilidad para ser investigados en trabajo autónomo por
parte del alumno.
Este volumen incluye dos trabajos que versan sobre la modalidad de la interpre-
tación en los servicios públicos, también conocida como interpretación social o
interpretación comunitaria. Llama la atención el hecho de que ambos incluyen
un pequeño debate sobre la (falta de) definición de esta modalidad de interpre-
tación y la mejor manera de etiquetarla, aunque en cada caso se basen en dife-
rentes fuentes (lo que hace aún más interesante una lectura complementaria de
ambos trabajos). Concretamente, Santamaría y Fernández achacan a la etiqueta

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


24 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

«interpretación en los servicios públicos» el hecho de que no considera que esta


modalidad de interpretación también se lleva a cabo en entidades privadas como
ONGs.
En «El uso de corpus en la formación de intérpretes en los servicios públi-
cos en casos de violencia de género. Aplicaciones pedagógicas e investiga-
ción», Sánchez y Lázaro justifican la necesidad de construir un corpus de con-
versaciones reales en la lista de características que debe poseer un intérprete que
se dedique a la modalidad de interpretación en los servicios públicos. Esta lista,
propuesta por Inglis (1984, en Sánchez y Lázaro, p. 186), recoge a su vez los
requisitos específicos que esta modalidad exige a los intérpretes. Sánchez y
Lázaro refieren las cifras de la violencia de género en España, así como los
instrumentos legislativos e institucionales dedicados a paliarla. Asimismo, alu-
den a la visibilidad de la traducción y la interpretación como derecho en la pro-
puesta de directiva COM (2011)/275 y como necesidad de formación en los
planes de estudios universitarios (poca repercusión en este caso). Las autoras
subrayan también la menor presencia de la interpretación dentro de los «estu-
dios traductológicos de corpus» con respecto a la traducción, si bien llaman la
atención sobre diferentes y muy diversos ejemplos de aplicación de corpus al
estudio de la interpretación: desde corpus de interpretación simultánea para la
creación de sistemas de interpretación automática (Ryu et al 2003, en Sánchez y
Lázaro, en este volumen) hasta estudios de corte cognitivo (Tagaki et al 2001,
Van Besien 1999, también en Sánchez y Lázaro). Finamente, describen la me-
todología de su proyecto, incidiendo en la primera fase (recopilación del mate-
rial) y los problemas que lleva asociados.
Tras repasar las razones de la escasez de estudios basados en corpus en el área
de la interpretación comunitaria, Santamaría y Fernández deducen que el propio
desconocimiento y falta de regulación de la profesión se refleja en la falta de
consenso terminológico para referirse a este tipo de intérpretes. En su contribu-
ción, que lleva por título «Aplicabilidad del uso de corpus a la docencia en
interpretación. La herramienta UniversalDoctor Project en la formación del
intérprete en el ámbito sanitario», las autoras parten de la idea básica de que
la documentación es una necesidad esencial también para los profesionales que
trabajan en el ámbito sanitario. A continuación, exploran una herramienta pro-
ducto de un corpus que puede servir para la fase de documentación y para que
los alumnos hagan prácticas de esta modalidad de interpretación. Las autoras
hacen interesantes propuestas de mejora de la herramienta, centradas en la nece-
sidad de incorporar elementos que tengan en cuenta condicionantes culturales
de la interacción médico-paciente tales como el «historial cultural» y el «grado
de cooperación» del paciente.
INTRODUCCIÓN 25

4. Otros estudios aplicados


Socorro y Cabrera presentan en «Corpus como base para el desarrollo de
material de aprendizaje» una actividad dentro de una asignatura motivada en
el aprendizaje centrado en competencias, impulsado en el marco del Espacio
Europeo de Educación Superior. Esta actividad constituye una respuesta ade-
cuada a una demanda existente en el entorno social en el que tiene lugar el
aprendizaje (la comunidad autónoma de Canarias y su economía basada en el
sector terciario), dentro del sector alojativo de la industria del turismo: la tra-
ducción de ofertas de alojamientos. En este caso, los alumnos recopilaron un
corpus de ofertas alojativas de establecimientos turísticos de todo tipo publica-
das en línea y redactadas en español, que, en una fase posterior, se explotó co-
mo recurso documental para una actividad de traducción especializada turístico-
comercial. Los autores dedican sus esfuerzos a exponer la metodología de la
actividad y las dificultades propias de la elaboración de un glosario de estas
características (presencia de tecnicismos, dialectalismos, culturemas y présta-
mos).
El trabajo de Arnáiz, Álvarez y Corell considera también la recopilación de un
corpus ad hoc, si bien esta vez la finalidad del mismo no es la documentación
en el marco de la enseñanza de la traducción, sino en un contexto de traducción
profesional. En «Corpus de textos audiovisuales frente a corpus de textos
escritos. La traducción de micropíldoras de aprendizaje», los autores sope-
san los parámetros que han de gobernar la construcción de un corpus para tra-
ducir ejemplos de un género audiovisual de muy reciente aparición como es la
micropíldora de aprendizaje. El trabajo además contiene interesante informa-
ción de fondo sobre el contexto en el que nace este género audiovisual y una
caracterización del mismo.
En «Los equivalentes de la informática en los diccionarios generales bilin-
gües: ¿Utopía o realidad?», Teresa Ortego y Purificación Fernández Nistal
utilizan dos corpus generales del español (CREA y Corpus del Español) y dos
corpus especializado (corpus Open Office dentro del sistema OPUS y Corpus
Tècnic del Institut Universitari de Lingüística Aplicada) como corpus de refe-
rencia para investigar si los equivalentes propuestos en dos de los diccionarios
generales bilingües de uso más generalizado en el par de lenguas inglés-español
se ajustan a la realidad de uso reflejada en los corpus mencionados. En nuestra
opinión, de este estudio pueden sacarse además otro tipo de conclusiones acerca
de los propios corpus: Desde otra perspectiva, la metodología empleada por las
autoras sirve también para evaluar los recursos. En este sentido resulta particu-
larmente interesante el caso del corpus OpenOffice de OPUS: Al no poder do-
cumentar las autoras en él términos del dominio de la informática que pueden
considerarse «clásicos». El esmero con el que las autoras detallan la metodolo-
gía aplicada en este pequeño estudio permite su replicabilidad en otros contex-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


26 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

tos, más aún si se tiene en cuenta que el estudio se ha llevado a cabo con recur-
sos disponibles en línea.
Si bien hemos alojado el trabajo Karin Vilar en el bloque de estudios aplicados,
lo cierto es que lo interpretamos en primer término como una muestra de la
relación entre los estudios traductológicos y los estudios contrastivos a través de
los corpus. El trabajo «Análisis cualitativo de textos con un programa CA-
QDAS» 3 tiene como objetivo estudiar las microfunciones del género textual
reseña y sus realizaciones lingüísticas en alemán y en español. La autora busca
explicar unas expectativas lectoras «traicionadas» en el caso de un lector espa-
ñol de una reseña escrita por un autor alemán. Vilar somete los datos –dos con-
juntos representativos de reseñas académicas, uno de reseñas escritas en alemán
y otro de reseñas escritas en español– a un análisis cualitativo para la identifica-
ción de microfunciones. A continuación, la autora compara la representatividad
de cada microfunción, así como la variedad y frecuencia de las microfunciones
y los recursos lingüísticos asociados a las mismas. El estudio pone de manifies-
to que la crítica negativa es un elemento representativo en la reseña alemana,
pero no en la española. Vilar también demuestra que, si bien las microfunciones
son las mismas en las reseñas de ambos idiomas, el español prefiere ciertas de
ellas (p. ej. por la microfunción «algo no es como debe ser»). Además, en los
textos alemanes la distribución de las microfunciones parece ser más homogé-
nea. Finalmente, resultan también muy interesantes las reflexiones de la autora
acerca de la dificultad de mantener una objetividad total en el análisis.
Incluimos el estudio de Medina y Ramírez, «Metodología para evaluar la
localización web en España. Primeros resultados aplicados a un corpus de
sitios web de pymes agroalimentarias andaluzas», bajo el epígrafe «estudios
aplicados» por su orientación a la evaluación de la calidad en localización. En
este estudio las autoras presentan resultados parciales de un trabajo más amplio
que comprende la recopilación de un corpus compuesto por los sitios web de las
pymes andaluzas del sector agroalimentario para, tras la aplicación de un mode-
lo de auditoría, estudiar las características de la localización de las mismas y
hacer propuestas de mejora. Este estudio pone de manifiesto la interdisciplina-
riedad a la que están llamados los estudios de traducción e interpretación, parti-
cularmente en este caso la manera en la que los estudios traductológicos basa-
dos en corpus y los estudios de mercadotecnia pueden nutrirse mutuamente.

5. Creación de recursos
En prácticamente todos los comentarios a los trabajos a los que nos hemos refe-
rido hasta ahora hemos aludido a los recursos que se han creado específicamen-
te para llevar a cabo los diferentes estudios, ya se tratara de grandes proyectos o
recursos ad-hoc. Queremos ahora, no obstante, detenernos mínimamente sobre
INTRODUCCIÓN 27

algunos trabajos que se centran específicamente en la creación de un recurso de


uso general y disponible en línea.
En la contextualización de su trabajo, Araújo y Correia presentan el proyecto
PerFide, que acoge a Per-Fide/EPIC (en el que luego las autoras hacen sus aná-
lisis concretos). Destacan por su claridad y su utilidad los detalles en torno a
este gran proyecto de compilación que viene en ayuda de la investigación con
corpus de la lengua portuguesa, para la que no existen demasiados recursos de
este tipo. Per-Fide es un corpus multilingüe (PT / ES / RU / IT / FR / EN / DE),
descargable y gratuito. Este corpus incluye textos de lo que las autoras denomi-
nan «áreas de conocimiento» de la literatura, la religión, lo jurídico-
administrativo, la técnica, y el periodismo, permite búsquedas bilingües simul-
táneas e integra la posibilidad de búsqueda en diccionarios probabilísticos de
traducción. En la segunda parte de su trabajo, Araújo y Correia pasan a describir
el subcorpus Per-Fide/EPIC, un corpus multimodal de interpretaciones simultá-
neas entre el portugués europeo y el inglés británico de discursos pronunciados
en el Parlamento Europeo. En este corpus, las transcripciones de las interpreta-
ciones están alineadas con los discursos originales, y ambos elementos están
sincronizados con los vídeos que contienen las grabaciones de los discursos
interpretados. Las autoras se refieren a los problemas que planteó el diseño de
Per-Fide/EPIC, principalmente la imposibilidad de incluir metadatos relevantes
sobre los intérpretes, carácter en gran medida ficticio de la oralidad. Además,
describen brevemente pero de manera comprehensiva el proceso de compila-
ción. Estos últimos detalles resultan, a nuestro juicio, muy interesantes, puesto
que el proceso se torna bastante transparente para el lector y puede, por lo tanto,
servir de estímulo para la creación de otros recursos de naturaleza similar.
Bilbao y Makazaga, en el capítulo «EHUskaratuak: un corpus de traduccio-
nes académicas en una lengua minoritaria», presentan el corpus EHUskara-
tuak en su contexto histórico e institucional y los objetivos de los desarrollado-
res del proyecto. En primer lugar los autores detallan la naturaleza del recurso:
Este se nutre de las traducciones del servicio de traducción del servicio de Eus-
kera de la Universidad del País Vasco/EHU en las que se trabaja de forma cola-
borativa. Se trata de traducciones de manuales universitarios, prosa de divulga-
ción científica y leyes. El corpus se completa con una base de datos terminoló-
gica que se publicará en 2014 (Gaika) y un servicio de consultas sobre la lengua
vasca (Ehulku). A continuación, Bilbao y Makazaga presentan los otros corpus
existentes de la lengua vasca y los describen con arreglo a una serie de paráme-
tros: su foco de creación, su carácter actual o histórico, la configuración lingüís-
tica, su carácter general o especializado, si contienen textos traducidos o no y si
están o no lematizados. Por último, los autores describen EHUskaratuak con
más detalle (es bilingüe paralelo y no tanto multilingüe) y ejemplifican algunos
tipos de búsqueda. Como conclusión, Bilbao y Makazaga señalan que el objeti-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


28 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

vo de los creadores de EHUskaratuak es seguir creciendo hasta incluir todas las


traducciones académicas coordinadas por el servicio de euskera de la EHU
(2007-2015) y subrayan que este corpus cumple los requisitos que exigen los
investigadores y los traductores, que son los principales grupos de usuarios del
mismo.

6. Evaluación y clasificación de corpus


Si bien el trabajo de Bilbao y Makazaga, con su metodología para la clasifica-
ción de corpus, podría igualmente incluirse dentro de este apartado. No obstan-
te, ya hicimos referencia al mismo en el apartado «Creación de recursos», por lo
que nos centraremos en este punto final en las aportaciones de Goretti Faya y de
Teresa Tomaszkiewicz.
En «Propuesta de clasificación de corpus», Faya recopila la más variada ter-
minología utilizada para etiquetar corpus y organiza los conceptos subyacentes
en una nueva clasificación en forma de árbol, de carácter integrador y amplia-
ble. Esta propuesta de clasificación resulta útil para describir en profundidad el
tipo de corpus que se está utilizando en un nivel determinado, con la ventaja de
que los conceptos utilizados son rastreables en la bibliografía relevante y gozan
de mucha aceptación en la bibliografía especializada.
Por su parte, Tomaszkiewicz hace en «Les corpus dans le cadre de la maîtrise
en traduction» un breve repaso a la noción de corpus, para concluir que el con-
cepto de corpus no es unitario, puesto que se utiliza de manera diferente según
las disciplinas (p. 361). Los corpus en traductología son datos en contexto que
pueden lanzar preguntas interesantes para más de una disciplina, ya que la tra-
ductología está llamada a la interdisciplinariedad, aunque luego la investigación
de los fenómenos se haga con herramientas lingüísticas o literarias (v. pág.
369). Resulta muy interesante sus reflexiones acerca de las diferentes maneras
de utilizar los corpus por parte de un lingüista y de un traductólogo (pág. 360),
así como sobre la falsa idea de que la noción de corpus es algo nuevo, propio de
la investigación contemporánea: La autora achaca esta impresión errónea al
hecho de que se confunden los medios tecnológicos disponibles para compilar y
analizar los corpus con la idea teórica de corpus en sí (pág. 360). En un breve
ejercicio de historiografía, Tomaszkiewicz explica cómo antes de 1990 en Polo-
nia se investigaba en los TFMs de traductología aquellos aspectos que permitían
los corpus disponibles (muy restringidos, como detalla la autora), pues la com-
pilación de corpus con los medios disponibles y las condiciones políticas
reinantes por entonces era sumamente difícil. Por último, pasa revista a los tipos
de corpus que se han utilizado para los TFM del máster de la Universidad Adam
Mickiewicz de Poznań.
INTRODUCCIÓN 29

7. Bibliografía
Ahmad, Khurshid. 2008. Being in Text and Text in Being: Notes on Representative
Texts. @ G. Anderman y M. Rogers, eds. Incorporating Corpora. The linguist
and the translator. Toronto: Multilingual Matters. ISBN 9781853599859, pp.
60-94.
Borja Albi, Anabel. 2008. Corpora for Translators in Spain. The CDJ-GITRAD Corpus
and the GENTT Project. @ G. Anderman, y M. Rogers, eds. Incorporating
Corpora. The linguist and the translator. Toronto: Multilingual Matters. ISBN
9781853599859, pp. 253-265.
Eskola, Sari. 2004. Untypical frequencies in translated language. A corpus-based study
on a literary corpus of translated and non-translated Finnish. @ A. Mauranen y
P. Kujamäki, eds. Translation universals: Do they exist? Amsterdam: John
Benjamins. ISBN 9789027216540, pp. 83-99.
Even-Zohar, Itamar. 1990. Polisystem Studies. @ Poetics Today 11 / 1.
Laviosa, Sara. 2014. Corpora and Holistic Cultural Translation. @ M.T. Sánchez Nieto,
ed. Corpus-based Translation and Interpreting Studies: From description to
application / Estudios traductológicos basados en corpus: De la descripción a
la aplicación. Berlín: Frank & Timme Verlag für wissenschaftliche Literatur.
ISBN 9783732900848.
Marco, J. 2014, Taking stock: A critical overview of research on (universal) features of
translated language. @ Sánchez Nieto, M.T., ed. Corpus-based Translation
and Interpreting Studies: From description to application / Estudios traducto-
lógicos basados en corpus: De la descripción a la aplicación. Berlín: Frank &
Timme, Verlag für wissenschaftliche Literatur. ISBN 9783732900848.
Marco, Josep. y van Lawick, Heike. 2009. Using corpora and retrieval software as a
source of materials for the translation classroom. @ A. Beeby, P. Rodríguez-
Inés y P. Sánchez-Gijón, eds. Corpus Use and Translating: Corpus Use for
Learning to Translate and Learning Corpus Use to Translate. Ámsterdam:
John Benjamins. ISBN 9789027224262, pp. 9-28.
Martínez Vilinsky, Barbara. 2012, On the lower frequency of occurrence of Spanish
verbal periphrases in translated texts as evidence for the unique items hypothe-
sis. @ Across Languages and Cultures 13 / 2: 197-210.
Olohan, Maeve. 2002. Corpus Linguistics and Translation Studies: Interaction and Re-
action. @ Linguistica Antverpiensia 1: 419-429.
Saldanha, Gabriela. 2009. Principles of corpus linguistics and their application to trans-
lation studies research. @ Tradumàtica 7. Disponible en
<http://www.raco.cat/index.php/Tradumatica
/article/view/154828/206722>. Consultado el 20/9/2014.
Shlesinger, Miriam. 1998. Corpus-based Interpreting Studies as an Offshoot of Corpus-
based Translation Studies. @ Meta 43 / 4: 486-493.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


30 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

Smith, Nicolas, Sebastian Hoffmann y Paul Rayson. 2008. Corpus Tools and Methods,
Today and Tomorrow: Incorporating Linguists’ Manual Annotations. @ Liter-
ary and Linguistic Computing 23 / 2: 163-180.
Straniero Sergio, Francesco y Caterina Falbo, eds. 2012. Breaking Ground in Corpus-
based Interpreting Studies, Peter Lang, Berna, etc.
Sutter, Gert, Patrick Goethals, Thorsten Leuschner & Sonja Vandepitte. 2012. Towards
methodologically more rigorous corpus-based translation studies. @ Across
Languages and Cultures 13 / 2: 137-143.
Tirkkonen-Condit, Sonja. 2004. Unique items–over-or under-represented in translated
language? @ A. Mauranen y P. Kujamäki, eds. Translation universals: Do they
exist? Amsterdam: John Benjamins. ISBN 9789027216540, pp. 177-184.
Tognini-Bonelli, Elena. 2001. Corpus Linguistics at Work. Ámsterdam: John Benja-
mins. ISBN 9789027222763.
Zanettin, Federico. 2012. Translation-Driven Corpora: Corpus Resources for Descrip-
tive and Applied Translation Studies. Manchester: St. Jerome. ISBN:
9781905763290.

1
https://sites.google.com/site/federicozanettinnet/cl-htm#TOC-Translation-driven-Bilingual-and-
Multilingual-Corpora. Fecha de consulta: 16/09/2014.
2
http://www.lancaster.ac.uk/fass/projects/corpus/cbls/corpora.asp. Fecha de consulta: 16/09/2014.
3
CAQDAS: Computer Assisted Qualitative Data Analysis Software.
Testimonies of the evolution of corpus-based Trans-
lation Studies in the last decade (2003-2013)

1. A kaleidoscopic reality
The tenor, somehow kaleidoscopic, of the present volume is a good indicator of
the evolution of corpus-based Translation Studies in their second decade of
existence (2003-2013). Laviosa (2014) refers to this decade as a period in which
the Descriptive approach to this discipline has been marked by the persistent
interest in translation universals and by research on the features of translational
language – in this case, paying special attention to the study of translators’
(mainly literary translators) style and performance –, as well as by the consoli-
dation of the relation between corpus-based Translation and Interpreting Studies
and Contrastive Linguistics. Within the Applied branch of the discipline,
Laviosa remarks on the contribution of corpora in this decade to “a culture of
research in education” (Laviosa 2014), the compilation of many – and new –
corpora, the emergence of the first corpora in Interpreting, together with their
related research initiatives and, finally, the use of corpora as a tool for quality
assessment and for developing computer-assisted translation tools.
Another element that has characterized the final part of this second decade de-
scribed by Laviosa (2014) is the emergence of critical voices that stress the need
for greater methodological transparency in corpus-based research in general,
and in translation universals in particular. An example of this stand is presented
in Sutter et al. (2012), in their introduction to number 13, in Across Languages
and Cultures. Marco (2014), for his part, provides an excellent analysis of these
critical voices and outlines possible tendencies for future research on corpus-
based Translation Studies, taking into account the useful reflections that these
critical voices provide.
The aim of the first part of the present Introduction is to show how the different
papers collected in this volume fit into Laviosa’s (2014) representation of cor-
pus-based Translation Studies, which has consolidated itself over the last dec-
ade. A brief overview of the contributions, which are described and commented
in further detail in sections 2 to 6, is provided below.
(i) As part of the descriptive branch of corpus-based Translation Studies, the
present volume compiles a number of works that address indicators for research
on translated language (Ruiz and Motoki, Etxeberria), studies on the style of
literary translators (Novodvorski, Humblé) and contributions that analyze trans-
lators’ practices (Tonin and Castillo, Chretariu-Braescu). As for the Applied
branch, it should be noted that three out of the four papers in this volume that
provide didactic proposals have emerged from Interpreting Studies (Sánchez
Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
32 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

and Lázaro, Santamaría and Fernández, Araújo and Correia), while Trujillo and
Cabrera’s contribution is the only one that focuses on the didactics of transla-
tion (tourism and commercial translation in this case). Also within the Applied
branch, special attention is given to the incorporation of corpora in (me-
ta)lexicography, focusing on the assessment of general bilingual dictionaries
(Ortego and Fernández).
(ii) Most of the papers included share a common interest in providing methodo-
logical data. In fact, Novodvorski’s work includes a step-by-step description of
the methodology adopted for his doctoral dissertation. In this vein, we can also
find the works of Vilar, Ortego and Fernández, Ruiz and Motoki, Sánchez and
Lázaro, Humblé or Tonin and Castillo – the latter with a corpus-driven method-
ology applied to the history of Translation. Among the methodological aspects,
Novodvorski’s contribution is a clear example of how the linguist-translation
scholar develops their own tagging system according to their research interest.
Furthermore, within this “kaleidoscopic reality” we want to highlight the coex-
istence of qualitative and quantitative approaches to research with corpora:
Humblé’s contribution illustrates how certain quantitative analyses (namely, the
type/token relation) can give clues about future qualitative research lines. Vilar,
for her part, adopts a qualitative methodology and shows how qualitative analy-
sis, adopting CAQDAS tools, becomes an alternative to tagging concordances
(or in-corpus annotation according to Smith et al., 2008) in the case of small
corpora. Finally, Tonin and Castillo show how corpora (a collection of synoptic
editions in this case) are but one of the elements subject to qualitative analysis,
while paratexts of the editions are also analyzed. The combined analysis of par-
atexts and the corpus helps to explain the causes and effects behind different
features of translations. Tonin and Castillo’s contribution proves that the com-
bination of qualitative and quantitative methodologies proposed by Olohan
(2002) has yielded results in the last decade.
(iii) Regarding resources creation/set-up, and in accordance with Laviosa’s
analysis (2014), this volume includes a number of papers focused on the compi-
lation of corpora, and either describe the resources used or report on the set-up
processes or the overall purposes behind their compilation. In some cases, the
technical information provided by the authors on how they compiled their cor-
pora is very inspiring and can be replicated in other research contexts (Araújo,
Novodvorski). The nature of the material considered along these lines ranges
from specialized ad hoc corpora (Arnáiz et al.), to broad, open-access corpora
(Bilbao and Makazaga, Tonin and Castillo, Araújo and Correia), corpora cur-
rently being analyzed (Medina and Ramírez) or corpora still being compiled
(Sánchez and Lázaro). Among the examples of compiled corpora, or corpora in
the process of being compiled, there are two specific corpora on interpreting
(Sánchez and Lázaro, Araújo and Correia).
INTRODUCTION 33

(iv) Interpreting Corpora: Three of the contributions included in this volume


deal with interpreting corpora. One of the papers focuses on conference inter-
preting (Araújo and Correia), while the other two pieces of work concentrate on
public service interpreting (Lázaro and Sánchez, Santamaría and Fernández).
The application of corpora to Interpreting Studies was first addressed by Shle-
singer in her 1998 article and is now gaining momentum, as Straniero and Fal-
bo's 2012 book shows. Lázaro and Sánchez's and Satamaría and Fernández's
contributions represent an important innovation, as they shed light on a type of
interpreting that has never been researched with the aid of corpora before. It is
worth highlighting the interesting contribution made by Santamaría and Fernán-
dez, who comment on an IT linguistic resource which, while not a corpus in a
strict sense, is based on a corpus made up of examples and can be applied to the
didactics of interpreting for public services in the medical field.
(v) In her review of the last decade of corpus-based Translation Studies,
Laviosa pointed to surveys of existing corpora and websites with lists of corpus
resources, such as those by Federico Zannetin 1 or Xiao 2. However, in our view
this period has also seen the emergence of a line of reflection and enquiry about
the corpus resources themselves, exemplified in the work of Ahmad (2008),
Borja (2008), or Zanettin (2012), to name but a few. This reflective work is
most probably a consequence of the proliferation of many and very different
corpora – a proliferation that, in turn, has been facilitated by the technical de-
velopments that facilitate the setting up, storing, analyzing and exploiting of
corpora. These reflections seem to focus on two different aspects: the classifica-
tion of corpora on the one hand, and their evaluation on the other. We can find
this tendency to classify and evaluate corpora resources in other sister disci-
plines: Such is the case of Rojo (2010) or Briz and Albelda (2009) within Cor-
pus Linguistics applied to Hispanic Studies. In this volume, the chapters by
Faya, Tomaszkiewicz and Bilbao and Makazaga could be categorized within
this line of investigation.
(vi) Lastly, this volume includes some work on the role of corpora at the inter-
face between Translation Studies and other disciplines. Medina and Ramírez
have set up a corpus of localized websites, whose analysis might point to con-
clusions which could be most useful for other disciplines, such as e-commerce
and marketing. As for Tomaszkiewicz, she includes interesting reflections on
the possibility – and even necessity – of analyzing the same corpus with con-
ceptual tools used in Translation Studies, but also in other different disciplines
at the same time.
Before moving on to introduce the content of this volume in detail, we would
like to briefly draw attention to the label “corpus-based Translation and Inter-
preting studies” (see Sánchez and Lázaro in this volume). Readers who are fa-
miliar with research in this discipline will probably agree that the label “corpus-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


34 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

based Translation Studies” is widely accepted. Having said that, and keeping in
mind the growing body of research on interpreting drawing on corpora – a line
of investigation represented here by three chapters –, we consider that the label
proposed by Sánchez and Lázaro gives a more complete picture of the research
panorama in the discipline.

2. The characterization of translated language


The chapter by Daniel Ruiz and Chie Motoki, entitled “The uniqueness of
Japanese onomatopoeias in translation and non-translation”, testifies to the
productive debate around the Unique Items Hypothesis (UIH). This hypothesis
was initially put forward in corpus-based Translation Studies focusing on the
English/Finnish language pair (Tirkkonen-Condit, 2004). Further evidence for
the UIH was gathered in a translator training context in the same language pair
(Eskola, 2004) and, later, in the English/Spanish language pair (Martínez Vilin-
sky, 2012). Chie and Motoki are now breaking quite new ground: the study of
translated Japanese on the basis of Spanish originals, using onomatopoeia as an
indicator. The authors explain in detail the significant challenges that arise when
working with comparable corpora of the Japanese language in general, and with
the use of lexical units, such as Japanese onomatopoeia in particular. The work
they present is intended as an initial preliminary study. The first conclusions
lead the authors to put forward the tentative explanation of a lack of semantic
stimulus, a different concept from the already wellknown “lack of lexical stimu-
lus”. Ruiz and Motoki point to the lack of semantic stimulus in the Spanish
originals as an explanation for the lower frequency of onomatopoeias in those
Japanese texts translated from Spanish. Regardless of its exploratory character,
this chapter deserves attention due to the original explanations proposed for the
phenomenon under examination.
Similarly to Ruiz and Motoki, Etxeberria deals with the description of translated
language, this time particularly of translated Basque, in the chapter entitled
“Corduroy and velvet in translated and non-translated Basque literature.
Linguistic and stylistic aspects resulting from the comparison of two corpo-
ra”. This work draws on Even-Zohar’s (1990) Polysystem Theory, with the
actual research being performed on a monolingual comparable corpus of the
Basque language named Ereduzko Prosa Gaur, which consists of translated and
original Basque literary prose (see p. 66 for a detailed description of the cor-
pus). Etxeberria aims at characterizing the translated language of a literary sys-
tem that she describes as “young, peripheral and weak”. Translated texts play,
thus, a crucial role in this system, “accounting nowadays for 30 to 35% of the
Basque editorial output” (p. 64. our translation).To that end, Etxeberria devel-
ops a fine-tuned, original methodology that, in addition, is carefully explained
to the reader. Her methodology comprises (i) isolating four groups of indicators
INTRODUCTION 35

to analyze four factors: lexical diversity, semantic precision, some unique items
of Basque and some loan vs. originally Basque word couples; (ii) investigating
the frequencies of the former indicators in the subcorpora of translated and not-
translated literary prose, and (iii) analyzing and discussing the results. In our
view, this methodology is of a mixed nature: it is corpus-driven as she observes
the data and comes to her conclusions inductively. On the other hand, on a
higher level, Etxebarria’s methodology could be considered corpus-based, as
she aims at testing the hypothesis formulated following the main concepts of
Polysystem Theory (for the corpus-based vs. corpus-driven opposition, see
Tognini Bonelli (2001:17), Marco and Van Lawick (2009) or Saldanha (2009),
among others). Etxebarria finds that translated Basque literary prose conforms
more closely to the norm than original Basque literary prose. Furthermore, she
points to a “clearer tendency towards precision, detail and semantic nuance” in
translated Basque (p. 88, our translation), as well as to other interesting findings
relating to the original texts.
Several papers discuss issues related to the study of translator style and the be-
havior of literary translators on the basis of corpora of varying natures and/or
corpus linguistics techniques. Philippe Humblé, in his inspiring study entitled
“The translator and the immigrant. Three translations of Emine Sevgi
Özdamar’s Life is a Caravasar”, applies these techniques to the research of
novels written by immigrants. In these novels, that which has generally been
designed as “accent” is part of the author’s identity, and, as such, can be em-
ployed as a stylistic trait by the latter. Humblé puts the type/token ratio into use
in order to study how the author’s “accent” has been translated. He shows how
his quantitative analysis opens up lines of enquiry for further qualitative re-
search. Having some initial objective data established as a result of these first
quantitative analyses, Humblé can move on to formulate further hypotheses,
thus giving momentum to the research spiral.
Andreea-Anca Braescu-Chretariu works from quite a different, qualitative
methodological perspective: using a sample corpus, she examines several trans-
lations of the same literary work in order to describe the behavior of the differ-
ent translators and also to evaluate the quality of the translations. In “Idioms in
Le rouge et le noir Romanian translations”, Braescu-Chretariu shows how
idioms are translated by the five different translators that have approached the
translation of Sthendal’s Le rouge et le noir during the 20th century. The author
comes to the conclusion that the sometimes exaggerated distribution of idioms
in some of the translations runs the risk of bringing the source text too close to
the target culture. She also detects difficulties when translators handle the ellip-
sis, a typical feature of Sthendal’s literary style.
The main focus of the paper by Ariel Novodvorski, “Corpus-Based Transla-
tion Studies. Methodological aspects for analysis of style”, is not so much on

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


36 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

research results but on research methods. The author is concerned with the
“need to define a theoretical and methodological framework for the study of the
stylistic profiles of translation” (p. 118, our translation). His proposal consists
precisely of a step-by-step account of the methodology that he used for his doc-
toral research. The parameters adopted by Novodvorski include the use of punc-
tuation and italics, paratexts, keyness and the linguistic devices related to re-
ported speech. Novodvorski also details the techniques and procedures em-
ployed (setting up the corpora, tagging them, etc.), which are listed on page119.
He built a parallel corpus consisting of three literary works by the Argentinean
writer Ernesto Sábato and their translations into Brazilian Portuguese. What is
most striking in this paper is the alignment of the procedures and tools with the
research objectives, as well as the development of a special tagging system,
which proves to be essential for the analysis of the “reported speech”, “punctua-
tion” and “italics” variables.
The contribution made by Castillo and Tonin, “Corpora for the History of
Translation: Officina Barezzi and the synoptic edition of Beccaria's On
Crimes and Punishments translations into Spanish” will be of interest to
researchers of the History of Translation, and especially to researchers of "the
history of Cultural Mediation between Italy and Spain" (p. 140) wishing to ana-
lyze examples of how to combine corpus-driven methodology with tools and
techniques normally used in the History of Translation, such as the study of
paratexts. Officina Barezzi is a website which hosts parallel corpora, specifical-
ly the "synoptic digital edition of earliest translations of significant works for
both Spanish and Italian cultures". It is an ambitious project, as well as an ex-
ample of the creation of new and free resources, in an electronic format and
freely accessible, in line with the true spirit of digital humanities. This paper
includes interesting considerations on important methodological decisions, such
as the selection of the original texts for the synoptic editions. But one of the
most important points of this paper is certainly how the authors specify and give
examples of the two approaches to the comparative study of translation methods
from the material existing in Officina Barezzi: (1) from paratext to corpus (de-
ductive method), drawing conclusions from the reading of the paratexts and
searching for examples that confirm such conclusions, or (2) from corpus to
paratext (inductive method), comparing translations in order to infer the method
used by each translator and confirming the hypothesis in the paratexts.

3. Interpreting Studies and the Applied branch of corpus-based


Translation and Interpreting Studies
In “Corpora and Interpreter Training: an exploratory study”, Araújo and
Correia introduce Per-Fide/EPIC, a multimedia corpus of bilingual and bilateral
interpreting (EN-en /PT-pt) as an extension of the Per-Fide corpus (<http://per-
INTRODUCTION 37

fide.ilch.uminho.pt>), as well as the results of an exploratory analysis which


gives an idea on how to take advantage of the Per-Fide/EPIC corpus for re-
search purposes, but also, and specially for training purposes. The authors main-
tain that complementing the cognitive paradigm with findings from Contrastive
Linguistics would be very appropriate in simultaneous interpreting teaching:
using examples from the Per-Fide/EPIC corpus, they establish especially prob-
lematic fields in simultaneous interpreting in general, and between Portuguese
and English, in particular, that could be focused on in simultaneous interpreting
lessons (such as anaphoric relations, tense/aspect/mode, interphrastic cohesion,
semantic role of arguments). Using these contrastive analyses of the interpreter's
production, the student could "develop metalinguistic awareness" (p. ¡Error!
Marcador no definido., our ttranslation), as well as "identify peculiarities of
languages" (p. ¡Error! Marcador no definido., our translation). The value of
the interpreting testimonies included in this corpus, all of which are real and
multimodal, lies not only in the fact that they are real pieces of data, but in their
availability to be researched by the student as part of autonomous work.
This volume contains two papers on public service interpreting, also known as
community interpreting. It is remarkable that both papers include a short discus-
sion about (the lack of) a definition of and the best way of labelling this type of
interpreting, although each paper is based on different resources, which makes it
even more interesting to read both of them alongside one another. More specifi-
cally, Santamaría and Fernández state that labelling this type of interpreting as
"public service interpreting" excludes this type of interpreting from contexts in
which it is carried out in private organizations, such as in NGOs.
After revising the reasons for the dearth of corpus-based community interpret-
ing studies, Santamaría and Fernández infer that the lack of knowledge and
regulation of the profession is reflected in the lack of an agreement about which
terminology to use to refer to this kind of interpreters. In their paper “Applica-
bility Of Corpus-Based Interpreting Studies To Academic Training. The
Use of Universal Doctor Project In The Academic Training Of Community
Interpreters”, the authors start from the premise that documentation is also
essential for professionals working in the healthcare field. Then, they analyze a
tool based on a corpus. They propose to use this tool in the documentation
stage, as well as for the students when receiving training in this kind of inter-
preting. The authors make interesting proposals to improve the tool, focusing on
the need to include some characteristics related to cultural aspects existing with-
in the interaction between doctor and patient, such as the patient’s “cultural
background” and the patient’s “level of cooperation”.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


38 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

4. Other applied research


In “Building a Virtual Corpus-Based Bilingual Accommodation Glossary”,
Socorro and Cabrera present an activity within a subject using a competency-
based learning approach in the European Higher Education Area framework.
This activity ensures an adequate response to meet an existing demand in the
social environment in which learning takes place (the autonomous community
of the Canaries, Spain, whose economy is based on the service sector) and, spe-
cifically, in tourist accommodation: the translation of accommodation offers. In
this case, students compiled a corpus of online Spanish accommodation offers
found in any type of tourist establishment. At a later stage, the corpus was used
as a documentary resource in an activity about specialised tourism and commer-
cial translation. Authors devote themselves to describing the methodology used
in the activity and the difficulties that arise from drawing up their glossary
(presence of technical terms, dialect words, culturemes and loan words).
The research conducted by Arnáiz, Álvarez and Corell also includes the compi-
lation of an ad hoc corpus. On this occasion the purpose is not documentation in
the framework of translation training, but in professional translation. In “Audi-
ovisual Corpora vs. Written Corpora. Translating Knowledge Pills”, au-
thors reflect on the parameters which should prevail when compiling a corpus to
translate examples from a very recent audiovisual genre, that is, knowledge
pills. Moreover, the study also includes interesting data about the background in
which the audiovisual genre was born and a detailed description of it.
In “Computing equivalents in general bilingual dictionaries: A Reality or a
Utopia?”, Mª Teresa Ortego Antón and Purificación Fernández Nistal use two
general Spanish corpora (CREA and Corpus del Español) and two specialised
corpora (Open Office corpus in the OPUS system and Corpus Tècnic, from the
Institut Universitari de Linguistica Aplicada, Universitat Pompeu Fabra, Spain)
as reference corpora to confirm whether the use of equivalents gathered in two
of the most widely used general bilingual dictionaries is reflected in the afore-
mentioned corpora. In our opinion, from another approach, the methodology
used by the authors could also be used to assess the resources. In this sense, the
case of the OpenOffice corpus (OPUS) is particularly interesting, since re-
searchers could not find evidence of some computing terms which could be
considered to be “classical ones”. The careful description of the methodology
applied in this study allows it to be developed in other contexts, especially if
one takes into account the fact that the research was carried out using only
online resources.
Although the study led by Karin Vilar has been placed in the section on applied
research, the truth is that we understand it to be a testimony of how corpus-
based Contrastive Studies can inform or complement Translation Studies. The
INTRODUCTION 39

paper entitled “Qualitative Text Analysis with a CAQDAS 3” aims to study


the micro-functions of a particular text genre, scholar reviews, and its linguistic
realization in German and in Spanish. The author wants to explain the “be-
trayed” reading expectations when a Spaniard once read a review written by a
German speaker. Vilar qualitatively analyses data (two representative sets of
scholar reviews, one of them written in German and the other in Spanish) in
order to identify the most frequent micro-functions. Then, she compares how
representative each micro-function is, the variety and the frequency of each
micro-function and which linguistic devices are associated with them. The study
reveals that negative criticism is a representative of German reviews but not of
Spanish ones. Vilar also proves that, although micro-functions are the same in
reviews written in German or in Spanish, the use of some of them are preferred
in Spanish language (i.e. the micro-function “algo no es como debe ser”). In
addition, in the German texts the distribution of micro-functions seems to be
more homogenous. Finally, conclusions about the difficulty of being completely
objective in the analysis are extremely interesting.
For the purpose of this introduction, we have included the research of Medina
and Ramírez, “A methodology for evaluating web localization in Spain: ini-
tial results from a corpus of websites for Andalusian agri-food SMEs”, un-
der the label "applied research", as it focuses on the evaluation of quality in
localization. In their research, the authors present some partial results of a wider
study which includes (i) the compilation of a corpus of websites from the Anda-
lusian SMEs in the agri-food industry, (ii) the implementation of an audit mod-
el, and (iii) the analysis of the localized product, with the aim of making some
suggestions for improvement. The research highlights the importance of inter-
disciplinarity in Translation and Interpreting studies, and more particularly, the
way corpus-based Translation Studies and marketing studies can mutually bene-
fit from each other.

5. Resource creation / set-up


In practically all the notes to the chapters we have discussed so far, we have
referred to the resources that have been specifically created to carry out the
respective studies, be they large compilation projects or ad-hoc corpora. How-
ever, we will now take a further look at some chapters that focus specifically on
the creation of online, generally available resources.
In the contextualization of their paper, Araújo and Correia present the PerFide
project, which includes the Per-Fide/EPIC subcorpus, on which the authors
then carry out their specific analyses. The authors provide the reader with clear
and useful information about this important compilation project that supports
corpus-based studies of the Portuguese language, for which not many resources

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


40 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

of this kind have existed until now. Per-Fide is a multilingual and free down-
loadable corpus (PT / ES / RU / IT / FR / EN / DE). This corpus comprises texts
from different “knowledge areas” (literature, religion, legal-administrative,
technical, journalism). Simultaneous bilingual searches are allowed, and it is
also possible to search in probabilistic translation dictionaries. In the second
part of their chapter, Araújo and Correia move on to describe the Per-
Fide/EPIC subcorpus, a multimodal corpus of simultaneous interpretations be-
tween European Portuguese and British English of speeches delivered at the
European Parliament. In this corpus, the transcriptions of the interpretations are
aligned with the original speeches, both elements are further synchronized with
the videos containing the recordings of the interpreted speeches. The authors
then refer to the problems that they have encountered when designing Per-
FIDE/EPIC. The greatest obstacle was the impossibility of including relevant
metadata about the interpreters and, secondly, the largely fictive character of the
orality in this kind of speech. In addition, they briefly yet comprehensively de-
scribe the compilation process. The latter details are, in our opinion, very inter-
esting, as they render the compilation process quite transparent for the reader
and can thus serve as a stimulus for those researchers who are/could be involved
in the creation of similar resources.
Bilbao and Makazaga, in their paper “EHUskaratuak: a corpus of academic
translations in a minority language” present the EHUskaratuak corpus from a
historical and institutional perspective and outline the main objectives of their
project. Firstly, the authors of the paper describe the main characteristics of this
resource, which has been constructed from the translations completed by the
Translation Service of the Basque Departmentof the University of the Basque
Country (UPV/EHU). These translations, carried out by applying a specific
collaborative methodology, are made up of translations of academic textbooks,
popular science, prose writings and legislation. The corpus also includes a ter-
minological database which will be published in 2014 (Gaika) and a service of
linguistic queries and advice to promote the correct and appropriate usage of the
Basque language (Ehulku). Secondly, Bilbao and Makazaga present other
Basque-language corpora and describe them according to different parameters:
their institutional authorship, their chronological dimension (present-day lan-
guage corpus vs historical corpus), their linguistic dimension and their level of
specialization (general corpus vs specialized corpus). When defining these cor-
pora, the authors also explain whether they have been lemmatized and whether
they include original and/or translated texts. Finally, the authors of this paper
describe the EHUskaratuak corpus in detail and present some interesting search
possibilities. As a conclusion, Bilbao and Makazaga point out that the main aim
of this corpus is to include all the academic translations coordinated by the
Translation Service of the Basque Departmentof the University of the Basque
INTRODUCTION 41

Country (UPV/EHU) (2007-2015) and emphasize the importance and useful-


ness of this resource not only for researchers but also for translators.

6. Evaluation and classification of corpora


The research by Bilbao and Makazaga could also be included in this section,
because of its methodology for classifying corpora. However, as it has already
been presented in section 5 (Resource creation/set-up), we will now focus solely
on the contributions made by Goretti Faya and Teresa Tomaszkiewicz.
In “Proposal of Textual Corpora Classification”, Faya compiles the most
varied terminology used to categorize corpora, and branch out the underlying
concepts in a new classification based on a hierarchical tree structure. This inte-
grative and forward-looking classification is useful when describing the kind of
corpora that is being used in a particular project in depth, with the advantage
that the concepts used can be traced in the relevant bibliography and are widely
accepted in specialized bibliographies.
In “The Use of Corpora in the Context of MA Seminars in Translation
Studies”, Tomaszkiewicz briefly reviews the concept of corpus and comes to
the conclusion that it is not a unified concept because it is used differently de-
pending on the discipline (p. 361). Corpora in Translation Studies are samples
of data originating in a given context, which can give rise to interesting ques-
tions for more than one discipline, even if the analysis is then carried out using
linguistic or literary conceptual tools. The reflection of the author on the differ-
ent ways in which a linguist and a translator scholar can use corpora is particu-
larly interesting (p. 360), as is her consideration of the false belief that the con-
cept of corpus is something new, issued from the modern-day research. For
Tomaszkiewicz, this false impression can be explained by the fact that the tech-
nological resources that are available nowadays to compile and analyse corpora
are mixed up with the theoretical idea of corpus itself (p. 360). In a brief section
devoted to historiography, Tomaszkiewicz states that in Poland, before 1990,
the topics for master’s thesis research were very limited, as were the corpora,
the reason being that the compilation of corpora with the resources available
and the political context in that period were very difficult. Finally, she analyses
the different kinds of corpora that have been used for master’s theses at Adam
Mickiewicz University in Poznań.

7. References
Ahmad, Khurshid. 2008. Being in Text and Text in Being: Notes on Representative
Texts. @ G. Anderman and M. Rogers, eds. Incorporating Corpora. The lin-
guist and the translator. Toronto: Multilingual Matters. ISBN 9781853599859,
pp. 60-94.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


42 M.T. SÁNCHEZ, S.ÁLVAREZ, V. ARNAIZ, M. T. ORTEGO, L. SANTAMARÍA, R.FERNÁNDEZ

Borja Albi, Anabel. 2008. Corpora for Translators in Spain. The CDJ-GITRAD Corpus
and the GENTT Project. @ G. Anderman and M. Rogers, eds. Incorporating
Corpora. The linguist and the translator. Toronto: Multilingual Matters. ISBN
9781853599859, pp. 253-265.
Eskola, Sari. 2004. Untypical frequencies in translated language. A corpus-based study
on a literary corpus of translated and non-translated Finnish. @ A. Mauranen
and P. Kujamäki, eds. Translation universals: Do they exist? Amsterdam: John
Benjamins. ISBN 9789027216540, pp. 83-99.
Even-Zohar, Itamar. 1990. Polisystem Studies. @ Poetics Today 11 / 1.
Laviosa, Sara. 2014. Corpora and Holistic Cultural Translation. @ M.T. Sánchez Nieto,
ed. Corpus-based Translation and Interpreting Studies: From description to
application / Estudios traductológicos basados en corpus: De la descripción a
la aplicación. Berlín: Frank & Timme Verlag für wissenschaftliche Literatur.
ISBN 9783732900848.
Marco, J. 2014, Taking stock: A critical overview of research on (universal) features of
translated language. @ Sánchez Nieto, M.T., ed. Corpus-based Translation
and Interpreting Studies: From description to application / Estudios traducto-
lógicos basados en corpus: De la descripción a la aplicación. Berlín: Frank &
Timme, Verlag für wissenschaftliche Literatur. ISBN 9783732900848.
Marco, Josep. and van Lawick, Heike. 2009. Using corpora and retrieval software as a
source of materials for the translation classroom. @ A. Beeby, P. Rodríguez-
Inés and P. Sánchez-Gijón, eds. Corpus Use and Translating: Corpus Use for
Learning to Translate and Learning Corpus Use to Translate. Ámsterdam:
John Benjamins. ISBN 9789027224262, pp. 9-28.
Martínez Vilinsky, Barbara. 2012, On the lower frequency of occurrence of Spanish
verbal periphrases in translated texts as evidence for the unique items hypothe-
sis. @ Across Languages and Cultures 13 / 2: 197-210.
Olohan, Maeve. 2002. Corpus Linguistics and Translation Studies: Interaction and Re-
action. @ Linguistica Antverpiensia 1: 419-429.
Saldanha, Gabriela. 2009. Principles of corpus linguistics and their application to trans-
lation studies research. @ Tradumàtica 7. Disponible en
<http://www.raco.cat/index.php/Tradumatica
/article/view/154828/206722>. Consultado el 20/9/2014.
Shlesinger, Miriam. 1998. Corpus-based Interpreting Studies as an Offshoot of Corpus-
based Translation Studies. @ Meta 43 / 4: 486-493.
Smith, Nicolas, Sebastian Hoffmann and Paul Rayson. 2008. Corpus Tools and Meth-
ods, Today and Tomorrow: Incorporating Linguists’ Manual Annotations. @
Literary and Linguistic Computing 23 / 2: 163-180.
Straniero Sergio, Francesco and Caterina Falbo, eds. 2012. Breaking Ground in Corpus-
based Interpreting Studies, Peter Lang, Berna, etc.
INTRODUCTION 43

Sutter, Gert, Patrick Goethals, Thorsten Leuschner & Sonja Vandepitte. 2012. Towards
methodologically more rigorous corpus-based translation studies. @ Across
Languages and Cultures 13 / 2: 137-143.
Tirkkonen-Condit, Sonja. 2004. Unique items–over-or under-represented in translated
language? @ A. Mauranen and P. Kujamäki, eds. Translation universals: Do
they exist? Amsterdam: John Benjamins. ISBN 9789027216540, pp. 177-184.
Tognini-Bonelli, Elena. 2001. Corpus Linguistics at Work. Ámsterdam: John Benja-
mins. ISBN 9789027222763.
Zanettin, Federico. 2012. Translation-Driven Corpora: Corpus Resources for Descrip-
tive and Applied Translation Studies. Manchester: St. Jerome. ISBN:
9781905763290.

1
https://sites.google.com/site/federicozanettinnet/cl-htm#TOC-Translation-driven-Bilingual-and-
Multilingual-Corpora. [Last accessed 16/09/2014].
2
http://www.lancaster.ac.uk/fass/projects/corpus/cbls/corpora.asp. [Last accessed: 16/09/2014].
3
Computer Assisted Qualitative Data Analysis Software.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


PARTE I
LA CARACTERIZACIÓN DE LA LENGUA
TRADUCIDA

PART I
THE CHARACTERIZATION OF TRANSLATED
LANGUAGE
La singularidad de la onomatopeya japonesa en la
lengua traducida y no traducida

[The uniqueness of Japanese onomatopoeias in


translation and non-translation]
DANIEL RUIZ MARTÍNEZ Y CHIE MOTOKI
Universidad de Salamanca
danielruizmartinez@outlook.com
Resumen
Las onomatopeyas japonesas —abundantes, altamente productivas y profusamente
empleadas en numerosos ámbitos de la lengua japonesa— han representado tradicio-
nalmente un reto en el mundo de la traducción tanto dentro como fuera de Japón. La
escasez de este fenómeno en numerosas lenguas, especialmente marcada si atendemos
al ámbito europeo, convierte a la onomatopeya japonesa en un interesante candidato a
elemento único (unique item), dentro del japonés traducido y en consonancia con las
teorías sobre de los universales de traducción. Mediante las posibilidades que ofrece el
estudio de corpus comparables especializados en onomatopeyas japonesas, trataremos la
representación de estas expresiones en varias obras literarias traducidas y no traducidas.
Asimismo, este estudio servirá para observar algunas de las particularidades de someter
las onomatopeyas japonesas a un estudio lingüístico con corpus y sus posibilidades en el
marco de las investigaciones de la lengua de traducción basadas en corpus.
Abstract
Japanese onomatopoeias and mimetic expressions—abundant, highly productive and
extensively employed in many areas of the Japanese language— have traditionally rep-
resented a challenge to translation done within Japan as well as without. The scarcity of
this phenomenon in many languages, specially accentuated within the European sphere,
makes Japanese onomatopoeia an interesting candidate for «unique item» within trans-
lated Japanese and in harmony with the theories regarding translation universals. Using
the possibilities offered by the study of comparable corpus specialized in Japanese on-
omatopoeias, we deal with the representation of these expressions in several translated
literary works as well as untranslated ones. In addition, this study will aid in observing
some of the peculiarities the Japanese onomatopoeic expressions undergo in a corpus
linguistic study and their possibilities in the frame of corpus-based research into trans-
lated language.
Palabras clave
Japonés, onomatopeya, corpus comparable, hipótesis de los elementos únicos
Keywords
Japanese language, onomatopoeia, comparable corpus, unique items hypothesis

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
48 DANIEL RUIZ Y CHIE MOTOKI

1. Justificación y marco teórico de la investigación


El japonés es conocido por su rico caudal de léxico onomatopéyico, en especial,
cuando se compara con el de muchas otras lenguas europeas, como el inglés o el
español. Además de ser muy numerosas, las onomatopeyas no se asocian nece-
sariamente al lenguaje infantil, por lo que se utilizan profusamente en multitud
de ámbitos y géneros textuales. La falta de un sistema onomatopéyico tan desa-
rrollado en otros idiomas, sumada a la indeterminación y dinamicidad de las
onomatopeyas, dificulta enormemente la tarea de quien trata de traducir estas
expresiones a otras lenguas.
Animadas por este reto, diversas investigaciones han tratado las onomatopeyas
japonesas con un enfoque comparativo y traductológico. Estos estudios por lo
general han abordado la onomatopeya japonesa tomándola como punto de parti-
da y, por lo tanto, han adoptado casi siempre el japonés como lengua de origen
dentro del proceso de traducción. El tema de nuestra investigación ha surgido
precisamente del interés de invertir ese proceso, es decir, del deseo de observar
la onomatopeya japonesa como punto de llegada a través de la traducción desde
otro idioma. Para conocer más a fondo este fenómeno es necesario prestar aten-
ción al comportamiento de las onomatopeyas en el contexto de la lengua japo-
nesa traducida.
Si, como suele señalarse, las onomatopeyas japonesas carecen de equivalentes
fácilmente identificables en otros idiomas y su traducción a otras lenguas resulta
compleja, entonces podemos suponer que el proceso de traducción inverso pue-
de ser igualmente complejo. Así, dado que el español apenas emplea onomato-
peyas, podemos imaginar que las traducciones al japonés desde el español tam-
poco las contendrán.
Esta cuestión conforma el núcleo de la hipótesis de los elementos únicos (uni-
que items hypothesis), formulada por Tirkkonen-Condit (2002, 2009) y enmar-
cada en el estudio de la caracterización de lengua traducida y los universales de
traducción. Según esta hipótesis los «textos traducidos manifiestan frecuencias
menores de elementos lingüísticos que carecen de un correlato lingüístico en los
idiomas de partida que pudiera emplearse como equivalente de traducción»
(Tirkkonnen-Condit 2002: 209). Es decir, Tirkkonnen-Condit propone que,
debido a la falta de equivalencia formal entre elementos semánticamente simila-
res de dos idiomas distintos, el texto de origen no estimula al traductor a utilizar
ciertos elementos de la lengua de destino, es decir, los «elementos únicos» de la
lengua meta. De este modo, al no haber un estímulo que desencadene los ele-
mentos únicos en el texto meta, estarán infrarrepresentados en las traducciones a
dicho idioma. Así, las onomatopeyas japonesas parecen configurarse como bue-
nos candidatos a elementos únicos del japonés en las traducciones creadas desde
el español.
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 49

No obstante, la hipótesis de los elementos únicos también ha sido criticada. Por


ejemplo, Chesterman (2007) critica especialmente el concepto de «equivalencia
formal» y su graduación, y señala igualmente otros problemas, como la ambi-
güedad de la formulación de la hipótesis, su nomenclatura ola metodología para
la identificación de candidatos a elemento único. Ciertamente, partir del concep-
to de equivalencia formal en dos lenguas tan desemejantes entre sí como el ja-
ponés y el español no hace sino complicar las cosas. Las evidentes diferencias
del propio sistema de representación gráfica de ambos idiomas no son más que
la antesala de otras muchas divergencias en el léxico, la sintaxis o la construc-
ción del discurso, por mencionar algunos ejemplos básicos. En este sentido,
para establecer un sistema de identificación y clasificación de la diferencia for-
mal entre el léxico onomatopéyico japonés y el español se precisa de un estudio
comparativo muy laborioso del que ahora carecemos. Además, las onomatope-
yas conforman un grupo tan numeroso, heterogéneo y vagamente definido, que
resulta difícil imaginar un criterio común que aplicar universalmente. Por otro
lado, muy probablemente el acercamiento desde el concepto de equivalencia
formal deba rechazarse casi categóricamente porque la onomatopeya, en esen-
cia, no difiere del resto del vocabulario japonés de acuerdo a un criterio formal,
sino más bien perceptivo. Esto se debe a que lo que diferencia básicamente a las
onomatopeyas del resto del léxico es la percepción onomatopéyica que los ha-
blantes tienen de las mismas. En este sentido, de la hipótesis de los elementos
únicos podemos extraer la idea de partida de que el traductor no percibirá ono-
matopeyas en español y por lo tanto no las empleará en japonés.
En cualquier caso, la hipótesis de los elementos únicos es una importante fuente
de inspiración para el estudio de la onomatopeya japonesa y su representación
en la lengua traducida y no traducida. Investigaciones como ésta sin duda apor-
tarán nueva información sobre estas expresiones y ayudarán a precisar su defi-
nición. Asimismo, con este trabajo podremos arrojar luz sobre la caracterización
del japonés traducido contemporáneo, que constituye un campo todavía poco
estudiado. De hecho, de las investigaciones realizadas en esta área, el estudio de
Meldrum (2009) es el único que emplea de manera sistemática los corpus com-
parables, es decir, los compuestos de textos traducidos y no traducidos (Baker
1993). Su trabajo estudia la certeza de varias creencias sobre la lengua traducida
japonesa en torno a diversos elementos lingüísticos e investiga concretamente el
uso diferenciado de los pronombres personales, los préstamos escritos en silaba-
rio katakana, las expresiones femeninas, la extensión de los párrafos o el em-
pleo de sustantivos abstractos e inanimados como agentes de verbos transitivos.
Aunque Meldrum menciona brevemente las onomatopeyas al tratar el empleo
del katakana (Meldrum 2009: 119), no existe ningún estudio que aborde estas
unidades de manera sistemática y conjunta. Asimismo, tampoco existe ningún
estudio sobre los elementos únicos del japonés.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


50 DANIEL RUIZ Y CHIE MOTOKI

Nuestro estudio no tiene como objetivo demostrar la hipótesis de los elementos


únicos tomando la onomatopeya japonesa como un posible candidato, sino que
se propone ahondar en el conocimiento de estas unidades a la vez que las pre-
senta como uno más de los indicadores que pueden emplearse las investigacio-
nes sobre la lengua traducida. Así, con el fin de ilustrar las posibilidades de las
onomatopeyas, realizamos un breve estudio con un corpus comparable y ofre-
cemos los datos comparativos que consideramos de mayor interés.
Por último, es necesario realizar una breve mención sobre el término «onomato-
peya». Los estudios de esta área han tratado de establecer distintas categorías —
muy rebatidas— para las onomatopeyas japonesas. El léxico onomatopéyico se
ha clasificado tradicionalmente en dos grupos de acuerdo a un criterio semánti-
co: las «onomatopeyas», relativas a fenómenos sonoros, y las «mímesis», relati-
vas a fenómenos no sonoros (como los estados mentales, la descripción del
movimiento, etc.). En este trabajo utilizamos el término «onomatopeya» en un
sentido amplio y con él designamos a todas las expresiones japonesas de carác-
ter onomatopéyico, con independencia de la realidad a la que hacen referencia.

2. Metodología

2.1. Construcción de un corpus comparable de onomatopeyas


Como sucede habitualmente en los estudios sobre la lengua traducida, no exis-
ten corpus de traducción en japonés a disposición de los investigadores, por lo
que fue necesario crear una herramienta de trabajo propia y específica para el
objetivo de este estudio.
El criterio de selección de las obras que componen un corpus especializado
plantea siempre complejas cuestiones sobre su cantidad, calidad o representati-
vidad. En nuestro caso, la construcción de un corpus comparable —doblemente
complejo—de japonés ha estado muy supeditada al escaso material disponible.
Si bien la adquisición de obras creadas originalmente en japonés no presenta
mayores complicaciones, no abundan, en cambio, las publicaciones de textos
traducidos directamente del español al japonés, necesarias para elaborar el sub-
corpus de japonés traducido. En definitiva, reconocemos que los estudios con
corpus comparables han de aspirar a una simetría relativa entre cada subcorpus,
pero dadas las limitaciones de la combinación lingüística español-japonés resul-
ta complicado encontrar textos que sean cuantitativa y cualitativamente muy
semejantes entre sí y, al mismo tiempo, resulten aptos para el estudio de las
onomatopeyas.
Aunque nuestro corpus se compone de textos literarios completos, prescindimos
de la digitalización íntegra de los mismos por el objetivo y carácter de este estu-
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 51

dio, así como por diversos problemas relacionados con el ámbito de las onoma-
topeyas, tal y como justificamos más adelante, en el apartado 2.3.1. De este
modo, la porción digitalizada de las obras del corpus(es decir, el corpus en sen-
tido estricto si consideramos como corpus solo lo digitalizado) fue volcada ma-
nualmente en una tabla de Microsoft Excel de Windows e incluye básicamente
las onomatopeyas en sí, su contexto más inmediato y su documentación, además
de una serie de etiquetas útiles para el análisis que ofrecemos más adelante.

2.2. Criterios de selección de las fuentes textuales


Uno de los mayores obstáculos fue encontrar textos aptos para la elaboración
del corpus. En este problema intervienen principalmente dos factores: la exis-
tencia de textos en la combinación de estudio y su idoneidad para tratar el tema
de la investigación, es decir, las onomatopeyas.
En primer lugar, el más básico de los factores de selección gira en torno a la
disponibilidad de material de estudio en la combinación lingüística, en este caso
español-japonés. Aunque el contacto entre las comunidades de ambos idiomas
es cada vez mayor, el número de traducciones directas entre ambas lenguas
sigue siendo muy bajo en comparación al de combinaciones que incluyen, por
ejemplo, el inglés. Este factor limita notablemente las posibilidades de un estu-
dio de este tipo.
En segundo lugar, otro factor de selección importante versa sobre la aptitud de
los textos disponibles para el estudio de las onomatopeyas. Pensemos en primer
lugar en la disyuntiva de tomar textos escritos u orales. A pesar de que se suele
señalar la lengua hablada como uno de los espacios en que el uso de las onoma-
topeyas es más abundante y variado, este ámbito continúa siendo uno de los
campos menos investigados, presumiblemente por la dificultad que entraña
conseguir y tratar materiales orales. En cualquier caso, en una investigación
como la de este trabajo resulta inviable trabajar con ese tipo de textos: de hacer-
lo, el subcorpus traducido debería realizarse con interpretaciones del español al
japonés, que son de partida muy escasas y de difícil acceso para los investigado-
res. Además, en la interpretación profesional, la presencia de onomatopeyas es
previsiblemente testimonial, dado que esta suele desarrollarse en entornos for-
males, es decir, en contextos en los que por lo general se suelen evitar este tipo
de expresiones. Por estos motivos, el estudio de la onomatopeya japonesa me-
diante corpus comparables tendrá que nutrirse necesaria y obligatoriamente de
textos escritos.
De los géneros del texto escrito, opinamos que el literario es probablemente uno
de los más apropiados para un estudio comparativo con onomatopeyas. Esto se
debe principalmente a los dos factores presentados: la disponibilidad de material
y, sobre todo, la idoneidad del género textual. Dejando de lado la evidente esca-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


52 DANIEL RUIZ Y CHIE MOTOKI

sez de textos traducidos en la combinación japonés-español, la creación literaria


representa uno de los géneros en que las onomatopeyas se emplean con mayor
frecuencia. No obstante, es preciso insistir en que la abundancia excesiva de
onomatopeyas puede resultar tan contraproducente como su ausencia. Puesto
que nuestro interés es observar las diferencias originadas de decisiones presu-
miblemente inconscientes, creemos necesario seleccionar en la medida de lo
posible géneros en los que el uso de las onomatopeyas no cumple una función
protagonista. Por este motivo la literatura infantil o el cómic (en todas sus va-
riantes) resultan menos convenientes para un estudio de este tipo, ya que en
ellos las onomatopeyas suelen atraer gran parte de la atención de los lectores,
autores y traductores, arrastrando consigo la ideología de estos con respecto a
dichas unidades.
De este modo, creemos necesario evitar las obras en las que la representación de
las onomatopeyas está alterada conscientemente. Es evidente que si un autor
toma con determinación una actitud definida ante el uso de las onomatopeyas,
sus obras muy probablemente diverjan de la tónica general de la literatura de su
mismo tipo y, por consiguiente, su incorporación a un corpus del tipo de nuestro
estudio no resulte tan interesante. Sin embargo, es muy difícil determinar el
grado de consciencia de un autor en la toma de decisiones estilísticas. Por ejem-
plo, se suele decir que ciertos autores japoneses utilizan las onomatopeyas pro-
fusamente o de manera muy creativa y, del mismo modo, de otros se señala
justo lo contrario, es decir, que las rechazan abiertamente. No obstante, los es-
tudios comparativos en este campo son todavía escasos. Además, opinamos que
esta cuestión en absoluto es exclusiva de las onomatopeyas, sino que afecta
prácticamente a cualquier elemento léxico sujeto a las variables del estilo: ver-
bos, adjetivos, sintaxis, puntuación, etc. En este sentido resulta conveniente
tratar de desmitificar el excesivo carácter especial que en ocasiones se le ha
otorgado a la onomatopeya y que la ha situado en algunos análisis muy por de-
lante de otros elementos del texto. Por estos motivos creemos que la problemá-
tica sobre la interferencia de la autoría en el caso de las onomatopeyas no difiere
de la que puede acusarse ante otros elementos similares y, en consecuencia, no
es preciso formular medidas compensatorias más allá de las que emplearíamos
ante otra parte del léxico estilístico.
Por último, todo lo dicho sobre los autores es evidentemente aplicable a los
traductores, ya que actúan en calidad de autores de las traducciones. Por ejem-
plo, algunos manuales y escuelas de traducción de Japón imparten ciertas direc-
trices sobre el empleo de la onomatopeya en la traducción y, por lo tanto, po-
demos suponer que los traductores pueden haber desarrollado una actitud de-
terminada ante estas expresiones. Sin embargo, este fenómeno forma parte de la
ideología de cada traductor y es extrapolable a su actitud frente cualquier otro
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 53

elemento lingüístico, ya sea el empleo de los tiempos verbales o la selección del


léxico, por nombrar algunos ejemplos básicos.

2.3. Composición del corpus comparable de onomatopeyas


Nuestro corpus comparable está formado por dos subcorpus: uno de textos tra-
ducidos al japonés desde el español y otro de textos japoneses no traducidos. La
selección de los textos traducidos ha estado determinada por la escasez de obras
traducidas desde el español. En el caso del subcorpus de textos no traducidos, el
criterio de selección ha girado en torno al éxito comercial de las obras en Japón.
Se establecieron los siguientes criterios de comparabilidad para ambos subcor-
pus:
• Género: novela juvenil y adulta.
• Autoría: autores y traductores diferentes para cada obra.
• Cronología: obras publicadas en las décadas de 1990 y 2000. Aunque
una obra (Tsugumi) fue publicada en 1989, se enmarca en la corriente
literaria que determinó las producciones de décadas posteriores y, por lo
tanto, su estilo es equiparable al de las demás obras.
• Tamaño: textos íntegros de cuatro obras traducidas y cuatro obras no
traducidas. En el análisis pormenorizado los datos fueron extrapolados
debido a las diferencias de tamaño entre ambos subcorpus (textos tradu-
cidos: 790.360 caracteres; textos no traducidos: 387.098 caracteres).
El subcorpus de textos traducidos está formado por las siguientes obras:
• Finis Mundi, de Laura Gallego. Traducido por Naohiro Matsushita:
Kono yo no owari.
• La sombra del viento, de Carlos Ruiz Zafón. Traducido por Hiromi Ki-
mura: Kaze no kage.
• El pequeño libro que aún no tenía nombre, de José Antonio Millán.
Traducido por Tetsuyuki Andō: Mada namae no nai chiisana hon.
• Una caperucita en Manhattan, de Carmen Martín Gaite. Traducido por
Chiharu Suzuki: Manhattan no akazukin-chan.
El subcorpus de textos no traducidos está formado por las siguientes obras:
• Tsugumi, de Banana Yoshimoto.
• Natsu no niwa, de Kazumi Yumoto.
• Seirei no moribito, de Nahoko Uehashi.
• Hebi ni piasu, de Hitomi Kanehara.
Para calcular el tamaño de un texto japonés se utiliza el número total de caracte-
res (que incluye la puntuación). Esto se debe a que el japonés carece del con-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


54 DANIEL RUIZ Y CHIE MOTOKI

cepto ortográfico de palabra, ya que en una oración no existe ningún tipo de


separación física (espacio en blanco) entre una unidad léxica y la siguiente.
Dado que no se han digitalizado los textos íntegros, la cantidad total de caracte-
res de cada obra ha sido estimada tomando como referencia varias páginas del
cuerpo del texto: se ha calculado manualmente el número de caracteres de las
páginas con números múltiplos de diez a partir de la décima página (páginas 10,
20, 30, etc.) y mediante los cálculos oportunos se ha extraído una estimación
total para cada obra.

2.4. Búsqueda y selección de onomatopeyas

2.4.1. Búsqueda de onomatopeyas


En nuestro estudio la búsqueda de onomatopeyas se ha realizado de manera
totalmente manual, es decir, identificando cada unidad onomatopéyica mediante
la lectura atenta e íntegra de los textos de las obras seleccionadas. A continua-
ción explicamos los motivos de condujeron a tomar esta decisión.
Las investigaciones que estudian la candidatura de ciertos términos o construc-
ciones a elementos únicos suelen tratar con un grupo cerrado de expresiones, en
muchas ocasiones muy pequeño o que se reduce incluso a una sola palabra. Sin
embargo, en este estudio tratamos el vocabulario onomatopéyico japonés en
conjunto y este, de partida, constituye un grupo muy numeroso: nótese que, por
ejemplo, el diccionario de onomatopeyas de Ono (2007) recoge cerca de 4500
expresiones onomatopéyicas básicas. Además, en el marco de la problemática
que suscita su numerosidad, aunque dispusiéramos de un listado muy amplio
(extraído, por ejemplo, de varias obras lexicográficas), este resultaría insuficien-
te para abarcar el fenómeno en toda su dimensión. Esto se debe a una de las
características más representativas del sistema onomatopéyico japonés: su alto
grado de productividad. Esta singularidad hace del léxico onomatopéyico un
grupo abierto y proclive a incorporar nuevas formas constantemente.
Así, no contamos con un listado definido de términos ya que, de partida, su
elaboración resulta inviable. Existen básicamente dos factores relacionados con
la productividad que provocan esta situación: la complejidad de los paradigmas
de derivación de las onomatopeyas y la aparición de hápax.
Por un lado y como hemos señalado, el sistema onomatopéyico del japonés es
tan productivo que la creación de formas derivadas de las ya existentes es muy
frecuente. Por ejemplo, Kadooka (2007: 52) señala para la raíz pata(indica un
golpe) hasta veinticuatro derivados básicos (patan, pattan, patatt, pattari, pata-
pata, pataan, batatt, bataatt, battari, etc.). Estas variaciones formales aportan
matices diversos —sobre la calidad del sonido, el movimiento o el tamaño del
objeto involucrado, por ejemplo— y muchas de ellas no suelen estar registradas
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 55

en los diccionarios. Ante la dificultad que plantea la derivación léxica, una solu-
ción recurrente es la de acudir a las raíces o lexemas y, a continuación, sistema-
tizar los esquemas de derivación, pero en el caso de las onomatopeyas esta op-
ción sigue resultando muy problemática. Uno de los principales obstáculos es
que la derivación puede afectar a la propia morfología de la raíz onomatopéyica,
por ejemplo, mediante el uso de infijos (pata >pa-T-ta) o la sustitución de unos
fonemas por otros relacionados fonosimbólicamente (pata >bata). Estos son
algunos de los mecanismos más típicos, pero existen muchos otros, a cada cual
más rocambolesco. Asimismo, pueden ocurrir simultáneamente varios métodos
de derivación en una misma expresión. De este modo, la complejidad del siste-
ma, sumada además a la variación ortográfica del japonés, entorpece enorme-
mente el diseño de un sistema de búsqueda automático eficaz para este grupo de
términos tan numeroso.
Por otro lado, incluso en posesión de un lexicón onomatopéyico muy desarro-
llado, nos seguiríamos tropezando con el problema del léxico creativo, cuyo
máximo exponente son los hápax en sentido estricto, es decir, unidades total-
mente novedosas en la lengua y por lo general utilizadas por un solo autor. El
sistema onomatopéyico japonés es especialmente productivo en este sentido, ya
que permite a cada hablante crear nuevas raíces sirviéndose del simbolismo
fónico asentado en el léxico onomatopéyico. Evidentemente es imposible elabo-
rar una lista de unidades de búsqueda si ni siquiera las conocemos o las pode-
mos prever.
Un método relativamente eficaz con el que atajar estos dos problemas (la deri-
vación y, en especial, los hápax) consiste en examinar los listados de frecuencia
de las unidades del corpus. De este modo se pueden buscar candidatos a onoma-
topeya creativa entre las unidades cuya frecuencia presenta valores cercanos al
1, es decir, las más infrecuentes. No obstante, este sistema no deja de ser orien-
tativo y sigue requiriendo un control manual trabajoso.
Para ilustrar este asunto, mostramos parte de los resultados de este trabajo. La
tabla 1 indica la cantidad de onomatopeyas que se podrían identificar en la digi-
talización del corpus si se utilizara como referencia el listado de onomatopeyas
que ofrece el diccionario de Ono (2007), el más exhaustivo de las obras lexico-
gráficas publicadas. En el grupo I se encuentran las onomatopeyas que confor-
man una entrada en el diccionario y que podríamos hallar de manera casi total-
mente automática (85 %). El grupo II engloba las onomatopeyas que no están en
el diccionario de Ono y que representan el principal problema. Del grupo II, el
subgrupo IIa comprende las onomatopeyas que se derivan de alguna forma del
grupo I y que, por lo tanto, podríamos hallar si dispusiéramos de un sistema de
búsqueda avanzado capaz de gestionar los complejos parámetros de derivación.
Por último, el grupo IIb está formado por onomatopeyas totalmente creativas e
imposibles de prever.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


56 DANIEL RUIZ Y CHIE MOTOKI

Subcorp. Subcorp. textos no


Corpus completo
Grupo textos traducidos traducidos
Formas % Formas % Formas %
I 315 96,6 513 82,9 624 85,0
IIa 6 1,8 95 15,4 94 12,8
IIb 5 1,5 11 1,7 16 2,2
Tabla 1. Indexación de las onomatopeyas del corpus a partir de Ono (2007).
En vista de estas condiciones y con el objetivo de abarcar el número total de
onomatopeyas, en este estudio experimental la búsqueda de onomatopeyas se ha
realizado manualmente. Asimismo, en esta ocasión, dada la falta de un lexicón
onomatopéyico exhaustivo y de un sistema de búsqueda eficaz y complementa-
rio, no se ha digitalizado el corpus íntegramente, sino únicamente las onomato-
peyas halladas y sus contextos. Entendemos que en este caso el atractivo de
digitalizar completamente los textos (con el inmenso esfuerzo que requiere) es
menor, ya que una de sus mayores ventajas es precisamente la consiguiente
posibilidad de buscar automática o semiautomáticamente las unidades que son
objeto de estudio.

2.4.2. Selección de onomatopeyas


En la búsqueda de onomatopeyas a lo largo del corpus surge la cuestión de de-
terminar qué unidades cumplen los requisitos necesarios para ser calificadas
como tales. La consideración de una expresión como onomatopéyica puede
diferir enormemente dependiendo del criterio aplicado. Este puede valerse de la
etimología, la forma, el uso, la percepción, etc. de cada unidad. En nuestro caso
tomamos como línea directriz un planteamiento similar al del diccionario de
onomatopeyas de Ono (2007), que con cerca de 4500 entradas es el más extenso
de todos los publicados hasta la fecha. Al igual que esta obra, recogemos expre-
siones con una morfología típicamente onomatopéyica, de función sintáctica
predominantemente adverbial y de etimología onomatopéyica. Asimismo, en
nuestra selección añadimos otras expresiones que, a pesar de no estar registra-
das en la obra de Ono, son indudablemente onomatopéyicas por su forma, fun-
ción y simbolismo fónico (en la mayoría de los casos se trata onomatopeyas
creativas, que obviamente no están recogidas en las obras lexicográficas).
Siguiendo el mismo criterio que Ono, en nuestra selección prescindimos de los
términos que debido a un proceso de lexicalización contienen elementos no
onomatopéyicos, como las expresiones hechas, las palabras compuestas (por lo
general, sustantivos) y las derivadas que implican una transcategorización (ver-
balización, adjetivación, etc. mediante sufijos no onomatopéyicos, como –meku
o –yaka). Asimismo, al igual que Ono, descartamos la expresión chotto («un
poco»; de uso muy extendido), a pesar de su probable origen onomatopéyico.
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 57

La selección resultante está formada, por consiguiente, por expresiones cuya


naturaleza y comportamiento onomatopéyicos resultan incontestables tanto para
los hablantes de japonés como para los investigadores del área. A pesar de ex-
cluir ciertas unidades de naturaleza onomatopéyica, el criterio que tomamos
permite abarcar la gran mayoría del abundante léxico onomatopéyico del japo-
nés, compuesto principalmente por adverbios.

3. Análisis del corpus


A continuación exponemos de manera concisa algunos de los datos más rele-
vantes recabados del análisis del corpus de onomatopeyas y relacionados con la
representación, diversidad, formas más frecuentes y creatividad de estas expre-
siones. Las conclusiones que ofrece este estudio obedecen a las limitaciones
propias de una selección de textos reducida, por lo que resulta arriesgado extra-
polar los resultados que mostramos a continuación tanto al género textual de las
obras toma como a la generalidad de la lengua. Por último, en este trabajo em-
pleamos los términos forma y ocurrencia para los ingleses type y token, respec-
tivamente.

3.1. Representación
Siguiendo el planteamiento de la hipótesis de los elementos únicos, es de espe-
rar que las onomatopeyas japonesas, al carecer de un correlato formal en espa-
ñol, estén infrarrepresentadas en la lengua traducida. La tabla2 muestra el nú-
mero de onomatopeyas y las densidades (extrapoladas) para cada subcorpus.
Textos traducidos Textos no traducidos
Ocurrencias 1674 2277
Densidad extrapolada
21,18 58,82
(ocurr./100.000 carac.)
Tabla 2. Densidad de onomatopeyas según subcorpus.
En estos cálculos se observa que en el subcorpus de textos no traducidos la den-
sidad de onomatopeyas (58,82) casi triplica a la de los textos traducidos
(21,18).Basándonos en estos resultados podemos confirmar la hipótesis de par-
tida: las onomatopeyas están infrarrepresentadas en los textos traducidos en
comparación con los textos no traducidos.

3.2. Variedad de onomatopeyas


La variedad de onomatopeyas viene determinada por el ratio entre formas y
ocurrencias. Cuanto mayor sea dicho ratio, más diversas serán las onomatope-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


58 DANIEL RUIZ Y CHIE MOTOKI

yas. Este tipo de cálculos pueden asociarse con los conceptos que propugnan
universales de traducción como los de repetición y simplificación.
En este recuento se han considerado las variantes ortográficas (hiragana, kata-
kana y caracteres chinos) como una misma forma. Como se aprecia en la tabla
3, las onomatopeyas del subcorpus de textos no traducidos son más variadas en
comparación con las de los textos traducidos, a pesar de ser más frecuentes (tal
y como mostraba la tabla 2).
Textos traducidos Textos no traducidos
Formas 326 619
Ocurrencias 1674 2277
Ratio form./ocurr. 19,47 24,18
Tabla 3. Diversidad de onomatopeyas por subcorpus.

3.3. Formas más frecuentes


Las onomatopeyas más comunes de la lengua son utilizadas a diario y pueden
considerarse parte del léxico más activo de los hablantes y, por extensión, tam-
bién de los traductores. Por este motivo, podemos prever que, aun careciendo de
un estímulo formal en la lengua de partida, los traductores las emplearán con
una frecuencia similar a la de los autores de textos no traducidos.
Como se observa en la tabla 4, el listado de las formas más populares contiene
muchas unidades comunes en ambos subcorpus, en especial en las diez primeras
posiciones. No obstante, la tendencia observada en el conjunto de cada subcor-
pus se vuelve a confirmar: las onomatopeyas más frecuentes también se em-
plean más en el subcorpus de textos no traducidos.

Textos traducidos Textos no traducidos


5
Ocu- n/10 Ocu- nº/105
Pos. Onomatopeya Onomatopeya
rrencias car. rrencias car.
1ª 109 jit(to) 13,79 95 zut(to) 24,54
2ª 84 zut(to) 10,63 88 kit(to) 22,73
3ª 83 yukkuri 10,50 68 yukkuri 17,57
4ª 65 kit(to) 8,22 63 fui 16,27
5ª 65 sukkari 8,22 51 bon’yari 13,17
6ª 52 chan 6,58 42 jit(to) 10,85
7ª 52 hakkiri 6,58 40 shikkari 10,33
8ª 50 shikkari 6,33 39 bikkuri 10,07
9ª 44 sot(to) 5,57 31 hakkiri 8,01
10ª 27 jikkuri 3,42 30 sukkari 7,75
11ª 27 fu 3,42 29 fu 7,49
12ª 26 bikkuri 3,29 27 gut(to) 6,97
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 59

13ª 25 nikkori 3,16 25 chan 6,46


14ª 24 bon’yari 3,04 23 dondon 5,94
15ª 20 uttori 2,53 23 pat(to) 5,94
Tabla 4. Formas más frecuentes por subcorpus.
No obstante, si bien habíamos observado que en el conjunto de los textos no
traducidos la densidad de onomatopeyas casi triplicaba a la de los textos tradu-
cidos (tabla 2), esta diferencia se reduce en varias de las más frecuentes hasta
casi la mitad (zutto, kitto, yukkuri, shikkario fu), se iguala (chan) o, excepcio-
nalmente, llega a invertirse (jitto). Esto quizá se deba a la ya señalada pertenen-
cia de estas unidades al léxico más activo de los traductores.

3.4. Creatividad formal


Las onomatopeyas representan un ámbito de la lengua japonesa en el que la
creatividad del hablante desempeña una función protagonista. La neología pue-
de manifestarse en las diversas dimensiones de una palabra, como su semántica
o su valor sintáctico, por nombrar algunos ejemplos, pero en este apartado nos
referiremos a la creatividad desde un punto de vista exclusivamente formal. Si
atendemos a la diversidad morfológica de las onomatopeyas, podemos encontrar
expresiones muy comunes y otras muy innovadoras. Por este motivo, este as-
pecto es idóneo para investigar comparativamente acerca de la creatividad de
los textos traducidos y no traducidos, cuyo estudio puede emparentarse con
algunos universales de traducción, como el de normalización.
Como mencionamos anteriormente, el sistema onomatopéyico japonés se carac-
teriza por su alto grado de productividad. El hablante puede emplear los meca-
nismos de derivación para modificar las onomatopeyas que ya están asentadas
en la lengua y adaptarlas oportunamente a cada contexto. De este modo, a partir
de una raíz onomatopéyica, y mediante un rico sistema de derivación, pueden
crearse distintas onomatopeyas emparentadas; asimismo, es posible crear nue-
vas raíces siguiendo la lógica del simbolismo fónico desarrollado dentro del
sistema onomatopéyico.
Para establecer el grado de originalidad formal de cada onomatopeya hemos
tomado como referencia el diccionario monolingüe Daijisen en su formato elec-
trónico, editado por Matsumura (1999) y actualizado constantemente. En este
caso hemos optado por no emplear como referencia obras lexicográficas espe-
cializadas en onomatopeyas ya que, si bien recogen muchísimas expresiones
distintas (así como sus derivaciones), suelen ser muy exhaustivas y contienen
unidades cuyo uso y conocimiento pueden considerarse marginales. En este
sentido, opinamos que emplear un diccionario de referencia general da mejor
cuenta del léxico conocido por la mayoría de los hablantes y, por tanto, sirve
como criterio con el que medir el grado de originalidad de las onomatopeyas.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


60 DANIEL RUIZ Y CHIE MOTOKI

De este modo, partimos de la premisa de que las onomatopeyas no recogidas en


este diccionario de uso común son de un carácter innovador mayor. Los resulta-
dos de la clasificación de las onomatopeyas del corpus según su creatividad se
observan en la tabla 5: el grupo I comprende las onomatopeyas recogidas en el
diccionario y el grupo II, las que no lo están (y que consideramos, por lo tanto,
más creativas).
Textos traducidos Textos no traducidos
Formas Porcentaje Formas Porcentaje
Grupo I 292 89,6 % 423 68,3 %
Grupo II 34 10,4 % 196 31,7 %
TOTAL 326 100,0 % 619 100,0 %
Tabla5. Formas comunes y creativas del corpus de acuerdo con el diccionario Daijisen.
Los resultados señalan que los textos traducidos recurren casi en un 90 % de los
casos a onomatopeyas asentadas en la lengua, mientras que este porcentaje se
reduce hasta algo menos del 70 % en los no traducidos. De acuerdo con estos
datos, las onomatopeyas de la redacción original en japonés tienden a ser más
creativas desde un punto de vista morfológico y en comparación con las de las
traducciones.

4. La onomatopeya como indicador en el estudio de la lengua


traducida y no traducida
Por último, queremos mostrar nuestro interés por que trabajos de este tipo sir-
van para que otros investigadores consideren la onomatopeya como uno de los
indicadores que emplear en sus estudios sobre la caracterización de la lengua
traducida y no traducida. Aunque hemos demostrado algunos de los principales
atractivos de estas expresiones, también existen numerosos aspectos de las
onomatopeyas japonesas que pueden complicar esta posible función. Por las
limitaciones de este trabajo mencionaremos únicamente dos cuestiones relacio-
nadas con la semántica.
En primer lugar, considerando la hipótesis de los elementos únicos, la mayoría
de las investigaciones del área estudian la representación de ciertas construccio-
nes sintácticas o de palabras eminentemente gramaticales. En cambio, las ono-
matopeyas japonesas son unidades léxicas con una importante carga semántica
y exigen un cuidado aún mayor en el equilibro temático de las obras que com-
ponen el corpus comparable.
En segundo lugar, existe el problema de la asimetría lingüística, que también ha
sido señalado por Tirkkonen-Condit (2002, 2009) y Chesterman (2007). Por
cuestiones culturales o de tradición sabemos que los miembros de distintos sis-
temas lingüístico-culturales suelen fijarse en ciertos aspectos de un mismo fe-
LA SINGULARIDAD DE LA ONOMATOPEYA JAPONESA EN LA LENGUA TRADUCIDA Y NO TRADUCIDA 61

nómeno de manera diferente: con mayor frecuencia, con mayor profundidad,


etc. Sin embargo, también es probable que los hablantes de japonés detallen
ciertos matices muy concretos de la naturaleza de un movimiento o un sonido
no porque se fijen más que los hablantes otros idiomas, sino porque gracias a las
onomatopeyas disponen de un mecanismo muy rico y productivo que les facilita
canalizar su expresión. Al mismo tiempo, es posible que los textos escritos por
los hispanohablantes no aborden los aspectos que tratan las onomatopeyas japo-
nesas y, por ese motivo, muchas de ellas no aparecen en las traducciones reali-
zadas desde el español. De este modo, cuando abordamos la onomatopeya japo-
nesa de manera comparada, es posible que no estemos ante un problema ni de
traducibilidad ni de equivalencia y puede que en este caso no debamos hablar de
una falta de estímulo formal, sino de estímulo semántico. Evidentemente si los
textos en español no tratan los temas propios de las onomatopeyas, estas estarán
necesariamente infrarrepresentadas en la traducción de la combinación español-
japonés. Lamentablemente no disponemos todavía de investigaciones suficien-
tes que nos ayuden a corroborar estas hipótesis, de manera que debemos esperar
a que los estudios comparados sobre la semántica de ambas lenguas puedan
aportar más información sobre este asunto.

5. Conclusiones
En este trabajo hemos presentado sucintamente algunas consideraciones sobre
la onomatopeya japonesa que pueden servir de apoyo a otros estudios realizados
en el campo de la caracterización de la lengua traducida. Datos recabados de
esta investigación sugieren que las onomatopeyas están infrarrepresentadas en
la lengua traducida en comparación con la no traducida, pero resulta aventurado
achacarlos a los motivos que aduce la hipótesis de los elementos únicos de
Tirkkonen-Condit (2002).Asimismo, hemos señalado la productividad del sis-
tema onomatopéyico japonés como una de las áreas más interesantes para el
estudio de la lengua traducida, pero también se ha manifestado como uno de los
aspectos que plantea mayores problemas metodológicos. En ese sentido, espe-
ramos que las consideraciones expuestas en este trabajo contribuyan a estable-
cer un diseño experimental consistente que se pueda reproducir y automatizar
para las onomatopeyas japonesas y otros casos similares.Por último, hemos
aportado algunas informaciones sobre la onomatopeya japonesa que hasta ahora
se habían intuido pero no probado. No obstante, por la naturaleza y limitaciones
de este estudio, es necesario que otros trabajos similares corroboren los resulta-
dos arrojados por esta investigación.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


62 DANIEL RUIZ Y CHIE MOTOKI

6. Bibliografía
Baker, Mona. 1993. Corpus linguistics and translation studies: Implication and applica-
tions. @ M. Baker, M. G. Francis y E. Tognini-Bonelli, eds. Text and Technol-
ogy. In Honour of John Sinclair. Amsterdam: John Benjamin. ISBN
9789027221384, pp. 233-250.
Chesterman, Andrew. 2007. What is a unique item? @ Y. Gambier, M. Shlesinger y R.
Stolze, eds. Doubts and Directions in Translation Studies. Amsterdam: John
Benjamins. ISBN 9789027216809, pp. 3-13.
Kadooka, Ken-ichi. 2007. Nihongo onomatope goi ni okeru keitaiteki/on’inteki taikeisei
ni tsuite [Sobre el sistematismo morfológico y fonológico del vocabulario on-
omatopéyico japonés]. Tōkyō: Kurosio. ISBN 9784874243862.
Matsumura, Akira, ed. 1999. Daijisen. Shōgakukan. Diccionario en formato electrónico.
Meldrum, Yukari Fukuchi. 2009. Translationese-Specific Linguistic Characteristics: A
Corpus-Based Study of Contemporary Japanese Translationese @ Hon’yaku
kenkyū e no shōtai 3: 105-132.
Ono, Masahiro. 2007. Nihongo onomatope jiten: giongo/gitaigo 4500 [Diccionario de
onomatopeyas de japonés: onomatopeyas/mímesis 4500]. Tōkyō: Shōgakukan.
ISBN 9784582854749.
Tirkkonen-Condit, Sonja. 2002. Translationese – A myth or an empirical fact? A study
into the linguistic identifiability of translated language. @ Target 14: 207-220.
Tirkkonen-Condit, Sonja. 2009. Unique items – over- or under-represented in translated
language?@ A. Mauranen y P. Kujamäki, eds. Translation Universals: Do
They Exist?Amsterdam: John Benjamins. ISBN 9789027216540, pp. 177-183.
Pana y terciopelo en la literatura vasca traducida y
no traducida. Aspectos lingüístico-estilísticos resul-
tantes de la comparación de dos corpus 1

[Corduroy and velvet in translated and non-


translated Basque literature. Linguistic and stylistic
aspects resulting from the comparison of two cor-
pora]
ISABEL ETXEBERRIA RAMÍREZ
Universidad del País Vasco – Euskal Herriko Unibertsitatea (UPV-
EHU)
isabeletx@gmail.com
Resumen
El euskera es una lengua en proceso de estandarización y normalización, que cuenta con
un volumen de textos traducidos mayor en proporción al de las lenguas hegemónicas.
En este estudio pretendemos caracterizar la lengua vasca traducida con el fin de identi-
ficar qué rasgos pudieran estar influyendo en el desarrollo léxico, morfosintáctico y
estilístico de la lengua. Para ello, compararemos dos corpus en lengua vasca: uno de
textos literarios traducidos y otro de textos literarios no traducidos. Utilizaremos una
parte del corpus Ereduzko Prosa Gaur, compuesta por 111 obras traducidas y 176 obras
no traducidas, publicadas todas entre 2000 y 2006. Y analizaremos los siguientes aspec-
tos: diversidad léxica, precisión semántica, algunos elementos distintivos del euskera y
ciertos usos lingüísticos relacionados con el proceso de estandarización de la lengua.
Abstract
Basque is a language going through a standardization and normalization process, in
which translation occupies a more central position than in other hegemonic languages.
The aim of this study is to characterize translated Basque, so as to identify those fea-
tures that might be having any influence on the lexical, morphosyntactic and stylistic
development of the language. For that purpose, two corpora of Basque texts will be
compared: one corpus of translated literary texts and one corpus of non-translated liter-
ary texts. These corpora are a part of Ereduzko Prosa Gaur, consisting of 111 translated
literary works and 176 non-translated literary works, all of them published between
2000 and 2006. The following aspects will be analyzed: lexical diversity, semantic
precision, some unique items of Basque and some linguistic usages related to the stand-
ardization process.
Palabras clave
Corpus comparables; euskera traducido / no traducido; rasgos estilísticos; estandariza-
ción; universales de traducción

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
64 ISABEL ETXEBERRIA RAMÍREZ

Keywords
Comparable corpora; translated / non-translated Basque; stylistic features; standardiza-
tion; translation universals

1. Introducción
El sistema literario vasco es, de acuerdo a la caracterización de Itamar Even-
Zohar, un sistema joven, periférico y débil. Desde la publicación en 1545 de la
primera obra impresa en euskera (Linguae vasconum primitiae, de Bernart
Etxepare) hasta el año 1875 apenas se publicaron 100 títulos en lengua vasca.
Durante los 100 años siguientes se alcanzó una media de 31,5 publicaciones al
año. Y a partir de la década de 1970, a consecuencia de, entre otros factores, la
creación de la variedad unificada o euskera batúa —destinada a convertirse en
estándar para el sistema de enseñanza, los medios de comunicación y la admi-
nistración—, el crecimiento de la producción editorial vasca ha sido exponen-
cial: entre 1976 y 2008 se publicaron 31.524 libros en euskera. Hoy día se cal-
cula que se publican más de 2.000 libros al año, de los cuales una cuarta parte
son obras literarias. Las letras vascas han tenido un desarrollo tardío y excep-
cionalmente acelerado en los últimos 40 años. Se trata, por tanto, de un sistema
joven. Por otro lado, los datos sobre el conocimiento de la lengua (36,4 % de la
población de la Comunidad Autónoma del País Vasco era bilingüe en 2011,
según el V Mapa sociolingüístico, publicado en 2014) nos indican que se trata
de un sistema periférico, así como, debido a la situación de diglosia en que se
encuentra, débil. En este contexto, cabe esperar que la traducción tenga una
gran transcendencia en el sistema literario vasco. Y efectivamente así lo corro-
boran los datos: se calcula que los textos traducidos representan un 30-35 % de
la producción editorial vasca actual.
El peso de la traducción en el sistema literario de destino se refleja no solo en la
influencia que ejerce en la configuración de los cánones literarios o en la impor-
tación de nuevos temas, corrientes y estilos, sino también en su carácter de vía
de entrada de nuevos modos de expresión y recursos lingüístico-estilísticos. Y
es que, durante el proceso de traducción de un texto, el traductor debe hacer
frente a los numerosos obstáculos y desafíos que le imponen el texto y la lengua
de origen. El traductor no puede o no debe hacer trampas, no puede o no debe
eludir las complejidades que le presenta el texto de partida. Las soluciones y los
recursos léxicos y estilísticos que propone el traductor en estos trances quedan a
disposición del resto de hablantes de la lengua meta, y pasan así a enriquecer el
patrimonio de dicha lengua.
Se trata, por supuesto, de un fenómeno universal, inherente al trabajo de traduc-
ción, sean cuales sean las lenguas de origen y de destino. Y, sin embargo, con-
sideramos que en el caso de la lengua vasca es más notoria y transcendente esta
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 65

influencia. En primer lugar porque, como ya hemos indicado, debido a la reali-


dad sociolingüística del euskera, la proporción de textos traducidos es mucho
mayor que en otras lenguas y, por tanto, es más frecuente la relación de los lec-
tores con la lengua traducida. Se debe considerar, por otro lado, que el proceso
de normalización y estandarización de la lengua vasca no ha hecho más que
empezar y que, aunque desde los primeros pasos de la fundación del euskera
batúa en 1967 se han dado importantes pasos para modernizar, flexibilizar, en-
riquecer y aprovisionar de recursos la lengua, a día de hoy todavía presenta
desequilibrios y carencias en su desarrollo léxico, morfosintáctico y estilístico. 2
Y, por último, las diferencias tipológicas entre el euskera y otras lenguas con-
llevan que los traductores vascos se encuentren más frecuentemente en la nece-
sidad de recurrir a usos lingüísticos no habituales en euskera.
Esta idea de la trascendencia de la traducción y de las aportaciones que los tra-
ductores hacen al devenir de la lengua vasca es un tema recurrente en las refle-
xiones de escritores, traductores y lingüistas vascos, y está ampliamente asumi-
da. No es este el lugar para recoger y enumerar opiniones al respecto, pero valga
una cita de Anjel Lertxundi, uno de los más reconocidos escritores en lengua
vasca, para ilustrar este parecer:
Itzulpenetan inbertituriko ahaleginak dira, zalantzarik gabe, euskal literaturaren
berririk esanguratsuena azken urteetan. Itzulpenak etengabe sortzen du literatura
hizkera, eta aldi berean, zehaztasunaren bidez, estilo ezberdinetarako bideak ire-
kitzen ditu, zehaztasunaren euskarririk gabe ezinekoa delako aniztasuna... Behin
edo behin esan dudanez, idazleok itzultzaile mentalak gara (batez ere euskaraz ez
den hizkuntzetan irakurtzen dugunok); aitzitik, inork ez digu zuzentasunik eta
pentsatzen eta idazten dugunaren arteko koherentziarik eskatzen, inork ezin eza-
gutu ditzakeelako landu ditugun ideiak. Tranpa egin dezakegu, zailtasunak
saihestu eta hasieran konplexua zena errazagoa egin dezakegu; gure tapiza sinpli-
fikazio horiekin ehundu dezakegu, eta gero haren gainean ibili inposaturiko doto-
reziaz. (Lertxundi, 1993: 59-60) 3.
Esas supuestas aportaciones que los traductores hacen —o, siguiendo a
Lertxundi, están obligados a hacer, a diferencia de los escritores, por las especi-
ficaciones impuestas por el texto de origen— no han sido todavía sistemática-
mente examinadas ni constatadas. Es por ello que en este estudio pretendemos
abordar el tema tratando de verificar dos cuestiones preliminares y básicas: si
ciertamente existen diferencias lingüístico-estilísticas entre el euskera traducido
y el no traducido y, en caso de que así sea, en qué consisten dichas diferencias.
Consideramos además que este intento por caracterizar la lengua vasca traduci-
da puede ofrecer información de interés al debate sobre los universales de tra-
ducción. Y es que el presente estudio ofrece la posibilidad de testar la existencia
o el alcance de los universales de traducción a la luz de los datos aportados por
una lengua que apenas ha sido analizada desde este prisma, una lengua singular

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


66 ISABEL ETXEBERRIA RAMÍREZ

y distante tipológicamente de otras lenguas, y en una situación de diglosia que


opinamos que influye de manera decisiva en su desarrollo y comportamiento.
No quisiéramos terminar esta introducción sin hacer una observación que expli-
ca, creemos, algunas de las decisiones metodológicas tomadas en este estudio.
La presente investigación se realizó a modo de ensayo preliminar con vistas a
comprobar la viabilidad de un trabajo posterior de más largo alcance y mayor
profundidad. En este contexto, se optó por tratar de obtener una visión de con-
junto de la cuestión (¿existen ciertamente diferencias lingüístico-estilísticas
reseñables entre el euskera literario traducido y el no traducido?). Así pues, en
lugar de centrar nuestra investigación en el estudio exhaustivo de un reducido
número de rasgos, recurrimos al análisis de una gran variedad de indicadores
que nos ayudaran a vislumbrar cuáles son los rasgos distintivos más destacados
que diferencian el euskera traducido y el no traducido, para ahondar en su estu-
dio en investigaciones futuras.
Asimismo, optamos por utilizar un corpus ya constituido y de acceso público,
sirviéndonos únicamente de las opciones de búsqueda y comparación que dicho
corpus ofrece a los usuarios en su interfaz pública, con las ventajas y limitacio-
nes que ello supone. Es decir, primamos rentabilizar el tiempo y los recursos
para así poder testar un mayor abanico de rasgos lingüístico-estilísticos, pero
debimos por ello renunciar a ciertos datos que habrían ofrecido mayor rigor y
precisión a algunas cuestiones (y que esperamos subsanar fácilmente en el desa-
rrollo de trabajos posteriores).

2. Metodología
Al objeto de identificar diferencias reseñables entre el euskera traducido y el no
traducido, hemos seleccionado dos corpus: uno compuesto por textos literarios
traducidos al euskera y otro conformado por textos literarios en euskera no tra-
ducidos producidos en lengua vasca. Hemos analizado en ellos la frecuencia de
uso de un total de 525 elementos lingüísticos, agrupados en cuatro apartados,
como explicaremos más adelante.

2.1. Corpus
Para nuestro estudio hemos utilizado una parte de Ereduzko Prosa Gaur. 4 Ere-
duzko Prosa Gaur (en adelante EPG) es un corpus creado y gestionado por el
Servicio de Euskera y el Instituto de Euskera de la Universidad del País Vasco,
con la colaboración del Patronato de Euskera del Ayuntamiento de San Sebas-
tián. Se trata de un corpus monolingüe, integrado únicamente por textos en len-
gua vasca, traducidos y no traducidos. Las lenguas de origen de los textos tra-
ducidos son múltiples. EPG se compone de dos subcorpus. Por un lado, un con-
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 67

junto de textos periodísticos, provenientes del diario Berria y de la publicación


semanal Herria, que conforman un total de 12 millones de palabras. Por otro
lado, un subcorpus de textos literarios íntegros, formado por 287 obras literarias
en prosa, que alcanzan los 13,1 millones de palabras. Es un corpus sincrónico,
ya que todos los textos que recoge, tanto los periodísticos como los literarios,
han sido publicados entre 2000 y 2006. EPG está alojado en la página web de la
Universidad del País Vasco y es de acceso libre. Asimismo, cuenta con un ade-
cuado motor de búsqueda que permite realizar búsquedas tanto por lemas como
por palabras enteras, opción muy interesante para lenguas aglutinantes como la
vasca, y tiene capacidad para hacer búsquedas de hasta cinco lemas o palabras
con distintos grados de separación entre ellas. Cabe reseñar que la accesibilidad
del usuario público, tal y como ha sido nuestro caso, se limita a los resultados
de las búsquedas de palabras o lemas contextualizados en aproximadamente dos
o tres líneas de texto. El acceso libre y gratuito a EPG no permite al usuario, por
tanto, disponer de cada uno de los textos que conforman el corpus en su exten-
sión total 5.
Tal y como hemos apuntado, en este estudio comparativo hemos utilizado solo
una parte de EPG; en concreto, el subcorpus de prosa literaria, ya que solo en
este subcorpus se especifica qué textos son traducidos y cuáles no. El subcorpus
de prosa literaria se compone, como hemos indicado, de 287 obras, de las cuales
111 son traducciones y 176 son obras escritas originariamente en euskera. EPG
no especifica el número de palabras que conforman el subcorpus de prosa litera-
ria traducida y el de prosa literaria no traducida. Aun así, su motor de búsqueda
ofrece dos tipos de resultados: número de apariciones totales del indicador soli-
citado en cada uno de los dos subcorpus, por un lado, y número de obras de
cada subcorpus en las que aparece dicho indicador, por otro. Y nuestra expe-
riencia en este estudio en la búsqueda de 525 indicadores nos ha demostrado
que, salvo alguna excepción fácilmente identificable y atribuible a un marcado
uso estilístico de algún autor en concreto (y que nos hemos cuidado de excluir
de los resultados generales), existe en todos los resultados una correlación entre
el número total de apariciones y el número de obras en las que se utiliza cada
indicador en ambos subcorpus. Es por ello que nos hemos permitido utilizar el
número de obras de cada subcorpus como criterio para medir sus tamaños. Para
equilibrar la diferencia entre los tamaños de ambos subcorpus, hemos utilizado
un factor corrector: 1,58 (resultado de dividir 176 entre 111), por el que hemos
multiplicado todos los datos correspondientes al subcorpus de textos traducidos,
tal y como se podrá apreciar en los gráficos más adelante.
El reparto por géneros entre los dos subgrupos es muy similar. Son obras de
ficción un 72,97 % de las traducciones recogidas y un 69,31 % de las obras no
traducidas. Un 24,32 % de las traducciones se engloban en la etiqueta de no
ficción (ensayo, biografía, autobiografía, literatura de viajes...), frente a un

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


68 ISABEL ETXEBERRIA RAMÍREZ

30,68 % de las obras no traducidas. Y finalmente, el teatro tiene una representa-


ción del 2,70 % en las traducciones y del 0 % en las obras escritas originaria-
mente en euskera.
Las obras no traducidas son en su gran mayoría primeras ediciones, por lo que
es de suponer que la fecha de creación de los textos coincide con la fecha de
publicación: es decir, las obras no traducidas fueron escritas aproximadamente
entre 2000 y 2006. 6 En el caso de las traducciones, las fechas de creación de los
textos originales se reparten de la siguiente manera: 30 originales son anteriores
al siglo XX, 29 fueron escritos en la primera mitad del siglo XX y 52 en la se-
gunda mitad del siglo XX. Cabe reseñar, de todos modos, que los usos lingüísti-
cos de los textos traducidos se corresponden con el euskera actual. Es decir, en
ninguna de las traducciones de obras anteriores al siglo XX que se recogen en
EPG han procurado los traductores imitar el euskera del siglo correspondiente,
sino que se han ajustado a las normas y los usos de principios del siglo XXI.
Asimismo, al seleccionar los elementos lingüísticos que hemos utilizado como
indicadores en nuestras búsquedas, hemos puesto especial atención en no incluir
elementos con una marcada carga histórica, cultural y geográfica, y hemos evi-
tado, así, términos correspondientes a la flora o fauna de un determinado lugar,
así como otros términos que pudieran estar íntimamente ligados a ciertos con-
textos socioculturales. Es decir, los indicadores lingüísticos utilizados en este
estudio representan realidades y conceptos que existen y han existido en prácti-
camente todas las épocas y sociedades.7
Las razones que nos han llevado a utilizar EPG son principalmente pragmáticas.
Por un lado, el hecho de ser un corpus ya constituido y de libre acceso, nos
permite ahorrar el tiempo que debiéramos haber dedicado a la compilación de
textos y dedicar más tiempo a la búsqueda y comparación de indicadores. EPG
cuenta además con un adecuado motor de búsqueda, como ya hemos comenta-
do, que, además de posibilitar la búsqueda tanto por lemas como por palabras,
incluye un filtro para limitar la búsqueda a textos traducidos y/o no traducidos.
Por otro lado, se trata de un corpus generalista, de textos no especializados, y
por tanto con una recepción amplia. Los textos pertenecientes a ámbitos más
especializados (científico, administrativo, comercial…) gozan por lo general de
una recepción más reducida en lengua vasca, bien porque se producen en menor
volumen (como en el caso de los textos comerciales o de divulgación científi-
ca), bien porque los lectores suelen preferir la versión castellana (en el caso de
los textos administrativos). Y teniendo en cuenta el punto de partida de nuestro
estudio (las supuestas aportaciones que el euskera traducido está haciendo al
patrimonio y el desarrollo de la lengua), resulta más interesante analizar textos
de recepción general que no pertenezcan a ámbitos por decirlo de alguna mane-
ra endogámicos, en los que tanto la producción como la recepción se restringen
a un limitado y específico número de hablantes.
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 69

EPG es, finalmente, un corpus homogéneo. Se trata, como su nombre indica, de


un corpus de referencia, es decir, compilado según un estándar mínimo de cali-
dad, y consideramos que ese carácter referencial constituye en sí mismo un
factor homogeneizante. Asimismo, encontramos homogeneidad entre los dos
subcorpus de textos traducidos y no traducidos tanto en el reparto por géneros
como en el empleo de usos lingüísticos actuales.
Por supuesto, existe un factor que escapa a este equilibrio u homogeneidad entre
el subcorpus de textos traducidos y el de los no traducidos, y es el de la calidad
literaria de los textos. Sin ánimo ninguno de cuestionar el en nuestra opinión
excelente estado de salud de la literatura vasca contemporánea, no debemos
olvidar que los textos literarios no traducidos compilados para este corpus de
referencia han sido escogidos entre la producción literaria de una comunidad de
alrededor de 700.000 hablantes, mientras que las obras traducidas han pasado
previamente por un filtro de calidad nada desdeñable: han sido escogidas para
ser traducidas al euskera entre los millones de obras literarias publicadas a lo
largo de la historia en otros idiomas. En cualquier caso, no es nuestro objetivo
hacer un juicio de valor de las aptitudes lingüísticas, estilísticas y literarias de
unos y otros autores, sino tratar de caracterizar el euskera literario traducido
para comprender mejor qué tipo de aportaciones puede estar haciendo al desa-
rrollo de la lengua.

2.2. Indicadores lingüísticos


En los dos corpus de textos literarios traducidos y no traducidos hemos querido
testar cuatro rasgos principales: la diversidad y riqueza léxica, la precisión se-
mántica, algunos usos distintivos del euskera y algunos usos lingüísticos rela-
cionados con el proceso de estandarización de la lengua.

2.2.1. Diversidad y riqueza léxica


Con el objeto de medir la diversidad y riqueza léxica de ambos corpus, hemos
creado grupos de sinónimos y parasinónimos, y hemos comparado cuántas va-
riantes y en qué proporción se utilizan en cada corpus. Se trata de un total de 47
grupos de sinónimos de muy variado tamaño, desde grupos de tres variantes
hasta grupos de 21, pertenecientes a diversas categorías gramaticales: sustanti-
vos, adjetivos, adverbios, verbos y algunos tipos de conectores. Siempre que
fuera posible hemos procurado incluir en los grupos variantes dialectales, va-
riantes de registro y préstamos. Finalmente, hemos cuantificado cuántas de las
variantes de cada grupo de sinónimos se utilizan en ambos corpus, y con qué
frecuencia se utiliza cada variante. He aquí, a modo de ejemplo, algunos de los
47 grupos de sinónimos y parasinónimos:

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


70 ISABEL ETXEBERRIA RAMÍREZ

• [distira, dirdira, dirdai, distirapen, dizdiz, diz-diz, distiradura, ñirñir,


ñir-ñir, izarniadura, erlantz, bristada, erluz, leinuru]: sinónimos para el
concepto de brillo, entre los que distiradura y erlantz, por ejemplo, son
de registro alto y señalados como de escasa frecuencia en el diccionario
de la Academia de la Lengua Vasca (Hiztegi batua, en adelante HB), e
izarniadura y leinuru aparecen como variantes de los dialectos de la
zona vascofrancesa.
• [lastaira, koltxoi, matalaz]: colchón, entre los que koltxoi y matalaz son
préstamos del castellano y del francés respectivamente, y lastaira es la
variante recomendada por el diccionario de la Academia.
• [ergel, lerdo, tentel, memelo, mozolo, inozo, babo, babalore, tonto, tun-
tun, kokolo, txotxolo, zozo, pepelerdo, tontolapiko, tutulu, txatxu]: gru-
po de sinónimos para el concepto de tonto.
• [agian, apika, ausaz, beharbada, menturaz, akaso, igual/igoal, heldu-
bada]: sinónimos para quizás, entre los que akaso e igual/igoal apare-
cen señalados como de bajo registro en HB, y heldubada como variante
del dialecto suletino.

2.2.2. Precisión semántica


En esta parte del estudio hemos querido conocer la capacidad de precisión y
especificación en los textos, para lo que hemos creado cuatro grupos de hipóni-
mos. Por un lado, los grupos formados por los colores rojo, azul y verde y sus
correspondientes matices y, por otro, un grupo de hipónimos que conforman el
campo semántico de los tejidos. Veámoslos:
• [gorri, gorrixka, gorriska, gorrizta, gorrimin, gorrail, gorrikara, bermi-
loi, karmin-koloreko, purpura, eskarlata, gorrindol, granate]: rojo, ro-
jizo, colorado, encarnado, bermejo, bermellón…
• [urdin, oztin, urdinxka, urdinska, urdinsko, urdinkara, urdinarre, urdi-
nantz, urdiño, zeru-urdin, itsas(o-)urdin, urdin elektriko, (urdin) tur-
kesa, (urdin-)anil, altzairu-urdin, arbel-urdin]: azul, azulado, azulino,
azul cielo, azul eléctrico, azul marino, añil, (azul) turquesa…
• [berde, orlegi, botila-berde, esmeralda-berde, sagar-berde, oliba-
berde, berdezka, berdexka, berdaxka, berdekara, berdetsu, berdats,
berdail]: verde, verdoso, verdusco, verde botella, verde esmeralda…
• [flanela, franela, belus, satin, saten, liho, gaza, muselina, popelina, po-
liester, nylon, tafeta, mahoi, mahon, feltro, fieltro, tul, pana, belus il-
daskatu]: franela, terciopelo, satén, lino, gasa, muselina, popelina, po-
liéster, nailon, tafetán, mahón, fieltro, tul, pana.
Una vez más, hemos calculado cuántas de las variantes se utilizan en cada cor-
pus y con qué frecuencia.
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 71

2.2.3. Usos lingüísticos distintivos del euskera


En este apartado hemos querido conocer el comportamiento de traductores y
escritores vascos en la utilización de ciertas estructuras lingüísticas distintivas
del euskera. Se trata de elementos lingüísticos que no tienen traducción directa
en la mayoría de las lenguas de las que se suele traducir al euskera y que de
hecho conforman el grueso de las obras de origen del subcorpus de textos tradu-
cidos analizado o, en su defecto, de las lenguas puente comúnmente utilizadas
por los traductores vascos: español, inglés, francés, alemán, ruso, italiano, por-
tugués, catalán y gallego. En principio, se podría pensar que en los textos tradu-
cidos, al no encontrar el traductor un estímulo en el texto de origen que lo lleve
a utilizar dichos elementos particulares del euskera, difícilmente se activará esta
opción en su mente y por tanto la frecuencia de uso de este tipo de elementos
será menor en los textos traducidos que en los no traducidos. Nos acercamos de
algún modo en el planteamiento de esta cuestión a lo que en el debate sobre los
universales de traducción se ha venido en llamar elemento único o unique item
y que ha sido estudiado por, entre otros, Mauranen (2000), Tirkkonen-Condit
(2004), Eskola (2004) y Chesterman (2007). El hecho de que el subcorpus de
textos traducidos de nuestro estudio esté formado por obras traducidas al euske-
ra desde múltiples lenguas no nos permite hablar con total rigor de elementos
únicos. Consideramos, sin embargo, que, debido precisamente a la gran diversi-
dad de las lenguas de origen correspondientes a dichos textos traducidos, las
escasas ocasiones en las que los elementos que hemos seleccionado como usos
distintivos del euskera pudieran tener equivalente directo en alguna otra lengua
representan, en proporción al total de apariciones de dichos usos en el subcor-
pus de textos traducidos, un peso poco significativo e insuficiente para restar
valor a la información que sobre esta cuestión nos pueda aportar la comparación
de los dos subcorpus (en el contexto, no lo olvidemos, de un estudio que no
tiene como objeto verificar rigurosa y exhaustivamente un número reducido de
hipótesis sino arrojar luz sobre líneas de investigación que puedan resultar fruc-
tíferas en trabajos posteriores).
En nuestro estudio hemos seleccionado seis elementos o usos lingüísticos, que
enumeramos y explicamos a continuación. Se trata en todos los casos (a excep-
ción quizás del último grupo) de usos morfosintácticos de registro más bien alto
que suelen presentar una baja frecuencia de uso en actos de habla cotidianos.
• [Bi-biak, bi-biei, bi-biekin, bi-bietan…]: los dos, a los dos, con los dos,
en los dos… / [biak ala biak, biei ala biei, biekin ala biekin, bietan ala
bietan…]: los dos, a los dos, con los dos, en los dos…
Los grupos bi-biak y biak ala biak tienen el mismo significado y uso, y se utili-
zan como variante enfática del sintagma no marcado biak (los dos), en todos los
casos declinativos: biak (los dos), biei (a los dos), biekin (con los dos), bientzat

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


72 ISABEL ETXEBERRIA RAMÍREZ

(para los dos), etc. Vendrían a equivaler a la utilización de tous les deux en
francés, siendo biak el equivalente de la variante no marcada les deux, y tanto
bi-biak como biak ala biak los equivalentes a la variante enfática tous les deux.
En principio, a excepción de cuando se deba traducir precisamente la expresión
tous les deux de un texto francés, no encontrará el traductor nada en el texto de
origen que le haga decantarse por biak en lugar de bi-biak.
• Ezean
Ezean es una conjunción que aúna las funciones de partícula condicional y ne-
gativa. Equivaldría a si no. Cabe reseñar, en todo caso, que en euskera se pue-
den (y es habitual) formular las condiciones negativas por medio de dos partícu-
las independientes, como en el resto de lenguas: ba-, que significa si, y ez que
significa no.
Amaia etortzen EZ BAda, ezin izango gara hasi. → Si no viene Amaia, no po-
dremos empezar.
Amaia etorri EZEAN, ezin izango gara hasi. → Si no viene Amaia, no podremos
empezar.
Por medio de nuestro estudio comparativo queremos comprobar hasta qué punto
un traductor que se encuentre ante la necesidad de traducir una oración condi-
cional negativa se decantará por la traducción más directa (ez ba-) o, por el con-
trario, optará por el uso distintivo del euskera ezean.
• Non (eta) ez… -n
Non (eta) ez… -n es una conjunción condicional negativa, que, al igual que en el
caso de ezean, tiene un equivalente más directo en ez ba- (si no).
Etorriko gara, non eta ez duen euria egiten. → Vendremos si no llueve.
Etorriko gara, euria egiten ez badu. → Vendremos si no llueve.
• -ene(n)tz
-ene(n)tz es una partícula que se usa como sufijo de los verbos en la oraciones
interrogativas indirectas con el significado o no, y que puede ser sustituida por
el equivalente más directo respecto a otras lenguas ala ez.
Etorri den ALA EZ jakin nahi du. → Quiere saber si ha venido o no.
Etorri denE(N)TZ jakin nahi du. → Quiere saber si ha venido o no.
• Nor eta, zer eta, non eta, noiz eta…
Nor eta, zer eta, non eta… es una expresión utilizada para mostrar sorpresa y
que enfatiza un sintagma dentro de la oración. Literalmente se traduciría de la
siguiente manera: nor eta Ainhoa (quién y Ainhoa), zer eta pastel bat (qué y un
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 73

pastel), non eta Bartzelonan (dónde y en Barcelona). Y en significado equival-


dría a precisamente.
Non eta Bartzelonan topatu nuen Pariseko nire laguna → Me encontré con mi
amiga de París precisamente en Barcelona.
Nork eta Peruk esan hori! → ¡Mira que decirlo Peru!
En el contexto de esta misma hipótesis, hemos estudiado un subgrupo de ele-
mentos distintivos del euskera formado por onomatopeyas. El euskera se carac-
teriza por contar con muchos vocablos de origen onomatopéyico. Teniendo en
cuenta que en muchas ocasiones un concepto que en una lengua se puede expre-
sar por medio de una onomatopeya no puede ser formulado por otra onomato-
peya en otra lengua, hemos querido comprobar en qué medida recurren los tra-
ductores vascos a este tipo de elementos únicos. Es decir, si en euskera para
expresar que un rumor ha corrido de boca en boca podemos utilizar, además de
la traducción literal (y totalmente correcta y válida) ahoz aho, la voz onomato-
péyica bolo-bolo, ¿en qué medida serán conscientes los traductores vascos de
que también pueden recuperar esta opción?

2.2.4. Usos lingüísticos relacionados con el proceso de estandarización


de la lengua
En este último apartado hemos querido analizar las frecuencias de uso de ciertos
términos que evidencian la situación de diglosia y de desarrollo todavía no to-
talmente normalizado de la lengua vasca. Se trata de objetos de la vida cotidiana
que los hablantes suelen designar por medio de préstamos; es decir, aun contan-
do con vocablos eusquéricos recogidos (y en su gran mayoría priorizados) en
los diccionarios, los hablantes suelen preferir el préstamo castellano o francés,
bien porque el neologismo eusquérico les resulta artificial, bien porque senci-
llamente no la conocen.
Con este fin, hemos conformado cinco campos semánticos de sustantivos que
designan objetos cotidianos, cuidando de incluir tanto neologismos en euskera
como voces prestadas, y hemos comparado la frecuencia de uso en los dos cor-
pus:
• Electrodomésticos: [irabiagailu, batidora], [(t)xigorgailu, tosta-
dor(e)(a)], [zukugailu, esprimidor(e)(a)]…
• Bricolaje: [bihurkin, birabis, destornillador(e)(a)], [azkoin, tuerka]…
• Utensilios de cocina: [(kortxo) kentzeko, (tapoi) kentzeko, kortxo-
torloju/o, kortxo(ak) ateratzeko, sakakortxos], [(poto) irekigailu, (poto)
irekitzeko, (lata) irekigailu, (lata) irekitzeko, (ontzi) irekigailu, (ontzi)
irekitzeko, abrelatas]…

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


74 ISABEL ETXEBERRIA RAMÍREZ

• Costura: [kateorratz, ixteko orratz] (=imperdible), [botoi-zulo, begi-


te](=ojal)…
• Accesorios del automóvil: [eskularru-kaxa, eskularruen kutxa, guante-
ra], [kolpe-leungailu, kolpetako, kolpebabes, paratxoke]…
Nuestra hipótesis es que los traductores, por encontrarse obligados a expresar en
euskera lo que establece el texto de origen, no pueden eludir este tipo de pala-
bras, a diferencia de los escritores, a los que, como aducía Anjel Lertxundi, no
se les exige correspondencia entre lo que habían concebido y lo que finalmente
han escrito. Si se nos permite la broma, se podría decir que los escritores vascos
evitarán en la medida de lo posible que las guanteras o las batidoras desempe-
ñen un papel importante en las tramas de sus novelas, para no tener que utilizar
los vocablos eskularru-kutxa o irabiagailua, que a día de hoy resultan cierta-
mente extraños a la gran mayoría de los hablantes vascos, mientras que en las
obras traducidas el empleo de dichas palabras podría ser más frecuente, si así lo
estableciera el texto de origen. Nuestro objetivo, por tanto, consiste en compro-
bar si realmente aparece más ampliamente representado este tipo de vocablos en
la literatura traducida, y cómo se comportan los traductores y los escritores vas-
cos en la elección entre neologismos eusquéricos y voces prestadas.

2.3. Análisis de datos


Tal y como indicábamos más arriba, EPG cuenta con un motor de búsqueda y
cálculo de frecuencias ágil y fiable, y ofrece cada una de las apariciones del
término buscado inserta en su oración correspondiente, lo que supone una longi-
tud de contexto suficientemente amplia para poder verificar los resultados. He-
mos aprovechado esta herramienta del contexto para verificar uno a uno todos
los resultados ofrecidos por el buscador de EPG manualmente, a fin de evitar
errores tales como confundir las dos acepciones principales del adjetivo gorri
(el color rojo y el adjetivo intensificador crudo o intenso, como en negu gorria
o crudo invierno), o poder descartar del cómputo total de apariciones contextos
como Cruz Roja o la Plaza Roja de Moscú (y es que en dichos contextos no ha
habido obviamente una intención del autor por priorizar el adjetivo rojo frente a
rojizo, colorado o bermejo).

3. Resultados del análisis


A continuación pasamos a resumir los datos más relevantes extraídos de la
comparación entre los dos corpus.
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 75

3.1. Diversidad y riqueza léxica


En lo que respecta a la diversidad y riqueza léxica, es decir, al número de va-
riantes sinonímicas utilizadas en cada corpus y la frecuencia de utilización de
cada una de ellas, los resultados han sido poco espectaculares. Ciertamente las
cifras son muy parecidas en ambos corpus. Se utilizan la misma cantidad de
variantes en los textos traducidos y en los no traducidos, y se utilizan en fre-
cuencias muy similares. Veamos algunos ejemplos.
En este primer gráfico podemos observar que los tres sinónimos propuestos para
el verbo sacudir (astindu, dardarazi, inarrosi) muestran una frecuencia de uso
similar en los dos corpus y por tanto una proporción parecida en el peso de cada
variante respecto al conjunto de sinónimos. Es decir, tanto en los textos traduci-
dos como en los no traducidos astindu es la variante más utilizada, seguida en
segundo lugar por inarrosi y en última posición por dardarazi. 8

Gráfica 1. Frecuencias de uso del grupo de sinónimos astindu, dardarazi, inarrosi (sa-
cudir) en textos traducidos (T) y no traducidos (NT)
Ocurre lo mismo en el grupo de las variantes sinonímicas maiz, sarri, usu…,
que equivalen a a menudo:

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


76 ISABEL ETXEBERRIA RAMÍREZ

Gráfica 2. Frecuencias de uso del grupo de sinónimos maiz, sarri, usu, behin eta berriz,
behin eta behin... (a menudo) en textos traducidos (T) y no traducidos (NT)
Los resultados son muy parecidos en el grupo formado por las variantes sino-
nímicas de ahalik eta… -en (lo más… posible):

Gráfica 3. Frecuencias de uso del grupo de sinónimos ahalik eta... -en, ahal den... -en,
hainbat... -en, albait... -en (lo más ... posible) en textos traducidos (T) y no traducidos
(NT)
La tendencia que reflejan estos tres ejemplos se repite sistemáticamente en la
práctica totalidad de grupos de sinónimos. No se observa, por tanto, que en uno
de los corpus haya mayor diversidad y riqueza sinonímica que en el otro. Al
contrario, el número de variantes utilizadas y la frecuencia de utilización de
dichas variantes es muy similar en ambos corpus.
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 77

Por otro lado, hemos podido extraer alguna información transversal del análisis
de estos grupos de sinónimos. Como ya comentábamos, al formar los grupos
procuramos incluir variantes dialectales, de registro y préstamos. Pues bien,
hemos detectado que, aunque la frecuencia de uso de las variantes dialectales es
muy parecida en ambos corpus, en las contadas ocasiones en las que se presenta
algún desequilibrio, suele ser en el corpus de los textos no traducidos donde se
observa un mayor uso de estas variantes. Retomemos el ejemplo de la gráfica 2
y observaremos un pequeño desequilibrio en la variante usu o usuki, utilizada en
los dialectos de la zona vascofrancesa.

Gráfica 2. Frecuencias de uso del grupo de sinónimos maiz, sarri, usu, behin eta berriz,
behin eta behin... (a menudo) en textos traducidos (T) y no traducidos (NT)
Algo parecido ocurre en el grupo de sinónimos noizbehinka, noizean behin,
noizik behin, aldian behin… (de vez en cuando). En este grupo, tal y como
muestra la gráfica 4, se observa una mayor utilización en el corpus de los textos
no traducidos de la variante vizcaína lantzean behin y de noiztenka, de la zona
vascofrancesa.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


78 ISABEL ETXEBERRIA RAMÍREZ

Gráfica 4. Frecuencias de uso del grupo de sinónimos noizbehinka, noizean behin, noi-
zik behin, aldian behin, lantzean behin... (de vez en cuando) en textos traducidos (T) y
no traducidos (NT)
Lo mismo ocurre con la variante de los dialectos orientales alta dentro del gru-
po alta, alabaina, alabadere (sin embargo), según se observa en la gráfica 5:

Gráfica 5. Frecuencias de uso del grupo de sinónimos alta, alabaina y alabadere (sin
embargo) en textos traducidos (T) y no traducidos (NT)
En muchas de las ocasiones en las que, como en los ejemplos anteriores, se da
una sobrerrepresentación de una variante dialectal concreta en los textos no
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 79

traducidos, el desequilibrio es debido al uso de un escritor en concreto. No pa-


rece que podamos generalizar y concluir, por tanto, que los escritores recurren
más a las variantes dialectales que los traductores, pero sí cuando menos que la
tendencia a favorecer los usos dialectales está más generalizada entre escritores
que entre traductores.
Otro aspecto a reseñar es la mayor utilización en el corpus de los textos no tra-
ducidos de préstamos y variantes señaladas por la Academia como no recomen-
dadas. En la gráfica 6 podemos observar que las dos variantes que presentan una
diferencia importante (más de 30 puntos de diferencia) entre los dos corpus son
dos préstamos señalados como de registro coloquial y no recomendados para la
variedad estándar por HB: akaso e igual/igoal.

Gráfica 6. Frecuencias de uso del grupo de sinónimos agian, apika, ausaz... (quizás) en
textos traducidos (T) y no traducidos (NT)
Otro ejemplo claro lo encontramos en el grupo de sinónimos de ihes egin (esca-
par). En este grupo, la variante eskapatu, préstamo del castellano, se utiliza más
en los textos no traducidos, mientras que con la variante itzuri, que pertenece a
un registro más culto, ocurre a la inversa.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


80 ISABEL ETXEBERRIA RAMÍREZ

Gráfica 7. Frecuencias de uso del grupo de sinónimos ihes egin, alde egin, hanka egin...
(escapar) en textos traducidos (T) y no traducidos (NT)
En la gráfica 8, por último, hemos recogido los datos referentes a lastaira (col-
chón) y los dos préstamos con los que suele ser sustituido y que se recogen en
HB como no recomendados: koltxoi, del español, y matalaz, del francés.

Gráfica 8. Frecuencias de uso del grupo de sinónimos lastaira, koltxoi y matalaz (col-
chón) en textos traducidos (T) y no traducidos (NT)
Estos datos y otros de índole similar (inportantzia, puñal, kalabozo…) parecen
apuntar, por tanto, a un mayor ajuste a la norma por parte de los traductores que
de los escritores.
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 81

3.2. Precisión semántica


En lo que respecta a la capacidad de especificación y precisión semántica, los
datos no dejan lugar a dudas. Recordemos que en esta parte de nuestro estudio
pretendíamos comparar la utilización de términos que de alguna manera matizan
o detallan el significado. Pues bien, en los cuatro campos analizados hemos
encontrado una mayor tendencia a la precisión y el detalle en los textos traduci-
dos que en los no traducidos. Observemos el grupo formado por matices del
color azul. No solo se utiliza una mayor variedad de términos en los textos tra-
ducidos que en los no traducidos (de hecho, vocablos como urdinantz, urdiño,
itsas urdin, altzairu urdin y arbel urdin no aparecen ni una sola vez en el corpus
de textos no traducidos), sino que todos ellos se utilizan con mayor frecuencia
en los textos traducidos.

Gráfica 9. Frecuencias de uso del grupo semántico matices del color azul en textos
traducidos (T) y no traducidos (NT)
En el grupo de matices del color verde la tendencia general se repite. En esta
ocasión encontramos dos términos que han sido utilizados únicamente en los
textos no traducidos (berdats y berdail, con una única aparición), y un tercer
término (orlegi) en el que la frecuencia de uso es mayor en el corpus de las no
traducciones que en el de las traducciones. En el resto de indicadores encontra-
mos una clara prominencia en el corpus de los textos traducidos.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


82 ISABEL ETXEBERRIA RAMÍREZ

Gráfica 10. Frecuencias de uso del grupo semántico matices del color verde en textos
traducidos (T) y no traducidos (NT)
Los datos son igualmente evidentes para el grupo de matices del color rojo,
reflejados en la gráfica 11:

Gráfica 11. Frecuencias de uso del grupo semántico matices del color rojo en textos
traducidos (T) y no traducidos (NT)
Y por último, en el grupo semántico de los tejidos encontramos datos aún más
contundentes si cabe. Dos de los términos solo se utilizan en los textos traduci-
dos: popelina y poliéster. Un único término se utiliza exclusivamente en los
textos no traducidos: mahón. Y prácticamente todos los términos son empleados
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 83

en mayor número de libros en el corpus de las traducciones que en el de los


libros no traducidos, excepto dos: el ya citado mahón y las dos variantes para
designar la pana (pana, en la zona vascoespañola, y belus ildaskatu, en la zona
vascofrancesa).

Gráfica 12. Frecuencias de uso del grupo semántico tejidos en textos traducidos (T) y no
traducidos (NT)
La contundencia de los datos contrasta claramente con lo que en la propuesta de
los universales de traducción ha venido en llamarse universal de simplificación.
De hecho, los resultados de nuestro estudio comparativo muestran una mayor
tendencia a la matización semántica en los textos traducidos que en los no tra-
ducidos. Guiados por el sentido común, se podría aventurar que esta diferencia
se debe a una mayor precisión semántica en los textos de origen de los textos
traducidos que en los textos de escritores vascos. Tratándose el nuestro de un
corpus comparable y puesto que no disponemos de dichos textos de origen, esta
hipótesis debe quedar por ahora sin comprobar. Si en un futuro pudiéramos
verificar esta cuestión, surgiría entonces una pregunta más interesante aun: ¿por
qué encontramos una mayor precisión semántica en los textos literarios selec-
cionados para ser traducidos al euskera que en los de los escritores vascos? Tal
y como apuntábamos más arriba, al hablar sobre la homogeneidad entre los dos
subcorpus comparados, una posible explicación reside en la calidad literaria de
los textos: recordemos que estamos comparando textos seleccionados de entre la
producción literaria de una comunidad de 700.000 hablantes a lo largo de siete
años (subcorpus de textos no traducidos) con obras seleccionadas de la historia
de la literatura universal para ser traducidas al euskera precisamente por su ca-
rácter referencial (subcorpus de textos traducidos). Pero aun así, es evidente que
la riqueza y la precisión semántica no son por sí mismas garantes de la calidad
literaria y que por tanto una obra considerada referencial en términos literarios
no tiene por qué caracterizarse por su riqueza y precisión semánticas.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


84 ISABEL ETXEBERRIA RAMÍREZ

3.3. Usos distintivos del euskera


Los datos correspondientes a los usos o elementos distintivos del euskera no
muestran grandes diferencias entre los corpus, ni evidencias notorias de una
mayor preferencia por este tipo de elementos entre unos u otros tipos de autores,
lo cual consideramos que es en sí un dato significativo y a tener en cuenta. En
general, la frecuencia de uso de estos elementos es muy parecida en ambos cor-
pus, salvo pequeñas oscilaciones que no parecen responder a ninguna tendencia
sistemática.
En la gráfica 13 se recoge la cantidad de usos de la forma enfática biak ala biak
(tous les deux, tanto el uno como el otro) en todos los casos de declinación en
que la hemos encontrado. Salvando las pequeñas fluctuaciones de un caso de
declinación a otro, y si sumamos los totales, observamos que el empleo de esta
estructura es muy parecido en ambos corpus, incluso un poco mayor entre los
textos traducidos: se emplea en 69,52 obras traducidas y en 63 obras no traduci-
das.

Gráfica 13. Frecuencias de uso del elemento distintivo del euskera biak ala biak (forma
enfática de los dos) en todos los casos de declinación encontrados, en textos traducidos
(T) y no traducidos (NT)
En la gráfica 14 hemos agrupado los datos correspondientes a los otros elemen-
tos distintivos del euskera. Un vez más, encontramos frecuencias de uso muy
parecidas en ambos corpus, con ligeros altibajos:
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 85

Gráfica 14. Frecuencias de uso de diversos usos exclusivos del euskera en textos tradu-
cidos (T) y no traducidos (NT)
En el empleo de las onomatopeyas, por otra parte, tampoco encontramos una
sobrerrepresentación en ninguno de los dos corpus. En la gráfica 15 hemos
agrupado siete de los 25 grupos onomatopéyicos. Existen algunas oscilaciones,
como se puede observar, de las que no se puede concluir ningún comportamien-
to regular.

Gráfica 15. Frecuencias de uso de diversas onomatopeyas como usos distintivos del
euskera en textos traducidos (T) y no traducidos (NT)

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


86 ISABEL ETXEBERRIA RAMÍREZ

En todo caso, consideramos que esta falta de sobrerrepresentación muy marcada


es un dato significativo en sí. Es decir, nuestras sospechas apuntaban a que este
tipo de elementos distintivos del euskera aparecerían infrarrepresentados en el
corpus de los textos traducidos, ya que, tal y como argumentábamos más arriba,
al no encontrar el traductor en el texto de origen un estímulo (un equivalente
directo) que active esa opción en su mente, es de esperar que recurra con menos
frecuencia a estos elementos. El hecho de que la frecuencia de uso sea parecida
e incluso en ocasiones mayor en los textos traducidos se puede explicar en nues-
tra opinión por una muy desarrollada competencia lingüística de los traductores.
Es decir, los traductores vascos deben hacer un esfuerzo cognitivo mayor que
otros traductores para encontrar y activar opciones lingüísticas en su mente, por
dos razones principales: por la distancia tipológica entre el euskera y las más
habituales lenguas desde las que suele traducir, por un lado, y por las carencias
en el desarrollo léxico, morfosintáctico y estilístico del euskera causadas por su
situación de diglosia, por otro. Y asimismo, deben hacer un mayor esfuerzo
cognitivo que sus cohablantes vascos no traductores al producir actos de habla,
puesto que tienen que ofrecer soluciones a los retos que les impone el texto de
origen. La recurrencia de este esfuerzo haría que los resultados de estas búsque-
das activas se enraícen, neurológicamente hablando, en los procesos de habla de
los traductores y presenten en el futuro una mayor prominencia en sus produc-
ciones.

3.4. Usos lingüísticos relacionados con el proceso de estandarización de


la lengua
En el apartado referente a los usos lingüísticos más o menos desequilibrados
relacionados con el proceso de estandarización de la lengua, finalmente, las
evidencias no han resultado demasiado concluyentes, principalmente porque las
cifras de apariciones son muy pequeñas. Atendiendo a los totales, sin embargo,
se pueden avanzar algunas tendencias;se observa una vez más, por ejemplo, que
los textos de los traductores son más ajustados a la norma.
En la gráfica 16 hemos recogido el grupo semántico de los electrodomésticos.
Las columnas de la izquierda recogen los neologismos eusquéricos propuestos
por los diccionarios para designar a dichos objetos y las columnas de la derecha
recogen los préstamos comúnmente utilizados por el hablante corriente. Los
totales confirman una mayor tendencia a las variantes estándares eusquéricas
entre los traductores: en el corpus de las traducciones hemos encontrado térmi-
nos eusquéricos en 25,28 obras, mientras que los términos prestados se utilizan
en solo 3,16 libros. En el corpus de los textos no traducidos la diferencia entre
ambas cifras es proporcionalmente menor: en 37 obras se utilizan las variantes
eusquéricas y en 16 los préstamos.
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 87

T NT T NT

irabiagailu 6,32 1 batidor(e)(a) 0 1

SUBTOTAL 6,32 1 SUBTOTAL 0 1

(t)xigorgailu 6,32 2 tostador(e)(a) 0 0

SUBTOTAL 6,32 2 SUBTOTAL 0 0

zukugailu 0 0 esprimidor(e)(a) 0 0

SUBTOTAL 0 0 SUBTOTAL 0 0

(plater/ontzi) ikuzgailu 0 0 lababajillas 0 0


TÉRMINOS EUSQUÉRICOS

TÉRMINOS PRESTADOS
(plater/ontzi) garbigai-
1,58 3
lu

SUBTOTAL 1,58 3 SUBTOTAL 0 0

garbigailu 1,58 23 labadora 0 4

ikuzgailu 1,58 4

SUBTOTAL 3,16 27 SUBTOTAL 0 4

xurgagailu 1,58 1 aspiragailu 0 2

aspirador(e)(a) 0 3

SUBTOTAL 1,58 1 SUBTOTAL 0 5

lisaburdina 6,32 2 plantxa 3,16 6

lisagailu 0 1

SUBTOTAL 6,32 3 SUBTOTAL 3,16 6

25,2 TOTAL 3,16 16


TOTAL 37
8
Gráfica 16. Frecuencias de uso del grupo semántico de los electrodomésticos, clasifica-
do por términos eusquéricos y términos prestados, en textos traducidos (T) y no traduci-
dos (NT)
Podría sorprender el hecho de que se designan más este tipo de objetos en las
obras no traducidas que en las traducidas (en contra de nuestras expectativas, ya
que intuíamos un intento de los escritores vascos por evitar este tipo de térmi-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


88 ISABEL ETXEBERRIA RAMÍREZ

nos). Ciertamente, si sumamos las voces eusquéricas y las prestadas en ambos


corpus, conseguimos un total de 28,44 para los textos traducidos y 53 para los
no traducidos. Pero no se debe pasar por alto que 23 de los 37 casos en que
obras no traducidas han utilizado una voz eusquérica se correponden con la
palabra garbigailu (lavadora). En este caso, por tanto, un único indicador des-
equilibra de manera notoria el sentido del total.
Cifras de aparición demasiado reducidas y desajustes parecidos al que acabamos
de mencionar se repiten en el resto de grupos semánticos analizados, lo que
dificulta extraer conclusiones generales. Resulta evidente que esta parte del
estudio debe ser reforzada con más y más amplios campos semánticos.

4. Conclusiones
Proponíamos como objetivo para este estudio identificar características distinti-
vas de la lengua traducida, en el contexto de un idioma —el euskera— en situa-
ción de diglosia y que por tanto presenta una proporción de traducciones respec-
to a la producción textual general más grande que en las lenguas hegemónicas,
en vistas a que esa caracterización nos pudiera dar pistas para comprender cómo
influyen las traducciones en el desarrollo léxico, morfosintáctico y estilístico de
la lengua. Y, ciertamente, aunque hemos encontrado similitudes, también hemos
descubierto diferencias reseñables entre los dos corpus en algunos aspectos.
Hemos hallado señales de que la lengua de las traducciones es más ajustada a la
norma que la de los textos no traducidos. En los textos de los traductores se
cuidan más las recomendaciones de diccionarios, gramáticas, etc., y se tiende a
rehuir los préstamos cuando existen equivalentes eusquéricos válidos; especial-
mente cuando dichos préstamos pertenecen a un registro bajo. Asimismo, aun-
que la lengua traducida no elude las variantes dialectales, es más habitual y
evidente el esfuerzo por colorear dialectalmente la lengua estándar en los textos
no traducidos que en los traducidos.
Hemos detectado también una mayor tendencia a la precisión, el detalle y el
matiz en el plano semántico en el euskera de las traducciones. En cierta manera
contrasta esta evidencia con el hecho de que a nivel de variedad léxica (el nú-
mero de variantes sinonímicas utilizadas y la frecuencia de uso) no hayamos
encontrado apenas diferencias entre los dos corpus. Probablemente un estudio
de la diversidad léxica a nivel de todos los lexemas de ambos corpus (propor-
ción entre tokens y types) podrá arrojar luz a esta cuestión.
Por último, quisiéramos remarcar las similitudes halladas en el uso de los ele-
mentos distintivos del euskera, que nos atrevemos a considerar manifestación de
la alta competencia lingüística y del buen hacer de los traductores vascos con-
PANA Y TERCIOPELO EN LA LITERATURA VASCA TRADUCIDA Y NO TRADUCIDA… 89

temporáneos, tal y como era de esperar, por otra parte, en un corpus que se defi-
ne a sí mismo como de referencia.

5. Bibliografía
Baker, Mona. 1993. Corpus linguistics and translation studies. Implications and applica-
tions. @ M. Baker, G. Francis y E. Tognini-Bonelli eds. Text and technology.
In honour of John Sinclair. Amsterdam/Philadelphia: John Benjamins, ISBN
9789027221384, pp. 233-250.
Chesterman, Andrew. 2007. What is a unique item? @ Y. Gambier, M. Shlesinger y R.
Stolze eds. Doubts and Directions in Translation Studies. Amster-
dam/Philadelphia: John Benjamins, ISBN 9789027216809, pp. 3-13.
Eskola, Sari. 2004. Untypical frequencies in translated language. A corpus-based study
on a literary corpus of translated and non-translated Finnish. @ A. Mauranen y
P. Kujamäki eds. Translation universals. Do they exist? Amster-
dam/Philadelphia: John Benjamins, ISBN 9789027216540, pp. 83-99.
Even-Zohar, Itamar. 1990. Polisystem studies. @ Poetics today 11: 1. Durham: Duke
University Press.
Lertxundi, Anjel. 1993. @ Jakin 79: 59-60. ISSN 0211-495X.
V Mapa sociolingüístico 2011. 2014. Vitoria-Gasteiz: Servicio de Publicaciones del
Gobierno Vasco. ISBN 9788445733462.
Mauranen, Anna. 2000. Strange strings in translated language. A study on corpora. @
M. Olahan ed. Intercultural faultlines. Research models in Translation Studies.
Textual and cognitive aspects. Manchester: St. Jerome, ISBN 1900650444 pp.
119-141.
Tirkkonen-Condit, Sonja. 2004. Unique items . Over- or under-represented in translated
language? @ A. Mauranen y P. Kujamäki eds. Translation universals. Do they
exist?Amsterdam/Philadelphia: John Benjamins, ISBN 9789027216540, pp.
177-184.
Torrealdai, Joan Mari. 1997. Euskal kultura gaur. Donostia: Jakin-Elkarlanean Funda-
zioa. ISBN 84-922537-0-3
Torrealdai, Joan Mari. 2013. Euskal liburugintza 2012. @ Jakin 198: 11-52. ISSN 0211-
495X.

1
Este artículo resume parte de una investigación que llevé a cabo como trabajo de fin de máster
en el Máster Universitario de Lingúística y Filología Vasca de la Universidad del País Vasco bajo
la dirección de Gidor Bilbao Telletxea, a quien quiero agradecer una vez más la disponibilidad, la
generosidad y el sentido común que me mostró en su trabajo de acompañamiento y dirección.
Quiero agradecer asimismo a los tres profesores que formaron el tribunal evaluador de esta inves-
tigación, Xabier Artiagoitia, Gotzon Aurrekoetxea y Arantzazu Elordieta, por las observaciones y

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


90 ISABEL ETXEBERRIA RAMÍREZ

correcciones con que enriquecieron esta investigación. Finalmente, agradezco sus valiosas aporta-
ciones al anónimo evaluador o evaluadora que ha revisado este texto antes de su publicación.
2
Se considera el año 1967 el comienzo del proceso de estandarización de la lengua vasca, puesto
que en aquel año se presentó y debatió, en una serie de reuniones de la Academia de la Lengua
Vasca, el primer grupo de medidas para la unificación, en base a un informe preparado por el
lingüista Koldo Mitxelena.
3
«Considero que el esfuerzo realizado en el ámbito de la traducción es, sin lugar a dudas, el
acontecimiento más significativo de la literatura vasca de los últimos años. La traducción está
construyendo el lenguaje literario. La traducción está abriendo camino a nuevas formas de proce-
der, por medio de la precisión, y es que solo basándose en la precisión se puede aspirar a la diver-
sidad. (…) Como ya he expresado alguna vez, los escritores [vascos] somos traductores mentales
(la mayor parte de lo que leemos está escrito en otras lenguas, que no en euskera); y, sin embargo,
no se nos exige precisión ni correspondencia entre lo que pensábamos y lo que hemos escrito, ya
que nadie puede saber qué habíamos concebido realmente en nuestra mente. Podemos hacer
trampa, podemos eludir las dificultades y allanar lo que en principio era complicado; podemos
tejer nuestra alfombra con ese lenguaje llano y luego caminar sobre ella con una elegancia impos-
tada» (traducción propia).
4
Prosa de Referencia Actual (traducción propia). Se encuentra disponible en esta dirección:
<http://www.ehu.es/euskara-orria/euskara/ereduzkoa/>
5
Esta limitación nos ha impedido valorar la diversidad y riqueza léxica por medio de la ratio
entre types y tokens, como suele ser habitual en estudios de esta área, y nos ha llevado a diseñar
una nueva estrategia comparativa, tal y como veremos más adelante, en el apartado 2.2.1.
6
Solo 1 de las 176 obras no traducidas es una reedición, revisada y actualizada: 110. Streeteko
geltokia.
7
Existe una excepción, como veremos más adelante (los usos lingüísticos relacionados con el
proceso de estandarización de la lengua); precisamente estos indicadores han ofrecido resultados
poco concluyentes.
8
El corpus EPG ofrece dos tipos de datos de frecuencia de uso: el número de libros en que apare-
ce el término buscado y el número de apariciones en cada libro. Aunque en nuestro estudio hemos
analizado ambos tipos de datos, para este artículo recogemos solo los datos correspondientes al
número de libros. Siendo más pequeñas las cifras del número de libros que las de número total de
apariciones, las columnas que forman en los gráficos son más proporcionadas entre sí, y los gráfi-
cos más inteligibles.
El traductor y el inmigrante. Tres traducciones de
La vida es un caravasar de Emine Sevgi Özdamar

[The translator and the immigrant.Three transla-


tions of Emine Sevgi Özdamar’s Life is a Carava-
sar]
PHILIPPE HUMBLÉ
Vrije Universiteit Brussel
philippe.humble@vub.ac.be
Resumen
La intención de este artículo es mostrar cómo se pueden utilizar las herramientas de la
lingüística de corpus para hacer el análisis de la traducción de una obra literaria y más
específicamente de una novela escrita por una autora inmigrante turca. La traducción de
este tipo de literatura exige una habilidad particular del traductor en el caso de obras
escritas en un lenguaje intencionalmente retorcido e imperfecto. En este artículo se
analiza de manera más detenida la novela Das Leben ist eine Karawanserei de la autora
turco-alemana Emine Sevgi Özdamar y sus traducciones al inglés, al francés y al espa-
ñol. Por medio del programa Wordsmith se analiza la relación type/token, que es indica-
tiva de la riqueza léxica de una obra. De este análisis se desprende que los tres traducto-
res redujeron efectivamente la relación type/token de sus traducciones. Hubiera sido
muy difícil distinguir este tipo de características por medio de un análisis puramente
manual de estas traducciones.
Abstract
This article sets out to show how corpus linguistics tools can be used to analyse the
translation of works of literature and more specifically of a novel written by a Turkish
immigrant. The translation of this type of literature requires particular skilfulness of the
translator specifically in the case of works written in a language which was intentionally
distorted and imperfect. This article discusses more thoroughly the novel Das Leben ist
eine Karawanserei of the Turkish-German author Emine Sevgi Özdamar and its transla-
tions into English, French and Spanish. By means of the Wordsmith programme the
type / token ratio is analysed, which is indicative of the lexical richness of a piece of
writing. This analysis shows that the three translators effectively reduced the type/token
ratio in their translations . It would have been very difficult to distinguish this type of
feature through a purely manual analysis of these translations.
Palabras clave
Análisis de corpus, literatura alemana, literatura de inmigración, traducción, relación
type/token

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
92 PHILIPPE HUMBLÉ

Keywords
Corpus analysis, German literature, immigration literature, translation, type/token rela-
tionship

1. Introducción
Esta comunicación sobre la traducción de una novela de una escritora turca-
alemana, Emine Sevgi Özdamar, encaja dentro de un proyecto de investigación
más amplio sobre las formas de expresión de inmigrantes en el seno de diferen-
tes sociedades europeas, tanto en términos de cultura como de lengua. El interés
por este tema se debe a la problemática que es común en nuestros días a toda
Europa occidental y a América del Norte, que es el de la inmigración en masa.
No hablamos, claro está, de los inmigrantes abastados, los expats, sino de las
oleadas de refugiados económicos y políticos que cruzan a diario las fronteras
europeas y americanas.
Ocurre que un grupo pequeño pero creciente de esos exiliados se expresa públi-
camente de alguna forma y también por medio de la literatura. Existe una litera-
tura de inmigrantes reciente, no muy grande todavía, pero de mucho vigor y que
está siendo copiosamente traducida.
Ahora, ¿cómo evaluar esas traducciones de una manera mínimamente objetiva?
Y ¿por qué evaluarlas? La evaluación es un problema espinoso en los estudios
de la traducción, en parte porque a partir de los años setenta, cuando esos estu-
dios empezaron a adquirir fundamentos más científicos, surgieron los estudios
descriptivos de la traducción (Toury 1995), que hicieron que el enfoque cambia-
ra de prescriptivo a descriptivo. Cualquier evaluación mantendrá efectivamente
siempre un sesgo subjetivo, estará siempre basado en una muestra aleatoria y
acabará de alguna forma siendo un requisitorio contra el traductor. Sin embargo,
sabemos que las traducciones tienen ciertas características que se pueden eva-
luar y que se pueden investigar en el texto. Es cierto que hay traducciones que
se aproximan más al original que otras, o se aproximan de otra manera, y sobre
estas características podemos emitir juicios de valor. Para detectar estos rasgos
particulares de cada traducción, tenemos que intentar echar mano de métodos lo
más objetivos posible.
Ya en 1998, Munday demostró, por medio del análisis de un cuento de Gabriel
García Márquez, que las herramientas y los conceptos utilizados en la lingüísti-
ca de corpus eran instrumentos valiosos para el análisis de una traducción litera-
ria. Los resultados tenían que ser tomados con cierto cuidado, pero «the basic
word statistics, type-token ratio and frequency lists give an idea of the general
texture of the texts and are of special value in spotting possible fruitful areas of
investigation» (Munday, 1998:7). Después de Munday, Mona Baker (2000)
investigó igualmente las posibilidades de investigación de la tecnología de cor-
EL TRADUCTOR Y EL INMIGRANTE. TRES TRADUCCIONES DE LA VIDA ES UN CARAVASAR… 93

pus, aplicándola a la noción de estilo. Las aplicaciones se especializaron des-


pués en el sentido de la problemática de los «universales de la traducción» y esa
misma noción de «estilo». Que sepamos, esta es la primera vez que se aplica el
análisis de corpus a la traducción de literatura de inmigrantes. Veremos a conti-
nuación por qué esa literatura necesita ser tratada de una manera distinta de la
literatura en general.
No hay duda de que algunas advertencias se tienen que hacer al aplicar las he-
rramientas de la lingüística de corpus a la traducción. Particularmente en el caso
de la relación type/token, que nos interesa aquí más particularmente, el tamaño
del texto tiene sus consecuencias, aunque la corrección que aplica automática-
mente Wordsmith, el programa más utilizado, corrige en gran parte esos bemo-
les. Igualmente, en el caso concreto de este artículo que examina un original
alemán con sus traducciones al español y al inglés, el hecho de que el pronom-
bre personal sujeto generalmente se omite en castellano y no se puede omitir ni
en inglés, ni en alemán, ni en francés aumenta el número de tokens. Por otro
lado, el castellano tiene un número muy alto de diferentes formas verbales. En
alemán, un verbo regular cuenta con 10 formas diferentes, pero en inglés sólo
con 5, mientras que en francés con 35 y en castellano hasta con 48. Esto podría
explicar en parte por qué hay menos types en la traducción inglesa. Estadística-
mente hablando, cada verbo alemán puede ser traducido en castellano de 4,8
maneras diferentes. Finalmente, a causa de las declinaciones, el alemán admite
muchas formas diferentes de lo que sería en inglés, en francés y en castellano
una sola palabra (un artículo definido) o dos (singular y plural). En realidad, las
particularidades de las lenguas tienden a compensarse unas a otras, como lo
demuestra (secundariamente) Frankenberg (2009).

2. La literatura de la inmigración
La literatura de los inmigrantes no es un fenómeno nuevo en sí. Antes también
había una literatura escrita por personas que no habían nacido en el país de la
que utilizaban la lengua. Hay ejemplos ilustres en varios idiomas, tales como
Joseph Conrad, Becket, Ionesco, Nabokov o Tahar Ben Jelloun. Sin embargo,
esos escritores no hacían demasiado alarde de su procedencia, ni mucho menos
de que querían escribir en esa lengua de adopción de una forma diferente de los
nativos. Conrad, por ejemplo, tiene la reputación de haber escrito «mejor» in-
glés que los ingleses y Tahar Ben Jelloun escribe un francés indistinguible de un
autor nativo.
Parte de la nueva generación de escritores inmigrantes, sin embargo, pretende
hacer todo lo contrario. Como mínimo no les interesa si su manera de expresar-
se está conforme o no a las reglas de su lengua de adopción. En otros casos,
hasta quieren hacer de este «acento» su marca registrada. Algunos ejemplos de

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


94 PHILIPPE HUMBLÉ

este tipo de escritores son la japonesa Yoko Tawada y Emine Sevgi Özdamar en
Alemania y el Iraní Kader Abdolah en Holanda. Son escritores que escriben en
su «segunda» lengua de una manera característica y esta se volvió su marca
registrada. En sus nuevas patrias esos tres autores se volvieron sorprendente-
mente populares y los tres fueron repetidamente galardonados con grandes pre-
mios nacionales.
Si la evaluación de la traducción es una cuestión compleja, en el caso de la lite-
ratura de los inmigrantes mencionados, hay que añadir la dificultad suplementa-
ria de que el lenguaje utilizado es un tipo de lengua particular, ya que se maneja
a partir de otra lengua materna, y que este dato forma parte del mensaje. El ca-
rácter típico de la literatura de los inmigrantes reside en este aire «traducido»
que tiene y que es difícil de traducir. La razón probablemente sea que el traduc-
tor, por su vez, escribe en su lengua materna y no en una lengua que dominaría
de manera imperfecta, como es el caso de esos escritores inmigrantes.
Este «acento», sin embargo, es esencial para la expresión de este grupo de la
población. Esto lo prueban investigaciones de la sociolingüística, de los que los
trabajos de Labov son el primer y el mejor ejemplo. Si los inmigrantes, hasta los
que nacieron en su nueva patria, tienen un acento particular, es porque quieren
diferenciarse. Como lo decía Labov:
Before systematic sociolinguistic studies began, it was assumed that the domi-
nant influences on the speech of New Yorkers would be the parents’ language,
the result of massive immigration from Ireland, Germany, Italy, Poland, Greece,
Russia, etc., in the period 1850–1924. But linguistic influence turned out to be
the least important of all, as children turned a deaf ear to the foreign accents of
their parents […] 1(Labov 2006: 186)
El acento no es solamente cuestión de lengua. Es cuestión de identidad. Así el
acento de los escritores inmigrantes es parte fundamental de lo que escriben y si
no estamos simplemente interesados en algunas historias exóticas, es esencial
que este acento aparezca en la traducción. Por lo tanto, este tipo de traducción
representa para el traductor un desafío particular. Tiene que hacer un esfuerzo
para llegar a transmitir este sabor, muy apreciado por el público, de lengua re-
torcida, de Zwischensprache, «lengua entre los dos», Zittersprache, «lengua
temblante». El traductor naturalmente es nativo de la lengua. Él o ella maneja su
lengua de una manera natural y no tiene acento. Sin embargo, tiene que traducir
como si no fuera un hablante nativo y reprimir sus instintos correctores. La in-
corrección, en el peor de los casos, o la falta de fluidez, forma parte del mensa-
je. En el caso de Özdamar podríamos decir que ella escribe en un «alemán ma-
lo» como el de los trabajadores extranjeros, los Gastarbeiter, que emigraron a
Alemania sobre todo en los años sesenta y setenta. El asunto ha sido estudiado
en Alemania y en su libro Sprachkontaktforschung, Claudia Maria Riehl enu-
mera una serie de características de lo que se conoce como «Gastarbeiter-
EL TRADUCTOR Y EL INMIGRANTE. TRES TRADUCCIONES DE LA VIDA ES UN CARAVASAR… 95

deutsch» y que mencionamos a seguir para que se tenga una idea. Así Riehl
distingue:
Einwortsätze (Blume statt Das ist eine Blume)
Ausfall von Verben (jetzt Pause)
Fehlen des bestimmten und unbestimmten Artikels (mit Zug)
Ausfall von Flexionsformen (vielleicht morgen niks Arbeit)
Verwendung des Infinitivs (Hier alles saubermachen)
Generalisierung des femininen Artikels die (mit die Kind kommen)
Verwendung von viel als Gradpartikel (viel kalt)
niks als Wort- und Satznegation (niks Arbeit; niks mehr zurück) (Riehl, 2004:
123) 2
Sería muy extraño si las editoriales, para traducir este tipo de lenguaje, recurrie-
ran a los servicios de un traductor no nativo. Tampoco garantizaría una fideli-
dad al original, sólo garantizaría el cambio de una lengua «extraña» por otra
igualmente «extraña», pero diferente del original. Los rasgos «extraños» de un
traductor marroquí escribiendo en castellano no serían necesariamente semejan-
tes a un traductor marroquí escribiendo en alemán, si es que tal individuo se
encontrase. La solución que encontraron las editoriales fue de confiar en la des-
treza de sus traductores acostumbrados. En esta comunicación nos proponemos
analizar en qué medida existe esa «destreza» en las traducciones de tres traduc-
tores de la vida es un caravasar de Emine Sevgi Özdamar.

3. Emine Sevgi Özdamar


Emine Sevgi Özdamar es una escritora kurda que nació en 1946 en Malatya, en
Turquía. Es escritora, actriz y directora teatral. Creció en Estambul y Bursa.
Como joven de 19 años se fue a Alemania en 1965, sin ningún conocimiento de
alemán, y trabajó durante dos años en una fábrica en Berlín.
De 1967 a 1970 estudió teatro en Estambul y hasta 1976 trabajó profesional-
mente como actriz en Turquía. Con el golpe militar de 1971 perdió, como
miembro del Partido de los Trabajadores de Turquía sus perspectivas de futuro
en su país y se fue de nuevo a Berlín. Allí escribió sus primeros textos teatrales
tales como «Carrera de una chica de la limpieza. Recuerdos de Alemania». Se
graduó en la Universidad de París VIII Vincennes -Saint Denis con un diploma
«Maîtrise de Théâtre». Desde 1986 es escritora independiente. Vive y trabaja en
Berlín.
Además de su trabajo como actriz, Özdamar escribió desde el principio obras de
teatro, novelas, poemas y relatos. Ha sido galardonada con numerosos premios,
incluyendo el Premio Ingeborg Bachmann en 1991. Desde mayo de 2007 Öz-
damar es miembro de la Academia Alemana de Lengua y Literatura. Sus obras
más importantes han sido traducidas al castellano:

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


96 PHILIPPE HUMBLÉ

• Mutterzunge (1990) / La lengua de mi madre (1996)


• Das Leben ist eine Karawanserei, hat zwei Türen, aus einer kam ich
rein, aus der anderen ging ich raus (1992) / La vida es un caravasar
(1994)
• Die Brücke vom Goldenen Horn (1998) / El Puente del Cuerno de Oro
(2000).
La obra que nos ocupa ahora más particularmente es la novela La vida es un
caravasar, traducida a varias lenguas, entre las cuales el castellano.

4. La vida es un caravasar
La vida es un caravasar es la historia de una muchacha nacida en Malatya en
Turquía y que sufre de tuberculosis. La historia comienza en un tren lleno de
soldados, cuando la niña está todavía en el útero de su madre. Su familia se
compone de siete personas, contando la abuela Ayse. A causa de la pobreza, el
padre está constantemente en busca de trabajo y la familia tiene que hacer frente
a mudanzas incesantes dentro de Turquía. Viajan entre Estambul, Bursa y An-
kara. No hay dinero en casa y la familia está envuelta en una lucha constante
por la sobrevivencia. Todos tienen que adaptarse constantemente a nuevas cir-
cunstancias. El padre finalmente sucumbe a la bebida y la madre tiene que en-
cargarse de la supervivencia de la familia. Esto hace que ella también caiga
víctima de la depresión. La narradora ahora tiene que sustentar a la familia, lo
que consigue con unos pequeños trabajos en el teatro de Bursa. Al final, resuel-
ve emigrar a Alemania.
No sabemos, por supuesto, si la historia refleja correctamente la biografía de
Özdamar, pero se le acerca sin duda bastante. Lo que más llamó la atención de
la crítica alemana en esta obra, traducida a muchos idiomas y galardonada con
varios premios, es la lengua muy idiosincrática de la autora. Con esta denomi-
nación se quiere indicar la calidad extraña que tiene la lengua de Özdamar, len-
gua que además fue perdiendo sus características particulares en la medida en la
que la autora se fue acostumbrando a su patria de adopción y dominando cada
vez mejor el alemán.
Con el fin de comparar las traducciones de La vida es un Caravasar, hicimos un
análisis de tres traducciones diferentes: una en francés, una en español y una en
inglés. Se utilizó el programa Wordsmith 6 para este fin. No pretendemos aquí
agotar el análisis, sino hacer una comparación global a nivel de léxico, para
mostrar en qué medida los traductores consiguieron mantener el sabor del origi-
nal.
Al leer las diferentes traducciones, inmediatamente nos damos cuenta que todas
son de un nivel más que satisfactorio. Los tres traductores investigados tienen
EL TRADUCTOR Y EL INMIGRANTE. TRES TRADUCCIONES DE LA VIDA ES UN CARAVASAR… 97

mucha experiencia, lo que explica sin duda el buen trabajo que hicieron. Dedi-
caré ahora algunas palabras a la biografía intelectual de cada uno.

5. Los traductores

5.1. Luise Von Flotow


En los estudios de la traducción Luise Von Flotow, canadiense nacida en Ale-
mania, no es una desconocida. Es profesora de teoría de la traducción, conocida
por sus trabajos teóricos en el campo de la traducción feminista. Tradujo más de
una veintena de libros del alemán y del francés al inglés, de autores como Ro-
bert Walser, Herta Müller y Christa Wolf, así como de escritores franceses ca-
nadienses como France Théoret. Luise von Flotow también escribió un artículo
muy interesante y muy lúcido, publicado en Meta, sobre la experiencia de tra-
ducir el libro de Özdamar. Declara: «Özdamar's ‘broken’ German presents the
greatest challenge in translating Karawanserai into English. Preserving or ren-
dering this foreignness seems to be desirable, since it is an integral part of the
source text.» 3 (von Flotow 2000:68) Destaca que traducir la obra de Özdamar es
justamente difícil por el hecho de que su alemán no es un alemán normal, que se
tiene que traducir a un tipo de «broken English», un «inglés roto»:
The solution seems to be to translate as literally as possible, to deliberately build
irregularities into the English version and write «angular English» that will
somehow match or replicate elements critic Göktürk has described as «un-
gelenk» (clumsy) (1994: 82) in the source text. (von Flotow 2000:68). 4

5.2. Miguel Sáenz


Miguel Sáenz es un traductor español conocido. Traduce principalmente litera-
tura alemana (Bertolt Brecht, Thomas Bernhard, WG Sebald, Günter Grass),
pero también literatura en inglés de Henry Roth, William Faulkner, Salman
Rushdie. Además, escribió una biografía de Thomas Bernhard. Publicó igual-
mente artículos teóricos sobre traducción y en uno de ellos menciona el hecho
de que, durante la traducción de Caravanserai y de Mutterzunge, se puso en
contacto con la autora para pedir explicaciones. Siendo él mismo el producto de
una sociedad colonial, nacido y criado en Marruecos colonizado por los españo-
les, es muy consciente de los aspectos colonialistas de su trabajo y reflexiona
sobre ellos de manera crítica. En el caso de Özdamar, se dio cuenta de los pro-
blemas específicos de su obra:
[…] en ocasiones, el alemán de Özdamar es «incorrecto». Y ella se ha negado
siempre a que se corrigieran sus errores, porque esos errores, decía, eran preci-
samente ella. (Sáenz, 2009)

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


98 PHILIPPE HUMBLÉ

5.3. Colette Kowalski


Colette Kowalski, la traductora francesa de Karawanserei, tradujo unos treinta
libros, sólo obras literarias alemanas. Se especializó en autores como Veit
Heinichen y Botho Strauss. Fue muy aclamada y recibió varios premios de tra-
ducción. Murió en 2006, a la edad de 70 años. Contrariamente a Luise von Flo-
tow y a Miguel Sáenz, Colette Kowalski parece ser más bien una traductora
tradicional cuando dice:
[…] Pourtant, me semble-t-il, le traducteur devrait tendre à adopter un manteau
couleur de muraille, avoir l'ambition de retrouver la transparence de la vitre in-
soupçonnée. On pourrait penser que la meilleure façon de se rendre invisible est
de s'attacher à une stricte littéralité, la fidélité jusqu'à la mort, la mort du texte
dans la plupart des cas. Car l'étroite imitation conduit souvent à un produit qui
n'a de nom dans aucune langue humaine. Il est fort regrettable que la structure
syntaxique de l'allemand ne puisse guère s'imiter en français et que le traducteur
se sente à tout moment gêné dans sa liberté de mouvement. 5(Kowalski 2000 :
104)
Se esperaría, por lo tanto, una típica traducción «domesticada», pero el análisis
demostrará que ella rindió muy bien la «pobreza léxica» del original.

6. Análisis
A pesar del hecho de que los tres traductores sean altamente experimentados,
sus traducciones son diferentes de una manera que un análisis puramente intui-
tivo difícilmente podría indicar. Como mencionamos anteriormente, el alemán
de Özdamar no es gramaticalmente correcto según los estándares tradicionales y
fue su deseo explícito que no se le corrigiera. ¿Pueden los traductores forzarse a
«primitivizar» su lengua, y qué significaría esta «primitivización»? Podemos
distinguir los dos niveles tradicionales: gramatical y léxico. Los métodos de
análisis de corpus pueden utilizarse para analizar el nivel léxico, y difícilmente
el gramatical.
¿Cuáles con las particularidades léxicas propias del texto original de Özdamar,
más específicamente respecto a la relación type/token? Como es sabido, a mayor
relación type/token, más variación en el vocabulario. La relación type/token
depende de la longitud del texto, ya que en un texto más largo hay más probabi-
lidad de que re-ocurran palabras. En el caso de traducciones, sin embargo, este
problema no surge, ya que se trata de textos de tamaño virtualmente igual.
Veamos primero el texto el texto original de Özdamar. Exhibe los números
siguientes:
EL TRADUCTOR Y EL INMIGRANTE. TRES TRADUCCIONES DE LA VIDA ES UN CARAVASAR… 99

Özdamar Tokens Types Type/token Estandarizada


Caravasar 105.616 8013 7.96 40,98
Tabla 1. Relación type/token en Das Leben ist eine Karawanserei, hat zwei Türen, aus
einer kam ich rein, aus der anderen ging ich raus (1992) de Özdamar
Como era de esperarse de un texto que se supone fue escrito desde el punto de
vista de un niño y, además, escrito en una lengua extranjera, la relación ty-
pe/token es bastante baja cuando la comparamos con libros literarios alemanes
«normales». Para tener una idea de lo que significan estos números, los pode-
mos comparar con otros textos literarios alemanes de la misma longitud.
Das Schloss (El castillo) de Kafka, por ejemplo, es de un tamaño casi igual a
Caravasar y puede darnos, por lo tanto, una idea de la relación type/token en el
ámbito de la literatura alemana. Kafka se considera, por lo demás, como un
escritor con poca variación léxica.
Tokens Types Type/token Estandarizada
Kafka Das Schloss 109.799 10.633 9.75 44,44
Tabla 2. Relación type/token en Das Schloss de Kafka
Se puede notar que aún en el caso de Kafka, en un texto de tamaño comparable,
la variación léxica es más alta que en el caso de Özdamar. A eso se le tiene que
añadir que la autora turca usa en varias ocasiones palabras, frases o hasta párra-
fos enteros en turco, lo que tendría que haber aumentado el índice. Aun así, la
relación type/token quedó muy por debajo de la novela de Kafka. Podemos
comparar Caravanserai con otras novelas en alemán, de otros tamaños. Esco-
gimos a dos autores, Mann y Walser, como representantes de la literatura ale-
mana moderna tradicional, Goethe como representante de la literatura clásica y
otros dos escritores con raíces extranjeras, Herta Müller (rumana) y Osman Egin
(turco).
Tokens Types Type/token Estandarizada
Walser Der Gehülfe 77.818 11.812 13.98 50,45
Mann Der Zauberberg 275.834 34.287 12.64 52,69
Goethe Wilhelm Meister 193.941 17.189 8.86 50,34
Osman Engin 52.710 8.169 15.50 48,95
1001
Nachtschichten
Herta Müller Atemschaukel 67.895 9.941 14.69 46,06

Tabla 3. Relación type/token en Mann, Walser, Goethe, Herta Müller y Osman Egin
También cuando se compara con novelas alemanes tradicionales y no tradicio-
nales, la relación type/token de la novela de Özdamar es extraordinariamente
baja. La relación «estandarizada» corrige las distorsiones debidas al tamaño del

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


100 PHILIPPE HUMBLÉ

texto, como se puede notar comparando los números de tokens, y la relación


type/token cruda con la estandarizada. Todos giran en torno de los 50, menos
Herta Müller que, en una situación y con una historia de vida parecida con la de
Kafka, tiene como relación type/token igualmente un número parecido.
Se puede concluir que, comparando a Özdamar tanto con escritores alemanes
tradicionales, recientes o antiguos, como con autores modernos, aun con raíces
extranjeras, la baja relación type/token es un distintivo esencial del estilo de la
escritora turca. Compararemos a continuación estos números con los números
de las traducciones;

6.1. Type/token en las traducciones de Karawanserei


Los números de las traducciones son los siguientes:
Traductor Tokens Types Type/token Estandarizada
Original alemán 105.616 8013 7.96 40,98
English Luise Von Flotow 111.864 5745 5.8 37,05
Français Colette Kowalski 114.132 8508 7.36 38,91
Español Miguel Sáenz 114.227 8344 7.31 38,12
Tabla 4. Relación type/token en las traducciones de Karawanserei de Luise Von Flotow,
Colette Kowalski y Miguel Sáenz
La primera constatación que se desprende de estos números es el número varia-
do de tokens. En un estudio dedicado al asunto de la supuesta ley que dice que
las traducciones siempre son más largas que los originales, Frankenberg efectúa
un estudio de corpus en el que llega a la conclusión siguiente: «translations tend
to be more explicit than source texts, regardless of the changes dictated by lan-
guage-specific differences» 6 (Frankenberg, 2009: 57) Esto significa que, aunque
haya diferencias esenciales entre las diferentes lenguas, hay explicitación. En el
caso de una traducción del alemán hay diferencias estructurales que obligan al
traductor a usar más palabras de la usadas en el original. Así, el alemán suele
escribir los multi-word items en una sola palabra (en Caravasar Baumwolltante
se traduce por «Tía de Algodón»), y eso vale tanto para el castellano como para
el inglés y el francés. Además, como lo señalamos al principio, el castellano
cuenta con muchas más formas verbales que el alemán (o el inglés, o el fran-
cés), lo que significaría otro aumento del número de palabras. Por otro lado, y
también como lo habíamos mencionado, el español suprime los pronombres
personales sujeto, y no hay declinaciones lo que acaba reduciendo también el
número de tokens. En el caso del inglés, este es el más bajo de todas las traduc-
ciones. El tratamiento de los multi-word ítems podría haber aumentado este
número, pero sería extraño que fuera en esa proporción.
EL TRADUCTOR Y EL INMIGRANTE. TRES TRADUCCIONES DE LA VIDA ES UN CARAVASAR… 101

Esto significa que podemos formular como una hipótesis que, en este caso tam-
bién, los traductores se habrían visto obligados a explicitar, aunque fuera míni-
mamente, el texto del original. Asombra, por lo tanto, que, en términos de rela-
ción type/token, haya habido una tendencia contraria. Aunque el número de
palabras haya sido más alto, la relación type/token bajó en los tres casos con
respecto al original.
El número de types es más alto en el caso de las traducciones francesas y espa-
ñolas: un 10 % más o menos en cada caso. En el caso del inglés, sin embargo,
tenemos una reducción de casi un 30 %, con un aumento en el número de to-
kens, lo que significa que la variedad léxica parece ser mucho más baja que en
el original. Esto, que esté claro, no implica ningún juicio de valor respecto a las
traducciones en cuestión y que dan una impresión del original muy diferente.
Las cifras indican una pista de investigación. En lo que sigue consagraremos
alguna atención especial a la traducción española de Karawanserei.

6.2. Type/token en novelas españolas


Para tener una idea de la medida en que la traducción española se conforma a
los textos escritos originariamente en castellano, hicimos una comparación con
la relación type/token de algunos clásicos.
Type/token
estandarizada
Doctor Pasavento 44,67
Corazón tan blanco 44,96
Paradiso 47,27
La mujer habitada 48,11
Nada 46,78
La sombra del ciprés es alargada 49,46
Tabla 5. Relación type/token en clásicos españoles
Al comparar los números de las novelas españolas originales con la traducción
de Sáenz, se puede notar que en materia de relación type/token son claramente
más altos, tanto por lo que se refiere al original de Özdamar como a la traduc-
ción al castellano. Esto significa que el traductor hizo un buen trabajo y que no
hizo de la novela de Özdamar otra novela en español. La relación type/token
extremadamente baja en el original corresponde a una relación baja en la tra-
ducción. Los números de las novelas en castellano son sorprendentemente pare-
cidos, con el valor más bajo para la novela de Enrique Vila Matas y el más alto
para Miguel Delibes. Sáenz, por lo tanto, no se dejó «seducir» por una tradición
literaria que le hubiera impuesto un texto más variado del punto de vista léxico.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


102 PHILIPPE HUMBLÉ

7. Conclusión
Un análisis rápido de tres traducciones de La vida es una caravasar de Emine
Sevgi Özdamar demuestra inmediatamente lo desconcertante que puede ser
traducir a su lengua materna una novela que fue escrita por alguien que no la
escribió en su lengua materna. Salta a la vista un esfuerzo consciente por parte
de los traductores de no «normalizar» el texto en el sentido de transformarlo un
texto escrito por un autor nativo. Por otro lado, se nota también que la incum-
bencia no fue fácil, porque aun si hubo explicitación, visible por el aumento del
número de Tokens, los traductores se esforzaron por no sofisticar demasiado su
lenguaje, manteniéndolo relativamente simple. Aun si los traductores tuvieron
éxito en su intento, el hecho que la relación type/token, sobre todo en el caso de
la traducción inglesa, resultara más baja que la original indica que en este caso
la traductora puede haber vuelto el texto un poco más simple todavía de lo que
había pretendido la autora original. La traducción española parece atenerse más
al original en términos léxicos. Incluso cuando se compara con obras originales
escritas en castellano, los números demuestran algo «extraño» que, en nuestro
caso, es indudablemente el acento «inmigrante» del original. Todo eso, sin em-
bargo, tendría que ser verificado por un análisis cualitativo, aunque las indica-
ciones son fuertes. El análisis por medio de herramientas de la lingüística de
corpus abre pistas para una investigación posterior que se revelaría mucho más
difícil sin esta primera brecha

8. Bibliografía
Baker, Mona. 2000.Towards a Methodology for Investigating the Style of a Literary
Translator @ Target 12/2: 241-266.
Baker, Mona. 1998. Réexplorer la langue de la traduction : une approche par corpus @
Meta : journal des traducteurs / Meta: Translators' Journal 43/4 : 480-485.
Frankenberg-Garcia, Ana. 2009. Are translations longer than source texts? A corpus-
based study of explicitation @ A. Beeby, P. Rodríguez Inés y P. Sánchez-
Gijón, eds. Corpus use for learning to translate and learning corpus use to
translate, Amsterdam/Philadelphia: John Benjamins Publishing Company.
ISBN 9789027224262, pp. 47-58.
Kowalski, Colette. 2000. Heurs et malheurs du traducteur, Disponible en
<http://www.culturactif.ch/alaune/kowalski.htm >. Consultado el 25/1/2014.
Labov, William. 2006. Social Stratification of English in New York (Second edition).
Cambridge: Cambridge University Press. ISBN 9780521528054.
Laviosa, Sara. 1998. The Corpus-based Approach: A New Paradigm in Translation
Studies. @ Meta journal des traducteurs / Meta: Translators' Journal 43/4:
474-479.
EL TRADUCTOR Y EL INMIGRANTE. TRES TRADUCCIONES DE LA VIDA ES UN CARAVASAR… 103

Riehl, Claudia Maria. 2009. Sprachkontaktforschung. Tübingen: Gunter Narr Verlag.


ISBN 9783823364696.
Toury, Gideon. 1995. Descriptive Translation Studies and Beyond. Amsterdam y Phila-
delphia: John Benjamins. ISBN 9781556194955.
Sáenz, Miguel. 2009. Traducción y cultura en el ámbito literario. @ Entreculturas 1:
763-771.
Von Flotow, Luise. 2000. Life is a Caravanserai: Translating Translated Marginality, a
Turkish-German Zwittertext in English @ Meta: journal des traducteurs/Meta:
Translators' Journal 45/1: 65-72.

Corpus de obras investigadas


Özdamar, Sevgi Emine. 2008. Leben is eine Karawanserei Hat zwei Türen Aus einer
kam ich rein Aus der anderen ging ich raus, Köln: Kiepenheuer & Witsch.
ISBN 9783462023195.
Özdamar, Sevgi Emine. 1994. La vida es un caravasar tiene dos puertas por una entré
por la otra salí, Trad. Miguel Sáenz, Madrid: Alfaguara. ISBN 8420427985.
Özdamar, Sevgi Emine. 1997. La vie est un caravansérail, Trad. Colette Kowalski,
Paris : Le serpent à plumes. ISBN 2842614216.
Özdamar, Sevgi Emine. 2000. Life is a Caravanserai Has two Doors I came in one I
went out the Other, Trad. Luise von Flotow, London: Middlesex University
Press. ISBN 189825334X .

1
Antes de que comenzaran los estudios sociolingüísticos sistemáticos, se suponía que las influen-
cias dominantes en el discurso de los neoyorquinos serían los idiomas de los padres, el resultado
de la inmigración masiva de Irlanda, Alemania, Italia, Polonia, Grecia, Rusia, etc., en el período
1850-1924. Pero la influencia lingüística resultó ser la menos importante de todos, ya que los
hijos hicieron oídos sordos a los acentos extranjeros de sus padres […] (Traducción propia)
2
Oraciones de una sola palabra (Blume en vez de Das ist eine Blume) (Flor)
Eliminación de los verbos (jetzt Pause) (ahora pausa)
Ausencia del artículo definido e indefinido (mit Zug) (con tren)
Ausencia de inflexiones (vielleicht morgen niks Arbeit) (quizá mañana nada trabajo)
Uso del infinitivo (Hier alles saubermachen) (Aquí limpiar todo)
Generalización de la matriz artículo femenino (mit die Kind kommen) (con la niño venir)
El uso de viel para expresar un grado (viel kalt) (mucho frío)
El uso de niks como palabra de negación para palabras y oraciones (niks Arbeit; niks mehr
zurück) (nada trabajo; nada volver) (Traducción propia)
3
El «Alemán roto» de Özdamar representa el mayor reto en la traducción de Caravasar en inglés.
Preservar o reflejar la calidad extranjera parece ser deseable, ya que es una parte integral del texto
de origen. (Traducción propia)
4
La solución parece ser la de traducir lo más literalmente posible, para insertar deliberadamente
irregularidades en la versión inglesa y escribir un «inglés anguloso» que de alguna manera iguale
o reproduzca elementos que el crítico Göktürk ha calificado de «ungelenk» (torpe) (1994: 82) en
el texto de origen. (Traducción propia)

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


104 PHILIPPE HUMBLÉ

5
Pero a mí me parece que el traductor debe tratar de adoptar un color como de muralla, tener la
ambición de recuperar la transparencia de la ventana insospechada. Uno podría pensar que la
mejor manera de llegar a ser invisible es centrarse en un literalismo estrecho, la fidelidad hasta la
muerte, la muerte del texto en la mayoría de los casos. Porque la imitación pura y simple a menu-
do conduce a un producto que no tiene nombre en cualquier idioma humano. Es muy lamentable
que la estructura sintáctica del alemán difícilmente pueda imitarse en francés y que el traductor se
sienta avergonzado a todo momento en su libertad de movimiento. (traducción propia)
6
Las traducciones tienden a ser más explícitas que los textos de origen, independientemente de
los cambios dictados por las diferencias específicas del idioma. (Traducción propia)
Les expressions idiomatiques dans les versions
roumaines du Rouge et le noir 1

[Idioms in Le rouge et le noir Romanian transla-


tions]
ANCA-ANDREEA BRĂESCU
Université “Ștefan cel Mare”, Suceava
chetrariu_anca30@yahoo.com
Résumé
Dans cette contribution, nous analysons le traitement des expressions idiomatiques sur
un corpus composé de cinq versions roumaines du roman Le rouge et le noir, parues
entre 1930 et 2009.
Perçues comme « figées », les expressions idiomatiques sont difficilement transpor-
tables d’une langue à l’autre, la recherche d’un équivalent étant d’autant plus entravée
dans la traduction du roman stendhalien. L’écart culturel est doublé par le décalage
temporel entre l’original et la traduction, difficultés auxquelles s’ajoute le langage ellip-
tique, voire laconique dans lequel sont intégrées ces expressions.
À travers des échantillons, nous analysons comparativement l’original et les versions
roumaines, identifiant et commentant les solutions de traduction. Nos conclusions por-
tent sur la spécificité des expressions idiomatiques dans les deux langues, sur la créativi-
té des traducteurs, ainsi que sur le problème du dosage exagéré des expressions, qui
risque d’annexer le texte-source à la culture-cible.
Abstract
In this paper, we analyze the treatment of idioms in a corpus composed of five Romani-
an versions of the French novel Le rouge et le noir, published between 1930 and 2009.
Considered as "fixed", idioms are difficult to transport from one language to another.
Looking for an equivalent is even more difficult in the translation of Stendhal's novel.
The cultural gap is doubled by the time lag between the original and the translation.
Another difficulty is the elliptical or laconic language in which these terms are incorpo-
rated.
Across samples, we analyze comparatively the original and the Romanian versions,
identifying and commenting on translation solutions. Our conclusions are related to the
specificity of translating idioms, to the translator’s creativity and the problem of using
exaggerated idioms, which may annex the original text to the target culture.
Palabras clave
Estudios de traducción, corpus bilingüe, expresiones idiomáticas, Le rouge et le noir
Keywords
Translation studies, bilingual corpus, idiomatical, idiom, Le rouge et le noir

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
106 ANCA-ANDREEA BRĂESCU

0. Introduction
Le concept de corpus en traduction a connu une évolution qui correspond à une
synchronisation avec les nouvelles technologies, censées faciliter le travail du
traducteur. Dans cette contribution, nous élaborons une analyse de la traduction
littéraire, nous appuyant sur un corpus bilingue, français et roumain, formé du
roman original Le rouge et le noir et des cinq versions roumaines qui sont pa-
rues entre 1930 et 2009.
Pour nous, le terme « corpus » garde ici son acception traditionnelle de choix
représentatif d’échantillon de textes qui servent à illustrer une certaine problé-
matique, à savoir, dans ce cas précis, la problématique de la traduction des ex-
pressions idiomatiques.

1. Considérations générales sur les versions roumaines du


Rouge et le noir
Jusqu’au XXe siècle, en Roumanie, la réception de Stendhal passe par la lecture
de l’original et/ou des traductions en feuilleton et fragmentaires. Sur le terrain
de la critique littéraire, la réception se matérialise dans la parution d’articles et
d’études littéraires, voire dans la traduction d’ouvrages critiques qui portent sur
les romans de l’auteur français.
Le premier roman stendhalien rendu intégralement en roumain est La char-
treuse de Parme, qui paraît en 1922, dans la traduction de V. Demetrius (Sten-
dhal 1922). Quant au roman Le Rouge et le noir, il est tout d’abord traduit
fragmentairement, en feuilleton, en 1928 (Stendhal 1928). En 1933 paraît une
deuxième traduction fragmentaire, dont on ignore encore le nom du traducteur
(Stendhal 1933).
En Roumanie, la première traduction intégrale du roman Le Rouge et le noir
n’est pas datée, mais l’an de parution est le plus probablement 1930 (Stendhal
1930). Après cette première version, les retraductions connaissant une certaine
dynamique, en 1950 étant publiée la deuxième version par le traducteur Ion
Marin Sadoveanu (Stendhal 1950).
La version de Gellu Naum, parue en 1959 (Stendhal 1959) et qui a circulé par la
suite dans onze rééditions, la plus récente en 2003 (Stendhal 2003), s’est impo-
sée comme « la traduction » du Rouge et le noir en roumain, mais elle se con-
fronte à l’évolution de la langue et de la perception sur le traduire, le besoin de
retraduction se manifestant notamment vers la fin des années 2000.
La réputée traductrice roumaine Irina Mavrodin publie en 2007 (Stendhal 2007)
une version qui, à la différence des précédentes, représente un travail préparé de
longue date, étant donné l’intérêt qu’elle accorde à l’œuvre stendhalienne dans
LES EXPRESSIONS IDIOMATIQUES DANS LES VERSIONS ROUMAINES DU ROUGE ET LE NOIR 107

un premier temps en tant qu’herméneute (Mavrodin 1985). Au moment de la


rédaction de cette version, la traductrice a derrière elle une expérience de qua-
rante ans dans la pratique traductive et bénéficie de conditions optimales à la
réalisation de cette nouvelle version.
Irina Mavrodin est un professionnel de la traduction, auteure de versions de
référence d’ouvrages essentiels de la littérature française et développe égale-
ment une pratico-théorie du traduire, résultant d’une longue et fertile réflexion
sur la traduction (Mavrodin 2006).
La dernière traduction, datant de 2009 (Stendhal 2009) s’encadre dans l’ample
projet éditorial de la société de presse « Adevărul Holding ». Le principal but de
ce projet est de rendre la littérature plus « accessible », proposant des livres en
tant que supplément qui accompagne un journal, à un prix très bas. Cette ver-
sion, parue dans le cadre d’une campagne publicitaire assez agressive, rend
compte d’une simplification du roman stendhalien, autant du point de vue pa-
ratextuel (texte dépourvu de toute forme d’introduction, mais accompagné
d’illustrations), que du point de vue du texte proprement dit, par des stratégies
que nous analyserons par la suite.
Quant au profil des traducteurs, nous ignorons les détails concernant l’activité
littéraire du premier traducteur, mais nous savons qu’autant Ion Marin
Sadoveanu (1893-1964) que Gellu Naum (1915-2001) ont été des personnalités
marquantes de la littérature roumaine, qui se sont dédiés au traduire en tant
qu’activité complémentaire. Quant à Doru Mareş (n. 1957), après une courte
carrière dans l’enseignement, en tant que professeur de français, il est devenu
journaliste, s’exerçant également au traduire. Le statut de traducteur chevronné
d’Irina Mavrodin explique certains aspects qui seront mis en évidence à travers
l’analyse comparative que nous entreprenons.

2. Les expressions idiomatiques : précis généraux


Dans un sens large, les expressions idiomatiques ou « imagées » représentent
des locutions rattachées à une langue et à une culture, n’ayant que très rarement
d’équivalent littéral dans une autre langue.
Afin d’en donner une définition plus complète et d’observer quels en seraient
les enjeux dans la traduction, nous avons fait recours aux précisions de Pierre
Guiraud ou d’Alain Rey. Dans Les Locutions françaises, le premier les définit
comme « unité de forme et de sens » (Guiraud, 1961 : 5) possédant une signifi-
cation qui ne découle pas du sens individuel des termes composants. Il observe
aussi que très souvent la locution « s’écarte de la norme grammaticale et lexi-
cale » (Guiraud, 1961 : 5), ayant souvent un « sens métaphorique » (Guiraud,
1961 : 7).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


108 ANCA-ANDREEA BRĂESCU

Dans la préface au Dictionnaire des expressions et locutions, Alain Rey consi-


dère les locutions en tant que « suites de mots convenues, fixées, dont le sens
n’est guère prévisible », (Rey et Chantreau, 2003 : VII). Il réitère les particulari-
tés déjà mentionnées par Pierre Guiraud, à savoir le fait que les règles gramma-
ticales n’y sont pas toujours respectées et que leur emploi est figuré, ce qui les
donne un caractère parfois obscur.
De ces définitions, nous retenons pour notre analyse le caractère indécompo-
sable des expressions idiomatiques, leur emploi figuré, ainsi que leur apparte-
nance à la culture source. Nous y ajoutons également le fait que, étant redevable
à l’imaginaire de la langue, ces expressions puisent souvent dans le langage
populaire, ce qui les annexe en quelque sorte à la culture d’origine.
Quelle solution le traducteur peut-il trouver pour les rendre dans une autre
langue et culture? Une expression équivalente ? Elle sera, à son tour, redevable
à la culture-cible. C’est une question sur laquelle nous allons insister dans notre
analyse, d’autant plus que le dosage de ces expressions dans le texte original et
dans le texte-cible rend compte d’une intention artistique de l’auteur et, respec-
tivement, d’une stratégie traductive de celui qui rend l’ouvrage dans une autre
culture.
Redevable à l’imaginaire et à la figuration du langage et de la culture d’origine,
les expressions idiomatiques acquièrent un caractère « intraduisible », figé. Fi-
gées, mais soumises en même temps au vieillissement de la langue, ce qui les
transforme parfois en témoins de l’imaginaire linguistique à un moment donné
dans l’évolution de la culture. Le traducteur se confronte dans ce cas à un autre
problème, à savoir le vieillissement du texte original, ce qui établit un double
écart par rapport à la culture-source.

3. Les expressions idiomatiques et leur emploi dans Le rouge et


le noir
Dans notre analyse, nous avons considéré comme « expression idiomatique »
toute expression indécomposable qui acquiert un sens seulement dans un en-
semble de constituants, étant rattachée à la culture d’origine. Avant de réfléchir
sur les stratégies du traducteur en ce qui concerne le transport des expressions
idiomatiques, nous analysons brièvement leur emploi général en littérature, à
savoir le problème de l’intention de l’auteur.
En littérature, les expressions idiomatiques ont souvent été associées à
l’expression banale de la pensée, voire au cliché, étant considérées soit des
moyen ornementaux et esthétiques, soit des instruments à rendre la ‘couleur
locale’, le parler régional ou familial, soit des outils ayant une fonction humoris-
tique ou caricaturale. Pourtant, elles ne sont pas que l’apanage de la littérature
LES EXPRESSIONS IDIOMATIQUES DANS LES VERSIONS ROUMAINES DU ROUGE ET LE NOIR 109

de second ordre, mais un outil dont fait usage la littérature de tout genre. En
plus, dans le langage littéraire, le sens figuré des expressions idiomatiques est
doublé par la créativité de l’auteur, qui peut intervenir, à son tour, sur ces ex-
pressions et les modifier.
C’est ce qui se passe souvent chez Stendhal, où elles acquièrent une nouvelle
valeur, qui rend compte des nouveaux enjeux de la littérature. Le roman Le
rouge et le noir se caractérise par une tension, autant au niveau des relations
entre les personnages, qu’au niveau du discours. Le trouble intérieur du person-
nage principal stendhalien est rendu aussi par des collisions au niveau de la
narration : entre la voix du narrateur et la voix des personnages il y a une lutte
sourde, qui se matérialise dans l’emploi du style indirect libre. Par ailleurs, la
voix du personnage principal et la voix du narrateur semblent parfois devenir
une seule, ce dernier embrassant la perspective de son personnage, même s’il
donne l’apparence d’objectivité. Les paroles rapportées se confondent avec le
recours au style indirect libre, ce qui entraîne une ponctuation spécifique, les
pensées de Julien étant pratiquement fondues dans le discours et contribuant à
créer l’impression d’une narration à la première personne.
Marqué par un style indirect libre alterné avec une forme de dialogue rapporté,
dans le récit stendhalien il y a une tension permanente entre la voix énonciative
du récit et la voix du personnage principal. Stendhal y alterne le discours narra-
tivisé à des paroles qui trahissent la subjectivité du personnage principal, allant
jusqu’à superposer et à faire concourir les deux voix énonciatives, notamment
par le procédé de la déponctuation.
Parmi les marques de la polyphonie narrative nous comptons les expressions
idiomatiques, qui donnent une certaine touche d’oralité au texte. Le passage aux
réflexions directes de Julien entraîne un changement des marqueurs lexicaux et
l’oralité semble contaminer le texte.

4. Le défi de la traduction des expressions idiomatiques dans Le


rouge et le noir
Pour l’analyse du traitement des expressions idiomatiques dans les cinq ver-
sions roumaines du roman stendhalien, nous avons fait recours à des échantil-
lons du texte. L’analyse de ce corpus nous révélera les stratégies et les ten-
dances des traducteurs lors du transport des expressions idiomatiques du fran-
çais vers le roumain.
Afin de faciliter le repérage des cinq versions roumaines qui constituent notre
corpus, nous proposons leur numérotation : VR1 la version de George A. Du-
mitrescu (1930 ?), VR2 la version de Ion Marin Sadoveanu (1950), VR3 la ver-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


110 ANCA-ANDREEA BRĂESCU

sion de Gellu Naum (1981), VR4 la version d’Irina Mavrodin (2007) et VR5 la
version de Doru Mareș (2009).
Corpus analysé :
VERSION ORIGINALE
Les enfants l’adoraient, lui ne les aimait point; sa pensée était ailleurs. Tout ce
que ces marmots pouvaient faire ne l’impatientait jamais. Froid, juste, impas-
sible, et cependant aimé, parce que son arrivée avait en quelque sorte chassé
l’ennui de la maison, il fut un bon précepteur. Pour lui, il n’éprouvait que haine
et horreur pour la haute société où il était admis, à la vérité au bas bout de la
table, ce qui explique peut-être la haine et l’horreur. Il y eut certains dîners
d’apparat, où il put à grande peine contenir sa haine pour tout ce qui
l’environnait. Un jour de la Saint-Louis entre autres, M. Valenod tenait le dé
chez M. de Rênal, Julien fût sur le point de se trahir ; il se sauva dans le jardin,
sous prétexte de voir les enfants. Quels éloges de la probité ! s’écria-t-il ; on di-
rait que c’est la seule vertu ; et cependant quelle considération, quel respect bas
pour un homme qui évidemment a doublé et triplé sa fortune, depuis qu’il admi-
nistre le bien des pauvres ! je parierais qu’il gagne même sur les fonds destinés
aux enfants trouvés, à ces pauvres dont la misère est encore plus sacrée que celle
des autres ! Ah ! monstres! monstres ! Et moi aussi, je suis une sorte d’enfant
trouvé, haï de mon père, de mes frères, de toute ma famille. (Stendhal 1972 : 33).
VERSION ROUMAINE 1
Copiii îl adorau, el nu-i iubea deloc; gândul lui era în altă parte. Orice ar fi putut
face mormolocii aceia nu-l plictiseau niciodată. Rece, drept, nepăsator şi totuşi
iubit pentrucă sosirea lui gonise întru câtva plictiseala din casă, fu bun preceptor.
Cât îl privea, nu simţea decât ură şi oroare faţă de societatea înaltă, în care el era
primit, la drept vorbind, în coada mesei, ceea ce explică poate ura şi oroarea lui.
Avură loc şi oarecari prânzuri de gală, când el abia putu să-şi înfrâne ura de tot
ceeace-l înconjura. Într’o zi, la Sf. Ludovic, pe când d-l Valenod dădea tonul
conversaţiei la d. de Rênal, Julien fu aproape să se tradeze; fugi în gradină sub
motiv să vadă pe copii. Ce elogii asupra cinstei! exclamă el; s’ar spune că
aceasta este singura virtute; şi totusi, ce consideraţie, ce respect adânc unui om,
care cu siguranţă şi-a îndoit şi întreit averea, de când administrează bunurile
săracilor! Pun rămăşag, că el profită şi din fondurile destinate copiilor găsiţi,
acelor sărmani a căror mizerie este încă şi mai sfântă decât a celorlalţi! Ah!
monştri! monştri! Şi eu însu-mi sunt un fel de copil găsit, urât de tata, de fraţi, de
întreaga mea familie. (Stendhal 1930?: 58-59)
VERSION ROUMAINE 2
Copii îl adorau, dar el nu-i iubea ; gândurile lui erau aiurea. Orice ar fi făcut
prichindeii aceştia, nu-şi ieşea din fire niciodată. Rece, drept şi nepăsător, iubit
totuşi, pentrucă sosirea lui risipise oarecum plictiseala din casă, era un bun
pedagog. Întrucât îl privea, nu nutrea decât ură şi dezgust pentru înalta societate
în care fusese primit, ce-i drept, la coada mesei, ceeace ar putea explica, poate,
LES EXPRESSIONS IDIOMATIQUES DANS LES VERSIONS ROUMAINES DU ROUGE ET LE NOIR 111

ura şi dezgustul lui. La câteva mese de gală abia îşi putu stăpâni ura pentru tot
ce-l împrejmuia. Între altele, odată, de ziua sfântului Ludovic, când musafirii
domnului de Rênal nu se uitau decât în gura domnului Valenod, Julien fu cât
p’aci să se dea de gol ; se refugie în grădină sub cuvânt că se duce să vadă copii
(sic). Cum laudă cu toţii cinstea ! izbucni el. S’ar spune ca nu mai există altă
virtute. Dar în acelaş timp cum se mai ploconesc, cum se mai gudură în faţa unui
om care desigur că şi-a îndoit şi întreit averea de când mânueşte avutul
săracilor ! Aş pune rămăşag că ciupeşte şi din banii destinaţi copiilor găsiţi, ai
acestor sărmani, a căror mizerie e şi mai sfântă decât a celorlalţi. Ah, ce monştri !
Ce monştri ! Eu însumi nu sunt decât un fel de copil găsit, urît de tatăl meu, de
fraţi şi de întreaga mea familie. (Stendhal 1950: 36-37)
VERSION ROUMAINE 3
Copiii îl adorau. El nu-i iubea deloc. Gândurile îi erau în altă parte. Orice ar fi
făcut ţâncii ăştia nu-l scoteau din răbdări niciodată. Rece, drept, nepăsător şi
totuşi iubit, fiindcă sosirea lui alungase oarecum plictiseala din casă, el fu un bun
preceptor. În ceea ce-l privea, nu simţea decât ură şi scârbă pentru înalta
societate în care era îngăduit, de fapt, la coada mesei, ceea ce explica poate ura şi
scârba. La câteva prânzuri de gală abia îşi putu stăpâni ura faţă de tot ce-l
înconjura. Într-o zi de Sfântului Ludovic, mai ales, pe când domnul Valenod
dădea tonul conversaţiei în salonul domnului de Rênal, Julien fu cât pe ce să se
tradeze şi fugi în grădină, pretextând că vrea să vadă copiii. „Câte laude i se mai
aduc cinstei ! gândi el. Ai zice că ea e singura virtute. Şi totuşi, câtă stimă, ce
josnic respect pentru un om care fără îndoială că şi-a dublat şi şi-a întreit averea
de când administrează bunurile săracilor ! Aş pune rămăşag că scoate câştiguri
până şi din fondurile hărăzite copiilor găsiţi, ale acestor sărmani a căror
nenorocire e şi mai sfântă decât a altora! Ah ! Monştrii ! Monştrii ! Şi eu, de
asemenea, sunt un copil găsit, urât de tata, de fraţii mei, de toată
familia”. (Stendhal 1981: 38)
VERSION ROUMAINE 4
Copiii îl adorau, dar el nu-i iubea ; gândul lui era în altă parte. Nimic din ce
puteau face ţâncii ăştia nu-l enerva. Rece, corect, impasibil, şi totuşi iubit, pentru
că venirea lui izgonise oarecum plictisul din casă, fu un bun preceptor. În ceea
ce-l priveşte, el nu simţea decât ură şi oroare faţă de înalta societate în care era
admis, ce-i drept la coada mesei, ceea ce explică poate ura şi oroarea lui. Au avut
loc câteva dineuri fastuoase, în timpul cărora cu greu şi-a putut stăpâni ura faţă
de tot ce-l înconjura. Odată, de sărbătoarea Sfântului Ludovic, când domnul
Valenod susţinea conversaţia în salonul domnului de Rênal, Julien fu cât pe ce să
se trădeze ; fugi în grădină, sub pretextul că trebuie să-i caute pe copii. Ce elogii
aduse probităţii ! exclamă el; de parcă asta ar fi singura virtute ; şi câtă
consideraţie, cât respect linguşitor faţă de un om care în mod evident şi-a dublat
şi triplat averea de când administrează bunurile săracilor ! Pot paria că îşi trage
câştiguri şi din fondurile destinate copiilor găsiţi, acestor bieţi copii a căror
mizerie este mai sacră decât oricare alta ! Ah ! ce monştri ! ce monştri ! Dar şi eu

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


112 ANCA-ANDREEA BRĂESCU

sunt un fel de copil găsit, urât fiind de tatăl meu, de fraţii mei, de toată familia
mea. (Stendhal 2007: 48)
VERSION ROUMAINE 5
Copiii îl adorau, însă el nu-i iubea absolut deloc. În altă parte îi zbura gândul.
Tot ce ar fi putut scorni plozii aceia nu-l făcea nicidecum să îşi piardă răbdarea.
Rece, corect, impasibil şi totuşi iubit, se dovedi un bun preceptor poate şi pentru
că apariţia lui mai alungase din plictiseala care domnea în întreaga casă. Nu
simţea decât ură şi dezgust faţă de înalta societate în care fusese admis, nu e
vorbă, la cel mai îndepărtat capăt al mesei. Poate că asta şi explica ura şi
dezgustul. În timpul câtorva dineuri fastuoase cu greu îşi putuse înfrâna
manifestarea repulsiei faţă de tot ceea ce-l înconjura. De exemplu, cu ocazia
sărbatorii de Saint-Louis, pe când domnul Valenod conducea conversaţia de la
domnul de Rênal, Julien fusese foarte aproape de a se trăda. A trebuit să iasă pe
nepusă-masă în gradină, pretextând că trebuie să vadă ce fac copiii. „Cât mai
elogiază probitatea! îşi strigase în sine. Ai zice că altă virtute nu mai există. Şi
câtă consideraţie, cât respect josnic pentru un om care, evident, şi-a dublat, şi-a
triplat averea de când administrează bunurile săracilor ! Pariez că scote bani şi
din fondurile destinate copiilor găsiţi, amărâţilor acelora a căror stare mizerabilă
este încă mai profundă decât a celorlalţi săraci! Ah ! Monştrilor ! Monştrilor ! Şi
eu sunt un fel de copil găsit, urât cum sunt de tatăl meu, de fraţi, de întreaga
familie”. (Stendhal 2009: 31)

4.1. Créativité de l’auteur – liberté du traducteur


Analysons une première expression idiomatique présente dans l’unité suivante :
Pour lui, il n’éprouvait que haine et horreur pour la haute société où il était ad-
mis, à la vérité au bas bout de la table, ce qui explique peut-être la haine et
l’horreur. [VO]
L’expression imagée « être admis au bas bout de la table » rend preuve de la
position de Julien dans la famille qui l’accueille, anticipant sa révolte. Nos re-
cherches ont mis en évidence le fait que l’expression française couramment
employée est « être assis/ être placé en bout de table ». Chez Stendhal, elle ac-
quiert donc une connotation plus générale, « être assis/ placé » étant remplacé
par « être admis ». Cette variante originale de l’expression contribue davantage
à rendre le statut précaire du personnage. Si cette expression comporte déjà un
sens dépréciatif dans le contexte du repas, comme le montre le Dictionnaire du
Centre national de ressources textuelles el lexicales, ici elle signifie accepter
quelqu’un tout en lui attribuant un rôle inférieur en général.
La tonalité péjorative a été rendue par tous les traducteurs roumains, mais avec
des nuances différentes, les traducteurs rendant preuve de créativité.
L’équivalence prédominante est a fi primit în/ la coada mesei. Certains traduc-
teurs, comme Gellu Naum, prennent la liberté d’insister, à l’instar de l’auteur,
LES EXPRESSIONS IDIOMATIQUES DANS LES VERSIONS ROUMAINES DU ROUGE ET LE NOIR 113

sur la nuance dépréciative par l’emploi de la construction verbale a fi îngăduit


[être accepté]. Le même genre de solution est envisagée par Irina Mavrodin, qui
emploie dans sa version l’expression verbale a fi admis [être admis].
L’auteur de la dernière version, Doru Mareş, recourt au même verbe, mais il
opère un étoffement de la deuxième partie de l’expression, ajoutant une épithète
au superlatif : « cel mai îndepărtat capăt al mesei » [au plus éloigné bout de la
table]. Or la créativité dont rend preuve Stendhal dans le cas de cette expression
n’influence pourtant pas le style dépourvu d’ornements, voire elliptique, qui
caractérise en général son récit. C’est pourquoi, allonger trop une expression,
comme c’est le cas de cette dernière version, risque d’alourdir trop le style sten-
dhalien. Les solutions envisagées par Gellu Naum et Irina Mavrodin, rendent de
manière plus synthétique l’expression idiomatique originale et contribuent à
(re)créer les mêmes effets stylistiques que dans le texte-source.

4.2. Traduire l’ellipse dans les expressions idiomatiques


Dans d’autres cas, Stendhal modifie l’expression idiomatique dans l’autre sens,
c’est-à-dire en la rendant plus courte, voire elliptique :
Un jour de la Saint-Louis entre autres, M. Valenod tenait le dé chez M. de Rênal,
Julien fût sur le point de se trahir. [VO]
L’expression « tenir le dé de la conversation », elliptique chez Stendhal, renvoie
à « tenir le premier rang dans la conversation, y briller », comme le montre le
Dictionnaire du Centre National de ressources textuelles et lexicales. Dans ce
cas, à part l’expression telle quelle, les traducteurs doivent tenir compte de la
construction lapidaire de la phrase stendhalienne.
Le premier traducteur, George A. Dumitrescu, et Gellu Naum emploient
l’expression « a da tonul conversaţiei » [donner le ton de la conversation], qui
rend d’une manière appropriée l’expression française, renvoyant à la connota-
tion de déclencheur, mais sans suggérer la dominante de l’attitude de Valenod.
La solution trouvée par Irina Mavrodin, « a sustine conversaţia » [soutenir la
conversation], surprend cette dominante générale de la tenue de Valenod.
Ion Marin Sadoveanu choisit une expression presque populaire, qui se caractéri-
se par une trop grande oralité, entraînant un étoffement de la phrase et des
ajouts qui portent atteinte au style lapidaire de Stendhal : « când musafirii […]
nu se uitau decât în gura domnului Valenod » [lorsque les hôtes…ne regardaient
que dans la bouche de M. Valenod]. Cette version, datée historiquement, com-
porte d’autres expressions du même genre, comme « să se dea de gol » (pour se
trahir). L’abondance d’expressions idiomatiques transporte le texte dans
l’espace culturel roumain populaire, entraînant un certain effacement des parti-
cularités culturelles de l’original.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


114 ANCA-ANDREEA BRĂESCU

Dans la plus récente version roumaine, le traducteur emploie une expression


dont l’usage n’est pas courant en roumain : « a conduce conversaţia » [conduire
la conversation], créant un effet de lourdeur et entravant la lecture.
Dans le cas d’expressions idiomatiques plus communes et qui ont un équivalent
en roumain, la traduction ne devrait pas entraîner des difficultés : l’expression
« être sur le point de » est traduite en roumain dans la plupart des versions par
« a fi cât pe ce să ». Pourtant, George A. Dumitrescu et Gellu Naum traduisent
par « a fi aproape să/de », expression qui passe moins facilement en roumain.
Nous observons que la traduction des expressions idiomatiques entraîne des
difficultés, d’une part, du point de vue de la recherche de l’équivalent et, d’autre
part, du point de vue du choix des solutions qui respectent la spécificité du texte
original et qui puissent permettre une lecture fluente en roumain.

4.3. Le phénomène de l’ajout des expressions idiomatiques


De par leur spécificité, les expressions idiomatiques sont censées rendre une
langue plus fluente, plus naturelle. Mais un dosage exagéré risque d’annexer le
texte à la culture roumaine, le dépourvoyant de sa spécificité originale. C’est
souvent le cas dans certaines versions roumaines du Rouge et le noir, où les
traducteurs ajoutent des expressions idiomatiques là où l’auteur n’en a pas em-
ployé :
Tout ce que ces marmots pouvaient faire ne l’impatientait jamais. [VO]
Cette phrase est rendue en roumain par Ion Marin Sadoveanu par l’expression
idiomatique « a iesi din fire », alors que Gellu Naum emploie l’expression « a
scoate din răbdări ». Pour ce qui est du dernier traducteur, il préfère aussi em-
ployer l’expression idiomatique « a-și pierde răbdarea ».
Nous remarquons dans la version d’Irina Mavrodin la préférence pour les ex-
pressions courtes, sans connotations familières et rendues dans un style lapi-
daire analogue à l’original. Elle emploie, dans ce cas précis, le verbe équivalent
« a se enerva » [s’énerver], restant fidèle à la forme et au sens de l’original.
Transporter ces expressions tout en maintenant un style laconique, mais dense,
représente un des grands défis de la traduction du roman stendhalien.

5. Conclusions
Nos conclusions sont formulées suite à une analyse détaillée, effectuée sur un
corpus plus vaste dans le cadre de notre thèse de doctorat, soutenue en sep-
tembre 2013. Nous avons voulu présenter ici une partie des résultats de notre
LES EXPRESSIONS IDIOMATIQUES DANS LES VERSIONS ROUMAINES DU ROUGE ET LE NOIR 115

recherche, tout en illustrant notre analyse par un corpus formé d’un échantillon
des textes que nous avons analysés.
Nous concluons sur le fait que dans la problématique de la traduction des ex-
pressions idiomatiques du français vers le roumain les difficultés sont liées no-
tamment à l’ellipse, qui accentue l’impression de style neutre, renforçant
l’ambigüité et rendant plus complexe la polyphonie narrative.
Par l’analyse des cinq versions, nous avons observé la modalité de traitement de
ces particularités du roman stendhalien, identifiant les tendances traduisantes de
chaque traducteur. Si, d’une part, les choix des traducteurs sont datés histori-
quement et renvoient à l’imaginaire de la langue à un certain moment de
l’histoire, d’autre part, nous remarquons dans le cas de certaines versions des
problèmes liés au dosage des expressions idiomatiques, voire à leur emploi exa-
géré. C’est surtout le cas de la dernière version analysée (Stendhal, 2009), qui
comporte de graves problèmes de traduction, ce qui nous amène à l’appeler, en
reprenant le syntagme de Lance Hewson, une « traduction fausse » (Hewson,
2013).
Dans la plupart des versions nous avons remarqué une difficulté constante de
rendre le discours elliptique stendhalien et la polyphonie narrative, des solutions
ponctuelles plus ou moins créatives contribuant à la création d’une série ouverte
des versions roumaines du roman stendhalien.
Notre conclusion est que la retraduction du roman était nécessaire au XXe
siècle, d’une part, à cause de l’évolution de la langue, visible notamment dans
les deux premières versions, et, d’autre part, à cause du fait que la traduction de
Gellu Naum, qui a beaucoup circulé à travers les onze rééditions, est très datée
historiquement.
Dans ce contexte, la version d’Irina Mavrodin, qui comporte une préparation de
long terme et qui se montre plus attentive à la modernité de l’écriture stendha-
lienne, est nécessaire pour la série ouverte de (re)traductions, d’autant plus que
la traductrice roumaine est préoccupée aussi par l’aspect théorique de la traduc-
tion.

6. Bibliographie
Corpus des textes analysés
Stendhal. 1972. Le Rouge et le noir: chronique du XIXe siècle. Préface Claude Roy,
postface et notes Béatrice Didier. Paris : Gallimard.
Stendhal. 1922. Schitul din Parma (I-II), trad. V. Demetrius. Bucureşti: Socec.
Stendhal. 1928. Le rouge et le noir, trad. H. Blazian. Dimineaţa, XXIV, no. 7778-7893.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


116 ANCA-ANDREEA BRĂESCU

Stendhal. 1930 (?). Roşu şi negru (I-II), trad. George A. Dumitrescu. Bucureşti: Librăria
Universală Alcalay & Co.
Stendhal. 1950. Roşu şi negru. Cronica secolului al XIX- lea, trad. Ion Marin
Sadoveanu. Bucureşti: Editura de Stat.
Stendhal. 1959. Roşu şi negru, Opere alese (I). trad. Gellu Naum. Bucureşti: Editura de
Stat pentru Literatură şi artă.
Stendhal. 2003. Roşu şi negru. Bucureşti: Editura Rao.
Stendhal. 2007. Roşu şi negru. traducere, prefaţă şi note Irina Mavrodin, Bucureşti:
Leda.
Stendhal. 2009. Roşu şi negru, traducere şi note Doru Mareş, Bucureşti: Adevărul
Holding.

Corpus théorique
Guiraud, Pierre. 1961. Les Locutions françaises. Paris : Presses universitaires de France,
coll.« Que sais-je ?. ISBN 9782130364566.
Hewson, Lance. 2013. Éloge de la subjectivité. Atelier de traduction numéro hors-série
« Traduire la subjectivité ». Suceava: Editura Universității Suceava: 13-29.
ISSN 1220-9589
Mavrodin, Irina. 2006. Despre traducere - literal şi în toate sensurile. Craiova: Editura
Scrisul Românesc. ISBN 9789738797338
Mavrodin, Irina. 1985. Stendhal- scriitură şi cunoaştere. Bucureşti: Editura Albatros.
Rey, Alain, Chantreau, Sophie. 2003. Dictionnaire des expressions et locutions. Paris :
Dictionnaires Le Robert. ISBN 9782849022665

Dictionnaires
Dictionnaire du Centre National de ressources textuelles et lexicales
<http://www.cnrtl.fr/definition/bouts>
Dictionarul explicativ al limbii române <http://dexonline.ro/>

1
Contribution réalisée dans le cadre du programme CNCSIS PN-II-IDEI-PCE-2011-3-0812
(Projet de recherche exploratoire) Traduction culturelle et littérature(s) francophone(s): histoire,
réception et critique des traductions, Contrat 133/2011.
Estudios de la traducción basados en corpus.
Aspectos metodológicos para el análisis de estilo

[Corpus-based Translation Studies. Methodological


aspects for analysis of style]
ARIEL NOVODVORSKI
Universidad Federal de Uberlândia (MG/Brasil)
arivorski@gmail.com
Resumen
El crecimiento de las investigaciones en el ámbito de los Estudios de la Traducción
basados en Corpus (ETBC) ha aumentado en las últimas décadas (Laviosa, 2002); sin
embargo, aún se hace necesaria la definición de un cuadro teórico-metodológico más
preciso, para la investigación de los perfiles estilísticos de la traducción (Saldanha,
2011b). Este trabajo presenta el cuadro metodológico desarrollado para el análisis de
estilo, en un corpus paralelo de textos literarios, en el par lingüístico español/portugués.
El corpus está integrado por tres obras del escritor argentino Ernesto Sabato, traducidas
al portugués brasileño por Sergio Molina. Se describirán todos los procedimientos im-
plicados para la compilación, preparación y análisis estilístico del corpus de estudio, con
apoyo de las herramientas y utilitarios del programa WordSmith Tools©, 5.0 (Scott,
2008). Son parte integrante de los procedimientos de análisis la identificación de temá-
ticas y el análisis contrastivo de semejanzas y diferencias en el plano léxico-gramatical.
Abstract
Despite the fact that the research in the field of Corpus-based Translation Studies (CTS)
has been increasing in recent decades (Laviosa, 2002), a more precise theoretical and
methodological framework remains necessary for the investigation of stylistic profiles
regarding translation (Saldanha, 2011b). This study reports a methodological frame-
work developed for style analysis using a parallel corpus of literary texts in the language
pair Spanish-Portuguese. The corpus consists of three works of the Argentine writer
Ernesto Sabato, translated into Brazilian Portuguese by Sergio Molina. All research
procedures involved in the compilation, preparation and stylistic analysis of the corpus
—the latter carried out with the aid of WordSmith Tools©, 5.0— are described in detail.
They are an integral part of the procedures for identification of text’s aboutness
and contrastive analysis of similarities and differences in lexical-grammatical level.
Palabras clave
Estudios de la traducción basados en corpus, procedimientos metodológicos, estilo en
traducción, corpus paralelo
Key words
Corpus-based translation studies, methodological procedures, style in translation, paral-
lel corpus

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
118 ARIEL NOVODVORSKI

1. Introducción
Este trabajo está situado en el ámbito de los Estudios de la Traducción basados
en Corpus (ETBC) y, particularmente, se orienta hacia los estudios sobre Estilo
de los textos traducidos. Asumimos estilo, aquí, como atributo textual, en el
análisis de un corpus paralelo de textos literarios, en el par lingüístico espa-
ñol/portugués.
Pese al crecimiento de las investigaciones en el ámbito de los ETBC, que viene
aumentando en las últimas décadas (Laviosa, 2002), la definición de un cuadro
teórico-metodológico más preciso, para la investigación de los perfiles estilísti-
cos de la traducción (Saldanha, 2011b), aún se hace necesario. Por otro lado, la
representación de las lenguas española y portuguesa, tanto en las investigacio-
nes nacionales como internacionales, en el ámbito de los ETBC, también es
escasa.
De ese modo, el objetivo principal de este estudio es presentar detalladamente
algunos de los procedimientos metodológicos desarrollados mi tesis doctoral
(Novodvorski, 2013), circunscrita a la investigación del perfil estilístico en la
traducción literaria entre esas lenguas. En dicha oportunidad, establecí un víncu-
lo entre diferentes teorías y establecí una triangulación de los datos y resultados
obtenidos en la investigación.
El corpus de estudio está formado por tres obras literarias del autor argentino
Ernesto Sabato, traducidas al portugués brasileño por Sergio Molina. Los pro-
cedimientos metodológicos utilizan, principalmente, conceptos provenientes de
la Lingüística de Corpus, en especial por la utilización de herramientas y utilita-
rios del programa para análisis lingüísticos WordSmith Tools© (WST), 5.0
(Scott, 2008).
Serán presentados en este trabajo los diferentes procedimientos metodológicos
adoptados, adaptados y/o creados para la identificación: de las temáticas
(aboutness) del corpus, por medio de la clavicidad (keyness), entendida como
cualidad textual (Scott, 2010; Stubbs, 2010; Berber Sardinha, 2009); de seme-
janzas y diferencias en el plano léxico-gramatical, a partir de un análisis con-
trastivo, vinculadas a las (sub)categorías de la presentación del discurso (Leech
y Short, 2007; Semino y Short, 2004); y de significados culturales vehiculados
en las traducciones, a través de los usos de la letra cursiva y de los signos de
puntuación (Saldanha, 2005; 2011c; May, 1997) y de elementos paratextuales
(Genette, 2009).
La próxima sección presenta una breve delimitación del campo de estudios teó-
ricos al que se circunscribe este trabajo.
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 119

2. Un acercamiento teórico
El origen e inspiración de los Estudios de la Traducción basados en Corpus
(ETBC) derivan tanto de la Lingüística de Corpus (LC) como de los Estudios
Descriptivos de la Traducción (EDT). Aunque las primeras influencias de la LC
en los estudios de la traducción hayan surgido a partir de la búsqueda por cons-
tituir una metodología de investigación más coherente y efectiva, Laviosa
(2002) señala que ya hay suficientes elementos para afirmar que los ETBC pa-
san a constituirse como un «nuevo paradigma». La autora entiende que se trata
de un abordaje que va más allá de una metodología innovadora. En ese sentido,
entre las contribuciones más destacadas procedentes de investigaciones desarro-
lladas en el área, Laviosa destaca la formulación de hipótesis y de fundamenta-
ciones teóricas, la definición de herramientas para análisis empíricas, además de
las innúmeras aplicaciones.
Ya en el ámbito de los estudios acerca de estilo de los textos traducidos, la me-
todología de análisis propuesta por Malmkjaer (2004) es la Estilística Traducto-
ria. Dicho abordaje metodológico consiste en el estudio de patrones recurrentes
en las relaciones entre el texto de partida y la traducción, o entre la obra más
vasta de un autor y un conjunto de traducciones de esa obra. Malmkjaer (2004:
14) apunta que «estilo puede ser definido como una regularidad consistente y
estadísticamente significante de ocurrencia en el texto de ciertos ítems y estruc-
turas, o tipos de ítems y estructuras, entre aquellos que la lengua ofrece como un
todo» (traducción propia).
En la estilística traductoria se busca responder a la siguiente cuestión: ¿qué hace
que una traducción signifique de un modo determinado y no de otro? En el aná-
lisis estilístico monolingüe, por otro lado, Malmkjaer (2004) observa que es
posible realizar afirmaciones acerca del modo como cualquier texto provoca
respuestas en la mente lectora, independientemente del modo como el texto
haya surgido. Malmkjaer define claramente su objeto de atención en el estilo de
los textos traducidos.
La próxima sección presenta un conjunto de aspectos metodológicos, desarro-
llados para el análisis de estilo de los textos traducidos, aplicados a un corpus
paralelo literario.

3. Una aproximación metodológica


La metodología de los ETBC adoptada para la realización del presente trabajo
consistió, resumidamente, en los siguientes procedimientos:
• compilación del corpus de estudio;
• preparación para la lectura con las diversas herramientas y utilitarios del
programa para análisis lingüísticos WST (Scott, 2008);

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


120 ARIEL NOVODVORSKI

• alineación de los tres subcorpus paralelos;


• etiquetado del corpus con (sub)categorías y marcadores, propios para el
análisis del discurso referido (Leech y Short, 2007; Semino y Short,
2004), en términos de la Presentación del Habla, Escritura y Pensamien-
to (PHE&P);
• compilación de un corpus de referencia, para el estudio de la clavicidad
(keyness), a partir de la extracción de las palabras-clave (Scott, 2010;
Stubbs, 2010; Berber Sardinha, 2009);
• etiquetado para la identificación de algunas marcas tipográficas, para el
análisis contrastivo de la letra cursiva (itálicos) en textos originales y
traducidos;
• itemización, para análisis de la puntuación; y
• preparación para análisis de elementos paratextuales, como notas del
traductor, además de otros materiales considerados peritextos y epitex-
tos del corpus (Genette, 2009).
La perspectiva de análisis adoptada se resume en la siguiente ilustración:

Ilustración1. Perspectiva de análisis


De ese modo, los trabajos consistieron en una triangulación de técnicas, proce-
dimientos y datos, según: (1) la identificación de las temáticas del corpus, por
medio da clavicidad, entendida como cualidad textual (Scott, 2010; Stubbs,
2010; Berber Sardinha, 2009); (2) el análisis contrastivo de semejanzas y dife-
rencias en el plano léxico-gramatical, a partir de las (sub)categorías de la pre-
sentación del discurso [habla, escritura y pensamiento – PHE&P] (Leech y
Short, 2007; Semino y Short, 2004), vinculado al punto de vista narrativo
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 121

(Schiavi, 1996; Hermans, 1996; May, 1994); y (3) el análisis de significados


culturales vehiculados por medio de intervenciones explícitas: itálicos y pun-
tuación (Saldanha, 2005; 2011c; May, 1997) y de elementos paratextuales en
las traducciones (Genette, 2009).

3.1. Corpus de estudio


La composición del corpus de estudio reúne tres obras literarias del escritor
argentino Ernesto Sabato, escritas en lengua español, en su variante rioplatense,
y sus respectivas traducciones al portugués brasileño, realizadas por el traductor
literario Sergio Molina. Los títulos de los textos originales, de las traducciones,
de las editoriales y años de publicación se pueden apreciar en la siguiente ilus-
tración:

Ilustración 2. Corpus de Estudio

3.2. Compilación y preparación del corpus de estudio


La compilación del corpus de estudio consistió en las etapas de: digitalización,
por medio del programa ABBYY FineReader®, versión 10; aplicación del motor
OCR (Optical Character Recognition), para reconocimiento óptico de caracte-
res; y posterior revisión, para corrección de problemas identificados en el proce-
so de digitalización del corpus. De las tres etapas, el proceso de revisión fue el
que requirió mayor esfuerzo y mucha concentración, además de ocupar un
tiempo de dedicación prolongado. Calculo que fue necesario destinar alrededor

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


122 ARIEL NOVODVORSKI

de 60 horas de trabajo, distribuidas en un mes y medio. Las siguientes ilustra-


ciones 3 y 4 muestran un resumen de esos procedimientos:

Ilustración 3. Programa ABBY FineReader®, versión 10

Ilustración 4. Proceso de revisión del corpus digitalizado

3.3. Extensión del corpus de estudio


Una vez que el corpus de estudio ya se encontraba digitalizado y revisado, el
procedimiento siguiente consistió en convertir los archivos de formato DOC a
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 123

texto plano TXT, para posterior lectura con las herramientas y utilitarios del
programa WST. Cada uno de los textos originales (TOs) y de los textos traduci-
dos (TTs) fue archivado en ambos formatos. Para la obtención de los datos esta-
dísticos del corpus se utilizó la herramienta Wordlist. El número total de ítems
(tokens), palabras totales, se obtuvo a partir de la lectura del corpus de estudio
completo, TOs y TTs; en el caso de las formas (types), palabras diferentes, se
realizó una lectura separada para los textos en español y otra para los textos en
portugués.
Diferentemente de los ítems, la totalidad de las formas (21.028) proporcionada
por la herramienta del programa (ver Ilustración 5) no se puede tomar en cuenta,
una vez que el corpus de estudio general es compuesto por textos escritos en dos
lenguas diferentes. Tampoco se podría alcanzar el valor total de las formas en
cada lengua por medio de la suma de los resultados de cada uno de los textos,
una vez que una gran cantidad de formas de un texto también ocurre en los otros
textos. De ese modo, el número total de formas, en cada subcorpus de TOs y
TTs, fue calculado separadamente.
Además de esas informaciones más generales sobre la extensión del corpus y de
cada uno de los subcorpus, también se calculó la significancia estadística de las
diferencias entre las proporciones (Cf. Ilustración 5, columna p-valor), en la
relación entre cada TO y TT y, aun, entre el conjunto de TOs y TTs. Para el
cálculo de la significancia estadística se realizó el test de la binomial para dife-
rencias entre proporciones. A seguir, la Ilustración 5 (v. pág. 124) reúne los
datos generales del corpus de estudio.

3.4. Alineación del corpus de estudio


Tras las etapas de digitalización, preparación y extracción de datos más genera-
les sobre la extensión del corpus de estudio, el paso siguiente fue el de alinea-
ción de los TOs con sus respectivos TTs. Para procesar el corpus paralelo con el
utilitario Viewer & Aligner, del programa WST, se observó la necesidad de
organizar paralelamente, lado a lado, en dos columnas, cada TO con su corres-
pondiente TT. Esa necesidad fue observada después de muchos experimentos e
intentos en los que la alineación difería considerablemente.
La finalidad de ese procedimiento, por un lado, era que el inicio de cada párrafo
del TO correspondiera al del TT. Tal correspondencia hizo posible que, una vez
para guardados en documentos independientes en formato DOC y, por último,
convertidos al formato TXT, se pudiera procesar los TOs y TTs con el utilitario
Viewer & Aligner, manteniéndose encontrados en los inicios de cada párrafo.
Por otro lado, estando lado a lado los textos originales y sus respectivas traduc-
ciones, los procedimientos de observación, comparación y anotación de particu-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


124 ARIEL NOVODVORSKI

laridades, en la etapa de etiquetado, se pudieron realizar simultáneamente en


ambos textos, sin pérdida de la alineación.

Ilustración 5. Extensión del Corpus de Estudio

La Ilustración 6 presenta una vista parcial del procesador de texto Word®, en la


que se puede apreciar un fragmento alineado de TO y TT, con ajuste de párrafo.
Además, es posible observar también parte de las etiquetas empleadas para ano-
tación de la PHE&P:

Ilustración 6. Alineación del corpus


ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 125

La próxima ilustración muestra el procedimiento realizado para el ajuste de


párrafo:

Ilustración 7. Alineación del corpus con ajuste de párrafo

Con los tres subcorpus paralelos alineados y convertidos individualmente cada


TO y su respectivo TT al formato TXT, se pudo procesar la alineación con el
utilitario Viewer & Aligner. Según la elección del investigador, se puede optar
por la visualización del corpus alineado por frases (Cf. Ilustración 8) o alineado
por párrafos (Cf. Ilustración 9):

Ilustración 8. Corpus alineado por frases en el utilitario Viewer & Aligner

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


126 ARIEL NOVODVORSKI

Ilustración 9. Corpus alineado por párrafos en el utilitario Viewer & Aligner

A partir de cada uno de esos dos modos de visualización del corpus alineado,
por frases o por párrafos, el utilitario da la opción de guardar los resultados en
archivo con formato TXT. Con eso, se pueden obtener y guardar dos archivos en
dicho formato, uno que contendrá el corpus paralelo alineado por frase (Cf.
Ilustración 10, pág. 127) y otro alineado por párrafo (Cf. Ilustración 11, pág.
127). Ese procedimiento es muy oportuno para el establecimiento posterior de
las líneas de concordancia, con la herramienta Concord del WST. Las dos pró-
ximas ilustraciones muestran una vista parcial del corpus paralelo alineado en
formato TXT:
Es importante observar que, al término de todos los procedimientos relatados
para la alineación del corpus paralelo de cada uno de los tres pares de TOs y
TTs, obtuve la siguiente organización por formatos del corpus:
• cada TO con su correspondiente TT, alineado lado a lado, en dos co-
lumnas, en un mismo archivo en DOC;
• cada TO y TT en DOC y en TXT, separadamente, sin etiquetas;
• cada TO y TT en DOC y en TXT, separadamente, con etiquetas, según
el aspecto a ser analizado;
• cada TO y TT en VWR (Viewer), separadamente;
• cada TO con su correspondiente TT, alineado por frases, en ALI (Alig-
ner);
• cada TO con su correspondiente TT, alineado por párrafos, en ALI
(Aligner);
• cada par de TO/TT, alineado paralelamente por frases, en TXT; y
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 127

• cada par de TO/TT, alineado paralelamente por párrafos, en TXT.

Ilustración 10. Corpus paralelo alineado por frases en archivo formato TXT

Ilustración 11. Corpus paralelo alineado por párrafos en archivo formato TXT

Con el corpus etiquetado y alineado, en formato TXT, el procedimiento poste-


rior fue realizar búsquedas con la herramienta Concord, para establecimiento de
las líneas de concordancia, posibilitando la cuantificación de los resultados, el
establecimiento de tipologías y análisis cualitativo a partir de ejemplos. La pró-
xima ilustración presenta una vista parcial de la herramienta Concord, con las
líneas de concordancia establecidas a partir de la búsqueda por la etiqueta RFN,

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


128 ARIEL NOVODVORSKI

una de las categorías utilizadas en el análisis del discurso referido, y con el or-
den secuencial dado por la columna Nº de Palabra (Word #). Teniendo en cuen-
ta que el corpus ya se encuentra alineado y en formato TXT, al realizar las bús-
quedas a partir de las etiquetas, dicha organización guiada por el número de
palabra posibilita la visualización de la traducción debajo del texto original:

Ilustración 12. Concordancias de RFN con el corpus alineado por frases


A partir de la búsqueda con cada una de las categorías, según cada uno de los
niveles de análisis realizados, guardé en formato CNC (Concord), en carpetas
específicas, los resultados obtenidos. La ilustración 13 (pág. 129) muestra una
vista parcial de la organización de los resultados.
Teniendo en cuenta que los ETBC se configuran como un área interdisciplina-
rio, tras haber recurrido a los estudios sobre estilística, principalmente a aque-
llos que abordan aspectos vinculados a os diversos puntos de vista, apliqué al
corpus de estudio el conjunto de categorías para el análisis de la presentación
del discurso (PHE&P) propuesto por Leech y Short (2007) y por Semino y
Short (2004), como se puede observar en las últimas dos ilustraciones. Sin em-
bargo, tal abordaje basado en corpus no se mostró muy productivo, por lo me-
nos a ese nivel de análisis. No obstante eso, el corpus mostró diversos aspectos
que sería interesante investigar. De ese modo, decidí adoptar una perspectiva de
análisis más guiado por el corpus. Tal cambio de orientación condujo al estudio
de la tematicidad, a partir de la extracción de palabras clave.
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 129

Ilustración 13. Organización de los resultados por categorías para el discurso referido

3.5. Corpus de referencia y análisis de la clavicidad


Según Mike Scott (2010), aunque aún no se comprenda muy bien, el análisis de
la clavicidad (keyness) empieza a despertar el interés de investigadores, como
una cualidad textual que daría fuertes indicios sobre la temática del texto, junto
a indicadores de estilo. En ese sentido, otro procedimiento metodológico que
desarrollé, específico para la extracción de palabras clave y análisis de la tema-
ticidad contrastiva del corpus, fue la compilación equilibrada de un Corpus de
Referencia. En ese sentido, compilé un corpus de referencia compuesto por
textos periodísticos, académicos y literarios, originalmente escritos en lengua
española, que denominé CorREF01[es], y otro en lengua portuguesa denomina-
do CorREF01[pt].
Durante la compilación, tuve el cuidado de equilibrar por ítems, número de
palabras totales (tokens), los dos corpus y cada uno de los subcorpus que los
componen. Además, en términos cuantitativos, también observé que el corpus
de referencia fuera, por lo menos, de extensión cinco veces mayor que el corpus
de estudio. Según Berber Sardinha (2004: 102), ese es el tamaño recomendado
para el corpus de referencia. Otra recomendación para evitarse el filtrado de las
palabras clave es que el corpus de referencia esté integrado por tipologías y
géneros textuales distintos del corpus de estudio. Con eso, busqué que los textos

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


130 ARIEL NOVODVORSKI

que integraran el corpus de referencia, en general, fueran variados lo suficiente,


para no filtrar los resultados, principalmente los textos literarios. La próxima
ilustración muestra la extensión y distribución de los corpus de referencia en
ambas lenguas:

Ilustración 14. Extensión y distribución del corpus de referencia


Con los corpus de referencia en formato TXT, el paso siguiente fue extraer las
palabras clave por medio de la herramienta KeyWords del programa WST. El
resultado se obtiene a partir de la comparación entre las listas de palabras del
corpus de estudio con el corpus de referencia, respectivamente en cada lengua.
De ese modo, fue necesario tener archivadas en la computadora las listas de
palabras correspondientes de cada corpus en formato LST, para extracción pos-
terior de las palabras clave, que también fueron archivadas en formato KWS. A
partir de los resultados, pude identificar áreas semánticas que apuntaron hacia el
establecimiento de las temáticas del corpus de estudio. La siguiente ilustración
es una vista parcial de las palabras clave, específicamente de los sustantivos
clave, en lengua española y portuguesa, organizadas por clavicidad.
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 131

Ilustración 15. Palabras clave (sustantivos) organizadas por clavicidad

3.6. Itálicos, puntuación y elementos paratextuales


Así como las palabras clave pueden ser asumidas como «indicios» (pointers),
una vez que apuntarían hacia áreas que valdría la pena investigar (Scott, 2010;
Stubbs, 2010), Saldanha (2005; 2011c) también observa que los itálicos pueden
indicar áreas de interés para el investigador. La autora observa factores como la
disminución del nivel de formalidad en las traducciones al inglés y una conse-
cuente facilitación en la interpretación, vinculados a los efectos estilísticos que
derivan del uso enfático del itálico. Los itálicos son recursos extralingüísticos,
según Saldanha (2005), que pueden llamar la atención del lector para determi-
nadas formas particulares, y que tanto el autor del texto como el traductor po-
seen control sobre el uso de los itálicos.
Sin profundizar demasiado en las funciones comunicativas que describe Sal-
danha (2005) para el uso del itálico, por no tratarse específicamente de la finali-
dad del presente trabajo, apuntamos que de los tres tipos identificados por la
investigadora, el que corresponde a los usos enfáticos del itálico sería el de ma-
yor interés para el análisis de la significancia estilística. Saldanha (2005: 95)
también observa que los manuales de español y de portugués que consultó son
poco consistentes o que ni siquiera abordan el asunto, cuando se trata de la dis-
tinción de palabras, letras o expresiones, en las referencias que realiza un autor,
por ejemplo, a la pronunciación o al modo como se utiliza un término en deter-
minados contextos. Es decir, el uso del itálico cuando podría apuntar hacia as-
pectos de variación lingüística.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


132 ARIEL NOVODVORSKI

Considerando los trabajos desarrollados por Saldanha (2005; 2011c) y a partir


de la presencia significativa de itálicos en el corpus de estudio, durante los pro-
cedimientos de digitalización y preparación del corpus, percibí la importancia
de anotar de algún modo las ocurrencias de itálicos, porque se perderían en el
proceso de conversión a TXT. En ese sentido, otro procedimiento metodológico
desarrollado en la investigación, para el análisis de lo que serían esas interven-
ciones posiblemente más explícitas del traductor, fue el etiquetado en el corpus
de estudio de la letra cursiva (itálicos). Para eso, inserí las etiquetas <itálico> e
</itálico> para indicar el punto de inicio y término de expresiones y frases ente-
ras escritas en cursiva. Ese paso se hizo necesario, como ya apuntado, una vez
que al convertir los textos de formato DOC a TXT se pierden tales detalles. La
siguiente ilustración presenta una búsqueda para extracción de itálicos con la
herramienta Concord, en el corpus alineado:

Ilustración 16. Concordancias para extracción de itálicos

Además de los itálicos, otro nivel de análisis efectuado en la investigación con-


sistió en la cuantificación contrastiva de todos los signos de puntuación. Con la
herramienta Concord, realicé la búsqueda por el punto, la coma, el punto y co-
ma, paréntesis, etc. Sin embargo, pude observar que los primeros resultados no
parecían ser coherentes, dada la extensión del corpus (Cf. Ilustración 17). De
ese modo, experimenté itemizar todos los signos de puntuación que iría a inves-
tigar. Ese procedimiento de itemización (Berber Sardinha, 2004) consistió en
separar los signos de puntuación de las palabras que los precedían o seguían,
insiriendo un espacio. Tal ajuste fue realizado con auxilio del recurso localizar
y sustituir, en el procesador de texto Word®, sustituyendo el signo de puntua-
ción específico por un espacio seguido o antecedido por el signo. Las siguientes
ilustraciones muestran la búsqueda por el PUNTO, en el corpus con o sin itemi-
zación. En el ángulo inferior izquierdo de las imágenes se puede observar la
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 133

diferencia en los resultados: 367 ocurrencias del PUNTO, sin itemización y


3.588 ocurrencias con itemización.

Ilustración 17. Concordancia del PUNTO sin itemización

Ilustración 18. Concordancia del PUNTO con itemización


Para el ámbito de los elementos paratextuales (Genette, 2009), específicamente
en el caso de los peritextos, aquellos elementos que se encuentran en el períme-
tro del texto, utilicé la anotación del corpus para la recuperación posterior de las

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


134 ARIEL NOVODVORSKI

Notas del Traductor. Las etiquetas utilizadas fueron <NT+nº>, para indicar el
inicio, y </NT+nº> para el término de una nota. La numeración fue secuencial,
según el orden de aparición. La siguiente ilustración trae las líneas de concor-
dancia, a partir de la búsqueda por las <NT*>:

Ilustración 19. Notas del traductor


Para concluir esta presentación de procedimientos metodológicos, vinculados al
análisis de estilo de TTs en el ámbito de los ETBC, cabe apuntar que también se
aplicaron criterios detallados de organización para todos los elementos paratex-
tuales, tanto para los epitextos (paratextos que están más allá del texto) como
para los peritextos (paratextos que se circunscriben al espacio físico del texto).
La ilustración 20 (pág. 135) exhibe una vista parcial de la organización del cor-
pus de estudio, en carpetas independientes, a nivel de análisis y de formato.
La próxima sección concluye este trabajo, con algunas consideraciones a las que
se arriba, tras la descripción minuciosa de los procedimientos metodológicos
expuestos aquí.
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 135

Ilustración 20. Organización del corpus de estudio y elementos paratextuales

4. Consideraciones
El objetivo principal de este trabajo consistió en presentar, detalladamente, al-
gunos de los procedimientos metodológicos adoptados, adaptados y también
creados, en una investigación del perfil estilístico circunscrito a la traducción
literaria (Novodvorski, 2013), en un corpus paralelo español/portugués. Tras un
breve acercamiento teórico, describí las técnicas y recursos que integraron la
propuesta de triangulación de los datos y resultados obtenidos en la investiga-
ción, a partir del diseño de un cuadro metodológico. Según Saldanha (2011b),
aunque se pueda hablar del crecimiento de las investigaciones en el ámbito de
los ETBC, aún es necesaria la definición de un cuadro teórico-metodológico
más preciso, para la investigación de los perfiles estilísticos de la traducción. En
ese sentido, este trabajo también buscó cubrir, por un lado, esa carencia apunta-
da.
Se describieron todos los pasos implicados para la compilación, preparación y
análisis estilístico del corpus de estudio, con apoyo de las herramientas y utilita-
rios del programa WST (Scott, 2008), para la identificación de temáticas del
corpus, por medio de la clavicidad; para el análisis contrastivo de semejanzas y
diferencias en el plano léxico-gramatical, vinculado a las (sub)categorías de la
presentación del discurso; y para el estudio de significados culturales vehicula-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


136 ARIEL NOVODVORSKI

dos en las traducciones, a través de los usos de la letra cursiva, de los signos de
puntuación y de elementos paratextuales.
Destaco la perspectiva de construcción de un cuadro teórico-metodológico,
aplicado al análisis de estilo de los textos traducidos y, principalmente, la posi-
bilidad de replicación de los procedimientos adoptados aquí, en futuros trabajos,
dando continuidad a la investigación.

5. Bibliografía
Berber Sardinha, Tony. 2004. Lingüística de corpus. Barueri: Manole. ISBN
8520416764.
Berber Sardinha, Tony. 2009. Pesquisa em Lingüística de Corpus com WordSmith
Tools. Campinas, SP: Mercado das Letras. ISBN 9788575911068.
Baker, Mona. 2000. Towards a methodology for investigating the style of a literary
translator. @ Target 12 / 2: 241-266.
Genette, Gérard. 2009. Paratextos Editoriais. Tradução de Álvaro Faleiros. Cotia, SP:
Atelié Editorial. ISBN 9788574804583.
Hermans, Theo. 1996. The Translator’s voice in translated narrative. @ Target 8 / 1: 23-
48.
Laviosa, Sara. 2002. Corpus-Based Translation Studies: Theory, Findings, Applica-
tions. Amsterdam/New York: Editions Rodopi. ISBN 9042014873.
Leech, Geoffrey y Mick Short. 2007. Style in Fiction. Harlow: Pearson. ISBN
9780582784093.
Malmkjaer, Kristen. 2004. Translational stylistics: Dulcken’s translations of Hans
Christian Andersen. @ Language and Literature 13 / 1: 13-24. DOI:
10.1177/0963947004039484.
May, Rachel. 1997. Sensible Elocution: how translation works in & upon punctuation.
@ The Translator 3 / 1: 1-20. ISSN 1355-6509.
Novodvorski, Ariel. 2013. Estilo das traduções de Sergio Molina de obras de Ernesto
Sabato: um estudo de corpora paralelos espanhol / português. Tesis (Doctorado
en Estudios Lingüísticos) Belo Horizonte: Universidade Federal de Minas Ge-
rais (UFMG).
Saldanha, Gabriela. 2005. Style of Translation: An exploration of stylistic patterns in the
translations of Margaret Jull Costa and Peter Bush. Tesis (Doctorado en
Filosofía). Dublin: School of Applied Language and Intercultural Studies, Dub-
lin City University.
Saldanha, Gabriela. 2011b. Translator Style – Methodological considerations. @ The
Translator 17 / 1: 25-50. ISSN 1355-6509.
ESTUDIOS DE LA TRADUCCIÓN BASADOS EN CORPUS. ASPECTOS METODOLÓGICOS… 137

Saldanha, Gabriela. 2011c. Emphatic Italics in English Translations: Stylistic Failure or


Motivated Stylistic Resources? @ Meta: Translators' Journal 56 /2: 424-442.
Scott, Mike. 2008. WordSmith Tools, version 5.0. Liverpool: Lexical Analysis Software.
Scott, Mike. 2010. Problems in investigating keyness, or clearing the undergrowth and
marking out trails... @ M. Bondi y M. Scott, eds. Keyness in Texts. Amster-
dam/Philadelphia: John Benjamins Publishing Company. ISBN
9789027223173, pp 43-57.
Schiavi, Giuliana. 1996. There is always a teller in a tale. @ Target 8 / 1: 1-21.
Semino, Elena y Mick Short. 2004. Corpus Stylistics. New York: Routledge. ISBN
0415286697.
Stubbs, Michael. 2010. Three concepts of keywords. @ M. Bondi y M. Scott, eds.
Keyness in Texts. Amsterdam/Philadelphia: John Benjamins Publishing Com-
pany. ISBN 9789027223173, pp. 21-42
.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


Un corpus para la historia de la traducción: Offici-
na Barezzi y la edición sinóptica de las traducciones
españolas del Dei delitti e delle Pene
de Cesare Beccaria 1

[Corpora for the History of Translation: Officina


Barezzi and the synoptic edition of Beccaria's On
Crimes and Punishments translations into Spanish]
CARMEN CASTILLO PEÑA (1) Y RAFFAELLA TONIN (2)
(1) Università di Padova (Universidad de Padua, Italia)
(2) Università di Bologna (Universidad de Bolonia, Italia)
raffaella.tonin@unibo.it
Resumen
El portal Officina Barezzi (http://officinabarezzi.cab.unipd.it/officinabarezzi/) de la
Universidad de Padua aloja una serie de corpus paralelos de textos literarios y no litera-
rios de los siglos XVII-XIX con sus primeras traducciones. Los textos han sido adecua-
damente etiquetados para el análisis léxico y traductológico. Entre ellos se encuentra el
proyecto dedicado al Tratado Dei Delitti e delle Pene de Cesare Beccaria y a sus traduc-
tores españoles Juan Antonio de las Casas y Juan Rivera (1774 y 1821 respectivamen-
te). En esta comunicación se presentarán las distintas fases del proyecto ya ultimado,
haciendo hincapié en las potencialidades que se ofrecen al investigador en traductología
y en historia de la traducción a través del análisis de algunos casos representativos de
los dos métodos traductores empleados.
Abstract
Officina Barezzi http://officinabarezzi.cab.unipd.it/officinabarezzi/ is a website created
by the University of Padova in which parallel corpora made of literary texts are hosted.
Texts have been tagged to be consulted for lexical and translation analysis. Among
them, we can find Cesare Beccaria's treatise On Crime and Punishment together with its
first two translations into Spanish: the first one by Juan Antonio de las Casas (1774) and
the second one by Juan Rivera (1821). The present paper will describe, on the one hand,
the different steps in the building of the whole project and, on the other, the range of
feasible analyses offered to researchers interested both in Translation Studies and in the
History of Translation through the presentation of some examples of the methods and
procedures employed by the two translators of Beccaria.
Palabras clave
Corpus paralelo, italiano, edición sinóptica, análisis traductológico
Keywords
Parallel corpus, Italian language, synoptic edition, translation analysis
Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
140 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

1. Un corpus para la historia de la traducción: el proyecto Offi-


cina Barezzi
El portal Officina Barezzi (http://officinabarezzi.cab.unipd.it/officinabarezzi/)
es el producto de un ambicioso proyecto de investigación de larga andadura
consistente en la edición digital sinóptica de primeras traducciones de obras
significativas para la cultura italiana y española, cuya finalidad es ofrecer al
investigador una serie de textos paralelos de especial relevancia para ambas
lenguas y culturas. Como todo proyecto de una cierta amplitud de miras, los
resultados, visibles, abiertos y utilizables por toda la comunidad científica, se
prestan a múltiples aplicaciones y admiten diferentes lecturas. En primera ins-
tancia el portal está fundamentalmente dedicado a la edición de primeras tra-
ducciones, vertidas en formato electrónico, filológicamente rigurosas, legibles
en cuanto textos independientes y tratadas como parte de un corpus alineado, es
decir alineadas entre sí y con el texto fuente, y por tanto consultables como si de
un corpus textual se tratase, ya que tiene la capacidad de generar concordancias
monolingües o bilingües. Actualmente el portal tiene tres secciones: la edición
integral de las primeras traducciones al italiano de las Novelas Ejemplares de
Miguel de Cervantes, la edición integral de la traducción al italiano de La píca-
ra Justina, atribuida a Francisco López de Úbeda, y la edición integral de las
dos primeras traducciones al español del Trattato dei deliti e delle pene de Ce-
sare Beccaria. De estas tres secciones, solo la primera es actualmente pública,
mientras que las otras dos se encuentran en una fase muy avanzada de prepara-
ción. El portal prevé, además, alojar otras secciones dedicadas a distintas tipo-
logías de textos, así como fuentes lexicográficas y normativas inéditas, relacio-
nadas estrechamente con la traducción en Italia y en España. Se trata por tanto
de un abanico de producción traductológica muy amplio que permite abarcar
textos españoles o italianos de particular trascendencia para la historia de la
mediación cultural entre los dos países, ya por el autor del texto fuente –
Cervantes o Beccaria–, ya por la modalidad de traducción –la adaptación, o
reelaboración, en el caso la novela picaresca frente a la traducción literal de la
primera traducción del Trattato–, ya por la función de la traducción –fruición y
uso comercial del género picaresco, frente a la relevancia política y social del
Trattato–, ya por la época a la que pertenecen las traducciones –el siglo XVII,
en el que tantas traducciones españolas salen de las prensas italianas, y el
XVIII, que vio la difusión en España de la ciencia, la tecnología y el espíritu
ilustrado y racional gracias a la traducción.
El nombre del portal –taller Barezzi– rinde homenaje a Barezzo Barezzi, impre-
sor veneciano del siglo XVII de cuyas prensas salieron una asombrosa serie de
traducciones de textos literarios españoles (algunas de las cuales se deben al
mismo impresor), especialmente del género picaresco, con algunas calas en la
novela sentimental y en la literatura religiosa. A Barezzi, se debe, además, la
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 141

publicación de la primera traducción de las Novelas Ejemplares de Miguel de


Cervantes y una discreta colección de diccionarios y gramáticas.

1.1. La edición de traducciones antiguas


Como se ha dicho, el objeto central de todas las secciones es la edición de las
traducciones, su alineamiento con el texto fuente y un servicio de búsqueda
textual que genera concordancias mono y multilingües. Como se trata de textos
antiguos, una de cuestiones a las que ha habido que dar respuesta es el tipo de
edición. Hemos optado por la edición filológica rigurosa de un ejemplar bien
conservado. Los textos que ponemos al alcance del investigador no son pues
meras transcripciones o ediciones facsimilares. Dependiendo de la época del
texto, ya que los problemas textuales que plantea un texto del XIX son notoria-
mente distintos a los de un texto del XVII, cada edición se ofrece limpia de
evidentes errores de impresión, que aparecen convenientemente anotados, pero
refleja fielmente las características gráficas y morfosintácticas de la lengua de la
época, lo cual quiere decir que en el caso de textos anteriores al siglo XVIII se
hayan mantenido las variantes vocálicas, las grafías latinizantes, las variedad
morfológica en el sistema verbal y nominal, junto a todos los rasgos propios del
español o del italiano del siglo XVII, dando cuenta de todo ello en la introduc-
ción y en un aparato de notas. Ediciones filológicas, pero no reconstrucciones
de un texto virtual elaboradas a partir de las lecciones de las distintas ediciones
del mismo. El propósito es ofrecer un texto cuya lectura esté lo más cercana
posible al lector de la época en la que se publicó la traducción. Tratándose de
ediciones sinópticas, lo más transparente a nuestro juicio no era añadir capas
editoriales, sino al contrario, limpiar los textos de las conjeturas e hipótesis de
lecturas acumuladas por la tradición filológica, pues así lo recomendaba la fina-
lidad última de nuestro proyecto. En Castillo (2007) y Pini y Castillo (2007 y
2013) se explican los motivos detallados del mantenimiento de ciertos fenóme-
nos lingüísticos habitualmente corregidos en otras ediciones, como la puntua-
ción que genera anacolutos o las discordancias, precisamente porque su conser-
vación ofrece al investigador en historia de la traducción un panorama más lim-
pio de las características traductológicas de los textos que editamos. Un ejemplo
entre todos lo ofrece el mantenimiento de anacolutos evidentes en el texto cer-
vantino de la príncipe de las Novelas Ejemplares, corregidos de forma sistemá-
tica por la tradición editorial, pero mantenidos en la de Officina Barezzi, preci-
samente porque solo así se puede apreciar la solución que aportaron los dos
primeros traductores italianos del texto, que lo leyeron y tradujeron con todos
los defectos e imperfecciones que caracterizan la príncipe.
Si bien el objetivo de estas páginas no es la ilustración de los principios filoló-
gicos que rigen la edición de los textos de Officina Barezzi, convenía mencio-
narlos para introducir una de las grandes cuestiones que suscita este portal y su

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


142 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

relación con los instrumentos y herramientas a disposición del historiador de la


traducción. Nos referimos a la elección del texto fuente. Fieles a la idea de dar
relevancia al texto traducido, la elección de la edición del texto fuente se plan-
teó inmediatamente como un problema de primer orden, ya que se trata de tex-
tos cuya importancia y fama implica necesariamente una serie a veces ininte-
rrumpida de ediciones distintas. Es el caso de las Novelas Ejemplares, del Trat-
tato, y de la Pícara Justina. Por razones obvias había que elegir una edición
cronológicamente anterior a la fecha de las traducciones y geográficamente
plausible. Por ejemplo, en el caso de Cervantes, teníamos a nuestra disposición
tanto las ediciones españolas como la milanesa editada por el impresor Bidelli
en 1615, puesto que se trata de traducciones al italiano publicadas en Venecia y
Milán en 1626 y 1627 respectivamente. El cotejo de errores y variantes aconse-
jó la edición madrileña de la príncipe de Juan de la Cuesta, tal y como se expli-
ca en la introducción que se hace a la edición en Officina Barezzi.
Mucho más compleja aparece la adopción de un texto fuente para el Trattato de
Beccaria, tal y como se pone de manifiesto en Francioni (1984). La abundante
bibliografía sobre el asunto nos permite saber que del texto de Beccaria tenemos
al menos dos hilos editoriales: uno procedente de la famosa traducción francesa
de André Morellet, en la que se altera el orden de los capítulos; el otro hilo de-
riva de las ediciones de los manuscritos de Beccaria, en los que tenemos, ade-
más constancia de la participación de otro gran ilustrado italiano, Pietro Verri.
Se sabe que una buena parte de las traducciones europeas derivan directamente
de la traducción francesa de Morellet, o bien de las ediciones italianas en las
que se aceptaron –aparentemente por mano del propio autor– las modificaciones
introducidas por el traductor francés (caso ejemplar para la historia de la traduc-
ción, donde el texto traducido ejerce una indudable función directiva sobre el
texto fuente), pero hay también una serie de traducciones procedentes del texto
italiano publicado con anterioridad o con independencia de la traducción france-
sa. No en vano, cuando Gherbezza (2007) estudia las traducciones al ruso de
esta obra fundamental en la historia de la fundamentación europea del concepto
de derechos humanos, dice:
Un lettore russo può disporre oggi di almeno nove traduzzioni diverse del Dei
delitti e delle pena. Ebbene, se egli potesse farne una lettura sinottica, ovvero se
gli capitasse di sfogliarne quanto meno un paio, scegliendole a caso, molto pro-
babilmente stenterebbe a riconoscervi un’unica matrice o addiritura la medesima
opera. 2
Tonin (2010, 2011 y 2012) explica la evolución de los paratextos en las edicio-
nes italianas del Tratado en las varias ediciones italianas, así como la relevancia
de las traducciones, sobre todo la francesa, en la recepción de la obra, como
prueba de la investigación en la que se ha fundamentado la edición sinóptica de
Officina Barezzi. El corolario de dicha investigación es que para dar cuenta del
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 143

trabajo de los traductores en ediciones antiguas no podemos utilizar, a priori, la


edición consolidada o más reconocida del texto fuente, ya que no nos consta que
fuese la que utilizaron los traductores. Un enorme trabajo de cotejo de paratex-
tos y de variantes textuales nos ha conducido a la edición más cercana, pero no
podemos afirmar con certeza que fuese esa precisamente la edición que tuvieron
entre manos los traductores. Especialmente en el caso de textos de gran difu-
sión, como es el de Beccaria, no podemos pasar por alto el hecho de que la hi-
pótesis que estamos manejando a propósito del texto utilizado por los traducto-
res puede quedar en entredicho debido al menos a dos factores: que en el siglo
XVIII los textos circulaban también en ediciones manuscritas privadas entre los
círculos de ilustrados y que las traducciones francesas eran o podían ser bien
conocidas. De forma que aun siendo reconocible una cierta edición del texto
fuente en la organización externa y la sintaxis interna de una traducción, no
queda descartada la posición colindante de otras ediciones y de las traducciones
francesas. Por ello adoptamos el término de texto parámetro para referirnos a la
edición del texto fuente que con prudencia proponemos como base para la edi-
ción sinóptica.

1.2. Noticias de los editores y de los traductores. La edición de los para-


textos
De lo expuesto hasta ahora se deduce que el corpus textual constituido en Offi-
cina Barezzi está orientado principalmente hacia su uso para la investigación en
historia de la traducción. Estamos convencidos de que el estudio de la historia
de la traducción es uno de los elementos fundantes de la competencia traductiva
(Vega y Pulido, 2013) y de que la investigación en este ámbito debe dotarse de
instrumentos propios no perfectamente coincidentes don los del estudio de la
historia de la cultura o la historia de la literatura. Utilizando la terminología de
Lépinette (2003: xii-xiii) consideramos que la historia de la traducción puede y
debe ser construida a partir de al menos dos enfoques: uno sociológico cultural
y otro descriptivo-contrastivo. Para atender al primero, el portal reúne en una
sección específica llamada «introducción» estudios monográficos con todas
aquellas informaciones sobre las traducciones que consientan dar cuenta del
contexto social y cultural de la producción y recepción del texto meta: todas las
noticias que hemos podido reunir no solo sobre el traductor, sino sobre el editor
y el comitente, el número de ediciones, las bibliotecas en que se encuentran,
junto a todo aquello que pueda ayudar a trazar y definir el conjunto de circuns-
tancias de ámbito editorial y socioeconómico que gravitan en torno al texto
fuente. En atención a este mismo enfoque hemos optado por editar los paratex-
tos como sección aparte, distinguiendo los paratextos del texto fuente traducidos
en el texto meta, de los paratextos del texto meta.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


144 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

1.3. Herramientas de Officina Barezzi


El portal permite elegir entre la lectura independiente del texto fuente y de los
textos metas

Ilustración 1. Página de acceso a los textos

y la lectura sinóptica:
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 145

Ilustración 2. La edición alineada


Además de la cuestión filológica referida al cuidado y respeto con el que se
editan las traducciones y la prudencia con la que se elige y edita el texto fuente,
es característico de Officina Barezzi el hecho de que tales textos hayan sido
tratados como base para la constitución de un corpus. Esto quiere decir que han
sido etiquetados precisamente para su tratamiento en un corpus alineado. El tipo
de etiquetado ha ido perfeccionándose en las distintas etapas del proyecto, de
forma que si en la edición de las traducciones de las Novelas Ejemplares fue
concebido para la alineación de los textos, en la edición del Tratado ha sido
implementado con el objetivo de proporcionar al investigador concordancias
referidas a estrategias traductivas básicas como son la omisión, la amplificación
y la alteración del orden expositivo o argumentativo. Aquí se ofrece una mues-
tra de las concordancis monolingües

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


146 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

Ilustración 3. Concordancias de una de las traducciones


y bilingües:

Ilustración 4. Concordancias y textos alineados


Lógicamente, el portal ofrece además toda una serie de herramientas habituales
en los programas de concordancias: listado de palabras con el número de ocu-
rrencias, la posibilidad de búsqueda de secuancias textuales, colocaciones, con
el valor añadido que desde cualquier punto de la lista de resultados se generan
concordancias monolingües o multilingües con extrema facilidad.
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 147

Ilustración 5. Máscara de búsqueda


El portal se configura como un instrumento concebido especialmente para los
estudios cualitativos y descriptivos sobre la historia de la traducción, ya que
permite al investigador y al profesor de traducción realizar análisis minuciosos
y exhaustivos sobre un texto traducido, que pueden ser, además, comparativos
con respecto a otros textos traducidos a partir del mismo texto fuente y utilizar-
los como elementos de prueba o como muestras para futuros investigadores y
traductores.
Cuando es muy breve la distancia temporal entre una serie de traducciones (co-
mo es el caso de las Novelas Ejemplares con el que hemos ilustrado el portal)
los beneficios del estudio comparativo son evidentes al poner de manifiesto
decisiones habituales del proceso traductor que han de ser imputables a la vo-
luntad del traductor. Omisiones, censuras, adaptaciones de culturemas, actitudes
sistemáticas ante estilemas del texto fuente, etc. pueden ser analizadas como
elementos propios de un sistema, y no como casos ejemplares o circunstanciales
(cfr. a este respecto las actitudes ante fenómenos relativos a la traducción del
discurso directo en Castillo Peña 2007). Cuando la distancia temporal entre los
textos traducidos es amplia, el análisis cualitativo y comparativo ofrece resulta-
dos de mayor alcance, en la medida en que permite ponerlo en relación con
tradiciones y actitudes históricamente relevantes, como es el caso del tipo de
investigación que ofrecemos como prueba en los siguientes apartados.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


148 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

2. Las traducciones de Dei delitti e delle pene. Propuesta de aná-


lisis del método traductor
A partir de la edición sinóptica que actualmente recoge el texto parámetro ita-
liano y las dos primeras traducciones españolas del Dei delitti e delle pene (Tra-
tado de los delitos y de las penas)3 de Cesare Bonesana, marqués de Beccaria,
queremos esbozar posibles caminos de investigación acerca del método de tras-
vase empleado por los dos traductores, a saber, Juan Antonio de las Casas, el
primero y Juan Rivera, el segundo. Como bien se sabe, uno de los elementos
que influyen en la elección del método traductor es la finalidad de la traducción;
es precisamente la finalidad la que guía al traductor en todas las tomas de deci-
siones a lo largo del proceso de trasvase, tanto en aspectos formales y textuales
(mecanismos de coherencia y cohesión, elección léxico-sinonímica, variaciones
de uso como tono, campo y registro, y, en general, todo tipo de rasgo estilísti-
co), como en todo lo que atañe al contenido (distribución, omisión, desplaza-
miento, amplificación de la información, etc.). Además, la finalidad del texto
traducido, sobre todo si en ella destaca un rasgo heterofuncional con respecto al
texto original (Nord 1996 en Hurtado Albir 2001: 246-247), está condicionada a
su vez por el contexto socio-histórico de acogida. De allí que la distancia tem-
poral entre la aparición del texto original y el momento de la traducción pueda
«producir cambios en los aspectos pragmáticos, semióticos y comunicativos»
(Hurtado Albir 2001: 576) y, a la vez, reflejar «los gustos estéticos de la época,
el estado de la lengua de llegada, su concepción de la traducción, sus tabúes y
sus principios ideológicos» (Hurtado Albir 2001: 597). En resumidas cuentas,
en ámbito traductológico más que ‘el tiempo lo cura todo’, se podría decir que
‘el tiempo lo cambia (casi) todo’.
En concreto, la edición sinóptica de la obra de Cesare Beccaria que el portal
Officina Barezzi aloja nos brinda la posibilidad de observar de cerca el relieve
de la distancia temporal y del cambio de época y contexto en la actitud del tra-
ductor que, como cualquier mediador, ha de saberse mover con desparpajo entre
las coordenadas espacio-temporales del texto original y el hic et nunc de la cul-
tura de recepción. Se trata, en nuestro caso, de una doble mirada ya que en el
corpus no sólo se halla el original italiano al lado de su primera traducción al
castellano, sino también su retraducción realizada casi cincuenta años más tarde.
A continuación, presentaremos algunos fragmentos de la obra, extraídos del
portal, en las tres versiones: texto italiano, primera traducción y segunda traduc-
ción y propondremos un breve análisis comparado para comprobar si los traduc-
tores realizaron intervenciones intratextuales en la interpretación del Tratado
que dieron a conocer a la España, cada uno de su propio tiempo. De ser así,
veremos en concreto qué técnicas de trasvase fueron empleadas para solucionar
problemas encontrados en el proceso traductor y si a través de ellas (omisión,
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 149

amplificación, inversión, modulación, etc.) se logró perseguir la finalidad plan-


teada.
Sin embargo, gracias a la presencia de un amplio conjunto de paratextos, proce-
dentes tanto del texto italiano, como de las dos traducciones, el portal ofrece
otro tipo de recorrido no estrictamente de tipo traductológico; a partir del estu-
dio de prólogos, notas, advertencias, y demás textos anejos se puede realizar un
tipo de investigación que se centre más en los cambios de coyuntura socio-
histórica y de sus reflejos en la recepción del texto, sea en el contexto de origen,
sea en las sociedades destinatarias de las traducciones al español.

2.1. Contenido del corpus


La edición sinóptica, como decíamos, está constituida por:
• El Tratado Dei delitti e delle pene en su quinta edición de 1766. La edi-
ción princeps es de 1764, sin embargo se ha elegido la quinta por ser la
última edición aprobada por el autor mismo y la más adecuada para
nuestra finalidad, ya que en ella se hallan todos los paratextos, añadidos
y notas presentes en ambas traducciones.
• La traducción de Juan Antonio de las Casas de 1774. Su labor fue im-
pulsada por el fiscal Pedro Rodríguez Campomanes que, junto a Manuel
de Lardizábal, trabajaba, bajo el reinado de Carlos III, en la elaboración
del Código Criminal. Pese a la aprobación de la Real Academia de la
Historia, que la juzgó «fielmente traducida al castellano con uso de
buen estilo y de expresiones claras y ajustadas sin alteración reparable»
(Libro de Actas de la Real Academia de Historia, en Calabrò 1996:
103), la obra fue prohibida en 1777 por el Tribunal de la Inquisición y
no se volvió a publicar hasta 1820. En esa segunda ocasión el traductor
emplea la misma estrategia defensiva de Beccaria: el anonimato.
• La traducción de Juan Rivera editada en 1821, tan solo al cabo de un
año de la re-edición de la anterior. De Rivera, tal vez un liberal forzado
al exilio, también existe una traducción de otra obra incluida en el Índi-
ce del Santo Oficio, es decir La ciencia de la legislación del jurista ita-
liano Gaetano Filangieri que se edita en 1822.
Entre la primera y la segunda traducción transcurren casi 50 años, un lapso de
tiempo suficiente para poner de manifiesto ese cambio de dimensión socio-
histórica de la que hablábamos. Podríamos decir que Beccaria y Las Casas
comparten a grosso modo el momento histórico, pero sobre todo sufren los
mismos límites a la libertad de expresión; además, en ambos textos destaca la
misma macrofunción textual: divulgar los nuevos ideales filosóficos de la Ilus-
tración. Rivera, en cambio propone una retraducción en un momento de grandes
expectativas en la historia de España (trienio Consitucional), con una finalidad

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


150 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

aplicativa concreta: influir en el debate que, por aquel entonces, llevaría a «dis-
cutirse y aprobarse en las próximas Cortes estraordinarias el código criminal»
(Rivera en Beccaria 1821: V), tal y como se lee en un fragmento de su Adver-
tencia del traductor disponible en el portal.
Aparte, en el portal se pueden consultar:
• Una introducción general en la que se presenta el Tratado, su génesis y
evolución, la influencia de la traducción francesa y la justificación de la
elección de la quinta edición como texto parámetro.
• Un conjunto de paratextos procedentes tanto de la edición italiana, co-
mo de las dos traducciones; entre ellos destacan prólogos, advertencias,
notas y demás constancia escrita de la labor traductora.
El investigador, entonces, o bien puede acceder directamente al corpus para
analizar los textos y ver ejemplos concretos de la presencia del traductor en el
texto traducido, gracias al etiquetado de tipo traductológico del que ya se ha
hablado, o bien puede empezar por la introducción y los paratextos que le pro-
porcionarán datos sobre el contexto socio-histórico, información sobre el autor
y los traductores y, en un segundo momento, pasar a la comparación de los dos
métodos traductores para comprobar la relevancia de todo lo anteriormente leí-
do en la traducción, entendida sea como proceso que como producto.
En los dos ejemplos de comparación que presentamos a continuación intentare-
mos esbozar las dos vías: en el primer caso, antes de afrontar el análisis, se hará
imprescindible anticipar algunos elementos contextuales; en el segundo iremos
directamente a la comparación de los textos para luego deducir datos sobre el
contexto y la finalidad.

2.2. Del contexto al texto: un ejemplo de comparación


El fragmento que se presenta a continuación procede del apartado «A chi legge»
que Cesare Beccaria añade al Tratado a partir de la quinta edición y que respon-
de de forma indirecta a las acusaciones que le fueron dirigidas por la Autoridad
Eclesial de la República de Venecia de la mano del monje Ferdinando Facchi-
nei. La introducción al corpus proporcionará datos sobre las repercusiones que
el panfleto de Facchinei produjeron en la evolución del Tratado; entre ellas cabe
destacar el mantenimiento del anonimato del autor en las siguientes ediciones,
la ampliación del entramado paratextual (a partir de la tercera edición se añaden
varios escritos apologéticos en defensa de la obra, como, por ejemplo, el Com-
mentaire de Voltaire), avisos del editor sobre premios y éxito de la obra en el
extranjero, etc. Precisamente a este conjunto de textos añadidos pertenece el
prólogo en cuyo comienzo el autor justifica su obra afirmando que las leyes que
las naciones europeas todavía aplican a finales del siglo XVIII en tema de dere-
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 151

cho penal se remontan al Corpus Iuris Civiles de época romana, recopilado por
el imperador Justiniano (482-565) –definido «Principe che dodici secoli fa reg-
nava in Costantinopoli»– y que habían llegado hasta la época de Beccaria a
través de la tradición jurídica medieval y latino-germánica («oscuri interpreti»).
Luego, en el párrafo a continuación, Beccaria se autodefiende afirmando que él
solo había querido presentar algunas costumbres sociales y sus consecuencias
(«convenzioni sociali e delle conseguenze di esse») y de ninguna manera atacar
el conjunto de conocimientos que Dios comunica a los hombres a través de la
Revelación, ni tampoco la ley natural que la conciencia del hombre concibe
gracias a la intervención divina («principi contrari o alla Legge Naturale o alla
Rivelazione»).
A chi legge (Beccaria) Prólogo del autor (Las Casas) Prólogo del autor (Rivera)

Alcuni avanzi di Leggi di un Algunos restos de Leyes de un Doce siglos ha que un prín-
antico popolo conquistatore antiguo Pueblo conquistador, cipe que reinaba en Constan-
fatte compilare da un Prin- hechas recopilar por un Prínci- tinopla dispuso que se hiciese
cipe che dodici secoli fa pe, que doce siglos ha reinaba una colección de algunos
regnava in Costantinopoli, en Constantinopla, mixturadas restos de las leyes de un
frammischiate poscia co' riti después con ritos Lombardos, y pueblo antiguo y conquista-
Longobardi, ed involte in envueltas en farraginosos volú- dor, las que mezcladas des-
farraginosi volumi di privati menes de privados y obscuros pués con los ritos de los
ed oscuri interpreti, formano intérpretes, forman aquella Lombardos, quedaron, por
quella tradizione di opinioni tradición de opiniones, que en decirlo así(1), 4 sepultadas
che da una gran parte una gran parte de la Europa bajo el fárrago, voluminoso
dell'Europa ha tuttavia il tiene todavía el nombre de de los comentarios hechos y
nome di Leggi; […] sieno le Leyes: […] sean las Leyes publicados por un enjambre
Leggi a cui con sicurezza obedecidas con seguridad y de intérpretes oscuros, (2)
obbediscono coloro che satisfacción de aquellos, que cuyas decisiones debían ser
tremando dovrebbono reg- para regir las vidas y fortunas muy poco respetables por
gere le vite e le fortune degli de los hombres, deberían obrar cuanto procedían de unos
uomini. […] llenos de temor y desconfianza. hombres privados, cuyo
[…] estado no exigía ni consa-
graba su trabajo.(3) Esto es
sin embargo lo que forma la
tradición de opiniones que
una gran parte de Europa
honra todavía con el nombre
de leyes, […] vienen a ser las
reglas que se atreven a seguir
tranquilamente los árbitros
de la vida y hacienda de los
hombres; los que deberían
estremecerse al ejercer la

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


152 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

autoridad que les está con-


fiada.(4) […]

Sarebbe dunque un errore Sería, pues, un error atribuir, a Se equivocaría pues cual-
l'attribuire a chi parla di quien habla de convencio- quiera que atribuyese princi-
convenzioni sociali e delle nes Sociales, y de sus conse- pios contrarios a la religión
conseguenze di esse principi cuencias, principios contrarios a natural o revelada, al autor
contrari o alla Legge Natu- la Ley Natural, o a la Revela- que no ha tratado más que de
rale o alla Rivelazione, ción, porque no trata de estas. los pactos sociales y de sus
perché non parla di queste. Sería un error en quien, hablan- consecuencias. ¿Cómo podía
Sarebbe un errore a chi do del estado de Guerra antes impugnar una cosa de que no
parlando di stato di guerra del estado de Sociedad, lo hablaba? (5) También sería
prima dello stato di Società, tomase en el sentido Hobesiano, un error entender en el senti-
lo prendesse nel senso […] do de Hobbes lo que se dice
Hobbesiano, […] del estado de guerra, anterior
al de sociedad.[…]

Tabla 1. A chi legge

2.3. Traductor prudente vs. traductor ampliador


La notoria prudencia que Beccaria emplea para ser «defensor de los hombres sin
ser su mártir» (Beccaria en Delval 2004: 22), su estilo a veces oscuro a través
del que «envuelve en una niebla la luz de lo verdadero» (Beccaria en Delval
2004: 22) sin lugar a duda destaca en estos pasajes. Las Casas parece pisar las
huellas del autor con una traducción que sigue al pie de la letra el orden y la
distribución de los núcleos informativos con respecto al texto original, incluso
dentro de la unidad oración; esta cercanía se refleja también en el nivel léxico-
semántico, en la elección de los nexos y conectores, en la puntuación, etc. Si, en
cambio, comparamos la traducción de Las Casas con la de Rivera, enseguida
vemos que Rivera emplea un número más amplio de palabras, que invierte muy
a menudo el orden de los elementos de la oración, insertando incluso marcado-
res del discurso con un sujetivo valor de reformulador (ej. 1) o que a nivel léxi-
co busca especificaciones que restringen la aplicabilidad semántica del término
(ej. 2).
Sin embargo, es solo comparando el texto original con esta traducción cómo se
mide la relevancia de las intervenciones de Rivera y su dominio de técnicas de
trasvase con las que soluciona algunos de los núcleos conflictivos planteados
por el original. Por ejemplo, con respecto a mecanismos como la amplificación
y la explicitación, Rivera las emplea detenidamente cada vez que intenta aclarar
pasajes crípticos y ambiguos, mencionar referencias ocultas y argumentar de
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 153

forma más clara hasta insertando a veces su propia nota polémica. En el ejemplo
3 el traductor pone de manifiesto la polémica, aunque oculta, voz del autor con-
tra los jurisconsultos medievales. En el ejemplo 4, Rivera, hablando de los sobe-
ranos –que el denomina «árbitros»– completa la acción que prudentemente Bec-
caria les atribuye (tremare / «estremecerse») en su función de responsables de
las vidas de sus súbditos, añadiendo la referencia a la autoridad de ejercer con
prudencia y moderación, de allí el hecho de estremecerse en el cuidado y respe-
to que deben de demostrar hacia las vidas de sus súbditos.
En el ejemplo 5, se halla una explícita reformulación, bajo forma de pregunta
retórica, que Rivera añade a una afirmación de autodefensa del autor y que,
según el traductor, a lo mejor quedaba algo oculta e indirecta; éste, en cambio,
decide subrayar tajantemente la ajenidad del autor a las acusaciones que les
fueron dirigidas por el fraile Facchinei.

2.4. Del texto al método y a la finalidad


En el capítulo que comentaremos a continuación se habla de delitos que resultan
difíciles de demostrar. Como ocurre con el capítulo siguiente («XXXII. Suici-
dio»), se tratan temas que hoy en día, en la mayoría de los países democráticos,
ya no se consideran crímenes: adulterio, homosexualidad, aborto.
XXXI. Delitti di prova dif- XXXI. Delitos de prueba XXXI. De los delitos difíciles
ficile difícil de probar

[...] Vi sono alcuni delitti, che […] Hay algunos delitos, que Hay algunos crímenes que
sono nel medesimo tempo son á un mismo tiempo fre- son frecuentes en la socie-
frequenti nella società, e cuentes en la Sociedad, y de dad, y cuya prueba es al
difficili a provarsi, e in questi prueba difícil; y en estos la
mismo tiempo difícil. En-
la difficoltà della prova tien dificultad de la prueba tiene el
luogo della probabilità lugar de la probabilidad de la tonces debe considerarse
dell'innocenza, ed il danno inocencia; y siendo el daño de esta dificultad como una
dell'impunità essendo tanto la impunidad de tanta menos probabilidad de la inocencia:
meno valutabile, quanto la consideración, cuanto la y siendo de poca importan-
frequenza di questi delitti frecuencia de ellos depende de cia el peligro, que resulta de
dipende da principi diversi, otros principios; el tiempo del la impunidad, porque aun la
dal pericolo dell'impunità, il examen y el de la prescripción
esperanza de ella contribuye
tempo dell'esame, e il tempo deben disminuirse igualmente.
della prescrizione, devono Vemos, sin embargo, que los poco á aumentar semejante
diminuirsi egualmente. E adulterios, el deleite griego, especie de delitos, cuyo
pure gli adulterii, la greca delitos de prueba tan difícil, origen es enteramente distin-
libidine, che sono delitti di son los que, conforme á los to, se pueden disminuir
difficile prova, sono quelli, principios recibidos en prácti- igualmente el tiempo de la
che secondo i principi ca, admiten las presunciones instrucción del proceso y el
ricevuti ammettono le tiránicas, las casi-pruebas, las
de la prescripción. Pero no
tiranniche presunzioni, le semi-pruebas (como si un
quasi-prove, le semi-prove hombre pudiese ser semi- son estos los principios que
(quasi che un uomo potesse digno de castigo, y semi- se siguen en la actuali-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


154 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

essere semi innocente o semi digno de absolución); donde dad.(6)


reo, cioè semi punibile e semi la tortura ejercita su cruel
assolvibile), dove la Tortura imperio en la persona del ¿No vemos, por ejem-
esercita il crudele suo impero acusado, en los testigos, y aun plo, que en las acusaciones
nella persona dell'accusato, en toda la familia de un infeliz de adulterio y pederastía (7)
nei testimoni, e persino in como con frialdad inicua
tutta la famiglia di un enseñan algunos Doctores, (crímenes que son siempre
infelice, come con iniqua que por norma y ley se ponen difíciles de probar) se admi-
freddezza insegnano alcuni en manos de los Jueces. […] ten tiránicamente las pre-
Dottori, che si danno ai sunciones, las conjeturas,
Giudici per norma, e per (8) las semi-pruebas, como
legge. […] si el acusado pudiese ser
inocente y reo a medias, y
merecer a un mismo tiempo
ser absuelto y castigado? En
este género de delitos sobre
todo es en los que, según las
bárbaras e injustas compi-
laciones que se han dado
por regla a los magistrados,
ejerce la tortura su cruel
imperio sobre el acusado,
sobre los testigos y sobre
toda la familia del infeliz en
quien recae la sospecha. (9)
[…]

L'infanticidio è parimente El infanticidio es igualmente El infanticidio es también un


l'effetto di una inevitabile efecto de una contradicción efecto casi inevitable de la
contraddizione, in cui è posta inevitable, en que se encuen- horrorosa situación en que
una persona, che per tra una persona, que haya
se encuentra una infeliz que
debolezza o per violenza cedido, ó por violencia, o por
abbia ceduto. Chi trovasi tra flaqueza. Quien se ve entre la cedió á su propia flaqueza ó
l'infamia, e la morte di un infamia y la muerte de un ser á la violencia. Por un lado la
essere incapace di sentirne i incapaz de sentir los males, infamia, y por otro la des-
mali, come non preferirà ¿cómo no preferirá esta á la trucción de un ser incapaz
questa alla miseria infallibile miseria infalible, en que se- de sentir, es la única alter-
a cui sarebbero esposti ella, e rían puestos ella y su infeliz nativa que le permiten las
l'infelice frutto? La miglior parto? El mejor modo de
leyes, (10) ¿y puede dudarse
maniera di prevenire questo evitar este delito, fuera prote-
delitto sarebbe di proteggere ger con Leyes eficaces la que preferirá el partido que
con leggi efficaci la flaqueza contra la tiranía; la libra de la vergüenza y de la
debolezza contro la tirannia, cual exagera los vicios, que no miseria así a ella como al
la quale esagera i vizi, che pueden cubrirse con el manto triste fruto de sus placeres?
non possono coprirsi col de la virtud. El medio mas eficaz para
manto della virtù. Yo no pretendo minorar el precaver esta especie de
Io non pretendo diminuire il horror justo, que merecen
delito (11) seria asegurar á
giusto orrore, che meritano estas acciones; pero señalando
questi delitti; ma, sus orígenes, me juzgo con la flaqueza toda la protec-
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 155

indicandone le sorgenti, mi derecho de sacar una conse- ción de las leyes contra la
credo in diritto di cavarne una cuencia general; esta es, que tiranía que apenas declara
conseguenza generale, cioè, no se puede, llamar preci- guerra sino á los vicios (12)
che non si può chiamare samente justa (vale tanto
que no pueden cubrirse con
precisamente giusta (il che como decir necesaria) la pena
vuol dire necessaria) una de un delito, cuando la Ley no la apariencia de la virtud.
pena di un delitto, finché la ha procurado con diligencia el
legge non ha adoperato il mejor medio posible de evitar- Por lo demás, no pre-
miglior mezzo possibile nelle lo en las circunstancias exis- tendo disminuir el justo
date circostanze d'una tentes de una Nación. horror que deben inspirar los
Nazione per prevenirlo. crímenes de que acabo de
hacer mención; pero al
indicar su origen, me creo
autorizado para deducir una
consecuencia general, y es
que el castigo de un delito
no puede ser justo, ó nece-
sario (que es lo mismo) (13),
si la ley no ha empleado,
para precaverle, los mejores
medios posibles en las cir-
cunstancias en que se halla
la nación.

Tabla 2. Cap.XXXI. Delitti di prova difficile

2.5. Los demás trucos del trujamán


En los ejemplos 7 y 8 vemos una de las técnicas más empleadas por Rivera: la
particularización, es decir el empleo de un término más preciso y concreto res-
pecto al del texto original. El ejemplo 8 se nota el rigor terminológico de Rivera
que intenta precisar a que se refiere Beccaria al hablar de «casi-prueba» (quasi-
prove) en un párrafo en el que se critica la injusta relevancia de rumores y difa-
maciones a la hora de juzgar uno de los delitos susodichos; se trata, por tanto,
de pruebas con poco fundamento, que más precisamente Rivera indica con el
término «conjeturas».
En el ejemplo 7 es interesante ver el esfuerzo de Beccaria en evitar de nombrar
la palabra sodomía a la hora de comprobar el que se conocía como el ‘crimen
contra la naturaleza’; el autor usa la forma eufemística «greca libídine» (el «de-
leite griego» en la traducción de Las Casa) o, más adelante en el texto, «attica
venere» («Venus Atica»). 5 Rivera en ambos casos traduce con pederastía, un
lema que presenta unas actualizaciones lexicográficas relevantes. La voz apare-
ce por primera vez en el Nuevo diccionario de la lengua castellana de Salvá

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


156 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

(1846), pero solo en la acepción de sodomía. La recoge también el Diccionario


Nacional de Ramón Domínguez (1853), pero solamente en la otra acepción:
«pasión depravada que consiste en abusar lúbricamente de los niños». A partir
de 1879, y precisamente en el suplemento, también el Diccionario de Salvá
empieza a adoptar esta acepción. Con respecto al Diccionario de la Real Aca-
demia, aparece por primera vez en la edición de 1899 (Usual) ya con doble
definición: «abuso deshonesto cometido contra los niños» y por extensión como
sinónimo de sodomía. 6 Actualmente el DRAE sigue dando las dos acepciones,
mientras que sea el Diccionario de uso del español de María Moliner, sea el
Diccionario del español actual de Seco, Andrés y Ramos registran ambas acep-
ciones pero indican la sinonimia con «homosexualidad masculina» como una
forma culta o literaria –el primero– y rara –el segundo–. Por supuesto, la pala-
bra existe también en italiano con ambos significados (véase Grande Dizionario
della lengua Italiana en el que también se indica que, aunque el étimo es griego,
la palabra ha entrado a través del francés).
Resulta, entonces, difícil prescindir de nuestra actual perspectiva según la cual
en un caso nos hallamos frente a un delito contra menores y en otro a una sim-
ple orientación sexual y, por tanto, nuestra interpretación de la traducción de
Rivera excluiría la acepción que no indica un delito, es decir la referencia gené-
rica a la homosexualidad. Sin embargo, Beccaria habla de la «attica Venere»
que ocurre «in quelle case, dove si condensa l'ardente gioventù» (según nos
indica Francioni en «collegi e seminari ecclesiastici», 1984: 102), donde cohabi-
tan jóvenes seminaristas y adultos eclesiásticos, dejando así al lector la libre
interpretación de la extensión de su significado. Entonces, ¿por qué Rivera de-
cide descodificar el prudente eufemismo de Beccaria traduciendo con pederas-
tía en lugar de sodomía? Resulta imposible establecer si lo hace porque en su
época ambas conductas se seguían considerando a la par de delictuosas y enton-
ces con el hiperónimo las incluye ambas, o si pretende hacer hincapié en la
acepción que indica una costumbre sin lugar a duda reprochable, o por lo menos
incluirla de forma más patente con respecto a la prudente mención del texto
original. De ser así, no sólo anticiparía la evolución lexicográfica del término,
sino que sobre todo interpretaría el texto original de forma sujetiva, quizás para
llamar la atención de su público sobre un problema social que considerara rele-
vante. Como nos sugiere Nida, «a veces un traductor intenta, consciente o in-
tencionadamente, cambiar un mensaje con el fin de que esté de acuerdo con sus
propias ideas sociales, políticas o religiosas» (2012: 156).
Otros mecanismos que Rivera emplea muy a menudo son la transposición
(cuando se privilegian estructuras sintácticas diferentes del original) y la inver-
sión (dislocación de un sintagma o proposición respecto al orden original), a
través de los que el traductor consigue facilitar la comprensión de pasajes re-
buscados u oraciones demasiado largas. Esto ocurre de forma patente en el ej. 9,
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 157

pero se nota también en casos anteriores cuando, por ejemplo, decide poner en
un segundo plano la repetición del título del capítulo, introduciendo un parénte-
sis –«(crímenes que son siempre difíciles de probar)»– o, al revés, destacar un
núcleo informativo que el autor posiciona entre paréntesis («las semi-pruebas
[…] y castigado? »), añadiendo además un énfasis no presente en el texto origi-
nal con la introducción de una pregunta retórica. A través de estas modificacio-
nes, se podría leer también un intento de cambio de enfoque o punto de vista
con respecto a la formulación original, técnica conocida como modulación y de
cuyos ejemplos la traducción de Rivera abunda ya que a menudo él intenta in-
volucrar al lector de forma más directa o subrayar la explícita presencia del
emisor (véase Tonin 2011: 67-75).
De esta última técnica se hallan varios ejemplos en el pasaje sobre el aborto en
el que Rivera, por un lado intenta ser más explícito («una persona» se convierte
en «una infeliz») y por otro, interpreta y reelabora el texto original según su
punto de vista. En el ejemplo 10 se halla un añadido sujetivo en el que él subra-
ya que no hay otra posibilidad para una mujer que se halle en dicha «horrorosa
situación» (sintagma que traduce la palabra «contraddizione»). Los ejemplos
11, 12 y 13 también introducen el punto de vista de Rivera: un crimen de esta
categoría se convierte en una «especie de crimen»; el origen de los vicios ya no
es la flaqueza («la debolezza» en italiano), sino la tiranía que «apenas les decla-
ra guerra» (en este caso la ambigüedad de la formulación del texto original pue-
de llevar también a esta lectura); como último, «justo» y «necesario», con res-
pecto al castigo de un delito, llegan a ser sinónimos, y esto Rivera lo afirma sin
la atenuación del paréntesis del texto original –«(il che vuol dire necessaria)»– y
gracias a una explicitación añadida dentro de un paréntesis en el texto traducido
–«(que es lo mismo)».

2.6. La retraducción ‘lo cambia todo’


Las consideraciones sobre las técnicas de Rivera que acabamos de ver nos lle-
van a pensar en un método traductor totalmente distinto del que emplea Las
Casas. Y, si después de este tipo de comparación, además accedemos a los para-
textos presentes en el portal, como por ejemplo el Prologo y la Protesta del
traductor, en el caso de Las Casas, o la Advertencia del traductor de Rivera, se
confirman nuestra suposiciones. Rivera conocía la traducción anterior a la suya,
juzgaba que «podía mejorarse infinito […] en obsequio del buen nombre del
autor y con el designio de ser útil a la patria» (Rivera en Beccaria 1821: V). De
hecho, Rivera goza, a parte de un contexto socio-histórico totalmente diferente
del de Las Casas, también de la labor de difusión de sus predecesores, entre
ellos el francés Morellet, cuya traducción sin duda Rivera conocía. Así que él se
puede permitir manipular el texto no ya para documentar una comunicación que
se había realizado en la cultura de origen –de esto se ocuparon sus antecesores–,

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


158 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

sino para convertirlo en instrumento de comunicación y, en su caso, en estímulo


de debate en la sociedad española de su tiempo. 7 Su retraducción quiere perse-
guir una finalidad muy concreta: influir en el debate de las Cortes sobre el nue-
vo código penal. Y, como aparece solamente un año después de la re-edición de
la primera, se podría clasificar de retraducción activa, según la clasificación de
Pym (1998 79-85), porque compite con la traducción de Las Casas por el corte
militante y la altisonante función expresiva, aunque la expresividad que mani-
fiesta ya no pertenece al autor original sino al traductor-autor.

3. Conclusiones
En el portal Officina Barezzi no solo «[las] sucesivas retraducciones de una
misma obra pueden constituir un corpus a partir del cual podría localizarse,
entre otras cosas, todos los núcleos conflictivos de la traducción planteados por
el original y las estrategias adoptadas por los distintos traductores», siguiendo
las sugerencias de Zaro (2007: 30), sino que a partir de esta comparación se
pueden deducir datos sobre el papel del traductor en las distintas épocas, su
propia conciencia de mediador, las funciones de su labor en la sociedad en la
que operaban.
Respecto a la posibilidad de futuros desarrollos de la edición sinóptica del Tra-
tado, y dada la comprobada relevancia de la primera traducción al francés en la
recepción de la obra y, sobre todo, en la proliferación de traducciones proceden-
tes de una traducción previa –como por ejemplo la alemana de 1766–, nuestro
objetivo a corto plazo es ampliar el corpus añadiendo la traducción francesa de
André Morellet. Asimismo sería relevante poder extender la amplitud del cor-
pus añadiendo la vulgata, es decir la edición italiana de 1774 en la que se adop-
tan la estructura macrotextual y las modificaciones intratextuales realizadas por
el traductor francés y que se seguirá editando en Italia hasta mediados del siglo
XX. De hecho, como demuestra el caso del ruso, la obra de Beccaria se fue
traduciendo a lo largo de los siglos empleando muy a menudo como texto fuen-
te el original italiano en su versión afrancesada. Como último, precisamente
para comprobar posibles contaminaciones derivadas de la oculta presencia del
francés en el texto fuente italiano, es también nuestro objetivo ampliar el corpus
con las sucesivas traducciones españoles del Tratado, como por ejemplo la de
1836 de Ramón de Salas y Cortés y la de 1879 de Pascual Vincent (véase Tonin
2011: 62-66).

4. Bibliografía
Beccaria, Cesare. 1774. Tratado de los delitos y de las penas, (en la traducción de Juan
Antonio de las Casas). Madrid: D. Joachin Ibarra, Impresor de Cámara de S.M.
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 159

Beccaria, Cesare. 1821. Tratado de los delitos y de las penas, (en la traducción de Juan
Rivera). Madrid: Imprenta de D. Fermín de Villalpando, Impresor de Cámara
de S.M.
Beccaria, Cesare. 2004. De los delitos y de las penas, con el comentario de Voltaire (en
la traducción de Juan Antonio de las Casas; introducción, apéndice y notas de
J. Antonio Delval). Madrid: Alianza Editorial.
Calabrò, Giovanna.1966. Beccaria e la Spagna. @ Accademia delle Scienze di Torino,
ed. Atti del convegno internazionale su Cesare Beccaria. Torino: Accademia
delle Scienze, pp. 101-120.
Castillo Peña, Carmen. 2007. Polifonía y traducción: la voz en el texto traducido. @ C.
Castillo Peña y J. Pérez Navarro, eds. De texto a texto. Traducción, adapta-
ción, reescritura. Padova: Unipress. ISBN: 9788880982388, pp. 175-200.
Francioni, Gianni. 1984. Nota al testo. @ G. Francioni y L. Firpo, eds. Edizione nazio-
nale delle opere di Cesare Beccaria. Vol.1. Milano: Mediobanca. ISBN:
8876613129, pp.215-368.
Gherbezza, Ettore. 2007. Dei delitti e delle pene nella traduzione di Michael M. Ščerba-
tov. Florencia: Firenze University Press. ISBN: 9788884539227.
Hurtado Albir, Amparo. Traducción y traductología. Introducción a la traductología.
Madrid: Cátedra. ISBN 8437619416.
Lépinette, Brigitte. 2003. Presentación. @ B. Lépinette y A. Melero, eds. Historia de la
traducción. Valencia: Universidad de Valencia. ISBN 8437057779. pp. viii-
xxvi.
Nida, Eugene. Sobre la traducción. Madrid: Cátedra. ISBN 9788437629780.
Pini, Donatella y Castillo Peña, Carmen. 2007. La prosa di Cervantes in mano al tradut-
tore: il caso delle "Novelas ejemplares". @ M. G. Profeti, ed. Il viaggio della
traduzione. Florencia: Firenze University Press. ISBN: 9788884535733, vol. 1,
pp. 79-90.
Pini, Donatella y Carmen Castillo Peña. 2013. Cervantes. Elogio de la imperfección.
@Artifara. Revista electrónica de Lenguas y Literaturas Ibéricas y Latinoame-
ricanas 13 bis: 264-284. ISSN 1594-378X. Disponible en
<http://www.ojs.unito.it/index.php/artifara/article/view/436>. Consultado el
30/05/2014.
Pym, Anthony. Method in Translation History. Manchester: St.Jerome Publishing.
ISBN 1900650126.
Real Accademia Española. Nuevo tesoro lexicográfico de la lengua española. Disponi-
ble en <http://rae.es>. Consultado el 15/04/2014.
Tonin, Raffaella. 2010. ‘Dei delitti e delle pene’ di Cesare Beccaria in spagnolo: tradu-
zione documento e traduzione strumento a confronto. @ InTRAlinea, Online
Translation Journal: 12. ISSN 1827-000X. Disponible en
<http://www.intralinea.org/archive/article/1663>. Consultado el 12/04/2014.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


160 CARMEN CASTILLO PEÑA Y RAFFAELLA TONIN

Tonin, Raffaella. El tratado ‘Dei delitti e delle pene’ de Cesare Beccaria y sus dos
primeras traducciones al castellano. Padova: Unipress. ISBN 9788880982890.
Tonin, Raffaella. 2012. 'Dei delitti e delle pene' de Cesare Beccaria: traducción, reescri-
tura y manipulación a la sombra de la Santa Inquisición. @ A. Cassol et al. eds.
Metalinguaggi e metatesti. Lingua, letteratura e traduzione. Padova: AISPI
Edizioni. ISBN: 9788890789700, pp. 847-855.
Vega, Miguel Ángel y Martha Pulido, eds. 2013. La historia de la traducción como
parte de los estudios de la traducción: problemas de investigación y didáctica.
@MonTI, 5. ISSN: 1889-4178. Disponible en <
http://dti.ua.es/es/documentos/monti/monti-5-2013-portada-e-
indices.pdf?noCache=1371725717819>.
Zaro, Juan Jesús. 2007. En torno al concepto de retraducción. @ J.J. Zaro Vera y F.
Ruiz Noguera, eds. Retraducir, una nueva mirada. La retraducción de textos
literarios y audiovisuales. Málaga: Miguel Gómez Ediciones.
ISBN9788488326713, pp. 21-34..

1
Este trabajo y el corpus que describe ha sido financiado por el MIUR (Ministerio dell’Istruzione,
l’Università e la Ricerca) y por la Universidad de Padua. Aunque se trata de un trabajo concebido,
elaborado y escrito de forma colectiva, a efectos oficiales hacemos constar que el apartado 1 es
obra de Carmen Castillo y el 2 de Raffaella Tonin.
2
Un lector ruso puede disponer hoy de al menos nueve traducciones distintas del Dei deliiti e
delle pene. Pues bien, si pudiese hacer una lectura sinóptica, o simplemente si se pusiese a hojear
al menos un par de ellas elegidas al azar, muy probablemente le costaría reconocer en ellas una
sola matriz e incluso la misma obra (traducción propia).
3
Hemos elegido este texto porque se le considera una de los ensayos jurídico-filosóficos más
influyentes de la Ilustración italiana. Dei delitti e delle pene se publica anónimo en 1764 y, tras un
éxito fulminante, se empieza a traducir a las principales lenguas europeas (al francés y al alemán
en 1766, al inglés en 1767, al sueco en 1770, etc.), convirtiéndose de tal forma en texto de refe-
rencia sobre Derecho Penal a nivel internacional a los pocos años de su publicación. La obra fue
impulsada por el anhelo de una sociedad literaria de jóvenes ilustrados –la Accademia dei Pugni–
a la que pertenecía el autor, hacia una jurisprudencia capaz de impedir los delitos en vez de casti-
garlos. En ella, de hecho, se planteaba la necesidad de varias reformas como, por ejemplo, la
proporcionalidad entre delitos cometidos y castigos aplicados, la inutilidad de la pena de muerte
como método disuasorio, la iniquidad de la tortura como herramienta de comprobación de la
verdad ya que su éxito depende de la fuerza y resistencia física del torturado y no de su inocencia
o culpabilidad, etc.
4
La cursiva empleada dentro de los tres textos alineados sirve para destacar procedimientos tex-
tuales que a continuación se explicarán; el número puesto al final indicará el ejemplo comentado.
5
En las notas al Dei delitti e delle pene de Francioni (en Firpo 1984: 101-102) se lee que «greca
libidine» corresponde a «sodomia» y «attica venere» a «omosessualità»; en el caso siguiente, el
de «infanticidio» Francioni pone: «intende probabilmente il procurato aborto». En el Grande
Dizionario della Lengua Italiana de UTET (Salvatore Battaglia, Torino) en la entrada «libídine»,
se halla la locución: «greca libídine» cuya definición corresponde a la anteriormente mencionada
y además se cita el pasaje del texto de Beccaria. Lo mismo ocurre con «attica venere» (bajo la
UN CORPUS PARA LA HISTORIA DE LA TRADUCCIÓN: OFFICINA BAREZZI… 161

entrada «venere»), definida como «omoerotismo maschile» y a la que se añade el pasaje del Dei
delitti e delle pene objeto del presente análisis.
6
La consulta lexicográfica se ha realizado utilizando el Nuevo Tesoro Lexicográfico de la Lengua
Española de la Real Academia. Para comprobar datación y uso del la palabra, se ha consultado
también el corpus CORDE; los dos documentos anteriores a la fecha de la traducción Rivera son
respectivamente de 1580 (Comentario a Garcilaso de Fernando de Herrera) y de 1780 (Historia
Antigua de México de Francisco Javier Clavijero), pero solamente en el segundo documento se
entiende que la palabra pederastía se emplea como sinónimo de homosexualidad: «Cuatro son los
principales vicios con que infama a los americanos: glotonería, embriaguez, ingratitud
y pederastía o sodomía».
7
Véase a este respecto la dicotomía entre traducción documento y traducción instrumento pro-
puesta por Nord 1996, en Hurtado Albir 2001: 246-247.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


PARTE II
ESTUDIOS DE INTERPRETACIÓN Y LA RAMA
APLICADA DE LOS ESTUDIOS TRADUCTOLÓGI-
COS
BASADOS EN CORPUS

PART II
INTERPRETING STUDIES AND THE APPLIED
BRANCH OF CORPUS-BASED TRANSLATION AND
INTERPRETING STUDIES
Corpus y formación de intérpretes: un estudio ex-
ploratorio

[Corpora and interpreter training: an exploratory


study]
SÍLVIA ARAÚJO Y ANA CORREIA
Universidade do Minho
saraujo@ilch.uminho.pt
Resumen
En este artículo proponemos un estudio de corpus, de carácter exploratorio, sobre la
utilidad de los corpus multilingües en áreas relacionadas con el estudio de la lengua, la
traducción y, en particular, de la interpretación simultánea. Empezamos por ofrecer una
descripción de las fases inherentes a la compilación de un corpus de interpretación mul-
timedia (EN-PT/PT-EN), pasando en seguida al análisis de cinco fenómenos lingüísti-
cos: papeles semánticos de los argumentos; tiempo, modo y aspecto; cohesión interfrás-
tica; relaciones anafóricas (pronombres personales y relativos) y aspectos léxicos. Este
estudio intenta demostrar que el análisis lingüístico puede ayudar a circunscribir áreas
críticas de la interpretación simultánea, contribuyendo de forma positiva a la formación
de intérpretes.
Abstract
This paper offers an exploratory corpus-based study about the usefulness of multilingual
corpora in fields related to the study of language, translation and, in particular, simulta-
neous interpreting. We begin with a description of a multimedia interpreting corpus
(EN-PT/PT-EN), which is followed by the analysis of five linguistic phenomena: se-
mantic roles of the arguments; tense, mode and aspect; inter-sentence cohesion; ana-
phoric relations (personal and relative pronouns); and lexical aspects. This study aims to
demonstrate that a linguistics-oriented analysis may help to identify problem areas in
simultaneous interpretation, thus rendering an important contribution to the training of
interpreters.
Palabras clave
Corpus electrónico, interpretación, formación de intérpretes, lingüística contrastiva
Keywords
Electronic corpora, interpreting, training of interpreters, contrastive linguistics

1. Corpus electrónicos
La lingüística de corpus ha sufrido un desarrollo muy fuerte en las últimas dé-
cadas y por eso hoy tenemos a nuestra disposición una enorme multiplicidad de
corpus electrónicos consultables: monolingües, multilingües, comparables, pa-
Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
166 SÍLVIA ARAÚJO Y ANA CORREIA

ralelos, etc. Este tipo de recurso es de extrema utilidad para el estudio de los
idiomas, porque permite a los investigadores basar sus pesquisas en datos reales
del uso de la lengua. Además, la utilización de corpus tiene otras aplicaciones
prácticas en lo que se refiere, por ejemplo, a la creación de contenidos didácti-
cos no sólo para la enseñanza de idiomas sino también para los estudios de tra-
ducción, y en particular la formación de traductores e intérpretes.
Actualmente, en comparación con otros idiomas, los corpus disponibles para el
portugués son escasos, así que en la Universidad do Minho nos hemos dedicado
a la compilación de un gran corpus paralelo multilingüe, en el que el portugués
(y sus variantes africana y brasileña) es el idioma pivote. Este proyecto, cofi-
nanciado por la Fundación Portuguesa para la Ciencia y la Tecnología y por el
Fondo Europeo de Desarrollo Regional, se titula «Per-Fide: Portugués en Para-
lelo con otros seis idiomas (Português; Español; Russkyi; Français; Italiano;
Deutsch; English)» (Araújo et al., 2012; Almeida et al., 2014) y resulta de una
colaboración entre el Instituto de Letras y Ciencias Humanas y el Departamento
de Informática de la Universidad do Minho. 1 Entre 2010 y 2013 el equipo inter-
disciplinario del Proyecto Per-Fide estuvo involucrado en la compilación de
textos paralelos en estos siete idiomas. Se compiló una gran cantidad de textos,
pertenecientes a distintos dominios: literario, jurídico-legislativo, religioso,
técnico y periodístico. El corpus Per-Fide destaca en la red de recursos lingüís-
ticos del portugués porque a) abarca un gran número de idiomas; b) incluye
textos de varias áreas; y c) está disponible gratuitamente para consulta y descar-
ga a través de su interfaz web.
En cuanto a sus funciones de búsqueda, el corpus Per-Fide presenta varios as-
pectos innovadores. Además de la búsqueda monolingüe y bilingüe sencilla, el
usuario puede efectuar búsquedas bilingües dobles que le permitirán introducir
dos palabras simultáneamente para verificar de forma rápida el grado de corres-
pondencia directa entre ellos. El usuario puede activar también otro modo de
búsqueda a través de los diccionarios probabilísticos de traducción, clicando en
ptd en vez de search. La ilustración 1 (pág. 167) muestra una búsqueda por ptd
con la palabra portuguesa assinatura.
Para una palabra, el ptd ofrece las diferentes alternativas de traducción con base
en una medida de confianza estadística. Se trata de un abordaje cuantitativo que
por su rápida y fácil visualización puede ser de gran utilidad para observaciones
preliminares, pero que deberá siempre ser complementado con el análisis de las
concordancias, es decir, las palabras en contexto.
A pesar de que el proyecto haya terminado oficialmente en 2013, todavía queda
mucho por hacer. Una de las limitaciones de nuestro corpus es que sólo con-
templa texto escrito, así que nuestro próximo objetivo es de ampliar el corpus
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 167

Per-Fide al dominio de la oralidad y en particular de la interpretación, comple-


mentando la componente de traducción.

Ilustración 1. Ptd de assinatura

2. Corpus de interpretación
La logística que exige el proceso de construcción de un corpus oral determina
que sean pocos los corpus orales disponibles y, en general, de reducida dimen-
sión. Esto vale especialmente para los corpus de interpretación (nos referimos
aquí al modo simultáneo). El Departamento de Estudios Interdisciplinarios so-
bre Traducción, Lenguas y Cultura de la Universidad de Bologna compiló el
EPIC – European Parliament Interpreting Corpus, un corpus electrónico abier-
to, paralelo y trilingüe (italiano, español e inglés) de discursos proferidos en
sesiones plenarias del Parlamento Europeo y sus interpretaciones (Bendazzoli
y Sandrelli 2005, 2009). 2 El Hamburger Zentrum für Sprachkorpora ha desa-
rrollado un trabajo notable en esta área y creó varios corpus orales dirigidos al
estudio del bilingüismo y de la adquisición. 3 Este centro se dedicó también a la
compilación de algunos corpus de interpretación, en modo consecutivo y simul-
táneo, que incluyen el portugués brasileño (e.g. Community-interpreting Data-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


168 SÍLVIA ARAÚJO Y ANA CORREIA

base Pilot Corpus; Consecutive and Simultaneous Interpreting Corpus) (An-


germeyer et al. 2012). De una forma general, estos corpus presentan algunas
restricciones de acceso e búsqueda y obligan al registro de los usuarios.

2.1. Per-Fide/EPIC: un corpus de interpretación bidireccional multime-


dia
Como continuación del Proyecto Per-Fide, como habíamos señalado arriba,
queremos contribuir a subsanar la laguna que existe al nivel de los corpus de
interpretación incluyendo el portugués europeo. Tomando inspiración de EPIC,
nos hemos propuesto compilar un corpus bidireccional de discursos pronuncia-
dos por eurodiputados portugueses e ingleses en sesiones plenarias del Parla-
mento Europeo y las respectivas interpretaciones. A la semejanza del corpus
Veiga creado en el ámbito del Corpus Lingüístico da Universidade de Vigo
(Sotelo y Guinovart 2012), se pretende que este sea un corpus multimedia,
en que cada segmento de texto transcrito esté alineado con el trozo de vídeo que
le corresponde. 4 A título provisional, nuestro corpus se llamará Per-
Fide/EPIC.

2.1.1. Descripción del corpus


El corpus Per-Fide/EPIC está compuesto por un conjunto de vídeos corres-
pondientes a las intervenciones de los eurodiputados portugueses e ingleses de
la séptima legislatura, entre enero y junio de 2011. A cada discurso original
portugués le corresponde una interpretación en inglés y a cada discurso original
inglés le corresponde una interpretación en portugués, de ahí que se hable del
carácter bidireccional del corpus. Per-Fide/EPIC se divide, así, en dos subcor-
pus cuantitativamente equivalentes: 1) portugués original/inglés interpretado y
2) inglés original/portugués interpretado.
Con este corpus, pretendemos crear un recurso que sea representativo de la di-
mensión oral de la lengua, y en particular de la oralidad en contexto de interpre-
tación simultánea. En efecto, el sistema de asignación de tiempo de palabra hace
que las intervenciones de los eurodiputados sean, en general, bastante cortas,
rondando una media de dos minutos por discurso. Por consiguiente, a fin de
sacar el máximo provecho de su tiempo de antena, la mayoría de los eurodipu-
tados prepara sus discursos y los lee, lo que naturalmente resulta en un débito y
densidad muy elevados en comparación con un discurso impromptu. Por estas
razones, podemos decir que se trata de una oralidad con características propias,
impuestas por el contexto en que ocurre.
Además hay otras consideraciones importantes que no deben ser olvidadas, ya
que pueden influir en el análisis del material lingüístico producido por los intér-
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 169

pretes. Por una parte, sabemos que los discursos presentados por los deputados
son preparados de antemano. Cabe señalar que algunas intervenciones (e.g.
preguntas y comentarios) son espontáneas, y por lo tanto carentes de prepara-
ción anticipada. Además, no sabemos si los intérpretes tienen acceso previo a
los discursos que interpretan en las sesiones plenarias. Por otra parte, la infor-
mación sobre los intérpretes es escasa. No disponemos de información sobre su
formación y su experiencia profesional. Esto podría resultar útil para garantizar
la homogeneidad de la muestra en caso de que quisiéramos vincular los datos
del análisis a este tipo de variables, pero no es este nuestro objetivo. Intentare-
mos naturalmente controlar estas variables hasta donde sea posible, conscientes
de que los vídeos facilitados por el servicio de audiovisuales del Parlamento
Europeo fueron grabados para fines distintos de los da investigación y que, por
lo tanto, carecen de metadatos potencialmente relevantes desde el punto de vista
de la metodología científica.

2.1.2. Metodología de compilación


En cuanto a las etapas de compilación, este proceso empezó con la descarga de
los vídeos a partir del sitio web de servicios audiovisuales del Parlamento Euro-
peo. Por lo que se refiere a los derechos de autor, hay que señalar que el servicio
audiovisual permite que el material facilitado a través de su sitio web sea utili-
zado gratuitamente para fines educativos. Este permiso se encuentra explícita-
mente previsto en el separador Copyright del sitio web de servicios audiovisua-
les del Parlamento Europeo.
Los vídeos retratan los oradores pronunciando discursos en su idioma nativo.
Sin embargo, aunque se mantiene la imagen del orador, es posible escuchar las
interpretaciones en cada uno de los idiomas oficiales de la Unión Europea por-
que cada vídeo está integrado con las varias pistas de audio. Por consiguiente,
después de descargar los vídeos fue necesario extraer únicamente las pistas
portuguesa e inglesa para posteriormente asociar a los videos correspondientes.
A continuación nos dedicamos a la transcripción de los discursos y de las inter-
pretaciones. Para ellos utilizamos el Partitur-Editor incluido en el software
EXMARaLDA, desarrollado por investigadores del Hamburger Sprachzentrum
al que hemos hecho referencia más arriba. Antes de dar inicio a la transcripción
propiamente dicha, fueron introducidos los metadatos relativos a los oradores e
intérpretes en la pestaña Speakertable; y a los discursos en la pestaña Metain-
formation. En cuanto a los oradores, introducimos los siguientes atributos:
nombre, sexo, idioma y grupo político; en el caso de los intérpretes definimos
como atributos el idioma y el sexo. Los metadatos del discurso introducidos en
el separador Metainformation fueron la fecha y la fuente (original o interpreta-
ción). La definición de los metadatos fue condicionada por los factores ya des-
critos en la sección 2.1.1.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


170 SÍLVIA ARAÚJO Y ANA CORREIA

La transcripción es un proceso minucioso que requiere una inversión sustancial


de tiempo y esfuerzo. Afortunadamente, hemos podido contar con la valiosa
colaboración de los alumnos del tercer año de la licenciatura en lenguas extran-
jeras aplicadas de la Universidade do Minho, en el ámbito de la asignatura de
Principios de Interpretación. La transcripción es una etapa crucial en la compi-
lación de un corpus oral ya que constituye una representación estable de los
datos sin la que cualquier análisis lingüístico quedaría invalidado. La transcrip-
ción implica varias tomas de decisión según los objetivos del corpus: hay que
decidir qué normas vamos a utilizar, si vamos a representar ortográficamente los
fenómenos de la oralidad y cómo, si vamos a introducir anotaciones supraseg-
mentales, entre otras cuestiones metodológicas. En nuestro caso, decidimos
utilizar las convenciones HIAT (Halbinterpretative Arbeitstranskriptionen)
integradas en el EXMARaLDA Partitur-Editor (Schmidt 2004). HIAT es un
sistema de transcripción para la representación escrita de la lengua hablada,
creado en los años 70 en el ámbito del análisis del discurso y que fue retomado
por los desarrolladores del Partitur-Editor EXMARaLDA. Paralelamente a la
transcripción ortográfica de los discursos, fueron anotados varios fenómenos
orales: falso comienzo, duda, reformulación, pausa, errores de pronunciación,
repetición, pasaje dudoso y pasaje imperceptible. En una fase inicial nos limi-
tamos a anotar estos fenómenos más inmediatos. Sin embargo, la revisión y
análisis de las transcripciones nos permitirá detectar otros fenómenos lingüísti-
cos relevantes para el estudio de la interpretación simultánea. De aquí se con-
cluye que el propio proceso de transcripción es inherentemente dinámico y heu-
rístico, estableciendo un ciclo de retroalimentación constante entre las transcrip-
ciones y las anotaciones. Si bien es lento, los alumnos consideraron este ejerci-
cio productivo y pedagógico dado que les permitió no sólo desarrollar sus com-
petencias de discriminación auditiva y memoria sino también familiarizarse con
la interpretación simultánea.
Después de la transcripción y anotación, hay una serie de etapas técnicas que
cumplir. Las transcripciones de los discursos originales serán alineadas con las
de las interpretaciones. Puesto que se trata de un corpus multimedia, los respec-
tivos vídeos serán segmentados y sincronizados con los alineamientos textuales.
Al final, será construida una interfaz de búsqueda que permitirá al usuario recu-
perar información con base en los metadatos y anotaciones introducidas en el
corpus. Éste estará alojado en el servidor del proyecto Per-Fide.

3. La lingüística aplicada al estudio de la traduc-


ción/interpretación
Los estudios de traducción siempre mantuvieron una relación estrecha con la
lingüística. Hay inúmeras tipologías creadas por lingüistas precisamente para
apoyar el estudio de la traducción, permitiendo clasificar de una forma sistemá-
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 171

tica los fenómenos que caracterizan el pasaje de un idioma al otro. Algunos


ejemplos son las tipologías propuestas por Vinay y Darbelnet 1958; Dancette
1989; Gouadec 1989; Gile 1992; Pym 1992; Nord 1996; Chesterman 2000;
Delisle 2005; Collombat 2009, etc. Este tipo de material es muy importante
desde un punto de vista formativo por cuanto permite proporcionar a los estu-
diantes las herramientas conceptuales y terminológicas para entender mejor el
mecanismo traductivo y, por consiguiente, reflexionar de forma consciente so-
bre la calidad de sus traducciones, lo que resultará, por cierto, de gran utilidad
para consolidar sus competencias de revisión de textos. En cambio, existe algu-
na resistencia a la integración de la lingüística en la mayor parte de las investi-
gaciones llevadas a cabo en el ámbito de los estudios de interpretación. A pesar
del interés mostrado en los aportes de la lingüística durante las décadas de 50 y
60, la investigación desarrollada actualmente en el campo de la interpretación
parece privilegiar el abordaje cognitivo, prestando una especial atención a cues-
tiones relacionadas con la memoria de trabajo (Gile 1995; Liu 2004; Mizuno
2005, entre otros). Sin embargo, hay algunas investigaciones que permiten en-
cuadrar los fenómenos propios de la interpretación (simultánea) con base en
criterios lingüísticos. Algunos ejemplos pueden ser encontrados en los trabajos
de autores como Gile 1987; Altman 1994; Barik 1994; Falbo 1998, entre otros,
etc. Todos ellos se centran en la noción de error, a la que le dan diferentes nom-
bres según la forma en la que afectan la (im)perceptibilidad del discurso de
llegada (e.g. écart/faute; maladresse/erreur). Otro aspecto común es que com-
parten, de forma más o menos explícita, la división estructural entre problemas
de forma y de contenido. En el primer grupo caben cuestiones de cohesión (e.g.
errores morfosintácticos y de pronunciación) y en el segundo de coherencia
(e.g. omisiones y adiciones).
Los idiomas son, sin duda, las herramientas de trabajo de la interpretación, ra-
zón por la que consideramos que la formación de intérpretes podrá beneficiarse
de una reflexión sobre la lengua a fin de desarrollar la conciencia metalingüísti-
ca en los alumnos. A largo plazo, este trabajo podrá ayudar a los futuros profe-
sionales a tratar de forma consciente, y por consiguiente más eficaz, las áreas
críticas de la interpretación simultánea. La Universidad de Liège es, a nuestro
conocimiento, la única que parece atribuir alguna relevancia a los aportes de la
lingüística. El master de interpretación en esta universidad incluye una asignatu-
ra electiva de Lingüística Contrastiva con diferentes combinaciones lingüísticas.

4. Análisis del corpus


En este capítulo, intentaremos delimitar algunas de estas áreas, analizando los
mecanismos lingüísticos presentes en un discurso original portugués y su inter-
pretación en inglés, desde una perspectiva contrastiva. El análisis versará sobre
cinco fenómenos lingüísticos: papel semántico de los argumentos; tiempo, mo-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


172 SÍLVIA ARAÚJO Y ANA CORREIA

do y aspecto; cohesión interfrástica; relaciones anafóricas (pronombres persona-


les y relativos); y aspectos léxicos.

4.1. Papeles semánticos de los argumentos


Aunque generalmente consideradas palabras vacías, las preposiciones pueden
engendrar alteraciones de sentido más o menos profundas (Van Valin 2005).
Por ejemplo, en 1b, al utilizar la preposición by en lugar de to, se cambia signi-
ficativamente el papel semántico de los argumentos citizens y world, ya que
éstos pasan a ser los agentes del proceso y no sus destinatarios:
1a) China, como membro permanente do Conselho de Segurança da ONU, tem
obrigações de Direitos Humanos, as obrigações que constam da Carta das
Nações Unidas, e tem de prestar contas por elas, não apenas aos seus cidadãos,
mas a todo o mundo.
1b) China is a permanent member of the United Nations Security Council and
therefore has obligations under the United Nations charter and has to be called to
account for them, not just by citizens but by the whole world.
En 1b, el uso de by en lugar de to se debe probablemente al hecho de que el
intérprete empleó la voz pasiva (has to be called to account) para traducir la
colocación prestar contas que aparece en la voz activa, en el discurso original.

4.2. Tiempo y aspecto


Los valores temporo-aspectuales inherentes a las formas verbales no siempre
son integralmente vehiculados en el discurso interpretado:
2a) A União Europeia, mesmo na prossecução dos seus interesses económicos,
tem a responsabilidade de apoiar ativistas como Ai Weiwei, como Liu Xiaobo,
como Hu Jia, que se têm batido corajosamente pela urgente reforma política na
China, contra a pressão, pelos Direitos Humanos e pelas liberdades básicas.
2b) The European Union, even while pursuing its economic interests, has to take
into consideration cases such as Mister Ai, or Mister Liu or Mister Hu, the peo-
ple who are fighting for basic freedoms and Human Rights there.
En 2a, nos encontramos ante una forma verbal en el pretérito perfeito composto
(se têm batido), compuesta por el verbo auxiliar ter y el participio del verbo
principal, que expresa una acción realizada en el pasado y que se prolonga hasta
el presente (Campos 1987, 1997). Este valor aspectual de continuidad habría
sido transmitido a través del uso del present perfect progressive (have been
fighting) en lugar del present progressive (are fighting) que sólo marca una
acción en curso. La perseverancia de los activistas en la lucha contra el régimen
chino resulta menos evidente en el discurso interpretado. El en ejemplo que se
ofrece a continuación, es interesante notar que el uso del present perfect pro-
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 173

gressive sería incompatible con las propiedades semánticas primitivas del verbo
leave. En cuanto a la categoría aspectual, leave procede de los verbos de achie-
vement (Vendler 1957), razón por la que la combinación have been leaving no
resulta natural para expresar la idea de que los activistas han venido a ser objeto
de persecución y detención a lo largo del tiempo:
3a) (...) a reconsideração das sentenças judiciais, que têm mantido ativistas de
Direitos Humanos na prisão.
3b) (...) the removal of convictions that have left Human Rights defenders in
prison.
La combinación have been keeping podría haber sido una alternativa viable en
este contexto, que transmitiría de la forma más fiel el valor de continuidad vehi-
culado por la forma verbal portuguesa (têm sido mantidos). En el siguiente
ejemplo, no es el tiempo verbal que plantea problemas sino la modalidad. Al
elegir simplemente el present perfect (have been) sin rescatar la modalidad
deóntica (Campos 1998) expresa, en el discurso original, por el auxiliar ter de,
la interpretación transmite una idea distinta de la que manifestaba el original:
4a) Violações de Direitos Humanos, por parte das autoridades chinesas têm de
ser tema constante no diálogo político com a China.
4b) Infringements of Human Rights, by the Chinese authorities have been a con-
stant in the political dialogue with China.
En el discurso interpretado, se dice que la violación de los derechos humanos
por las autoridades chinas ha sido un tema de diálogo permanente con la China.
En cambio, el discurso original refiere que este tema debe ser introducido y
debatido, sugiriendo que hubiera sido pasado por alto hasta el momento.

4.3. Cohesión interfrástica


Algunos de los estudios lingüísticos específicamente dedicados a los errores
más recurrentes en interpretación siempre buscan identificar las adiciones y
omisiones que tienden a brotar en los discursos interpretados. La tendencia a
eliminar alguna información que figura en el discurso original es inevitable,
puesto que la interpretación impone una gran sobrecarga sobre la memoria del
intérprete. Por consiguiente, los conectores discursivos no siempre son preser-
vados en el proceso interpretativo (McDermid 2014):
5a) O desaparecimento de Ai Weiwei tem de ser entendido no contexto do au-
mento desesperado da repressão política por parte das autoridades Chinesas. Tu-
do por medo de que o espírito revolucionário no mundo Árabe infete a sociedade
chinesa. Mas a União Europeia pode fazer a diferença.
5b) The disappearance of Ai Weiwei has to be understood in the context of the
tightening up of political repression in China. They are afraid that the democratic

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


174 SÍLVIA ARAÚJO Y ANA CORREIA

spring in the Arab world 1might infect them. The European Union can make a
difference.
Al eliminar la conjunción mas, se pierde esta idea de que la Unión Europea
puede realmente intervenir en el proceso para intentar contrarrestar el régimen
de represión llevado a cabo por China. En cambio, hay otros casos en que los
conectores son añadidos por el intérprete. En 6b, el conector therefore fue aña-
dido a fin de establecer una relación de causa (China = miembro de la ONU) y
efecto (China => obligaciones) que sólo aparece de forma implícita en el dis-
curso original:
6a) A China, como membro permanente do Conselho de Segurança da ONU,
tem obrigações de Direitos Humanos, as obrigações que constam da Carta das
Nações Unidas, e tem de prestar contas por elas, não apenas aos seus cidadãos,
mas a todo o mundo.
6b) China is a permanent member of the United Nations Security Council and
therefore has obligations under the United Nations charter and has to be called to
account for them, not just by citizens but by the whole world.

4.4. Relaciones anafóricas


La anáfora es una relación asimétrica entre un antecedente previamente identifi-
cado referencialmente y un término anafórico que sólo adquiere identidad refe-
rencial a través de su integración en aquel contexto (Campos y Xavier 1991;
Irmer 2011). En el discurso original que sigue, el pronombre tudo retoma casi
toda la oración anterior, es decir, el papel fuertemente controlador de China en
lo que respecta a la subyugación de su población:
7a) O desaparecimento de Ai Weiwei tem de ser entendido no contexto do au-
mento desesperado da repressão política por parte das autoridades Chinesas. Tu-
do por medo de que o espírito revolucionário no mundo Árabe infete a sociedade
chinesa.
El intérprete opta por articular estos dos enunciados materializando, a través del
pronombre anafórico they, la idea de que esa represión es llevada a cabo por las
autoridades chinas, aunque este agente represivo no aparece explícitamente
mencionado en el contexto anterior. Cabe señalar que su aparición implicaría,
debido a la cadena anafórica que se establecería entre el sintagma nominal auto-
ridades chinesas y los pronombres they y them, la idea de que la infección re-
caería sobre las autoridades chinas y no sobre la sociedad china en general:
7b) The disappearance of Ai Weiwei has to be understood in the context of the
tightening up of political repression in China. They are afraid that the democratic
spring in the Arab world might infect them.
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 175

En otras palabras, si el intérprete hubiera optado por atribuirle un antecedente


más ‘directo’ a they, proponiendo como antecedente para este pronombre no el
locativo in China, sino su real antecedente autoridades chinesas, entonces ten-
dría de sustituir el pronombre them por el sintagma nominal the chinese, para
evitar que las autoridades fueran entendidas como el paciente sobre el que recae
la eventual infección con el espíritu revolucionario. Como vemos, las cadenas
anafóricas que se van fijando en las relaciones interfrásticas dan lugar a cone-
xiones sintácticas que determinan las relaciones semánticas entre los diferentes
actantes implicados en el discurso. Cambiar una de las palabras de esa cadena
puede ocasionar alteraciones muy significativas de sentido. Por esta razón, con-
sideramos que las relaciones anafóricas constituyen un área particularmente
sensible en la construcción de la significación (Denizot y Dupraz 2012). Estas
relaciones anafóricas se traducen en el uso de pronombres relativos que estable-
cen un fuerte vínculo correferencial con su antecedente:
8a) Violações de Direitos Humanos, por parte das autoridades chinesas, têm de
ser tema constante no diálogo político com a China, que deve ser repensado, no
sentido de garantir a produção de resultados concretos, nomeadamente, a recon-
sideração das sentenças judiciais, que têm mantido ativistas de Direitos Humanos
na prisão.
En este caso, el pronombre relativo indica que es el diálogo político con China
que debe ser reconsiderado. El intérprete opta por convertir esta oración relativa
(que deve ser repensado) en una oración coordinada (and we need to rethink)
cuyo objeto directo introducido por un determinante demostrativo (that dialo-
gue) consiste en la repetición de la primera palabra de la cadena, o sea, del tér-
mino antecedente dialogue:
8b) Infringements of Human Rights, by the Chinese authorities have been a con-
stant in the political dialogue with China and we need to rethink that dialogue so
that it produces definite results, particularly the removal of convictions that have
left Human Rights defenders in prison.
En su empeño por segmentar el discurso en bloques de información que le per-
mitan conservar el orden canónico de la frase (sujeto – verbo - objeto(s)), el
intérprete parece más propenso a emplear la parataxis que la hipotaxis (Trévise
2003; Fabricius-Hansen y Ramm 2008). En otras palabras, los pronombres rela-
tivos que permean los discursos originales portugueses son espontáneamente
sustituidos, en inglés, por conjunciones coordinativas copulativas que parecen
ayudar al intérprete a procesar trozos de información más reducidos. Parado-
xalmente, esta forma aparentemente más simples (porque más atomizada) de
procesar y restituir el discurso original haz con que el intérprete tenga que atri-
buir al verbo de la oración coordinada un sujeto, puesto que el inglés es un
idioma de sujeto obligatoriamente realizado, a diferencia del portugués. Esta
operación puede resultar algo complicada, especialmente cuando ese sujeto no

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


176 SÍLVIA ARAÚJO Y ANA CORREIA

está fonéticamente marcado en el original. En efecto, como vemos, el pronom-


bre we asociado al verbo rethink parece limitar la reflexión sobre el diálogo a
los agentes europeos porque no da cuenta de la necesidad de una reflexión con-
junta entre los dos bloques (China-Europa).
Sin embargo, la ruptura de la cadena anafórica entre el pronombre relativo y su
antecedente no siempre se debe al pasaje de la subordinación (en portugués) a la
coordinación (en inglés). En el ejemplo 9a, existe una relación clara de correfe-
rencia entre el pronombre que y el nombre ativistas; en la interpretación, la
reformulación de ter a responsabilidade de apoiar por have to take into consi-
deration llevó a la adición de cases y, por consiguiente, de the people para darle
un antecedente al pronombre who:
9a) A União Europeia, mesmo na prossecução dos seus interesses económicos,
tem a responsabilidade de apoiar ativistas como Ai Weiwei, como Liu Xiaobo,
como Hu Jia, que se têm batido corajosamente pela urgente reforma política na
China, contra a pressão, pelos Direitos Humanos e pelas liberdades básicas.
9b) The European Union, even while pursuing its economic interests, has to take
into consideration cases such as Mister Ai, or Mister Liu or Mister Hu, the peo-
ple who are fighting for basic freedoms and Human Rights there.
Del proceso de interpretación resulta que la cadena anafórica pase a integrar un
nuevo elemento (the people):
PT: ativistas (1) .... que (2) / EN: cases (1) ... the people (2) .... who (3)
La cadena anafórica del original podría haber sido preservada, por ejemplo, de
la siguiente forma:
9c) The European Union [...] has to support activists such as Mister Ai, or Mister
Liu or Mister Hu, who have been fighting for basic freedoms and Human Rights.
El ejemplo 9b termina con el deíctico there, que sólo puede ser interpretado
referencialmente si asociado a un referente (i.e. a China) que, en este caso, no
aparece en el cotexto inmediato. El oyente tendrá que recuperarlo a través de su
memoria textual o saber enciclopédico, corriendo el riesgo de establecer una
relación de correferencia errónea entre el deíctico y el SN más próximo (the
European Union). La sobrecarga cognitiva impuesta por este tipo de construc-
ción podría haber sido evitada con la simples omisión de there.

4.5. Aspectos léxicos


Además de la sintaxis, existen otros fenómenos, de orden léxica, que interfieren
con las propiedades semánticas de las palabras. En el siguiente ejemplo, la ex-
presión aumento desesperado conjuga los valores cuantitativo (aumento) y cua-
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 177

litativo (desesperado). En el discurso interpretado se conservó únicamente la


dimensión cuantitativa a través del lexema tightening up:
10a) O desaparecimento de Ai Weiwei tem de ser entendido no contexto do au-
mento desesperado da repressão política por parte das autoridades Chinesas.
10b) The disappearance of Ai Weiwei has to be understood in the context of the
tightening up of political repression in China.
A pesar de la tendencia a eliminar, en el discurso interpretado, elementos apa-
rentemente accesorios como adjetivos o adverbios, puede ser importante tener
en cuenta que ni todos estos elementos se sitúan al mismo nivel en cuanto a su
impacto. En 10b, consideramos que la supresión del adjetivo desesperado no es
insignificante.
Además de la omisión, pueden ser encontrados otros problemas relacionados
con elecciones léxicas que conllevan alteraciones de sentido, como en 11b:
11a) Violações de Direitos Humanos, por parte das autoridades chinesas, têm de
ser tema constante no diálogo político com a China, que deve ser repensado, no
sentido de garantir a produção de resultados concretos, nomeadamente, a recon-
sideração das sentenças judiciais, que têm mantido ativistas de Direitos Huma-
nos na prisão.
11b) Infringements of Human Rights, by the Chinese authorities have been a
constant in the political dialogue with China and we need to rethink that dialogue
so that it produces definite results, particularly the removal of convictions that
have left Human Rights defenders in prison.
En este caso, a pesar de la correspondencia directa entre las palabras marcadas
en cursiva, cabe señalar que removal se sitúa en un nivel ulterior desde el punto
de vista semántico, en comparación con el original reconsideração. En principio
la reconsideración de las sentencias judiciales es una etapa previa a su remo-
ción, y no es garante de que la decisión final sea efectivamente la remoción.

5. Consideraciones finales
El corpus Per-Fide/EPIC viene a cubrir una laguna en los corpus orales, y en
particular de interpretación. Al presente, este corpus integra el portugués euro-
peo y el inglés pero prevemos una ampliación a otros idiomas. Una de las gran-
des ventajas de este tipo de recurso consiste en el hecho de que faculta datos
auténticos, que pueden contribuir a una aprehensión holística del proceso inter-
pretativo, conjugando las dimensiones (meta)cognitiva y (meta)lingüística (Set-
ton 1999; Dimitrova y Hyltenstam 2000). Sobre la base del análisis propuesto
en este artículo, hemos intentado demostrar que la reflexión lingüística sobre el
producto de la interpretación permite, por un lado, delimitar áreas críticas como
sea la cuestión de las relaciones anafóricas y, por otro lado, identificar idiosin-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


178 SÍLVIA ARAÚJO Y ANA CORREIA

crasias de los idiomas como por ejemplo la predilección del inglés por la para-
taxis (en oposición al portugués que privilegia la hipotaxis). En cuanto a la for-
mación de intérpretes, creemos que este tipo de reflexión podrá contribuir para
desarrollar mecanismos de alerta en los alumnos.

6. Bibliografía
Almeida, José João et al. 2014. The Per-Fide Corpus: a new resource for corpus-based
terminology, contrastive linguistics and translation studies. @ T. Berber Sar-
dinha y T. São Bento Ferreira, eds. Working with Portuguese Corpora. Lon-
don: Bloomsbury Academic. ISBN 9781441190505, pp. 177-200.
Altman, Janet. 1994. Error analysis in the teaching of simultaneous interpretation: a
pilot study. @ S. Lambert y B. Moser-Mercer, eds. Bridging the gap: empirical
research in simultaneous interpretation. Amsterdam/Philadelphia: John Ben-
jamins, ISBN 9789027285805, pp. 25-38.
Angermeyer, Philipp, Bernd Meyer y Thomas Schmidt. 2012. Sharing Community In-
terpreting Corpora: A pilot study. @ T. Schmidt y K. Wörner, eds. Multilin-
gual Corpora and Multilingual Corpus Analysis. Amsterdam/Philadelphia:
John Benjamins. ISBN 9789027219343, pp. 275-294.
Araújo, Sílvia et al. 2012. Apresentação do projecto Per-Fide: Paralelizando o Portu-
guês com seis outras línguas. @ Linguamática, 2/2: 71-74, ISSN 1647-0818.
Disponible en
<http://linguamatica.com/index.php/linguamatica/article/view/65/90>. Con-
sultado el 2/6/2014.
Barik, Henri. 1994. A description of various types of omissions, additions and errors of
translation encountered in simultaneous interpretation. @ S. Lambert y B.
Moser-Mercer, eds. Bridging the gap: Empirical research in simultaneous in-
terpretation. Amsterdam/Philadelphia: John Benjamins. ISBN
9789027285805, pp. 121-137.
Bendazzoli, Claudio y Annalisa Sandrelli. 2005. An Approach to Corpus-based Inter-
preting Studies: Developing EPIC (European Parliament Interpreting Corpus).
@ H. Gerzymisch-Arbogast y S. Nauert, eds, MuTra – Challenges of Multidi-
mensional Translation: Conference Proceedings. Saarbrücken. ISBN 069-
1306222, pp. 1-12. Disponible en
<http://www.euroconferences.info/proceedings/2005_Proceedings/2005_Benda
zzoli_Sandrelli.pdf>. Consultado el 4/6/2014.
Bendazzoli, Claudio y Annalisa Sandrelli. 2009. Corpus-based Interpreting Studies:
Early Work and Future Prospects. @ Revista tradumàtica – Traducció i Tecno-
logies de la Informació i la Comunicació 7. ISSN 1578-7559. Disponible en
<http://www.fti.uab.es/tradumatica/revista/num7/articles/08/08art.htm>. Con-
sultado el 4/6/2014.
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 179

Campos, Maria Henriqueta Costa. 1998. Dever e poder. Um subsistema modal do por-
tuguês. Lisboa: Fundação Calouste Gulbenkian/Junta Nacional de Investigação
Científica e Tecnológica. ISBN 972-31-0806-2.
Campos, Maria Henriqueta Costa y Maria Francisca Xavier. 1991. Sintaxe e Semântica
do Português. Lisboa: Universidade Aberta. ISBN 972-674-072-X.
Campos, Maria Henriqueta Costa. 1997. Tempo, aspecto e modalidade. Estudos de
linguística portuguesa. Porto: Porto Editora. ISBN 972-0-40116-8.
Campos, Maria Henriqueta Costa. 1987. O pretérito perfeito composto: um tempo pre-
sente? @ Actas do III Encontro da Associação Portuguesa de Linguística. Lis-
boa: Fundação Calouste Gulbenkian, pp.75-85. Disponible en
<http://www.apl.org.pt/docs/actas-03-encontro-apl-1987.pdf>. Consultado el
10/5/2014.
Chesterman, Andrew. 2000. Translation typology. @ A. Veisbergs e I. Zauberga, eds.
The Second Riga Symposium on Pragmatic Aspects of Translation. Riga: Uni-
versity of Latvia. ISBN 9984606597, pp. 49-62.
Collombat, Isabelle. 2009. La didactique de l’erreur dans l’apprentissage de la traduc-
tion. @ The Journal of Specialised Translation 12: 37-54, ISSN 1740-357X.
Disponible en <http://www.jostrans.org/issue12/art_collombat.php>. Consulta-
do el 7/5/2014.
Dancette, Jeanne. 1989. La faute de sens en traduction. @ TTR. Traduction, Terminolo-
gie, Rédaction 2/2: 83-102. ISSN 1708-2188. DOI 10.7202/037048ar. Dispo-
nible en <http://id.erudit.org/iderudit/037048ar>. Consultado el 20/5/2014.
Delisle, Jean. 2005. L’Enseignement pratique de la traduction. Beyrouth/Ottawa: Les
Presses de l’Université d’Ottawa. ISBN 9782760306011.
Denizot, Camille y Emmanuel Dupraz, eds, 2012. Anaphore et anaphoriques: variété
des langues, variété des emplois. Rouen: Publications de l'Université de Rouen
et du Havre. ISBN 9782877755368.
Dimitrova, Birgitta Englund y Kenneth Hyltenstam, eds, 2000. Language processing
and simultaneous interpreting: interdisciplinary perspectives. Amster-
dam/Philadelphia: John Benjamins. ISBN 9789027283054.
Fabricius-Hansen, Catherine y Wiebke Ramm, eds, 2008. Subordination versus Coordi-
nation in Sentence and Text. Amsterdam/Philadelphia: John Benjamins. ISBN
9789027231093.
Falbo, Caterina. 1998. Analyse des erreurs en interprétation simultanée. @ The Inter-
preters' Newsletter 8: 107-120. ISSN: 1591-4127. Disponible en
<http://hdl.handle.net/10077/2494>. Consultado el 26/4/2014.
Gile, Daniel. 1987. Les exercices d’interprétation et la dégradation du français: une
étude de cas. @ Meta 32/4: 420-428. ISSN 1492-1421. DOI 10.7202/002909ar.
Disponible en <http://id.erudit.org/iderudit/002909ar>. Consultado el
26/4/2014.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


180 SÍLVIA ARAÚJO Y ANA CORREIA

Gile, Daniel. 1992. Les fautes de traduction: une analyse pédagogique. @ Meta 37/2:
251-262. ISSN 1492-1421. DOI: 10.7202/002907ar. Disponible en
<http://id.erudit.org/iderudit/002907ar>. Consultado el 26/4/2014.
Gile, Daniel. 1995. Basic Concepts and Models for Interpreter and Translator Training.
Amsterdam/Philadelphia: John Benjamins. ISBN 9789027224330.
Gouadec, Daniel. 1989. Comprendre, évaluer, prévenir. Pratique, enseignement et re-
cherche face à l’erreur et à la faute en traduction. @ TTR: Traduction, Termi-
nologie, Rédaction 2/2: 35-54. ISSN: 1708-2188. DOI : 10.7202/037045ar.
Disponible en <http://id.erudit.org/iderudit/
037045ar>. Consultado el 25/4/2014.
Irmer, Matthias. 2011. Bridging Inferences: Constraining and Resolving Underspecifi-
cation in discourse interpretation. Berlin/Boston: Walter de Gruyter. ISBN
9783110262018.
Lui, Minhua, Daniel Schallert y Patrick Carrol. 2004. Working Memory and Expertise
in Simultaneous Interpreting. @ Interpreting 6/1: 19-42, ISSN 1384-6647. DOI
10.1075/intp.6.1.04liu.
McDermid, Campbell. 2014. Cohesion in English to ASL simultaneous interpreting. @
Translation & Interpreting 6/1: 76-101. ISSN 1836-9324. DOI
ti.106201.2014.a05. Disponible en <http://trans-
int.org/index.php/transint/article/view/296/152>. Consultado el 22/4/2014.
Mizuno, Akira. 2005. Process Model for Simultaneous Interpreting and Working
Memory. @ Meta 50/2: 739-752. ISSN 1492-1421. DOI: 10.7202/011015ar.
Disponible en <http://id.erudit.org/iderudit/011015ar>. Consultado el 7/5/2014.
Nord, Christiane. 1996. El error en la traducción: categorías y evaluación. @ A. Hurta-
do Albir, ed. La enseñanza de la traducción. Castelló: Universitat Jaume I.
ISBN 8480210788, pp. 91-103.
Pym, Anthony. 1992. Translation Error Analysis and the Interface with Language
Teaching @ C. Dollerup y A. Loddegaard, eds. The Teaching of Translation
and Interpreting. Amsterdam/Philadelphia: John Benjamins,
ISBN 9789027220943, pp. 279-288.
Schmidt, Thomas. 2004. Transcribing and annotating spoken language with EXMAR-
aLDA. @ Proceedings of the LREC Workshop on XML based richly annotated
corpora, Paris: ELRA. Disponible en
<http://www.exmaralda.org/files/Paper_LREC.pdf>. Consultado el
09/06/2014.
Setton, Robin. 1999. Simultaneous Interpretation: A Cognitive-pragmatic Analysis.
Amsterdam/Philadelphia: John Benjamins. ISBN 9789027216311.
Sotelo Dios, Patricia y Xavier Gómez Guinovart. 2012. A Multimedia Parallel Corpus
of English- Galician Film Subtitling. @ A. Simões, R. Queirós y D. da Cruz,
eds. 1st Symposium on Languages, Applications and Technologies. OASIcs:
CORPUS Y FORMACIÓN DE INTÉRPRETES: UN ESTUDIO EXPLORATORIO 181

Open Access Series in Informatics, vol. 21. Dagstuhl Publishing: Saarbrücken.


ISBN 978-3-939897-40-8, pp. 255-266.
Trévise, Anne. 2003. A propos de quelques relations inter-énoncés: hypotaxe, parataxe,
asyndète et construction du sens. @ A. Celle, S. Gresset, eds. La subordination
en anglais. Une approche énonciative. Toulouse: Presses Universitaires du Mi-
rail. ISBN 2858166838, pp. 51-68.
Van Valin, Robert. 2005. Exploring the syntax-semantics interface. Cambridge: Cam-
bridge University Press. ISBN 9780521010566.
Vendler, Zeno. 1957. Verbs and Times. @ The Philosophical Review 66/2: 143-16.
ISSN 1558-1470.
Vinay, Jean-Paul y Jean-Louis Darbelnet. 1958. Stylistique comparée du français et de
l’anglais. Paris: Didier. ISBN 9782278008940.

Agradecimientos
Las autoras desean agradecer a FCT – Fundação para a Ciência e Tecnologia
por financiar su investigación; a José João Almeida, Nuno Carvalho (Universi-
dade do Minho), Patricia Dios y Xavier Guinovart (Universidade de Vigo) por
la ayuda prestada en las etapas de compilación del corpus cumplidas hasta el
momento.

1
http://per-fide.ilch.uminho.pt/ .
2
http://sslmitdev-online.sslmit.unibo.it/corpora/corporaproject.php?path=E.P.I.C.
3
http://virt-fedora.multilingua.uni-hamburg.de/drupal/fedora/repository.
4
http://sli.uvigo.es/CLUVI/vmm_en.html.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


El uso de corpus en la formación de intérpretes
en los servicios públicos en casos de violencia de gé-
nero en España

[Corpus and training of public service gender vio-


lence interpreting in Spain]
RAQUEL LÁZARO GUTIÉRREZ Y MARÍA DEL MAR SÁNCHEZ RAMOS
Grupo FITISPos-UAH – Universidad de Alcalá
raquel.lazaro@uah.es
Resumen
Nuestra propuesta se centra en la elaboración de recursos formativos para intérpretes en
el ámbito de la violencia de género en España. En vista de la necesidad en la formación
de intérpretes en este campo, exploraremos cómo los llamados Estudios de Traducción
basados en Corpus pueden contribuir a cubrir este vacío pedagógico. Así, describiremos
la elaboración de un corpus oral de conversaciones entre víctimas de violencia de géne-
ro y los agentes que intervienen. Seguidamente nos centraremos en el proceso de recopi-
lación y creación de un archivo electrónico y su análisis con el fin de establecer paráme-
tros contrastivos y conocer el género del discurso de agentes y víctimas para su poste-
rior aplicación pedagógica.
Abstract
Our proposal is part of several research actions carried out in order to improve training
of gender violence professional interpreters in Spain. Due to the necessity of interpret-
ing training in this field, our communication will explore how Corpus-based Translation
Studies can be used to bridge this gap. We will describe the different steps involved in
the compilation of an oral corpus, consisting of conversations between gender violence
victims and other actors involved. We will focus our attention upon the compilation
process of our electronic archive in order to develop contrastive parameters and to study
the genre of gender violence discourse and its pedagogical application.
Palabras clave
Interpretación, servicios públicos, violencia de género, corpus
Keywords
Interpreting, public service, gender violence, corpus

1. Introducción
Hoy en día la sociedad y las autoridades están concienciadas de la necesidad de
erradicar la violencia de género, a la que con tanta frecuencia se ha mencionado
en la prensa nacional como la gran lacra de nuestra sociedad1. Pese a los gran-

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
184 MARÍA DEL MAR SÁNCHEZ Y RAQUEL LÁZARO

des esfuerzos que se están realizando a nivel estatal y europeo por la parte de las
administraciones para atajar este problema, la información y los mecanismos
articulados para el beneficio de estas mujeres no siempre llegan a sus destinata-
rias.
Sabemos gracias al Centro de Investigaciones Sociológicas que en el año 2011
la prevalencia de violencia de género entre las mujeres extranjeras duplicaba la
de las mujeres españolas. Algunas de estas mujeres cuentan con una barrera
adicional que les impide acceder a las medidas mencionadas anteriormente: se
trata de víctimas que no hablan (con fluidez) las lenguas nacionales.
Para que se produzca un acceso igualitario a todos los servicios que proporciona
nuestra sociedad, entre los que están incluidos los relacionados con la protec-
ción y asistencia a las víctimas de violencia de género, es necesaria muchas
veces la utilización de intérpretes que actúen de puente entre víctimas y agentes
que les atienden. No obstante, es necesario reconocer que la intervención de una
persona bilingüe (familiares, amigos, personal que habla otras lenguas, volunta-
rios…) no es la solución idónea para este tipo de problema. Lo realmente ade-
cuado es utilizar intérpretes profesionales especializados en esta área.
La especialización en contextos de violencia de género es algo que, hoy por
hoy, solo se adquiere mediante la práctica y, en muchas ocasiones, tras varias
experiencias desagradables. Los intérpretes que ejercen en este ámbito son, en
el mejor de los casos, personas con formación en interpretación en los servicios
públicos (community interpreting), que poseen conocimientos sobre las técnicas
de interpretación más frecuente en estas áreas, sobre el funcionamiento de las
instituciones en que se lleva a cabo esta asistencia y sobre las particularidades
discursivas y culturales de los hablantes que intervienen en estas conversacio-
nes, entre otras habilidades.
Conscientes de la necesidad de especialización por parte de los intérpretes que
ejercen en contextos de violencia de género, nos proponemos examinar el papel
que los corpus orales juegan en este ámbito. En este artículo, por lo tanto, ex-
ploraremos cómo los llamados Estudios de Traducción basados en Corpus pue-
den contribuir a cubrir este vacío pedagógico. Así, se describirá la elaboración
de un corpus oral de conversaciones entre víctimas de violencia de género y los
agentes que intervienen. Nos centraremos en los primeros pasos del proceso de
recopilación y creación de un archivo electrónico con el fin de establecer pará-
metros contrastivos y conocer las peculiaridades del discurso de agentes y víc-
timas para su posterior aplicación pedagógica.
EL USO DE CORPUS EN LA FORMACIÓN DE INTÉRPRETES EN LOS SERVICIOS PÚBLICOS… 185

2. Interpretación en los servicios públicos


La interpretación en los servicios públicos es aquella que, como su propio nom-
bre indica, se desarrolla en las distintas instituciones que ofrecen un servicio
público, como pueden ser los juzgados, hospitales, comisarías, centros de salud,
colegios, oficinas de la administración, etc., entre los trabajadores de estas insti-
tuciones, o proveedores de servicios, y las personas que acuden a ellos, o usua-
rios. Denominada community interpreting o public service interpreting en in-
glés, encontramos una de sus primeras definiciones de este tipo de interpreta-
ción en Wadensjö (1998:49):
Interpreting carried out in face-to-face encounters between officials and laypeo-
ple, meeting for a particular purpose at a public institution is (in English-
speaking countries) often termed community interpreting. [...]
Community interpreting is typically bi-directional, that is, the same interpreter
works in the two languages in question. As a rule, it is carried out consecutively
upon the original speakers' talk, sequence by sequence. The concept covers both
interpreting in face-to-face situations and interpreting provided over the tele-
phone. Health care, mental health, educational, social service and legal interpret-
ing are frequently given as sub-categories, and community interpreting as a more
general concept. (Wadensjö 1998: 49)
El terreno en el que se desarrolla esta modalidad de interpretación es muy am-
plio, e incluye una multitud de ámbitos, como el legal (considerado por algunos
autores una modalidad distinta de la interpretación en los servicios públicos
(Phelan 2001), el sanitario, el educativo, el administrativo, el social, el policial,
etc. Se lleva a cabo de manera bilateral tanto presencialmente como a través del
teléfono y posee una serie de características específicas respecto al resto de
modalidades como las que señalo a continuación:
• La importancia de que el intérprete conozca en profundidad no sólo las
lenguas en las que interpreta, sino también la cultura a la que pertenecen
sus clientes (Valero Garcés 2006).
• La asimetría entre los hablantes.
• La tensión existente en el desarrollo de las conversaciones interpretadas
(Phelan 2001, Valero Garcés 2006).
• El escaso (aunque creciente) reconocimiento de la profesión, que con-
duce al uso de intérpretes no profesionales para llevar a cabo esta tarea,
o a las malas condiciones del intérprete profesional que trabaja en este
ámbito y que percibe bajos salarios, trabaja durante muchas horas
desempeñando tareas distintas a las del intérprete, o cuenta con poco
apoyo y recursos (no recibe información previa acerca del tema sobre el
que tiene que interpretar o sobre las peculiaridades de sus interlocuto-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


186 MARÍA DEL MAR SÁNCHEZ Y RAQUEL LÁZARO

res, le avisan de los encargos con poca antelación, etc.) (Lázaro Gutié-
rrez 2014)
• El desempeño por parte del intérprete de una tarea mucho más amplia
que el simple trasvase de información, que incluye, entre otros aspectos,
el peso y la responsabilidad de la coordinación de la conversación
(Wadensjö 1998).
Teniendo en cuenta las características de la interpretación en los servicios pú-
blicos, un intérprete que se dedique a esta modalidad debería poseer, según In-
glis (1984, citado en Iliescu 2001) las siguientes características:
• Suficiente vocabulario general y específico.
• Capacidad para recordar funciones como presentaciones y saludos, des-
pedidas, formulación de preguntas y otras formas de extraer informa-
ción, petición de explicaciones y repeticiones, puntualización sobre al-
gún aspecto concreto de la conversación, secuencialización, expresión
de acuerdo y desacuerdo, autocorrección, disculpas, habilidad para rec-
tificar una falsa impresión, otras modalidades fáticas como los cumpli-
dos o los deseos de felicidad, y destrezas de deletreo.
• Consciencia de la naturaleza y características del discurso.
• Reconocimiento y traslado de registro y tono.
• Manejo correcto de estructuras sintácticas.
• Manejo de estrategias discursivas.
• Habilidad para reconocer y trasladar la fuerza ilocucionaria del mensaje
original.
• Habilidad de percibir opiniones y grado de conocimiento de los interlo-
cutores sobre el tema de la interacción.
• Capacidad de captar y trasladar el punto de vista de los interlocutores.
• Habilidad para mejorar la estructura del discurso.
• Conocimiento de las diferencias culturales entre los interlocutores.
De este modo, los intérpretes que quieran especializarse en violencia de género
deberían adquirir conocimiento sobre el vocabulario específico de este tipo de
interacciones, las estructuras más frecuentes (preguntas, narraciones, peticiones
de explicaciones, etc.), la naturaleza de la interacción, las peculiaridades del
discurso que se utiliza (metáforas, empatía) y un largo etcétera. Consideramos
que una herramienta útil para aislar estos aspectos es un corpus de conversacio-
nes reales. A partir de los hallazgos extraídos del análisis de un corpus de con-
versaciones entre víctimas y agentes se podrá contar con información útil para
la elaboración de material docente pertinente para la formación de intérpretes
especializados en contextos de violencia de género.
EL USO DE CORPUS EN LA FORMACIÓN DE INTÉRPRETES EN LOS SERVICIOS PÚBLICOS… 187

3. Interpretación en casos de violencia de género


Los datos del Instituto Nacional de Estadística (INE) para el año 2010 nos
muestran que España es el segundo país de la Unión Europea con población
extranjera, después de Alemania.
País Población extranjera
UE 32.489.000
Alemania 7.130.919
España 5.663.525
Reino Unido 4.362.006
Italia 4.235.059
Bélgica 1.052.844
Grecia 954.784
Tabla 1. Población extranjera en países de la UE.
[Fuente INE, 2010]
Según la misma fuente (INE), en 2011 en España las nacionalidades predomi-
nantes eran la rumana 14,9 % y la marroquí 13,6 %. Estos datos nos dan una
pista sobre la necesidad de contar con intérpretes en lenguas como la rumana o
el árabe para facilitar el acceso de esta población a los distintos servicios públi-
cos del país de acogida.
En su revisión de la aplicación de la Plataforma de Acción de Beijing en los
Estados miembros de la Unión Europea sobre violencia contra la mujer y apoyo
a las víctimas, el Instituto Europeo de la Igualdad de Género (2012) nos alertaba
sobre el hecho de que un nada desdeñable 33 % de las mujeres europeas había
sufrido violencia física o sexual. En España, la Macroencuesta sobre Violencia
de Género de 2011, realizada por el Centro de Investigaciones Sociológicas
(CIS) en colaboración con el Gobierno, alerta de que «la prevalencia de la vio-
lencia de género entre las mujeres extranjeras duplica la de las mujeres españo-
las» y de que «de cada cien mujeres que sufrieron violencia de género en Espa-
ña en el último año, el 85,5 % eran españolas y el 14,5 % extranjeras». Según el
citado documento 469.317 mujeres extranjeras sufrieron violencia de género en
algún momento de sus vidas y 130.241 lo hicieron en 2010. Por otro lado, los
datos que publica el Consejo General del Poder Judicial evidencian que en el
año 2010 el 12 % de las víctimas de violencia de género que acudían a los juz-
gados en España eran extranjeras. Solo tres años más tarde, en 2013, esta cifra
alcanzaba el 35 %.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


188 MARÍA DEL MAR SÁNCHEZ Y RAQUEL LÁZARO

Conscientes de esta problemática, las autoridades estatales han adoptado una


serie de medidas con el fin de disminuir el fenómeno de la violencia de género y
contribuir a establecer una estrategia nacional para la erradicación de esta lacra
mediante la atención personalizada a las mujeres víctimas. El objetivo es agru-
par en una red nacional a todas las instituciones gubernamentales del país, ade-
más de duplicar personal y otros recursos para luchar contra la violencia de
género. Entre estas medidas se encuentran la Ley Orgánica 1/2004 de Medidas
de Protección Integral contra la Violencia de Género y el Real Decreto
233/2005 a través del cual se establece la creación y la constitución de juzga-
dos de violencia sobre la mujer.
Además, se constituyen el Observatorio contra la Violencia Doméstica y de
Género del Consejo General del Poder Judicial como un instrumento de análisis
y de actuación que, en el ámbito de la Administración de la Justicia, promueve
iniciativas y medidas dirigidas a erradicar el problema social de la violencia
doméstica y de género, y el Observatorio Estatal de Violencia sobre la Mujer en
el seno del Ministerio de Sanidad, Servicios Sociales e Igualdad, que empezó a
funcionar en el año 2006 siendo el órgano competente en la elaboración de in-
formes y estudios sobre violencia de género y en evaluación del impacto de las
políticas y medidas tomadas en este sentido, mediante la recogida, análisis y
difusión de material sobre violencia de género. A mediados de la década pasada
se crea también la Red de Puntos Municipales del Observatorio Regional contra
la Violencia de Género y se pone en marcha la línea de teléfono 016 para las
mujeres que sufren maltrato, entre otras iniciativas que no mencionaremos por
falta de espacio.
A nivel europeo, destaca la Directiva 2012/29/UE del Parlamento Europeo y
del Consejo de 25 de octubre de 2012 por la que se establecen normas mínimas
sobre los derechos, el apoyo y la protección de las víctimas de delitos, y por la
que se sustituye la Decisión marco 2001/220/JAI del Consejo. Se trata de otro
instrumento legal que viene a reforzar la legislación nacional de todos los países
miembros de la Unión Europea. Dicha propuesta se basa en instrumentos ya
existentes a los que complementa, especialmente en la Directiva 2011/36/UE
del Consejo, relativa a la protección y la lucha contra la trata de seres huma-
nos y a la protección de víctimas, la Directiva del Consejo, relativa a la lucha
contra el abuso sexual, la explotación sexual de menores y pornografía infantil
o la Decisión marco 2001/220/JAI del Consejo, relativa al estatuto de la vícti-
mas en el proceso penal.
Además, la Directiva COM (2011)/275 recoge de manera expresa en su art. 6 el
derecho a la traducción e interpretación, que se detalla en 6 subartículos. A ni-
vel europeo, este mismo artículo, sobre el derecho a la traducción e interpreta-
ción está respaldado por la Directiva 2010/64/UE del Parlamento Europeo y del
EL USO DE CORPUS EN LA FORMACIÓN DE INTÉRPRETES EN LOS SERVICIOS PÚBLICOS… 189

Consejo, de 20 de octubre de 2010, relativa a interpretación y traducción en los


procesos penales.
Las iniciativas a nivel europeo también se reflejan en la ejecución de proyectos
como «Speak Out for Support – SOS-VICS» (JUST/2011/JPEN/2912), coordi-
nado por la Universidad de Vigo y en el que participan universidades de toda
España. Se trata de un proyecto piloto centrado en la formación de intérpretes
cuya especialidad es el trabajo con víctimas extranjeras de violencia de género.
Este proyecto pretende rellenar una laguna en la formación de estos intérpretes
que, exceptuando módulos y clases impartidos en algunos posgrados de traduc-
ción e interpretación en los servicios públicos, no reciben enseñanzas específi-
cas sobre la interpretación en estos contextos, contrastando así con la formación
que sí reciben los agentes (médicos, policías, trabajadores sociales, etc.) que
atienden a mujeres víctimas de violencia de género.
Para llevar a cabo su labor con la mayor eficacia posible, los intérpretes tendrían
que adquirir conocimientos temáticos sobre violencia de género, conocimientos
sobre los procedimientos institucionales y las distintas situaciones comunicati-
vas, conocimientos lingüísticos, culturales y, específicamente, terminológicos, y
habilidades para manejar el estrés, tanto propio como del resto de los participan-
tes en la interacción.

4. Estudios de interpretación basados en corpus


Desde que la académica Mona Baker asentara las bases de los llamados Estu-
dios Traductológicos de Corpus (Corpus-Based Translation Studies), han sido
muchas las propuestas que han apostado por una metodología de corpus para
estudiar las características específicas de diversos géneros (Corpas y Seghiri
2009; Straniero Sergio 2012) así como las aplicaciones pedagógicas de los
mismos (Calzada Pérez 2010; Monzó Nebot 2008; Sánchez Ramos y Vigier
Moreno: en prensa; Zanettin 2003). Estos trabajos se presentan como una fuente
de información indispensable para todos aquellos estudios que precisen un aná-
lisis exhaustivo de las características de los distintos géneros, las características,
similitudes y diferencias de las traducciones y la enseñanza de la traducción a
través de una aplicación eminentemente práctica. Según Calzada Pérez (2007)
los Estudios Traductológicos de Corpus destacan:
por su flexibilidad y capacidad de adaptación, los CTS aúnan metodologías des-
criptivas y lingüísticas; análisis del proceso y producto; exégesis de detalles o
amplios patrones de comportamiento de interés tanto por cuestiones formales
como por facetas culturales, ideológicas e incluso literarias. (Calzada Pérez
2007:216)
Sí es importante resaltar el creciente interés de la metodología de corpus en los
estudios de traducción, donde diversos estudiosos han investigado la naturaleza

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


190 MARÍA DEL MAR SÁNCHEZ Y RAQUEL LÁZARO

de los textos traducidos (Baker 1996, 2004; Kenny 2001; Laviosa 2002). Sin
embargo, y aunque Shlesinger (1998) inicia el camino de los estudios de inter-
pretación basados en corpus, la popularidad no ha sido la misma. Como bien
señalan distintos autores (Luzón et al. 2008; Straniero Sergio y Falbo 2012), son
las características propias de la interpretación las que han impedido, de alguna
forma, que los estudios de interpretación basados en corpus adquirieran el lugar
que, sin duda, les corresponde dentro de la disciplina de los Estudios Traducto-
lógicos de Corpus. Sin embargo, y a pesar de estas dificultades, el uso de corpus
en los estudios de interpretación se está extendiendo y proliferan investigacio-
nes que permiten una aproximación mucho más rápida y precisa en el estudio de
ejemplos reales del lenguaje oral (Schmidt y Wörner 2012).
El uso de corpus en el área de la interpretación ofrece numerosas ventajas. Así,
es posible obtener información gramatical, modelos de discurso, densidad léxi-
ca, etc. Tal y como señala Shlesinger (1998), los corpus comparables y parale-
los pueden ofrecer un campo de estudio en la interpretación. Otros estudios,
como el elaborado por Ryu et al. (2003), centran su investigación en el uso de
corpus y la interpretación simultánea y la compilación de un corpus bilingüe
para fines lingüísticos y contrastivos. También en el campo de la interpretación
simultánea encontramos trabajos que exploran los factores que tienen cabida en
la interpretación, como pueden ser los intervalos de tiempo entre los hablantes
implicados en la interpretación (Takagi et al 2002). Se realiza un estudio esta-
dístico exhaustivo de dichos intervalos, donde se recoge el número de palabras
en cada caso, el número de unidades de pronunciación o etiquetas del discurso.
Por último, podemos destacar la investigación de Van Besien (1999), que utiliza
la lingüística de corpus para indagar en las técnicas de interpretación, entre ellas
la anticipación. Como puede observarse, son muy variadas las aplicaciones que
el uso de corpus puede tener en los estudios de interpretación.
En nuestro caso en concreto, y como hemos mencionado en párrafos anteriores,
la formación de intérpretes en los casos de violencia de género es muy escasa.
En la línea de lo ya apuntado por Inglis (1984, citado en Iliescu 2001), entre las
distintas destrezas y conocimientos que los intérpretes en violencia de género
deben poseer, debemos destacar las siguientes:
• Conocimientos temáticos sobre violencia de género
• Conocimientos sobre procedimientos y situaciones comunicativas
• Conocimiento lingüístico y cultural
• Conocimiento terminológico
• Habilidades para manejar el estrés
Y de forma más específica, los intérpretes en los casos de violencia de género
necesitan una especialización más concreta en cuanto a mediación lingüísica
EL USO DE CORPUS EN LA FORMACIÓN DE INTÉRPRETES EN LOS SERVICIOS PÚBLICOS… 191

con víctimas extranjeras además de un conocimiento de la lengua, protocolos de


actuación y cuestiones relativas a las emociones. A la vista de las necesidades
formativas en el caso de los intérpretes en violencia de género, nuestra propues-
ta pretende contribuir a su formación a través de una metodología de corpus.
Pasamos a describir las distintas fases metodológicas de nuestro proyecto.

1) Primera fase
La fase inicial de nuestro proyecto, y fase en la que nos encontramos, supone la
creación y recopilación de un archivo electrónico (Bowker 2003) compuesto por
diversos corpus:
• Videos simulados (conversaciones monolingües, conversaciones inter-
pretadas)
• Conversaciones reales (conversaciones monolingües, conversaciones in-
terpretadas)
• Interpretaciones
Hay que subrayar tres aspectos importantes que pueden dificultar esta primera
fase: dificultades técnicas, dificultades en cuanto al material y los problemas de
permiso y propiedad. De un lado, la primera dificultad la encontramos en la
parte técnica, relacionada con conseguir el formato adecuado del corpus para su
posterior análisis y la limpieza de los archivos. Sin embargo, los problemas más
relevantes los encontramos en la obtención de material y la propiedad de los
mismos.
Material
• Videos simulados procedentes de guías de talleres en formación en vio-
lencia de género (del Instituto Asturiano de la Mujer 2), de recursos di-
dácticos de interpretación social 3 y de material digital del grupo de in-
vestigación FITISPos (Universidad de Alcalá).
• Conversaciones reales y conversaciones interpretadas. Para ello se
cuenta con la ayuda de diversas organizaciones y asociaciones: Federa-
ción de Asociaciones de Mujeres Separadas y Divorciadas, Asociación
de Mujeres Separadas y Divorciadas, Asociación de Mujeres Unidas
contra el Maltrato, Movimiento por la Paz, Puntos Municipales del Ob-
servatorio Regional de la Violencia de Género (Coslada, Alcalá de He-
nares, Mejorada del Campo, Tres Cantos, Getafe), Juzgados especiali-
zados en Alcalá de Henares, Guadalajara y Madrid, Centros de la Mujer
del Instituto de la Mujer de Castilla-La Mancha (Sigüenza y Azuqueca
de Henares), Dirección General de la Mujer de la Comunidad de Ma-
drid, CIMASCAM (Centro de Atención Integral a Mujeres Víctimas de
Violencia Sexual), Servicio de Atención a la Familia de la Dirección

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


192 MARÍA DEL MAR SÁNCHEZ Y RAQUEL LÁZARO

General de la Policía, Casas de Acogida en Azuqueca de Henares, Vi-


llalba y Alcorcón, Comisión de la Violencia del Hospital Fundación de
Alcorcón.

2) Segunda fase
La segunda fase constituye la parte más técnica del proyecto. Así, se procederá
al tratamiento de los distintos corpus y su conversión a formato .txt para su pos-
terior procesamiento con herramientas informáticas. Para ello, y para sacar el
máximo partido al material, se hace necesario el etiquetado, preferentemente
automático, con la finalidad de incluir información metatextual (agentes del
discurso, nacionalidad, sexo, lengua, etc.). De particular importancia, y como se
ha hecho en otros proyectos como el coordinado por la profesora Calzada Pérez
(Universitat Jaume I, Castellón) ECPC: European Parliamentary Comparable
and Parallel Corpora, se recurrirá a la codificación de la información en etique-
tas (XML) así como la creación de una definición de tipo de documento (DTD),
acción posible con potentes editores de texto como Jedit.
Este etiquetado y alineamiento posterior del corpus es particularmente útil en la
explotación de corpus paralelos, puesto que facilita la recuperación de informa-
ción, patrones lingüísticos y contrastivos que puede ser realmente útil en el uso
de corpus para fines pedagógicos.

3) Tercera fase
Esta última fase se corresponderá con el análisis de los corpus con el fin de
obtener patrones lingüísticos que nos sirvan para caracterizar el género específi-
co sobre el discurso de violencia de género (agente-víctima). Este análisis se
realizará con herramientas de concordancias (Wordsmith, AntConc). El men-
cionado análisis permitirá establecer un estudio contrastivo de las conversacio-
nes originales y la interpretación (tendencias y normas), así como las diferencias
y similitudes entre las interpretaciones y la «norma» (protocolos de actuación).

5. Conclusión
La necesidad de formación de intérpretes es patente en los casos de violencia de
género. Los corpus son fuente indiscutible en la didáctica de la traducción, y es
por ello por lo que nuestra propuesta se centra en la formación de intérpretes en
los casos de violencia de género a través de una metodología de corpus. Somos
conscientes que estamos ante un proyecto muy ambicioso, y que cuenta con
dificultades importantes e íntimamente relacionadas con la naturaliza del len-
guaje oral, como es la obtención de material y los permisos y propiedades de los
distintos corpus. Con todo, es nuestro objetivo contribuir a la formación de in-
EL USO DE CORPUS EN LA FORMACIÓN DE INTÉRPRETES EN LOS SERVICIOS PÚBLICOS… 193

térpretes en el campo de la violencia de género, así como asentar las bases para
una didáctica de la interpretación basada en corpus.

6. Bibliografía
Akira Takagi et al. 2002. A Corpus-based Analysis of Simultaneous Interpretation. @
Proceedings of International Joint Conference of the 5th Symposium on Natu-
ral Language Processing (SNLP-2002), pp.167-174. Disponible en
<http://slp.itc.nagoya-u.ac.jp/web/papers/2002/snlp2002_takagi.pdf>. Con-
sultado el 15/05/2014.
Baker, Mona. 1996. Corpus-based Translation-Studies: The Challenges that Lie Ahead.
@ H. Somers, ed. Terminology, LSP, and Translation: Studies in Language
Engineering in Honor of Juan C. Sager. Amsterdam/Philadelphia: John Ben-
jamins. ISBN 9789027216199, pp. 175-186.
Baker, Mona. 2004. A Corpus-based View of Similarity and Difference in Translation.
@ International Journal of Corpus Linguistics 9/2: 167-193.
Bowker, Lynne. 2003. Corpus-based Applications for Translator Training: Exploring
possibilities. @ S. Granger, J. Lerot y S. Petch-Tyson. Corpus-based Ap-
proaches to Contrastive Linguistics and Translation Studies. Amster-
dam/Philadelphia: Rodopi. ISBN 9789042010468, pp. 169-183.
Calzada Pérez, María. 2007. El espejo traductológico. Teorías y didácticas para la
formación del traductor. Madrid: Editorial Octaedro. ISBN 9788480638999.
Calzada Pérez, Maria. 2010. Learning from Obama and Clinton: language classroom
corpora relating to individuals. @ M. Moreno Jaén, F. Serrano Valverde y M.
Calzada Pérez, eds. Exploring New Paths in Language Pedagogy. Londres:
Equinox. ISBN 9781845536954, pp. 191-210.
Centro de Investigaciones Sociológicas. 2011. Macroencuesta sobre Violencia de Géne-
ro.
Corpas Pastor, Gloria y Miriam Seghiri. 2009. Virtual corpora as documentation Re-
sources: Translating travel insurance documents (English–Spanish). @ A.
Beeby, P. Rodríguez Inés y P. Sánchez-Gijón, eds. Corpus Use and Translat-
ing. Corpus Use for Learning to Translate and Learning Corpus Use to Trans-
late. Ámsterdam: John Benjamins. ISBN 9789027291066, pp. 75-107.
Iliescu Gheorghiu, Catalina. 2001. Introducción a la Interpretación: la Modalidad Con-
secutiva. Alicante: Universidad de Alicante. ISBN 9781441647962.
Inglis, Margaret. 1984. A Preparatory Course in Bilateral Interpreting. Edinburgo:
University of Edinburgh, Department of Linguistics.
Instituto Asturiano de la Mujer. Disponible en
<http://institutoasturianodelamujer.com/iam/category/biblioteca-digital/>. Con-
sultado el 15/05/2014.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


194 MARÍA DEL MAR SÁNCHEZ Y RAQUEL LÁZARO

Instituto Europeo de Igualdad de Género. 2012. Revisión de la aplicación de la Plata-


forma de Acción de Beijing en los Estados miembros de la Unión Europea so-
bre violencia contra la mujer y apoyo a las víctimas.
Kenny, Dorothy. 2001. Lexis and Creativity in Translation. A Corpus-based Study.
Manchester: St. Jerome. ISBN 9781900650380.
Laviosa, Sara. 2002. Corpus-based Translation Studies. Theory, Findings, Applications.
Ámsterdam: Rodopi. ISBN 9789042014879.
Lázaro Gutiérrez, Raquel. 2014. Use and Abuse of an Interpreter. @ C. Valero-Garcés,
eds. (RE)Considerando ética e ideología en situaciones de conflicto. Alcalá de
Henares: Servicio de Publicaciones de la Universidad de Alcalá. ISBN
9788416133086.
Linkinterpreting, Universidad de Vigo. Disponible en
<http://linkterpreting.uvigo.es/interpretacion-social/material-didactico/>. Con-
sultado el 15/05/2014.
Luzón, María José, Mari Carmen Campoy, María del Mar Sánchez Ramos y Pilar Sala-
zar. 2008. Spoken Corpora: New Perspectives in Oral Language Use and
Teaching. @ M. C. Campoy y M. J. Luzón, eds. Spoken Corpora in Applied
Linguistics. Bern: Peter Lang. ISBN 9783039112753, pp. 3-26.
Monzó Nebot, Esther. 2008. Corpus-based Activities in Legal Translator Training. @
The Interpreter and Translator Trainer 2/ 2: 221-252.
Phelan, Mary. 2001. The Interpreter’s Resource. Manchester: Multilingual Matters.
ISBN 9781853597091.
Ryu, Koichiro et al. 2003. Bilingual Speech Dialogue Corpus for Simultaneous Ma-
chine Interpretation Research. @ Proceedings of the 6th Oriental COCOSDA
workshop in Singapore on Oct 1-3 2003, pp. 164-168. Disponible en
<http://ir2.nul.nagoya-u.ac.jp/jspui/handle/2237/15076>. Consultado el
15/05/2014.
Sánchez Ramos, María del Mar y Franciso Javier Vigier Moreno. En prensa. Using
corpus management tools in public service translator training: an example of
their application in the translation of judgments. @ A. Pareja-Lora, C. Calle y
P. Rodríguez Arancón, Technological Innovation for Specialized Linguistics
Domains. Oxford: Oxford University Press.
Schmidt, Thomas y Kai Wörner. 2012. Multilingual Corpora and Multilingual Corpus
Analysis. Ámsterdam: John Benjamins Publishing. ISBN 9789027273444.
Shlesinger, Miriam. 1998. Corpus-based Interpreting Studies as an offshoot of corpus-
based Translation Studies. @ Meta 43/4: 486-493.
Straniero Sergio, Fabio. 2012. Using corpus evidence to discover style in interpreters’
performance. @ F. Straniero y C. Falbo, eds. Breaking Ground in Corpus-
based Interpreting Studies. Bern: Peter Lang. ISBN 9783035103779.
EL USO DE CORPUS EN LA FORMACIÓN DE INTÉRPRETES EN LOS SERVICIOS PÚBLICOS… 195

Valero Garcés, Carmen. 2006/2008. Formas de Mediación Intercultural e Interpreta-


ción en los Servicios Públicos. Conceptos, Datos, Situaciones y Práctica. Gra-
nada: Comares. ISBN 9788498360202.
Van Besien, Fred. 1999. Anticipation in simultaneous interpretation. @ Meta, 44/2:
250-259.
Violencia machista, una lacra social que no cesa. Disponible en
<http://www.rtve.es/noticias/20140323/violencia-machista-lacra-social-
cesa/901482.shtml>. Consulado el 10/05/2014.
Wadensjö, Cecilia. 1998. Interpreting as Interaction. Londres y Nueva York: Longman.
ISBN 9780582289116.
Zanettin, Federico, Silvia Bernardini y Dominic Stewart, eds. 2003. Corpora in Trans-
lator Education. Manchester: St. Jerome. ISBN 9781900650601.

1
http://www.rtve.es/noticias/20140323/violencia-machista-lacra-social-cesa/901482.shtml
2
http://institutoasturianodelamujer.com/iam/category/biblioteca-digital/
3
http://linkterpreting.uvigo.es/interpretacion-social/material-didactico/

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


Aplicabilidad del uso de corpus a la docencia en in-
terpretación. La herramienta Universaldoctor Pro-
ject en la formación del intérprete en el ámbito sa-
nitario
[Applicability of Corpora to Academic Training in
Interpreting. The use of Universaldoctor Project in
the Training of Interpreters in Healthcare Settings]
LETICIA SANTAMARÍA CIORDIA Y ROSA FERNÁNDEZ MUÑIZ
Universidad de Valladolid, Facultad de Traducción e Interpretación
leticia.santamaria@lesp.uva.es
Resumen
Las nuevas tecnologías han dado un nuevo impulso a la lingüística de corpus, sistemati-
zando el uso de los mismos en casi todas las ramas del conocimiento.
No obstante, la revisión del estado de la cuestión en materia de Estudios de Interpreta-
ción basados en corpus pone de manifiesto la escasez de estudios empíricos de interpre-
tación en el ámbito social o comunitario, fruto, entre otros motivos, de la tardía incorpo-
ración de esta disciplina al mundo académico, de la dificultad de recopilación de corpus
de datos auténticos, y del escaso reconocimiento de la profesión, eclipsada desde sus
orígenes por el prestigio de la interpretación en organismos internacionales.
Este artículo reflexiona sobre la aplicabilidad del uso de corpus a la docencia de la in-
terpretación comunitaria a través del análisis de la herramienta UniversalDoctor Pro-
ject, un software multilingüe que busca facilitar la comunicación en el entorno médico-
sanitario a través de un corpus compuesto por frases, preguntas y respuestas traducidas a
varios idiomas.
Abstract
New technologies have boosted Corpus Linguistics and have systematized the use of
corpora in every field of knowledge.
Nevertheless, such improvement has not affected all the disciplines in the same extent,
as shows the still poor development of Corpus-based Interpreting Studies, especially in
the field of Community Interpreting. This lack of empirical studies could be explained
by the characteristics of the discipline itself, which hamper the compilation of real data,
its late incorporation to the academic world, as well as the limited recognition of the
profession, overshadowed, from the very beginning, by conference interpreting in inter-
national organizations.
This paper discusses the applicability of Corpus-based Interpreting Studies to the aca-
demic training of community interpreters by analysing the program UniversalDoctor
Project, a multilingual software, specialised in the healthcare field, which proposes a
Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
198 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

varied corpus of terms, sentences, explanations, questions and answers translated into
several languages.
Palabras clave
Interpretación en el ámbito social, estudios de interpretación basados en corpus, softwa-
re multilingüe, UniversalDoctor Project
Keywords
Community interpreting, academic training, Corpus-based Interpreting Studies, multi-
lingual software, UniversalDoctor Project

1. El corpus como herramienta para el estudio sistematizado de


los usos lingüísticos
La necesidad de estudiar la lengua a través de ejemplos reales de uso ha sido
uno de los principios básicos de la lingüística de corpus desde sus inicios. Aho-
ra bien, el concepto de corpus ha variado sustancialmente a lo largo del tiempo,
y su desarrollo ha estado intrínsecamente ligado, en los últimos años, al avance
tecnológico. La popularización de las nuevas tecnologías en general y del uso
de ordenadores en particular ha permitido divulgar, almacenar, tener acceso y
gestionar grandes cantidades de texto, paliando el problema del que adolecían
los corpus en las primeras etapas de la lingüística de corpus, a saber, su reduci-
do tamaño y un procesamiento de datos, costoso, lento y propenso al error.
Los actuales corpus electrónicos aportan rapidez, precisión y consistencia en el
procesamiento de los datos a un bajo coste (Villayandre 2010: 319). En esta
misma línea se expresa Sinclair (1991: 4), quien apunta que «the ability to ex-
amine large text corpora in a systematic manner allows access to a quality of
evidence that has not been available before». 1
La revolución tecnológica ha favorecido la inmediata disponibilidad de recursos
al alcance no solo del lingüista sino del propio profesional de la traducción o de
la interpretación. Además, poder contar con un volumen representativo de tex-
tos reales en los que basar sus observaciones lingüísticas otorga solidez a los
argumentos del investigador, facilita la validación de sus hipótesis y la aplicabi-
lidad de sus conclusiones.
La aplicación de las nuevas tecnologías al uso de corpus ha remplazado el tradi-
cional concepto de lingüística de corpus, previo a la era digital, por el de «lin-
güística de corpus computacional» - computer corpus linguistic, como lo deno-
mina Leech (1992: 106).
Partiendo de este enfoque actualizado, Rodríguez-Inés (2009) define corpus
como «un conjunto de textos en formato electrónico reunidos bajo unos criterios
determinados con el objetivo de representar una lengua o variedad de lengua».
Además, la autora hace un apunte interesante, señalando que la lingüística de
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 199

corpus parte de una perspectiva de análisis del lenguaje que entiende la lengua
como un fenómeno «observable, mesurable y, hasta cierto punto, predecible»
(Rodríguez-Inés 2009).
La aportación de esta definición es que admite que la lengua y sus usos puedan
tener un carácter sistematizable a partir de estudios empíricos y metodológicos.
No obstante, esta opinión no es compartida por todos los lingüistas. El enfoque
racionalista de Chomsky (1957), desde un punto de vista teórico, o de Aber-
crombie (1965), desde un punto de vista práctico, rechazan esta idea y critican
la falta de rigor e imparcialidad de los corpus como herramienta de análisis,
cuyo reducido tamaño, por la falta de recursos técnicos en las primeras etapas
de la disciplina, según estos autores, se traducía en corpus parciales en cuanto al
reflejo de las variables lingüísticas.

1. 1. La representatividad como criterio básico a la hora de determinar la


utilidad de un corpus
La literatura sobre lingüística de corpus pone en evidencia la falta de consenso
entre autores sobre la cantidad de textos que debe contener o los criterios que
determinan que un corpus pueda considerarse representativo. Más allá del crite-
rio puramente cuantitativo, Biber et al. (1998: 246) destacan el criterio cualita-
tivo como parámetro determinante de la representatividad, señalando que un
corpus lingüístico, más allá de limitarse a un conjunto de textos debe, sobre
todo, ser capaz de representar una lengua o parte de ella.
No cabe duda que la facilidad de acceso a materiales del campo de estudio será
lo que acabe determinando el tamaño final del corpus y, por ende, su representa-
tividad. Al inicio de este artículo ya anticipábamos la dificultad de recopilación
de material al que se ve enfrentado cualquier estudio de interpretación en el
ámbito social o comunitario, por las restrictivas políticas de protección de datos
que, por lo general, imperan en los contextos en los que esta se lleva a cabo.
McEnery y Wilson (en Villayandre 2010: 322-324) realizan un compendio de
los criterios que, en su opinión, ha de cumplir un corpus para poder ser conside-
rado como tal. Los autores hacen alusión a una serie de características como son
el formato electrónico de los textos, que permite automatizar tareas como la
búsqueda, recuperación y clasificación de información; la autenticidad de los
datos, que deben ser muestras reales de uso de la lengua objeto de estudio; los
criterios de selección, lingüísticos y/o extralingüísticos, que se elegirán en fun-
ción de la finalidad concreta del corpus; y el tamaño, por lo general finito y
fijado de antemano, si bien, por encima del tamaño, lo que prima es la adecua-
ción del corpus al fin con el que fue constituido (en Villayandre 2010: 324).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


200 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

Además de estos criterios, los autores inciden en la representatividad como as-


pecto fundamental para garantizar la utilidad de un corpus y que este pueda ser
considerado como tal (en Villayandre 2010: 323). En este sentido, la selección
de los textos debe responder a parámetros estadísticos que garanticen que estos
constituyen una muestra representativa de la variedad de lengua objeto de estu-
dio. Cuando la finalidad es la lengua en su conjunto, y ante la imposibilidad de
reunir en un único corpus todas las muestras, la solución pasa por tomar una
muestra más pequeña que refleje dicha lengua a pequeña escala.
La naturaleza no finita de las lenguas justifica los argumentos de los detractores
de la disciplina en sus primeras etapas, como Chomsky (1957), que reprochaba
la parcialidad de los corpus por su carácter incompleto, al no contener todas las
oraciones de una lengua, y sesgado, ya que la inclusión de una palabra o ele-
mento lingüístico vendrá determinada por su frecuencia de uso. Precisamente
para subsanar este problema se recurre a la selección, según criterios estadísti-
cos, de textos de diversos géneros, tipologías, temas, medios de publicación,
etc. (Villayandre 2010: 323).

2. La lingüística de corpus aplicada al campo de la interpreta-


ción
La profesión de intérprete evidencia como pocas la importancia de una correcta
documentación con carácter previo al desempeño de su trabajo. El intérprete
debe parecer docto en todas las ramas del conocimiento en las que interviene,
sin realmente serlo. En este sentido, la documentación es esencial para asegurar
el rigor terminológico y la coherencia de su discurso y, por ende, la sensación
de fiabilidad en torno a la figura del intérprete.
Por ello, es habitual instar a los organizadores de la reunión o el evento a que
faciliten por adelantado la documentación necesaria para el correcto desarrollo
de la interpretación: el programa completo o el orden del día, biografías de los
oradores u organigrama de la empresa que indique los puestos de los intervi-
nientes, los soportes de presentación de estos o los hilos conductores de las dife-
rentes intervenciones. También son de gran utilidad los glosarios de siglas y
abreviaturas utilizadas. En cualquier caso, la calidad de la prestación final estará
supeditada, en gran medida, a la preparación previa y las fuentes de documenta-
ción suministradas 2.
La propia Asociación Internacional de Intérpretes de Conferencia (AIIC) en
España, ESPaiic, única asociación profesional de intérpretes que se ha ocupado
de recoger en un código deontológico las condiciones laborales exigibles y velar
por su cumplimiento, insiste en este aspecto: «Para la calidad de la interpreta-
ción, es sumamente importante la colaboración de los organizadores del acto,
que pueden facilitar a los intérpretes documentación, material de referencia o
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 201

glosarios» (en Gallego y Tolosa 2012: 34). La propia Seleskovitch (1968: 221)
referente ineludible en la reflexión académica sobre interpretación, insistía ya
en este punto hace más de cuatro décadas, afirmando que, para llevar a cabo una
interpretación profesional y de garantías, es altamente aconsejable que el intér-
prete disponga de tiempo suficiente para preparar la conferencia a partir de do-
cumentos de trabajo, textos, discursos, etc. de la misma, en especial cuando
estos están previstos para ser leídos.
Pese a la importancia de la documentación para el ejercicio de la interpretación,
Gallego y Tolosa (2012: 36) señalan que «los traductólogos han relacionado
ambas nociones durante años en el campo de la investigación mayoritariamente
y no tanto en el de la docencia y la profesión de dicha actividad». Además, la
rentabilidad de su uso se ha venido contemplando básicamente para su aprove-
chamiento en el corto plazo, es decir, con una utilidad efímera.
La extensión de la lingüística de corpus a la disciplina de la interpretación ha
contribuido a ampliar el margen de aplicabilidad del uso de corpus como recur-
sos documentales tanto desde una perspectiva profesional como docente, siendo
esta última la que copará nuestra atención en este artículo.
La creciente proliferación de estudios en este campo ha puesto de manifiesto la
utilidad de extrapolar la labor de documentación puntual a la construcción de un
almacén de datos recuperables para futuros encargos. Por ejemplo, el intérprete
puede aprovechar elementos de interpretaciones anteriores para su uso en en-
cuentros similares posteriores; además, por extensión, puede construir corpus
paralelos con una función documental, a partir de la extracción terminológica en
forma de glosarios.
No sólo eso, más allá del aprovechamiento individual, la elaboración de corpus
terminológicos y fraseológicos repercute en el beneficio colectivo de la profe-
sión mediante la difusión del conocimiento. Se asegura, de esta manera, la ho-
mogeneidad terminológica en particular, y el rigor lingüístico en general.
Pese a que la utilidad del manejo de corpus en interpretación es innegable, hay
que lamentar la escasez de estudios rigurosos de interpretación basada en cor-
pus, fundamentalmente por la dificultad derivada de la recogida de material
real, como veremos a continuación.

2.1. Dificultades añadidas para la construcción de corpus en interpreta-


ción
Los estudios lingüísticos basados en corpus de discursos orales distan mucho de
alcanzar el nivel de desarrollo de los estudios que manejan textos escritos, entre
otros motivos, porque las tareas de recopilación y transcripción son mucho ma-
yores en un caso que en otro, como señala Thompson (2005: 254): «The recor-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


202 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

ding and transcription of unscripted speech events is highly labour intensive in


comparison to the work involved in collecting quantities of written text for
analysis». 3
El resultado es una considerable brecha entre ambas disciplinas, traducción e
interpretación, en lo que a estudios basados en corpus se refiere, tanto en térmi-
nos de tamaño y disponibilidad de los corpus, como en términos de volumen de
estudios y aplicaciones pedagógicas (véase, entre otros, Laviosa 2002 y Aston
et al., 2004).
A la dificultad inherente a la propia naturaleza del material, Pöchhacker (en
Bendazzoli y Sandrelli 2009: 2) añade otras circunstancias que entorpecen la
recopilación de material real en cantidades lo suficientemente representativas,
como la reticencia de los interlocutores a ser grabados, por motivos de confi-
dencialidad, y el recelo de los propios intérpretes, que sienten que la investiga-
ción científica supone cuestionar la calidad de su trabajo.
El propio modelo de contrato que la Asociación Internacional de Intérpretes de
Conferencia (AIIC) ha estandarizado para sus miembros estipula que la inter-
pretación debe destinarse exclusivamente para su uso inmediato y directo por
parte de los oyentes presentes en el acto, no pudiéndose llevar a cabo grabacio-
nes sin el consentimiento prioritario del intérprete.
La intrínseca complejidad del proceso de interpretación, por la pluralidad de
instituciones en las que se utiliza y la enorme variedad de especializaciones que
dentro de ella se aglutinan, obliga a tener en cuenta un considerable número de
variables para poder obtener resultados válidos. Shlesinger (1998, en Bendazzo-
li y Sandrelli, 2009: 2), señala las siguientes:
• El contexto situacional de la interpretación (interpretar en una conferen-
cia médica no es comparable a hacerlo en un juzgado), y que determina
tanto el rol de los interlocutores como el del propio intérprete, repercu-
tiendo en la propia interpretación.
• La propia modalidad de interpretación y sus características específicas.
• La variedad de oradores (experiencia a la hora de hablar en público, ha-
bilidades lingüísticas, acento, etc.) y de discursos (temática, extensión,
velocidad, grado de tecnicidad, recurso o no a soporte visual durante la
exposición, etc.).
• El destinatario de la interpretación: en un simposio científico, por ejem-
plo, las expectativas de un público especialista necesariamente diferirán
de las de un público general.
• El perfil del propio intérprete, trazable mediante el análisis de factores
como su nivel de formación, experiencia, lenguas de trabajo, grado de
preparación para la tarea, etc.
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 203

La consideración de todas estas variables será esencial para conseguir compilar


un volumen de datos homogéneos lo suficientemente representativo para cada
contexto de estudio.

2.1.1. Dificultades añadidas para el uso de corpus en interpretación en


el ámbito social
Esta escasez de estudios de interpretación basados en corpus que hemos venido
mencionando es extensible, y aún más flagrante, en el caso específico de la
interpretación en el ámbito social. Los motivos son varios:
En primer lugar, la tardía incorporación de la disciplina al mundo académico.
Muchos sitúan el primer congreso de la organización Critical Link, celebrado en
1995 en Geneva Park (Canadá), como el punto de partida para la consideración
académica de la disciplina, si bien se practica como actividad desde tiempos
inmemoriales.
En segundo lugar, el perfil de los investigadores y profesionales, muchos de
ellos provenientes de disciplinas como las ciencias sociales, el trabajo social o
el derecho, sin ninguna formación lingüística y que tradicionalmente se han
decantado más por los estudios culturales.
Por último, las dificultades para conseguir un corpus de datos auténticos dado el
ámbito de trabajo en el que suele desarrollarse (hospitales, comisarías, juzgado,
oficinas del estado…) y las características de sus participantes (inmigrante ile-
gales, refugiados, niños…) que exigen una escrupulosa política de protección de
datos.

3. La interpretación en el ámbito social. Definición y variables


en cuanto a su denominación
Dado el desconocimiento general de la profesión, derivado sobre todo de su
falta de regulación, conviene empezar definiendo en qué consiste y cuáles son
las particularidades de esta modalidad de interpretación. Abril Martí la define
como sigue:
Aquella que facilita la comunicación entre los servicios públicos nacionales –
policiales, judiciales, médicos, administrativos, sociales, educativos y religiosos-
y aquellos usuarios que no hablan la lengua oficial del país y que habitualmente
pertenecen a minorías lingüísticas y culturales: comunidades indígenas que con-
servan su propia lengua, inmigrantes políticos, sociales o económicos, turistas o
personas sordas (Abril Martí 2006: 5).
Lo primero que llama la atención al analizar este tipo de interpretación es la
falta de consenso en torno a la propia denominación. Son varios los autores que
defienden la pertinencia de hablar de «interpretación comunitaria» (Torres

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


204 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

2003; Hale 2010), derivada de la voz inglesa community interpreting. Los paí-
ses anglófonos, con Australia a la cabeza, fueron los primeros en reconocer este
tipo de interpretación como modalidad profesional y regularizar su ejercicio.
El término, de uso aún bastante restringido en España, subraya el concepto de
comunidad, haciendo referencia «a que el fin último de este tipo de interpreta-
ción es permitir la comunicación entre comunidades de individuos que cohabi-
tan en el mismo espacio pero no comparten la misma lengua» (García Luque
2009: 19).
En efecto, países como Australia, Estados Unidos y Canadá entendieron, desde
un principio, la necesidad de profesionalizar la interpretación en el ámbito so-
cial.
Australia, pionera en formación de intérpretes en los Servicios Públicos, es el
referente de la disciplina. Destaca, además, su esfuerzo por contribuir al recono-
cimiento de la profesión a través de la creación, en 1977, de un sistema nacional
de acreditación de intérpretes, el NAATI (National Accreditation Authority for
Translators and Interpreters).
En el contexto estadounidense, la Massachussets Medical Interpreters Associa-
tion y la California Heathcare Interpreters Association destacan por su labor en
el impulso de la profesionalización de este tipo de interpretación.
Por último, en Canadá, el desarrollo de la profesión surgió a raíz de iniciativas a
nivel provincial, en concreto con la creación de servicios de interpretación en el
ámbito sanitario y legal. En este país, que también cuenta con un sistema de
acreditación de intérpretes, existe además un gran interés investigador y educa-
tivo. En 1995 fueron pioneros en la organización del primer congreso interna-
cional sobre traducción e interpretación en servicios públicos, conocido como
Critical Link, con el objetivo de poner en contacto e intercambiar experiencias
entre los profesionales de la interpretación en el ámbito social o comunitario.
El apelativo más extendido en España es, seguramente, el de «interpretación
social» (Martin 2000; Ruíz Mezcua 2010), si bien creemos que el empleo del
calificativo «social» es desaconsejable, ya que puede provocar confusión sobre
la figura del intérprete y el papel que este debe desempeñar en la mediación. En
efecto, dicha denominación provoca que, con frecuencia, se equipare la figura
del intérprete social (que no debe posicionarse del lado de ninguna de las par-
tes) a la del trabajador social (que sí suele interceder por una de ellas). Esto
puede poner en entredicho el parámetro de la imparcialidad, pilar básico del
código deontológico de la profesión y fundamental para el correcto desempeño
de la labor del intérprete. Por ello, proponemos matizar el adjetivo y hablar de
«intérprete/ interpretación en el ámbito social».
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 205

Otro término que en los último años ha venido ganando adeptos es el de «inter-
pretación en los Servicios Públicos» (Valero 2003; Abril Martí 2006; García
Luque 2009), acuñado así por los contextos en los que este tipo de interpreta-
ción suele llevarse a cabo. Pese a ser uno de los términos de más reciente acu-
ñación, creemos que es acertado por su transparencia, ya que no genera la con-
fusión que sí causaba el anterior en cuanto al rol del intérprete. No obstante, es
restrictivo en cuanto al ámbito de actuación –los servicios públicos-, excluyen-
do a innumerables organismos y entidades privadas con necesidades manifiestas
de interpretación, como es el caso de las ONGs. En este sentido cabe recuperar
la reflexión de Pöchhacker (2002), que apunta que esta actividad no puede limi-
tarse a contextos específicos, lo que hace casi imposible llegar a una definición
exacta, por el elevado número de instituciones y situaciones culturales en las
que puede llevarse a cabo.
Mejnartowicz (2008) habla de la figura del «mediador lingüístico y cultural».
Cabré (1993), por su parte, se refiere a él como «mediador comunicativo» o
«mediador lingüístico», que describe de la siguiente manera:
Las nuevas necesidades comunicativas de la sociedad son la causa de que surjan,
al mismo tiempo, otras necesidades en ámbitos paralelos relacionados con el
lenguaje, como por ejemplo en el mundo socioprofesional. Aparecen así las nue-
vas profesiones centradas en el tratamiento del lenguaje y en la resolución de
nuevos aspectos lingüísticos […]. El experto en servicios lingüísticos, también
llamado mediador lingüístico o mediador comunicativo (o, en términos de Engel
y Pitch, information manager) es una de las nuevas profesiones en proceso de
consolidación social (Cabré 1993:472).
El interés de esta denominación radica sobre todo en que aúna dos conceptos
clave para el desempeño de esta profesión: la labor de mediación lingüística,
por un lado, y el factor cultural, por otro. En efecto, el profundo conocimiento
de las culturas de sus interlocutores es condición imprescindible para el éxito
comunicativo. No puede, por tanto, entenderse la figura del intérprete desvincu-
lada de su rol de mediador cultural.
La finalidad primera y última de la interpretación en general es fomentar la
intercomprensión del conjunto de la sociedad cuando no existe lengua común de
intercambio. En el caso de la interpretación en el ámbito social, debido al perfil
del usuario y a los contextos en los que se produce, dicho intercambio está pro-
fundamente marcado por la idiosincrasia del propio individuo, de modo que su
familiarización y sensibilización con el contexto sociocultural que le rodea pue-
de determinar, en muchos casos, el éxito o el fracaso de la situación comunica-
tiva.
Aplicado al ámbito concreto de la interpretación en el ámbito sanitario, es fun-
damental que el profesional de la salud tenga en consideración, a la hora de
interaccionar con el paciente y su entorno, las convenciones culturales de su

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


206 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

sociedad de procedencia. El intérprete, por su condición de experto en media-


ción intercultural, deberá ejercer de puente entre culturas para asegurar un en-
tendimiento que favorezca un entorno de comprensión de las diferencias y ga-
rantice el manejo de posibles situaciones conflictivas.
La manifiesta falta de consenso que existe en torno a la propia denominación no
es sino un reflejo más del desconocimiento de esta profesión, que dista aún de
ser reconocida como tal por parte de muchos sectores. La falta de regulación por
parte de las instituciones públicas hace que con frecuencia la labor de mediación
lingüística en estos contextos se lleve a cabo por familiares y amigos, y no por
intérpretes profesionales, una dinámica que lleva a Pöchhacker (1999: 135) a
hablar de un nuevo concepto, el de «interpretación natural» (natural interpre-
ting). El autor insiste, además, en que esta dinámica de recurrir a un intérprete
«improvisado» difícilmente podrá revertirse hasta que no se logre una regula-
ción legal e institucional que desemboque en un sistema de acreditación de co-
mo sí existe en nuestro país, por ejemplo, en torno a la figura del intérprete ju-
rado:
Since communication and interpreting needs arise in a broad range of situations
in the personal lives of migrants or deaf persons, it is practically unavoidable that
‘natural interpreting’ by family members or friends will persist at least in a num-
ber of less formal circumstances, thus complicating the emergence of a uniform
perception of the interpreting function on either side of the interaction. Where
economic considerations prevail over (underdefined) legal provisions and inte-
grationist policies, the fuzzy boundary between professional and amateur inter-
preting is likely to shift in favor of the latter (Pöchhacker 1999: 135). 4

4. Presentación y descripción de la herramienta Universal Doc-


tor Project
UniversalDoctor Speaker Profesional forma parte del proyecto UniversalDoctor
Project, ideado por el médico Jordi Serrano Pons y puesto en marcha en 2011.
Este subprograma se concibió en inicio como herramienta de ayuda para el per-
sonal sanitario en su comunicación con pacientes extranjeros. Creemos que su
aprovechamiento puede, no obstante, hacerse extensible al propio intérprete,
que puede encontrar en él una fuente valiosa de consulta gracias a un corpus
compuesto de 1000 preguntas, explicaciones y términos recurrentes en el trato
médico-paciente.
Actualmente existen ocho idiomas disponibles para el perfil del médico, que
son: alemán, catalán, español, francés, inglés, italiano, polaco y portugués; el
perfil del paciente, por su parte, ofrece un total de diez idiomas: alemán, árabe
marroquí, catalán, chino, español, francés, inglés, portugués, rumano y ruso.
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 207

Además del que nos ocupa (UDS Profesional), UniversalDoctor Project cubre
un abanico amplio de contextos situacionales, a través de versiones que se dise-
ñan específicamente en función del destinatario: UDS iPhone, pensado para su
instalación en el teléfono móvil y su uso en desplazamientos y viajes, o la ver-
sión específica para tableta electrónica (UDS iPad).
Lógicamente, el perfil de paciente potencial que puede servirse de la versión
para dispositivos móviles es el de un viajero o turista que se desplaza al extran-
jero y adquiere esta herramienta como parte de la preparación de su estancia y
en previsión de eventuales contratiempos. Se trata, por tanto, de un individuo
con un cierto nivel adquisitivo, muy alejado del perfil del inmigrante que suele
requerir la asistencia de un intérprete y que por lo general no dispone de medios
para adquirir una herramienta de este tipo y ni mucho menos soporte tecnológi-
co para usarla.
Dentro de UniversalDoctor Project, y paralelamente a UniversalDoctor Speaker
para el binomio médico-paciente, encontramos otros subprogramas específicos
destinados a otros cuerpos sanitarios, como UniversalWomen Speaker o Uni-
versalNurse Speaker, especializados en el campo de la obstetricia y de la enfer-
mería, respectivamente.
El pleno aprovechamiento del programa, más allá de la versión gratuita de
prueba, pasa por la adquisición de una licencia de uso cuyo coste varía en fun-
ción del número de idiomas y la prorrogación del contrato de la licencia por
uno, dos o cinco años.
A la aplicación se accede a través de la página web www.universaldoctor.com.
Una vez seleccionados los idiomas de los dos perfiles, médico y paciente, apa-
rece una pantalla de menú general (Ilustración 1) con un listado de secciones
que permiten al usuario concretar la consulta:

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


208 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

Ilustración 1. Pantalla de menú general


Tal y como se observa en la imagen 1, la pantalla se divide en dos partes dife-
renciadas. En la parte izquierda figuran las distintas casuísticas, ordenadas se-
gún se suceden habitualmente en la atención al paciente cuando este acude al
centro sanitario (admisión y datos, antecedentes, síntomas, pruebas, diagnóstico
y tratamiento).
De este modo, se facilita la búsqueda mediante la anticipación de los eventuales
problemas que puedan surgir, y presentándolos en el orden en el que se prevé
que acontezcan.
En la columna de la derecha, por su parte, figura un listado de contenidos recu-
rrentes que pueden serle útiles al médico a la hora de determinar el diagnóstico
del paciente. El menú es accesible en todo momento a lo largo de la navegación
por el programa, con la consiguiente comodidad de manejo para el usuario, que
puede desplazarse por las distintas pantallas conservando siempre la opción de
recuperar ese listado a través de un menú desplegable situado en la parte supe-
rior izquierda. Veamos la recopilación de estos contenidos recurrentes:
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 209

¿Ha entendido…? ¿Tiempo? ¿Cantidad? ¿Dónde?


Evolución Medicación Alergia Recetas
Dolor Fiebre Tos Documentos

Episodios anterio- Características del


Vacunación
res síntoma

Tabla 1. Contenidos de referencia en el trato con el paciente


Accedemos, a título ilustrativo, a la primera sección, Admisión y Datos Admi-
nistrativos (Ilustración 2). Este apartado es de especial interés, ya que, si bien la
asistencia del intérprete por regla general se solicita para el momento de la con-
sulta, es indudable que la barrera lingüística, si la hubiese, se producirá desde el
momento mismo en que el paciente llega al centro de salud.

Ilustración 2. Pantalla de Admisión y datos administrativos


En la parte izquierda, el programa reproduce una serie de apartados que se co-
rresponden con los diferentes momentos del proceso de admisión del paciente
(datos, citaciones, recetas, informes, tarjetas sanitarias).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


210 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

Como ocurriese en la pantalla inicial, para cada uno de estos apartados la he-
rramienta sugiere una serie de preguntas útiles relacionadas. Se añade, además,
su correspondiente traducción al idioma seleccionado y la posibilidad de repro-
ducirla por audio, algo esencial para idiomas que no compartan el mismo alfa-
beto (ruso, chino, árabe, etc.).
Siguiendo esta misma dinámica, el programa ofrece al usuario un soporte termi-
nológico a lo largo de todas las fases del proceso, desde la llegada del paciente
al centro sanitario hasta su salida: solicitud de antecedentes, descripción de sín-
tomas (Ilustración 3), exploración, diagnóstico (Ilustración 4, pág. 211) y trata-
miento.
Pese a sus lógicas limitaciones, la utilidad del corpus terminológico y fraseoló-
gico para todos los agentes implicados en la interacción resulta indudable. Para
el intérprete, como referencia de apoyo y base para la elaboración de un glosario
más amplio; para el personal médico, en calidad de herramienta de apoyo lin-
güístico en el trato al paciente; por último, para docentes y discentes, como
herramienta de aprendizaje en la simulación de contextos de interpretación (jue-
go de roles) y, como ocurriese con el intérprete, como base para la elaboración
en el aula de glosarios terminológicos de mayor envergadura.

Ilustración 3. Pantalla descripción de síntomas


APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 211

Ilustración 4. Pantalla de Diagnóstico

5. La consideración de las diferencias culturales como sugeren-


cia para optimizar la herramienta
No sin antes reiterar su interés, entendemos que la principal carencia del pro-
grama es que descuida la importancia del componente cultural en este tipo de
interacciones, y que puede llegar a condicionar sobremanera el éxito de la me-
diación.
En este aspecto el software adolece de una sección específica centrada en la
idiosincrasia sociocultural del individuo y en la que se prevean posibles conflic-
tos derivados de las diferencias entre las distintas sociedades, las convicciones
religiosas o sus costumbres y tradiciones y de cómo influyen en la conducta de
los individuos. Siguiendo la misma dinámica de manejo del programa original,
nuestra sugerencia de optimización pasaría por añadir, en el menú principal, una
nueva sección de condicionantes culturales que incluiría apartados como los
siguientes:

a. Historial cultural del paciente.


La inserción de un apartado de esta naturaleza se justifica por la dificultad que a
veces se plantea para crear el historial médico del paciente, especialmente en
culturas herméticas con un índice bajo de asimilación cultural, lo que se traduce
en una escasa asistencia general a revisiones médicas y un uso muy restringido

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


212 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

de los servicios sanitarios del país de destino. Sánchez (2009: 96) pone el ejem-
plo de la cultura china, y recoge algunas de sus causas:
• Falta de tiempo derivada de la gran carga laboral de la población china.
• Distintas consideraciones culturales sobre el concepto de sa-
lud/enfermedad.
• Ciertas situaciones (como las relacionadas con la salud sexual) les resul-
tan comprometidas y chocan con los principios de búsqueda de la ar-
monía propia de la cultura china.
• Desconocimiento del funcionamiento de los servicios sanitarios y dife-
rencias de los mismos con respecto a los de la cultura de referencia
(elevado coste de la atención sanitaria en China).
La consideración de estos y otros factores permitiría al médico entender el com-
portamiento tanto del individuo como de su entorno, y adelantarse a las reaccio-
nes previsibles sobrevenidas de dichas diferencias culturales. La sensibilización
y comprensión de las divergencias en los patrones de conducta repercutirá en
una mejor atención sanitaria y, en última instancia, en la salud del paciente.
Extendiendo su uso al campo del aprendizaje y de la formación de intérpretes,
apartados como este contribuyen a inculcar en el estudiante la importancia de
analizar con detenimiento el contexto cultural que envuelve cada ejercicio de
interpretación.

b. Grado de cooperación del paciente.


La pertinencia de incluir este apartado se justifica por las diferencias en torno al
tipo y a la cantidad de información que el paciente extranjero, en ocasiones, está
dispuesto a compartir con el personal sanitario. Su importancia es innegable, ya
que la dificultad para obtener información del paciente puede entorpecer el pro-
ceso de diagnóstico.
Contrariamente a lo que cabría pensar, con frecuencia la aparente falta de
cooperación del individuo no es consecuencia de un recelo consciente a com-
partir información, sino que suele ser fruto de las convenciones culturales que
imperan en su sociedad y que determinan, por ejemplo, qué tipo de información
es apropiado compartir en una interacción comunicativa con desconocidos, qué
grado de confianza es admisible en situaciones jerárquicas asimétricas o cuánta
información puede transmitirse sin caer en la descortesía.
Estas diferencias en el trato se hacen patentes cuando intervienen culturas en las
que la relación médico-paciente es mucho más asimétrica que, por ejemplo, en
España. Pasar por alto los distintos valores y manifestaciones de la cortesía en
una u otra cultura puede, incluso, poner en riesgo el éxito de la comunicación,
como señala Santamaría:
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 213

Entender los patrones comunicativos y las diferencias entre lo que una cultura
considera cortés y descortés evitará que se produzcan conflictos de tipo etnolin-
güístico que puedan comprometer el éxito del intercambio comunicativo (Santa-
maría, 2012: 292).
Como posibles motivos de conflicto, Sánchez (2009), cita, por ejemplo, «los
modos de expresar la cortesía, el lenguaje no verbal, la distribución de los tur-
nos de palabra y la disposición de los interlocutores», entre otros.
Conocer estas diferencias ayudará al médico a entender la actitud del paciente y
a adecuar el enfoque de sus preguntas de manera que el intercambio sea lo más
cooperativo y fructífero posible. Como señala Hale (2010): «que los cuidados
sanitarios sean satisfactorios depende en gran medida del éxito de la comunica-
ción entre el personal sanitario y el paciente, de modo que la lengua tiene un
papel protagonista».

c. Posible entorpecimiento del diagnóstico.


Determinados hábitos culturales pueden condicionar o entorpecer el diagnóstico
y el tratamiento, por ejemplo:
• La posible negativa de una paciente musulmana a desvestirse delante de
un médico varón.
• Pacientes con restricciones alimenticias derivadas de su opción religiosa
(un hindú no comer ternera, un musulmán ayunar en época de Rama-
dán).
• Individuos de culturas que rechazan o son reticentes a la medicina occi-
dental o a la realización de pruebas diagnósticas, por el arraigo de la
medicina tradicional en sus sociedades. Esto es habitual en pacientes
chinos, que con frecuencia rehúsan someterse a determinadas pruebas
por considerarlas invasivas, como ocurre con los análisis de sangre.
También suelen ser reticentes a comer la comida del hospital y al ayuno
con carácter previo a pruebas de diagnóstico, ya que los usos alimenti-
cios de la medicina occidental chocan con los principios de la medicina
tradicional china, para la que los alimentos se consideran parte integran-
te e indispensable del tratamiento.
• Miembros de estructuras familiares muy rígidas, a menudo con una je-
rarquía patriarcal, lo que implica la intervención del conjunto familiar y
en especial del cabeza de familia en la toma de decisiones sobre aspec-
tos sanitarios.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


214 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

6. Conclusiones sobre la herramienta y aplicabilidad para la


docencia
La naturaleza de los contenidos, así como su distribución en una estructura de
patrones habituales de una consulta médica prototípica, llevan a pensar que el
corpus léxico y fraseológico del programa UniversalDoctor Project fue conce-
bido, al menos en primera instancia, pensando en proporcionar al personal sani-
tario una herramienta multilingüe con la que solventar por sí mismo la barrera
lingüística, sin necesidad de recurrir a agentes externos (traductores, intérpretes,
colegas con conocimiento de la lengua extranjera, etc.).
Para conseguirlo, UniversaDoctor ha creado un corpus en constante aumento
(actualmente con más de 1.000 entradas), llevado a cabo por traductores profe-
sionales especializados y revisado por profesionales sanitarios, factores que
contribuyen a su fiabilidad.
Pese a su voluntad de ser un recurso que otorgue autonomía al usuario, la au-
sencia de indicadores culturales que ayuden a entender y gestionar las diferen-
cias de comportamiento entre individuos impiden que la herramienta sea ente-
ramente útil por sí misma, y es una prueba significativa de que las habilidades
lingüísticas pueden resultar infructuosas si no van acompañadas de habilidades
socioculturales. En ese sentido, este artículo contribuye a insistir en la necesidad
de considerar los conceptos de lengua y cultura como un binomio indisociable e
indivisible, y reivindicar el rol insustituible del intérprete como mediador lin-
güístico y cultural, en especial en contextos sociales.
Por otro lado, desde nuestra primera toma de contacto con la herramienta pen-
samos en su aplicabilidad a la práctica docente y al trabajo en el aula. El estudio
más pormenorizado de la misma no ha hecho sino corroborar esa primera im-
presión sobre su utilidad como recurso complementario para la formación de
intérpretes mediadores en el ámbito sanitario, principalmente por su manejo
sencillo e intuitivo, lo que favorece el trabajo autónomo del alumno, que puede
experimentar por su cuenta, así como por la variedad de contextos situacionales
que contempla y que permiten abarcar todo el proceso de actuación en la aten-
ción sanitaria del paciente.
La proliferación de estudios basados en corpus que presenten una metodología
clara, así como de herramientas de trabajo como la que se analiza en este artícu-
lo, no sólo contribuirá a mejorar la calidad de la formación de los futuros intér-
pretes de Servicios Públicos, sino que permitirá avanzar en el necesario recono-
cimiento de la profesión.
Por último, el empleo de recursos de aprendizaje basados en corpus de trabajo
fiables contribuye, además, a conseguir dos objetivos fundamentales:
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 215

Desde el punto de vista de la formación académica, a aumentar el interés del


alumnado a través de nuevas técnicas didácticas que le permitan interactuar en
el aula y participar de forma activa en el proceso de enseñanza-aprendizaje.
Desde el punto de vista de la visibilidad de la figura del intérprete en el ámbito
social como profesional especializado, así como la sensibilización de la socie-
dad hacia la importancia de la labor que desempeña, el avance y la mejora de la
calidad de la formación deben entenderse como un paso crucial para progresar
en el necesario reconocimiento de la profesión.

7. Bibliografía
Abercrombie, Davis. 1965. Studies in Phonetics and Linguistics, London: Oxford Uni-
versity Press. ISBN 0194370232.
Abril Martí, Mª Isabel. 2006. La interpretación en los Servicios Públicos: Caracteriza-
ción como género, contextualización y modelos de formación. Hacia unas ba-
ses para el diseño curricular. Tesis Doctoral del Departamento de Traducción
e Interpretación. Leída el 23 de octubre de 2006. Granada: Universidad de
Granada. URI: http://hdl.handle.net/10481/1075. Consultado el 2/02/2014.
Aston, Guy, Silvia Bernardini y Dominic Stewart, eds, 2004. Corpora and Language
Learners. Amsterdam / Philadelphia: John Benjamins. ISBN 9789027222886.
Bendazzoli, Claudio y Annalisa Sandrelli. 2009. Corpus-based Interpreting Studies:
Early Work and Future Prospects. @ Tradumàtica, 7. L’aplicació dels corpus
lingüístics a la traducció. ISSN: 1578-7559, pp. 1-9.
Beeby, Allison, Patricia Rodríguez-Inés y Pilar Sánchez- Gijón, eds. 2009. Corpus use
and translating: corpus use for learning to translate and learning corpus use to
translate. Amsterdam: John Benjamins Pubishing. ISBN 9789027224262.
Biber, Douglas, Susan Conrad y Randi Reppen. 1998. Corpus Linguistics: Investigating
Language Structure and Use. Cambridge: Cambridge University Press. ISBN
0521499577.
Cabré, María Teresa. 1993. La terminología. Teoría, metodología, aplicaciones. Barce-
lona: Antártida Empúries. ISBN 9788475964058.
Chomsky, Noam. 2002. Syntactic Structures (2ª edition [1957]). Berlin/ Nueva York:
Mouton de Gruyter ISBN 3110172798.
García Luque, Francisca. 2009. La interpretación telefónica en el ámbito sanitario:
realidad social y reto pedagógico. @ Redit: Revista electrónica de didáctica de
la traducción y la interpretación, nº 3. ISSN-e 1989-4376, pp. 18-30. Disponi-
ble en:
http://www.redit.uma.es/Archiv/n3_2009/mono_GarciaLuque_redit3.pdf. Con-
sultado el 5/03/2014.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


216 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

Gallego, Daniel y Miguel Tolosa. 2012. Terminología bilingüe y documentación ad hoc


para intérpretes de conferencias. Una aproximación metodológica basada en
corpus. @ Estudios de Traducción, vol.2. ISSN: 2174-047X. pp.33-46.
Hale, Sandra Beatriz (coord. Carmen Valero Garcés). 2010. La interpretación comuni-
taria. La interpretación en los sectores jurídico, sanitario y social. Granada:
Comares. Col.Interlingua. ISBN 9788498366563.
Laviosa, Sara. 2002. Corpus-based Translation Studies: Theory, Findings, Application.
Amsterdam / New York: Rodopi. ISBN 9042014873.
Leech, Geoffrey. 1992. Corpora and theories of linguistic performance. @ J.Svartvik,
ed., Directions in corpus linguistics. Proceedings of Nobel Symposium 82. Ber-
lin, New York: Mouton de Gruyter. ISBN 3110128268. pp.105–122.
Martin, Anne. 2000. La interpretación social en España @ D. Kelly, ed. La traducción y
la interpretación en España hoy: perspectivas profesionales. Granada: Comares,
ISBN 8484440419. pp. 207-223.
Mejnartowicz, Agnieszka. 2008. Mediación lingüística y cultural en los Servicios Per-
sonales. @ L. Pegenaute et al., eds. Actas del III Congreso Internacional de la
Asociación Ibérica de Estudios de Traducción e Interpretación. La traducción
del futuro: mediación lingüística y cultural en el siglo XXI. Barcelona 22-24 de
marzo de 2007. Barcelona: Promociones y Publicaciones Universitarias. Vol.
n.º 2. ISBN 978844770270, pp. 381-390
Pérez Hernández, Chantal. 2002. Explotación de los córpora textuales informatizados
para la creación de bases de datos terminológicas basadas en el conocimiento.
@ Estudios de Lingüística del Español (ELiEs), 18. ISSN: 11398736.
Pöchhacker, Franz. 1999. Getting Organized: The Evolution of Community Interpret-
ing. @ I. Kurz y M. Bowen, eds. History of Interpreting. Special issue of Inter-
preting 4/1. Amsterdam: John Benjamins Publishing Company. ISSN: 1384-
6647, pp. 125-140.
Pöchhacker, Franz. 2002. Researching interpreting quality: Models and Methods. @ G.
Garzone y M. Viezzi, eds. Interpreting in the 21st Century: Challenges and
Opportunities. Amsterdam/ Philadelphia: John Benjamins Publishing. ISBN
9789027297037, pp. 95-106.
Rodríguez- Inés, Patricia. 2009. Editorial de Tradumàtica. 7. L’aplicació dels corpus
lingüístics a la traducció. Diciembre 2009. ISSN: 1578-7559.
Ruiz-Mezcua, Aurora. 2010. La enseñanza de la interpretación social en el contexto
biosanitario: la preparación psicológica del intérprete médico. @ TRANS. Re-
vista de Traductología, 14. Universidad de Málaga. ISSN 1137-2311, pp.
1137-2311.
Sánchez Pérez, Marta. 2009. La mediación intercultural en el ámbito sanitario. El caso
de los pacientes de origen chino. Trabajo de investigación final del Máster in-
teruniversitario en Traducción Médico-Sanitaria. Castellón de la Plana: Uni-
versidad Jaume I.
APLICABILIDAD DEL USO DE CORPUS A LA DOCENCIA EN INTERPRETACIÓN… 217

Santamaría Ciordia, Leticia. 2012. Almodóvar po polsku. La imagen de Almodóvar en


Polonia y sus consecuencias sobre la traducción de su cine. Lask: Oficyna
Wydawnicza LEKSEM. Col. Rozumienie, Interpretacja, Przeklad. ISBN:
9788360178997.
Seleskovitch, Danica. 1968. L’interprète dans les conférences internationales. Prob-
lèmes de langage et de communication. Paris: Minard. ISBN 9782256908231.
Sinclair, John. 1991. Corpus, concordance, collocation: Describing English language.
Oxford: Oxford University Press. ISBN 9780194371445.
Thompson, Paul. 2005. Spoken Language Corpora. @ M. Wynne, ed. Developing Lin-
guistic Corpora: A Guide to Good Practice, Oxford: Oxbow Books. ISSN
1463 5194.
Torres Díaz, María Gracia. 2003. Interpretación comunitaria médica e investigación. @
E. Ortega Arjonilla, dir. Panorama actual de la investigación en Traducción e
Interpretación, vol I. Granada: Atrio. ISBN 8496101126, pp. 447-453.
Valero Garcés, Carmen. 2003. Una visión general de la evolución de la traducción e
interpretación en los servicios públicos. @ C. Valero Garcés, ed. Traducción e
Interpretación en los servicios públicos. Contextualización, actualidad y futu-
ro. Granada: Comares. ISBN 8481386375, pp. 3-35.
Villayandre Llamazares, Milka. 2010. Aproximación a la lingüística computacional.
Tesis doctoral. Universidad de León, Departamento de Filología Hispánica y
Clásica.

Referencias electrónicas
La profesión de intérprete ayer y en la actualidad. @ Interlingua Events. Gestión de
proyectos de comunicación multilingüe. Disponible en:
<http://www.interlingua-events.com/ES/La-profesion-de-interprete-ayer-y-en-
la-actualidad.html>. Consultado el 7/2/2014.

1
La capacidad de analizar de manera sistematizada corpus de cierta extensión permite obtener
unos resultados de calidad no disponibles hasta entonces (traducción propia).
2
<http://www.interlingua-events.com/ES/La-profesion-de-interprete-ayer-y-en-la-
actualidad.html>.
3
La grabación y transcripción del discurso oral es una labor mucho más exigente en comparación
con la que supone la recogida de textos escritos (traducción propia).
4
Teniendo en cuenta que las necesidades de interpretación de inmigrantes y personas sordas
pueden surgir en muy distintas situaciones personales, es prácticamente inevitable que persista la
«interpretación natural», con carácter menos formal, llevada a cabo por familiares o amigos. Esto
dificulta que exista una percepción uniforme de la función de la interpretación por parte de los
interlocutores. Mientras las razones económicas prevalezcan sobre las (imprecisas) disposiciones
legales y las políticas integracionistas, el límite poco definido entre el intérprete profesional y el

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


218 LETICIA SANTAMARÍA Y ROSA FERNÁNDEZ

amateur es muy posible que acabe decantando la balanza del lado de este último (traducción
propia).
PARTE III
CORPUS Y ESTUDIOS APLICADOS
PART III
CORPORA AND APPLIED RESEACH
Desarrollo de un glosario bilingüe sobre un corpus
virtual de ofertas alojativas

[Building a virtual corpus-based bilingual accom-


modation glossary]
KARINA SOCORRO TRUJILLO Y RAMSÉS NARCISO CABRERA OLIVARES
Universidad de Las Palmas de Gran Canaria (ULPGC)
ksocorro@dfm.ulpgc.es
Resumen
Enmarcados en un contexto en el que la formación universitaria está vinculada al mun-
do profesional (EEES) y donde el aprendizaje se establece por competencias (uso de las
TIC, autogestión de la información, resolución de problemas, etc.), desarrollamos en el
aula un glosario inglés-español y español-inglés sobre ofertas alojativas. Para ello, en
una primera fase, el alumno selecciona su propio texto, en el que señala los marcadores
textuales prototípicos, elabora un glosario individual y lo traduce. Así, a partir de un
amplio corpus turístico, los estudiantes generan su propio material de aprendizaje indi-
vidualmente, optimizan el uso de los textos paralelos, crean una base de datos de fuentes
de consulta y de términos con definiciones, profundizan en este ámbito de especialidad
y, por supuesto, traducen. En una segunda fase, el alumno interactúa con sus compañe-
ros construyendo y revisando un glosario grupal que se convertirá en un recurso virtual
útil para la traducción turística directa e inversa.
Abstract
This work is framed within a context where higher education is deeply related to profes-
sional performance (EHEA) and where learning has adopted a competence-based ap-
proach, where the use of ICT, managing information, problem solving, and so onis
highlighted. So, an English-Spanish and Spanish-English corpus-based tourist accom-
modation glossary has been developed. Firstly, students choose their original texts on
line individually, analyze the textual conventions of this particular text type, develop an
individual glossary and translate. By building a comprehensive text corpus, students
autonomously generate their own learning resources, learn to effectively use parallel
texts and produce an information source and terminology data base. Afterwards, stu-
dents interact with their classmates by reviewing their glossaries and unifying them into
a single data base. As a result, they generate and share a useful digital tool for tourist
translation in both directions.
Palabras clave
Aprendizaje, corpus, glosario, ofertas alojativas, traducción
Keywords
Learning, corpus, glossary, accommodation, translation

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
222 KARINA SOCORRO Y RAMSÉS N. CABRERA

1. Introducción
El turismo supone una fuente de riqueza para la economía de cualquier país en
este mundo cada vez más globalizado, en especial, para España, donde es el
pilar de la economía, y, en particular, para Canarias, donde se lleva a cabo esta
experiencia didáctica, y cuya economía está basada en este sector terciario
(74,6 %). En las décadas más recientes se ha experimentado un incremento de la
investigación enfocada a la traducción turística como la de Nobs (2006), Calvi
(2010, 2012), Kelly (1997), Bugnot (2009), Fuentes Luque (2005), Durán
(2011), y Cómitre y Valverde (2014).La indudable importancia de este tipo de
traducción para el sector ha favorecido su presencia como materia en los nuevos
Grados en Traducción e Interpretación, que se han implantado desde el año
2009 en adelante.
Con el objetivo de conseguir formar a traductores que en el futuro ejerzan su
profesión eficazmente, creemos que el diseño curricular de la materia de traduc-
ción turística debe ir enfocado a desarrollar las competencias y habilidades en el
estudiante que le capaciten para producir textos meta de calidad, algo que hoy
en día lamentablemente no siempre se cumple debido a la falta de reconoci-
miento de la figura del traductor, en ocasiones, por parte del sector. Este hecho
no solo se aplica a la producción de textos traducidos, sino incluso de origina-
les, como hemos podido constatara la vista de los textos originales trabajados a
lo largo de esta experiencia didáctica.
De acuerdo con la norma UNE EN-15038, las competencias que ha de desarro-
llar el traductor de textos turísticos son las siguientes: traductológica; lingüísti-
co-textual (términos de otras disciplinas, turísticos y culturemas); heurístico-
documental; cultural (intercultural); y técnica. En sintonía con esta normativa,
así como con el diseño curricular por competencias, objetivos y tareas que se
recogen en el Libro Blanco de los Grados en Traducción e Interpretación, con la
tarea que aquí presentamos se pretende desarrollar en el aprendiz de traductor
algunas de las competencias propias del profesional recogidas en tal publica-
ción: dominio de técnicas y terminología de la traducción especializada; manejo
de herramientas informáticas; destreza para la búsqueda de informa-
ción/documentación; conocimiento de los aspectos económicos y profesionales;
y capacidad de trabajo en equipo. El desarrollo de estas competencias queda
englobado en un proceso integrador de aprendizaje constante. Como apunta
Rubio Royo (2013), el docente debe enfocar el aprendizaje hacia una formación
integral en donde prevalezca el proceso de adaptación personal, social y auto-
gestionado por medio del aprendizaje permanente.
Por tanto, el presente trabajo consiste en la creación de un glosario bilingüe
inglés-español y español-inglés elaborado a partir de un corpus textual turístico.
El glosario consta de cuatro campos: uno para términos en la lengua origen; otro
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 223

para términos en la lengua meta; un tercero para definiciones en caso de que


resultaran oportunas; y un cuarto para fuentes de documentación consultadas,
entre las que se incluyen diccionarios monolingües, bilingües y multilingües
impresos y en línea, textos paralelos en inglés, y textos de apoyo en español.
Este glosario, con una extensión de 1443 entradas inglés-español y 1341 entra-
das español-inglés, también constituye un recurso documental para la traducción
de textos turísticos, de manera que se trabaja la competencia documental como
parte esencial del proceso de adquisición de la competencia traductora. Salvo
que se indique lo contrario en el propio glosario, todas las fuentes se consulta-
ron durante el segundo semestre del año académico 2012-2013.
El glosario, en un principio, lo elaboraron 50 alumnos de tercero de Grado en
Traducción e Interpretación Inglés-Alemán y de Doble Grado en Traducción e
Interpretación Inglés-Alemán Inglés-Francés, de la Universidad de Las Palmas
de Gran Canaria, para la asignatura Traducción Turístico-Comercial B Inglés,
incluida dentro del plan de 2009 de la titulación e impartida durante el segundo
semestre del año académico 2012-2013. Sin embargo, se ha conseguido mejorar
y ampliar este glosario gracias a las aportaciones de los alumnos del curso aca-
démico 2013-2014 de la misma titulación y asignatura. Entre los objetivos de la
materia, se contempla enseñar al alumnado las peculiaridades de los tipos tex-
tuales turístico y comercial, así como las estrategias más apropiadas para afron-
tar sus traducciones de forma eficaz, con una adecuación al entorno socioeco-
nómico canario. En concreto, las competencias que se especifican en la guía
básica de la asignatura (2009) son las siguientes: reconocer las convenciones
culturales y lingüísticas, tanto en inglés como en español, de los textos turísticos
y comerciales más demandados socialmente; aplicar estrategias traslativas cohe-
rentes según el encargo y el tipo de texto turístico-comercial; manejar las he-
rramientas terminológicas y documentales más adecuadas para la traducción
turístico-comercial; y emplear los recursos multimedia para la práctica de la
traducción.

2. Marco teórico
El género turístico comprende un rango de textos muy heterogéneos. En este
sentido, Calvi (2010: 9-32) afirma que «la gran variabilidad y la tendencia a la
hibridación [de los tipos turísticos] complican todo intento de clasificación».
También argumenta con estas palabras:
Además, la creciente demanda de información por parte de los turistas y el im-
pacto de la comunicación a través de Internet, hoy en día rompe las convenciones
y propicia la aparición de los nuevos géneros textuales electrónicos que favore-
cen la hibridación genérica y el desarrollo de géneros fronterizos (Calvi 2010: 9-
32).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


224 KARINA SOCORRO Y RAMSÉS N. CABRERA

Gross (1998: 3), en Martínez (2005: 125), continúa argumentando al intentar


definir el texto turístico: «Su denominador común es el destinatario, o sea, el
turista o viajero al que se ofrece información […] con la intención latente o
manifiesta de invitar a visitar [el destino ofertado]».
De acuerdo con la Organización Mundial del Turismo (Singh 2010: 94), existen
cuatro sectores principales dentro de la industria del turismo:
-The attraction sector: recreation and entertainment, provisions of indoor and
outdoor recreation and entertainment facilities―natural and cultural attractions,
theme parks, museums, national parks, wildlife parks, gardens, heritage sites, en-
tertainment, events, etc.
-The accommodation sector: hotels, motels, bed and breakfast, guest house,
apartments, villas and flats, condominium timeshares, campsites, touring cara-
vans, holiday villages, marinas, etc.
-The transport sector: airlines, railways, bus and coach operators, car rental oper-
ators, shipping lines, etc.
-The travel organizer sector or the travel and trade organs: tour operators, travel
agents, incentive travel organizers, etc.
-The destination organization sector: national tourist offices, regional tourist of-
fices, local tourist offices, tourism associations, etc. 1
Nos hemos decantado por el sector alojativo porque la traducción de estos tipos
textuales representa una demanda de traducción real en la sociedad de hoy. En
efecto, conviene anunciarse en Internet, ya que se trata de un medio que alcanza
a cualquier persona situada en cualquier parte del mundo. Además, en este sec-
tor, los encargos de traducción más frecuentes son las versiones bilingües o
multilingües del mismo producto, en este caso, de ofertas alojativas.
Definimos «alojamiento» como «toda instalación que regularmente (u ocasio-
nalmente) ofrece plazas para que el turista pueda pasar la noche». La Decisión
2009/578/CE de la Comisión Europea nos ayuda a ampliar esta cuestión cuando
afirma lo siguiente acerca de la categoría de productos de servicios de aloja-
miento turístico:
[…] consiste en la oferta a turistas, viajeros e inquilinos de alojamiento en habi-
taciones debidamente equipadas dotadas al menos de una cama, a cambio del pa-
go de una cantidad. La oferta de alojamiento podrá incluir servicios de restaura-
ción, de bienestar físico (fitness) y recreativos, así como el uso de zonas verdes.
Zabala et al. (2008: 1) defienden la necesidad de estructurar claramente las dis-
tintas clases de alojamiento turístico. Por regla general, estos establecimientos
suelen clasificarse en «hoteleros» y «extrahoteleros». Así lo recoge, por ejem-
plo, el Boletín Oficial de Canarias (BOC, Nº 002, 5 de enero de 2010), que,
además, coincide con Zabala et al. (2008: 1). Mientras quela primera categoría
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 225

engloba hoteles, hoteles-apartamento, hostales y pensiones, la segunda com-


prende apartamentos turísticos, alojamientos turísticos al aire libre, albergues
turísticos, viviendas de turismo rural y otros que se determinen reglamentaria-
mente. Clasificaciones similares podemos encontrar, por ejemplo, en la Ley
13/2011, de 23 de diciembre, del Turismo de Andalucía (artículo 40) y en la
Ley 6/2003, de 27 de febrero, del Turismo de Aragón (Vigente hasta el 12 de
Abril de 2013).
La Comisión Europea también ha generado su propio sistema para distinguir los
varios tipos de alojamientos turísticos. De acuerdo con la Decisión 1999/34/CE,
se nombran las siguientes categorías:
• Establecimientos de alojamiento colectivo.
o Hoteles y establecimientos similares.
o Otros establecimientos de alojamiento colectivo: viviendas de
vacaciones, camping turísticos (solo para bungalows), puertos
deportivos, y otros establecimientos de alojamiento colectivo
no comprendidos en otras partes.
o Establecimientos especializados: establecimientos de cura,
campamentos de trabajo y de vacaciones, alojamiento en los
medios de transporte, centros de conferencias.
• Alojamiento turístico privado.
o Tipos de alojamiento: habitaciones alquiladas en casas particu-
lares, habitaciones alquiladas a particulares o a agencias profe-
sionales.
o Otros tipos de alojamiento privado: residencia secundaria, alo-
jamientos proporcionados gratuitamente por parientes o amigos,
otros alojamientos particulares no comprendidos en otras par-
tes.
A la vista de estas clasificaciones, podemos detectar que ninguna recoge todos
los establecimientos alojativos existentes, sino los prototípicos. Alrededor de
todo el mundo se puede hallar una amplia gama de locales propios de la cultura
en que han surgido y del tipo de turismo por el que opte el usuario. Por ejemplo,
en Reino Unido son muy conocidos los B&B, alojamientos en régimen de cama
y desayuno; así como lo son en Japón los ryokan, establecimientos que suelen
ofrecer tatami y baños termales. En España, resultan destacables los cortijos,
fincas rústicas propias de las zonas meridionales de la Península; y los monaste-
rios, residencias de una comunidad religiosa compuesta, sobre todo, por monjes
cristianos que viven alejados de la sociedad de acuerdo con sus votos religiosos.
Entre otros alojamientos interesantes, contamos con los restaurants withrooms
o «restaurantes con habitaciones», los megaresorts, estaciones turísticas que
integran hotel, casino, entretenimiento y compras en un lugar temático; o los
hoteles boutique, de reciente aparición, construidos con menos de 200 habita-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


226 KARINA SOCORRO Y RAMSÉS N. CABRERA

ciones, con servicio personalizado y diseño sofisticado. Por esta diversidad, que
está en función del destino y tipo de turismo ―rural, de salud, gastronómico,
cultural, académico, deportivo, de negocios, religioso, etc.―, supone una tarea
ardua el agrupar todas esas ofertas en una sola clasificación. Asimismo, para la
tarea que nos ocupa, consideramos que lo importante es integrar todos los tér-
minos asociados al sector alojativo y no tanto las clasificaciones, que sí pueden
ayudarnos a conocer mejor el ámbito de especialidad con el que trabajamos.

3. Metodología
Nuestra tarea contempla los componentes del diseño curricular de una clase
comunicativa según Nunan (Borja y Hurtado Albir 1999: 48), a saber: objetivos,
dinámica, materiales, actividades, y papel del profesor y del estudiante en la
tarea diseñada. Como veremos, se abordan muchos de los objetivos formativos
y competencias de la nueva concepción de formación universitaria vinculada al
mundo profesional.
Dentro de los objetivos formativos principales, contemplamos el desarrollo de
la competencia traductora inglés-español y español-inglés, aplicada a textos
turísticos y, en concreto, a ofertas alojativas. Esta se complementa con las com-
petencias profesionales empleadas en el uso de diccionarios generales y especia-
lizados, la creación de glosarios de términos con y sin definiciones; la recopila-
ción de fuentes de documentación como paso previo a la traducción y, en caso
necesario, la acuñación de términos nuevos. Asimismo, el estudiante discrimina
entre trabajos lexicográficos según su utilidad para la traducción, aprende a
optimizar el uso de textos paralelos y traduce en sentido inverso, de acuerdo con
la creciente demanda de esta modalidad de traducción en el mercado laboral
actual.
La dinámica con la que se desarrollaron competencias transversales e interper-
sonales favoreció el uso de recursos informáticos, así como las actividades indi-
viduales y autónomas. En primer lugar, los estudiantes seleccionaron sendos
textos turísticos, propuestas alojativas on-line en español de establecimientos
turísticos de todo tipo: hoteles, casas rurales, apartamentos, etc. Estos textos
conformaron el corpus de trabajo y se encontraron en diversas webs de ofertas
turísticas, por ejemplo: homeaway.es; lapizarranegra.com, casasruralesma-
drid.com; escapadarural.com; atrapalo.com; www.booking.com;
www.mediavacaciones.com, etc. Fue condición sine qua non que los escritos
elegidos no hubieran sido ya traducidos. A continuación, los estudiantes anali-
zaron las convenciones del TO y detectaron los posibles problemas traductoló-
gicos, gracias a lo que aprendieron a evaluar y garantizar la calidad de los tex-
tos. En siguiente lugar, crearon un glosario español-inglés con terminología,
definiciones y fuentes de consulta con el que apoyar su traducción individual.
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 227

En esta tarea, el estudiante desplegó estrategias de traducción y aplicó las técni-


cas adecuadas a este tipo textual turístico.
El trabajo en equipo comprendió el trato entre participantes durante la unifica-
ción de los glosarios individuales. Posteriormente, los estudiantes formaron
subgrupos dentro del aula para unir sus glosarios entre sí. Cada grupo, com-
puesto de 4 o 5 alumnos, recibió una letra como denominación para coordinar
mejor la labor organizativa. Finalmente, el trabajo en gran grupo constituyó la
compartición de conocimiento al unificar los glosarios, revisarlos y corregirlos,
así como al poner sus resultados en común a nivel grupal.
Como venimos mencionando desde antes, para esta tarea se ha empleado una
gran variedad de materiales, comenzando por el amplio corpus virtual auténtico,
recopilado por el alumnado, de textos sobre ofertas alojativas en línea redacta-
dos en español. También cuentan los glosarios individuales y el grupal, produc-
to de este proceso.
Aparte de las actividades individuales mencionadas anteriormente, dentro de los
grupos pequeños se asignó a un coordinador la tarea de gestionar la unificación
y la revisión de los glosarios. De manera similar, se encargó a un estudiante la
función de coordinador general para manejar la unión a escala de toda la clase,
con tareas adicionales de corrección y edición, así como de actualización a par-
tir del material nuevo ofrecido por el grupo del curso 2013/2014.
Durante toda la tarea, la docente transmitió conocimientos relacionados con la
situación socio-cultural, los marcadores textuales, la terminología y la fraseolo-
gía propia del texto turístico. Asesoró sobre las fuentes de documentación y su
utilidad, y actuó como orientadora, guía y diseñadora del método de trabajo. Por
su parte, el estudiante desempeñó un papel activo con capacidad de toma de
decisiones y oportunidades de liderazgo en la coordinación.

4. Confección del glosario y resultados


A fin de construir un glosario exhaustivo, se necesita reunir información de
diversa naturaleza para cada entrada. Sager (1990: 194) propone incluir sinóni-
mos en la misma lengua; equivalentes en otras lenguas; aspectos morfológicos y
gramaticales; términos relacionados ―por ejemplo: antónimos―; definiciones
y explicaciones; las representaciones gráficas en otros sistemas de signos; co-
mentarios y notas diversas; y datos sobre su clasificación temática, pertenencia
a un área o dominio temático, como el contexto y el tipo textual, o el lugar que
ocupa en un sistema de conceptos. No obstante, nos hemos ceñido a estos obje-
tivos formativos que hemos perseguido con la tarea que se explica en este traba-
jo: la creación de glosarios de términos con y sin definiciones; la recopilación
de fuentes de documentación como paso previo a la traducción; en caso necesa-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


228 KARINA SOCORRO Y RAMSÉS N. CABRERA

rio, la acuñación de términos nuevos; la optimización del uso de textos paralelos


por parte del estudiante; y la traducción en sentido inverso (aunque también el
glosario puede aprovecharse para traducción directa). Los campos que se reco-
gen en el glosario están más que justificados y son los siguientes: término en
LO; término en LM; definición y explicación del término (en caso necesario);
imagen o ilustración (de manera opcional); y fuentes de documentación consul-
tadas.
La documentación se emplea para resolver problemas en las distintas fases de la
traducción, que, según García Yebra (1984: 30), son la fase semasiológica, en la
que se ha de comprender el sentido del texto origen, y fase la onomasiológica,
en la que se expresa el mensaje en la lengua meta. Como señala Hurtado Albir
(2001: 62), la documentación «permite al traductor adquirir conocimientos so-
bre el campo temático, la terminología y las normas de funcionamiento textual
del género en cuestión».
Mayoral (1997/1998) indica que la operación de documentación ofrece infor-
mación factual, referida a conceptos (que recogemos en caso necesario); infor-
mación lingüística ―por ejemplo, elementos léxicos, gramaticales, estilísticos,
de género y formato―; e información metalingüística o pragmática, para la
comprensión del contexto y de la situación. Dicho esto, destaca la importancia
de contemplarlos siguientes criterios de evaluación de las fuentes:
• Fiabilidad. Se han de priorizar las fuentes fiables, que han de provenir
de una autoridad en el campo temático de la traducción, si es posible.
• Accesibilidad. Una fuente fiable pero difícil de alcanzar no es del todo
conveniente a la labor del traductor.
• Originalidad. El texto redactado en la lengua original es el que guarda
mayor nivel de autoridad.
• Especificidad. El grado de especialización de una fuente en un determi-
nado tema indicará su utilidad al traductor. En este sentido, destacan los
diccionarios especializados con definiciones.
• Exhaustividad. Las fuentes poco exhaustivas no son lo bastante prácti-
cas como para emplear tiempo en consultarlas.
• Corpus. Las fuentes terminológicas que se basan en un corpus auténtico
presentan un uso más real y fiable de las formas que contienen.
Para nuestro glosario hemos consultado un amplio abanico de fuentes, con dic-
cionarios monolingües, bilingües y multilingües impresos y en línea, textos
paralelos en inglés, y textos de apoyo en español. A continuación, mostramos
algunas fuentes de documentación consultadas y recopiladas a modo de ejemplo
para ilustrar su variedad:
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 229

Fuente consultada*
Lengua Origen *(Salvo que se explicite lo contrario, las fuentes listadas se
consultaron en el segundo semestre del año 2012-2013.)
accommodation -Homeaway.co.uk (TP). En: www.homeaway.co.uk/p499616
for n -Niumba (TP). En: www.niumba.com/en/united-
kingdom/england/greater-
london/apartments/beckenham/225925
-Niumba (TP). En: www.niumba.com/en/united-
kingdom/northern-
ireland/londonderry/bungalows/castlerock/169692
-Oxford Dictionaries. En: oxforddictionar-
ies.com/definition/english/sleep?q=sleep
-Wordreference.com. En:
www.wordreference.com/es/translation.asp?tranword=accom
modate
beach bar -Cruise Reviews (TP). En:
www.caribbeanportreviews.com/Antigua.htm
-Fodor’sTravel (TP). En: www.fodors.com/news/photos/16-
best-beach-bars-in-the-world#!1-intro
-Lainformacion.com (TA). En: via-
jes.practicopedia.lainformacion.com/destinos/los-10-mejores-
chiringuitos-de-playa-de-espana-13212
bedlinen -Better Homes and Gardens (TP). En: www.bhg.com
-Cambridge Dictionaries Online. En:
www.dictionary.cambridge.org
-Collins. En: www.collinsdictionaries.com
-Comodecorar casa (TA). En: www.comodecorarcasa.com
-El País. En: servi-
cios.elpais.com/diccionarios/castellano/lencer %EDa
-Merriam-Webster. En: www.merriam webster.com/ [Consul-
ta: febrero 2014]
-Oxford Dictionaries. En: oxforddictionaries.com/
-Pons. En: www.pons.eu
-Porqui.net (TA). En: www.poraqui.net
-Real AcademiaEspañola. En: lema.rae.es/drae/?val=cama
-Reverso. En: diccionario.reverso.net
cloakroom -ARMSTRONG, Maria and Fogarty, Catherine (Productoras
ejecutivas). (2013). Big Coat Productions (Productora). Love
it or List it. [serie de televisión]. Canadá. W Network. Versión
española Tu casa a juicio. 2013. Divinity
-Homeaway (TP). En: www.homeaway.com/vacation-
rental/p846960?uni_id=1256943
-Real Academia Española. En: www.rae.es/rae.html
-The Free Dictionary. En:
www.thefreedictionary.com/lavatory
-West Country Cottages (TP). En:
www.westcountrycottages.co.uk/publicwcc/properties/nuthatc
hcottage.htm
-WiseGEEK. En: www.wisegeek.com

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


230 KARINA SOCORRO Y RAMSÉS N. CABRERA

cosy (UK) -ALCARAZ, E. et al. (2000) Diccionario de términos de tu-


rismo y ocio, Ariel referencia, Barcelona.
-Collins. En: www.collinsdictionary.com/dictionary/spanish-
english/acogedor [Consulta: febrero de 2014]
-Diccionarios Bilingües Oxford. En:
www.diccionarioinglesespanoloxford.es
-Tripadvisor Canada (TP). En:www.tripadvisor.ca
Tabla 1. Ejemplos de fuentes consultadas 2
Por otra parte, en cuanto a la redacción de los textos originales, cabe señalar que
en los años noventa se experimentó un importante aumento del acceso de un
gran sector de la población al mundo de Internet, en el que las empresas de to-
dos los sectores y, en concreto, del sector turístico vuelcan toda clase de infor-
mación que pueda resultar de interés a los futuros clientes. La intervención di-
recta de propietarios y viajeros (como productores inexpertos de TO) pone en
duda el papel exclusivo del experto en la transmisión de informaciones.
A continuación, mostramos la tipología de errores encontrados en los textos
originales redactados en español que acompañamos de ejemplos. En primer
lugar, observamos errores de carácter gramatical, por ejemplo, en el uso inade-
cuado de pasivas ―«Los tres edificios son separados astutamente por plan-
tas»―; en la no concordancia —«Las playas de Stella Mares y Praia do Fla-
mengo son la mas linda de la ciudad de Salvador»—; y en la formación de
enunciados agramaticales ―«Hacer nada, es ideal. Poner» al 100 % todos tus
sentidos y escuchar el sonido de la naturaleza»―. De entre los fallos ortotipo-
gráficos hallados, destacamos la puntuación incorrecta ―«atractivo mobiliario
antiguo armario empotrado», «Los clientes de Casa Juana, también tienen»―;
el intercambio de tildes por apóstrofes ―«esta’» (está), «cafe’» (café), «podra’»
(podrá), etc.―; la falta de espaciado apropiado ―Limpio, tranquilo» , «y a ori-
llas del Río Ambroz», «encontramos el salón, comedor»―; y errores varios
ortográficos―«canselación», «Visital virtual», «Imágen», «opcción»―. En
tercer lugar, los errores lingüísticos se centran en el uso impropio de lexías co-
mo «secador» o «lencería», que, al investigar más profundamente los TO, ha-
cían referencia, en realidad, a un escurridor y a ropa de cama, respectivamente.
Finalmente, encontramos errores de naturaleza cultural, como el del siguiente
enunciado: (…)«puedes contar con los servicios necesarios tales como restau-
rantes, farmacias, parada de guaguas» (…).La aparición de la lexía «guagua»,
propia de la variedad dialectal canaria, estaría justificada si se evidenciara un
deseo de otorgar colorido localal texto a ojos de los lectores, pero, ya que se
halla en medio de una simple enumeración, podemos concluir que quizá el re-
dactor no consideró que producía un texto para un público no canario.
Para recapitular, Agorni (en Calvi 2012: 3) insiste en el papel del traductor co-
mo mediador de conocimientos, pero también en su responsabilidad en la pro-
moción turística, que se manifiesta en la elección de las estrategias persuasivas
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 231

y las formas evaluativas. Según Calvi (2012), se detecta que no siempre se rea-
liza de manera satisfactoria la mediación intercultural (las traducciones) y que
se presta poca atención a la normalización del léxico, con repercusiones negati-
vas en la comunicación en un sector crucial para la economía de España.
En siguiente lugar, resaltamos las dificultades principales en la elaboración de
un glosario, que acompañamos de ejemplos:
• Dialectismos

Lengua Origen Lengua Meta Definición

ben (SCOT) 1) montaña


2) monte

loch (SCOT) lago

sun room (US) terraza acristalada Estancia propia de los países anglo-
sajones para crear un ambiente
cálido en los meses fríos.
Tabla 2. Ejemplos de dialectismos 3
Para anotar términos propios de un dialecto, hemos escrito una pequeña leyenda
en el campo de término en la lengua origen. Así, por ejemplo, tenemos términos
muy interesantes por su origen escocés, loch y ben, que reciben la leyenda
«(SCOT)»; y también otras lexías como sunroom, que se encuentra en EEUU,
por lo que aparece con la leyenda «(US)».
• Tecnicismos

Lengua Origen Lengua Meta Definición

kitchenette cocina americana Cocina pequeña.

en-suite bathroom 1) baño privado Baño incluido generalmente dentro de la


2) baño adjunto habitación.

swim-up bar bar acuático Bar situado dentro de una piscina.

villa villa Casa de recreo situada aisladamente en el


campo.
Tabla 3. Ejemplos de tecnicismos
A causa de la naturaleza variada de los textos turísticos, resulta usual hallar
terminología de un gran número de ámbitos: arquitectura, cocina, ocio, deporte,
etc. En este caso, tenemos dos términos que describen dos posibles estancias de
un alojamiento―kitchenette y en-suite bathroom―, un tipo de local de espar-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


232 KARINA SOCORRO Y RAMSÉS N. CABRERA

cimiento para turistas ―swim-up bar― y una clase de establecimiento alojativo


turístico ―villa―.
• Culturemas

Lengua Origen Lengua Meta Definición

haggis haggis Plato típico escocés muy conocido que


consiste en un pesado embuchado que se
sirve tradicionalmente con puré de coli-
nabo y patatas.

chiringuito 1) beach bar


2) pool bar
3) beach restau-
rant
de n espigas 1) n-ear Sistema de medición de calidad, confort y
2) n-star equipamiento de los alojamientos rurales.

tartan tartan Tipo de tejido de origen escocés.

Tabla 4. Ejemplos de culturemas


La información cultural contiene un reservorio de recursos vital para que el
traductor resuelva eficazmente los problemas que surgen en los textos turísticos.
Destacan las estrategias que resaltan los fenómenos, eventos, etc., característi-
cos del lugar en que se encuentran las ofertas alojativas, por lo que contar con
una base terminológica que detalle estas cuestiones supone una gran ayuda en la
labor traductológica.
• Préstamos

Lengua Origen Lengua Meta Definición

salchichón salchichón Embutido curado de origen griego y


romano, realizado con carne magra
de cerdo y tocino, condimentado
con sal y especias como pimienta,
nuez moscada, clavo o cilantro.
wellness centre 1) centro de bienes- Establecimiento, parecido a un
tar balneario, donde se encuentran
2) centro de well- tratamientos beneficiosos para el
ness cuerpo y la mente.
Tabla 5. Ejemplos de préstamos
Analizando el corpus textual de partida, los estudiantes aprenden cuáles son las
situaciones apropiadas para utilizar préstamos en sus traducciones. Gracias a
esto, consiguen extraer guías de utilización para generar sus propios préstamos
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 233

en el TM o para domesticar los que encuentre en el TO según las características


del encargo de traducción.
Finalmente, después de generar el glosario, entre los alumnos participantes se
circuló una pequeña encuesta para evaluar la actividad. El rango de puntuación
era de 1 ―muy negativo―, a 5 ―muy positivo―. Con un número total de 42
participantes y 1 valor perdido, la valoración media de la actividad según los
estudiantes es 4,07. Esto demuestra la buena aceptación que ha tenido el desa-
rrollo de este glosario entre los alumnos, que, tras la realización de la tarea,
tienen a su disposición el recurso terminológico generado.

5. Conclusiones
Con la realización de esta tarea, podemos extraer conclusiones como que, a
través de esta actividad, el alumnado genera un corpus diverso a partir del cual
se desarrolla una labor autogestionada en una primera fase, y de compartición
de conocimientos en una segunda fase, en la que la retroalimentación favorece
el resultado final, el glosario bilingüe. Asimismo, nos adaptamos a los nuevos
paradigmas de formación, con un aprendizaje que emplea Internet como espacio
vital. Se incorporan, por tanto, tecnologías digitales: Moodle, Microsoft Office,
etc. Tal y como adelantábamos antes, creamos una herramienta versátil e inter-
disciplinar que toca un amplio abanico de temas relacionados: decoración, ar-
quitectura, gastronomía, ocio, etc.
En los estudiantes fomentamos hábitos de trabajo, buen juicio y toma de deci-
siones. El glosario sirve no como fundamento único, sino como herramienta de
apoyo en una profesión que requiere de la consciencia activa del traductor en
todo momento. Gracias a este trabajo, inculcamos en los alumnos la necesidad
de reflexión sobre qué decisiones tomar dependiendo de las características par-
ticulares de cada encargo, lo que, además, fomenta su autonomía como expertos
de la traducción. Más aún, demostramos la utilidad de estas actividades didácti-
cas en la creación de recursos orientados al ejercicio de la profesión. En un con-
texto universitario en el que priman los principios del Espacio Europeo de Edu-
cación Superior, resulta muy beneficioso todo contacto con la labor real del
traductor, reflejada en esta ocasión en nuestra actividad terminológica. Vemos
la importancia de la figura del traductor y del productor textual. No solo hay
que destacarlo como mediador cultural, sino también como revisor o corrector
de estilo, a la vista de la falta de calidad de algunos textos originales seleccio-
nados por los alumnos. De hecho, en las presentaciones orales los estudiantes
resaltaron este aspecto, por el que debían corregir sus textos antes de emprender
el proceso de traducción.
La tarea que hemos diseñado ha conseguido ajustarse a los criterios de aprendi-
zaje establecidos en el Libro Blanco. Al crear este glosario bilingüe basado en

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


234 KARINA SOCORRO Y RAMSÉS N. CABRERA

corpus de ofertas alojativas, el estudiante se ha impregnado de los usos y con-


venciones del género turístico gracias al estudio de los textos alojados en el
corpus compilado; ha aplicado las estrategias necesarias para la traducción de
los textos escogidos para la actividad; se ha valido de terminología y ha llevado
a cabo labores de documentación; y ha recurrido a las herramientas digitales
requeridas para potenciar la eficacia de sus traducciones.
Proponemos continuar con la investigación aquí iniciada. También sugerimos
expandir el glosario con nuevas entradas. Se podrían añadir a la vez más imáge-
nes e ilustraciones, por ejemplo, pues ofrecen un valioso apoyo a la hora de
entender la diversa gama de culturemas incluidos. En este sentido, sugerimos
elaborar glosarios que se especialicen en otros temas relacionados, como la
gastronomía o el deporte.

6. Bibliografía
Borja Albi, Anabel, y Amparo Hurtado Albir. 1999. La traducción jurídica. @ A. Hur-
tado Albir, ed. Enseñar a traducir. Metodología en la formación de traductores
e intérpretes. Madrid: Edelsa, Colección Investigación didáctica. ISBN
9788477113584, pp. 145-166.
Bugnot, Marie-Angie. 2009. Estereotipia y localización en el discurso turístico. @ Çédi-
lle. Revista de Estudios Franceses 5: 56-80, ISSN 1699-4949.
Calvi, MariaVittoria. 2010. Los géneros discursivos en la lengua del turismo: una pro-
puesta de clasificación. @ Ibérica 19: 9-32, ISSN 1139-7241. Universita degli
Studi di Milano
Calvi, MariaVittoria. 2012. Palabras y cultura en la lengua del turismo. @ Revista de
Turismo y Patrimonio Cultural Pasos 10/4 (especial): 1-3, ISSN 1695-7121.
Cómitre Narváez, Isabel y José María Valverde Zambrana. 2014. How to translate cul-
ture-specific items: a case study of tourist promotion campaign by Turespaña’s
tourist promotion campaign. @ JoSTrans 21: 71-111, ISSN 1740-357X.
Durán Muñoz, Isabel. 2011. El trabajo ontoterminográfico aplicado a la traducción de
textos del turismo de aventura (español, inglés, alemán): fases de preparación,
elaboración y edición. Málaga: Servicio de Publicaciones de la Universidad de
Málaga. ISBN 9788497476416.
Fuentes Luque, Adrián. 2005. La traducción de promoción turística institucional: la
proyección de la imagen de España. @ A. Fuentes Luque, ed. La traducción en
el sector turístico. Granada: Atrio. ISBN 9788496101401, pp. 59-92.
García Yebra, Valentín. 1982. Teoría y práctica de la traducción. Gredos. ISBN
9788424902810.
Hurtado Albir, Amparo. 2001. Traducción y traductología. Cátedra. ISBN
9788437619415.
DESARROLLO DE UN GLOSARIO BILINGÜE SOBRE UN CORPUS VIRTUAL DE OFERTAS ALOJATIVAS 235

Kelly, Dorothy Anne. 1997. The translation of texts from the tourist sector: textual
conventions, cultural distance and other constraints. @ TRANS, revista de tra-
ductología 2: 33-42, ISSN 1137-2311.
Martínez Motos, Raquel. Análisis comparativo de las convenciones textuales de textos
turísticos en inglés y en español: los folletos editados por organismos oficiales.
@ A. Fuentes Luque, ed. La traducción en el sector turístico. Granada: Atrio.
ISBN: 9788496101401, pp. 121-138.
Mayoral Asensio, Roberto. 1997/1998. La traducción especializada como operación de
documentación. @ Sendebar 8/9: 137-154, ISSN 1130-5509.
Nobs Federer, Marie-Louise. 2006. La traducción de folletos turísticos. ¿Qué calidad
demandan los turistas? Comares. ISBN 9788498360158.
Nunan, David. 1989. Designing Tasks for the Communicative Classroom. Cambridge
University Press. ISBN 9780521379151.
Rubio Royo, Enrique. 2013. Perspectivas del conocimiento en una formación integral:
perspectiva desde la tecnología y la ciencia (perfil e-aprendiz). Disponible en
<http://www.slideshare.net/erubio/el-conocimiento-en-la-formacin-integral-
desdxe-la-perspectiva-de-la-tecnologa-y-la-ciencia-perfil-eaprendiz-de>. Con-
sultado el 27/5/2014.
Sager, Juan. 1990. A Practical Course in Terminology Processing. John Benjamins
Publishing. ISBN: 9027274347.
Singh, Jagbir. 2010. Ecotourism. New Dehli: I.K. International Publishing House.ISBN
9789380026961.
Zabala Aguayo, Francisco et al. 2008. Estudio de la oferta hotelera sevillana. @ I. Ber-
múdez y C. Fernández, eds. Investigaciones turísticas. Una perspectiva multi-
disciplinar. Digital @tres S.L. ISBN 9788469150306, 6-21. Disponible
en<www.aloj.us.es/ftf/investiga/Ijorna/investigaciones.pdf>.

Legislación
Boletín Oficial de Canarias, Nº 002, martes 5 de enero de 2010. Gobierno de Canarias.
Disponible en <http://www.gobiernodecanarias.org/boc/2010/002/>. Consulta-
do el 27/5/2014.
Decisión 1999/34/CE de la Comisión, de 9 de diciembre de 1998, sobre los procedi-
mientos de aplicación de la Directiva 95/57/CE del Consejo sobre la recogida
de información estadística en el ámbito del turismo. Unión Europea. Disponi-
ble en <http://eur-
lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:1999:009:0023:0047:ES:P
DF>. Consultado el 27/5/2014.
Decisión 2009/578/CE de la Comisión, de 9 de julio de 2009, por la que se establecen
los criterios ecológicos para la concesión de la etiqueta ecológica comunitaria
a los servicios de alojamiento turístico. Unión Europea. Disponible en
<http://www.magrama.gob.es/es/calidad-y-evaluacion-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


236 KARINA SOCORRO Y RAMSÉS N. CABRERA

ambiental/temas/etiqueta-ecologica-de-la-union-europea/d_turismo_tcm7-
1953.pdf>. Consultado el 27/5/2014.
Guía Docente: Guía Básica. Traducción Turístico-Comercial B Inglés. Las Palmas de
Gran Canaria: Universidad de Las Palmas de Gran Canaria. 2009. Disponible
en <http://www.fti.ulpgc.es/upload/40324.pdf>. Consultado el 27/5/2014.
Ley 6/2003, de 27 de febrero, del Turismo de Aragón (Vigente hasta el 12 de Abril de
2013). Gobierno de Aragón. Disponible en
<http://noticias.juridicas.com/base_datos/CCAA/ar-l6-2003.htm>. Consultado
el 27/5/2014.
Ley 13/2011, de 23 de diciembre, del Turismo de Andalucía. Gobierno de Andalucía.
Disponible en <http://www.juntadeandalucia.es/boja/2011/255/1>. Consultado
el 27/5/2014.
Libro Blanco. Título de Grado en Traducción e Interpretación. Agencia Nacional de
Evaluación de la Calidad y Acreditación. Disponible en
<http://www.aneca.es/var/media/150288/libroblanco_traduc_def.pdf >. Con-
sultado el 27/5/2014.
UNE EN-15038. Servicios de traducción. Requisitos para la prestación del servicio.
Madrid: Asociación Española de Normalización y Certificación

1
-Sector del ocio: recreación y entretenimiento, establecimiento de instalaciones de recreo y entre-
tenimiento en interiores y exteriores. Monumentos naturales y culturales, parques temáticos,
museos, parques nacionales, parques naturales, jardines, lugares de patrimonio, entretenimiento,
eventos de ocio, etc.
-Sector alojativo: hoteles, moteles, B&B, pensiones, apartamentos, villas, pisos, multipropieda-
des, campamentos, caravanas, pueblos turísticos, puertos deportivos, etc.
-Sector del transporte: aerolíneas, empresas ferroviarias, empresas de autobuses y autocares,
empresas de alquiler de coches, empresas navieras, etc.
-Sector de organización de viajes o de órganos de turismo y comercio: turoperadores, agencias de
viajes, organizadores de viajes de empresa, etc.
-Sector de organización del destino: oficinas de turismo nacionales, regionales y locales, asocia-
ciones de turismo, etc. (traducción propia).
2
Para ilustrar mejor nuestros ejemplos, hemos incluido una versión simplificada de nuestro glosa-
rio, que solo incluye los campos de término en LO y fuentes consultadas. La leyenda TA significa
texto de apoyo; y la TP, texto paralelo. Los diccionarios no llevan leyenda.
3
Con el objetivo de hacer más sencillos nuestros ejemplos, de manera similar a la anterior oca-
sión, incluimos una tabla con menos campos que los presentes en nuestro glosario real.
Corpus de textos audiovisuales frente a corpus de
textos escritos. La traducción de micropíldoras de
aprendizaje

[Audiovisual Corpora Vs Written Corpora. Trans-


lating Knowledge Pills]
VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ ÁLVAREZ Y ALFREDO
CORELL ALMUZARA
Universidad de Valladolid
varnaiz@lia.uva.es
Resumen
En los últimos años, debido al proceso de virtualización de los materiales de aprendiza-
je, ha irrumpido en el marco formativo un nuevo género textual que plasma las particu-
laridades de los textos especializados en un contexto audiovisual con unas característi-
cas concretas: las micropíldoras de aprendizaje.
Desde esta perspectiva, las micropíldoras se conciben como breves vídeos formativos
sobre una temática específica, que permiten trasladar determinados contenidos especia-
lizados en un formato atractivo en el proceso de formación integral de los estudiantes.
Este nuevo género textual plantea, a su vez, nuevas necesidades en el contexto traducto-
lógico, no solo desde la perspectiva de la traducción profesional, sino también desde el
enfoque de la enseñanza de la traducción. Las peculiaridades de este nuevo producto
audiovisual junto con su carácter híbrido hacen necesaria la búsqueda de nuevas herra-
mientas y recursos para su trasvase a otras lenguas.
El presente trabajo analiza las posibilidades que ofrecen diferentes tipos de corpus (au-
diovisuales y de textos escritos) a la hora de traducir micropíldoras de aprendizaje en el
ámbito de la inmunología.
Abstract
In the last decade, inspired by the increasing demand of virtualizing teaching materials,
a new textual genre that combines the particular features of specialized texts in a very
marked audiovisual context has emerged within the educational framework: knowledge
pills.
Knowledge pills are short brief educational videos on specific issues which convey
specialized contents in an attractive and innovative format.
This new textual genre brings unique possibilities, but it also raises new questions with-
in the translation process, not only from the perspective of professional translation, but
also from the approach of translation teaching. The particular structure of this new audi-
ovisual product, together with its hybrid nature, make it necessary to search for new
tools and resources for its translation, bearing in mind its special characteristics.

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
238 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

The aim of this work is to analyze the possibilities different corpora (audiovisual and
written corpora) provide when translating knowledge pills in the field of immunology
Palabras clave
Micropíldora de aprendizaje, corpus, texto audiovisual, traducción, inmunología
Keywords
Knowledge pills, corpora, audiovisual text, translation, immnology

1. Introducción
La integración de las TIC en el mundo educativo (sobre todo Internet) ha tenido
como consecuencia la aparición de nuevos modelos y entornos formativos, que
van a desempeñar un papel muy destacado no solo en la enseñanza a distancia
(EaD), sino también como apoyo a los paradigmas educativos tradicionales de
corte presencial (Álvarez, 2012). En este contexto, son muchos los esfuerzos
que se centran ahora en reflexionar sobre la puesta en marcha de estas nuevas
modalidades formativas 1, con el fin de valorar sus potencialidades en los um-
brales de lo que debería ser una verdadera sociedad del conocimiento.
Así, el nuevo contexto educativo exige la aparición de modalidades de forma-
ción más flexibles y abiertas, centradas en el estudiante y en sus particularida-
des en el proceso de aprendizaje; modalidades tales como como el e-learning o
enseñanza virtual, b-learning o enseñanza mixta e, incluso, m-learning o apren-
dizaje electrónico móvil (Sancho 2013) son cada más habituales en nuestras
aulas universitarias pues permiten configurar nuevos escenarios de aprendizaje
adecuados a las actuales coordenadas espacio-temporales y a las nuevas compe-
tencias y objetivos educativos. Algunos datos que ilustran esta idea y que repre-
sentan el contexto formativo español actual pueden identificarse en el último
informe UNIVERSITIC publicado por la CRUE en 2012 (Uceda y Píriz
2012:19 y ss.):
• El número medio de buenas prácticas relacionadas con la docencia vir-
tual implantadas o en desarrollo es de 15,32 (un 72,97 % de media so-
bre el total de 21 buenas prácticas consideradas como importantes por la
Sectorial TIC de la CRUE).
• Si analizamos cada una de las diferentes buenas prácticas relacionadas
con la docencia virtual destacan los esfuerzos que han realizado las uni-
versidades en la creación de portales multimedia con contenidos digita-
les para docencia (canal Youtube, iTunes, etc.). Este tipo de herramien-
tas supone una vía muy útil para que el alumnado acceda a contenidos
en cualquier momento y situación y está presente en más del 70 % de
las universidades españolas. Como segunda práctica más empleada se
sitúa la existencia de salas/platós profesionales de grabación/producción
de contenidos multimedia (68 %) y, en tercer lugar, la existencia de un
CORPUS DE TEXTOS AUDIOVISUALES FRENTE A CORPUS DE TEXTOS ESCRITOS… 239

plan específico de formación para el personal en tecnologías y metodo-


logías educativas propias de la docencia virtual (62 %).
• Un número medio de 1.502 PDI por universidad emplean la plataforma
de docencia virtual institucional, este valor supone un 87 % del total de
docentes de cada institución. Si comparamos los datos para aquellas
universidades que han contestado en los dos últimos años comprobamos
como se ha producido un incremento de este indicador del 9,7 % del va-
lor absoluto y un 6,7 % del relativo.
• Por término medio, 21.730 estudiantes emplean la plataforma de docen-
cia virtual de la institución. Este valor supone un 90,6 % de los estu-
diantes. De nuevo existe un incremento de ambos indicadores en las
universidades que han participado en las dos últimas campañas, en este
caso de un 5,1 % en el valor absoluto y un 1 % en el relativo.
• Las universidades del SUE ofertan 5,5 titulaciones de media de carácter
no presencial, lo que supone una media del 7,35 % de todas las titula-
ciones de dichas universidades
En este marco de referencia, surgen las denominadas píldoras formativas (Ben-
gochea y Medina 2013), que se definen como «pequeñas piezas de material
didáctico, creadas como objetos de aprendizaje de contenido audiovisual y dise-
ñadas para complementar las estrategias tradicionales de formación y facilitar la
comprensión de algunos aspectos de la materia curricular que presentan una
mayor dificultad de comprensión para los estudiantes, ya sea por su hondura
conceptual como por su complejidad instrumental» (ibíd. :82). Cabe mencionar
en este punto que no existe entre los investigadores unanimidad a la hora de
denominar a este nuevo género de material de aprendizaje, ya que encontramos
en la escasa literatura al respecto otras unidades tales como «píldoras docentes»
(Valderrama et al. 2009) o «píldoras de conocimiento» (Maceiras et al. 20102).
Por extensión (o más bien, por reducción) surgen las denominadas «micropíldo-
ras de aprendizaje» (Fernández, Revuelta et al. 2013), género con unas caracte-
rísticas claramente marcadas en el que se basa el presente trabajo.

2. Las micropíldoras de aprendizaje


Al margen de su nomenclatura, como hemos visto en el apartado anterior, uno
de las principales dificultades a la hora de abordar el análisis y procesamiento
de las (micro)píldoras de aprendizaje es su clasificación dentro de los géneros
audiovisuales. Los numerosos trabajos que hasta la fecha han abordado el estu-
dio de géneros audiovisuales desde las diversas disciplinas (estudios fílmicos
y/o televisivos, traductológicos, literarios, etc.), han arrojado una amplia varie-
dad de taxonomías condicionadas, por lo general, por la naturaleza del marco de
origen (Altman 2000; Chaume 2000; Creeber 2001, entre otros). De todas ellas,

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


240 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

y teniendo en cuenta que la presente investigación nace en el seno de los Estu-


dios de Traducción, la clasificación que Agost lleva a cabo en 1999 resulta ser
una de las integradoras. En ella, la autora identifica cuatro géneros audiovisua-
les principales–géneros dramáticos, informativos, publicitarios y de entreteni-
miento- que a su vez se desglosan en función de su carácter narrativo, expositi-
vo, instructivo, conversacional, representativo, etc. en sus posibles combinacio-
nes.

La irrupción, más o menos reciente, de los productos audiovisuales en el pano-


rama académico universitario y el surgimiento de nuevos géneros y formatos
para su divulgación nos plantean una serie de productos nuevos de difícil clasi-
ficación. Lecciones magistrales en vídeo, videotutoriales, entrevistas, documen-
tales, MOOC, etc. son solo algunos de los recursos que se están utilizando como
complemento y/o instrumento docente para la formación virtual o semipresen-
cial. Su naturaleza y funcionalidad, además de sus características intrínsecas,
hacen posible la combinación de las funciones narrativa, descriptiva, expositiva
y/o instructiva para su difusión a través de formatos no considerados hasta la
fecha.

En este sentido, las micropíldoras de aprendizaje se conciben como «piezas


[audiovisuales] autocontenidas, con una duración [...] de entre 5 y 15 minutos,
[con un diseño] enfocado a integrarse en un contenido formativo más amplio en
el que pueden aparecer varias piezas de esta naturaleza» (Bengoechea, Budia y
Medina 2012). Esta breve descripción apunta hacia una de las principales carac-
terísticas diferenciales de este género con respecto a otros tipos de contenidos
didácticos que docentes e instituciones distribuyen en la actualidad a través de
la red: su duración.

En contraposición a las tradicionales lecciones magistrales cuyo formato puede


alcanzar -e incluso superar- los 60 minutos de duración, como sucede con los
contenidos distribuidos por instituciones tan diversas como el Massachusetts
Institute of Technology (MIT) 3, el Albert Einstein College of Medicine4, la Uni-
versidad de Stanford 5, o la Universidad de California 6, las micropíldoras de
aprendizaje no superan los 10 minutos de duración, motivo por el cual el conte-
nido íntegro de la unidad didáctica abordada se puede organizar en una sucesión
de «micropíldoras» para la correcta organización de la información (Corell
2013).

Pero al margen de la duración, otro de los principales aspectos diferenciales de


las micropíldoras de aprendizaje es la configuración técnica y estética del pro-
ducto audiovisual. Mientras que en las lecciones magistrales en vídeo, el conte-
nido responde a una grabación «no depurada» del producto, sin edición poste-
rior, en la que el estudiante es un mero espectador externo en una situación co-
CORPUS DE TEXTOS AUDIOVISUALES FRENTE A CORPUS DE TEXTOS ESCRITOS… 241

municativa que se desarrolla en un aula llena de estudiantes, en el caso de las


micropíldoras de aprendizaje el aula como contexto en el que se desarrolla la
comunicación desaparece. El docente y la presentación son los únicos elemen-
tos de la exposición, y se establece una «falsa» comunicación directa entre emi-
sor-profesor y receptor-espectador/estudiante, en la que el espectador es el des-
tinatario «exclusivo» de la comunicación. Esta «complicidad», y el hecho de
contar con un soporte audiovisual adicional (audio, vídeo o presentación po-
werpoint) condicionan el tipo de exposición y/o comunicación que se establece,
facilitando una comunicación más neutralizada, sin interacción, o con una esca-
sa interacción ficticia.

También en este caso el contexto comunicativo que se genera vuelve a distan-


ciarse nuevamente de otros contenidos audiovisuales didácticos como es el caso
de las lecciones magistrales mencionadas con anterioridad (Bengoechea et al.
2012: 122). Su brevedad, y su desarrollo dentro de una situación comunicativa
«simulada» hacen que el producto esté muy depurado, eliminando en su factura
final repeticiones, reformulaciones, frases inacabadas y todas aquellas imper-
fecciones y distracciones propias de una comunicación espontánea.

Ilustración 1: Diferentes subgéneros audiovisuales dentro de la comunicación didáctica


institucional distribuida a través de la red social Youtube. A la izquierda, micropíldora
de aprendizaje (Corell 2013); a la derecha, lección magistral (Grimson 2009)

3. Estudio de caso: el subtitulado de micropíldoras de aprendi-


zaje
El estudio que se describe en el presente trabajo se centra en la traducción y
subtitulado de algunas de las micropíldoras de aprendizaje que en la actualidad
se desarrollan en la Universidad de Valladolid en el seno del proyecto «Saber,
Extender». Este proyecto, impulsado por el Área de Formación e Innovación en
colaboración con el Servicio de Medios Audiovisuales de la Universidad de

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


242 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

Valladolid, tiene como objetivo la creación de contenidos multimedia destina-


dos a la teleformación. El proyecto abarca desde la preparación del material
docente a la distribución de los contenidos multimedia a través de las diferentes
plataformas al alcance de la UVa (bien sea a través de la intranet -repositorio
institucional-, o de internet -canal Youtube institucional e iTunes). En el marco
de este proyecto surge el bloque «Inmunopíldoras» [(micro)píldoras de aprendi-
zaje sobre Inmunología], desarrollado por el profesor de Inmunología Humana
Dr. Alfredo Corell, bloque en el que se centra nuestro estudio.

La elaboración de estas píldoras de aprendizaje (o píldoras de conocimiento)


tiene unas fases claramente establecidas: elección del tema de la píldora o serie,
la presentación (diseño del plan de rodaje, preparación del material gráfico que
ilustre el discurso, etc.), la grabación en plató, la edición del vídeo por parte de
los profesionales del Servicio de Medios Audiovisuales, la transcripción de la
píldora a texto, la traducción y subtitulado de las píldoras y la difusión de de las
mismas por diversos medios de la intranet de la Universidad y de Internet.

Ilustración 3: Fotograma de la micropíldora «Cómo elaborar una píldora


de conocimiento» (Corell 2013)
Con motivo de la difusión de las primeras píldoras de aprendizaje a través del
canal institucional de Youtube del Servicio de Medios Audiovisuales de la
UVa, se pudo comprobar la funcionalidad parcial que en la actualidad oferta el
servicio de subtitulado automático intralingüístico de Google a través de este
sitio web. Tal y como reconocen sus propios responsables (Murphy 2014), uno
de los principales problemas a día de hoy a los que se enfrenta este servicio es la
calidad del sistema de reconocimiento de habla para la transcripción del conte-
nido sonoro del vídeo. El Word Error Rate (WER) o porcentaje de error por
palabra que recogen estos programas continúa siendo muy elevado, especial-
CORPUS DE TEXTOS AUDIOVISUALES FRENTE A CORPUS DE TEXTOS ESCRITOS… 243

mente en el caso del reconocimiento automático -independiente del hablante-,


como sucede en el caso del subtitulado automático que aquí se aborda (Burger
2006). Este hecho resulta especialmente significativo en el caso de la termino-
logía especializada, ya que los términos y estructuras lingüísticas que caracteri-
zan a los usos específicos de la lengua no suelen formar parte de las memorias
que sustentan los software de reconocimiento de habla tradicionales aplicados al
subtitulado automático.

Así, el retardo inherente al subtitulado en tiempo real, unido a los problemas


lingüísticos «menores» a los que se enfrenta el subtitulado automático tradicio-
nalmente (reformulación, segmentación inter e intrasubtítulo, frases inconclu-
sas, puntuación, etc.) quedan relegados a un lejano segundo plano debido a la
barrera que plantea para la comprensión la presencia de importantes errores de
transcripción que impiden el acceso al contenido, pudiendo generar falsos senti-
dos.

Ante este panorama, desde el principio se planteó la necesidad de producir sub-


títulos intralingüísticos no automatizados que garantizasen el acceso fiel al
componente lingüístico de las micropíldoras de aprendizaje para, a continua-
ción, añadir una versión subtitulada al inglés de los mismos contenidos.

Tal y como hemos expuesto previamente, este género audiovisual propio de los
entornos formativos presenta unas características particulares que lo diferencian
de otro tipo de productos audiovisuales (por ejemplo, la interacción «simula-
da»), por lo que su categorización, como ya hemos visto, resulta complicada,
amén de la complicación intrínseca al propio concepto de género perfectamente
descrita en trabajos como García-Izquierdo (2005) o Montalt et al. (2008).

En esta primera fase del proyecto se planteó la traducción de 17 de las 44 mi-


cropíldoras alojadas en el bloque de Inmunología por el profesor Alfredo Corell.
Pertenecientes a cuatro unidades didácticas diferentes, el metraje total asciende
a 130 minutos, con una duración por micropíldora que oscila entre los 05:30
minutos y los 10:30 minutos. En total, el volumen en número de palabras es de
19625, con una extensión aproximada de unas 1100 palabras por píldora, lo que
a su vez se corresponde con una velocidad aproximada de dicción cercana a las
148 palabras por minuto. Cabe destacar aquí que, a diferencia de otros géneros
audiovisuales, o contenidos docentes de distintas características –como puede
ser el caso de las lecciones magistrales- la locución de estos vídeos no es espon-
tánea, por lo que se genera un ritmo discursivo más constante y elevado que en
otros géneros audiovisuales tradicionales. Las repeticiones, reformulaciones y
auto-correcciones desaparecen en este formato, dando lugar a un texto mucho
más condensado, lo que representa en sí, un reto en el proceso de subtitulado
(Díaz Cintas 2003).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


244 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

No obstante, a las dificultades espacio-temporales específicas que plantea el


subtitulado de píldoras de aprendizaje (segmentación, condensación lingüística,
velocidad de subtítulo, etc.), se suma el elevado grado de especialización de la
temática que en estos textos se aborda: la inmunología humana.

Si bien a menudo se reflexiona sobre la Traducción Audiovisual desde un punto


de vista técnico por las peculiaridades lingüísticas que plantea (Ivarsson y Ca-
rroll 1998; Díaz Cintas 2003), es preciso recordar que los diferentes géneros y
subgéneros audiovisuales pueden recoger diversos niveles de especialización
(Agost 1999). En el caso de los materiales de divulgación didáctica –MOOC,
videotutoriales, lecciones magistrales o píldoras de aprendizaje-, esta especiali-
zación constituye una característica intrínseca del género, por lo que es preciso
abordar su traducción desde una nueva perspectiva.

Las ventajas de aplicar la Lingüística del Corpus a la Traducción y más concre-


tamente el uso y gestión de corpus para la práctica de la traducción han sido
descritas por no pocos investigadores (Bernardini y Zanettin 2000; Corpas Pas-
tor 2001, 2004a, 2004b; Sánchez Gijón 2003; Seguiri 2006, 2008 y 2011, entre
otros). Tal y como expone Seghiri (2011:14):

[…] La necesidad de utilización de los corpus virtuales se perfila como uno de


los [recursos] más útiles dados los cortos plazos de entrega y la rapidez que se
exige en el desempeño de esta profesión.
Decidimos, por lo tanto, diseñar un corpus para este encargo en concreto (un
corpus ad hoc), que nos ayudara (más bien ayudara a nuestros estudiantes) no
solo en su labor documental (contenidos temáticos) sino también para la bús-
queda de equivalentes terminológicos y fraseológicos durante el proceso de
traducción; pero claro, ¿qué tipo de corpus compilamos para este encargo en
concreto?

La primera idea, atendiendo a criterios cualitativos, fue buscar textos de fuentes


fiables que pertenecieran al mismo género que los textos de nuestros encargo,
de la misma temática y variedad textual; sin embargo, tras realizar búsquedas
por palabras clave y pedir ayuda a nuestro experto (y a la vez cliente), nos di-
mos cuenta de que, debido a la reciente aparición de este género no existían
micropíldoras docentes con las mismas particularidades que nuestro texto de
partida (esto es, micropíldoras docentes de inmunología, de duración similar (5-
10 minutos) y que se desarrollasen en un contexto docente). Por otro lado, las
que existían (fundamentalmente elaboradas por empresas, como los ejemplos
desarrollados por la empresa IMGENEX) exigían un trabajo adicional de trans-
cripción, revisión y preparación previos, ya que, al estar desarrollados en «la
lengua de la ciencia», su contenido no estaba subtitulado de forma manual
CORPUS DE TEXTOS AUDIOVISUALES FRENTE A CORPUS DE TEXTOS ESCRITOS… 245

(aunque contaba con subtítulos automáticos), con los problemas de


(in)comprensión que esto plantea. Esta necesidad de producir los textos escritos
de los materiales que constituyeran el corpus paralelo suponía tal demora en el
encargo, que hacía imposible su utilización para el encargo de traducción esta-
blecido.

En la misma línea, encontramos otro tipo de productos audiovisuales del mismo


género y temática, pero diferentes características: clases magistrales grabadas de
más de una hora de duración distribuidas a través de los canales institucionales
de universidades estadounidenses como University of California, Stanford Uni-
versity, o el Albert Einstein College of Medicine. Al igual que en el caso de las
micropíldoras desarrolladas por empresas, estos contenidos únicamente ofrecen
subtítulos automáticos con importantes deficiencias, por lo que su posible utili-
zación para abordar la traducción y subtitulado de los materiales del proyecto
«Saber, Extender», si bien constituiría la estrategia más acertada, como indica
Corpas, tampoco resultaba una opción óptima.

Con todo ello, y apoyándonos en la finalidad didáctica del texto de partida, de-
cidimos cambiar de estrategia y optar por la compilación de un corpus de textos
escritos (fundamentalmente manuales especializados de enseñanza recomenda-
dos por el experto colaborador), que se encontraban ya en formato PDF, por lo
que su conversión y tratamiento posterior resultaba mucho más sencillo. Somos
conscientes de las diferencias existentes entre el género origen del encargo y el
género de los textos que van a integrar el corpus; sin embargo, si atendemos a la
temática, a la finalidad del texto de partida, a los potenciales receptores del
mensaje y al hecho de que no se trata de una traducción «per se», sino del subti-
tulado [en el que los elementos propios de la oralidad pasan a ocupar un segun-
do plano, cuando no desaparecen- Tomaskiewicz (1993); Díaz Cintas
(2003:208-213)], consideramos que la herramienta diseñada para el encargo
podría ser de utilidad no solo para encontrar equivalentes terminológicos y fra-
seológicos, sino también para desarrollar la subcompetencia temática de los
estudiantes, tal y como pone de manifiesto el trabajo de Corpas (2004).

Una vez diseñado el corpus, pasamos a la compilación del mismo (fase en la


que nos encontramos) siguiendo el modelo protocolizado por Seghiri (2011)
para la compilación de un corpus virtual y que consiste en cuatro fases clara-
mente diferenciadas: búsqueda y acceso a la información, descarga de la misma
(en el caso de manuales descargables), normalización (conversión de los archi-
vos) y almacenamiento e identificación de los textos.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


246 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

4. Conclusiones
En el actual proceso de virtualización de materiales docentes, los contenidos
audiovisuales constituyen uno de los principales objetos de trabajo. Su naturale-
za y objetivos de divulgación, hacen de su traducción algo imprescindible.

De entre los diferentes contenidos audiovisuales de nueva aparición, como es el


caso de los MOOC, los videotutoriales y las píldoras de aprendizaje entre otros,
nuestro trabajo se centra en la traducción y subtitulado de estas últimas para su
divulgación en el contexto internacional. La adopción de redes sociales como
Youtube para la distribución de los contenidos por parte de las diferentes insti-
tuciones, y el desarrollo de servicios como el subtitulado automático de los ma-
teriales por parte de estas plataformas, dan fe del interés por alcanzar niveles de
difusión de amplio alcance. Sin embargo, la divulgación de materiales en otras
lenguas, requieren un trasvase lingüístico ajeno todavía a procesos de automati-
zación.

Las características técnicas de las píldoras de aprendizaje, y especialmente su


alto grado de especialización, aconsejan la adopción de corpus especializados y
herramientas de gestión para su trasvase, proceso previo a su subtitulación inter-
lingüística. La temática elegida –inmunología- delimitó la búsqueda de materia-
les para la compilación del corpus de trabajo; el formato y el género de los tex-
tos de partida, sin embargo, plantearon el principal problema de gestión de di-
chos corpus. Los textos paralelos (contenidos desarrollados por empresas y/o
instituciones) que podrían constituir el corpus de trabajo óptimo para la traduc-
ción para el subtitulado plantean, a día de hoy, una barrera para su utilización:
se trata de materiales audiovisuales, sin transcripción escrita cotejada que per-
mita la gestión de los mismos. La preparación previa –transcripción y revisión-
de los textos para su gestión e integración en los posibles corpus de trabajo re-
queriría de un trabajo previo adicional al propio proceso de traducción que, si
bien necesario, incrementaría sustancialmente el encargo traductor.

Por ello, y teniendo en cuenta el ámbito de especialidad del texto, se planteó la


posibilidad de adoptar textos escritos (manuales y textos didácticos), que si bien
no se identificaban con las mismas características de género, sí podían resultar
de ayuda en la gestión de aspectos terminológicos y fraseológicos. No obstante,
las peculiaridades técnicas y lingüísticas del nuevo género, hacen de este corpus
alternativo una opción de trabajo «aproximada», al no incluir otros aspectos
específicos propios del estilo divulgativo oral.

Con todo, el creciente desarrollo de píldoras de aprendizaje por parte de las


instituciones, unido al interés de las mismas por alcanzar la máxima difusión a
través de su divulgación internacional, plantean la necesidad de desarrollar ma-
CORPUS DE TEXTOS AUDIOVISUALES FRENTE A CORPUS DE TEXTOS ESCRITOS… 247

teriales óptimos y exclusivos para su traducción. Únicamente entonces será


posible contrastar la adecuación de los corpus «parciales» adoptados hasta la
fecha para la traducción de los materiales, con la de los corpus paralelos que
cumplan con todas las características textuales, técnicas y formales de los textos
originales.

5. Bibliografía
Agost, Rosa. 1999. Palabras, voces e imágenes, Barcelona: Ariel.
Altman, Rick. 2000. Los géneros cinematográficos. Barcelona: Paidós Comunicación.
Álvarez Álvarez, Susana. 2012. La tecnología al servicio de la enseñanza de la traduc-
ción: diseño de un curso de traducción económica en modalidad mixta (pre-
sencial-virtual) y su experimentación en el aula. Tesis doctoral: UVa. Disponi-
ble en <http://uvadoc.uva.es/bitstream/10324/1988/1/TESIS234-130121.pdf>.
Consultado el 22/4/2014.
Bengoechea Martínez, Luis; Flor Budia y José Amelio Medina. 2012. «Videotutoriales
subtitulados, un material didáctico accesible», @ L. Bengoechea Martínez y
J.R. Hilera González. Actas del III Congreso Iberoamericano sobre Calidad y
Accesibilidad de la Formación Virtual: CAFVIR 2012. 120-127. Disponible en
<http://www.esvial.org/wp-content/files/paper_Cafvir120.pdf>. Consultado el
22/4/2014.
Bengochea, Luis y José Amelio Medina Merodio. 2013. «El papel de los videotutoriales
accesibles en el aprendizaje del futuro», Actas V Congreso Internacional sobre
Aplicación de Tecnologías de la Información y Comunicaciones Avanzadas
(ATICA 2013), Universidad Continental. 80-87. Disponible en
<http://www.esvial.org/wp-
content/files/Videotutoriales_BengocheaMedina.pdf>. Consultado el
22/4/2014.
Bernardini, Silvia y Federico Zanettin (eds.) 2000. I corpora nella didattica della tradu-
zione. Corpus Use and Learning to Translate. Bolonia: CLUEB.
Burger, Susanne; Zachary, A. Sloane y Jie Yang. 2006. «Competitive Evaluation of
Commercially Available Speech Recognizers in Multiple Languages», @ Proc.
Language Resource and Evaluation Conf. (LREC',06),2006. Disponible en
<http://isl.anthropomatik.kit.edu/cmu-
kit/downloads/Competitive_Evaluation_of_Commercially_Available_Speech_
Recogniziers_in__Multiple_Languages.pdf>. Consultado el 22/4/2014.
Chaume, Frederic. 2000. «La traducción audiovisual: estudio descriptivo y modelo de
análisis de los textos audiovisuales para su traducción», Tesis doctoral inédita.
Castellón: Universitat Jaume I.
Corell Almuzara, Alfredo. 2013. «¿Cómo elaborar una píldora de conocimiento?».
Servicio de Medios Audiovisuales UVa. Disponible en

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


248 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

<https://www.youtube.com/watch?v=9Z8MzPBlm1g>. Consultado el
22/04/2014.
Corpas Pastor, Gloria. 2001 «Compilación de un corpus ad hoc para la enseñanza de la
traducción inversa especializada», @ TRANS. Revista de traductología. 5. 155-
184.
Corpas Pastor, Gloria. 2004a «La traducción de textos médicos especializados a través
de recursos electrónicos y corpus virtuales», @ L. González y P. Hernúñez
(eds.) Las palabras del traductor. Actas del II Congreso Internacional «El es-
pañol, lengua de traducción», 20 y 21 de mayo, Toledo 2004. Bruselas: Comi-
sión Europea/ESLETRA. 137-164.
Corpas Pastor, Gloria. 2004b «Localización de recursos y compilación de corpus vía
Internet: aplicaciones para la didáctica de la traducción médica especializada».
@ V. García Yebra y C. Gonzalo García (eds.). Manual de documentación y
terminología para la traducción especializada. Colección «Instrumenta Biblio-
logica». Madrid: Arco/Libros. 223-506.
Creeber. Glen. (ed). 2001. The television genre book. Londres: British Films Institute.
Díaz Cintas, Jorge. 2003. Teoría y práctica de la subtitulación (Inglés / Español). Bar-
celona: Ariel.
Fernández Sánchez, Mª Rosa; Francisco I Revuelta Domínguez y Jesús Valverde Berro-
coso. 2013. «Innovación y acción tutorial en el planteamiento y desarrollo de
tutorías EEES». Comunicación presentada en JUTE 2013 (XXI Jornadas Uni-
versitarias de Tecnología Educativa). Valladolid, 27 y 28 de junio de 2013.
García-Izquierdo, Isabel. 2005. El género textual y la traducción. Reflexiones teóricas y
aplicaciones pedagógicas. Berne: Ed. Peter Lang.
Gewerc Barujel, Adriana (coord.). 2007. Modelos de enseñanza y aprendizaje presentes
en los usos de plataformas de e-learning en universidades españolas y pro-
puestas de desarrollo. Informe final. Madrid: Dirección General de Universi-
dades. Disponible en <http://swad.ugr.es/paper/pdf/20080616184853PEA-
EA2007-0046.pdf>. Consultado el 22/4/2014.
Grimson, Eric y John Guttag. 2009. «Lec 1 | MIT 6.00 Introduction to Computer Sci-
ence and Programming, Fall 2008», MIT OpenCourseWare. Disponible en
<https://www.youtube.com/watch?v=k6U-
i4gXkLM&list=TLnlYmKb_lTUXmxsRzBkBOQX7KLWs_-crm>. Consulta-
do el 22/4/2014.
Ivarsson, Jan y Mary Carroll. 1998. Subtitling. Simrishamn: TransEdit.
Maceiras Castro, Rocío; Ángeles Cancela Carral y Vicente Goyanes de Miguel. 2010.
«Aplicación de Nuevas Tecnologías en la Docencia Universitaria», @ Forma-
ción Universitaria, Vol. 3(1): 21-26.
CORPUS DE TEXTOS AUDIOVISUALES FRENTE A CORPUS DE TEXTOS ESCRITOS… 249

Montalt Ressurrecció, Vicent; Pilar Ezpeleta Piorno e Isabel García-Izquierdo. 2008.


«The Acquisition of Translation Competence through Textual Genre», Trans-
lation Journal. 12 (4).
Murphy, Shannon K. 2014. «Future of Accessibility and Video Captions according to
Google and Youtube», 3PlayMedia. Disponible en
<http://www.3playmedia.com/2014/01/10/future-accessibility-video-captions-
according-google-youtube/>. Consultado el 22/4/2014.
Sancho, Jesús. 2013. «El fenómeno mobile learning se expande», La Vanguardia. 22 de
abril de 2013. Disponible en
<http://www.lavanguardia.com/tecnologia/20130422/54371359030/mobile-
learning-aprender-movil-tecnologia-smartphone.html>. Consultado el
22/4/2014.
Sánchez-Gijón, Pilar. 2003. «És la web pública la nova biblioteca del traductor?», @
Tradumàtica (Traducció i Tecnologies de la Informació i la Comunicació), 2.
Seghiri Domínguez, Miriam. 2006. Compilación de un corpus trilingüe de seguros
turísticos (español-inglés-italiano): aspectos de evaluación, catalogación, di-
seño y representatividad. Tesis doctoral. Málaga: Universidad de Málaga.
Seghiri Domínguez, Miriam. 2008. «Creating virtual corpora step by step». Researching
and Teaching specialized languages: New contexts, new challenges. VII Annu-
al Conference of the European Association of Languages for Specific Purposes
(AELFE). Murcia: Universidad de Murcia. 435-449.
Seghiri Domínguez, Miriam. 2011. «Metodología protocolizada de compilación de un
corpus de seguros de viajes: aspectos de diseño y representatividad», RLA.
Revista de Lingüística Teórica y Aplicada Concepción (Chile). 49(2). 13-30.
Disponible en <http://www.scielo.cl/scielo.php?pid=S0718-
48832011000200002&script=sci_arttext>. Consultado el 22/4/2014.
Tomaszkiewicz, Teresa. 1993. Les opérations linguistiques qui sous-tendent le proces-
sus de sous-titrage des films. Poznán: Adam Mickiewicz University Press.
Uceda Antolín, Javier y Segundo Píriz Durán. 2012. UNIVERSITIC 2012: Descripción,
gestión y gobierno de las TI en el Sistema Universitario Español, CRUE-TIC
Comisión Sectorial de las Tecnologías de la Información y las Comunicacio-
nes. Disponible en
<http://www.crue.org/Publicaciones/Documents/Universitic/2012.pdf>. Con-
sultado el 22/4/2014.
Valderrama Méndez, José O.; Ángel Sánchez Sánchez y Santiago Urrejola Madriñán.
2009. «Colaboración Académica Internacional en Tecnologías de la Informa-
ción y Docencia Virtual», @ Formación Universitaria, Vol. 2(6). (3-13).

1
Entendemos modelo o modalidad formativa como «un conjunto de orientaciones destinadas a
diseñar actividades y entornos educativos. El modelo especifica direcciones de la enseñanza y el

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


250 VERÓNICA ARNÁIZ-UZQUIZA, SUSANA ÁLVAREZ Y ALFREDO CORELL

aprendizaje dirigidas a conseguir determinadas metas. Incluye una determinada fundamentación,


una teoría, que justifica y describe lo que es bueno y por qué y se apoya en la evidencia empírica»
(Weil y Joyce, 1978: 2, cit. en Gewerc (2007: 15).
2
Cabría mencionar que es este término el que aparece también en el Proyecto de Innovación
«Saber, Extender» desarrollado por el Área de Innovación Docente en colaboración con el Servi-
cio de Medios Audiovisuales de la Universidad de Valladolid y que alberga la experiencia que
presentamos en este trabajo.
3
A través del Canal Oficial del Instituto Tecnológico de Massachusetts (Massachusetts Institute
of Technology, MIT) en la plataforma de vídeos Youtube: https://www.youtube.com/user/MIT
4
A través del Canal Oficial de la plataforma de vídeos Youtube del Albert Einstein College of
Medicine: https://www.youtube.com/user/EinsteinCollegeofMed
5
A través del Canal Oficial de la plataforma de vídeos Youtube de la Universidad de Stanford:
https://www.youtube.com/user/StanfordUniversity
6
A través del Canal Oficial de la plataforma de vídeos Youtube de la Universidad de California:
https://www.youtube.com/user/UCtelevision
Los equivalentes de la informática en los dicciona-
rios generales bilingües: ¿Utopía o realidad?

[Computing Equivalents in General Bilingual Dic-


tionaries: a Reality or a Utopia?]
MARÍA TERESA ORTEGO ANTÓN Y PURIFICACIÓN FERNÁNDEZ NISTAL
Universidad de Valladolid
tortego@lesp.uva.es
Resumen
El conocimiento especializado ha pasado de ser patrimonio exclusivo de los expertos a
interesar también a muchos usuarios con un nivel cultural medio, hecho que va acompa-
ñado de la necesidad de trasvasar dichos conocimientos a otras lenguas y culturas. En
este contexto, está demostrado que una de las principales herramientas que consultan los
traductores son los diccionarios generales bilingües. En nuestro trabajo pretendemos
verificar si los equivalentes propuestos en dos de los diccionarios generales bilingües de
uso más generalizado en el par de lenguas de inglés-español se ajusta a la realidad de
uso, de manera que procedemos a validar el empleo de dichos equivalentes pertenecien-
tes al campo de la informática en dos corpus especializados (un subcorpus de OPUS y
Corpus Tècnic del IULA) y, a continuación, en dos corpus de referencia de la lengua
española: Corpus de Referencia del Español Actual y Corpus del Español (Davies,
2002). Los resultados de nuestro estudio permitirán un diagnóstico más ajustado acerca
del empleo real de dichos equivalentes para valorar en última instancia la eficacia o no
de los diccionarios seleccionados a la hora de responder a las necesidades de los traduc-
tores.
Abstract
Specialised knowledge, which used to be exclusively for experts, is now also of interest
to middlebrow language users. In addition, the need to transfer scientific knowledge to
other languages and cultures arises in the current globalised world. It has been previous-
ly stated that general bilingual dictionaries make up one of the main tools employed by
translators to look up unknown words. In this paper, we would like to determine wheth-
er or not the translation equivalents suggested for computing terms in two of the most
prestigious general English-Spanish dictionaries are really employed in the Spanish
language. The employment of the aforementioned equivalents will be proved in two
specialised corpora (an OPUS subcorpus and IULA Corpus Tècnic) and in two Spanish
reference corpora: Corpus de Referencia del Español Actual and Corpus del Español
(Davies, 2002). The resulting data from the analysis may allow us to get an accurate
diagnosis of the real use of the suggested equivalents in order to test the effectiveness of
the selected dictionaries when dealing with translators’ needs.
Palabras clave
Conocimiento experto, corpus, diccionario general bilingüe, equivalente, traducción

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
252 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

Keywords
Expert knowledge, corpora, general bilingual dictionary, equivalent, translation

1. Introducción
En las últimas décadas el conocimiento experto ha pasado de ser patrimonio
exclusivo de los especialistas de un determinado campo del saber a interesar
también a los usuarios de una lengua con un nivel cultural medio. Entre los
diversos factores que han favorecido este cambio destaca la relevancia que las
unidades empleadas para designar conceptos especializados han adquirido en la
sociedad actual. En el presente trabajo las denominaremos unidades de signifi-
cación especializada (USE). Asimismo, dichas USE han experimentado un pro-
ceso de divulgación, como consecuencia de la democratización de la educación
y de la difusión del conocimiento experto que llevan a cabo los medios de co-
municación.
Por otro lado, en el entorno globalizado surge la necesidad de trasvasar el cono-
cimiento experto, que generalmente se produce o se difunde internacionalmente
en lengua inglesa, a otras lenguas como el español.
Para llevar a cabo dicho transvase interlingüístico constatamos que una de las
herramientas a las que acuden los usuarios de una lengua son los diccionarios
generales bilingües, a pesar de que estas obras no sean las más recomendables
para realizar consultas sobre las USE, puesto que, con frecuencia, inducen a
errores cuando se desconocen los conceptos especializados. Sin embargo, en
múltiples trabajos (Meyer, 1988; Atkins y Varantola, 1998a, 1998b; Mackin-
tosh, 1998; Durán Muñoz, 2010; Bowker, 2012), se afirma que los diccionarios
generales bilingües constituyen uno de los recursos más generalizados y utiliza-
dos por los traductores e intérpretes.
En el panorama de la lexicografía bilingüe tenemos constancia de trabajos de
referencia que estudian los distintos aspectos que caracterizan el tratamiento de
las USE en el par de lenguas de inglés y francés. Por ejemplo, se han publicado
estudios que abordan en el tratamiento de las USE desde una perspectiva gene-
ral (Jessen, 1996; Boulanger, 2001). Además, los trabajos centrados en un de-
terminado campo del saber también han suscitado el interés de los investigado-
res: Thoiron (1998) estudia el tratamiento que reciben las USE de la medicina,
Roberts (2004) opta por estudiar las USE de la enología y Roberts y Josselin
(2005) y Josselin (2005) por las USE de la vulcanología.
En este contexto que acabamos de esbozar nos sorprendió la escasez de estudios
en el campo de la lexicografía bilingüe en las lenguas inglesa y española, razón
por la que pretendemos verificar si los equivalentes propuestos en dos de los
diccionarios generales bilingües de uso más generalizado en el par de lenguas
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 253

de inglés-español se ajustan a la realidad de uso, dado que por nuestra experien-


cia en la formación de traductores e intérpretes y como usuarias de estas obras
consideramos que uno de los obstáculos para los traductores y, especialmente,
para los estudiantes de traducción, está relacionado con el tratamiento conferido
a los equivalentes de las USE, puesto que su cobertura no siempre es la más
adecuada y el empleo mostrado tiende a alejarse del uso que llevan a cabo los
hablantes de una lengua.

2. Las USE del campo de la informática


Partimos de la premisa de que el estudio de la totalidad de las USE incluidas en
un diccionario general bilingüe es una tarea extremadamente extensa y, en gene-
ral, es una labor que se ha definido como ardua, por no decir que imposible,
como así lo afirman varios de los trabajos consultados (Thoiron, 1998; Sierra
Soriano, 2001; Rodríguez Reina, 2002). En consecuencia, hemos optado por
circunscribirnos a un determinado campo del saber, la informática.
De hecho, los avances realizados desde el campo de la informática han trans-
formado no solamente el formato de los mismos, sino también la concepción y
el modo de plantear el trabajo lexicográfico. Además, esta área de conocimiento
influye en todos los niveles de confección de las obras lexicográficas: en su
organización, en su estructura, en la distribución de los contenidos, en su fiabi-
lidad, en su accesibilidad, etc.
Asimismo, este dominio se caracteriza por su gran interdisciplinariedad, puesto
que actualmente las aplicaciones informáticas vertebran la práctica totalidad de
los campos de especialidad de nuestra sociedad, hasta el punto de que sus trans-
formaciones inciden en gran medida en el avance de la mayoría de las áreas del
saber humano.
En consecuencia, dicho carácter interdisciplinar hará posible que el estudio de
los equivalentes de traducción propuestos de las USE del campo de la informá-
tica en los diccionarios generales bilingües pueda mostrarnos, previsiblemente,
una visión global del tratamiento que los compiladores de dichas obras confie-
ren a los equivalentes de traducción de las USE en general.
En este sentido, consideramos que analizado un campo de especialidad lo sufi-
cientemente representativo y transversal a muchos saberes, el enfoque conferido
a dicho campo tenderá a reproducirse en el resto de los campos de especialidad
recogidos en los diccionarios.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


254 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

3. La delimitación del campo de aplicación: los diccionarios ge-


nerales bilingües de inglés/español.
Dada la enorme proliferación en el mercado editorial en los últimos años de
diccionarios generales bilingües en inglés y español, consideramos pertinente,
en aras de dotar a nuestro estudio de una mayor exhaustividad, acotar nuestro
campo de aplicación a las últimas ediciones publicadas de dos diccionarios que
cuentan con un largo recorrido editorial:
• El Gran Diccionario Oxford: Español- Inglés, Inglés-Español (2008),
de ahora en adelante GDO.
• El Collins Universal Español-Inglés, English-Spanish (2009), de ahora
en adelante CU.
De hecho, como señala Hastings (2000), hay que remontarse a 1971 para cons-
tatar el lanzamiento de la primera edición del CU y, desde entonces, se han su-
cedido nueve ediciones. A pesar de que la primera edición del GDO es poste-
rior, puesto que vio la luz en 1994, tenemos constancia de la publicación de
cuatro ediciones. Con estas cifras queda demostrado el impacto editorial y pro-
bada la extensa difusión de los mencionados diccionarios en el contexto hispa-
nohablante, entre otras razones, por la implantación incontestable de la lengua
inglesa como segunda lengua en todos estos países.
Además, los diccionarios seleccionados cumplen con una serie de requisitos
considerados por expertos como Roberts (1997) o Landau (2001: 7-42) elemen-
tos que asisten a los usuarios a decantarse por una determinada obra y que, a
nuestro juicio, explicarían su éxito editorial y permitirían realizar un análisis
contrastivo de la información en ellos recogida.
Dichos requisitos podrían resumirse en la orientación hacia un amplio espectro
de usuarios potenciales, en presentar un tamaño que podría definirse como «co-
llege dictionary», en ofrecer cobertura de las principales variedades diatópicas
del inglés y del español y en publicarse en formato electrónico, el GDO en CD-
ROM y el CU en un archivo que se descarga de internet a partir de la clave in-
serta en la solapa del volumen en papel. Por último, en el prestigio de las edito-
riales que publican dichas obras que, en principio, avala la fiabilidad de la in-
formación en ellos contenida, puesto que para su elaboración los lexicógrafos se
han basado en ediciones precedentes que han revisado y complementado con
unidades léxicas extraídas de corpus lingüísticos.
Por ejemplo, según se evidencia en las informaciones recogidas en la «Ayuda»
del CU, los compiladores de esta obra han utilizado el Bank of English para la
lengua inglesa, que se corresponde con la versión actual del corpus confeccio-
nado en el antiguo proyecto COBUILD, y el Banco de Español para la lengua
española.
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 255

Por lo que respecta al GDO, los lexicógrafos se han basado en lengua inglesa en
el Oxford English Corpus y en el Oxford English Programme. Sin embargo, no
se ofrecen datos relativos al empleo de un corpus para el español en esta obra.
Por otro lado, la selección de diccionarios se asienta en los resultados del traba-
jo dirigido por Corpas et al. (2001: 248), en el que se corrobora que las obras
que forman parte de nuestro campo de aplicación son las más utilizadas por los
estudiantes de traducción: «en cuanto a los bilingües con el español, los alum-
nos de inglés (B) suelen tener el Oxford, el Collins o ambos». A esta conclusión
llegaron tras analizar las respuestas obtenidas a partir de una serie de cuestiona-
rios que completaron los alumnos de la licenciatura de Traducción de la Univer-
sidad de Málaga.
Otro trabajo de investigación que llega a la misma conclusión fue el realizado
por Fernández Quesada (2009: 149-162), quien al analizar los errores de traduc-
ción de una muestra formada por estudiantes de lenguas en el contexto del es-
pañol como lengua materna vuelve a incidir en el empleo de los diccionarios
seleccionados: «Gran Diccionario Oxford [GDO] (2005) y Collins Dictionary
[CD] (2003)».
Por tanto, una vez acotado el campo de análisis procedemos a describir la meto-
dología que hemos aplicado en nuestro estudio.

4. Metodología de análisis
Dado que realizar un estudio contrastivo de todos los equivalentes de traducción
de las USE pertenecientes al campo de la informática recogidos en la nomencla-
tura de los diccionarios generales bilingües sobrepasaría los límites temporales
y los recursos que tenemos a nuestro alcance, nos hemos decantado por un mé-
todo de trabajo esencialmente descriptivo siguiendo la tradición metodológica
de estudios previos (Rodríguez Reina, 2002; Roberts, 2004) basado en el análi-
sis de muestras extraídas de la nomenclatura.
En consecuencia, nuestra muestra de análisis se circunscribirá a una serie de
equivalentes de traducción propuestos en las entradas de las USE marcadas
diatécnicamente con el campo de la informática y recogidas en la sección de
inglés-español tanto del CU como del GDO.
Por otro lado, consideramos pertinente que dicha muestra esté compuesta por
sustantivos y por verbos. Desde un punto de vista morfosintáctico, el discurso
de la informática, siguiendo un patrón similar al del resto de áreas de conoci-
miento, se caracteriza por el predominio de sustantivos, puesto que, por lo gene-
ral, los conceptos tienden a tomar cuerpo en forma de nominalizaciones (Sager
et al. 1980: 234). No obstante, conviene apuntar que en esta área de conoci-
miento los verbos son considerados elementos de extraordinaria importancia por

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


256 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

cuanto con ellos se expresan acciones que los usuarios deben ejecutar para lle-
var a cabo un determinado algoritmo con el programa informático que están
manejando (Clavería et al. 2001: 99), razón que justifica la inclusión de los
verbos en la muestra de USE.
Por tanto, del listado ofrecido por Ortego Antón (2012: 549-554), en el que se
ofrecen las entradas marcadas diatécnicamente con informática y recogidas en
ambas obras, escogemos aleatoriamente ocho sustantivos y cinco verbos, que
constituirán nuestra muestra de análisis.
1 file
2 flip-flop
3 hacker
4 hardware
5 machine code
6 OCR
7 patch
8 processor
Tabla 1. Muestra de sustantivos
1 display
2 quit
3 reboot
4 save
5 upload
Tabla 2. Muestra de verbos
Una vez delimitada la muestra de análisis, hemos procedido a extraer los equi-
valentes de traducción que se ofrecen en cada uno de los diccionarios seleccio-
nados, como puede constatarse en la Tabla 3. En la primera columna se ofrecen
las USE en lengua inglesa, seguidamente los equivalentes recogidos exclusiva-
mente en el CU, a continuación los equivalentes propuestos en ambas obras y en
la columna de la derecha aquellos equivalentes registrados solamente en el
GDO.
USE CU CU y GDO GDO
file fichero, archivo
circuito basculan-
flip-flop flip-flop
te/biestable
hacker pirata informático hacker
hardware hardware, soporte físico equipo
machine
lenguaje de máquina código máquina
code
OCR LOC, ROC
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 257

patch ajuste parche, patch


procesador, unidad de
processor
proceso
display desplegar visualizar
VI abandonar, VT aban- VI salir de, VT
quit VT terminar
donar salir
reboot reinicializar, reiniciar
save archivar guardar almacenar
upload poner subir cargar
Tabla 3. Equivalentes propuestos en el CU y en el GDO
De la observación de la tabla se desprende que en la mayoría de ocasiones para
una USE en lengua inglesa se ofrecen en cada una de las obras dos o más equi-
valentes, si bien no existen marcas de uso que expliquen qué equivalente esco-
ger en función del contexto o del nivel discursivo.
A continuación, hemos verificado si el tratamiento conferido a dichos equiva-
lentes se corresponde con el uso que llevan a cabo los usuarios de lengua espa-
ñola. Para ello, primeramente hemos cotejado el empleo de dichos equivalentes
en dos corpus especializados: un subcorpus de OPUS y Corpus Tècnic del IU-
LA.
El corpus OPUS es una colección de corpus paralelos compilados en la Univer-
sidad de Uppsala. Tiedermann (2012) señala que dicho corpus está compuesto
de textos originales y de sus traducciones, generalmente procedentes de Inter-
net, que se han convertido a formato XML y se han anotado. Además, se ofrece
una interfaz para realizar las búsquedas, por lo que no es necesario descargar el
corpus, si bien existe dicha posibilidad. En consecuencia, para este estudio he-
mos utilizado el subcorpus OpenOffice, disponible en 6 lenguas con un total de
15 combinaciones, de manera que circunscribiremos el análisis a la combina-
ción de inglés-español, con aproximadamente 500 mil palabras en cada sección.
El Corpus Tècnic del IULA está compuesto por textos escritos en cinco lenguas
diferentes (catalán, español, inglés, francés y alemán) pertenecientes a los cam-
pos de economía, derecho, medio ambiente, medicina e informática. Cada una
de las áreas fue estructurada en diferentes subáreas por un especialista, a fin de
que los textos pudieran recuperarse con mayor precisión temática (Cabré y
Bach, 2004: 164).
CA ES EN FR DE TOTAL
Informática 655000 1227000 338000 194000 83000 2497000
Tabla 4. Palabras pertenecientes al campo de la informática en el Corpus Técnic

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


258 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

La consulta de este corpus se realiza en línea a través de BwanaNet, una interfaz


desarrollada por el IULA en catalán. En primer lugar, hay que escoger la lengua
de búsqueda, en nuestro caso el inglés, y activar la pestaña relativa a consultar
documentos paralelos. A continuación, hay que seleccionar el campo del saber y
los subcampos disponibles así como definir cómo queremos obtener las concor-
dancias: ± 5 palabras o el segmento completo. El motor de búsqueda rastrea 22
documentos, con un total de 266811 palabras. Uno de los obstáculos de esta
interfaz está relacionado con la recuperación de ocurrencias, que se limita a 50,
por lo que no es posible hallar la frecuencia de una USE en el corpus.
Seguidamente hemos corroborado el empleo de los equivalentes en el Corpus
de Referencia del Español Actual (CREA). Este corpus recoge las variedades
estándar del español y actualmente contiene más de 170 millones de formas en
su última versión (3.2.), que data de junio de 2008, procedentes de textos escri-
tos (90 %) y orales (10 %). Ofrece cobertura de los diferentes campos del saber:
ciencia, economía, política, ficción, etc. Fue diseñado para monitorizar la evo-
lución de la lengua española en los últimos 25 años del siglo XX y, además,
según Sánchez (2002; en McEnery et al., 2006) 1, a comienzos del siglo XXI se
incluirían nuevos textos de los años 2000 a 2004. En este corpus hemos realiza-
do las búsquedas a través de la interfaz en línea, acotando los resultados al cam-
po de la informática, si bien también presentamos la frecuencia normalizada sin
limitar los resultados al mencionado subcorpus.
A pesar de que en lengua española actualmente se ha publicado un nuevo cor-
pus, Corpus del Español del Siglo XXI (CORPES XXI), un recurso en construc-
ción que consta de algo más de 160 millones de formas, no hemos considerado
pertinente su utilización para verificar el empleo de los equivalentes. Este recur-
so, en construcción, se compone de textos que proceden de un periodo com-
prendido entre 2001 y 2012 y las obras seleccionadas fueron publicadas en 2008
y 2009. Por tanto, una porción del léxico recogido en dicho corpus no podrá
estar lematizado en los diccionarios que forman nuestro campo de aplicación.
Además, la versión beta está actualizándose periódicamente con la introducción
de nuevos datos, de manera que las búsquedas obtenidas están en continuo
cambio y los resultados podrían verse alterados en función del momento en que
se realizan las mencionadas búsquedas.
Por último, hemos confrontado los equivalentes de las USE seleccionadas con
el empleo que se ofrece en el Corpus del Español (Davies, 2002), de ahora ade-
lante CdE. Este corpus se completó en 2002 y se revisó posteriormente en 2007.
Se compone de 100 millones de palabras cuyo uso abarca del siglo XII al siglo
XX, de las cuales 40 millones pertenecen a los siglos XVIII, XIX y XX. En
consecuencia, hemos circunscrito las búsquedas a textos que datan del siglo
XX, que se clasifican según sean orales o pertenezcan a ficción, a la prensa o al
ámbito académico.
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 259

5. Análisis y resultados

5.1. OpenOffice
En este corpus se evidencia el empleo de seis de las USE de la muestra en len-
gua inglesa, como se puede constatar en la Tabla 5.
USE casos frecuencia normalizada equivalente diccionario
file 50 100 archivo CU y GDO
hardware 1 2 hardware CU y GDO
processor 1 2 procesador CU y GDO
display 6 12 visualizar CU y GDO
save 11 22 guardar CU y GDO
upload 1 1 cargar GDO
Tabla 5. USE y equivalentes de traducción recogidos en el subcorpus OpenOffice
La escasa aparición de las USE de la muestra en este corpus técnico podría de-
berse a que ante el alto grado de especialización solo se recogen aquellas USE
relacionadas con los comandos utilizados en el programa informático. Además,
podemos afirmar que la mayoría de los equivalentes de traducción se corres-
ponden con las propuestas en las entradas de ambos diccionarios (5), de hecho,
solamente uno de ellos están únicamente registrados en el GDO.

5.2. Corpus Tècnic del IULA


Durante la consulta de este corpus constatamos que la alineación de los segmen-
tos no se lleva a cabo con el debido rigor, por lo que no hemos encontrado equi-
valente en varias de las USE consultadas, que hemos señalado con el signo «?».
USE equivalente diccionario
file archivo, fichero CU y GDO
hacker ?
hardware hardware CU y GDO
machine code ?
processor procesador CU y GDO
ver
mostrar
display
visualizar CU y GDO
reproducir
quit ?

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


260 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

reiniciar CU y GDO
reboot rearrancar
guardar CU y GDO
save grabar
upload ?
Tabla 6. Equivalentes recogidos en el Corpus Tècnic
Por lo que respecta a los equivalentes, en seis de las USE se ofrecen equivalen-
tes recogidos tanto en el CU como en el GDO, una cifra similar a la obtenida en
OpenOffice, el subcorpus de OPUS.
No obstante, nos llama la atención el caso de «OCR», puesto que en este corpus
se utiliza como equivalente el préstamo en español, «OCR», en tanto que en los
diccionarios consultados se ofrece la adaptación en lengua española: «LOC» y
«ROC».

5.3. CREA
Respecto a si el empleo de los equivalentes propuestos en el CU y en el GDO se
registra en el CREA, procedemos a mostrar los resultados en la Tabla 7. Ade-
más, en la última columna se ofrece la frecuencia normalizada sin limitar los
resultados al campo de la informática, con el objetivo de poder realizar un estu-
dio comparativo entre los corpus de referencia del español seleccionados.
frecuencia
casos en infor-
USE equivalente documentos normali-
mática
zada
fichero (CU y GDO) 419 66 3.64
file
archivo (CU y GDO) 1499 194 25.75
circuito basculante (CU) - - -
flip-flop circuito biestable (CU) 1 1 0.00
flip-flop (CU y GDO) 3 1 0.01
hacker (GDO) 24 9 0.38
hacker pirata informático (CU y 0.09
GDO) 14 12
hardware (CU y GDO) 217 81 2.80
hardwa- 0.32
re soporte físico (CU y GDO) 3 3
equipo (GDO) 909 267 250.48
machine lenguaje de máquina (CU) 7 1 0.05
code código máquina (GDO) 26 3 0.17
OCR LOC (CU y GDO) - - -
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 261

ROC (CU y GDO) - - -


ajuste (CU) 60 26 22.90
patch parche (GDO) 52 28 2.26
patch (GDO) - - -
procesador (CU y GDO) 400 126 4.69
proces-
sor unidad de proceso (CU y -
GDO) - -
desplegar (CU) 23 11 3.27
display
visualizar (CU y GDO) 73 26 3.30
terminar (CU) 49 25 54.26
quit abandonar (CU y GDO) 11 9 41.30
salir (GDO) 92 51 147.13
reinicializar 2 1 0.01
reboot
reiniciar (CU y GDO) 33 24 34.92
archivar (CU) 16 7 1.26
save guardar (CU y GDO) 131 54 18.86
almacenar (GDO) 182 45 5.09
poner (CU) 185 96 129.27
upload subir (CU y GDO) 28 13 34.93
cargar (GDO) 56 35 9.14
Tabla 7. Empleo de equivalentes de traducción en el CREA
De los 32 equivalentes propuestos en nuestra selección de diccionarios, el em-
pleo de cinco de ellos no se registra en el CREA, que se corresponden con «cir-
cuito basculante», «LOC», «ROC», «patch» y «unidad de proceso». Por diccio-
narios, tres de estos equivalentes se proponen en ambos diccionarios («LOC»,
«ROC» y «unidad de proceso»), uno aparece solamente en el CU («circuito
basculante») y otro en el GDO («patch»).
Además, la frecuencia de aparición de cuatro de los equivalentes se limite a un
texto, por lo que consideramos que su uso es muy restringido. Dichos equiva-
lentes se corresponden con «circuito biestable», «flip-flop», «lenguaje de má-
quina» y «reinicializar». Dos de ellos se recogen en ambas obras («flip-flop» y
«reinicializar») y los otros dos únicamente en el CU («circuito biestable» y
«lenguaje de máquina»).
La distribución de estos datos por porcentajes se presenta en el Gráfico 1, en el
que se pone de manifiesto que un 16 % de los equivalentes de traducción inclui-
dos en las entradas del CU y del GDO no se recoge en el CREA y, además, un
12 % se reduce a un solo texto, por lo que podríamos afirmar que no tenemos

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


262 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

constancia del empleo de más del 25 % de los equivalentes propuestos en ambas


obras.

Gráfico 1. Usos recogidos en el CREA de los equivalentes registrados en el CU y en el


GDO
Por diccionarios, en el CU se proponen 24 equivalentes de traducción, cuyo uso
se ejemplifica en el CREA, tal y como se recoge en el Gráfico 2. De nuevo, los
datos que se desprenden de dicho gráfico muestran que un tercio de los equiva-
lentes propuestos en esta obra no se suelen utilizar en español.

Gráfico 2. Usos recogidos en el CREA de los equivalentes registrados en el CU


Por lo que respecta al GDO, la distribución porcentual de los 24 equivalentes
propuestos se ofrece en el Gráfico 3. En esta obra, la cifra de equivalentes de
traducción propuestos de los que no tenemos constancia de uso disminuye hasta
el 25 %.
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 263

Gráfico 3. Usos recogidos en el CREA de los equivalentes registrados en el GDO


Si comparamos los resultados obtenidos, observamos que la media de inclusión
de equivalentes se sitúa en el 72 %, de manera que la cifra de equivalentes cuyo
uso se evidencia en el CREA es ligeramente superior en el GDO (75 %) que en
el CU (67 %).

5.4. CdE
Los resultados que se obtienen de contrastar en el CdE la utilización de los
equivalentes propuestos en el CU y en el GDO siguiendo una metodología simi-
lar a la empleada en el CREA se ofrecen en la Tabla 8.
casos en informá- frecuencia normali-
USE equivalente
tica zada
fichero (CU y GDO) 73 3.20
file
archivo (CU y GDO) 487 21.34
circuito basculante (CU) - -
flip-flop circuito biestable (CU) 1 0.04
flip-flop (CU y GDO) 2 0.09
hacker (GDO) 2 0.09
hacker pirata informático (CU y
GDO) 1 0.40
hardware (CU y GDO) 32 1.40
hardwa-
re soporte físico (CU y GDO) 2 0.09
equipo (GDO) 27 1.18
machine lenguaje de máquina (CU) 1 0.04
code código máquina (GDO) 1 0.04
OCR LOC (CU y GDO) - -

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


264 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

ROC (CU y GDO) - -


ajuste (CU) 246 10.78
patch parche (GDO) 86 3.77
patch (GDO) - -
proces- procesador (CU y GDO) 96 4.21
sor unidad de proceso (CU y
GDO) 3 0.13
desplegar (CU) 1 0.04
display
visualizar (CU y GDO) 2 0.09
terminar (CU) - 45.53
quit abandonar (CU y GDO) - 30.28
salir (GDO) - 128.65
reinicializar (CU y GDO) - -
reboot
reiniciar (CU y GDO) 1 0.04
archivar (CU) - 0.57
save guardar (CU y GDO) - 11.96
almacenar (GDO) 5 0.22
poner (CU) - 93.59
upload subir (CU y GDO) - 28.52
cargar (GDO) - 8.33
Tabla 8. Empleo de equivalentes de traducción en el CdE
A la vista de estos resultados, nos llama la atención que los verbos se incluyen
en el CdE con carácter general y, tras realizar varias búsquedas con colocados
especializados, por ejemplo «salir» con «archivo», «programa» o «aplicación»,
el empleo de dichas unidades con significado especializado no se recoge en este
corpus.
En consecuencia, de los 32 equivalentes de la muestra, observamos que la utili-
zación de trece de ellos no se registra en este corpus. Por diccionarios, seis apa-
recen en ambos diccionarios («LOC», «ROC», «abandonar», «reinicializar»,
«guardar» y «subir»), cuatro únicamente en el CU («circuito basculante», «ter-
minar», «archivar» y «poner») y tres en el GDO («patch», «salir» y «cargar»).
Además, constatamos que la distribución por textos de varios de los equivalen-
tes registrados en los diccionarios se limita a un único documento, ya se recoja
el equivalente en ambos diccionarios («pirata informático» y «reiniciar»), sola-
mente en el CU («circuito biestable», «lenguaje de máquina» y «desplegar») o
únicamente en el GDO («código máquina»).
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 265

La distribución de estos datos por porcentajes se presenta en el Gráfico 4. Se


observa que solamente se muestran ejemplos del empleo del 40 % de los equi-
valentes de traducción de las USE del campo de la informática.

Gráfico 4. Usos recogidos en el CdE de los equivalentes registrados en el CU y en el


GDO
Por diccionarios, los usos recogidos en el CU disminuyen al 37 % respecto a la
tendencia general.

Gráfico 5. Usos recogidos en el CdE de los equivalentes registrados en el CU


Por lo que respecta al GDO, la distribución porcentual de los 24 equivalentes
propuestos se muestra en el gráfico verde y constatamos que los usos de los
equivalentes propuestos son superiores a la media, puesto que representan el
50 %.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


266 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

Gráfico 6. Usos recogidos en el CdE de los equivalentes registrados en el GDO

5.5. Comparativa de resultados


Son varios los equivalentes propuestos en el CU y en el GDO que no se recogen
en los corpus analizados, de manera que sospechamos que los equivalentes de
dichas USE no se emplearán en lengua española. Dichos equivalentes se corres-
ponden con «circuito basculante» (flip-flop), «LOC» y «ROC» (OCR) y «patch»
como equivalente de la misma denominación en lengua inglesa.
Además, tras contrastar los datos del CREA y del CdE, los siguientes equivalen-
tes, «circuito biestable», «lenguaje de máquina» y «reinicializar», solo se reco-
gen en un documento, por lo que constatamos que su uso es bastante limitado.
Por porcentajes, en un 12 % de los casos no tenemos constancia del empleo de
los equivalentes propuestos y en casi un 10 % el empleo es dudoso a la vista de
los resultados obtenidos, de manera que podemos afirmar que casi el 25 % de
los equivalentes propuestos en la muestra no se emplean en lengua española.
Por otro lado, constatamos que las cifras de inclusión de los equivalentes en los
corpus analizados son superiores en el GDO que en el CU, aunque mostramos
cautela a la hora de decantarnos por uno u otro diccionario, puesto que habría
que analizar otros parámetros como la inclusión y el marcado diatécnico de las
USE.
Asimismo, atendiendo a los datos que se desprende del análisis de las frecuen-
cias normalizadas en los corpus de referencia, en los casos en que se ofrecen
dos o más equivalentes, observamos que en uno de los equivalentes propuestos
la frecuencia de uso es superior, por ejemplo «archivo» predomina sobre «fiche-
ro». No obstante, en posteriores estudios sería interesante comprobar si la elec-
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 267

ción de una determinada USE está relacionada con una determinada variedad
diatópica de la lengua española.

6. Conclusiones
Con los datos recabados y con los resultados obtenidos hemos extraído las con-
clusiones, que ponen de manifiesto los diversos obstáculos a los que están ex-
puestos los usuarios de los diccionarios electrónicos bilingües y, en especial, los
traductores e intérpretes.
Por un lado, el tratamiento conferido a los equivalentes de las USE del campo
de la informática que se emplean en el discurso divulgativo en los diccionarios
generales bilingües de inglés-español adolece de la deseada sistematicidad,
puesto que aproximadamente un tercio de los equivalentes propuestos no suelen
emplearse en lengua española, con los problemas que se derivan de este hecho
para los usuarios de estas obras y, en especial, para los traductores e intérpretes,
que se verán obligados a utilizar otras herramientas para corroborar si la infor-
mación recogida en este tipo de obras se emplea en lengua española.
Por otro lado, en función de la obra que consulten, los usuarios encontrarán
varias alternativas que, en ocasiones, no siempre se emplean en lengua españo-
la, por lo que una vez más incidimos en la importancia de complementar el uso
de diccionarios generales bilingües con el contraste de los resultados en corpus
de referencia, por ejemplo CORPES XXI.
En consecuencia, nuestra función como docentes va encaminada a mejorar en la
medida de lo posible la formación documental de traductores e intérpretes, hasta
que los editores en las nuevas ediciones de la obras solventen los obstáculos
detectados en cuanto a los equivalentes de traducción propuestos.

7. Bibliografía
Atkins, B. T. Sue y Krista Varantola. 1998a. Language Learners Using Dictionaries:
The Final Report on the EURALEX/AILA Research Project on Dictionary
Use. @ B. T. S. Atkins, ed. Using Dictionaries: Studies of Dictionary Use by
Language Learners and Traslators, Tübingen: Max Niemeyer Verlag. ISBN
9783484309883, pp. 21–81.
Atkins, B. T. Sue y Krista Varantola. 1998b. Monitoring Dictionary Use. @ B. T. S.
Atkins, ed. Using Dictionaries: Studies of Dictionary Use by Language Learn-
ers and Traslators, Tübingen: Max Niemeyer Verlag. ISBN 9783484309883,
pp. 83–122.
Boulanger, Jean-Claude. 2001. L'aménagement des marques d'usage technolectales dans
les dictionnaires généraux bilingues. @ J. Pruvost, ed. Les dictionnaires de la
langue française. Paris: Honoré Champion. ISBN 2130525156, pp. 247-271.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


268 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

Bowker, Lynne. 2012. Meeting the Needs of Translators in the Age of e-Lexicography.
@ S. Granger y M. Paquot, eds. Electronic Lexicography. Oxford: Oxford
University Press. ISBN 9780199654864, pp. 379-397.
Cabré, Mª Teresa y Carmen Bach. 2004. El corpus tècnic del IULA: corpus técnico
especializado bilingüe. @ Panace@, 16/5: 173-176.
Cabré, Mª Teresa et al. 2013. Corpus Técnic. Barcelona: IULA. Disponible en
<http://bwananet.iula.upf.edu/> Consultado el 10-9-2014.
Clavería, Gloria, Carmen Morales y Joan Torruella. 2001. La terminología informática
en español. @ M. Bargalló et al., eds. Las lenguas de especialidad y su didácti-
ca. Tarragona: Universitat Rovira i Virgili. ISBN 8484240363, pp. 91-102.
Corpas Pastor, Gloria, Jorge Leiva Rojo y María-José Varela Salinas. 2001. El papel del
diccionario en la formación de traductores e intérpretes: análisis de necesidades
y encuestas de uso. @ M. C. Alaya Castro, coord. Diccionarios y enseñanza,
Alcalá de Henares: Universidad de Alcalá. ISBN 9788481384307, pp. 239–
273.
Davies, Mark. 2002. Corpus del Español: 100 million words, 1200s-1900s. Disponible
en <http://www.corpusdelespanol.org> Consultado el 18-3-2014.
Durán Muñoz, Isabel. 2010. Specialised Lexicographical Resources: a Survey of Trans-
lators’ Needs. @ S. Granger y M. Paquot, eds. eLexicography in the 21st cen-
tury: New Challenges, New applications. Proceedings of ELEX 2009, Cahiers
du Cendal. Louvain-la-Neuve: Presses Universtaires de Louvaine-La-Neuve.
ISBN 9782874632112, pp. 55-66.
Fernández Quesada, Nuria. 2009. El diccionario bilingüe y los errores de traducción en
los estudiantes de inglés como lengua ‘c’. @ J. M. García Platero y M. A. Cas-
tillo Carballo, eds. Investigación lexicográfica para la enseñanza de lenguas,
Málaga: Servicio de Publicaciones de la Universidad de Málaga. ISBN
9788497472982, pp. 149–163.
Gallimberti, Beatriz y Roy Russel, eds. 2008. Gran Diccionario Oxford: Español- In-
glés, Inglés-Español. 4ª ed. Oxford: Oxford University Press. ISBN
9780199547357.
Hastings, Andrew. 2000. El diccionario inglés-español, español-inglés como herramien-
ta para el traductor. @ R. C. Gonzalo García y V. García Yebra, eds. Docu-
mentación, terminología y traducción. Madrid: Síntesis. ISBN
9788477387480, pp. 109–122.
Jessen, Anette. 1996. The Presence and Treatment of Terms in General Dictionaries.
M. A. Thesis. Ottawa: University of Ottawa. Disponible en
<http://www.ruor.uottawa.ca/en/handle/10393/4427> Consultado el 10-9-2014.
Josselin, Amélie. 2005. Place et rôle des terminologies dans les dictionnaires généraux
unilingues et bilingues. Étude d'un domaine de spécialité: Volcanologie. Tesis
doctoral. Lyon: Université Lumière Lyon II, Centre de Recherche en Termino-
logie et Traduction. Disponible en <http://theses.univ-
LOS EQUIVALENTES DE LA INFORMÁTICA EN LOS DICCIONARIOS GENERALES BILINGÜES… 269

lyon2.fr/documents/lyon2/2005/josselin_a#p=0&a=top> Consultado el 7-2-


2014.
Landau, Sydney I. 2001. Dictionaries. The Art and Craft of Lexicography. 2nd Edition.
Cambridge: Cambridge University Press. ISBN 9780521785129.
Mackintosh, Kristen. 1998. An Empirical Study of Dictionary Use in L2-L1 Transla-
tion. @ B. T. S. Atkins, ed. Using Dictionaries: Studies of Dictionary Use by
Language Learners and Traslators, Tübingen: Max Niemeyer Verlag. ISBN
9783484309883, pp. 123–149.
Meyer, Ingrid. 1988. The General Bilingual Dictionary as a Working Tool in ‘Thème’.
@ Meta 33/3: 368–376.
Ortego Antón, María Teresa. 2012. Estudio contrastivo inglés/español del tratamiento
del léxico especializado recogido en los diccionarios generales bilingües: Co-
llins Universal y Gran Diccionario Oxford. Tesis doctoral. Soria: Universidad
de Valladolid. ISBN 9788480218337. Disponible en
<http://uvadoc.uva.es/handle/10324/2022> Consultado el 9-3-2014.
Real Academia Española. 2014. Corpus del Español del Siglo XXI (CORPES XXI).
Disponible en <http://www.rae.es> Consultado el 18-3-2014.
Real Academia Española. 2001. Corpus de Referencia del Español Actual
(CREA). Disponible en <http://www.rae.es> Consultado el 18-3-2014.
Roberts, Roda P. 1997. Using Dictionaries Efficiently. 38th Annual Conference of the
American Translators Association. San Francisco, California.
Roberts, Roda P. 2004. Terms in General Dictionaries. @ J. M. Bravo Gozalo, ed. A
New Spectrum of Translation Studies. Valladolid: Universidad de Valladolid.
ISBN 9788484483182, pp. 121–140.
Roberts, Roda P. y Amélie Josselin. 2005. Le traitement des termes dans les diction-
naires généraux. @ H. Bejoint y F. Maniez, eds. De la mesure dans les termes.
Hommage à Philippe Thoiron. Lyon: Presses Universitaires de Lyon. ISBN
9782729707828, pp. 324-348.
Rodríguez Reina, Mª Pilar. 2002. Las marcas de especialidad: Una cuenta pendiente de
difícil solución. @ G. Guerrero Ramos y M. F. Pérez Lagos, eds. Panorama
actual de la terminología, Granada: Comares. ISBN 9788484445326, pp. 327-
357.
Schriven, Rob, Catherine Love y Gaëlle Amiot-Cadley, eds. 2009. Collins Universal
Español-Inglés, English-Spanish, 9ª ed. Barcelona: Random House Mon-
dadori/Glasgow: Harper Collins Publishers. ISBN 9788425343179.
Sager, Juan C., David Dungworth, y Peter F Mcdonald. 1980. English Special Lan-
guage. Principles and Practice in Science and Technology. Wiesbaden: Oscar
Brandstetter. ISBN 9783870970949.
Sierra Soriano, Ascensión. 2001. El diccionario bilingüe. Estructura y nomenclatura.
Alicante: Editorial Club Universitario. ISBN

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


270 MARÍA TERESA ORTEGO Y PURIFICACIÓN FERNÁNDEZ

Thoiron, Philippe. 1998. Place et rôle de la terminologie dans les dictionnaires bilingues
non spécialisés. Le cas de la terminologie médicale dans le Dictionnaire Ha-
chette-Oxford (français-anglais). @ S. Mellet y M. Vuillaume, eds. Mots chif-
frés et déchiffrés. Paris: Honoré Champion. ISBN 9782852038943, pp. 621-
650.
Tiedemann, Jörg. 2012. Parallel Data, Tools and Interfaces in OPUS. @ N. Calzolari et
al., ed. Proceedings of the 8th International Conference on Language Re-
sources and Evaluation (LREC'2012). Istambul: European Language Resour-
ces Association. ISBN 9782951740877. Disponible en <http://www.lrec-
conf.org/proceedings/lrec2012/pdf/463_Paper.pdf> Consultado el 18-3-2014.

1
McEnery, Anthony, Xiao, Richard y Tono, Yukio. 2006. Corpus Based Language Studies: An
Advanced Resource Book. London: Routledge. ISBN 9780415286237.
Análisis cualitativo de textos con un programa
CAQDAS

[Qualitative text analysis with a CAQDAS]


KARIN VILAR SÁNCHEZ
Universidad de Granada
kvilars@ugr.es
Resumen
Presentamos aquí un ejemplo de análisis cualitativo de textos mediante la utilización de
un programa CAQDAS (Computer Assisted Qualitative Data Analysis Software):
Atlas.ti. El análisis se realiza sobre dos corpus de textos pertenecientes a un tipo de
texto determinado, en español y en alemán, la reseña de libros científicos sobre temas
lingüísticos, y en base a las microfunciones representativas del mismo. Primero se loca-
lizan las microfunciones en los textos y después se clasifican todas las citas asociadas a
una o varias de ellas según su materialización lingüística. El resultado es un documento
altamente complejo y dinámico que permite ver la macro y microestructura del tipo de
texto en cuestión, en cada idioma, por separado, o de forma comparativa. Todos los
datos pueden apreciarse en sus contextos reales, aspecto muy relevante a la hora de
traducir los textos.
Abstract
An example of qualitative textual analysis by means of a CAQDAS (Computer Assisted
Qualitative Data Analysis Software) is presented: Atlas.ti. The investigation is based on
the analysis of the representative micro-functions of two text corpora belonging to the
same text type, reviews of scientific books on linguistics, in Spanish and German. First-
ly, the micro-functions are located in the texts, and afterwards all the citations associat-
ed with them are classified according to their linguistic realization. The result is a highly
complex and dynamic document that shows the macro and microstructure of the text
type in question, in each language separately and/or comparatively in both. All data can
be regarded in their real contexts, a relevant aspect in view of the translation of the
texts.
Palabras clave
Análisis cualitativo de textos, análisis comparativo de textos, análisis funcional, traduc-
ción español-alemán, reseña de libros científicos
Keywords
Qualitative text analysis, comparative text analysis, functional analysis, translation
Spanish-German, review of scientific books

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
272 KARIN VILAR SÁNCHEZ

1. Introducción
Quiero introducir este trabajo con una pequeña anécdota. Un compañero mío,
español, se sintió molesto por la reseña que un colega alemán, que él descono-
cía, hizo sobre su último libro. La reseña estaba redactada en alemán y era obvio
que su autor estaba realmente interesado por la obra, ya que había realizado un
análisis exhaustivo y profundo, señalando los múltiples puntos fuertes del libro,
pero comentando también sus escasos puntos débiles. Sin duda, a mí que soy
alemana, me hubiese gustado que un libro mío hubiese sido el objeto de tal re-
seña. Pero sin embargo, para mi colega parecía constituir casi una ofensa. Las
reacciones tan opuestas de dos especialistas del mismo campo del saber ante un
texto especializado, me hizo pensar que posiblemente este tipo de texto especí-
fico no estaba sujeto a las mismas convenciones en ambas lenguas. Quizás, en
contra de lo que yo pensaba y de forma diferente al alemán, en español la crítica
negativa no formaba parte de una reseña cuando una obra se consideraba buena.
Las definiciones que encontré en ambas lenguas no corroboraron esta hipótesis
ya que coinciden en nombrar dos momentos principales de la reseña, el descrip-
tivo y el crítico. Según el Diccionario de Uso de María Moliner, reseñar es «dar
noticia en un periódico de una obra literaria o científica, haciendo su crítica o
algún comentario sobre ella» y según el Duden (1996) una reseña (Rezension)
es una «kritische Besprechung eines Buches, einer wissenschaftlichen Veröf-
fentlichung, künstlerischen Darstellung o.Ä., bes. in einer Zeitung od. Zeitsch-
rift». Las obras que se ocupan de forma más intensa con este tipo de texto am-
plían dichas definiciones, manteniendo sin embargo los dos momentos principa-
les nombrados. En cuanto a los objetivos principales de la reseña crítica en el
ámbito académico, Sánchez (2006) que dedica un apartado completo a la reseña
crítica, detalla dos propósitos: «— Dar noticias de las nuevas publicaciones
facilitando su divulgación» y «— Valorar de manera razonada y crítica las obras
de reciente aparición y orientar a especialistas» (Sánchez 2006: 474). Sin em-
bargo, entre otras normas que «pueden considerarse como punto de partida para
la materialización de la reseña», como la lectura atenta de la obra, la descripción
de los contenidos y la estructura de la misma, y su evaluación en función del
cumplimiento de los objetivos establecidos por el autor, recomienda «evitar un
tratamiento de menosprecio sobre el libro y el autor». Aunque sea de forma
indirecta, Sánchez advierte del peligro de herir la sensibilidad del autor de la
obra reseñada. Es un aspecto que en los estudios alemanes sobre el mismo tipo
de texto no se tiene en cuenta. Aparte de los aspectos descriptivo y crítico, des-
tacando e insistiendo sobre todo en el segundo, en dichos trabajos se incluyen
de forma más explícita los actos ilocucionarios de recomendar o desaconsejar,
siempre basados en los resultados del análisis realizado (Jokubeit 1980: 90 ss;
Ripfel 1998; Gläser 1990: 109 ss). Es decir, el crítico no sólo describe y evalúa
sino que influye de forma directa en la acción del posible lector o comprador de
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 273

la obra. Esta breve comparación de lo que en ambas lenguas se entiende por una
reseña crítica deja patente la consideración que tiene el español con la imagen
pública (face-keeping) de sus interlocutores (directos e indirectos), en compara-
ción con el respeto que el alemán tiene por la precisión científica de la obra:
«Überprüft werden die wissenschaftlichen Kardinaltugenden: Erkenntnis-
fortschritt, methodische Sauberkeit, Verständlichkeit, Klarheit, Logik der
Darstellung und Argumentation» (Zillig 1982: 202 ss).
En lo que sigue, trataré de aclarar las observaciones que hasta ahora he hecho de
forma empírica, realizando un estudio cualitativo de este tipo de texto, en espa-
ñol y en alemán. Para ello utilizaré el programa Atlas.ti que permite abarcar un
amplio número de textos y gestionar los datos del análisis de una forma práctica
y efectiva. El enfoque metodológico utilizado será el del análisis microfuncio-
nal. Con análisis microfuncional me refiero a un enfoque de investigación que
parte de las funciones comunicativas, pragmáticas o semántico-gramaticales que
constituyen un tipo de texto determinado para llegar así a sus materializaciones
lingüísticas representativas. Conocer estas microfunciones y sus realizaciones
en un tipo de texto determinado, ayuda enormemente a producir textos estilísti-
ca y conceptualmente adecuados 1. En el pasado ya hemos realizado diversos
estudios microfuncionales de distintos tipos de texto, en español y en alemán,
utilizando el programa de Atlas.ti: contratos de trabajo (Vilar ed. 2007), garan-
tías de electrodomésticos (Vilar 2014b), reclamaciones (Vilar 2014a), etc.

2. El análisis con Atlas.ti

2.1. El programa
Atlas.ti es un programa de análisis cualitativo de textos que fue creado en un
principio para el ámbito de la sociología o la psicología, donde se realizan análi-
sis profundos de entrevistas. Con Atlas.ti se parte del material textual y a partir
de la interpretación del contenido de éste, se asocian las categorías correspon-
dientes a un interés científico determinado. Esta metodología hace que el pro-
grama resulte también ser una herramienta excelente para el análisis de textos
en el ámbito de la lingüística, más concretamente para el enfoque onomasioló-
gico donde el investigador parte del significado que se encuentra en el nivel
profundo de un texto para, a partir de éste, llegar al nivel superficial, es decir, al
recurso lingüístico utilizado. Esto significa empero que la búsqueda no puede
realizarse de forma automática. No obstante, el programa facilita enormemente
el trabajo de análisis porque permite al investigador centrarse en enjuiciamien-
tos lingüísticos complejos mientras que el ordenador se ocupa de registrar y
ordenar los datos. Por consiguiente Atlas.ti no es el programa apropiado para
realizar meros análisis cuantitativos. Para conocer la frecuencia de uso de ele-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


274 KARIN VILAR SÁNCHEZ

mentos del nivel superficial del texto como pueden ser elementos léxicos, gra-
maticales o estructurales, o para investigar la asociación de alguno de estos
elementos con un factor extralingüístico, por ejemplo un registro, un dialecto,
una variante histórica u otros muchos más, hay otros programas más adecuados.
Con el programa Atlas.ti (http://www.atlasti.com/index.html) se trabaja en una
misma unidad hermenéutica con corpus de todo tipo de documentos, escritos,
gráficos, audio y vídeo. El programa facilita la codificación de los documentos
primarios en los más diversos niveles (conceptual, funcional, léxico, gramatical,
pragmático, gráfico, visual, auditivo, fonético, etc.), en base al interés herme-
néutico del investigador, y hace posible relacionar todos los datos de tal forma
que permite comprobar en pocos instantes todo tipo de hipótesis relacionadas
con la interrelación de los datos. El programa ayuda además a presentar de for-
ma clara incluso grandes cantidades de datos y resultados y a exportarlos en
diversos formatos.

2.2. El corpus
En nuestro caso concreto hemos trabajado con 36 textos escritos, 18 reseñas
críticas sobre temas de lingüística en español, y 18 textos en alemán 2. Los tex-
tos españoles proceden de «Lingüística en la red: reseñas»
(http://www.linred.es/resenas.htm ) y tienen una longitud media de 2.345 pala-
bras. Los textos alemanes fueron tomados de «Zeitschrift für Rezensionen zur
germanistischen Sprachwissenschaft» (http://www.degruyter.com/view/j/zrs) y
tienen una extensión media de 2.092 palabras. Es decir, en cuanto a la proce-
dencia, la extensión así como a su temática, los textos de ambos corpus son
comparables y deberían servir para comprobar mi hipótesis de que en los textos
alemanes la crítica negativa se realiza con más frecuencia y naturalidad que en
los textos españoles. Naturalmente, he procurado que todos los textos en ambas
lenguas procedan de diferentes autores y que éstos además sean nativos.

2.3. Los códigos


Los códigos son la entidad básica para el análisis con Atlas.ti. Están pensados
para marcar y clasificar todos aquellos significados que el investigador busca en
función de su interés hermenéutico. En el ámbito psicológico o sociológico,
donde más se utiliza el programa, los códigos podrían hacer referencia a actitu-
des o sentimientos como por ejemplo el rechazo de determinados grupos socia-
les o el miedo ante ciertas situaciones. En nuestro análisis, el análisis microfun-
cional, los códigos corresponden a las microfunciones y posibles funciones más
generales, es decir, a entidades funcionales o conceptos mentales. Dado este
enfoque y puesto que lo que desconocemos y queremos conocer es justamente
la forma material correspondiente a un significado, la localización de las partes
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 275

del texto que expresan lo que se ha definido en los códigos, lógicamente no


puede realizarse de forma automática. Esto significa además que todos los tex-
tos han de ser leídos muy detenidamente, palabra por palabra, para así detectar
la información que buscamos. Se trata pues de un trabajo laborioso que requiere
la interpretación del ser humano.
En el caso de las reseñas críticas y dado nuestro interés hermenéutico especial,
es la crítica negativa el significado que nos interesa en primer lugar y por ello
constituye nuestra función primaria o supercódigo 3 principal. Sólo después de
localizar todas las partes de los textos que expresan alguna crítica negativa, y en
función del contenido concreto, pueden determinarse las microfunciones. Para
asegurar una interpretación homogénea definimos crítica negativa como «decir
algo negativo sobre la obra que se reseña o decir que no cumple con las expec-
tativas que tiene el lector experto de la misma». Ejemplos del alemán:
«Abgesehen von der hier durchaus fragwürdigen Argumentation deutet vieles
schlicht auf eine unzureichende Evaluation der Kontexte hin» (evaluación abier-
tamente negativa: unzureichend) o «Es folgt ein Exzerpt aus Schillers «Der
Jüngling am Bache» (ohne Titel und Quellenangabe)» (no cumple con las ex-
pectativas del lector experto ya que éste suele esperar que se incluya el título y
la fuente). Ejemplos del español: «Las marcas sobre la variación dialectal, evi-
dentemente, se quedan muy cortas en este sentido» (evaluación abiertamente
negativa: muy cortas) o «[…] no se trascienden los problemas más ordinarios de
la fraseología» (no cumple con las expectativas del lector experto puesto que
éste espera que en una obra especializada sí se trasciendan los problemas más
ordinarios de la fraseología). A pesar de que las definiciones exactas ayudan a
favorecer una interpretación homogénea, inevitablemente, siempre se producen
casos que escapan a una interpretación perfectamente objetiva, dado que la in-
terpretación no sólo depende de las expectativas del lector experto sino también
de las expectativas personales de cada individuo: «Allerdings ist die Studie
nichts für eilige Leser» (el lector concreto, ¿qué tipo de lector es, un lector rápi-
do o lento?), o de su escala de valores «Dies soll ein Versuch sein, die nur teil-
weise vorhandene griechische Terminologie zu vervollständigen» (¿Es suficien-
te con intentar algo o solo cuentan los logros?). Una posible ayuda en los casos
de interpretación dudosa es la reformulación de una crítica subjetivamente nega-
tiva con palabras que expresan la crítica negativa de forma más directa: «Das
suggeriert eine Kontinuität der Basisdialekte, die man für das Alemannische
vielleicht nicht unbedingt, für andere Dialektgebiete aber kategorisch bestreiten
muss»  «Was der Autor suggeriert ist nicht korrekt».

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


276 KARIN VILAR SÁNCHEZ

3. Resultados

3.1. El nivel conceptual


Como ya hemos mencionado, nuestro interés hermenéutico nos obliga a dife-
renciar dos niveles conceptuales, la crítica negativa, en general, y las diversas
realizaciones conceptuales de la misma, que categorizamos en microfunciones.
Finalmente, se describirán las realizaciones lingüísticas concretas de cada mi-
crofunción.

Gráfico 1. Niveles de análisis

3.1.1. Función general: crítica negativa


La primera diferencia significativa se manifiesta en la representación numérica
de la crítica negativa en los textos de ambas lenguas. En los textos alemanes se
detectaron en total 151 citas que expresan una crítica negativa, en cambio, en
los textos españoles solamente fueron 26. Pero más interesante aún que la mera
diferencia numérica es la distribución de la crítica negativa en los textos. En los
textos alemanes se produce en 15 de 18 textos, en español sólo en 7 de 18 tex-
tos. Por lo tanto, en alemán, se trata de una función bastante representativa
mientras que en español lo es mucho menos. En lo que sigue, observaremos la
materialización concreta de la crítica negativa en ambas lenguas. En primer
lugar examinaremos mediante qué microfunciones se realiza, o sea, qué recurso
conceptual se utiliza para criticar, y después analizaremos los medios lingüísti-
cos utilizados.

3.1.2. Microfunciones
Como ya hemos mencionado, las microfunciones hacen referencia a conceptos
abstractos que resultan ser de relevancia en un tipo de texto determinado. Son
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 277

las unidades o intenciones comunicativas más pequeñas que se encuentran en el


nivel suprareferencial. En los gráficos exportados de la unidad hermenéutica del
programa Atlas.ti, en la que analizamos todas las reseñas, se puede observar que
la crítica negativa se realiza mediante una serie de microfunciones: decir que
algo no es correcto (corrección), decir que algo no es como debe ser (no es co-
mo debe ser), decir que el autor no hace algo considerado necesario (no hacer
algo considerado necesario), decir que algo no es claro (claridad), decir que
hay demasiado poco o mucho (cantidad), proponer una mejora (propuesta de
mejora), decir que algo es necesario o innecesario (necesidad) y valoración
negativa en general (misceláneo).

Gráfico 2. Desglose en microfunciones de la crítica negativa en alemán (Nota: El pri-


mer número entre paréntesis hace referencia a la cantidad de citas en todos los textos
analizados.)

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


278 KARIN VILAR SÁNCHEZ

Gráfico 3. Desglose en microfunciones de la crítica negativa en español


Salvo que en español no se utiliza en ningún caso la microfunción de decir que
algo es necesario o innecesario (necesidad), la diversidad de microfunciones es
prácticamente idéntica en ambas lenguas y lo que es más importante, en las dos
se utilizan las mismas. Sin embargo, la representatividad numérica absoluta de
la crítica negativa y de las microfunciones que la materializan difiere bastante
de una lengua a otra:
alemán español
corrección 33 5
no hacer algo consi-
22 4
derado necesario
no es como debe ser 21 10
claridad 23 1
cantidad 17 2
misceláneo 16 1
propuesta de mejora 15 3
necesidad 4
TOTAL 151 26
Tabla 1: Número de citas correspondientes a cada microfunción, enalemán y español
Aparte de las frecuencias considerablemente menores, salta a la vista la distri-
bución más homogénea en alemán, de las distintas microfunciones:
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 279

Gráfico 4. Microfunciones que expresan crítica negativa en las reseñas alemanas

Gráfico 5. Microfunciones que expresan crítica negativa en las reseñas españolas


Si observamos además la distribución de cada microfunción en los textos, la
diferencia entre ambas lenguas se hace aún más patente. En alemán, la mayoría
de las microfunciones se produce en más de la mitad de los textos, es decir que
son bastante representativas. En cambio, en español, todas las microfunciones
se producen de manera esporádica, ninguna de ellas en más de 4 textos y la gran
mayoría en menos de tres:

total citas distribución total citas distribución


alemán textos español textos
corrección 33 11 5 4
no hacer algo 22 10 4 3

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


280 KARIN VILAR SÁNCHEZ

considerado
necesario
no es como debe
21 10 10 3
ser
claridad 23 10 1 1
cantidad 17 9 2 2
misceláneo 16 10 1 1
propuesta de
15 10 3 2
mejora
necesidad 4 2
TOTAL 151 16 26 7
Tabla 2: Distribución general de las microfunciones en los textos alemanes y españoles
Todos estos resultados indican que en español, de forma diferente al alemán, la
crítica negativa no constituye una característica inherente de las reseñas críticas
y que las pocas incidencias existentes podrían deberse a circunstancias excep-
cionales o a posibles preferencias estilísticas de autores aislados. Con el fin de
verificar esta última hipótesis, comprobamos el reparto de las diferentes micro-
funciones producidas en los textos concretos y por separado. En caso de tratarse
de un estilo individual y divergente de la norma, las citas correspondientes a las
microfunciones en cuestión se limitarían a uno o a un escaso número de textos o
autores.
Como puede observase en la tabla 4, la distribución de las diferentes microfun-
ciones en los textos españoles es bastante homogénea y no indica que ninguna
de ellas sea el resultado de las preferencias estilísticas de un autor aislado. Lo
mismo cabe decir de las microfunciones alemanas, con la excepción de la nece-
sidad que es expresada por solo dos de los 18 autores. En los pocos casos, en
los que alguna microfunción sí se produce de forma más concentrada en un
mismo texto, en ambas lenguas, se trata de enumeraciones. Por ejemplo, en el
texto 5 del corpus español, la microfunción no es como debe ser es utilizada en
un mismo razonamiento:
[...] su relevancia no es uniforme. [...] No hay homogeneidad en cuanto al nivel
de terminologicidad, [...] Tampoco hay homogeneidad en el grado de fijación de
las unidades. [...] El tercer frente que dificulta la deseada homogeneidad [...].
corrección claridad no hacer no es cantidad misceláneo propuesta necesidad TOTAL
algo consi- como de mejora citas
derado debe crítica
necesario ser negativa
texto 1 1 1 3 1 2 1 9
texto 2 1 1 1 2 3 1 2 11
texto 3 2 2 1 4 1 3 3 16
texto 4 1 2 1 1 5
texto 5 1 2 3
texto 6 3 2 1 2 2 1 3 2 16
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 281

texto 7 2 2 6 1 1 12
texto 8 2 2 1 5
texto 9
texto 10 1 1 2
texto 11 1 1 1 3
texto 12
texto 13 1 1 1 1 1 5
texto 14 5 1 1 1 3 1 12
texto 15 8 3 4 2 17
texto 16 3 1 4
texto 17 11 3 5 5 1 2 1 28
texto 18 2 1 3
TOTAL 33 23 22 21 17 16 15 4 151
Tabla 3: Distribución detallada de las microfunciones que expresan crítica negativa, en
los textos alemanes
correc- no hacer no es claridad cantidad miscelá- propues- necesi- TOTAL
ción algo consi- como neo ta de dad citas
derado debe mejora crítica
necesario ser negati-
va
texto 1 1 1 3 5
texto 2
texto 3
texto 4
texto 5 1 1 4 1 1 8
texto 6
texto 7 2 3 5
texto 8
texto 9
texto 10
texto 11
texto 12
texto 13
texto 14 1 1
texto 15 2 1 2 5
texto 16
texto 17 1 1
texto 18 1 1
TOTAL 5 4 10 1 2 1 3 - 26
Tabla 4: Distribución detallada de las microfunciones que expresan crítica negativa, en
los textos españoles
En el texto 17 del mismo corpus, la microfunción corrección (decir que algo no
es correcto) se utiliza incluso 8 veces en una misma oración:
Beim Überfliegen fällt auf: S. 522 Zusammenhängen > Zusammenhänge; S. 523
am Ende des Abschnitts „Allgemeines“ fehlt ein beschließender Punkt; S. 524

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


282 KARIN VILAR SÁNCHEZ

„Kapitel 6“ steht in der Zeile des vorausgehenden Abschnitts; S. 526 College


Yidish > College Yiddish; S. 528 Gesichte > Geschichte; S. 529 detailierter >
detaillierter; S. 530 Vierteljahresblätter > Vierteljahrsblätter; S. 530 Generell zu
> Generell zur; S. 532 laryngalistischer > laryngaltheoretischer.
Comparando ambas lenguas podemos constatar que la crítica negativa constitu-
ye una función muy representativa de las reseñas críticas alemanas y se realiza
de forma relativamente frecuente en los textos. La materialización de la crítica
es variada y se utilizan conceptos mentales diversos. En cambio, en español la
misma función se produce de forma mucho más extraordinaria y en los pocos
textos en los que aparece lo hace de manera mucho menos frecuente. En tres de
los siete textos españoles que expresan alguna crítica negativa, se da en un solo
caso. A pesar de ello, en español la materialización de la función es igualmente
variada y los conceptos mentales utilizados son los mismos. A continuación y
para terminar, dejamos el nivel conceptual para dedicarnos al análisis de la ma-
terialización lingüística de las microfunciones.

3.2. El nivel lingüístico


Antes de adentrarnos en los resultados concretos correspondientes al nivel lin-
güístico, es importante señalar de nuevo la importancia de definir y delimitar
muy bien el alcance de las categorías que manejamos puesto que, en numerosos
casos, los recursos lingüísticos que se emplean para expresar una microfunción
podrían ser clasificados en diversas categorías. Entre los verbos y las frases
verbales, por ejemplo, hay expresiones que podrían incluirse de igual modo en
otras categorías, por ejemplo el verbo sich etwas fragen en la de la interroga-
ción: «Manchmal wird sich der Leser fragen, ob die jeweiligen Theoretischen
Einführungen in die Unterkapitel in dieser Ausführlichkeit notwendig sind.»
(texto 2). El criterio que utilizamos en estos casos es el de la reformulación
natural, es decir, ¿qué recurso se utilizaría con más naturalidad para reformular
el enunciado en cuestión? En el caso que estamos tratando, optaríamos por decir
«Sind die jeweiligen theoretischen Einführungen in die Unterkapitel in dieser
Ausführlichkeit notwendig?» y como consecuencia clasificamos esta cita en la
categoría de la interrogación y no en la de los verbos. A pesar de este esfuerzo
por la aplicación de unos criterios objetivos, somos conscientes de la existencia
de una cierta subjetividad residual.
Como es lógico, en ambas lenguas hay un sinfín de recursos lingüísticos con los
que se puede expresar la crítica negativa. Pero también es normal que en un
tipo de texto determinado, relativamente normalizado, la expresión de esta críti-
ca se restrinja a un número limitado de medios típicos o, según Bondarko un
menú de opciones
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 283

[…] menu of options, a graded set of possible choices, which is close to the
widely used concept of “functional field” (grammatical, lexical, and contextual
means of conveying a certain grammatical idea or covering a certain “domain of
meaning”) (Bondarko 1975; 1987: 11-13) (Kashkin 1998)
Igual que ocurría con las microfunciones utilizadas en ambas lenguas, en el caso
de los recursos lingüísticos empleados, todos los medios que se utilizaron en el
corpus español, también se produjeron en el corpus alemán, con la diferencia de
que en esta lengua el abanico de formas fue bastante más amplio. Como se pue-
de observar en el gráfico 6, en español el recurso más frecuentemente utilizado
para expresar crítica negativa es la negación (9 citas), usado para decir que algo
no es como debe ser, por ejemplo, «no alcanzamos a comprobar tal suposición»
(texto 7), que algo no es correcto, por ejemplo, «no nos parece admisible» (texto
15) y que no se ha hecho algo que se considera necesario. Ejemplo «[…] no se
trascienden los problemas más ordinarios y recurrentes de la fraseología» (texto
7). El segundo recurso más utilizado fue el de los sustantivos (6 citas). Este
recurso se aplica para decir que algo no es como debe ser, por ejemplo, «Esto
puede causar cierta extrañeza» (texto 2); que algo no es correcto, por ejemplo,
«errata» (texto 1); que no se hace algo considerado necesario, «falta de men-
ción» (texto 7); y para evaluar negativamente, en general (misceláneo), «dificul-
tad inherente» (texto 18). Los atributos (5 citas) son el tercer recurso emplea-
do, usado para decir que algo no es como debe ser, por ejemplo, «poco funcio-
nal» (texto 7), que algo no es correcto, «discutible» (texto 5), y para la valora-
ción negativa de la cantidad, «se quedan muy cortas» (texto 4). Para esta última
microfunción es además el único medio utilizado. El condicional (3 citas) es el
único recurso que se empleó para presentar una propuesta de mejora y no se
utilizó para realizar otra microfunción. Ejemplo: «En esta información sobre los
marcos deberían incluirse también las informaciones culturales» (texto 5).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


284 KARIN VILAR SÁNCHEZ

Gráfico 6. Crítica negativa en reseñas críticas españolas: microfunciones y recursos


lingüísticos

Gráfico 7. Crítica negativa en reseñas críticas alemanas: microfunciones y recursos


lingüísticos
Por último, los verbos (3 citas) se emplean para decir que algo no es como debe
ser, por ejemplo, «el tercer frente que dificulta la deseada homogeneidad» (texto
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 285

5), y para la valoración negativa de la claridad, ejemplo «quizás peque de ambi-


guo» (texto 14).
En el gráfico 7 salta a la vista que el número de recursos lingüísticos utilizados
en alemán es mayor (8 en alemán vs. 5 en español) y que su uso se diversifica
bastante más que en español. Con el único fin de ilustrar el uso de los distintos
recursos lingüísticos para la expresión de las diversas microfunciones, volvere-
mos a reproducir a continuación un ejemplo para cada una de las combinacio-
nes 4.
Negación (34 citas, 5 microfunciones):
• «Bachmann schöpft das Potenzial seines Korpus nicht vollends aus»
(texto 1, cantidad);
• «[...] wird nicht ganz deutlich» (texto 5, claridad);
• «[...] womit dies als Abgrenzungskriterium folglich nicht relevant sein
kann» (texto 4, corrección);
• «Insofern ist seine Arbeit weder korpusorientiert noch empirisch» (texto
1, no es como debe ser);
• «Zur Syntax wird hier nichts gesagt» (texto 17, no hacer algo conside-
rado necesario).
Atributo (32 citas, 7 microfunciones):
• «zu rar gehalten» (texto 15, cantidad);
• «vage» (texto 15, claridad);
• «diskutabel» (texto 18, corrección);
• «unglücklich» (texto 14, misceláneo);
• «verzichtbar» (texto 6, necesidad);
• «anderswo besser» (texto 2, no es como debe ser);
• «Wer nach „vergessenen“ oder schlecht zugänglichen Texten Hermanns
sucht, wird von der Publikation nur bedingt bedient» (texto 4, no hacer
algo considerado necesario).
Verbos (27 citas, 5 microfunciones):
• «Ihre Begeisterung nimmt zum Teil jedoch derart überhand, [...]» (texto
7, cantidad);
• «Durch den leserfreundlichen und laiengerechten Stil mangelt es der
Argumentation jedoch stellenweise an fachlicher Genauigkeit» (texto 7,
claridad);
• «Ob es sich bei diesen Annahmen wirklich um Theorien handelt, sei
dahingestellt» (texto 18, corrección);

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


286 KARIN VILAR SÁNCHEZ

• «hier verbirgt also gewissermaβen eine konventionelle Terminologie


das eigentlich Besondere an dem gewählten Ansatz» (texto 14, no es
como debe ser);
• «[...] versäumt es aber, seine eigenen Kriterien zu präzisieren» (texto 3,
no hacer algo considerado necesario).
Interrogación (18 citas, 5 microfunciones):
• «Sind die Auswahlkriterien philologischer oder kulturhistorischer Art?»
(texto 15, claridad);
• «Trotzdem stellt sich die Frage, ob man bei dieser Art von
Diskursanalyse [...] nicht Texte als von sich aus gegebene
kommunikative Einheiten zusammen mit ihren je einmaligen
sozialhistorischen Situierungen [...] übergeht» (texto 2, no es como debe
ser);
• «Manchmal wird sich der Leser fragen, ob die jeweiligen theoretischen
Einführungen in die Unterkapitel in dieser Ausführlichkeit notwendig
sind» (texto 2, necesidad);
• «Ist das denn heute anders?» (texto 17, misceláneo);
• «[...], wie kann der Kontext dann im Modell denselben Status eines
Junktors haben?» (texto 6, corrección).
Condicional (15 citas, 1 microfunción):
• «Es wäre ein groβer Gewinn, wenn [...] zur Verfügung gestellt
würden.» (texto 3, propuesta de mejora);
Sustantivos (9 citas, 2 microfunciones):
• «Das Notitzhafte» (texto 17, claridad);
• «Problem» (texto 16, misceláneo).
Adverbios (9 citas, 3 microfunciones):
• «[...]. Gut. Allerdings wird man dennoch erwarten dürfen, dass das, was
zu finden ist, korrekt und aktuell ist.» (texto 17, corrección);
• «Leider [...]» (texto 15, misceláneo);
• «der nur eingschränkt brauchbare Anhang» (texto 3, no es como debe
ser).
Substitución (7 citas, 1 microfunción):
• «laryngalistischer > laryngaltheoretischer» (texto 17, corrección).
De nuevo e igual que hicimos en el caso de las microfunciones, analizamos la
distribución de los recursos lingüísticos en el total de los textos, para así detec-
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 287

tar posibles preferencias individuales y aisladas que lógicamente no representa-


rían un uso común.
negación atributo verbo interrog. cond. sustantivo adverbio sustitución TOTAL
texto 1 6 2 1 9
texto 2 1 3 3 3 1 11
texto 3 4 3 1 2 3 2 1 16
texto 4 1 1 1 1 1 5
texto 5 1 2 3
texto 6 3 5 1 2 3 1 1 16
texto 7 7 2 2 1 12
texto 8 1 2 1 1 5
texto 9
texto 10 1 1 2
texto 11 3 3
texto 12
texto 13 1 2 1 1 5
texto 14 2 4 3 1 1 1 12
texto 15 6 3 6 1 1 17
texto 16 1 2 1 4
texto 17 6 3 5 2 1 1 3 7 28
texto 18 1 1 1 3
TOTAL 34 32 27 18 15 9 9 7 151
Tabla 5: Distribución detallada de los recursos lingüísticos utilizados para expresar
crítica negativa, en los textos alemanes

negación sustantivo atributo cond. verbo TOTAL


texto 1 1 3 1 5
texto 2
texto 3
texto 4
texto 5 4 2 1 1 8
texto 6
texto 7 2 1 2 5
texto 8
texto 9
texto 10
texto 11
texto 12
texto 13
texto 14 1 1
texto 15 2 1 2 5
texto 16
texto 17 1 1
texto 18 1 1
TOTAL 9 6 5 3 3 26

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


288 KARIN VILAR SÁNCHEZ

Tabla 6: Distribución detallada de los recursos lingüísticos utilizados para expresar


crítica negativa, en los textos españoles
En la tabla 6 podemos observar que ninguno de los recursos utilizados para
expresar crítica negativa en los siete textos españoles se produce de forma ais-
lada. La mayoría de ellos incluso se reparten entre tres autores (2 textos) o cua-
tro (2 textos). Es decir, los medios utilizados para criticar algo de forma negati-
va en sí, parecen ser relativamente corrientes aunque el hecho mismo de hacerlo
en el contexto dado resulte menos común. El recurso más utilizado en los textos
españoles es la negación (9 citas), seguido por los sustantivos (6) y los atributos
(5). El condicional (3 citas) y los verbos (3 citas) son los medios menos frecuen-
tes.
La distribución de los medios lingüísticos utilizados en los textos del corpus
alemán es tan uniforme o incluso más que la del corpus español. La distribución
oscila entre 7 y 14 textos, siendo el verbo el recurso más representativo en los
textos (14 textos) aunque no sea el medio más frecuentemente utilizado (27
citas). En segundo lugar están los atributos (12 textos), seguidos por la negación
(10 textos) y el condicional (10 textos). Los sustantivos (8 textos), la interroga-
ción (7 textos) y los adverbios (7 textos) son algo menos representativos. Llama
la atención el uso masivo y aislado de la sustitución en el texto 17. Es un recur-
so que no se da en ninguno de los demás textos alemanes y en ninguno de los
españoles. Por lo tanto, tenemos un claro indicio de que la sustitución no consti-
tuye un recurso propio de las reseñas críticas, ni de las alemanas ni de las espa-
ñolas, y que el uso que hemos observado es el resultado de un estilo individual,
y divergente de la norma.
Si comparamos los recursos lingüísticos empleados en ambas lenguas, podemos
observar que aparte de la sustitución que, como acabamos de ver, no parece
constituir un recurso característico de las reseñas críticas alemanas, hay dos
medios lingüísticos en los textos alemanes que no se utilizan en los españoles.
Se trata de la interrogación, con 18 citas en 7 textos alemanes, y del adverbio,
con 9 citas en 7 textos alemanes. Tampoco en alemán son los recursos más re-
presentativos y frecuentes, pero aún así tienen un importante peso en el reparto
de los medios. Por otro lado, hay coincidencias entre ambas lenguas en el senti-
do de que la negación es el recuso más frecuente y mejor distribuido en las dos.
Los cuatro recursos restantes se utilizan en ambas lenguas aunque tanto la fre-
cuencia de uso como la distribución relativas difieren en mayor o menor grado.
Resumiendo, podemos decir que la mayor diferencia entre las reseñas críticas,
en alemán y español, es que en alemán la crítica negativa parece ser un elemen-
to representativo, por producirse en casi todos los textos de nuestro corpus (16),
mientras que en español no es así. En esta lengua se dio en menos de la mitad de
los textos (7). Pero no sólo es la crítica negativa más representativa por su exis-
tencia en los textos alemanes en sí, sino también por su uso muchísimo más
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 289

frecuente en los mismos. En cuanto a los conceptos mentales que se emplean


para realizar la crítica negativa, las diferencias son menores. Aparte de la mi-
crofunción de la necesidad que, como hemos comentado, no tiene apenas rele-
vancia en los textos alemanes, todas las microfunciones que se utilizan en ale-
mán, también se dan en español, aunque las frecuencias relativas varían algo en
ambas lenguas. Mientras que en alemán el reparto es más homogéneo, tanto en
lo que atañe a la frecuencia de uso absoluta como a la distribución en los textos,
en español destaca la expresión de que algo no es como debe ser. En el nivel de
las materializaciones lingüísticas volvimos a observar diferencias importantes
entre ambas lenguas. La variedad en la expresión es considerablemente mayor
en alemán (8 vs. 5 recursos) y hay dos recursos relevantes en alemán que en
español no se utilizan.
Aunque en este trabajo nos hemos centrado en la crítica negativa, resulta intere-
sante observar que la crítica positiva es muchísimo más frecuente en los textos
de ambas lenguas, con 349 citas en alemán y 276 en español. Esto significa que
en el corpus alemán se realizaron 151 citas de crítica negativa frente a 349 de
crítica positiva, es decir las últimas doblan con creces a las primeras. En espa-
ñol la relación es muchísimo más dispar. Frente a 26 citas de crítica negativa
hay 276 de crítica positiva, es decir, diez veces la cantidad de las negativas.
Esto significa que en ambas lenguas prevalece la crítica positiva pero que en
español el predominio es tan extremo que casi anula la crítica negativa.

4. Conclusiones
A pesar de las definiciones que en ambas lenguas coinciden bastante, nuestros
resultados parecen indicar que en alemán una reseña crítica se escribe para in-
formar, de la forma más objetiva posible, sobre una monografía científica en el
ámbito de la lingüística. Parece que se le da más valor a la objetividad científica
que a la imagen pública del autor. En español, en cambio, la crítica negativa se
suele evitar, probablemente para tener consideración con la imagen pública del
autor o simplemente con el fin de eludir posibles conflictos originados por el
daño de la misma. Estas observaciones coinciden con los resultados obtenidos
por los estudios de la cortesía, en español y en alemán, que afirman que el ha-
blante español tiende más a evitar actos que puedan constituir una amenaza para
la imagen pública del interlocutor (face-threatening-acts) que el alemán (Wein-
rich, 1986; Schmelz, 1993; Haverkate, 1994; House, 1998; Lüger, 2002). En
todo caso, los resultados que hemos obtenido ayudan a entender la reacción tan
divergente de mi propia opinión y de la de mi colega sobre la reseña referida al
principio. Como indiqué, a mí la reseña en cuestión me hubiese halagado por su
profundidad y objetividad, pero a mi colega le molestó porque constituía una
amenaza para su imagen pública.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


290 KARIN VILAR SÁNCHEZ

Finalmente quisiera comentar la posible existencia de un factor que tiene el


potencial de trastocar la realización normal de la crítica negativa en una reseña
crítica. Me refiero a una eventual relación entre el o la autor/a de la obra reseña-
da y el o la reseñador/a, máxime si se trata de una relación de dependencia o de
competición, o incluso de rivalidad. En estos casos, dicha relación puede influir
enormemente en la disposición o en la reticencia a formular una crítica negati-
va. Pero también es verdad que este factor puede darse en ambas lenguas por
igual. En todo caso, la posible influencia de circunstancias sociales o psicológi-
cas tendría que estudiarse en un trabajo socio y/o psicolingüístico adicional.
Si aceptamos los resultados presentados en este trabajo de que en alemán la
crítica negativa en una reseña crítica es perfectamente aceptada o incluso
deseada porque permite al lector hacerse una idea objetiva y real de una obra, y
que en el lector español de una reseña crítica esta expectativa no se da por las
razones explicadas, se plantea la pregunta de cómo debe procederse a la hora de
traducir este tipo de texto u otros que presenten una problemática parecida. Se-
guramente se trata de encontrar el equilibrio entre la lealtad al texto de salida,
por un lado, y al lector del texto meta, por otro, cuestión que además habrá que
decidir en cada caso teniendo en cuenta el mayor número posible de factores
circunstanciales.

5. Bibliografía
Drodowski, Günther, ed. 1996. Duden Deutsches Universal Wörterbuch A-Z.
Mannheim-Leipzig-Wien-Zürich: Dudenverlag. ISBN 3-411-05503-0.
Gläser, Rosemarie. 1990. Fachtextsorten im Englischen. Tübingen: Forum für
Fachsprachenforschung. ISBN 3-8233-4520-6.
Haverkate, Henk. 1994. La cortesía verbal. Estudio pragmalingüístico. Madrid: Gredos.
ISBN 9788424916527.
House, Juliane. 1998. Politeness and Translation. @ L. Hickey, ed. The Pragmatics of
Translation. Clevedon: Multilingual Matters. ISBN 1-85359-405-9, pp. 54-72.
Jokubeit, Werner. 1980. Zur Funktion und Gestaltung der Rezension als einer Textart
des Erörterns. @ Textlinguistik: Beiträge zur Theorie und Praxis der
Textgestaltung 7: 61-83.
Kashkin, Vyacheslav B. 1998. Choice Factors in Translation. @ Target 10/1: 95-111.
Lüger, Heinz-Helmut, ed. 22002. Höflichkeitsstile. Frankfurt/M: Peter Lang. ISBN 978-
3-631-39663-6.
Moliner, María. 2012. Diccionario de uso del español. Madrid: Gredos. ISBN
9788424936372.
Ripfel, Martha. 1998. Fachtextsorten der Wissenschaftssprachen II: die
wissenschaftliche Rezension. @ L. Hoffmann, H. Kalverkämper y H. E.
ANÁLISIS CUALITATIVO DE TEXTOS CON UN PROGRAMA CAQDAS 291

Wiegand, eds. Fachsprachen. Languages for Spacial Purposes. Berlin, New


York: Walter de Gruyter. ISBN 3-11-011101-2, pp. 488-493.
Sánchez Lobato, Jesús, coord. 2006. Saber Escribir. Instituto Cervantes: Ed. Aguilar.
ISBN84-03-09723-9.
Schmelz, Matthias P. 1993. Psychologie der Höflichkeit. Frankfurt/M: Peter Lang.
ISBN 3-631-46987-X.
Vilar Sánchez, Karin, ed. 2007. Mikrofunktionen in Arbeitsverträgen Deutsch-Spanisch.
Berna: Peter Lang. ISBN 978-3-03911-314-9.
Vilar Sanchez, Karin. 2004. Diccionario de sinónimos funcionales. @ P. Faber, C. Ji-
ménez y G. Wotjak, eds. Léxico especializado y comunicación interlingüística.
Granada: Granada Lingvistica. ISBN 84-7933-288-3, pp. 297-322.
—. 2014a. Kann man Stil lehren? Die Analyse textsortenspezifischen Stils im DaF-
Unterricht in Spanien. @ D. Reimann, ed. Kontrastive Linguistik und
Fremdsprachendidaktik Iberoromanisch – Deutsch. Studien zu Morphosyntax,
nonverbaler Kommunikation, Mediensprache, Lexikographie und
Mehrsprachigkeitsdidaktik Spanisch, Portugiesisch, Deutsch. Tübingen: Narr
Verlag. ISNB 978-3-8233-6825-0, pp. 259-273.
—. 2014b. Micro-function combination patterns and linguistic adequacy in specialised
texts. @ Babel 60/1: 70-90.
Weinrich, Harald. 1986. Lügt man im Deutschen, wenn man höflich ist? Mannheim–
Wien–Zürich: Dudenverlag. ISBN 3-411-01023-1.
Zillig, Werner. 1982. Textsorte „Rezension“. @ K. Detering, J. Schmidt-Radefeldt y W.
Sucharowski, eds. Sprache erkennen und verstehen. Tübingen: Max Niemeyer
Verlag. ISBN 3-484-30119-8, pp.197-208.

1
V. http://es.wikipedia.org/wiki/An%C3%A1lisis_microfuncional y
http://de.wikipedia.org/wiki/Mikrofunktionsanalyse .
Para más información sobre el análisis microfuncional y la composición microfuncional de de-
terminados tipos de texto v. Vilar (2004 y 2013).
2
El documento de Atlas.ti que contiene los corpus y todos los datos del análisis se puede consul-
tar en http://hdl.handle.net/10481/31617.
3
Utilizo el término en el sentido general. En el programa Atlas.ti, el término supercódigo hace
referencia a un código que es el resultado de poner en relación de algún tipo, dos códigos básicos.
4
Reproducimos solo la parte de las citas que expresan la idea definida en la microfunción. De-
pendiendo de la importancia del contexto para la transmisión de la idea, puede tratarse de pala-
bras, expresiones, frases o incluso de párrafos enteros.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


Metodología para evaluar la localización web en
España. Primeros resultados aplicados a un corpus
de sitios web de pymes agroalimentarias andaluzas

[A methodology for evaluating web localization in


Spain: initial results from a corpus of websites for
andalusian agri-food SMEs]
ANA MEDINA REGUERA Y CRISTINA RAMÍREZ DELGADO
Universidad Pablo de Olavide de Sevilla
anamedina@upo.es
Resumen
En este trabajo se presenta una metodología desarrollada con el objetivo de establecer la
cantidad y la calidad de los sitios web de las pequeñas y medianas empresas (pymes)
andaluzas. Con un proceso análogo al de la auditoría y un cuestionario de verificación o
checklist dividido en ocho bloques de preguntas, se realiza el visionado de más de mil
sitios web corporativos, tras el cual se ofrecen aquí los primeros resultados sobre el
status quo de la localización en la pyme agroalimentaria andaluza. Estos incluyen datos
sobre la cantidad de empresas con página web, número de idiomas a los que están tra-
ducidas y algunas carencias en la localización.
Abstract
This paper presents a methodology designed to quantify and evaluate the quality of the
websites of small and medium-sized enterprises in the Spanish region of Andalusia.
Using an audit-like procedure and a checklist with eight groups of questions, we viewed
more than a thousand corporate websites. This paper provides our initial results on the
current situation of localization in Andalusian agri-food SMEs, including the number of
companies with a website, the number of languages into which the websites are translat-
ed, and localization deficiencies.
Palabras clave
Traducción para el comercio exterior, traducción comercial, estudios de localización
mediante corpus, sitio web corporativo, comunicación internacional en pymes
Keywords
Translation in foreign trade, business translation, corpus-based localisation studies,
corporate website, SME international business communication

1. Introducción
En varios trabajos sobre Traducción para el Comercio Exterior publicados en
España (Medina Reguera 2007, Medina Reguera y Álvarez García 2013, Morón
Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
294 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

Martín 2012, Socorro Trujillo 2008), se ha resaltado la importancia que una


planificación lingüística adecuada puede tener sobre la internacionalización de
las empresas en general y de las pymes 1 en particular. Sus resultados están en
consonancia con otros estudios publicados por la Comisión Europea, de los
cuales podemos destacar el informe ELAN (2006), en el que se cuantifica en un
44,5 % la diferencia de volumen de ventas en el exterior entre compañías que
tienen estrategias lingüísticas bien definidas y aquellas que carecen de ellas. El
impulso político a través de acuerdos, la ayuda financiera mediante subvencio-
nes, los avances tecnológicos, la deslocalización industrial, la selección de mer-
cados más favorables o la búsqueda de socios fuera de las fronteras para fortale-
cerse son algunas de las causas de este proceso mundial de globalización eco-
nómica. En el caso particular de España, hay que añadir además la fuerte crisis
económica como factor clave para la internacionalización de pequeñas empresas
que hasta la caída de la economía española se habían «conformado» con las
ventas en el interior del país.
La planificación lingüística dentro de la empresa exportadora puede abordarse
de maneras diversas, siendo la contratación de hablantes con conocimientos de
idiomas la más frecuente, si bien también puede fomentarse la contratación de
personal nativo, la formación de idiomas para los empleados o la contratación
de traductores e intérpretes profesionales (ELAN 2006). Si bien la comunidad
científica internacional se ha dedicado a estudiar la importancia del multilin-
güismo y el uso de una lengua común –fundamentalmente el inglés– en las
compañías multinacionales (Marschan-Piekkari, Welch, y Welch 1999; Feely y
Harzing 2003, Harzing y Pudelko 2013), no puede decirse lo mismo de los es-
tudios centrados en las pymes, exceptuando el proyecto ELAN-CAT (Hagen
2009) y el proyecto PIMLICO (Hagen 2011). Del mismo modo, en qué medida
y con qué frecuencia se contratan traductores e intérpretes en las pymes españo-
las es un objeto de investigación difícil de abordar, y apenas encontramos algu-
nos estudios parciales en los que se ha preguntado a prestadores y prestatarios
de los servicios de traducción por el volumen de traducciones de textos comer-
ciales que se encargan y en qué medida se contratan intérpretes profesionales
frente a la interpretación in house realizada por empleados de la empresa (Ha-
gen 2009, Medina Reguera y Álvarez García 2013, Gallego Hernández 2013;
Neves y Alburquerque 2011; Ibáñez, Bachiller y Sánchez 2010). Las conclusio-
nes de todos los estudios coinciden en que las empresas contratan pocos traduc-
tores e intérpretes en comparación con el uso de empleados internos. Por ejem-
plo, en la encuesta realizada a más de cuatrocientas empresas andaluzas agroa-
limentarias en 2013, el 58,97 % afirmó no contratar nunca el servicio de traduc-
tores en intérpretes en sus negociaciones internacionales, y del 41,03 % restante,
el 6,28 % afirmó contratar únicamente intérpretes, el 20,63 % solo traductores y
el 14,13 % afirmó contratar habitualmente las dos modalidades (Medina Regue-
ra y Álvarez García 2013). Por su parte, en el estudio ELAN-CAT se cifra en
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 295

15 % las empresas catalanas que contratan servicios de traducción e interpreta-


ción frente al 45 % de pymes europeas (Hagen 2009: 33). En tercer lugar, en el
estudio sobre gestión lingüística en las empresas portuguesas, 23 empresas
(56 % del total) afirmaron servirse de colaboradores internos para gestionar sus
necesidades lingüísticas, mientras que nueve empresas (22 %) afirmaron contra-
tar servicios de traducción y otras nueve (22 %) afirmaron repartirse el trabajo
entre colaboradores internos y profesionales de la traducción (Neves y Albu-
querque 2011: 13). Por último, en un estudio sobre empresas vitivinícolas de
Castilla y León (Ibáñez, Bachiller y Sánchez 2010), un 45 % de los encuestados
no recurre nunca a los servicios de traducción, un 22 % lo hace algunas veces, y
un 55,9 % afirma recurrir poco o nada a la interpretación. En definitiva, estos
resultados basados en empresas de la Península Ibérica son asombrosamente
parecidos, puesto que: a) las empresas dicen ser conscientes de la importancia
de las lenguas extranjeras; b) las empresas confirman que tienen la necesidad de
gestionar la comunicación oral y escrita en más de una lengua; c) y sin embargo
el resultado final de dicha gestión resulta insuficiente e insatisfactorio, tanto en
la cantidad y calidad de competencias lingüísticas de sus empleados como en la
contratación de los servicios de traducción e interpretación.
Dejando a un lado las investigaciones sociológicas, los estudios sobre tipologías
textuales (Socorro Trujillo 2008, Mayoral Asensio 2006, Suau Jiménez 2010)
son bastante más frecuentes que las investigaciones empíricas que necesitan de
cuestionarios o entrevistas para llegar a afirmaciones concluyentes, si bien no
todos los estudios sobre tipologías textuales para la traducción empresarial o
comercial parten de un estudio riguroso sobre qué tipos de textos son suscepti-
bles de ser frecuentemente traducidos frente a otros que pueden –o deben– utili-
zarse en la docencia, pero que apenas se convierten en encargos de traducción
en el mercado real. Este hecho es perfectamente comprensible si tenemos en
cuenta que apenas contamos con estudios de mercado sobre la traducción en
España. Lozano Arguelles presenta en 2011 una encuesta sobre el tipo de tra-
ducción y de textos más demandado y obtiene que «manuales de instrucciones
de uso», «páginas web», e «informes sobre productos» son los tres «tipos tex-
tuales» más frecuentes para traducción directa, mientras que «páginas web»,
«traducción jurada» y «cartas comerciales» son los encargos más frecuentes de
la modalidad de traducción inversa. Al comparar los datos con un cuestionario
anterior realizado por Roiss (2001), afirma:
Hace 12 años, el peso de la traducción inversa de páginas web era mínimo, y el
lugar principal estaba ocupado por las cartas comerciales, seguidas por la traduc-
ción jurada y los folletos turísticos. La rápida evolución de las tecnologías desde
entonces ha propiciado un vuelco en el tipo de textos traducidos. Sin duda algu-
na, la localización tiene un papel más que destacado en el mercado de la traduc-
ción. Las cartas comerciales pierden importancia, aunque se mantienen en un se-
gundo lugar, junto con la traducción jurada. (Lozano Argüelles 2011: 40)

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


296 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

Si bien no deseamos entrar en problemas metodológicos derivados del concepto


de «tipo textual» del que hace uso el trabajo de Lozano Argüelles, sí nos parece
relevante su estudio empírico como muestra objetiva de las tendencias del mer-
cado en nuestro país. Para nuestra investigación, es importante constatar que
varios de los diferentes tipos de textos señalados por los grupos de encuestados
(traductores autónomos y empresas de traducción) están directamente relacio-
nados con el comercio exterior. Según nuestra propia definición, la traducción
comercial entendida como traducción de cartas comerciales y documentos mer-
cantiles ha quedado obsoleta, pues consideramos la Traducción para el Comer-
cio Exterior (TCEX) de un modo más amplio: debe incluir el conjunto de activi-
dades traductoras que tienen como finalidad contribuir al proceso de intercam-
bio internacional de bienes y servicios (promoción, importación, exportación,
inversión, deslocalización y globalización) en cualquiera de sus fases, incluyen-
do cualquier tipo de texto, modalidad o técnica utilizada. 2

2. La localización del sitio web corporativo


En la introducción hemos reseñado brevemente algunos estudios sobre traduc-
ción comercial o mercantil que se han aproximado a los textos o documentos
generados por la empresa en procesos de internacionalización desde perspecti-
vas muy diversas. 3 Sin embargo, aún no hemos abordado precedentes de inves-
tigación cuyo objetivo ha sido la traducción de páginas web de empresas (o,
como viene acuñándose el nombre del género, de sitios web corporativos), pro-
ceso de traducción que viene denominándose localización web –frente a locali-
zación de software o localización de videojuegos–, y que Jiménez-Crespo
(2013: 1) define como «a communicative, technological, textual and cognitive
process by which interactive digital texts are modified for use by audiences
around the world other tan those originally targeted». Dado que no todas las
webs son elaboradas por empresas privadas –existen sitios web de instituciones
públicas, personas privadas, fuentes de documentación como bibliotecas y bases
de datos, medios de comunicación, asociaciones de personas, etc.–, debemos
separar del resto aquellos estudios de webs cuya finalidad es, fundamentalmen-
te, vender los productos o servicios de una compañía en el exterior, así como
también mejorar la imagen de la empresa en el interior (traducción como marca
de prestigio).
Aunque nos basamos esencialmente en los trabajos de Jimémez Crespo (2008,
2009, 2011, 2013), existen otros sobre localización del sitio web corporativo,
tales como el de Bolaños sobre las empresas informáticas (2002), el de Renau
Renau (2004) sobre la industria cerámico-azulejera, o algunos trabajos en el
marco del proyecto de investigación Traduvino sobre páginas web del sector
vitivinícola (Sánchez Nieto 2006, 2009, Sánchez Barbero 2010) así como el de
Ivorra Pérez (2009, 2011) sobre las empresas jugueteras. Todos ellos hacen uso
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 297

de corpus textuales de páginas web, ya sea en su totalidad o en algunos de sus


subtextos (páginas de inicio, páginas de presentación de la empresa…). Algunos
estudios tienen un enfoque lingüístico-contrastivo, retórico o didáctico, si bien
son los estudios de Jiménez-Crespo los que abordan con mayor intensidad el
control de calidad en el diseño y desarrollo web, tanto de los sitios originales
como de sus consiguientes localizaciones en otras lenguas (Jiménez Crespo
2008, 2013: 102-132). Uno de los problemas principales que plantea la calidad
de la localización de nuestro corpus es la relación directa existente con la cali-
dad del texto original, así como la falta de interacción entre los agentes implica-
dos en todo el proceso. Una de las hipótesis principales de las que parte nuestra
investigación, derivada de una somera observación al conjunto del corpus, es
que existe una brecha entre la teoría encontrada en los manuales de diseño y
estilo web (proceso GILT, redacción de hipertextos, concepto de web usability)
y la práctica de la realidad encontrada en el corpus. Para poder realizar una des-
cripción y valoración de las webs de nuestro corpus respecto a los estándares de
calidad, entenderemos el concepto de localización en este trabajo como el con-
junto del proceso, es decir, la internacionalización del producto digital, la adap-
tación global de los textos digitales, y el propio proceso de traducción.

3. El corpus de sitios web corporativos del sector agroalimenta-


rio en Andalucía
Es bien sabido, desde finales de la década de los noventa, que el uso de corpus
en los estudios de traducción es de gran utilidad tanto en el proceso de traduc-
ción como en el proceso de evaluación y análisis de calidad (Bowker 2001). En
esta primera fase 4 de la investigación se ha tratado el conjunto de sitios webs
descargados como un corpus paralelo (Laviosa 2002) o corpus de traducción
(Johansson 1998), conformado por las webs originales con sus localizaciones
hacia una o varias lenguas. Aunque nuestro corpus final incluirá en una etapa
posterior el total de pymes de Andalucía, hemos decidido empezar analizando
las webs de las empresas de un solo sector económico. La Agencia Andaluza de
Promoción Exterior de la Consejería de Economía, Innovación, Ciencia y Em-
pleo de la Junta de Andalucía divide las empresas en cuatro sectores: consumo,
servicios, agroalimentario e industria. Se ha elegido el sector agroalimentario
por dos motivos: en primer lugar, porque es el sector más fuerte en volumen de
ventas de la comunidad autónoma, seguido del sector aeronáutico; en segundo
lugar, porque la pyme agroalimentaria es el tipo de pyme más representativa del
entramado empresarial andaluz: pequeña, familiar, en expansión y en proceso
de mayor cualificación.
En cuanto al volumen de ventas exteriores, según los datos estadísticos elabora-
dos por el Observatorio para la Internacionalización de la Economía Andaluza 5,
así como los registros oficiales de la Agencia Tributaria del ejercicio 2013, An-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


298 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

dalucía es la tercera comunidad española y ha presentado en 2013 el mayor


crecimiento de las siete grandes comunidades exportadoras de España, alcan-
zando un cuarto año de récord histórico en las exportaciones. Las ventas exte-
riores representan un 18,3 % del PIB regional, lo que supone una importante
contribución a la mejora de la economía en esta comunidad. La exportación de
legumbres, hortalizas o frutas han subido en 2013 un 6,1 % y un 6 % respecto al
año anterior, hasta alcanzar los 2.253 y los 1.434 millones de euros respectiva-
mente. Las ventas de aceite de oliva andaluz, por su parte, aumentaron en un
6,8 %, con exportaciones por valor de 1.546 millones. Aunque no se abordan en
este trabajo aspectos léxicos o terminológicos, los datos sobre los principales
productos agroalimentarios del sector deben tener una relación directa sobre la
densidad terminológica y las listas de frecuencia del corpus.
En relación con la diversidad de lenguas del corpus están los países objeto de
las exportaciones de las empresas. Las cifras y los países destino de las exporta-
ciones son relevantes para el estudio porque puede analizarse la variedad de
lenguas meta a las que los sitios web corporativos han sido traducidos frente al
uso del inglés como lengua franca o lengua del comercio internacional. Ya al-
gunos estudios han apuntado las ventajas de negociar usando la lengua materna
de uno de los dos socios comerciales frente al uso del inglés entre españoles y
alemanes. 6 Las cifras de 2013 certifican la importante diversificación geográfica
alcanzada por las exportaciones andaluzas en los últimos años, siendo los mer-
cados de la UE-28 el destino del 53,6 % de las exportaciones andaluzas. Aun
así, las ventas a los mercados comunitarios han crecido hasta en un 60 % en este
periodo, aunque han crecido mucho más hacia África, un 121 %, y Asia, un
111 %. Por países, el primer destino de las exportaciones andaluzas sigue sien-
do Francia, con 2.944 millones (el 11,3 % del total), seguido de Alemania, con
2.057 millones (7,9 %), Portugal, con 1.977 millones (7,6 %), Italia, (1.841
millones y 7,1 %), y Reino Unido (1.261 millones y 4,9 % del total). Fuera de la
UE, dos países se sitúan entre los siete primeros destinos de las exportaciones
andaluzas, Marruecos (1.138 millones y 4,4 % del total) y Estados Unidos
(1.040 millones y 4 %). 7 Más adelante se detallan las lenguas incluidas en nues-
tro corpus.
Para compilar el corpus era necesario disponer de una base de datos de pymes
exportadoras o con intención de exportar en el momento actual, para poder dife-
renciarlas de establecimientos comerciales o negocios que, o bien por su reduci-
do tamaño o por su condición de minoristas, no ven la necesidad de disponer de
un sitio web y tampoco se plantean la venta fuera de su local. Por tanto, para no
desvirtuar los resultados, se tomaron para el corpus aquellas empresas registra-
das en el directorio de EXTENDA (Agencia Andaluza de Promoción Exterior),
disponible en <www.extenda.es>, y para cada una de ellas se elaboró un cues-
tionario de verificación (ver cap.4). A continuación, del grupo de empresas con
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 299

webs, se pasó a la descarga de todos los sitios con todas sus páginas y en todas
las lenguas disponibles en el periodo del 15 al 24 de marzo de 2014 con el pro-
grama HTTrack (website copier que permite la descarga de todos los archivos
que componen un sitio web desde el servidor en el que están alojados). El direc-
torio de EXTENDA contiene 2177 empresas del sector agroalimentario organi-
zadas por provincias. Para formar parte del directorio las empresas deben relle-
nar un formulario también visible en la web y aportar información básica sobre
la actividad desarrollada e indicar el nombre de la persona responsable de ex-
portación, aunque también permite la inclusión de las empresas que aún no ex-
portan pero están decididas a hacerlo. Conocer este último dato es importante
para establecer la representatividad de la muestra de población y del corpus,
como veremos a continuación. Una vez enviado el formulario, EXTENDA ela-
bora una ficha y la introduce en el directorio (ilustración 1).

Ilustración 1. Acceso al directorio desde la web de EXTENDA


Desde la página principal, seleccionamos «sector agroalimentario» y accedemos
al listado de empresas de cada una de las ocho provincias (Ilustración 2). De
cada empresa, el directorio ofrece una ficha con los datos básicos de contacto,
entre los que se encuentran la URL de la web, en caso de que exista.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


300 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

Ilustración 2. Organización del directorio de empresas en la web de EXTENDA


A continuación se extrae la URL para descargar el sitio web de la ficha de cada
empresa (ilustración 3), y se comprueba, para aquellas que no presentan ningún
URL, si se trata de un error o desactualización de la ficha introduciendo el
nombre de la empresa en el buscador de Google. Si el resultado fuese afirmati-
vo, se incluye la web en el corpus. Del mismo modo, los resultados han arrojado
un buen número de direcciones web incluidas en las fichas pero realmente
inexistentes en internet.

Ilustración 3. Ficha por cada empresa del directorio de la web de EXTENDA


Para comprobar la representatividad del corpus hemos comparado el número de
empresas registradas en Extenda con el número de empresas exportadoras ofre-
cidas por el Estudio Estadístico de la Empresa Exportadora de la Junta de Anda-
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 301

lucía. 8 Dado que, a diferencia del directorio de empresas del que se ha tomado
el corpus (ilustración 2), en la estadística oficial (ilustración 4), el sector «bebi-
das» aparece independiente del sector «agroalimentario», hay que sumar ambas
cifras. La Estadística indica que existen 2.821 empresas exportadoras totales y
1.322 empresas exportadoras regulares 9 para el año 2013, a cuyo valor debemos
sumarles las 540 (empresas exportadoras totales) y 126 (exportadoras regulares)
del sector bebidas.

Ilustración 4 10 Empresas exportadoras totales y regulares de Andalucía


Por tanto, tomando como referencia el número de empresas exportadoras totales
(es decir, todas las empresas exportadoras de productos agroalimentarios que
exportaron al menos una vez durante el año 2013), nuestro corpus de 2177 em-
presas a las que hemos aplicado nuestro cuestionario de verificación supone un
64,77 % de las empresas totales, mientras que si la referencia es el número de
empresas regulares, habríamos analizado en nuestra investigación el total de las
empresas exportadoras agroalimentarias andaluzas (2177 empresas del corpus
sobre 1448 empresas regulares).

4. Metodología de explotación del corpus


Una vez compilado el corpus comenzó el trabajo de auditoría, consistente en la
observación o visionado de los sitios web mediante la ayuda de un cuestionario
de comprobación o verificación, al que también denominaremos, usando el an-
glicismo, checklist. Escogimos la herramienta de formularios en línea google-
docs, pues nos permite rellenar un cuestionario por cada web y almacenar las
respuestas en una hoja de cálculo. El cuestionario fue revisado y modificado
después de su aplicación a un primer corpus piloto de veinte empresas. La audi-
toría realizada a las primeras empresas sirvió también para poner en común las
dificultades encontradas y reformular algunas preguntas del cuestionario. El
equipo de trabajo se reunió en tres ocasiones para garantizar que los cinco 11
investigadores estaban respondiendo del mismo modo a todas las preguntas. Por

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


302 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

ejemplo, para responder adecuadamente la pregunta número 21, todos los «audi-
tores» debían tener el mismo concepto de locale (conjunto de información espe-
cífica que combina la lengua, la región y codificación infomática, ver Jiménez-
Crespo 2008: 38 para una definición más amplia). Así, la pregunta quedó for-
mulada del siguiente modo:
21. ¿Posee el sitio web un diseño estándar para todas las versiones lingüísticas o
está adaptado a cada locale? Esta pregunta se basa exclusivamente en el diseño,
en la apariencia del sitio web.
□ Estándar
□ Adaptado a cada locale
De modo similar, para responder a las preguntas 36 y 37, todos los miembros
debían interpretar la diferencia entre «adaptación» y «traducción» que contiene
la pregunta 37:
36. ¿Se incluye en el sitio información que lleva a enlaces externos al sitio web?
□ Sí
□ No
37. ¿Se ha tenido en cuenta en la versión localizada la adaptación o traducción de
la información que lleva a enlaces externos?
□ Sí, porque el enlace también está localizado
□ Sí, se indica expresamente que la información contenida en el enlace solo está
disponible en la lengua origen (adaptación)
□ No
□ No sistemáticamente
El resultado final, después de las modificaciones oportunas, derivó en una che-
cklist compuesta de 56 preguntas, organizadas en torno a ocho bloques temáti-
cos:
1. Datos de la sociedad: contiene los datos básicos sobre la empresa,
nombre, provincia, tipo de sociedad (S.L, S.A, etc.).
2. División entre páginas localizadas vs. no localizadas. Estudio de las
páginas no localizadas (información de contacto adaptada, resumen
o documento adjunto en pdf en otras lenguas, etc.).
3. Bloque de estudio de lenguas (banners/enlaces/TA): Estudio sobre
las lenguas a las que están traducidas los sitios y modo de señalizar-
lo. Estudio sobre los banners y banderas. Páginas que han sido tra-
ducidas con herramientas de traducción automática.
4. Bloque de estudio de imágenes: Estudio sobre la localización de
imágenes y texto en imágenes de las webs.
5. Bloque de contenido: estudio sobre la variación de contenido de las
versiones localizadas respecto de las versiones originales.
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 303

6. Enlaces externos y tienda virtual: localización de elementos exter-


nos y porcentajes de webs con sitios de venta online, estudio sobre
la localización de la tienda virtual.
7. Errores de codificación y derivados de diferentes sistemas lingüísti-
cos.
8. Marketing electrónico: estudio sobre posicionamiento SEO y SEM
de los sitios web mediante la observación del código fuente (etique-
tas lengua y palabras clave), presencia en redes sociales y en
youtube.
Como puede desprenderse de la estructura del cuestionario, la investigación no
aborda cuestiones lingüísticas de contraste ni otros objetivos clásicos de los
corpus de traducción, tales como errores traductológicos comunes a otros géne-
ros textuales no electrónicos (errores morfosintácticos, léxicos o terminológicos,
falsos sentidos, problemas estilísticos, etc.). Tampoco se ocupa de los proble-
mas de equivalencia o calcos en las formas lingüísticas convencionales de los
menús de navegación u otras partes del sitio (véase Jiménez-Crespo 2008). Sí se
trata, en cambio, de un estudio de carácter macrotextual y sociolingüístico, en
tanto en cuanto pretende ofrecer una visión panorámica o statu quo de la locali-
zación de este género digital y complejo, con el fin de ofrecer propuestas de
mejora dirigidas expresamente tanto al sector de la localización como directa-
mente al conjunto de pymes exportadoras.
En definitiva, el objetivo del proyecto de investigación en el que se enmarca el
trabajo de estas páginas es proporcionar un estudio amplio y riguroso sobre la
calidad de la localización de los sitios webs corporativos que, a su vez, arroja
conclusiones sobre la propia calidad de las webs originales. Este último fin se
debe a que el visionado de las webs originales ha arrojado conclusiones impor-
tantes tanto para el sector de la localización como para el de la redacción de
sitios originales en lengua española, sitios que van a ser localizados simultá-
neamente a la versión original o posteriormente. La ausencia de calidad de los
textos localizados ya ha sido atribuida por varios autores a causas diversas. Ji-
ménez-Crespo (2008: 539) destaca las siguientes: ausencia de una fase de con-
trol de calidad, cortos plazos de entrega, relajación de normas en textos web,
desaparición de la figura del texto como una única unidad, problemas tecnológi-
cos asociados a las fases de internacionalización y no al proceso de traducción
en sí, falta de calidad del texto original, así como falta de profesionalización de
los traductores de textos web. Uno de los objetivos del proyecto de investiga-
ción en el que se enmarca esta publicación radica en analizar en qué medida
estos motivos son responsables también en nuestro corpus.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


304 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

5. Primeros resultados
Dado que esta publicación se ha centrado en describir los objetivos generales y
la metodología del proyecto de investigación, se ofrecen a continuación única-
mente los resultados de algunas preguntas escogidas de los tres primeros blo-
ques del cuestionario. Como describimos arriba, el primer bloque está destinado
a los datos básicos de las empresas: nombre, provincia de la sede y tipo de so-
ciedad. En relación con la ubicación de la sede de la sociedad, la distribución de
las 2177 pymes exportadoras inscritas en Extenda entre las ocho provincias
andaluzas (tanto las que tienen sitio web corporativo como las que no) es la
siguiente:

Pymes por provincias


Sevilla (479) Córdoba (337) Almeria (248) Málaga (235)
Cádiz (228) Jaén (219) Granada (218) Huelva (213)

10%
22%
10%
10%
16%
10%
11% 11%

Gráfico 1. Distribución de empresas incluidas en el corpus por provincias


Como puede verse en el gráfico, la distribución geográfica de las empresas es
bastante equilibrada en casi todas las provincias excepto en Sevilla y Córdoba,
que son las provincias que cuentan con más pymes exportadoras en el sector
agroalimentario. La capital de la comunidad autónoma es, con diferencia, la
provincia que alberga el mayor número de empresas exportadoras andaluzas
agroalimentarias. Estos datos cambian si se observan en las estadísticas oficiales
los volúmenes de venta totales de todos los sectores (es decir, incluyendo indus-
tria, consumo y servicios además de nuestro sector), según los cuales por detrás
de Sevilla están Málaga y Cádiz antes que Córdoba.
A continuación, la auditoría recoge el tipo de sociedad empresarial de la empre-
sa analizada. Se han obtenido las siguientes estadísticas:
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 305

Nº de em presas

1191

403

206
85 100
37 28 25 14 8 5 4 3

S.L. S.A. S.C.A. S.A.T. S.L.U. C.B. S.L.L. S.C. S.A.U. S.A.L. S.C.P. S.L.N.E. Otro

Gráfico 2. Distribución de los tipos de sociedades empresariales


La mayor parte de las empresas, en concreto, el 54,7 %, son sociedades limita-
das (S.L.), seguidas de las sociedades anónimas (S.A.), que constituyen un
18,5 % de las pymes agroalimentarias inscritas en Extenda y seguidas de las
sociedades cooperativas agrarias (S.C.A.), con una representación del 9,4 %.
Otros tipos de sociedades representativas son: S.A.T: sociedad agraria de trans-
formación; S.L.U: sociedad limitada unipersonal; C.B.: comunidad de bienes;
S.L.L.: sociedad limitada laboral. El conocimiento sobre el tipo de sociedad es
pertinente porque nos permitirá relacionar el tamaño de la empresa con su pre-
sencia en internet y con la calidad de su sitio web corporativo. Partimos de la
premisa de que las empresas más potentes invierten más en recursos lingüísticos
que las empresas más pequeñas (hipótesis ya contrastada en el estudio ELAN y
PIMLICO, véase el apartado de introducción). El gráfico 2 muestra que más de
la mitad de las pymes exportadoras son sociedades limitadas (S.L. o S.L.U.),
cuyo capital social mínimo es 3000 euros y que puede formarse con un socio
único, frente a los 60000 euros necesarios para inscribir una sociedad anónima,
que debe tener un mínimo de tres socios y requiere una forma más compleja de
organización. Por su parte, las cooperativas y sociedades agrarias se forman
mediante una aportación de capital variable fijado en sus estatutos y suelen estar
constituidas por personas físicas que se asocian, en régimen de libre adhesión y
baja voluntaria, para la realización de actividades empresariales encaminadas a
satisfacer sus necesidades y aspiraciones económicas y sociales.
Los datos sobre el nombre, la sede y el tipo de empresa preceden a la primera
pregunta del cuestionario. Ésta tiene como finalidad cuantificar las pymes con
sitio web corporativo frente a aquellas que carecen de él:

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


306 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

«Pregunta nº 1: ¿Dispone la empresa de sitio web? Respuesta: □Sí / □No».


A pesar de que el uso del sitio web como herramienta de presentación, promo-
ción y venta en el extranjero es indiscutible, y que la presencia de las empresas
en internet es hoy día un hecho obligado por parte de instituciones públicas y
privadas, casi la mitad de las pymes andaluzas agroalimentarias inscritas en
Extenda no disponen de sitio web. De las 2177 empresas del sector agroalimen-
tario, solo el 59 % dispone de sitio web corporativo.
«Pregunta nº 2: ¿Está el sitio web localizado? Respuesta: □Sí / □No»
Con la respuesta afirmativa se marca si el sitio está traducido al menos a una
única lengua extranjera diferente del español. A pesar de que la localización
debe ir más allá de la mera traducción de los contenidos lingüísticos, y supone
una adaptación a la cultura destino de los productos de la empresa, en esta pre-
gunta se toma el concepto de localización con el significado de traducción de un
sitio web ya subida a un servidor de internet. Los resultados obtenidos indican
que el 53 % de los sitios sí disponen de al menos una versión localizada, frente
a un 47 % que solo tienen la web en versión original (versión en español en
todos los casos). Prácticamente la mitad de las empresas que exportan sus pro-
ductos o que están intentando hacerlo, no cuentan ni siquiera con una versión de
su sitio web corporativo en una lengua distinta del español. De esta forma, enla-
zando con el resultado de la pregunta anterior (pregunta número 1), nos encon-
tramos con que aproximadamente la mitad de las empresas inscritas en EX-
TENDA cuentan con un sitio web corporativo y de ese 50 %, de nuevo casi la
mitad no ha localizado su sitio web. Analizando estos resultados desde una
perspectiva global, incluyendo a las 2177 empresas inscritas en Extenda, llega-
mos a la conclusión de que el 41 % del total no disponen de un sitio web, el
27 % disponen de sitio web pero sin localizar y por último, el 31 % sí tiene sitio
web corporativo localizado. En definitiva, dos tercios del total de pymes agroa-
limentarias andaluzas que exportan regularmente o tienen intención de hacerlo,
o bien no disponen de un sitio web o no lo han localizado a ningún locale ex-
tranjero. Más adelante veremos, del tercio restante, a qué idioma o idiomas han
localizado su sitio.
En las siguientes capturas mostramos ejemplos de empresas que hacen hincapié
en su actividad exportadora y, aún así, no han localizado su sitio web a ninguna
lengua extranjera. En la ilustración 5, la empresa hace alusión a su «intensa
actividad de comercialización, tanto en el mercado español como en el europeo
y americano…».
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 307

Ilustración 5. Ejemplo de sitio web no localizado

Ilustración 6. Ejemplo de sitio web no localizado con enlace vacío para el inglés
La imagen de la página web incluye el siguiente mensaje: «Liderando la pro-
ducción y exportación de la fresa de Huelva». A pesar de que la página tiene un
enlace a una versión en inglés del sitio, cuando pinchamos para acceder a la
misma, esta incluye información en latín correspondiente a una plantilla web
que suele mostrarse cuando la página no tiene ningún contenido textual. Ade-
más, hay texto ilegible y texto en español, ofreciendo una imagen muy descui-
dada y poco profesional (ilustración 7):

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


308 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

Ilustración 7. Aspecto de la página que debería albergar la versión en inglés


del sitio con texto en latín
En este punto el corpus queda dividido en empresas que disponen de versiones
en otras lenguas y empresas que solo ofrecen información en lengua española.
Las empresas que ofrecen información en otras lenguas abarcan un grado muy
variable de localización, pues encontramos empresas que han traducido única-
mente algunas pestañas del menú o algunos documentos adjuntos (y en este
sentido no podría hablarse de localización en sentido riguroso del término, sino
de semilocalización o localización parcial, como veremos a continuación) y
otras que sí han sido localizadas teniendo en cuenta la cultura meta a la que van
a ser vendidos los productos. Pese a que la mayoría de los estudios científicos
define localización como adaptación lingüística y cultural al locale de destino,
lo cierto es que encontrar cambios estructurales importantes entre la versión
original y la versión localizada ha sido la excepción en nuestro corpus. Este
hecho, unido a que la traducción profesional de un texto cualquiera ya implica
una adaptación cultural en sí misma, hace que resulte muy complejo mantener
la «traducción de una web en internet» y la «localización de una web» como dos
conceptos claramente diferenciados entre sí. Por estos motivos, una web locali-
zada, en términos generales, es una web traducida y subida a un servidor de
internet, sin detrimento de que se recojan en nuestro cuestionario varias pregun-
tas con el fin de teorizar sobre los diversos grados de localización.
Dado que nos interesa indagar, desde un punto de vista sociolingüístico, los
motivos por los que una empresa exportadora o interesada en exportar no se ha
ocupado de que su carta de presentación más directa no pueda leerse en las len-
guas de aquellos países destinatarios de sus productos, debíamos profundizar
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 309

aún más en la observación de estas páginas. Siguiendo los niveles de adaptación


cultural de las webs propuestos por Singh y Pereira (2005: 10-15), una web
semilocalizada es aquella que, manteniéndose en su lengua original, tiene algún
elemento de adaptación cultural, tales como los datos de contacto de los distri-
buidores o delegaciones en otros países. En nuestro estudio también hemos in-
tentado medir el grado de sensibilidad o conciencia frente a la adaptación cultu-
ral de los sitios no localizados. En este sentido, los prefijos internacionales, la
inclusión del nombre del país (a veces en español, a veces la fórmula en inglés
Spain) o la inclusión de un formulario de contacto en inglés en una página no
localizada, son un indicativo de que, pese a no haberse encargado una traduc-
ción, sí se es consciente de su necesidad. La introducción del prefijo +34 o una
dirección de correo electrónico denominada exports nos indican que existe un
plan de contingencia mínimo si se tiene que atender una llamada o un email de
algún posible cliente extranjero. En este grupo de empresas, en cuyas webs a
menudo se incluyen banderas o banners para el inglés vacíos de contenido, se
intuye el deseo de contar con una versión en inglés. Deben buscarse, por tanto,
para este grupo de empresas, motivos como la posible falta de inversión o la
falta de información sobre cómo acceder a los servicios lingüísticos para expli-
car la ausencia de localización (Medina Reguera y Álvarez García 2013).
Los resultados de nuestra tercera pregunta (« Pregunta nº 3: En caso de que no
disponga de versión o versiones localizadas, ¿hay alguna información o dato de
contacto que esté mínimamente adaptado?»), ha arrojado un 28 % de sitios web
que tienen algún tipo de información mínimamente adaptada.
En otras ocasiones, por el contrario, la página está absolutamente enfocada al
público local, y la falta de diversidad lingüística podría achacarse a otros facto-
res, como la falta de conocimientos sobre la importancia que las lenguas ejercen
sobre el comercio internacional (Jiménez Narbona 2012). En este grupo se en-
cuentra el 72 % de las empresas. En otras palabras, ni si quiera un tercio de las
empresas exportadoras del sector agroalimentario andaluz que poseen una pági-
na web no traducida a ningún otro idioma –recordemos en este punto que se
trata del 47 % del total de empresas con web- han pensado en los clientes ex-
tranjeros a la hora de presentar su empresa en internet, ni siquiera a la hora de
escribir la dirección postal o el número de teléfono. En este sentido, sería perti-
nente que la industria de la traducción reflexionase también sobre cómo seguir
esforzándose en explicar al sector empresarial las ventajas de la contratación de
sus servicios así como en aumentar la conciencia en foros empresariales (cáma-
ras de comercio, agencias de internacionalización, etc.) sobre la necesidad de
utilizar los idiomas como herramienta para la promoción y venta de sus produc-
tos.
Jiménez-Crespo propone cinco niveles de localización, de 0 a 4, en las que el
nivel 0 lo comprenden las páginas web que contienen uno o varios documentos

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


310 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

pdf con la información básica de la empresa o bien un enlace a un sistema de


traducción automática (Jiménez-Crespo 2013: 35-36). Aunque nosotros no he-
mos incluido el enlace de la TA en este nivel, sí podríamos asimilar este grupo
de 28 % del total de sitios web no localizados pero que poseen algún tipo de
información de contacto adaptada al nivel 0 de Jiménez-Crespo. La distribución
del tipo de información adaptada es la siguiente:
«Pregunta nº 4: En caso de que hayan adaptado alguna información del sitio mo-
nolingüe, ¿de qué tipo de información o dato se trata?»

Gráfico 3. Informaciones adaptadas


Llama la atención que, en las direcciones postales, solo 15 webs incluyan el
nombre del país (España o Spain) debajo del nombre de la provincia.
A continuación, la sexta pregunta nos ofrece información sobre las lenguas a las
que se han localizado los sitios:
«Pregunta nº 6: En caso de que se haya localizado el sitio web, ¿a qué idiomas se
ha traducido?»
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 311

Gráfico 4. Idiomas de localización de los sitios web


A partir de este momento, el cuestionario de verificación se centra en el grupo
de sitios web que sí están localizados, y la primera cuestión obviamente se ocu-
pa de la/s lengua/s a la/s que se traducen. Con diferencia, la lengua que cuenta
con más representación en las versiones localizadas es el inglés y su hegemonía
como lengua franca en todos los ámbitos, incluido el económico, alcanza casi el
total de las webs localizadas. Le siguen el francés, el alemán, el italiano y el
portugués, lenguas europeas de los principales socios exportadores de Andalu-
cía (ver cap. 3). Finalmente, las lenguas orientales (chino con 36 sitios traduci-
dos, 13 al japonés) y el ruso también cuentan con bastantes versiones.
Desde un punto de vista comercial y de marketing electrónico, el modo de acce-
der a las diferentes versiones lingüísticas también influye psicológicamente en
los compradores. Nuestro cuestionario ha incluido un apartado de preguntas en
las que puede estudiarse el modo en el que se accede a las páginas localizadas y
su relación con la página original. Así, gracias a la pregunta número 8, se identi-
fican aquellos sitios en los que se elige la lengua desde un portal de inicio co-
mún:
«Pregunta nº 8: ¿Aparece el acceso a las diferentes versiones lingüísticas en un
portal de inicio común?»
En nuestro corpus, el 77 % no tiene las versiones lingüísticas en portal de inicio
común, mientras que el 23 % sí dispone de él. El objetivo de la formulación de
esta pregunta y su inclusión en el cuestionario es saber si las empresas son
conscientes de la importancia de la «igualdad» lingüística y consideran por tan-
to que todas las versiones (la original y el resto) están al mismo nivel. En la

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


312 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

mayoría de los casos se tiende a establecer la versión original (versión en espa-


ñol) como versión principal del sitio web desde la que se accede al resto de
versiones lingüísticas. Por lo tanto, el usuario que accede al sitio web mediante
la URL, se encuentra primero con la interfaz de la versión en español, la cual le
da acceso mediante el uso de banderas o el nombre de la lengua extranjera a la
versión o versiones localizadas. Solo un 2,3 de cada diez sitios web que incluían
versiones localizadas daban acceso a todas las versiones (originales y traduci-
das) mediante un portal de inicio común multilingüe enlazado a todas estas ver-
siones. En estos casos, la versión en español puede considerarse al mismo nivel,
con el efecto positivo de atracción a los clientes extranjeros (véase ejemplo en
la ilustración 8).
A continuación, se incluye un ejemplo de un portal de inicio común correspon-
diente a uno de los sitios web incluidos en nuestro corpus:

Ilustración 8. Ejemplo de portal de inicio común


Por último, haremos una breve alusión al bloque de preguntas número 3, refe-
rente al modo de señalizar las versiones localizadas. Además del lugar (en un
portal de inicio, en la página principal home, arriba a la derecha, arriba a la iz-
quierda, etc.), el icono más frecuente para dar acceso a los hipervínculos son las
banderas, pero también el nombre de las lenguas ocupa un lugar importante. El
estudio también desvela que un 6 % de los sitios contiene iconos sin hipervincu-
lar, es decir, contiene las banderas o el nombre de las lenguas, pero al clicar
estos no funcionan o remiten a la versión original (en español) del sitio web,
corroborando la realidad de que las versiones localizadas no existen, si bien
éstas pudieran estar previstas para el futuro, o ser el cliente consciente, al me-
nos, de su importancia.
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 313

6. Conclusiones
Se han presentado aquí las bases, objetivos y primeros resultados de un proyec-
to novedoso y que puede tener un importante componente de transferencia tec-
nológica una vez concluida la investigación, pues puede ser capaz de transferir
conocimiento y propuestas de mejora al sector empresarial. El corpus de webs
de empresas agroalimentarias andaluzas nos debe servir de modelo para el resto
de empresas de otros sectores y, probablemente, podría ser extrapolable a otras
comunidades autónomas. La metodología incluye la cumplimentación de 2177
cuestionarios, uno por cada empresa incluida en la investigación. Cada empresa
se corresponde con un cuestionario porque el primer objetivo del estudio era
cuantificar el porcentaje de empresas que disponen de sitio web corporativo
frente a empresas exportadoras que aún no tienen presencia en internet. En se-
gundo lugar, hemos desarrollado el modo de compilación de un corpus paralelo
o corpus de traducción cuya explotación tiene como primer objetivo la investi-
gación empírica cuantitativa, es decir, conocer el volumen y porcentaje de sitios
web corporativos originales y traducidos. El número y delimitación de idiomas,
el acceso a las diferentes versiones lingüísticas o la sensibilidad mostrada hacia
el cliente extranjero son algunos de los primeros resultados que presentamos en
estas páginas. El corpus se compone de 1284 sitios web corporativos y asumi-
mos el sitio web corporativo como un género textual de estructura multimodal y
compleja ampliamente descrito y estudiado por otros autores (fundamentalmen-
te nos basamos en los trabajos de Jiménez-Crespo 2008, 2013). Estos se pueden
visionar descargados en formato html con el programa de descarga HTTrack sin
temor a que sufran modificaciones durante la investigación.
El visionado del corpus debía hacerse rigurosa y metódicamente, y a tal efecto
hemos elaborado un cuestionario de verificación, tomando como referencia el
método de la auditoría y el trabajo del auditor profesional (Madariaga 2004). No
hemos presentado en esta publicación la totalidad de las preguntas del cuestio-
nario, pues nos hemos detenido en los pasos seguidos en su elaboración, en la
estructura de los bloques de contenido y se han ofrecido los resultados de las
preguntas más relevantes de los tres primeros bloques del cuestionario. Dado
que no se trata de un formulario de googledocs al uso, cumplimentado por los
agentes implicados en el proceso traductor, sino en un cuestionario rellenado
por un equipo de trabajo y basado en una lista de verificación, era fundamental
explicar detenidamente la metodología de trabajo y la justificación de la rele-
vancia de los objetivos de la investigación.
En esta publicación, además, se pretende ofrecer una descripción del panorama
general o status quo en términos cuantitativos de la localización de los sitios
web de pymes exportadoras agroalimentarias andaluzas. A este respecto, pode-
mos afirmar que se trata en su gran mayoría de sociedades limitadas, de las
cuales solo tienen presencia en Internet algo más de la mitad, y de ellas nueva-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


314 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

mente casi la mitad tiene su web en al menos una lengua extranjera (ver apdo.
5). Este número es bastante inferior a la media europea si tomamos como refe-
rencia los datos de la Agenda Digital para Europa y la Agenda Digital para
España, en la que se estipula que España tiene que subir del 28,6 % al 55 % en
pymes con páginas web entre los años 2012 y 2015, o del 10,7 % al 33 % en
«pymes que realizan ventas online» y del 8,8 % al 20 % en «población que rea-
liza compras online transfronterizas» (Planes Específicos de la Agenda Digital
para España, punto 8, pág. 57).
El análisis de los diferentes sitios web pone de manifiesto que existe una gran
brecha entre la teoría de la localización (en qué consiste el proceso, cómo debe
llevarse a cabo, qué aspectos deben tenerse en cuenta, qué profesional se encar-
ga de realizarla, las buenas prácticas que la disciplina establece) y la realidad
existente en la práctica, en la que parecen desconocerse el proceso en sí y la
importancia de llevarlo a cabo con una mínima garantía de calidad. Las empre-
sas están inscritas en un portal para exportar (EXTENDA, fuente del listado de
empresas de las que hemos descargado las webs) pero su presentación lingüísti-
ca en internet no puede describirse como internacional. Sobre los motivos a los
que atribuir las deficiencias de estructura de los originales (páginas rudimenta-
rias, con poca información útil para la venta en el exterior y poco actualizadas),
intuimos después de una observación muy detallada del corpus que existen pro-
blemas de interactuación entre los tres agentes esenciales en el proceso: el em-
presario o cliente de los servicios de localización, el desarrollador del sitio web
y el localizador/traductor (Medina Reguera y Ramírez Delgado 2014).
Por tanto, aunque el fin último de los textos localizados es que se perciban co-
mo creaciones originales en las diferentes lenguas o locale (LISA 2004: 11),
podemos ratificar que queda aún un largo camino para llegar a ese fin en el
corpus analizado. Más bien, en nuestro contexto, hay que establecer metas más
cercanas, consistentes en la modernización de los sitios originales y una mayor
inversión en el sector para aumentar el número de localizaciones, habida cuenta
de los porcentajes derivados del estudio. Un número creciente de empresas ex-
portadoras y un volumen de exportación en constante crecimiento conllevan
necesariamente mayores necesidades de mediación lingüística en un sector que,
de manera tradicional, ha estado formado por empresas familiares y carentes de
conocimientos en idiomas. No hay duda de que la buena calidad de las produc-
ciones textuales refuerza positivamente la imagen de las empresas y que los
Estudios de Traducción pueden contribuir a desarrollar el crecimiento, la com-
petitividad y la internacionalización de la empresa española, así como a favore-
cer y potenciar su presencia internacional en las redes comerciales y en los mer-
cados globales.
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 315

7. Bibliografía
Agenda Digital para España. 2013. Disponible en <
http://www.agendadigital.gob.es/agendadigtal/recursos/Recursos/1. %20Versi
%C3 %B3n %20definitiva/Agenda_Digital_para_Espana.pdf> y en
<http://www.agendadigital.gob.es/Paginas/Index.aspx>.
Agenda Digital para Europa. 2013. Disponible en <http://ec.europa.eu/digital-
agenda/>.
Álvarez García, Carmen. 2010. Estudio del lenguaje de especialidad económico: El
lenguaje del comercio internacional. @ Entreculturas 3: 279-290.
Bolaños Medina, Alicia 2002. Diseño y aplicación de un modelo didáctico innovador
para la traducción de géneros digitales. Tesis Doctoral. Universidad de las
Palmas de Gran Canaria.
Bowker, L. 2001. A Corpus-Based Approach to Translation Evaluation. @ Meta 46/2:
345-363.
Cyr, Dianne. 2004. Localization of Web Design: An Empirical Comparison of German,
Japanese, and U.S.Website Characteristics. @ Journal of the American Society
for Information Science and Technology 55/13: 1-10. Disponible en
<http://www.diannecyr.com/cyr2004_weblocalization.pdf>. Consultado el
15/5/2014
ELAN. 2006. Effects on the European Economy of Shortages of Foreign Language
Skills in Enterprise. Disponible en
<http://ec.europa.eu/languages/policy/strategic-
framework/documents/elan_en.pdf>. Consultado el 15/5/2014.
Feely, Alan.J. y Anne-Wil Harzing. 2003. Language management in multinational com-
panies. @ Cross-cultural management: an international journal 10 / 2: 37-52.
Gallego Hernández, Daniel, Paola Masseau y Miguel Tolosa Igualada. 2013. La traduc-
ción profesional en el ámbito de la economía y los negocios. Primeros resulta-
dos de un estudio de mercado. @ II Jornadas Ciencia y Traducción, Universi-
dad de Córdoba.
Hagen, Stephen. 2011. Report on Language Management Strategies and Best Practice
in European SMEs: The PIMLICO Project. Disponible en
<http://ec.europa.eu/languages/policy/strategic-framework/documents/pimlico-
full-report_en.pdf>. Consultado el 15/5/2014.
Hagen, Stephen. 2009: The ELAN-CAT Study: A Study of the Use of Languages for
Commerce and Trade in Catalonia. Universitat Oberta de Catalunya. Disponi-
ble en:
<http://www.uoc.edu/portal/ca/catedra_multilinguisme/_resources/documents/
HAGEN_barcelona_study_21_dec.pdf> ). Consultado el 15/5/2014
Harzing, Anne Wil. y Markus Pudelko. 2013. Language competencies, policies and
practices in multinational corporations: A comprehensive review and compari-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


316 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

son of Anglophone, Asian, Continental European and Nordic MNCs. @ Jour-


nal of World Business 48 / 1: 87-97.
Ibáñez Rodríguez, Miguel, Jesús M. Bachiller Martínez y María Teresa Sánchez Nie-
to. 2010. Comercio exterior y mediación lingüística en el sector vitivinícola de
Castilla y León. @ Hermeneus. Revista de Traducción e Interpretación 12: 1-
16.
Ibáñez Rodríguez, Miguel et al., eds. 2010. Vino, lengua y traducción. Universidad de
Valladolid: Secretariado de Publicaciones e Intercambio Editorial.
Ivorra Pérez, Francisco. 2009. La dimensión cultural del contexto y su influencia en las
estrategias comunicativas que dan expresión a las páginas web de negocios en
inglés y en español. @ Languages for Business. A Global Approach.Aragón:
Prensas Universitarias de Zaragoza.. ISBN 978-84-92774-01-2, pp. 97-112.
Ivorra Pérez, Francisco. 2011. La dimensión cultural de género y su influencia en el
estilo comunicativo de las páginas web de negocios de empresas jugueteras es-
pañolas y británicas. Multiple Voices in Academic and Professional Discurse:
Current Issues in Specialised Language Research, Teaching and New Technol-
ogies. Cambridge: Cambridge Scholars Publishing. ISBN 1-4438-2971-4, pp.
91-101.
Jiménez, Juan Carlos y Aránzazu Narbona. 2012. La lengua como instrumento de inter-
nacionalización. @ Mediterráneo económico 21: 167-180. Disponible en:
<http://publicaciones.fundacioncajamar.com/index.php/me/article/view/556/16
0>. Consultado el 14/05/2014.
Jiménez-Crespo, Miguel Ángel. 2008. El proceso de localización web: estudio contras-
tivo de un corpus comparable del género sitio web corporativo. Tesis doctoral.
Universidad de Granada.
Jiménez-Crespo, Miguel Ángel. 2009. El uso de corpus textuales en localización. @
Tradumática 7. Disponible en
http://ddd.uab.cat/pub/tradumatica/15787559n7a5.pdf.
Jiménez-Crespo, Miguel Ángel. 2011. A Corpus-based Error Typology: Towards a
More Objective Approach to Measuring Quality in Localization. @ Perspec-
tives 19: 315-338.
Jiménez-Crespo, Miguel Ángel. 2013. Translation and Web Localization. New York-
London: Routledge.
Johannson, Stig y Signe Oksefiell, eds. 1998. Corpora and Cross-linguistic Research:
Theory, Method and Case Studies. Amsterdam-Atlanta: Rodopi. ISBN 978-90-
420-0291-3.
Laviosa, Sara. 2002. Corpus-based Translation Studies. Amsterdam: Rodopi.
LISA. 2004. Localisation Industry Primer. 2nd Edition. @ A. Lommel, ed. Ginebra:
The Localisation Industry Standars Association (LISA).
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 317

Lozano Argüelles, Cristina. 2011. Estudio de Mercado sobre la Traducción en España.


Universidad de Salamanca. Trabajo de Grado de la Lic. en Traducción e Inter-
pretación. Repositorio Gredos de la Universidad de Salamanca. Disponible en
<http://hdl.handle.net/10366/108764 >
Madariaga, Juan Mª. 2004. Manual Práctico de Auditoría. Barcelona: Deusto.
Marschan, Rebecca, Denice Welch y Lawrence Welch. 1997. Language: The Forgotten
Factor in Multinational Management. @ European Management Journal 15/5:
591-98.
Mayoral Asensio, Roberto. 2006. La traducción comercial. @ Butlletí de la Associació
de Traductors i Intérprets Jurats (diciembre), s.p.
Medina Reguera, Ana. 2007. La traducción alemán-español de documentos del
Comercio Exterior: Organización de la tipología textual e integración del
contenido temático. @ B. Santana, S. Roiss Y M.A. Recio, eds. Puente entre
dos mundos: Últimas tendencias en la investigación traductológica alemán-
español. Ediciones Universidad de Salamanca. ISBN: 978-84-7800-357-0, pp.
252-260.
Medina Reguera, Ana y Carmen Álvarez García. 2013. La relación empresa-traducción
en el sector agroalimentario andaluz. @ Skopos 4 [en prensa].
Medina Reguera, Ana y Cristina Ramírez Delgado. 2014. La localización de la sección
“productos” en sitios web de empresas exportadoras agroalimentarias. New In-
sights into Specialised Translation. Selected Papers from the International
Conference on Economic, Business, Financial and Institutional Translation.
InTRALinea Online Translation Journal [en prensa]
Neves y Albuquerque 2011. Gestão das Línguas na Comunicação Internacional das
Empresas. @ Revista Portugal Global 15. Disponible en
<http://www.revista.portugalglobal.pt/AICEP/Conhecimento/LnguasnaComuni
caoInternacionaldasEmpresas/>. Consultado el 15/5/2014.
Planes Específicos de la Agenda Digital para España. 2013. Disponible en
<http://www.agendadigital.gob.es/planes-
actuaciones/Bibliotecaplanesconsolidados/Planes-Especificos-ADpE.pdf>
Renau Renau, M. Luisa 2004. La página web de la industria cerámica-azulejera: un
estudio descriptivo y su aplicación en la enseñanza de inglés para la informá-
tica. Tesis Doctoral. Castelló: Universitat Jaume I
Roiss, Silvia. 2001. El mercado de la traducción inversa en España. Un estudio estadís-
tico. @ Hermȇneus. Revista de Traducción e Interpretación 3: 397-408.
Sánchez Barbero, Cristina. 2010. Las páginas web de las bodegas. Una aproximación
textual. @ M. Ibáñez Rodríguez, coord. Vino, Lengua y traducción, Vol. 2
(CD-ROM), ISBN 978-84-8448-554-4, pp. 335-352.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


318 ANA MARÍA REGUERA Y CRISTINA RAMÍREZ

Sánchez Nieto, M. Teresa. 2006. Publicidad, vitivinicultura y traducción: Estudio con-


trastivo de presentaciones de bodegas españolas y alemanas. @ Hermeneus.
Revista de Traducción e Interpretación 8: 125-154.
Sánchez Nieto, M. Teresa. 2009. El realce totalizador en español y en alemán. Un estu-
dio retórico-contrastivo y descriptivo de traducciones de sitios web corporati-
vos de bodegas. @ Viceversa. Revista galega de traducción, 15: 87-118.
Singh, Nitish y Aurun Pereira. 2005. The Culturally customized web site: Customizing
web sites for the global marketplace. Burlington, Oxford Elsevier Butterworth-
Heinemann. ISBN 13: 978-0750678490.
Socorro Trujillo, Karina. 2008. Aspectos textuales y terminológicos de documentos
mercantiles del comercio internacional: herramientas aplicables a la forma-
ción de traductores. Las Palmas de Gran Canaria: Servicio de publicaciones de
la ULPGC.
Suau Jiménez, Francisca 2010. La traducción especializada en inglés y español en gé-
neros de Economía y Empresa.Madrid: Editorial ARCO LIBROS, S.A., Colec-
ción Biblioteca Philologica. ISBN 978-84-7635-791-0.

1
Pyme es sustantivo común derivado del acrónimo de pequeña y mediana empresa, aunque en
nuestro estudio nos referimos también a las micropymes: según datos del INE 2012, el 95,4% de
las empresas de España son micropymes, es decir, de 0 a 9 empleados, el 3,8% pequeñas empre-
sas, de 10 a 49 empleados, y el 0,6% medianas empresas, de 50 a 199 empleados.
2
Esta definición de Medina Reguera coincide en buena parte con las definiciones de traducción
comercial de Mayoral (2006) o Socorro Trujillo (2008), basadas en el contenido y en el contexto.
La diferencia radica en que, en nuestra definición, todas las manifestaciones textuales y modali-
dades de traducción que intervienen en el proceso de internacionalización de una empresa (inclu-
yendo textos publicitarios sobre productos, textos jurídicos como licitaciones, formularios mer-
cantiles, textos multimodales como vídeos corporativos o páginas web, etc.) forman parte del
concepto TCEX, pues el punto de partida es el desarrollo del negocio internacional, y a él se
subordinan las manifestaciones textuales. Otras reflexiones sobre la clasificación de géneros
textuales de este ámbito puede leerse en Del Pozo Triviño, M. 2009. La traducción de documen-
tos marítimos. Clasificación de los principales géneros y marco de análisis. Sendebar 20, s. p.
3
Y aún podríamos haber incluido en este apartado de precedentes otros muchos trabajos sobre
traducción económica, que solo mencionan superficialmente la traducción comercial (Gallego
Hernández, Daniel. 2012. Traducción económica y corpus: del concepto a la concordancia.
Publicaciones de la Universidad de Alicante), o aquéllos que dedican su interés a la traducción
publicitaria en campañas de marketing internacional (de Pedro, Raquel. 2007. Las estrategias de
internacionalización en la traducción publicitaria. Revista de Lingüística y Lenguas Aplicadas, 2,
pp. 7-16) u otros como, por poner un ejemplo, Carmona Sandoval, que bajo la etiqueta de «tra-
ducción financiera» han establecido una tipología textual de «documentos requeridos en procesos
de internacionalización empresarial» (Carmona Sandoval, Alejandro. 2013. El estudio de las
cuentas anuales como ejemplo para cuestionar la «traducción financiera». Sendebar 24. pp 151-
168), ejemplificado en empresas españolas que se desean establecerse en Francia). Por último, no
podemos olvidar estudios sobre «traducción institucional» que estudian textos legislativos del
Comercio Internacional, tales como Fuertes Olivera, Pedro A., Silvia Montero Martínez y Merce-
METODOLOGÍA PARA EVALUAR LA LOCALIZACIÓN WEB EN ESPAÑA… 319

des Garcia de Quesada. 2005. Modelos culturales y discursivos en la traducción de textos de


Comercio Internacional: problemas y soluciones. Babel 51 (4): 357-379.
4
Este trabajo forma parte de un proyecto de I+D+i financiado por el Ministerio de Economía y
Competitividad en la convocatoria 2013-2016 («Programa Estatal de Investigación, Desarrollo e
Innovación Orientada a los Retos de la Sociedad») denominado «Localización de webs corporati-
vas y e-marketing multilingüe para fomentar la internacionalización de las pymes españolas»
(FFI2013-44550-R) cuya investigadora principal es Ana Medina Reguera (Universidad Pablo de
Olavide de Sevilla).
5
Información disponible en el sitio web de la Agencia Andaluza de Promoción Exterior (EX-
TENDA): http://www.extenda.es/web/opencms/servicios/observatorio/.
6
Véase La empresa española en el Mercado alemán: experiencias y factores de éxito 2011. Edi-
tado por la Cámara de Comercio Alemana para España. Barcelona. 2011. Disponible en:
http://www.ahk.es/fileadmin/ahk_spanien/Encuesta/La_empresa_espanola_en_el_mercado_alema
n.pdf así como otros estudios anteriores de la Cámara.
7
Fuente de la noticia:
http://www.extenda.es/web/opencms/extenda/noticias/noticia_1091.html#sthash.SRVSt7CR.dpuf
8
Estadística de Intercambios de Bienes entre Estados de la UE y Comercio Extracomunitario.
Resultados de Andalucía. Disponible en
http://www.extenda.es/web/opencms/servicios/observatorio/index.htm. Consultado el 15/5/2014
9
Se denomina empresas exportadoras regulares a aquellas que han exportado al menos una vez al
año durante los últimos cuatro años.
10
Fuente: http://www.extenda.es/web/opencms/servicios/observatorio/index.html.
11
Nuestro agradecimiento más sincero a Julia García Donas, Antonio Jesús Peña Moya y Kira
Joline Wehmeier, sin cuyo trabajo y aportaciones no hubiera sido posible auditar la totalidad del
corpus.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


PARTE IV
COMPILACIÓN Y CLASIFICACIÓN DE RECURSOS
PART IV
RESSOURCE CREATION / SET-UP AND RES-
SOURCE CLASSIFICATION
EHUskaratuak: un corpus de traducciones acadé-
micas en una lengua minoritaria

[EHUskaratuak: a corpus of academic translations


in a minority language]
GIDOR BILBAO TELLETXEA Y JESUS MARI MAKAZAGA EIZAGUIRRE
Universidad del País Vasco - Euskal Herriko Unibertsitatea
gidor.bilbao@ehu.es
Resumen
EHUskaratuak (<http://ehuskaratuak.ehu.es>) es un corpus multilingüe que permite
consultar textos paralelizados de libros académicos traducidos del inglés, francés y
castellano al euskera bajo la coordinación del Servicio de Euskera de la UPV/EHU.
Todas las traducciones han sido realizadas aplicando una metodología colaborativa, en
la que un profesional de la traducción realiza una primera versión, que es posteriormen-
te consensuada por un grupo de revisores técnicos especialistas del área de conocimien-
to de la publicación, junto con otro grupo de revisores lingüísticos, especialistas de la
lengua meta, el euskera, una lengua minoritaria en proceso de normalización. La aplica-
ción busca ofrecer al usuario los resultados más completos por medio de una búsqueda
muy simple, de modo que pueda servir no sólo a profesionales de la traducción o a in-
vestigadores, sino también a los propios especialistas universitarios, tanto en la traduc-
ción como en la creación de sus propios textos en una lengua en proceso de normaliza-
ción.
Abstract
EHUskaratuak (<http://ehuskaratuak.ehu.es>) is a multilingual corpus containing
Basque translations of academic books in English, French and Spanish which can be
consulted alongside their original text. These translations are coordinated by the Basque
Normalization and Translation Department of the University of the Basque Country
(UPV/EHU). All translations are carried out according to a collaborative methodology:
first, a professional translates the text, which is subsequently revised by a group of
technical reviewers specialized in the field of knowledge of the publication, and then by
a team of copy editors specialized in the target language, Basque, a minority language in
the process of normalization. This application seeks to offer the user the most complete
results by means of a very simple search, so that it can be useful not only to translation
professionals or researchers, but also to university specialists themselves, both in the
translation and creation of their own texts in Basque, a language on the way to normali-
zation.
Palabras clave
Corpus multilingüe, textos paralelizados, lenguaje científico-técnico, traducción técnica
y normalización de lenguas

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
324 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

Keywords
Multilingual corpus, parallel texts, scientific-technical language, technical translation
and language normalization

1. EHUskaratuak: el corpus de un servicio de traducción


El nombre con el que bautizamos el corpus de traducciones académicas que
presentamos en este artículo encierra en sí un juego de palabras que pretende ser
sugerente para el usuario vascófono: euskara significa ‘lengua vasca’; el verbo
derivado euskaratu quiere decir ‘traducir a la lengua vasca’, y finalmente el
participio nominalizado euskaratuak es utilizado para referirse a ‘las cosas tra-
ducidas a la lengua vasca’, ‘las traducciones en lengua vasca’. Euskaratuak
sería una palabra perfectamente comprensible para cualquier conocedor del
vascuence, pero la -h- intercalada la convierte en una palabra nueva, inexistente
en el léxico de la lengua vasca, que recuerda las siglas en euskera (EHU) del
nombre oficial bilingüe de la universidad en la que se ha desarrollado el corpus:
«Universidad del País Vasco - Euskal Herriko Unibertsitatea (UPV/EHU)». De
este modo, si euskara es la lengua vasca, EHUskara sugeriría la lengua vasca de
la UPV/EHU, y EHUskaratuak sería, de alguna manera, el conjunto de lo que se
ha traducido al euskera en la UPV/EHU 1.
Esta explicación pretende situar el corpus en el contexto en el que fue gestado.
De hecho, EHUskaratuak (<http://ehuskaratuak.ehu.es>) nació en el seno del
Servicio de Euskera de la UPV/EHU 2, un servicio universitario que, entre otras
funciones, incluye las de un servicio de traducción. En el caso de la Universidad
del País Vasco, este servicio distingue claramente el servicio de traducción de
textos administrativos, no académicos, para lo cual se cuenta con una plantilla
de traductores pertenecientes al Personal de Administración y Servicios de la
universidad, y, por otra parte, un servicio lingüístico que se ocupa fundamen-
talmente de garantizar la idoneidad y la calidad de la lengua vasca usada en los
textos académicos, de los cuales una buena parte son traducciones.
En este punto, quizás no sobre una aclaración en relación con la situación de la
lengua vasca en la Universidad del País Vasco. La UPV/EHU reconoce en sus
estatutos (artículo 8) la oficialidad del euskera y del castellano, y establece que
«prestará particular atención a la cultura vasca y, dentro de ella, al euskera, es-
pecialmente en sus aspectos científicos y técnicos». Esta salvaguarda, lejos de
reflejar una posición privilegiada de la lengua vasca en la UPV/EHU, supone
implícitamente el reconocimiento de su situación no normalizada, y aboga ex-
plícitamente por impulsar su normalización en el ámbito universitario. De he-
cho, en 1990 se aprobó un I Plan de Normalización del Uso del Euskera en la
UPV/EHU, que fue seguido en 1999 por el segundo plan con la misma denomi-
nación; los planes quinquenales posteriores, aprobados el curso 2007-2008 y el
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 325

curso 2013-2014, se llamaron, un tanto eufemísticamente, Plan Director del


Euskera de la UPV/EHU.
Unos pocos datos recogidos en el II Plan Director del Euskera de la UPV/EHU
(2013-2017) nos pueden valer para ilustrar la situación de la lengua vasca como
lengua minoritaria en el ámbito universitario, aún tomando en consideración
que, teniendo en cuenta tanto universidades públicas como privadas, la
UPV/EHU es la universidad que indudablemente ha realizado un mayor esfuer-
zo por impulsar el desarrollo del euskera tanto en la docencia universitaria como
en la investigación.
Si examinamos los datos del alumnado, nos parece significativo observar que en
el curso 1997/98 cursaba sus estudios en los grupos de euskera el 23,46 % del
alumnado de nuevo acceso, y en el curso 2012/13 el 48,07 %. Si lo comparamos
con los porcentajes de profesorado, observamos que en el año 2013 el 47,76 %
del PDI de plantilla con dedicación completa ocupaba una plaza de perfil lin-
güístico bilingüe (español-euskera), de lo cual se puede extrapolar que cerca de
la mitad del profesorado no sabe euskera (el dato no es exacto, porque hay pro-
fesores que saben euskera y ocupan puestos no bilingües, pero no son numero-
sos). Finalmente, es interesante el dato relativo a la docencia en lengua vasca, y
su incremento en un periodo no muy amplio: teniendo en cuenta que, en gene-
ral, no hay titulaciones ni asignaturas que se oferten exclusivamente en lengua
vasca, se ha pasado de ofertar en 1988 el 32 % de las asignaturas obligatorias en
euskera, a un 80 % en 2013. Esta evolución ha ido acompañada por un esfuerzo
en la creación y traducción de material bibliográfico en lengua vasca, pero el
déficit es aún hoy evidente.
Es precisamente en este aspecto donde interviene el Servicio de Euskera de la
UPV/EHU, que cuenta entre sus funciones la coordinación y el control de la
calidad de tres colecciones de traducciones académicas: 1) Una colección de
manuales universitarios, que edita el Servicio Editorial de la Universidad del
País Vasco. 2) Una colección de prosa de divulgación científica (Zientzia Ira-
kurle Ororentzat ‘Ciencia para todos los lectores’), que edita junto con la Cáte-
dra de Cultura Científica de la UPV/EHU. 3) Una colección bilingüe de leyes
(llamada Legeak - Leyes), que la universidad edita en colaboración con el De-
partamento de Justicia del Gobierno Vasco.
Al menos desde 2002, el Servicio de Euskera de la UPV/EHU ha enmarcado
todos sus proyectos de traducción en un proyecto de normalización de la lengua
vasca académica, gracias a la clarividencia de un precursor en el campo de los
corpus de la lengua vasca y en general de las herramientas tecnológicas aplica-
das al estudio del euskera como fue el profesor Iñaki Ugarteburu.
Este proyecto, en su primer diseño, de hace ya más de una docena de años, in-
cluía una herramienta de consulta online de las memorias de traducción de todos

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


326 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

los textos académicos traducidos bajo la coordinación y supervisión del Servi-


cio; aquella herramienta (Itzulpenen kontsulta ‘Consulta de traducciones’) fue
de hecho, en 2002, el antecedente directo, organizado según la tecnología dis-
ponible en aquel momento, de lo que luego ha sido, a partir de 2013, EHUska-
ratuak.
En este contexto hay que mencionar también Ereduzko Prosa Gaur, el corpus
de la lengua vasca más exitoso hasta el momento, como veremos más adelante,
que fue publicado por el Servicio de Euskera de la UPV/EHU en su página web
en 2007, fundamentalmente gracias al trabajo del profesor Ibon Sarasola,
miembro del Servicio.
Volviendo al proyecto ideado por Iñaki Ugarteburu, la consulta del texto de las
traducciones se completaba con una base de datos terminológica que, desgra-
ciadamente, pronto dejó de actualizarse, con lo cual perdió muy pronto gran
parte de su valor. Ahora, en 2014, estamos a punto de publicar la base de datos
terminológica Gaika (‘Por temas’, ‘Por áreas’), relacionada por medio de links
con el corpus EHUskaratuak, puesto que recoge precisamente la terminología
utilizada en dicho corpus.
Finalmente, el tercer componente del proyecto de normalización lo constituía y
sigue constituyendo Ehulku (‘Consejos lingüísticos de la UPV/EHU’), un servi-
cio de consulta de dudas lingüísticas atendido por miembros del Servicio de
Euskera, completado por una serie de cápsulas de formación lingüística que el
profesorado vascófono de la UPV/EHU recibe regularmente en su dirección de
correo electrónico.
Insistimos en que estas tres herramientas fueron concebidas para optimizar el
valor de las traducciones académicas coordinadas y supervisadas por el Servicio
de Euskera. El denominador común de las tres colecciones de traducciones
mencionadas más arriba es la metodología colaborativa en la traducción, ya que
en todas las traducciones colaboran desde el inicio mismo de la traducción uno
o varios profesionales de la traducción, uno o varios revisores técnicos especia-
listas del área de conocimiento del libro traducido, y un grupo de revisores lin-
güísticos especialistas de la lengua meta (el euskera). Todos ellos estudian, an-
tes de comenzar a elaborar una primera versión de la traducción, cuáles son los
problemas terminológicos, fraseológicos... específicos del texto que debe ser
traducido, y cada uno desde su conocimiento contribuye a que la traducción sea
fiel al original, natural desde el punto de vista de la lengua meta, y correcta
desde la perspectiva del especialista de la materia.
No podemos ocultar que todos estos proyectos suponen a la UPV/EHU un es-
fuerzo económico cuantioso. Sólo en la partida presupuestaria de apoyo a la
producción y traducción de libros universitarios de texto, es decir, fundamen-
talmente en la primera de las colecciones citadas, la universidad viene invirtien-
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 327

do estos últimos años (manejamos datos de 2011, 2012 y 2013) en torno a


500.000 euros anuales, sufragados a través de contratos programa financiados
por el Gobierno Vasco.
Una inversión de tal envergadura exige a los responsables del proyecto un es-
fuerzo suplementario para hacer visibles y útiles los productos obtenidos, y es
precisamente en este contexto donde los autores de este artículo, desde los pues-
tos de responsabilidad que ocupaban en cada momento, y partiendo desde su
propia experiencia como traductores e investigadores en proyectos como EGLU
(la gramática de la Real Euskaltzaindia de la Lengua Vasca, en la que Makazaga
es coautor desde los primeros volúmenes), ZTHB (el diccionario de términos
científicos y técnicos de la Real Euskaltzaindia de la Lengua Vasca, en el que
participa Bilbao), el servicio de consulta de dudas lingüísticas Ehulku en el que
colabora Makazaga, o incluso el proyecto de edición de textos Monumenta Lin-
guae Vasconum del cual es partícipe Bilbao, cobran conciencia de la importan-
cia creciente de los corpus como herramientas de consulta imprescindible en la
toma de decisiones de carácter lingüístico, y en 2012 llegan a la conclusión de
que es el momento de recoger y publicar en un corpus online paralelo todas las
traducciones coordinadas y supervisadas por el Servicio de Euskera de la
UPV/EHU.

2. Los corpus públicos de la lengua vasca


Antes de presentar nuestro corpus, merece la pena presentar una visión panorá-
mica de los corpus públicos de la lengua vasca a día de hoy. Lo hacemos pen-
sando que puede ofrecer una aproximación válida al lector que se acerca a este
artículo desde un conocimiento lejano de la situación de la lengua vasca y de los
trabajos desarrollados en torno a la lengua vasca; y por otra parte, desde la con-
vicción de que, dada la rapidez con la que evoluciona el estado de la cuestión en
relación con este tipo de herramientas, es interesante contar periódicamente con
fotos fijas que dejen constancia de la realidad concreta en un momento determi-
nado, en la línea de un trabajo presentado por Miriam Urkia con ocasión de la
publicación del corpus Consumer corpusa (Urkia 2010), o incluso de uno ante-
rior, de 2008, obra de varios colaboradores de la Fundación Elhuyar (Areta,
Gurrutxaga y Leturia 2008).
Recogemos en la «Tabla 1» los corpus públicos de la lengua vasca disponibles
en la fecha actual (mayo de 2014). En cada caso, recogemos en cursiva el nom-
bre del corpus, junto a cada uno de los cuales añadimos entre comillas simples
nuestra traducción (que en muchos casos puede servir para ofrecer una idea
aproximada del contenido) y entre paréntesis angulares la dirección en la que
está disponible. En cada caso definimos luego cada corpus según los parámetros
que nos han parecido interesantes para hacer después una presentación sintética

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


328 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

del panorama: los focos de producción de los corpus de la lengua vasca, si se


trata de un corpus histórico o actual, si es monolingüe, bilingüe o multilingüe, si
los textos recogidos corresponden a lenguajes de especialidad o a la lengua ge-
neral, si se trata de lengua traducida o lengua no traducida, y, finalmente, si el
corpus en cuestión está lematizado o no.
OEH-ko Testu Corpusa ‘Corpus de textos del Diccionario General Vasco’ (CD)
Euskaltzaindia Histórico Monolingüe Gen.-Liter. No traducido No lemat.
XX. mendeko euskararen corpus estatistikoa ‘Corpus estadístico de la lengua vasca del siglo
XX’
<http://xxmendea.euskaltzaindia.net/Corpus/>
Euskaltzaindia Actual Monolingüe General No traducido Lematizado
Lexikoaren Behatokiaren corpusa ‘Corpus del Observatorio del Léxico’
<http://lexikoarenbehatokia.euskaltzaindia.net/cgi-bin/kontsulta.py>
Euskaltzaindia Actual Monolingüe General No traducido Lematizado
EHUskaratuak ‘Traducciones de la UPV/EHU’
<http://ehuskaratuak.ehu.es/kontsulta/>
UPV/EHU Actual Bilingüe Científ.-técn. No traducido Lematizado
Egungo Testuen Corpusa (ETC) ‘Corpus de Textos Actuales’
<http://www.ehu.es/etc/>
UPV/EHU EI Actual Monolingüe General No traducido (No) lemat.
Ereduzko Prosa Gaur (EPG) ‘Prosa de referencia actual’
<http://www.ehu.es/euskara-orria/euskara/ereduzkoa/>
UPV/EHU EI Actual Monolingüe Literario No tr. + Tr. (No) lemat.
Ereduzko Prosa Dinamikoa (EPD) ‘Prosa de referencia dinámica’
<http://ehu.es/ehg/epd/>
UPV/EHU EI Actual Monolingüe General No traducido (No) lemat.
Euskal Klasikoen Corpusa (EKC) ‘Corpus de clásicos vascongados’
<http://www.ehu.es/ehg/kc/>
UPV/EHU EI Histórico Monolingüe Literario No traducido (No) lemat.
Goenkale Corpusa ‘Corpus de la serie televisiva Goenkale’
<http://ehu.es/ehg/goenkale/>
UPV/EHU EI Actual Monolingüe General No traducido (No) lemat.
Pentsamenduaren Klasikoak corpusa ‘Corpus de la colección Clásicos del Pensamiento’
<http://ehu.es/ehg/pkc/>
UPV/EHU EI Actual Monolingüe Filosófico No traducido (No) lemat.
ZIO corpusa ‘Corpus de la colección ZIO de prosa de divulgación científica’
<http://www.ehu.es/ehg/zio/>
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 329

UPV/EHU EI Actual Monolingüe Científ.-Lit. Traducido (No) lemat.


Zuzenbide Corpusa ‘Corpus de derecho’
<http://www.ehu.es/ehg/zuzenbidea/>
UPV/EHU EI Actual Monolingüe Jur.-adm. Traducido (No) lemat.
Itzulpen juridikoen kontsulta ‘Consulta de traducciones de textos jurídicos’
<http://www.justizia.net/euskara-justizian>
EJ-GV Just. Actual Bilingüe Jur.-adm. Traducido No lemat.
Epaitegietako agirien corpus elebiduna ‘Corpus bilingüe de documentos de los juzgados’
<http://www.justizia.net/uzei/default.asp?idioma=eu>
EJ-GV Just. Actual Bilingüe Jur.-adm. Traducido No lemat.
Bizimena: Bizkaiko Foru Aldundiko itzulpen memoriak ‘Modo de vida: memorias de traducción
de la Diputación Foral de Bizkaia’
<http://www.bizkaia.net/home2/Temas/DetalleTema.asp?Tem_Codigo=6130>
BFA Actual Bilingüe Jur.-adm. Traducido No lemat.
Gipuzkoako Foru Aldundiaren itzulpenen datu basea ‘Base de datos de traducciones de la Dipu-
tación Foral de Gipuzkoa’
<http://www.gipuzkoa.net/imemoriak/>
GFA Actual Bilingüe Jur.-adm. Traducido No lemat.
CorpEus ‘CorpEusk, corpus del euskera’
<http://corpeus.elhuyar.org/cgi-bin/kontsulta.py>
Elhuyar Actual Monolingüe General No traducido Lematizado
Elhuyarren web-corpus elebakarra ‘Corpus-web monolingüe de la Fundación Elhuyar’
<http://webcorpusak.elhuyar.org/cgi-bin/kontsulta.py?mota=arrunta>
Elhuyar Actual Monolingüe General No traducido Lematizado
Elhuyarren web-corpus paraleloa ‘Corpus-web paralelo de la Fundación Elhuyar’
<http://webcorpusak.elhuyar.org/cgi-bin/kontsulta2.py?mota=arrunta>
Elhuyar Actual Bilingüe General Traducido Lematizado
Zientzia eta teknologiaren corpusa ‘Corpus de ciencia y tecnología’
<http://www.ztcorpusa.net/cgi-bin/kontsulta.py>
Elhuyar Actual Monolingüe Científ.-técn. No traducido Lematizado
Consumer corpusa ‘Corpus de la revista Consumer’
<http://corpus.consumer.es/corpus/>
Elh. + Eroski Actual Multilingüe General Traducido Lematizado

Tabla 1: Corpus públicos de la lengua vasca en 2014


Si nos fijamos en los focos de producción, es evidente que ha sido la universi-
dad pública UPV/EHU la institución que ha realizado hasta el momento el ma-
yor esfuerzo en la creación de corpus de la lengua vasca. Hay que destacar la

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


330 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

labor que en este campo está realizando el instituto de investigación Euskara


Institutua ‘Instituto de Euskera’ («EI» en la tabla), en cuya página web se pue-
den consultar actualmente 8 corpus diferentes; también EHUskaratuak está
disponible en la página web de la misma universidad, pero, en este caso, no se
trata de un proyecto del Instituto de Euskera, sino del Servicio de Euskera.
A la UPV/EHU le sigue en número de corpus producidos y publicados la Fun-
dación Elhuyar, una fundación que dio sus primeros pasos como asociación
cultural y lleva más de cuarenta años trabajando para consolidar el euskera en el
ámbito de la ciencia y de la tecnología, y que colabora con la UPV/EHU en
diversos proyectos; en la página web de Elhuyar podemos consultar cuatro cor-
pus diferentes, a los que hay que añadir un quinto, producido junto con una
empresa privada.
También merece una mención especial Euskaltzaindia, la Real Academia de la
Lengua Vasca, en cuya página encontramos actualmente dos corpus (aunque en
realidad uno es continuación del otro) y fue pionera con la publicación de un
corpus en formato CD. Finalmente, también otras instituciones públicas como
son las diputaciones forales (con el impulso de sus servicios de traducción) o el
departamento de Justicia del Gobierno Vasco han hecho sus aportaciones en
este campo.
Con la etiqueta de corpus histórico hemos querido reunir los corpus de la len-
gua vasca que reúnen textos anteriores al año 1900. Observamos que tan solo
dos de los 21 corpus consultados cumplen ese requisito, y 19 de ellos corres-
ponden, por tanto, a la lengua vasca actual.
Doce de los corpus examinados recogen lenguajes de especialidad: cinco de
ellos recopilan textos de lenguaje jurídico-administrativo, tres son de lenguaje
científico-técnico, otros tres son textos literarios y uno es exclusivamente filosó-
fico. Hemos etiquetado el resto como corpus de lengua general, aunque en oca-
siones resulta difícil distinguir estos de los literarios (es el caso, por ejemplo, de
un corpus que recoge los textos escritos de los guiones de una serie de televi-
sión).
Nos ha interesado así mismo saber cuántos corpus recogen textos de lengua
traducida, y cuántos corresponden a textos creados en euskera, no traducidos.
Sin atender al número de caracteres que recoge cada corpus, podemos decir que
son justo mitad y mitad: diez corpus de lengua traducida y diez de lengua no
traducida, más uno que reúne textos de los dos tipos, pero dispone de un filtro
de búsqueda que permite discernir los unos de los otros.
La mayor parte de los corpus públicos de la lengua vasca son monolingües (ca-
torce), pero la cantidad de corpus bilingües es considerable: cinco de ellos son
bilingües y recogen textos paralelos euskera-español, el par de lenguas más
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 331

frecuente en la traducción en lengua vasca, y uno (precisamente EHUskaratuak)


es bilingüe con el euskera formando pareja con el español, el francés o el inglés,
dependiendo del texto. Tan solo un corpus es realmente multilingüe y recoge
textos paralelos de las cuatro lenguas oficiales del estado español (español, eus-
kera, catalán y gallego).
Finalmente, un parámetro en nuestra opinión fundamental para evaluar la cali-
dad de los corpus de una lengua como el euskera es la lematización. Hay que
tener en cuenta que la búsqueda de una secuencia de caracteres como jario, en
euskera, incluso con el uso de truncadores, podría permitir obtener resultados
referidos exclusivamente a la categoría gramatical de «nombre»: jario, jarioa,
jarioak, jarioen, jariorik... y quedarían excluidos darizkion, dario, zerien, da-
rion, dariela, zerizkiola, zerien... que solo podríamos localizar en un corpus
lematizado que permitiera distinguir en su búsqueda «jario [verbo]» y «jario
[nombre]». Entre los corpus analizados, cinco de ellos realizan exclusivamente
búsquedas de secuencias de caracteres y no disponen de lematizador; ocho se
definen como corpus lematizados, y disponen de un lematizador más o menos
desarrollado. En el caso de los ocho corpus del Instituto de Euskera de la
UPV/EHU, no se puede decir que sean corpus no lematizados, puesto que las
búsquedas devuelven resultados que no se esperarían a partir de la secuencia de
caracteres; sin embargo, el nivel de lematización es muy básico.

3. EHUskaratuak: un corpus de traducciones académicas


Ya hemos adelantado que la idea del proyecto EHUskaratuak partió del Servi-
cio de Euskera de la UPV/EHU, como una forma de hacer más visibles y útiles
para un público amplio (traductores, terminólogos, lingüistas... por supuesto,
pero también profesorado y alumnado universitario de todas las áreas de cono-
cimiento) las traducciones académicas coordinadas y supervisadas por el servi-
cio a lo largo de los años. El desarrollo tecnológico, por su parte, ha sido obra
de Elhuyar. Hizkuntza eta teknologia ‘Elhuyar. Lengua y tecnología’, una sec-
ción de la Fundación Elhuyar, dedicada específicamente al desarrollo de recur-
sos y herramientas como resultado de I+D, dirigidos a diversas industrias de la
lengua, en estrecha colaboración con diferentes departamentos y proyectos de
investigación de la UPV/EHU. Cabe señalar que el desarrollo del etiquetado y
el sistema de consulta de EHUskaratuak permitió la realización de un trabajo de
fin de máster en el departamento de Lenguajes y Sistemas Informáticos de la
UPV/EHU, en el Máster de Análisis y Procesamiento de la Lengua (Jauregi
2012). Para decidir la asignación del encargo (financiado con dinero de la parti-
da del Vicerrectorado de Euskera y Plurilingüismo dedicada a «compra, locali-
zación y mantenimiento de aplicaciones en euskera») fueron criterios decisivos
precisamente la colaboración con nuestra universidad en distintos proyectos y la

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


332 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

garantía que ofrecía su lematizador, ya probado en otros recursos desarrollados


por la misma empresa.
Centrándonos en los textos que conforman el corpus EHUskaratuak, desde el
principio pensamos en una fórmula que permitiera un incremento progresivo de
la cantidad de textos, hasta llegar a integrar todas las traducciones académicas
coordinadas por el Servicio de Euskera. En una primera fase se compilaron los
libros publicados entre 2010 y 2012, para ir añadiendo en fases sucesivas, co-
rrespondientes a años naturales, la producción de ese año y la del año inmedia-
tamente anterior al más antiguo ya compilado, de modo que la secuencia de las
fases sería la siguiente: 2010-2012 > 2009-2013 > 2008-2014 > 2007-2015... En
estos momentos el corpus recoge 51 libros publicados entre 2009 y 2013 (más
algunos más antiguos, exclusivamente de la colección ZIO, de prosa de divulga-
ción científica), de 18 subáreas de conocimiento, que se distribuyen de la si-
guiente forma (señalamos junto a cada subárea el número de libros recogido en
el corpus para cada par de lenguas):
Ciencias de la Vida
Biología: 4 EN > EU
Medicina: 3 EN > EU
Humanidades
Arte: 2 ES > EU; 1 EN > EU
Filología: 1 EN > EU
Filosofía: 1 EN > EU
Historia: 1 ES > EU; 1 EN > EU
Literatura: 1 ES > EU
Ciencias Sociales
Economía: 1 ES > EU
Pedagogía: 7 ES > EU; 1 FR > EU
Psicología: 1 EN > EU
Sociología: 2 EN > EU; 1 ES > EU; 1 FR > EU
Derecho: 1 ES > EU; 1 EN > EU
Ciencias Exactas y de la Materia
Física y Química: 2 ES > EU
Geología: 1 ES > EU; 1 EN > EU
Matemáticas: 1 EN > EU
Ciencia y Tecnología
Arquitectura: 1 ES > EU; 1 EN > EU
Informática: 1 ES > EU; 2 EN > EU
Ingeniería: 7 ES > EU; 3 EN > EU
Tabla 2: Número de libros del corpus EHUskaratuak para cada subárea y par de lenguas
Como vemos en la «Tabla 2», el par de lenguas más frecuente es el español-
euskera, con 26 libros, seguido de cerca por el par inglés-español, con 23 publi-
caciones; en el par francés-euskera hay tan solo 2 libros. Sin embargo, si obser-
vamos el dato correspondiente al número de frases traducidas en cada lengua, el
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 333

resultado varía considerablemente, debido a que, en general, los libros de texto


universitarios que el servicio ha traducido del inglés al euskera son mucho más
voluminosos que los que ha traducido del español al euskera. La «Tabla 3» es
clara en este sentido:
Idioma Número de frases Número de palabras
Inglés (lengua origen) 257.947 3.851.363
Español (lengua origen) 155.924 2.915.413
Francés (lengua origen) 9.470 183.727
Euskera (lengua meta) 423.341 5.455.708
TOTAL 846.682 12.406.211
Tabla 3: Número de frases y palabras del corpus EHUskaratuak, por lenguas
En este punto, puede resultar interesante explicitar que, para facilitar la compi-
lación de los textos del corpus, en todos los pliegos de condiciones de los en-
cargos de traducción del Servicio de Euskera de los últimos años (a partir de
2008, aproximadamente), se incluye la obligatoriedad de entregar, junto con la
traducción, la memoria de traducción correspondiente, pensando precisamente
en facilitar la creación de productos derivados como el corpus que nos ocupa.
En el caso de traducciones más antiguas, o de algunas traducciones de las que
no disponemos de memoria de traducción, nos vemos obligados a realizar el
trabajo a posteriori, obteniendo el texto alineado a partir de diferentes formatos
(en ocasiones disponemos del texto traducido en formato doc, pero debemos
escanear ahora el original; y, en el caso de las traducciones más antiguas, inclu-
so debemos escanear la propia traducción).
Para comenzar a describir la propia aplicación EHUskaratuak, debemos recor-
dar el interés por llegar a un público amplio, no necesariamente especializado
en lingüística, lo cual exige desarrollar una interfaz de búsqueda completa y
compleja para satisfacer las necesidades del público interesado, pero al mismo
tiempo intuitiva y sencilla de manejar, pensada para poder obtener resultados
útiles también a través de la búsqueda simple.
El usuario puede elegir entre consultar la interfaz de búsqueda y todos los de-
más elementos de la aplicación (presentación, ayuda e información sobre textos
compilados) en euskera o en español.
Aunque en algunos sitios se ha definido el corpus como corpus multilingüe
(Jauregi 2012), porque incluye cuatro lenguas diferentes, nosotros preferimos
definirlo como corpus paralelo bilingüe, ya que los textos son paralelos siempre
de dos en dos, siendo el euskera siempre lengua meta, mientras que, dependien-
do del libro, el inglés, el español o el francés son la lengua origen; si bien es
cierto que, si se realiza la búsqueda desde un término en euskera, el usuario
puede elegir las diferentes lenguas en las que quiere ver el resultado, o las tres
(inglés, español y francés); no obstante, el resultado será siempre una serie de

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


334 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

textos paralelos en diferentes combinaciones de lenguas (inglés > euskera; es-


pañol > euskera; francés > euskera), siempre de dos en dos.
Por ejemplo, si buscamos en los dos diccionarios bilingües de lengua general
más al uso la palabra castellana fluido, uno de ellos (Elhuyar hiztegia, de la
Fundación Elhuyar) propone en euskera fluido con la marca de especialidad
«Fís.», y la colocación «mecánica de fluido : fluidoen mekanika». El otro dic-
cionario más usado (Zehazki, de Ibon Sarasola), para la misma búsqueda, pro-
pone jariakin con la citada marca de especialidad «Fis.», y precisamente la
misma colocación, pero con una propuesta diferente: «mecánica de fluido: ja-
riakinen mekanika». La diferencia entre las dos opciones estriba en adoptar para
el término de especialidad un préstamo «internacional» de origen latino, o usar
un neologismo derivado de la palabra patrimonial jario. Si queremos comprobar
en EHUskaratuak cuál de los dos términos vascos ha sido más utilizado en las
traducciones académicas de la UPV/EHU, elegiremos como idioma «Euskera»,
pediremos buscar «lema» (para que la búsqueda incluya palabras declinadas
como jarioa, jarioen, jarioarekin), señalaremos la categoría «nom», y nos in-
teresará conocer los resultados en las tres combinaciones de lengua posibles. El
resultado es clarificador: fluido aparece en 20 libros, con 1413 coincidencias, y
jariakin en 11 libros, con 48 coincidencias. Además, si nos fijamos en los textos
originales, vemos que, en varias ocasiones, el término original es el español
secreción o el inglés secretion.
Como el corpus está etiquetado y lematizado tanto en euskera como en inglés,
español y francés, la propia herramienta EHUskaratuak nos permitirá proseguir
la investigación, rastreando a través de la búsqueda simple las traducciones que
se han propuesto para el lema español fluido o secreción, para el lema inglés
fluid o secretion y para el lema francés secrétion. Esta búsqueda nos permitirá
comprobar que en el área de ciencias de la vida también se utiliza en euskera
sekrezio para traducir el inglés secretion, o incluso jario para el francés sécréti-
on.
La búsqueda avanzada, a su vez, permite realizar la búsqueda en una combina-
ción de lenguas. Siguiendo con el ejemplo anterior, podemos buscar los textos
en los que el lema inglés fluid ha sido traducido por el lema en euskera jariakin.
Un estudio detenido de los resultados obtenidos nos permitirá comprobar que
todos ellos se refieren al ámbito de las ciencias de la vida (aun cuando el libro
haya sido catalogado en alguna otra de las áreas).
El siguiente paso sería comprobar si la colocación fluidoen mekanika o la colo-
cación jariakinen mekanika han sido usadas en alguna ocasión en las traduccio-
nes académicas de la UPV/EHU. Para ello podemos usar también la búsqueda
avanzada, eligiendo el idioma «Euskera» en las dos ventanas de búsqueda, y
escribiendo el lema fluido (y luego jariakin) en una de ellas, y el lema mekanika
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 335

en la otra; debemos especificar la distancia 0 entre ellas. El resultado es también


clarificador: nunca se ha utilizado jariakinen mekanika, y aparece en cuatro
ocasiones fluidoen mekanika.
La posibilidad de establecer la distancia entre las dos palabras que buscamos,
permite realizar investigaciones más complejas. Por ejemplo, para ver cómo se
traducen o formulan las definiciones en euskera, en un contexto académico,
podemos realizar las siguientes búsquedas avanzadas, con resultados franca-
mente interesantes:
ESP Lema: definir
Categoría: verb.
ESP Forma: como
Distancia: 2

ENG Lema: define


Categoría: verb.
ENG Forma: as
Distancia: 2
En una lengua de las características del euskera, es importante el uso adecuado
de los truncadores para buscar palabras compuestas (por ejemplo «*-landaredi»
y «landaredi-*»), sufijos (por ejemplo «*tasun») o desinencias (por ejemplo
«*kiko»).
Finalmente, debemos señalar que la aplicación permite generar automáticamen-
te, a partir de los resultados, gráficos estadísticos circulares.

4. EHUskaratuak: un corpus para traductores, académicos e


investigadores
Más arriba hemos apuntado que EHUskaratuak pretende ser una herramienta
útil para un público amplio que pueda acercarse a este corpus por diferentes
intereses.
Por un lado, pensamos en la utilidad del corpus para traductores que deban tra-
ducir textos académicos de características similares a los textos del corpus, y en
los académicos, tanto profesores como estudiantes, que deben producir textos
académicos en lengua vasca, en un contexto en el que los materiales de referen-
cia no son abundantes, por las circunstancias que hemos tratado de resumir en el
primer apartado de este trabajo. En nuestra opinión, para que este tipo de públi-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


336 GIDOR BILBAO Y JESÚS MARI MAKAZAGA

co acceda regularmente a un corpus, este debe cumplir tres condiciones: 1) El


manejo debe ser sencillo e intuitivo. 2) El corpus debe tener un tamaño suficien-
te, para que la escasez de resultados no produzca frustración. 3) El corpus debe
ser conocido y accesible, para lo cual es importante que aparezca en directorios
especializados y que establezca alianzas con otros corpus de la misma lengua,
para facilitar mutuamente su visibilidad.
Por otro lado, queremos también ofrecer una herramienta útil a los investigado-
res, tanto de la traducción como de la lengua. En este caso, las exigencias son
sensiblemente diferentes. En lugar del manejo intuitivo, el investigador valorará
la existencia de filtros de búsqueda adecuados. La visibilidad del corpus tampo-
co será importante para ellos. Pero también este tipo de usuario, como el ante-
rior, necesitará un corpus de tamaño suficiente para que sus resultados sean
representativos.
Pensamos que la herramienta EHUskaratuak cumple buena parte de los requisi-
tos que le exige y exigirá la comunidad académica y científica vascófona. El
reto actual es seguir creciendo progresivamente, de acuerdo con la planificación
inicial, para conseguir que la totalidad de las traducciones académicas coordi-
nadas y supervisadas por el Servicio de Euskera de la UPV/EHU esté efectiva-
mente en el corpus.

5. Bibliografía
Areta, Nerea, Antton Gurrutxaga e Igor Leuria. 2008. Begiratu bat corpus-baliabideei.
@ BAT Soziolinguistika aldizkaria 66: 71-92. Disponible en
<http://www.soziolinguistika.org/files/Nerea %20Areta %2C %20Antton %20
Gurrutxaga %2C %20Igor %20Leturia.pdf >. Consultado el 27/5/2014.
Jauregi, Amaia. 2012. EHUskaratuak. Corpus eleaniztun baten etiketatze automatikoa
eta kontsulta-sistemaren garapena [Tesis de máster]. Disponible en
<http://ixa.si.ehu.es/master/master_tesiak>. Consultado el 27/5/2014.
Urkia, Miriam. 2010. Corpusgintzaren garrantzia hizkuntzalaritzan eta euskararen egoe-
ra. @ Plazaberri Enero 2010. Disponible en
<http://www.euskaltzaindia.es/dok/plazaberri
/2010/urtarrila/corpusgintza_miriamurkia.pdf>. Consultado el 27/5/2014.
Vicerrectorado de Euskera de la UPV/EHU. 2014. II Plan Director del Euskera de la
UPV/EHU (2013-2017). Bilbao: Servicio Editorial de la Universidad del País
Vasco.

1
Gidor Bilbao ha participado en este artículo en el contexto de un proyecto de investigación
financiado por el Ministerio de Ciencia e Innovación de España, dirigido por el profesor Joseba
A. Lakarra: «Monumenta linguae Vasconum (IV)» (FFI2012-37696). Este proyecto forma parte
EHUSKARATUAK: UN CORPUS DE TRADUCCIONES ACADÉMICAS EN UNA LENGUA MINORITARIA 337

del grupo de investigación consolidado GIC 07/89-IT-473-07, financiado por el Gobierno Vasco,
y se incluye en la Unidad de Formación e Investigación UFI11/14 de la UPV/EHU. Jesus Mari
Makazaga participa en el proyecto de investigación GIU13/23 de la UPV/EHU.
2
Uno de los autores, Jesus Mari Makazaga, ha trabajado en este Servicio de Euskera de la
UPV/EHU desde 2002, y es su director desde 2011. Gidor Bilbao ha sido director del servicio de
octubre de 2007 a junio de 2009 y Vicerrector de Euskera y Plurilingüismo, el vicerrectorado del
que depende el servicio, de enero de 2011 a enero de 2013.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


Propuesta de clasificación de corpus textuales

[Proposal of textual corpora classification]


GORETTI FAYA ORNIA
Universidad de Oviedo
gorettifayaornia@gmail.com
Resumen
El empleo de corpus en diversas disciplinas ha ocasionado una falta de consenso en una
doble vía. Por un lado, en la terminología empleada, y por otro, en la clasificación de
corpus.
Es conveniente contar con una clasificación de corpus clara, organizada e integradora,
ya que permite observar las características de cada tipo así como su relación con los
demás. En consecuencia, facilita la selección del tipo de corpus más adecuado para un
estudio concreto, muestra otras alternativas (otros tipos de corpus), y permite ubicar el
trabajo dentro de un marco general de corpus lingüísticos.
En esta comunicación, pretendemos dar a conocer nuestra propia propuesta de clasifica-
ción de corpus. Hemos tratado de que sea lo suficientemente amplia y abarque los in-
tereses de las disciplinas que trabajan con más frecuencia con corpus lingüísticos (la
Lingüística Contrastiva y los Estudios de Traducción).
Abstract
Using corpora for different subjects has resulted in a lack of agreement in two ways.
First, with respect to the terminology used, and secondly, regarding the way corpora are
classified.
A clear, organised and integrated classification is advisable, since it shows the features
of each type of corpus as well as its relationships with other corpora. Consequently,
such a classification (a) makes it easier to select the most suitable type of corpus for a
specific study, (b) reveals other alternatives (other types of corpora) and (c) allows for a
study in a general frame of linguistic corpora.
With this paper, we aim to show our own proposal for classifying corpora. We have
attempted to make our classification wide enough so as to cover the interests of those
disciplines that most often work with linguistic corpora (i.e. Contrastive Linguistics and
Translation Studies).
Palabras clave
Clasificación de corpus, propuesta de clasificación, corpus en la Lingüística Contrastiva
y Estudios de Traducción, falta de consenso en terminología y clasificación
Keywords
Corpora classification, classification proposal, corpora in Contrastive Linguistics and
Translation Studies, lack of agreement about terminology and classification

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
340 GORETTI FAYA ORNIA

1. Introducción
En este trabajo, daremos a conocer nuestra propia propuesta de clasificación de
corpus. Su elaboración se debe a las necesidades surgidas en otro trabajo de
investigación que estábamos llevando a cabo.
Dicho estudio consistía en un análisis contrastivo del género del folleto médico
en inglés y en español. En él trabajábamos con dos corpus de folletos. Uno es-
taba formado por documentos traducidos a inglés en España y otro por docu-
mentos originales redactados en lengua original (inglés y español).
Nos resultaba preciso ubicar en una clasificación general estos dos corpus, para
así observar las relaciones entre ellos. Sin embargo, las clasificaciones existen-
tes no cubrían todas nuestras necesidades.

2. Terminología empleada en el presente trabajo


Veamos a continuación el uso de la terminología en el presente trabajo. Orde-
namos los términos alfabéticamente.
Corpus alineado
Es un corpus en el que coexisten originales con sus correspondientes traduccio-
nes y que ha sido sometido a un proceso de alineamiento (Rabadán y Fernández
Nistal 2002: 51). El proceso de alineación se puede llevar a cabo tanto a nivel
de frase como de palabra (P. Baker 2006: 9).
Corpus canónico
Término utilizado principalmente por Torruella y Llisterri (1999: 55) y Corpas
Pastor (2001: 158) en sus tipologías para referirse a un corpus que contiene las
obras completas de un determinado autor.
Corpus comparable
Es uno de los términos en donde encontramos mayores discrepancias e incohe-
rencias terminológicas entre la Lingüística Contrastiva y los Estudios de Tra-
ducción. Para la primera (Teubert 1996, Peters, Picchi y Biagini 1996, McEnery
y Wilson 1996, Johansson y Hasselgard 1999), se trata de textos originales en
dos o más idiomas, según la época de composición, la categoría de texto, el
público al que se dirigen, etc. Son por tanto multilingües, y como consecuencia,
facilitan las comparaciones entre lenguas así como las investigaciones cruzadas.
En los Estudios de Traducción, el término suele hacer referencia a dos coleccio-
nes de textos en la misma lengua. Por un lado, un conjunto de textos originales
en una sola lengua. Por otro, un grupo de textos traducidos a esa misma lengua
a partir de otras lenguas diferentes (sin ser traducciones de los primeros) (Gran-
ger 2003: 20).
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 341

En nuestra opinión, los corpus comparables pueden ser tanto monolingües como
multilingües. Se distinguen tres categorías. En primer lugar, textos originales en
una o varias lenguas. En segundo lugar, textos traducidos en una o en varias
lenguas. En tercer lugar, una combinación de textos originales y traducidos en
una o varias lenguas (sin ser estos traducciones de los primeros). Como vemos,
la condición esencial de este grupo es que no pueden estar integrados por origi-
nales con sus correspondientes traducciones.
Corpus cronológico
Se trata de un corpus que incluye textos producidos durante un determinado
periodo de tiempo (Torruella y Llisterri 1999: 55; Corpas Pastor 2001: 158).
Corpus de muestras
Se compone de partes de un texto seleccionadas según determinados principios
conciernientes al tamaño, ubicación de la muestra en texto completo y método
de selección (Laviosa 1997: 34).
Corpus de referencia
Este tipo de corpus trata de representar la naturaleza general de una lengua. Por
ello, consta de una amplia variedad de textos que incluyen diversos géneros y
fuentes (P. Baker 2006: 137-138). Sinclair (1996: 10) define del siguiente modo
este tipo de corpus en el informe EAGLES:
A reference corpus is one designed to provide comprehensive information about
a language. It aims to be large enough to represent all the relevant varieties of the
language, and the characteristic vocabulary, so that it can be used as a basis for
reliable grammars, dictionaries, thesauri and other language reference material.
(Sinclair 1996: 10)
Corpus de textos completos
Un corpus de textos completos contiene textos íntegros (Laviosa 1997: 291).
Corpus diacrónico
Corpus que trata de ser representativo de una lengua o de una variedad en un
determinado periodo de tiempo, de modo que permita estudiar la evolución
lingüística (P. Baker 2006: 56). Son por tanto aquellos cuyos textos no están
restringidos a un periodo de tiempo (Laviosa 1997: 35).
Los términos «corpus de referencia» y «corpus diacrónico» suelen tener el
mismo referente, ya que para que un corpus sea representativo de la lengua en
su conjunto (corpus de referencia) no debe ceñirse a un periodo concreto (rasgo
típico de los corpus diacrónicos).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


342 GORETTI FAYA ORNIA

Corpus electrónico
Se trata de un tipo de corpus que se encuentra en soporte electrónico para poder
trabajar con él de manera más rápida y eficaz (Rabadán y Fernández Nistal
2002: 46).
Corpus escrito
El término hace referencia a un corpus que contiene únicamente textos produci-
dos o publicados en formato escrito (P. Baker 2006: 171). Puede encontrarse en
papel o en soporte electrónico (ya sea escaneado o mecanografiado).
Corpus especializado
Aquellos que están compuestos por textos que no pertenecen a la lengua gene-
ral, sino que se centran en un ámbito determinado, ya sea una temática concreta,
un campo del saber en particular, un determinado autor, cierta variante dialectal,
un periodo de tiempo concreto, etc. (Torruella y Llisterri 1999: 55, Corpas Pas-
tor 2002: 158, y Rabadán y Fernández Nistal 2002: 50).
Corpus generalista
Son representativos de la lengua común e incluyen una gran variedad de textos
producidos en situaciones comunicativas cotidianas (Torruella y Llisterri 1999:
55, Corpas Pastor 2001: 158).
Corpus genérico
Corpus representativo de un determinado género (Torruella y Llisterri 1999: 55,
Corpas Pastor 2001: 158).
Corpus informatizado
Se trata de «una recopilación de textos seleccionados según criterios lingüísti-
cos, codificados de modo estándar y homogéneo, con la finalidad de poder ser
tratados mediante procesos informáticos y destinados a reflejar el comporta-
miento de una o más lenguas» (Torruella y Llisterri 1999: 51).
Corpus mixto
Son aquellos corpus compuestos tanto por textos completos como por muestras
(Laviosa 1997: 291).
Corpus monolingüe
Estos corpus están integrados por textos escritos en una sola lengua, y por ello,
son siempre comparables. El motivo de que los corpus monolingües no puedan
ser paralelos se debe a que, como veremos más adelante, los corpus paralelos
constan de originales con sus correspondientes traducciones, es decir, están
redactados en al menos dos lenguas (Granger 2003: 20).
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 343

Corpus monitorizado
Se trata de un corpus con un volumen textual constante (como sucede en los
corpus estáticos), pero actualizado: se van añadiendo nuevos elementos a la vez
que se eliminan cantidades equivalentes de material antiguo (Torruella y Lliste-
rri 1999: 54, Corpas Pastor 2001: 158). Dichos textos «are scanned on continu-
ing basis, ‘filtered’ to extract data for database, but not permanently archived»
(Atkins et al 1992: 5).
Con ellos podemos «monitorizar» la evolución de una lengua. Este tipo de cor-
pus solo puede encontrarse en los corpus diacrónicos. El motivo es que estos
últimos no están ligados a un periodo restringido y son, por tanto, los únicos
que permitirán la inclusión de nuevos textos.
Corpus multilingüe
Los corpus multilingües son simplemente aquellos que contienen textos en más
de un idioma (P. Baker 2006: 119).
Corpus oral
Según Baker et al (2006: 148), estos corpus constan de discursos orales transcri-
tos. Su elaboración resulta compleja debido a las repeticiones, pseudocomienzos
de frases, dubitaciones, vocalizaciones e interrupciones de los discursos espon-
táneos. Se confunde frecuentemente con los corpus de habla (speech corpus).
Estos son corpus integrados por grabaciones realizadas en un estudio,
cuya finalidad principal es estudiar diferentes rasgos fonéticos.
Sin embargo, discrepamos con Baker en la definición de este tipo de corpus. En
nuestro trabajo, emplearemos el término «corpus oral» para referirnos a discur-
sos orales grabados (y no a discursos orales transcritos). Nuestro uso del tér-
mino se asemeja por tanto a lo que el autor denomina «corpus de habla» (speech
corpus). En nuestra opinión, la transcripción de los discursos orales (lo que él
denomina «speech corpus»), se incluye dentro de los corpus escritos.
Corpus paralelo
Este término hace referencia a un conjunto de textos originales con sus corres-
pondientes traducciones (Brown y Cocke 1988, Gale y Church 1991, Marinai et
al 1991, Baker 1993 y 1995, Malmkjaer 1998, Kenny 2001, Rabadán y Fernán-
dez Nistal 2002, Altenberg y Granger 2002, Olohan 2004, Borja Albi 2007,
entre otros). Los textos integrantes podrán estar alineados.
Corpus publicado
Consta de textos que se han publicado y están disponibles para su venta.
Corpus sincrónico

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


344 GORETTI FAYA ORNIA

Contiene textos producidos en un periodo limitado de tiempo (Laviosa 2007:


35).

3. Propuestas de clasificación existentes


Se han publicado numerosos trabajos sobre corpus que han tratado directa o
indirectamente cuestiones de etiquetado y clasificación de corpus. Debido a su
relevancia para trabajos posteriores, destacamos especialmente las obras de
Laviosa (1997), Johansson (1998), Torruella y Llisterri (1999), Corpas Pastor
2001, Granger (2003), Olohan (2004), Paul Baker (2006), Borja Albi (2007),
Cabré, M. T. (2007), Briz y Albelda (2009), Zanettin (2012), entre otros. Las
principales diferencias que se detectan entre las propuestas de clasificación ata-
ñen a los criterios seleccionados (Pearson 1998).
A pesar de su importante contribución al mundo académico, hemos podido ob-
servar que estas propuestas presentan ciertas limitaciones, entre las que desta-
camos las siguientes. En primer lugar, algunas clasificaciones propuestas no
abarcan todos los tipos de texto, sino que se centran en un único tipo (por ejem-
plo, textos traducidos, textos monolingües, discursos orales, etc.). En segundo
lugar, algunas de las clasificaciones resultan demasiado amplias y sería conve-
niente completarlas con otros subgrupos o atendiendo a otros criterios. Por úl-
timo, no todas se representan en forma de árbol, por lo que la relación entre los
distintos tipos de corpus no queda reflejada con claridad.

4. Nuestra propuesta de clasificación


En este apartado procedemos a presentar nuestra propuesta de clasificación.
Consideramos que es suficientemente amplia, ya que abarca los intereses tanto
de la Lingüística Contrastiva como de los Estudios de Traducción. Además, los
tipos de corpus que se distinguen en la clasificación no son categorías indepen-
dientes, sino que la representación en forma de árbol permite observar la rela-
ción entre ellos.
Nuestra clasificación consta de dos fases. La primera atañe a aspectos formales,
concretamente al medio de difusión, al grado de amplitud del análisis, al mo-
mento temporal, a la posibilidad de adición, a la extensión de los textos, a su
publicación y a la temática tratada. La segunda se centra en los siguientes aspec-
tos lingüísticos: número de lenguas, composición de originales y traducciones y
relación entre ellos, la dirección de la traducción y, por último, la alineación. A
continuación, explicamos con más detalle cada uno de los pasos de nuestra cla-
sificación.
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 345

La primera división efectuada corresponde al medio de difusión; esto es, si el


corpus contiene textos escritos u orales. Asimismo, añadimos una tercera cate-
goría para aquellos corpus en los que se combinan ambos.

Los textos pertenecientes al ámbito escrito pueden estar en soporte electrónico o


impreso. Dentro del ámbito oral existen variadas posibilidades de clasificación,
debido principalmente al desarrollo de los materiales multimedia. Por citar al-
gunos ejemplos, los textos que componen el corpus podrían clasificarse según
(a) el soporte en el que se encuentran (CD, cinta de video o audio, reproductor
MP3, medio electrónico, etc.), (b) el formato de grabación (.mp3, .mp4, .wma,
etc.), (c) el momento de emisión (directo o diferido), (d) el canal de difusión
(radio, televisión, rueda de prensa, Internet, videoconferencia, etc.) e incluso (e)
si los textos que lo integran se han producido con preparación previa (conferen-
cias, comunicados informativos, etc.) o si por el contrario son improvisados
(debate, rueda de prensa, etc.). No detallaremos estos tipos en nuestra clasifica-
ción, pero si en un trabajo de investigación resultara necesario indicar esta in-
formación, creemos que este sería el momento adecuado.
En este punto podrían distinguirse dos tipos de corpus según el grado de ampli-
tud o restricción del análisis: corpus de referencia y corpus de no referencia.
Entendemos los primeros como aquellos que tratan de ser representativos de
una lengua.

A su vez, atendiendo al momento temporal que se analiza, estos corpus pueden


ser corpus sincrónicos (si los textos están restringidos a un momento concreto)
o diacrónicos (si no están restringidos a un determinado momento temporal).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


346 GORETTI FAYA ORNIA

Si fuera preciso especificar si el corpus es informatizado (esto es tratado para


que pueda ser utilizado por programas informáticos), consideramos que debería
indicarse a continuación. Sin embargo, no lo reflejamos en nuestro esquema
para no extenderlo demasiado de forma innecesaria, dado que entendemos que
hoy en día la mayor parte de los corpus son informatizados.
El siguiente nivel corresponde a las posibilidades de actualización y aumento de
información de un corpus. Incluimos aquí el término «monitorizado», enten-
diéndolo como «aquellos corpus compuestos por textos escaneados y filtrados
frecuentemente para que los datos estén actualizados». De este modo, los corpus
diacrónicos pueden dividirse en «monitorizados» o «no monitorizados», ya que
al no ceñirse a un periodo restringido, podrán admitir la incorporación constante
de nuevos textos. Por el contrario, los corpus sincrónicos siempre serán «no
monitorizados», ya que estudian una determinada época con principio y fin.
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 347

El siguiente paso de la clasificación atañe a la extensión de los documentos que


componen el corpus. Siguiendo la clasificación de Laviosa (1997) en este punto,
cabe distinguir entre (a) corpus de textos completos; (b) corpus compuesto por
muestras y (c) corpus mixtos. Téngase en cuenta que en este esquema y en los
siguientes, ya no desglosaremos «corpus orales», «corpus escritos» y «corpus
orales y escritos», ya que contienen las mismas divisiones y ocuparía demasiado
espacio indicarlo por triplicado. En su lugar, nos referiremos a ellos de forma
simplificada como «corpus orales/escritos».

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


348 GORETTI FAYA ORNIA

A continuación, atendemos a la publicación de los textos, es decir, si el corpus


consta de textos publicados, no publicados o una combinación de ambos.

El siguiente estadio de la clasificación, el último de la primera fase, atañe al


grado de especialización de los documentos, es decir, si pertenecen a la lengua
general (corpus generalistas) o a la lengua especializada (corpus especializa-
dos). En base al criterio que se adopte, existen diversas posibilidades para sub-
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 349

dividir los corpus especializados. Siguiendo la terminología de autores como


Laviosa (1997) o P. Baker (2006), podemos citar como ejemplo los corpus ge-
néricos (un determinado género), los canónicos (un determinado autor), los
cronológicos (según periodo de tiempo, y siguiendo la terminología de Corpas
Pastor), etc. Podrían distinguirse también otros corpus especializados, como los
dialectales (atendiendo al dialecto), los históricos (en base al momento histórico
al que hagan referencia), los nacionales/regionales (atendiendo al ámbito), los
pedagógicos/formación (si tienen función didáctica), los de segunda generación
(creados con posterioridad a 1990; también llamados «megacorpus» por su gran
tamaño) o los corpus médicos, jurídicos, económicos, etc. (si se atiende a la
temática). De este modo, la primera fase de nuestra clasificación quedaría como
se indica a continuación. Téngase en cuenta que con el fin de simplificar el es-
quema no desglosamos de forma independiente los corpus de referencia y los de
no referencia.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


350 GORETTI FAYA ORNIA

A continuación, procedemos a adentrarnos en la segunda fase de la clasifica-


ción. En ella, analizaremos desde una vertiente lingüística los textos que inte-
gran los corpus. La primera división que efectuaremos atañerá al número de
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 351

lenguas que intervienen en el corpus. Consecuentemente distinguiremos entre


monolingües y multilingües.

Si nos centramos en los corpus multilingües, podemos distinguir dos tipos:


comparables y paralelos. La condición esencial de un corpus comparable es que
no esté integrado por originales con sus correspondientes traducciones. Por el
contrario, un corpus paralelo es un conjunto de textos originales con sus corres-
pondientes traducciones.

Por tanto, los corpus comparables pueden estar compuestos por diferentes con-
juntos: (a) textos originales, ya sea en una misma lengua o en varias lenguas; (b)
textos traducidos en varias lenguas; o bien (c) una combinación de textos origi-
nales y traducidos, sin ser estos traducción de los primeros.
En los corpus paralelos no es necesario especificar si los textos son originales o
traducciones, puesto que el término «paralelo» ya implica que está compuesto
por originales y sus correspondientes traducciones. Estos corpus se dividirán en
«unidireccionales» o «multidireccionales» (en donde se incluyen los «bidirec-
cionales»). Entendemos por «unidireccional» aquellos corpus que incluyen
originales con sus correspondientes traducciones (esto es, paralelo), y por
tanto multilingües, en los que la traducción se ha llevado en una única
dirección (es decir, siempre con un mismo idioma origen). En este senti-
do, un corpus multidireccional es aquel que incluye originales con sus
correspondientes traducciones (esto es, paralelo), y por tanto multilin-
gües, en los que la traducción se ha llevado en más de una dirección.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


352 GORETTI FAYA ORNIA

Además, los corpus paralelos pueden estar alineados o no alineados. Dicha ali-
neación puede ser a nivel de palabra, de frase, de párrafos, etc. Esta sería la
última división de la segunda fase, y por tanto, el fin de nuestra propuesta de
clasificación.

Todas las categorías que contengan textos traducidos pueden completarse con
las alternativas que propone Laviosa (1997). En primer lugar, según esta autora,
desde el punto de vista de la lengua origen, pueden ser «corpus con una única
lengua origen» o «corpus con varias lenguas origen». La categoría de «corpus
con dos lenguas origen» la hemos cambiado a «corpus con varias lenguas ori-
gen», por ser una categoría más amplia. En segundo lugar, según esta autora,
atendiendo al modo de traducción (escrito u oral), pueden distinguirse «corpus
con un solo modo de traducción» o «corpus con dos modos de traducción». En
tercer lugar, según el método de traducción (es decir, si se trata de una traduc-
ción humana –ya sea asistida o no- o traducción automática), podrán ser «cor-
pus con un solo método de traducción» o «corpus con varios métodos de tra-
ducción». La categoría «corpus con dos métodos de traducción» de Laviosa se
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 353

corresponde con lo que nosotros denominamos «corpus con varios métodos de


traducción».
En este punto también podrían efectuarse otras divisiones de rango inferior. Por
ejemplo, las que atañen a la dirección de la lengua del traductor (lengua mater-
na, lengua extranjera o estado mixto de lenguas meta) así como a la categoría
del traductor (estudiante o profesional). En nuestro esquema no reflejaremos
todas estas categorías, ya que las consideramos secundarias y creemos que su
presencia complicaría demasiado la clasificación. No obstante, si fuera necesa-
rio especificar alguno de estos aspectos en un determinado trabajo de investiga-
ción, en nuestra opinión, este sería el lugar apropiado.

5. Conclusiones
En nuestra opinión, nuestra propuesta de clasificación de corpus es amplia e
integradora. No se centra en una única disciplina, sino que combina los intereses
de varias, principalmente los de la Lingüística Contrastiva y los Estudios de
Traducción (por ser dos de las disciplinas que emplean corpus con más frecuen-
cia).
Además, nuestra clasificación es flexible porque permite la incorporación de
subtipos de corpus, en caso de que en un proyecto concreto sea preciso atender
a criterios más específicos que los que hemos expuesto.
Por último, consideramos que la representación en forma de árbol es sistemáti-
ca, fácil de entender y permite observar con claridad el lugar que ocupa un de-
terminado corpus en la clasificación general, así como su relación con otros
tipos.

6. Bibliografía
Altenberg Bengt y Sylviane Granger. 2001. The grammatical and lexical patterning of
make in native and non-native student writing. @ Applied Linguistics 22/2:
173-194
Atkins, Sue, Jeremy Clear y Nicholas Ostler. 1992. Corpus design criteria. Literary and
Linguistic Computing. @ Journal of the Association for Literary and Linguis-
tic Computing 7/1: 1-16.
Baker, Mona. 1993. Corpus Linguistics and Translation Studies — Implications and
Applications. @ M. Baker, G. Francis y E. Tognini-Bonelli, eds. Text and
Technology: In honour of John Sinclair. ISBN 9789027285874, pp. 233-252.
Baker, Paul. 2006. Using Corpora in Discourse Analysis. Londres y Nueva York: Con-
tinuum. ISBN 9780826477255.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


354 GORETTI FAYA ORNIA

Borja Albi, Anabel. 2007. Corpora for Translators in Spain. The CDJ-GITRAD Corpus
and the GENTT Project. @ G. Anderman y M. Rogers, eds. Incorporating
Corpora: The Linguist and the Translator. Clevendon: Series Translating Eu-
rope. Multilingual Matters. ISBN 1853599859, pp. 243-265.
Briz Gómez, Antonio y Marta Albelda Marco. 2009. Estado actual de los corpus de
lengua española hablada y escrita. I+D. @ Instituto Cervantes. El español en
el mundo. Madrid: Instituto Cervantes. ISBN 9788434020368, pp. 165-225.
Brown, Peter, John Cocke et al. 1988. A Statistical Approach to Language Translation.
@ Proceedings of the 12th International Conference on Computational Lin-
guistics: Budapest.
Cabré, María Teresa. 2007. Constituir un corpus de textos de especialidad: condiciones
y posibilidades. @ M. Ballard y C. Pineira-Tresmontant, ed. Les corpus en lin-
guistique et en traductologie. Arras: Artois Presses Université. ISBN
9782848320632, pp. 89-106.
Gale, William y Kenneth W. Church. 1991. Identifying Word Correspondences in Par-
allel Text. @ P. Price, ed. Proc. of Fourth Darpa Workshop on Speech and
Natural Language. (del 19 al 22 de febrero). Asilomar (California): DARPA,
pp 152-157.
Corpas Pastor, Gloria. 2001. Compilación de un corpus ad hoc para la enseñanza de la
traducción inversa especializada. @ TRANS. Revista de Traductología 5: 155-
184.
Granger, Sylviane, Jacques Lerot y Stephanie Petch-Tyson. 2007. Corpus-based Ap-
proaches to Contrastive Linguistics and Translation Studies. Beijing: Foreign
Language Teaching and Research Press. ISBN 9789042010468
Johansson, Stig. 1998. On the role of corpora in cross-linguistic research. @ S. Johans-
son y S. Oksefjell, eds. Corpora and cross-linguistic research: Theory, meth-
od, and case studies. Ámsterdam: Rodopi B.V. ISBN 9042002913, pp. 3-24.
Johansson Stig y Hilde Hasselgård. 1999. Corpora and cross-linguistic research in the
Nordic countries. @ Granger et al, eds. Corpus-based Approaches to Contras-
tive Linguistics and Translation Studies. Beijing: Foreign Language Teaching
and Research Press. 9789042010468, pp. 145-162.
Kenny, Dorothy. 2001. Lexis and Creativity in Translation. A Corpus-based Approach.
Manchester: St. Jerome
Laviosa, Sara. 1997. How Comparable Can ‘Comparable Corpora’ Be? @ Target 9/2:
289-319.
Laviosa, Sara. 2007. Studying Anglicisms with Comparable and Parallel Corpora.@ W.
Vandeweghe, S. Vandepitte y M. van de Velde, eds. The Study of Language
and Translation. ISBN 9789027226815, pp: 123–136.
Malmkjaer, Kirsten et al. 1998. Translation & Language Teaching. Language Teaching
& Translation. Manchester: UK. St. Jerome Publishing.
PROPUESTA DE CLASIFICACIÓN DE CORPUS TEXTUALES 355

Marinai, Elisabetta, Carol Peters y Eugenio Picchi. 1991. Bilingual Reference Corpora:
A System for Parallel Text Retrieval. @ Using Corpora, Proc. of 7th Annual
Conference of the UW Centre for the New OED and Text Research. UK: OUP,
pp 63-70.
McEnery, Tony y Andrew Wilson. 1996. Corpus Linguistics. Edinburgh: Edinburgh
University Press, ISBN 0748608087.
Olohan, Maeve. 2004. Introducing Corpora in Translation Studies. Londres y Nueva
York: Routledge. ISBN 9780415268844.
Peters, Carol, Eugenio Picchi y Lisa Biagini. 1996. Parallel and Comparable Bilingual
Corpora in Language Teaching and Learning. @ S. Botley et al., eds. Proceed-
ings of Teaching and Language Corpora. Lancaster: Lancaster University.
ISBN 186220 013, pp. 68-82.
Rabadán Rosa y Purificación Fernández Nistal. 2002. La traducción inglés-español:
fundamentos, herramientas, aplicaciones. León/Valladolid: Universidad de
León/ITBYTE. ISBN 8497730100.
Sinclair, John. 1996. Preliminary Recommendations on Corpus Typology. EAGLES.
http://www.ilc.cnr.it/EAGLES/corpustyp/corpustyp.html
Teubert, Wolfgang. 1996. Comparable or parallel corpora? @ Corpus to corpus: a study
of translation equivalence: International Journal of lexicography. London: Ox-
ford University Press.
Torruella, Joan y Joaquim Llisterri. 1999. Diseño de corpus textuales y orales. @ J. M.
Blecua et al., eds. Filología e informática. Nuevas tecnologías en los estudios
filológicos. Barcelona: Editorial Milenio. ISBN 978-8489790414, pp. 45-77.
Zanettin, Federico. 2012. Translation-Driven Corpora. Corpus Resources for Descrip-
tive and Applied Translation Studies. Manchester: St Jerome. ISBN 978-
1905763290.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


Les corpus dans le cadre de la maîtrise en traduc-
tion
[The use of corpora in the context of MA seminars
in translation studies]
TERESA TOMASZKIEWICZ
Université Adam Mickiewicz à Poznań, Pologne
tomaszki@amu.edu.pl
Resumen
Dans les programmes de formation des traducteurs nous retrouvons trois blocs de
matières : une formation linguistico-traductologique, une formation professionnelle et
une formation académique. Dans le cadre de cette dernière se trouve habituellement le
séminaire de maîtrise qui aboutit à la soutenance des mémoires. Un professeur qui est
censé diriger un tel séminaire affronte avec ses étudiants les différentes dimensions de
l’analyse des corpus pour mener à bien leurs recherches.
Dans cet article, reposant sur une expérience de direction de plus de 150 maîtrises à
l’Université Adam Mickiewicz en Pologne, on présente les problèmes suivants : la place
de la recherche en maîtrise intégrée dans les programmes de formation des traducteurs
au sein des universités, les corpus avant les années 90 vs les corpus contemporains, la
collecte des corpus, la variété de sujets vs la variété de corpus, la compatibilité des cor-
pus par rapport aux sujets de maîtrise et la méthodologie d’analyse des corpus.
Abstract
Programs for the training of translators, especially in relation to Master’s Translation
Studies contain three subject blocks : linguistic and translation training, professional
training and academic training. The academic training consists, as a rule, of the MA
seminar which ends in the defense of the Senior thesis (Master’s thesis). To properly
carry out scientific research the Professor who conducts the students must tackle a va-
riety of research corpora. In this article – which is based on our experience of 15 years
as a supervisor of over 150 MA theses – we present various statistics which show how
students choose the corpora. The following issues will be discussed: the role of the MA
seminar in the overall training of translators at the university level, corpora dating back
to the nineteen eighties as opposed to present-day corpora, literary and non-literary
corpora and the diversity of the issues studied, suitability of corpora in connection with
the issue under analysis, methodology of analysis.
Mots clés
Maîtrise en traductologie , corpus littéraires , corpus non-littéraires , collecte des corpus,
méthodologie d’analyse des corpus
Keywords
Master’s in translation , literary corpora , non-literary corpora , obtaining corpora ,
methodology of corpora analysis

Esta obra se publica con una licencia Creative Commons Reconocimiento – NoComer-
cial – SinObraDerivada (by-nc-nd): No se permite un uso comercial de la obra original
ni la generación de obras derivadas.
358 TERESA TOMASZKIEWICZ

1. Remarques préliminaires
Le séminaire de maîtrise qui prépare les étudiants à l’élaboration d’un mémoire
de fin d’études constitue un point important dans la formation universitaire des
traducteurs et des interprètes, au moins dans les pays de l’Europe centrale et
orientale. Pendant un an ou plus souvent deux ans les étudiants de deuxième
cycle, sous la surveillance d’un professeur, sont censés effectuer des recherches
ponctuelles dans le domaine de la traductologie, très souvent reposant sur
l’analyse de différents corpus. La nature, la forme, l’étendue de ces corpus sont
très variés, mais leur choix et leur adéquation par rapport à la recherche menée
font, entre autres, l’objet d’une évaluation du jury pendant l’examen final. Dans
cet article nous pensons présenter nos expériences en tant que directrice de ces
séminaires de maîtrise depuis 20 ans pour démontrer la façon de constituer les
corpus par les étudiants ainsi que les possibilités de les exploiter.
Pour ouvrir le débat sur le rôle des corpus dans l’élaboration d’une maîtrise en
traduction nous allons tout d’abord rappeler quelques compréhensions de cette
notion, pour ensuite introduire des informations concernant le fonctionnement
des études traductologiques en Pologne avant 1990 et après. Nous allons aussi
nous pencher sur le rôle du mémoire de maîtrise dans les programmes contem-
porains de formation des traducteurs et d’interprètes pour donner à la fin, à titre
d’exemple, un aperçu de différentes recherches réalisées par les étudiants à
l’Université Adam Mickiewicz à Poznań pendant ces vingt dernières années.
Cette présentation n’a aucune prétention d’être exhaustive, mais doit servir
comme point de départ pour les discussions ultimes concernant le rôle de ce
mémoire de fin d’études pour la totalité de la formation traductologique.

2. Notion de corpus
Les études sur corpus semblent promises à un avenir fructueux, car elles ont
déjà fait la preuve de leur efficacité et rencontrent de ce fait un intérêt croissant
auprès des linguistes et des traductologues. Il n’empêche qu’ il existe différentes
façons de constituer des corpus et il n’y a pas, semble-t-il, une seule conception
scientifique reconnue mais des méthodes et des acceptions aussi nombreuses
que les objectifs des chercheurs. Passons en revue quelques opinions concernant
la compréhension de la notion de corpus :
• La notion de corpus est définie dans la tradition comme un regroupe-
ment de textes fondateurs, en particulier dans la religion ou dans le
droit. Cette conception canonique se réfère par exemple au corpus bi-
blique dont la logique propre est de rassembler des textes qui par nature
sont des éléments d’un ensemble. […]
• Par opposition à cette notion canonique de corpus, on trouve des re-
groupements d’écrits ou de transcriptions de l’oral qui se justifient pour
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 359

des raisons de démonstration littéraires, linguistiques ou sociologiques


[….].
• Depuis quelques années s’est renforcée une réflexion sur la ‘linguisti-
que de corpus’ […] Cette conception reconnaît le corpus comme un en-
semble raisonné de textes, qui peut être éventuellement de grand volu-
me (Trésor de la Langue Française, par exemple) et qui est traversé par
une cohérence interne, nécessitant parfois une représentativité externe.
(Ballard et Pineira-Tresmontant 2007 :7).
Il résulte de cette première ébauche de définition que les corpus aussi bien en
linguistique qu’en traductologie sont des regroupements de textes authentiques,
écrits ou oraux. Ces textes de plus en plus prennent une forme électronique qui
facilite leur exploitation. Evidemment ils peuvent être analysés de différents
points de vue qui concernent les différents aspects du fonctionnement de
l’homme dans la société. N’oublions pas que la notion de corpus entre dans un
champ beaucoup plus large qui concerne en général une réflexion commune et
croisée, d’ordre épistémologique et méthodologique sur la notion de corpus telle
qu’elle est exploitée aujourd’hui dans les sciences du langage, et plus large-
ment, dans les sciences humaines et sociales. « On y traite des questions relati-
ves aux notions de donnée, d’observables, d’empiricité, de théorie (lien type/
occurrence), de variable contextuelle, d’annotation, de codage, de catégorisation
etc. On s’interroge sur la fonction des corpus dans l’activité de recherche. »
(Laboratoire STIH -Sens, Texte, Informatique, Histoire, dirigé par Franck Ne-
veu) (www.stih.paris-sorbonne.fr).
Il est clair, que nous ne prétendons pas à résoudre dans cette courte présentation
tous les dilemmes concernant la définition des corpus dans les sciences humai-
nes. Dans le cadre de cet article nous allons nous limiter au contexte linguisti-
que et traductologique.
G.Vetulani (2013 : 14) constate :
Pour un linguiste la réalité qu’il observe est constituée par les données provenant
des corpus, c’est à dire des réalisations linguistiques pratiques au niveau de la
parole, tels que: mots, fragments plus ou moins longs de la parole, provenant des
énonciations concrètes, phrases, textes écrits ainsi que les enregistrements appar-
tenant aux différents registres ou types de discours. (trad.T.T.) 1
La collecte des unités soumises à une investigation linguistique peut se faire par
une méthode traditionnelle, à travers une analyse, nous dirions manuelle, des
textes ou des définitions dans les dictionnaires ou à l’aide de programmes élec-
troniques spécialisés qui soutiennent un linguiste dans ses recherches grâce à
une grande capacité et une vitesse beaucoup plus puissante de dépouillement
des données que celle humaine. Or, dans les deux cas nous avons affaire aux
recherches empiriques ce qui réserve la place à la linguistique parmi les scien-

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


360 TERESA TOMASZKIEWICZ

ces se référant tout d’abord à l’observation des données réelles. La « matière »


de cette « observation » est justement fournie par des corpus.
Il faudrait alors réfléchir jusqu’à quel point l’observation du fonctionnement de
la langue et de la parole par un linguiste s’appuie sur les mêmes données que
l’analyse du transfert linguistique et culturel pendant la traduction. Autrement
dit, il faut se poser la question sur la façon d’exploiter des corpus par un linguis-
te et un traductologue.
Or, déjà dans cette courte présentation de la notion, nous avons pu voir que la
signification et la pragmatique des corpus a évolué pendant les différentes péri-
odes. En plus, les chercheurs signalent qu’il n’y a pas de corpus bon à tout et
qu’il faut les personnaliser en fonction de la recherche.
Il ne peut y avoir de théorie générale des corpus. Réunir dans un ensemble des
éléments langagiers apparentés dépend des items et du type de textes, de la mét-
hode et des moyens d’analyse qui renvoient eux-mêmes aux projets de recher-
che. (Tournier 2007 : 49).
Il en résulte que la constitution du corpus, son étendue, son caractère sont dictés
par le champ d’investigation, les hypothèses posées, les résultats recherchés.
Aussi bien les linguistes que les traductologues observent les phénomènes ayant
trait à l’utilisation de la langue, or dans le cas de la recherche en traduction les
questions et les hypothèses surgissent dans le cadre de la rencontre d’au moins
deux zones linguistico-culturelles, ce qui n’est pas forcément le cas de la re-
cherche en linguistique. C’est probablement pourquoi C. Wecksteen (2007 :
261) signale l’existence « d’un fossé […] entre la façon dont linguistes et tra-
ductologues conçoivent et utilisent un corpus », ce qui d’après cette auteure
n’exclue pas « une discussion qui puisse être fructueuse pour les deux parties. »
Cette auteure, par exemple, a entrepris de montrer comment une analyse fondée
sur l’observation de corpus parallèles permettait à la traductologie de démontrer
des phénomènes liés à l’opération même de la traduction qui met en relation
non seulement des langues, mais aussi des textes. Elle souligne aussi que
« même si linguistique contrastive et traductologie utilisent toutes deux les cor-
pus parallèles, la méthode d’exploration, les objectifs visés, et par conséquent
les enseignements qui en sont tirés, sont différents. » (Wecksteen 2007 : 262).
Nous allons revenir à cette constatation dans notre analyse concernant
l’exploitation des corpus par les étudiants. Toutefois, avant de passer à cette
analyse il faudrait s’arrêter encore sur une autre observation.
L’ intérêt énorme qu’attachent aujourd’hui les chercheurs en sciences humaines
aux corpus en général, vu le nombre de publications, rencontres, débats autour
de cette problématique pourrait faire penser que la notion de corpus est une
invention nouvelle, caractéristique pour les recherches contemporaines. Cette
confusion résulte du fait qu’on s’émerveille devant les nouvelles technologies
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 361

qui permettent de collecter des corpus et des bases de données énormes et de les
traiter d’une manière rapide, beaucoup plus rapide qu’il y a encore une vingtai-
ne d’années. Or, ceci ne veut pas dire que la notion de corpus est née à présent.
Cl. Bocquet constate :
En lisant la littérature ancienne sur la traduction, celle qui a précédé la littérature
traductologique au sens strict [….] on s’aperçoit qu’elle est largement fondée sur
l’analyse de ce qu’on pourrait appeler aujourd’hui un corpus, dans la définition
très classique qu’en donne, par exemple, Jean Dubois, dans la perspective de
l’analyse de discours. ‘Collection de données langagières sélectionnés et orga-
nisées selon des critères linguistiques explicites pour servir d’échantillon du lan-
gage’ (Dubois 1969 : 116). 2
Cl.Bocquet continue :
Étienne Dolet déjà fonde l’essentiel de ses considérations relatives à la manière
de bien traduire sur un ensemble, certes très modeste, de traduction de Ciceron
[…] Gaspars de Tende, le premier de son genre il est vrai, utilise, quant à lui, un
véritable corpus, au demeurant gigantesque […] (Bocquet, 2007 : 158-159).
Il faut donc admettre que la majorité des recherches en linguistique ou en tra-
ductologie doit s’appuyer sur l’observation des données langagières ou textue-
lles, mais cette observation, cette analyse sont différentes aujourd’hui par rap-
port à celles d’antan.
On peut remarquer sans problèmes que l’accessibilité de données linguistiques,
surtout en ce qui concerne les langues pour lesquelles on a déjà élaboré des cor-
pus spécialisés, est nettement plus grande que dans les époques précédentes. […]
Les recherches sur les corpus se développent de plus en plus. Grâce à elles on en-
richie le savoir à la base des preuves enregistrées (usages) et non pas à la base
des exemples préfabriqués, comme c’était parfois le cas avant (Vetulani, 2013 :
15) (trad.T.T.). 3
Cette courte revue de quelques points de vue sur la compréhension et
l’utilisation des corpus nous montre qu’il est relativement difficile d’en donner
une définition pouvant embrasser tous les aspects. Nous pouvons seulement
constater que c’est un phénomène en plein épanouissement. Les nouvelles tech-
nologies qui permettent de créer des corpus de plus en plus gigantesques impo-
sent aussi un nouveau traitement de ces données et de nouvelles exploitations. Il
est clair que cet outil technique est exploité par les domaines de plus en plus
vastes et se trouve au croisement de plusieurs disciplines.
Dans ce contexte, il faut de nouveau réfléchir à la façon dont toutes ces possibi-
lités d’exploitation des bases de données influencent le choix des corpus par les
étudiants dans leurs recherches. Pour répondre à cette question nous allons tout
d’abord nous arrêter sur quelques exemples concrets concernant l’organisation
et le fonctionnement des séminaires de maîtrise en Pologne.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


362 TERESA TOMASZKIEWICZ

3. Un peu d’histoire
Toutes ces réflexions qui viennent d’être présentées concernent sans aucun dou-
te tous les professeurs qui sont censés diriger les travaux de maîtrise au-
jourd’hui dans le cadre des recherches traductologiques largement comprises.
Or, nous aimerions rappeler une époque un peu plus éloignée de la réalité con-
temporaine, à savoir le fonctionnement des études traductologiques en Pologne
avant 1990. Ces expériences sont comparables avec celles d’ autres pays de
l’Europe centrale et orientale et peuvent servir comme modèle « d’antan ».
Dans ces pays les formations en langues après la Deuxième Guerre mondiale se
faisaient dans le cadre de ce qu’on appelait - la philologie. D’ailleurs cette ter-
minologie a été conservée de nos jours car à présent où plusieurs programmes
de formation des traducteurs sont enregistrés, par exemple, sur la plateforme
OPTIMALE (voir la note 5), la majorités sont intégrés dans la formation dite «
philologique ». Or, il nous semble que l’aspect terminologique n’est pas crucial
pour ce débat. Le centre du problème se trouve dans la reconnaissance du métier
du traducteur par le système administratif en vigueur. Ce métier, au moins en
Pologne, n’était pas reconnu par les autorités communistes. Il en résulte qu’on
ne pouvait pas proposer aux autorités ministérielles de l’époque un programme
universitaire de formation de traducteurs qui s’éloignait d’un programme géné-
ral prévu pour « la philologie » ou à partir des années soixante-dix aussi pour «
la linguistique appliquée ».
Ceci dit, la plus ancienne formation traductologique en Pologne a été réalisée à
l’Université de Varsovie sous l’étiquette : « linguistique appliquée ». Or, ce
programme devait répondre à plusieurs exigences : montrer qu’on formait des
gens qui étaient préparés aussi bien pour assurer la didactique des langues que
la traduction (linguistique appliquée) et qui en plus réalisaient le minimum obli-
gatoire du programme prévu par le Ministères pour la formation universitaire
appelée « la philologie ». Ce contexte paraissait relativement hostile à toute
tentative de donner à la formation des traducteurs et des interprètes un statut de
formations universitaire. En plus, il faut le dire pour une fois ouvertement, dans
un système totalitaire toute personne maîtrisant des langues étrangères et par
définition ayant des contacts avec des étrangers était nuisible pour le système en
tant que tel. Par conséquent, toutes les formations philologiques et encore plus
la formation des traducteurs étaient constamment surveillées par les autorités du
pays.
Néanmoins, malgré ce contexte un peu hostile aux recherches et à la formation
en traductologie, dans un contexte d’un pays au-delà du « rideau de fer », beau-
coup de travaux de maîtrise ont été réalisés, contre vents et marées. Pour faire
face à ces inconvénients il a fallu créer une façon spécifique de constituer des
corpus estudiantins afin qu’ils réalisent leurs projets. N’oublions pas cette bana-
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 363

lité qu’à l’époque il n’y avait pas d’Internet, de tablettes, de communication


électronique, de corpus électroniques et en général l’accès aux documents écrits
en deux versions linguistiques était très restreint. Il a fallu créer des corpus un
peu différemment et profiter de ce qu’on pouvait trouver sur le marché, p.ex. les
documents parallèles des conventions et contrats internationaux publiés par une
institution importante de cette époque et accessible au public, à savoir PISM
(L’Institut Polonais des Affaires Internationales). En ce qui concerne la presse,
par exemple française, un seul titre était disponible l’Humanité (l’organe offi-
ciel du Parti Communiste Français mais sans traduction en polonais). Cette situ-
ation imposait aux jeunes chercheurs le recours aux corpus littéraires.
Pourtant, Skibińska (2008) a bien démontré que la politique éditoriale en Po-
logne après la guerre a été largement marquée par une idéologie sous - jacente.
Il en résulte que les étudiants en maîtrise n’avaient accès qu’aux corpus consti-
tués par les traductions des œuvres littéraires françaises acceptées par les autori-
tés en vigueur, à savoir à tout ce qui correspondait à l’idéologie communiste-
marxiste. Dans ce type de conditions le type de corpus auquel les étudiant pou-
vaient avoir accès dictait le type et le but de la recherche. Évidemment nous
parlons de petites recherches dans le cadre de maîtrise, mais même à ce niveau-
là il faut se poser la question de la méthodologie. « On est donc conduit à discu-
ter les méthodologies de constitution des corpus en termes de représentativité
quantitative et qualitative par rapport aux phénomènes à décrire et à analyser,
[…] » (Beacco 2002 : 149).
À l’époque que nous décrivons la réalité de la rédaction d’une maîtrise dans un
contexte dépourvu d’accès à une vraie base de données limitait les recherches à
une analyse du corpus qu’on pouvait difficilement constituer. Nous pouvons
donc avancer que l’accès limité aux bases de données très souvent dictait le type
de recherches effectuées. Nous pouvons paraphraser cette situation de façons
suivante :
« Analysons de quoi nous disposons et en fonction de ceci nous pouvons préci-
ser l’objet de la recherche ». Du point de vue scientifique cette attitude paraît
minimaliste, mais elle a été acceptée par plusieurs directeurs de mémoires.
Les époques et les conditions du travail à l’université ont largement changés en
1990, c’est-à-dire à partir du changement du système politique et économique
dans les pays de l’Europe de l’Est. Il n’empêche que la façon de travailler des
étudiants en maîtrise dans notre nouvelle époque n’a pas beaucoup changé. Les
observations de la façon de faire de plusieurs étudiants en maîtrise depuis une
vingtaine d’années nous permet de constater majoritairement deux tendances :
• ils ont une idée de réflexion et essaient de choisir les corpus en fonction
du but de la recherche, mais aussi souvent

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


364 TERESA TOMASZKIEWICZ

• ce sont les corpus auxquels ils ont accès qui dictent le but de leur inves-
tigation.
Devant une telle réalité des choses on devrait peut-être revenir à la discussion
sur le rôle de cette recherche ponctuelle dans le domaine de traductologie qui
doit se terminer par un mémoire de fin d’études de maîtrise. Dans le monde
contemporain où tout le monde essaie d’ajuster les programmes de formation
universitaire aux besoins du marché il faut se poser la question dans quelle me-
sure la rédaction d’un mémoire de maîtrise peut contribuer à la réalisation de cet
objectif.

4. Rôle du séminaire de maîtrise en formation traductologique


à l’époque contemporaine
Passons donc à la réflexion concernant le rôle des séminaires de maîtrise dans le
cadre d’une formation traductologique à l’époque contemporaine. La formation
des traducteurs et d’interprètes fait l’objet depuis une dizaine d’années d’un
nombre impressionnant de débats, de conférences, de projets internationaux et
nationaux. Les universitaires et les professionnels se penchent sur le contenu
des programmes d’enseignement, sur la qualité des formateurs, sur des outils
aidant cette formation. Plusieurs chaînes et plateformes de coopération ont été
créées, au moins au niveau européen, comme par exemple, EMT (European
Master’s in Translation) 4 ou la plateforme OPTIMALE 5 qui résulte de la coopé-
ration pendant 3 ans des directeurs de plus de 70 programmes de formation dans
ce domaine dans toute l’Europe. Dans ces débats revient toujours la question
concernant la place du séminaire de maîtrise dans ces formations.
Si tous, nous sommes d’accord que les études dans le domaine de traduc-
tion/interprétation sont des études professionnels, il n’empêche que dans les
programmes de formation des traducteurs /interprètes 6 nous retrouvons trois
blocs de matières enseignées: une formation linguistico-traductologique, une
formation professionnelle et une formation académique. Dans le cadre de cette
dernière se trouve habituellement le séminaire de maîtrise qui aboutit à la soute-
nance des mémoires. Ceci ne veut pas dire que tous les pays européens ont
adopté cette façon de délivrer les diplômes (voir p.ex. la Grande Bretagne ou
l’Espagne ou l’obligation de ce travail de fin d’études n’est pas nécessaire pour
obtenir le diplôme). Mais, dans beaucoup d’entre eux, la Pologne y comprise, le
mémoire de maîtrise à la fin des études est obligatoire. Evidemment la prépara-
tion de ce mémoire peut durer un ou deux ans, mais le plus souvent deux. Or, en
général il n’existe aucun document qui préciserait les critères d’une maîtrise
dans ce domaine. Alors, nous pouvons nous référer uniquement aux exemples
concrets des directeurs de ces travaux. Ainsi, par la suite nous pensons parler de
nos expériences en tant que directrice de ce séminaire de maîtrise depuis 20 ans.
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 365

5. Les séminaires de maîtrise en traduction à l’Université Adam


Mickiewicz à Poznań
L’année 1990 marque une rupture entre l’époque du communisme et l’ouverture
à un système démocratique. Toute sorte de bouleversements dans tous les do-
maines de la vie sociale et politique ont traversé le pays. Les premières institu-
tions ouvertes aux changements étaient les universités. On a rejeté les progra-
mmes de formation imposés par le Ministère de l’Education et chaque universi-
té cherchait son chemin éducatif. La situation était toutefois difficile car pour
réaliser de nouvelles visions de formation on avait besoin de spécialistes en
formation qui manquaient dans beaucoup de domaines, la traductologie y com-
prise. Il a fallu plusieurs années pour constituer des équipes d’enseignants pou-
vant assurer la réalisations de nouveaux programmes, adaptés aux besoins de la
société démocratique. A l’Université Adam Mickiewicz nous avons aussi travai-
llé pour former des formateurs dans le cadre des études traductologiques. Cette
période a duré un certain temps car on ne peut pas former des cadres spécialisés
en une ou deux années. Pourtant le séminaire de maîtrise couronné par une re-
cherche a toujours existé. Finalement, notre programme de formation de traduc-
teurs a été accepté par la Direction Générale de la Traduction de la Commission
Européenne et nous avons pu adhérer au réseau de l’EMT ayant obtenu le certi-
ficat de qualité en 2011. Dans ce programme le séminaire de maîtrise est un
élément important. Nous dirions plus, sans ce mémoire final un étudiant en Po-
logne ne peut recevoir aucune certification de fin d’études.
Au cours des quinze dernières années 153 maîtrises ont été rédigées sous notre
direction. En principe, les étudiants ont la liberté de préciser leurs sujets ou
leurs domaines d’ intérêt. Presque tous ces travaux (151) reposaient sur
l’analyse de différents corpus, dans la majorité des cas choisis librement par ces
jeunes chercheurs. Si nous voulions caractériser ces corpus il faudrait les re-
grouper selon certaines catégories. La première grande ligne de partage (tout
d’abord très générale) concerne la distinction entre les corpus littéraires et non-
littéraires. Alors parmi ces 151 corpus 68 concernaient les textes littéraires,
donc 45 % et le reste 55 % (83) toute sorte de textes non-littéraires.

5.1.Corpus littéraires
Parmi les textes littéraires une grande partie sont des romans ou des nouvelles,
aussi bien contemporains que plus anciens : moyenâgeux, romantiques, du XIX
s. ou tout à fait contemporains.
• 4 de ces corpus embrassaient des textes d’ opéras ou de comédies musi-
cales (6 %),
• et 4 des œuvres poétiques, chansons y comprises (6 %),

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


366 TERESA TOMASZKIEWICZ

• 2 des textes de littérature enfantine (3 %),


• 6 (9 %) étaient constitués de pièces théâtrales.
• Nous avons classé dans cette catégorie aussi les textes bibliques (3) (4 %) non
seulement parce qu’ils possèdent beaucoup des traits d’un texte littéraire mais
aussi à cause de la problématique analysée.
Parmi les phénomènes analysés à la base de ces corpus littéraires nous pouvons
évidemment citer :
• le transfert des différentes figures de style se plaçant au niveau paradigmatique
( métaphores, personnifications), syntagmatique ( apostrophes, répétitions, re-
formulations) et phonétique (assonances , allitérations) etc. mais aussi
• le transfert du comique ou des néologismes.
Toutefois, le comique comme problème de recherche peut être étudié à la base
des corpus littéraires, mais aussi audiovisuels. Par contre, nous pouvons parler
des formations néologiques dans les productions littéraires mais aussi dans le
langage de presse ou en tant que nouvelle terminologie. En plus, les corpus
littéraires permettent de réfléchir sur les prototypes textuels (descriptif, narratif,
mais aussi dialogal).
Ceci dit, nous pouvons constater aussi que parmi ces 68 corpus littéraires 10 ont
été utilisés pour étudier les problèmes lexicaux et morphosyntaxiques apparais-
sant pendant les transferts d’une langue à une autre.
Une autre problématique traitée à l’aide des corpus littéraires, mais aussi audio-
visuels concerne les différentes stylisations : archaïque, dialectale, langage des
subcultures des jeunes, langage érotique etc. (10 mémoires).
Dans la majorité des cas tous ces corpus sont principalement bilingues polonais-
français ou français polonais mais, dans 7 cas trois systèmes linguistiques en-
traient en jeu : polonais + français + espagnol ou + anglais, ou + allemand. Il y
avait encore 3 travaux ou on a pris en compte deux ou plus de traduction d’un
même texte.
Une autre forme de constituer les corpus amenait à pratiquer la traduction com-
mentée des œuvres n’existant pas en version polonaise. Il s’agit d’un projet
scientifique réalisé entre 2005 et 2010 avec les étudiants en maîtrise. L’objectif
principal de ce projet au début était la diffusion et la promotion en Pologne de la
littérature, langue et culture des communautés minoritaires francophones cana-
diennes, notamment: acadienne, franco-ontarienne, franco-saskatchewannaise et
franco-manitobaine. Nous avons prévu trois éditions du séminaire pendant les-
quelles les étudiants ont préparé leurs maîtrises sous forme de traduction com-
mentée de leurs traductions des textes des auteurs choisis 7. Dans la deuxième
étape nous avons pris en compte la littérature belge contemporaine francophone.
La majorité des réflexions concernaient les problèmes traductologiques liés aux
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 367

transferts culturels, stylisation dialectale, langage des jeunes, universalité des


valeurs des cultures éloignées etc. Nous pouvons dire que dans ce projet les
corpus étaient en quelque sorte imposés par des enseignants.

5.2. Corpus non-littéraires


En ce qui concerne les corpus non-littéraires, comme nous avons dit ils constit-
uent 55 % du total. Or, leur caractère est beaucoup plus varié. Tout d’abord il
faut parler des corpus écrits, des corpus oraux et des corpus mixtes qui intègrent
des éléments oraux, écrits et sémiotiques (gestes, mimiques, images, icones)
par exemple dans la traduction audiovisuelle. Dans cette catégorie s’intègrent
aussi des corpus parallèles. Cette énumération ne présente peut-être pas quelque
chose de nouveau, mais il est intéressant d’ évoquer certaines statistiques.

5.2.1. Langues de spécialité


Les corpus écrit dans le domaine des langues de spécialité constituent 30 % de
tous les corpus. Évidemment la notion de langues de spécialité est très vaste et
elle peut être exploitée de manières différentes c’est pourquoi nous mentionnons
seulement la répartition proportionnelle de ce différents domaines qui faisaient
l’objet de recherches dans le cadre de notre séminaire. Le domaine qui est le
plus représenté c’est le droit (11), suivi de médecine (4), et ensuite un travail
dans les domaines suivants : économie, technique, musique, tourisme, église,
torture, marin, pêche, chasse, militaire. Treize de ces travaux peuvent être clas-
sifiés en tant que recherches typiquement terminologiques et sept ont envisagé
aussi des aspects morpho-syntaxiques.

5.2.2. Textes de presse


Les deuxième groupe de textes écrits ce sont les textes de presse (17 - 20 %),
qui par leur nature sont eux aussi très variés : presse politique, presse féminine,
vulgarisation scientifique, mais aussi publicité. A un certain moment quelques
travaux ont été consacrés aux modèles de textes (8) fonctionnant dans deux ou
trois sociétés et ayant des matrices un peu différentes, comme des recettes de
cuisine, des faire-part de décès, des modes d’emploi, des petites annonces, mais
aussi les contrats de droit civil (de bail ou de location) etc. Dans ces cas souvent
les corpus avaient la structure des textes parallèles. Par conséquent, nous avons
aussi proposé d’étudier des textes parallèles télévisés comme des journaux télé-
visés, des bulletins météo ou des talk- show, mais cette fois-ci nous avons eu
affaire aux corpus audiovisuels.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


368 TERESA TOMASZKIEWICZ

5.2.3. Textes audiovisuels


D’une manière plus sommaire nous pouvons dire que parmi 83 corpus non-
littéraires 20 (24 %) étaient constitués par les corpus audio-visuels (films com-
pris). Nous avons classé parmi cette catégorie aussi les travaux consacrés aux
traductions des films pour les malentendants (2) et l’audio description (1). Il est
clair que l’analyse de ces corpus doit aussi intégrer la dimension sémiologique
largement comprise, c’ est qui est encore plus important dans le groupe suivant.

5.2.4. Corpus médiaux à dominante sémiotique


Dans cette catégorie nous intégrons non seulement des textes audiovisuels mais
aussi les corpus de presse, étudiés du point de vue non seulement linguistique
mais aussi par rapport à la dimension sémiotique du document (images,
graphismes, icones, dimensions mimique et gestuelle). Pendant la période
analysée dix travaux ont concerné ce genre de réflexion. Quelque uns ont dé-
battu, par exemple, du problème de l’image stéréotypique de la femme ou de
l’homme dans la publicité. D’autres ont comparé les stéréotypes en langue et en
images. Nous avons donc pris en compte les différentes dimensions de la tra-
duction intersémiotique.

5.2.5 Corpus oraux


Et finalement il faut parler des corpus oraux se composant d’enregistrements
audio ou audiovisuels. Il s’agit donc des enregistrements des conversations aut-
hentiques, des interprétations de conférence ou du matériel audiovisuel. Dans le
premier cas l’objet de l’investigation concernait le déroulement de la conversa-
tion. Les étudiants ont pris en compte des phénomènes tels que les échanges
comportant des « excuses », des « offres », des « termes d’adresse », des « titres
honorifiques », les phénomènes de textualisation conversationnelle (8 travaux =
10 %). Pendant l’analyse de l’interprétation de conférence (2 travaux) et la tra-
duction à vue (1) on a analysé le problème de reformulation, la qualité de
l’interprétation ou le passage du code écrit au code oral.

5.2.6. Traduction automatique


La dernière catégorie qui malheureusement est peu représentée dans ces travaux
que nous venons de présenter concerne la traduction automatique et l’utilisation
des outils informatiques dans la traduction (3 = 4 %). Malgré la formation de
ces étudiants qui intègre l’utilisation des outils informatiques pendant la traduc-
tion ou le recours aux bases de données les étudiants ne paraissent pas tellement
intéressés par une recherche dans ce domaine. Nous supposons qu’avec le déve-
loppement de plus en plus poussé des techniques informatiques en traductologie
cette tendance peut changer.
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 369

Pour terminer cette revue des corpus et de leur utilisation dans les maîtrises il
faut encore mentionner un aspect important. Un corpus peut être aussi utilisé
pour analyser des techniques traductologiques menant à la résolution des pro-
blèmes, mais aussi pour détecter des erreurs de traduction, erreurs commises par
l`homme mais aussi par la machine (11 travaux).

6. Conclusion
Aujourd’hui, les jeunes chercheurs qui préparent leur maîtrise travaillent sur des
corpus de plus en plus diversifiés et multimodaux. Comme nous avons démon-
tré, les corpus peuvent être livresques, numériques, multimédia (sites internet de
presse en ligne, forum…), plurilingues ou bien encore plurisémiotiques, comme
une collection d’objets ou d’œuvres d’art contextualisant les discours
d’exposition artistiques, des enregistrements audio-visuels dans des espaces
publics (avec la prise en compte de la gestuelle).
Très souvent les disciplines concernées dépassent le cadre strict de la linguisti-
que ou de la littérature. Il n’empêche que les étudiants en maîtrise doivent faire
face à ces corpus hétérogènes, hybrides et la traductologie n’apporte pas tou-
jours un cadre d’analyse adéquat. Nous affrontons alors la notion d’hybridité
des corpus qui doit être entendue comme un ensemble de données en contexte,
c’est-à-dire situées dans un environnement signifiant et constituant de nouveaux
points de questionnement pour toutes les disciplines. Il en résulte, qu’il faut que
le directeur de thèse soit capable de suggérer tout d’abord le champ
d’exploitation, de donner des outils d’analyse pour aider à intégrer la recherche
en question à certains courants en linguistique ou en étude littéraire.

7. Références
Ballard, Michel et Carmen Pineira-Tresmontant, eds, 2007. Les corpus en linguistique
et en traductologie. Arras : Artois Presses Université Traductologie. ISBN 978-
2-84832-063-2.
Beacco, Jean-Claude. 2002. Corpus. @ P. Charadeau et D.Mainguenau, eds. Diction-
naire d’Analyse du Discours. Paris : Éditions du Seuil. ISBN 2-02-037845-0,
pp.148-151.
Bocquet Claude. 2007. D’un corpus pour la traduction à un corpus pour une véritable
histoire de la traduction. @M.Ballard et C. Pineira-Tresmontant, eds. Les cor-
pus en linguistique et en traductologie. Arras : Artois Presses Université Tra-
ductologie. ISBN : 978-2-84832-063-2. pp. 159-174.
Bocquet, Claude. 2008. La traduction juridique. Fondement et méthode. Bruxelles : De
Boeck. ISBN 978-2-8041-5928-3.

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…


370 TERESA TOMASZKIEWICZ

Dubois, Jean. 1973. Corpus. @ J.Dubois et al, eds. Dictionnaire de linguistique. Paris :
Larousse. ISBN 20299-10-72, pp. 128-129.
Skibińska, Elżbieta. 2008. Kuchnia tłumacza. Studia o polsko-francuskich relacjach
przekładowych. Kraków : Universitas. ISBN 97883-242-0953-8.
Tomaszkiewicz, Teresa. 2008. Transfert de la littérature acadienne en Pologne : bilan
d’une expérience traductologique et didactique. @ Alternative francophone 1
/1: 98-118. <http://ejournals.library.ualberta.ca/index.php/af/issue/current>.
Tomaszkiewicz, Teresa. 2009. Granice przekładalności współczesnej literatury
akadyjskiej w świetle myśli Olgierda Wojtasiewicza. @ Hejwowski K.,
Szczęsny A. et Topczewska U. eds. 50 lat polskiej translatoryki. Warszawa:
ILS, Uniwersytet Warszawski. ISBN 978-83-929439-0-7, pp.163-174.
Tomaszkiewicz, Teresa. 2012. Croisement des langues et des cultures dans la traduc-
tion. @Kacprzak A., A. Konowska et M. Gajos, eds. Pluralité des cultures :
chances ou menaces ? Analyses linguisitiques et didactiques. Łódź – Łask :
Oficyna Wydawnicza LEKSEM. ISSN 2107-7029, pp. 275-285.
Tournier, Maurice. 2007. Corpus de textes en lexicométrie sociopolitique. @ M.Ballard
et C. Pineira-Tresmontant, eds. Les corpus en linguistique et en traductologie.
Arras : Artois Presses Université Traductologie. ISBN 978-2-84832-063-2, pp.
49-60.
Vetulani, Grażyna. 2013. Problemy i korzyści wynikające z automatycznego przetwar-
zania korpusów – na przykładzie badań z zakresu predykacji rzeczownikowej
w języku polskim. @ D. Śliwa (ed.) Roczniki Humanistyczne, z. 8, Lingwistyka
korpusowa i translatoryka. pp. 13-24. ISSN: 0035-7707.
Wecksteen, Corinne. 2007. Le corpus en traductologie : un moyen d’observation pour
une approche réaliste de la traduction : application à quelques phénomènes
connotatifs. @ M.Ballard et C. Pineira-Tresmontant, eds. Les corpus en lin-
guistique et en traductologie. Arras : Artois Presses Université Traductologie.
ISBN 978-2-84832-063-2, pp. 261-282.

1
Vetulani 2013, citation en original: « Dla lingwisty rzeczywistością obserwowaną jest zgromad-
zona w korpusach "materia", czyli konkretne realizacje językowe (wykonania na poziomie paro-
le), takie jak: słowa, krótsze i dłuższe fragmenty wypowiedzi, zdania, teksty pisane, ale także
nagrania mowy pochodzące z różnych rejestrów i typów dyskursu.”
2
Pour une définition plus ample on peut consulter Dubois et al., 1973.
3
Vetulani 2013, citation en original: „Rzeczą oczywistą jest, iż obecnie obserwacja zjawisk języ-
kowych różni się w swoim charakterze od tej, która miała miejsce dawniej. Bez trudu da się
zauważyć - przynajmniej jeśli chodzi o języki, dla których stworzono już nowoczesne i re-
prezentatywne korpusy - że dostępność do faktów językowych jest dzisiaj dużo większa niż
dawniej. […] Badania korpusowe są dziś niezwykle zaawansowane. Dzięki nim wnosi się do
nauki wiedzę na podstawie zarejestrowanych zaświadczeń (uzusu), a nie - jak to bywało niekiedy
w przeszłości - poprzez preparowane przykłady językowe.”
LES CORPUS DANS LE CADRE DE LA MAÎTRISE EN TRADUCTION 371

4
European Master’s in Translation :
http://ec.europa.eu/dgs/translation/programmes/emt/universities/index_en.htm.
5
OPTIMALE : http://www.translator-training.eu/.
6
Nous pensons qu’à ce point il faut faire une remarque importante qui concerne la distinction
entre les notions de traducteur et d’interprète. Toutes les nouvelles formations universitaires font
clairement la différence entre les traducteurs des textes écrits et les interprètes des textes oraux.
Or, Cl. Bocquet (2008 : 8) constate : « […] il aurait été également possible, et peut-être bienvenu,
d’accueillir en français, comme cela a été fait en allemand, le terme de ‘translatologie’ à côté du
terme ‘traductologie’, pour englober l’interprétologie’. Cela aurait été d’autant plus justifié
qu’avant Robert Estienne en 1539 et Étienne Dolet en 1540, on employait en français le verbe
‘translater’ dans un sens correspondant aux deux verbes modernes de traduire et
d’interpréter […]». Il en résulte que quand nous allons parler dans la suite des séminaires de
maîtrise, ces séminaires embrassent aussi bien des étudiants en traduction qu’en interprétation.
7
A propos de ce sujet on peut lire plus dans Tomaszkiewicz (2008, 2009, 2012).

METODOLOGÍAS Y APLICACIONES EN LA INVESTIGACIÓN EN T&I CON CORPUS…

View publication stats

Anda mungkin juga menyukai