Anda di halaman 1dari 15
Isabel Garcia Izquierdo (ed.) El género textual y la traduccién Reflexiones tericas y aplicaciones pedagégicas & PETER LANG Bern: Berlin: Bruxelles Frankfurt am Main New York “Oxford: Wien Bibliographic information, by Die Deutsche Bibliothek Die Deutsche Bibliothek ists this publication in the Deutsche National- bibliagrafe; detailed bibliographic data is available on the Internet at ‘http: /idnb.ddb de> British Library and Library of Congress Cataloguing-in-Publication Data: ‘A catalogue record for this book is availabe from The British Library, Great Britain, and from The Library of Congress, USA Published within the project BFF2002.01932 supported by the Ministerio de Educacién y Ciencia and the FEDER programme. ISBN 3-03910-676-7 © Peter Lang AG, European Academic Publishers, Bern 2005 Hochfeldstrasse 32, Postfach 746, CH-3000 Bern 9, Switzerland info@peteriang.com, www peteriang.com, www-peteriang.net Allright reserved ‘Allpars ofthis publication are protected by copyright. Any utilisation outside the strict limits of the copyright law, without the persion ofthe publisher, is forbidden and lable to prosecution This apples in particular to reproductions, translations, microfilming, and storage and processing in electronic retneval systems Printed in Germany indice El concepto de género: entre el texto y el contexto (Grupo GENTT) Bloque I. Nuevos enfogues para viejos ditemas El género como espacio de socializacién del estudiante de traduccién cientifico-téenica V. MONTALT Organizacién del conocimiento para la traduccién juridica a través de sistemas expertos basados en el concepto de género textual A. BORIA Reeducacién y desculturacién a través de géneros en traduccién juridica, econémica y administrativa E. MonzO La implementacién del concepto de género textual en los corpus electronicos para traductores A. ALCINA 19 37 69 93 Bloque Il. Algunas aplicaciones pedagdgicas El género y la lengua propia: el espafiol de especialidad . 1. GARCiA 1ZQUIERDO La nocién de género en la planificacién de la docencia de la traduccion de la primera lengua extranjera ‘P. EZPELETA El género y la traduccion de la segunda lengua extranjera: aleman S. GAMERO La traduecién transgenérica en la clase de inversa S. JENNINGS Vigotsky, Wordsmith y GENTT: corpus y herramientas electronicas en la clase de traduccién general . M. CALZADA El género y la traduccion de textos administrativos espafiol-catalin ...... C.GaRCIA El género textual: un concepto transversal ¢ integrador en el disefio de asignaturas de traduccién y lenguaje cientifico-técnicos .. P. EZPELETA, C. GARCIA y V. MONTALT Pardmetros genolégicos en la estructura y planificacion de un curso de traduccién especializada A. BELTRAN, 17 135 159 177 189 - 207 217 241 El concepto de género: entre el texto y el contexto El presente trabajo pretende reflexionar y mostrar, desde el punto de vista prictico, el uso del concepto de género en la formacién de traductores. Se trata de una nocién que ha propiciado cierta contro- versia en el Ambito de la Traductologia (véase I. Garcia Izquierdo, 2000; Mayoral, 2001), pero que representa, en nuestra opinién, una ‘base fundamental sobre la que se pueden asentar gran parte de los ‘conocimientos lingiiisticos y extralingilisticos que los estudiantes de traduccion van adquiriendo en su formacién, que les permite, de hecho, Ilegar a ellos (Monz6 y Borja, 2000) y que al cabo conforma 14 una parte muy importante de su competencia como profesionales. A pesar de los detractores que, en los iltimos tiempos, ha tenido el concepto, el equipo de investigacién GENTT lo tomé como eje vertebrador de su trabajo, y asumié el reto de defender la pertinen- cia del género no sélo en la vertiente investigadora, sino también en Ja docente. El grupo GENTT (www-gentt.ujies) nacié en el seno del depar- tamento de traduccion y comunicacién de la Universitat Jaume Ten el afio 2000 y desde entonces ha desarrollado una intensa actividad investigadora en el émbito de las aplicaciones del concepto de géne- ro enel campo de la traduccién. Ademés, los resultados de los estu- dios obtenidos se han aplicado con diligencia desde el inicio en las clases de la titulacién de traduccién e interpretaciOn. Es decir, desde nuestras primeras investigaciones, la motivacién pedagégica se mantuvo implicita. El propésito fundamental del proyecto GENTT! 1 El proyecto Géneras texaales para la traduccién (GENT). Etiguetado de la ‘microestructura textual de un corpus multlingie comparable de los émbitos de especialidad ha sido financiado por el Ministerio de Ciencia y Tecnologia La implementacién del concepto de género textual en los corpus electrénicos para traductores ‘M* AMPARO ALCINA CAUDET — Universitat Jaume [ 1. Introduccién El concepto de género se muestra como un instrumento til en el estudio y la practica de la traduccién, de forma que el traductor pue- de apoyarse en la clasificacién en géneros para resolver problemas de traduecién. De abi que nos planteemos cémo las tecnologias pue~ den contribuir a facilitar el trabajo del traductor. En primer lugar, presentamos las caracteristicas principales de los corpus electréni- cos. A continuacién se muestra la especificidad de las necesidades del investigador en traductologia y del traductor profesional. Por ‘iltimo, nos centramos en el manejo de la clasificacién en géneros mediante las herramientas de gestién de corpus existentes. 2. El corpus lingiiistico electrénico Los corpus lingiisticos tienen su origen en el interés por investigar el lenguaje desde un punto de vista empirico. Abordar et estudio del Ienguaje desde este punto de vista motivé que algunos investigado- res se plantearan la necesidad de probar sus hipétesis 0 las de sus antecesores sobre textos y manifestaciones reales de los hablantes, ‘en lugar de atender a sus propias intuiciones inevitablemente subje- ea ‘M:Amparo Alcina Caudet tivas. Asi pues, los corpus nacen con un propésito de investigacion lingiistica, y con el tiempo se ha ido mostrando su utilidad concreta en Ambitos como la lexicografia, la terminologfa, la traduccién, la traduccién automética, la traduccién asistida, por nombrar los que nos resultan més afines (McEnery y Wilson, 1996). Los corpus lingitisticos constituyen un objeto de estudio para probar hipétesis en el dmbito de la investigacién, pero también constituyen una fuen- te de datos de gran valor que se puede wtilizar puntual o sistematica- mente en el enforno de las profesiones relacionadas con las lenguas, como la traduccién. Desde los inicios de los corpus en los afios sesenta, se pueden distinguir distintas etapas 0 generaciones que de un modo u otro van ala par del aumento de la potencia de procesamiento y capacidad de almacenamiento de los ordenadores (Sanchez y otros, 1995:14-20) La aparicién y desarrollo de los corpus ha dado lugar a mucha bi- bliografia sobre la definicién de corpus, sus caracteristicas y los fun- damentos para su creacién y desarrollo (McEnery y Wilson, 1996; Kennedy, 1998). Podemos decir que un corpus es una coleccién de textos seleccionados segin criterios previamente establecidos con el fin de extraer datos objetivos y generalizables sobre el funciona- miento de una lengua. Las caracteristicas que se atribuyen a los cor- pus son que debe ser amplio, representativo y sistematizado. A pe- sar de que nace con el objetivo de ser una muestra fiel y a escala de la lengua real, sabemos que su fiabilidad es relativa, ya que no pode- ‘mos tomar todas las manifestaciones reales de una lengua sino una representacién, y que tiene cariicter temporal, es decir, se refiere a un periodo concreto de la lengua. Por ello, los critetios sobre la ela- ‘boracion de corpus han de ajustarse siempre al objetivo de aquello que se desea investigar o analizar (Alcina Caudet, 2001), El desarrollo de corpus electrénicos ha sido espectacular en las liltimas décadas. Existen numerosos corpus electrénicos, aunque sus caracteristicas y modo de acceso son muy diversos. Entre las carac- teristicas que hay que tener en cuenta a la hora de describir un cor- us esta ‘La implementacin del concepto de género textual 95 — Lenguas implicadas. Molingie, bilingiie o multilingile. Si contie- ne textos en dos o mas lenguas, hay que distinguir cudl es la rela- ‘cién entre los textos, y si se trate de textos comparables 0 parale- los, si son textos originales o traducciones. _ El tamaiio del corpus y si es abierto 0 cerrado, Normalmente el tamaiio del corpus se mide en nlimero de palabras. Actualmente, Jos corpus llegan a tener millones de palabras (e1 corpus BNC supera los cien millones). Al iniciar la elaboracién del corpus se puede establecer los criterios de seleccién de textos y el tamafio, de modo que al alcanzar e1 niamere de palabras deseado se cierra el corpus. En cambio, en otros proyectos, especialmente lexico- grificos, el corpus se alimenta continuamente de nuevos textos (McEnery y Wilson, 1996). No obstante, el tamafio no deberia medirse exclusivamente en niimero de palabras, también impor- ta: el namero de textos de diferentes tipos, el nimero de muestras ‘de cada textos y el niimero de palabras en cada muestra (Biber y otros, 1998). - — Tipo de textos que incluye. Por ejemplo, si incluye textos de tipo general (BNC), si son textos literarios (PDL), textos orales transcritos, ete. | — Corpus textual o corpus de referencia, dependiendo de si contie- ne textos completos o fragmentos de textos (Alvar Ezquerra y Corpas Pastor, 1994). En el caso de que contengan s6lo fragmen- tos de textos ha de establecerse ta cantidad de palabras que se tomardn de cada texto y como se escogerdn las partes. Por ejem- plo, el corpus BNC toma articulos de revistas completos, pero de los textos escritos de mas de 45.000 palabras escoge partes que no excedan de esa cantidad. ; = Corpus crudo 0 etiquetado. Puede tratarse de una coleccion de textos que contiene simplemente la cadena de caracteres que for- man parte de los textos originales, o bien haber sido enriquecidos con informacién lingiistica en distintos niveles (documental, tex- tual, morfolégica, sintactica, etc.) mediante el uso de etiquetas. — El modo de acceso a los corpus es también variado. Algunos cof- pus se publican en forma impresa impidiendo las ventajas que 96 ‘M:Amparo Alcina Caude, implica su tratamiento infornstico. Naturaimente, fos que nos i teresa ag on los corpus electrénicos, es decir, aquellos que han Ios praafonnados a un formato susceptible de ser maneiado por los ps eramos iforios {machine-readable form). Entre es. : inéditos: se Sesion concreta y se han desert ena MPloneeh ae ee accesibfes piblicamente, Otros, en cambi publica y se 3. Aspectos tecnoldgicos del desarrotio de fos corpus Durante las distintas etapas en que se ha impulsado la invest igacion 6 i 6 ¥ creacién de corpus, se ha ido perfeccionando las estrate y tée- creacién IS, Se hai lo las estrategias y téc. fat sus propios corpus En el ambito de la recopilacién de textos podemos citar e srama System Quirk o el programa Gentt (Fennings, 2003), En cuanto al almacenamiento de textos ha intereaady perf nar el formato de almacenamiento de los textos de form ue eaten redan contener la informacién necesaria para ser veneer | pro- 97 La implementacién del concepto de género textual procesados conforme a las necesidades del investigador o usuario. Tras diversos formatos de codificacién de los datos metalingiisticos (entire fos que destacé ef formato COCOA), ha sido el formato SGML el que se ha convertido en un estandar, que en la actualidad ha evolu- cionado hacia el lenguaje XML, mucho més flexible y rico a Ja hora de representar los datos. Los distintos niveles de etiquetado que se pueden dar en los corpus y sus formas de anotacién se pueden rastrear enlabibtiografia (Hockey, 2000; Garside otros, {997; Magan Mutoz, 1996; Martin de Santa Olalla Sanchez, 1999; Pérez Guerra, 1999). Los procedimientos de anotacién de textos al nivel de la palabra contemplan dos tipos de procesos: la consulta a un diccionario de formas o el entrenamiento del programa a partir de corpus etiqueta- dos y de los que se extrae informacién de forma heuristica Para la explotacién de los datos del corpus se cuenta con los Mamados programas de concordancias, aunque su funcién excede de ta exiracci6n de concordancias y por ello preferimos Ilamarlos programas de andlisis de corpus. Como ejemplos de este tipo de programas podemos citar: — WordSmith (Scott, 1997; Berber Sardinha, 1999) — MonoCone (Barlow, 1996) = MicroConcord — CorpusBench (Bergenholtz y Tarp, 1995: 36) — Excerper (Bergenholtz y Tarp, 1995: 36) — KonTfext (descrito muy brevemente en Ahmad, 2001) — Tact (Pérez Guerra, 199) Entre las funciones que permiten algunos de estos programas tene- mos estén: ~ indices de palabras y clisters (listados de palabras de una en una, de dos en dos, etc.) — Obtencién de los contextos (concordancias) de una determinada palabra o expresién — Frecuencias absolutas y relativas de palabras (tokens) y formas distintas de palabras (types) oe (M: Amparo Alcina Caudet — Anélisis estadisticos, como informaciéa mutua —que mide la proba- bilidad condicional y sirve para la obtencién de colocaciones-, t-score 0 t-test que mide la diferencia entre los contextos de dos palabras distintas y sirve por ejemplo para estudiar posibles dife- rencias entre el uso de casi sinénimos = Extraccién de candidatos a términos o palabras clave — Alineacién de textos con su traduccién La gestion de corpus con programas informéticos exige la creacién de gran cantidad de recursos electrénicos para poder aprovechar real- ‘mente los datos que contiene el corpus. Por una parte, para que los etiquetadores morfol6gicos, sintacticos o lematizadores sean capaces de asignar una etiqueta a cada palabra 0 expresi6n del texto con- forme lo leen, es necesario que dispongan de enormes listados de palabras asociadas con su etiqueta correspondiente. Para algunas ‘enguas, es posible encontrar estos diccionarios ya desarrollados incluso estin disponibles gratuitamente en Internet, pero no para todas. Ademas, no siempre los recursos disponibles se ajustan al tipo de necesidades que requiere una determinada investigacién, bien porque se parte de teorias lingiisticas distintas bien porque lo que se desea investigar no esté contemplado en el etiquetario disponible. Por otra parte, incluso en la gestién de corpus sencilios se re- quiere otro tipo de recursos para aprovechar realmente el potencial del programa informético. Asi, por ejemplo, el uso de WordSmith permite contabilizar las ocurrencias de cada palabra distinta, pero para poder calcular las ocurrencias de cada lema seria necesario crear un fichero de lemas que desarrollara para cada lema todas sus for- ‘mas posibles en la lengua. Al igual que en el caso anterior, podemos encontrar recursos ya preparados y listos para usar en algunas len- ‘guas pero no en otras. También conviene disponer de listados de palabras gramaticales que funcionen como palabras excluidas. En ocasiones, sin embargo, los paquetes de concordancias y es- tadisticas no pueden realizar el tipo de célculos que necesitamos para nuestra investigacién y se requiere crear programas especificos para la explotacién del corpus. Las principales ventajas de escribir La implementacién del concepto de género textual 99 mas propios son 1) Ilevar a cabo andlisis que no son posibles aay Srcordanias 2) poder hacer varios anilisis si- multéneamente de forma mas répida y segura; y 3) aumentar la rapi- idez y la seguridad (Biber y otros, 1998). Los investigadores han utilizado y recomiendan diversos lenguajes de programacién para el anilisis de corpus: Biber indica el uso de Pascal y C (Biber y otros, 1998); Mason describe el uso de Java en lingiistica de corpus (Mason, 2000). 4, Algunos corpus electrénicos disponibles en linea El corpus CREA de la Real Academia Espatiola de la Lengua () permite la basqueda de formas (permitiendo el acceso ‘a concordancias y al texto completo) seleccionando los textos me- diante los siguientes criterios: Medio: libros, periddicos, revistas, miscelénea y orales Autor del texto ‘Obra: indicando el titulo de la obra en la que se desea buscar una palabra 0 expresion . _ Criterio cronolégico: permite la seleccién de un afio concreto 0 bien del periodo comprendido entre dos fechas ; Criterio tematico: permite seleccionar una o varias éreas temati- cas y/o temas de entre una lista Criterio geogrifico: es posible escoger los textos que pertenecen a uno 0 varios paises origen El corpus PDL (), desarrollado por cl Institut d’Estudis, Catalans, contiene dos subcorpus: literati y no literario, en los que se puede hacer bisquedas de manera indepen- diente, Permite restringit las bisquedas de formas o lemas (por ejem- plo, se pueden buscar todas las formas conjugadas de un determina~ do verbo introduciendo como lema su forma en infinitivo) 0 100 ‘M Amparo Alcina Couder escogiendo el autor, el intervalo de fechas de las obras, elt Mi \ el titulo de obra y también especificar si la bitsqueda queremos hacerla en ef Corpus Jiterario o em ef no iterario. Elcorpus BNC (British National Corpus, ) contiene textos en inglés brténico procedentes de diversos tipos de fuentes (prensa, revistas especializadas, libros académicos, informes). Se puede hacer distintos tipos de consulta y sonal dispone de un programa propio, SARA, que permite una gtan flexibilidad en las consultas del corpu ‘i an epUs, que estd etiquetado en El acceso a los corpus CREA y PDL. no exige el pago del servi- cio. En cambio, el acceso completo a BNC exige la adquisicién o fa suscripcién previo pago. No obstante, también es posible «| acceso al corpus BNC en linea en version demostracién. La limitacién de la Version demostracién es que los resultados que ofrece no se refieren 4 todo el corpus, sino a una parte 5. Los corpus lingiiisticos y la traduccién Los corpus lingitisticos electrénicos estén resultando de gran interés {anto para la investigacién en traductologia como en la prictica pro- fesional de la traduccién, En relacién con el estudio de la traduc- cin, Baker introduce el estudio de la traduccién a partir del andlisis, de corpus hacia 1993 (Baker, 1993), Esta autora propugna que el anilisis de grandes cantidades de textos traducidos puede ayudar- 0s a comprender {a naturaleza misma de la traduccién, sus caracte- risticas especificas en relacién con los textos originales. Este punto de vista ha dado lugar a andlisis de distintos fendmenos como la explicitacién (Olohan y Baker, 2001) y muchos otros (véase por ejemplo 1a recopilacién de trabajos sobre corpus paralelos en el li- bro de Johansson y Oksefjell (Johansson y Okseffell, 1998)), Tam. bién se ha investigado sobre Ja seleccidn de textos 0 el uso de cor. ‘La implementactén del concepto de género textual 101 pus en traduccién (Bowker, 1998). Todos ellos han contribuido de forma relevante en ef estudio empirico de la traduccién. Otro de los puntos de contacto entre corpus lingiiistico y tra- duccién es la aplicacién que éstos han tenido en la traduccién au- tomética y taduccién asistida. En 1991, Brown y sus diseipulos anunciaban la utilidad de los corpus en la traduccién automatica (Brown y otros, 1990), enfoque que dio lugar mas adelante a los programas de gestion de memorias de traduccién. En este émbito resulta de gran interés la investigacién sobre nuevas técnicas y es- trategias para la segmentacién de textos y su alineacién bilingle 0 multilingiie (Véronis, 2000; Yzaguirre y otros, 2003). Asi, Jos pro- gramas de traduccién automética basada en corpus requieren el desarrollo de grandes corpus textuales multilingties, Por otra parte, los programas de traduccién asistida, tan extendidos y utilizados actuatmente por traductores, almacenan textos originales y sus tra- ducciones (bien sea como segmentos alineados o como segmentos indizados) en bases de datos que reciben el nombre de memorias de traduccibn. Estas memorias de traduccién son, de algin modo, una forma especial de corpus multilingiie alineado, Gracias al de- sarrollo de TMX, el formato estindar de intercambio de datos en memorias de traduccién, estas memorias pueden ahora intercam- biarse entre distintos programas de traduccién asistida. Existen al- gunas experiencias que intentan promover el intercambio y uso de estas memorias y otros recursos a través de Internet como el pro- ecto TuMatXa (http:/www.tumatxa.com/), En el ambito de la traduccién profesional, una practica que va tomando fuerza entre los traductotes es el uso de corpus para docu- mentar y comprender el uso de palabras, términos o expresiones en la lengua origen o bien para conocer las connotaciones o el uso de expresiones en la Iengua meta. Los textos paralelos se han utilizado en traduccién para: a) documentarse sobre un area de conocimiento un tema concreto sobre el que versa el texto que ha de traducirse; ’) para la comprensién de la terminologia del texto origen 0 su uso correcto en ¢] texto meta; c) como modelos de texto (Gamero Pérez, 1999: 143). 102 MeAmparo Alcina Coudet La recopilacién de estos textos paralelos en corpus electrénicos facilita enormemente la tarea del traductor. En relacién con la préc- tica de la traduccion, 10s corpus textuales facilitan al traductor la tarea de documentarse sobre la terminologia, ya que los corpus y las, herramientas de andlisis textual le permiten la extraccién de concor- dancias a través de las cuales puede indagar el significado de un término presente en el texto origen, o familiarizarse con el uso de un determinado término en la lengua meta (Marco Borillo, 2003). Tam- bién se ha defendido (Sanchez-Gijén, 2003), que los corpus de tex- tos pueden facilitar al traductor el acceso a los conocimientos temati- cos. Efectivamente, gran parte de los corpus actualmente disponibles en formato digital permiten bisquedas restringidas a un determina- do ambito temitica (véase, por ejemplo, los ya mencionados CREA yPDL), El uso de corpus entre los traductores se muestra por tanto como tuna herramienta itil y muchos investigadores describen distintas formas de uso tanto en la préctica de la profesién como en Ia forma- cién de traductores (Bowker, 1998; Lopez Chollet, 2001; Vargas Sierra, 2002; ¥zaguirre y otros, 2001; Zanettin, 1998; Alcina Caudet y Prufionosa Tomis, 1992). 6. Algunos corpus lingiiisticos para traductores En los iltimos afios se han desarrollado algunos corpus especifica- mente orientados a ofrecer apoyo al traductor. Esta orientacién ha- cia la traduccién se concreta por ejemplo en el caracter multilingtie del corpus, la distincién entre textos traducidos y ori propio corpus, o la importancia que se da al tipo de documento o al género textual. Un ejemplo de ello es el corpus técnico BwanaNet del Institut de Lingiiistica Aplicada (). El corpus BwanaNet es multilingiie (contiene textos en tres len- La implementacién del concepto de género textual 103 as: inglés, castellano ¥ catalén) y sus textos son de cardcter técni- sobre diversas mateias (informatica, medioambiente, derecho, ‘economia, medicina). A las tradicionales bisquedas que permiten Jos corpus lingiifsticos (basquedas restringidas por ambito temati- 0, obtencién de frecuencias y concordancias, consultas por lema © forma), se afiade ia posibilidad de mostrar textos paralelos (véase Figura 1). También permite restringir las biasquedas a textos origi- nales o traducciones y hacer biisquedas especificando el tipo de do- cumento (profesional, juridico, teérico). 5. Resultados: concordancias ane Cpr Ten Migs Dena En el corpus GENTT, desarrollado por el grupo Gestt de la Univer- sitat Jaume I, se han incorporado también textos pertenecientes a distintos géneros textuales de los ambitos juridico, médico y técni- co. A las caracteristicas generales de un corpus lingiiistico, podemnos 104 M:Amparo Alcina Caudet destacar en primer lugar la importancia que se da al género textual como criterio clasificador del corpus. En segundo lugar, destaca la posibilidad que ofrece de ver el texto completo tal cual aparece en el formato impreso. Se considera que el traductor necesita, ademas de] conocimiento lingiistico, el conocimiento de convenciones tipogri- ficas y de disposicién y distribucién del texto en el papel, y por ello se incorpora al corpus no sélo el texto crudo y sus etiquetas, sino también la imagen visual del texto, en formato PDF. Actualmente, en la Universidad de Malaga se desarrolla tam- bién un corpus desde el punto de vista de la traduccién, TURICOR, en el que se recopitan textos del género especifico de los contratos turisticos (Aguayo Maldonado y otros, 2004 y Pagina web de Turicor ), 7. El género textual en los corpus lingiiisticos Alo largo de las paginas de este volumen se ha defendido la impor- tancia que tiene para el traductor conocer las convenciones de los, distintos géneros textuales en las lenguas con las que trabaja. No insistiremos por tanto en esta cuestién, sino en el hecho de que al plantear la creacién de un corpus lingtifstico ¢lectrénico para traduc- tores debemos abordar cémo formalizar el concepto de género tex- tual de modo que se puedan hacer consultas utilizando este criterio. Desde la traductologia y las tecnologias de la traduccion parece necesario proporcionar modelos de corpus textuales que cubran no s6lo las expectativas de informacién léxica y contextual, sino tam- bién las teméticas y de género textual de forma que den lugar a implementaciones de corpus lingtiisticos utiles desde el punto de vista de la traduccién. Ademés, una vez probada la metodologia ‘empleada en la elaboracidn de estos corpus, tendremos la experien- cia necesaria para ofrecer al traductor técnicas y pautas para elabo- rar sus corpus ad hoc y pasar a compartirlos con otros traductores. La implementacién del concepto de géner textual 105 ‘A continuacién presentamos cémo se puede implementar el con- cepto de género en algunas de las herramientas disponibles para tra uctores, de forma que queden adaptadas para trabajar utilizando el género textual como criterio de clasficacion de los textos y bisque- das restringidas. 8. Explotar el concepto de género con las tecnologias actuales A continuacién veremos algunas estrategias para gestionar corpus Y memorias de traduccién utilizando el género textual como criterio de seleccién de textos y bisqueda de dates. En concreto, veremos qué posibilidades nos ofrecen los programas Virtual Corpus Mana- ger de System Quirk, WordSmith y Workbench. Virtual Corpus Manager es una herramienta incorporada en el programa de ingenieria lingiiistica System Quirk, desarrollada bajo la direccién de Khurshid Ahmad en la Universidad de Surrey. Esta herramienta de Corpus Virtual permite el almacenamiento y recupe~ racién de textos y la navegacion por el corpus. Cuando se guardan ‘en el corpus virtual, los textos se incorporan con la indicacién de ‘una serie de atributos y valores que corresponden a distintas catego- rias de datos (texto, autor, publicacién, lengua, dominio, estatus del copyright o textos relacionados). Los valores de los atributos asig nados a los textos permiten identificarlos y organizarlos segim tas, necesidades del usuario y utilizando distintos perfiles. Asi, se puc- den organizar los textos jerarquicamente por lengua, dominio, ete ‘Ademas, el usuario puede definir la organizacién o atributos que ‘desea implementar en el sistema. Sin embargo, la clasificacion esté limitada (al menos en la version 2.1 disponible a través de Internet) ‘a unos pacos valores. Por ejemplo, el atributo “text type’ ofrece la posibilidad de los valores *advertisement’, ‘newspaper’, “book’, journal’, ‘tech manual’ (véase Figura 2). 107 ‘osaup8 je stuasajaz etanbya woo opezaqeous a€njout anb nso “€ bundy. [(] (s9r22008@) ugros0a wpa eepeayenss eeeopTs (19) sepeateue> 0 (non) ser fwarun UoTs90a oun v aaaHoe Ze sopeaTeRse jpeateuse ou 196 Uapand seoTUPIED eeEopTOG sor” 'uptenbox aopepaydoxd sey stqeace Je2opze uo ueratnbpe nb exed sauayorgne wansesedues © FepTIO 5 sepEIes Hog sausmepTnbss A wesprou 35 ‘CbeseuD 0/6 ¥OToEINI TOM w UaDztE as onb ‘euoTupDIOuT Sourzd s0}2030u 66220 A eeTT}OIE ap eaUotsyeodwon ap zyazed © UEDTIGT 7 seopared 4 sotans 9p owvermragaAe2 ered sepezsrran saemTeaauad rosade> oood =p seautd wos eestupIza cusopTed se7<0230> <1 /pewsyupaee sesopsee eet 9p wyBoTodyL pesy/> -caab /sooyzyqueyo-azecus6> ‘Mé Amparo Alcina Caudet La implementacién del concepto de género textual 106 a cor gestion Virtual Corpus [CAquikk21b2\corpus\lo7GTe fm : a 5 g g 5 : 5 5 z é& 5 & é 8 de corpus més completo. Ha sido desarrotiado por Mike Scott y pu- blicado por la Universidad de Oxford. El programa gestiona ‘mos introducir en los textos informacién relativa al género textual debidamente codificada con etiquetas, En el texto de la ilustracién (Figura 3) se muestra un texto en cuyo encabezado, delimitado las etiquetas de inicio y de fin , se ha introducido la informacién referente al género articulo cientifico: art, cienti- crudo y también corpus etiquetado en un nivel sencillo. Asi, pode- fico=/gen>. El programa WordSmith es probablemente el programa de Figura 2 108 ‘MéAmparo Alcina Caudet La codificacién de los textos con estas etiquetas nos permitiré res- sringir las consultas que queramos realizar en el corpus (frecuen- cias, concordancias simples 0 complejas, etc.) a los textos de un, determinado género. Para que el programa pueda procesar adecuadamente las etique- tas contenidas en el encabezado, en primer lugar es necesario indi- car qué parte del texto corresponde a etiquetas del encabezado y por tanto no deben ser procesadas en el texto, En WordSmith esto se indica en el apartado ‘Sections to Cut’, en la que especificaremos que desde el principio del fichero y hasta la etiqueta de fin de enca- bezado ‘’, tal como se muestra en fa ilustracién (Figura 4). W a implementacién del concepto de género textual 109 ejemplo, en la ilustracida que se muestra a continuacién (Figura 5) se ha especificado que sGlo se procesen los textos que contengan la expresin “divulgativo”. [Oustat of ach inepar (OTE ® craracers” [Sections to ct steting at [ator 3] evdiogwin: [hea >], F petra aes 6 Ger ‘Starting at. [ =I ‘i ing wit Figura 4. Ventana del programa WordSmith que permite i car las etiquetas usadas en el corpus. ‘Ademés, antes de realizar cada consulta indicaremos fas condicio- nies que debe cumplir un texto para ser utilizado en la consulta. Por Figura 5, Ventana del programa WordSinith indicando crterios de seleccién de textos basada en etiquetas. El programa de traduccién asistida Workbench, de Trados, gestiona la segmentacion del texto origen y su almacenamiento junto al seg- mento meta en la memoria de traduccién. Ademds, este programa permite almacenar junto a cada unidad de traduccién, informacién relativa al proyecto de traduccién. £1 usuario puede establecer la informacion que desea almacenar en una memoria de traduccién y configurar cada proyecto para que cada unidad contenga los datos identificativos del proyecto. En la siguiente ilustracion puede verse la ventana en Ia que se escogen los valores que se va a dar a cada ‘ano de fos campos de fa memoria. 110 ‘M: Amparo Alcina Caudet , | Espatiol (Costa Rica) satel eva) Area geomifica LM: Expafal spat Aca geotcs LO: Ins todos rio) | Atea tematica: Tecnologia || Tema: Quimica Figura 6. Ventana del programa Workbench de Trados, indicando configuracién del proyecto de traduccién, La implementacién del concepto de género textual mM. Una vez los textos y sus traducciones se incorporan a la memoria de traduccién con la informacién metalingtiistica correspondiente, tam- bién pueden ser recuperados utilizando criterios de bissqueda que restrinjan las unidades de traduccién o concordancias que se deseen obtener. 9. Conclusiones Los corpus electrénicos y los programas que los gestionan constitu- yen herramientas muy dtiles en ingenierfa lingiistica tanto en la i vestigacion como en el ambito profesional. Estas herramientas han comenzado a ser utilizadas también en traductologia y traduccién, pero dada la naturaleza especifica de estas actividades se requiere el estudio y adaptacién de los corpus tradicionales para obtener un rendimiento adecuado. En este trabajo hemos podido apreciar las diferencias que implica la traduccién y las posibilidades actuales de adaptar las herramientas actuales a las necesidades del traductor. ‘También hemos podido comprobar la necesidad de que se desarro- llen herramientas més especificas para estos fines. Bibliografia [AGUAYO MALDONADO, A.;J-L. CARO HERRERO; G. ConPas PASTOR; ILM. Gomez GaLLeGoy A.J. Guevara Plaza (2004): “TuriCor: Un modelo de det0s para slmacenamiento y consulta de un compis muiinge” en A. Aguayo Maldonado, J.L. Caro Herteo, :M. Gomez Gallego y A.J. Guevara Plaza (ed. TURITEC 2004, V Congreso Nacional Turismo y Teonlogias dela In- formacisn y las Comunicaciones, Mélaga, Universidad de Mélaga/ Escuela Universitaria de Turismo, 327-344 [AHMAD, KHURSHID (2001): “The Role of Specialist Terminology Management in ‘Artificial Intelligence and Knowledge Acquistion” en Wricitr, SUE Exzeny 112 M-Amparo Alcina Caudes GeRHARD BuDIN (eds.): Handbook of Terminology Management, Philadelphia: John Benjamins, 809-844. ALCINA CAUDET, M* AMPARO (2001): “Automatizacin de tareas en la elabora- ‘ign de un diccionario terminologico” en CABRE, M.T; LL. CODINA y R ESTOPA (eds: ferminologia i Documentacid, Barcelona, Institut Univeritar de Lingtistica Aplicada. Universitat Pompeu Fabra, 5139, — ¥ MANUEL PRUNONOSA ToMAs (1992): “Uso del ordenador para el estudio {erminolégico previo a a traduccién de un texto” en EDO JULIA, MIQUEL (ed, Actes del I Congrés Internactonal sobre Traduccis, Bellaterra, Universitat ‘Auténoma de Barcelona, 103-112. ‘Auvak EZQUERRA, MANUEL y GLORIA CORPAS PASTOR (1994): “Criteios de di- sefo para la creaciGn de cépora” en ALVAR EZQUERRA, MANUEL y JUAN ANDRES VILLENA PONSODA (eds. Estudios para un corpus del espaol, Milaga, Universidad de Malaga, 31-40, BAKER, MONA (1993): “Corpus Linguistics and Translation Studies. Implications and Applications” en BAKER, M.;G, FRANCIS yE, TOGNINI-BONELLI (eds) Text and Technology: in Honour of John Sinclair, Arasterdam/ Philadelphia. Johin Benjamins, 233-250, BARLOW, MICHAEL (1996): ManoCane or Windows, Manual, Houston: Athelstan, ‘BERBER SARDINHA, TONY (1999): “Usando WordSmith Tools na investigagio da linguagem”, DIRECT Papers, 40, BERGENHOLTZ, HENNING y SVEN TaRP (1995); Manual of Specialised Lexico- ‘graphy: The Preparation of Specialised Dictionaries, Atnsterdam, The Nether lands, John Benjamins Publishing Company. BIBER, DOUGLAS; SUSAN CONRAD y RaNDI REPPEN (eds,) (1998): Corpus linguis- tics investigating language structure and use, Cambridge, Cambridge University Press, BOWKER, LYNNE (1998): “Using Specialized Monolingual Native-Language Cor- ora asa Translation Resource: A Pilot Study”, Meta, 43: 4, 631-651 BROWN, P.; J. COCKE; S, DELLA PIETRA; V.J. DELLA PIETRA; F. JELINEK; D.J. LAFRERTY; R.L. MERCER y P.S. ROOSING (1990): “A statistical approach to ‘machine translation”, Computational Linguistics, 16, 79-85, (GAMERO PEREZ, SILVIA y AMPARO HURTADO ALBIR (1999) “La raduccn técnica ¥-cientifica” en HURTADO ALBIR, AMPARO (ed.): Ensefiar a traducir. Metodo- logia en la formacién de traductores e intérpretes, Madtid, Edelsa, 139-133, GaRsiDE, ROGER; GEOFFREY LEECH y ANTONY MCENERY (eds,)(1997): Corpus Annotation: Linguistic Information from Computer Text Corpora, Essex, Longman. HOCKEY, SUSAN (2000): Electronic Texts in the Humanities, Oxford, Oxford University Press, JENNINGS, STEPHEN (2003): The Development ofa Software Tool for Corpus Com pifation and Classification: A Practical Application inthe Context ofthe Gentt La implementacin del concepto de género textual 113 Project, Dept. Traduecié i Comunicacié, Universitat Jaume I de Castello, Tra- taj de investizacion JOUANSSON, S. y S. OKSEFIELL (1998): Corpora and crosslinguistic Research Theory, Method, and Case Studies, Amsterdam, Rodopi KENNEDY, GRAEME D. (1998): An Inroduction o Corpus Linguistics, London, Longman LOPE? CHOLLET, Mania SE (2001): “Uilizacién de conus en a frmacin el traductor”en VALERO GARCES, CARMEN y ISABEL DE LA CRUZ CABANILLAS (eds): Traduceién y nuevas tecnologias. Herramientas uxiiares del trace- sev, Alcalé de Henares, Universidad de Alealé, 317-325 MAGAN MuRO7, F. (1996): “Estindares de repesentacin da informaci6n textual ‘© multimedia" en GOMEZ GUINOVART, J-y A.M, LORENZ SUAREZ (eds } Lingiiistica € informética, Santiago de Compostela, Torculo Ediciéns, 153— 186. "Manco BORILLO, Jose (2003); “Concordances, discordances? Qué pot aportar la lingistca de corpus la ddactca de la traducci literati" en VII Jornades de Traduccié a Vie. Inerictes. dpropant la pedagogia de la traduccis | de les engiles estrangeres, Vie. MARTIN DE SANTA OLALLA SANCHEZ, AURORA (1999) “Una propuesta de codi- ficacién morfosintéctica para corpus de referencia en lengua espafla”, Est dios de Lingistca Espafola, 3. Tambien disponible en Mason, OLIVER (2000); Programming for Corpus Linguistics. How to Do Text ‘Analysis with Java, Edinburgh Textbooks in Empirical Linguistics, Edinburgh, Edinburgh University Press. Moevenv, Ty A. WICSON (1996): Corps Linguistics, Edinburgh, Edinburgh University Press. Lonny MAEVE y MONA BAKER (2001: El usode ha en textos raids en inglés: la explicitacion como proceso cognitivo en traduccion” en VALERO GARCES, CARMEN € ISABEL DE LA CRUZ CABANILLAS (eds): Traduccién y ruevas conologias. Herramientas auxiliares de traductor, Alcaté de Henares, Universidad de Aicaté, 7-101 PEREZ GUERRA, JAVIER (1999) “Estindares de anotacin en linglistica de cor pus”, Revista Espafola de Lingiistica Aplicada (RESLA), Volumen mono- ‘rifico; Panorama de la investigacin en lingistca informatica, 25-52. SANCHEZ, AQUILINO; RAMON SARMIENTO; PASCUAL CANTOS y JOSE SIMON (eds.) (1995): Cumbre: corpus lingiistico del espa! contempordneo. Fundamentos, ‘metodologia y aplicaciones, Madrid, SGEL, SANcHEZ-GHON, PILAR (2003) Els documents digitals espciaizats:uilitzaci de la lingbfstica de corpus com a font de recursos pera la tradusciéexpeciae litzada, Departament de Traduceid i Interpretacis, Universitat Auténoma de Barcelona 14 Me Amparo Alcina Caudet SCOTT, MikE (1997): “PC Analysis of key words ~ and key key words”, System, 25: 2, 233-248. ‘VARGAS SIERRA, CHELO (2002): “Utilizacin de los programas de concordancias ‘en latraduccién especializada”, en El espatiol, lengua de traduccién, Actas del I congreso internacional, Almagro. YZAGUIRRE, LUIS DE; MARTA RIBAS; JORDI VIVALDI PALATRESI y M. TERESA ‘CABRE CASTELLVi (2001): “Alineacin automiética de traducciones: descrip- cin y usos en los Ambitos de Is profesién, de la docencia y de la investigacién ‘traductoldgica” en VALERO GARCES, CARMEN y ISABEL DE LA CRUZ CABA- NILLAS (eds.): Tradueci6n y nuevas tecnologias. Herramientas auxiliares del traductor, Alcalé de Henares, Universidad de Alcalé, 391-398. ZANETTIN, FEDERICO (1998): “Bilingual Comparable Corpora and the Training of Translators”, Meta, 43: 4, 616-630. Bloque Il. Algunas aplicaciones pedagdgicas

Anda mungkin juga menyukai