Anda di halaman 1dari 40

UNIDADES DE CONOCIMIENTO ESPECIALIZADO, CARACTERIZACIN

Y TIPOLOGA

M. Teresa Cabr Castellv (teresa.cabre@upf.edu)


Rosa Estop Bagot (rosa.estopa@upf.edu)

Resumen
En este informe nos proponemos analizar la nocin y tipologa de las Unidades
de Conocimiento Especializado (UCE) para establecer los parmetros
pertinentes para su clasificacin y determinar qu elementos son relevantes
para caracterizar las Unidades Terminolgicas (UT) y diferenciarlas de otros
tipos de UCE que aparecen con ellas en el discurso especializado. Nos
centramos en el mbito de Genmica, mbito que ha sido desarrollado
especficamente en este proyecto en forma de un recurso digital : la Base de
conocimiento GENOMA.
Para realizar completamente este trabajo nos proponemos tomar dos corpus de
datos: un corpus lexicogrfico especializado del que extraemos un corpus de UT
reconocidas como tales por los especialistas, y un corpus textual sobre
Genmica, incluido en el banco de textos de la Base de conocimiento GENOMA.
En este informe se trabaja nicamente el primer corpus de UT con la finalidad
de disponer de las estructuras ms representativas de las unidades de Genmica
reconocidas explcitamente por los expertos como unidades terminolgicas. El
corpus lexicogrfico de partida es el diccionario de KAUFMANN, U. y
BERGENHOLTZ, H. (1998) Diccionario enciclopdico de Ingeniera gentica. 2
vols. Toronto, Lugus Libros LatinAmerica Inc.

1. Conocimiento y discurso especializado


Muchos son los autores que se han ocupado de describir las caractersticas que
convergen en las situaciones que convenimos en denominar especializadas. Entre los
factores relevantes cabe destacar las condiciones del emisor, del receptor, de la
situacin, de la temtica y de la funcin comunicativa bsica.
Cada uno de los elementos anteriores requiere una breve precisin. De entrada hay que
aclarar que en general no se trata de que elementos de unas determinadas caractersticas
impongan a sus producciones la condicin de especializadas, aunque en algn caso la
correlacin sea ms que evidente, sino de constatar que en las situaciones comunicativas
que se reconocen externamente como especializadas los elementos que se dan en todo
esquema de comunicacin presentan caractersticas peculiares constantes.

El emisor o emisores son siempre de individuos con un conocimiento importante del


tema de comunicacin, conocimiento que por regla general han aprendido
conscientemente en una situacin explcita de aprendizaje. Este conocimiento es el que
asegura que un tema especializado sea tratado como tal, como veremos a continuacin.
El receptor o receptores de la comunicacin especializada son muy diversos y sera
absurdo intentar clasificarlos de manera precisa, pero existe una condicin que se da en
todos ellos: el hecho de tener expectativa de recibir informacin, de ser informados,
expectativa que no se da en otras situaciones comunicativas cuyo propsito general es
de otra ndole.
En relacin al conocimiento que se transmite, podemos decir que solo ser
especializado si se representa y se transmite respetando escrupulosamente la estructura
conceptual del campo en cuestin, ello significa que cada concepto de una disciplina
ser transmitido sin sobrepasar los lmites de sus caractersticas, y adems
salvaguardando las fronteras ntidas existentes entre los conceptos en el contexto de una
especialidad. La propiedad de precisin semntica de los trminos solo puede respetarse
en la comunicacin si quien comunica controla bien la estructura conceptual del mbito
(Cabr 2002b).
Este control conceptual, necesario para comunicar un conocimiento especializado,
condiciona y explica que en ese tipo de transmisin la funcin comunicativa primordial
sea la informativa y ello a pesar de que en un anlisis del texto puedan encontrarse
pistas de otras funciones.
Finalmente las situaciones en las que se produce y transmite conocimiento especializado
suelen ser profesionales, esencialmente producidas por expertos y dirigidas a un pblico
tambin experto o semi-experto. Una excepcin parece constituirla la comunicacin
cientfica o tcnica con intencin divulgativa, pero no es tal si observamos que la
transmisin de informacin especializada siempre cumple la condicin de ser el experto
o su mediador quien transmite el conocimiento con la finalidad constante de aumentar la
competencia especializada en una temtica del destinatario (en este caso el lego). En
estas situaciones, que no seran las ms significativas dentro del esquema de la
comunicacin especializada, el entorno situacional adquiere rasgos de profesional por
cuanto quien produce el conocimiento acta como un experto, aunque sea slo un
mediador actuando como un experto en la transmisin de formas adecuadas de
comunicacin segn las condiciones discursivas (Cabr 2002a).
Todo este conjunto de caractersticas permite diferenciar la comunicacin especializada
en general de otros tipos de comunicacin (ldica, literaria, emotiva, etc.) y encontrar en
los textos producidos caractersticas estructurales especficas.

2. Los textos especializados y su triple estructuracin


La observacin de los textos especializados (orales y escritos), considerados
especializados por las condiciones discursivas que los caracterizan, nos lleva a
establecer en ellos, siguiendo la propuesta de Cabr (2002b), por lo menos la
conjuncin de tres estructuras:

a) Una estructura formal, relacionada con el gnero textual de cada texto


b) Una estructura informativa, mejor denominada cognitiva, que representa el
conocimiento transmitido por el texto
c) Una estructura gramatical, conformada por la interrelacin de las distintas
estructuras lingsticas que conforman el texto.
Las tres estructuras que constituyen un texto estn ntimamente imbricadas entre s de
forma que la aparicin relevante de determinadas Unidades de Conocimiento
Especializado (UCE) o su mayor o menor concentracin depende de la estructura formal
y de la estructura cognitiva.
Cognitivamente, las Unidades Terminolgicas (UT) estn todas ellas relacionadas, ms
o menos explcitamente, ms o menos directamente, y se agrupan en conjuntos que
pueden ser secuenciales y no secuenciales. El conjunto de las UT y sus relaciones puede
representarse topogrficamente en forma de mapa cognitivo. El mapa de un texto
corresponde a su representacin cognitiva. El mapa consensuado sobre una materia
corresponde a la estructuracin general de un mbito especializado o a una escuela de
pensamiento o accin.
Finalmente la interrelacin entre el formato y la gramtica condiciona el tipo de
estructuras sintcticas, los marcadores, la mayor o menor densidad de lxico
especializado, etc.
Veamos a continuacin brevemente algunas caractersticas de las tres estructuras.
La estructura formal del texto, asociada al gnero textual al que pertenece, distribuye el
texto en partes relevantes que lo caracterizan como perteneciente a un tipo textual
determinado. As, un paper cientfico, por ejemplo, suele estar estructurado segn el
Convenio de Vancouver, que establecieron en 1978 un grupo de editores y que
actualmente apoya el Comit Internacional de Directores de Revistas Mdicas
(CIDRM), en los siguientes apartados (Junyent, 2003):
Ttulo
Autor o autores y organismo de referencia
Resumen
Introduccin o justificacin
Materiales y Mtodos
Resultados obtenidos
Discusin o conclusiones
Bibliografa
La estructura de conocimiento de una materia, as como la que presenta un texto
especializado, se podra representar como un mapa de estructuras de nodos y relaciones.
Los nodos pueden tener distinto alcance y de acuerdo con este criterio corresponder
lingsticamente a fragmentos textuales (por ejemplo las partes de un texto
perteneciente a un determinado gnero textual o un prrafo), a unidades lingsticas

oracionales, sintagmticas, lxicas o morfolgicas. Las unidades mnimas de un nodo


son las lxicas, aunque en determinadas materias las unidades morfolgicas marquen el
carcter especializado de estas unidades lxicas y constituyan por tanto el foco de su
valor especializado. En cada nodo mnimo pues figura una UCE de carcter lxico. Las
relaciones estn expresadas lingstica o topogrficamente.1
A partir de un fragmento de un texto especializado extrado de una revista mdica,
podemos observar representaciones de las UCE de distintos niveles con sus relaciones.
En la primera ilustracin hemos marcado con un crculo los nudos de conocimiento y
hemos subrayado las relaciones entre estos nudos. Constatamos adems que la relacin
entre fragmentos textuales se establece normalmente (aunque no exclusivamente) sobre
la base de los denominados marcadores textuales. La ilustracin 2 presenta la estructura
textual mnima de conocimiento y, en ella, podemos observar que los nodos estn
ocupados por unidades de conocimiento que corresponden a unidades del lxico. La
ltima ilustracin es una abstraccin del conocimiento que transmite el texto.
La Esclerosis Mltiple (EM) es una enfermedad del Sistema Nervioso Central (SNC) que afecta
de forma focal a la sustancia blanca. La lesin caracterstica consiste en una desmielinizacin
segmentaria de la sustancia blanca del SNC, asociada a un infiltrado inflamatorio perivascular en
las fases activas (o agudas) de la enfermedad. Si bien la causa de la enfermedad sigue siendo
desconocida, hay numerosos datos que indican que el sistema inmunolgico juega un papel
importante.

Este fragmento puede descomponerse en las siguientes proposiciones:


La Esclerosis Mltiple (EM) es una enfermedad del Sistema Nervioso Central (SNC)
(La Esclerosis Mltiple (EM)) afecta de forma focal a la sustancia blanca (del SNC)
La lesin caracterstica consiste en una desmielinizacin segmentaria de la sustancia blanca del
SNC
(La desmielinizacin segmentaria de la sustancia blanca del SNC) (est) asociada a un infiltrado
inflamatorio perivascular en las fases activas (o agudas) de la enfermedad
La causa de la enfermedad sigue siendo desconocida
Hay numerosos datos que indican que el sistema inmunolgico juega un papel importante en (la
causa de la enfermedad desconocida)

Para profundizar en este punto, vase Cabr (2002b).

La representacin conceptual general de este fragmento teniendo en cuenta todas las


informaciones del texto podra representarse:

La Esclerosis Mltiple (EM)

es una

enfermedad del Sistema Nerviosos Central (SNC)

que afecta de forma focal a la sustancia blanca. La lesin caracterstica

demielinizacin segmentaria de la sustancia blanca del SNC,

consiste en una

asociada a un

infiltrado inflamatorio perivascular en las fases activas (o agudas) de la enfermedad.

Si bien la

causa de la enfermedad

indican que el

sigue

desconocida,

hay numerosos datos que

sistema inmunolgico juega un papel importante.

Ilustracin 1

Esta representacin, si prescindimos de los datos no esenciales para la caracterizacin


del objeto esclerosis mltiple, podra reducirse:

(5) desconocida

(2) enfermedad del

(5) sistema
immunolgico

Sistema Nervioso
Central (SNC)

relacionada con

causa

es

(1) Esclerosis
Mltiple (EM)
(3) substancia

la lesin consiste en

afecta

blanca.

(4) desmielinizacin
segmentaria de la substancia
blanca del SNC

(4) infiltrado inflamatorio


perivascular en las fases activas
(o agudas) de la enfermedad

asociada a

Ilustracin 2
En esta representacin reducida pueden observarse que la informacin se organiza en
torno a distintas clases de informacin, clases que corresponden a diferentes aspectos (o
dimensiones) del objeto conceptual esclerosis mltiple como se muestra en la
ilustracin 3:

(2) Clasificacin

Est asociada a una

Se produce en

(3) Localizacin
anatmica

(5) Etiologa
(1) enfermedad

Est causada por

Se manifiesta con

(4) Patogenia

Ilustracin 3

Pero si de este fragmento de texto extraemos, no todos los conocimientos que el texto
transmite, sino solo los conceptos esenciales en los que se basa el conocimiento sobre el
objeto esclerosis mltiple (EM), nos damos cuenta que estos conceptos forman parte de
la estructura bsica del objeto conceptual esclerosis mltiple. Se observa tambin que
adems todos los conceptos coinciden con unidades terminolgicas:
Conceptos especficos clave
Sistema nervioso central (SNC)
Sustancia blanca
Desmielinizacin segmentaria
Infiltrado perivascular
Conceptos genricos
Lesin
Fase activa o aguda
Enfermedad
Sistema inmunolgico
Los conceptos clave representados como nodos de conocimiento se relacionan de la
siguiente manera (en donde LOC significa una relacin de locativa, PART una relacin
partitiva i CAUSA una relacin de causa-efecto):

esclerosis mltiple (EM)


LOC

CAUSA 1

CAUSA 2

Sistema nervioso central (SNC)


Desmielinizacin segmentaria

infiltrado
inflamatorio perivascular

PART

LOC
Sustancia blanca

Dejando momentneamente a un lado la estructura conceptual o cognitiva y observando


su estructura gramatical, podemos ver que la estructura gramatical de este fragmento se
organiza en distintos niveles lingsticos:

Un nivel textual (que en este caso correspondera a la totalidad del texto del que procede
este fragmento), en el que aparecen distintas estructuras multioracionales y oracionales
interrelacionadas por marcadores discursivos2.
Un nivel sintctico, en el que las oraciones se componen de constituyentes estructurales
o sintagmas que ocupan un lugar y ejercen una funcin en la oracin.
En el nivel sintagmtico infraoracional tenemos combinaciones estructuradas
jerrquicamente de unidades del lxico que, en conjunto, pueden corresponder a
unidades del nivel lxico inferior o a otras unidades que son simples combinaciones
sintagmticas de discurso. En el lxico tenemos una serie de unidades que
estructuralmente pueden proceder de la sintaxis (sintagmas lexicalizados) o ser
originariamente lexemticas.
Todas estas unidades poseen una estructura morfolgica, aunque algunas se compongan
solo de un elemento morfolgico. Por lo tanto, en el nivel de la estructura lxica pueden
detectarse adems unidades morfolgicas de valor especializado.
Aparte del criterio compositivo en la organizacin estructural de la gramtica del texto
especializado, se dan muy sistemticamente algunas caractersticas gramaticales que, de
modo orientado segn los casos, permiten caracterizar especficamente el texto
especializado en todos los niveles lingsticos, o, mejor aun, que permiten contrastarlo
con las caractersticas de los textos no especializados.
En el nivel textual existe un control bastante sistemtico de la distribucin de la
informacin, que aparece ms o menos concentrada y es de uno u otro tipo en funcin
del gnero del texto. Tambin existe una organizacin espacial precisa de los contenidos
ms rigurosa que en los textos no especializados. Y por encima de todo puede
observarse en los textos especializados se da una insistencia en presentar formalmente
los conceptos distintos bien diferenciados. Por ello aparecen a menudo grficos,
cuadros, esquemas, y otros recursos organizativos de la informacin. Tambin
presentan, sobre todo en los textos de materias tcnicas y de algunas materias cientficas
de ciencias naturales, mdicas, experimentales y exactas (menos en ciencias humanas y
sociales), smbolos y abreviaturas de carcter internacional, frmulas, nomenclaturas
cientficas y otros signos (pocas veces icnicos) representativos de los conceptos
simples o complejos del mbito. Se observa tambin en este nivel una tendencia a la
impersonalizacin o bien a la asuncin del yo individual por parte del yo colectivo
(nosotros), a la presentacin de los datos de forma que se perciban como objetivos, a la
cita de voces que corroboren la informacin (polifona discursiva), etc.
En el nivel sintctico se detecta en los textos especializados de carcter descriptivo una
tendencia a estructuras poco complejas y a oraciones de menor longitud. Determinados
tipos oracionales no aparecen, o si lo hacen no son representativos, como, por ejemplo,
frases exclamativas o interrogativas. La longitud de las oraciones, sin embargo, suele
variar en funcin del tipo de texto y, por ejemplo, en los de tipo argumentativo la
sintaxis es ms compleja y las oraciones de mayor longitud. Cabe tratar tambin como
caso excepcional el discurso estereotipado propio de determinados mbitos, como
podra ser el jurdico, de mucha mayor complejidad sintctica.
2

Es en este nivel textual en que puede detectarse el tipo o clase textual a travs de la organizacin de la
informacin y la presencia de marcadores textuales.

En el nivel lxico, que es el nivel que junto con el textual ms diferencia el discurso
especializado del no especializado, se observa una seleccin del lxico dependiente de
dominio, de lxico ya sea formal y semnticamente, o slo semnticamente.
Formalmente y semnticamente, porque existen vocablos que solo aparecen en el
discurso de una determinada especialidad. Slo semnticamente, porque, aunque se trate
de vocablos utilizados tambin en otras materias o en la comunicacin general, estos
adquieren un sentido especfico dentro de cada dominio especializado, sentido que se
ubica en el conjunto de sentidos que conforman el significado global de una unidad
lxica3. Desde el punto de vista del lxico, se observa en el texto especializado una
mayor proporcin de siglas y acrnimos, y a veces de estructuras poco naturales
morfolgicamente (por ejemplo, el nombre de algunas protenas como 1-amilasa, Bamilasa, en las que se usa el guin como indicador de un falso prefijo). Finalmente es
preciso recalcar que en todos los textos especializados, al lado de las unidades lxicas
especficas del mbito en cuestin, aparece el vocabulario general necesario para trabar
el discurso.
En el nivel semntico detectamos una tendencia hacia la evitacin de la redundancia en
los textos de mayor nivel de especialidad, tendencia que desaparece gradualmente a
medida que disminuye el nivel de especializacin del texto. Dentro de la redundancia,
sin embargo, destaca en los textos especializados el uso de repeticiones explicativas o
parafrsticas del tipo UT seguida de definicin, explicacin o parfrasis o a la inversa
explicacin o definicin seguida de UT. Estos recursos ya sean UT, ya sean parfrasis o
definiciones, suelen figurar entre parntesis, aparecer conectadas mediante conjunciones
o formar parte de clusulas explicativas, oracionales o no. Es de destacar tambin en los
textos especializados, como consecuencia de la bsqueda de la mayor precisin la
introduccin de marcadores denominativos explcitos del tipo Unidad parafrstica +
Marcador metalingstico + UT. La redundancia se manifiesta tambin en el uso de
ilustraciones y grficos que refuerzan (sitan, precisan o complementan) determinados
conceptos o estructuras conceptuales expresados en el texto.
En el nivel morfolgico aparecen morfemas especficos de un mbito, aunque no en
todos los mbitos con el mismo grado. Podemos observar tambin una tendencia a la
complejidad morfolgica por parte de los trminos, mayor que en el vocabulario clave
de los textos no especializados, y una tendencia mayor a la nominalizacin de los
verbos dando al texto un carcter ms designativo y aportando un ingrediente mayor de
abstraccin.
Y finalmente, aunque la ortografa de los textos especializados es la comn de la lengua
en la que estn elaborados, cabe notar en algunas materias algunas grafas no corrientes,
como la repeticin o alternancia de maysculas y minsculas en las siglas,
contraviniendo la ortografa de las palabras (anti-VIH, ADN circular), el uso de letras de
otros alfabetos (rayos ) o la presencia simultnea de letras y nmeros en un mismo
vocablo (1-amilasa, cido C terminal, acetil-CoA).

3. Unidades de Conocimiento Especializado: Tipologa general


3

Ha sido en esta acepcin que en algunos trabajos, como en Estop (1999, 2002), se ha utilizado la sigla
USE (unidades de significacin especializada) para referirse a estas unidades.

La observacin del texto priorizando el aspecto de conocimiento que transmite permite


establecer elementos de distinta naturaleza en la estructura de conocimiento y sus
elementos, los nodos y las relaciones.
Cuando el foco de nuestra observacin se ubica en la relacin entre los elementos de
conocimiento que conforman la estructura cognitiva del texto y las unidades que
vehiculan este conocimiento entramos ya en el terreno de la lingstica. En este plano,
forma y significado devienen indisociables.
Desde este punto de vista, observamos que tanto las zonas de conocimiento del texto
como los nudos cognitivos se corresponden con unidades lingsticas, sean grupos de
proposiciones relativas a un punto o ncleo de informacin o elementos que constituyen
estas proposiciones con el rol de predicados o argumentos.
.
3.1 Cuestiones de terminologa
Denominamos genricamente UCE (Unidades de Conocimiento Especializado) a las
unidades de distinto nivel descriptivo que constituyen los nudos de conocimiento de un
texto o forman parte de ellos. La condicin esencial para considerar que una unidad es
una UCE es el tipo de conocimiento que transmite (condiciones cognitivas y
semnticas) y su uso en discurso (condiciones pragmtico-discursivas).
Presentamos a continuacin los trminos y siglas ms relevantes de este texto, tanto los
referidos a la clasificacin como a los elementos de anlisis:
Unidad terminolgica (UT): unidad lxica, cuya estructura corresponde a una unidad
lxica de origen o producto de la lexicalizacin de un sintagma, que posee un
significado especfico en el mbito al que se asocia y es necesaria en la estructura
conceptual del dominio del que forma parte. Las condiciones pues que cmple una
unidad para ser una UT son tres:
a) estructura
b) especificidad semntica
c) necesidad en la estructura conceptual
Unidad sintagmtica o unidad polilxica: unidad compleja de estructura sintctica, que
en funcin de su grado de lexicalizacin, puede corresponder a una unidad lxica o a
una unidad fraseolgica (David, 1993). Si esta unidad lxica cumple los requisitos de
especificidad semntica y necesidad, corresponde a una unidad terminolgica. Si
cumple el requisito de especificidad, pero no el de necesidad, corresponde a una unidad
fraseolgica especializada, que contiene siempre una UT.45

Vase en este mismo proyecto el informe correspondiente a la unidades fraseolgicas (Bevilacqua


2004).
5
Corbin (1992, 1997) utiliza el trmino unidad polilexemtica para denominar la unidad lxica formada
por ms de un lexema, e incluye en este concepto todos los tipos de unidades compuestas, tanto las
compuestas cultas, como las patrimoniales y mixtas, y las unidades sintagmticas lexicalizadas. En este
texto no utilizamos esta denominacin.

10

Unidad monolxica: unidad lxica formada por una sola unidad lxica. Las unidades
monolxicas pueden ser simples o construidas, formadas por un solo lexema o por
varios lexemas.

3.2 Criterios de clasificacin y tipologa de las UCE


Las UCE pueden clasificarse por diferentes criterios. Los seis que en nuestra opinin
son relevantes para distinguir distintos tipos de UCE son:

el sistema al que pertenecen


la estructura
la categora gramatical
la clase conceptual
la cohesin interna
el papel lingstico-conceptual que ejercen en el discurso especializado

3.2.1 Clasificacin por el sistema al que pertenecen


Desde el punto de vista del sistema al que pertenecen, las UCE pueden ser unidades del
lenguaje natural o pertenecer a una gran multiplicidad de sistemas artificiales.
SISTEMA

UNIDADES DEL LENGUAJE


NATURAL
gen, antisuero, cido desoxiribonucleico,
amplificacin del ADN, anisogameto,
centrifugacin, cultivar, alogentico,
genticamente

UNIDADES DE OTROS
LENGUAJES
AC, A, K, H2O, Agrobacterium,
Agrobacterium rhizogenes

Hay que llamar la atencin sobre el hecho de que las unidades especializadas
representadas por signos distintos de los del sistema del lenguaje natural equivalen en la
comunicacin a las mismas categoras gramaticales del sistema lingstico natural,
conceptualmente pueden ser descritas a travs de las mismas clases semnticas, su
estructura puede corresponder a la tipologa de las unidades del sistema lingstico,
pueden tambin presentar distintos grados de cohesin interna si se trata de unidades
sintagmticas y cumplen los mismos roles en el discurso que las unidades lingsticas.

11

A menudo encontramos en los textos especializados unidades hbridas en cuya


formacin intervienen elementos de distintos sistemas de signos, combinndose
unidades del lenguaje natural con unidades de lenguajes artificiales diversos; sera el
caso de los elementos qumicos: los sufijos oso, -asa, -ico, -ina, etc. que por su aspecto
formal parecen sufijos del lenguaje natural, y, en cambio, son de creacin totalmente
artificial (acetato, adenina, adenosina, azarosa, alanina, alcohol, amilasa,
aminopeptidasa, anin, aplicn, ampilicina). Otros ejemplos de unidades hbridas son
las combinaciones de smbolos (nmeros y letras) con unidades lxicas (cido C
terminal, acetil-CoA, ARNm, ADN A, actinomicina D, hepatitis) o las combinaciones de
unidades lxicas de dos sistemas ditintos (1-amilasa, B-amilasa, Agrobacterium
mediated).
Las siglas merecen en el discurso especializado una mencin explcita, por tres razones.
En primer lugar por su importancia cuantitativa, creciente en la sociedad
contempornea. En segundo lugar por la variacin que introducen en los textos cuando
estos no son originales sino traducidos. La diferencia estructural de las lenguas, asumida
totalmente en la traduccin cuando se refiere a la morfologa y la sintaxis, se resuelve
con vacilacin en el caso de las siglas (ADP, ARN, ADN junto a PDA, RNA o DNA). Y
en tercer lugar, porque las siglas, en tanto que unidades a caballo entre el lxico de una
lengua natural y el de un sistema artificial se combinan con unidades lxicas del sistema
lingstico siguiendo las reglas combinatorias propias de la lengua en la que se usan,
tanto si corresponden a unidades propias como a prstamos (ADN circular, ADN copia
ADN nativo, ADN pasajero, ADN polimerasa dependiente del ADN, amplificacin del
ADN, amortiguador TEB). Y finalmente, en relacin a las unidades abreviadas que
aparecen en los textos, podemos observar que, aunque este tipo de recurso parece tener
una gran importancia en los textos especializados, un anlisis ms a fondo sobre las
unidades aparentemente abreviadas determina la distincin de dos tipos distintos: por un
lado las formas abreviadas propiamente dichas, de carcter lxico y fruto de uno de los
tipos de formacin de palabras regular en las lenguas; por otro lado, las abreviaturas,
formas aparentemente gramaticales que aparecen en las lenguas por consenso y no
admiten variacin.

3.2.2 Clasificacin por la estructura


Desde el punto de vista de su estructura interna, las UCE pueden coincidir con
morfemas (-itis, -ico, apo-, agluto-, -asa, -ina), con unidades lxicas, simples, derivadas
y compuestas (virus, hepatitis, ocular, autonmico, anablico, apgamo, cruzar,
coagular, amplificar, gentico, antisuero, Agrobacterium), con sintagmas, ya sean
terminolgicos o fraseolgicos (esclerosis mltiple, nervio alveolar inferior,
secuenciacin del genoma, altamente calrico, amplificacin del ADN, Agrobacterim
tumefaciens), o con oraciones (que son muy escasas).
En el caso de las UCE lingsticas (morfemas, palabras, sintagmas u oraciones), las
categoras o clases estructurales que se le atribuyen deben interpretarse literalmente, de
acuerdo con la terminologa gramatical. Cada unidad corresponde a un morfema, a un
lexema, a una combinacin de lexemas o a una oracin. Sin embargo, cuando nos
referimos a las UCE no lingsticas, la clase estructural debe interpretarse como
"correspondiente a" las propias de las unidades lingsticas: cada unidad se asocia a una
clase que corresponde a un morfema, un lexema, un sintagma o una oracin.

12

ESTRUCTURA

UNIDADES MORFOLGICAS
-itis, -genia, apo-, agluto-,-oide, -soma
-asa, ina, -ol, -osa, -ato

UNIDADES MONOLXICAS
clula, caldo, clonaje, codificar, clonar, asepsia, anablico,
apgamo, autonmico

UNIDADES SNTAGMTICAS (unidades lxicas


(polilxicas) y unidades fraseolgicas)
cido desoxirribonucleico altamente repetitivo, cido desoxirribonucleico de
doble cadena, clula hija, ARN satlite, carcter de un gen individual, alteracin
cromosmica, adaptacin del regulador del crecimiento, altamente calrico,

clula ovrica de hmster chino, encapsular el ARN viral, purificar el


ARNnh, acortar el ARN, responder a un antntgeno

UNIDADES ORACIONALES
cepa obtenida por ingeniera gentica, el ARNm se pliega, el ARNm
incorpora las instrucciones genticas, el ADN cromosmico
permanece doblemente enhebrado

Adems de clasificarse por su estructura, las UCE lxicas se pueden organizar en


subgrupos en funcin de los elementos internos que componen su estructura.
Por ejemplo, las UCE monolxicas pueden pertenecer a tres grandes grupos: a unidades
simples, a unidades derivadas y a unidades compuestas; y aun entre las derivadas se
pueden distinguir las unidades derivadas por prefijacin, las derivadas por sufijacin y
las integradas por sufijos y prefijos conjuntamente6. Y las unidades derivadas y
compuestas pueden clasificarse de acuerdo a sus modos de formacin en derivadas y
compuestas cultas, formadas por morfemas o bases lxicas del fondo greco-latino, y
derivadas y compuestas patrimoniales, constituidas por morfemas o bases lxicas del
fondo actual de las lenguas.

Esta composicin no presupone que la formacin se haya realizado adjuntando simultneamente un


prefijo y un sufijo al mismo tiempo.

13

La clasificacin estructural de las unidades lxicas sintagmticas se lleva a cabo en


funcin de la categora de las unidades lxicas y gramaticales que las constituyen y las
describen como estructuras sintcticas. La mayora de ellas corresponden a sintagmas
nominales, aunque encontramos tambin sintagmas verbales y adjetivales (y
potencialmente sintagmas adverbiales).
A pesar de esta formulacin de posibilidades, es preciso aclarar que la mayora de los
sintagmas verbales cuyos componentes co-aparecen con una cierta frecuencia en los
textos de una especialidad pueden corresponder, no a unidades terminolgicas, sino a
unidades fraseolgicas propias de esta especialidad. Ms problemtico es aun el caso de
los sintagmas nominales cuyo ncleo es un nombre deverbal relacionado con un verbo
semnticamente fuerte en el mbito. En estos casos, para diferenciar lo que
correspondera a un fraseologismo o a una unidad terminolgica, nos remitimos a
Lorente (2003) cuyo trabajo de clasificacin de los verbos y nombres deverbales en
relacin a su carcter fraseolgico o terminolgico forma parte de los resultados de este
Proyecto de investigacin.7
Pero hay un dato que nos parece incontrovertible: en la representacin cognitiva de la
estructura conceptual de un mbito, los nudos centrales estn ocupados por
estructuras nominales (nombres o sintagmas nominales), ya sean de origen nominal,
adjetivo o verbal, hasta el punto que cuando una nocin que corresponde a un proceso o
a una accin pueda representarse verbalmente o nominalmente, es la forma nominal la
que ocupa el nudo correspondiente a la estructura conceptual de un mbito. Este dato
permitira formular dos cuestiones: La primera tiene que ver con los modos de
representacin conceptual en terminologa y con los modos de conceptualizacin de los
expertos (no osamos decir, por falta de datos empricos, de los modos de
conceptualizacin de los hablantes en general). La segunda nos llevara a cuestionarnos
si es efectivamente a travs de unidades de categora lingstica cmo el experto
organiza la estructura de su mbito8; o ms finamente, si es universal que sea a travs de
unidades lingsticas. El anlisis emprico sobre estas cuestiones ser objeto de trabajos
posteriores.
Recuperando ahora las unidades sintagmticas nominales en la clasificacin de las
unidades terminolgicas, las unidades sintagmticas nominales pueden corresponder a
tres estructuras:
a) las formadas por un ncleo nominal complementado por un adjetivo o sintagma
adjetivo
b) las formadas por un ncleo nominal complementado por un sintagma
preposicional
c) las formadas por un ncleo nominal complementado por un sintagma nominal.

Para una descripcin de los verbos que parecen en un corpus textual de Genmica, puede verse Lorente
2003.
8
En este sentido puede verse la tesis de doctorado de Cleci Bevilacqua, incluida en este proyecto y cuya
presentacin tendr lugar en julio de 2004, que muestra cmo en un corpus de tratamientos
medioambientales el campo en cuestin se estructura conceptualmente al entorno de nodos verbales.

14

ESTRUCTURA DE LAS UCE SINTAGMTICAS NOMINALES

NUCLEO: NOMBRE
COMPLEMENTO: S. ADJETIVAL
clula simple, alcohol graso, contaminacin
bacteriana, baja sensibilidad, ADN viral, cido graso
saturado, cultivo celular primario, cido
desoxirribonucleico circular cerrad, clula
bacteriana donante competente
NUCLEO: NOMBRE
COMPLEMENTO: S. PREPOSICIONAL
clula de fusin, condicin de crecimiento, coeficiente
de transferencia de masa, alta frecuencia de
transduccin, compuesto de alto peso molecular, ADN
de cloroplasto, ADN de clula animal, concentracin
por congelacin, almacenamiento en fro,
cromatografa en gel, ciclo sin sentido, aislamiento
del virus, copia del ADN, cebador del ARN,
aislamiento de las protenas

NUCLEO: NOMBRE
COMPLEMENTO: S. NOMINAL
Cromosoma hijo, clula recipiente, clula madre
,clula B, cromosoma W, cadena no ramificada,
cromatidio no hermano, ADN A, ADN no codificador,

Cada una de estas estructuras puede recibir expansiones, en forma subordinada o a


travs de la coordinacin de alguno de sus elementos, o incluir entres sus componentes
esenciales otras unidades, bsicamente determinantes o cuantificadores (alta frecuencia
de transduccin, actividad fijadora del nitrgeno, adaptacin del regulador del
crecimiento, ADN circular cerrado covalentemente, ADN moderadamente repetitivo,
anlisis de inmunosorbentes enlazados a enzimas, ARN nuclear pequeo,
cromatografa en capa delgada, cultivo en agar blando).

3.2.3 Clasificacin por la categora gramatical


Desde el punto de vista morfosintctico, las UCE lxicas o UT pueden pertenecer a
cuatro categoras gramaticales: nominal, verbal, adjetival y adverbial. De entre todas
ellas, las de categora nominal son ms representativas, a gran distancia de las de
categora verbal y adjetival. Las UCE adverbiales son relativamente pocas y suelen
tener un correlato adjetival en el mbito.9
9

Es preciso especificar que aunque en este prrafo hablamos de categora intrnseca nominal, verbal,
adjetival y adverbial, cabra aadir, por un lado, las estructuras sintcticas lexicalizadas y, por el otro, las

15

CATEGORIA GRAMATICAL

NOMINAL
caldo, cdigo, clula, almidn, anin, adenina, cido asprtico,
ADN, ADN-ARN, citoplasma, antisuerio, amiosis, clonaje de
tejidos, coagulante, condicin de crecimiento, cultivo hidropnico,
Agrobacterium

ADJETIVA
alelomfico, alcalino, avirulento, alogentico, coloidal, antiviral,
citotxico, contaminante, abortivo, medioambientalmente negativo

VERBAL
centrifugar, clonar, acetilar, cultivar, codificar, administrar penicilina, hacer
un antibitico letal, unirse mediante apareamiento de bases, transferir por
apareamiento bacteriano, cortar el ARNnh

ADVERBIAL
biolgicamente, por va oral, por va intravenosa, altamente molecular,
en posicin de decbito, inmunolgicamente

3.2.4 Clasificacin por la clase conceptual


Semnticamente, las UCE pueden reducirse a cuatro grandes clases conceptuales, si
seguimos la clasificacin de Vendler (1967): entidades, eventos, propiedades y

unidades que a pesar de no pertenecer a una clase gramatical pasan a funcionar como propias de esa clase
(por va oral (adv), analizador (m), antifngico (m), coagulante (m), concentrado (m)).

16

relaciones.

CLASE SEMNTICA

ENTIDADES
clula, agar, copia, alcohol, comatina, protena, ADN,ADN
donador, agente viral, cdigo genetico

EVENTOS (accin o proceso)


amortiguacin, almacenamiento, asimilacin, condensacin, aislamiento
del virus, amplificacin gnica, control gentico, aislar, cruzar, clonar,
codificar, amplificar

PROPIEDADES
aAutooxidable, alcalinidad, androesterilidad, consanguneo, alogentico,
calor de fermentacin, capacidad hidrfila, gentico

RELACIONES
almacenamiento, administrar, cultivar, clonar

Estas cuatro clases no pueden concebirse ni como una lista absoluta (existen otras
clasificaciones que amplan las clases conceptuales bsicas), ni como una propuesta
discreta. Por un lado estas clases pueden subespecificarse; lo muestra la propuesta del
propio Vendler (1967) que, refirindose a los verbos, establece cuatro clases aspectuales
basadas en los criterios de procesividad y telicidad: estados, actividades, realizaciones y
logros10.
Por otra parte, estas clases se resisten a describir muchas veces aquellas unidades que
estn a caballo entre dos clases y participan por tanto de las caractersticas de ambas, a
veces con el predominio de la una sobre la otra, pero en algunos casos sin elementos
que permitan decantarse claramente hacia una u otra opcin, ya que sta puede depender
del punto de vista que el analista priorice. As, por ejemplo, unidades como cncer,
aborto bacteriano, clonaje forzado, clonaje pasmdico, clonacin in vitro,
10

Ciercia & McConnell-Ginet (1990: 353) definen cada uno de estos subtipos:

States are like snapshots of the world at a given instant. They lack a natural culmination or end point, and
their subject is perceived not as an agent (as doing something) but as an experiencer (as experiencing
something). () Activities share with states the property of lacking a natural clmination. Yet they are
agentive in that they typically involve a subject doing smething. () Telic eventualities have a natural
end point or culmination.

17

agroinfeccin pueden considerarse eventos (acciones o procesos) o entidades


(resultados) en funcin del punto de vista que se priorice; actividad gnica, cambio
evolutivo, cambio gentico pueden ser considerados eventos y propiedades, y centrfuga
refrigerada podra ser entidad y propiedad).
Cada clase conceptual puede desplegarse adems en subclases que heredan todas o
algunas de las propiedades de la clase y subclases superiores jerrquicamente. Este
principio constituye la base de las clasificaciones jerrquicas y de las ontologas
especializadas. Veamos a continuacin algunas muestras:
a) Sager i Kageura (1994/1995) formularon a principios de la dcada de los noventa una
propuesta de clasificacin jerrquica de los conceptos especializados a partir de cuatro
categoras muy bsicas: entidades, actividades, cualidades y relaciones:
ENTITADES
Materiales: animales (gente,
organismos).
Clasificadores: elementos
simples,
elementos
complejos,
conceptos
separados, parte de un
trmino complejo
Abstractos: estructura de
conocimiento
(general,
especfico,
lingstico,
matemtico);
entidades
abstractas
(segn
l
temtica);
entidades
subjetivas
(roles,
evaluativas, psicolgicas).
Representacionales:
Entidades
de
documentacin
(tipos,
partes).

ACTIVIDADES
Unidades
de
actividad:
actividades
especficas
(accin/proceso,
transferencia, cambio
de
estado,
produccin)

RELACIONES
Etiquetas de tipos de
relaciones:
Generales, segn el rea
temtica, medida en el
rea temtica
Valores de relaciones:
Fsicas
(espaciales,
temporales, funcionales)
No fsicas (modo de
relacin, comparacin,
situacin relativa).

PROPIEDADES
Etiquetas del tipo de
cualidades:
general,
segn el rea temtica,
medida en el rea
temtica
Valores de cualidades:
Fsicas
(espaciales,
temporales, funcionales,
de situacin, de forma,
de color, cuantitativas,
escalares, otras)
No fsicas (generales,
especiales,
naturales,
ratifcales,
simples,
complejas, negativas, de
manera segn el rea
temtica).

b) Una de las clasificaciones semnticas de la unidades lxicas ms utilizadas en


proyectos de extraccin de informacin actualmente es la ofrecida por el proyecto
WORDNET [http://www.cogsci.princeton.edu/~wn/index.shtml]. A continuacin
ofrecemos una muestra de esta clasificacin y la bsqueda en su base lxica de la
unidad cell:

18

19

c) El proyecto SIMPLE propone una lista de catorce papeles temticos y rasgos


semnticos para la descripcin semntica del lxico de las lenguas
(http://www.ub.es/gilcub/SIMPLE/liege/spanish/Spanish.html). Reproducimos la lista
de los papeles temticos utilizados en este proyecto y un ejemplo de los rasgos que
SIMPLE utiliza para describir el contenido de las unidades lxicas a travs de la unidad:
SemanticRole list
RoleKinship
RoleIconic
RoleHeadQuantified
RoleHeadCollective
RoleProtoAgent
RoleProtoPatient
Role2Participant
RoleOblique
RoleLocation
RoleDirection
RoleOrigin
RoleSOAArg
RoleAdjunct
RoleUnderspecified
20

Todas las clasificaciones aqu expuestas se han valorado para establecer la ontologa del
prototipo de banco de conocimiento que se ha desarrollado en el presente proyecto. Este
banco, denominado GENOMA, puede consultarse en http://www.iula.upf.edu. A
continuacin, como muestra, se reproduce el resultado de la bsqueda en este banco del
concepto enfermedad gentica a partir del trmino enfermedad gentica:

21

3.2.5 Clasificacin por el papel lingstico-conceptual que ejercen en el


discurso especializado
Aparte de la clase semntica, pero relacionada con ella, las UCE representan en la
estructura conceptual de un mbito papeles distintos segn constituyan un nodo o se
integren en un nodo, o bien representen relaciones entre nodos, o ambas cosas a la vez,
como ya ha sido descrito en Cabr (2002b).
De acuerdo con este criterio, las UCE que forman parte de las estructuras conceptuales
pueden describirse en forma de conjuntos de dos rasgos: el rasgo nodo y el rasgo
relacin. As tendremos las siguientes combinaciones pertinentes para la representacin
cognitiva del conocimiento especializado:
[+nodo relacin]
[+nodo +relacin]
[-nodo +relacin]

gen, clon,
clonacin, cruce
clonar, cortar

Los nodos poseen pesos conceptuales distintos segn su mayor proximidad o


alejamiento del nodo central. Cuanto ms cercanos al nodo central, mayor peso
conceptual; cuanto ms distantes, menor peso conceptual.
Otro de los elementos que condiciona el papel de las UCE en una estructura conceptual
es su condicin terminolgica o fraseolgica: son o bien representaciones de nodos, o
bien forman parte de predicaciones que especifican su funcin, su utilidad, sus

22

caractersticas, etc. Desde este punto de vista semntico, son estructuras complejas
normalmente descriptivas de una accin que ejerce la unidad que ocupa el nodo
mnimo, o una expansin o restriccin o simplemente especificacin de las propiedades
de este nodo. De acuerdo con este criterio, en el que intervienen al mismo tiempo
condiciones sobre la estructura de las unidades y condiciones sobre la relacin y alcance
de los nodos, diferenciamos entre, por un lado, las unidades terminolgicas, de
estructura lxica o sintctica, pero en este ltimo caso lexicalizadas, fuertemente
cohesionadas y representativas de nodos mnimos, y, por otro lado, las unidades
fraseolgicas, de estructura sintctica, de grado menor de cohesin interna, y
representativas de expansiones de los nodos mnimos. En este contexto, las oraciones
especializadas representaran combinaciones libres que contendran unidades
terminolgicas y unidades fraseolgicas. Existe un solapamiento entre la estructura y la
condicin de nodo mnimo de las estructuras conceptuales que ha provocado una gran
confusin entre los distintos tipos de unidades que hay que retener, as como una gran
variacin denominativa.

3.2.6 Clasificacin por la cohesin interna


En este trabajo, como ya hemos avanzado, consideramos unidades terminolgicas las
unidades de carcter lxico, con entrada en el lexicn del hablante en tanto que
especialista del mbito, de estructura morfolgica simple, derivada, compuesta o
sintagmtica (entre las que se incluyen las siglas y las formas lexicalizadas abreviadas),
semnticamente especficas, que constituyen un nodo mnimo de un mbito (no de un
texto).
Y consideramos fraseologa, y hablaremos por lo tanto de unidades fraseolgicas a
aquellas unidades pertinentes en un mbito especializado, de estructura sintctica
(nominal, verbal, adjetival o adverbial), de combinacin restringida, que representan
expansiones de los nodos mnimos. Entre ellas, las ms estudiadas son las estructuras
correspondientes a sintagmas verbales, en las que las UT ejercen la funcin de
complemento interno, en la mayora de los casos, aunque pueden ejercer tambin ms
raramente la de complemento externo.
Si estas unidades fraseolgicas verbales son muy representativas de un mbito, suelen
alternar con estructuras sintagmticas nominales formadas por el verbo de base,
realizado como nombre deverbal seguido de un sintagma preposicional que introduce el
complemento, la mayor parte de las veces determinado. Con menor frecuencia
encontramos tambin otras estructuras que se caracterizan porque el lxico es el mismo
aunque bajo estructuras superficiales distintas (aislar, aislamiento, aislamiento de
protenas, aislamiento de las protenas, aislamiento del virus, AC aislado; agente
alquilante, alquilar, alquilacin).
Como resumen de todo lo expuesto, recalcamos una vez ms que slo consideramos UT
las UCE que cumplen los requisitos de estar lexicalizadas, es decir, insertas en la
gramtica como piezas lxicas, usarse en un dominio temtico con un sentido definido y
ser necesarias en la representacin conceptual de dicho dominio. Estas unidades
lexicalizadas se han convertido, de hecho, en unidades lxicas a todo los efectos, aunque

23

tal vez no tengan todas las posibilidades gramaticales que tienen las unidades
originariamente lxicas.
Las unidades de sistemas no lingsticos que, aparte de su pertenencia a otro tipo de
sistema, cumplen todas las dems caractersticas de las UT y pueden substituirlas en un
texto, las trataremos como UT subsidiarias. Desde el punto de vista funcional, actan
como unidades terminolgicas (es el caso de los smbolos o de las nomenclaturas);
desde el punto de vista de sus posibilidades discursivas, presentan diferencias en
relacin a las unidades lingsticas, ya que, aparte de haber sido acuadas siempre in
vitro, en el exterior del discurso y para finalidades esencialmente normalizadoras, son
inmunes a propiedades del lenguaje natural como la variacin (adenina o
agrobacterium) y al cambio evolutivo. Estas unidades funcionan prcticamente siempre
como nombres, porque son los nombres las unidades ms prototpicas tanto por la forma
de expresar el conocimiento como por la evidencia psicolgica que de ellas tienen los
especialistas, como por su nmero y frecuencia en los discursos especializados, son las
unidades de carcter nominal.

4. Anlisis descriptivo de las UCE lxicas (UT) del mbito de Genmica


El proyecto global de descripcin de las unidades de conocimiento especializado
propias del mbito de la Genmica se ha dividido en dos fases:
a) En una primera fase cuyos resultados se presentan en este informe- analizamos
las UCE correspondientes a unidades terminolgicas (UT) (unidades lxicas
cuya estructura corresponde a una unidad lxica de origen o lexicalizada)
procedentes de un corpus lexicogrfico especializado de Genmica. Este anlisis
tiene el objetivo de disponer de las estructuras ms representativas de las
unidades de Genmica, en tanto que han sido reconocidas explcitamente por los
expertos como unidades terminolgicas que merecen ser una entrada del
diccionario de Genmica que ellos han elaborado. Daremos pues por supuesto
que toda entrada o subentrada- de un diccionario de Genmica elaborado por
un experto del mbito en cooperacin con un terminlogo (en nuestro caso el de
Kaufmann, U. y Bergenholtz, H. (1998) Diccionario enciclopdico de
Ingeniera gentica. 2 vols. Toronto, Lugus Libros LatinAmerica Inc.)
proporciona unidades terminolgicas reconocidas explcitamente como tales por
los expertos. Se presupone, por lo tanto, que estas unidades forman parte del
acervo lxico del conocimiento experto en Genmica

24

b) En una segunda fase -que corresponde a la continuacin de este trabajo en un


nuevo proyecto-, analizaremos las mismas unidades en su contexto discursivo, y
por lo tanto dentro de texto y teniendo en cuenta las caractersticas enunciativas
de dicho texto como discurso. Ello nos dar informacin sobre la
representatividad real en el uso de las unidades codificadas en el diccionario y
nos proporcionar la confirmacin o refutacin de los patrones que se habran
considerado ms representativos de las unidades del mbito de la Genmica11.
En el marco de la primera fase del trabajo, en este informe analizamos las UCE de
Genmica procedentes de un corpus lexicogrfico extrado del Diccionario
Enciclopdico de Ingeniera Gentica. De todo el corpus, se han analizado
sistemticamente las entradas correspondientes a las letras A y C, en total 1301 entradas
que corresponden a un 24% de las entradas de este diccionario.
Hemos analizado solamente las unidades que el diccionario inclua como lema (entrada
principal). No obstante cabe sealar que esta obra incluye una cantidad de fraseologa
nominal y verbal, y de UCE oracionales en muchos de los artculos del diccionario.
Estas unidades se reconocen grficamente por estar introducidas por un pequeo
tringulo al final de las entradas. La gran cantidad de combinaciones concurrentes que
incorpora este diccionario, que pueden corresponder a fraseologa o a simples
colocaciones, no se suelen recoger en muchas obras terminogrficas, y, en el caso que
nos ocupa, pensamos que esta peculiaridad responda al perfil profesional de los autores
de la obra:
aminocido m amino acid
Los aminocidos son compuestos orgnicos que contienen un grupo amino, -NH2 y un grupo de
cido carboxlico, -COOH. Hay 20 aminocidos diferentes que constituyen las unidades
estructurales de los pptidos y las protenas. Una protena de tamao promedio se compone de
unos 300 aminocidos conectados por enlaces peptdicos. El posible nmero de secuencias de
aminocidos, en una protena de 300 aminocidos, es aproximadamente 1090. Por lo tanto, la
cantidad de protenas que puede lograrse es prcticamente ilimitada. Muchas biomolculas
importantes son pptidos, es decir, consisten de unos pocos aminocidos.
Adems vimos que en cada una de las protenas, el zipper y la regin de enlace del ADN,
estaban separadas exactamente por 6 aminocidos.
c cada ~ est codificado por each ~ is encoded by; los ~s estn incorporados a ~s are
incorporated into; ser traducido a un ~ be translated into an ~
ARNm m mRNA
c ~ de clula animal animal cell ~; degradar el ~ degrate ~; el ~ incorpora las instrucciones
genticas ~ embodies genetic instructions; el ~se pliega the ~ folds; ~ de la hormona de
crecimiento growth-hormone ~; el precursor del ~ the precursor of ~; ~ purificado purified ~;
reconocer el sitio de enlace del ~ recognize the ~ binding site; una subfraccin del ~ a
subfraction of the ~; ~ truncado truncated ~

Las unidades analizadas las entradas de las letras A y C se distribuyen de la manera


siguiente, si tenemos en cuenta su categora gramatical:

11

Poseemos sin embrago datos sobre el anlisis realizado en el marco de este proyecto sobre los verbos
en Genmica (Lorente 2003).

25

Categora
nominal
gramatical
Nmero de 1189
UCE
%
91,39%

Verbal

Adjetival

21

85

1,61%

6,53%

Estos datos confirman la idea de que los expertos asocian la terminologa


principalmente a los nombres; pero no solo eso, sino que adems conciben la estructura
bsica de una disciplina a travs de las unidades lingsticas nominales, dando pie a la
afirmacin general de que conocer una disciplina es conocer su terminologa.

5. Estructuras ms relevantes de las Unidades terminolgicas del corpus de


Genmica

5.1 Las Unidades terminolgicas nominales


Desde el punto de vista de su estructura, las 1189 UT nominales del vocabulario de
Genmica que se han analizado se distribuyen de la manera siguiente:

6% 1% 2% 0%
0%
2% 2%
1%

UT NOMINALES

4%
5%
3%
66%

5%
3%
UCE polilxicas

UCE simples

UCE sufijadas

UCE prefijadas

UCE qumicas

UCE siglas/Abrevi.

UCE com. Hbridos

UCE com. cultas

UCE cultas sufijados

UCE latinas

UCE comp. patrimoniales

Smbolos

Frmulas

Raras

Como puede apreciarse, las UT polilxicas son estructuralmente las nicas


representativas, ya que corresponden al 66% de todas las estructuras. El 34% de los
casos se distribuye en nueve tipos de estructura, que en funcin de su mayor o menor
representatividad (representatividad siempre dbil) se reparten en dos grupos:

26

a) las estructuras que presentan una frecuencia de 4-6% (entre 83 y 33 casos en el


corpus analizado, que cubren el 20% del total): estructuras compuestas cultas
(6%), unidades qumicas (5%), derivadas sufijadas (5%) y siglas (4%):

6
5
4
3
2
1
0
Estructuras con frecuencia de 4-6%
compustas cultas

unidades qumicas

derivadas sufijadas

siglas

b) las estructuras que presentan una frecuencia por debajo del 4% (que
corresponden a menos de 33 casos y cubren el 13% del total): unidades simples
(3%), estructuras prefijadas (3%), compuestos hbridos (2%), compuestos
patrimoniales (2%).

3
2,5
2
1,5
1
0,5
0
Estructuras con frecuencia menor del 4%
unidades simples

derivadas prefijadas

compuestos hbridos

compuestos patrimoniales

Dentro de las 796 unidades polilxicas, se dan tres estructuras bsicas:


[[N] Sintagma preposicional]: 272 unidades
[[N] Sintagma adjetivo]: 432 unidades
[[N] Sintagma nominal]: 92 unidades

27

Unidades polilxicas

432

600
272

400

92

200
0
N Sintagma preposicional

N Sintagma adjetivo

N Sintagma nominal

Cabe notar el nmero elevado de unidades de estructura [[N] SA] que es la estructura
sintagmtica ms productiva tambin en la mayora de terminologas, como han
mostrado diferentes estudios. Otro tema es la variacin que presenta cada una de estas
tres estructuras bsicas.
La estructura con ms tipos variantes es [[N] Sintagma preposicional]: 272 unidades
N de N: 99
N de art N: 24
N de Npl: 14
N de N A: 12
N en N: 11
N de art sigla: 9
N de sigla: 7
N de art N A: 5
N de A N: 5
N de N de N: 5
N de Npl Apl: 3
N de Npropi: 3
N en N A: 3
N por N: 3
sigla de N: 3
N en N de N: 2
A N de N: 2
N A de A N: 2
N A de N: 2
N de art Npl: 2
N de N de A Npl: 2
N sin N: 2
sigla de A N: 2
N A de N A: 1
N en N: 1
N por A N: 1
N a art N: 1
N A de A sigla: 1
N A de art N: 1
N A de Npl: 1
N A de sigla: 1
N A por N A: 1
28

N A por N de N: 1
N con N: 1
N de A N A: 1
N de art N de art N: 1
N de art N de N: 1
N de art N sigla: 1
N de art smbolo: 1
N de N A a N: 1
N de N a art N: 1
N de N de art Npl: 1
N de N sigla: 1
N de N smbolo: 1
N de Nllat: 1
N de N-N: 1
N de Npl A: 1
N de Npl Apl: 1
N de Npl de N A: 1
N de un N A: 1
N de una N para Npl: 1
N en A N: 1
N en Npl: 1
N entre Npl: 1
N in Nllat: 1
N por art N: 1
N por N en N: 1
N por Npl: 1
N por Npl de art Npl: 1
N por Npl de art smbolo: 1
sigla de art N: 1
sigla de N A: 1
sigla N A de art sigla: 1
Algunos ejemplos de estas unidades seran (se puede consultar la lista completa en el
CD anexo): cromatografa en columna, ADN de doble hebra, cromatografa en capa
delgada, cdigo de una letra para aminocidos, cdigo del ADN, cdigo de
nucletidos, condicin de fermentacin, concentracin al vaco, aberracin de los
cromasomas, control de la contaminacin, complejo proteico de ADN, adaptacin del
regulador del crecimiento, cultivo en agar, cultivo en agar blando, ciclo sin sentido,
almacenamiento de las enzimas, cepa obtenida por ingeniera gentica, cruzamiento de
prueba de tres puntos, ADN polimerasa dependiente del ARN, ADN polimerasa
dependiente del ADN, etc.
Un anlisis ms detallado de las unidades de estructura [[N] SP] permite observar que
en muchas de ellas aparece un nombre deverbal como ncleo del SN y el complemento
est determinado por un artculo definido (aislamiento de las protenas, aislamiento del
virus, almacenamiento de las enzimas, alteracin del ADN, amplificacin del
cloranfenicol, anlisis de los comosomas, clula de la membrana. Aberracin de los
cromosomas). Estos casos corresponden grosso modo a unidades fraseolgicas, y no a
unidades terminolgicas, segn nuestros criterios.

29

La variacin es substancialmente menor en la estructura [[N] Sintagma adjetivo]: 426


unidades
N A: 346
Sigla A: 44
NAA: 28
Sigla AA: 3
Sigla Adv A: 2
N sigla A: 2
N smbolo A: 2
NAAA: 2
NA Adv A: 1
Sigla A A adv: 1
Sigla no A: 1
Algunos ejemplos de estas unidades son (se puede consultar la lista completa en el CD
anexo): aborto bacteriano, contaminacin microbiana, cadena no ramificada, clula no
diferenciada, cromosoma doble diminuto, actividad fermentativa residual, clula
bacteriana donante competente, cortes escalonados, ARN autoempalmante, ARNm
enmascarado, ARN nuclear pequeo, ADN no codificador, ADN moderadamente
repetitivo, etc.
Finalmente, la estructura [[N] Sintagma nominal] presenta un grado de variantes similar
a la anterior estructura pero corresponde a un nmero de unidades muy inferior: 90
unidades
Sigla N: 26
NN: 25
N smbolo: 16
N sigla: 6
NNN: 5
Sigla Smbolo: 5
NAN: 2
N sigla A: 1
Sigla N N: 1
N A smbolo: 1
N abreviatura: 1
N frmula: 1
Ejemplos de estas unidades son (la lista completa se encuentra en el CD anexo): anlisis
Cot, clula T, ARN satlite, clula madre, cepa Hfr, AP endunucleasa, cromatidio hijo,
complejo antgeno-anticuerpo, clula CHO, configuracin cis, ADN Z, etc.
De la misma manera que ocurra con un corpus terminogrfico de derecho y de
medicina estudiado anteriormente (Estopa, 1996), la mayora de UT polilxicas
corresponden a un nmero muy bajo de patrones estructurales y, contrariamente, existe
una gran dispersin de estructuras morfolgicas que equivalen a muy pocas UTP, de
hecho, como tambin pasaba en los estudios mencionados, la mayora de patrones

30

presentan una sola ocurrencia. As, las seis estructuras siguientes corresponden al 75%
de las UT polilxicas del corpus analizado:
NA (346)
NdeN (99)
Sigla A (44)
NAA (28)
Sigla N (26)
NN (25)
N de art N (24).
Dentro de la lista de UT nominales, llama la atencin la baja presencia de unidades
lxicas no construidas. Si este dato fuera significativo nos llevara a suponer que la
Genmica posee un vocabulario bsico propio extraordinariamente reducido, y que la
mayora de sus conceptos se han denominado a travs de unidades formadas por
combinacin morfolgica o lxica. En nuestra muestra (sobre el 25% de las entradas del
Diccionario) slo aparecen 30 unidades no construidas: aborto, cido, agar, agua, ala,
alcali, alelo, alga, ambiente, angstrong, antera, azcar, calor, cortes, cncer, caldo,
callo, cap, carbono, clula, cresta, cepa, cigoto, clon, cdigo, codn, colonia, columna,
copia, cultivo.
Cabe resaltar tambin el equilibrio frecuencial entre la composicin en su conjunto
(10%) y la derivacin tambin en su conjunto (13%), y su contraste en relacin a los
procesos de truncacin, entre los que slo se da la siglacin (4%).
Es interesante notar el grado de productividad de algunas siglas, especialmente de ADN
y ARN, que constituyen el ncleo o el complemento de numerosas unidades de carcter
sintagmtico. Por citar un ejemplo, la unidad ADN, que es quizs la ms representativa
de este lxico, constituye el ncleo de 62 unidades polilxicas: ADN contrasentido,
ADN copia, ADN copia simple, ADN cormosmico, ADN de clula animal, ADN de
doble hebra, ADN de plastidio, ADN del cloroplasto, ADN del organelo, ADN
desnaturalizado, ADN donador, ADN extrao, ADN glicosilasa, ADN circular
cerrado covalentemente) y en 15 unidades polilxicas forma parte de su complemento
(amplificacin del ADN, ARN polimerasa dependiente del ADN, cadena del ADN,
cantidad de ADN, cdigo del ADN, composicin de ADN, cebador del ADN.
Una mencin aparte merecen los casos denominados UT qumicas, que corresponden
a substancias de la qumica formadas por sufijos especializados creados por consenso
internacional. El sufijo ms productivo en nuestro corpus es -ina (abzima, acetilcolina
ciclina amilopectina alanina albmina adenosina, etc.), seguido de -asa (1-amilasa,
acetiltransferasa, amiloglucosidasa, B-amilasa, celulasa), -osa (agarosa, amilosa,
celobiosa, celulosa) -n (almidn, aplicn, catin ), y -ol (alcohol).
En relacin a las clases semnticas de las unidades terminolgicas nominales, podemos
observar que la mayora se describen como entidades, aunque dentro de ellas destaca un
grupo de unidades nominales procedentes de unidades verbales, que, al heredar el rasgo
de eventividad del verbo, permiten etiquetar la unidad nominal tambin como acciones
o procesos. Observamos as cmo algunas unidades, en funcin del punto de vista o de
los rasgos activados, pueden considerarse entidades o procesos: ciclo ovrico, cintica
enzimtica, cintica del crecimiento, cintica de la reaccin, cintica de la muerte

31

trmica, ciclo de infeccin ltica, ciclo sin sentido, ciclo ltico. O bien unidades
relacionadas con adjetivos que pueden considerarse entidades o propiedades: constante
de espiralizacin, constante de fijacin, constante de fijacin.

5.2 Las Unidades terminolgicas adjetivas


La frecuencia de las estructuras correspondientes a las UT adjetivas analizadas (86
unidades) es la siguiente:

UT ADJETIVAS

Cultos
sufijados
26%

Polilxicos Mixtos
4%
8%

Prefijados
22%

Cultos
13%

Qumicos
2%

Sufijados
25%

Mixtos
Cultos
Sufijados
Qumicos
Prefijados
Cultos sufijados
Polilxicos

De entrada observamos que entre los adjetivos no aparece ni un adjetivo simple12. Esta
constatacin puede obedecer a dos razones: o bien en Genmica no existen adjetivos
propios acuados en el origen conceptual de la disciplina, y la adjetivacin en el mbito
de la Genmica slo se realiza a travs de unidades derivadas o compuestas a partir de
los nombres o verbos propios; o bien los adjetivos de estructura simple usados en
Genmica, procedentes del fondo comn del lxico general o de otra materia aunque
asociados a un sentido especfico en el mbito, no se reconocen como terminolgicos
(en el sentido que no funcionan aisladamente sino siempre se integran en una UT
polilxica formando parte de su complemento), lo que dara una pista sobre cmo los
especialistas atribuyen estatus de trmino a una unidad, es este caso adjetiva13.
En los ejemplos analizados observamos que la derivacin cubre el 75% de los casos; la
composicin, reducida a la composicin culta o mixta , el 21% de los casos, lo que
cubre casi el total de la adjetivacin (96%).

12

Esta misma situacin se ha descrito en el caso de los nombres.


Esta cuestin ya se ha tratado en Estop (1999) en relacin al mbito de la Medicina. Dejamos para
estudios posteriores el anlisis de este tema en Genmica.

13

32

Entre las estructuras sufijadas no cultas (25%), el total se reparte casi equitativamente
entre las que proceden de un verbo (12 casos) y las que proceden de un nombre (9
casos, ms dos si incluimos aqu los parasintticos). Los sufijos que aparecen son los
siguientes (con exclusin de los que solo aparecen una vez):
Combinados con bases verbales aparecen los siguientes sufijos adjetivales:
-(a/e)nte
-ivo
-(a)do (correspondiente a la forma de participio pasado de verbo)
-ble
Combinados con bases nominales se presentan las siguientes formas de sufijo:
-ar
-ico
-al
Las formaciones adjetivas sufijadas cultas presentan los sufijos siguientes:
-ico (que aparece en el 77% de los casos)
-ivo (dos casos)
-al (un solo caso)
-ista (un caso)
Si a las formaciones patrimoniales sufijadas, les sumamos las estructuras cultas
sufijadas y las estructuras con sufijos propios slo de la Qumica (dos casos con el
sufijo ino) se cubre el 55% del total de los adjetivos.
Todas las estructuras prefijadas proceden de un adjetivo real en la lengua castellana. A
este adjetivo se le antepone uno de los prefijos siguientes: a- (avirulento, acntrico,
ameitico), -anti (antiviral, antimictico, antisptico), auto- (autooxidable, autotrfico),
y co(n)- (consanguneo, codominante). Los prefijos tienen distinto grado de
productividad, como muestra el cuadro siguiente:
Prefijos
10
10

4
2

0
a-

anti-

auto-

co-

Los prefijos ms productivos (a-, anti- y auto- ) constituyen adjetivos relacionales


(como tambin ocurre en otros mbitos, como en medicina), y no calificativos, y
participan en la constitucin de una taxonoma nocional en el mbito de la Genmica.

33

En cuanto a otros tipos de formacin destacamos como dato curioso en este vocabulario
la presencia de estructuras sintagmticas adjetivas con carcter terminolgico,
especialmente raras en los mbitos de especialidad, integradas por un ncleo adjetivo
(calrico, molecular, sensible) con modificacin cuantitativa antepuesta, cuantificacin
que se actualiza lingsticamente siempre en el adverbio altamente14.

5.3 Las Unidades terminolgicas verbales


Finalmente, las UT verbales analizadas (20 unidades) responden a las estructuras
siguientes:

UT VERBALES

Sufijados
10%

Cultos afijados
25%

Prefijados
15%

Sufijacin 0
50%

Sufijados

Prefijados

Sufijacin 0

Cultos afijados

En relacin a los verbos que aparecen en el corpus procedente del diccionario


especializado, uno de los datos ms relevantes es la importante presencia (importante en
relacin al nmero total de casos) de verbos formados por conversin sintctica a partir
de nombres, que podran considerarse tambin como verbos simples que han producido
nombres por conversin sintctica (cortar, cruzar, clonar, coagular, cultivar, acetilar,
controlar, centrifugar, alquilar). De todos ellos slo la unidad clonar es propia y
original de Genmica; coagular, acetilar y centrifugar proceden de unidades propias de
otras materias especializadas; el resto forma parte del acervo lxico general, y en el
campo de la Genmica, se utilizan con un sentido especfico15.
La agrupacin de las unidades verbales simples y las derivadas regresivas permite
observar que el conjunto de los verbos morfolgicamente simples corresponde al 52%
14

Esta estructura es el calco de la unidad del ingls highly.


Sobre la identificacin de los verbos de Genmica que adquieren un sentido especializado y cmo se
representa el cambio de sentido a travs de la estructura argumental y de qualia (Pustejovski 1995),
tenemos un trabajo en curso de realizacin.

15

34

de los casos. Slo cinco verbos presentan una estructura derivada prefijada, dos
totalmente patrimonial: aislar, asimilar y aparear (el primero procedente de base
nominal, y los dos restantes de base adjetiva), dos de estructura culta (adaptar y
absorber) y uno de estructura hbrida (congelar). nicamente dos verbos del corpus
corresponden a una estructura derivada sufijjada (amplificar y codificar).
Aparte del hecho de que las unidades verbales de nuestro corpus posean una u otra
estructura, es relevante la correspondencia entre verbos, nombres y adjetivos, simples,
derivados o compuestos, de la misma familia derivativa, como puede observarse en la
lista siguiente. La presencia constante de un nombre cuando existe el verbo es un dato a
tener en cuenta para formular generalizaciones.

Verbos del corpus

Lexemas de la misma familia


que el verbo, presentes en el diccionario
______________________________________________________________________
absorber
acetilar
activar
adaptar
aislar
alquilar
almacenar
amplificar
aparear
asimilar
clonar
centrifugar
codificar
coagular
congelar
controlar
construir
cortar
cruzar
cultivar

absorcin, absorbente, absorbancia


acetilacin, acetil, acetilcolina,
acetiltransferasa, acetil-CoA
activador, activacin, actividad
adaptacin, adaptador, adaptabilidad
aislamiento, aislado
alquilacin (sic), aquilante
almacenamiento
amplificacin
par, apareamiento, apareado
asimilable, asimilacin
clon, clonacin, clonaje
centrifugacin , centrfuga
cdigo, codificacin, codificado, codificador
coagulacin, cogulo, coagulado, coagulante
congelacin
control
construccin
corte
cruzamiento, cruzado, cruce
cultivo

6. Recapitulacin
En este trabajo se han presentado en primer lugar el concepto y la clasificacin de las
denominadas Unidades de Conocimiento especializado (UCE). Para delimitar
especficamente el concepto de CE nos hemos situado en el marco de la comunicacin
especializada y en l en el discurso especializado que se materializa en los textos
denominados tambin especializados.

35

La comunicacin especializada se distingue de la comunicacin general por los factores


que intervienen en ella, los ms representativos de los cuales son las condiciones del
emisor, las situaciones en que se produce este tipo de discurso y su funcin
prioritariamente informativa. En estas situaciones se producen textos especializados que
se diferencian de los generales tambin por varios factores, aunque comparten con ellos
el esquema general de descripcin. Discursivamente las UCE aparecen en el discurso
producido por especialistas o por mediadores entre los especialistas y el pblico.
Los textos especializados, como los generales, pueden describirse a partir de sus
condiciones discursivas y sus caractersticas textuales. Estas ltimas se materializan en
tres estructuras interrelacionadas: una estructura formal, una estructura cognitiva y una
estructura lingstica.
Desde el punto de vista formal, los textos especializados no se distinguen de los
generales ms que por el hecho de seleccionar gneros textuales especficos. As, por
ejemplo, el gnero tesis doctoral o el de paper cientfico solo se da en situaciones
especializadas de comunicacin.
Cognitivamente los textos especializados se distinguen de los generales por la precisin
de sus conceptos, los cuales componen una estructura bien delimitada, explcitamente
establecida y consensuada por los expertos de cada mbito de especialidad, de forma
que los conceptos se usan en el discurso slo en relacin a su ubicacin a dicha
estructura y adquieren en ella un valor preciso.
Lingsticamente los textos especializados se caracterizan por encima de otras
caractersticas por las unidades en las que basa la transmisin del conocimiento
especializado.
Estas unidades, denominadas Unidades de Conocimiento Especializado (UCE), se han
clasificado teniendo en cuenta diferentes aspectos que actan de criterio de
tipologizacin: el sistema al que pertenecen, la estructura interna, la categora
gramatical, la clase conceptual, el grado de cohesin interna y el papel que ejercen en el
discurso.
De acuerdo con estas caractersticas se han definido las unidades terminolgicas (UT),
que son las ms relevantes en la representacin de los conceptos de toda especialidad,
como unidades lxicas, de estructura lxica o sintctica, necesarias en la estructuracin
conceptual de un mbito, que corresponden a las unidades mnimas con autonoma
conceptual. Adems de las UT se han caracterizado las Unidades Fraseolgicas
Especializadas (UFE), relevantes tambin en la representacin del conocimiento de un
mbito especializado, pues son expansiones de las UT y piezas clave en las relaciones
que se establecen en un campo de conocimiento.
Hecha esta clasificacin, en este trabajo se han analizado las UT de Genmica
procedentes de un corpus lexicogrfico (el diccionario de Kaufmann, U. y Bergenholtz,
H. (1998) Diccionario enciclopdico de Ingeniera gentica. 2 vols. Toronto, Lugus
Libros LatinAmerica Inc.) con la finalidad de disponer de las estructuras ms
representativas de las unidades de Genmica reconocidas explcitamente por los
expertos como unidades terminolgicas.

36

En una segunda fase -que corresponder a la continuacin de este trabajo en un nuevo


proyecto-, analizaremos las mismas unidades en su contexto discursivo, y por lo tanto
dentro de texto, teniendo en cuenta las caractersticas enunciativas de dicho texto como
discurso. Ello nos dar informacin sobre la representatividad real en el uso de las
unidades codificadas en el diccionario y nos proporcionar la confirmacin o refutacin
de los patrones que se habran considerado ms representativos de las unidades del
mbito de la Genmica.
Este trabajo descriptivo, tanto el correspondiente a la primera fase como al de la
segunda fase, se encamina a la deteccin automtica de unidades terminolgicas, a su
representacin en el texto y a la generacin (en forma de asistente de generacin)
automtica o semiautomtica de estructuras conceptuales a partir del tratamiento
automtico de texto.

7. Bibliografa
Esta bibliografa incluye tambin las publicaciones relacionadas con este Proyecto
de investigacin realizadas por las autoras de este trabajo
Bevilacqua, C. R. (1999) Unidades fraseolgicas especializadas: estado de la cuestin y
perspectivs. Barcelona: IULA-UPF. [Trabajo de investigacin, indito]
Bevilacqua, C. R. (2004) Unidades fraseolgicas especializadas eventivas: descripcin y
reglas de formacin en el mbito de la energa solar. Barcelona: IULA-UPF. [Tesis
doctoral, indito]
Cabr, M. T. (1999a) Terminology. Theory, Methods and Applications. Edited by J. C.
Sager. Translated by J. DeCesaris. Amsterdam/Philadelphia: John Benjamins Publishing
Company. 252 p. HB: 90-272-1633-9. PB: 90-272-1634-7.
Cabr, M. T. (1999b) La terminologa. Representacin y comunicacin. Una teora de
base comunicativa y otros artculos. Barcelona: Institut Universitari de Lingstica
Aplicada, Universitat Pompeu Fabra. (Srie Monografies, 3).
Cabr, M. T. (2000a) Elements for a theory of terminology: Towards an alternative
paradigm. En: Terminology. International Journal of Theoretical and Applied Issues in
Specialized Communication, 6, 1, p. 1-23.
Cabr, M. T. (2000b) Sur la reprsentation mentale des concepts: bases pour une
tentative de modlisation. En: BEJOINT, H.; THOIRON, P. (dir.) Le sens en terminologie.
Lyon: Presses Universitaires de Lyon, p. 20-39. ISBN: 2-7297-0641-0 .
Cabr, M. T. (2002a) Textos especializados y unidades de conocimiento: metodologa
y tipologizacin. En: Garca Palacios, Joaqun; Fuentes, M. Teresa (eds). Texto,
terminologa y traduccin. Salamanca: Ediciones Almar, p. 15-36. ISBN: 84-7455-0793.

37

Cabr, M. T. (2002b) Anlisis textual y terminologa, factores de activacin de la


competencia cognitiva en la traduccin. En: Alcina Caudet, A. y S. Gamero Prez
(eds.) La traduccin cientfico-tcnica y la terminologa en la sociedad de la
informacin. Castelln: Publicacions de la Universitat Jaume I, p. 87-105.
Cabr, M. T. (2003a) Theories of terminology. Their description, prescription and
explanation. A: Terminology, 9, 2, p. 163-200.
Cabr, M. T. (2003b) El lenguaje cientfico desde la terminologa. En: Gutirrez,
Bertha (2003) Aproximaciones al lenguaje de la ciencia. Burgos: Fundacin Instituto
Castellano y Leons de la Lengua, p. 19-52. ISBN: 84-607-7286-1.
Cabr, M. T.; Estop, R. On the units specialised meaning uses in professional
communication. Terminology Science and Research, 2003, 1-2 (en premsa).
Cabr, M. T.; Estop, R. (2002) El conocimiento especializado y sus unidades de
representacin: diversidad cognitiva. Sendbar, 13, 141-153 .
Cabr, M. T.; Feliu, J. (ed.) La terminologa cientfico-tcnica: reconocimiento, anlisis y
extraccin de informacin formal y semntica (DGES PB96-0293). Barcelona, Institut
Universitari de Lingstica Aplicada de la Universitat Pompeu Fabra, 2001.ISBN: 84477-0744-X.
Cabr, M. T.; Lorente, M. (1999) L'estructura argumental dels predicats derivats. A:
Estudi General, Revista de la Facultat de Lletres de la Universitat de Girona. Vol. 17-18,
p. 67-78.
Chierchia, G.; McConell-Ginet, S. (1990) Meaning and Grammar. An Introduction to
Semantics. Cambridge, The MIT Press.
Corbin, D. (1992) "Hypothses sur les frontires de la composition nominale". Cahiers
de grammaire, 17, 26-55.
Corbin, D. (1997) "Locutions, composs, units polylexmatiques: lexicalisation et
mode de construction". Actes du colloque de 1994 "La Locution, entre langue et usage".
Textes renis par Michel Martins-Baltar/ENS ditions Fontenay/Saint-Cloud, 1-29.
DAVID, S. (1993) Les units nominales polylexicales. lments de description et
reconnaissance automatique. Tesis doctoral. Pars: Universit Denis Diderot.
Estop, R. (2001) Les units de signification spcialises: largissant lobjet du travail
en terminologie. Terminology, 7, 2, 217-237.
Estop, 2001 Los adjetivos en las unidades terminolgicas polilxicas: un anlisis
morfosemntico. Organon, 14, 28/29, 233-246.
Estop, R. (2003 [1999]) Extracci de la terminologia: elements per a la construcci
dun SEACUSE. CD-ROM. 84-89782-02-4.

38

Estop, R. (1996). Les unitats terminolgiques polilexemtiques en els lxics


especialitzats: dret i medicina. Universitat Pompeu Fabra. IULA. Treball de recerca de
doctorat [texto indito].
Feliu, J. (2000) Relacions conceptuals i variaci funcional: elements per a un sistema
de detecci automtica. [Trabajo de investigacin, indito]
Feliu, J.; Sol, E.; Teb, C. Cabr, M. T. (2002) Las relaciones conceptuales: un
elemento esencial en la estructuracin del conocimiento especializado. En: Actas del
VIII Simposio Iberoamericano de Terminologa. Cartagena de Indias, 28 a 31 de
octubre de 2002. ISBN: 958-33-4022-7.
Feliu, J.; Vivaldi, J.; Cabr, M. T. (2002) Ontologies: a review. Working Paper, 34.
Barcelona: Institut Universitari de Lingstica Aplicada. DL: 23.735-2002.
Feliu, J.; Vivaldi, J.; Cabr, M. T. (2002) Towards an Ontology for a Human Genome
Knowledge Base. LREC2002. Third International Conference on Language Resources
and Evaluation. Proceedings. Las Palmas de Gran Canaria, mayo 2002, p. 1885-1890.
ISBN: 295-1740-808.
Fellbaum, C. (ed.) (1998) WordNet. An Elechtronical Database. Cambridge, The MIT
Press.
Junyent, C. (2003) La transmisin del conocimiento especializado. Conocimiento y
conceptos. Cabr, M. T.; Freixa, J.; Teb, C. Terminologa y conocimiento
especializado. Barcelona: IULA-UPF.
Kaufmann, U.; Bergenholtz, H. (1998) Diccionario enciclopdico de Ingeniera
gentica. 2 vols. Toronto, Lugus Libros LatinAmerica Inc.
Lorente, M. (2002) Verbos y discurso especializado. En Estudios de Lingstica
Espaola (ELIES), 16. Publicacin electrnica http://elies.rediris.es
Lorente, M. (2003) Procesos de creacin del lxico con significado especializado:
unidades verbales en el discurso del Genoma Humano. En Bisetto, A.; Iacobini, C.;
Thorton, A.M. (2003) Seriti di Morfologa. In onore di Sergio Scalise. Roma, Caissa
Italia Editore. pgs 129-148.
Pustejovsky, J. (1995) The Generative Lexicon. Cambridge/Massachussets: The MIT
Press.
Sager, J. C.; Kageura, K. (1994/1995) Concept Classes and Conceptual Structures:
Their Role and Necessity. En: Alfa, 7/8, p. 191-216.

8. Anexo
Adjuntamos en un CD anexo una base de datos en ACESS que incluye las UT
analizadas. Esta base est formada por los campos siguientes:

39

o nmero de identificacin de la ficha


o la unidad
o el tipo de unidad segn su estructura (simple, sufijada, prefijada, compuesta
culta, compuesta patrimonial, compuesta hbrida, compuesta culta afijado,
sufijada qumica, sigla, frmula, polilxica, smbolo, nombre latino)
o la categora gramatical de la unidad
o en el caso de las unidades afijadas y de las compuestas con algn formante
greco-latino, los formantes o afijos de la unidad
o en el caso de las UT polilxicas, la estructura morfosintctica bsica
o en el caso de las UT polilxicas, la estructura morfosintctica detallada
o en el caso de las UT polilxicas, el nmero de elementos pertenecientes a
una categora gramatical fuerte
o clase semntica (accin, proceso, entidad, propiedad, relacin)
o comentario, para poder hacer cualquier tipo de anotacin til para anlisis
futuros.
Tambin se incluye un archivo EXCEL que cuenta con todas la unidades clasificadas
por clases gramaticales (en tres hojas diferentes: nombres, verbos, adjetivos) y casa
clase gramatical ordenada por tipos de unidades en funcin de su estructura.

40