Anda di halaman 1dari 11

in Cahiers de Grammaire 23, 1998, Universit de Toulouse-le-Mirail

VERS UNE STRUCTURATION SYNTACTICO-SMANTIQUE DE LA TERMINOLOGIE MDICALE1 Applications la traduction espagnol-franais Xavier BLANCO, Carmen BONELL Universitat Autnoma de Barcelona Keywords Medical terminology ; Bilingual terminography ; Electronic dictionary ; Class of objects Abstract The present article suggests an outline of syntactico-semantic structuring in the field of medicine in Spanish by assigning the concept of class of objects. The aim is the introduction of semantic information that can be reproduced by computer in large terminology bases. The methodology employed allows us to coordinate the description of nouns with that of verbs and adjectives, thus obtaining a group of local medicine grammars. Several Spanish-French translation problems with view in TAO applications are tackled. 0. Introduction La dmarche habituellement employe en terminologie est, comme on sait, onomasiologique. Le terminologue/terminographe sattache principalement dlimiter et dfinir des concepts reprsents par des termes. Ses fiches terminologiques donnent priorit aux donnes de type encyclopdique (domaine, dfinition), signaltique (sources documentaires) et traductologiques (quivalents en une ou plusieurs langues). Mais le terme, pour sa part, reste une ralit linguistique dont le fonctionnement syntacticosmantique est rarement interrog ou mme simplement ignor. Certes, il existe des travaux bien connus qui intgrent dans la description terminologique des informations de type contextuel (Cohen, 1986) et lintrt des cooccurrents et des collocations des termes a t souvent mis en relief (Heid, Freibott, 1991). Mais il nen reste pas moins que la fiche terminologique est, presque en exclusivit, consacre des noms. Les verbes et les adjectifs appartenant une langue de spcialit donne, quand ils sont pris en compte, se trouvent confins des champs sentis comme secondaires lintrieur de la fiche. Cet tat de choses peut ventuellement avoir une justification dans le cas de recensements dobjets 2 (les noms tant les seuls aptes lopration de dnomination) ; en revanche, il semble tout fait arbitraire pour les nomenclatures contenant des noms prdicatifs, comme cest le cas pour les noms de maladie. En effet, il ny a pas de raison a priori pour procder au recensement de kyste et non de senkyster ou de kystique, qui appartiennent au mme domaine et sont par consquent galement ncessaires pour le travail sur les textes. Dautant plus que, la traduction oprant sur des sens et non sur des formes, on peut trs bien tre amen rendre un nom prdicatif par un verbe ou par un adjectif (la espina ha formado un quiste en la planta del pie = lpine sest enkyste dans la plante du pied). Sil est vrai que, dans un premier moment, ce genre de sries peut sembler plus propre aux mots quaux termes (pour rhume N, on a senrhumer V et enrhum ADJ ; pour rhinite N on ne dispose pas de verbe ou dadjectif associ), il se trouve quelles jouent un rle capital autant pour la comprhension que pour le bon maniement des noncs professionnels. Ainsi, bouton au sens de petite tumeur, pourra tre mis en rapport avec
1

Nous voudrions remercier Gaston Gross et Pierre-Andr Buvet (Laboratoire de Linguistique Informatique, Paris XIII) pour leurs suggestions concernant le traitement linguistique du domaine de la mdecine. Le prsent article a bnfici galement de la rflexion effectue autour du projet TERMEDICA Terminologie et enseignement de la langue mdicale 26306-MG2-1-PT-ERASMUS-EILC, coordonn par la Universidade Nova de Lisboa (coord. M Teresa Rijo da Fonseca Lino) et avec la participation de lUniversit Lumire Lyon II (coord. Philippe Thoiron) et de lUniversit Autonome de Barcelone (coord. Manuel Tost). 2 En admettant que lon renonce disposer dinformations contextuelles sur lemploi de ces noms -objets qui peuvent savrer indispensables leur utilisation effective et qui peuvent tre exprimes moyennant diffrents formalismes. Nous pensons, par exemple, aux valeurs tliques (Pustejovski, 1991), aux fonctions lexicales Real, Fact, Labreal (Melcuk, Clas, Polgure, 1995) ou aux oprateurs appropris (Gross, 1994).

boutonneux , mais non avec boutonner (verbe intransitif) ou boutonnement, qui seraient rattacher bouton petite excroissance dun vgtal, ni avec boutonner (verbe transitif) ou boutonnage du domaine de la couture (Lerat, 1995: 71). Cet ensemble de questions nous amne prconiser lintroduction de verbes et adjectifs dans les nomenclatures des glossaires terminologiques, ce qui exige de se poser la question des relations syntactico-smantiques entre ces diffrentes units lexicales et conduit llaboration de grammaires locales des diffrents domaines et sous-domaines envisags. Pour cette tche, il nous semble important de relativiser limportance de la frontire entre mots et termes. Nous pensons, en effet, que ltude lexicographique des termes de base peut permettre de proposer des cadres utiles au travail terminologique, dans la mesure o lajout progressif de termes plus spcifiques nintroduirait pas de phnomnes linguistiques nouveaux. 1. Terminologie mdicale et approche par classes dobjets Nous nous proposons de procder une bauche de structuration syntactico-smantique de la terminologie mdicale de base. Sagissant dun domaine o la communication entre spcialistes et profanes semble capitale, nous avons fortement privilgi la terminologie banalise, cest--dire, celle pour laquelle les locuteurs non spcialistes sont capables dmettre des jugements de grammaticalit. Ce choix devrait permettre, dune part, de se donner des limites raisonnables dans un champ si vaste et, dautre part, denvisager des applications lenseignement/apprentissage des langues trangres. Nous naborderons pas les problmes spcifiques au recueil dinformations terminologiques (slection et dpouillement de corpus entre autres) ni lextension de la description au vocabulaire hautement spcialis, ce qui exigerait davoir recours des consultants. Par ailleurs, ce genre de questions ne pourraient tre traites convenablement que dans le cadre de sous-domaines (pdiatrie, neurologie...). Nous adoptons donc une perspective gnraliste et largement base sur lintuition (appuye par la consultation douvrages caractre didactique), qui nous parat cependant valable pour une premire exploration linguistique du domaine. Notre langue de travail est lespagnol, mais nous considrerons, galement, la traduction vers le franais et nous signalerons les points o les deux langues semblent diverger. La mthodologie de description linguistique employe est celle des classes dobjets, introduite par Gaston Gross (Gross, 1992). Le principe de base consiste effectuer, dans le lexique, des partitions rpondant une mme intuition smantique partir de critres strictement syntaxiques et, donc, reproductibles 3. On a procd, ainsi, dresser une liste de noms de <maladies> laide de quelques prdicats caractristiques comme diagnosticar (N0:hum/N1:<maladie>/N2:hum/Fr:diagnostiquer), sanar (N0:hum/N1:de <maladies>/Fr:gurir) ou tratar (N0:hum/N1:hum/N2:de <maladie>/Fr:traiter). Ces prdicats sont appels oprateurs appropris gnraux une classe. Des oprateurs prsentant des restrictions de slection plus fortes permettent de procder lidentification de diffrentes sous-classes de <maladies>4, e.g. : contagiar/N0:hum/N1:<maladie infectieuse>/N2:a Nhum/Fr:contagion extirpar/N0:hum/N1:<maladie tumeur>/N2:a Nhum/Fr:extirper soldarse/N0:<maladie fracture>/Fr:souder Ensuite, on identifie des classes darguments slectionnes par les <maladies> elles-mmes (noms de <malades>, noms de <mdecins>...). Finalement, les propres oprateurs appropris aux <maladies>
3

Lapproche adopte est proche de celle propose par Z. Harris, qui en prsente une application spcifique aux langues de spcialit dans (Harris et al. 1989). 4 Notons que le recensement opr se fait partir de critres strictement linguistiques (restrictions de slection des prdicats retenus comme oprateurs appropris). Les tiquettes choisies pour dsigner les diffrentes classes dobjets doivent donc tre comprises comme de simples procds mnmotechniques permettant de regrouper des termes partir de faisceaux de proprits syntactico-smantiques. Elles ne concident forcment pas avec les concepts du spcialiste. On nhsitera donc pas inclure les <blessures> et <fractures> dans la classe des <maladies>. Il conviendra, en revanche, de distinguer les <maladies> des <symptmes>, qui prsentent une syntaxe diffrente: Juan tiene la fiebre amarilla, Juan est enfermo de la fiebre amarilla vs Juan tiene fiebre, *Juan est enfermo de fiebre. Notons, dailleurs, que certains prdicats comme cursar slectionnent une <maladie> comme N0 et un <symptme> comme N1: las enfermedades degenerativas cursan con calcificacin extensa del esqueleto.

peuvent tre regroups en classes prsentant des particularits linguistiques communes : <oprations thrapeutiques>, <diagnostics>... On tablit, de cette faon, un ensemble de grammaires locales de terminologie mdicale. 2. bauche de structuration syntactico-smantique du domaine 2.1 Les <maladies> Nous partirons de la classe dobjets <maladies> caractrise par la structure de base : N0hum tiene N1<maladies> tiene (tener) tant un verbe support 5 qui prend en charge lactualisation du prdicat nominal <maladies>. Le verbe tener (avoir) se combine, en principe, avec tous les noms de <maladies> (Buvet ; Blanco, 1998). Certaines <maladies> acceptent, en plus, des supports comme sufrir de, padecer 6 Juan (sufre de + padece) (asma + diabetes + anorexia + reuma...). En franais, nous trouvons le support souffre : Jean souffre de (asthme + diabte + anorexie + rhumatisme...). Il sagit de <maladies> qui correspondent, du point de vue aspectuel, des tats. Elles prennent le dterminant zro en position de N1 et donnent lieu, en gnral, un nom de malade par drivation : asmtico, diabtico, anorxico, reumtico... Certaines dentre elles peuvent se manifester par des crises ; elles prennent alors des dterminants nominaux aspectuels de type ponctuel : (un ataque + una crisis) de (asma + epilepsia + *arteriosclerosis). Une sous-classe de ces noms correspondrait aux <maladies psychologiques> : esquizofrenia, paranoia...7 Les <malformations> sont assez proches de cette classe. Elles sont aussi des tats et prennent le dterminant zro. Elles ont, cependant, des causatifs terminatifs spcifiques comme corregir : corregir (la miopa + la escoliosis + *el asma). Les <maladies infectieuses> prennent le dterminant dfini : Juan tiene el clera vs *Juan tiene clera. Notons quelles ont un double emploi. Dune part, il sagit dvnements qui se combinent facilement avec des verbes supports doccurrence, soit intensifs la peste (infesta + asola + azota) la regin, soit progressifs : la peste se extiende por la regin. Dautre part, elles sont des tats : Juan tiene la peste. Leur support privilgi est tener, elles se combinent moins bien avec padecer et sufrir de : Juan (tiene + ?padece + *sufre de) la peste. Les <maladies infectieuses> smelfactives ont le terminatif appropri pasar : Juan ha pasado (el sarampin + la varicela). Les <maladies infectieuses> se combinent galement avec le support inchoatif contraer : Juan ha contrado (el tifus + la rabia + la peste). Certaines dentre elles acceptent, en plus, le causatif contagiar avec un N0 humain ou, ventuellement, animal : Blas le contagi el sarampin a Juan ; ese perro le contagi la rabia a Juan, mais *el agua contaminada le contagi el tifus a Juan ; *el hierro oxidado le contagi el ttanos a Juan. Il est remarquer que le causatif contagiar impose le dterminant dfini au nom de maladie, mme si le nom en question a tendance prendre un autre dterminant : Juan tiene un resfriado, Juan le contagi (el + *un) resfriado. Les maladies de type vnementiel (inflammations, perforations, etc.) se combinent avec le dterminant indfini : Juan tiene (una peritonitis + un enfisema pulmonar) 8. Elles ont un locatif implicite (elles sont situes un endroit prcis du corps) : * Juan tiene una peritonitis en el hgado. Certaines dentre elles ont un caractre clairement ponctuel (infarto, angina de pecho, trombosis, lipotimia...) et se combinent avec le support dar 9 : a Juan, le di (un infarto + una lipotimia + *diabetes + *el tifus). Elles nacceptent pas de dterminants nominaux ponctuels, puisquil sagit dj de noms ponctuels : *Juan ha tenido (un ataque + una crisis) de (trombosis + lipotimia) ni des prdicats comme latente, recada, qui impliquent un tat. En revanche, elles acceptent les cardinaux : Juan ha sufrido (dos + tres) (infartos + lipotimias).
5 6

Sur la notion de verbe support, on peut se reporter aux travaux du LADL, e.g. (Gross, M. 1981). Il existe aussi dautres supports familiers, surtout inchoatifs, avec une combinatoire plus restreinte : me ha entrado (un dolor de cabeza + *un cncer), he pillado (un resfriado + *la lepra), cf. en franais Jean a chop (un rhme + *la lpre). 7 Notons que, en franais, cette sous-classe prsente un support spcifique : Luc est dune nvrose inimaginable (acceptable en langue courante) vs * Luc est dune tuberculose inimaginable (Gross, 1996). 8 Il serait intressant dtudier de faon systmatique la relation entre suffixe et dtermination pour les noms de <maladies> (e.g. -itis impliquerait le dterminant indfini). 9 Qui a un aspect ponctuel. Notons aussi que les douleurs se combinent avec un autre support ponctuel familier (entrar): le entr un dolor en Npc.

Les <fractures>10 et les <blessures> sont des noms proches de cette classe, mais leur locatif nest pas inhrent au nom. Les premires prennent un complment (nom de partie du corps ou dos) introduit par de (fractura de hmero) et les deuximes un locatif introduit par en (heridas en las piernas) 11. Elles ont des causatifs comme producir : el golpe le produjo una (fractura de pelvis + herida en la cabeza) et des oprateurs lien (oprateurs pour lesquels le sujet du causatif est le mme que celui du nom prdicatif rgi) comme hacerse : Juan se hizo un corte en el brazo. Comme oprateurs appropris ces sous-classes, nous pouvons mentionner cicatrizar, coser, cauterizar (<blessures>), soldar, reducir, enyesar (<fractures>). Mentionnons aussi les <tumeurs> (fibroma, plipo...), qui prennent galement un locatif en en : Juan tiene un tumor en el cerebro. Il serait remarquer que certains noms de <maladies> trs communs ont un comportement particulier. Ainsi, gripe peut se combiner aussi bien avec le dterminant dfini quavec lindfini : Juan tiene (la + una) gripe, mais Juan tiene (*el + un) resfriado. Dans certains contextes, nous trouvons aussi le dterminant zro : Juan est en cama (con gripe + *con resfriado). Nous nous sommes rfrs surtout des noms de <maladies>. Notons, cependant, que les verbes, bien que moins nombreux, doivent tre aussi rpertoris. Ainsi, Juan se ha resfriado (Jean sest enrhum) est quivalent Juan ha cogido un resfriado (Juan a pris un rhume) 12 et doit tre dcrit comme verbe inchoatif quivalent au nom de maladie plus un support inchoatif. Cette bauche de structuration de la classe <maladies> devrait permettre de reprsenter de faon plus prcise les restrictions de slection de certaines oprateurs : contagiar (contagiar/N0:Nhum+ Nani/N1:<maladie infectieuse>/N2:a Nhum), vacunar (vacunar/N0:Nhum/N1:Nhum/N2:contra <maladie infectieuse>), etc. 2.2 Les <malades> Le N0 correspondant une <maladie> peut correspondre, en principe, nimporte quel humain (nous excluons explicitement les maladies des animaux, qui correspondraient au domaine de la mdecine vtrinaire). Cependant, il existe des noms dhumains correspondant spcifiquement des <malades>. Ils sont associs, en gnral, des noms de <maladies tats> (cf. supra) : asmtico, diabtico, anorxico, reumtico. Il sagit de noms prdicatifs qui peuvent tre relis transformationnelllement aux noms de <maladies> correspondants : Juan tiene asma = Juan es asmtico = Juan es un asmtico. Il est intressant de constater que ce sont prcisment les <maladies tats> qui donnent lieu de la faon la plus rgulire des noms de <malades>. Par contre, les <maladies vnements> ne produisent pas de tels drivs, sauf dans quelques cas qui sont, par ailleurs, trs peu usits en langue courante (pulmonaco, neumonaco). Pour ce qui est des <maladies infectieuses>, elles ne donnent lieu que rarement des noms de <malades> et, quand cest le cas, ces noms prennent souvent un caractre pjoratif : sidoso, apestado... Il faut tenir compte galement de quelques noms de <malades> gnriques : enfermo, paciente, afectado de... Notons que enfermo se combine, normalement, avec des <maladies tats> ou avec des <maladies infectieuses>, rarement avec des <maladies vnements> : el enfermo de (*infarto + ?peritonitis). 2.3 Les <mdecins>

10

Dans la langue des rapport mdicaux les <fractures> et <blessures> prennent parfois le dterminant zro : Juan sufre fractura de cccix y contusiones mltiples. 11 Le nom fractura combin avec les noms dos (avec dterminant zro) donnerait lieu des composs nominaux. Notons que, comme le signale Jacques Labelle (Labelle, 1986), les noms de partie du corps introduits par de sans article constituent normalement des noms composs ( mal de tte, rhume de cerveau, ulcre destomac...). 12 Une des particularits de resfriado consiste tre un vnement: Juan ha tenido (uno + dos) resfriados Jean a eu (un + deux) rhumes-, mais prsenter un adjectif associ : Juan est resfriado. Notons, cependant, quil nest pas possible den driver un nom de malade, diffrence de ce qui se passe avec les <maladies tats>: *el resfriado (*lenrhum) vs el asmtico (lasthmatique). Notons aussi que ladjectif resfriado prend le verbe support estar et non pas ser comme les <maladies tats> (Juan es asmtico, *Juan est asmtico). Cette diffrence nest pas perceptible en franais (Jean est enrhum, Jean est asthmatique).

Certains oprateurs anti-causatifs (causer que non P, e.g. gurir) peuvent prsenter comme N0 appropris des noms de <mdecins> : N0<mdecins> ha curado a N<malades> de N<maladies>. Cela nous aiguille vers la classe des <mdecins>. Du point de vue morphologique, il sagit dune classe beaucoup plus varie que celle des <malades>. Si celle-ci tait forme presque exclusivement par des drivs des noms de <maladies>, la classe des <mdecins> prsente par contre des noms pouvant tre mis en rapport avec les <maladies> ( cancerlogo, reumatlogo, alerglogo... 13), les parties du corps (dentista, estomatlogo, podlogo...), les oprations thrapeutiques (cirujano, acupuntor...), les sousdomaines de la mdecine (endocrinlogo, psiquiatra...) ou mme lge ou le sexe des patients (pediatra, gerontlogo, gineclogo, andrlogo...). Ce sont les N0 appropris des <oprations thrapeutiques> et des <diagnostics> (cf. infra). 2.4 Les <oprations thrapeutiques> et les <diagnostics> Si les classes prcdentes taient essentiellement constitues par des noms, les <oprations thrapeutiques> prsentent un grand nombre de verbes : operar, coser, enyesar, extirpar... Normalement, ils sont en comptence avec le nom prdicatif correspondant : operar - operacin (quir rgica), injertar injerto... Cependant, les termes plus techniques nont quune forme substantivale. Le suffixe permet alors un classement ais. Les suffixes les plus connus relatifs des <oprations thrapeutiques> sont : -toma (incision), -ectoma (extirpation), -centesis (ponction), -desis (union), -rafia (suture), -plastia (rparation), clisis (lavage), etc ; les verbes supports les plus courants : practicar, proceder a et hacer. Les <diagnostics> prsentent galement des verbes : diagnosticar, auscultar, radiografiar. Nombre de noms prdicatifs, mme courants, ne prsentent pourtant pas de verbe associ : biopsia, ecografa, electrocardiografa, gastroscopia... 2.5 Autres classes partir des <oprations thrapeutiques> et des <diagnostics>, on peut tablir deux classes darguments lmentaires : les <instruments thrapeutiques> et les <instruments de diagnostic>, e.g. practicar una incisin mediante un (bistur + escalpelo + escarificador...) ; auscultar a un paciente con un estetoscopio... Certains termes donnent lieu des cas dhomographie. Ainsi, radiografa est un nom prdicatif des <diagnostics> quand il se combine avec le verbe support hacer (hacer una radiografa = radiografiar) et un objet de la classe <instruments de diagnostic> dans des emplois comme (examinar + leer) una radiografa. La forma inyeccin est un nom prdicatif des <oprations thrapeutiques> dans (poner una inyeccin = inyectar) et un objet dans des emplois comme romper la aguja de una inyeccin, o inyeccin quivaut seringue. Les <mdicaments> constituent une autre classe importante. Ils apparaissent en position N1 de phrases comme N0<mdecins> (receta + administra) N1<mdicaments> N2<malades> ou N0<malades> toma N1<mdicaments> contra N2<maladies>. Diffrentes sous-classes de <mdicaments> (pomadas, jarabes, supositorios...) peuvent tre tablies, daprs leur mode dadministration, moyennant des oprateurs appropris comme inyectar, ingerir, administrar por va (oral + rectal + tpica...). Il faut distinguer galement entre les formes (pldora, cpsula, pastilla...) et les substances (penicilina, morfina...). Des dterminants nominaux appropris peuvent se rvler utiles pour la distinction de sous-classes : una caja de pastillas, dos frascos de jarabe vs cinco miligramos de cortisona. Nous trouvons aussi, dans les glossaires spcialiss, des locatifs appropris (quirfano, hospital, UCI...). Finalement, nous avons considr les parties du corps : Npc le duele a N<malades>. Diffrentes sous-classes devront tre distingues : amputar N1pc<membre>, practicar la ablacin de N1pc<organe>, tener un tirn en Npc<muscles>, tener una fractura de Npc<os>, la Npc<veines> (discurre + asciende) por N1pc<membre>14. 2.6 Une premire vue densemble

13

Bien que le franais et lespagnol prsentent un fonctionnement trs semblable cet gard, certaines diffrences peuvent tre notes, surtout en nologie : sidologue, *sidlogo. 14 Remarquons que les veines et artres prsentent une cooccurrence lexicale qui les apparente aux fleuves : una vena (discurre + asciende + drena + irriga) N1pc, confluencia de (venas + arterias), etc.

Lorganisation dun domaine par classes dobjets ne peut pas tre reprsente de faon arborescente, tant donn que les classes nentretiennent pas toujours entre elles des relations de genre espce, mais constituent un treillis (Le Pesant, 1994). Il serait par ailleurs dangereux de postuler trop tt une hirarchie fixe, qui risquerait de perturber des observations futures et de conduire un dcoupage subjectif, et, donc, non reproductible de la ralit linguistique. Il semblerait toutefois intressant de disposer dune premire vue densemble de la structuration syntactico-smantique propose. cet effet, nous prsentons un tableau qui rassemble les classes mises en vidence ci-dessus sans pour autant en indiquer explicitement les rapports. classes <maladies> <malades> <mdecins> <oprations thrapeutiques> <diagnostics> <instruments thrapeutiques> <instruments de diagnostic> <mdicaments> exemples gripe, fiebre amarilla diabtico, artrtico cirujano, dentista enyesar, extirpar radiografa#1, gastroscopia bistur, escarificador radiografa#2, ecografa pomada, supositorio, morfina oprateurs et supports appropris contagiar, curarse de, tener diabetes, artritis operar, empastar practicar, proceder a hacer, realizar incisin, corte leer, examinar recetar, administrar

3. Remarques sur la traduction espagnol-franais Lbauche de structuration syntactico-smantique prsente ci-dessus contient trois types de classes : les arguments lmentaires (<instruments thrapeutiques>, <mdicaments>...), qui nont pas de contraintes de slection propres ; les prdicats de premier ordre (<maladies>, <malades>, <mdecins>...), qui ne sappliquent que sur des arguments lmentaires et, finalement, les prdicats de deuxime ordre (<oprations thrapeutiques>, <diagnostics>...), qui sappliquent aussi bien sur des arguments lmentaires que sur des prdicats de premier ordre. Dans ce qui suit, nous nous occuperons, dabord, des problmes lis la traduction des noms composs, nettement majoritaires dans le lexique des langues de spcialit et concernant aussi bien les arguments que les prdicats (par dfinition, des prdicats nominaux). Ensuite, nous aborderons de faon particulire lexpression de laspect lie aux prdicats de <maladies>. Finalement, nous nous pencherons sur les prdicats de deuxime ordre appropris aux <maladies>. 3.1 Composs nominaux et traduction Les composs nominaux constituent la partie principale de tout glossaire ou dictionnaire spcialis. Il sagit de groupes nominaux dont lensemble des proprits smantiques et syntaxiques nest pas compltement prvisible daprs les proprits de leurs constituants. Ils constituent, de ce fait, des units lexicales part entire. En tant que telles, leur traduction ne peut pas tre calcule partir de celle de leurs constituants. Elle posent des problmes rels dans la mesure o le grand nombre de noms composs existant dans le lexique, ainsi que leur frquence dans les textes, font que le traducteur sy trouve confront en permanence. La transparence translinguistique entre les langues proches ayant des limites cet gard (Blanco, sous presse), la traduction littrale des composs nominaux est une source non ngligeable derreurs de traduction qui sont dues soit la non identification de ces squences, soit au manque dune documentation convenable. Lquivalent de traduction dun nom compos peut correspondre un autre nom compos (afasia funcional - aphasie fonctionnelle), un nom simple (neuroma ganglionar - ganglioneurome) ou un nom surcompos (rin en herradura - rein en fer cheval). Les constituants du nom compos de L2 peuvent correspondre ou non aux quivalents de traduction des constituants du nom compos de L1 (tos hmeda toux humide vs tos perruna - toux aboyante, *toux de chien, *toux canine). Parfois, mme si les constituants du compos de L2 peuvent tre considrs comme les quivalents de traduction des constituants du compos de L1, la traduction par transparence conduirait quand mme lerreur (anemia alimentaria - anemia nutritionnelle, ?anmie alimentaire).

Les composs de L1 et de L2 lis par une relation de traduction peuvent diffrer, en plus, quant la forme morphologique15. Ainsi, des composs espagnols Nom Adjectif peuvent tre rendus, en franais, par des composs Nom de Nom (mano simiesca - main de singe, rubeosis retiniana - rubose de la rtine) ; les composs Nom de Nom par Nom Adjectif (embolia de la retina - embolie rtinienne, prolapso del recto - prolapsus rectal) ; Nom de Nom par Nom Nom (aguja de ligadura - aiguille ligature, prueba de la antitripsina - preuve lantitripsine). Bien que ces changements soient les plus frquents, nombre dautres combinaisons sont possibles : quiste por retencin - kyste rtentionnel, vejiga de columnas vessie en colonnes, etc. Le genre et le nombre des constituants du compos peuvent aussi varier. Nous avons ainsi des relations dquivalence o varient : le genre du premier constituant (N1) : erisipela (nf) gangrenosa - rysiple (nm) gangreneux ; le genre du deuxime constituant (N2) (quand le compos comporte deux noms) : vestbulo de la vagina (nf) - vestibule du vagin (nm) ; le nombre du premier constituant : menstruacin vicariante - rgles vicariantes ; le nombre du deuxime constituant : fiebre del heno - fivre des foins ; la dtermination du deuxime constituant : piel de marinero - peau du marin.

Notons que plusieurs de ces divergences L1 - L2 peuvent apparatre en mme temps : genre du N1 et dtermination (prueba de la floculacin - test de floculation), genre et nombre du N2 (istmo de las fauces - isthme du gosier), forme morphologique du compos et genre du N1 (injerto de nervio - greffe nerveuse), forme morphologique et dtermination du N2 (prueba de indol - preuve lindol), etc. Dans certains cas, on constate une inversion des constituants du compos (varice aneurismtica - anvrysme variqueux, reumatismo cardaco - endocardite rhumatismale), parfois due uniquement la place de ladjectif (torticulis falsa - faux torticolis, ventrculo cuarto - quatrime ventricule). Il va sans dire que les diffrences entre L1 et L2 existent aussi, et peuvent tre encore plus notables, dans le cas de traductions non compositionnelles : folculo intestinal - glandes de Lieberkuhn (forme morphologique du compos, genre et nombre du N1), neuroma del mun - nvrome damputation (genre et dtermination du N2). La combinatoire explose si lon tient compte, lors de ltablissement des relations traductologiques, de lexistence des variantes ou des synonymes dun compos donn lintrieur dune mme langue. Ainsi, folculo ovrico peut tre traduit soit par follicule ovarien soit par follicule de De Graaf ; corps jaune correspond aussi bien cuerpo amarillo que cuerpo lteo ; msculo voluntario peut tre traduit par muscle volontaire ou par muscle stri. Souvent la variante en L2 existe aussi en L1 : msculo estriado. Signalons, finalement, que nous nous sommes limits considrer un petit nombre de proprits des noms composs. Laccroissement du nombre de proprits observes aurait comme consquence laccroissement conscutif des divergences de traduction. Ainsi, par exemple, fiebre cuartana se traduit par fivre quarte, mais, en espagnol, leffacement du N1 est possible (la cuartana = la fiebre cuartana), alors quil ne permet pas de maintenir la synonymie en franais (la quarte la fivre quarte). Il importe avant tout de souligner que la traduction dun nom compos ne doit pas tre construite lors de la rdaction du texte darrive, mais slectionne en tant ququivalent de traduction parmi les units lexicales vraiment existantes en L2. 3.2 Lexpression de laspect Nous avons dj signal, plusieurs reprises, que les noms de <maladies> correspondent des prdicats nominaux. En consquence, ils sont actualiss par des verbes supports. ct des verbes supports neutres par rapport laspect (e.g. tener - avoir), nous trouvons des oprateurs clairement aspectuels (que ce soient des verbes, des noms ou des adjectifs) qui sappliquent sur les noms de <maladies> et quil est parfois difficile de bien traduire : inchoatifs : contraer - contracter (soutenu) ; coger - attraper (standard) ; pillar - choper (familier) ;

15

Michel Mathieu-Colas a estim plus de 700 les formes morphologiques possibles pour un compos nominal (Mathieu-Colas, 1996).

terminatifs : curarse de - gurir de ; restablecerse de - se rtablir de, se remettre de16 ; duratifs : arrastrar (un resfriado) - traner (un rhme), crnico - chronique ; progressifs : empeorar - empirer ; desarrollar - dvelopper ; ponctuels : agudo - aigu ; un ataque de - une attaque de, un accs de ; itratifs : recaer - rechuter ; recidiva - rcidive ; reactivacin - ractivation.

Dautres valeurs aspectuelles peuvent tre obtenues par combinaison des prcdentes, e.g. progressif et terminatif : mejora - amlioration. La symtrie entre les langues ne se maintient pas forcment lintrieur dune srie morphologique donne. Ainsi, lespagnol admet mejorar (Juan ha mejorado de la hepatitis) li mejora, alors que le franais ne semble pas permettre la relation * amliorer - amlioration dans le domaine de la sant. 3.3 La traduction des prdicats de deuxime ordre Nous nous bornerons ici deux considrations par rapport aux prdicats de deuxime ordre. La premire concerne lexpression de la cause, la deuxime la ncessit dinformations distributionnelles prcises permettant une dsambigusation efficace. Parmi les prdicats de deuxime ordre, un certain nombre sont, en effet, lis lexpression de la cause. Ainsi, nous avons des noms comme contagio - contagion 17, qui implique que N0 fait avoir une <maladies> N1. Il est important de noter que la causation nest pas toujours lie au dbut dun procs ou dun vnement. Le lexique de la mdecine est particulirement riche en units lexicales exprimant la causation de la fin. Il sagit, notamment, de prdicats comme curar - gurir, desintoxicar - dsintoxiquer, calmar (el dolor) - calmer (la douleur), enucleacin (de un tumor) - nuclation (dune tumeur), suturar (una herida) - suturer (une blessure, une plaie), etc. Soulignons aussi que, ct des formes appartenant exclusivement au lexique de spcialit (e.g. exresis - exrse), on trouve des formes fortement polysmiques. Des informations distributionnelles prcises se rvlent, donc, indispensables pour procder la traduction. Ainsi, la forme visita correspond en espagnol, hormis son sens non spcialis18 (visite touristique, visite de politesse...), un locatif qui correspond au franais cabinet de consultation et un prdicat qui correspond visite mdicale. On observe la mme situation pour consulta. Nous avons donc les entres suivantes (cf. 4) : visita/G:nf/F:N21/T:loc/C:<loc md>/D:md/Fr:cabinet (de consultation) visita/G:nf/F:N21/N0:<mdecins>/N1:<malades>/Vsup:hacer/Fr:visite o la premire correspond un argument lmentaire locatif, qui sera slectionn par des prdicats de premier ordre comme aller , se rendre , alors que la deuxime correspond un prdicat nominal de deuxime ordre qui sapplique, de faon appropri, des <mdecins> en position de N0 et des <malades> en position de N119. 4. Les dictionnaires lectroniques Un des avantages importants de la structuration syntactico-smantique dun domaine en termes de classes dobjets rside dans la possibilit demployer les dictionnaires construits non seulement pour la consultation humaine travers un logiciel de gestion de base de donnes, mais aussi comme information linguistique pour des programmes de traitement automatique des langues naturelles, qui peuvent aller du vrificateur orthographique la documentation automatique et la traduction assiste par ordinateur.

16

Notons lexistence du pragmatme je Pron1 souhaite un prompt rtablissement, ainsi que de la locution Nhum reprendre du poil de la bte. 17 Observons encore, par rapport la dfectivit des sries morphologiques, que le verbe espagnol contagiar est tout fait courant, alors que le franais contagionner est fort peu usit. 18 Notons lexistence du support appropri girar un visita, inacceptable dans le sens de visita mdica: * el mdico gir una visita a su paciente. 19 Ce qui nexclut pas la combinatoire avec dautres sous-classes dhumains dont le contexte se chargerait dexpliciter le rle. Ainsi, Juan le hizo una visita a Pedro serait interprte, hors contexte, comme visite de politesse. Rien nempche pourtant quelle soit utilise, le contexte aidant, pour faire rfrence une visite mdicale.

De faon schmatique, une entre correspondant un argument lmentaire aurait la forme minimale suivante (Gross, 1992) (Blanco, 1997) : penicilina/F:N21/T:inc/C:<md subst>/Fr:pnicilline o F donnerait des informations de type minemment morphologique (catgorie grammaticale et code de flexion), T correspondrait au trait syntactico-smantique du lemme (inanim concret), C la classe dobjets (<mdicaments substances>) et Fr lquivalent de traduction en franais. Le dictionnaire prvoit galement dautres champs non obligatoires, e.g. R (registre ou niveau de langue), V (variantes graphiques). Pour un prdicat, nous aurions : inyectar/F:V3/T:act/C:<opr thr>/N0:<mdecins>/N1:<md subst>/N2: <malades>/Fr:injecter o lon rend compte, en termes de traits syntactico-smantiques et de classes dobjets, des contraintes de slection du prdicat sur son domaine darguments (N0, N1 et N2). Des noms comme penicilina seraient ainsi slectionns en position N1 de verbes comme inyectar. Cette prsentation exige, toutefois, plusieurs remarques supplmentaires. Dabord, il faut insister sur le fait que les tiquettes de classes dobjets jouent un rle mnmotechnique de dsignation de fichiers. Nous nexcluons donc pas des phrases comme el enfermero le inyect penicilina al paciente, des noms comme enfermero ou ATS (infirmier, aidesoignant) se trouvant pour linstant dans le fichier <mdecins> lattente dune structuration dfinitive de cette classe (sans doute renomme <personnel sanitaire>). Ensuite, il serait noter que, pour le moment, les informations fournies sont de type exclusivement distributionnel. Il est cependant ncessaire de prvoir des informations de type transformationnel (e.g. possible co-rfrence entre le N0 et le N2 : el paciente se inyect penicilina). Il faudrait galement tenir compte de la dtermination. Ainsi par exemple, penicilina admettrait des dterminants nominaux appropris du type una dosis de, tres miligramos de. Finalement, des liens devraient tre tablis entre les diffrentes formes dun mme prdicat. Ainsi, inyectar est mettre en rapport avec : inyeccin/F:N21/T:act/C:<opr thr>/N0:<mdecins>/N1:<md subst>/N2: Fr:injection <malades>/Vsup:poner/

Notons, cependant, que ltablissement de telles relations est complexe. Ainsi, il faudrait, dune part, distinguer le prdicat nominal inyeccin de largument lmentaire de mme forme qui dsigne le produit inject et qui fonctionne comme dterminant nominal appropri des <mdicaments substances> : el mdico administr a su paciente una (inyeccin + dosis) de penicilina. Dautre part, le rapport mentionn exige de tenir compte des contraintes aspectuelles. Ainsi, en regard des deux phrases : el mdico inyecta penicilina al enfermo el mdico pone una inyeccin de penicilina al enfermo seule la deuxime fait rfrence de faon inquivoque un fait ponctuel, la premire pouvant correspondre autant un fait ponctuel quhabituel (el mdico pone inyecciones de penicilina al enfermo). 6. Conclusions Nous avons prsent un travail prliminaire conduisant ltablissement dune premire structuration syntactico-smantique du domaine de la mdecine. Cette tude devrait permettre dentreprendre lintroduction, dans de grandes bases lexicales, dinformation smantique traitable par ordinateur. Les fichiers terminologiques ainsi obtenus constitueront non seulement des rpertoires lexicaux, mais des ensembles de grammaires locales offrant des possibilits dapplications diverses. Les dictionnaires qui seront la base de ces applications devront prsenter une bonne couverture lexicale du domaine non seulement pour ce qui est des noms, mais aussi pour ce qui est des verbes et des adjectifs. Nous conclurons par deux types dobservations, les unes relatives la description des formes et les autres relatives la description des sens. 6.1. De la reconnaissance des formes...

titre illustratif, mentionnons que nous avons men une premire exprience avec le dictionnaire lectronique de lespagnol pour les formes simples DELASs 20 et une premire version du dictionnaire de classes dobjets de mdecine contenant 14.000 termes (surtout des noms de <maladies>). Ces outils permettent de reconnatre, tant donn un corpus de 10.000 lignes (6.019 phrases, 73.977 occurrences, 11.239 occurrences diffrentes, 5.917 hapax) 21, un total de 6.977 occurrences appartenant 3.829 formes canoniques. Au total, 1.273 formes canoniques sont classes comme appartenant au domaine de la mdecine. Environ une centaine peuvent tre considres comme des verbes appropris aux diffrentes classes du d omaine. Les adjectifs appropris au domaine sont environ 350. Or, il est intressant dobserver que, parmi les occurrences qui restent non identifies (environ 1.000 aprs avoir limin les fautes de frappe, les graphies non normalises e.g. majuscules sans accents et les noms propres 22), plus de 400 correspondent des formes adjectivales (adjectifs et participes). Il est donc possible quun effort particulier de description lexicographique reste faire pour les adjectifs, compte tenu de la richesse des possibilits drivationnelles existantes dans le domaine. Des inventaires dadverbes appropris simples et composs intervenir quirrgicamente, operacin a corazn abierto, administrar por va (tpica + rectal) ainsi que des dterminants nominaux appropris una crisis de, una dosis de seraient galement prvoir. 6.2. ... la reconnaissance des sens Les inventaires de formes ne constituent quun premier pas dans tout traitement automatique. En effet, laccs des lments de sens, si rudimentaires soient-ils, se rvle indispensable pour prvoir les proprits combinatoires des units lexicales et, a fortiori, pour procder leur dsambigusation en vue dapplications en documentation automatique ou en traduction assiste par ordinateur. Nous avons propros une bauche syntactico-smantique, en termes des classes dobjets, du domaine de la mdecine. Sagissant dun champ si vaste, il ne pouvait tre question que dun premier dbroussaillage constituant un cadre gnral o viendraient sinscrire des tudes plus dtailles de certains sous-domaines, dcrits partir des matriaux prsents dans des corpora textuels bien dlimits (e.g. Rassinoux et al., 1993). Il nous semble toutefois important dentamer de telles descriptions par une couche lexicale qui ne soit pas trop trangre la comptence linguistique dun locuteur non spcialiste, ce qui permet de fixer les principaux phnomnes linguistiques par recours des jugements de grammaticalit reproductibles. On allie ainsi le travail du linguiste celui du terminologue tout en laissant la porte ouverte des applications en enseignement/apprentissage des langues. Rfrences Blanco, Xavier (1997) : De las clases de objetos a las clases de predicados, Verba 24, p. 371-385. Blanco, Xavier (1998) : Les dictionnaires lectroniques de lespagnol (DELASs et DELACs), 17me Colloque Lexiques et Grammaires Compars, Guernesey 4-7 octobre 1998. Blanco, Xavier (sous presse) : Noms composs et traduction franais -espagnol, Lingvistic Investigationes. Buvet, Pierre-Andr ; Blanco, Xavier (1998) : Perspectives pour la traduction automatique des dterminants, 5me Confrence Annuelle sur le Traitement Automatique des Langues Naturelles, TALN 98, Paris 10-12 juin 1998. Cohen, Betty (1986) : Lexique des coocurrents. Bourse, conjoncture conomique, Montral : Linguatech. Gross, Gaston (1992) : Forme dun dictionnaire lectronique, Clas, A. ; Safar, H. (eds) : Lenvironnement traductionnel, Montral / Sillery : Aupelf-Uref, Presses de lUniversit du Qubec, p. 255-272.
20

Dictionnaire lectronique de langue gnrale qui permet la reconnaissance denviron 60.000 units lexicales simples de lespagnol et de leurs paradigmes flexionnels (Blanco, 1998). 21 Petit corpus dessai extrait de batteries de test servant la prparation de lexamen pour lobtention du M.I.R. (mdico interno residente) et couvrant 24 spcialits mdicales. 22 Certains dentre eux devront, cependant, tre rintgrs au systme sils font partie dponymes (e.g. maladie de Biermer), car ceux-ci doivent figurer dans le dictionnaire de noms composs. Signalons au passage que le recensement et la description des noms composs constituent une des tches les plus ardues de lactivit lexicograhique. Un premier glossaire contenant 5.000 composs ne nous a permis didentifier que 200 noms composs dans le corpus mentionn. Or des observations manuelles nous ont permis destimer plus de 6.000 les composs nominaux prsents dans le corpus.

10

Gross, Gaston (1994) : Classes dobjets et description des verbes, Langages 115, p. 15-30. Gross, Gaston (1996) : Prdicats nominaux et compatibilit aspectuelle, Langages 121, p. 54-72. Gross, Maurice (1981) : Les bases empiriques de la notion de prdicat smantique, Langages 63, p. 7-52. Harris, Zellig et al. (1989) : The Form of Information in Science. Analysis of an Immunology Sublanguage, Dordrecht / Boston / London : Kluwer Academic Publishers. Heid, Ulrich ; Freibott, Gerhard (1991) : Collocations dans une base de donnes terminologique et lexicale, Meta 36-1, p. 77-91. Labelle, Jacques (1986) : Grammaire des noms de maladie, Langue Franaise 69, p. 108-128. Le Pesant, Denis (1994) : Les complments nominaux du verbe lire. Une illustration de la notion de classe dobjets, Langages 115, p. 31-46. Lerat, Pierre (1995) : Les langues spcialises, Paris : PUF. Mathieu-Colas, Michel (1996) : Essai de typologie des noms composs franais, Cahiers de Lexicologie 69, p. 71-125. Melcuk, Igor ; Clas, Andr ; Polgure, Alain (1995) : Introduction la lexicologie explicative et combinatoire, Louvain-la-Neuve : Duculot. Pustejovski (1991) : The Generative Lexicon, Computational Linguistics 17: 4, p. 409-441. Rassinoux, Anne-Marie et al. (1993) : Analyse multilingue et reprsentation du contenu informationnel des textes mdicaux, Bouillon, Pierrete ; Clas, Andr (eds) : La traductique, Montral : Les Presses de lUniversit de Montral ; AUPELF-UREF, p. 454-468.

11

Anda mungkin juga menyukai