Anda di halaman 1dari 82

Rint

Rseau international de nologie et de terminologie

Nouveaux outils pour la nologie


Afrique centrale et de lEst Afrique de lOuest Canada Communaut franaise de Belgique France Hati Madagascar Maroc Qubec Rpublique centrafricaine Suisse Tunisie Union latine

20
Revue semestrielle codite par lAgence de la francophonie et la Communaut franaise de Belgique N 20 dcembre 1999

Terminologies nouvelles

Sommaire

Introduction
Nouveaux outils pour la nologie par Louis-Jean Rousseau et Loc Depecker Page 2

Nologie traductive par Adrien Hermans et Andre Vansteelandt Page 37 Nologie et terminologie: activits et rexions par Danielle Candel Page 44 La conversion et linterface innitif/impratif/nom dans la terminologie du micro-ordinateur par Emmanuel Aito Page 54 Nologismes, internationalismes et mondialisation par Alessio Petralli Page 60

En bref
Nouvelles du Rint Page 72 Publications Page 75

Contributions
Recherches nologiques sur Internet par Cline Tucat et Loc Depecker Page 4 Cenit : Systme de dtection semiautomatique des nologismes par Sorcha Roche et Lynne Bowker Page 12 Utilisation dune banque de textes en terminographie par Anouk Jaccarini Page 17 Recherche terminographique semiautomatise en veille terminologique: exprimentation dans le domaine mdical par Marie-Claude LHomme, Claudine Bodson et Renata Stela Valente Page 25

Sommaire

Prsentation

Nouveaux outils pour la nologie

L
( 1 ) Nouvelles technologies de linformation et de la communication.

Prsentation

a socit de linformation offre un monde en expansion constante caractris par la gnralisation de lusage des NTIC ( 1 ). Cette rvolution de linformation bouleverse les contenus linguistiques en mettant la disposition des utilisateurs un volume de donnes textuelles qui semble sans limite, ouvrant ainsi un immense champ lexicographique et terminographique, grce aux rseaux de type Internet. Le volume de linformation rendue disponible simultanment fait peur plus dun, la question majeure tant : comment se retrouver dans ces ux dinformations ? Compte tenu du potentiel extraordinaire quoffrent ces trsors dinformation et de connaissances dans tous les domaines du savoir, le Rseau international de nologie et de terminologie (Rint ) a dcid de faire le point sur leur exploitation dans les travaux sur la nologie, en regard des nouveaux outils la disposition des utilisateurs, quils soient spcialistes la recherche de linnovation, terminologues qui assurent la collecte et le traitement des nologismes ou simples utilisateurs de terminologie. Le Rint veut ainsi tenter de rpondre de nouvelles questions thoriques et

pratiques sur la nologie et aider les terminologues se retrouver dans le foisonnement des possibilits et des outils ainsi offerts. Il a pour cela mobilis les chercheurs et spcialistes susceptibles dintervenir dans le domaine de la veille nologique an de dgager des orientations mthodologiques sur ces questions dont les plus frquentes sont: comment retrouver un nologisme, dans quelle( s ) langue( s ), par quel moyen, grce quel instrument, etc. Ce sont l des problmes rencontrs par toute personne qui recherche le sens dun nologisme, une attestation able, un contexte pertinent, un quivalent possible, ou encore des donnes conceptuelles susceptibles de contribuer la dnition, etc. De multiples points de vue sont voqus ici, de la recherche proprement dite dune dsignation nologique ou dun nouveau concept, la gestion des ressources linguistiques de nature nologique. Le Rint a, comme son nom lindique, vocation cela. Cr en 1986 par le premier sommet des chefs dtats et de gouvernements francophones, le Rseau international de nologie et de terminologie francophone se compose de spcialistes de la nologie et de la terminologie appartenant des organismes vocation linguistique. Depuis sa cration, cette organisation na cess de se pencher sur ces

Prsentation

Prsentation

questions. Le Rint a contribu crer une rexion en nologie sur le franais, sur les langues partenaires de la francophonie et sur leurs rapports mutuels. Il sest efforc de dvelopper des mthodologies dans ce sens, de mobiliser au l de nombreuses rencontres scientiques, et de susciter llaboration de plusieurs outils pour la veille nologique. Parmi les outils les plus reprsentatifs, il est possible de citer Adepte-Nomino ( 2 ), qui est un logiciel dextraction terminologique. Plus directement lie la nologie est la banque de donnes dattestations de nologismes, Balno, cre par le Rint pour favoriser lchange et la mise en commun de matriaux nologiques et dont le systme est implant lUniversit de Rennes. Balno est une base de concentration alimente par des relevs de nologismes effectus aux quatre coins de la plante. Les nologismes sont intgrs distance par Internet. Cette base de donnes est mise gratuitement ( 3 ) la disposition de tous ceux qui souhaitent lalimenter ou en utiliser le contenu, notamment pour la mise jour des dictionnaires et des banques de terminologie. Lune des priorits qui se dessinent, et que lon dcouvrira dans ce numro de Terminologies nouvelles, est de pouvoir accder aux nombreux textes et contextes diffuss sur Internet. Comme la mis en vidence le numro 19 de Terminologies nouvelles, consacr au thme terminologie et intelligence articielle , une nologie de corpus se dveloppe actuellement, fonde sur les immenses masses de textes circulant sur les rseaux. Ce retour une dmarche terminologique fonde sur lanalyse des textes, lieu de cration, de description et de dnomination des nouveaux concepts, rend ncessaires lutilisation de nouveaux outils et limplantation de pratiques renouveles pour la nologie et la terminologie, car nologie et

terminologie sont trs lies sitt que le travail sapplique des domaines de pointe. En dpit de ces ux absolument indits, les moteurs de recherche, dont certains sont dcrits ici, autorisent de plus en plus une recherche nologique able et rapide. Ils permettent, pour certains, de localiser en quelques secondes un nologisme, den cerner le sens grce au contexte, en fournissant ventuellement, lorsque le document est riche, lquivalent dans une autre langue. Ce foisonnement textuel sans prcdent nest cependant pas sans risques ou sans cueils pour le terminologue. Comment choisir les textes ? Quels sont les textes ables, tant sur le plan scientique et technique que sur le plan linguistique ? Comment assurer la gestion de ces donnes textuelles? Voil quelques-unes de questions quil faut rsoudre par de nouvelles rexions mthodologiques. De plus, la relle interactivit que procure Internet sous la forme notamment de forums et de listes de diffusion permet dinterroger des personnes de tous les continents en laissant esprer une rponse ou un dbut de rponse. Ce sont plusieurs de ces possibilits qui sont explores dans ce numro de Terminologies nouvelles. Que les contributeurs en soient remercis, qui ont travaill pour ce numro sans lurgence et la dynamique quaurait pu reprsenter un colloque scientique. Quils aient rpondu cet appel montre cependant que le Rint a su susciter rexions et nergies de par le monde. Mais cest certainement une diffusion accrue de la langue franaise sur des rseaux de type Internet qui permettra daccder la nologie du franais daujourdhui, quil soit dEurope, dAmrique, dAfrique ou dAsie. Un grand effort dans ce sens reste faire pour les langues partenaires de la francophonie. Le

millnaire qui commence les verra prendre pied aussi dans la socit de linformation pour peu que safrme dans ce sens une relle volont politique. Louis-Jean Rousseau, Secrtaire gnral du Rseau international de nologie et de terminologie, Ofce de la langue franaise, Qubec. Loc Depecker, Prsident de la Socit franaise de terminologie, Universit de la Sorbonne nouvelle, Paris III-Crettal.

( 2 ) Anciennement : Termino ( 3 ) On peut accder Balno partir du site Internet du Rint, dont ladresse est la suivante : http://www.rint.org.

Contributions

Recherches nologiques sur Internet

Le but de cet article est de montrer, aprs cinq annes dutilisation active dInternet, le prot quil est possible de tirer de son utilisation dans le cadre de recherche en traduction, en terminologie / nologie et en rdaction technique. Durant ces annes de mise en place sur Internet de ressources informationnelles et linguistiques de par le monde, il est devenu difcile de trouver facilement et rapidement ce que lon cherche dans ltonnant foisonnement de linformation quest devenu Internet. Cet article a pour but daider les utilisateurs sorienter plus aisment dans ces ddales en leur indiquant et conseillant les pistes qui nous semblent les plus efcaces ce jour. Termes-cls : nologie, Internet, moteur de recherche, corpus, banque de terminologie.

1 Introduction
a question de la nologie acquiert une dimension nouvelle dans le cadre de la socit de linformation, en raison de la masse des nologismes et concepts qui circulent et de la difcult y accder. Dans cette perspective, la nologie revt un nouvel aspect, notamment dun point de vue informationnel. Cest pour cette raison quil est ncessaire dexploiter les outils existants pour accder linformation nologique et ventuellement den crer de nouveaux. Cet article sattachera essentiellement quelques-unes des possibilits quoffre Internet aujourdhui dans le but dtre utile aux personnes qui commencent naviguer sur Internet. Nous traiterons de la nologie, particulirement scientique et technique, en faisant cette distinction : un nologisme est constitu dune forme linguistique ( dsignation ) et dun concept ( unit de pense ). La question de la recherche de nologismes peut ainsi se poser au moins de deux faons: Pour un concept nouveau, chercher dans une langue son ou ses quivalents linguistiques sans avoir sa dsignation ;

Pour un concept nouveau et partir dau moins une dsignation dans une langue, chercher dans dautres langues des quivalents linguistiques. Dans le premier cas, il sagit dun travail de terminologie proprement dit puisque lon part du concept et que lon va vers le signe linguistique dans une langue. Dans le second, il sagit surtout dun travail de nologie orient vers la traduction.

2 Les outils de recherche sur Internet


Traditionnellement, le tlphone et lannuaire qui laccompagne constituaient le meilleur des dictionnaires : rien de mieux que davoir au bout du l un spcialiste du domaine. Et sans doute, le tlphone, tout rudimentaire quil apparaisse, reste le meilleur des dictionnaires de nologie. Mais on peut tout de mme aller plus loin: en effet, Internet et plus particulirement les listes de diffusion ou les forums de discussion spcialiss reprsentent aujourdhui le prolongement du questionnement par simple appel tlphonique. Le tout est de savoir ce que lon cherche et qui est lautre bout.

Contributions

Contributions

2.1 Comment faire une recherche efcace ?


Il existe aujourdhui plusieurs dizaines de moteurs de recherche sur Internet. Une mme recherche lance sur ces outils ne donnera pas les mmes rsultats et, dun jour lautre, ceux-ci pourront tre diffrents. On peut distinguer comme principaux types de moteurs de recherche : les robots dexploration qui parcourent les sites serveurs Internet et cumulent des masses dinformations dans des banques de donnes interrogeables grce des moteurs de recherche tels que Lycos, Alta Vista, etc. les catgoriseurs tels que Live Topics sur Alta Vista qui limitent la recherche laide de critres prcis ; les catalogues sujets qui sont des rpertoires labors par des professionnels qui visitent, valuent et classent les ressources disponibles sur Internet ; les mta-index ou mta-moteurs qui permettent, partir dun seul formulaire, deffectuer une recherche dans plusieurs index la fois. Cependant, mme si ces distinctions sont utilises, les diffrences entre ces divers outils sont relativement uides. La question de la recherche sur Internet se rsume le plus souvent un problme documentaire. Et une recherche est efcace lorsquelle procure uniquement les documents souhaits. Les outils de recherche gnraux peuvent savrer frustrants. En effet, on se fait difcilement une ide claire sur la couverture de la banque dans laquelle la recherche est lance, ou sur son indexation. De plus, le mode de fonctionnement de la recherche nest pas toujours clairement prsent. Il convient cependant de se familiariser progressivement avec diffrents outils an de mieux juger des chances de

trouver ce que lon cherche. De mme, les possibilits dinterrogation diffrent dun outil lautre, do le besoin, l encore, de se familiariser avec les procdures de recherche. En ce qui concerne les langues slectionner, il faut savoir si le moteur de recherche est francophone ou international: en effet, pour le premier, le mot cl sera en franais alors que pour le second, il faudra partir dune autre langue, gnralement langlais. En tout tat de cause, il est difcile de rechercher un nologisme partir du mot cl nologie . Ainsi, une interrogation lance le 18 mars 1999 sur le moteur de recherche Voil de France Tlcom ne proposait pas moins de 698 rponses. Il faut donc interroger partir de ce que lon cherche. Mais cest l aussi le plus difcile puisque la mthode de la recherche varie selon la connaissance que lon a du concept. Certains critres sont essentiels pour faire une recherche efcace. Il vaut mieux partir dun ou plusieurs mots cls relativement prcis et non dun terme trop gnrique. Il est possible de les mettre entre guillemets, lesquels indiquent au moteur de recherche que les rsultats devront comporter ces termes dans lordre o ils ont t entrs. On peut aussi utiliser les oprateurs boolens ou logiques, cest--dire AND, OR et AND NOT. AND indique au moteur de recherche que le mot situ derrire devra obligatoirement gurer dans la rponse, OR quil pourra y gurer et AND NOT quil ne devra en aucun cas y gurer. Ces oprateurs sont gnralement traduits en franais par ET, OU et SAUF sur les moteurs de recherche francophones tels que Nomade, Yahoo France, etc. Par exemple, si la recherche porte sur la manire dorthographier Euroland , il faudra entrer dans la bote de dialogue euroland* . Ainsi, une recherche lance sur Alta Vista le 10 avril 1999 ne donnait plus que 200 rponses, sachant que la majorit

des sites tait ddie la parit des monnaies des pays de la zone Euro. Cependant, plusieurs sites permettent de retrouver Euroland dans son contexte journalistique et un site tait consacr au problme Euroland ou Eurolande ? De la mme manire, si lon recherche des informations ou un quivalent franais dun anglicisme nologique encore peu rpandu, on peut tenter dinterroger partir de sa forme mme. Par exemple, pour langlicisme job rotation, recherch sur Internet le 18 avril 1999, 13 rponses apparaissent sur Voil, 8 sur Alta Vista et 10 sur Excite. Lquivalent franais propos dans plusieurs articles est rotation des postes. La frquence de lunit nologique propose, rcurrente dans divers contextes de rfrence, donne ainsi un bon critre dapprciation. Ce genre de critre commence tre utilis de manire systmatique, notamment en France, par les commissions de normalisation terminologique. Il est en revanche beaucoup plus difcile de chercher une dsignation partir de sa dnition suppose. Si lon connat la dnition mais que lon ne sait pas quelle dsignation elle correspond, la stratgie de la recherche est diffrente : en effet, il faudra formuler une recherche laide doprateurs boolens et partir des caractres du concept prsents dans la dnition. Le plus facile, apparemment, est de chercher un nologisme dans un domaine trs spcialis. En gastro-entrologie par exemple, la pancolite est une atteinte inammatoire de la totalit du colon. Les mots cls, cest--dire les caractres essentiels du concept numrs, seront inammation et colon . Lalgorithme boolen sera le suivant : ( colon AND inammat* ) AND colon. Ainsi, une recherche lance sur Alta Vista le 2 juillet 1999 a donn 19 sites spcialiss en gastroentrologie et plus particulirement sur les maladies inammatoires de
5

Contributions

lintestin. Certains de ces sites sont spcialiss dans le domaine de ce type dinammation, et dans deux dentre eux on trouve une dnition constitue de la pancolite.

on pourrait retenir la rpartition suivante :

2.2.1 Les moteurs dexploration


On peut trouver la liste des moteurs dexploration en posant la question outils de recherche un moteur de recherche francophone ou Search engine un moteur anglophone. Il est galement possible daller directement sur le site appel Toile du Qubec o les moteurs les plus performants sont rpertoris. Ces outils explorent des banques constitues automatiquement par des robots informatiques visitant les sites serveurs W3. Les frquences de mise jour varient selon les outils, cest pourquoi un grand nombre dadresses URL savrent primes dans les rsultats des recherches. De plus, mme si le bruit y est relativement lev, le volume des donnes signales est trs important. Parmi les moteurs de recherche les plus immdiatement utiles pour des recherches dordre gnral, on peut citer: Alta Vista ( http://www.altavista.com) Ce site est lun des plus performants, tant pour son vaste contenu que pour sa procdure de recherche. Il offre la possibilit de rechercher dans deux banques distinctes : The Web pour les pages des sites W3 et Usenet pour les forums de discussion. Il offre deux niveaux de recherche : simple query et advanced query , toutes deux documentes par des pages daide. Ce deuxime type de recherche est destin des recherches spciques qui ncessitent lutilisation des oprateurs boolens: ainsi, dans la bote de dialogue Search , on entrera le concept rechercher, et dans la bote Boolean Expression , on indiquera les termes auxquels la recherche doit se limiter. On cerne ainsi la dsignation rechercher et la dnition correspondante. Alta Vista indexe le contenu entier des documents mais le bruit y

2.2 Description des divers moteurs de recherche


Il y a ici au moins deux tapes respecter : Ltape du formulaire : les moteurs de recherche proposent lutilisateur entrant sur un site un ou plusieurs formulaires. Un formulaire est un cadre de discussion ( bote de dialogue ) intgr une page de la toile. Il permet dindiquer les critres de recherche : dans quelle langue lancer la recherche, sur combien de temps recueillir les rsultats, quexclure priori dans la collecte, etc. Des explications souvent trs prcieuses sont fournies quant lutilisation de ces formulaires : conseils pour restreindre la recherche, pour lemploi des oprateurs boolens, des parenthses, etc., ce qui permet de structurer et dafner la formulation de la question. Cette tape est cruciale pour lancer une recherche. En effet, tous les moteurs insistent sur les degrs de prcision de la recherche envisage et sur la bonne formulation de la question. Ltape de la consultation des rponses aux questions les plus frquemment poses sur le site par les utilisateurs. Ce sont les FAQ ( Foire Aux Questions ou Frequently Asked Questions ), qui sont souvent dun trs grand intrt. Ces deux tapes essentielles montrent lintrt quil y a exprimenter plusieurs moteurs de recherche et apprendre connatre leurs qualits et leurs limites. Nous nous en tiendrons ici aux outils qui paraissent les plus performants pour la recherche nologique. Si lon veut classer les outils en grandes catgories,

reste lev. Cest pourquoi le catgoriseur Live Topics, disponible uniquement sur le site amricain dAlta Vista, peut tre trs utile : il effectue en effet une analyse statistique des mots contenus dans les documents slectionns par la requte et dresse la liste des vingt termes les plus reprsents. An de restreindre les rsultats, il suft dindiquer require ou exclude en face de chaque terme. HotBot ( http://www.HotBot.com ) Avec 10 millions de pages W3 indexes par jour, ce moteur de recherche amricain se prsente comme le robot le plus rapide du monde . Linterface dutilisation est particulirement bien dveloppe et dote dune fonction daide exceptionnelle. Il propose plusieurs modes de recherche et permet lutilisation doprateurs boolens et de parenthses. Il est galement possible de limiter la recherche en ajoutant des critres secondaires, procdure similaire Alta Vista ( Advanced Query ). Infoseek ( http://www2.infoseek.com ) Il a dsormais deux modes: ultrasmart et ultraseek . Le premier est un formulaire dinterrogation coupl un rpertoire. Le second ninclut que le formulaire. Les traditionnels oprateurs boolens AND et AND NOT sont ici remplacs par les signes + et - : en prcdant le mot dun + , on obtient le ET, le - donne le SAUF. Par exemple, si on entre le terme culture , le document peut contenir le mot culture ; avec +culture , le document doit contenir ce mot ; avec -culture , le document ne doit pas contenir ce terme. Lycos ( http://www.fr.lycos.de ) Comme la plupart des moteurs, Lycos afche un formulaire simple dans lequel indiquer llment rechercher. Pour une recherche avance, il suft de cliquer sur

Contributions

Search Options mais la recherche boolenne est minimale et peu documente. La rponse peut se limiter un maximum de 40 documents. Enn, se cre de plus en plus des sites thmatiques : on peut, pour le monde des affaires, citer : Open Texts Livelink Pinstripe ( http://pinstripe.opentext.com ) Cet outil est mis trs rgulirement jour et met laccent sur lindexation du texte intgral des pages W3. La recherche boolenne est efcace, avec deux niveaux de recherche : Simple Search et Power Search pour des recherches boolennes plus complexes avec possibilit de spcier pour chaque terme dans quel champ effectuer la recherche. Chaque mode de recherche est explicit dans des pages daide.

le franais : http://www.yahoo.fr langlais : http://www.yahoo.com lallemand : http://www.yahoo.de lespagnol : http://www.yahoo.es litalien : http://www.yahoo.it ainsi que plusieurs autres Yahoo spcialiss par langue ou rgion, proposs en bas de la page daccueil. La recherche seffectuant par sujets, les sites trouvs sont gnralement lis la demande formule. Si les rsultats ne conviennent pas, il est possible dtendre la recherche sur Alta Vista en cliquant sur le lien Alta Vista au bas de la page. La Toile du Qubec ( http://www.toile.qc.ca/ ) Ax sur les sites qubcois ou francophones, ce site propose des moteurs de recherche spcialiss. Il est efcace pour la nologie du franais dans des domaines bien prcis. Ces moteurs sont en ralit des catalogues multimoteurs, cest--dire des moteurs de recherche qui lancent sur diffrents moteurs la question pose: il sagit de All-in-One Search, BotsSpot, CUSI at Internet Direct et NetSearch. Par exemple, NetSearch propose dutiliser Excite, Yahoo, Lycos, Infoseek, etc. pour effectuer la mme recherche. Excite ( http://www.excite.com ) Ce moteur de recherche francophone et international effectue des recherches non seulement par mots cls mais aussi par concepts. Dans ce cas, Excite recherche non seulement des sites qui correspondent exactement la question pose mais aussi des sites qui sy rattachent. Par exemple, si lon recherche des informations sur les fonds de pension des retraits, Excite indiquera galement, dans ses rsultats, les sites traitant de la condition conomique des personnes ges. Dans le cas dune recherche par mot cl, Excite propose dajouter des termes se rattachant au mot indiqu dans le formulaire : si lon tape terminologie, Excite propose, pour afner la recherche, dajouter des

termes comme traduction, termes, etc.

2.2.3 Les mta-index


Quelques outils permettent deffectuer une recherche dans plusieurs index la fois partir dun seul formulaire. Ainsi, une mme requte peut tre envoye simultanment plusieurs banques de donnes et le mta-index fera la collection des rsultats. De par leur nature, ces systmes peuvent savrer plutt lents et ne tirent gure prot des possibilits particulires de certains outils de recherche. Ils permettent cependant davoir des rsultats plus varis que si la recherche tait lance sur un seul moteur. SavvySearch ( http://www. savvysearch.com ) Site franco-anglais qui peut accder prs dune trentaine de banques de donnes, il rassemble les rsultats des diffrents moteurs de recherche en indiquant ceux quil juge les plus pertinents. De plus, il synthtise linformation en supprimant toutes les donnes redondantes. Grce ce mta-index, en tapant nologie , on peut facilement et rapidement avoir accs, par exemple, aux nouveaux termes publis au Journal Ofciel de la Rpublique Franaise en allant sur le site de la Commission gnrale de terminologie (accessible par ailleurs sur http://www.culture.fr ). MtaCrawler ( http://www.go2net. com/search.html ) Aussi intressant que le prcdant, ce site de recherche anglophone se limite aux neuf outils de recherche suivants : Excite, WebCrawler, Lycos, Alta Vista, Infoseek, Thunderstone, Yahoo, LookSmart et The Mining Co. Le systme possde une option Java permettant de contrler lexcution
7

2.2.2 Les catalogues sujets pourvus dun moteur de recherche


Ce sont des catalogues dans lesquels les ressources Internet sont classes par sujets dont certains dentre eux sont interrogeables laide dun formulaire. Il sagit de rpertoires produits par des professionnels qui visitent, valuent et classent les ressources de leurs domaines de comptence. Le contenu de leurs bases est moins considrable que celui amass par un robot, mais leurs bases sont plus cohrentes et posent moins de problmes de bruit au moment de la recherche. En effet, les informations sont organises hirarchiquement, de la plus pertinente la moins pertinente. Yahoo ! Yahoo est un excellent cataloguesujet dot dune interface de recherche performante. Il faut savoir que ce moteur est surtout efcace si lon recherche une information gnrale sur un sujet. Yahoo est subdivis selon les langues :

Contributions

de la recherche, ainsi quun mode de recherche rapide. Starting Point ( http://www.stpt.com ) Cest un semi-mta-index combinant un rpertoire et un formulaire dinterrogation. Il permet lutilisation doprateurs logiques. Une fois les mots cls fournis au systme, le systme afche une liste de catgories et doutils de recherche. Il suft de slectionner lun deux, les mots cls tant automatiquement transfrs.

cours sur la terminologie et la rdaction spcialise. Etis ( http://www.unilat.org/ dtil/etis/index1.htm ) Ce serveur europen de terminologie est aliment par les institutions internationales les plus actives en matire de terminologie. Ce site permet, grce de nombreux liens, la consultation dun grand nombre de ressources aussi bien en terminologie quen traduction. En effet, il propose des bases de donnes classs par pays, des dictionnaires en ligne et des sites de terminologie qui prsentent des dictionnaires, lexiques et glossaires, etc. Le site de lOMS ( http://who.int/ pll/cat/tao_ressources.html ) Ce site, et plus particulirement son unit de traduction assiste par ordinateur, propose la consultation de deux glossaires sur les maladies et le paludisme. De plus, il offre un service de traduction des termes de la sant et propose des dictionnaires multilingues sur lanatomie, le cancer, le sida, etc. Enn, le service de terminologie technique de lOMS propose une liste de ressources terminologiques de la sant disponibles sur Internet en franais, anglais et espagnol. Plusieurs liens permettent daccder des glossaires lectroniques, des bases de donnes terminologiques et aux documentations en ligne de lONU et de lUnion europenne. Le CRTT ( Centre de Recherches en Terminologie et Traduction de lUniversit de Lyon II ) ( http://www.univ-lyon2.fr/langues/ LEA/LEA_RCH2.htm ) Le CRTT propose des liens prcieux vers des sites traitant de lexicologie, de terminologie et de traduction. Il informe galement sur les nouveauts en terminologie, les colloques organis par le CRTT et propose une liste des divers organismes de normalisation francophones et internationaux.

3 Les sites utiles la nologie


3.1 Les sites de ressources en terminologie / nologie
En entrant les mots cls glossaire, lexique, terminologie, nologie , etc. il est possible daccder de nombreux documents spcialiss sur un thme, dictionnaires, glossaires, lexiques, aussi bien en franais que dans dautres langues. Les sites sont classs ici en fonction de la masse actuelle des donnes de chacun dentre eux. Termisti ( http://www.refer.org/termisti ) Ce site, cr par lInstitut suprieur des traducteurs et interprtes de Bruxelles, est actuellement lun des plus intressants sur les questions de terminologie et de nologie. Il propose la consultation de glossaires multilingues raliss par les tudiants en quatrime anne lInstitut. Pour consulter la che du terme recherch, il suft de cliquer sur celui-ci dans le lexique de la langue voulue. Ce site offre galement une liste trs intressante de ressources terminologiques interactives tels que les bases de donnes consultables, les rseaux, centres et organismes de terminologie, les listes de diffusion et forums de discussions , ainsi que des
8

Le Crettal ( http://www.tele3.net/ terminologie/memoires.htm ) Y est particulirement intressante la consultation de mmoires de terminologie raliss par des tudiants de matrise LEA, option traduction spcialise, dans le cadre de lenseignement de terminologie de Paris III. Ces glossaires se prsentent sous la forme de ches accessibles en cliquant sur le terme du lexique. Ce site offre aussi la possibilit de consulter les cours sur la terminologie, des dictionnaires multilingues comme celui de linformatique, ainsi que les cours de traduction diffuss sur la chane tlvise franaise La Cinquime. Le Lilla ( Laboratoire dingnierie linguistique et de linguistique applique de lUniversit de Nice Sophia Antipolis (http://www.lilla2. unice.fr ) Cest un site trs original qui propose la cration en ligne, de faon automatique, de nologismes correspondant la morphologie des langues latines. Le nologue de lan 2000 peut ainsi crer des nologismes en partant dun prxe, dun sufxe ou dune base morphologique. Le site donne aussi la dnition des nologismes quil a recenss.

2.2 Les banques de terminologie en ligne


Cr par le Rint (Rseau international de nologie et terminologie francophone : http://www.rint.org ), Balno a t la premire base de donnes dattestations nologiques sur Internet. Elle a pour but de collecter, changer et diffuser les nologismes partir de relevs effectus par des quipes de recherche francophones ou travaillant sur le franais. Balno offre deux types de consultation : la consultation simple ou la consultation experte. Avec la premire, on peut, ou consulter la

Contributions

liste de tous les nologismes rpertoris dans la base de donnes dattestations nologiques, ou faire une recherche partir dun terme prexistant. Ainsi, pour le terme acide , acide* indique que lon recherche tous les nologismes qui commencent par acide ; *acide*, que lon recherche ceux qui contiennent ce terme; enn, *acide, que lon dsire consulter ceux qui se terminent par ce mot. Termium (http://termium.pwgsc.ca/) La banque de donnes bilingue franais-anglais du Gouvernement du Canada a beaucoup volu ces derniers temps. Elle stend sur de nouveaux domaines et depuis peu vers dautres langues, particulirement lespagnol, en raison de limportance que prend cette langue dans la construction du grand march amricain. La Base de donnes terminologiques du Cilf ( Centre international de la langue franaise: http://www.cilf.org/bt.fr.html ) Le Cilf propose une banque de terminologie en ligne. partir du terme recherch, de la langue et du dictionnaire spcialis dans lesquels on souhaite effectuer la recherche, on accde une liste de mots; en cliquant sur lun dentre eux, on accde sa che qui donne ses quivalents en franais, anglais, allemand et espagnol, son domaine dapplication et sa dnition. Euterpe ( ParlementEuropen ) ( http://germany.trados.com :4712/MT W_LOGON ) et Eurodicautom ( Commission Europenne ) ( http://www2.echo.lu/eurod/ ) Constitu au sein des institutions de lUnion europenne, ces bases proposent des dictionnaires interactifs multilingues qui donnent la dnition du terme et sa traduction dans la langue cible choisie au dbut de la requte. Ce sont des bases trs riches pour toute terminologie

entrant dans les textes rglementaires de lUnion europeene. Iloterm ( http://ilis.ilo.org/ilis/ ilisterm/ilintrte.html ) Site de lOrganisation internationale du travail, Iloterm est une base de donnes terminologiques quadrilingue gre par lunit de terminologie et de rfrences du service des documents ofciels. Elle traite des domaines du travail et des questions sociales; les termes y gurent en anglais avec leurs quivalents franais, espagnol et /ou allemand. De plus, moyennant un abonnement, on peut avoir accs au thesaurus traitant de la terminologie du travail, de lemploi et de la formation. Termite ( http://www.itu.int/ ITU_Databases/Termite/index.html) Cette base de donnes de lUnion internationale des tlcommunications recense les termes gurant dans les glossaires publis par cet organisme depuis 1980 et les termes plus rcents ayant trait aux diverses activits de lUnion internationale des tlcommunications. Le Grand dictionnaire terminologique ( http://www.lgdt.cedrom_sni.qc.ca/ ) Ralis par le Gouvernement du Qubec, le Grand dictionnaire terminologique est disponible sur cdrom et depuis peu sur Internet moyennant un abonnement. Il est compos dune banque de terminologie de plus de trois millions de termes techniques et dune banque documentaire sur les travaux rcents effectus en terminologie et nologie. Parmi les nouveaux prvoir, gure le site Internet de lInstitut national de la langue franaise ( Inalf ), qui devrait tre oprationnel en lan 2000. On pourra y consulter des bases de textes, des dictionnaires et la base dattestations nologiques Borno.

2.3 Les organismes de terminologie


Le Rint, cr en 1986 lors du premier sommet de la Francophonie, regroupe des organismes francophones vocation terminologique et a pour vocation, entre autres, dencourager la cration terminologique en langue franaise, de diffuser les travaux de nologie, et de rpertorier les terminologies nouvelles. Le site du Rint propose la consultation de sa revue Terminologies nouvelles, de Balno, une liste de publications et un inventaire de ressources terminologiques. Le site de la DGLF ( Dlgation gnrale de la langue franaise: http://www.culture.fr/culture/dglf ) est intressant car il propose une compilation des messages reus sur diffrentes listes de diffusion. Il sagit des propositions faites par des professionnels abonns ces listes pour traduire des termes trangers ou dsigner en franais des notions dapparition rcente. Ces documents ont une valeur dinformation et non de recommandation ofcielle. Realiter ( Rseau panlatin de terminologie ) ( http://www.iula.upf.es/ cpt/cptfr.htm ), rassemble des personnes, institutions et organismes de pays de langue latine impliqus dans des travaux de terminologie et de nologie. Outre des informations permanentes et les travaux en cours, ce site propose des outils de travail en nologie et terminologie dans ces langues. Lun des buts est de crer sur des formants identiques des nologismes communs dans les langues latines. Riterm ( http://www.iula.upf.es/ riterm/ritermes.htm), rseau ibroamricain de terminologie, propose un site en espagnol et portugais. Ses objectifs consistent dvelopper les activits de terminologie au niveau ibro-amricain, tablir un rseau de
9

Contributions

coopration entre les diffrents agents terminologiques pour changer les informations ncessaires an de renforcer les terminologies espagnoles et portugaises.

4 Les sites daide la traduction


4.1 Les dictionnaires
Nous ne dtaillerons pas ici le contenu de tous les dictionnaires auxquels il est possible daccder mais nous proposerons plusieurs adresses intressantes pour le traducteur. Citons tout dabord http://www.facstaff.bucknell.edu/ rbeard/diction.html qui propose laccs un nombre impressionnant de dictionnaires en ligne en diffrentes langues. On peut ainsi trouver, en franais, des dictionnaires gnraux mais aussi des dictionnaires plus ou moins spcialiss tels quun glossaire informatique des termes de la commission ministrielle de terminologie informatique, des microglossaires multilingues, un dictionnaire du cheval, etc. Il est galement possible davoir directement accs aux dictionnaires franais grce ladresse suivante : http://www.facstall.bucknell.edu/ rbeard/diction3.html#french Trs utiles galement sont les signets des traducteurs ( http://www.wo.int/pll/cat/Translator Bookmark.html ), qui proposent laccs des banques de donnes anglophones et francophones, des ressources terminologiques, des dictionnaires gnraux et spcialiss, unilingues ou multilingues, des lexiques, des glossaires et qui permettent la consultation de plusieurs bibliothques europennes. Ladresse suivante : http://fp3.com/ljm ( Le juste mot ; glossaires et lexiques ) prsente une liste de glossaires et lexiques franais
10

abordant tous les domaines classs par thmes principaux puis en sousdomaines et tris alphabtiquement. Il est possible deffectuer une recherche partir dun mot cl ou dun domaine. Il existe aussi des liens qui renvoient vers des dictionnaires pour traducteurs. Il faut galement signaler que Termisti, voqu plus haut, propose une liste de dictionnaires utiles la traduction. Il est aussi possible de rechercher soi-mme le dictionnaire grce aux divers moteurs de recherche tels que Yahoo ou Alta Vista, mais en prenant soin dindiquer les mots cls. La recherche boolenne savre alors la plus apte produire les rsultats dsirs.

4.2 Les listes de diffusion et les forums de discussion


Les listes de diffusion permettent un groupe de personnes de communiquer sur un thme donn par lintermdiaire du courrier lectronique. Les messages sont distribus tous les participants par un automate. Elles sont donc utiles la terminologie, la nologie et la traduction, tant donn quil est possible davoir non seulement une rponse la question pose, mais aussi lavis dun spcialiste voire dune communaut de spcialistes. Prenons lexemple de Termilat ( termilat@francenet.fr), liste lectronique de diffusion sur la terminologie et les industries des langues en langues nolatines. Y circulent des demandes de traduction en langues trangres, des informations, des offres de collaboration dans les travaux terminologiques. Cette liste est soigneusement contrle an que seuls les messages pertinents soient envoys aux usagers de la liste. Elle est en expansion constante et cre une dynamique extraordinaire entre ses diffrents acteurs.

Citons aussi la liste de diffusion TLS ( http://www.uhb.fr/Langues/ Craie/tls/tls.html) destine diffuser des informations se rapportant la terminologie et qui met en uvre un systme de questions-rponses sur des problmes terminologiques et nologiques. Oriente vers la traduction vive et spcialise, cette liste permet de rpondre dans lurgence des questions portant sur un terme ou sur son quivalent dans une langue. Les forums de discussion ont les mmes objectifs que les listes de diffusion : des spcialistes rpondent une question donne. Cependant, ce systme peut savrer plus rapide tant donn que la discussion peut se faire en ligne plutt que par envoi de courriel ( e-mail ). Parmi les forums de terminologie, citons Logos ( http://www.logos.it/forumgen.html ) et sci.lang ( http://news:sci.lang ). Ces forums de discussion sont prcieux car ils permettent aux spcialistes dun domaine de dbattre dun point. Ils offrent galement loccasion rve par un traducteur de stablir un impressionnant rseau dinformateurs. Il est donc vident quils peuvent aider, comme les listes de diffusion, la nologie parce quils permettent dobtenir une rponse la question pose et non une autre, et de recueillir lavis de spcialistes, voire dune communaut large de spcialistes selon un dbat contradictoire.

5 Conclusion
Le nologue chercheur ou le nologue en herbe dispose ainsi de plusieurs grands types doutils performants pour la nologie: Des rpertoires de nologismes en ligne inclus le plus souvent dans des dictionnaires, lexiques et banques de donnes ;

Contributions

Des moteurs de recherches qui orientent vers et dans des donnes textuelles ; Des extracteurs de termes ventuellement nologiques, du type Termino ; Des moteurs de cration de nologismes du type de celui prsent par le Lilla. Il faudra encore attendre quelque temps pour que les systmes dtectent automatiquement les nologismes rcents. Mais lide nest pas si vaine : il sufrait de considrer que tous les textes existants sur les rseaux forment un immense corpus dexclusion.

Liste rcapitulative des adresses des moteurs de recherche Internet : Voil http://www.voil.fr Alta Vista http://www.altavista.com Excite http://www.excite.com Hot Bot http://www.HotBot.com Infoseek http://www2.infoseek.com Lycos http://www.fr.lycos.de Open texts Livelink Pinstripe http://pinstripe.opentext.com Yahoo France http://www.yahoo.fr Yahoo Angleterre http://www.yahoo.com Yahoo Allemagne http://www.yahoo.de Yahoo Espagne http://www.yahoo.es Yahoo Italie http://www.yahoo.it La toile du Qubec http://www.toile.qc.ca/ SavvySearch http://www.savvysearch.com MtaCrawler http://www.go2net.com/search.html Starting Point http://www.stpt.com Liste rcapitulative des sites utiles la nologie: Termisti http://www.refer.org/termisti Etis http://www.unilat.org/dtil/etis/index1.htm OMS http://who.int/pll/cat/tao_ressources.html CRTT http://www.univ-lyon2.fr/langues/LEA/ LEA_RCH2.htm Crettal http://www.tele3.net/terminologie/memoires.htm Lilla Rint http://www.rint.org Termium http://termium1.pwgsc.ca/ Cilf http://www.cilf.org/bt.fr.html Euterpe http://germany.trados.com :4712/MTW_LOGON Iloterm http://ilis.ilo.org/ilis/ilisterm/ilintrte.html Termite http://www.itu.int/ITU_Databases/Termite/index.html Le Grand Dictionnaire terminologique Site de la DGLF Realiter Riterm http://www.lgdt.cedrom_sni.qc.ca/ http://www.culture.fr/culture/dglf http://www.iula.upf.es/cpt/cptfr.htm http://www.iula.upf.es/riterm/ritermes.htm

Petite internographie commente:


Les trois moteurs de recherche les plus performants pour la recherche en terminologie/nologie sont notre avis : AltaVista; Excite; Hot Bot. Les trois sites de ressources en terminologie/nologie les plus importants semblent tre : Etis; OMS; Termisti. Les trois banques de donnes les plus intressantes sont : Balno; Le Grand dictionnaire terminologique du Qubec; Termium. Une adresse retenir : http://ahost4u.com/zak/bases/htm: Toutes les principales banques de donnes auxquelles il est possible daccder par des liens; Liste de sites Internet spcialiss dans la traduction, outils de recherche pour la traduction, dictionnaires et sites spcialiss dans le recrutement des traducteurs.
( 1 ) Les auteurs remercient M. Gilles Bacoul, traducteur la socit Motus ( Paris ), pour sa contribution cet article.

Liste des sites daide la traduction : Site de dictionnaires http://www.facstaff.bucknell.edu/rbeard/diction.html Signets des traducteurs http://www.wo.int/pll/cat/TranslatorBookmark.html Le juste mot http://fp3.com/ljm Listes de diffusion et forums de discussion: Termilat http:// termilat@francenet.fr TLS http://www.uhb.fr/Langues/Craie/tls/tls.html Logos http://www.logos.it/gorumgen.html sci.lang http://news :sci.lang Cline Tucat et Loc Depecker, Union latine-Universit de la Sorbonne nouvelle, Paris III-CRETTAL ( 1 ).
11

Contributions

Cenit: Systme de dtection semi-automatique des nologismes


Les langues voluent un rythme acclr, donc la dtection manuelle des nologismes devient encore moins pratique. Cet article dcrit Cenit, un systme de veille nologique qui vise identier des nologismes dans les domaines spcialiss. Le systme utilise une stratgie fonde sur lexploitation de corpus. Nous exposons les composants et les divers stades de traitement. Termes cls : nologismes ; systme de dtection des nologismes; corpus ; ltres.

1 Introduction

aprs Le Meur et Depecker ( 1995 : 48 ) : Les langues voluent la n du XXe sicle de faon prodigieuse, sous la pousse notamment des nouvelles techniques et de la rvolution informationnelle en cours. Pour le terminologue au travail, il nest plus raisonnable de travailler sans outils, donc lapplication des ordinateurs aux divers aspects du travail terminologique continue gagner en popularit. Depuis longtemps, les ordinateurs sont employs pour le stockage et lorganisation des donnes. Plus rcemment, les techniques dintelligence articielle ont t adoptes en terminologie pour crer une nouvelle gnration de ressources terminologiques quon appelle base de connaissances terminologiques (BCT ) ( Miller et al. 1991 ; Condamines 1995 ). Les BCT permettent non seulement le stockage des donnes linguistiques, mais de plus ils fournissent au terminologue la possibilit de saisir et de modliser les donnes notionnelles et les arborescences de domaine. En ce qui concerne les applications plus automatises, des chercheurs ont examin la possibilit de lextraction automatique de termes, et des approches et des projets diffrents sont rcapituls dans Kageura et Umino ( 1996 ) ainsi que dans Bourigault et al. ( 1998 ). De mme, plusieurs chercheurs

commencent tudier la possibilit dinformatiser la dtection des nologismes, travail qui prend du temps et qui ncessite une mainduvre importante si on le fait manuellement. Il existe dj quelques systmes crs dans le but de dtecter des nologismes. Le systme Aviator ( Blackwell 1993 ; Collier 1993 ; Renouf 1993 ) identie les nologismes dans la presse anglaise pour fournir aux enseignants des ressources lexicales. De mme, le projet Obneb ( Cabr et de Yzaguirre 1995 ) a pour but la dtection des nologismes dans la presse, mais cette fois en espagnol et en catalan. Loutil NeoloSearch ( Janicijevic et Walker 1997 ) identie les nologismes franais qui se trouvent sur lInternet, tandis que le systme Cordon ( W3 Cordon ) utilise des techniques statistiques et donc nest pas li une seule langue. Dans cet article, nous dcrivons Cenit ( Corpus-based English Neologism Identier Tool ), un prototype mis au point Dublin City University. Cenit diffre des systmes susmentionns car il sadresse spciquement aux terminologues et donc, contrairement lObneb par exemple, Cenit dtecte des nologismes dans les domaines spcialiss. LObneb, par contre, ne sert pas les besoins des terminologues car, selon Cabr et de Yzaguirre ( 1995 : 90 ), lObneb exclut pralablement toute nouveaut terminologique qui appartient un domaine spcique de la technologie, de la science ou de lindustrie.

12

Contributions

2 Nologismes
Avant de dcrire en dtail le prototype, il faut sarrter un bref instant sur la question: Quest-ce quun nologisme ? Nous sommes daccord avec Rey ( 1995 : 63 ) qui note que ltablissement dune dnition prcise de nologisme est une tche assez difcile. Nanmoins, la plupart des terminologues saccordent sur les points suivants : un nologisme est une unit lexicale qui a lair innovateur dans la langue ltude ( Dubuc 1985 : 111 ; Rey 1995 : 64 ; Rondeau 1984 : 122 ; Sager 1990 : 79 ). Mais ils ne saccordent pas toujours sur la nature spcique de lunit lexicale ou le genre particulier de la nouveaut. Par exemple, Rondeau ( 1984 : 127 ) identie trois grandes catgories de nologismes ( nologisme de forme, nologisme de sens, et emprunt ), tandis que Rey ( 1995 : 68-70 ) prcise trois catgories diffrentes ( nologisme formel (y compris les emprunts ), nologisme smantique et nologisme pragmatique). Dubuc ( 1985 : 113-4 ), pour sa part, prcise deux catgories principales : les nologismes de formation dite indirecte ( o lon donne un mot existant un sens nouveau ) et ceux de formation directe ( o lon cre une nouvelle entit lexicale, soit de toutes pices, soit par regroupement dlments existants ). Finalement, Sager ( 1990 : 71 ) nidentie que les deux catgories suivantes de nologismes: les crations compltement nouvelles et les emprunts. Quel que soit le mode de formation, un nologisme dcrit une notion ou une ralit nouvelle. La terminologie vise rassembler les donnes sur le lexique dune langue de spcialit ainsi qu normaliser les termes ( Sager 1990 : 2 ). Les ressources terminologiques (glossaires, banques de termes ) devraient fournir, dans la mesure du possible, une reprsentation de ltat actuel du

domaine ltude, sur le plan aussi bien linguistique que notionnel. Mais souvent, tout au dbut de lintroduction dune notion, la terminologie qui la dcrit nest pas xe. Plutt, daprs Sager ( 1990 : 82 ), plusieurs formes coexistent. Donc, en premier lieu, il est important que le terminologue reconnaisse, recueille et enregistre toutes les formes. Au l du temps, il peut suivre les tendances dusage et il peut faire des recommandations en ce qui concerne la cration ou la slection de termes prfrs. Du fait quelle reprsente un travail important, la procdure de dtection des nologismes est longue, trop longue pour le terminologue occup, qui a besoin dun outil pour lui venir en aide.

3 Cenit: vue densemble


Nous avons cr un outil qui sappelle Cenit ( Corpus-based English Neologism Identier Tool ). Cenit vise identier des nologismes dans la langue de spcialit. Dans les paragraphes suivants, nous dcrivons les caractristiques et le fonctionnement de ce systme. Nanmoins, il faut dire tout dabord que Cenit nest encore quun prototype ; donc il prsente lheure actuelle quelques limites. Premirement, nous avons choisi la langue anglaise comme point de dpart, mais en principe, les techniques pourraient tre adaptes au franais. Deuximement, Cenit nidentie que les nologismes de forme. Il ne peut pas dtecter les nologismes de sens, crs, par exemple, par extension smantique ou par changement de catgorie grammaticale. Le fait que Cenit ne traite que des units lexicales qui consistent en un seul mot, quelles soient des crations compltement nouvelles ou des drivations ( cres par prxation, sufxation, etc. ) constitue une dernire limite du

prototype. Cest--dire quactuellement, Cenit ne peut pas dtecter les nologismes de forme syntagmatique, mais nous avons lintention daccrotre la capacit du systme cet gard dans la phase suivante du projet. Pour raliser Cenit, nous avons choisi le langage de programmation Perl car celui-ci manipule trs bien les chanes de caractres. Le systme fonctionne sous Unix avec laccs par le World Wide Web. Cenit comprend deux programmes principaux: le programme pour crer les dictionnaires spcialiss, et le programme de recherche. Le systme comprend un dictionnaire de base provenant du lexique Unix et le programme pour crer les dictionnaires spcialiss donne au terminologue la possibilit dajouter dautres dictionnaires an dadapter Cenit pour traiter un domaine spcique. Cenit vise traiter un chier dentre ( fournit par lutilisateur ) an didentier les nologismes quil comporte. Le programme de recherche est le programme principal qui excute les tches suivantes. Il transforme le chier dentre en liste de types ( c.--d. une liste qui comprend chaque forme diffrente gurant dans le texte) quil fait passer par une srie de ltres. Ces ltres examinent chaque forme et essayent de lliminer en la comparant avec les dictionnaires. Aprs avoir t ltre, la liste est considrablement rduite. Les mots qui restent peuvent tre des nologismes et chacun dentre eux est expos sur lcran, soulign dans le contexte dapparition, charge pour le terminologue deffectuer un tri.

3.1 Programme pour crer les dictionnaires spcialiss


Le dictionnaire de base est assez gnral et de plus, il ne contient que des formes canoniques (c.--d. les
13

Contributions

formes non-drives et non-chies ). Donc, nous anticipons que les terminologues aimeront construire des dictionnaires spcialiss en utilisant des corpus de textes prsents ltat naturel. ce stade, Cenit prend comme donnes dentre un corpus de textes spcialiss fournit par lutilisateur. Il transforme ce corpus en liste doccurrences ( tokens ) et nalement en liste de types. videmment, plus le corpus est grand, plus le dictionnaire spcialis sera complet et plus les rsultats seront ables. Notons que le programme najoute pas au dictionnaire spcialis les formes qui se trouvent dj dans le dictionnaire de base. Chacun des dictionnaires comprend 52 chiers tris : deux par lettre ( aA-zZ ) pour quon puisse accder soit aux minuscules, soit aux majuscules.

majuscule se trouve au dbut ou au milieu dune phrase. La troisime copie est une copie exacte du chier dentre dorigine o tout reste intact. Cette copie sera utilise au dernier stade quand Cenit exposera les nologismes candidats dans leurs contextes dapparition.

3.2.2 Exclusion des correspondances exactes


Le premier ltre prend comme donnes dentre la liste des types provenant de la premire copie du chier dentre. Chaque mot est compar avec le dictionnaire de base et avec les dictionnaires spcialiss. Seuls les mots qui ne gurent pas dans les dictionnaires avancent la prochaine tape.

correspondances exactes, ils ne se trouvent donc pas ni dans le dictionnaire de base, ni dans le dictionnaire spcialis. Si on lance le ltre danalyse morphologique, chaque mot est trait pour en dterminer la racine et si la racine se trouve dans lun des dictionnaires, Cenit supprime la forme drive ou chie.

3.2.4 Sparation entre les mots qui commencent par une majuscule et les mots en minuscules
Ce stade prend comme donnes dentre la liste du stade prcdent. Les mots sont diviss en deux groupes : le premier groupe comprend les mots qui commencent par un caractre majuscule, et le deuxime comprend les mots qui ne commencent pas par une majuscule. Les trois stades suivants ne traitent que les mots du premier groupe.

3.2.3 Exclusion par lanalyse morphologique


Car le dictionnaire de base ne contient que les formes canoniques ( par exemple, manger ), lutilisateur peut souhaiter exclure aussi les formes drives ou chies ( par exemple, mange, mangeons, mang, etc. ). Cependant, la drivation est lun des modes les plus communs de formation des nologismes, cest la raison pour laquelle, si lon utilise ce ltre, on risque exclure les nologismes intressants ( par exemple, les nologismes hypothtiques mangement ou mangeation ). Donc, cette tape nest pas obligatoire. Nous supposons que la plupart des formes drives et chies connues se trouvent dans le dictionnaire spcialis crs par le terminologue car la source de ce dictionnaire est un corpus de textes prsents ltat naturel. Par consquent, nous imaginons que cette option ne sera employe que par les utilisateurs qui nont pas de dictionnaire spcialis. ce stade, les mots sont dj traits par le ltre des

3.2 Programme de recherche


Dans les paragraphes suivants, nous dcrivons les ltres et les stades de traitement plus en dtail. Lordre dans lequel ce programme traite les donnes est extrmement important. La gure 1 illustre lordre de lapplication des ltres. Les crochets indiquent quun stade est facultatif.

3.2.5 Exclusion des correspondances exactes sans faire attention au type de caractre
Toutes les majuscules sont transformes temporairement en minuscules. Ensuite, chacun des mots est compar nouvelle reprise avec les dictionnaires. Cette seconde comparaison vise supprimer les mots qui navaient de majuscule que parce quils taient placs en tte de phrase.

3.2.1 Traitement du chier dentre


La premire tape dans le processus didentication des nologismes est le traitement du chier dentre. Cenit cre trois copies diffrentes du chier dentre. Dans la premire copie, tous les signes de ponctuation sont supprims. Le systme emploiera cette copie pour crer une liste doccurrences ( tokens ) et nalement une liste de types. La deuxime copie ressemble la premire la diffrence que les points ( . ) ne sont pas supprims. Cenit emploiera la deuxime copie pour identier les noms propres en dterminant si un nom avec une
14

3.2.6 Exclusion des initialismes


La cration dun nologisme par lacronymie est valable, surtout si le sigle se prononce comme un mot ( par exemple, laser ). Lorsquils sont reconnus comme mots, ces acronymes scrivent souvent en minuscules. Nanmoins, plusieurs terminologues ne sintressent pas aux sigles qui ne comprennent que des initiales tout en majuscules et qui ne se prononcent pas comme un mot (par exemple, CPTIAQ ). Ce type de sigle

Contributions

correspond souvent au nom dun produit, dune socit, etc. Cenit propose alors un stade facultatif qui vise supprimer les initialismes tout en majuscules. Pour chacun des mots sur la liste, le systme calcule le nombre total de caractres ainsi que le nombre de majuscules, et si les deux sont gaux, Cenit supprime le mot.

3.2.7 Exclusion des noms propres


Ce ltre se divise en deux parties. Dabord, Cenit compare le mot qui prcde le nologisme candidat avec une liste darrts ( stoplist ) qui comprend les mots comme Monsieur, Mme, Professeur, Dr, etc. Si le mot prcdent se trouve sur la liste darrts , le nologisme candidat est supprim. Pour ceux qui restent, ils procdent ltape suivante, qui emploie la deuxime copie du chier dentre ( c.--d. la version qui ne contient aucune ponctuation sauf les points). Dabord, le systme repre prcisment lemplacement dans le texte de chaque nologisme candidat. Si le candidat nest pas prcd par un point ( c.--d. sil se trouve au milieu dune phrase ), il est probable que le candidat est un nom propre et, par consquent, Cenit le supprime.

candidat dans la troisime copie du chier dentre ( c.--d. la copie exacte du chier dorigine ). Ensuite, le systme identie les limites de la phrase en cherchant les points et les caractres majuscules. Pour nir, Cenit fournit une liste de nologismes candidats en contexte dapparition, charge pour le terminologue deffectuer un tri. (Noter que le terminologue peut regarder les rsultats la n de chaque stade, sil le dsire ). Ensuite, le terminologue peut ajouter au dictionnaire tout mot qui fait partie de la liste mais qui nest pas nologisme.

poque bien excitante pour la terminologie et nous esprons que le travail dcrit ici pourra servir de point de dpart des recherches plus approfondies dans ce domaine. Sorcha Roche et Lynne Bowker, School of Applied Language and Intercultural Studies, Dublin City University, Irlande.

Remerciements
Nous remercions Danile Tort ( DCU.LS ) pour la correction des preuves.

3.3 Extension du prototype actuel


Le prototype actuel est trop limit pour rpondre tous les besoins des terminologues. court terme, nous prvoyons de procder des extensions, comprenant la possibilit didentier des nologismes syntagmatiques et, peut-tre, la possibilit de dtecter les nologismes qui sont crs par changement de catgorie grammaticale. Pour identier les syntagmes, nous avons lintention dtudier les bigrammes et les trigrammes dans les corpus. Pour dtecter les changements de catgorie grammaticale, nous proposons dexaminer les collocations de termes.

Bibliographie
Blackwell ( S. ), 1993 : From Dirty Data to Clean Language, dans Aarts ( J. ), de Haan ( P. ), et Oostdijk ( N. ), dir., English Language Corpora : Design, Analysis and Exploitation, Amsterdam, Rodopi, p. 97-105. Bourigault ( D. ), Jacquemin ( C. ), LHomme ( M.-Cl. ), dir., 1998 : Computerm 98, Proceedings of the First Workshop on Computational Terminology, COLING-ACL 98, 15 aot 1998, Universit de Montral, Canada. Collier, ( A. ), 1993 : Issues of Large-Scale Collocational Analysis, dans Aarts ( J. ), de Haan ( P. ), et Oostdijk ( N. ), dir., English Language Corpora : Design, Analysis and Exploitation, Amsterdam, Rodopi, p. 289-298. Cabr ( M.T. ) et de Yzaguirre ( L. ), 1995 : Stratgie pour la dtection semiautomatique des nologismes de presse , dans Traduction, terminologie, rdaction, vol. 8 ( 2 ), p. 89-100. Condamines ( A. ), 1995 : Analyse de textes spcialiss pour le recueil de donnes terminologiques, dans Terminologies nouvelles, n 14, p. 35-42. Dubuc ( R. ), 1985 : Manuel pratique de terminologie ( 2e dition ), Qubec, Linguatech.

3.2.8 Regroupement des mots en majuscules et des mots en minuscules


Les nologismes candidats qui ont des caractres majuscules sont maintenant runis avec les candidats en minuscules. Cette liste reprsente la somme de nologismes candidats qui se trouvent dans le chier dentre.

4 Conclusion
Nous avons afrm, au dbut de cet article, que les langues voluent au rythme acclr. Dtecter manuellement les nologismes nest plus pratique pour les terminologues, qui doivent souvent travailler dans des dlais trs serrs. Les ordinateurs se sont rvls utiles pour aider les terminologues raliser un travail important dont la dtection des nologismes fait partie. Cest une

3.2.9 Exposition des nologismes candidats et de leurs contextes dapparition


Le dernier stade consiste exposer chacun des nologismes candidats en contexte dapparition. Cenit repre lemplacement de chaque

15

Contributions

Janicijevic ( T. ) et Walker ( D. ), 1997 : NeoloSearch : Automatic detection of neologisms in French Internet documents , prsent au colloque ACHALLC97, Kingston, Canada, (http://www.quics.queensu.ca/achallc97/ papers/a009.html [date daccs 03/09/98]) Kageura ( K. ) et Umino ( B. ), 1996 : Methods of Automatic Term Recognition : A Review , dans Terminology, vol. 3 ( 2 ), p. 259-289. Le Meur ( A. ) et Depecker ( L. ), 1995 : Balno : un projet de rseau informatique pour la veille nologique, dans Terminologies nouvelles, n 14, p. 48-53. Miller ( D. ), Meyer ( I. ) et Michaud ( D. ), 1991 : Terminologie et analyse notionnelle assiste par ordinateur , dans Actes du Colloque international sur les industries de la langue, Tome II, Qubec, Ofce de la langue franaise et STQ, p. 781-800. Renouf ( A. ), 1993 : A word in time : First ndings from the investigation of dynamic text , dans Aarts ( J. ), de Haan ( P. ), et Oostdijk ( N. ), dir., English Language Corpora : Design, Analysis and Exploitation, Amsterdam, Rodopi, p. 279288. Rey ( A. ), 1995 : Essays on Terminology ( traduit par J.C. Sager ), Amsterdam, John Benjamins. Rondeau ( G. ), 1984 : Introduction la terminologie ( 2e dition ), Qubec, Gatan Morin. Sager ( J.C. ), 1990 : A Practical Course in Terminology Processing, Amsterdam, John Benjamins.

Neolosearch, Queens University, Canada : http ://www.quics.queensu.ca/achallc97/ papers/a009.html [03/09/98 ]

Obneb, Universitat Pompeu Fabra, Espagne : http ://www.iula.upf.es/ pjobneca.htm [ 03/09/98 ]

Figure 1 : Les stades du programme de recherche CENIT

Traitement du fichier dentre

Exclusion des correspondances exactes

[ Exclusion par lanalyse morphologique] ( tape facultative )

Sparation entre les mots qui commencent par une majuscule et les mots en minuscules

Les mots qui commencent par une majuscule

Exclusion des correspondances exactes sans faire attention au type de caractre

Les mots en minuscules

[ Exclusion des initialismes] ( tape facultative )

Exclusion des noms propres

Sites Internet
Aviator, University of Liverpool, Royaume-Uni : http ://radar.rdues.liv. ac.uk/newwds.html [ 03/09/98 ] Cenit, Dublin City University, Irlande : http ://www.compapp.dcu.ie/Projects/199 8/CL/sroche.cl4/ [ 03/09/98 ] Cordon, Institut fr deutsche Sprache, Allemagne : http ://www.idsmannheim.de/telri/seminar/ jv-cordon.html [ 03/09/98 ]
Regroupement des mots en majuscules et des mots en minuscules

Exposition des nologismes candidats et de leurs contextes dapparition

Figure 1 : Les stades du programme de recherche Cenit

16

Contributions

Utilisation dune banque de textes en terminographie

Larticle prsente les rsultats dun projet dexprimentation men lOfce de la langue franaise et visant vrier les possibilits et les modalits dintgration dun corpus informatis la chane de travail terminographique. Le projet se situe dans la continuit dun projet de constitution de banques de textes dj men par lOfce dans le contexte de sa participation aux travaux de veille nologique du Rint. Aprs avoir dcrit les logiciels et les mthodes de dpouillement utiliss, on formule des recommandations quant la constitution et lexploitation de banques de textes en terminographie. Termes-cls : corpus informatis; gestion documentaire ; terminotique ; banque de textes ; logiciel.

1 Introduction

( 1 ) Le systme Balno, cr par le Rint, a pour objectifs la collecte, lchange et la diffusion rapides de nologismes sur Internet : ( http://www.rint.org/cadreIndex7. htm ). ( 2 ) Nous entendons par che contextuelle une che portant les donnes suivantes : terme franais, contexte( s ), source( s ). Mentionnons galement que les ches rdiges devaient traiter de notions absentes de la Banque de terminologie du Qubec ( BTQ ).

e volume de textes disponibles sur Internet, donc en format numrique, est de plus en plus important. Cette situation prsente un avantage indniable du point de vue du terminographe; en effet, le texte crit constitue la matire premire de son travail et lapparition de nombreux logiciels permettant le traitement informatis de la langue lui offre la possibilit, pour peu quil intgre ces logiciels ses mthodes, de traiter une quantit imposante de textes. En 1998, dans le contexte de sa participation aux travaux de veille nologique du Rint, lOfce de la langue franaise a fait constituer par la Socit de mathmatiques appliques ( SMA ) de Qubec deux banques de textes, en imagerie mdicale et en robotique industrielle, partir de documents puiss mme le rseau Internet. Lobjectif de lopration tait de procder lanalyse de ces banques de textes an dalimenter les systmes de veille terminologique de la Banque de terminologie du Qubec et de Balno ( 1 ). Les rsultats de cette analyse ont amen lOfce poursuivre lexprimentation dans le domaine de la robotique industrielle. Ce sont les rsultats de cette nouvelle exprimentation que nous prsentons ici : lexprience visait tirer dun nouveau corpus, form comme le premier de textes spcialiss recueillis sur Internet et constitus en banque textuelle, le plus grand

nombre possible de ches contextuelles ( 2 ), tout en analysant les mthodes utilises pour le faire. On dsirait ainsi valuer plus en dtail les possibilits et les modalits dintgration dun corpus informatis la chane de travail terminographique. Larticle prcise dabord les objectifs du projet et les logiciels utiliss, avant de sattarder la constitution du corpus et la description des mthodes de dpouillement appliques. Il prsente ensuite les rsultats sous forme de comparaison entre les diffrentes mthodes de dpouillement pour enn formuler certaines propositions et recommandations.

2 Exprimentation
2.1 Objectifs
Notre objectif gnral tait de vrier comment lutilisation dune banque de textes informatise pouvait sintgrer dans la chane de travail dun terminologue participant lalimentation dun dictionnaire terminologique. Il sagissait dabord dvaluer la pertinence de lutilisation dune banque textuelle comme corpus de dpouillement, par opposition, par exemple, lexploitation ponctuelle de chacun des textes au fur et mesure de sa dcouverte. Il fallait aussi dterminer la meilleure faon danalyser le corpus ainsi constitu, en tentant de voir comment les mthodes traditionnelles de dpouillement pouvaient tre amliores ou assistes par des outils
17

Contributions

logiciels. On dsirait aussi vrier la compatibilit et la convivialit des logiciels utiliss.

2.3 Constitution du corpus


Nous avons constitu, laide du moteur de recherche Copernic, une banque denviron 73 000 mots, dans le domaine de la robotique. Nous avons privilgi les textes rdigs en franais manant de centres de recherche universitaires ou gouvernementaux ( rapports dactivits, thses, projets de recherches, articles, etc. ). En effet, ce type de texte nous paraissait offrir le plus de potentiel pour la recherche de termes nouveaux, par la crdibilit de leurs auteurs des chercheurs de haut niveau parce quils ont t rdigs en franais ( et non traduits ) et parce quils traitent de domaines de pointe. Nous reviendrons plus loin sur limportance accorder ltape de constitution du corpus de dpouillement. Signalons simplement que nous navions pas pour ambition de former un corpus se sufsant luimme, cest--dire qui contiendrait sufsamment dinformations provenant de sources assez diversies pour servir lui seul de documentation pour la rdaction des ches terminologiques. Notre but tait plutt de constituer une banque de textes servant trouver des termes absents de la BTQ, et dont la nature permettrait de recueillir des contextes trs parlants , pouvant guider le terminologue abordant ces notions pour complter les ches ( cest--dire collecter les donnes conceptuelles ncessaires la rdaction dune dnition et ventuellement de notes) et lui permettre de sengager avec conance dans la bonne direction pour la recherche dinformations supplmentaires. Une fois les textes trouvs, encore fallait-il les constituer en corpus, ce que nous avons fait grce lAtelier BDT. Nous reviendrons plus loin sur les manipulations lies cette opration.

2.4 Dpouillement
Traditionnellement, lorsquil sagit dtablir une nomenclature pour un domaine spcialis, le terminologue sarme de son crayon et de sa patience et entreprend la lecture de textes rcents publis dans le domaine qui lintresse. Au l de cette lecture, il se familiarise avec le domaine en question et relve ce quon appelle des candidats-termes, cest--dire des units simples ou syntagmatiques qui semblent se distinguer par leur caractre dunivocit et de spcicit. Le terminologue relve donc ces units avec leur contexte et, ventuellement, les informations terminologiques quil dniche dans le texte et qui lui permettront plus tard de rdiger dnition et notes. Cette tape, le dpouillement, gourmande de temps, devra tre suivie dune recherche exhaustive permettant de vrier les emplois du terme, sa frquence, ses quivalents ( dans le cas dune banque multilingue ), etc. Un premier problme soulev ltape du dpouillement est donc un problme de temps. Une autre difcult relative au dpouillement est lie labsence de nomenclature de dpart : en effet, en veille, lobjectif est dabord dtablir une telle nomenclature, puisquon est alors la recherche de termes que lon na pas encore traits, cest--dire relevs, attests, consigns, dnis, etc. On ne sait donc pas exactement ce quon cherche, et la dmarche fait appel une bonne dose dinstinct et dexprience ; les rsultats obtenus dpendent donc beaucoup de lexprience du terminologue et de sa connaissance du domaine trait. On a tent, lors de lexprimentation dcrite ici, de vrier sil tait possible de lever ces difcults en automatisant ltape du dpouillement des textes. Pour cela, nous avons choisi de comparer trois

2.2 Logiciels utiliss


Lexprimentation a men lutilisation dune srie de logiciels correspondant chacun une tape du travail terminologique. Pour la recherche documentaire sur Internet, nous avons utilis Copernic ( 3 ), un moteur de recherche qui permet de conserver les archives des recherches dj faites et qui conjugue les possibilits de plusieurs logiciels de recherche en les lanant simultanment pour ensuite faire la synthse des rsultats. Pour la gestion de la banque, nous avons utilis lAtelier BDT, logiciel mis au point par la socit SMA de Qubec, qui permet la constitution et la gestion de banques de textes et qui est dot dun moteur de recherche ( dans le corpus ) assez performant. Pour effectuer la transition entre le format utilis sur Internet et lAtelier BDT, il est ncessaire de se servir dun logiciel de traitement de texte; nous avons utilis Word. En ce qui a trait lanalyse textuelle, nous nous sommes servie du logiciel de dpouillement AdepteNomino. Enn, pour la rdaction des ches, nous avons effectu le transfert des ches rdiges avec AdepteNomino vers Sami ( 4 ), le logiciel dalimentation et de mise jour de la Banque de terminologie du Qubec ( BTQ ). Dans les cas o nous avons dpouill les textes manuellement, les ches ont t rdiges directement dans Sami.

( 3 ) On peut tlcharger une version gratuite de Copernic ladresse suivante : http://www.copernic.com/fr/ ( 4 ) Pour plus dinformations sur Sami, voir Pelletier ( 1996 ).

18

Contributions

approches ; la comparaison sest faite sur le plan du temps ncessaire pour produire un certain nombre de ches. Un tableau rsume cette comparaison dans la section Analyse. La premire approche, que nous avons appele dpouillement classique, consistait imprimer les textes et souligner la main les candidatstermes pour relancer ensuite ces termes dans la banque de textes an de trouver les meilleurs contextes. Remarquons que, malgr son nom, cette dmarche se distingue dj dune mthode plus traditionnelle puisquelle utilise, mme si ce nest que partiellement, les possibilits dun logiciel comme lAtelier BDT pour la recherche des contextes ; pour suivre vraiment ce que nous avons dcrit plus haut comme la mthode de travail habituelle du terminologue, il aurait fallu imprimer tous les textes et recueillir, en les recherchant visuellement, les meilleurs contextes pour chaque terme retenu. Cependant, notre faon de procder a quand mme donn des rsultats assez probants lors de la comparaison avec les deux autres mthodes. La deuxime approche est intermdiaire : dans ce que nous avons appel dpouillement semiautomatique, il sagissait dtablir une nomenclature dlments de base susceptibles de donner des termes complexes ( par exemple capteur qui donnera entre autres capteur ultrason ) ou de racines susceptibles de fournir des termes simples et complexes ( comme llment tronqu holon* qui ramnera holonomie, holonome, robot holonome, nonholonome, etc. ) et de lancer chacun des termes de cette nomenclature dans la banque de textes pour recueillir occurrences, cooccurrences et contextes. Il sagit de la mthode qui correspond le mieux loptique dans laquelle lAtelier BDT a t constitu : ce logiciel est en effet quip dun moteur de recherche

intressant et performant qui permet de trouver aisment tous les contextes et cooccurrences dun terme donn. Il suft de lancer un terme pour trouver ses composs, des exemples de son utilisation, des contextes. Cependant, le logiciel ne fournissant pas ce jour dindex, la principale contrainte lie son utilisation vient du fait quil faut savoir quoi demander au moteur de recherche pour obtenir des rsultats. Il est donc ncessaire de disposer dune nomenclature de dpart ; or, comme nous lavons dj soulign, en veille, lobjectif est justement dtablir une telle nomenclature. Une des faons de contourner le problme est de lancer dans la banque de textes des termes de base ( par exemple, pour le domaine de la robotique, des termes comme robot, commande, manipulateur, etc. ) quon aura recueillis lors de lectures prliminaires. Cependant une telle mthode ne permet pas de trouver des termes composs partir de bases auxquelles on naura pas song, sinon par hasard. Si on veut agir de faon plus mthodique, il faudra donc aller plutt vers la troisime mthode, le dpouillement automatique qui consiste simplement faire analyser les textes de la banque par un logiciel de dpouillement textuel, ici AdepteNomino.

que font traditionnellement les terminologues en situation de veille terminologique. partir de deux textes choisis au hasard dans la banque de textes, puis imprims, nous avons soulign les candidats-termes, avant de constituer une che contextuelle pour chacun dentre eux en les relanant dans la banque de textes pour trouver le ou les meilleurs contextes, aprs avoir vri leur absence de la BTQ. En une heure, 11 ches contextuelles ont ainsi t rdiges.

2.5.2 Dpouillement semiautomatique


Rappelons que pour utiliser cette mthode il faut disposer dune nomenclature de dpart ; nous avons donc choisi de lancer les 15 composantes des 11 termes trouvs avec la premire mthode ( 5 ), ce qui a permis disoler 62 nouvelles notions et de rdiger les ches contextuelles correspondantes en environ 8 heures. Rappelons quil sagissait ici de lancer chacun des lments de base dans la banque de textes, de relever chacun des candidats-termes forms partir de ces lments, puis de relever le ou les meilleurs contextes pour chacun de ces termes avant de rdiger la che contextuelle correspondante dans Sami.

2.5 Rsultats
Les rsultats sont groups selon la mthode utilise, ce qui permettra plus loin la comparaison entre ces mthodes.

2.5.1 Dpouillement classique


Nous navons effectu que trs peu de dpouillement selon cette mthode : elle a t utilise surtout dans le but dobtenir une rfrence, un point de comparaison avec les autres mthodes, tant donn que cest celle qui colle le mieux ce

( 5 ) Nous entendons par composante chacun des lments de base dun terme : si on a trouv par exemple capteur ultrason, on relancera capteur et ultrason.

19

Contributions

( 6 ) Nous avons en premier lieu tent lanalyse de lensemble des textes placs dans la banque de textes avec Tact, logiciel mis au point lUniversit de Toronto ( et dont on peut tlcharger une version Web ladresse suivante : http://tactweb.humanities.mcmaster.c a/ ). Tact fournit une liste des mots trouvs dans le texte, accompagns de leur frquence dutilisation ; il faut, partir de cette liste, slectionner les termes dont on pense quils pourraient donner des rsultats intressants ( soit quil sagisse de termes simples, ou dlments de base de termes complexes ) et les marquer un par un avant de demander Tact de produire une liste de cooccurrences ou de contextes. Pour notre banque de textes, Tact a produit une liste denviron 10 000 mots, quil aurait fallu lire et slectionner, sans laide, cette tape du traitement, dun contexte pour dcider de la pertinence de chacun deux. Devant lampleur de la tche, nous avons dcid de tenter immdiatement un essai avec AdepteNomino. Il faut galement souligner que les manipulations prliminaires lanalyse du texte sont peu conviviales avec Tact, qui fonctionne en environnement Dos, avec lequel la plupart des utilisateurs sont peu familiers. ( 7 ) Il faut noter que la mise en forme des textes faite automatiquement par lAtelier BDT nuit lutilisation dAdepte-Nomino, cause des diffrents marqueurs qui y sont introduits ; pour obtenir les meilleures performances dAdepte-Nomino, nous avons donc d partir des textes dans leur format original , cest--dire sauvegards en format texte seulement par Word. ( 8 ) Ne sont dcrites ici que les sorties dAdepte-Nomino : pour une description plus dtaille de son fonctionnement, voir Perron ( 1996 : 32 ). ( 9 ) Le temps ncessaire ce transfert na pas t comptabilis. Dans le cadre de ce projet, il a t effectu par les services informatiques de lOfce ; cest une opration trs rapide ( titre dexemple, il faut moins dune minute pour verser 170 ches ).

2.5.3 Dpouillement automatique ( 6 )


Nous avons lanc AdepteNomino, partir encore une fois de lensemble des textes placs dans la banque ( 7 ). Aprs une analyse ( qui dure entre 20 et 25 minutes pour une banque de textes telle que la ntre ), Adepte-Nomino produit cinq listes ( 8 ) : les units complexes nominales ( ucn ), les units complexes nominales additionnelles (ucna ), une liste des verbes, une liste des adjectifs et une liste des noms. Cest surtout partir de la liste des ucn et de la liste des noms que nous avons identi des candidats-termes. Lorsquon interroge nimporte lequel des lments des listes fournies par Adepte-Nomino, le logiciel le replace dans son contexte (autant de fois quil y a doccurrences ). Il est donc possible de choisir immdiatement les contextes qui paraissent les meilleurs et de les transfrer directement dans le champ appropri. En environ trois heures et demie, 89 candidats-termes ont t recueillis et leurs ches contextuelles rdiges ( aprs vrication dans la BTQ ). Le rsultat se trouvait sous la forme de ches au format AdepteNomino, que nous avons verses dans Sami par la suite ( 9 ).

Analyse des rsultats


Le tableau 1 rsume les donnes relatives au nombre de ches et au temps ncessaire leur production pour chaque mthode:

Notons dabord que malgr son apparente incongruit ( il est moins lev que le rsultat du dpouillement classique ), le rsultat correspondant au dpouillement semi-automatique est tout fait normal; en effet, comme nous lavons mentionn dans la section Rsultats, il sagit dune mthode en quatre tapes : 1. tablir une nomenclature de base ; 2. Lancer les lments de cette nomenclature dans la banque de textes laide du moteur de recherche de lAtelier BDT ; 3. Recueillir les candidats-termes complexes produits par cette recherche ; 4. Pour chacun dentre eux, rechercher le ou les meilleurs contextes. On pourrait bien sr recueillir les contextes ( tape 4 ) en mme temps quon identie les termes complexes ( tape 3 ), mais il semble que cette faon de faire soit plus complique et produise plus de bruit ; on risque en effet de se retrouver avec des contextes inutiles quon devra liminer par la suite. Cest pourquoi nous avons choisi dtablir dabord la liste des termes complexes pour ensuite faire une recherche de contextes ( cette recherche est dailleurs plus restreinte que la prcdente, puisquon ne lance dans la banque de textes que le compos qui nous intresse ). La mthode la plus performante semble tre de loin, au vu des rsultats reproduits dans le tableau, celle qui fait intervenir un logiciel de

Tableau 1 Mthode Classique Semi-automatique Automatique Nombre de ches 11 62 89 Temps ncessaire 1 heure 8 heures 3 heures et demie Nombre de ches lheure 11 7,75 24,4

20

Contributions

dpouillement comme AdepteNomino. Nous pensons quune telle performance sexplique par la rapidit et lefcacit permises par lordinateur, combines la libert laisse au terminologue; en effet, avec une telle mthode, cest le logiciel qui propose les candidats-termes, et cest le terminologue qui dispose de ces propositions comme il lentend. On pourrait objecter que le terminologue, avec une telle mthode, ne lit plus les textes, et donc nest plus aussi familier avec son domaine. ceci nous rpondrons que la performance dun outil de dpouillement automatique de textes donne au contraire plus de temps au terminologue pour lire, et qui plus est pour lire des textes imprims qui, de toute faon, nauraient pas pu tre analyss de faon automatique ( moins dtre dabord numriss, ce qui pose des problmes diffrents ). Nous dirions que le logiciel soccupe des textes disponibles sous format numrique, et ltre humain des textes imprims. De plus, cest le terminologue qui a choisi les textes faire analyser ( et donc qui les a au moins parcourus ) et cest lui qui analyse chaque contexte propos par Adepte-Nomino pour juger de sa pertinence, ce qui contribue de faon apprciable sa familiarisation avec le domaine.

sur la constitution de banques textuelles permettrait dtablir des orientations mthodologiques aptes guider le terminologue lors de cette tape primordiale quest la mise sur pied de son corpus de dpouillement.

3.3 Manipulations informatiques


Il faut mentionner ici que les oprations de stockage des textes dans lAtelier BDT comprennent des manipulations informatiques ( cration et initialisation de la banque, cration dun nouveau rpertoire, puis marquage, segmentation et importation des textes, mise jour de la page daccueil ) susceptibles de rebuter de nombreux terminologues peu familiers avec les dessous de la manipulation de chiers, ce qui a amen certains terminologues sinterroger sur les tapes de la constitution dune banque de textes ( Michel, 1998 :10 ) : Qui doit faire les recherches menant sa constitution ? Les bibliothcaires sont-ils les mieux qualis pour ce genre de dmarche ? Comment en arriver jumeler lexpertise du terminologue familiaris avec les sites les plus intressants et celle des documentalistes ? En rponse ces questions, nous proposons ici ( 11 ) un mode de formation dune banque de textes avec lAtelier BDT qui dcharge le terminologue des tches qui sont par trop trangres son travail habituel et qui, lui paraissant lourdes et malaises, pourraient le dcourager de

3.2 Utilit dune banque de textes


Dans loptique o lon considre quune banque de textes doit tre rentable , cest--dire que le temps quon a investi dans sa constitution doit avoir t utilement dpens, il est permis de se poser des questions sur lutilit dune telle banque. Nous soulignerons simplement ici deux faits en rponse ces doutes: en situation de veille terminologique, o on ne dispose pas de nomenclature de dpart, lexprimentation dcrite ici fait ressortir le rapport entre le temps investi et les rsultats. Pour une demijourne passe rcolter des textes sur Internet, on peut tirer, en deux jours environ, plus de 400 ches contextuelles ( 10 ) de la banque ainsi constitue. Lexprimentation, bien quelle nait pas directement port sur une situation de mise jour du fonds terminologique, a galement fait ressortir, de faon sous-jacente, le fait suivant : on a d liminer une certaine quantit de termes qui taient dj dans la BTQ ; tant donn la qualit des textes stocks ( consistant, rappelons-le, en grande partie en rapports de recherche universitaires ), il parat donc probable que pour ces termes la banque de textes aurait pu servir de ressource documentaire fort utile ( jointe aux ressources habituelles ) en situation de mise jour. Il faudrait mener dautres exprimentations, avec des corpus plus importants, pour vrier cette hypothse.

3 Propositions et recommandations
3.1 Constitution dun corpus
La qualit et la diversit des textes choisis constituent lassise dun travail terminologique bas sur le corpus ; elles dterminent en effet en grande partie lutilit et la pertinence du rsultat nal. Ltablissement de critres rgissant le choix de textes destins faire partie dun corpus de dpouillement nous parat donc essentiel ; la poursuite dessais portant

( 10 ) On considre le travail accompli par un terminologue habitu la procdure et utilisant un outil de dpouillement automatique ; comme pour toute nouvelle technique, les premires expriences seront peut-tre moins rentables ... ( 11 ) On trouvera en annexe une proposition dtaille de partage des tches qui ne demande plus au terminologue que de sauvegarder sous le bon format le texte quil a trouv en ajoutant la date de consultation et ladresse du site.

21

Contributions

mettre sur pied cette banque, tout en tenant pour acquis quil est le mieux plac pour reprer les meilleurs textes dans son domaine de recherche.

3.4 Exploitation des textes


Une autre proccupation des terminologues portait sur la pertinence de consacrer du temps intgrer un texte intressant une banque textuelle au lieu den extraire au moment mme toutes les informations utiles. Cette question nous amne rappeler ici le concept de banque volutive : un terminologue, tant quil travaillerait dans le mme domaine, continuerait denrichir sa banque et la mettrait ventuellement en commun avec ceux de ses collgues qui travaillent dans un domaine voisin du sien. Cette faon de voir est inspire par lobservation suivante : lexprience dmontre quune notion ayant fait lobjet dune recherche sur Internet ramne souvent plusieurs autres notions avec elle ; le texte ainsi trouv risque donc de savrer utile ultrieurement et il est parfois difcile de retrouver un site Internet ( mme sil est marqu dun signet on court toujours le risque quil soit devenu inaccessible ou quil ait t dplac) alors quil est possible de le conserver sur son propre disque dur, et qui plus est, avec les possibilits quoffre le moteur de recherche dun logiciel de gestion documentaire. De plus, le terminologue, au fur et mesure quil fait connaissance avec son domaine, sait de mieux en mieux quoi chercher et o le chercher ; sa banque de textes gagne donc en qualit au l du temps, et peut devenir une source inestimable dinformations dans un domaine donn. Elle peut servir ultrieurement des oprations de mise jour, familiariser un nouveau terminologue avec un domaine donn, faire des tudes dvolution de la terminologie dans une sphre
22

dactivit, etc. On pourrait objecter, en se rfrant au phnomne de saturation dj soulign par plusieurs auteurs ( voir par exemple Otman 1991b : 61 ), quon observe qu partir dune certaine taille (au demeurant difcile dterminer), un corpus de textes ne fournit plus beaucoup de terminologie nouvelle. Ce phnomne nous semble sappliquer de faon plus marque dans certaines situations : dans les cas de corpus en langue gnrale par exemple, ou dans un domaine qui connat une volution plutt lente. Dans les domaines spcialiss identis comme des priorits par lOfce, ce phnomne ne parat cependant pas reprsenter un obstacle la constitution dune banque volutive, pouvant au contraire servir indiquer que le domaine est peu prs couvert lorsque lajout de nouveaux textes napporte plus ou presque plus de terminologie nouvelle. Dans tous les cas, de nouvelles exprimentations pourraient fournir des indicateurs sur la taille optimale dun corpus en langue spcialise.

texte pour le replacer dans son contexte et ventuellement dcouvrir ses composs. Ceci liminerait (ou du moins rduirait) le besoin dune nomenclature de dpart. Mais la solution qui nous semble la meilleure est celle-ci : mettre au point une interface de communication entre lAtelier BDT et Adepte-Nomino, qui permettrait danalyser directement en tout ou en partie la banque de textes constitue grce lAtelier BDT. De plus, comme nous y avons fait allusion plus tt, linterface entre Adepte-Nomino et Sami existe dj ; une nouvelle interface entre lAtelier BDT et Adepte-Nomino rsulterait donc en un outil intgr constitu dun logiciel de gestion documentaire, dun logiciel de dpouillement et dun logiciel dalimentation dune banque de terminologie, outil qui sinscrirait aisment dans la chane de travail terminographique.

3.6 Proposition de chane de travail informatise en situation de veille


Mme sil volue assez rapidement, le travail du terminologue-terminographe comporte toujours les mmes grandes tapes ( Auger, 1994 : 50 ) : 1 ) prparation du travail terminologique [ ] ( exploration du domaine, recherche de documentation, slection et enregistrement des sources ) ; [ ] 2 ) travail terminographique proprement dit [ ] ( mise en forme et traitement dun corpus de textes, dpouillement, tablissement de la nomenclature, extraction de donnes terminologiques et paraterminologiques, [ ] etc. ) ; 3 ) stockage et traitement des donnes recueillies [ ] ; 4 ) dition et diffusion du produit nal ( dictionnaire terminologique) [ ]. Ce que nous proposons ici, cest de mieux appuyer certaines de ces

3.5 Convivialit et compatibilit des logiciels


Comme nous lavons brivement mentionn plus haut, en ce moment lAtelier BDT et Adepte-Nomino ne sont pas pleinement compatibles; les textes une fois marqus par lAtelier deviennent inutilisables (ou posent du moins plusieurs difcults dutilisation) par Adepte-Nomino. Cest ce problme relatif la compatibilit entre les logiciels qui nous amne formuler, aprs discussion avec les concepteurs de lAtelier BDT, deux recommandations dont voici la premire ( qui constitue une tape vers la mise en uvre de la deuxime, qui, elle, reprsenterait la situation idale) : munir lAtelier BDT dun index interactif qui permettrait dinterroger nimporte quel mot du

Contributions

Tableau 2 tape Recherche de textes pertinents sur Internet Constitution dune banque de textes Extraction des termes Extraction des contextes, notes, dnitions, etc. Rdaction des ches tapes laide de logiciels permettant dautomatiser en partie la tche du terminologue. Le projet dexprimentation men lOfce de la langue franaise concernait surtout les premires tapes du travail terminologique, soit la prparation du travail par la recherche documentaire et la slection de sources, de mme que le travail dextraction des donnes terminologiques. Le tableau 2 prsente sous forme schmatique la chane de travail propose, avec pour chaque tape un exemple de logiciel disponible ( 12 ). Logiciel Copernic Microsoft Word et Atelier BDT Adepte-Nomino Adepte-Nomino Sami chacun doit apprivoiser les nouveaux outils mis sa disposition. Mais dans un monde o linformation est de plus en plus considre comme une richesse, il est essentiel de se proccuper de trouver des moyens de la conserver sous la meilleure forme et de la traiter le plus efcacement possible. Les terminologues sont des spcialistes du traitement de linformation sous bien des aspects; il leur revient donc de se tenir au courant des possibilits offertes par Internet et par linformatique en gnral an dexploiter au mieux ces possibilits ; ils demeureront ensuite les meilleurs juges des outils les mieux adapts leur travail. Anouk Jaccarini, Ofce de la langue franaise, Qubec.

Bibliographie
Auger ( Pierre ), 1994 : Les outils de la terminotique : typologie des logiciels daide la terminologie et/ou dautomatisation de la chane de travail en terminographie dans Terminologies nouvelles, n 11, p. 46-52. Cte ( Normand ) : Formation aux banques virtuelles de textes commentaires de lquipe du tronc commun industriel, document interne, Ofce de la langue franaise, mars 1999. Michel ( France ), 1998 : Banques virtuelles de textes scientiques, une aide possible la veille terminologique ? dans Terminologies nouvelles, n18, p. 5-10. Otman ( Gabriel ) 1991a : Aspects de linformatisation des activits terminologiques et traductionnelles dans Clas ( A. ) et Hayssam Safar, dir., Lenvironnement traductionnel : la station de travail du traducteur de lan 2001 Actes du colloque de Mons, 1991, Sillery, Presses de lUniversit du Qubec, p. 213 221. Otman ( Gabriel ) 1991b : Des ambitions et des performances dun systme de dpouillement terminologique assist par ordinateur dans La banque des mots, numro spcial 4/1991, p. 59-96. Pelletier ( Sylvie ) 1996 : Le systme Sami-BTQ : un systme intgr de production et de mise jour des donnes de la Banque de terminologie du Qubec dans Terminologies nouvelles, n15, p. 66-76. Perron ( Jean ), 1996 : Adepte-Nomino, un outil de veille terminologique dans Terminologies nouvelles, n15, p. 32-47.

4 Conclusion
Il est apparu lors de cette exprimentation que lutilisation des outils informatiques tudis pouvait rendre plus agrable et plus efcace le travail du terminologue. partir de logiciels existants, comme lAtelier BDT et Adepte-Nomino, il est possible de mettre au point des outils sur mesure parfaitement adapts au travail accomplir, surtout en situation de veille, mais aussi pour la mise jour, o ils sajouteraient aux ressources dj disponibles. Il y a bien sr tout un travail dadaptation accomplir, autant des outils aux personnes que linverse. Cette adaptation demande du temps et risque mme de ralentir la production pendant une priode donne, o

( 12 ) Il faut souligner quil existe de nombreux autres logiciels ayant les mmes fonctions ou des fonctions semblables; on sen tient ici ceux qui ont servi au projet.

23

Contributions

Annexe
Proposition de partage du travail pour la constitution dune banque de textes avec lAtelier BDT ( 13 ).

FRQUENCE lors de la cration dune nouvelle banque de textes

TEMPS 5 minutes

RESPONSABLE DE LA DOCUMENTATION sous lAtelier BDT, cre une nouvelle banque informe le terminologue du rpertoire o il doit placer ses textes

TERMINOLOGUE

variable ( hebdomadaire, mensuelle )

une demi-journe pour environ 35 000 mots

copie les textes quil trouve pertinents sous format WP5.0 ( en ajoutant ladresse du site et la date de consultation) dans le rpertoire indiqu par le responsable de la documentation sous lAtelier BDT, marque ( adresse Internet, titre et titre abrg ) et segmente les textes importe les textes dans la banque met jour le chier bdt.htm ( page daccueil de lAtelier BDT ) vrie la banque ( sous consultation ) la banque devient disponible et prte tre utilise par le terminologue

sur notice du terminologue, an que les textes deviennent disponibles le plus rapidement possible

environ 2 minutes par texte

( 13 ) Note : dans ce texte, nous nommons responsable de la documentation la personne ( technicien ou documentaliste) qui serait charge, entre autres, dassister le terminologue dans la constitution dune banque de textes.

24

Contributions

Recherche terminographique semi-automatise en veille terminologique: exprimentation dans le domaine mdical


Le prsent article fait tat dune recherche terminographique intgrant des outils informatiques (outil de dpouillement, concordancier, systme de gestion de bases de donnes et module de cration de ches terminologiques). La recherche, qui portait principalement sur un sous-domaine de la mdecine, savoir la pharmacologie cardiovasculaire, se limitait des concepts qui navaient pas fait lobjet dun traitement pralable dans la Banque de terminologie du Qubec ( BTQ ). Nous relatons les tapes les plus importantes de la recherche et dcrivons les principales difcults rencontres. Nous proposons galement des solutions fondes sur les lacunes observes. Termes-cls : terminographie, terminotique, veille terminologique, dpouillement assist par ordinateur.

1 Introduction
e terminologue peut tirer prot dun nombre croissant doutils informatiques quil utilise pour acclrer ou systmatiser des tches rptitives ou fastidieuses. Nous faisons rfrence ici aux logiciels de dpouillement assist par ordinateur, aux concordanciers, aux systmes de gestion de bases de donnes et aux logiciels ddition de ches terminologiques. Ces outils sont galement utiliss par dautres professionnels, comme les traducteurs ou les lexicographes, mais le terminologue en adapte certaines fonctions ses besoins particuliers. En effet, celui-ci applique une mthode de recherche qui rend compte dun certain nombre de concepts rattachs un domaine de spcialit qui a t circonscrit au pralable. Le prsent article porte sur lutilisation de certains de ces outils dans un contexte particulier, savoir la veille terminologique. La veille terminologique est une activit qui consiste reprer des termes nouveaux et colliger des renseignements sur ces termes ( contextes, notes et dnitions ) dans le but de les dcrire. Nous adoptons une dnition fonctionnelle de la nouveaut dun terme inspire de Perron ( 1997 ) qui sappuie sur lutilisation dun corpus dexclusion : un terme nouveau, ou nonyme, est un terme qui na pas fait lobjet dune description terminologique dans un rpertoire donn ( le corpus

dexclusion utilis ici est la Banque de terminologie du Qubec ( BTQ ) ). La recherche a t ralise dans le cadre dune entente avec lOfce de la langue franaise, organisme gouvernemental qubcois. Nous devions nous pencher sur environ 400 concepts lis au domaine de la mdecine, plus prcisment la radiologie et la pharmacologie cardiovasculaire ( 1 ). Les ches terminologiques produites taient bilingues ( anglais-franais), mais nous nous concentrerons sur les aspects touchant les termes franais lis au domaine de la pharmacologie cardiovasculaire. Notre quipe ( 2 ) devait procder en outre lexprimentation de diffrents outils informatiques et dterminer sils prsentaient un intrt dans un contexte professionnel. Les outils tests sont Adepte-Nomino ( Perron 1996 ) et Sami-BTQ ( Pelletier 1996 ) ( 3 ). Nous prsentons dabord un panorama des principales tapes de la recherche, pour ensuite nous pencher sur les difcults lies chacune des

( 1 ) Ces sous-domaines de la mdecine ont t choisis en fonction de laccessibilit de textes en format lectronique. Toutefois, il aurait t prfrable de travailler sur un seul sous-domaine et denrichir le corpus de textes. Une recherche portant sur deux sousdomaines simultanment prsente des difcults notables puisque le terminologue doit se familiariser avec des notions parfois loignes. Nous naborderons pas ces difcults dans le cadre du prsent article, mais elles ont t prsentes durant toutes les tapes de la recherche.

( 2 ) Nous tenons remercier les personnes qui, outre les trois auteurs, ont particip au projet de recherche : Anne Chudobiak, Claire-Hlne Lavigne, Sophie Milliard, Jean Ntakirutimana et Margreet de Rooij. ( 3 ) Signalons par ailleurs que nous avons intgr dautres logiciels plus largement rpandus an de prendre en charge certaines tches priphriques (les logiciels en question sont cits au tableau 2 ).

25

Contributions

tapes franchies. En conclusion, nous suggrons quelques avenues an damliorer la recherche telle que nous lavons ralise.

Tableau 1 : Comparatif des mthodes de travail traditionnelles et des mthodes de travail intgrant des outils informatiques.
Mthode traditionnelle Mthode intgrant des outils informatiques 1. Recherche et collecte de textes en format lectronique portant sur un domaine de spcialit. 2. Conversion de textes papier en format lectronique ( numrisation ). 1. Identication automatique de termes ( logiciel didentication automatique des units potentiellement terminologiques). 2. Premire slection humaine des units produites par lidentication automatique qui feront lobjet de recherches ultrieures. 1. Reprage automatique de contextes pour les termes retenus et slection humaine des meilleurs contextes. 2. Rafnement de la liste de termes devant faire lobjet de descriptions. 1. tude des contextes relevs pour la production de ches terminologiques. 2. Information complmentaire puise dans des ressources lectroniques ( par exemple, Internet ) et, si ncessaire, dans des ouvrages de rfrence papier. 1. Copie, dans une che terminologique, dune partie des informations recueillies lors du dpouillement. 2. Ajout dinformation complmentaire. 3. Importation de la che dans une banque de donnes terminologiques.

2 Principales tapes de recherche


Les mthodes de recherche terminographiques font lobjet dun consensus depuis dj quelques dcennies. Toutefois, lintgration de certains outils informatiques vient bouleverser en partie ces mthodes. Nous prsentons au tableau 1 les diffrences observes entre une recherche terminologique systmatique traditionnelle et une recherche qui a recours des outils informatiques (cette description est largement inspire de Auger et al. ( 1991 ) ). Nous nous sommes alignes sur la dmarche prsente dans la troisime colonne du tableau 1, tout en tenant compte des particularits lies la veille terminologique (il en sera question un peu plus loin). chaque tape de la recherche, nous avons intgr un logiciel donn ou fait appel une fonction prsente dans un logiciel: le tableau 2 dresse la liste des diffrents outils informatiques utiliss. La recherche, comme on peut le constater, sappuie, en dpit de lintgration doutils informatiques, sur des mthodes de recherche systmatique ( Auger et Rousseau 1978 ). Laspect prdominant de ce type de recherche est la prise en compte de lensemble des termes dun domaine : le terminologue dnit, ultimement, les termes les uns par rapport aux autres. Cette stratgie permet de dgager les liens existant entre les concepts du domaine ( hyperonymie et hyponymie, co-hyponymie, mronymie, etc. ) et ce pour parvenir dgager les
26

Recherche documentaire : Mise en forme du corpus

Collecte de textes de nature varie portant sur un domaine de spcialit.

Reprage des units terminologiques

Reprage de termes au moment de la lecture de textes et transcription des contextes.

Relev de contextes

Relev de contextes lors de la lecture des textes. Rafnement de la liste de termes devant faire lobjet de descriptions.

Analyse des contextes tude des contextes relevs pour la production de ches terminologiques. Information complmentaire puise dans des ouvrages de rfrence.

Rdaction de ches terminologiques

Reproduction, dans une che terminologique, dune partie des informations recueillies lors du dpouillement. Ajout dinformation complmentaire. Reproduction de la che dans une banque de donnes terminologiques.

Contributions

Tableau 2 : Outils utiliss lors de la recherche Tche Mise en forme du corpus Procd ou outil informatique pour la raliser Numrisation ( numriseur pleine-page), reconnaissance optique de caractres ( Omnipage Direct ) et vrication orthographique pour la correction des textes numriss ( vricateur de Word ). Slection de textes partir de sites Internet Analyse linguistique ( Nomino ( 4 ) ) Listes de termes gres dans un chier Excel Slection de contextes proposs par le concordancier ( Adepte ) Copie des contextes slectionns dans Adepte ( systme de gestion de bases de donnes intgr dans lenvironnement Adepte ) Lecture et analyse des contextes relevs dans Adepte pour chacun des termes (tablissement de renvois pour les termes apparents ) Consultation douvrages de rfrence sur support lectronique ( banques de terminologie, dictionnaires sur CD-Rom ) Consultation de sites Internet En dernier recours, consultation douvrages de rfrence sur support papier Copie et collage dans Sami-BTQ du systme conceptuel dun domaine comparable celle donne par la recherche systmatique vritable. Cette lacune est cause par le fait quune partie des termes du domaine peut dj faire lobjet dune description terminologique, alors quune seconde partie reste dcrire. Dautres lacunes sont entranes par le fait que les traitements automatiques restent imparfaits et reposent exclusivement sur un corpus qui peut lui-mme prsenter des imperfections ( par exemple, nous avons parfois exclu des termes pour lesquels le corpus ne livrait pas sufsamment de renseignements ). Pour ces raisons, il arrive que le terminologue doive composer avec des listes de termes partielles.

Pour illustrer le sens de la dernire observation, nous avons reproduit au tableau 3 une partie de la liste de termes construits partir de la tte abcs ( ce sont les termes trouvs dans les textes du corpus utilis dans le cadre de la recherche ). Tableau 3 : Liste de termes dont la tte est abcs Termes trouvs dans le corpus abcs appendiculaire abcs bilatral abcs crbral abcs de Brodie abcs du cerveau abcs du foie abcs du poumon abcs du psoas abcs encapsul abcs pidural abcs intra-osseux abcs mdullaire abcs ncrotique abcs paravertbral abcs para-vertbral abcs pelvien abcs priptreux Prsence dans la BTQ

Identication automatique de termes Relev et analyse des contextes

BTQ BTQ BTQ BTQ BTQ BTQ BTQ

Recherche dinformation complmentaire

Rdaction de ches

caractristiques qui dniront les termes dnotant ces concepts. Nous avons d cependant tenir compte de certaines difcults lies la recherche terminologique mene en contexte de veille telle quelle a t dnie la section 1 (rappelons que nous avons cart des termes dj dcrits dans le corpus dexclusion, savoir la BTQ ). Dans ce contexte, il est parfois difcile dobtenir une vue densemble
( 4 ) Adepte et Nomino sont fondus dans le mme environnement de travail. Toutefois, Nomino fait le dpouillement et les autres tches sont ralises au moyen de fonctions prsentes dans Adepte. Cette distinction ne sera pas toujours faite dans ce qui suit.

On remarque que, sur un total de 17 termes, sept sont dj traits dans la Banque de terminologie du Qubec. Donc, en principe, ces units ne doivent pas faire lobjet dun traitement dans un contexte de veille terminologique. Cependant, les trous signals dans les listes peuvent soulever des problmes au moment de lanalyse des renseignements recueillis. Par exemple, les trous posent des problmes du point de vue de lapprhension dun domaine de spcialit. Nous allons commenter ces difcults au moyen dun certain nombre de concepts lis au concept d action ( effet recherch par ladministration de mdicaments) qui sont reproduits la gure 1.
27

Contributions

Action

*conduction *contraction *automatisme

*potentiel d'action phase ascendante du potentiel d'action Types Proprits vitesse d'ascension du potentiel d'action types

*dpolarisation phases

*repolarisation

*repolarisation initiale

repolarisation ventriculaire

plateau de repolarisation

repolarisation cellulaire

*repolarisation finale

repolarisation prolonge

proprits

pente de repolarisation

phase de repolarisation *vitesse de repolarisation

Figure 1 : Concepts lis action

Tableau 4 : Termes construits partir de conduction et de conductibilit Termes construits partir de conduction conduction tawarienne conduction cardiaque Termes construits partir de conductibilit conductibilit auriculaire conductibilit atrio-ventriculaire conductibilit cardiaque conductibilit ventriculaire conductibilit de r-entre

Tous les concepts prsents la gure 1 nont pas fait lobjet dun traitement pour diffrentes raisons ( les concepts mis de ct sont signals par lastrisque ). Nous prsentons, cidessous, quelques causes pour lesquelles ils nont pas t retenus dans le cadre du projet. Conduction : terme non relev lors du dpouillement initial des textes franais (qui accordait la priorit aux termes complexes ). En revanche, certains hyponymes ont t retenus : conduction cardiaque, conduction tawarienne. De plus, certains termes faisant rfrence la proprit de conduire les impulsions ont t traits : conductibilit auriculaire, conductibilit atrioventriculaire, conductibilit cardiaque, conductibilit de r-entre et conductibilit ventriculaire. On constate ( tableau 4 ) le manque de paralllisme entre ces deux derniers groupes de concepts ( quune vritable recherche systmatique aurait corrig ). Contraction : terme trait dans la BTQ. Ici encore, certains hyponymes ont t retenus : contraction cardiaque, contraction myocardique, contraction spontane, contraction tonique, contraction vasculaire, contraction ventriculaire. De plus, certains termes troitement lis ces premires units ont t traits dans le cadre du projet : contractilit cardiaque, contractilit myocardique, contractilit ventriculaire. De nouveaux paralllismes nont pas t saisis de faon approprie ( tableau 5 ). Automatisme : terme non relev lors du dpouillement des textes franais. Certains hyponymes dautomatisme ont pourtant t traits : automatisme auriculaire, automatisme cardiaque, automatisme ectopique, automatisme sinusal. Un certain nombre de termes dnotant la proprit de gnrer des automatismes ont galement t retenus : automaticit ectopique, automaticit myocardique, automaticit

28

Contributions

Tableau 5 : Termes construits partir de contraction et de contractilit Termes construits partir de contraction contraction auriculaire contraction cardiaque contraction myocardique contraction tonique contraction vasculaire contraction ventriculaire Termes construits partir de contractilit contractilit cardiaque contractilit myocardique

3 Dtail de la recherche
Nous allons maintenant nous pencher sur les tapes proprement dites de la recherche et sur certaines difcults ponctuelles. Les sections qui suivent prsentent les tapes dcrites dans la troisime colonne du tableau 1. Prcisons dentre de jeu que les diffrentes tches sont dcrites successivement dans le but de faciliter leur prsentation. Dans les faits, cependant, les chevauchements et les aller et retour sont frquents.

contractilit ventriculaire

Tableau 6 : Termes construits partir de automatisme et de automaticit Termes construits partir de automatisme automatisme auriculaire automatisme cardiaque automatisme ectopique automatisme sinusal Termes construits partir de automaticit

3.1 Mise en forme du corpus


Les termes traiter devaient tre extraits de textes en format lectronique ( qui taient soumis, par la suite, un logiciel de dpouillemement, voir 3.2 ). Nous avons mis en forme un corpus de textes de pharmacologie cardiovasculaire qui comptait environ 300 000 mots ( 5 ). Les textes slectionns avaient t numriss lors dun prcdent projet de recherche, cest--dire que les textes papier ont t convertis en format lectronique. Les textes du corpus devaient tre rdigs en franais, cest--dire non traduits. Nous avons galement pris soin de choisir des textes crits par des auteurs diffrents pour constituer un corpus reprsentatif. cette tape, nous navons pas mis laccent sur la varit des niveaux de spcialisation des textes en tenant pour acquis quun chantillon sufsamment labor permettrait de constituer un corpus bien quilibr. Nous avons regroup les textes accessibles en format lectronique.

automaticit ectopique automaticit sinusale automaticit ventriculaire des concepts fait lobjet dun traitement terminographique. Cependant, tous les concepts dun domaine doivent tre apprhends pour dcrire les termes adquatement. En contexte de veille, le terminologue doit lui-mme combler les trous pour les concepts qui ne sont pas spciquement pris en charge dans le cadre dun projet. Ainsi, on peut penser, lors de la planication dun projet de veille terminologique, quune description terminographique exigera moins de temps puisquelle ne porte que sur un nombre rduit de concepts. Toutefois, il nen va pas tout fait ainsi puisque les liens entre tous les concepts doivent tre saisis. De plus, la systmaticit, qui fait ordinairement la qualit dune recherche terminographique, est perdue partiellement dans ce type de dmarche.

sinusale, automaticit ventriculaire. Ici encore, des paralllismes nont pas t saisis de faon approprie ( tableau 6 ) : Potentiel daction : terme trait dans la BTQ ; Dpolarisation : terme trait dans la BTQ. Nous avons toutefois trait des hyponymes de ce terme : dpolarisation diastolique, dpolarisation diastolique lente, dpolarisation spontane, dpolarisation ventriculaire. Repolarisation: terme trait dans la BTQ. Des hyponymes de ce terme ont t dcrits : repolarisation cellulaire, repolarisation en phases, repolarisation prolonge, repolarisation ventriculaire. Repolarisation initiale, repolarisation nale, vitesse de repolarisation: termes non relevs dans le corpus de dpart. Comme le montrent les exemples ci-dessus, seule une partie

( 5 ) Rappelons que nous avons travaill sur un autre sousdomaine de la mdecine, savoir la radiologie; ces textes ont t tlchargs partir de sites Internet.

29

Contributions

Cependant, lors du traitement des termes, nous avons rencontr des difcults importantes qui dcoulent des choix faits au dpart. Il aurait t primordial, ds la premire tape, de slectionner des textes qui respectent des critres trs prcis. En veille terminologique, les documents qui forment le corpus de dpouillement devraient contenir la plupart des renseignements essentiels la rdaction dune che puisque, en principe, ces renseignements ne se trouvent nulle part ailleurs ( dans les ouvrages de rfrence, par exemple ). De plus, le succs des traitements automatiques repose en trs grande partie sur la qualit des textes formant le corpus de dpart. Voici les principaux critres auxquels les documents devraient normalement rpondre : 1. Une certaine uniformit des thmes abords dans un groupe de documents ; 2. Une documentation quilibre : cest--dire sufsamment pointue pour contenir des renseignements susceptibles dclairer les concepts terminologiques appartenant un domaine relativement restreint et sufsamment accessible pour permettre au terminologue den tirer des dnitions qui sadressent un vaste public ; 3. Des documents comportant un nombre doccurrences sufsamment lev des termes faisant lobjet dun traitement ; 4. Un nombre lev de textes de provenances diverses, an daccder des attestations des variantes terminologiques (synonymes, abrviations, etc.). Ainsi, les documents intgrs dans un corpus de dpart doivent faire lobjet dune slection rigoureuse. Cette observation reste valable peu importe le type de recherche terminologique entreprise traditionnelle ou informatise , mais le problme est ampli par le fait quen recherche informatise on tente
30

de runir des sources en format lectronique qui ne rpondent pas ncessairement tous ces critres ( 6 ). De plus, de nombreux textes prsentant ces caractristiques idales ( des manuels didactiques, des encyclopdies spcialises) sont rarement en format lectronique. Le terminologue peut numriser les textes idaux, mais la numrisation devient rentable dans la mesure o le projet en est un de grande envergure. notre avis, la constitution dun corpus lectronique ( dans une optique de recherche en contexte de veille ) devrait se drouler de la manire suivante : 1. Lidentication des objectifs de la recherche ( domaine, langue, nombre de concepts dcrire, mode de description des concepts) ; 2. Le reprage de documents de types varis portant sur le domaine choisi; 3. La vrication de laccessibilit des textes reprs en format lectronique ( copie de textes accessibles, conversion, si ncessaire, de textes intressants en format lectronique ).

Dans le cadre du projet, le temps consacr linterprtation des listes proposes par Nomino a t prolong en raison du fait quil fallait nous assurer que les termes retenus navaient pas fait lobjet dune description pralable dans la BTQ. La consultation de la banque a d tre faite ponctuellement pour chacune des units potentiellement intressante puisquaucune procdure automatique nallgeait cette tche.

3.2.1 Listes proposes par le logiciel de dpouillement Nomino


Comme plusieurs autres logiciels de dpouillement, Nomino gnre des listes de mots et de syntagmes nominaux qui sont imparfaites du point de vue de lutilisateur : dans le cas qui nous proccupe, les listes comportaient un grand nombre dentres qui nont pas fait lobjet dun traitement terminographique. Le tableau 7 prsente les principaux problmes relevs dans les listes de termes complexes ( 8 ).

3.2 Identication automatique de termes


Lensemble des textes slectionns ont t soumis au logiciel Nomino pour en extraire le contenu terminologique ( 7 ). Nomino propose des listes de mots simples et de syntagmes nominaux partir desquelles le terminologue slectionne les units qui feront lobjet dun traitement terminographique. Nous aborderons, dans les sections qui suivent, quelques difcults souleves par lutilisation dun logiciel de dpouillement. Nous dcrirons dabord les imperfections des listes proposes par le logiciel et leurs rpercussions sur le travail terminographique (3.2.1 ). Nous nous pencherons par la suite sur deux mthodes dutilisation des listes ( 3.2.2 ).

( 6 ) On a par ailleurs souvent tendance exagrer lintrt que peuvent prsenter les ressources trouves sur Internet. Il est vrai que le Web offre une masse documentaire colossale mais lexprience montr quil peut se rvler difcile disoler, dune part, puis de runir, dautre part, un nombre sufsamment lev de documents de qualit et rdigs dans une autre langue que langlais ( ce fait sobserve dans un certain nombre de domaines ). ( 7 ) Pour une prsentation dtaille du fonctionnement du logiciel, voir Perron ( 1996 ). ( 8 ) Nomino propose galement des listes de mots simples. Bien que ces listes proposent galement des units terminologiques, la proportion de bruit est nettement plus leve.

Contributions

Tableau 7 : Principales causes de bruit et exemples tirs des textes dpouills ( 9 ) Problmes graphiques ( fautes de typographie contenues dans le texte traits) Syntagme nominal non terminologique (syntagme construit partir dun nom mais qui nest pas une unit terminologique) Terme nappartenant pas au domaine Mot mal catgoris (un mot dans le syntagme relev est mal analys: verbe trait comme un nom, par exemple ) Collocation plutt quunit terminologique (groupe de mots ayant des afnits et qui apparaissent frquemment dans les textes, mais qui ne sont pas des termes complexes ) Mauvais dcoupage (le terme apparaissant dans le texte est soit plus long, soit plus court que le terme propos dans la liste) sur la conduction, eeffet indsirable

conduction au niveau des synapses des ganglions sympathiques, effet additionnel, effet bien connu ; hypotension avec des variations ; insufsance prexistante conduite automobile, anne de lenfant contraction cardiaque cesse, hypertension artrielle comporte ; insufsance doit ; rsistance vasculaire pulmonaire montre effet de la drogue, effet des mdicaments, traitement de la migraine, traitement de langine de poitrine

hypertension activit: hypertension activit rnine basse ; mdicament action: mdicament action alphabloquante

De plus, mme si les listes proposes par le logiciel de dpouillement taient parfaites, cest-dire quelles ne comportaient que des units terminologiques valables compte tenu dun projet donn ( ce qui est loin dtre le cas ), elles soulvent des difcults du point de vue de la dmarche normalement adopte par le terminologue. Ce dernier doit dsormais procder partir dune liste de formes linguistiques et en extraire le contenu conceptuel pertinent pour rdiger une dnition et tablir des liens entre concepts apparents. Ce contenu conceptuel est moins immdiatement perceptible partir dune liste de

syntagmes nominaux proposs par un logiciel de dpouillement. (Nous verrons plus loin quune mthode permet toutefois de simuler la dmarche conceptuelle. )

semblent intressantes. Le terminologue doit dabord sassurer que lunit propose est effectivement un terme ( certaines entres sont limines rapidement; dautres, au contraire, sont plus difciles traiter, car seule la lecture du contexte permet de prendre une dcision claire ). De plus, si la recherche est ralise dans un contexte de veille terminologique, il doit sassurer que le terme napparat pas dans la BTQ. Nous avons test cette technique sur une partie dune liste de syntagmes nominaux gnre par Nomino : nous avons limin environ 90 % des entres de cette manire. Ce travail est trs mcanique et peu satisfaisant, puisquon doit consacrer beaucoup de temps isoler environ 10 % de termes dont lintrt nest pas ncessairement assur cette tape. La seconde mthode consiste reprer, dans les listes proposes par le logiciel, des blocs de termes potentiellement intressants sans tenir compte de lensemble des entres dans les listes. Cette dernire mthode est nettement plus intressante pour des motifs qui ressortiront clairement dans ce qui suit. Le terminologue travaille sur une srie de termes apparents sur le plan de la forme ou du sens, ou se trouvant dans un mme environnement conceptuel ( 10 ). Il utilise, comme point de dpart, une srie de termes construits partir de la mme tte.

3.2.2 Utilisation des listes proposes par le logiciel de dpouillement Nomino


Le terminologue peut aborder les listes de syntagmes nominaux de deux manires. La premire mthode consiste procder un balayage systmatique des entres an dcarter toutes les units ne devant pas faire lobjet dune recherche plus pousse et de conserver les entres qui

( 9 ) Les lments entranant du bruit varient en fonction de la stratgie didentication adopte par le logiciel et, parfois, de la langue traite. De plus, la proportion de bruit dpend de lapplication vise (pour de plus amples renseignements, voir Lauriston ( 1994 ); LHomme et al. ( 1996 ) et Otman ( 1991 ) ). ( 10 ) Cette mthode a t suggre dans Perron ( 1996 ).

31

Contributions

Voici un exemple de la mthode utilise dans les textes que nous avons dpouills. Nous savons que les mdicaments exercent un certain nombre d actions . Nous utilisons les termes construits partir daction comme point de dpart dun dpouillement. Nous avons reproduit dans le tableau 8 une partie de la liste des units complexes proposes par Adepte-Nomino dont la tte est action : Tableau 8 : Liste partielle des termes dont la tte est action Termes complexes action adrnergique action adrnolytique action agoniste action alpha action alpha-adrnergique action alpha-adrnolytique action alpha-agoniste action alpha-agoniste adrnergique action alphabloquante action alphabloquante accessoire action alphabloquante non spcique action analgsique action analogue action anesthsique action anesthsique locale action anorexigne action antagoniste Un premier reprage permet deffacer les units complexes releves par Adepte-Nomino, mais qui ne sont pas des termes. Par exemple, action analogue a t cart de la liste la suite dune premire lecture. De mme, action alpha a t exclu, car lexamen des contextes a permis de constater qualpha tait toujours plac devant un adjectif ( alphaadrnergique, alpha-adrnolytique, etc. ). Ensuite, un recoupement avec les termes de la BTQ permet dliminer les units ayant dj fait lobjet dune description terminologique. Aucun des termes ci-dessus napparaissait dans la BTQ, mais action coagulante
32

( list un peu plus loin) a t repr et, par consquent, cart de la liste. Les lments qui restent peuvent en principe faire lobjet dune recherche. Le terminologue peut, par la suite, utiliser les contextes dans lesquels ces termes apparaissent pour reprer dautres termes lis sur le plan conceptuel. Les contextes afchs contiendront en effet dautres termes qui seront utiliss comme point de dpart pour une autre recherche. Par exemple, une recherche sur action adrnergique donne accs au contexte suivant : La plupart des bta bloquants sont antagonistes des actions adrnergiques et au niveau des rcepteurs bta 1 et au niveau des bta 2. Ce contexte rvle la prsence dautres termes, savoir bta bloquant, rcepteur bta 1 et rcepteur bta 2. Le terminologue peut effectuer des recherches sur ces termes qui serviront eux-mmes de pistes pour dautres units et ainsi de suite jusqu ce quil puise le lon. Cette mthode a permis de reprer, dans les textes de pharmacologie, des termes associs aux familles conceptuelles suivantes : Noms de mdicaments ou de substances biochimiques (ex.: alcalode de lergot ; barorcepteur aortique ; cliprolol ); Proprits ou mcanismes daction des mdicaments (ex.: absorption digestive ; action adrnolytique ) Maladies et symptmes (ex.: angor primaire ; bradycardie rexe ; dcit enzymatique ) ; Proprits ou mcanismes daction des parties du corps ( ex. automaticit ectopique, conductibilit atrioventriculaire, dbit coronarien ) ; Termes anatomiques (ex.: ganglion vgtatif ; innervation parasympathique ). Ainsi, la dmarche qui consiste procder partir de termes apparents est moins contraignante et plus satisfaisante pour le terminologue. Cest galement celle qui se rapproche

le plus des mthodes de travail traditionnelles.

3.3 Extraction et analyse des contextes


Adepte comporte un concordancier qui afche, pour toutes les units prsentes dans les listes, les phrases dans lesquelles ces units apparaissent. Les contextes peuvent tre slectionns ou simplement consults. Les contextes slectionns sont copis, la demande de lutilisateur, dans une che recevant lensemble des contextes choisis pour un terme. ltape de lanalyse des contextes, nous nous sommes aperu que les contextes extraits des corpus ne comportaient pas lensemble des lments essentiels la rdaction de dnitions. tant donn que les corpus taient constitus de textes trs spcialiss, cest--dire destins des spcialistes du domaine, il a fallu puiser des renseignements complmentaires dans dautres sources plus accessibles : par exemple, des manuels pdagogiques de format papier destins des tudiants en mdecine ou encore des sites Internet qui sadressent la population en gnral pour vulgariser certaines connaissances scientiques. Il aurait fallu choisir, et ce ds le dbut, des textes de type pdagogique ou informatif grand public pour viter un surplus de travail cette tape. Mme si on ne peut pas toujours en tirer des dnitions proprement dites, les contextes contiennent de nombreux lments qui permettent de cerner les concepts dcrits. Nous avons reproduit quelques exemples cidessous : lments dnitoires Absorption intestinale: les graisses, insolubles dans leau, sont transformes en micelles composes dacides gras, de monoglycrides et de sels biliaires.

Contributions

( Notion de transformation lie labsorption intestinale) Les btabloquants nont, aux doses thrapeutiques, quune action adrnolytique, qui dplace le tonus neurovgtatif en faveur du parasympatique, ralentissant le nud sinusal et freinant la conduction auriculoventriculaire. ( Effet de laction adrnolytique exerce par certaines substances ) Relations explicites avec des concepts connexes Certains neuroleptiques tels que lhalopridol ou la chlorpromazine ont une action alphabloquante non spcique. Dautres neuroleptiques tels que le sulpiride, la thioroprazine, ou le pimozide possdent une action alphabloquante assez marque prdominance alpha 2 prsynaptique qui pourrait expliquer leur prol dsinhibiteur , probablement li la libration accrue de catcholamines* ( g. 34 ). ( Mdicaments qui exercent une action alphabloquante). Dissocier laction de ces produits en une action antiarythmique et une action antibrillante est plus ou moins lgitime, car les deux ne sont pas sans relation. ( Relation entre deux types dactions voisines ). Le mcanisme de laction hypotensive des hydrazinophtalazines est encore trs mal connu. Certains auteurs ont suppos quelles inhibent directement les centres vasomoteurs. ( Effets de laction hypotensive ). Les contextes sont galement utiles pour dnicher dautres formes de renseignements : Attester certaines relations synonymiques tablies dans les autres sources consultes ( par exemple, la srie synonymique suivante : nud atrioventriculaire, nud auriculoventriculaire, nud dAschoff-Tawara, nud atrioventriculaire de Tawara, nud dAschoff et Tawara peut tre tablie la suite dune consultation combine du corpus et de la documentation complmentaire ) ;

Vrier lexactitude des renseignements trouvs dans les autres sources consultes ( par exemple, de tels renseignements pouvaient se rvler plus ou moins pertinents, tre trop gnraux ou porter sur une notion mdicale diffrente ) ; Fournir de linformation plus technique qui pouvait faire lobjet de note ( ex.: dure dune action exerce par un mdicament, effets indsirables provoqus par une substance, affections traites par un mdicament, etc. ) ; Donner le genre dun terme, notamment dun terme dnotant un mdicament ; Fournir lexplicitation dun sigle ( ex.: MIBG est expliqu dans un contexte entre parenthses ) : Une scintigraphie la MIBG ( mthyl iodo benzo guanidine ) est ralise en cas de suspicion de neuroblastome.

3.4 Recherche dinformations complmentaires


Comme les contextes extraits lors des premires tapes de la recherche se sont rvls insufsants, il a fallu nous tourner vers dautres ressources documentaires. Les renseignements recueillis taient verss au fur mesure dans une che terminologique ( gre par Adepte ). cette tape, nous avons utilis deux types de catgories de ressources documentaires, savoir les ouvrages de rfrence, monographies, revues et encyclopdies ( sur support informatique ou papier) et les sites Internet. Les documents du premier groupe ( dictionnaires et ouvrages spcialiss ) ont aid produire un certain nombre de dnitions. Toutefois, la recherche dans certains ouvrages requiert beaucoup de temps. Mentionnons galement que les ouvrages de rfrence ( dictionnaires, banques de terminologie) ont rarement permis de retrouver les

termes recherchs tels quels ( ce que nous pouvions anticiper, puisquil sagissait de nonymes). Toutefois, ils prsentaient le plus souvent des renseignements dordre conceptuel sur des termes apparents ( hyperonymes, hyponymes ou cohyponymes ). LInternet sest rvl particulirement utile parce quil permet datteindre linformation spcialise rapidement. Il hberge un grand nombre de sites quon pourrait qualier de gnralistes comme des compilations de revues mdicales, des listes de rsums scientiques, etc. ( voir Michel 1998 pour une prsentation dun certain nombre de sites mdicaux ). Lorsque les recherches dans les premiers sites se rvlaient infructueuses, nous tentions de localiser dautres sites moins largement connus au moyen des moteurs de recherche ( ex.: Altavista, Copernic, Yahoo, etc. ). Les mcanismes de recherche, bien que parfois rudimentaires ( la recherche se fait par simple correspondance entre chanes de caractres ), permettent disoler des documents web partir dun terme simple ou complexe. Signalons que les requtes sur les termes complexes ont livr les rsultats les plus intressants. Par ailleurs, nos efforts ont t facilits par le fait que la recherche portait sur des termes mdicaux construits partir de racines grecques et latines. Lambigut souvent gnre par les recherches simples sur des chanes de caractres a t rduite considrablement pour cette raison. Lorsque les recherches de termes complexes se rvlaient vaines, nous reprenions une nouvelle recherche partir dune composante dun terme, notamment partir de sa tte. Nous reprions frquemment au moyen de cette mthode des contextes ou des informations sur lhyperonyme. Frquemment, ces contextes prsentaient des informations sur le modicateur mme sil ntait pas

33

Contributions

mentionn explicitement qui nous aidaient ainsi saisir le concept dans sa totalit. Toute information pouvant aider potentiellement la description dun concept tait retenue et stocke. Comme dans bien dautres domaines, les sites Internet anglais sont nettement plus nombreux et riches en renseignements. Nous avons repr ces sites de langue anglaise partir de lquivalent anglais dun terme donn lorsque nous lavions dnich dans un rpertoire ( pour les quivalents non relevs tels quels, nous procdions partir des composantes dun terme complexe ). Dautres termes se sont rvls plus difciles traiter de cette manire, soit parce que nous navions pas relev dindices sur leur traduction, soit parce que lquivalent anglais repr avait dautres acceptions non mdicales. Dans les faits, ce sont les sites anglais qui nous ont permis de rdiger la plupart des dnitions. La recherche dinformation complmentaire a t beaucoup plus ardue quon ne laurait pens au dpart. Cette tape a souffert des imperfections lies la constitution du corpus.

Nous avons, dans certains cas, copi les informations utiles partir dAdepte et nous les avons colles dans Sami ( les entres franaises et anglaises ). Quant aux dnitions et aux notes, elles taient rdiges directement dans Sami. Sami peut importer directement des ches produites dans Adepte, ce qui vite davoir reproduire les rubriques ou les coller dans les champs prvus cette n. Nous navons pas eu recours cette stratgie puisque nos entres Adepte comportaient de nombreux renseignements dont la saisie sest

faite sans vritable gestion de linformation dans les champs. En outre, nous trouvions plus utile de conserver tous les renseignements retenus que dditer les ches de dpouillement an de les rendre compatibles avec la structure des ches Sami-BTQ. Certains renseignements apparaissant dans la che de dpouillement qui dcrivait un premier terme ont servi traiter dautres termes lis sur le plan conceptuel. La gure 3 prsente quelques ches rdiges au terme de la recherche.

Figure 5 : Fiches de terminologie


1. Conduction cardiaque FICHIER TRAVAIL 005 q010274 025 V7818 030 PUMS 035 UM 040 9812 060 mdecine| 105 cardiac conduction 110 E ; a 205 conduction cardiaque 210 P5 ; n f ; F ; b 215 Propagation dune impulsion nerveuse qui prend naissance dans le nud auriculo-ventriculaire et qui se propage dans les artres entranant la contraction de ces dernires. |c| 295 SOURCE ANNE VOLUME NUMRO MOIS PAGE MENTION a 605268 1998 12 b 603134 1998 12 c 603135 1998 12 2. Dpolarisation diastolique FICHIER TRAVAIL 005 q011024 025 V7818 030 PUMS 035 UM 040 9809 060 mdecine| 105 diastolic depolarization 110 E ; a 130 1- phase-four depolarization |E; a| 205 dpolarisation diastolique 210 P5 ; n f ; F ; a 215 Diminution de la polarisation de la diastole, cest--dire du mouvement de dilatation du cur et des artres, qui alterne avec le mouvement de contraction ( systole ). |b| 295 SOURCE ANNE VOLUME NUMRO MOIS PAGE MENTION a 603134 1998 10 b 603135 1998 10

3.5 Rdaction des ches


Les ches ont t saisies dans un logiciel ddition de ches terminologiques, Sami-BTQ ( 11 ), partir des renseignements extraits des autres sources documentaires reproduites dans Adepte-Nomino. Sami-BTQ permet de conserver des versions provisoires et de les modier tant que les versions dnitives ne sont pas prtes. De plus, ses mcanismes de recherche permettent datteindre des termes apparents et la BTQ peut tre consulte par lutilisateur tout moment.
( 11 ) Pour une prsentation dtaille des fonctions du logiciel, voir Pelletier 1996.

34

Contributions

4 Suggestions damliorations la mthode de travail


En guise de conclusion, nous rappellerons les principales tapes abordes dans le prsent article en mettant laccent sur les lacunes que nous avons observes. Nous suggrons galement des lments qui permettraient damliorer la mthode de travail. Premirement, au cours des diffrentes tapes de la recherche, nous nous sommes rendu compte que les textes slectionns ntaient pas parfaitement adapts la description de 400 termes complexes du domaine mdical. Nous avons donc pass beaucoup de temps rechercher de linformation complmentaire pour mobiliser les renseignements ncessaires la prparation des ches terminologiques. La recherche aurait gagn en efcacit si les objectifs avaient t bien dnis au pralable et si le corpus avait t constitu de faon les atteindre. Un corpus quilibr peut se rvler difcile constituer ds le dpart, mais ces efforts permettraient daccrotre la productivit, notamment en rduisant le temps consacr la recherche complmentaire. Deuximement, le dpouillement des textes a repos sur un traitement automatique (par le logiciel Nomino ) et nous avons accord la priorit aux termes complexes. Toutefois, comme nous lavons vu, lacquisition de connaissances ncessaires la description dun terme complexe passe dabord et frquemment, par lacquisition de connaissances sur un autre terme. Or, comme tous les termes du domaine ne faisaient pas ncessairement lobjet dun traitement, notre recherche perdait en systmaticit. Le travail vritablement terminologique est par excellence

systmatique : un domaine de la connaissance humaine ne peut tre apprhend adquatement que de faon systmatique. Nous croyons ds lors que la dcision de raliser ou non une description systmatique doit tre prise lors de la planication du travail et cela est directement li au prol de lusager qui aura accs cette terminologie. Ce dernier doit dterminer lorientation que doit adopter une recherche terminographique. Le terminologue canalise et dcrit les concepts dun domaine et, de ce fait, procde sa dlimitation. Enn, le projet a permis de relativiser la croyance pourtant bien rpandue voulant que lutilisation doutils informatiques accroisse considrablement la productivit. Il est vrai que certains traitements automatiques allgent nettement des tches fastidieuses. Toutefois, ils modulent de faon sensible des mthodes de travail implantes depuis longtemps. La chane de travail terminographique, par exemple, devient plus squentielle et le terminologue doit sadapter ces nouvelles stratgies. Le gain de productivit se fait sentir pour des projets de grande envergure et non pour de petits projets. Marie-Claude LHomme, Claudine Bodson, Renata Stela Valente, Dpartement de linguistique et de traduction, Universit de Montral.

Auger ( P. ) et Rousseau ( L.-J. ), 1978 : Mthodologie de la recherche terminologique, Qubec : Lditeur ofciel du Qubec. Bergenholtz ( H. ) et Tarp ( S. ), 1995 : Manual of Specialised Lexicography, Amsterdam / Philadelphia: John Benjamins. Boulanger, ( J.C. ), 1979 : Problmatique dune mthodologie didentication des nologismes en terminologie, dans Nologie et lexicologie. Hommage Louis Guilbert, coll. Langue et langage, Paris : Librairie Larousse, pp. 36-46. Duplain ( J. ) et coll., 1997 : Guide dutilisation de la che de terminologie, dition mise jour, Qubec : Gouvernement du Qubec. Lauriston ( A. ), 1994 : Automatic Recognition of Complex Terms : The TERMINO Solution , dans Terminology 1( 1 ), pp. 147-170. LHomme ( M.C. ), 1999 : valuation de mthodes dinformatisation de la chane de travail terminographique ( en vue de la description de nologismes lis au domaine de la mdecine ). Rapport dvaluation prsent lOfce de la langue franaise ( avec la collaboration de C. Bodson, A. Chudobiak, C.H. Lavigne, S. Milliard, J. Ntakirutimana et R. S. Valente ). LHomme, ( M.C. ), 1998 : Exprimentation du logiciel Adepte-Nomino en contexte de veille terminologique. Rapport dvaluation prsent lOfce de la langue franaise ( avec la collaboration de M. de Rooij ). LHomme, ( M.C. ), 1996 : Denition of an Evaluation Grid for Term-extraction software , dans Terminology 3( 2 ), pp. 291-312. Meyer ( I. ) et Mackintosh ( K. ), 1996 : The Corpus from a Terminographers Viewpoint , dans International Journal of Corpus Linguistics 1( 2 ), pp, 257-285. Michel ( F. ), 1998 : Banques virtuelles de textes scientiques, une aide possible la veille terminologique? , dans Terminologies nouvelles 18, pp. 5-10. Otman ( G. ), 1991 : Des ambitions et des performances dun systme de dpouillement terminologique assist par

Bibliographie
Auger ( P. ), Drouin ( P. ) et LHomme ( M.C. ), 1991 : Un projet dautomatisation des procdures en terminographie, Meta 36 ( 1 ), pp. 121-127.

35

Contributions

ordinateur , dans La banque des mots 4 ( numro spcial ), pp. 59-96. Pelletier ( S. ), 1996 : Le systme SamiBTQ : un systme intgr de production et de mise jour des donnes de la Banque de terminologie du Qubec , dans Terminologies nouvelles 15, pp. 66-76. Pelletier ( S. ), 1995 : Sami. Systme dalimentation et de mise jour de la Banque de terminologie du Qubec, Qubec : Ofce de la langue franaise. Perron ( J. ), 1996 : Adepte-Nomino : un outil de veille terminologique, dans Terminologies nouvelles 15, pp. 32-47. Sager ( J.C. ), 1990 : A Practical Course in Terminology Processing, Amsterdam / Philadelphia: John Benjamins. Sinclair ( J. ), 1991 : Corpus, Concordance, Collocation, Oxford : Oxford University Press.

36

Contributions

Nologie traductive

Pour acclrer la mise disposition des nologismes aux traducteurs et rdacteurs, le Rseau international de nologie et de terminologie a mis sur pied une action de veille nologique visant consigner, puis diffuser plus rapidement les termes nouveaux par le biais dun rseau francophone dchange de nologismes sur Internet, Balno ( Bote Aux Lettres NOlogie ). Mene en Communaut franaise de Belgique, une recherche sur la nologie traductive sintgre dans ce projet du Rint. Le prsent article en fait la description. Termes-cls : nologie, traduction, veille terminologique.

1 Introduction
e dcalage entre lapparition des termes et leur consignation dans les dictionnaires constitue un problme pour les traducteurs, rdacteurs et spcialistes des domaines techniques, scientiques et sociaux. Cette partie du vocabulaire spcialis et de la langue commune fait rgulirement dfaut dans les dictionnaires sur papier, mais galement dans les dictionnaires et banques de donnes terminologiques sur support lectronique ( disquettes, disque optique compact et en ligne), mme si ces derniers peuvent tre mis jour plus facilement et plus rapidement. Pour acclrer la mise disposition des nologismes aux traducteurs et rdacteurs, le Rseau international de nologie et de terminologie a mis sur pied une action de veille nologique visant consigner, puis diffuser plus rapidement les termes nouveaux par le biais dun rseau francophone dchange de nologismes sur Internet, Balno ( bote aux lettres nologie ). Mene en Communaut franaise de Belgique, une recherche sur la nologie traductive sintgre dans ce projet du Rint. Elle vise la cration dun rseau de traducteurs francophones belges qui sengagent signaler les nologismes quils crent eux-mmes ou quils ont rencontrs au cours de leur travail. Ces

nologismes sont soumis ltude puis diffuss.

2 La nologie traductive
Dans les diffrents domaines de la vie sociale, les usagers crent des termes au fur et mesure de leurs besoins. Le lexique senrichit ainsi continuellement, notamment pour dnommer ou dsigner de nouvelles ralits.

2.1 Nologie primaire et nologie traductive


On peut distinguer deux types de nologie: celle o la formation dun nouveau terme, dans une langue prcise, accompagne la formation dun nouveau concept et celle o le terme existe dj dans une langue et o un nouveau terme est cr dans une autre langue. La situation typique dans laquelle se droule le premier processus est la situation de travail ( le laboratoire de recherche, la fabrication de nouveaux produits, etc. ). Le contexte classique de la deuxime forme de nologie est la traduction. Appelons nologie primaire la premire forme et la seconde, nologie traductive . En effet, la nologie traductive peut tre le fait, sporadique ou plus ou moins systmatique, dinstances charges de terminologie. Ces instances proposent souvent des quivalents pour des termes qui circulent dj dans la langue darrive sous forme demprunts, de calques ou de termes jugs mal forms.
37

Contributions

Cependant, lenvironnement le plus ancien et le plus naturel de nologie traductive, cest--dire la formation et lintroduction de nouveaux termes qui ont dj un prcdent linguistique, est la traduction. Cest que les traducteurs sont les premiers tre confronts aux nouveaux termes en LS ( languesource ) et aux nouveaux concepts, pour lesquels leur mtier les contraint proposer un quivalent dans la LC ( langue-cible ). Nous appelons donc nologie la cration dun nouveau terme par un traducteur et, pour la facilit de notre propos, nologisme un nouveau terme, propos dans une traduction, tout en sachant que le dbat autour du concept de nologie/nonymie est, aujourdhui encore, plus ouvert que jamais. Il y a un contraste important entre la constatation de J. ReyDebove en 1971 ( un nologisme est un mot rcemment utilis dans les changes et absent des corpus mtalinguistiques ) et lanalyse trs ne de F. Cusin-Berche en 1998 ( la perception du nologisme est aussi lie au sentiment linguistique du locuteur, qui un mot semble nouveau, au degr de diffusion du terme dans la communaut linguistique et au fait que le nologisme peut se fonder sur la traduction dides non originales, mais exprimes de faon indite, pour exprimer une certaine vison du monde ).

foisonnante. Les traducteurs ont, en effet produire dans la langue darrive, un texte ayant les mmes fonctionnalits que le texte dans la langue de dpart. La valeur lie au nologisme, souvent signale dans le microcontexte de la langue de dpart, cest--dire dans lensemble des informations vhicules par la phrase ou le paragraphe, ncessite souvent un nologisme parallle dans la langue darrive. Une priphrase ferait disparatre la fonctionnalit du nologisme ( Wijnands 1989 : 2 ), on lvitera donc dans la mesure du possible.

Luxembourg ( Benhamida 1993 ), 76% des traducteurs estiment quils ont un rle jouer dans les processus de diffusion des nologismes bien forms.

2.4 Les principes de la nologie traductive


a ) Un premier principe de traduction applicable la terminologie peut tre formul ainsi: on ne traduit pas dune langue dans une autre. Le traducteur ne cherche pas systmatiquement des quivalents pour tous les termes du texte traduire ( il ne traduit jamais mot mot ). Il cre des termes sils sont utiles pour la transmission correcte du message. La nologie traductive obit en premier lieu aux principes rgissant la traduction elle-mme. La premire obligation du traducteur nest pas lquivalence des termes, mais celle du message. Le nologisme passe donc par le prisme du systme notionnel avant de passer par le prisme du systme de la langue. Dans le cas de la traduction par quivalence des termes, qui joue un rle plus important dans la traduction spcialise que dans la traduction de textes littraires, le traducteur ne cherche pas demble traduire le terme. Il identie la notion exprime par le terme du texte de dpart et rexprime ensuite la notion dans le texte traduit. La question quil se posera est donc celle-ci: quel est le terme dans la langue-cible dont le sens correspond exactement la notion exprime par le terme dans la langue-source ? Ladquation, cest-dire la qualit qua un terme de bien convenir la notion quil exprime, dans le contexte prcis du texte traduire, est donc lexigence principale. Le traducteur sait en effet quune ralit peut souvent tre considre et dnomme selon plusieurs facettes ou points de vue ( Bedard 1986 ). Cette

2.3 La traduction, lieu stratgique pour la nologie


Les nologismes crs par les traducteurs apparaissent immdiatement dans un contexte rel de communication, savoir lenvironnement qui favorise une propagation naturelle des nouveaux termes. Laudience du traducteur est celle du commanditaire de la traduction, qui peut tre importante. Les nologismes proposs par les traducteurs circulent immdiatement dans des crits, support qui semble, pour les termes techniques et scientiques, la voie de pntration principale des nologismes, une voie qui a le plus grand potentiel dacceptabilit dans une communaut linguistique et qui assure donc demble une lgitimation, une valorisation et une conscration du nouveau terme. Souvent press par le temps, le traducteur ne peut pas consacrer beaucoup dnergie la recherche du nologisme correct. Aussi, plus souvent quil ne le souhaiterait, il recourt des emprunts ou des priphrases ( Hermans 1991 : 3 ). Les traducteurs ont nanmoins conscience de leur rle de nographes. Selon une enqute mene en Belgique, au Canada, en Suisse et au

2.2 Les traducteurs-nographes


Quoiquun traducteur isol ne cre pas quotidiennement des nologismes et ne soccupe que dune partie de la nologie, savoir la nologie terminologique ou dnominative, lensemble du monde de la traduction dploie une activit nographique varie et multiple, surtout dans les domaines o la nologie primaire est elle-mme
38

Contributions

L1 Terme Notion

Notion

L2 Terme Notion

connaissance lui permettra de crer de bons quivalents, des termes qui donnent une image aussi nette que possible du rfrent. La connaissance de lunivers notionnel du domaine, grce laquelle le traducteur appartient la mme communaut de pense que lauteur et le lecteur, lui permettra de reconnatre plus facilement la fonction du nologisme dans la LS. b ) Un deuxime principe, dordre terminologique cette fois, est le respect des traditions prsidant la cration des termes dans la spcialit considre. Chaque discipline ne possde pas seulement son systme notionnel, mais galement ses matrices terminogniques, qui lui font choisir de prfrence certaines lois de construction des termes. Un nouveau terme nest pas un objet isol mais un lment dun systme, plus ou moins structur. Le traducteur professionnel expriment sait quen terminologie, il y a peu dquivalents tablis. Les quivalents prsents dans les dictionnaires ne sont souvent que des possibilits, auxquelles le traducteur est libre ou non de donner vie . Linnovation est en effet contenue potentiellement dans la langue, ce sont des dterminations sociales qui provoquent son mergence un moment donn. Cependant, le traducteur est parfois oblig de donner vie un quivalent prcis, notamment dans des contextes juridiques et ofciels ( normes, lgislations nationales ou internationales). Les traductions lexicales dune discipline ou dune technique incluent ce que Kocourek ( 1992 ) appelle un entrain

onomasiologique variable, cest-dire une propension plus ou moins marque des spcialistes dnommer toutes les ralits abordes. c ) Le troisime principe, enn, relve du respect de la cohrence de la langue-cible. Dans ses crations de termes, le traducteur sera conservateur et suivra les voies traces par la langue. Les termes sont souvent motivs. Les nologismes doivent galement offrir la possibilit dengendrer des drivs dans leur catgorie lexicale ou dans dautres catgories lexicales.

3 Caractristiques des nologismes de traduction


Quels caractres distinguent les nologismes primaires des nologismes crs par les traducteurs? Les hypothses avances ci-dessous sont bases sur le corpus des quelque 60 nologismes rcolts en 1995 par le Centre de Terminologie de Bruxelles dans les milieux de la traduction francophone belge.

3.1 Prdominance de la formation syntagmatique


Une premire observation est la prdominance des syntagmes, dans notre corpus de nologismes de traduction et ce, quelle que soit la langue du terme-source. Nous mettons lhypothse que ce grand nombre est li au processus mme de la nologie traductive. En effet, si lon compare les nologismes non

traductifs avec le reste du corpus, on constate que le pourcentage de syntagmes est plus lev dans la seconde catgorie. Comparez les termes cotenance, dclar, eurage, gammiste avec les nologismes traductifs gestion intgre des dchets, industrie de la rcupration, recyclage nergtique. Les premiers sont pourtant esthtiques ( sonorit, connotations ) clairs , mme si paradoxalement ils sont parfois cryptiques, sans tre motivs lextrme. a ) Dune part, limportance de la formation syntagmatique se manifeste par la comparaison du terme de la langue-source et de son quivalent franais. Contrairement au franais, langlais nprouve pas le besoin de prciser, dans les squences dterminant+dtermin, les rapports logiques qui unissent ces deux lments. Pour tre plus explicite, le franais utilisera par contre des prpositions, conjonctions ou subordonnes relatives. Exemples : holding pipette k pipette de maintien pipette de contention pipette daspiration ( N+N ) public-key k encryptage cl encryption publique (Adj. + N + N) (N+prp.+N+Adj.) Les syntagmes franais raccourcissent nanmoins, grce la suppression dlments de liaison. Exemples : bulles trois trous, bulle deux trous. Cette ellipse est attribuable linuence de langlais. Lellipse du rgissant, galement utilise dans les langues germaniques, se retrouve aussi en franais, mais elle est plus rare. Exemples : ( bulle ) deux trous ( objets ) encombrants mnagers ( dchets ) inertes b ) Dautre part, la prpondrance de la formation syntagmatique dans la nologie traductive sobserve galement par la
39

Contributions

comparaison avec les nologismes non traductifs, par exemple ceux du btiment. Certains de ces nologismes non traductifs sont, il est vrai, des dnominations de spcialisations, dues la profusion des mthodes, des matriaux, des techniques ainsi qu lapprofondissement des connaissances. Cette nologie rete une volution du mtier, qui sillustre paralllement de deux faons. Dune part, on assiste une rednition des tches: une nouvelle spcialit est cre, qui, tout en regroupant des spcialits plus classiques, se concentre sur un objet spcique ( exemple: la salle de bain pour le bainiste, qui soccupera autant de la plomberie que des revtements, des boiseries ventuelles, de llectricit, de la dcoration, etc.). Dautre part, les spcialisations portent soit sur le matriau ( le mtallier ), soit du lieu ( le vrandaliste ), soit de lobjet ( le dallagiste ). Les drivs foisonnent pour ces dnominations de spcialisations, avec une prfrence vidente pour le sufxe de spcialit -iste. Il va de soi quune nologie qui rete une telle volution ne peut pas tre rendue adquatement par des syntagmes. Cest, au contraire, la nouvelle dnomination qui cr ou renforce la cration des nouveaux mtiers. Il nen reste pas moins que beaucoup de nologismes secondaires plurilexicaux qui crent et expriment la fois de nouvelles ralits sexpliquent sans doute par le blocage au niveau mme de la notion quils dnotent: un syntagme tient souvent plus de la dnition et de la priphrase que de la dnomination. En outre, la formation syntagmatique, quand elle se base sur un mot-cl auquel on ajoute une pithte, contribue de facto la formation dun schma notionnel ( gnrique k spcique ). Lexemple le plus frappant en est les familles de termes crs partir des termes
40

suivants : bulle : distinction selon lapparence et lutilisation ( deux trous, trois trous ) collecte : distinction selon lobjet ( mono- ou multimatires ), le mode ( fatale, mobile ) et la forme (par bulles, par parc conteneurs ) dchets: distinction notamment par lorigine ( verts, animaux, bureautiques ) recyclage : distinction au niveau du temps ( pre- ou postconsumer ) de la matire et/ou du rsultat ( recyclage nergtique ).

3.2 Lattrait du signiant


Une deuxime caractristique de la nologie traductive est lattrait quexerce le signiant de la languesource. Elle revt plusieurs formes et se rapproche du phnomne du calque. a ) Lorsque le signiant recouvre une des caractristiques de la notion ou du rfrent, par exemple sa forme ( skinpack ), le traducteur a souvent tendance considrer le mme trait pour crer un nologisme dans la langue-cible ( par exemple, pelliculage ). Ce faisant, il ne respecte pas le premier principe de la nologie traductive. Rappelons que ce principe consiste considrer la notion au point doublier le signiant en langue-source et proter du fait quune notion ou un rfrent peut tre considr et donc dnomm selon plusieurs facettes ou points de vue ( forme, fonction, utilit, utilisation, etc.) ( Bedard 1986 ). Voici un nologisme manant dune commission ministrielle de terminologie respectant ce principe de traduction. Il ne sest pas lexicalis: Anglais Notion Franais notebook k ordinateur k ordinateur computer portatif plumier b ) Voici un autre signe de lattraction exerce par la langue demprunt. Lordre des mots au sein des syntagmes nominaux complexes

franais respecte gnralement les rgles dagencement des mots en franais et non celles de la langue anglaise dorigine. Exemples : high-band width cable connection k connexion par cble large bande integrated-services digital network k Rseau numrique intgration de services object-oriented programme/database k Programmation/banque oriente objet Ce nest cependant pas toujours le cas, notamment pour les syntagmes courts : compact disk k compact disque Deux modes dattraction de langlais peuvent expliquer ce phnomne dinversion dterminantdtermin: dans les domaines comme linformatique, lattraction du modle syntaxique, dont les linguistes pensaient pourtant quelle nexistait pas, ou alors les fausses motivations ( en loccurrence, le public traduit littralement labrviation CD, quil connat bien parce quelle gure sur tous les disques compacts quil achte ). c ) Voici une troisime illustration de lattrait de la langue originelle. En se transportant de langlais en franais, un signiant peut acqurir le statut de terme parce que le traducteur a cru le constater en anglais. Exemples de ces hapax, qui se sont lexicaliss en franais, pas en anglais: general-purpose computer k ordinateur non ddi organizational structure k structure organisationnelle Pour une part, ce phnomne sexplique peut-tre par cette pratique de lantposition en chane de dterminants de langlais. Cette pratique donne une allure de substantifs plurilexmatiques, donc de termes, des expressions qui se traduiraient en fait plus lgamment par une subordonne ou autre priphrase, en franais. En ce sens, on

Contributions

peut mettre lhypothse selon laquelle lattrait du signiant entrane dans certains cas une terminologisation presque force du franais...

3.4 Toujours des emprunts, des calques et peu de nonymes


Nous avons rencontr relativement peu demprunts ou de calques parmi les termes qui nous ont t soumis. De toute vidence, les domaines qui restent les plus soumis cette pratique sont ceux de linformatique et de la mdecine. Exemples : workow, drawer k tiroir Nous navons rencontr aucun exemple de cration ex nihilo. Ce procd de cration lexicale nest pas frquent dans la pratique du traducteur, et ne lui est dailleurs pas recommand. Ce type de procd est presque exclusivement rserv la publicit ( pour les dnominations commerciales, notamment). Il ressort dailleurs de plusieurs recherches menes dans le domaine que ce type de terme senracine trs difcilement dans lusage, car le locuteur le peroit comme un corps tranger dans sa langue.

On propose par exemple mgadivertissement pour megatainment, et alicaments comme quivalents de medifood. Quant UFO-ologist, il est traduit par ovniologue.

3.3 De nouveaux formants internationaux


Un grand nombre de termes sont composs sur base dcologique, qui devient par abrgement co( - ). Cette forme abrge est devenue un lment de composition part entire dans le domaine de lenvironnement. Ce prxe joue un rle comparable celui qui provient du grec et du latin. De fait, cette particule a effectivement une origine grecque ( oikos ), mais elle sest smantiquement transforme, plus particulirement ces 25 dernires annes. Elle se rattache dsormais au concept de lenvironnement en gnral, et non plus de la maison, comme laurait exig un point de vue strictement tymologique. Au sujet dco( - ) encore, on note un ottement quant sa graphie et son insertion dans les composs. On ly trouve avec et sans trait dunion. Dans la protection de lenvironnement, un autre lment fertile pour la cration lexicale est ladjectif vert ( cosac vert, verdir ). Il est relativement peu frquent dans les termes quil nous a t donn de rcolter, mais bien prsent dans le vocabulaire de lenvironnement, et ce, dans une srie de langues, notamment lallemand et langlais. Eco- et vert sont par ailleurs devenus synonymes, dsignant tous deux la notion respectueux de lenvironnement : police verte, PC vert, comptabilit verte...

3.6 Cration lexicale lie Internet


Les activits et termes varis proposs sur Internet ont suscit une explosion de termes ou mots nouveaux, mme sils ne sont pas tous spcialiss. En voici quelques exemples, qui constituent un d la crativit du traducteur, mais quil doit imprativement transposer dune manire ou dune autre. Les termes crs sont peu stables, tant pour le fond que la forme (graphies multiples) et ils semblent hsiter entre la forme syntagmatique N+Adj (ex. banque virtuelle pour web banking ) et le compos ou conxe cyber- + N: Angl. Cyberspace k Fr. cyberespace Cyberocracy k ybrocratie All. Cyber-Zeugin k cybertmoin Cyber-Anwalt k cyberavocat Cyberpolizei k cyberpolice Vs. Cyber-Kken k poussin cyberntique Cyber-Haustier k animal domestique virtuel Angl. cyber-car k voiture virtuelle Nl. Cyberparadijs k paradis virtuel On le voit, il importe de mobiliser les facults cratrices de la langue franaise et de ses locuteurs et de permettre aux francophones le comportement ludique dont font preuve les anglophones dans leur usage quotidien de la langue. Ces mots ou termes se stabiliseront ou disparatront, cest lusage qui
41

3.5 Des conxes hybrides


Dans les conxes, on remarque un nombre important de formations hybrides ( latin-grec, classiquemoderne ) parmi les termes qui nous ont t soumis. Lusage ne semble donc pas prouver de rticences vis-vis de ce procd, pourtant critiqu et dconseill par lensemble des linguistes et philologues. Exemples: cophile formant moderne co( logie ) + formant grec philo polynorm formant grec poly + formant moderne norm domologie formant latin domus ( maison ) + formant grec logos ( discours ) La recherche dquivalents pour des acronymes anglais mne le traducteur crer des termes dont on ne connat ni le statut ni les possibilits de diffusion.

Contributions

tranchera. De nombreux nologismes lis Internet semblent ressortir exclusivement au domaine de lcrit ( mdia ou publications pour internautes ). Il ne suft donc pas au traducteur, pour crer de bons nologismes, de respecter les principes de la nologie traductive rappels plus haut, ni de connatre et dappliquer les procds classiques de formation lexicale en franais. Dautres ressources, que mentionne Cl. Bdard ( 1986 ), sont dexcellents moteurs de cration: 1. Lemprunt des domaines techniques analogues; 2. Lextension de sens ; 3. Lomission de constituants lorsque le syntagme dorigine est dj trs long. Le traducteur dispose dune assez grande libert de choix, pour les moyens linguistiques rexprimant en LC, avec les mmes fonctionnalits ( Delisle 1993 ), le sens dun texte en LS.

Cette mthode lui permettra davoir moins recours aux calques, mais souvent galement de trouver de meilleures solutions quun syntagme dnitoire. Il contribuerait ainsi mieux lenrichissement de la langue en crant des termes plus courts, plus esthtiques et rellement nouveaux. La nologie traductive est un domaine inexplor. Les rsultats dtudes son propos intresseraient aussi bien la traductologie que la nologie en langue franaise. Cest que la langue franaise et sans doute toutes les langues du monde sont en situation de traduction, presque systmatique, par rapport langlais. Outre un cours de terminologie, ne faudrait-il pas ds lors ajouter au programme des spcialistes euxmmes, ou au moins celui de leurs formateurs, un cours de traductologie? Adrien Hermans et Andre Vansteelandt, Centre de terminologie de Bruxelles, Institut Marie Haps, Bruxelles.

Cusin-Berche ( F. ), 1998: Le management par les mots: tude sociolinguistique de la nologie, Paris, LHarmattan. de Schaetzen ( C. ), 1994: Mthodologie des attestations en nologie terminologique, dans Le Langage et lhomme, XXIX, 1. Delafontaine (Christine ) sous la direction de I. Hoorickx, 1994-1995: A Terminology of Medically Assisted Procreation, Bruxelles, Institut Libre Marie Haps. Delisle ( J. ), 1993: La traduction raisonne, Ottawa, Presses de lUniversit dOttawa. Diki-Kidiri (M. ), Joly ( H. ), Murcia ( C. ), 1981: Guide de la Nologie, Paris, Conseil international de la langue franaise. Dugas ( A. ), Molinier ( C. ), 1992: La productivit lexicale, dans Langue franaise, n 96, p. 3-124. Goosse ( A. ), 1975: La nologie franaise aujourdhui: observations et rexions, Paris, Conseil international de la langue franaise. Guilbert ( L. ), Baggioni ( D. ), Bastuji ( J. ), Dresco ( P. ), Fauveau ( B. ), Gardin, Guespin ( L. ), Laurian ( A.-M. ), Lefevre ( G. ), Marcellesi ( C. ), Mortureux, Petroff, 1974: La nologie lexicale, dans Langages, n 36, p. 3-128. Guilbert ( L. ), 1975: La crativit lexicale, Paris, Larousse. Hermans ( A. ), 1991: Groupes de travail en terminologie, dans Le Langage et lhomme, XXVI, 2-3, p. 165-171. Hermans ( A. ), 1991: Quelques pratiques terminographiques des traducteurs belges, dans Nouvelles de la FIT, 10, 3. Hermans ( A. ), 1994: Traduction et nologie. Proposition de coopration, dans Le Langage et lhomme, XXIX, 3-4, p. 299-302. Hohnhold ( I. ), 1990: bersetzungsorientierte Terminologiearbeit: Eine Grundlegung fr Praktiker, Stuttgart, Intra. Hrsg Altner ( G. ) et al., 1993: Jahrbuch kologie, Mnchen, C.H. Beck.

4 Conclusions
Ltude des nologismes recenss nous a permis de dgager deux caractristiques majeures, et notre avis mal connues, du processus mme de la nologie traductive : savoir la prdominance de la formation syntagmatique et lattrait du signiant de la langue-source. Pour crer de bons nologismes, le traducteur doit ds lors, plus systmatiquement et plus consciemment, se dgager de la manire dont la notion est exprime ( ou le rfrent est dnomm ) dans la langue-source. Il lui faut considrer tous les aspects et toutes les dimensions de la notion ou du rfrent. Il pourra ainsi utiliser laspect ou la dimension qui convient le mieux au discours, aux habitudes langagires et terminologiques de la langue-cible.
42

Bibliographie
Abreu ( J.M. ), 1994: Labrviation dans le langage technique, dans La Banque des mots, n 47, p. 105-115. Adda ( R. ), Bastuji ( J. ), Bochmann ( K. ) et al., 1979: Nologie et lexicologie: hommage Louis Guilbert, Paris, Larousse. Bedard ( C. ), 1986: La traduction technique. Principes et pratique, Qubec, Linguatech. Benhamida ( L. ), 1993: Translators and Interpreters as Adopters and Agents of Diffusion of Planned Lexical Innovations: The Francophone Case, dans Ed. Wright ( S.E. ) and Wright ( L.D. ): Scientic and Technical Translation, Amsterdam, Benjamins. Boulanger ( J.-C. ), 1990: La cration lexicale et la modernit, dans Le Langage et lhomme, XXV, 4, p. 233-240.

Contributions

Humbley ( J. ), 1993: Lobservation de la nologie terminologique: lexprience du CTN , dans La Banque des mots, 5, numro spcial, p. 65-73. Kocourek ( R. ), 1982: La langue franaise de la technique et de la science, Wiesbaden, Brandstetter Verlag. Lenoble-Pinson ( M. ), 1991: Anglicismes et substituts franais, Louvain-la-Neuve, Duculot, 173 p. Massenaux ( Nadine ) sous la direction de Mme Costa, 1992-1993: Vokabular der Wende in den deutschsprachigen und franzsischen Presse, Lexeme und Termini, Bruxelles, Institut libre Marie Haps. Rey-Debove ( J. ), 1971: tude linguistique et smiotique des dictionnaires franais contemporains, Mouton. Sager ( J.-C. ), 1989: Term Formation , dans Lebende Sprachen, XXXIV, 4. Thiel ( G. ), Thome ( G. ), 1987: Resolutionen: Ein empirisch entwickelter Beitrag zur Textanalyse, Tbingen, G. Narr. Wijnands ( P.W. ), 1989: Le nologisme comme problme de traduction, dans Lebende Sprachen, XXXIV, 2.

Remerciements
La recherche a t encourage par une subvention accorde par le Service de la langue franaise du Ministre de la culture et des affaires sociales de la Communaut franaise de Belgique. La recherche dont le prsent article donne quelques rsultats a t ralise par Adrien Hermans, lisabeth Lequeue et Andre Vansteelandt, avec la collaboration de Hlne Bertrand, de Thierry Lepage et de Pablo Sanz Moreno.

43

Contributions

Nologie et terminologie: activits et rexions

Pour prsenter le nouveau Service de nologie et terminologie de lInalf, on rsume les principales missions de ce service dont une tche importante est lassistance aux commissions spcialises de terminologie et de nologie dans le cadre du dispositif denrichissement de la langue franaise. On propose une typologie de ses activits et on discute certains lments mthodologiques mis en uvre ou observs en terminologie ponctuelle. Termes-cls : terminologie ponctuelle; veille nologique; description de lusage ; tiquetage par domaines; variation ; recommandations ofcielles.

l nous a longtemps sembl prmatur dintervenir dans un numro de revue consacr aux nouveaux outils pour la nologie. En effet, le SNT ( Service de nologie et terminologie) cr il y a quelques mois seulement ( 1 ), est trop jeune pour prtendre donner aujourdhui des renseignements gnraux sur ou pour la nologie. Cest pourtant bien dans ce secteur quil uvre, ayant repris, pour certaines de ses missions, une partie des activits du CTN. Lquipe, trs restreinte, de permanents participant partiellement ces travaux, a dj, outre une longue exprience de la lexicographie, celle de la lexicographie de spcialit ( 2 ). Elle a particip la constitution et lexprimentation de plusieurs bases de donnes lexicales, dictionnairiques ou textuelles, dans les domaines de spcialit ( 3 ), et traque de longue date les nologismes dans les textes ( 4 ). Aprs avoir dcrit ( en 1 ) les missions qui reviennent au SNT5 dans le cadre des travaux pour les commissions spcialises de terminologie, il est ncessaire dtablir un relev des requtes quelles entranent ( en 2 ), qui sera suivi (en 3 ) de lexpos des moyens et de la mthodologie adopts puis de lvocation de quelques constats et perspectives ( en 4 ).

( 1 ) lissue de deux runions dterminantes la Dlgation gnrale la langue franaise ( DGLF ) en septembre 1998, ayant eu pour but de re-diriger une partie des missions du CTN ( sous la responsabilit de John Humbley ) vers le SNT ( sous notre responsabilit ). Cela a pu se faire grce une convention avec la DGLF ( voir le Rapport annuel de la Commission gnrale de terminologie et de nologie, DGLF, 1998, p. 24 ). ( 2 ) Il sagit de Pierrette Marchaudon, de Violette Toldano et de nous-mme, toutes trois ayant particip la rdaction du Trsor de la langue franaise ( TLF ) puis, dans le cadre des travaux de lquipe Sciences et techniques, au Supplment au TLF pour les termes de spcialit et les emprunts langloamricain, et enn, dans le cadre du projet DFST, la cration de bases de donnes lexicales dans les domaines de spcialit. On trouvera des prcisions sur ce projet dans Candel 1994. ( 3 ) Participation au choix des textes pour la base textuelle Scitech, exploitation de la base de dictionnaires ITC1 et 2, cration de la base lexicale Lexitech, rdaction de vocabulaires ( jusquen 1997 ). ( 4 ) Nous laborons notamment une tude sur la dnition dans les textes de spcialit. ( 5 ) Dans le cadre de la convention avec la DGLF cite ci-dessus en note 1.

44

Contributions

1 Les actions du SNT dans le cadre des travaux pour les commissions de terminologie.
Trois types dactivits se dgagent : lassistance aux commissions spcialises de terminologie et de nologie, lassistance la commission gnrale de terminologie, caractrises lune et lautre par la rdaction et la diffusion de documents en amont des sances; et enn, la participation aux travaux et rexions des commissions en cours de sance, sous la forme davis, de propositions, de commentaires ( 6 ). Ces trois activits se traduisent par la collecte dinformations prexistantes aussi bien que par des suggestions, voire des recommandations. Dune faon gnrale, il sagit de terminologie ponctuelle. Tout au plus aborde-t-on la terminologie systmatique ou ses mthodes en quelques occasions, de manire ponctuelle : on peut tre amen traiter dlments ou de sousensembles dune terminologie ( cf. le champ de la toxicodpendance dans le domaine de la sant, avec notamment les termes assutude, addiction, leurs synonymes et leurs quivalents ). Mais il ne sagit pas de rdiger des terminologies en tant que telles.

quivalent un terme angloamricain ( en 2.2 ). Deux autres types de travaux pour les commissions spcialises de terminologie et de nologie sont prsents au tableau 2: llaboration ou la reformulation dune dnition ( en 2.3 ) et lexamen ou le rexamen dun terme ou dune forme ( en 2.4 ). Quelques observations gnrales sont prsentes en 2.5.

2.1 Lassistance la veille nologique et terminologique


La veille nologique et terminologique se fait par le reprage et la collecte de nologismes terminologiques, et concerne les termes eux-mmes aussi bien que leurs dnitions.

dbat porte actuellement sur leadership, qui, daprs le Petit Robert 1996, est un emprunt enregistr ds 1875, avec le sens gnral de fonction, position de leader ; leader est enregistr ds 1929, avec le sens de chef, porte-parole ( ... ) , personne qui prend la tte dun mouvement, dun groupe et un renvoi meneur et chef de le ; sous chef de le, au sens gur de celui qui vient le premier dans une hirarchie, qui est la tte dun groupe, dune entreprise , on renvoie leader. Or les spcialistes de la banque ont pour coutume dutiliser, avec un sens particulier leur domaine, le driv chef de lat. Deux positions sont possibles: refuser un nologisme franais choquant (7 ) pour le non-initi en raison de son mode de drivation ou bien appuyer leffort de francisation enregistr dans le jargon bancaire.

2.2 La recherche dun terme franais quivalent un terme anglo-amricain


Ce type dtude regroupe trois cas de gure. Soit le terme discut est dj en usage en franais, on en recherche un autre, qui peut tre un nologisme de forme et on amnage une dnition de ce terme en franais. Soit le terme tudi est en train de simplanter en franais, tout comme le concept auquel il renvoie a lui-mme franchi les frontires : la recherche porte alors sur un nologisme de forme et de sens et saccompagne aussi dune recherche de dnition en franais de ce terme. Soit, enn, le terme franais recherch peut lui-mme tre lquivalent dun autre quivalent franais dj en usage mais ne donnant pas satisfaction, car il est, par exemple, trop proche du terme source anglo-amricain et ne sintgre pas vraiment au moule morphosmantique du systme linguistique franais; lactivit porte sur un nologisme de forme. Un

2.3 Llaboration ou la reformulation dune dnition


Dans les deux premiers cas prsents au Tableau 2, lactivit est relative un nologisme (partiel ) de sens, quil sagisse de la modication dune dnition pour un terme dont le sens a volu ou de la modication dune dnition pour un terme dont le domaine demploi a chang. Dans le troisime cas, on cherche formuler une dnition en termes de spcialit, mais qui soit comprhensible par le plus grand

2 Une typologie des missions proposes au SNT dans le cadre des travaux des commissions spcialises de terminologie.
On trouve, rsums dans le tableau 1, deux types de demandes: lassistance la veille nologique et terminologique (ci-dessous en 2.1 ) et la recherche dun terme franais

( 6 ) Nous souhaitons mentionner lefcacit de nos trois premires collaboratrices temporaires dans ce secteur : Galle Berjonneau, Emmanuelle Bruley et Odile Raymond. ( 7 ) Il le serait moins sil se graphiait *chefdelat.

45

Contributions

nombre. Cette proccupation a t la ntre dans lensemble de nos travaux de lexicographie traitant de mots de spcialit ( 8 ). Elle simpose aussi en terminologie, aussi ne et pointue cette terminologie soit-elle. Il faut rappeler ici le rle du public: pour qui ces travaux de terminologie sontils raliss ? Quel est le public vis ? Ce nest pas seulement le public spcialis du domaine qui nen a gure besoin. Ce nest pas seulement le scientique de haut niveau cherchant se cultiver dans un domaine voisin du sien. Cest aussi un public plus large, journalistique, mdiatique, pour qui une bonne vulgarisation simpose : il faut dformuler les dnitions trop spcialises pour les reformuler , an que le plus grand nombre de lecteurs les comprenne. Ce public est galement constitu de personnes concernes directement par ces termes dans leur travail quotidien, et qui pourtant nont pas toujours connaissance des notions auxquelles ils se rapportent : nous pensons au vaste ensemble professionnel constitu par le personnel de secrtariat, telles les secrtaires mdicales, qui transcrivent et contribuent rdiger les commentaires, rapports, diagnostics, ordonnances, prescriptions dicts par les mdecins.

2.4 Lexamen ou le rexamen dun terme ou dune forme


Un terme ou une forme entranent un rexamen notamment si leur domaine demploi a chang. Le cercle de leur( s ) domaine( s ) dappartenance slargit ou se rtrcit, selon que le terme spcialis se banalise, se gnralise, ou selon que, au contraire, il se spcialise davantage. Il se peut aussi simplement que le terme connaisse une respcialisation, un simple transfert de domaine. Il y a lieu dinterprter
46

lactivit en cause comme relative un nologisme de forme et de sens. Lexamen de formes dont la graphie a chang permet denregistrer des variantes graphiques en fonction des domaines demploi. Sil sagit dun amnagement possible des graphies selon les domaines dont relvent leurs emplois, il parat conomique de proposer une homognisation, allant, de prfrence, dans le sens dune simplication. Nous pensons un exemple comme la srie des termes en scan( n )-( 9 ), les diffrents termes termins en -plex( e ) (duplex et multiplex mais multiplexe ) ou encore les variantes en hm( o ) / hm(a ) , hma / hmato ( hmovigilance, hmacrite, hmatocrite ) ou densi- / densito ( dans densimtre et densitomtre ). Ces tudes permettent disoler des formes ou des lments disponibles mergents, que lon pourra proposer pour de nouvelles sries de formations: citons -vigilance ( hmovigilance, matriovigilance, pharmacovigilance, ractovigilance, stimulovigilance ) ; citons aussi llment el en sciences et techniques spatiales, de lment, dans pixel ( de langlais picture element ), et, partir de ce modle, dans volumel et dans voxel ( anglo-amricain: volume element, voxel ), mais qui apparat concurrent dune nale -le dans tachle ( pour tche lmentaire ), qui correspond langlo-amricain groundel ( 10 ).

coexistantes et concurrentes, qui ne sont autres que des synonymes terminologiques, lun des termes retant lusage naturel, spontan, lautre tant un terme labor ou du moins recommand en vue de supplanter le premier. Cest la question classique des termes nologiques concurrents qui se pose, avec, comme choix danalyse, et selon le point de vue adopt, celui de termes homonymiques, ou celui de mots polysmiques. Nous mettons en avant ici la probabilit dune nuance apporte au sens dun terme par la nouvelle forme servant le dsigner: plus exactement, ces nouvelles dsignations vhiculent sans doute des connotations ( frimousse est propos comme quivalent de smiley (Vocabulaire de lInternet, 1999 ) ( v. Spillner 1994 ) ( 11 ). Dans le cas dune dnition vulgarisatrice (2.3 ) il sagit vraiment de la cohabitation de dnitions, mme si nous ne sommes pas l en lexicographie gnrale, o lon appelle la double dnition ce qui consiste proposer, pour un terme de spcialit, une dnition en termes spcialiss dune part et une dnition pour le grand public dautre part. Nous devons tenir compte de niveaux de spcialisation diffrents dans lart de dnir : reformuler en termes simples une dnition de spcialistes.

2.5 Analyse des principaux facteurs de variation: synonymie, niveaux de spcialisation, facteur temps
Nous venons de relever quelques caractristiques dactivits de terminologie aussi bien que de lexicographie terminologique. Dans les cas dcrits en 2.2, on est en prsence de sries nologiques

( 8 ) Cf. la note 3 ci-dessus. ( 9 ) Voir Candel ( paratre ) : VB. ( 10 ) Ces termes et leurs dnitions ont fait lobjet de publications au Journal Ofciel et sont actuellement en cours de rvision. ( 11 ) Les ottements demeurent toujours possibles (De Schaetzen 1990 : 57 ).

Contributions

Un certain nombre de cas permettent la mise au jour de sousensembles terminologiques devenus dsuets : ils ne devraient pas trouver leur place dans un relev nologique. Il sagit de termes dont lusage est rvolu, le concept dsign ne correspondant plus une ralit en usage. Ce sont des archasmes nologiques , ou nologismes archaques , termes devenus obsoltes, en raison de lvolution subie par leur forme ou par leur sens, dun usage rvolu, dpass, vieilli. Toute analyse dun terme en formation devient un lment danalyse diachronique. Laction sur la langue consistant recommander des termes, qui porte en principe sur des nologismes terminologiques, risque de sappliquer des termes connus, en usage depuis un certain temps dj, et qui ne sont donc plus des nologismes. Les commissions spcialises de nologie et de terminologie sont tout naturellement amenes dpasser le strict cadre de la nologie, en cherchant orienter ou redresser des usages terminologiques mais lon peut se demander si rester dans le strict cadre de la nologie terminologique est possible.

a ) des bases de donnes ( le Grand Dictionnaire Terminologique, de lOfce de la langue franaise, au Qubec, Termium, du Bureau de la traduction, Ottawa, Eurodicautom, des Communauts europennes, Luxembourg ), sur Internet et / ou sur CD-Rom ; b ) des dictionnaires spcialiss : sur CD-Rom ( choix de dictionnaires de Lexpro la Maison du dictionnaire, Cilf ), sur Internet, avec ou sans dnitions, domaine par domaine, en version papier ( 12 ) ; c ) des dictionnaires gnraux : sur CD-Rom ( Le Petit Robert 1996 ), sur Internet ( plusieurs tomes du TLF, le tome 14 tant accessible librement ), en version papier (le TLF, le Dictionnaire de lAcadmie, 9e dition ) ; d ) des dictionnaires encyclopdiques, en version papier ( le Grand Larousse universel ).

3.1.3 Une dmarche efcace : la recherche par synonymes


Quil sagisse de la recherche ou de la vrication de termes en franais, dquivalents trangers, ou de domaines dans lesquels un terme est utilis, on constate que ces recherches se font le plus souvent au moyen de linterrogation de termes qui, par le sens ou par la forme, sont proches des termes ltude. Cest donc une tude partir des synonymes qui simpose ( voir Lerat 1994 : 28 ). En sciences et techniques spatiales, une recherche sur stabilisation ( sur ) trois axes permet dvaluer, outre ces deux formulations elles-mmes, des attestations de stabilisation trois axes, triaxiale, sur les trois axes, 3 axes, pour deux synonymes en anglais.

3.2 Travail en collaboration


Le travail se fait dabord et surtout avec les membres des commissions spcialises de terminologie. Ce sont des personnalits marquantes des domaines concerns, de la sphre scientique, industrielle, conomique ( le CEA, le CNES, la Banque, les hpitaux, la pharmacie, la presse mdicale, les syndicats reprsentatifs des professions... ). On travaille en sance sur les termes, leurs dnitions, leurs usages. Des propositions sont recueillies, discutes, annotes en commun et les changes entre spcialistes des domaines concerns sont de tout premier intrt pour les linguistes. Le rle des personnalits du domaine est inestimable. Leur disponibilit et lintrt quelles manifestent pour la langue reprsentent pour les linguistes, les lexicographes,
( 13 ) Voir le Rapport dtape Inalf de juin 1997, UPR 9017, p. 2127.

3.1.2 Recherches dans des textes


La terminologie spcique un domaine, objet des cas examins cidessus, ne couvre pas toujours un ensemble dusages sufsamment reprsentatifs du domaine tudi. Les textes ont la mmoire des mots, des usages, et de lvolution de ces usages. Une collecte de donnes plus vaste simpose alors, avec une vrication dans les textes, une plus large chelle travers linterrogation de textes, sur des CD-Rom ( Encyclopdia Universalis ), des bases textuelles informatises ( Scitech ( 13 ) de lInalf ), ou dans divers contextes balays grce au moteur de recherche Altavista. Il sagit dune exploitation de lusage, que lusage soit tabli ou naissant. Une recherche de la frquence autant que de la rpartition des attestations peut tre rapidement rvlatrice des usages suivre ou recommander.

3 Moyens spontanment mis en uvre et mthodologie adopte


3.1 Travail au sein du SNT
3.1.1 Recherches dans des dictionnaires et autres rpertoires de mots
Des termes, ou, le plus souvent, des traductions de termes, ainsi que leurs dnitions, sont recherchs, ainsi que leurs dnitions, dans la qute dquivalents franais des termes anglo-amricains. On consulte cette n :

47

Contributions

terminologues et traducteurs, un atout exceptionnel, ingalable et marquent une tape indispensable dans la rexion sur les termes ( 14 ).

3.3 Comparaison dexpriences diffrentes: lexicographie gnrale, lexicographie de spcialit et terminologie


Trois types de dmarches sont compares au tableau 3: la lexicographie gnrale (par exemple telle que nous lavons pratique dans le cadre du TLF ), la lexicographie de spcialit ( par exemple telle que nous lavons pratique pour le Supplment au TLF et pour les travaux de lquipe sciences et technique) et la terminologie (telle que nous la pratiquons au sein du SNT dans le cadre du travail pour les commissions spcialises de terminologie). Nous les avons caractrises selon leurs objets dtude, la mthode quelles entranent, le mode de classement des units tudies et le recours lusage ( 15 ). On relve de nombreux points communs entre ces trois dmarches, mais surtout le mme besoin danalyse et de synthse, ainsi que leffort de proposition et de

conseil, mais rpartis de manire diffrente entre ces trois expriences. Les units ltude sont issues de listes spcialises ou, plus rarement, de corpus textuels. Il faudrait systmatiser le recours aux marques de domaines, aux arbres de domaines conventionnellement arrts mais autorisant des spcications nouvelles. On atteste et valide les emplois et on privilgie lusage grce aux corpus textuels et aux recherches complmentaires dans de grandes bases de donnes textuelles et sur Internet. Mais, dans le traitement de termes, la question de lusage reste largement ouverte : nous y reviendrons.

4.2 Une objectivit difcile


Il est plausible que lon cherche viter des anglo-amricanismes vitables. Mais les ractions quant ces termes divergent dun expert dcideur lautre. La dnomination dun concept familier est accueillie favorablement, ft-elle angloamricaine. Un terme angloamricain dsignant un concept tranger la connaissance dun individu est naturellement moins bien accueilli. Lobjectivit nest pas partage de la mme manire selon que lon est, ou non, familier dun domaine de spcialit, de ses concepts et de ses dsignations.

4 Constats et perspectives
4.1 Un consensus difcile
Il arrive que des spcialistes runis au sein dune commission ne saccordent pas sur un terme, un domaine demploi ou une dnition : aprs avoir statu, il suft quils convient un collgue extrieur au groupe, qui, entendant les rsultats des dbats, slve contre un terme, sa dnition ou son domaine ou sousdomaine demploi, et tout est remis en cause. Le rsultat de sances de travail en commission spcialise peut aussi faire nalement lobjet dun renvoi une nouvelle srie dtudes et de dbats, pour navoir pas reu, ou pas totalement, lagrment du Service du dictionnaire de lAcadmie ( 16 ) et de la commission gnrale de terminologie. En tout tat de cause, il y a de fortes chances pour que les interventions ne concernent plus, alors, un vritable nologisme, mais un terme dj ancr dans lusage. Si le consensus est absent du dbut la n des dbats, ltude du terme est renvoye une date ultrieure, et peut-tre abandonne.

4.3 Choix conventionnels: tiquetage par domaines


Il arrive que des termes ltude, dans le domaine de comptence de la commission spcialise, relvent galement dautres domaines ou sousdomaines. Les spcialistes de la commission runie renvoient alors ce terme leurs collgues des autres spcialits, pour sassurer de lopportunit dajouter une autre marque de domaine celle(s ) propose( s ) par leur commission. Il nest pas rare que la deuxime commission saisie propose alors de reformuler la dnition, paralllement lintroduction de la nouvelle marque de domaine.

( 14 ) Outre les synthses tablies, ces circuits comprennent aussi des changes avec les terminologues des autres pays francophones ( Canada, Belgique, Suisse ) et avec des organismes de normalisation. ( 15 ) On se reportera avec prot Lerat ( 1994 ). ( 16 ) Le rle de lAcadmie est soulign dans Humbley ( paratre ). Il est dcrit dans le Rapport annuel de la Commission gnrale de terminologie et de nologie, 1998.

4.3.1 La terminologie des marques de domaines: une terminologie en soi


Nous sommes par ailleurs, avec les noms de domaines, dans un autre type de terminologie: cest la terminologie des marques ou indicateurs de domaines. Or bon nombre de ces termes-marqueurs ont aussi leur place dans les dictionnaires de langue on peut aisment consulter les longues listes de marques de domaines, en gnral abrges, qui

48

Contributions

ouvrent tout dictionnaire de langue. Le Dictionnaire de lAcadmie compte, pour le premier tome de sa neuvime dition ( 1994, A Enz- ), 137 marques de domaines. Le recours aux domaines est habituel en lexicographie gnrale, tout comme en lexicographie de spcialit et va de soi en terminologie. Mais lusage des marques de domaines implique toujours ladoption de cadres conventionnels ( 17 ). Ces marques ont la valeur de simples tiquettes et rpondent un codage. Cest, davantage encore, le cas des langages documentaires comme les thesaurus. Certains de leurs descripteurs accompagnent avec succs les descriptions linguistiques des mots de dictionnaires. Des confusions existent lorsque deux types de systmes diffrents sont utiliss conjointement et que le rpertoire, lexicographique ou terminologique, ne les distingue pas sufsamment. Langage administratif, institutionnel et langage usuel des initis du domaine de spcialit peuvent ainsi tre confondus. Cest ainsi que la commission gnrale de terminologie souhaite distinguer ce qui relve de lenrichissement de la langue franaise et ce qui relve de la terminologie administratrice et juridique ( Rapport annuel, 1998 : 11 ). Il faut dnir les tiquettes, ou, plus exactement, dterminer les ensembles auxquels elles renvoient et les sous-ensembles quelles incluent ventuellement. Dans les diffrents types de constructions ou de recueils administratifs, on cherchera viter les dnominations ambiges, ou rpondant des modes de distribution inhomognes. Les langages documentaires nont pas

pour fonction premire de correspondre aux termes utiliss dans le discours scientique ou technique, mais il peut y avoir ressemblance et adquation trompeuse. Si la nologie nest pas, sans doute, prdominante dans les terminologies en usage ici, elle y est prsente. Do lutilit de collaborations comme celle engage entre la commission spcialise de terminologie comptente pour le domaine de la sant et des groupes uvrant des classications mdicales, comme la Classication commune des actes des professions de sant ( CCAPS ), due au Ple dexpertise et de rfrence national des nomenclatures de sant ( PERNNS ), et ralise partir de la Nomenclature gnrale des actes de professionnels ( NGAP ) et du Catalogue des actes mdicaux ( CdAM ), ou la Classication alphanumrique de la documentation mdicale et pharmaceutique ( CANDO ).

introduits chacun par son tiquette de domaine, voire proposerait une seule dnition, avec une indication de domaine supplmentaire pour une partie de la dnition seulement. Ce catalogage des termes par tiquettes de domaines est lui-mme modulable : ainsi, on peut aussi bien proposer en parallle deux tiquettes de domaines, cest--dire rattacher simultanment un mme terme ce deux tiquettes ( par exemple : ingnierie nuclaire ou sant pour le terme radioprotection ), ou encore proposer une hirarchie dans le classement de ces tiquettes et recourir une tiquette de domaine et une tiquette de sous-domaine ( par exemple transports par rapport aronautique ). Une confusion risque de se faire jour entre les sens, les emplois particuliers de mots et les termes ayant un sens spcique dans le cadre dun domaine particulier demploi, que ce domaine relve des sciences ou des applications technologiques ou industrielles.

4.3.2 Points de vue terminologique ou lexicographique


Dans les dmarches terminologique et lexicographique, le changement de domaine pourrait tre trait comme le changement de sens. Dans le cas dun changement de sens, sil sagit de modier la dnition dun terme, que le sens de ce terme ait volu ou quil y ait eu transfert ou glissement de son domaine demploi, on estime, en terminologie, quon a affaire deux units diffrentes. En lexicographie, on a l deux sens diffrents, ou deux emplois diffrents dun mme mot. Pour un changement de domaine dappartenance, cette rpartition est plus difcile faire. Dun strict point de vue de terminologue, on admet quon a affaire deux termes, relevant de deux domaines demploi diffrents, alors quun traitement lexicographique ferait placer sous une mme entre deux alinas successifs,

4.4 La veille nologique en terminologie


La veille nologique et terminologique a souvent pour rle dappuyer ou de rorienter des propositions. Mais l encore, la prudence simpose. Ce nest pas toujours un article de journal, ou quelques extraits de la presse du mois qui permettent de prendre une dcision. On connat les effets de mode, les usages qui se rpandent aujourdhui extrmement vite: en 15 jours il arrive que lon ait recueilli pour un terme autant dattestations demploi quen 20 ans auparavant; les attestations sont donc nombreuses, mais la couverture des emplois nest pas signicative. Cette activit est dvelopper, avec les spcialistes des domaines. Toutes les propositions sont envisager : la mise en forme de
49

( 17 ) Notre exprience du Dictionnaire de sigles a t clairante ce sujet.

Contributions

documents dj collects, aussi bien que le lancement de nouvelles collectes. Bien entendu, elle existe dj largement, et de faon ingale, conformment aux besoins des commissions spcialises de terminologie et nologie. On devrait tenir compte de plusieurs paramtres : ( a ) du nombre doccurrences releves par domaines de spcialit recenss, ( b ) du nombre doccurrences releves dans des rpertoires de spcialit et dans des terminologies, (c ) des avis des reprsentants des groupements professionnels, des groupes dutilisateurs, dusagers de la langue du domaine souvent bien prsents ou reprsents dans les commissions de terminologie, (d ) des types de supports textuels analyss : encyclopdies ( Encyclopdia Universalis ), Internet ( Altavista : toutes sortes de textes ), journaux, manuels, articles de vulgarisation, etc. et ( e ) pour un terme du vocabulaire scientique gnral, du nombre de domaines ou de sous-domaines recenss. La veille passe par une expertise que lon appellera de premire main : donnes rassembles et fournies par les spcialistes eux-mmes, documents lists, extraits de journaux fournis par les membres des commissions, ou par dautres contributeurs. Elle protera aussi dune expertise de seconde main , donnes provenant par exemple des mmoires de terminologie rdigs par des tudiants ; cet ensemble pourraient tre agrges les donnes que nous avions collectes dores et dj dans le cadre de lquipe Sciences et techniques de lInalf. La veille peut par ailleurs contribuer aux travaux dingnierie linguistique relatifs au reprage automatique de terme. Le SNT ne saurait tre systmatiquement un producteur de nologie : cest le domaine des spcialistes. Il peut ltre
50

occasionnellement. Plus exactement, cette fonction serait donc dtre rcepteur et organisateur, archiveur de nologie, ou du moins de collaborer un tel ensemble dactivits.

4.5 Description de lusage ou prescription ?


Lusage dcidera , conclue-t-on couramment dfaut de consensus. Cela revient, le plus souvent, laisser le terme anglo-amricain simplanter. L usage , qui serait corriger en usages , serait rednir, moyennant un ensemble denqutes permettant de tenir compte du double critre de frquence et de rpartition des emplois. Lusage simpose toujours, paralllement ou concurremment aux actions de prescripteurs , mais, paradoxalement, cest quand il devient gnant quune solution commode pour les prescripteurs consiste dire lusage tranchera, ou laissons faire lusage . Cest ce qua tendance faire lAcadmie, gardienne de la langue et dfenseur de lusage, prcisment. Cest ce que fait le TLF, qui atteste, dcrit les sens, emplois et usages rencontrs. Mais ni le Dictionnaire de lAcadmie ni le TLF ne prtendent tre des dictionnaires de franais scientique ou technique, mme si le Supplment au TLF ( o notre quipe a choisi dviter les usages postrieurs 1970 an dtre mieux mme de juger des usages tablis ) sen rapproche davantage, pour ce qui est de la partie spcialise du vocabulaire pris en compte. Mais dans le cadre de laction pour laquelle uvrent les commissions spcialises de terminologie et de nologie, laisser faire lusage quivaut aussi bien laisser langlo-amricanisme simplanter aux dpens dun usage naissant, alternative commode, qui pourrait facilement tre adopte par les spcialistes, pour peu quon les y

encourage. Lexemple cit plus haut de leadership vs chef de lat fait entrevoir deux ralits: ne pas accepter de recommander ofciellement le nologisme de chef de lat dans les textes relatifs la Banque incite langloamricanisme, ce qui va lencontre de leffort d obligation pour les services de ltat demployer les quivalents franais publis la place des termes trangers correspondants ( Rapport annuel de la commission gnrale de terminologie et de nologie, 1998 : 9 ). Mais il est vrai aussi que si lusage dores et dj implant chez les professionnels du domaine est chef de lat, ce terme continuera sur sa lance, mme si le dispositif ofciel denrichissement de la langue franaise prfrait sabstenir de le recommander ( 18 ). Il y a des interfrences aussi bien que de grandes dissensions entre deux types dusages : on peut sexprimer en langue gnrale courante, commune un grand nombre de locuteurs de la rue , ou bien user dune langue de spcialit, pouvant atteindre un degr de spcialisation extrme, o se pose alors le problme du faible nombre de spcialistes, mais dont le langage a une porte extraordinaire du fait de ses implications en recherche, ou dans les applications industrielles, puis commerciales, etc. Avec cette diffusion possible des concepts et des termes dabord spcialiss, le terme spcialis rejoindra le grand public, en se banalisant. De mme que certains rpertoires gnralistes nhsitent pas jouer un rle prescriptif , comme le Petit Robert ( 1996 ) qui note volontiers abus. pour abusif , et abusivt pour

( 18 ) Voir aussi le numro de Terminologies nouvelles consacr lImplantation des termes ofciels ( 1994 ).

Contributions

abusivement , une forme de prescription se dgage des conseils prodigus aux spcialistes, avec des directives dusage. Cest ce que fait le Dictionnaire des termes ofciels en mettant en garde contre des termes trangers ou termes impropres viter ou remplacer . Cest aussi ce que font la DGLF et la commission gnrale de terminologie lissue des travaux des commissions, sil y a eu consensus, par les publications au Journal Ofciel puis sous la forme de fascicules thmatiques ( Vocabulaires ). On trouve ainsi, dans les fascicules de Vocabulaires, en notes, les prcisions et recommandations suivantes : On rencontre parfois aussi, moins bien, organiseur ( Informatique, 1998, J.O., : sous agenda lectronique ) ; lexpression ligne numrique paire asymtrique ne doit pas tre utilise ( Internet, 1999, J.O., sous raccordement numrique asymtrique ), lexpression pr-marketing est impropre , marketing direct est impropre ( conomie et des nances, 1998, J.O., respectivement sous prplacement et sous vente directe ) ; Il est dconseill dutiliser le terme catalogue outdoor ( conomie et des nances, 1998, J.O., sous catalogue du plein air ) ; le terme connectivit est dconseill ( Informatique, 1998, J.O., sous connexit ) ; le terme inforoute, qui nest pas recommand ( Internet, 1999, J.O., sous autoroutes de linformation ) ; le terme stewarding ne doit pas tre utilis ( Sport, J.O., sous stadiaire ). Cest ce que peuvent faire aussi certaines commissions, par un avis dans la presse spcialise sur la dnomination de concepts mergeant dans leur domaine. Une telle action est prometteuse dans le domaine mdical mais il ne semble pas que les physiciens, ou les mcaniciens sexprimant dans notre idiome bncient dun mdia journalistique sadressant un public sufsamment large : il ny a pas de revue gnraliste de physiciens. La Recherche sadresse

aux spcialistes de tous les domaines confondus. Les nombreux spcialistes auxquels nous avons eu loccasion de nous adresser ces dernires annes, loccasion de la rdaction de dnitions ou du choix de termes faire entrer dans les dictionnaires, sont particulirement intresss par le processus dentre des mots de leurs domaines dans le dictionnaire, dattestation de sens et demplois spcialiss. Aujourdhui, lorsque nous posons des questions aux spcialistes au sujet de termes nouveaux proposer comme alternatives linguistiquement efcaces aux anglo-amricanismes dj en usage, an de corriger ou de faire agrer un usage naturel spontan, nous obtenons deux types de rponses trs distinctes. Les uns sont sceptiques, car lide est rpandue, dans la communaut scientique, que toute action sur la langue venue den haut demeure inconnue, inutile et sans effet. Les autres sont prts collaborer et semparent mme, loccasion, des termes que nous soumettons leur jugement et nous disent les rutiliser aussitt car ils leur manquaient. Il est donc bienvenu de crer ou daider la cration et le dveloppement de nouveaux outils mthodologiques pour la nologie, sa collecte, sa cration, sa description, lincitation son abandon ou son usage et nalement sa diffusion. On y arrivera en encourageant la collaboration entre les scientiques et les linguistes, dans un commun respect. Danielle Candel, Service de nologie et terminologie, Inalf, CNRS, Paris, France.

Bibliographie
Candel ( D. ), 1994 : Vers un dictionnaire de franais scientique et technique , dans Franais scientique et technique, Candel ( D. ) d., Didier rudition, p. 185-201. Candel ( D. ), paratre : Franais scientique et technique , dans Histoire de la langue franaise 1945 2000. Candel ( D. ), Carton ( J. ), Marchaudon ( P. ) et Toldano ( V. ), 1992 : Dictionnaire de sigles, domaines conomiques et sociaux, Conseil conomique et social, CNRS, INaLF, La Maison du Dictionnaire, XXIV- 744 p. De Schaetzen ( C. ), 1990 : Besoins et ressources belges en terminologie, dans Terminologies nouvelles, 3, p. 55-57. Humbley ( J. ), paratre : Terminologie , dans Histoire de la langue franaise 1945 2000. Lerat ( P. ), 1994 : Terminologie vs lexicographie, dans Candel (D. ) d., Franais scientique et technique, Didier rudition, p. 27-36. Rapport annuel de la commission gnrale de terminologie et de nologie, 1998 : Premier Ministre, DGLF, 47 p. Rapport dtape, 1997 : CNRS INaLF, UPR 9017, 52 p. Spillner ( B. ), 1994 : Terminologie et connotations , dans Candel (D. ) d., Franais scientique et technique, Didier rudition, p. 53-62. Terminologies nouvelles, 1994 : Implantation des termes ofciels, actes du sminaire ( Rouen, dcembre 1993 ), 165 p.

51

Contributions

Tableau 1. Principaux objets dtude et recherches engages. Principales actions engages Assistance la veille terminologique et nologique oui oui

Recherche dun terme franais quivalent un terme angloamricain en train de simplanter en franais oui oui ( partiel ) synonyme dun autre terme franais dj en usage oui oui ( partiel )

Principaux objets dtude nologisme de forme nologisme de sens

dj en usage en franais oui

Tableau 2. Quelques phnomnes observs dans les principales actions de terminologie ponctuelle. Principales actions engages Autres phnomnes observs, lis la nologie Variabilit dnitionnelle Incidence diachronique dans les usages observs Incidence du domaine ou du degr de spcialisation Variabilit formelle

laboration ou reformulation dune dnition pour une unit linguistique ou terminologique dont le sens a volu pour une unit linguistique ou terminologique dont le domaine demploi a chang qui sadresse aussi au grand public

Examen ou rexamen dun terme dont le domaine demploi a chang dune forme dont la graphie a chang

oui

oui

oui

oui

oui

oui

oui

oui

oui

52

Contributions

Tableau 3. Trois expriences : lexicographie gnrale, lexicographie de spcialit, terminologie. Trois expriences caractristiques lINaLF objet dtude Prsentation listes de termes proposes par domaines termes extraits de corpus termes franais Idiome dorigine des termes emprunts angloamricains termes trangers Mthode dtude dans des rpertoires de mots recherches dans des textes complmentaires Mode de classement rpartition des termes par domaines Respect de lusage constat et mise en avant de lusage oui oui ? souvent oui oui oui oui rarement oui oui oui oui souvent oui Lexicographie gnrale Lexicographie de spcialit Terminologie ponctuelle

non oui oui rarement non

souvent souvent oui souvent rarement

oui rarement souvent souvent oui

53

Contributions

La conversion et linterface innitif/impratif/nom dans la terminologie du micro-ordinateur


La formation terminologique emploie, entre autres, la conversion ( drivation impropre, hypostase ) pour rpondre aux besoins de dnomination et denrichissement lexical. En principe, ce transfert transcatgoriel aboutit, dans de nombreux cas, ladjectivation ou la nominalisation. Cette formation lexicale et terminologique rvle donc un mouvement entre les classes lexicales. Dans la terminologie moderne du micro-ordinateur telle celle du texte intgral ( continu, suivi ) accompagnant le coffret du traitement de texte Microsoft Word 6.0 ( 1994 ), ce mouvement provoque un affaiblissement de lopposition innitif/impratif/nom. Cet affaiblissement permet, et en anglais et en franais, la coalescence entre ces trois fonctions et ce type de formation est investi dune capacit productrice bnque parce quconomique. Termes-cls : terminologie, conversion, drivation, cration lexicale, catgories grammaticales.

a morphologie des units linguistiques telles quelles sont employes dans la langue technoscientique nous offre loccasion dobserver de nombreux phnomnes la lumire des principes permettant de crer une varit dlments lexicaux. Les procds que lon observe mettent parfois lpreuve certains principes de cration lexicale, une activit qui est souvent imptueuse sinon inattendue, do ltiquette de crativit quon lui confre. Mais comme on le verra dans cette tude, il y a correspondance et concordance entre la langue usuelle et la terminologie selon les procds employs ; en fait, celle-ci senracine dans celle-l et lui sert de point de dpart. Pour ce qui est de la conversion face aux catgories grammaticales que nous soulevons, il y a lieu dexaminer les effets rels et potentiels qui simposent. La conversion dcrit deux termes de forme semblable (et dune origine tymologique commune) qui nissent par appartenir deux classes lexicales diffrentes. Ce type de drivation a pour synonymes lhypostase et la drivation impropre et mme la drivation zro ( en anglais zero derivation ). Cette formation marque par labsence dafxes et par le changement de catgorie grammaticale rend possibles des constructions complexes avec de grandes implications syntaxiques comme nous le constaterons dans des syntagmes lexicaliss. On peut critiquer ce mode, mais il fournit une grande souplesse et exploite le

concept dconomie qui fait quun nombre restreint dlments formateurs permettent la cration de multiples constructions terminologises. En principe, ce transfert transcatgoriel aboutit, dans de nombreux cas, ladjectivation ou la nominalisation, la signication se limitant un seul champ smantique. Mais ce faisant, le processus drivationnel implique une dynamique associative, paradigmatique. Cette formation lexicale et terminologique rvle donc un mouvement entre les classes lexicales. Il faut faire mention du fait que cette formation, loin dtre exclusive la terminologie, est un des procds morphologiques en grammaire, la fois en franais et en anglais. Mais dans la terminologie moderne du micro-ordinateur, ce processus provoque un affaiblissement de lopposition innitif/impratif/nom, observation qui dcoule de la prpondrance des noms et dautres formes nominalises en terminologie et en terminographie. Cet affaiblissement permet en franais et en anglais la coalescence entre ces trois fonctions, et ce type de formation est investi dune capacit productrice bnque parce quconomique. En revanche, certains estiment que cette formation risque de perturber la grammaire drivationnelle. En franais technoscientique, la cration lexicale occupe une place importante et les procds qui permettent la crativit restent encore expliciter, compte tenu de leur rapport avec certains phnomnes

54

Contributions

linguistiques et extra-linguistiques. Mais sans conteste, ces mcanismes seffectuent conformment une double quation dnomination/dnition, dnomination/conceptualisation. Nous nous proposons donc daborder linterface de ces catgories grammaticales au sein de la terminologie franaise du microordinateur ( donc de la microinformatique). Pour ce faire, on renvoie aux catgories ci-dessous.

1 Participe prsent (Ppr) > Nom ( N )


Ce qui suit constitue lillustration du participe prsent qui aboutit au nom : courant ( ppr>n ) alternatif, courant ottant, cas de double drivation impropre o les deux lments du syntagme lexicalis rvlent la drivation impropre par excellence ppr>n ; ppr>adj. dans le fonctionnement syntaxique du deuxime lment ; courant porteur ( premier lment : ppr>n ; deuxime lment : n>adj. postpos ) ; un syntagme peut mme se crer partir de cette combinaison nominale pour donner : courant porteur commun produisant alors une formule de type n+adj.+adj. On peut citer aussi cet lment compos : intrants-extrants ( ppr>n : formes substantivales formes loccasion de lavnement des concepts quelles dcrivent, savoir les donnes qui entrent et qui sortent ( information, donnes pp>nfpl ) du systme informatique. Les intrants, par un processus mtonymique, ont galement trait aux aspects du matriel : clavier, souris, lecteur optique, unit dentre ( 2e lment : n<pp ) tandis que les extrants dsignent aussi cran, imprimante ( nf<vb [ ppr ]+e ), sortie ( pp+e>nf ) sonore, etc. On voit donc que ces dsinences des participes nous fournissent les

sufxes formateurs : -ant( e ) et -( e ). Les formes drives impropres qui en rsultent sont utiles pour former les syntagmes lexicaliss: imprimante ( nf<ppr [ adj ] ) dans imprimante sans impact, imprimante impact, imprimante jeu lectrostatiques, imprimante laser ( ou le second lment est dabord emprunt et sigle li, intgr et non pel anglais jouant ici le rle du dterminant dans un syntagme lexicalis). Dans le Guide de lutilisateur Microsoft Word ( 1994 ), dornavant le Guide, notre source primaire, nous avons pu relever une quantit modeste dexemples autonomes tels Assistants, exposant. Par ailleurs, nous avons trouv ce procd assez productif dans les crations syntagmatiques lexicalises comme dans les cas suivants.

rservons nos commentaires jusquau passage sur les syntagmes lexicaliss.

3 Participe pass (Pp) > Nom (N )


Illustrons ce procd par accus ( pp>n, comme dans accus de rception ), donnes qui gurent dans base de donnes, et porteuse comme dans porteuse de donnes, modulation damplitude sans porteuse, modulation porteuse inhibe. Il convient de signaler la prsence de ce type de drivation impropre dans notre source primaire, savoir le Guide : le soulign, le double soulign ( employ parfois comme descriptif de bouton), le barr, les pointills, le rsum ( qui peut englober les statistiques dun document donn ), les coordonnes ( nfpl ) et le libell. Pour ce dernier exemple, le Petit Robert ( 1993 :1277 ) indique que cest un substantif driv de libeller, cest--dire rdiger dans les formes. Il sagit des termes dans lesquels un acte ofciel est rdig, comme par exemple dans lemploi spcialis le libell dun jugement. Ce nest que par extension smantique que nous arrivons libell dune demande, dune lettre. Cest dans cette optique que libell est employ dans notre source primaire. On y trouve galement : saisie comme dans, par exemple, saisie de texte, de donne, de dimensions, de glossaire, etc., ce dernier tant synonyme de entre (s ) employ souvent en petites majuscules (ENTRE ) pour indiquer le descriptif de la touche. Il y a des cas o ce mode permet des syntagmes du type touche de raccourci o le deuxime lment est un participe pass ( il peut tre considr comme rgressif ), et mise jour, mise en forme.
55

2 Ppr > Adjectif (Adj ) ( surtout dans les syntagmes lexicaliss)


Dans marge ottante ( nf ) on remarque que ottante ( lment rgisseur lintrieur dun terme complexe ) est dabord participe prsent transform en adjectif, avec la marque du fminin par lajout de e qui assure la dnition et la cohsion syntaxique du syntagme. Il en va de mme des syntagmes menu droulant et barre doutils ottante. Dautres exemples sont : statistiques parlantes, ce qui est trs expressif ou qui se passe de commentaire, cette qualit recherche des donnes ou des entres en gnral est un des tests de facilit ; option croissant/dcroissant, commande qui remplace parfois les formes innitives impratives sous certains menus et dans certaines botes de dialogue. On retrouve galement des syntagmes du type N+Prp+N+Ppr : point dinsertion clignotant. Pour ce qui est du manque daccord ou de la rupture syntaxique et de lemploi des majuscules initiales dans certains des exemples, nous

Contributions

4 Pp > Adj ( composition et syntagmes lexicaliss)


4.1 N+Adj o ladjectif dterminant est un participe pass
Ce procd est productif et rpond comme dans la langue usuelle au besoin de modication des noms qui constituent les lments principaux du syntagme: image incorpore ; espaces rservs ; listes hirarchises ( ascendantes/ descendantes ) ; rpertoire partag ; dossier partag ; paramtres dnis ou prdnis ; entre prdnie ; sparateur prdni ; taille prdnie ; ombrage prdni ; bordures prdnies ; plage dnie ; texte masqu ; titre intgr ; cellules rfrences ( plutt driv du nom rfrence ) ; cas dsactiv ; ancre verrouille ; zone ombre ; et expressions renverses telles Word installation ; fentre spare ; bordure hachure ; lment dessin ; ombre porte ; document rcupr ( sauvegard ) ; recherche pousse ; polices intgres ; style intgr ; texte justi, texte non justi ( alignement de texte ) ; marque dpose ; doubles touches intgres. On relve ce procd dans llment demprunt compos dans ce syntagme : PostScript encapsul, marque dpose crite avec des majuscules linitiale des mots constituants.

on peut sattendre parenthse ouvrante ; lettres rsultantes. On rencontre moins frquemment le format Adj+N : gros titre ; double interligne. Ladjectivation seffectue bien sr par le truchement du sufxe -able : tirets inscables, espaces inscable ; caractre non imprimable, zone non imprimable, polices dimensionnables ; ordinateur portable devant ordinateur portatif.

5 N1+N2
Cette construction syntagmatique entrane limprvisibilit parce quil est parfois difcile dtablir les rapports hirarchiques et smantiques entre N1 et N2 comme on le remarque dans les termes composs tandem. On essaie de dterminer les rgissants et les rgisseurs mais le rapport de subordination peut aller dans les deux sens. Citons par exemple carte son qui ne devient clair quaprs linsertion du joncteur de dont la chute est la base de lambigut ressentie ; raccourci clavier ; dossier systme ; chier texte et chiers texte dont le modicateur reste invariable, soulignant ainsi sa nature nominale et sa conversion incomplte ; alimentation papier par le truchement du bac ; documents matres ; conguration systme ; pilotes cran ( deuximes lments invariables ) ; paramtres clavier sans accord du pluriel pour N2; service clientle ; logiciel systme ; espace disque ; lecteur rseau ; trait connecteur ( N2 passerait facilement pour adjectif comme dans dispositif convertisseur ) ; version cran ; chier source ; longueur page ; champs Texte parfois sans T majuscule; Insertion Champ ; type quadrillage ( formulaire ) ; formule politesse ; Initiales auteur ; style journal ; mots cls ( parfois compos mots-cls ) ; conventions clavier ; Assistant Lettre

4.2 N+Adj o ladjectif provient de la conversion du participe prsent


Le cas des modicateurs source participiale est trs frquent et comprend les participes prsents : liste droulante que lon remarque dans champ Liste droulante ; texte environnant ; date courante ; heure courante ; titre courant ; disque tournant ; parenthse fermante, do
56

( lettres initiales majuscules) ; touche RETOUR ; touche ENTREE ; service clients ; lettre type. Cette variante de drivation impropre gure dans des syntagmes lexicaliss parfois complexes. Nous citerons ici des exemples peu complexes, rservant les plus complexes pour la rubrique des crations syntagmatiques: vice cach ; systme indtermin ; paramtres dnis ou prdnis ; barres doutils intgres ( ancres, empiles ) ; dossier partag ; rpertoire partag ; systme daide tendue ; listes hirarchises ; espaces rservs. Dans ces exemples, le terme en gros, cest--dire lensemble de la dsignation, est un nom et on y remarque une prpondrance du genre masculin. Le genre du dterminant dpend de llment rgissant du syntagme. Dautres termes syntagmatiss semblables sont: papier carbon ( nm ), commande imbrique ( nf ), tube ombr, rseau dcentralis, ordinateur jumels. On voit facilement pourquoi Darmesteter ( 1877 : 41 ) qualiait dune manire assez simple ces formations comme celles [ ] qui ne recour[ ent ] pas des sufxes . Cette nominalisation semble trs commode et productive en informatique sans grands retentissements sur la nominalisation des syntagmes lexicaliss qui contiennent ces adjectifs. Les lments en deuxime position jouant le rle de dterminant suivent le nombre et le genre des lments surtout nominaux qui prcdent. Le genre des syntagmes prpositionnels stablit partir du caractre du premier lment.

6 Adj > N
Un exemple ici est utilitaire ( adj )>utilitaire ( n ) ce dernier tant un dispositif qui, selon le cas, permet de raliser une opration. Ainsi, on peut avoir un utilitaire qui permet

Contributions

dimprimer des tiquettes facilement et rapidement. Le passage de la forme adjectivale la forme nominale rvle lhomographie comme dans le cas des noms suivants par rapport la catgorie grammaticale dont ils sont issus : le priphrique ; le graphique ; le gras ; litalique.

7 N > Adj ( syntagmes lexicaliss)


Nous avons vu prcdemment les noms postposs jouant le rle dadjectifs dans la partie sur la formation par composition lorsquon analysait les termes forms de deux ou plusieurs noms la fois. On y remarquera la valeur adjectivale du nom postpos modicateur dans son rle de complment de nom lintrieur des syntagmes terminologiss. Leur conversion de la catgorie nominale la classe adjectivale dans leur fonctionnement syntaxique facilite la cration de bon nombre de termes importants en terminologie de linformatique. Dans ce cas, on pourrait parler de la composition ou de la syntagmatisation (sil sagit dun syntagme ) par drivation impropre. La liste dexemples que nous fournirons permettra de vrier cette observation : tabulation arrire ( n1+n2 o n2 = dterminant (adj, adv ), systme anticopie ( on notera le caractre invariable de ce n2 dans son rle dadjectif malgr sa terminaison), ingnieur programmeur, ingnieur logiciel, langage auteur, logiciel auteur. Le Guide nous fournit parmi dautres exemples : chiers texte ; conventions clavier o n2 ne saccorde pas avec n1 du point de vue syntaxique; Assistant Lettre o n1 et n2 ont une lettre majuscule linitiale ; mode Refrappe o n2 a une lettre initiale majuscule; style journal ; cran Word o n2 = emprunt langlais commenant par une lettre majuscule ( marque

dpose ) ; Mots cls o il y a accord entre les deux lments ; fentre Word : 2e lment = emprunt, le 1er lment reprsente un emploi mtaphorique faisant appel son quivalent anglais; Police TrueType : syntagme o le 1er lment franais se combine avec n2, lment demprunt compos postpos modicateur ; document Word ; programme dinstallation Word ; documents matres ; mulation de terminal ANSI, Windows NT dont les sigles emprunts et nayant pas dquivalents franais dans le texte fonctionnent en tant que modicateur ( rle adjectival ). Cette formation rentrerait plutt dans la catgorie de la syntagmatisation des formants ; cest un des procds qui permettent de contourner le besoin de crer de nouveaux lments demprunt, sigles ou termes isols, malgr lapparence dhybridation souvent critique dans les cas demprunt de souche anglaise. Dans la terminologie du traitement de texte qui nous proccupe, cet emploi est privilgi cause du souci de garder les noms dposs de plusieurs programmes appartenant au coffret, y compris les programmes supplmentaires indispensables.

8 Innitif
Innitif ( Inf ) > Impratif ( Imp ) Un autre cas frappant de drivation impropre sapparente ( peut-tre par analogie) lusage en smiotique contemporaine qui recherche le smantisme pur par son exploitation des drivations non sufxes en suivant la formule Inf>N. Cest le cas de linnitif nominalis ( source verbale innitive ) du type lavoir, le faire, le paratre, le valoir, le vouloir, le devenir, le pouvoir-faire, le savoir-faire, le savoir-connatre, le faireconnatre, etc. Pour ce qui est de notre dpouillement, nous avons relev les exemples qui suivent dans un texte

suivi ( Armand et Bonneau: 1994 ) conu dun point de vue pdagogique et destin dmystier et rendre plus accessible lapprentissage des principaux systmes dexploitation et dapplication ainsi que certains logiciels de traitement de texte les plus employs. Les exemples cidessous rvlent la transformation de linnitif en impratif, drivation que lon remarque dailleurs dans la langue usuelle : Personnaliser, Rechercher, Remplacer, Slectionner, Enregistrer sous, Insrer, Dnir, Verrouiller, Dverrouiller, Fermer, Centrer Page, Dsactiver, Annuler, Crer. On note dans ces innitifs devenus impratifs que les lettres initiales sont toutes en majuscule. Ces mots de commande se trouvent dans diffrents menus et sont faciles comprendre ; la smantisation de linnitif nentrane aucune complexit dans le maniement de la terminologie telle que lemploient Armand et Bonneau. Lutilisateur non spcialiste qui cherche apprendre cette terminologie et qui sinitie au fonctionnement de lordinateur ne ressent pas de grands ennuis cet gard. Cet emploi conrme encore une fois que toute terminologie, surtout celle qui nous intresse en loccurrence, puise dans la langue usuelle. la diffrence de limpratif que lon trouve lintrieur du texte suivi de notre source de corpus primaire, limpratif qui signale les commandes accessibles par le truchement des boutons ou par les options de commandes marques sur les boutons dans les botes de dialogue et sur les boutons des barres doutils, fonctionnant comme lquivalent graphique dun menu ( qui regroupe en principe ces commandes ou options ), se manifeste par le biais de linnitif. Cette forme innitive est favorise grce la neutralit par rapport au sujet vis. Autrement dit,

57

Contributions

linnitif ne renvoie aucun pronom personnel. partir du Guide ( 1994 ) nous citerons les exemples en fonction des catgories suivantes. Tout dabord, des formes innitives simples pour signaler essentiellement des commandes : Fermer ; Enregistrer ; Imprimer ; Quitter sous le menu Fichier. Sous outils de vrication nous relevons par exemple Ignorer ; Suggrer ; Annuler ; Ajouter ; Supprimer ; Modier ; Restaurer, Expliquer, etc. Pour le lancement du programme, Lancer, Excuter. Pour ldition du document, Rechercher ; Remplacer ; Atteindre ; Couper ; Coller ; Copier ; Couper-Coller. La formule Inf+Prp nous donne les formes suivantes : Enregistrer Sous sous Fichier ; Remplacer par. Pour la combinaison Inf+Pronom : Accepter tout ; Rejeter tout ; Remplacer tout ; Enregistrer tout ; Slectionner tout. Pour la squence Inf+Adv, on trouve Ignorer toujours ; Remplacer partout lors de la vrication de document. Pour lordre Inf+N : Ajouter les mots ; Marquer les corrections ; Fusionner runions ; Comparer version ; Coller lignes ; Supprimer lignes ; Fermer un menu ; Reproduire la mise en forme. Avec un peu dexpansion, on a le format Inf+Inf+N : Faire apparatre les corrections lcran ( ou limpression ) une forme de construction priphrastique suivie dun nom et rendu en anglais par Format Painter. Pour la catgorie Inf+LocPrp, nous avons Remplacer en cours de frappe. En dernier lieu, pour Adv+Inf, il y a Toujours Substituer. Les catgories ci-dessus indiquent la souplesse et lconomie de cette forme de drivation neutre. Puisque linnitif ici remplace facilement limpratif, comme cest dailleurs le cas dans la langue commune, nous craignons que la critique de cette formation lexicale ne soit plus ncessaire. Ce mode de drivation impropre nous rappelle les mots anglais des mmes commandes
58

comme print, copy, save, replace, etc., o la morphologie des mots, du moins la graphie, ne montre aucune diffrence entre linnitif et limpratif. On voit donc que les verbes peuvent tre directement nominaliss ou adjectivs puis nominaliss ; ils gurent dans les syntagmes complexes lexicaliss o les lments qui changent ainsi de catgorie grammaticale remplissent la fonction dterminative dans lagencement syntaxique. Ce fonctionnement syntaxique est important car on voit la place des dterminants les verbes et noms qui fonctionnent en position postpose comme le feraient les lments de type proprement adjectifs.

9 Conclusion
Devant ces constatations, on relvera que Arriv et al. ( 1986 : 334 ) voient linnitif comme une forme du verbe ayant la particularit de ne connatre de marques ni de personnes, ni de nombre, ni de temps . Certains traits morphologiques confrent linnitif sa forme verbale. Il est galement susceptible, du point de vue syntaxique, dassumer toutes les fonctions du nom. Il est capable de fonctionner comme lquivalent dun impratif dans lexpression de lordre, de transmettre une consigne ou une interdiction. Pour Riegel et al. ( 1994 : 407 ), le caractre injonctif ou impratif est associ la gamme des actes directifs o le locuteur veut obtenir un certain comportement de son interlocuteur. Nous signalerons ce stade que dans la terminologie franaise de linformatique et selon loptique qui sous-tend la conception de cette interrogation, la prsence du locuteur est presque toujours latente. Le locuteur maintient une distance entre lui-mme et lusager du systme. Sil y a proximit, cest

essentiellement entre le systme informatique et celui qui sen sert, lment qui est mis en relief travers la serviabilit et la convivialit recherches par les utilisateurs des dispositifs informatiques. Poursuivant leur rexion, Riegel et al. ( 408 ) ajoutent que limpratif est doublement lacunaire car il est limit des personnes, et il est restreint au groupe verbal sans groupe nominal sujet exprim. Par ailleurs, linnitif ( 251 ; 334 ) est considr comme la forme nominale du verbe. Cest l o rside son attrait en terminologie de linformatique surtout dans la mesure o on a besoin dtablir une communication ou un dialogue virtuel entre lutilisateur et le systme informatique. Comment cet emploi de linnitif entrerait-il dans les dictionnaires techniques spcialiss traitant de linformatique, par exemple ? Son absence, ou son exclusion, si on lui a refus une considration terminographique (on peut noter que les formes verbales existent dans les dictionnaires gnraux de langue), est-elle attribuable sa marque dambigut ? Quoi quil en soit, on ne peut pas nier que linnitif peut tre employ la place de limpratif pour exprimer un ordre, un conseil avec la particularit graphique de lettres initiales capitales. Au point de vue de la communication, la conversion nous rappelle les six fonctions de Jakobson ( 1963 : 213-218 ; cf. Kocourek 1991 : 58 ) en particulier la fonction conative ( injonctive, appellative ). Lutilisateur ( ici le rcepteur, le lecteur ou le destinataire ) se servant du microordinateur est appel, mme en labsence apparente de lmetteur, excuter des oprations pertinentes. Ce qui frappe est que linteraction qui seffectue entre le systme informatique stablit non laide de limpratif, mais grce linnitif.

Contributions

Malgr les insufsances apparentes, aprs la cration de ces lments, il incombe au linguiste/terminologue dlaborer, dlucider le processus de cration lexicale et dtablir linterface entre les catgorisations grammaticales face aux servitudes de la grammaire de la langue concerne et de dmontrer ltendue de lemploi en question. Jusquici, les aspects portant sur les lments verbaux ont reu peu dattention, au prot des nominalisations. Il nous semble quil sagit dun emprunt smantique intralinguistique utile pour la terminologie de linformatique usite ces jours-ci par un effectif considrable de personnes, do le concept de la sociabilisation de linformatique. Si nous croyons la notion que le franais prfre dnommer les concepts plutt que de les dcrire, nous comprendrons pourquoi la terminologie franaise en gnral tend semparer de toute ressource disponible y compris des anglicismes, malgr les mesures extralinguistiques mises en place pour endiguer les lments inhabituels et trangers. Il est galement vident quil faut manier et travailler toute la gamme smiotique dune langue pour atteindre sa capacit dnominatrice et formatrice potentielle. Sinon, on nit par croire son insufsance et son incapacit face aux nouveaux concepts, surtout des concepts technoscientiques qui exigent une connaissance de pointe abstraite et exacte. Emmanuel Aito, Dpartement de franais, Universit de Regina, Regina, Saskatchewan, Canada.

Bibliographie
St-Pierre ( A. ), Bonneau ( A. ), 1994 : La matrise du micro-ordinateur, Boucherville, ditions Vermette Inc. Arriv ( M. ) et al. 1986 : La grammaire daujourdhui. Guide alphabtique de linguistique franaise, Paris, Flammarion. Darmesteter ( A. ), 1877 : De la cration actuelle de mots nouveaux dans la langue franaise et des lois qui la rglent, Paris, Vieweg ( Genve, Slatkine Reprints, 1972 ). Kocourek ( R. ), 1991, La langue franaise de la technique et de la science, 2e d., Wiesbaden, Brandstetter. Microsoft Corporation, 1994, Quick Results : Microsoft Word 6.0, USA, Microsoft. Microsoft Corporation, 1994, Users Guide : Microsoft Word 6.0, USA, Microsoft. Microsoft Corporation, 1994, Aperu : Microsoft Word 6.0, Ireland, Microsoft. Microsoft Corporation, 1994, Guide de lutilisateur Microsoft Word 6.0, USA, Microsoft. Petit Robert, 1993, Rey-Debove J. et Rey Alain, dir., Paris, Le Robert. Rieget ( M. ) et al., 1994, Grammaire mthodique du franais, Paris, PUF.

59

Contributions

Nologismes, internationalismes et mondialisation

La mondialisation laisse ses traces sur toutes les langues du monde. Les nouvelles technologies permettent dsormais de suivre cette volution linguistique de faon bien plus prcise que dans le pass. Alessio Petralli propose un systme de veille nologique concernant cinq communauts linguistiques, et livre les premiers rsultats de lenqute sur le phnomne de la mondialisation. Cet article est une mise jour de la communication orale prsente Barcelone en 1997 lUniversit Pompeu Fabra. Termes-cls : veille nologique; corpus ; nologie ; multilinguisme; nologisme formel; nologisme smantique; nologisme demprunt.

1 Introduction
es langues et leurs locuteurs sont dans un tat de perptuelle confrontation : on peut dire que leur diversit est une conrmation de leur identit. Cette confrontation, qui ne manque pas de susciter beaucoup dintrt, peut faire lobjet dtudes systmatiques : traductologie, lexicographie, enseignement des langues, par exemple. La mondialisation de ces dernires annes a raviv lintrt pour ces confrontations interlinguistiques, et pour les tudes contrastives en gnral, en rponse linternationalisation croissante de la socit qui cre le besoin de comptences linguistiques accrues. La linguistique de corpus ouvre de nouvelles perspectives dans le cadre des tudes contrastives. Il est dsormais possible daccder des corpus signicatifs numriss de types varis, disponibles en particulier sur Internet et sur des supports numriques ( cdroms ) ; le cot daccs est variable, mais actuellement trs faible, voire nul. Il existe des logiciels puissants dinterrogation textuelle, des interfaces conviviales et tout cela des prix abordables. Cependant la constitution de corpus lectroniques dune certaine taille, choisis avec des critres cohrents et convertis dans des formats spciques ( permettant linterrogation par des logiciels appropris, par exemple ), est une affaire autrement complexe et qui a son prix. Cette premire phase

longue et onreuse est le tribut que le linguiste doit payer an dobtenir des possibilits de recherches commodes et varies encore difcilement imaginables il y a peu de temps, ainsi, par exemple, la collaboration distance avec dautres chercheurs.

2 Parcours de recherche
La nologie internationale est dsormais en mesure de bncier des outils de traitement automatique et de procder lexploitation de grands corpus. On mesure aujourdhui le chemin parcouru lorsquon consulte les nombreux projets prsents dans le recueil de Braun-Schaeder-Volmert ( 1990 ), rfrence privilgie pour les internationalismes. De plus, les corpus informatiss et les rsultats de leurs analyses peuvent tre transmis et rendus accessibles assez facilement et peu de frais dans le monde entier, dautant plus que des liaisons efcaces ( Internet ), des ordinateurs puissants et des mmoires de masse volumineuses sont aujourdhui la porte du chercheur. Ces moyens de communication modernes ont une autre caractristique: la rapidit, qualit non ngligeable lorsquil sagit de pister les changements quotidiens dans des langues varies, tmoignages de la nologie internationale. Nous partons de lhypothse que la nologie internationale, base essentiellement sur langlais, peut tre diffuse quasi instantanment sur toute la plante; la tlvision atteint un public de masse, les nouveaux mdias une lite mergente. Les mots,

60

Contributions

comme les images, sont donc aujourdhui virtuellement omniprsents, et la disposition des masses, contrairement ce qui se passait autrefois lorsque les contacts internationaux constituaient le pr carr des personnes instruites. Il est intressant ce propos dexaminer comment on passe du mondial au local et vice versa. Ce qui nous a pouss vers les internationalismes tait notre travail sur litalien rgional du Tessin, qui comporte de nombreux tessinismes quon peut appeler danticipation ( Petralli 1990 : 126-129 ). En effet, au Tessin, on relve des nologismes italiens tels que : legge quadro de loi cadre, piano directore de plan directeur, educatore, de ducateur, riservazione de rservation, compostaggio de compostage, polluzione de pollution, suggestione de suggestion, boicotto de boycott, palette de palette, ordinatore de ordinateur, rsultat du contact quotidien que litalien rgional du canton suisse entretient depuis longtemps avec deux grandes langues de culture europenne, le franais et lallemand ( 1 ). Ce qui se passe au Tessin nest pas atypique de phnomnes analogues en Europe. On constate effectivement de nombreux parallles dans le lexique intellectuel, la langue de la mdecine ou des sciences des langues europennes. Ce qui est plus tonnant, en revanche, est le fait que la plupart des tudes sur les

internationalismes proviennent presque exclusivement de la linguistique allemande. La raison est sans doute laspiration louverture supranationale, qui a anim le monde universitaire allemand depuis la n de la Seconde guerre mondiale. Le projet dun observatoire de nologie internationale sest pourtant rvl bien plus difcile raliser que prvu. Il nous a fallu privilgier la nologie qualitative ( les signiants dans diffrentes langues dun petit nombre de nologismes choisis et en particulier de globalisation mondialisation, mais aussi multimedialit et interattivit, etc. ) plutt que les aspects quantitatifs, ou des listes plurilingues dinternationalismes nologiques rsultant dun dpouillement automatis.

3 Des corpus parallles aux corpus comparables


Lexploitation de corpus informatiss commence en 1961 avec la Brown University Corpus of American English, suivie vers la n des annes 60 du LOB Corpus, quivalent britannique de la premire. Au dbut les corpus numriss sont monolingues, mais rapidement on passe aux bilingues, visant une application lexicographique, traductionnelle ou pdagogique. Un des corpus bilingues le plus clbre est la transcription des dbats parlementaires canadiens, source inpuisable de textes politiques en franais et en anglais. Il sagit de corpus parallles, ou dune collection de textes dont les uns sont les traductions des autres. Beaucoup de corpus parallles plurilingues sont produits de nos jours par lUnion europenne et plus rcemment par la Suisse. Au dbut de nos recherches

nous avons utilis certains corpus parallles an de tester leur pertinence pour les recherches de nologismes internationaux. Dans la recherche dquivalents, lavantage des corpus parallles est indniable sur le plan quantitatif, mais on se heurte rapidement un inconvnient de taille. Les corpus bilingues et multilingues consistent gnralement en une langue source et en une ou plusieurs langues cibles, celle(s )-ci tant le fruit dune traduction. Il en rsulte des effets de distorsion du fait de la traduction, fortement inuence par la langue source. Le lexique dune traduction nest donc pas reprsentatif de celui de la langue cible. Dans le cas des corpus comparatifs, cependant, nous obtenons des textes qui traitent du mme sujet dans plusieurs langues et qui mettent en lumire des analogies de diffrents types, pas seulement lexicales, tmoignages authentiques des grands mouvements dhybridation culturelle et linguistique qui nous intressent. Plus gnralement, lexploitation de corpus comparables a sduit de nombreux chercheurs et pour beaucoup dutilisations ils reprsentent le nec plus ultra dans le cadre des corpus plurilingues.

4 Choix de secteurs et de domaines demplois


Aprs avoir test diffrents corpus parallles plurilingues, surtout dans les domaine de lcologie, de lconomie et du droit ( pour ce dernier, le recueil plurilingue de textes juridiques de lUnion europenne Celex, cf. http://europa.eu.int/celex est trs utile ), ns dans le contexte de lUnion europenne, nous avons dcid de nous concentrer sur des corpus comparables. Celui que nous avons constitu est tir de sources
61

( 1 ) On rappelle que le canton du Tessin, o on parle un italien rgional tessinois, est lun des vingt-six cantons suisses, qui runit 300 000 habitants sur 2 811 kilomtres carrs. Litalien est considr comme langue ofcielle, ct du franais et de lallemand, sans oublier le romanche ( voir Terminologies nouvelles 12 : 59 ).

Contributions

journalistiques et comporte cinq langues ( cf. tableau 1 ). Le choix de textes crits pris dans des journaux compromet quelque peu la reprsentativit de notre corpus, dans la mesure o le langage journalistique reprsente un registre soumis ses propres rgles. Ainsi, tout en soccupant potentiellement de tout, le langage des journaux serait plus apte exprimer certains sujets plutt que dautres et en parler dune certaine faon ( le style journalistique, qui peut dailleurs varier dun journal un autre ). Pour ces raisons il faut reconnatre que certains types dcrits sont presque totalement absents ( littraire ou potique par exemple ), alors que dautres sont surreprsents ( politique et conomique). En tout cas, aprs avoir rassembl un premier corpus, nous avons privilgi les articles qui traitent dune faon ou dune autre de la mondialisation. Mettant mondialisation en relation avec dautres mots-cls (voir tableau 2), par exemple avec style de vie, mode de vie et leurs quivalents dans les diffrentes langues, avec le prxe cyber- (dans les formes quivalentes en italien, allemand, anglais et espagnol), nous avons pu rassembler un nombre consquent darticles capables de donner la mesure de certaines tendances gnrales et actuelles. De telles tendances seraient, dans notre premire hypothse, lorigine de toute une srie de nologismes, qui reprsentent en quelque sorte certaines frontires de la nouvelle socit de la communication, au moins dans limaginaire vhicul par les quotidiens prestigieux cits dans le tableau 1.

espagnol ) comporte des articles sur ce quon peut appeler de faon large, style de vie de la mondialisation et des nouveaux mdias . Nous avons aussi cr un corpus plus restreint, consacr uniquement aux articles qui, toujours dans la mme priode ( 1992-1995 ) et dans les mmes journaux, comportent le mot italien globalizzazione ou lquivalent dans les autres langues. Le support privilgi pour ce traitement nest pas le papier mais bien sr le cdrom. En plus des cdroms, de nombreux textes journalistiques, surtout rcents, peuvent tre tlchargs partir dInternet. Cette option nest pas une solution de facilit: le langage HTML des pages de la toile engendre des difcults supplmentaires quand il sagit dobtenir un texte propre quon puisse interroger avec prot. Il serait galement possible de sadresser au fournisseur de bases de donnes qui permettent de rechercher des journaux en texte intgral, mais les cots peuvent tre relativement levs, surtout pour des journaux caractre conomique. Aprs un long travail de recherche et de tlchargement de donnes, nous sommes parvenus un corpus comportant aujourdhui 1 433 000 formes ( 2 ) pour cinq millions doccurrences ( cf. tableau 1 ). Ce corpus choisi et quilibr selon les critres simples dj esquisss est interrogeable souhait avec le logiciel danalyse textuelle trs puissant DBT ( 3 ).

un premier temps voulu procder toute une srie dexpriences qui ont donn quelques rsultats plus ou moins prometteurs. En outre, il faut noter que les secteurs qui nous intressent le plus ( les internationalismes nologiques) reprsentent seulement une des diffrentes possibilits dapprofondissement quun corpus comme le ntre offre au chercheur. Pour cette raison, aux recherches ponctuelles sur la diffusion dune nologie plus ou moins internationale, il est opportun dajouter des rexions caractre sociolinguistique. Il serait donc souhaitable quune observation permanente plusieurs niveaux soit conjugue une mise jour continue du corpus, et ce propos, il est ncessaire de bien dnir archive et collection. Un corpus de donnes textuelles peut tre dni comme une collection ( ou archive ) organise et articule de textes portant sur un domaine donn, dans lesquels sont reprsentes une ou plusieurs

6 Quelques enqutes effectues sur le corpus


Notre hypothse a t conrme par les rsultats des premiers sondages, rsums ici. Aprs avoir constitu le corpus, nous avons dans

( 2 ) Un repre quantitatif peut tre dduit de Volz ( 1996 : 162 ) lorsquil dit in order to browse the texts accumulated within a month from an average daily newspaper, a lexicographer would have to examine about 40 000 word forms, of which only 2% prove to be genuine neologisms ( cf. Maier-Meyer 1995 : 196 ). En tout cas, le nombre de 800 nologismes peut paratre excessif. ( 3 ) Pour dautres informations, voir http://www.ilc.pi.cnr.it/dbt/ pisystem.html. Il sagit dun corpus original dont lexploitation peut, notre avis, constituer une contribution signicative aux travaux sur les corpus comparables plurilingues.

5 Corpus en cinq langues


Le corpus en cinq langues ( italien, franais, allemand, anglais,
62

Contributions

langues ( 4 ). Comme nous lavons dj vu, prparer un corpus signicatif est une opration onreuse en termes dnergie et de temps. En effet, tous les problmes de rprabilit des donnes textuelles, il faut ajouter la ncessit de transfrer ces donnes dans un format utile qui permette des interrogations complexes, grce aux logiciels danalyse textuelle ddis comme DBT. Naturellement, une fois constitu, un corpus de qualit permet toute une srie articule et rapide de recherches nagure difcilement imaginables. La nologie en bncie grandement, comme lannonce dj Volz ( 1996 ).
( 4 ) Pour une dnition plus ofcielle , mais de langue anglaise, voir le Glossary of Corpus Linguistics, <http://clg1.bham.ac. uk/glossary.html> un corpus est un recueil de textes reprsentant la langue naturelle, choisi dans le but de caractriser un tat ou une varit de langues. En linguistique informatique moderne, un corpus comporte gnralement plusieurs millions de mots. La raison en est quil est reconnu que la crativit de la langue dbouche sur une varit dexpressions tellement vaste quil est difcile disoler les rcurrences qui sont les indices de la structure lexicale de la langue. Nous dcrivons ici deux types de corpus. Le premier est le corpus tmoin , qui est un recueil ni de textes, choisi en gnral avec beaucoup de prcaution et tudi en dtail. Une fois quun corpus tmoin est tabli, il ne subit aucune modication ni aucun ajout. Lautre type de corpus qui prend forme actuellement, est le corpus moniteur , qui rexploite des textes prpars sous forme numrise dans dautres buts : pour des imprimeurs dans le cas de journaux, de magazines, de livres, et de plus en plus, de traitements de textes; pour la langue parle, il sagit de transcriptions faites dans un but juridique ou bureaucratique.

7 A la recherche de nologismes et dinternationalismes


En se rfrant par exemple Petralli ( 1996b: 18 ), nous pouvons distinguer trois catgories de nologismes : le nologisme formel ( nouveau signiant pour un nouveau signi ), le nologisme smantique ( acquisition dun nouveau signi pour un signiant dj existant avec dautre( s ) signi( s ) ) et le nologisme demprunt ( importation plus ou moins directe dun vocable tranger avec des adaptations plus ou moins marques ). Dans la premire catgorie ( nologismes formels) nous comprenons le nologisme de formation : mot nouveau cr en exploitant les matriaux dj disponibles dans le systme linguistique et les recombinants.

7.1 Nologismes formels


Le nologisme formel est le type qui peut tre le plus facilement repr par des moyens automatiss ( cf. Volz 1996, le nologisme nouveau-n ). En effet le nouveau signiant peut tre facilement identi en confrontant deux corpus ou deux listes de mots. Puisque le nologisme est un mot nouveau, on prsuppose que la confrontation est faite entre des corpus comparables qui se rfrent des laps de temps divers ( diverses annes dun journal, par exemple ). Voir lannexe 1, qui prsente tous les mots qui commencent par a, b, c, contenus dans c92 ( Corriere della Sera 1992 ) et qui ne sont pas rpertoris dans DMI ( Dizionnario macchina dellitaliano ). Il nous a t possible dutiliser ce dictionnaire lectronique ( DMI ) de lInstitut de linguistique computationnelle du CNR Pise, reet lexical du vocabulaire italien de la seconde moiti des annes 80.

La liste des mots rsultant de cette comparaison comporte 373 units, dont une vingtaine au plus sont susceptibles de susciter lintrt du chasseur de nologismes italiens ( 5 ). Tous les autres sont par exemple des substantifs ou des adjectifs non lemmatiss ( ou des erreurs de lemmatisation), des noms propres ou des lments de syntagmes xes ( chief pour chief executive ). On se rappelle quil sagit ici de 1992, et les nologismes potentiels peuvent recouvrir des phnomnes sociaux tels que le sida, des adjectifs tels que alternatif, acquariano ( dellera dellacquarie ), des anglicismes dsormais plus ou moins intgrs dans le lexique italien comme antitrust et appeal, chat et anchorman, des reprsentants de sufxes internationalement productifs, comme -izzazione dans attualizzazione et compartmentalizzazione, des constructions mdiatiques comme cybersexe, des termes techniques comme coagrulatrice. Partant des ralisations nologiques de litalien, on peut chercher dans les corpus des autres langues les quivalents potentiels, par exemple en recherchant tous les mots qui se terminent par -izzazione, -izaction, -isierung isation/ization, -izacion, ( globalizzazione, mais aussi par exemple en italien delocalizzazione, en franais dlocalisation, en allemand Entterritorialisierung, en anglais delocalisation, en espagnol deslocalizacion ), ou bien les
( 5 ) Pour une comparaison purement indicative, on peut signaler les remarques de Volz ( 1996 : 162 ), qui dclare que : pour parcourir les textes accumuls dun mois de publication dun quotidien moyen, un lexicographe devrait examiner 40 000 mots-formes, dont seuls 2% seraient de vrais nologismes.

63

Contributions

anglicismes non adapts ( appeal ) ( 6 ), ou encore les prxes productifs comme ciber-/cyber-. Dans les exemples de lannexe 1, nous nous sommes limit aux trois premires lettres de lalphabet, mais il est vident que de telles recherches peuvent tre effectues aisment, condition de disposer de corpus signicatifs comparables, et de corpus dexclusion comme le DMI. De cette faon, les corpus des diffrentes annes peuvent tre paramtrs en comparant les listes de mots, vriant ainsi quels sont les mots effectivement prsents pendant une priode donne et absents dautres.

7.2 Nologismes de formation


Trs souvent, en particulier dans les discours spcialiss, les nologismes sont composs en faisant appel aux matriaux linguistiques dj disponibles en latin, en grec et de nos jours en anglais ( cf. biomouse ). Il sagit surtout de nologismes internationaux, puisque de nombreuses langues de spcialit ont tendance uniformiser une bonne partie de leur terminologie. Parmi les nologismes internationaux quon pourrait rechercher avec prot, on peut privilgier les termes faisant appel des prxes actuels et potentiellement trs productifs. Dans le sous-corpus ITA ( pour la composition de ce corpus transversal de journaux italiens, voir tableau 2 ) ( 7 ), on prsente ici ( cf. annexes 2 et 3 ) toutes les occurrences des mots commenant par post- et bio-, mais
( 6 ) Dans notre corpus transversal q94 appeal parat six fois dans c94 ( dont trois fois sex appeal ), trois fois dans S94 ( aucun exemple de sex appeal ) et six fois dans t94 ( dont trois fois sex appeal ). Outre les nombreuses attestations dans i94 et n94, appeal parat une fois dans la NZZ ( en parlant de product appeal entre guillemets dans le texte de la nouvelle automobile Smart ) et une fois dans TAZ 94 ( mais sex appeal ).

on aurait pu aussi bien choisir non-, euro- , etc. Il est vident que tous les rsultats ne sont pas pertinents dans la perspective de la nologie potentielle. Certaines occurrences ne sont pas a priori nologiques ( les noms propres, par exemple ), tandis que dautres ncessitent une vrication ponctuelle dans les contextes. Pour cette raison, des ns dillustration, nous prsentons dans lappendice 2 tous les contextes de bio-, par exemple bioclimico ( 8 ), Bioparc. Il convient de souligner que le logiciel DBT permet de rcuprer facilement tous les types de contextes souhaits, partir de quelques mots dans un kwic ( Keyword in Context ). En pratique, le logiciel DBT offre la possibilit de consulter une grande quantit darticles de journaux de faon modulaire et cela trs rapidement, ce qui ne serait pas possible en feuilletant les journaux sous forme papier.

Le fait quon relve ces mots dans bon nombre de journaux du corpus plurilingue q94 ( cf. tableau 2 ) est un bon indice de leur internationalit.

7.4 Nologismes smantiques


Reprer automatiquement un mot dj existant qui acquiert un nouveau sens est videmment une tche difcile. Il suft ce sujet de rappeler le tmoignage de Volz ( 1996 : 161 ) quand il souligne la difcult didentier les lments lexicaux dj existants, soit des mots simples ou composs, dont lusage ou le sens a t dplac, modi, ou tendu . Il est vident quil est bien plus difcile didentier ces mots que ceux du premier type . ( 9 ) Grce au
( 7 ) Rappelons que le corpus de rfrence et les diffrents souscorpus, en particulier le souscorpus ITA comprenant quatre annes ( de 1992 1995 ) de trois quotidiens italiens et le souscorpus q94 qui regroupe lanne 1994 de dix journaux dans cinq langues sont encore un stade relativement grossier/brut qui sera afn dans les analyses venir. Il subsiste par exemple des problmes de caractres accentus et de chiffres, et dans de nombreux cas il faudra examiner de plus prs lapport des contextes. Pour cette raison les matriaux prsents en annexe ont un caractre encore provisoire. ( 8 ) posizione geograca, oltre che per motivi orograci e *bioclimici*, ha conservato risorse naturali di eccezionale pregio. SV19-09-94 Dalle Alpi al mare un tuffo 461. ( 9 ) Pour Volz ( 1996 : 161 ) les mots du premier type sont des new-born neologisms , des mots isols qui ont t crs dans une langue particulire ou bien sans modle prexistant, comme dans le cas de la plupart des sigles, soit dans celui des crations ex nihilo, comme par exemple quark en anglais, ou par des mots ou des parties de mots emprunts, y compris les radicaux, afxes etc, dautres langues telles que le grec, le latin ou de nos jours langlais.

7.3 Nologismes demprunt


Rechercher automatiquement des emprunts rcents, passs dautres langues en italien, est souvent facilit par la forme particulire du signiant non adapte ou peu adapte. Par exemple il peut tre utile de rechercher tous les mots dans le corpus ITA ( cf. tableau 2 ) qui comportent au moins une des cinq lettres j ou k ou w ou x ou y, sauf ceux qui commencent par une majuscule, an dliminer les noms propres comme New York. Une autre possibilit propre litalien est la recherche de tous les mots qui se terminent en -s, qui, dans le corpus des journaux rdigs dans cette langue, sont au nombre de 124. Parmi ceux-ci, dans le corpus des textes de 1992 1995, moins dune dizaine nous ont sembl intressants. On a ensuite effectu une recherche peu cible en partant dune liste de mots tirs de Barnhart 1995, dont nous avons retenu chat, down, ranking, recall, wired, splatter, karaoke.

64

Contributions

logiciel DBT, il est possible dinterroger notre corpus par rapport aux mots qui lentourent, il y a toutes les chances quon le relve associ un contexte plus ou moins dtermin. Dans le cas de globalizzazione, les relevs dans diffrentes langues concernent des nuances de sens quil serait prmatur dinterprter ici de faon sociolinguistique. Dans le cas dune recherche plus cible de nologismes smantiques, il est vident quun changement vident rpt des mots du contexte signalera un possible changement de signis. Pour en donner une ide, on peut supposer que si lon relve raton en espagnol ( pour rendre mouse ), on pourrait envisager la naissance de topo en italien ( 10 ).

8 Les guillemets
Les guillemets constituent pour plusieurs raisons un signe de ponctuation important en matire de nologie ( 11 ). Nous laissons de ct pour le moment toute rexion de type quantitatif, qui serait mettre en relation avec le volume des diffrents sous-corpus, pour dire que lemploi des guillemets pour mettre en relief un mot ( et ainsi une charge nologique ventuelle ) est particulirement courant dans les journaux italiens. En particulier, lanalyse faite sur q94 met en lumire le grand nombre doccurrences releves dans le Corriere della Sera de 1994 ( c94 ). En gnral, il semblerait que lemploi de guillemets pour signaler les emprunts langlais non adapts est relativement limit ( exemples tirs de c94 : future, hacker, ction, correct, lecture, kidware ). Dans Le Monde 94 ( 194 ) de nombreux emprunts non adapts se trouvent accompagns de gloses mtalinguistiques, dexplications ou de propositions de traduction (par exemple feed-back rendu par effet de retour, et re-engineering accompagn du commentaire pour les adeptes du

jargon anglo-saxon ). Il est bien sr possible de relever le mme phnomne pour lespagnol ( V94 = La Vanguardia 1994 ). Citons comme exemple monitoring accompagn de la glose entre parenthses ( en espagnol, controlar ) . En ce qui concerne lattitude de la presse espagnole lgard des anglicismes, il est instructif de consulter le Libro de estile de El Pais. ( Ne dites pas mass media mais medios de masas ou medios informativos ). Entre autres anglicismes non adapts prsents entre guillemets dans V94, citons apartheid, bit, boom et lobby, termes dj assimils dans plusieurs langues. Dans le TAZ de Berlin on relve peu danglicismes non assimils signals par des guillemets; citons ce propos les internationalismes cool et impeachment. Parmi les prxes vhiculs par langlais, citons ciber/cyber- ( allemand Kyber- ). A propos de signes particuliers, il convient de signaler aussi lemploi des parenthses accompagnant tel ou tel commentaire, qui peut tre signicatif dans la recherche de nologismes. Comme on le comprend bien, partant des quelques mots proposs des ns dexemplication ( emprunts langlais non assimils entre guillemets ), il nest pas possible dextrapoler une tendance, dautant plus que lemploi de ce signe de ponctuation est tributaire des traditions des diffrents journaux, ainsi que de celles des langues en question, mais ils sont plus quune question de style. Des contextes signicatifs de ce point de vue, tirs du sous-corpus italien de lappendice 6, qui comporte des syntagmes de deux mots mis entre guillemets dans le Sole 24 Ore 1994, comportent des calques bien prvisibles: autostrade electtroniche, qualit totale, realt virtuale, casa cablata, etc., ainsi que des anglicismes non adapts et spcialiss ( on line, client server, information technology, public company, convenient store [ sic ], function point, etc. ).

9 Conclusions
Cet article se propose dillustrer un phnomne jusquici peu tudi par les sciences linguistiques, mais promis un dveloppement croissant. La nologie internationale et les nouveaux mdias qui la promeuvent sont en ralit un nouveau chapitre dans les tudes portant sur deux aspects de notre vie acclre : llan de linnovation linguistique (et extralinguistique) et lintensication des contacts entre les peuples et les diffrentes langues. Cette tendance, favorise par les nouveaux mdias, mais aussi par la diffusion des moyens de communications (tlvision, radio, fax, etc. ) et de moyens de transports rapides de plus en plus la porte des masses, donne lieu des changements consquents. Il sagit de changements difcilement mesurables moyen terme, tant leur rapidit et leur complexit rendent difciles toutes tentatives de prvision ( 12 ) allant au-

( 10 ) En forant un peu le trait, on peut sattendre des cooccurrences comme gatto ( chat ) et formaggio ( fromage ) pour lun ( *topo pour mouse ) et computer ( ordinateur ) et tastiera ( clavier ) pour lautre ( it. Mouse ). Un mot qui a plusieurs sens diffrents aura des colloquats diffrents. On peut ainsi dpister automatiquement les changement de sens. Volz ( 1996 : 163 ). ( 11 ) Pour litalien voir Petralli 1990 ainsi que Accame ( 1981 ). ( 12 ) On rencontre des prvisions inconsidres, comme le fait remarquer le directeur de Medialab Lugano, Nicholas Negroponte, qui voit priodiquement des scnarios rvolutionnaires. Nous pouvons citer celui dune rvolution numrique qui aurait fait disparatre rapidement le papier de nos bureaux.

65

Contributions

del de simples propos de Caf du Commerce. Les journaux reprsentent de toute faon un miroir signicatif de lvolution de la socit, en tant que vecteurs indispensables entre les connaissances toujours plus parcellises et le dsir de la part de groupes de citoyens de plus en plus nombreux daccder aux informations. Tout en observant la rserve de rigueur dans ces cas, on peut prtendre que les thmes choisis par les grands journaux, leur agenda setting , la langue et les mots employs constitueront une rfrence quil conviendra dobserver si lon souhaite pister les tendances mergentes de la socit contemporaine, surtout celles qui constituent le grand march mondial ( tats-Unis, Asie, Europe ). Mais il est vrai aussi quil est plus probable que dans les journaux on relve des tendances dj merges et que les jeux de la nologie soient dj exprims dans les revues spcialises. O et quand est ne la globalisation ? Quelle est linuence du village global ( 13 ) ? Rappelons toutefois que les journaux sont des vecteurs privilgis pour transmettre au grand public le vocabulaire de nombreuses sciences ( et dautres souscodes en gnral ). Cest le cas de lconomie, qui dans certains cas fait son propre marketing, mais cest aussi le cas des sciences plus dures qui ne ddaignent pas la scne mdiatique. La mondialisation est un phnomne indit et complexe. Elle est galement ambige, un fourre-tout o lon range des vnements signicatifs et triviaux. Il arrive que pour tel nouveau concept on ne trouve pas toujours les mots pour le dire . Les rexions de Fanfani ( 1991 : 12 ) sont signicatives de ce point de vue, quand il crit que pour litalien la n des annes 80 [ ... ] la phase de linuence de langlais tire sa n, inuence qui a commenc lpoque
66

de lexpansion conomique ( boom ) et qui tait caractrise par une pression croissante et tumultueuse dordre lexical surtout , tandis que de lautre il relve quon aborde une priode de rapports plus mrs et plus circonspects avec langlais, qui laisse entrevoir une certaine stabilisation dans le domaine lexical mais une inuence plus profonde au niveau des structures de la langue . Cette ( apparente ) contradiction devient subitement plus complique quand lauteur relve le dclin du soi-disant mythe amricain , il sagit probablement de son europanisation. Dans la pratique, le niveau superciel des langues serait moins inuenc de nos jours tandis que la structure profonde serait dj modie. En somme, dans la pire des hypothses, les Europens seraient dj devenus bien Amricains et lexception culturelle revendique par les Franais pour laudiovisuel serait un paravent pour les belles mes ( 14 ). Nous croyons quune nologie qualitative, suivant de prs lvolution de concepts cardinaux comme celui de la mondialisation/globalisation peut tre utile pour mieux comprendre la porte et les possibles consquences de lhgmonie culturelle amricaine et pourrait tre lorigine dune nouvelle pragmatique de la communication, et non seulement en rseau. On pense la concentration entre peu de mains des grands marchs de la communication. Pour ces raisons nous nous proposons de suivre de prs les parcours narratifs de et sur la globalisation, que de nombreux journaux europens et amricains proposent avec insistance quotidiennement leurs lecteurs. Nous avons commenc le faire pour la premire moiti des annes 90, et nous avons lintention de poursuivre pour la seconde moiti. Un modle danalyse smantique efcace, appliqu un nologisme aussi

rpandu ( globalisation/mondialisation ) et ses drivs, serait bien rvlateur. Ces perspectives mritent amplement, notre avis, une collaboration internationale. Alessio Petralli, Istituto di Scienze Sociali della comunicazione, Facolt di Scienze della comunicazione, Universit della Svizzera italiana, Lugano. Traduit par J. Humbley, Centre de terminologie et de nologie, Universit Paris XIII.

Bibliographie
Accame ( F. ), 1981 : Virgolette, che passione. Interpretazioni indisciplinate del comunicare implicito , Il Caff, XX, juin, p. 47-59. Barnhart ( D. ),1995 : The Barnhart New Words Concordance. Supplement, Cold Spring, New York, Lexik House Publishers. Braun, ( P. ), Schaeder ( B. ) et Volmert ( J. ) ( d. ), 1990 : Internationalismen. Studien zur interlingualen Lexikologie und Lexikographie, Tbingen, Niemeyer.

( 13 ) War and Peace in the Global Village, avec Quentin Fiore, date de 1969, tandis quen 1960, dans Explorations in Communication: An Anthology, dEdmund S. Carpenter, on relve dj global village. ( 14 ) En tout cas nous pensons que la culture ( et la langue ) franaise est aujourdhui la seule capable de rsister au leadership USA ). Comme exemple de cette rsistance et de cette tension, nous pouvons citer Le Monde diplomatique, dune part, et des publications comme Wired, de lautre.

Contributions

Fanfani ( M. ), 1991-1995 : Sugli anglicismi nellitaliano contemporaneo, Lingua Nostra, 52 ( 1991 ), p. 11-24, p. 73-89, p. 113-18; 53 ( 1992 ), p. 18-25, p. 79-86, p. 120-21; 54 ( 1993 ), p. 13-20, p. 63-71, p. 122-24; 55 ( 1994 ), p. 19-25, p. 76-77, p. 117-120; 56 ( 1995 ), p. 14-17. Maier-Meyer, 1995 : Lexikon und automatische Lemmatisierung, Munich: Centrum fr Informations- und Sprachverarbeitung der Universitt Mnchen ( CIS-Bericht 95-84 ). Petralli ( A. ), 1990 : Litaliano in un cantone. Le parole dellitaliano regionale ticinese in prospettiva sociolinguistica, Angeli, Milan. Petralli ( A. ), 1996a : Sul nuovo articolo linguistico della Costituzione svizzera. Straordinario storia di ordinaria democrazia elvetica, Nuova Critica, Lugano, Canobbio. ( http://www.tinet.ch/nuovacritica/ communications) Petralli ( A. ), 1996b : Neologismi e nuovi media. Verso la globalizzazione multimediale della comunicazione ?, CLUEB, Bologna. Volz ( N. ) 1996 : CORDON A Joint Venture Case Study , dans: Rettig ( H. ) ( d. ): Proceedings of the First European Seminar : Language Resources for Language Technology, Tihany, Hongrie, 1995. Budapest : Hungarian Academy of Sciences, p. 159-167.

Annexes 1
Ace Acquarellate Acquariana Acquariani Acquariano Ade Ademon Admnistration Advanced Adzubej Aereodinamiche Acionados Afraid After Agabenghian Agadez Age Ager Agers Agis Aharon Aharonot Aids Aires Airlines Akira Alcun Alekan Alferj Algernon Allan Allen Allenby Allilujeva Altavilla Alternativo Altroieri Amd Americs Ames Amiri Anchorman And Anders Andr Angeles Animal Animaletto Animatroni A Annus Anteo Anti Anticapitalistici Anticonsumiste Anticonsumistici Antidoping Antieducativa Antioccidentali Antipsicanalisi Antiregionalista Antiriciclaggio Antisocialismo Antitrust Antoni Antroposo Appeal Aramesh Arcais Architet Arcivestivano Arcuti Arden Ardenzi Arens Arp Ars Art Artimm Arts Assen Assets Associamo Associated Aston Astra At Athuin Atma Attualizzazione Auriol Autoalimentarsi Autocandidature Autocastrarsi Autoagellarci Avalon Avenue Aviv Bad * Baeck Baffetti Banker Bankitalia Baraka Barbour Barcelloni Barek Barfogenica Baring Bass Batch Bates Battle Battletec Bayer Bbs Beatnik Beautiful Beckettiani Behnke Belgeri Ben Bencheikh Benedini Benissmo Bennis Beppe Berdini Bergmaniana Bergognone Beria Berlanda Berlino Berlusconiani Best Biancorossoverde Biasco Bigliettini Bilit Bill Binswanger Biomeccanico Biomediche Biomedico Biomi Biondino Birobidzan Bisognava Bisognerebbe Biturbo Black Blade
67

Contributions

Blady Blasi Blob Blum Board Bobbiese Bobbio Boca Bocchiano Bocconiani Bohmien Bondismo Book Boomers Booz Border Bosniaca Bosniache Bosniaco Bot Bottigliette Boulanger Bourget Bowe Brac Braccesi Bradbury Braganti Braggio Brainstorm Braitenberg Breakfast Breeden Brett Bridgestone Brook Brooks Brosnan Brothers Brown Brownsville Brunetta Btp Bubble Bud Budyonny Buenos Building Bulletin Buon Busby Buscemi Bush
68

Butera By Ca Caccer Cadillac Caf Caf Caggiano * Cagnoni Cairella Calciola California Calise Calusca Camp Canal Cantanapoli Canton Cap Capital Capitan Cappiello Caprioliano Caps Caramel Carassa Carbo Card Cardinal Carey Carobbi Carroarmato Carroll Carr Casamadre Cascella Casetti Casini Cassiopea Castle Casuismo Cavaradossi Cavaturacciolo Cbs Cct Cd Ceccinelli Ced Cedex Cee Cementir Cenghialta

Centenaro Center Centocinquantamila Centosessant Centoventotto Cepollaro Cercarsele Cercopitecantropo Cespe Cgil Chances Chandler Change Chao Charbonnel Charles Chastel Chat Chatwin Chief Chironomidi Chord Chronos Cianfanelli Cibalgine Ciber Cibersesso Cibona Cicciolina Cidim Cilea Cina Cinela Cineli Cinemagique Cinemagraco Cinesesso Cinesine Cinesini Cinevideo Cino Cinquantasettesimo Cinquecentotrenta Cinquepercento Cinturoni Cio Cipro Cicole Clisura Coagulatrice Coast * Coelli

Coffeehouse Conanziamento Cohen Coinvolgimento Collars Collegabili Collegano Collegare Collegarsi Collegher Coloberti Colpaccio Com Comby Comics Committee Communications Compact Company Compartimentalizzazione Completmente Computeristi Computers Comunelli Comunicatore Comunicatori Concettualmente Conchetta Conclusosi Congurabile Conndustria Confuzione Connery Consisgliere Consoles Contropiano Coprodotto Corporation Corrigan Cosanostra Coss Course Cowboy Cranshaw Crash Credazzi Crediblit Crem Crs Csm Cto Cucurrucuc

Cumparsita Cuociuova Cup Cupio Cussione Cutugno Cyber Cybereden Cybermaster Cyberpunk Cyberspace Cyberspazio Cyborg

Contributions

Annexes 2
Mots comportant llment POSTrelevs dans le corpus ITA 1 ) post 8 2 ) postal 3 ) postatomico 4 ) postazione 1 5 ) postazioni 1 6 ) postbank 7 ) postbellico 8 ) postcomunismo 9 ) postcomunista 10 ) postcomunisti 11 ) postdemocristiani 12 ) postecologica 1 13 ) postecologico 1 14 ) postel 15 ) postelettorale 16 ) posterius 17 ) postfascisti 18 ) postfazione 19 ) postfuturistiche 20 ) postindustriale 21 ) postindustriali 22 ) postinformatica 23 ) postlethwaite 3 24 ) postludio 25 ) postman 26 ) postmoderna 27 ) postmoderni 28 ) postmodernism 29 ) postmodernismo 30 ) postmoderno 1 31 ) postnichilista 32 ) postnucleare 33 ) postolimpico 34 ) postpasquale 35 ) postprandiale 36 ) postproduzione 37 ) postquarantenni 38 ) postrel 39 ) postribolo 40 ) postrisorgimentale 41 ) postscript 42 ) poststalinista 43 ) postunitaria 44 ) posturografo 45 ) postvendita - DBT ( 12 ) (2) (1) (7) (8) (1) (1) (3) (4) (1) (1) (1) (1) (3) (2) (1) (1) (3) (1) (3) (1) (1) (1) (1) (2) (7) (1) (1) (1) (7) (1) (1) (1) (1) (1) (1) (1) (1) (2) (1) (1) (1) (1) (1) (1) E. Picchi Mots comportant llment BIOrelevs dans le corpus ITA 1 ) bio 2 ) biochimica 3 ) biochimiche 4 ) biochimici 5 ) biochimico 6 ) bioclimici 7 ) biocompatibile 8 ) biocompatibili 9 ) biocompatibilit 10 ) biocontrol 11 ) biodegradabile 12 ) biodegradabilit 13 ) biodiesel 14 ) biodiversit 15 ) bioelettronica 16 ) bioetica 17 ) bioetiche 18 ) bioetici 19 ) biosica 20 ) biosici 21 ) biosico 22 ) biogenetica 23 ) biognava 24 ) biografa 25 ) biogra 26 ) biograa 2 27 ) biograca 28 ) biogracamente 29 ) biograche 30 ) biograci 31 ) biograco 32 ) biograe 33 ) biografo 34 ) biohazard 35 ) bioimpianti 36 ) bioinformatica 37 ) bioinformatico 38 ) bioingegneri 39 ) bioingegneria 40 ) biolghini 41 ) biologi 42 ) biologia 5 43 ) biologica 1 44 ) biologiche 6 45 ) biologici 2 46 ) biologico 47 ) biologismo 48 ) biologo 2 49 ) biomasse (4) (3) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (1) (4) (1) (1) (1) (1) (1) (2) (1) (1) (2) (7) (1) (1) (4) (1) (1) (3) (3) (1) (1) (1) (1) (1) (5) (1) (3) (9) ( 10 ) (5) (8) (7) (1) (8) (1) 50 ) biomeccaniche 51 ) biomeccanici 52 ) biomeccanico 1 53 ) biomedica 54 ) biomedicale 55 ) biomediche 1 56 ) biomedicina 57 ) biomedico 1 58 ) biomi 1 59 ) biomolecolare 60 ) biomouse 61 ) bionica 62 ) bionici 63 ) bionico 1 64 ) bioparco 65 ) biopark 66 ) biopr 67 ) bioritmi 68 ) bioritmo 69 ) biosegnali 70 ) biosfera 71 ) biosistemi 1 72 ) biotecn 73 ) biotecno 74 ) biotecnologia 75 ) biotecnologica 76 ) biotecnologico 77 ) biotecnologie 78 ) biotiche 79 ) biotridimensionale 80 ) biottico 81 ) biove - DBT (1) (1) (1) (3) (1) (3) (2) (2) (1) (1) (1) (2) (2) (2) (1) (1) (1) (1) (1) (1) (2) (3) (1) (1) (6) (2) (1) (8) (1) (1) (1) (1) E.Picchi

69

Contributions

Tableau 1 Code C92 C93 C94 C95 RC2 RC3 RC4 RC5 RS2 RS3 RS4 RS5 S92 S93 S94 S95 RT2 RT3 RT4 RT5 T92 T93 T94 T95 V94 V95 L93 L94 L95 R94 R95 M95 Z93 Z94 Z95 B92 B93 B94 B95 I92 I93 I94 I95 RI2 RI3 RI4 RI5 N93 N94 N95 Source Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Sole - 24 ore Il Sole - 24 ore Il Sole - 24 ore Il Sole - 24 ore Il Sole - 24 ore Il Sole - 24 ore Il Sole - 24 ore Il Sole - 24 ore La Stampa La Stampa La Stampa La Stampa La Stampa La Stampa La Stampa La Stampa La Vanguardia La Vanguardia Le Monde Le Monde Le Monde ( 01.01.95 - 30.06.96 ) Le Soir Le Soir MCCarthy Neue Zrcher Zeitung Neue Zrcher Zeitung Neue Zrcher Zeitung TAZ TAZ TAZ TAZ ( 01.01 - 30.06 ) The Independent The Independent The Independent The Independent The Independent The Independent The Independent The Independent The N.Y. Times The N.Y. Times The N.Y. Times Anne 1992 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1994 1995 1993 1994 1995 1994 1995 1995 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1993 1994 1995 Nombre doccurrences 98322 191778 284642 220055 189592 309938 398717 526884 347792 365757 513201 720270 319465 197467 398252 916863 143122 201010 286538 351209 157905 136518 193824 343754 163974 184401 243681 189015 227470 265407 277696 275966 110171 158724 101667 111845 84858 78590 54104 461179 577624 612223 935727 462253 578380 612754 937797 66853 133958 87225 Total occurrences 15806417 Nombre de formes 17209 26102 33056 27391 25917 34980 39550 45465 29843 30781 37617 41365 27986 18778 29220 41578 23335 29249 36400 41790 24815 22774 28197 41323 20596 22813 21947 20219 24218 27089 27791 18809 22803 30761 21207 23293 18942 18420 13906 32372 36339 38052 46392 32400 36387 38069 46453 11049 16334 11996 Total Formes 1433378

70

Contributions

Tableau 2 Corpus ITA ITA ITA ITA ITA ITA ITA ITA ITA ITA ITA ITA Q94 Q94 Q94 Q94 Q94 Q94 Q94 Q94 Q94 Q94 Code C92 C93 C94 C95 S92 S93 S94 S95 T92 T93 T94 T95 C94 S94 T94 I94 N94 L94 R94 Z94 B94 V94 Source Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Corriere della Sera Il Sole 24 Ore Il Sole 24 Ore Il Sole 24 Ore Il Sole 24 Ore La Stampa La Stampa La Stampa La Stampa Il Corriere della Sera Il Sole 24 Ore La Stampa The Independent The N.Y. Times Le Monde Le Soir Neue Zrcher Zeitung TAZ La Vanguardia Anne 1992 1993 1994 1995 1992 1993 1994 1995 1992 1993 1994 1995 1994 1994 1994 1994 1994 1994 1994 1994 1994 1994

71

En bref

Nouvelles du Rint

e Comit dorientation du Rseau international de nologie et de terminologie a tenu sa vingtime runion lInstitut dtudes et de recherches pour larabisation, Rabat, en juillet 1999. Au cours de cette runion, le Rint, en accord avec lAgence intergouvernementale de la Francophonie, a choisi de privilgier en 1999 les actions dinformation et de diffusion. Cette orientation est signicative, car non seulement est-il important de faire connatre les ralisations du rseau, mais cest lune des missions fondamentales du Rint de rendre accessible toute linformation sur la nologie et la terminologie. Voici donc quelles sont les principales actions du Rint en ce sens.

Terminologies nouvelles
L a revue Terminologies nouvelles, dont le lectorat augmente rgulirement, est maintenant diffuse en texte intgral, en format PDF, dans le site Internet du Rint (www.rint.org ), compter du numro 14. Cette nouvelle forme de diffusion permettra au Rint de rejoindre un public plus large, en fonction des diffrents thmes traits dans la revue. Les thmatiques traites dans Terminologies nouvelles sont de plus en plus tendues et diversies. Le Rint

souhaite occuper tout le champ de lamnagement linguistique et celui de linformatisation des langues et pour ce faire, il privilgie louverture et le partenariat. Ainsi, le numro 18 portait sur Terminotique et documentation, le numro 19 sur le thme Terminologie et intelligence articielle . Le prsent numro porte en bonne partie sur linformatisation des travaux de veille nologique et terminologique. Les autres aspects de lamnagement linguistique ne sont pas pour autant ngligs puisque le prochain numro de Terminologies nouvelles abordera la question de la terminologie dans ses rapports avec la diversit culturelle. An de rendre plus accessible le contenu de Terminologies nouvelles, le Rint diffuse sur son site Internet une base bibliographique dans laquelle sont rpertoris tous les articles parus dans la revue depuis le premier numro. On peut interroger cette base par auteur, par titre et par terme cl. La revue Terminologies nouvelles est ralise sous la responsabilit du module de la Communaut franaise de Belgique Service de la langue franaise.

Inventaire des ressources terminologiques


Dictionnaires terminologiques et banques de terminologie
L a connaissance de ce qui existe en terminologie est prcieuse pour tous les terminologues et pour les usagers de la terminologie. Le Rint entretient et diffuse depuis de nombreuses annes un Inventaire des ressources terminologiques constitu de plusieurs lments. Tout dabord, il y a linventaire des travaux terminologiques publis (imprims et sur support lectronique ). Dans cette partie de linventaire, on retrouve essentiellement des dictionnaires terminologiques de tous domaines dont lune des langues est le franais. Il en va de mme pour les banques de terminologie qui ont fait lobjet dune enqute spcique de la part du Rint. Ces inventaires sont accompagns de formulaires lectroniques qui permettent aux auteurs, diteurs, diffuseurs, documentalistes ou usagers dinscrire directement de nouveaux titres.

Ressources terminologiques sur Internet


E n 1999, en rponse une demande maintes fois formule par les usagers de son site Internet, le Rint a dcid dajouter un nouveau volet son Inventaire des ressources terminologiques. Il sagit des

72

En bref

Contributions

terminologies diffuses en ligne dans lInternet. An de rpertorier ces ressources terminologiques parfois phmres, Une nouvelle page web vient dtre cre ladresse suivante : http://www.olf.gouv.qc.ca/ressources/ termino/ressling.html#inventaire. partir de cette page, on pourra consulter la base de donnes, qui donne accs par hyperliens aux sites terminologiques rpertoris, ou lenrichir en ajoutant de nouvelles donnes laide dun formulaire lectronique sur lequel on peut indiquer les donnes suivantes : titre, auteur, lieu ddition, diteur/diffuseur, public cible, tarication, type de rpertoire terminologique, catgories de donnes, langues, domaines, mots cls, adresse URL. LInventaire des ressources terminologiques est ralis sous la responsabilit du module qubcois Ofce de la langue franaise.

nologismes, an dacclrer la diffusion des termes nouveaux et an de rendre plus facile et plus efcace la mise jour des dictionnaires terminologiques et les banques de terminologie. Conu de manire simplier la saisie, la consultation, limportation ou lexportation des donnes, en environnement Windows, le systme Balno est ouvert gratuitement tout organisme ou toute personne qui souhaite participer activement aux changes terminologiques sur Internet.

lAgence intergouvernementale de la Francophonie. Au nombre de ces projets gurent les Grilles descriptives de logiciels de terminotique applications spciques et le Laboratoire terminotique virtuel.

Grilles descriptives de logiciels de terminotique applications spciques


A u cours du biennum 1998-1999, Mme Nelida Chan, professeur de terminologie au Collge Glendon de lUniversit York, Toronto et membre du Module canadien du Rint, a rdig un rapport portant sur des grilles descriptives de logiciels de terminotique applications spciques. Ces grilles servent valuer les logiciels de terminotique suivants : logiciels de gestion de donnes terminologiques; logiciels de saisie de donnes terminologiques; concordanciers ; logiciels de dpouillement de la terminologie; logiciels de production de dictionnaires ; gestionnaires de rseaux notionnels; gnrateurs de nologismes. Mme Chan a dailleurs prsent succinctement ces grilles dans un article paru dans la chronique En bref du numro 18 de Terminologies nouvelles ( juin 1998 ). labores partir de lanalyse dune cinquantaine de logiciels de terminotique provenant dAmrique, dAsie et dEurope, les grilles rpertorient, outre une dizaine dlments de tronc commun, un large ventail de caractristiques gnrales ( une soixantaine ) et spciques ( environ 900 ) que comportent les logiciels de terminotique applications spciques. En voici quelques exemples : critres de gestion des donnes terminologiques;
73

Bibliographies
A ux bases de donnes dj cites sajoutent deux bibliographies qui sont mises jour de faon permanente : la Bibliographie de la nologie et la Bibliographie de la terminotique. Ces deux bases de donnes sont galement diffuses dans le site Internet du Rint. Le systme Balno et les bibliographies sont places sous la responsabilit du module franais Dlgation gnrale la langue franaise. Lensemble de ces rpertoires et bases de donnes font du site Internet du Rint un vritable infoport terminologique indispensable tous ceux qui sintressent lenseignement et la pratique de la terminologie, de mme quaux usagers de la terminologie, notamment les membres des professions langagires et les crivants. Voici ladresse du site Internet du Rint : http://www.rint.org Louis-Jean Rousseau, Secrtaire gnral du Rint.

Inventaire terminotique
C onscient de limportance grandissante que prend linformatisation des travaux terminologiques, le Rint a cr il y a quelques annes un Inventaire terminotique, de faon rpertorier et faire connatre les diffrents types de logiciels utiliss en terminologie. En 1998-1999, le Rint a dcid dlaborer un nouvel inventaire terminotique de faon reter la grande diversit des types de logiciels. Ce nouvel inventaire est dcrit dans ce numro. LInventaire terminotique est ralis sous la responsabilit du module canadien Bureau de la Traduction.

Balno, outil de nologie interactive dans lInternet


L e systme Balno a pour objectifs la collecte, lchange et la diffusion rapides de matriaux terminologiques touchant plus particulirement les

Projets de terminotique du Rint

e module canadien du Rint dirige le groupe de travail en terminotique du Rseau. ce titre, il gre divers projets de terminotique raliss dans le cadre des biennums de

Contributions

type de concordances en langues source et cible ; mode de production de dictionnaires ; type de rseaux et de liens notionnels ; types et modalits de gnration. Les grilles descriptives constitueront un outil dvaluation prcieux une fois que les concepteurs de logiciels les auront remplies dans le cadre du projet denrichissement de linventaire des produits en terminotique men par le module canadien. En effet, les langagiers, perptuellement en qute de nouvelles avenues technologiques pour accrotre leur efcacit, disposeront dsormais dune ressource unique, accessible par Internet, dans laquelle seront rassembles lensemble des caractristiques des outils terminotiques. Ces renseignements les claireront dans le choix dun outil qui rponde adquatement leurs besoins. Les grilles sont accessibles ladresse URL suivante : www.uhb.fr/langues/balneo/GRILLE _ter/accueil.htm

valuer lutilit pour les langagiers. Les travaux consisteraient galement poursuivre les essais de logiciels de terminotique amorcs au cours du biennum 1998-1999, raison dune dizaine par anne, dans un cadre plus structur, celui dun laboratoire terminotique virtuel. Les rsultats des travaux seraient mis la disposition de la Francophonie par le truchement du site Internet du Rint. Ils pourraient galement tre prsents lors de diverses manifestations en Francophonie (Journe internationale de la Francophonie, Sommet francophone, etc.). Cest avec grand enthousiasme que le module canadien entreprendra ce projet retenu dans la programmation du Rint pour le biennum 2000-2001. Michle Valiquette, Terminologie et normalisation, Bureau de la traduction, Travaux publics et Services gouvernementaux Canada.

Laboratoire terminotique virtuel


On a vu merger, ces dernires annes, une plthore doutils informatiques destins automatiser le travail du langagier. Dans ce contexte, le comit dorientation du Rint a con au groupe de travail en terminotique du Rseau le mandat de fournir une expertise en terminotique aux diffrents modules et de dterminer dans quelle mesure les outils existants peuvent optimiser le travail du terminologue. Aussi, dans le cadre du biennum 2000-2001, le Module canadien du Rint a-t-il prsent la runion du comit dorientation du Rseau, qui sest tenue les 28 et 29 juillet 1999 Rabat, au Maroc, le projet intitul Laboratoire terminotique virtuel. Il sagirait de recenser les technologies prometteuses et den
74

Contributions

Publications

Discours professionnels en franais

l peut paratre pervers de rassembler en Scandinavie et de publier en Allemagne un recueil dtudes sur les langues de spcialit du franais. Certes, le rdacteur de louvrage et initiateur du projet, Yves Gambier, est professeur de franais dans un institut de traduction en Finlande et lditeur, Peter Lang, est plus ouvert aux tudes de linguistique applique que la plupart des maisons ddition franaises, mais la vraie raison de cette anomalie gographique se trouve ailleurs. Dune part, le regard que porte ltranger sur la situation en France est garant dobjectivit et, dautre part, ce sont les trangers qui sont en passe de prendre le relais des Franais, qui dlaissent, quelques brillantes exceptions prs, ce domaine de recherche. Cette crise des tudes des langues de spcialit fait lobjet dune analyse perspicace signe du rdacteur luimme, ici lauteur du plus long article du recueil. Il commence par esquisser la situation des LSP lchelle internationale, o langlais domine, comme le sigle en usage mme dans les crits francophones le laisse entendre. Historiquement, cest la ncessit denseigner rapidement la langue des tudes universitaires ( donc langlais, le franais, nagure le russe ) aux tudiants allophones, qui a motiv les premires tudes des langues de spcialit. Cest aussi laspect des langues de spcialit qui accuse le plus grand retard en France aujourdhui. Traditionnellement, ctait le franais, langue trangre ( Fle ), qui suscitait le plus grand

nombre dtudes sur les langues de spcialit du franais, tradition qui sessoufe, sauf dans le nord de lEurope. Gambier examine ensuite la langue de spcialit par rapport des domaines connexes, qui reprsentent en gnral une application apparente : la terminologie, la rdaction technique, la traduction. La mthode fait appel des critres souvent ous : le domaine, la situation de communication, linteraction, la vulgarisation, la sociolinguistique (langue de spcialit comme instrument de lgitimation professionnelle ), ces dernires tant pourtant susceptibles dvolution, donc porteuses de renouveau. Ce tour dhorizon est une raison sufsante pour justier lutilit de ce recueil. Mais les autres articles, la dmonstration pour ainsi dire, illustrent lenrichissement possible des langues de spcialit, lorsque lanalyse se fonde sur une approche linguistique plus complte. Savoir ce que constituent exactement les langues de spcialit tracasse les linguistes depuis longtemps. Cest la question des questions , comme le dit Lothar Hoffmann, cit en exergue par Finn Frandsen, qui pour sa part, tente une dnition qui se libre du carcan de lopposition simpliste entre langue gnrale et langue de spcialit. Pour ce chercheur, il vaut mieux examiner les entits selon des perspectives diffrentes et complmentaires : celle de lpistmologie dune part et de lontologie de lautre. Lune dnit les formes dusage dune langue, lautre les donnes elles-mmes. La nouvelle dnition des langues de spcialit quil propose est donc asymtrique et

si elle rsout en le dplaant le problme de la langue gnrale, elle comporte linconvnient de devoir constituer un nouveau mtalangage, que lauteur nessaie pas dimproviser. Aprs tant de critiques diriges contre lapproche qui privilgie le niveau lexical, il nest pas tonnant de constater que la majorit des articles accuse une orientation rsolument textuelle. Privilgier le textuel, et parfois lintertextuel, nexclut pas une multiplicit de regards, qui se rvlent tout fait complmentaires. Une des lectures possibles des textes de spcialit est la smantique interprtative de Franois Rastier. W. Johanssen analyse une brochure prsentant une entreprise la lumire des isotopies smantiques, dgages dans le texte, effet de la rcurrence syntagmatique dun mme sme. Cette analyse fait ressortir non seulement la cohsion du texte, dont le point de dpart est diffrent de celui de Hassan et Halliday, par exemple, mais aussi un aperu de la culture dentreprise. Andr Avias pour sa part fait appel une approche prototypique inspire de J. M. Adam pour analyser un article du Figaro sur le budget. Il dtermine dabord, non sans difcult, le dcoupage structurel de son article en squences textuelles, puis il choisit des prototypes. Bien entendu, cette dmarche ne se limite pas aux textes spcialiss, mais elle apporte une contribution au traage de largumentation dans le discours. Le caractre argumentatif, voire polmique dun autre genre de texte, le Mot du PDG , sorte de prface du rapport dactivit annuel dune entreprise, fournit le thme de
75

Contributions

larticle de K. Flottum. Lanalyse de ce genre textuel est dailleurs une spcialit scandinave, et lauteur a lavantage de pouvoir puiser dans un fonds de recherche tabli. Elle fonde son analyse sur les tudes qua ralises Ducrot sur la ngation syntaxique, sur la qualit de polyphonie, surtout sur la lecture quen fait H. Nlke. Une analyse des diffrents types de ngation fait ressortir lusage dominant de lun dentre eux, la ngation polmique, dni des ides fausses quon peut avoir sur lentreprise . Cette analyse, surtout syntaxique rappelons-le, permet non seulement de rsoudre des questions poses dans les tudes antrieures, mais aussi de dterminer quil sagit dun type de texte argumentatif et contre-argumentatif. Lauteur apporte la preuve par ailleurs que ce discours nest pas impersonnel, comme une lecture supercielle pourrait le laisser entendre, car les destinataires sont bien prsents, mais implicites. Ce sont les sciences cognitives qui viennent enrichir lanalyse dun texte juridique franais par L. Lundquist, dans le cas prsent un jugement de la Cour de cassation. Les outils que lauteur emploie sont emprunts lintelligence articielle dans le cas du cadre ( frame ), et aux tudes psychologiques, dans celui de lespace mental. Celui-l sert situer lanalyse de lensemble, celui-ci structure les relations infrieures. Lauteur expose ensuite le cadre du jugement, permettant au nophyte non francophone de situer les relations structurelles, tche malaise surtout en comparaison de la transparence structurelle du discours juridique danois dj familier. Lide despace mental permet son tour de bien reprer les lments et les relations au l du discours. Cet article est un bon exemple de perspicacit obtenue par un regard extrieur port sur le discours juridique franais, regard qui est loin dtre naf.
76

A. Askelund sinspire de la grammaire des cas pour son analyse des textes juridiques, mais cest la traduction qui lintresse. Elle explique comment lemprise du texte de dpart est diffrente selon quil sagisse de la langue maternelle ou de la langue trangre, et on apprcie son cadre danalyse originale et explicite de la mtamorphose du texte traduit. Les deux derniers articles du recueil sont orientation lexicale. Celui de G. Dyrberg et J. Tournay renoue avec la trs riche tradition danoise des dictionnaires de spcialit dont le contenu et la prsentation sont constamment modis en fonction des besoins perus des usagers. Le dictionnaire envisag dans cet article est juridique daprs son contenu et asymtrique selon sa prsentation. Destin aux usagers danois, il envisage un savant mlange dexemples et dexplications, tantt en danois, tantt en franais. Ce sont les informations encyclopdiques quil convient dinclure qui constituent le sujet de larticle, mais on passe en revue la formation de la dnition, les stratgies dexemplication de lquivalence partielle, particulirement bien illustres dailleurs, la typologie des exemples, et la place dans le dictionnaire de ce quelles appellent daprs A. Kjaer, les formules de routine . Ces dernires auraient mrit un article de plus en quoi consistent-elles en fait ? Fautil les prsenter sous un lment de la suite, ou de faon conceptuelle, quel traitement informatique proposer pour rsoudre les problmes sans issue sur le papier. Le dernier article du recueil, sign de P. Lederlin, traite des constructions de type N de N dans les textes conomiques. Lauteur cherche des rgles de production simples et maniables proposer ses tudiants norvgiens. Pour son cadre thorique, dune part, il se limite aux tudes relativement anciennes ( M. Wilmet 1986 ) ; dautre part il

sous-estime lexplication de la lexie complexe, pourtant voque. Selon cette approche, ltudiant apprend appel doffres, assiette de limpt comme des units lexicales (ou terminologiques) et non comme des locutions. Le recueil comporte une bibliographie de 71 tudes portant sur les langues de spcialit franaises publies rcemment en Scandinavie. Aprs avoir pris connaissance de plusieurs nouvelles approches prsentes ici, on ne peut partager le pessimisme de Gambier. Certes, la plupart des auteurs peinent dnir les langues de spcialit, mais en les dcrivant ils contribuent fournir une dnition par extension, plutt que par comprhension, comme diraient les lexicographes, mais qui est en mme temps plus intuitive, plus pratique, et plus consensuelle.
Une lecture de John Humbley, Centre de terminologie et de nologie, Laboratoire de linguistique informatique, Universit Paris 13.

Gambier ( Yves ), d., 1998 : Discours professionnels en franais. Francfort, Peter Lang, 233 p.

Terminologie maritime

e parler des gens de mer est li lhistoire de notre civilisation et porte la trace des changes culturels, techniques et commerciaux entre les peuples. ce titre, il a de longue date intress les lexicographes, ce qui explique la riche histoire des dictionnaires de marine. Outils essentiels pour enseigner, traduire et communiquer, ces dictionnaires de marine connaissent aujourdhui une importante mtamorphose dans le cadre des industries de la langue. La premire confrence internationale Terminologie maritime: traduire et communiquer avait pour principal objet de runir les spcialistes du langage des gens de

Contributions

mer ou du domaine nautique concerns par lusage, ltude ou lenseignement du vocabulaire maritime. Elle sest tenue lInstitut suprieur de traducteurs et interprtes (Isti, Bruxelles) les 15 et 16 mai 1998. Le succs fut tel quil a t dcid dorganiser la confrence tous les deux ans. La prochaine rencontre se droulera lUniversit de Turku, en Finlande, en mai 2000. Les actes du colloques, parus aux ditions du Hazard, rassemblent les communications des diffrents orateurs, regroupes en six thmatiques diffrentes : Histoire de la terminologie maritime ; Questions de normalisation; Informatique et terminologie maritime ; Enseignement et langue de spcialit ; Contacts interculturels et communication; Traduction spcialise et lexicographie. Toujours accessibles, ces textes rdigs en franais et en anglais offrent une diversit de points de vue sur le vocabulaire de la marine en cette n de millnaire.
Renseignements : Centre de recherche Termisti, 34 rue Joseph Hazard, B-1180 Bruxelles, Belgique, termisti@euronet.be, tl. : +32.2.346.26.41, tlc. : +32.2.346.21.34.

Le sens en terminologie

e volume collectif rassemble onze articles consacrs aux problmes du sens en terminologie. On y trouvera des contributions de Maria Teresa Cabr, Juan C. Sager, Monique Slodzian, Loc Depecker, Marc Van Campenhoudt, Franois Gaudin, Bruno de Bess, Ingrid Meyer et Kristen Mackintosh, Yves Gentilhomme, Claude Boisson, et de Henri Bjoint et Philippe Thoiron. Sont abordes les questions des rapports entre le terme et le mot, de la manire de dnir le sens des termes (relations entre concept, signi et rfrent, importance du domaine), des frontires entre langues spcialises et langue gnrale. Lensemble des contributions fait apparatre lmergence dun nouveau type de recherche terminologique fonde sur lexploitation des corpus, ventuellement multilingues. Cette nouvelle terminologie se dmarque de la tradition par ses mthodes et ses objectifs. Elle tend devenir descriptive plutt que normative et sinscrit dsormais dans le cadre dune approche ouvertement linguistique.
Presses universitaires de Lyon 80, boulevard de la Croix-Rousse BP 4371 F-69242 Lyon Cedex 04 France

Thoiron (Philippe) et Bjoint (Henri), dir., 1999 : Le sens en terminologie, Lyon, Presses universitaires de Lyon.

Newman (D.L.) et Van Campenhoudt (M.), d., 1999: Terminologie maritime: traduire et communiquer. Actes du 1er colloque international de terminologie maritime (Bruxelles, 15 et 16 mai 1998), Bruxelles, ditions du Hazard.

77

Je soussign souhaite recevoir gratuitement la revue Terminologies nouvelles.

Nom : Entreprise, organisme: Fonction : Adresse :


Ce bulletin dabonnement est adresser au module dont vous relevez ( adresse au dos de la revue )

Descriptif bibliographique: Depecker (Loc ) et Rousseau (Louis-Jean), dir.: Nouveaux outils pour la nologie, dans Terminologies nouvelles, n 20, dcembre 1999, Bruxelles, Agence de la francophonie et Communaut franaise de Belgique, ISSN : 1015-5716.

ISSN: 1015-5716 Tous droits de traduction de reproduction et dadaptation rservs pour tous pays. dit. resp.: M. Garsou, 44 boulevard Lopold II, 1080 Bruxelles, Belgique.

78

Numros dj parus
Consultables partir du n 14 ladresse www.rint.org
1, mai 1989 : Le Rint : objectifs et perspectives 2, dcembre 1989 : La formation en terminologie 3, juin 1990 : Harmonisation des mthodes en terminologie ( actes des sminaires de Talence et de Hull ) 4, dcembre 1990 : Numro gnral 5, juin 1991 : Terminologie et informatique 6, dcembre 1991 : Terminologie et dveloppement I ( actes du sminaire de Rabat ) 7, juin 1992 : Numro gnral 8, dcembre 1992 : Terminologie et environnement 9, juin 1993 : Terminologie et dveloppement II ( actes du sminaire de Cotonou ) 10, dcembre 1993 : Phrasologie ( actes du sminaire de Hull ) 11, juin 1994 : Numro gnral 12, dcembre 1994 : Implantation des termes ofciels ( actes du sminaire de Rouen ) 13, juin 1995 : Terminologie et entreprise 14, dcembre 1995 : Numro gnral 15, dcembre 1996 : Banques de terminologie ( actes de la table ronde de Qubec ) 16, juin 1997 : Enqutes terminologiques 17, dcembre 1997 : Terminologie et formation 18, juin 1998 : Terminotique et documentation 19, dcembre 1998 - juin 1999 : Terminologie et intelligence articielle ( actes du colloque de Nantes ) 20, dcembre 1999 : De nouveaux outils pour la nologie
79

80

Adresses des organismes membres du Rint

Afrique centrale et de lEst


Coordination : Centre de linguistique thorique et applique BP 4956 Kinshasa/Gombe Zare.

Madagascar
Centre des langues de lAcadmie malgache BP 6217 Antananarivo 101.

Afrique de lOuest
Coordination : Centre de linguistique applique Universit Cheikh Anta Diop Dakar Fann Sngal.

Maroc
Institut dtudes et de recherches pour larabisation BP 6216 Rabat Instituts tl. : 212 ( 7 ) 77 30 12

Canada
Terminologie et Normalisation Bureau de la traduction Travaux publics et Services gouvernementaux Portage II, 3e tage 165, rue Htel-de-Ville Hull ( Qubec ) K1A 0S5 tl. : 1 ( 819 ) 994-5934

Qubec
Ofce de la langue franaise 200, chemin Sainte-Foy, Qubec ( Qubec ) G1R 5S4 tl. : 1 ( 418 ) 643-4144

Rpublique centrafricaine
Conseil national damnagement linguistique BP 888 Bangui.

Communaut franaise de Belgique


Ministre de la Communaut franaise Service de la langue franaise 44, Bd Lopold II B-1080 Bruxelles tl. : 32 ( 2 ) 413 32 74

Suisse
Chancellerie fdrale suisse Services linguistiques centraux Section de terminologie Gurtengasse 2-4, 4e tage CH 3003 Berne tl. : 41 ( 31 ) 324 11 49

France
Codit par : LAgence de la francophonie et la Communaut franaise de Belgique ( Service de la langue franaise du ministre de la Communaut franaise et Commissariat gnral aux relations internationales) Secrtariat du Rint: Ofce de la langue franaise 200, chemin Sainte-Foy, Qubec ( Qubec ) G1R 5S4 Canada Le Rint sur Internet : http ://www.rint.org

Dlgation gnrale la langue franaise 1, rue de la Manutention F-75116 Paris tl. : 33 ( 1 ) 40 69 12 00

Tunisie
Innorpi 10bis, rue Ibn el Jazzar 1012 Tunis Belvdre tl. : 216 ( 1 ) 785 922

Hati
Facult de linguistique Universit dtat dHati 38, Rue Dufort ( Quartier Bois-Verna ) Port-au-Prince tl. : ( 509 ) 45 12 33

Modules associs
Union latine Bureau de Paris 131, rue du Bac F-75007 Paris tl. : 33 ( 1 ) 45 49 60 60