Le dernier volume du Trésor de la langue française est paru

Réalisé dans le cadre du CNRS par l’Institut national de la langue française, le Trésor de la langue française, dictionnaire de la langue du 19e et du 20e siècle, dit TLF, édité par le CNRS et les Editions Gallimard, est le fruit d’une entreprise sans précédent. Les 23 000 pages réparties en 16 volumes qui le constituent renouvellent la connais-sance du français moderne et contemporain. Le dernier volume vient de paraître.

Le projet du Trésor de la langue française (TLF) remonte à 1957. Le Centre de recherche pour un Trésor de la langue française, laboratoire du CNRS intégré depuis à l’Institut national de la langue française (INaLF-CNRS, actuellement dirigé par Robert Martin), a été créé à Nancy. Sous la direction de Paul Imbs, puis de Bernard Quémada, plus d’une centaine de chercheurs et de techniciens y ont collaboré : documentalistes, informaticiens, lexicologues, phonéticiens, historiens, sémanticiens, relecteurs, réviseurs, coordinateurs, maquettistes. Un ordinateur Gamma 60 Bull a permis de traiter la documentation sur laquelle se fondent l’originalité et la fiabilité du dictionnaire.

La richesse du TLF, citée en référence dans le Grand Robert, est celle des exemples (les rédacteurs ont exploité un fond textuel qui leur a procuré près de 120 millions d’exemples extraits de plus de 1500 œuvres). Il y a en fait deux Trésors : le Trésor ouvert, infini, susceptible d’enrichissements permanents, constitué par la base de données textuelles, et le Trésor- dictionnaire avec ses 16 volumes qui gère une partie de ces données. Ce dictionnaire offre à son consultant la possibilité de compléter la documentation d’exemples cités par l’examen de la base Frantext, gisement d’exemples à explorer en permanence.

Pour l’établissement du corpus de textes, les auteurs ont d’abord répertorié des œuvres éditées qui avaient eu une réelle diffusion du vivant de leur auteur, soit qu’elles aient paru d’abord en feuilleton ou que leur tirage ait été important. Ainsi, des auteurs comme Ponson du Terrail ou Eugène Sue comptaient-ils autant pour la sélection qu’Honoré de Balzac ou Victor Hugo, et Le Feu de Barbusse autant qu’un tome d’À la recherche du temps perdu. Chercher un équilibre dans chaque décennie pour la représentation de chaque genre littéraire par des œuvres ayant eu un réel succès, tel était le critère d’autorité de base. Une certaine conception de l’histoire de la langue sous-tendait ces choix : non pas celle d’un greffier d’état-civil enregistrant la vie et la mort des mots ou des sens, mais celle de l’historien s’attachant non seulement aux changements, mais aussi aux permanences que constatent d’importants dénombrements ; une certaine conception de l’écrit également suivant laquelle la langue des écrivains est à la fois le reflet de l’usage actuel et, par des essais néologiques ou syntaxiques, le présage de l’usage futur. Enfin, des nécessités techniques impliquaient d’opérer la saisie des textes à partir de supports imprimés, ponctués, paginés pour permettre une exploitation électronique. La langue parlée a été représentée à travers des textes proches d’elle (romans populistes, pièces du théâtre de boulevard). Le corpus littéraire a été complété par un corpus technique. Les mêmes principes de sélection des textes ont été retenus, mais la saisie porte sur certains chapitres d’œuvres et non sur les œuvres entières.

En plus de la base Frantext, le rédacteur a consulté des ensembles documentaires importants (l’IGLF, Inventaire général de la langue française, constitué de près de six millions de fiches, une base de néologismes, un index technique cumulatif, etc). Un classement syntagmatique (1) automatique permet au rédacteur de discerner rapidement les constructions usuelles d’un mot, parce que fréquemment attestées ou les cooccurrences les plus fréquentes. (2) Les articles du TLF peuvent ainsi donner une base sûre de phraséologie pour les dictionnaires bilingues rédigés à partir du français, rendre compte du phénomène de la lexicalisation et pénétrer, grâce à cette documentation automatique, la combinatoire sémantique du français propre à un auteur ou à une mode. (3) Par le nombre d’exemples enchaînés ou détachés, par les rubriques de syntagmes présentées sens par sens et qui procèdent des textes à la source du TLF, le Trésor de la langue française fournit au lecteur un miroir d’identification ou de reconnaissance culturelle. Cependant l’impasse est parfois faite sur la charge culturelle dont certains mots sont porteurs : par exemple, ni le TLF, ni le Grand Larousse, ni le Grand Robert n’indiquent que la couleur bleue est dévolue aux bébés-garçons, par opposition à la couleur rose réservée aux bébés-filles, et à la couleur blanche qui convient aux deux sexes, tant pour les dragées de baptême que pour la layette.

Le produit didactique qu’est le dictionnaire implique que le discours qu’il fournit soit clos, et que les mots cités dans les exemples comme dans la métalangue soient définis. (4) La nomenclature répondait à des principes de base : accueillir d’office les mots représentés dans les fonds littéraires d’exemples comptant au moins 100 occurrences ; accueillir les mots présentant moins de 100 occurrences mais à la condition expresse qu’ils fussent présents à la fois dans l’IGLF et un corpus de dictionnaires définis comptant Littré, le Dictionnaire général, les dictionnaires de Robert (le Grand et le Petit) et le Lexis. Les mots résiduels étaient, à la différence des deux procédures automatiques précédentes, examinées artisanalement, la qualité relative des exemples disponibles donnant un critère de retenue ou d’élimination. Les ethniques comme les dérivés de noms propres étaient conservés à condition qu’ils ne fussent pas seulement déterminatifs mais aussi caractérisants. Les fantaisies verbales avaient droit de mention dans la mesure où elles entraient dans la série morphologique d’un mot déjà admis à la nomenclature, ainsi que les antonomases instituées (5). La nomenclature fut aussi ouverte à des mots non-représentés dans les fonds d’exemples, mais présents dans des dictionnaires de langue contemporaine et attendus par des usagers francophones. C’est donc sur près de 100 000 mots que le TLF fournit des informations.

Une autre originalité quant à la nomenclature concerne le traitement de certains morphèmes (6). Le TLF, par exemple, est l’un des rares dictionnaires à traiter -o finale et finale par apocope (7) montrant que cette finale s’ajoute à des mots entiers ou à des bases tronquées et sert à construire des adjectifs, des adverbes et des substantifs auxquels elle donne une connotation familiale, populaire ou argotique (catho, info, perso, projo). Plus de 60 mots sont ainsi traités sous l’entrée -o et illustrés d’exemples. Il en va de même pour le traitement des structures du vocabulaire savant de formation française : ces articles (type hyper-, hypo-, radio-) manifestent à travers le foisonnement des exemples quelles sont les règles de formation, l’organisation de la concurrence entre suffixes et dégager des règles de construction que les taxinomies ou nomenclatures scientifiques s’efforcent de maîtriser (8).

Pour la rédaction de chaque rubrique, le rédacteur a à sa disposition un dossier de mots donnant sous forme de photocopie le contenu des dictionnaires de langue, des dictionnaires encyclopédiques Larousse, des dictionnaires techniques, ces derniers procédant de l’index technique cumulant les nomenclatures de 550 dictionnaires de spécialités recensés par le centre documentaire du Laboratoire. Contrôler la validité de l’information dictionnairique disponible est la première tâche du rédacteur. Les principaux articles du TLF sont terminés par une rubrique de bibliographie, une rubrique d’étymologie et d’histoire qui rend compte du mouvement des mots et des sens de 1789 à nos jours, apportant les précisions indispensables à l’histoire du mot et un éclairage nécessaire à l’analyse dite synchronique (9).

Deux catégories de mots sont privilégiés : les mots grammaticaux et le vocabulaire culturel. Entre ces mots existe un point commun : le grand nombre d’occurrences, et donc la possibilité pour les rédacteurs d’une illustration fine des emplois. Véritable encyclopédie du vocabulaire grammatical, le Trésor de la langue française offre également sur le vocabulaire culturel des articles-monographies rendant compte du fonctionnement du mot étudié dans les courants d’idées et les modes d’époques.

Référence :

Extraits de : Le Trésor de la langue française (TLF), trente ans après, bilan et perspectives, Gérard Gorcy, in Etudes de linguistique appliquée n°85/86.

Le Trésor de la langue française,

CNRS, Editions Gallimard,

16 volumes, 220 x 305 mm de 1000 à 1400 pages.

Reliure reluskin vert et or.

Fers gravés à l’or fin sous jaquette.

La série des 16 volumes coûte 8 000 F jusqu’au 28/02/95. Après cette date : 9 800 F. Chaque tome peut être vendu séparément.

Diffusion directe : CNRSEditions


Cliquer ici pour revenir au texte principal en (1)

>>>Note 1
Syntagmatique : groupe de morphèmes ou de mots qui se suivent avec un sens.


Cliquer ici pour revenir au texte principal en (2)

>>>Note 2
Occurrence : apparition d’une unité linguistique dans le discours.


Cliquer ici pour revenir au texte principal en (3)

>>>Note 3
Par exemple chemin de fer, guerre froide, économiste distingué, beau ténébreux.


Cliquer ici pour revenir au texte principal en (4)

>>>Note 4
Métalangue : langage naturel ou formalisé qui sert à parler d’une langue, à la décrire.


Cliquer ici pour revenir au texte principal en (5)

>>>Note 5
Exemples d'antonomase : un harpagon, une célimène.


Cliquer ici pour revenir au texte principal en (6)

>>>Note 6
Morphème : constituant d’un mot.


Cliquer ici pour revenir au texte principal en (7)

>>>Note 7
Apocope : chute d’un phonème ou d’une syllabe à la fin d’un mot.


Cliquer ici pour revenir au texte principal en (8)

>>>Note 8
Taxinomie : science des lois de la classification.


Cliquer ici pour revenir au texte principal en (9)

>>>Note 9
«Il est théoriquement impensable et pratiquement impossible que le contenu sémantique d’un mot ne se ressente pas peu ou prou du chemin qu’il a parcouru dans le temps et dans l’espace ; c’est à déceler ce passé subsistant dans le présent que doit aider le rappel de l’étymologie.» (Paul Imbs).


Informations complémentaires


Contact chercheur
Contact CNRS communication Sciences de l’homme et de la société,
Contact CNRS communication institutionnelle,
Contact Editions Gallimard :
Contact rédaction .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.