CENTRE DE TRAITEMENT AUTOMATIQUE DU LANGAGE

UCL > CENTAL > Projets > Delaf 2.0

Delaf 2.0

Delaf

Le Delaf, dictionnaire morphologique du français comportant quelques 792.260 entrées, a connu ses évolutions majeures dans les années 80 et 90, époque à laquelle il était le dictionnaire électronique de référence pour le français. Depuis 2001, le dictionnaire n’a plus connu de mise à jour significative. Il est donc utile de se pencher sur l’état de ce dictionnaire et de lui apporter des compléments permettant en quelque sorte de « rattraper la néologie ».


Méthodologie

La base que nous vous proposons ici a été construite à partir des données récoltées par les étudiants de Master en linguistique de l’UCL (Belgique), dans le cadre du cours de Linguistique française: questions spéciales de lexicologie, consacré à la néologie. La première année, un corpus de 1 Go de textes de presse composé de la totalité des dépêches de l’Agence de presse Belga diffusées entre 2000 et 2006 a été traité. La deuxième année, un corpus de 4 Go de textes de presse constitué d’articles parus dans plusieurs quotidiens français (Le Monde, Libération, Le Nouvel Observateur, L’Équipe et 01 Informatique) entre 2006 et 2009 a été constitué. Lors de la première année, le Delaf servait de corpus d’exclusion et lors de la seconde, c’est un Delaf-bis, complété par les formes de l’année précédente, qui servait de corpus d’exclusion. Comme on le voit, la notion de « néologisme » prend dans ce cadre un sens particulier : il s’agit des formes inconnues du Delaf. Les néographies sont donc examinées au même titre que les nouveaux lexèmes.


Remerciements

Nous remercions la quarantaine d’étudiants qui ont participé à ces deux expériences : leur travail a permis de constituer une mise à jour importante comportant plus de 4600 formes nouvelles. Un remerciement tout particulier à Nicolas Hanot dont le professionnalisme nous a permis d'obtenir des dictionnaires précis et uniformisés.


Téléchargements

Dès le 1er octobre, vous trouverez ci-dessous les deux dictionnaires ainsi constitués. Le troisième lien comprend un fichier assemblant les deux dictionnaires.
Dictionnaire de néologismes issus de la presse belge.
Dictionnaire de néologismes issus de la presse française.
Dictionnaire assemblé de néologismes issus de la presse belge et française.


UCL

Durée

  • 2 ans.
  • Début : 2007.

Chercheurs

Louise-Amélie Cougnon

Cédrick Fairon