CENTRE DE TRAITEMENT AUTOMATIQUE DU LANGAGE

UCL > CENTAL > Projets > GlossaNet

English version

GLOSSANET

Titre complet

GlossaNet : outil d'analyse de corpus en ligne

Résumé

GlossaNet est un service en ligne gratuit qui permet de :

  • Créer des corpus à partir de flux RSS ;
  • Faire de la veille linguistique sur ces corpus (l'utilisateur enregistre des requêtes linguistiques qui seront appliquées sur ce corpus à chaque fois que de nouveaux textes seront disponibles) ;
  • Obtenir des concordances par email.

GlossaNet est largement utilisé dans la recherche et l'enseignement en linguistique, linguistique de corpus et traitement automatique des langues. Certains l'utilisent également comme un outil de recherche et de veille d'information. Ce service intègre deux logiciels préexistants : Corporator (Fairon, 2006) et Unitex (Paumier, 2003).

Accéder au site de GlossaNet

Références

  • Fairon Cédrick, Macé Kévin, Naets Hubert, "GlossaNet2: a linguistic search engine for RSS-based corpora", In: Proceedings of LREC 2008, Workshop Web As Corpus (WAC4), Marrakesh, 2008. [PDF]
  • Fairon Cédrick, "Corporator: A tool for creating RSS-based specialized corpora", In: Proceedings of the Workshop Web as corpus. EACL 2006, Trento, 2006. [PDF]
  • Fairon Cédrick, Singler John V., "I'm like, 'Hey, it works!': Using GlossaNet to find attestations of the quotative (be) like in English-language newspapers", In: The Changing Face of Corpus Linguistics, A. Renouf and A. Kehoe ed(s), Rodopi.
  • Dister Anne, Fairon Cédrick, "Extension des ressources lexicales grâce à un corpus dynamique", Lexicometrica, 2004. [PDF, Lexicometrica]
  • Fairon Cédrick, "Extension dynamique de ressources lexicales par consultation du Web", Bulletin de linguistique appliquée et générale (BULAG), 26, 2001, p. 39-52.
Type de projet

Durée

  • Début : 1998 (UP7, Fr).
  • Depuis : 2001 (UCL, Be).

Chercheur(s)

Promoteur

Cédrick Fairon