CENTRE DE TRAITEMENT AUTOMATIQUE DU LANGAGE

UCL > CENTAL > Projets > Stratego

English version

Titre complet

Structuration automatique de textes bruts à des fins de groupement et catégorisation

Résumé

L'objectif principal du projet Stratego est de développer des outils visant à faciliter l'accès à de larges bases documentaires électroniques.


Plus précisément, le projet se concentre sur:

  • la structuration automatique de documents « bruts » (par exemple des documents numérisés) en documents XML satisfaisant un DTD ou un schéma XML,
  • le classement automatique de documents dans des catégories prédéfinies et
  • la constitution semi-automatique de thésaurus à partir de corpus de textes ciblés (ex: des textes de lois).


Plusieurs laboratoires sont impliqués dans ce projet:

  • CENTAL (UCL) (Centre de Traitement Automatique du Langage),
  • IRIDIA (ULB) (Institut de Recherches Interdisciplinaires et de Développements en Intelligence Artificielle),
  • ISYS (UCL) (Information Systems Unit) et
  • SIC (ULB) (Département des Sciences de l'Information et de la Communication)

Publications

Région wallonne

Wist 2

Durée

  • 36 mois.
  • Début : octobre 2007.

Chercheurs

Promoteurs

Partenaire industriel