CENTRE DE TRAITEMENT AUTOMATIQUE DU LANGAGE

UCL > CENTAL > Projets > Vocalise

English version

VOCALISE

Titre complet

VOCALISE : Synthèse vocale des SMS.

Résumé

D'après une étude récente, plus de 9 millions de Belges possèdent aujourd'hui un GSM, objet de consommation dont les ventes ont augmenté de 15% en 2006. Le GSM, téléphone portable, est paradoxalement rapidement devenu machine à écrire portable, envoyant des messages limités à un nombre restreint de caractères : les SMS. Les utilisateurs ont imposé cette fonctionnalité secondaire aux opérateurs de téléphonie, qui en ont rapidement fait un argument de vente.

Conscient de ce phénomène de société, le CENTAL lança en 2004 le projet "Faites don de vos SMS à la Science" : 75 000 SMS furent alors récoltés, ce qui constitue le plus grand corpus de SMS à ce jour. Au travers d'une étude scientifique réalisée sur ce corpus, le CENTAL a acquis une expertise unique dans le domaine de l'analyse des phénomènes qui distinguent, en français, le langage SMS de la norme écrite. Fort de cet acquis et afin de réaliser des études similaires dans d'autres langues, le centre a démarré, en 2007, le projet "sms4science".

Aujourd'hui, les opérateurs de téléphonie se rendent compte qu'une large couche de la population ne peut accéder au contenu textuel du SMS : personnes visuellement déficientes, automobilistes, clients de téléphonie fixe... Dès lors, l'idée est de proposer à cette clientèle un service supplémentaire : la vocalisation des SMS à l'aide d'un système de synthèse de la parole.

Or, le langage utilisé dans les SMS est si éloigné de la norme écrite (contractions, agglutinations, simplifications) que les systèmes classiques ne peuvent le vocaliser correctement. Sur la base de ce constat, le CENTAL a proposé à Multitel, centre de recherche montois expert en synthèse de la parole et reconnaissance de formes, de l'aider à développer un système de synthèse vocale des SMS dans le cadre d'un FIRST Post-Doc de la Région wallonne. Intéressé par le résultat de la recherche, Proximus, de son côté, a proposé de tester le système tout au long de son développement.

Région wallonne

First Post-Doc

Durée

  • 24 mois.
  • Début : avril 2008.

Chercheur

Dr Richard BEAUFORT

Promoteur

Prof. Cédrick Fairon,
Directeur du CENTAL

Partenaires industriels