.:: TALN - 2006

Traitement Automatique des Langues Naturelles : du 10 au 13 avril 2006 à Leuven (Belgique)

 Informations
 o LES ACTES SONT DISPONIBLES
 o Photos de la conférence
 o Appel d'urgence
 o Programme
 o Inscription
 o Voyage & lieu de la conférence
 o Logement
 o Posters & présentations
 o Leuven en photos
 TALN & RECITAL
 o Appel à com. (TALN)
 o Appel à com. (Recital)
 o Comité de programme
 o Comité scientifique (TALN)
 o Comité scientifique (Recital)
 o Comité d'organisation local
 o Soumettre un papier
 o Feuilles de styles
 Ateliers
 o TAL & ALAO (appel à com.)
 o Technolangue
 o MulLexSem (annulé)

 Tutoriel
 o Analogie en traitement automatique des langues. Application a la traduction automatique (Yves Lepage)
 Organisation





Tutoriel :
Analogie en traitement automatique des langues
-- application à la traduction automatique --

Ce tutoriel se propose de présenter une opération que le traitement automatique des langues a lontemps négligée. Il s'agit de l'analogie. Une analogie met nécessairement quatre objets A, B, C et D en relation ; elle se note A:B::C:D et elle se lit « A est à B ce que C est à D. » Par exemple, entre mots :

français : recevoir : j'ai reçu :: percevoir : j'ai perçu
arabe : aslama : muslimun : arsala : mursilun

entre phrases :

Ces fenêtres, là, je ne vous ai pas dit de les ouvrir. : Est-ce que vous pouvez m'ouvrir une fenêtre ? :: Ces chèques de voyage, là, je ne vous ai pas dit de les échanger. : Est-ce que vous pouvez m'échanger ces chèques de voyage ?

L'objet de ce tutoriel est de montrer la contribution éventuelle de cette opération au traitement automatique des langues, dans la lignée des approches « à moindre effort » et à base de corpus.

Première session de 1 heure 30

La première partie du tutoriel abordera l'histoire de la notion et posera certains garde-fous, car la notion a été étendue, puis mal comprise et galvaudée. On fera donc très nettement la séparation d'avec les notions de similarité et de métaphore, et on mentionnera les travaux dans lesquels le terme est employé à tort ou de façon partielle. L'intérêt d'un historique de la notion en mathématique, en philosophie, en grammaire et en linguistique est de dégager les articulations et les notions constitutives de l'analogie. Un historique permet aussi de comprendre pourquoi la notion a pu être tenue pour suspecte par la communauté du traitement automatique des langues.

La seconde partie abordera le problème de l'analogie entre chaînes de symboles. On donnera d'abord les propriétés formelles générales à tout type d'analogie. On montrera sur des exemples linguistiques que si l'énoncé du problème est simple, la résolution en reste complexe. On délimitera ensuite les types d'analogies entre chaînes considérées et on donnera une tentative de formalisation relativement économique en termes de notions utilisées. A partir de cette formalisation, on définira les langages formels de chaînes analogiques et l'on donnera plusieurs résultats. En particulier, on abordera le problème de la position de cette famille de langages relativement au problème de la puissance des langues humaines. On conclura cette partie sur quelques conséquences générales de l'utilisation de l'analogie en traitement automatique des langues.

Deuxième session de 1 heure 30

La troisième partie se propose de montrer que l'analogie est bien attestée en corpus et qu'elle permet une certaine structuration des corpus, voire d'envisager une densification des corpus. On abordera le problème de la validité des analogies de forme en tant qu'analogies de sens par échantillonnage. En lien avec ce problème, on montrera l'efficacité de l'analogie pour la génération automatique de paraphrases en conjonction avec le filtrage par n-séquences de caractères attestées.

La quatrième partie du tutoriel proposera un moteur universel fondé sur la conservation de l'analogie entre espaces analogiques. Il s'agit d'une méthode qui peut trouver maintes applications en traitement automatique des langues, de la conjugaison ou déclinaison automatique à la traduction automatique en passant par l'analyse ou la segmentation en mots de langues asiatiques. On donnera quelques résultats préliminaires. On se consacrera plus longuement à la traduction automatique. On détaillera la méthode, et on montrera qu'elle permet d'aborder le problème de la divergence entre langues, problème au coeur de la traduction. On montrera aussi les résultats obtenus sur les tâches de deux campagnes internationales d'évaluation de traduction automatique, les scores obtenus par un système « pur », et on comparera avec d'autres systèmes actuels.

Si ce tutoriel aura mentionné des applications de l'analogie à diverses tâches du traitement automatique des langues, il est bien sûr hors de question de prétendre que l'on peut tout faire en traitement automatique des langues avec la seule notion d'analogie. Aussi, la conclusion rappellera les notions clés de l'analogie, ses avantages, mais insistera aussi sur les problèmes de la méthode. Dans cet esprit, la conclusion se proposera de dégager les domaines ouverts à d'autres opérations, et de s'interroger sur les implications linguistiques de la démarche présentée.



Dernière mise à jour :  Février 2006