Operation EFL – Reconnaissance automatique de chaînes de coréférence en français par combinaison d’apprentissage automatique et de ressources linguistiques

Une chaîne de coréférences est constituée de l’ensemble des mentions référentielles présentes dans un texte qui désignent une même entité. Ces chaînes assurent la continuité des éléments de discours, ils sont une composante fondamentale de la cohérence globale des textes. L’objectf de la thèse est de développer un système de reconnaissance automatique de telles chaines dans des textes français bruts. L’approche préconisée s’appuiera principalement sur les méthodes actuelles d’apprentissage automatique supervisé (y compris l’apprentissage profond) mais elle exploitera aussi tous les indices linguistiques accessibles (en particulier ceux issus d’une analyse syntaxique).

Responsables

  • Isabelle Tellier
  • Eric de la Clergerie

Partenaires

  • Lattice (Marco Dinarelli, Frederic Landragin, Isabelle Tellier)
  • Alpage (Eric de la Clergerie)

Financement

  • Allocation de thèse (3 ans) attribuée à Loïc Grobol

Voir aussi dans «Opérations Labex EFL»

Opération EFL Word Order 3 Labex Empirical Foundations of Linguistics http://www.labex-efl.org, Université Sorbonne Paris Cité