Une chaîne de coréférences est constituée de l’ensemble des mentions référentielles présentes dans un texte qui désignent une même entité. Ces chaînes assurent la continuité des éléments de discours, ils sont une composante fondamentale de la cohérence globale des textes. L’objectf de la thèse est de développer un système de reconnaissance automatique de telles chaines dans des textes français bruts. L’approche préconisée s’appuiera principalement sur les méthodes actuelles d’apprentissage automatique supervisé (y compris l’apprentissage profond) mais elle exploitera aussi tous les indices linguistiques accessibles (en particulier ceux issus d’une analyse syntaxique).
Responsables
- Isabelle Tellier
- Eric de la Clergerie
Partenaires
- Lattice (Marco Dinarelli, Frederic Landragin, Isabelle Tellier)
- Alpage (Eric de la Clergerie)
Financement
- Allocation de thèse (3 ans) attribuée à Loïc Grobol