Accueil > Ecole thématique 2011 > Présentation

Présentation

par Thierry POIBEAU - publié le

L’école thé­ma­tique du CNRS sur l’annotation de données lan­ga­gières a été orga­nisée conjoin­tement par les labo­ra­toires CNRS LATTICE et MODYCO. Elle s’est déroulée du 10 au 16 sep­tembre 2011 à Biarritz.

La lin­guis­tique mais aussi d’autres domaines au sein des sciences sociales font de plus en plus appel à l’utilisation de corpus (ou au moins de données écrites ou orales attestées) pour effectuer des recherches très diverses. Malgré cette diversité, des besoins communs sont avérés, notamment au niveau de l’enrichissement de ces données par des anno­ta­tions (syn­taxiques, séman­tiques, prag­ma­tiques). Or ces pra­tiques s’apprennent lar­gement « sur le tas ». C’est pourquoi il paraît important de répondre à un besoin de for­mation et de dia­logue autour de la notion d’annotation, pour unifier les pra­tiques, faire émerger une com­mu­nauté et faire pro­fiter les uns et les autres de retours d’expérience.

Par le passé, des écoles thé­ma­tiques (ou des événe­ments simi­laires) ont été orga­nisées sur la notion de corpus (voir par exemple F. Rastier et F. Bal­la­briga, 2006) ou sur l’analyse sta­tis­tique de corpus (école thé­ma­tique « méthodes infor­ma­tiques et sta­tis­tiques en analyse de textes », orga­nisée à Besançon en 2009, à Nice en 2010 et à Besançon en 2011, http://laseldi.univ-fcomte.fr/ecole/).

Cette école thé­ma­tique porte quant à elle plus spé­ci­fi­quement sur l’annotation de corpus de données lan­ga­gières. Il s’agit d’un aspect tout à fait com­plé­men­taire des événe­ments cités supra (l’annotation suppose l’existence de corpus ; les anno­ta­tions peuvent ensuite être exploitées par des méthodes sta­tis­tiques). L’originalité de cette école est de se foca­liser sur la notion même d’annotation, qui demande un ensemble de com­pé­tences et de pra­tiques spécifiques.