Identification et indexation d'entité nommées

Par ai2d , 4 janvier, 2022

Il s'agit d'un projet dans le domaine des humanités numériques. L'objet est de perfectionner un outil d'identification et d'indexation d'entités nommées par construction d'un dictionnaire d'alias, puis détection et étiquettage des ambiguités, dans un corpus important et structuré de textes.

Il s'agit de faciliter la construction des dictionnaires et l'annotation des corpus en facilitant le retour au texte et de développer des outils de consultation et de d'analyses du corpus à l'aide de ces annotations (typiquement des graphes de co-occurences).

Il s’agit d’améliorer un prototype d'outil pré-existant en python en travaillant notamment sur la résolution des ambiguité et en automatisant les parties d’analyses du corpus à partir du dictionnaire constitué.

Encadrant
Gauvain Bourgne
Nombre d'étudiants
3
Attribué
Non
Obsolète
Oui
Tags