En cliquant sur "Accepter ", vous acceptez que des cookies soient stockés sur votre appareil afin d'améliorer la navigation sur le site, d'analyser son utilisation et de contribuer à nos efforts de marketing. Consultez notre politique de confidentialité pour plus d'informations.
Glossaire
Named Entity Recognition (NER)
Définition iA

Named Entity Recognition (NER)

La reconnaissance d’entités nommées (NER – Named Entity Recognition) est une technique du traitement automatique du langage naturel (TALN) qui consiste à identifier et à classer automatiquement dans un texte des entités nommées telles que les personnes, les lieux, les organisations, les dates ou encore les quantités. L’objectif est d’extraire de l’information structurée à partir de données textuelles non structurées.

La NER est utilisée dans de nombreux cas d’usage : moteurs de recherche (pour mieux indexer les documents), extraction d’information dans des textes juridiques ou médicaux, analyse de sentiment enrichie par la détection de noms de marques, ou encore systèmes de question-réponse. Elle constitue un élément essentiel des pipelines de NLP modernes.

Les approches varient depuis les méthodes classiques à base de règles et de modèles statistiques (CRF, HMM) jusqu’aux modèles de deep learning comme BERT ou spaCy, qui atteignent aujourd’hui des performances très élevées.

La reconnaissance d’entités nommées (NER) est un maillon essentiel des chaînes de traitement automatique du langage. Elle permet de transformer des documents bruts en informations exploitables : par exemple, repérer les noms d’entreprises dans des contrats, identifier les lieux cités dans des articles de presse ou extraire des pathologies à partir de dossiers médicaux.

Les approches modernes s’appuient sur les transformers, qui capturent les nuances contextuelles du langage. Cela permet de distinguer des entités ambiguës : un même mot peut renvoyer à une personne, une organisation ou un lieu selon la phrase. Toutefois, la NER reste un défi dans les environnements multilingues ou spécialisés (droit, biologie, finance), où le vocabulaire est complexe et évolutif.

En pratique, la NER est souvent intégrée à des systèmes plus larges, comme les moteurs de recherche, l’extraction d’information juridique ou la veille automatisée. Elle illustre parfaitement la capacité du TAL à rapprocher le langage humain des usages analytiques et décisionnels.

Références :