Une avancée majeure en traitement du langage naturel publiée dans IEEE Access

Nous sommes fiers de la publication de notre article scientifique intitulé « OWNER – Vers la Reconnaissance d’Entités Nommées Non-Supervisée et en Monde Ouvert » dans la prestigieuse revue internationale IEEE Access. Ce travail est le fruit d’un partenariat de recherche entre Alteca et le laboratoire LIRIS de l’INSA Lyon, dans le cadre de notre politique ambitieuse de R&D en intelligence artificielle.

Reconnaître les entités sans supervision : un enjeu pour les secteurs spécialisés

La reconnaissance d’entités nommées (Named Entity Recognition – NER) est une tâche clé du traitement automatique du langage naturel (TALN). Cette dernière consiste à identifier et classer automatiquement des entités telles que des noms de personnes, de lieux, d’organisations, de médicaments, de produits bancaires, etc., au sein de documents textuels.

Dans des secteurs comme la banque, l’assurance ou la santé, la rareté des données annotées constitue un frein majeur à l’adoption des solutions d’IA traditionnelles. C’est ce défi que notre équipe a relevé avec OWNER !

OWNER : un modèle non-supervisé, léger et performant

OWNER (Open World Named Entity Recognition) est un modèle de NER non-supervisé :

  • Il ne nécessite aucune donnée annotée,
  • Il s’adapte à n’importe quel domaine métier,
  • Il détecte et structure automatiquement les entités selon des types dynamiques,
  • Il repose sur une architecture légère facilement déployable.

Ainsi, OWNER exploite les modèles de langage modernes comme BERT, tout en conservant une taille 100 fois plus réduite par rapport aux grands modèles (LLMs) comme GPT ou Llama.

Des performances supérieures aux LLMs sur 13 jeux de données

Nos évaluations sur 13 jeux de données spécialisés démontrent qu’OWNER surpasse les performances des modèles LLM avec un gain de précision de 2 à 18% selon les cas d’usage. Cela ouvre des perspectives concrètes pour :

  • L’analyse exploratoire de documents textuels,
  • La construction automatique de graphes de connaissances,
  • Et la mise en place de systèmes d’information intelligents dans des environnements métier contraints.

Une illustration concrète de l’innovation portée par la R&D Alteca

Cette publication illustre parfaitement l’engagement d’Alteca dans l’innovation appliquée aux besoins métiers de nos clients. En conjuguant expertise en IA, partenariats scientifiques et retour terrain, nous créons des solutions à la fois robustes, performantes et adaptées aux contraintes de chaque métier.

Rendez-vous sur notre page GitHub pour retrouver notamment le code de ce modèle.

Auteurs : Genest, P. Y., Portier, P. E., Egyed-Zsigmond, E., & Lovisetto, M. (2025)

Accédez à l’article complet dans IEEE Access

Découvrez toutes nos publications scientifiques