Nous sommes fiers de la publication de notre article scientifique intitulé « OWNER – Vers la Reconnaissance d’Entités Nommées Non-Supervisée et en Monde Ouvert » dans la prestigieuse revue internationale IEEE Access. Ce travail est le fruit d’un partenariat de recherche entre Alteca et le laboratoire LIRIS de l’INSA Lyon, dans le cadre de notre politique ambitieuse de R&D en intelligence artificielle.
La reconnaissance d’entités nommées (Named Entity Recognition – NER) est une tâche clé du traitement automatique du langage naturel (TALN). Cette dernière consiste à identifier et classer automatiquement des entités telles que des noms de personnes, de lieux, d’organisations, de médicaments, de produits bancaires, etc., au sein de documents textuels.
Dans des secteurs comme la banque, l’assurance ou la santé, la rareté des données annotées constitue un frein majeur à l’adoption des solutions d’IA traditionnelles. C’est ce défi que notre équipe a relevé avec OWNER !
OWNER (Open World Named Entity Recognition) est un modèle de NER non-supervisé :
Ainsi, OWNER exploite les modèles de langage modernes comme BERT, tout en conservant une taille 100 fois plus réduite par rapport aux grands modèles (LLMs) comme GPT ou Llama.
Nos évaluations sur 13 jeux de données spécialisés démontrent qu’OWNER surpasse les performances des modèles LLM avec un gain de précision de 2 à 18% selon les cas d’usage. Cela ouvre des perspectives concrètes pour :
Cette publication illustre parfaitement l’engagement d’Alteca dans l’innovation appliquée aux besoins métiers de nos clients. En conjuguant expertise en IA, partenariats scientifiques et retour terrain, nous créons des solutions à la fois robustes, performantes et adaptées aux contraintes de chaque métier.
Rendez-vous sur notre page GitHub pour retrouver notamment le code de ce modèle.
Auteurs : Genest, P. Y., Portier, P. E., Egyed-Zsigmond, E., & Lovisetto, M. (2025)