Alteca représentée lors de conférences internationales sur l’Intelligence Artificielle

Alteca était représentée par ses doctorants lors de trois prestigieuses conférences scientifiques internationales. Aux côtés de géants tels que Meta, Google, Amazon, Microsoft et Apple, Alteca a démontré son expertise et son engagement dans la recherche de pointe en IA.

Conférence SIGIR’23 : Pierre-Yves Genest à Taipei

Pierre-Yves, doctorant en Intelligence Artificielle chez Alteca, a eu l’honneur de présenter ses travaux de recherche à la conférence SIGIR’23, une référence mondiale en recherche d’information qui s’est tenue à Taipei, Taïwan.
Son projet de recherche se concentre sur l’extraction d’informations précises en utilisant des modèles de langue spécifiques. Des avancées prometteuses pour l’avenir de l’IA !

Pour en savoir plus sur son travail, vous pouvez consulter sa publication scientifique en cliquant ici.

Conférence IJCNN 2023 et NASCA’23 : Yasser Khalafaoui à Gold Coast (Australie) et à Athènes (Grèce)

Yasser Khalafaoui, également doctorant en IA chez Alteca, s’est rendu à Gold Coast pour la conférence IJCNN 2023 et à Athènes pour la conférence NASCA’23.

La présentation de Yasser lors de ces événements a mis en lumière le Clustering collaboratif multi-vues, une méthode novatrice visant à améliorer les algorithmes de clustering, une composante cruciale de l’analyse de données. En combinant différentes perspectives ou « vues » des données, ce projet de recherche a montré la voie vers des résultats plus précis et significatifs, renforçant nos progressions dans le secteur de l’IA.

Durant la conférence IJCNN 2023, Yasser a joué un rôle central en tant que participant et président de session. Il a eu l’opportunité d’introduire et de modérer d’autres projets de recherche durant la conférence, notamment dans le domaine de la « compréhension et de l’analyse de texte grâce à l’utilisation de réseaux de neurones artificiels ».

Les différentes réalisations et contributions de nos doctorants à ces événements présagent un avenir prometteur pour le secteur de l’Intelligence Artificielle, en constante évolution.


4 nouveaux travaux de recherche publiés par nos experts

Pour aller plus loin, nous vous proposons de consulter en détails ces quatre derniers projets de recherches en IA résumés par les doctorants Alteca !

#1 PromptORE – Vers l’extraction de relation non-supervisée (P-Y. Genest)

L’extraction de relation vise à identifier les relations qui lient les entités (personnes, lieux, entreprises, etc.) dans un texte. De manière générale, les modèles ont besoin de données labellisées pour s’entraîner.
Or l’annotation de tels jeux de données est coûteuse et chronophage.
C’est dans ce contexte que les approches non-supervisées se sont développées. Malheureusement leurs performances restent médiocres et ne sont pas utilisables en pratiques (à cause d’hypothèses trop fortes). Pour résoudre ces problèmes, PromptORE se base sur le prompting de modèles de langues.


Grâce à cela, PromptORE ne repose pas sur des hypothèses irréaliste et obtient des performances 30 à 40% meilleures (comparées aux modèles précédents), tout en étant beaucoup plus simple et rapide à l’exécution.

#2 Linked-DocRED – Amélioration de DocRED avec l’entity-linking pour évaluer des pipelines d’Extraction d’Information orientées documents (P-Y Genest)

Un pipeline d’extraction d’information extrait les entités et relations de documents textuels pour les structurer sous forme de graphe de connaissances. L’évaluation de tels pipelines nécessite un jeu de données annoté (par entités, coréférences, relations et entity-linking).

À l’heure actuelle, aucun dataset existant n’est satisfaisant, car ils sont trop petits, pas assez divers, ou annotés automatiquement. Pour combler ce besoin, Linked-DocRED propose le premier jeu de données de taille importante, divers avec des documents manuellement annotés. L’utilisation de Linked-DocRED apporte un éclairage plus précis et plus objectif des performances des pipelines d’extraction d’information, et met en lumière le problème des cascades d’erreurs (les erreurs s’accumulent progressivement le long du pipeline et causent des dégradations importantes des résultats).

#3 Joint Multi-View Collaborative Clustering (Y. Khalafaoui)

Dans le domaine de l’apprentissage automatique, le clustering est une technique utilisée pour regrouper des données similaires. Une approche classique consiste à utiliser un seul ensemble de données, mais il est souvent plus efficace d’utiliser plusieurs ensembles de données, ou « vues ».

Présenté à la conférence IJCNN, ce projet propose une nouvelle approche de clustering multi-vues basée sur l’algorithme NMF. Cette approche utilise un mécanisme de collaboration entre les vues et le résultat (dit consensus) tout en réduisant l’impact du bruit. De ce fait, les clusters locaux peuvent se corriger mutuellement si l’un d’entre eux est bruité, via une mise à jour adaptive et itérative.

#4 Amélioration de l’algorithme NMF en contexte de Deep Learning (Y. Khalafaoui)

Présentée à la conférence NASCA, il s’agit d’une amélioration de l’algorithme précédent dans un contexte de Deep Learning. Cette implémentation est similaire au multi-layer NMF. Pour ce dernier algorithme, un concept du domaine des systèmes de contrôle a été adapté pour mettre à jour le degré de collaboration entre les vues.

Ce concept, appelé « régulation adaptive« , permet de contrôler la quantité d’informations échangées entre les vues. Au final, il améliore la performance de l’algorithme en cas de vues très différentes.