Bilan IA 2022 Partie 1 : Les images synthétiques nous envahissent

L’année 2022 s’achève avec son lot d’innovation, de progrès, mais aussi d’obstacles et difficultés. Toutefois, cette année a marqué les esprits par les nombreux outils à base d’Intelligence Artificielle déployés. On entend souvent dire que l’hiver de l’Intelligence Artificielle (période de stagnation et potentiel déclin) approche à grands pas, mais cette année 2022 a bel et bien prouvé le contraire. Zoom sur la première tendance de cette année : les images synthétiques, décryptée par Yasser, doctorant en Intelligence Artificielle chez Alteca.

Les images synthétiques nous envahissent

Les modèles génératifs d’images à partir du texte ont fait la une des journaux durant les 2 premiers trimestres de cette année 2022, et pour cause ! Toute personne, avec un peu d’imagination et sans connaissances en art, pouvait générer des œuvres d’art époustouflantes et en fantaisies photoréalistes.
Face à ces résultats, certaines entreprises n’ont pas hésité à intégrer ces modèles appelés « Text-to-Image » à leurs logiciels existant, faisant d’eux une fonctionnalité incontournable des logiciels de création et d’édition graphique.

Un individu a même gagné le premier prix d’art digital en participant avec une image générée par un modèle génératif d’image qu’il a nommé « Théâtre d’opéra Spatial ». Cela a suscité une vague d’indignation de la part de la communauté d’artistes, craignant que l’intelligence artificielle ne remplace les artistes.

Grâces à des interfaces simplistes et des APIs faciles d’utilisation, les modèles de génération d’image se sont démocratisés :

  • Le laboratoire de recherche en Intelligence Artificielle OpenAI a publié, en avril dernier, son modèle DALLE 2 en version Beta. Ce modèle est la version améliorée de son prédécesseur DALLE. Il contient un algorithme appelé « diffusion » capable de trouver des liaisons cachées entre les caractéristiques visuelles des images et le texte qui les décrit. De ce fait, DALLE 2 peut produire des images plus grandes et plus réalistes avec une très grande résolution.

  • Certains artistes ont saturé les réseaux sociaux avec des images produites par des modèles de génératifs. Des sites web dits « MarketPlace » ont même vu le jour, où l’on pouvait vendre les images générées et même le texte à utiliser (prompt) pour générer une image spécifique. Les prix sont aux alentours de 3 USD par input.

  • Getty Images et Shutterstock, ainsi qu’Adobe, ont intégré des modèles de génération d’images dans leurs propres produits et services.

  • Le laboratoire MidJourney a publié en juillet dernier sa version bêta de son modèle génératif, similaire à celui d’OpenAI « DALLE 2 » et « Stable Diffusion »

Notre avis : Les résultats époustouflants montrés par les différents modèles de génération d’image déployés cette année ne représentent pas une nouveauté, certains de ces modèles ont été développés en 2015, comme le modèle à base de diffusion. Par ailleurs, vu que ces modèles s’entraînent sur un volume très grand de données issues d’internet, ils sont sensibles aux biais. Certains artistes ont boycotté les modèles de génération d’image car ils se sentaient menacés par le progrès de l’Intelligence Artificielle.
Il est important de développer des modèles capables de filtrer les images générés par une IA de celles réalisées par des artistes.

La génération d’image n’est que le début, nous aurons probablement l’occasion de voir, en 2023, des modèles de génération de vidéo « text-to-video » ou encore des modèles de génération d’objets 3D « text-to-3D-object ».