Les modèles génératifs d’images à partir du texte ont fait la une des journaux durant les 2 premiers trimestres de cette année 2022, et pour cause ! Toute personne, avec un peu d’imagination et sans connaissances en art, pouvait générer des œuvres d’art époustouflantes et en fantaisies photoréalistes.
Face à ces résultats, certaines entreprises n’ont pas hésité à intégrer ces modèles appelés « Text-to-Image » à leurs logiciels existant, faisant d’eux une fonctionnalité incontournable des logiciels de création et d’édition graphique.
Un individu a même gagné le premier prix d’art digital en participant avec une image générée par un modèle génératif d’image qu’il a nommé « Théâtre d’opéra Spatial ». Cela a suscité une vague d’indignation de la part de la communauté d’artistes, craignant que l’intelligence artificielle ne remplace les artistes.
Grâces à des interfaces simplistes et des APIs faciles d’utilisation, les modèles de génération d’image se sont démocratisés :
Notre avis : Les résultats époustouflants montrés par les différents modèles de génération d’image déployés cette année ne représentent pas une nouveauté, certains de ces modèles ont été développés en 2015, comme le modèle à base de diffusion. Par ailleurs, vu que ces modèles s’entraînent sur un volume très grand de données issues d’internet, ils sont sensibles aux biais. Certains artistes ont boycotté les modèles de génération d’image car ils se sentaient menacés par le progrès de l’Intelligence Artificielle.
Il est important de développer des modèles capables de filtrer les images générés par une IA de celles réalisées par des artistes.
La génération d’image n’est que le début, nous aurons probablement l’occasion de voir, en 2023, des modèles de génération de vidéo “text-to-video” ou encore des modèles de génération d’objets 3D “text-to-3D-object”.