Bilan IA 2022 Partie 2 : L’Intelligence Artificielle au service des développeurs

Dans la première partie de notre bilan 2022 sur l’IA, Yasser, doctorant en Intelligence Artificielle chez Alteca soulignait une année fructueuse et loin d’un « hiver de l’IA » grâce, entre autres, au déploiement de nombreux outils. Après un premier zoom sur la génération d’images synthétiques « Text-to-image », il nous présente une autre facette de l’IA comme outil incontournable pour les développeurs !

L’IA, un nouvel outil de développement

Vous ne voulez pas coder des fonctions, tests unitaires triviaux pour votre projet ? Pas de problème, une solution à base d’Intelligence Artificielle existe.

Des modèles de langage, entraînés sur des données volumineuses constituées majoritairement de code informatique, ont démontré leur capacité à générer du code rivalisant avec des développeurs expérimentés : respectant les bonnes pratiques tout en minimisant les bugs. Toutefois, les résultats ne sont pas toujours fiables.

  • Ebay a commencé l’année en fournissant aux non-développeurs des outils de haut niveau qui leur ont permis de construire et de déployer des modèles sans connaissance préalable de l’IA.

  • DeepMind a présenté AlphaCode en février, un modèle pré-entraîné sur 86 millions de programmes dans 12 langages de programmation différents et amélioré sur des challenges de compétitions de coding. Contrairement à ses prédécesseurs, ce modèle utilise une approche d’apprentissage plutôt naïve. En se basant principalement sur les données d’entraînement, AlphaCode s’améliore en apprenant les patterns et relations qu’il découvre à partir des données. En résolvant 30% des challenges d’une compétition de coding, AlphaCode a ainsi dépassé plus de la moitié des développeurs présents lors de cette compétition.

  • GitHub a lancé son modèle de génération de code à partir de commentaires descriptifs, nommé Copilot. Ce dernier se base sur le modèle CODEX du laboratoire d’OpenAI. Copilot a été entraîné sur la majorité des langages de programmations présents dans les millions de répertoires publiques de la plateforme mère GitHub. L’instabilité de ses résultats pour certains langages de programmation dépend principalement du volume et de la variété des données d’entraînement pour ce langage en particulier. Les utilisateurs doivent payer un abonnement, mais les étudiants et les développeurs open-source vérifiés en sont exemptés.

Les versions largement disponibles de cette technologie ne sont pas en mesure d’écrire des programmes complexes à l’heure actuelle. Souvent, leurs résultats semblent corrects à première vue, mais se révèlent défectueux. En outre, leur statut juridique peut être mis en péril.