Billet IA #4 : l'Intelligence Artificielle, de la théorie à la pratique.

Dans ce quatrième épisode de nos billets IA, Yasser, doctorant en IA chez Alteca, revient sur l’importance d’acquérir une expérience pratique pour mettre en œuvre ses projets IA. De la théorie à la pratique, il semble n’y avoir qu’un pas et pourtant, il est nécessaire de réaliser un projet dans sa globalité pour comprendre les étapes de construction et de mise en production. Dans cet article, Yasser nous donne justement les étapes à suivre.

Les cours peuvent vous enseigner les tenants et les aboutissants de l’apprentissage automatique et profond, mais ils ne peuvent pas vous préparer entièrement à mettre votre travail en production. Pour acquérir l’expérience dont vous avez besoin, vous devez concevoir vos propres projets en partant de zéro.

Travailler sur des exemples et participer à des challenges peut briser la glace, mais ces approches offrent souvent une voie claire vers un objectif bien défini. Lorsque vous livrez un modèle d’apprentissage automatique à des utilisateurs réels, la tâche et les mesures de performance sont souvent flous. C’est à vous de trouver ce dont votre client a besoin, de le traduire en un problème et de construire un système qui le résout. Voici les étapes de base :

Identifiez un projet.

Trouvez une petite tâche à réaliser et déterminez ses inputs et outputs. Mettez-vous dans la peau d’un client pour ne pas tomber dans les exemples rencontrés lors de la montée en compétence. Par exemple, classer des images de chats et de chiens est simpliste et peu original, alors essayez quelque chose comme mesurer la différence de temps de passage à l’écran entre les acteurs masculins et féminins dans les films.

Obtenez les données.

Trouvez un ensemble de données correspondant à la tâche, ou construisez-le vous-même à l’aide d’outils de web scrapping. Il est essentiel de rassembler des données qui correspondent au problème. Ne modifiez pas le problème pour l’adapter à un ensemble de données disponible.

Pré-traitez les données.

Les données seront désordonnées, et votre travail consiste à les nettoyer et à les pré-traiter – aucun raccourci n’est autorisé. Recherchez les points faibles (labels incorrects, classes déséquilibrées, images de mauvaise qualité, etc.) et réfléchissez aux moyens de corriger ou d’augmenter les données pour y remédier. Pouvez-vous retourner les images ? Étirer des clips audio ? Quel impact cela aurait-il sur les labels ?

Fixez un objectif clair.

Comment saurez-vous que vous avez résolu le problème ? Personne ne vous dira quel objectif optimiser, vous devrez donc le déterminer par vous-même. Peut-être s’agit-il de la précision ou d’une simple erreur quadratique moyenne, mais peut-être votre use case exige-t-il d’éviter à tout prix les faux positifs ou de donner la priorité à la précision pour certains groupes d’exemples (comme le rendu plus précis du maquillage simulé sur les visages féminins).

Passez en revue la littérature.

Comment d’autres équipes ont-elles résolu des problèmes similaires ? Recherchez les publications pertinentes sur arxiv.org ou paperswithcode.com. Pouvez-vous affiner un modèle pré-entraîné existant ou devez-vous en construire un à partir de zéro ? (Si vous le pouvez, essayez les deux et voyez lequel fonctionne le mieux. C’est le meilleur moyen d’éviter de réinventer la roue).

Mettez en œuvre la solution.

Une fois le modèle entraîné, assurez-vous que votre mise en œuvre répond aux exigences des utilisateurs finaux. S’ils veulent une application mobile, vérifiez que votre modèle est suffisamment petit pour tenir sur un smartphone. S’il doit fonctionner en temps réel, déterminez les exigences en matière de latence. Identifiez les compromis que vous devriez faire pour atteindre l’objectif et l’impact qu’ils auraient sur la qualité de l’output de votre modèle. Dans la réalité, l’étape finale de la production peut nécessiter des mois de mise au point.

Partagez votre travail.

Mettez votre code sur GitHub pour montrer à vos collègues, à vos collaborateurs potentiels la qualité de votre travail. Rédigez un article de blog qui décrit votre projet du début à la fin. Détaillez votre processus de réflexion, les obstacles que vous avez rencontrés et la façon dont vous les avez surmontés.

Suivez ces étapes et, à la fin de votre premier projet, vous aurez acquis une expérience unique en mettant à profit vos connaissances en apprentissage automatique. À la fin de votre cinquième projet, vous serez sur la bonne voie pour acquérir un niveau d’expertise professionnel.

Sources : https://read.deeplearning.ai/the-batch/issue-128/