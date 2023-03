Les résultats offerts par l’intelligence artificielle -IA- sont impressionnants et beaucoup anticipent un bouleversement de l’internet actuel. Hugging Face est une société qui a été créée par trois Français et qui rivalise d’engagement vers des versions open-source des modèles qui utilisent L’IA. Une façon également d’éclairer le fonctionnement de ce formidable outil qu’est devenu l’IA. Visite dans leurs bureaux parisiens pour tenter de comprendre comment l’intelligence artificielle se fait.

Depuis l’arrivée de ChatGPT, l’intelligence artificielle n’a jamais paru autant à portée de dialogue et pourquoi pas de main. Alors que la compagnie OpenAI (à l’origine de ChatGPT et de l’exposition récente de l'Intelligence artificielle) s’est éloignée en 2019 de l’open source, c’est un virage différent qui a été pris par la société aux fondateurs français Hugging Face en 2016. Chez cette dernière, le code source peut être relu et amélioré par tout le monde (on dit alors qu’il est en open source).

Dans les bureaux parisiens de l'entreprise, Lucille Saulnier, ingénieure-chercheuse, et Giada Pistilli, éthicienne principale, nous expliquent : « On avance avec notre communauté (15 000 compagnies utilisatrices de leur service et 200 000 utilisateurs quotidiens), ensemble, on a des retours constants sur les résultats du machine learning. Pour les autres modèles (ChatGPT ou Midjourney par exemple), c’est toujours ennuyeux de ne pas savoir ce qui tourne derrière. »

Mais qu’est-ce qui fait tourner l'intelligence artificielle ? La question mérite d’être posée car le terme IA - intelligence artificielle- est trop souvent un mot valise sans réellement désigner ce qui est réalisé. Dans l’excellent cours en ligne Elements of AI, il est spécifié en introduction que « IA» n’est pas un nom comptable. » « L’IA est une discipline scientifique, comme les mathématiques ou la biologie. L’IA est donc une collection de concepts, de problèmes et de méthodes pour les résoudre. Il est ainsi plus juste de dire l’IA qu'une IA. »

Un atelier de bricolage dans la nouvelle dimension offerte par l’IA

Lucille Saulnier nous explique : « Il y a eu la publication en 2017 d’un papier très important : Attention is all you need : comprendre le traitement naturel du langage avec les modèles Transformers. » Elle sourit : « C’est très très technique, mais on peut dire qu’il a tout changé. »

Un modèle transformer est un modèle d'apprentissage profond. Les plus connus en IA, ceux auxquels on a été le plus souvent confronté, se développent autour du Natural Language Processing (NLP) -en français Traitement Automatique du Langage Naturel (TALN)- qu’on retrouve dans ChatGPT, Siri ou dans un correcteur orthographique. Lucille Saulnier : « Pour nous, l’idée est de garder le résultat de la recherche et qu’il serve pour les autres. Ce sont des fichiers très lourds et cela justifie le hub, la plateforme, gratuite et en open source. »

Giada Pistilli parle de librairie et l’image prend toute sa puissance suggestive. Ainsi sur le site est mis à disposition une banque de données dans laquelle les usagers peuvent puiser des solutions propres à l’IA, mais aussi comprendre comment ça tourne. (spoiler : ce sont des lignes et des lignes et des lignes et des lignes de code…) « Sur cette plateforme, on découvre des démonstrations des capacités de l’IA, dans la rubrique spaces » On y retrouve le désormais célèbre text to image (à la midJourney) mais aussi image to text, des démos genre ChatGPT… Ces déclinaisons semblent infinies comme un atelier de bricolage qui se déploie dans la nouvelle dimension offerte par l’IA pour résoudre tous types de problèmes, effectuer des tâches ou être créatif. On peut citer : DeepL , un puissant outil de traduction, mais aussi Grammarly un impressionnant assistant à l’écriture…

« Tout cela va très vite, commentent-elles en chœur. On est comme aux débuts d’internet, avec une volonté chez nous d’optimisation. C’est une mission noble pour un domaine vaste et puissant. » Le jeu d’échecs demeure un sport privilégié pour démontrer les prouesses de l’IA, Giadia souligne en souriant : « On veut ouvrir l’échiquier, pour permettre au plus grand monde de participer. » « On a comme partenaire entreprise AWS cloud (le service cloud d’Amazon), pour nos ressources calcul » souligne Lucile

Une équipe d’Hugging Face s’occupe de la plateforme. Giada, éthicienne principale, explique : « L'intelligence artificielle est à l’intersection politique / droit / éthique. À l’international, tout peut être différent, notamment en termes de copyrights. » Y aura-t-il un copyright sur le travail de la machine ? Ou le droit s’applique-t-il sur ce qui est offert à la machine (texte ou image) ? Cela demeure flou.

Faire tourner l’IA dans le bon sens, en tous les cas dans celui de sa requête

Car si le “comment ça tourne” se trouve dans les immenses fichiers farcis de lignes de codes consultables dans la librairie, pour obtenir le bon résultat, bien faire tourner l’IA, encore faut-il savoir s’adresser correctement à la machine. Alors que certains semblent toujours avoir du mal à formuler leurs requêtes pour le moteur de recherche Google, il faut se préparer à faire évoluer notre syntaxe pour parler à un modèle d’IA, poser les bonnes questions, entamer le bon dialogue, sinon rien de significatif ne sortira. C’est ce qu’on appelle le prompt engineering, et c’est en passe de devenir un nouveau métier. On peut traduire cette fonction comme ingénieur de requête ou ingénieur d'invite, et cela désigne ceux qui domptent les intelligences artificielles pour les amener à produire le résultat souhaité.

Le comédien Louis Jouvet expliquait qu’il n’y a pas de bon spectacle au théâtre sans un bon public. Cela s’applique totalement aux conversations avec les modèles utilisant l’IA. Riley Goodside, prompt ingénieur américain, explique que durant ses dialogues avec la machine : « Il explore le multivers des possibilités fictives, sculpte l'espace de ces possibilités et élimine tout sauf le texte qu’il souhaite », et de préciser : « cela peut être un exercice mental très difficile. »

Le nouveau casse-tête, la nouvelle mise en scène : faire tourner l’IA dans le bon sens, en tous les cas dans celui de sa requête. Explication sur ce "nouveau métier" dans un post détaillé de blog ici.

Entraîné dans le plus grand supercalculateur de France

Hugging Face regroupe plus de 150 employés: « Nous sommes 100% en télétravail, sans obligation de venir. » Des bureaux à Brest ou Lyon tout comme aux États-Unis, la plateforme propose également des cours en ligne de code, en plus de documentation sur l'IA dans leur librairie...

Le modèle BLOOM (BigScience Large Open-science Open-access Multilingual) est le dernier projet le plus impressionnant engagé par Hugging Face avec le soutien du CNRS, de la société civile GENCI (Grand équipement national de calcul intensif) et du ministère de l'Enseignement supérieur et de la Recherche. Bloom est un modèle d’intelligence artificielle, capable de comprendre n'importe quel texte, en 46 langues, et d'en restituer les informations principales. Le système a été entraîné dans le plus grand supercalculateur de France, sur le plateau de Saclay.

Les experts en IA parlent parfois de shoggoth pour les modèles transformers comme ChatGPT. Shoggoth comme les monstres imaginaires créés par l'écrivain américain H. P. Lovecraft. Pourtant, quand on navigue en open source on se dit qu’il n’y a pas de fantôme dans la machine, juste des lignes de code consultables à volonté. La part d’ombre est chez l’utilisateur avec ses fantômes personnels.

