En tant qu'étudiants du Media Lab en 2010, Karthik Dinakar SM '12, PhD '17 et Birago Jones SM '12 se sont associés pour un projet de classe visant à créer un outil qui aiderait les équipes de modération de contenu d'entreprises comme Twitter (maintenant X) et YouTube. Le projet a suscité énormément d’enthousiasme et les chercheurs ont été invités à faire une démonstration lors d’un sommet sur la cyberintimidation à la Maison Blanche – il leur suffisait de faire fonctionner le projet.
La veille de l'événement à la Maison Blanche, Dinakar a passé des heures à essayer de mettre en place une démo fonctionnelle permettant d'identifier les publications préoccupantes sur Twitter. Vers 23 heures, il a appelé Jones pour lui dire qu'il abandonnait.
Jones a alors décidé d’examiner les données. Il s'est avéré que le modèle de Dinakar signalait les bons types de messages, mais les affiches utilisaient des termes d'argot adolescent et d'autres termes indirects que Dinakar n'avait pas compris. Le problème n'était pas le modèle ; c'était la déconnexion entre Dinakar et les adolescents qu'il essayait d'aider.
« Nous avons alors réalisé, juste avant d'arriver à la Maison Blanche, que les personnes qui construisent ces modèles ne devraient pas être de simples ingénieurs en apprentissage automatique », explique Dinakar. «Ils devraient être les personnes qui comprennent le mieux leurs données.»
Cette idée a conduit les chercheurs à développer des outils pointer-cliquer qui permettent à des non-experts de créer des modèles d’apprentissage automatique. Ces outils sont devenus la base de Pienso, qui aide aujourd'hui les gens à créer de grands modèles linguistiques pour détecter la désinformation, le trafic d'êtres humains, les ventes d'armes, etc., sans écrire de code.
« Ce type d'applications est important pour nous, car nos racines remontent à la cyberintimidation et à la compréhension de la manière d'utiliser l'IA pour des choses qui aident réellement l'humanité », explique Jones.
Quant à la première version du système présentée à la Maison Blanche, les fondateurs ont fini par collaborer avec des étudiants des écoles voisines de Cambridge, dans le Massachusetts, pour leur permettre de former les modèles.
« Les modèles que ces enfants ont formés étaient bien meilleurs et nuancés que tout ce que j'aurais pu imaginer », explique Dinakar. « Birago et moi avons eu ce grand 'Aha !' moment où nous avons réalisé que responsabiliser les experts du domaine – ce qui est différent de démocratiser l’IA – était la meilleure voie à suivre.
Un projet qui a du sens
Jones et Dinakar se sont rencontrés alors qu'ils étaient étudiants diplômés dans le groupe de recherche sur les agents logiciels du MIT Media Lab. Leur travail sur ce qui est devenu Pienso a commencé dans le cours 6.864 (Traitement du langage naturel) et s'est poursuivi jusqu'à ce qu'ils obtiennent leur maîtrise en 2012.
Il s'est avéré que 2010 n'était pas la dernière fois que les fondateurs étaient invités à la Maison Blanche pour faire une démonstration de leur projet. Le travail a généré beaucoup d'enthousiasme, mais les fondateurs ont travaillé sur Pienso à temps partiel jusqu'en 2016, lorsque Dinakar a terminé son doctorat au MIT et que l'apprentissage profond a commencé à exploser en popularité.
« Nous sommes toujours en contact avec de nombreuses personnes sur le campus », explique Dinakar. « L'exposition que nous avons eue au MIT, la fusion des interfaces humaines et informatiques, a élargi notre compréhension. Notre philosophie chez Pienso ne pourrait être possible sans le dynamisme du campus du MIT.
Les fondateurs remercient également le programme de liaison industrielle (ILP) et le Startup Accelerator (STEX) du MIT de les avoir mis en relation avec les premiers partenaires.
L'un des premiers partenaires était SkyUK. L'équipe de réussite client de l'entreprise a utilisé Pienso pour créer des modèles permettant de comprendre les problèmes les plus courants de ses clients. Aujourd'hui, ces modèles permettent de traiter un demi-million d'appels de clients par jour, et les fondateurs affirment avoir permis à l'entreprise d'économiser plus de 7 millions de livres sterling en raccourcissant la durée des appels vers le centre d'appels de l'entreprise.
« La différence entre démocratiser l’IA et responsabiliser les gens grâce à l’IA dépend de qui comprend le mieux les données : vous, un médecin, un journaliste ou quelqu’un qui travaille quotidiennement avec des clients ? » dit Jones. « Ce sont ces personnes qui devraient créer les modèles. C'est ainsi que vous obtenez des informations exploitables à partir de vos données.
En 2020, alors que l’épidémie de Covid-19 commençait aux États-Unis, des responsables gouvernementaux ont contacté les fondateurs pour qu’ils utilisent leur outil afin de mieux comprendre la maladie émergente. Pienso a aidé des experts en virologie et en maladies infectieuses à mettre en place des modèles d’apprentissage automatique pour extraire des milliers d’articles de recherche sur les coronavirus. Dinakar affirme avoir appris plus tard que ces travaux avaient aidé le gouvernement à identifier et à renforcer les chaînes d'approvisionnement critiques en médicaments, notamment le populaire antiviral remdesivir.
« Ces composés ont été découverts par une équipe qui ne connaissait pas l'apprentissage profond mais qui était capable d'utiliser notre plateforme », explique Dinakar.
Construire un meilleur avenir pour l’IA
Étant donné que Pienso peut fonctionner sur des serveurs internes et une infrastructure cloud, les fondateurs affirment qu'il offre une alternative aux entreprises obligées de donner leurs données en utilisant les services proposés par d'autres sociétés d'IA.
« L'interface Pienso est une série d'applications Web assemblées », explique Dinakar. « Vous pouvez le considérer comme un Adobe Photoshop pour les grands modèles de langage, mais sur le Web. Vous pouvez pointer et importer des données sans écrire de ligne de code. Vous pouvez affiner les données, les préparer pour l'apprentissage en profondeur, les analyser, leur donner une structure si elles ne sont pas étiquetées ou annotées, et vous pouvez repartir avec un grand modèle de langage affiné en 25 minutes.
Plus tôt cette année, Pienso a annoncé un partenariat avec GraphCore, qui fournit une plate-forme informatique plus rapide et plus efficace pour l'apprentissage automatique. Les fondateurs affirment que le partenariat réduira encore davantage les obstacles à l’exploitation de l’IA en réduisant considérablement la latence.
« Si vous créez une plate-forme d'IA interactive, les utilisateurs ne prendront pas une tasse de café à chaque fois qu'ils cliqueront sur un bouton », explique Dinakar. « Il faut qu'il soit rapide et réactif. »
Les fondateurs pensent que leur solution ouvre la voie à un avenir dans lequel des modèles d'IA plus efficaces seront développés pour des cas d'utilisation spécifiques par les personnes les plus familiarisées avec les problèmes qu'ils tentent de résoudre.
« Aucun modèle ne peut tout faire », déclare Dinakar. « L'application de chacun est différente, leurs besoins sont différents, leurs données sont différentes. Il est très peu probable qu’un seul modèle fasse tout à votre place. Il s'agit de rassembler un jardin de modèles et de leur permettre de collaborer les uns avec les autres et de les orchestrer d'une manière qui a du sens – et les personnes chargées de cette orchestration doivent être celles qui comprennent le mieux les données.