En tant que personne qui aime beaucoup le zen du rangement, j'étais très heureux de prendre une pelle à poussière et une brosse et de balayer quelques grains renversés sur une table lors d'une visite au laboratoire de recherche Toyota à Cambridge, dans le Massachusetts, l'année dernière. La corvée était plus difficile que d'habitude car je devais l'effectuer à l'aide d'une paire de robotique bras avec pinces à deux doigts pour les mains.
Alors que j'étais assis devant la table, utilisant une paire de contrôleurs comme des poignées de vélo avec des boutons et des leviers supplémentaires, je pouvais ressentir la sensation de saisir des objets solides, ainsi que leur poids lorsque je les soulevais, mais il m'a fallu encore un certain temps pour m'y habituer.
Après plusieurs minutes de rangement, j'ai continué ma visite du laboratoire et j'ai oublié mon bref passage en tant que professeur de robots. Quelques jours plus tard, Toyota m'a envoyé une vidéo du robot que j'avais utilisé balayant seul un désordre similaire, en utilisant ce qu'il avait appris de mes démonstrations combiné avec quelques démonstrations supplémentaires et plusieurs heures de pratique supplémentaires pour balayer l'intérieur d'un véhicule simulé. monde.
La plupart des robots, et en particulier ceux qui effectuent un travail précieux dans les entrepôts ou les usines, ne peuvent suivre que des routines préprogrammées qui nécessitent une expertise technique pour être planifiées. Cela les rend très précis et fiables, mais totalement inadaptés aux travaux qui nécessitent adaptation, improvisation et flexibilité, comme le balayage ou la plupart des autres tâches ménagères. Faire apprendre aux robots à faire les choses par eux-mêmes s'est avéré un défi en raison de la complexité et de la variabilité du monde physique et des environnements humains, ainsi que de la difficulté d'obtenir suffisamment de données d'entraînement pour leur apprendre à faire face à toutes les éventualités.
Certains signes indiquent que cela pourrait changer. Les améliorations spectaculaires que nous avons constatées dans les chatbots IA au cours de la dernière année ont incité de nombreux roboticiens à se demander si des progrès similaires pourraient être réalisés dans leur propre domaine. Les algorithmes qui nous ont donné d’impressionnants chatbots et générateurs d’images aident également déjà les robots à apprendre plus efficacement.
Le robot de balayage que j'ai formé utilise un système d'apprentissage automatique appelé politique de diffusion, similaire à ceux que alimenter certains générateurs d'images IA, pour déterminer la bonne action à entreprendre en une fraction de seconde, en fonction des nombreuses possibilités et des multiples sources de données. La technique était développé par Toyota en collaboration avec des chercheurs dirigés par Chanson de Shuranprofesseur à l'Université de Columbia qui dirige désormais un laboratoire de robotique à Stanford.
Toyota essaie de combiner cette approche avec le type de modèles linguistiques qui sous-tendent ChatGPT et ses concurrents. L’objectif est de permettre aux robots d’apprendre à effectuer des tâches en regardant des vidéos, transformant potentiellement des ressources comme YouTube en puissantes ressources de formation de robots. Vraisemblablement, on leur montrera des clips de personnes faisant des choses raisonnables, et non les cascades douteuses ou dangereuses que l’on trouve souvent sur les réseaux sociaux.
« Si vous n'avez jamais touché à quoi que ce soit dans le monde réel, il est difficile de comprendre cela en regardant simplement des vidéos YouTube », explique Russ Tedrake, vice-président de la recherche en robotique au Toyota Research Institute et professeur au MIT. L'espoir, dit Tedrake, est qu'une compréhension de base du monde physique, combinée aux données générées par simulation, permettra aux robots d'apprendre des actions physiques en regardant des clips YouTube. L’approche de diffusion « est capable d’absorber les données de manière beaucoup plus évolutive », dit-il.