Chèvre Simulateur 3 est un jeu vidéo surréaliste dans lequel les joueurs emmènent des ongulés domestiques dans une série d'aventures invraisemblables, impliquant parfois des jetpacks.
Cela peut sembler un lieu improbable pour le prochain grand pas en avant intelligence artificiellemais Google DeepMind a dévoilé aujourd'hui un programme d'IA capable d'apprendre à accomplir des tâches dans un certain nombre de jeux, notamment Chèvre Simulateur 3.
Le plus impressionnant est que lorsque le programme rencontre un jeu pour la première fois, il peut effectuer des tâches de manière fiable en adaptant ce qu'il a appris en jouant à d'autres jeux. Le programme s'appelle SIMA, pour Scalable Instructable Multiworld Agent, et s'appuie sur les récentes avancées de l'IA qui ont permis à de grands modèles de langage de produire des chabots remarquablement performants comme ChatGPT.
« SIMA est plus grand que la somme de ses parties », déclare Frédéric Besse, ingénieur de recherche chez Google DeepMind qui a participé au projet. « Il est capable de tirer parti des concepts partagés dans le jeu, d'acquérir de meilleures compétences et d'apprendre à mieux exécuter les instructions. »
Comme Google, OpenAIet d’autres se bousculent pour prendre l’avantage en s’appuyant sur le récent boom de l’IA générative, élargissant le type de données à partir desquelles les algorithmes peuvent apprendre, offrant ainsi une voie vers des capacités plus puissantes.
Le dernier projet de jeu vidéo de DeepMind suggère comment les systèmes d'IA comme ChatGPT d'OpenAI et Gemini de Google pourraient bientôt faire plus que simplement discuter et générer des images ou des vidéos, en prenant le contrôle des ordinateurs et en exécutant des commandes complexes. C'est un rêve poursuivi à la fois par les passionnés indépendants d'IA et par les grandes entreprises, dont Google DeepMind, dont le PDG, Demis Hassabis, a récemment déclaré à WIRED « investit massivement dans cette direction ».
Une nouvelle façon de jouer
SIMA montre DeepMind apportant une nouvelle tournure aux agents de jeu, une technologie d'IA dont la société a été pionnière dans le passé.
En 2013, avant le rachat de DeepMind par Google, la startup londonienne a montré comment une technique appelé apprentissage par renforcementqui implique la formation d'un algorithme avec des retours positifs et négatifs sur ses performances, pourrait aider les ordinateurs à jouer au classique Jeux vidéo Atari. En 2016, au sein de Google, DeepMind a développé AlphaGoun programme qui a utilisé la même approche pour vaincre un champion du monde de Goun jeu de société ancien qui nécessite une habileté subtile et instinctive.
Pour le projet SIMA, l'équipe Google DeepMind a collaboré avec plusieurs studios de jeux pour collecter des données sur le clavier et la souris d'humains jouant à 10 jeux différents avec des environnements 3D, notamment Le ciel de No Man, Démolir, Hydroneeret Satisfaisant. DeepMind a ensuite ajouté des étiquettes descriptives à ces données pour associer les clics et les pressions aux actions entreprises par les utilisateurs, par exemple s'il s'agissait d'une chèvre à la recherche de son jetpack ou d'un personnage humain cherchant de l'or.