Un véritable génie, comme son nom l'indique, la toute nouvelle IA de Google baptisée Genie a la capacité de créer un jeu de plateforme 2D à partir d'une simple image. Les IA génératives n'ont pas arrêté d'évoluer depuis l'évènement de ChatGPT en 2022.
Aujourd'hui encore, les géants de l'intelligence artificielle continuent à nous surprendre. récemment Google DeepMind a annoncé un nouveau modèle d'IA générative qui suscite un débat auprès des développeurs de jeux vidéo. Genie, d'après Google, est en mesure de créer des jeux entièrement jouables à partir d'une seule image.
Le génie de Google pourrait devenir le modèle de base pour les futurs agents d'IA
Pour son apprentissage, Genie a dû accéder aux données de vidéos du web disponibles au grand public. À partir de là, elle peut transformer n'importe quel type d'image en un jeu de plateforme 2D qui reste encore assez simpliste.
Le résultat fourni est assez bluffant. Quel que soit l'invite d'image utilisée, qu'il s'agisse d'une peinture, d'une simple photographie ou d'un croquisle modèle Genie de Google le transforme avec une polyvalence inégalée.
Du côté des développeurs, Genie représente la nouvelle génération de modèles pouvant servir à la formation d'agents d'IA. Les équipes de Google DeepMind responsables du développement de Genie affirment d'ailleurs qu'il pourrait s'agir d'un modèle de base pour l'apprentissage des modèles à venir. « Génie repose sur des paramètres 11B et inclut un modèle de dynamique autorégressifun tokeniseur vidéo spatio-temporel, ainsi qu'un modèle d'action latente simple et évolutif », ont-elles ajouté.
Performant, oui ! Mais à quel prix ?
Genie est une solution innovante qui donne aux utilisateurs la possibilité d'interagir avec des environnements générés image par image. Et le plus grand avantage de ce modèle, c'est qu'il n'a pas besoin d'étiquetage fastidieux des actions durant la phase d'entraînement. Contrairement aux approches traditionnelles dans le domaine des modèles de monde qui nécessitent généralement l'incorporation de connaissances spécifiques au domaine applicatif, Génie parvient à apprendre des espaces d'actions latentes de manière entièrement auto-supervisée.
Cette approche ouvre la voie au développement d'agents dotés de capacités d'adaptation et d'apprentissage généralistes. En effet, l'espace d'actions latentes appris par Genie permet à des agents entraînés sur des environnements simulés de reproduction des comportements complets à partir de vidéos jamais vues auparavant.
Si Google reste optimiste quant aux capacités de génération de Genie, rien ne prouve que ce modèle ne va pas reproduire le travail des développeurs. Comme le cas des ses précédents, dont ChatGPT qui a fait l'objet d'une poursuite en justice par New York Times au mois de décembre dernier.
Notre blog est alimenté par les lecteurs. Lorsque vous achetez via des liens sur notre site, nous pouvons percevoir une commission d'affiliation.