Google DeepMind dévoile le modèle d'IA Genie 2 qui crée des mondes 3D jouables - All Things Windows (2025)

DeepMind, la branche de recherche sur l’IA de Google, a présenté Genie2, un modèle avancé capable de générer des environnements3D interactifs. Contrairement à son prédécesseur, qui se limitait à des sorties bidimensionnelles, Genie 2 propose des espaces virtuels dynamiques qui réagissent aux entrées de l’utilisateur en temps réel.

Il s’agit d’une étape importante dans l’évolution de la recherche et de la formation en IA, offrant des opportunités sans précédent pour la conception créative et le développement de systèmes d’IA généralistes.

Une nouvelle frontière dans les environnements interactifs

Genie 2 fonctionne comme un modèle de diffusion latente, construisant simulations image par image basées sur un une seule image ou une invite de texte. Les utilisateurs peuvent décrire un scénario avec des mots ou sélectionner une image générée par le modèle Imagen 3 de DeepMind pour créer des espaces entièrement interactifs.

Google DeepMind dévoile le modèle d'IA Genie 2 qui crée des mondes 3D jouables - All Things Windows (1)

Le système prend en charge plusieurs perspectives, notamment à la première personne, à la troisième personne et vues isométriques, permettant diverses applications dans la recherche en IA et les flux de travail créatifs.

DeepMind décrit Genie 2 comme permettant aux utilisateurs de « décrire un monde qu’ils veulent dans le texte, de sélectionner leur rendu préféré de cette idée, puis d’entrer et de interagir avec ce monde nouvellement créé.”

Cette capacité comble le fossé entre l’art conceptuel et les environnements fonctionnels, ce qui en fait un outil précieux pour les concepteurs et les chercheurs.

Capacités et Limites

L’une des principales avancées de Genie 2 est sa capacité à conserver la mémoire des éléments hors écran, permettant une reconstruction cohérente lorsque ces éléments réapparaissent dans la vue de l’utilisateur. Cette capacité le distingue des modèles comme Decart’s Oasis, qui a du mal avec la mémoire spatiale. et perd fréquemment la trace de la disposition des scènes lors des simulations en temps réel.

Cependant, Genie 2 a ses limites. La plupart des simulations durent entre 10 et 20 secondes avant que des artefacts visuels et une qualité d’image dégradée n’apparaissent. Bien que le modèle puisse maintenir des environnements visuellement cohérents pendant une minute maximum, DeepMind reconnaît que des durées prolongées restent un défi technique.

Les recherches de l’entreprise soulignent l’importance du développement continu. Google affirme que ses recherches démontrent le potentiel de Genie2 pour former des agents dans des environnements qu’ils n’ont jamais vus, accélérant ainsi les progrès vers l’IA générale, soulignant le rôle du modèle dans la création de scénarios variés qui testent l’adaptabilité de l’IA.

Transformer l’IA. Formation et prototypage créatif

Les principales applications de Genie 2 résident dans la recherche et la conception créative. Pour les chercheurs, il offre une plateforme permettant d’évaluer les agents d’IA dans des environnements inconnus, une étape cruciale vers le développement de systèmes capables de relever divers défis du monde réel.

Le modèle est également prometteur pour les industries créatives. Les artistes conceptuels et les concepteurs peuvent utiliser Genie 2 pour prototyper rapidement des environnements interactifs, transformant des croquis ou des descriptions en espaces 3D fonctionnels. DeepMind a présenté des exemples de modèles simulant divers environnements, depuis un robot humanoïde explorant une forêt jusqu’à un avatar futuriste naviguant dans un loft urbain.

Ce double utilitaire positionne Genie 2 à la fois comme un outil de recherche et un catalyseur d’innovation dans des flux de travail créatifs, permettant une expérimentation et une itération rapides.

Défis éthiques et techniques

Bien que DeepMind affirme son adhésion aux normes éthiques, le manque de transparence met en évidence tensions permanentes entre l’innovation et les pratiques responsables de l’IA.

Techniquement, le modèle s’appuie sur des processus de diffusion latente autorégressive, générant des cadres séquentiellement basés sur des actions antérieures et des représentations latentes. Cette approche permet des simulations dynamiques en temps réel, mais pose des défis pour maintenir la fidélité et la cohérence sur des durées plus longues.

Intégration avec les systèmes d’IA

En générant des agents d’environnements que nous n’avons jamais rencontré auparavant, Genie 2 repousse les limites de l’évaluation de l’IA.Cette capacité à créer de nouveaux scénarios soutient le développement de systèmes d’IA plus adaptables et plus polyvalents.

Orientations futures et implications plus larges

Alors que Genie 2 représente une avancée significative , des défis subsistent pour étendre les capacités du modèle. DeepMind continue d’affiner ses systèmes de mémoire et d’améliorer la fidélité des simulations de longue durée. Les récentes embauches dans des organisations comme OpenAI et Meta témoignent de l’engagement de l’entreprise à faire progresser les technologies mondiales générées par l’IA.

Les applications potentielles de Genie 2 s’étendent bien au-delà de la recherche et de la conception. Des jeux à la réalité virtuelle en passant par l’urbanisme et les systèmes autonomes, la capacité du modèle à générer des environnements réalistes et interactifs a de vastes implications.

Google DeepMind dévoile le modèle d'IA Genie 2 qui crée des mondes 3D jouables - All Things Windows (2025)
Top Articles
Latest Posts
Recommended Articles
Article information

Author: Velia Krajcik

Last Updated:

Views: 5838

Rating: 4.3 / 5 (74 voted)

Reviews: 89% of readers found this page helpful

Author information

Name: Velia Krajcik

Birthday: 1996-07-27

Address: 520 Balistreri Mount, South Armand, OR 60528

Phone: +466880739437

Job: Future Retail Associate

Hobby: Polo, Scouting, Worldbuilding, Cosplaying, Photography, Rowing, Nordic skating

Introduction: My name is Velia Krajcik, I am a handsome, clean, lucky, gleaming, magnificent, proud, glorious person who loves writing and wants to share my knowledge and understanding with you.