Google DeepMind ha presentato Genie 2, un modello d’intelligenza artificiale di larga scala progettato per generare ambienti virtuali interattivi e controllabili. L’obbiettivo di questo progetto รจ quello di sviluppare un’AI in grado di comprendere e replicare le dinamiche complesse del nostro ambiente.
Le caratteristiche principali di Genie 2
Genie 2 รจ stato addestrato in modo non supervisionato utilizzando un’ampia selezione di video non etichettati provenienti da Internet. Questa metodologia consente al modello di generare una varietร infinita di mondi virtuali descritti attraverso testo, immagini sintetiche, fotografie e persino dei semplici schizzi.
Il modello permette inoltre di interagire con gli ambienti generati. Agisce infatti su una base frame-by-frame, senza la necessitร di etichette predefinite per le azioni che si devono compiere.
ร composto da tre elementi principali:
- la tokenizzatore video spaziotemporale che segmenta i filmati in unitร comprensibili per il modello.
- un modello dinamico autoregressivo che prevede le sequenze future basandosi sui dati precedenti.
- un modello d’azione latente scalabile che facilita l’interazione dell’utente con l’ambiente generato.
Questa architettura consente a Genie 2 di apprendere le dinamiche del mondo reale e di applicarle nella generazione di ambienti virtuali. L’ideale per offrire un’esperienza interattiva e immersiva.
Agenti AI che si muovono in mondi virtuali
Genie 2 ha la capacitร di facilitare l’addestramento di agenti AI per imitare comportamenti osservati in video non visti durante l’addestramento. Si possono cosรฌ implementare degli agenti generalisti in grado di operare in una varietร di ambienti e situazioni analizzate in fase di post-training.
La capacitร di creare ambienti interattivi e controllabili, basandosi su dati non supervisionati, offre nuove opportunitร per lo sviluppo di agenti AI adattabili. Google DeepMind punta quindi a costruire sistemi di intelligenza artificiale piรน generali a partire dall’esperienza di Gemini, dei veri e propri modelli generativi di mondi.