Google DeepMind ha annunciato la formazione di un nuovo team dedicato allo sviluppo di “world models“. Modelli di intelligenza artificiale capaci di simulare ambienti fisici complessi. Questa iniziativa, guidata da Tim Brooks, ex co-responsabile del progetto Sora di OpenAI, mira a creare LLM in grado di replicare le dinamiche del mondo reale.
Cosa sono i world models di Google
I world models rappresentano un’evoluzione nel campo dell’AI, con applicazioni che spaziano dalla creazione di ambienti interattivi per videogiochi e film fino alla realizzazione di scenari realistici per l’addestramento di robot e sistemi di intelligenza artificiale. Nelle intenzioni di Google essi consentiranno di simulare mondi , inclusi gli effetti delle azioni umane come saltare o nuotare, offrendo un contesto per l’apprendimento e la valutazione di agenti AI.
L’iniziativa punta a raggiungere più facilmente un’intelligenza artificiale generale, cioè un sistema capace di svolgere qualsiasi compito intellettuale. Stando alle posizioni aperte per il nuovo team, l’azienda ritiene che l’espansione dell’addestramento su dati video e multimodali sia infatti cruciale per conseguire un’AGI.
I world models alimenteranno numerosi domini per il ragionamento visivo, la simulazione, la pianificazione per gli agenti AI e l’intrattenimento interattivo in tempo reale.
Gemini, Veo e Genie per i mondi virtuali
Il nuovo team collaborerà con alcuni progetti preesistenti di Google AI, tra cui i modelli della famiglia Gemini, il generatore video Veo e Genie, un modello di simulazione di ambienti 3D giocabili in tempo reale. L’obbiettivo è quindi quello di confrontarsi con concorrenti come la piattaforma Cosmos di Nvidia e World Labs.
Simulando le dinamiche del mondo reale, questi modelli offriranno un “sandbox” virtuale con cui testare la capacità delle AI di adattarsi e rispondere a scenari reali.