Google ha ufficializzato il lancio di Gemini 2.0, il suo modello di intelligenza artificiale generativa più avanzato e pensato per inaugurare l’era degli Agenti AI. Questo nuovo LLM rappresenta un’evoluzione delle versioni precedenti grazie a funzionalità multimodali e capacità “agenziali” che consentono un’interazione più profonda con altre piattaforme.
Caratteristiche di Gemini 2.0
Gemini 2.0 introduce il supporto per la multimodalità nativa, ciò permette al modello di elaborare e generare contenuti tramite testo, immagini, video e audio. In questo modo si ha una comprensione più completa delle richieste degli utenti e una risposta più precisa.
Il modello è poi in grado di produrre nativamente immagini e audio, questo con l’obbiettivo di migliorare ulteriormente la qualità delle interazioni e l’esperienza utente. L’accesso alle informazioni viene reso ancora più semplice con lo scopo di rendere Gemini 2.0 un supporto per qualsiasi attività quotidiana o di lavoro.
I nuovi agenti AI di Google
Tra i progetti sperimentali basati su Gemini 2.0 troviamo Project Astra, un assistente AI universale che si adatta a diversi contesti e combina strumenti come Google Lens e Google Maps per fornire supporto nelle attività quotidiane. Potrebbe rivelarsi particolarmente adatto per la gestione di conversazioni in lingue differenti.
Un altro agente, chiamato Project Mariner, è un prototipo per il browser Chrome che aiuta gli utenti a interagire con pagine web anche molto complesse. È infatti in grado di automatizzare task come quelli che prevedono la compilazione di moduli online e l’analisi di grafici.
Infine, Jules è un assistente dedicato agli sviluppatori che analizza problemi, propone soluzioni e scrive codice in base alle specifiche che gli vengono fornite, In questo modo si possono accelerare notevolmente i processi di sviluppo delle applicazioni.
Come sottolineato dalla compagnia in un suo comunicato in merito al lancio, con Gemini 2.0 Google si propone di inaugurare un’era in cui l’intelligenza artificiale non si limita a rispondere alle domande ma anticipa le esigenze degli utenti e agisce proattivamente. Sempre e comunque sotto la supervisione umana.