Whisk, l’ultimo esperimento di Google Labs e Google DeepMind, permette di inserire o creare immagini che rappresentano un soggetto, la scena in cui è presente e lo stile desiderati.
Come funziona Whisk di Google
Gli output inviati alla piattaforma possono essere poi combinati e remixati per creare qualcosa di unico come per esempio un peluche digitale, una spilla smaltata o un adesivo.
Whisk combina il più recente modello Imagen 3 con le capacità di comprensione e descrizione visiva di Gemini. Quest’ultimo scrive automaticamente una didascalia dettagliata delle immagini e la invia a Imagen 3. Tale processo consente poi di remixare facilmente soggetti, scene e stili in modi molto diversi tra loro.
Veo 2 per la generazione video
Oltre a Whisk Google ha annunciato Veo 2, la nuova versione del suo modello di generazione video basato sull’intelligenza artificiale che offre una comprensione avanzata della fisica del mondo reale, delle sfumature dei movimenti e delle espressioni umane. Vengono così accentuati il realismo e i dettagli dei video generati.
Una delle principali innovazioni di Veo 2 è la sua capacità di interpretare prompt che specificano generi, obiettivi e effetti cinematografici. Ad esempio, è possibile richiedere:
- una ripresa a bassa angolazione che attraversa una scena
- un primo piano su un volto
- un’inquadratura con un particolare obiettivo per ottenere un effetto grandangolare
- una profondità di campo ridotta per sfocare lo sfondo e mettere a fuoco un soggetto
Queste funzionalità permettono di creare video con una varietà di stili e tecniche cinematografiche. Inoltre Veo 2 riduce gli errori di generazione e integra SynthID, una filigrana invisibile che garantisce l’autenticità dei contenuti prodotti.
Attualmente, Veo 2 è disponibile su VideoFX, all’interno di Google Labs, con gli utenti che possono accedervi tramite una lista d’attesa. Google prevede di estendere l’accesso a Veo 2 su YouTube Shorts e altre piattaforme nel corso del prossimo anno.