Whisk, l’ultimo esperimento di Google Labs e Google DeepMind, permette di inserire o creare immagini che rappresentano un soggetto, la scena in cui รจ presente e lo stile desiderati.
Come funziona Whisk di Google
Gli output inviati alla piattaforma possono essere poi combinati e remixati per creare qualcosa di unico come per esempio un peluche digitale, una spilla smaltata o un adesivo.
Whisk combina il piรน recente modello Imagen 3 con le capacitร di comprensione e descrizione visiva di Gemini. Quest’ultimo scrive automaticamente una didascalia dettagliata delle immagini e la invia a Imagen 3. Tale processo consente poi di remixare facilmente soggetti, scene e stili in modi molto diversi tra loro.
Veo 2 per la generazione video
Oltre a Whisk Google ha annunciato Veo 2, la nuova versione del suo modello di generazione video basato sull’intelligenza artificiale che offre una comprensione avanzata della fisica del mondo reale, delle sfumature dei movimenti e delle espressioni umane. Vengono cosรฌ accentuati il realismo e i dettagli dei video generati.
Una delle principali innovazioni di Veo 2 รจ la sua capacitร di interpretare prompt che specificano generi, obiettivi e effetti cinematografici. Ad esempio, รจ possibile richiedere:
- una ripresa a bassa angolazione che attraversa una scena
- un primo piano su un volto
- un’inquadratura con un particolare obiettivo per ottenere un effetto grandangolare
- una profonditร di campo ridotta per sfocare lo sfondo e mettere a fuoco un soggetto
Queste funzionalitร permettono di creare video con una varietร di stili e tecniche cinematografiche. Inoltre Veo 2 riduce gli errori di generazione e integra SynthID, una filigrana invisibile che garantisce l’autenticitร dei contenuti prodotti.
Attualmente, Veo 2 รจ disponibile su VideoFX, all’interno di Google Labs, con gli utenti che possono accedervi tramite una lista d’attesa. Google prevede di estendere l’accesso a Veo 2 su YouTube Shorts e altre piattaforme nel corso del prossimo anno.