back to top

Google lancia Whisk e Veo 2 per creare immagini e video con l’AI

Whisk, l’ultimo esperimento di Google Labs e Google DeepMind, permette di inserire o creare immagini che rappresentano un soggetto, la scena in cui è presente e lo stile desiderati.

Come funziona Whisk di Google

Gli output inviati alla piattaforma possono essere poi combinati e remixati per creare qualcosa di unico come per esempio un peluche digitale, una spilla smaltata o un adesivo.

Whisk combina il più recente modello Imagen 3 con le capacità di comprensione e descrizione visiva di Gemini. Quest’ultimo scrive automaticamente una didascalia dettagliata delle immagini e la invia a Imagen 3. Tale processo consente poi di remixare facilmente soggetti, scene e stili in modi molto diversi tra loro.

Veo 2 per la generazione video

Oltre a Whisk Google ha annunciato Veo 2, la nuova versione del suo modello di generazione video basato sull’intelligenza artificiale che offre una comprensione avanzata della fisica del mondo reale, delle sfumature dei movimenti e delle espressioni umane. Vengono così accentuati il realismo e i dettagli dei video generati.

Una delle principali innovazioni di Veo 2 è la sua capacità di interpretare prompt che specificano generi, obiettivi e effetti cinematografici. Ad esempio, è possibile richiedere:

  • una ripresa a bassa angolazione che attraversa una scena
  • un primo piano su un volto
  • un’inquadratura con un particolare obiettivo per ottenere un effetto grandangolare
  • una profondità di campo ridotta per sfocare lo sfondo e mettere a fuoco un soggetto

Queste funzionalità permettono di creare video con una varietà di stili e tecniche cinematografiche. Inoltre Veo 2 riduce gli errori di generazione e integra SynthID, una filigrana invisibile che garantisce l’autenticità dei contenuti prodotti.

Attualmente, Veo 2 è disponibile su VideoFX, all’interno di Google Labs, con gli utenti che possono accedervi tramite una lista d’attesa. Google prevede di estendere l’accesso a Veo 2 su YouTube Shorts e altre piattaforme nel corso del prossimo anno.

Pubblicità
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Gemini 2.0 Flash, l’AI che è in grado di ragionare

Con Gemini 2.0 Flash Mountain View presenta una nuova...

Gemini anche alla guida con Android Auto

Negli ultimi mesi sono emersi diversi indizi sull'integrazione di...

Google: un nuovo team per ricreare il mondo con l’AI

Google DeepMind ha annunciato la formazione di un nuovo...

Android Auto anche sulle moto?

Google starebbe ampliando il supporto di Android Auto per...

L’AI di Gemini analizza i PDF su Google Files

Google ha introdotto una nuova funzionalità nell'app Files chiamata...

Chrome rileva i siti scam con l’AI

Nelle scorse ore Google ha introdotto una nuova funzionalità...
Pubblicità