back to top

Stable Video 3D: video in 2D da un’immagine

SV3D (per esteso Stable Video 3D) è un nuovo modello generativo dedicato alla produzione di filmati e creato dagli sviluppatori di Stability AI, gli stessi di Stable Diffusion e Stable Video Diffusion. Si tratta di una soluzione di tipo image-to-video che partendo da un’immagine statica riesce a creare un contenuto filmato in 3 dimensioni.

Tecnicamente parliamo di un’evoluzione del progetto chiamato Stable Zero123 che venne presentato per la prima volta alla fine dello scorso anno. Per il momento non è una soluzione disponibile al grande pubblico, può essere però utilizzato tramite la formula Professional Membership che prevede un abbonamento pari a 20 euro mensili.

Per quanto riguarda gli output generati da SV3D, attualmente il sistema è in grado di generare video con una risoluzione pari a 576×576 pixel, quindi non particolarmente elevata, per un totale di 21 fotogrammi. I risultati migliori sono ottenibili utilizzando come input il file di un’immagine da 576×576 px con sfondo bianco in cui è presente un unico oggetto.

L’output ottenuto tramite SV3D supporta naturalmente la rotazione, le prime demo mostrate al momento del lancio mostrano una notevole fluidità in fase di riproduzione. Sono rilevabili alcune leggere distorsioni ma è bene tenere conto che il modello sarà in grado di migliorare ulteriormente proprio grazie all’addestramento derivante dall’uso.

Stability AI ha deciso di rendere disponibile SV3D in due versioni differenti che prendono il nome di SV3D_u e SV3D_p. Il primo è stato concepito principalmente per la realizzazione di video orbitali basati su una sola immagine di input, il secondo è stato implementato per tenere in considerazione il percorso da seguire a partire da un’inquadratura.

Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

ChatGPT: arriva l’Advanced Voice Mode

OpenAI ha finalmente lanciato la modalità vocale avanzata per...

Gemini: modificare le immagini diventa più facile

Gemini, il modello generativo sviluppato da Google, è un...

GPT-4o mini: piccolo, economico ma potente

OpenAI, la compagnia a cui si deve il popolare...

Microsoft: un modello generativo per i fogli Excel

SpreadsheetLLM è il nome di un nuovo modello generativo...

Climate Answer: il chatbot che risponde a domande sul clima

Il Washington Post, quotidiano statunitense controllato da Jeff Bezos...

OpenAI: dati sottratti da un forum interno?

La vicenda, emersa solo di recente, risalirebbe all'inizio dello...
Pubblicitร