Google DeepMind ha annunciato il lancio di Nano Banana, un modello di intelligenza artificiale per l’editing di immagini integrato nell’applicazione di Gemini. Esso consente di operare delle modifiche anche complesse mantenendo l’identitร visiva del soggetto, una sfida storica per i sistemi text-to-image. Con questo strumento รจ possibile cambiare abiti, acconciature, ambientazioni e persino aggiungere nuovi elementi, come animali domestici o oggetti d’arredo, preservando la coerenza dei dettagli facciali.
Un confronto con gli altri modelli generativi
Le funzionalitร di Nano Banana includono la fusione di piรน immagini in un’unica scena, l’applicazione di elementi grafici da una foto all’altra e la possibilitร di eseguire delle modifiche progressive, ad esempio ridipingere pareti o aggiungere mobili in fasi successive.
Secondo i test effettuati nelle scorse ore il modello Gemini 2.5 Flash Image basato su Nano Banana ha ottenuto un punteggio piรน alto rispetto a concorrenti come ChatGPT-4o, FLUX.1 Kontext e Qwen Image Edit. Mentre Gemini 2.0 Flash Image si distingue per velocitร di elaborazione, la versione 2.5 ha garantito un equilibrio migliore tra qualitร visiva e soddisfazione degli utenti.
Le prove di categoria hanno evidenziato la superioritร di Gemini 2.5 in contesti creativi come il design di prodotto, con un ChatGPT-4o abbastanza competitivo nella gestione dei layout e Qwen Image Edit che sembrerebbe essere invece meno performante.
Un watermark sulle immagini per contrastare gli abusi
Nano Banana รจ giร disponibile sia per utenti gratuiti che per quelli premium nell’app Gemini e verrร reso accessibile anche agli sviluppatori tramite API, Google AI Studio e Vertex AI.
Tutte le immagini generate o modificate integrano un watermark visibile e un tag digitale SynthID per certificare la provenienza dei contenuti e contrastarne l’uso improprio.

