OpenAI, organizzazione non profit a cui si deve il modello generativo GPT (Generative Pre-trained Transformer), ha presentato DALL-E 3, nuova versione della piattaforma che permette di generare immagini a partire da prompt testuali (text-to-image). Una delle principali novità di questa release riguarda l’integrazione con il chatbot ChatGPT.
Grazie alla combinazione di questi due strumenti risulterà molto più semplice ottenere gli output desiderati da DALL-E 3. Fino ad ora infatti il compito di digitare dei prompt molto dettagliati spettava agli utenti, il sistema è infatti in grado di generare qualsiasi tipo di immagine ma necessita di una descrizione quanto più precisa possibile di quello che dovrebbe essere il risultato finale.
Ora, grazie all’integrazione effettuata da Sam Altman e soci, questo compito potrà essere delegato a ChatGPT, in sostanza si potrà chiedere a quest’ultimo di interagire con DALL-E 3 per la creazione di un’immagine e sarà il chatbot a produrre la descrizione testuale necessaria ad ottenere un output fedele alle aspettative dell’utente.
DALL·E 3??ChatGPT pic.twitter.com/90ITkUAln2
— OpenAI (@OpenAI) September 21, 2023
Una volta terminata la procedura il servizio proporrà 4 immagini differenti permettendo di scegliere quella più adatta al progetto che si vuole sviluppare. OpenAI ha chiarito che non sarà obbligatorio utilizzare ChatGPT per interagire con DALL-E 3, utilizzarli insieme permetterà però a più persone di esprimersi artisticamente tramite l’Intelligenza Artificiale.
DALL-E 3 consente anche di generare immagini in cui sono presenti dei personaggi pubblici, non è invece possibile creare output che contengono rappresentazioni oscene o violente. A tal proposito è stato sviluppato un sistema di classificazione dei termini che ignora automaticamente determinate parole in modo da evitare possibili abusi.