In un recente intervento dedicato al futuro del modello generativo di OpenAI, il CEO Sam Altman ha voluto fornire alcune anticipazioni riguardo a GPT-5 e al cosiddetto progetto Q*. Esattamente come nel caso di GPT-4 Turbo, si tratterà di un modello multimodale, in grado di gestire diverse tipologie di contenuti, con in più il supporto per la creazione di video.
Parlando nel corso di una puntato del podcast "Unconfuse Me" di Bill Gates, Altman ha sostenuto che la prossima implementazione dell’LLM (Large Language Model) permetterà di generare filmati a partire da semplici descrizioni in linguaggio naturale (prompt), nello stesso modo in cui oggi si possono realizzare immagini e tracce audio con l’AI.
Tale funzionalità sarebbe in programma in quanto una delle più richieste e attese dagli utenti. Del resto è logico pensare che i dirigenti di OpenAI, tornati in sella dopo una breve rivoluzione ai vertici, non vogliano evitare di impegnarsi nello sviluppo di una soluzione che, prima o poi, sarà comunque proposta da uno degli operatori del suo stesso settore.
Le implicazioni di una feature di questo genere sono però (im)prevedibili. Un modello generativo in grado di creare contenuti video on-demand potrebbe essere infatti ultizzato per la produzione di DeepFake. A pagarne le spese potrebbero essere personaggi noti della politica, lo sport o lo spettacolo ma anche le fasce più influenzabili (e non solo) dell’opionone pubblica.
Attualmente esistono diverse applicazioni che permettono di creare facilmente DeepFake, spesso utilizzati per la realizzazione di video per adulti. Queste però si basano soprattutto sulla sostituzione del volto di una persona con quella di un’altra nel contesto di un video preesistente. Con GPT-5 sarà invece possibile creare video da zero, descrivendo anche le scene che dovranno essere mostrate.