OpenAI ha finalmente lanciato la modalità vocale avanzata per l’interazione con ChatGPT e il modello generativo GPT-4o. Tale funzionalità, che dovrebbe essere accessibile soltanto agli utenti che hanno sottoscritto la formula ChatGPT Plus, prende il nome di "Advanced Voice Mode" e rende le comunicazioni tra uomo e macchina molto più naturali.
Una della caratteristiche più interessanti di questa feature risiede nel fatto che una conversazione può essere interrotta, il sistema sarà comunque in grado di riprenderla tenendo conto del contesto da cui è stata generata la sessione vocale. Il modello sarà inoltre in grado di reagire in modo differente interpretando le emozioni dell’interlocutore.
Ad oggi il progetto è ancora in fase di test e può essere messo alla prova soltanto da un ristretto numero di utilizzatori, l’estensione a tutti gli abbonati a ChatGPT Plus è attesa invece per l’autunno. Si tratta in ogni caso di un passo avanti importante per il gruppo capitanato da Sam Altman che è intervenuto personalmente per annunciare questa novità.
this is a cool one!
we will improve the feature quickly. https://t.co/8TYnQ1VXKw
— Sam Altman (@sama) August 1, 2024
Per realizzare l’Advanced Voice Mode, OpenAI ha affrontato un lungo periodo di sperimentazione durante il quale sono state coinvolte un centinaio tra aziende e altre organizzazioni e sono state valutate le performance in ben 45 lingue differenti. Tra queste ultime vi è anche l’Italiano, come dimostrato a maggio nel corso della prima presentazione.
Il lancio della funzionalità è stato rinviato più volte per la necessità di regolare il comportamento del modello in risposta ad argomenti che non possono essere trattati. Questo senza ignorare la diatriba sorta con l’attrice Scarlett Johansson che aveva accusato la compagnia di aver utilizzato una voce, chiamata Sky, ritenuta troppo simile alla sua.