back to top

Voicebox: l’AI text-to-speech di Meta

Voicebox è un modello generativo creato da Meta che date le sue caratteristiche potrebbe risultare molto utile ai creatori di contenuti e persino nel supporto ad utenti ipovedenti. Una delle particolarità di questa tecnologia risiede nel fatto che essa è in grado di produrre file audio commentati tramite una voce che riprende in tutto e per tutte l’intonazione e lo stile dell’autore.

Voicebox integra capacità di editing molto avanzate, tanto da poter sostituire un creator in tutte quelle operazioni che fino ad oggi si sarebbero dovute eseguire manualmente. A tal proposito il modello è stato implementato in modo da riuscire ad elaborare una registrazione audio rimuovendo qualsiasi rumore o disturbo che peggiorerebbe l’esperienza di ascolto.

Pubblicitร 

Ma non basta, perché Voicebox è anche in grado di riprendere e portare a termine un discorso dal punto in cui è stato interrotto, è sufficiente fornirgli il testo completo delle parole che non sono state incluse nella registrazione orginale. Con il tempo sarà sempre più difficile distinguere i contenuti trattati da esseri umani da quelli generati dal modello.

Per il momento le lingue supportate sono sei: inglese, tedesco, francese, spagnolo, portoghese e polacco, manca invece quello per l’italiano ma è molto probabile che venga incluso nel prossimo futuro. L’obbiettivo è quello di offrire uno strumento completo per la sintesi text-to-speech contestuale, lo speech editing e la traduzione automatica dei testi.

Meta ha presentato diversi casi d’uso di questa nuova tecnologia, definita multipurpose generative AI model, come per esempio la possibilità di fornire una voce naturale ad un assistente virtuale o a personaggi non giocanti nel Metaverso. Nello stesso modo una persona ipovedente potrà utilizzare Voicebox per la lettura di messaggi da parte di amici e conoscenti.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Meno metaverso e piรน AI nel futuro di Meta

Meta ha programmato una revisione della propria strategia aziendale...

ChatGPT ha compiuto 3 anni

Il 30 novembre 2022 OpenAI presentava al pubblico un...

Instagram: non piรน di 3 hashtag per post

Instagram ha iniziato a testare un importante aggiornamento che...

ChatGPT puรฒ fare tutto? Prova a chiedergli che ore sono..

Quando si interagisce con un'AI, come quella che permette...

DeepSeek svelerร  i segreti dell’universo

Il gruppo cinese DeepSeek, giร  noto per aver introdotto...

La memoria RAM diventa sempre piรน costosa a causa dell’AI

Il successo dell'intelligenza artificiale sta provocando forti tensioni sul...
Pubblicitร