back to top

Voicebox: l’AI text-to-speech di Meta

Voicebox è un modello generativo creato da Meta che date le sue caratteristiche potrebbe risultare molto utile ai creatori di contenuti e persino nel supporto ad utenti ipovedenti. Una delle particolarità di questa tecnologia risiede nel fatto che essa è in grado di produrre file audio commentati tramite una voce che riprende in tutto e per tutte l’intonazione e lo stile dell’autore.

Voicebox integra capacità di editing molto avanzate, tanto da poter sostituire un creator in tutte quelle operazioni che fino ad oggi si sarebbero dovute eseguire manualmente. A tal proposito il modello è stato implementato in modo da riuscire ad elaborare una registrazione audio rimuovendo qualsiasi rumore o disturbo che peggiorerebbe l’esperienza di ascolto.

Pubblicitร 

Ma non basta, perché Voicebox è anche in grado di riprendere e portare a termine un discorso dal punto in cui è stato interrotto, è sufficiente fornirgli il testo completo delle parole che non sono state incluse nella registrazione orginale. Con il tempo sarà sempre più difficile distinguere i contenuti trattati da esseri umani da quelli generati dal modello.

Per il momento le lingue supportate sono sei: inglese, tedesco, francese, spagnolo, portoghese e polacco, manca invece quello per l’italiano ma è molto probabile che venga incluso nel prossimo futuro. L’obbiettivo è quello di offrire uno strumento completo per la sintesi text-to-speech contestuale, lo speech editing e la traduzione automatica dei testi.

Meta ha presentato diversi casi d’uso di questa nuova tecnologia, definita multipurpose generative AI model, come per esempio la possibilità di fornire una voce naturale ad un assistente virtuale o a personaggi non giocanti nel Metaverso. Nello stesso modo una persona ipovedente potrà utilizzare Voicebox per la lettura di messaggi da parte di amici e conoscenti.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

WhatsApp: Strict Account Settings per una maggiore protezione della privacy

WhatsApp lancia Strict Account Settings, una nuova modalitร  di...

Negli USA l’AI di Gemini scrive anche le leggi

L'amministrazione Trump sta avviando un progetto che prevede l'utilizzo...

Meta testa gli abbonamenti premium su Instagram, Facebook e WhatsApp

Meta ha confermato l'intenzione di testare alcune nuove sottoscrizioni...

ChatGPT cancella due anni di lavoro accademico

Un grave incidente legato alla perdita dei dati avrebbe...

WhatsApp: un piano a pagamento per rimuovere la pubblicitร 

WhatsApp ha rilasciato la versione beta 2.26.3.9 per Android...

Microsoft: l’AI deve ancora dimostrare la sua utilitร 

Durante il World Economic Forum 2026 di Davos, Satya...
Pubblicitร