back to top

Voicebox: l’AI text-to-speech di Meta

Voicebox è un modello generativo creato da Meta che date le sue caratteristiche potrebbe risultare molto utile ai creatori di contenuti e persino nel supporto ad utenti ipovedenti. Una delle particolarità di questa tecnologia risiede nel fatto che essa è in grado di produrre file audio commentati tramite una voce che riprende in tutto e per tutte l’intonazione e lo stile dell’autore.

Voicebox integra capacità di editing molto avanzate, tanto da poter sostituire un creator in tutte quelle operazioni che fino ad oggi si sarebbero dovute eseguire manualmente. A tal proposito il modello è stato implementato in modo da riuscire ad elaborare una registrazione audio rimuovendo qualsiasi rumore o disturbo che peggiorerebbe l’esperienza di ascolto.

Pubblicitร 

Ma non basta, perché Voicebox è anche in grado di riprendere e portare a termine un discorso dal punto in cui è stato interrotto, è sufficiente fornirgli il testo completo delle parole che non sono state incluse nella registrazione orginale. Con il tempo sarà sempre più difficile distinguere i contenuti trattati da esseri umani da quelli generati dal modello.

Per il momento le lingue supportate sono sei: inglese, tedesco, francese, spagnolo, portoghese e polacco, manca invece quello per l’italiano ma è molto probabile che venga incluso nel prossimo futuro. L’obbiettivo è quello di offrire uno strumento completo per la sintesi text-to-speech contestuale, lo speech editing e la traduzione automatica dei testi.

Meta ha presentato diversi casi d’uso di questa nuova tecnologia, definita multipurpose generative AI model, come per esempio la possibilità di fornire una voce naturale ad un assistente virtuale o a personaggi non giocanti nel Metaverso. Nello stesso modo una persona ipovedente potrà utilizzare Voicebox per la lettura di messaggi da parte di amici e conoscenti.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

xAI perde un altro co-fondatore

Nuovo scossone ai vertici di xAI, la societร  fondata...

Sorpresa! L’AI rende il lavoro piรน faticoso

Secondo una ricerca condotta da Aruna Ranganathan e Xingqi...

Chiamate e videochiamate su WhatsApp Web

WhatsApp starebbe lavorando al supporto per le chiamate vocali...

UE: Meta deve aprire WhatsApp agli assistenti AI della concorrenza

La Commissione europea ha notificato a Meta una Statement...

Health+: Apple rinuncia al suo coach AI per la salute

Secondo quanto riportato da Bloomberg, Apple avrebbe deciso di...

L’AI open source รจ una nuova minaccia per la sicurezza?

Secondo un'indagine di SentinelLABS e Censys, le implementazioni di...
Pubblicitร