Google ha presentato TranslateGemma, una nuova suite di modelli di traduzione open source basati su Gemma 3 con cui facilitare la comunicazione in 55 lingue differenti. I modelli, disponibili in versioni da 4 miliardi, 12 miliardi e 27 miliardi di parametri, dovrebbero garantire un maggior equilibrio tra efficienza e qualità . Consentono inoltre l’utilizzo su diversi dispositivi, dai server cloud ai terminali mobile.
TranslateGemma: prestazioni superiori con meno risorse
Durante i test il modello TranslateGemma 12B ha superato le prestazioni di Gemma 3 27B nel benchmark WMT24++. La nuova architettura riesce quindi ad offrire una qualità di traduzione paragonabile o superiore con meno della metà dei parametri. Il modello da 4 miliardi di parametri ha poi registrato dei risultati competitivi rispetto a quelli più grandi ed è quindi ideale per applicazioni mobile o ambienti con risorse limitate.
La suite è stata sviluppata sulla base dell’esperienza accumulata con i modelli Gemini attraverso un processo di addestramento in due fasi:
- Supervised Fine-Tuning: tramite l’utilizzo di un ampio corpus di dati paralleli, con testi tradotti sia da esseri umani che generati da Gemini per garantire fedeltà anche nelle lingue minori.
- Reinforcement Learning: con l’impiego di modelli di ricompensa per perfezionare la qualità e la naturalezza delle traduzioni.
Una famiglia di modelli multimodali
TranslateGemma è stato addestrato su 55 coppie linguistiche e testato su oltre 500 combinazioni aggiuntive. Funge così da base per le attività di ricerca e personalizzazioni che potrebbero essere effettuate in futuro.
I modelli mantengono le capacità multimodali di Gemma 3 ma con prestazioni migliorate anche nella traduzione dei testi contenuti nelle immagini.
Disponibile nelle versioni 4B, 12B e 27B, TranslateGemma è adatto a diversi contesti, che vanno dal mobile computing al cloud ad alte prestazioni, per offrire delle traduzioni di livello professionale con latenze ridotte.

