back to top

xAI rilascia Grok-1.5V ed è multimodale

Grok-1.5V (la "v" sta per "vision") è l’ultima versione del modello generativo creato e addestrato dalla xAI, azienda fondata da Elon Musk. Questa versione arriva a pochi giorni di distanza dal rilascio di Grok-1.5 ma si differenzia per il fatto di essere un modello multimodale. è quindi in grado di gestire diversi tipi contenuti andando oltre la sola elaborazione dei prompt testuali.

L’aggiornamento promette un alto livello di efficienza anche nella gestione di immagini, compresi gli screenshot contenenti informazioni che possano essere elaborate, documenti, tabelle, diagrammi e altri grafici. Per il momento siamo soltanto alla fase dell’annuncio e la nuova release sarà disponibile soltanto per un numero ristretto di tester.

Pubblicitร 

L’anteprima di Grok-1.5V è stata comunque sottoposta a dei test interni e i bechmark avrebbero permesso di registrare performance migliori rispetto ad alcuni modelli alternativi, come quelli di Claude (Claude 3 Opus e Claude 3 Sonnet), Gemini 1.5 Pro e GPT-4-V. Questo in particolare nella capacità di individuare gli elementi che compongono un’immagine.

Chiaramente il training dell’LLM (Large Language Model) ha riguardato anche altri aspetti come per esempio la generazione di codice e, nello specifico, di sorgenti Python. A questo proposito Grok-1.5V è stato in grado di creare un’applicazione prendendo spunto da un diagramma di flusso, dimostrandosi un valido assistente per i programmatori.

Nello stesso modo questa release sarebbe capace di generare autonomamente un file CSV (Comma Separated Values) a partire dai dati contenuti in una tabella, di spiegare il significato di un meme, di creare un racconto dopo l’osservazione di un semplice disegno o di leggere l’etichetta di un alimento e calcolare il suo contributo calorico.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Stability AI: video 3D da immagini con Stable Virtual Camera

Stability AI ha presentato Stable Virtual Camera, un modello...

Quanto costerร  l’iPhone pieghevole? Tantissimo

L'atteso iPhone Fold di Apple, se questo sarร  veramente...

GIMP 3.0: tutte le novitร  della nuova milestone

Dopo ben sette anni di sviluppo, il team di...

Google spende 32 miliardi per acquisire Wiz

Google ha confermato l'acquisizione della startup Wiz, societร  specializzata...

L’AI sta cambiando le ricerche online (a scapito di Google)

Dopo decenni in cui gli utenti si sono affidati...

Samsung: One UI 7 arriverร  il 7 aprile

Il colosso sudcoreano Samsung ha annunciato ufficialmente che il...
Pubblicitร