back to top

xAI rilascia Grok-1.5V ed è multimodale

Grok-1.5V (la "v" sta per "vision") è l’ultima versione del modello generativo creato e addestrato dalla xAI, azienda fondata da Elon Musk. Questa versione arriva a pochi giorni di distanza dal rilascio di Grok-1.5 ma si differenzia per il fatto di essere un modello multimodale. è quindi in grado di gestire diversi tipi contenuti andando oltre la sola elaborazione dei prompt testuali.

L’aggiornamento promette un alto livello di efficienza anche nella gestione di immagini, compresi gli screenshot contenenti informazioni che possano essere elaborate, documenti, tabelle, diagrammi e altri grafici. Per il momento siamo soltanto alla fase dell’annuncio e la nuova release sarà disponibile soltanto per un numero ristretto di tester.

Pubblicitร 

L’anteprima di Grok-1.5V è stata comunque sottoposta a dei test interni e i bechmark avrebbero permesso di registrare performance migliori rispetto ad alcuni modelli alternativi, come quelli di Claude (Claude 3 Opus e Claude 3 Sonnet), Gemini 1.5 Pro e GPT-4-V. Questo in particolare nella capacità di individuare gli elementi che compongono un’immagine.

Chiaramente il training dell’LLM (Large Language Model) ha riguardato anche altri aspetti come per esempio la generazione di codice e, nello specifico, di sorgenti Python. A questo proposito Grok-1.5V è stato in grado di creare un’applicazione prendendo spunto da un diagramma di flusso, dimostrandosi un valido assistente per i programmatori.

Nello stesso modo questa release sarebbe capace di generare autonomamente un file CSV (Comma Separated Values) a partire dai dati contenuti in una tabella, di spiegare il significato di un meme, di creare un racconto dopo l’osservazione di un semplice disegno o di leggere l’etichetta di un alimento e calcolare il suo contributo calorico.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Per Linus Torvalds Elon Musk non รจ in grado di gestire un’azienda tecnologica

Linus Torvalds, creatore del kernel Linux e figura di...

Google Gemini 3 Deep Think: nuovo record di performance per il ragionamento AI

Google ha rilasciato Gemini 3 Deep Think, una nuova...

Meno metaverso e piรน AI nel futuro di Meta

Meta ha programmato una revisione della propria strategia aziendale...

Amazon sfida Nvidia con i chip Trainium

Nel corso della conferenza AWS re:Invent 2025 il CEO...

Gemini (di Google) รจ la parola piรน ricercata del 2025 (su Google)

Con l'ultima edizione del suo Year in Search, Google...

OpenAI รจ in “codice rosso” a causa del successo di Gemini

A tre anni dall'allarme lanciato da Google dopo il...
Pubblicitร