NVIDIA ha lanciato un potente modello di intelligenza artificiale sotto licenza Open Source. Si tratta nello specifico della famiglia NVLM 1.0 che compete con i sistemi proprietari di aziende come OpenAI e Google. Il modello di punta, NVLM-D-72B, basato su 72 miliardi di parametri, si sarebbe distinto per le sue eccezionali prestazioni nei compiti legati a visione artificiale e linguaggio, oltre che nelle capacità di elaborazione testuale.
NVIDIA sceglie l’AI Open Source
La decisione di NVIDIA di rendere pubblici i propri modelli e di promettere il rilascio del codice di addestramento segna una svolta nel comparto di riferimento. Viene così rotta con la tendenza di mantenere chiusi i sistemi AI più avanzati. Ciò consente a ricercatori e sviluppatori di accedere ad ogni aspetto della nuova tecnologia, accelerando la ricerca e lo sviluppo nel campo dell’Intelligenza Artificiale Generativa.
Il modello NVLM-D-72B si sarebbe dimostrato molto versatile nell’elaborazione di input complessi, sia visivi che testuali. È in grado di interpretare meme, analizzare immagini e risolvere problemi matematici in modo accurato. Una delle principali caratteristiche di questo modello è che, dopo il training multimodale, avrebbe migliorato le sue prestazioni nelle attività di solo testo, registrando un aumento medio di 4.3 punti nei principali benchmark.
La comunità di ricerca ha accolto positivamente il rilascio Open Source da parte della compagnia. È stato inoltre evidenziato che il modello, pur essendo basato su 72 miliardi di parametri, è paragonabile a LLaMA 3.1, un LLM (Large Language Model) da 405 miliardi di parametri, nei task legati a matematica e di programmazione.
Un modello multimodale
NVLM introduce anche innovazioni architetturali, combinando più tecniche di elaborazione multimodale e influenzando le modalità di implementazione del modello. Il rilascio di NVLM 1.0 rappresenta un momento cruciale nello sviluppo dell’AI in quanto NVIDIA sfida l’industria rendendo accessibili dei modelli di grandi dimensioni. Tuttavia, questa apertura porta anche rischi legati all’uso improprio della tecnologia, sollevando questioni etiche.