DeepSeek presenta un nuovo modello di AI

Gli sviluppatori di DeepSeek hanno reso disponibile un nuovo modello generativo che prende il nome di DeepSeek-V3-0324. Si tratta di una soluzioni rilasciata sotto licenza open source (MIT license) che potrà essere utilizzata gratuitamente anche in ambito commerciale.

Le caratteristiche del nuovo modello di DeepSeek

DeepSeek V3-0324 ha raggiunto un traguardo storico diventando il miglior modello non-reasoning open source secondo l’Artificial Analysis Intelligence Index. Le sue performance superano infatti quelle di alternative proprietarie come Gemini 2.0 Pro di Google, Claude 3.7 “Sonnet” di Anthropic e Llama 3.3 70B di Meta.

Sebbene non paragonabile per prestazioni ai modelli di tipo reasoning, come per esempio come DeepSeek R1 o i prodotti di OpenAI e Alibaba, V3-0324 dimostra l’enorme potenziale delle soluzioni open source per applicazioni in tempo reale come chatbot, assistenza clienti automatizzata e traduzioni live. Tutti ambiti dove la velocità di risposta è essenziale.

I modelli non-reasoning forniscono infatti risposte istantanee senza processi di ragionamento interni, caratteristica che li rende ideali per task che prevedono un alto livello di reattività.

Le specifiche di V3-0324

Come sottolineato dai portavoce di Artificial Analysis, è la prima volta che un modello open source guida la classifica degli LLM non-reasoning. I modelli reasoning rimangono però superiori per la risoluzione di problemi complessi.

Il nuovo V3-0324 mantiene molte delle specifiche della versione che venne resa disponibile in precedenza dagli stessi autori:

una finestra di contesto di 128 mila token (limitata a 64 mila via API).
671 miliardi di parametri totali.
37 miliardi di parametri attivi.
Solo testo (non si tratta quindi di un modello multimodale che può gestire diverse tipologie di contenuti).

DeepSeek-V3-0324 è in grado di limitare il numero di parametri utilizzati in fase di esecuzione, cosa che lo rende efficiente anche quando deve operare su configurazioni hardware particolarmente non avanzate.

Per restare sempre aggiornato seguici su Google News! Seguici

DeepSeek presenta un nuovo modello di AI

Le caratteristiche del nuovo modello di DeepSeek

Le specifiche di V3-0324

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Donna accusata di pianificare omicidi con ChatGPT

Parlamento europeo: niente AI su tablet e smartphone

DeepSeek presenta un nuovo modello di AI

Le caratteristiche del nuovo modello di DeepSeek

Le specifiche di V3-0324

Articoli Correlati

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Donna accusata di pianificare omicidi con ChatGPT

Parlamento europeo: niente AI su tablet e smartphone