back to top

DeepSeek presenta un nuovo modello di AI

Gli sviluppatori di DeepSeek hanno reso disponibile un nuovo modello generativo che prende il nome di DeepSeek-V3-0324. Si tratta di una soluzioni rilasciata sotto licenza open source (MIT license) che potrร  essere utilizzata gratuitamente anche in ambito commerciale.

Le caratteristiche del nuovo modello di DeepSeek

DeepSeek V3-0324 ha raggiunto un traguardo storico diventando il miglior modello non-reasoning open source secondo l’Artificial Analysis Intelligence Index. Le sue performance superano infatti quelle di alternative proprietarie come Gemini 2.0 Pro di Google, Claude 3.7 “Sonnet” di Anthropic e Llama 3.3 70B di Meta.

Pubblicitร 

Sebbene non paragonabile per prestazioni ai modelli di tipo reasoning, come per esempio come DeepSeek R1 o i prodotti di OpenAI e Alibaba, V3-0324 dimostra l’enorme potenziale delle soluzioni open source per applicazioni in tempo reale come chatbot, assistenza clienti automatizzata e traduzioni live. Tutti ambiti dove la velocitร  di risposta รจ essenziale.

I modelli non-reasoning forniscono infatti risposte istantanee senza processi di ragionamento interni, caratteristica che li rende ideali per task che prevedono un alto livello di reattivitร .

Le specifiche di V3-0324

Come sottolineato dai portavoce di Artificial Analysis, รจ la prima volta che un modello open source guida la classifica degli LLM non-reasoning. I modelli reasoning rimangono perรฒ superiori per la risoluzione di problemi complessi.

Il nuovo V3-0324 mantiene molte delle specifiche della versione che venne resa disponibile in precedenza dagli stessi autori:

  • una finestra di contesto di 128 mila token (limitata a 64 mila via API).
  • 671 miliardi di parametri totali.
  • 37 miliardi di parametri attivi.
  • Solo testo (non si tratta quindi di un modello multimodale che puรฒ gestire diverse tipologie di contenuti).

DeepSeek-V3-0324 รจ in grado di limitare il numero di parametri utilizzati in fase di esecuzione, cosa che lo rende efficiente anche quando deve operare su configurazioni hardware particolarmente non avanzate.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Google: con l’AI Mode crolla i traffico sui siti di news

Ormai possiamo dirlo con una certa sicurezza, il mondo...

Anthropic chiude il blog scritto da Claude AI poco dopo il lancio

รˆ durata veramente poco l'avventura di Claude Explains, il...

WhatsApp beta: riepiloghi dei messaggi con l’AI

Con la versione beta 2.25.18.18 di WhatsApp per Android,...

Builder.ai: non era un’AI ma 700 sviluppatori indiani

Una delle startup piรน celebrate dell'ecosistema tech, Builder.ai, sarebbe...

Gemini: l’AI organizza la tua giornata con le azioni programmate

Google continua a potenziare l'applicazione di Gemini rendendola sempre...

OpenAI aggiorna la modalitร  vocale avanzata di ChatGPT

OpenAI ha annunciato alcune novitร  per la modalitร  vocale...
Pubblicitร