back to top

DeepSeek presenta un nuovo modello di AI

Gli sviluppatori di DeepSeek hanno reso disponibile un nuovo modello generativo che prende il nome di DeepSeek-V3-0324. Si tratta di una soluzioni rilasciata sotto licenza open source (MIT license) che potrร  essere utilizzata gratuitamente anche in ambito commerciale.

Le caratteristiche del nuovo modello di DeepSeek

DeepSeek V3-0324 ha raggiunto un traguardo storico diventando il miglior modello non-reasoning open source secondo l’Artificial Analysis Intelligence Index. Le sue performance superano infatti quelle di alternative proprietarie come Gemini 2.0 Pro di Google, Claude 3.7 “Sonnet” di Anthropic e Llama 3.3 70B di Meta.

Pubblicitร 

Sebbene non paragonabile per prestazioni ai modelli di tipo reasoning, come per esempio come DeepSeek R1 o i prodotti di OpenAI e Alibaba, V3-0324 dimostra l’enorme potenziale delle soluzioni open source per applicazioni in tempo reale come chatbot, assistenza clienti automatizzata e traduzioni live. Tutti ambiti dove la velocitร  di risposta รจ essenziale.

I modelli non-reasoning forniscono infatti risposte istantanee senza processi di ragionamento interni, caratteristica che li rende ideali per task che prevedono un alto livello di reattivitร .

Le specifiche di V3-0324

Come sottolineato dai portavoce di Artificial Analysis, รจ la prima volta che un modello open source guida la classifica degli LLM non-reasoning. I modelli reasoning rimangono perรฒ superiori per la risoluzione di problemi complessi.

Il nuovo V3-0324 mantiene molte delle specifiche della versione che venne resa disponibile in precedenza dagli stessi autori:

  • una finestra di contesto di 128 mila token (limitata a 64 mila via API).
  • 671 miliardi di parametri totali.
  • 37 miliardi di parametri attivi.
  • Solo testo (non si tratta quindi di un modello multimodale che puรฒ gestire diverse tipologie di contenuti).

DeepSeek-V3-0324 รจ in grado di limitare il numero di parametri utilizzati in fase di esecuzione, cosa che lo rende efficiente anche quando deve operare su configurazioni hardware particolarmente non avanzate.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

ChatGPT ha compiuto 3 anni

Il 30 novembre 2022 OpenAI presentava al pubblico un...

ChatGPT puรฒ fare tutto? Prova a chiedergli che ore sono..

Quando si interagisce con un'AI, come quella che permette...

DeepSeek svelerร  i segreti dell’universo

Il gruppo cinese DeepSeek, giร  noto per aver introdotto...

La memoria RAM diventa sempre piรน costosa a causa dell’AI

Il successo dell'intelligenza artificiale sta provocando forti tensioni sul...

ChatGPT: modalitร  vocale e chat testuale in un’unica interfaccia

OpenAI ha rilasciato un nuovo aggiornamento per ChatGPT Voice,...

Black Friday: attenzione alle truffe basate sull’AI

Secondo uno studio pubblicata da Guardio, azienda specializzata in...
Pubblicitร