DeepSeek presenta un nuovo modello di AI

Gli sviluppatori di DeepSeek hanno reso disponibile un nuovo modello generativo che prende il nome di DeepSeek-V3-0324. Si tratta di una soluzioni rilasciata sotto licenza open source (MIT license) che potrร  essere utilizzata gratuitamente anche in ambito commerciale.

Le caratteristiche del nuovo modello di DeepSeek

DeepSeek V3-0324 ha raggiunto un traguardo storico diventando il miglior modello non-reasoning open source secondo l’Artificial Analysis Intelligence Index. Le sue performance superano infatti quelle di alternative proprietarie come Gemini 2.0 Pro di Google, Claude 3.7 “Sonnet” di Anthropic e Llama 3.3 70B di Meta.

Pubblicitร 

Sebbene non paragonabile per prestazioni ai modelli di tipo reasoning, come per esempio come DeepSeek R1 o i prodotti di OpenAI e Alibaba, V3-0324 dimostra l’enorme potenziale delle soluzioni open source per applicazioni in tempo reale come chatbot, assistenza clienti automatizzata e traduzioni live. Tutti ambiti dove la velocitร  di risposta รจ essenziale.

I modelli non-reasoning forniscono infatti risposte istantanee senza processi di ragionamento interni, caratteristica che li rende ideali per task che prevedono un alto livello di reattivitร .

Le specifiche di V3-0324

Come sottolineato dai portavoce di Artificial Analysis, รจ la prima volta che un modello open source guida la classifica degli LLM non-reasoning. I modelli reasoning rimangono perรฒ superiori per la risoluzione di problemi complessi.

Il nuovo V3-0324 mantiene molte delle specifiche della versione che venne resa disponibile in precedenza dagli stessi autori:

  • una finestra di contesto di 128 mila token (limitata a 64 mila via API).
  • 671 miliardi di parametri totali.
  • 37 miliardi di parametri attivi.
  • Solo testo (non si tratta quindi di un modello multimodale che puรฒ gestire diverse tipologie di contenuti).

DeepSeek-V3-0324 รจ in grado di limitare il numero di parametri utilizzati in fase di esecuzione, cosa che lo rende efficiente anche quando deve operare su configurazioni hardware particolarmente non avanzate.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

L'US Air Force ha recentemente compiuto un'importante innovazione nel...

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

Recentemente, Anthropic ha lanciato accuse gravi contro tre aziende...

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

OpenAI sta ridefinendo il ruolo degli assistenti digitali con...

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Un recente esperimento ha riportato l'attenzione su una vulnerabilitร ...

Donna accusata di pianificare omicidi con ChatGPT

In Corea del Sud una donna di 21 anni...

Parlamento europeo: niente AI su tablet e smartphone

Il Parlamento europeo ha deciso di disabilitare le funzionalitร ...
Pubblicitร