DeepSeek-R1: ChatGPT ha un rivale cinese

DeepSeek, una startup cinese specializzata in soluzioni di intelligenza artificiale, ha annunciato il rilascio di DeepSeek-R1. Un modello generativo avanzato sviluppato per eccellere in compiti di ragionamento complessi. Questo LLM (Large Language Model) รจ stato sviluppato attraverso un processo di apprendimento per rinforzo su larga scala, senza l’uso preliminare di fine-tuning supervisionato. Una tecnica che ha portato all’emergere di potenti capacitร  di ragionamento.

DeepSeek-R1 รจ un modello Open Source

La versione iniziale del progetto, che prendeva il nome di DeepSeek-R1-Zero, presentava alcune limitazioni tra cui per esempio ripetizioni infinite, scarsa leggibilitร  degli output e una mescolanza di lingue differenti. Per superare queste criticitร  e migliorare ulteriormente le prestazioni del sistema, DeepSeek ha lanciato DeepSeek-R1 che incorpora dati di avvio “a freddo” prima dell’apprendimento per rinforzo.

Pubblicitร 

Questo approccio ha permesso al modello di raggiungere prestazioni comparabili a quelle di OpenAI-o1 in compiti di matematica, programmazione e ragionamento. Per supportare la ricerca DeepSeek ha poi reso open source sia DeepSeek-R1-Zero che DeepSeek-R1. Questo insieme a sei modelli distillati dal secondo e basati su soluzioni come Llama e Qwen.

La decisione di rendere il modello libero e aperto sotto licenza MIT aperta garantisce una maggiore accessibilitร  per la comunitร  di ricerca e sviluppo e promuove ulteriori innovazioni nel campo dell’AI. Questa scelta contrasta con le pratiche usate per molti modelli avanzati che spesso sono accessibili soltanto tramite licenze commerciali o abbonamenti a pagamento.

La Cina si propone come protagonista dell’AI

DeepSeek-R1 รจ stato progettato per eccellere in compiti che richiedono capacitร  di ragionamento avanzate, come la risoluzione di problemi matematici complessi e la scrittura di codice. Questo dimostra che la Cina sta rapidamente colmando il divario con i leader del settore negli Stati Uniti. Un aspetto distintivo del modello R1 รจ la sua disponibilitร  gratuita. Fattore che potrebbe accelerare ulteriormente la ricerca e l’innovazione nel campo dell’intelligenza artificiale.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

L'US Air Force ha recentemente compiuto un'importante innovazione nel...

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

Recentemente, Anthropic ha lanciato accuse gravi contro tre aziende...

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

OpenAI sta ridefinendo il ruolo degli assistenti digitali con...

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Un recente esperimento ha riportato l'attenzione su una vulnerabilitร ...

Donna accusata di pianificare omicidi con ChatGPT

In Corea del Sud una donna di 21 anni...

Parlamento europeo: niente AI su tablet e smartphone

Il Parlamento europeo ha deciso di disabilitare le funzionalitร ...
Pubblicitร