Claude Sonnet 4.5: il nuovo standard per il vibe coding

Anthropic ha presentato Claude Sonnet 4.5 descrivendolo come il miglior modello al mondo per il coding e l’implementazione di agenti complessi. Con prestazioni superiori in ragionamento, matematica e utilizzo del computer, si propone come alternativa alle soluzioni di competitor come OpenAI e Microsoft.

Nuove funzionalità e strumenti per gli sviluppatori

L’aggiornamento porta con sé delle innovazioni rilevanti per Claude Code, tra cui i checkpoints che consentono di salvare e ripristinare facilmente lo stato di lavoro, una nuova interfaccia del terminale e un’estensione nativa per Visual Studio Code. L’API di Claude introduce inoltre un sistema di memoria estesa e strumenti di editing contestuale per miglirare la gestione di task di lunga durata.

Una delle novità più interessanti riguarda il rilascio del Claude Agent SDK, utilizzato anche per sviluppare Claude Code.

Esso permette di realizzare agenti personalizzati con delle soluzioni già adottate da Anthropic per coordinare i suoi subagenti e gestire attività multi-step.

Prestazioni e sicurezza

Claude Sonnet 4.5 ha stabilito un nuovo primato nel SWE-bench Verified, benchmark che misura la capacità di risolvere problemi di programmazione in scenari reali. Sul test OSWorld, dedicato a compiti informatici pratici, ha raggiunto un tasso di successo del 61,4%, contro il 42,2% della versione precedente. Il modello è poi riuscito a mantenere intatta la sua coerenza operativa per oltre 30 ore di seguito su compiti complessi.

Oltre al coding sono stati registrati dei miglioramenti in ambiti specifici come finanza, medicina, diritto e discipline STEM.

Claude Sonnet 4.5 è stato rilasciato sotto il framework AI Safety Level 3, con controlli contro comportamenti come tentativi d’inganno, compiacenza e ricerca di potere. Sono stati introdotti inoltre degli classificatori di sicurezza per individuare contenuti sensibili legati a rischi CBRN (chimici, biologici, radiologici e nucleari). Anthropic, infine, ha ridotto drasticamente i falsi positivi ed effettuato importanti progressi nella difesa dalla prompt injection.

Per restare sempre aggiornato seguici su Google News! Seguici

Claude Sonnet 4.5: il nuovo standard per il vibe coding

Nuove funzionalità e strumenti per gli sviluppatori

Prestazioni e sicurezza

Leggi anche...

Claude supera ChatGPT: la crescita esplosiva di Anthropic nel 2026

Anthropic fa causa al Pentagono: l’IA in gioco tra libertà di espressione e guerra

L’impatto dell’IA sul lavoro: analisi di Anthropic dopo ChatGPT

L’AI di Anthropic e il suo ruolo nei raid Usa contro l’Iran

OpenAI lancia Gpt-5.3 Instant: la sfida con Anthropic si intensifica

Anthropic si oppone al Pentagono: l’AI e le sfide etiche della sorveglianza

Claude Sonnet 4.5: il nuovo standard per il vibe coding

Nuove funzionalità e strumenti per gli sviluppatori

Prestazioni e sicurezza

Articoli Correlati

Leggi anche...

Claude supera ChatGPT: la crescita esplosiva di Anthropic nel 2026

Anthropic fa causa al Pentagono: l’IA in gioco tra libertà di espressione e guerra

L’impatto dell’IA sul lavoro: analisi di Anthropic dopo ChatGPT

L’AI di Anthropic e il suo ruolo nei raid Usa contro l’Iran

OpenAI lancia Gpt-5.3 Instant: la sfida con Anthropic si intensifica

Anthropic si oppone al Pentagono: l’AI e le sfide etiche della sorveglianza