back to top

CriticGPT corregge il codice di GPT (quando ci riesce)

CriticGPT è il nome di un modello generativo addestrato per svolgere un compito particolare. Si tratta infatti di una sorta di LLM (Large Language Model) di controllo il cui obbiettivo è quello di verificare che GPT restituisca delle risposte precise alle richieste degli utenti. Eventuali errori, o possibili "allucinazioni", verranno così segnalati.

Parliamo quindi di un assistente dedicato a chi deve valutare la qualità degli output prodotti dal modello. Il suo ruolo si rivelerà importante soprattutto quando GPT restituisce degli errori nei codici sorgente che gli esseri umani potrebbero avere delle difficoltà a rilevare. Alla base del suo funzionamento vi è una tecnica di training nota come FSBS (Force Sampling Beam Search).

Pubblicitร 

In sostanza CriticGPT è stato implementato utilizzando dataset relativi ad errori e bug, avendo uno "storico" da cui partire il modello può ricoscere i pattern associati più di frequente alle risposto inesatte. Nel contempo vengono raccolte nuove imprecisioni e nuovi patterne che vengono riutilizzati per rendere l’LLM ancora più accurato.

CriticGPT non è però ancora la soluzione definitiva alle inefficienze di GPT. Anch’esso infatti sarebbe esposto ad errori e falsi positivi che tenderebbero ad emergere in particolare quando devono essere analizzati testi molto lunghi o concetti complessi. I risultati ottenuti con i testi di breve respiro sembrerebbero essere invece abbastanza soddisfacenti.

Vi è poi un problema insito nel metodo utilizzato per l’addestramento. Infatti, quando il sistema si "convince" che un’informazione è corretta o, al contrario, che non lo è, diventa molto difficile riaddestrarlo. A ciò si aggiunge il fatto che CriticGPT viene utilizzato per rilevare imprecisioni in parti specifiche di codice, escludendo diversi scenari in cui potrebbe risultare utile.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

Meta: il chip per l’AI ce lo facciamo da soli

Meta sta testando il suo primo chip progettato internamente...

Manus: l’agente AI cinese completamente autonomo

Manus รจ il primo sistema AI in grado di...

L’AI si testa anche con Super Mario Bros

Negli ultimi anni i ricercatori hanno utilizzato vari titoli...

DeepSeek anticiperร  il lancio del modello R2

DeepSeek, la startup cinese che ha scosso il mercato...

Microsoft presenta i nuovi modelli AI Phi-4-miniย eย Phi-4-multimodal

Microsoft ha annunciato il rilascio di due nuovi modelli...

Mille artisti pubblicano un album contro la AI nella musica

Oltre mille musicisti britannici, tra cui artisti di spicco...
Pubblicitร