CriticGPT corregge il codice di GPT (quando ci riesce)

CriticGPT è il nome di un modello generativo addestrato per svolgere un compito particolare. Si tratta infatti di una sorta di LLM (Large Language Model) di controllo il cui obbiettivo è quello di verificare che GPT restituisca delle risposte precise alle richieste degli utenti. Eventuali errori, o possibili "allucinazioni", verranno così segnalati.

Parliamo quindi di un assistente dedicato a chi deve valutare la qualità degli output prodotti dal modello. Il suo ruolo si rivelerà importante soprattutto quando GPT restituisce degli errori nei codici sorgente che gli esseri umani potrebbero avere delle difficoltà a rilevare. Alla base del suo funzionamento vi è una tecnica di training nota come FSBS (Force Sampling Beam Search).

We’ve trained a model, CriticGPT, to catch bugs in GPT-4’s code. We’re starting to integrate such models into our RLHF alignment pipeline to help humans supervise AI on difficult tasks: https://t.co/5oQYfrpVBu

— OpenAI (@OpenAI) June 27, 2024

In sostanza CriticGPT è stato implementato utilizzando dataset relativi ad errori e bug, avendo uno "storico" da cui partire il modello può ricoscere i pattern associati più di frequente alle risposto inesatte. Nel contempo vengono raccolte nuove imprecisioni e nuovi patterne che vengono riutilizzati per rendere l’LLM ancora più accurato.

CriticGPT non è però ancora la soluzione definitiva alle inefficienze di GPT. Anch’esso infatti sarebbe esposto ad errori e falsi positivi che tenderebbero ad emergere in particolare quando devono essere analizzati testi molto lunghi o concetti complessi. I risultati ottenuti con i testi di breve respiro sembrerebbero essere invece abbastanza soddisfacenti.

Vi è poi un problema insito nel metodo utilizzato per l’addestramento. Infatti, quando il sistema si "convince" che un’informazione è corretta o, al contrario, che non lo è, diventa molto difficile riaddestrarlo. A ciò si aggiunge il fatto che CriticGPT viene utilizzato per rilevare imprecisioni in parti specifiche di codice, escludendo diversi scenari in cui potrebbe risultare utile.

Per restare sempre aggiornato seguici su Google News! Seguici

CriticGPT corregge il codice di GPT (quando ci riesce)

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Donna accusata di pianificare omicidi con ChatGPT

Parlamento europeo: niente AI su tablet e smartphone

CriticGPT corregge il codice di GPT (quando ci riesce)

Articoli Correlati

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Donna accusata di pianificare omicidi con ChatGPT

Parlamento europeo: niente AI su tablet e smartphone