CriticGPT corregge il codice di GPT (quando ci riesce)

CriticGPT è il nome di un modello generativo addestrato per svolgere un compito particolare. Si tratta infatti di una sorta di LLM (Large Language Model) di controllo il cui obbiettivo è quello di verificare che GPT restituisca delle risposte precise alle richieste degli utenti. Eventuali errori, o possibili "allucinazioni", verranno così segnalati.

Parliamo quindi di un assistente dedicato a chi deve valutare la qualità degli output prodotti dal modello. Il suo ruolo si rivelerà importante soprattutto quando GPT restituisce degli errori nei codici sorgente che gli esseri umani potrebbero avere delle difficoltà a rilevare. Alla base del suo funzionamento vi è una tecnica di training nota come FSBS (Force Sampling Beam Search).

Pubblicitร 

In sostanza CriticGPT è stato implementato utilizzando dataset relativi ad errori e bug, avendo uno "storico" da cui partire il modello può ricoscere i pattern associati più di frequente alle risposto inesatte. Nel contempo vengono raccolte nuove imprecisioni e nuovi patterne che vengono riutilizzati per rendere l’LLM ancora più accurato.

CriticGPT non è però ancora la soluzione definitiva alle inefficienze di GPT. Anch’esso infatti sarebbe esposto ad errori e falsi positivi che tenderebbero ad emergere in particolare quando devono essere analizzati testi molto lunghi o concetti complessi. I risultati ottenuti con i testi di breve respiro sembrerebbero essere invece abbastanza soddisfacenti.

Vi è poi un problema insito nel metodo utilizzato per l’addestramento. Infatti, quando il sistema si "convince" che un’informazione è corretta o, al contrario, che non lo è, diventa molto difficile riaddestrarlo. A ciò si aggiunge il fatto che CriticGPT viene utilizzato per rilevare imprecisioni in parti specifiche di codice, escludendo diversi scenari in cui potrebbe risultare utile.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

L’US Air Force rivoluziona i droni con software AI in volo

L'US Air Force ha recentemente compiuto un'importante innovazione nel...

Anthropic accusa le cinesi DeepSeek, Moonshot e MiniMax di “distillazione” del modello Claude

Recentemente, Anthropic ha lanciato accuse gravi contro tre aziende...

ChatGPT introduce l’opzione ‘Naughty chats’ per adulti

OpenAI sta ridefinendo il ruolo degli assistenti digitali con...

Prompt injection e SEO “tossica”: come si manipolano i chatbot

Un recente esperimento ha riportato l'attenzione su una vulnerabilitร ...

Donna accusata di pianificare omicidi con ChatGPT

In Corea del Sud una donna di 21 anni...

Parlamento europeo: niente AI su tablet e smartphone

Il Parlamento europeo ha deciso di disabilitare le funzionalitร ...
Pubblicitร