OpenAI ha annunciato il rilascio di due nuovi modelli di intelligenza artificiale “open weight” focalizzati sulle capacitร di ragionamento. Sam Altman e soci tornano cosรฌ in parte alla filosofia “open” che aveva ispirato la compagnia ai suoi esordi. I modelli prendono i nomi di gpt-oss-120b e gpt-oss-20b e sono liberamente scaricabili da Hugging Face. Il primo รจ piรน potente ed eseguibile su una singola GPU Nvidia. Il secondo รจ piรน leggero e utilizzabile anche su laptop con 16GB di RAM.
Le caratteristiche dei nuovi modelli “open weight” di OpenAI
Si tratta in entrambi i casi dei primi modelli “aperti” pubblicati da OpenAI dai tempi di GPT-2, piรน di cinque anni fa. Tale iniziativa arriva per fronteggiare la concorrenza da parte di alternative cinesi come DeepSeek e Qwen e dopo il cambio di rotta dichiarato dal CEO che ha ammesso come OpenAI sia stata “dalla parte sbagliata della storia” rispetto all’open source.
I nuovi modelli, disponibili con licenza Apache 2.0, consentono alle aziende di integrarli nelle proprie applicazioni e di monetizzarli senza restrizioni. OpenAI non ha perรฒ pubblicato i dati di addestramento utilizzati, una scelta forse legata alle controversie legali in atto sul tema del copyright.
I nuovi modelli sfruttano l’architettura MoE (Mixture-of-Experts), che attiva solo una parte dei parametri per ogni input, e il reinforcement learning ad alto calcolo per migliorare il ragionamento. Restano in ogni caso dei modelli “solo testo” e non sono in grado di generare immagini o audio.
I risultati dei benchmark
Per quanto riguarda le prestazioni, gpt-oss-120b e gpt-oss-20b hanno ottenuto dei risultati di alto livello in diversi benchmark tra cui Codeforces e Humanity’s Last Exam. Durante i test essi hanno superato alcuni rivali open restando perรฒ indietro rispetto ai piรน avanzati modelli “closed” di OpenAI come o3 e o4-mini. Tra i maggiori limiti vi รจ l’elevato tasso di allucinazioni, piรน del triplo rispetto ai modelli proprietari di ultima generazione.

