back to top

AI: modello generativo creato con meno di 50 dollari

Un team di ricercatori delle universitร  di Stanford e Washington ha sviluppato un modello di AI chiamato s1 in grado di competere con il modello di ragionamento o1 di OpenAI. Ciรฒ che rende notevole questa impresa รจ il costo estremamente contenuto. Il modello รจ stato addestrato in soli 26 minuti, con una spesa inferiore ai 50 dollari.

Come nasce l’AI di s1

Questo risultato รจ stato ottenuto utilizzando una tecnica nota come distillazione che permette a modelli piรน piccoli di apprendere dalle risposte generate da modelli piรน grandi. In questo caso s1 รจ stato affinato utilizzando le risposte del modello di ragionamento di Google, Gemini 2.0 Flash Thinking Experimental. รˆ perรฒ importante notare che i termini di servizio di Big G vietano l’uso dell’API di Gemini per sviluppare dei modelli AI concorrenti.

Pubblicitร 

s1 si basa su Qwen2.5, un modello open source sviluppato da Alibaba Cloud. In fase iniziale i ricercatori hanno utilizzato un dataset di 59 mila domande per l’addestramento ma hanno poi scoperto che un set ridotto di sole mille domande offriva risultati comparabili riducendo il tempo e le risorse necessarie per l’addestramento.

Il training รจ stato eseguito su 16 GPU Nvidia H100. Una caratteristica distintiva di s1 รจ l’uso della test-time scaling, una tecnica che consente al modello di “pensare” piรน a lungo prima di fornire una risposta migliorando l’accuratezza del ragionamento.

I risultati dei test

I test hanno dimostrato che l’AI di s1 supera il modello o1 di OpenAI fino al 27% in domande matematiche. Ciรฒ mette in discussione l’idea che la creazione di modelli di intelligenza artificiale richieda investimenti massicci e risorse computazionali elevate. Aziende come OpenAI, Microsoft, Meta e Google hanno investito invece miliardi di dollari e utilizzato migliaia di GPU per addestrare i loro modelli.

Questo risultato potrebbe avere delle implicazioni importanti per il futuro dell’intelligenza artificiale. Si consideri ad esempio che lo sviluppo di R1, modello di DeepSeek considerato giร  molto economi, รจ costato circa 6 milioni di dollari.

Iscriviti a Google News Per restare sempre aggiornato seguici su Google News! Seguici
Pubblicitร 
Claudio Garau
Claudio Garau
Web developer, programmatore, Database Administrator, Linux Admin, docente e copywriter specializzato in contenuti sulle tecnologie orientate a Web, mobile, Cybersecurity e Digital Marketing per sviluppatori, PA e imprese.

Leggi anche...

ChatGPT ha compiuto 3 anni

Il 30 novembre 2022 OpenAI presentava al pubblico un...

ChatGPT puรฒ fare tutto? Prova a chiedergli che ore sono..

Quando si interagisce con un'AI, come quella che permette...

DeepSeek svelerร  i segreti dell’universo

Il gruppo cinese DeepSeek, giร  noto per aver introdotto...

La memoria RAM diventa sempre piรน costosa a causa dell’AI

Il successo dell'intelligenza artificiale sta provocando forti tensioni sul...

ChatGPT: modalitร  vocale e chat testuale in un’unica interfaccia

OpenAI ha rilasciato un nuovo aggiornamento per ChatGPT Voice,...

Black Friday: attenzione alle truffe basate sull’AI

Secondo uno studio pubblicata da Guardio, azienda specializzata in...
Pubblicitร