HuggingFace Chat Not Arena ha pubblicato la sua classifica dedicata a quelli che sono i migliori modelli di Intelligenza Artificiale Generativa oggi disponibili sul mercato. Si tratta di un punto di riferimento importante per il settore in quanto HuggingFace è un vero e proprio laboratorio nel quale vengono testati modelli e dataset dedicati all’apprendimento automatico.
Stando a quanto riportato nella classifica, attualmente al 1° posto si piazzerebbe GPT-4 Turbo. Parliamo dell’ultima implementazione di GPT (Generative Pre-trained Transformer) da parte di OpenAI, il modello è però ancora in fase di anteprima (gpt-4-0125-preview) e servirà ancora del tempo prima che diventi quello di riferimenti per ChatGPT.
Thanks @Teknium1 and community's feedback! We've added a new column on leaderboard showing the knowledge cutoff date of each model.
For API-based models, unless specifically noted, we annotate it as unknown, as it may receive update without notice. For open models, we use its… https://t.co/EpDeMzvQQb pic.twitter.com/Hz17vAcNXY
— lmsys.org (@lmsysorg) January 30, 2024
Ad essere particolarmente interessante è invece la 2ª posizione dove non troviamo GPT-4 ma Bard di Google. Quest’ultimo è riuscito a conquistare la medaglia d’argento grazie a Gemini Pro, Intelligenza Generativa che Mountain View ha presentato insieme alle varianti Gemini Nano (pensata per i device) e Ultra (per le applicazioni critiche).
GPT-4 è invece al 3° e quarto posto grazie a due implementazioni differenti della medesima generazione, mentre GPT-3.5, quello utilizzato da OpenAI per il lancio pubblico ufficiale di ChatGPT, si trova soltanto in 11ª posizione. Buone le performace di Claude, considerato da molti la vera alternativa a GPT, con varianti al 6°,7° e 10° posto.
Venendo alle brutte notizie, dispiace osservare che tra le prime dieci posizioni sia presente soltanto un modello associato ad una licenza OpenSource rappresentato da una implementazione di Mistral della Anthropic, tutti gli altri invece sono delle soluzioni proprietarie. Fuori classica è invece Llama, di Meta, del quale si attende la terza generazione.