Alcuni giorni fa Google ha presentato Gemini, la sua nuova Intelligenza Artificiale Generativa multimodale, cioè in grado di gestire testi, immagini, video e altri contenuti simultaneamente. Un vero passo avanti rispetto agli LLM (Large Language Model) più affermati, peccato però che la demo mostrata al pubblico non rappresenterebbe lo stato dell’arte reale del progetto.
Gemini dovrebbe essere disponibile in tre versioni: Nano, destinata all’adozione all’interno dei dispositivi, Pro, con funzionalità più adatte all’utilizzo in ambito professionale, e Ultra, la variante più potente. I benchmark presentati, con risultati migliori rispetto a GPT, si sarebbero basati sulla release Ultra che però sembrerebbe ben lontana dell’essere pronta.
Stesso discorso per quanto riguarda il video di lancio, quello mostrato di seguito, dove si vede Gemini rispondere in tempo reale alle domande dell’utilizzatore e compiere velocemente task visuali anche molto complessi. In realtà però tale filmato sarebbe il risultato di un montaggio i cui sono stati utilizzati soltanto dei fotogrammi selezionati.
A difesa di Google è giusto sottolineare che l’azienda ha pubblicato un disclaimer nel quale viene chiarito che, per brevità, la latenza è stata ridotta volontariamente. Ma stando così le cose è probabile che le prestazioni di Gemini, diversamente da quanto potrebbe apparire nel video, siano ancora inferiori rispetto al modello concorrente di OpenAI.
??PSA about Google’s jaw-dropping video demo of Gemini – the one with the duck:
It was not carried out in real time or in voice. The model was shown still images from video footage and human prompts narrated afterwards, per a spokesperson. More here: https://t.co/ITU29Z5Oi9 pic.twitter.com/b9Bl9EpuuI
— Parmy Olson (@parmy) December 7, 2023
Mountain View avrebbe sostenuto che la sua intenzione era quella di fornire un’ispirazione agli sviluppatori. Al di là di tutto sembrerebbe però che la compagnia capitanata da Sundar Pichai sia ancora molto in ritardo per quanto riguarda le soluzioni basate sulle tecnologie di AI e che non abbia trovato un modo per impensierire i competitor.