Il modello generativo GPT-4.5 di OpenAI ha raggiunto un nuovo traguardo storico. ร riuscito infatti a superare il test di Turing facendo credere di essere umano nel 73% delle conversazioni testuali. Il test, ideato dal matematico britannico Alan Turing nel 1950, misura la capacitร di una macchina di mostrare intelligenza umana in un dialogo con un interlocutore reale.
GPT-4.5 puรฒ essere piรน “umano” degli “umani”
Lo studio รจ stato condotto dall’Universitร della California a San Diego, dove circa 300 studenti hanno partecipato ad un esperimento su piattaforma online. In ogni sessione, un giudice umano doveva decidere chi, tra due “testimoni” che interagivano solo tramite messaggi, fosse una persona reale. Uno dei due era sempre un chatbot.
Sorprendentemente, GPT-4.5 รจ stato giudicato umano piรน spesso dei veri esseri umani, battendo non solo le aspettative, ma anche altri modelli di AI. Ad esempio, il modello LLaMa 3.1 di Meta รจ stato identificato come umano nel 56% dei casi, mentre GPT-4o (il predecessore di GPT-4.5) solo nel 21%. Il chatbot ELIZA, risalente agli anni ’60, ha convinto infine soltanto il 23% dei giudici.
Stando a quanto dai responsabili della ricerca, in alcuni casi GPT-4.5 sarebbe stato persino giudicato piรน umano dei partecipanti reali.
OpenAI รจ riuscita a creare un’AGI?
Non tutti vedono questo risultato come una conferma della creazione di un’AGI o “intelligenza generale artificiale”. Il test di Turing misura infatti piรน le aspettative umane che la reale comprensione del comportamento di una macchina. La capacitร di produrre linguaggio fluente non sarebbe quindi una prova sufficiente dell’esistenza di una “intelligenza generale”.
Lo studio riapre cosรฌ il dibattito su cosa significhi davvero “essere intelligente” per un’intelligenza artificiale e se il solo superamento del test di Turing sia davvero il traguardo finale per dimostrare quanto siamo vicini all’ottenimento di un’AGI.