Un recente studio pubblicato da ricercatori di Stanford, Cornell e West Virginia University avrebbe scoperto che il modello AI Llama 3.1 70B di Meta รจ in grado di riprodurre con precisione quasi il 42% del testo del libro “Harry Potter e la pietra filosofale“. Un risultato che potrebbe creare delle preoccupazione riguardo al rapporto tra diritti d’autore e modelli di intelligenza artificiale generativa.
Come i modelli di AI di Meta ricordano le opere letterarie
I ricercatori hanno analizzato cinque modelli di intelligenza artificiale giร molto popolari, tra cui tre sviluppati da Meta, utilizzando come riferimento una serie di libri raccolti nel dataset Books3
, molti dei quali protetti da copyright. La ricerca mirava a determinare quanto frequentemente questi modelli riuscissero a riprodurre degli estratti identici a quelli presenti nei libri originali.
Il modello Llama 3.1 70B, rilasciato a luglio 2024, avrebbe mostrato un livello di memorizzazione piรน alto rispetto ad altre soluzioni simili. Llama 1 65B, rilasciato nel febbraio 2023, avrebbe memorizzato ad esempio solo il 4,4% dello stesso testo. Questo incremento suggerirebbe che Meta potrebbe non aver preso delle precauzioni sufficienti per limitare la memorizzazione di testi coperti da copyright durante passaggio tra le diverse versioni del modello.
Le implicazioni su possibili cause legali
Il team di ricerca avrebbe scoperto anche che la tendenza alla memorizzazione da parte dei modelli di Meta (e non solo) varia molto in base alla popolaritร dei libri. Opere come “Il Signore degli Anelli” e “1984” mostrerebbero dei tassi di riproducibilitร particolarmente elevati, mentre quelle meno note presenterebbero dei livelli minimi. Il romanzo “Sandman Slim” di Richard Kadrey sarebbe stato memorizzato ad esempio solo per lo 0,13%. Cosa che potrebbe complicare eventuali azioni legali per violazione dei diritti d’autore.