OpenAI ha addestrato GPT-4 con i video di YouTube?

OpenAI, la compagia che ha creato il chatbot ChatGPT, avrebbe utilizzato i video di YouTube nel training del modello generativo GPT-4. A rivelarlo sarebbe una recente inchiesta del New York Times, dando forza ad alcuni affermazioni di Mountain View secondo cui tale pratica sarebbe avvenuta in violazione dei termini di servizio della piattaforma.

Secondo quanto riportato dalla testata statunitense, alla fine del 2021 Sam Altman e soci si sarebbero trovati nella condizione di non avere ulteriori fonti online in lingua inglese per l’addestramento dell’LLM (Large Language Model). Sarebbe stato quindi sviluppato Whisper, un modello capace di trascrivere l’audio contenuto in una traccia o in un video.

Quest’ultimo sarebbe stato utilizzato per raccogliere i contenuti di circa un milione di ore di filmati presenti su YouTube, fatto questo i testi trascritti sarebbero stati utilizzati per addestrare GPT-4. Fin qui tutto bene se non fosse che le policy della proprietà di Google vietano espressamente non solo lo scraping dei dati senza consenso ma anche il download.

OpenAI transcribed over a million hours of YouTube videos to train GPT-4 https://t.co/xmBwIEeZ7t

— The Verge (@verge) April 6, 2024

Ma se Big G ha scoperto questa pratica perché non mai è intervenuta per bloccarla? Qui la faccenda sembrerebbe complicarsi uteriomente perché, sempre per il New York Times, anche Google avrebbe utilizzato i video di YouTube per il training dei propri LLM e ciò sarebbe avvenuto in violazione dei diritti d’autore detenuti dai creator.

Tale tesi sarebbe stata però respinta da Moutain View che, invece, avrebbe stretto degli accordi con questi ultimi per utilizzarne i contenuti. L’addestramento di modelli come Gemini verrebbe effettuto inoltre tramite dati pubblici prelevati da piattaforme del proprio network (come per esempio Documenti e Maps), cosa che non ne violerebbe i termini di servizio.

Per restare sempre aggiornato seguici su Google News! Seguici

OpenAI ha addestrato GPT-4 con i video di YouTube?

Leggi anche...

OpenAI lancia ChatGPT Health: un aiuto per la salute superiore a un medico

Slopaganda: la propaganda politica nell’era dell’intelligenza artificiale

Nuovo menu di Siri AI in macOS 27: scrittura e assistenza intelligente

Oltre 3.800 siti di informazione generati da AI: l’impatto della disinformazione in Italia

Spotify lancia la chat AI per scoprire nuova musica con intelligenza artificiale

Lyzr: come un agente IA ha raccolto 100 milioni di dollari in finanziamenti

OpenAI ha addestrato GPT-4 con i video di YouTube?

Articoli Correlati

Leggi anche...

OpenAI lancia ChatGPT Health: un aiuto per la salute superiore a un medico

Slopaganda: la propaganda politica nell’era dell’intelligenza artificiale

Nuovo menu di Siri AI in macOS 27: scrittura e assistenza intelligente

Oltre 3.800 siti di informazione generati da AI: l’impatto della disinformazione in Italia

Spotify lancia la chat AI per scoprire nuova musica con intelligenza artificiale

Lyzr: come un agente IA ha raccolto 100 milioni di dollari in finanziamenti