Giornali con duecento anni di storia, testate che hanno vinto il Pulitzer, editori locali e regionali da New York al Texas. In totale circa 400 pubblicazioni giornalistiche statunitensi che, insieme, portano in tribunale OpenAI e Microsoft. L’accusa: aver utilizzato in modo indebito, bucando i paywall e infrangendo il diritto d’autore, centinaia di migliaia di articoli per addestrare ChatGpt. La causa è stata depositata il 26 giugno presso una corte distrettuale di New York.
Gli editori sostengono che OpenAI abbia rastrellato di nascosto i loro siti web, inclusi i contenuti a pagamento, copiando articoli e altre opere originali sui propri server senza permesso e senza riconoscere un compenso agli autori. Ad esempio, l’azienda avrebbe usato il social network Reddit per costruire un dataset che conteneva molti pezzi delle testate che promuovono l’azione legale.
Inoltre, nelle 55 pagine della causa, lette da MF-Milano Finanza, l’accusa sostiene che OpenAI abbia intenzionalmente rimosso informazioni come crediti degli autori, nomi delle testate e avvisi di copyright durante il processo di estrazione dei dati. In questo modo per gli editori sarebbe stato più difficile provare il furto dei pezzi.
Il procedimento coinvolge anche Microsoft, socio con il 27% e finanziatore di lunga data di OpenAI, alla quale ha fornito oltre 13 miliardi di dollari per lo sviluppo di ChatGpt. Il colosso di Redmond è ritenuto responsabile di aver dato a OpenAI gli strumenti per le suddette violazioni del diritto d’autore. Ma azioni non corrette nella gestione dei contenuti sono imputate anche a Copilot, il servizio di AI di Microsoft. «Tali prodotti (ChatGpt e Copilot, ndr) hanno generato centinaia di miliardi di dollari (e la cifra continua a crescere) in valore di mercato per i convenuti. Neanche un centesimo è andato agli editori, il cui lavoro ha reso possibile tutto ciò», si legge nell’atto di citazione al Southern District of New York.
«È una causa storica, la più grande dopo quella intentata da 2 mila autori contro Anthropic, costretta a pagare 1,5 miliardi di dollari», osserva Franco Bernabè, fondatore di Techvisory, società specializzata in applicazioni verticali di AI, e presidente dell’Università di Trento. «Alcuni grandi gruppi editoriali possono accordarsi con OpenAI & co. per ottenere un pagamento, ma molte notizie arrivano da piccoli editori che restano privi di tutela e riconoscimento. Ciò disincentiva anche la produzione originale online, dove ormai molti contenuti sono fatti con l’AI».
Negli Stati Uniti la coppia OpenAI-Microsoft è stata citata in giudizio anche dal New York Times, che già nel 2023 aveva intrapreso le vie legali con motivazioni simili a quelle dei 400 editori locali.
La causa è stata aggiornata giovedì scorso, quando il quotidiano ha depositato un atto in cui accusa Microsoft di aver incoraggiato OpenAI ad addestrare i propri sistemi di intelligenza artificiale con articoli protetti da copyright del Times e di aver fornito servizi per facilitare tale operazione.
In Europa per ora non sono emersi procedimenti legali dello stesso peso. Tuttavia, c’è un caso simile pendente alla Corte di Giustizia Ue. L’imputato non è il duo OpenAI-Microsoft bensì Google, mentre nel ruolo dell’accusa c’è l’editore ungherese Like Company. Quest’ultimo sostiene che tra il 2023 e il 2024 Google abbia sistematicamente estratto e visualizzato parti importanti delle sue pubblicazioni per rispondere alle richieste degli utenti su Gemini, violando le norme sul copyright.
La big tech sostiene invece che la sua AI funzioni in modo diverso e produca output non copiando gli articoli, ma prevedendo le combinazioni testuali più probabili. Il 10 marzo si è tenuta la prima udienza e l’avvocato generale della Corte dovrebbe esprimersi a settembre. (riproduzione riservata)