Il New York Times vieta l’uso dei propri contenuti per l’addestramento dell’IA

I media internazionali vanno al contrattacco e alzano le barriere difensive per arginare il dilagare dell’intelligenza artificiale. Ultimo in ordine di tempo, il New York Times agli inizi di agosto ha aggiornato i Termini di servizio allo scopo di inibire l’utilizzo dei propri contenuti (testi, fotografie, immagini, file audio/video, metadati) nello sviluppo di “qualunque programma, incluso l’addestramento di sistemi di apprendimento o di intelligenza artificiale”. La novità sta proprio nel riferimento esplicito all’IA.

D’ora in poi sarà proibito, senza l’autorizzazione scritta del quotidiano americano, anche l’impiego di strumenti automatizzati come i crawler dei siti web, software utilizzati per raccogliere contenuti utili all’addestramento dei modelli di intelligenza artificiale.

Chi vìola le nuove regole può incorrere in sanzioni non meglio specificate.

Lo “scraping” dei modelli di IA

I modelli di IA come ChatGPT funzionano in modo non dissimile dai crawler. Il loro addestramento infatti è basato su quello che in gergo è noto come “data scraping”, ovvero la raccolta di dati e contenuti dai siti web. Per i detrattori si tratterebbe di una specie di “pesca a strascico”.

Fra i contenuti “raschiati” ci sono anche quelli pubblicati dalle testate giornalistiche. Contenuti protetti da copyright che i modelli di IA utilizzano senza il consenso degli autori. Molti siti d’informazione, specialmente quelli che impiegano paywall e abbonamenti, temono perdite economiche nonché la diffusione di fake news.

Per mettersi al riparo da controversie legali, alcune compagnie tecnologiche stanno studiando sistemi per bloccare l’impiego dei crawler. La scorsa settimana, OpenAI, la società madre del chatbot, per esempio ha lanciato un nuovo crawler, GPTBot, che consente alle testate di controllarne l’accesso ai contenuti dei propri siti web.

Intelligenza artificiale
Immagine | Pixabay / Geralt – Cryptohack.it

Accordi tra media e i colossi dell’IA

Se ancora non è chiaro quale sarà la contromossa dei colossi dell’IA, diverse società sono già al lavoro per trovare accordi con i principali media internazionali.

Lo stesso New York Times lo scorso febbraio ha siglato un accordo triennale da 100 milioni di dollari con Google, che consente all’azienda della casa madre Alphabet di inserire contenuti del quotidiano su alcune delle proprie piattaforme.

È il caso ancora dell’intesa siglata tra la Associated Press e OpenAI a luglio. L’accordo della durata di due anni prevede lo scambio di contenuti e tecnologie. Mentre l’agenzia di stampa internazionale potrà accedere alla tecnologia di OpenAI, l’azienda guidata da Sam Altman avrà la licenza a parte dell’archivio di AP per poter addestrare i propri algoritmi di intelligenza artificiale.

La lettera aperta per regolare l’IA

L’agenzia di stampa americana figura poi tra i firmatari della lettera aperta con cui diverse testate internazionali (incluse Agence France-Presse, Usa Today e Getty Images) lo scorso 10 agosto si sono appellate ai decisori politici affinché vengano introdotte regole globali a tutela dei diritti di proprietà intellettuale contro gli usi impropri dell’IA.

I firmatari denunciano l’utilizzo dei loro contenuti per addestrare i modelli di intelligenza artificiale “senza alcuna considerazione, remunerazione e attribuzione nei confronti degli autori”.

Gli estensori della missiva invocano quindi regole incentrate sulla “trasparenza” e sul “consenso” e chiedono di negoziare con i colossi dell’IA i termini dell’accesso ai loro contenuti. Le stesse società vengono sollecitate ad agire per eliminare fake news e informazioni “tendenziose” dai propri servizi.

Senza regole, di legge nella lettera, queste tecnologie “possono mettere in pericolo la sostenibilità dell’intero sistema dell’informazione erodendo la fiducia che il pubblico ripone nell’indipendenza e nella qualità di contenuti e minacciando la solidità finanziaria” delle testate giornalistiche.

Gestione cookie