Intelligenza Artificiale, licenze e copyright: editori e autori non possono più stare a guardare.
Nel conflitto in corso tra editori, autori e l’industria dell’AI, c’è un aspetto che non può assolutamente essere sottovalutato: la gestione delle licenze e del copyright per l’Intelligenza Artificiale.
Partiamo da novembre 2024. Un’azienda di AI, rimasta anonima, ha offerto a HarperCollins 5.000 dollari per i diritti di addestramento di un singolo albo illustrato per bambini, Santa’s Husband di Daniel Kibblesmith. L’autore ha rifiutato pubblicamente l’offerta, non per il valore economico, ma perché concedere la propria opera per l’addestramento di modelli di AI gli è parso “abominevole”.
L’episodio ha palesato un sentimento diffuso nel settore editoriale, fatto di rabbia e paura. Alla base c’è quello che è stato definito “il peccato originale dell’AI” (definizione creata da Michael Barbaro, co-conduttore del podcast THE DAILY del New York Times): l’uso non consensuale di materiali protetti da copyright, inclusi libri piratati, per addestrare i Large Language Models.
Siamo partiti con il piede sbagliato
Molti autori ed editori si chiedono come sarebbe oggi il loro atteggiamento verso l’Intelligenza Artificiale se gli sviluppatori non avessero utilizzato archivi pirata per addestrare i modelli. È così che diversi LLM hanno ottenuto accesso a milioni di testi protetti. Da lì sono partite le cause legali.
Ma qual è l’impatto di lungo periodo dell’AI generativa su scrittura ed editoria? La paura nasce anche dalla percezione di un furto già avvenuto. Diversi autori sono convinti che tutte le loro opere siano state acquisite dalle aziende di AI. Nel caso di Anthropic si parla di circa sette milioni di file digitali.
A spaventare di più però è il futuro. L’AI potrebbe arrivare a scrivere libri in grado di sostituire quelli degli autori umani, sfruttando anche le opere già ingerite nei modelli. Chiunque utilizzi strumenti come ChatGPT oggi sa già che ci sono ancora limiti evidenti, ma i sistemi di Intelligenza Artificiale ci hanno abituato a una evoluzione molto rapida, esponenziale. Quindi la possibilità che a breve un romanzo credibile possa essere scritto da una AI è tutt’altro che remota.
Il copyright non è l’unico problema
Il copyright non è l’unico problema. L’AI solleva questioni ambientali, rischi di bias nei testi e nelle immagini, diffusione di deepfake e contenuti illegali, oltre a truffe sempre più sofisticate. L’MIT mantiene un archivio che raccoglie oltre 1.600 categorie di rischio legate all’AI.
In questo contesto, il timore verso l’AI va ben oltre la difesa dei diritti d’autore.
Una risposta concreta: il licensing
Le principali aziende di AI hanno avviato accordi di licensing con grandi editori di news e periodici. AP, Condé Nast, Financial Times, New York Times, News Corp, Springer e The Atlantic hanno firmato intese, spesso con OpenAI, ma anche con Microsoft, Amazon e Perplexity.
Che poi questi editori non si siano resi conto di aver stretto un patto con il demonio questo è un altro discorso, ma negli ultimi vent’anni gli editori (di tutti i tipi) non hanno certo brillato per lungimiranza.
Molto diversa la situazione per l’editoria libraria. I dati raccolti da Ithaka S+R mostrano pochi accordi. Molti contratti restano riservati, ma la sensazione è chiara: i numeri sono limitati.
Anche perché in uno scenario di questo tipo non possiamo non porci una domanda: stringere un accordo di licensing con aziende di AI è qualcosa di utile o si tratta di vendere l’anima al diavolo, con la consapevolezza che oggi incassi un po’ di soldi ma nel medio-lungo periodo sei morto.
Competenza Vs Autorevolezza
Il problema di fondo è che un sistema di Intelligenza Artificiale per sembrare competente, non ha bisogno di tutto ma, per essere autorevole, sì. In ambiti come la medicina o l’ingegneria strutturale, l’accesso alle ricerche più aggiornate è decisivo. Nel mondo del giornalismo le cose sono diverse.
L’AI può gestire grandi quantità di letteratura, ma gran parte dei contenuti accademici resta dietro paywall. Senza licenze estese, l’AI non raggiunge una conoscenza completa.
Che ruolo hanno i libri in questo mercato?
Studi sullo storage globale dell’informazione mostrano che i libri contengono una percentuale minima dei dati mondiali. Questo non ne riduce il valore intellettuale. I libri concentrano conoscenza e, in rari casi, saggezza.
I modelli di AI eccellono nell’elaborazione di informazioni e nella costruzione di conoscenza. Non producono saggezza. Possono però rigenerare molti contenuti di saggistica a partire dai dati sottostanti.
Per accedere a dati autorevoli, le aziende di AI avranno bisogno di licenze. Molte licenze.
Un costo tutto irrisorio per le Big Tech
L’accordo transattivo tra Anthropic e gli autori ha fissato un possibile valore base per la pirateria: 3.000 dollari per libro. Il giudice ha osservato che l’azienda avrebbe potuto evitare il contenzioso acquistando copie usate e digitalizzandole.
Il messaggio per il settore è chiaro: creare un dataset di un milione di libri può costare poche decine di milioni di dollari. Un costo davvero irrisorio per realtà che operano su scale completamente diverse, in cui più che di milioni di dollari si parla di miliardi.
Quanto vale il licensing
Il valore medio stimato per libro si aggira intorno ai 100 dollari. Una cifra bassa per l’autore, significativa per i grandi cataloghi. I ricavi complessivi noti restano limitati rispetto ai costi dell’addestramento dell’AI.
Ma entra in gioco un altro discorso: un sistema di AI può conservare un libro oppure no? Perché qui cambia tutta la faccenda. ChatGPT non è una biblioteca, ma funziona come una biblioteca. Gli serve un’informazione e se la va a prendere, ma non può elaborare costantemente tutti i dati.
Se non sei al tavolo sei parte del menù
L’editoria tradizionale è in declino verticale da decenni. L’Intelligenza Artificiale non è la causa, ma un nuovo punto di svolta. La scrittura lunga e argomentata per ora resta insostituibile, anche se tutti i dati statistici in nostro possesso ci dicono che nel cosiddetto “Occidente” ormai non legge più nessuno, ed è questo il dato che dovrebbe preoccuparci.
Può sembrare un paradosso ma gli unici che “leggono” sono proprio i bot e i sistemi di Intelligenza Artificiale.
L’unica soluzione può avvenire con un intervento politico globale, ma di questi tempi ci rendiamo conto che stiamo parlando del nulla perché le priorità della politica sono altre. È probabile anche che molti politici non abbiano la più pallida idea dell’entità del problema, anzi è sicuro visto l’utilizzo che molti politici fanno dell’AI.
Ma gli editori non sono da meno, visto l’utilizzo sconsiderato e privo che stanno facendo dell’AI in tutti i settori, dalla scrittura alla traduzione, dalla promozione alla grafica.