Generative AI Training: anticipazioni dell’U.S. Copyright Office. Intervista a Dario Jucker

Dario Jucker, founder dello Studio legale Jucker ed esperto di diritto dell’arte e diritto d’autore, approfondisce alcune anticipazioni sull’addestramento dell’IA generativa fornite dall’U.S. Copyright Office nella Parte 3 del Rapporto “Copyright and Artificial Intelligence”

Abbiamo già trattato dello studio condotto dallo U.S. Copyright Office sulle questioni relative al diritto d’autore sollevate dall’intelligenza artificiale (IA), approfondendo la Parte 1 del Rapporto, che affronta il tema delle repliche digitali, e la Parte 2, che affronta il tema della proteggibilità degli output creati con l’IA generativa. Il 9 maggio 2025, l’Ufficio ha pubblicato una versione preliminare della terza parte “Generative AI Training” in risposta alle richieste del Congresso e alle manifestazioni di interesse delle parti interessate (“Generative AI Training. Pre-publication version”). La versione finale sarà pubblicata nei prossimi mesi, senza che siano previste modifiche sostanziali all’analisi o alle conclusioni. Ne parliamo con Dario Jucker.

La Parte 3 del Rapporto del U.S. Copyright Office “Copyright and Artificial Intelligence” fornisce alcune considerazioni preliminari sull’uso di opere protette da copyright nello sviluppo di sistemi generativi di intelligenza artificiale (IA). Cosa si intende per “Generative AI Training”? E a quale contesto tecnologico si riferisce il U.S. Copyright Office nella Parte 3 del Rapporto?

Vorrei fare una premessa. I primi di maggio è stato pubblicato il Report dell’U.S. Copyright Office, Parte Terza, dedicato al diritto d’autore e all’Intelligenza Artificiale (“IA”). Il Rapporto, che ad avviso di diversi operatori è estremamente approfondito, equilibrato ed esaustivo, redatto sotto la direzione di Shira Perlmutter (direttrice dell’U.S. Copyright Office dal 2020 e avvocato con una lunga esperienza nel settore IP) ha causato il suo licenziamento in tronco da parte del Presidente Trump.

La posizione della Perlmutter, che è anche quella della giurisprudenza americana, tiene conto della complessità della materia, ma in ogni caso prevede che la creatività umana sia l’immutabile requisito alla base della protezione autorale(Thaler v. Perlmutter, 687 F. Supp. 3d 140, D.D.C.1 8.8.23). Ad avviso del Presidente americano, lo sviluppo dell’IA deve essere favorito senza alcun compromesso, distinzione e complessità, tutti elementi che il rapporto si prefiggeva di mantenere in gioco. Stiamo quindi assistendo ad una chiara imposizione da parte dei poteri forti di questa tecnologia, dimenticando che un’analisi critica delle sue implicazioni, anche dal punto di vista giuridico, è espressione di libertà ed esercizio di facoltà critica.

Per IA generativa s’intende un sistema tecnologico estremamente complesso che utilizza un numero elevatissimo di dati e parametri (diversi milioni o miliardi), per addestrare un modello di apprendimento da parte della macchina e che consente, in modo a volte altamente trasformativo, la creazione di nuovi contenuti (cd. outputs) (What is generative AI?, IBM). Il grado di trasformazione degli outputs rispetto all’immensa mole dei contenuti immessi nel sistema è uno degli elementi fondamentali per determinare se può sussistere una violazione di diritto d’autore nei confronti dei titolari dei contenuti originali.

L’IA generativa prevede che il sistema, grazie ad un’esposizione continuativa ad esempi di apprendimento, diventi in grado di imparare dai propri errori, innalzando il proprio livello di rendimento. L’Ufficio del Copyright fa un esempio di modello di linguaggio, citando l’opera “Orgoglio e Pregiudizio” di J. Austen (ma lo stesso vale nel caso di immagini, video e audio). Nel passaggio letterario “Ci sono poche persone in Inghilterra che traggono maggiore godimento di me dalla musica, o che hanno un gusto più innato. Se avessi studiato, sarei stata una provetta …”  l’autrice ha ideato la parola “musicista”.  

L’IA è istruita con un modello matematico che genera le parole che con più alta probabilità si adattano al modello della frase, apprendendo da eventuali errori che il sistema stesso compie tentando di creare le parole. L’Ufficio del Copyright statunitense, mentre nei precedenti casi ha esaminato i temi delle repliche digitali e della protezione autorale della nuova soluzione ideata dalla macchina, ha ora concentrato l’attenzione sulla potenziale violazione del diritto d’autore nei confronti delle opere inserite nell’addestramento dell’IA, tentando di delineare possibili modelli di licenza.  

Il dibattito su questi temi è centrale e fitto di commenti, opinioni e consensi talvolta non unanimi. Negli Stati Uniti sono in corso decine di contenziosi incentrati sull’applicazione della dottrina del fair use ossia sull’eccezione al copyright per opere create mediante sistemi di IA generativa. Esistono precedenti significativi in Italia? E in Svizzera come è affrontato il tema dell’IA generativa?

Negli Stati Uniti, i numerosi casi giudiziari riguardano la protezione del diritto d’autore delle opere create mediante l’IA (si vedano: Thaler v. Perlmutter, 687 F. Supp. 3d 140, D.D.C.1 8.8.23; Zarya of the Dawm, Copyright Office Decision 21.2.23; Théatre D’Opèra Spatial, Copyright Office Decision 5.9.23; Allen v. Perlmutter, Case N. 1:24-cv-02665, U.S.D.C. CO. 26.9.24). Il principio generale è che la creatività umana rimane il requisito essenziale per la protezione autorale, ma si stanno aprendo anche interessanti brecce, prevedendo ad esempio che la protezione possa essere concessa qualora la creatività umana sia espressa attraverso l’utilizzo dell’IA.

Bisognerà esaminare caso per caso, ma resta determinante la qualità d’interazione tra la macchina e l’uomo; se gli “elementi espressivi” dell’opera sono determinati prevalentemente dall’IA , non si raggiungono gli standard per la protezione del diritto d’autore. Il caso Naruto v. Slater rappresenta un estremo: una scimmia realizza un selfie, così sancendo il principio per cui entità non umane assumono un ruolo preminente nel processo creativo.

Una maggiore apertura è invece prevista nella giurisprudenza cinese, dove è stato riconosciuto che alcuni outputs generati dalla IA sono opere proteggibili, che permettono agli esseri umani di esprimere originalità e ottenere risultati intellettuali (Li v. Liu, Bejing Internet Court (BIC) 2023).  In Cina è anche stata condannata una società di IA per avere violato il diritto d’autore su un personaggio di fantasia poiché l’autore dell’output aveva copiato ed adattato alcune immagini (Guandgong Higher People’s Court, Feb. 2024).

In Inghilterra, è pendente alla High Court di Londra il caso Getty v. Stability AI, nel quale, secondo la ricostruzione attorea, l’IA generativa sarebbe stata addestrata utilizzando numerosissime immagini in violazione dei diritti d’autore e della banca dati di Getty Images. Getty v. Stability AI ci sta mostrando le difficoltà procedurali di carattere preliminare che un caso di questo tipo può implicare. In Italia, occorre notare che non esiste preclusione a priori per la protezione autorale di un’opera realizzata da un software (cfr. Cass. civ. 1107/23): “L’impiego di un programma di software per la creazione di un’opera non esclude di per sé la protezione da parte del diritto d’autore dell’output”.

La Suprema Corte ha puntualizzato che l’utilizzo di un software sarebbe compatibile con l’elaborazione di un’opera dell’ingegno il cui tasso di creatività andrebbe scrutinato con maggiore rigore. Ciò richiede di chiarire l’intervento dell’IA per verificare se esso abbia reso recessiva l’elaborazione creativa dell’artista che se ne era avvalso.

Nella EU, è in vigore il Regolamento IA, che tratta del diritto d’autore ribadendo alcuni principi, già sanciti nella cd. Direttiva Copyright, e prevedendo alcuni obblighi: 

  • il principio generale per cui l’utilizzo dei contenuti protetti da diritto d’autore richiede il consenso dei titolari, salvo eccezioni;
  • la possibilità da parte del titolare di escludere alcuni materiali dall’addestramento dell’IA (c.d. opt-out);
  • l’obbligo di trasparenza del fornitore, tramite la redazione di una sintesi dei contenuti utilizzati per addestrare l’IA; e
  • l’obbligo di marcare i materiali manipolati con l’IA.

Si segnala infine il Disegno di Legge 1146/24 “Disposizioni e delega al Governo in materia di IA”, approvato dal Senato e attualmente all’esame della Camera, il quale prevede – in modifica dell’art. 1 LDA –  che anche le opere create con l’ausilio di strumenti di IA sono protette dal diritto d’autore, a condizione che la loro creazione derivi dal lavoro intellettuale dell’autore e consente inoltre la riproduzione e l’estrazione da opere o da altri materiali contenuti in rete o in banche dati cui si ha legittimamente accesso, effettuate tramite l’utilizzo di modelli e sistemi di IA, conformemente agli artt. 70-ter e 70-quater LDA.

In Svizzera, non esiste una legislazione specifica sull’IA, né vi sono precedenti giurisprudenziali. È stato pubblicato nel febbraio di quest’anno un rapporto sul Regolamento dell’IA. Con riferimento al diritto d’autore, la questione dell’IA è stata già affrontata nell’ambito della consultazione sulla revisione parziale della Legge sul Diritto d’Autore (LDA; RS 231.1) e, per il momento, la maggioranza dei consultati si è espressa a sfavore di una regolamentazione degli aspetti dell’IA legati al diritto d’autore.

Le rivoluzionarie tecnologie coinvolte attingono a enormi quantità di dati, comprese le opere protette da copyright. Le azioni in questione richiedono il consenso o il compenso dei titolari dei diritti d’autore?  E, nel caso in cui lo richiedano, come si può fare per ottenerlo?

Esiste una grande varietà di contenuti ed utilizzi, ma sono allo studio diverse possibilità di licenza. L’Ufficio del Copyright statunitense, nella misura in cui sarà necessaria una licenza da parte dei titolari delle opere protette, conferma che sono già diffusi nel mercato alcuni modelli di cd. licenze volontarie, sia individuali che collettive, ovvero amministrate tramite gli enti di gestione. Naturalmente diversi operatori del settore IA ritengono che l’utilizzo di opere per l’addestramento non costituisca una violazione del diritto d’autore e che dunque non sia necessaria alcuna licenza. La questione è comprendere se il modello delle licenze volontarie permetta la concessione di una sufficiente quantità e varietà di opere per addestrare l’IA e se il costo e il lavoro amministrativo di tali licenze saranno sostenibili da parte dell’industria.

L’Ufficio del Copyright è favorevole alle licenze volontarie e, per determinati settori, pensa al modello delle licenze collettive estese. Quest’ultimo modello prevede la negoziazione a valore di mercato tra un ente collettivo operante in uno specifico settore e gli utilizzatori, con facoltà, conformemente al Regolamento Europeo, di opt-out da parte degli autori.

Applicando la legge attuale sul copyright, l’Ufficio conclude che le diverse fasi dello sviluppo dell’IA generativa possono comportare l’utilizzo di opere protette da copyright con modalità che coinvolgono i diritti esclusivi dei titolari dei diritti. La questione fondamentale è se questi atti di potenziale violazione (prima facie) possano essere giustificati come “utilizzazioni libere” (fair use). Qual è la posizione del U.S. Copyright Office?

La posizione del Copyright Office è variegata e tiene conto della complessità del sistema, per questo motivo, è osteggiata da parte del Presidente americano, che si schiera senza indugio a favore delle Big Tech.

Ricordo che le utilizzazioni libere (cd. fair use) in U.S. prevedono un test che analizza i seguenti fattori:

  1. lo scopo e la natura dell’utilizzo dell’opera, incluso se l’uso è per scopo commerciale o no profit. In questo elemento è determinante comprendere se, e in quale misura, vi sia stata trasformazione dell’output rispetto alle opere originarie;
  2. la natura dell’opera protetta (alcune opere – romanzi, film, arte figurativa, musica –  sono più espressive/creative di altre);
  3. l’ammontare dell’opera utilizzata;
  4. l’effetto dell’utilizzo nel mercato potenziale delle opere originarie.

L’Ufficio del Copyright sostiene che diversi utilizzi di opere protette nell’addestramento dell’IA sono potenzialmente trasformativi. Numerosi commentatori ritengono che lo scopo dell’utilizzo delle opere protette per addestrare sistemi generativi sia diverso dallo scopo delle opere originali. Le opere protette avrebbero uno “scopo espressivo”, mentre gli outputs avrebbero uno scopo analitico e statistico.Google ha affermato che, poiché l’addestramento è un processo per decostruire opere esistenti allo scopo di creare modelli matematici che determinano il funzionamento del linguaggio, ciò servirebbe ad uno scopo diverso rispetto a quello creativo-espressivo per il quale sarebbero stati creati. 

La posizione dell’Ufficio è in linea con quest’interpretazione. È difficile paragonare specifiche opere immesse nel sistema – ad es. un’opera letteraria in varie lingue – con un output costituito da un modello di linguaggio capace di tradurre email, correggere la grammatica o rispondere a domande sulla letteratura del XX secolo – senza percepire una trasformazione dell’opera originaria.

Naturalmente questo non è sempre il caso. La trasformazione opera, infatti, a diversi livelli e l’applicabilità di tale principio dipenderà dalla funzionalità del modello e da come sarà sviluppato, non sussistendo trasformazione se gli outputs saranno sostanzialmente simili alle opere originarie. L’Ufficio si attende che alcuni utilizzi di opere protette per addestrare l’IA costituiranno “fair use” e altri non soddisferanno tale requisito. Ad esempio, la copia da fonti illegali di opere ad alto contenuto creativo-espressivo per generare contenuti sostanzialmente simili che competano nel mercato sarà considerata illecita. Molti altri usi saranno probabilmente nel mezzo e dovranno essere scrutinati caso per caso.   

La posta in gioco è alta: alcuni ritengono che richiedere alle aziende di IA di concedere licenze per opere protette da copyright significherebbe “strozzare” una tecnologia trasformativa, altri temono che l’addestramento senza licenza corroda l’ecosistema creativo, con l’utilizzo dell’intero patrimonio di opere degli artisti contro la loro volontà per produrre contenuti in concorrenza con le loro opere sul mercato. Infine, l’interesse pubblico richiede di trovare un equilibrio tra le diverse posizioni, che permetta all’innovazione tecnologica di evolversi e al tempo stesso di mantenere una comunità creativa fiorente. Qual è la tua opinione al riguardo?

Come espresso dal parere, si tratterà di trovare una soluzione mediana tra diversi interessi. Non è ragionevole tentare d’imporre una tecnologia, visti gli ingenti interessi economici in gioco. Il Presidente Trump sta tentando in modo maldestro d’imporre una tecnologia, facilitandone lo sviluppo, favorendo i suoi sostenitori e tentando di colmare ciò che separa gli Stati Uniti dalla Cina. Mi sembra che l’approccio EU sia ragionevole, prevedendo il principio della trasparenza e la possibilità di opt-out da parte degli autori.

Vorrei chiudere con un po’ di umorismo, ricordando una vignetta apparsa sul Foglio in occasione della Festa del Lavoro. Veniva raffigurato un robot comodamente seduto in poltrona a leggere il giornale mentre diceva: “Noi esseri artificiali avremmo dovuto sostituire gli operai, i quali si sarebbero dedicati all’arte. È finita che noi dipingiamo, creiamo video, scriviamo libri, e in cantiere ci vanno sempre loro”.

Dario Jucker si è laureato in giurisprudenza all’Università degli Studi di Milano e ha conseguito un Master of Laws alla Columbia University. È attivo sin dalla fine degli anni ‘90 nel settore del diritto dell’arte, offrendo consulenza legale a collezionisti, musei, fondazioni di artisti e mercanti d’arte. Dopo avere collaborato con diversi studi legali in Italia e in Svizzera, fonda nel 2018 lo studio legale Jucker.  Ammesso al patrocinio nelle giurisdizioni italiane e svizzere, offre consulenza in materia di diritto dell’arte per fattispecie cross-border tra i due Paesi. È consulente dell’Archivio Josef Albers per il quale combatte il mercato delle contraffazioni e di diversi altri archivi nella corrente gestione e valorizzazione, oltre che di gallerie, mercanti d’arte e collezionisti privati. 

Ha curato il volume Le buone pratiche del collezionismo edito da Edizioni Scientifiche Italiane e ha contribuito a numerose pubblicazioni in materia di diritto dell’arte. Nel 2009 ha conseguito un diploma in pittura magna cum laude all’Accademia di Belle Arti di Brera e, in parallelo all’attività legale, ha tenuto esposizioni personali in Svizzera sia di fotografie che di disegni. Partecipa abitualmente a conferenze in materia di diritto dell’arte e trasferimento di beni culturali ed è ospite frequente della RSI, Radiotelevisione Svizzera Italiana.