IA Generativa e diritto d’autore nello studio di EUIPO. Intervista a Federico Cerboni

Federico Cerboni, avvocato e senior associate, TARGET, approfondisce il tema dello sviluppo della GenAI e tutela del copyright, nell’ambito della normativa UE, affrontato nel recente studio di EUIPO

Il 12 maggio 2025 l’Ufficio dell’Unione Europea per la Proprietà Intellettuale (EUIPO) ha pubblicato uno studio intitolato The development of Generative Artificial Intelligence from a Copyright perspective. Questo studio, molto atteso, è il risultato di un’approfondita ricerca e analisi sullo sviluppo dell’intelligenza artificiale generativa dal punto di vista della tutela del diritto d’autore nell’ambito della normativa dell’UE. Ne parliamo con Federico Cerboni, avvocato e senior associate di TARGET.

Negli ultimi anni le tecnologie di intelligenza artificiale (IA) hanno registrato progressi significativi, in particolare, con il rilascio dei modelli linguistici di grandi dimensioni e dei sistemi di IA generativa (GenAI). I servizi GenAI che generano testi, codici, immagini, video e contenuti audio sono ora ampiamente disponibili. Ciò ha condotto i policymaker e le autorità di regolamentazione a esaminare come i sistemi giuridici esistenti dovrebbero evolversi per affrontare le implicazioni legate all’adozione su larga scala dell’IA e per bilanciare l’innovazione con la protezione della proprietà intellettuale (PI).

Lo studio di EUIPO affronta tre principali argomenti: (1) l’analisi tecnica, giuridica ed economica per comprendere meglio la funzionalità della GenAI e le implicazioni del suo sviluppo, con un esame dettagliato delle questioni relative al diritto d’autore riguardanti (2) l’uso dei contenuti nello sviluppo dei servizi GenAI e (3) la generazione di contenuti.

Il diritto d’autore è una pietra miliare nel sistema economico attuale in quanto offre agli autori, alle imprese culturali e creative, ai produttori e alla società in genere vantaggi competitivi non trascurabili. In generale, qual è il ruolo di EUIPO in materia di diritti di proprietà intellettuale? E quale il suo impegno nella protezione del diritto d’autore nel contesto dell’Unione europea con riguardo all’IA?

Le istituzioni dell’Unione europea rivestono da sempre un ruolo centrale nella tutela del diritto d’autore, poiché hanno uniformato e dettato i principi che sono poi stati recepiti dagli Stati membri nei diversi sistemi nazionali. Tale centralità si è poi acuita nei campi del diritto digitale e, oggi, dell’intelligenza artificiale.

In un contesto di forte incertezza, quantomeno con riferimento all’impatto di certi strumenti sulla sfera giuridica dei titolari di diritti di proprietà intellettuale, l’UE ha adottato direttive e regolamenti che forniscono i principi e le regole di condotta da tenere per evitare che la diffusione di nuovi strumenti digitali e tecnologici possa incidere negativamente sui titolari di diritti di proprietà intellettuale. A tal proposito, devono essere menzionati tre strumenti normativi cardine: la Direttiva 2001/29/CE (Direttiva InfoSoc), la Direttiva UE 2019/790 (Direttiva sul diritto d’autore nel Mercato Unico Digitale o CDSM) e il Regolamento UE 2024/1689 (noto come AI Act).

L’EUIPO, con l’Osservatorio Europeo sulle Violazioni dei Diritti di Proprietà Intellettuale, conduce studi e approfondimenti in materia di diritto digitale e di intelligenza artificiale e fornisce costante supporto all’attività legislativa della Commissione europea.

Inoltre, nel proprio Strategic Plan 2030, l’EUIPO ha annunciato l’intenzione di collocare il diritto d’autore al centro dei quadri regolatori che sostengono la competitività e l’innovazione europee. Tra gli obiettivi vi sono quello di condurre un’attenta e costante attività di studio delle nuove tecnologie e quello di implementare la propria attività di divulgazione e di educazione digitale.

Nello studio recentemente pubblicato da EUIPO, intitolato The development of Generative Artificial Intelligence from a Copyright perspective, vengono ripercorsi e approfonditi questi temi in modo organico e viene offerta una panoramica globale relativa ai rischi connessi alla diffusione dell’intelligenza artificiale generativa e agli strumenti per utilizzarla al meglio.

Lo studio è stato preparato da un gruppo di ricerca della Facoltà di Giurisprudenza dell’Università di Torino e dal Nexa Center for Internet & Society del Politecnico di Torino per EUIPO. La ricerca, condotta tra settembre 2024 e marzo 2025, è stata supportata da un’ampia attività di desk research e da interviste a gruppi di stakeholder chiave, tra cui titolari di diritti d’autore, aziende di IA, fornitori di soluzioni tecnologiche e organizzazioni pubbliche.

L’intelligenza artificiale generativa (GenAI) si basa sullo sfruttamento dei contenuti esistenti per generare nuovo materiale e introduce un nuovo paradigma, in cui non tutti i contenuti sono creati dall’uomo. GenAI solleva ora questioni urgenti sull’uso lecito di contenuti protetti dal diritto d’autore come, ad esempio, gli input per addestrare i sistemi GenAI, e sui modi in cui possiamo distinguere tra contenuti protetti dal diritto d’autore e contenuti che non lo sono. Lo studio di EUIPO affronta alcune di queste questioni ponendo il diritto d’autore al centro di un dibattito di rilevanza internazionale. Quali sono i principali aspetti evidenziati dallo studio The development of Generative Artificial Intelligence from a Copyright perspective?

Si tratta anzitutto di un testo molto completo e dettagliato, oltre 400 pagine di ricerca sia tecnica che giuridica. Un vero e proprio manuale di studio per chiunque sia interessato all’approfondimento della complessa relazione tra AI generativa (e le sue innumerevoli sfumature) e diritto d’autore.

Lo studio fornisce anzitutto una definizione di GenAI: “While the AI Act does not use or define the term ‘Generative AI’ (‘GenAI’), this term is understood to refer to the specific subset of AI systems which are designed and used for the creation of machine-generated outputs. Recital 99 of the AI Act states that “Large generative AI models are a typical example for a general-purpose AI model, given that they allow for flexible generation of content, such as in the form of text, audio, images or video, that can readily accommodate a wide range of distinctive tasks”. Thus ‘GenAI models’ are understood to be a subset of General-Purpose AI models if they fulfil the definition in the AI Act as stated above”.

Da tale definizione si comprende immediatamente quanto sia forte il collegamento tra GenAI e il mondo del diritto d’autore.

Lo studio si prefigge dunque l’obiettivo di analizzare qual è lo stato dell’arte tecnico e giuridico nell’ambito dell’Unione europea e passa in rassegna le principali soluzioni tecniche e giuridiche che consentono (i) agli autori di proteggersi qualora non volessero che le proprie opere fossero utilizzate come input per l’“addestramento” dei sistemi di GenAI e (ii) agli utenti (anche a presidio di interessi di natura pubblicistica) di riconoscere se un’opera è generata da (o con l’aiuto di) sistemi di GenAI.

Come giustamente evidenziato, l’AI è una risorsa proprio per chi si occupa creatività, poiché fornisce agli autori alcuni strumenti innovativi e molto efficaci, che consentono di raggiungere risultati difficilmente immaginabili fino a poco tempo fa.

Allo stesso tempo, i soggetti che possono trarre maggior beneficio dallo sviluppo e dalla diffusione della GenAI sono proprio coloro che maggiormente possono subirne le conseguenze negative. In assenza di idonee e adeguate tutele e protezioni, la GenAI utilizzata in modo non corretto può potenzialmente causare violazioni dei diritti di esclusiva di titolarità di artisti, editori, scrittori e creativi in generale.

Per questo, nello studio, vengono approfonditi e posti in rassegna gli interventi del legislatore europeo per armonizzare la disciplina e fornire ai titolari dei diritti degli strumenti di prevenzione e tutela; viene inoltre offerta una panoramica sui principali contenziosi che hanno avuto ad oggetto i sistemi di GenAI (tra tutti quello promosso negli U.S.A. dagli editori del New York Times contro OpenAI, “The New York Times Company v Microsoft Corporation and OpenAI Inc. et al, Case 1:23-cv-11195”) e vengono fornite le soluzioni giuridiche e tecniche per  prevenire la violazione dei diritti di proprietà intellettuale sia nella fase input(quindi in quella di addestramento delle macchine), sia nella fase output, ossia per evitare che i contenuti generati dalla GenAI possano ledere il copyright.

Lo studio di EUIPO si concentra su tre tematiche interconnesse tra loro: (1) l’uso di opere protette dal diritto d’autore come i dati di addestramento per i modelli GenAI, (2) la generazione di nuovi contenuti da parte di questi sistemi e le questioni giuridiche che ne discendono e (3) le implicazioni più ampie per i creatori, gli sviluppatori di IA e l’ecosistema del copyright. Quali sono i principali interrogativi che lo studio si propone di affrontare?

Questi sono sicuramente i tre punti centrali che fanno un po’ da driver dello studio. Quanto all’uso di opere protette per l’addestramento della GenAI, viene posta grande attenzione sui c.d. “TDM opt-out”, ossia gli strumenti attraverso cui i titolari dei diritti di proprietà intellettuale possono esprimere la propria riserva (sia in modo espresso e testuale, sia attraverso strumenti informatici) rispetto all’uso delle proprie opere per il training dei sistemi di intelligenza artificiale.

Viene poi evidenziata la crescente esigenza che sviluppatori dei sistemi di GenAI si comportino in modo trasparente come prescritto all’art. 50 dell’AI Act, sia con riferimento all’utilizzo degli input da parte degli sviluppatori, sia con riferimento alle caratteristiche degli output.

Con particolare riferimento agli output, vengono indicati tre tipi di prodotti rispetto ai quali elevare il grado di attenzione: (i) contenuti sintetici di carattere generale, (ii) i deepfake o (iii) i testi generati a fini informativi su questioni di interesse pubblico. Dati i rischi che si celano dietro la mancata identificazione di tali prodotti come frutto di elaborazione di intelligenza artificiale, è necessario che tali output siano progettati in modo da essere subito identificabili per gli elaboratori e per gli utenti.

In che modo la GenAI utilizza i contenuti protetti da copyright? Qual è il quadro normativo dell’Unione europea applicabile a tale utilizzo e come possono i titolari dei diritti d’autore riservarsi i propri diritti e escludere i contenuti dalla formazione di GenAI? Quali sono le tecnologie in via di sviluppo per contrassegnare o identificare i contenuti generati dall’IA? E infine, quali sono le opportunità per i titolari dei diritti d’autore di concedere licenze per l’utilizzo dei loro contenuti da parte di GenAI?

I sistemi di GenAI utilizzano contenuti protetti dal diritto d’autore principalmente nella fase di addestramento. I modelli vengono infatti alimentati con enormi quantità di testi, immagini, audio e video, raccolti in modo massivo dal web o da altre fonti accessibili, per effettuare operazioni di text and data mining (TDM). Attraverso questo processo i sistemi apprendono schemi statistici e regole di associazione che consentono loro di produrre nuovi contenuti.

Uno dei principali problemi legati a tale sistema di apprendimento viene definito “memorisation”. Si è infatti riscontrata la tendenza da parte dei sistemi di GenAI di riprodurre in modo quasi identico opere contenute nei dataset, con il rischio (anzi, molto più di un rischio) che vengano lesi diritti di autore di chi ha prodotto e realizzato tali prodotti creativi.

Da un punto di vista normativo, la Direttiva CDSM ha introdotto eccezioni e limitazioni in materia di TDM, distinguendo tra usi a fini di ricerca scientifica e usi più ampi. Come già accennato, in entrambi i casi, la Direttiva CSDM prevede che i titolari dei diritti possano riservarsi il diritto di escludere che le proprie opere vengano usate strumenti di addestramento dei sistemi di GenAI.

I titolari che desiderano riservarsi i propri diritti possono farlo attraverso strumenti sia giuridici sia tecnici. Da un lato, è possibile dichiarare la riserva nei termini di utilizzo di siti o piattaforme, oppure inserendo clausole contrattuali che vietino lo scraping e l’uso dei contenuti a fini di addestramento. Dall’altro, stanno emergendo soluzioni tecniche che rendono tale riserva leggibile in maniera automatica dagli elaboratori: per esempio l’uso del file robots.txt, che comunica ai sistemi di acquisizione il divieto di accesso a determinate risorse, o l’inserimento di metadati specifici direttamente nei file digitali, così da “portare” con sé l’indicazione di opt-out. Esistono inoltre registri centralizzati chiamati “Do Not Train” che raccolgono le dichiarazioni dei titolari e permettono agli sviluppatori di verificarle più facilmente.

Accanto agli strumenti di riserva, lo studio prende in considerazione anche le tecnologie pensate per contrassegnare o identificare i contenuti generati dall’intelligenza artificiale. Tra queste figurano i sistemi di provenance tracking, che associano metadati alla storia del file e indicano se esso è stato creato o modificato da un sistema generativo. Altri approcci includono il watermarking, cioè l’inserimento di segni nascosti all’interno dei contenuti, o il fingerprinting, che crea impronte digitali per consentire confronti e controlli. Sono in fase di sviluppo anche strumenti di rilevazione automatica, basati su algoritmi più sofisticati.

Infine, lo studio sottolinea che, oltre alla possibilità di escludere i propri contenuti dall’uso da parte delle IA, per i titolari dei diritti esiste anche la prospettiva di trarne beneficio economico attraverso accordi di licenza. Sta infatti emergendo un mercato di licenze dirette tra editori, creatori e sviluppatori di intelligenza artificiale, in cui vengono stabilite condizioni precise per l’uso dei dati nei dataset di addestramento, con la possibilità di ottenere remunerazioni e mantenere un certo grado di controllo. Questo modello, sebbene ancora in evoluzione, è considerato promettente perché può conciliare innovazione tecnologica e tutela dei diritti, favorendo uno sviluppo più equilibrato del settore.

In sintesi, dunque, GenAI utilizza i contenuti protetti come materiale di base per apprendere, ma il diritto dell’Unione europea offre strumenti affinché i titolari possano riservarsi i propri diritti e, allo stesso tempo, valutare opportunità di sfruttamento commerciale tramite licenze. Le tecnologie di marcatura e identificazione dei contenuti generati costituiscono un tassello fondamentale di questo ecosistema, poiché permettono di distinguere meglio ciò che è umano da ciò che è artificiale, rafforzando la trasparenza e la fiducia nel mercato.

A quali conclusioni perviene lo studio di EUIPO?

Le conclusioni a cui perviene lo studio sono una sintesi di tutto quanto detto fino ad ora. Ci sono molti problemi nuovi e soluzioni da esplorare, ci sono linguaggi da comprendere e da coordinare tra di loro.

Tra le principali problematiche: (i) risultano ancora incerti i meccanismi per l’espressione deglioptout” e non è stato ancora elaborato uno standard di settore; (ii) non esiste uno standard uniforme neppure per identificare e rendere trasparente la generazione di opere da parte dei sistemi GenAI. Le tecnologie esistenti (watermarking, provenienza, fingerprinting) non sono ancora adottate in modo coerente e particolarmente efficace; (iii) si osserva un crescente interesse verso accordi di licenza diretta per l’uso di contenuti protetti come dati di addestramento, che potrebbero diventare un modello economico sostenibile, ma ancora non è stata riscontrata casistica particolarmente significativa.

Infine, ci si attende che le Autorità pubbliche si adoperino per dare supporto con soluzioni tecniche, ad esempio, mediante l’istituzione di un registro centrale machinereadable per optout, standard per tracciabilità delle opere ecc. e non tecniche (linee guida, modelli contrattuali, campagne informative) per rendere sostenibile il bilanciamento tra innovazione e diritti d’autore.

Entro la fine del 2025, EUIPO ha in programma di lanciare l’EUIPO Copyright Knowledge Centre. Di cosa si occuperà il Centro con riguardo alla GenAI?

L’EUIPO Copyright Knowledge Centre è un centro di ricerca che sarà istituito per fornire informazioni e supporto pratico ai titolari di diritti d’autore che vogliono gestire e proteggere i propri asset. Tale nuovo organismo si innesta nell’ambito della più ampia intenzione dell’Ufficio di contribuire, in cooperazione con istituzioni europee e internazionali, allo sviluppo di soluzioni tecniche e servizi di mediazione che aiutino a far sì che, anche nell’era GenAI, il copyright continui a sostenere creatori e progresso tecnologico.

Federico Cerboni è avvocato e senior associate di TARGET. Si occupa principalmente di contenzioso e di arbitrato in materia societaria, contrattuale e proprietà intellettuale. Laureato in Giurisprudenza presso l’Università di Pisa, è iscritto all’Albo degli Avvocati di Milano.