Le nuove frontiere della digitalizzazione di manoscritti e opere antiche grazie all’IA

Dai laboratori europei ai progetti internazionali, si delinea una nuova era della ricerca umanistica in cui algoritmi, reti neurali e ricostruzioni digitali ridanno voce a testi perduti da secoli

Partendo dall’eredità secolare dell’arte della lettura, della conservazione e dello studio del patrimonio librario, le tecnologie basate sull’intelligenza artificiale stanno oggi ridefinendo i confini della conoscenza e della tutela culturale. Strumenti all’avanguardia come il riconoscimento automatico della scrittura manoscritta (HTR), l’analisi semantica del testo e la ricostruzione digitale di frammenti dispersi, si affermano sempre più come risorse imprescindibili nella digitalizzazione, nella valorizzazione e nello studio di manoscritti antichi, codici miniati e opere librarie di pregio. Queste innovazioni stanno trasformando profondamente le prassi archivistiche e filologiche tradizionali favorendo nuove forme di accesso aperto e condiviso al sapere.

HTR e intelligenza artificiale

Le più recenti applicazioni dell’intelligenza artificiale nel campo della trascrizione e del riconoscimento automatico della scrittura (HTR – Handwritten Text Recognition) stanno rivoluzionando le modalità di accesso e studio dei documenti manoscritti e delle opere librarie antiche. Piattaforme come Transkribus, sviluppata nell’ambito del progetto europeo READ, permettono oggi di addestrare reti neurali capaci di segmentare, trascrivere e analizzare testi complessi come manoscritti in scritture corsive medievali caratterizzate da una notevole variabilità grafica e morfologica. L’evoluzione di questi strumenti ha progressivamente ampliato il raggio d’azione oltre l’alfabeto latino coinvolgendo anche tradizioni scrittorie differenti e meno accessibili: è il caso, ad esempio, dei manoscritti arabi della Biblioteca Ambrosiana resi disponibili grazie alla piattaforma Nainuwa. Questi sviluppi segnano un passaggio cruciale verso un’era in cui la trascrizione automatica non solo riduce tempi e costi del lavoro filologico, ma contribuisce in modo determinante alla diffusione della conoscenza abbattendo barriere linguistiche, geografiche e culturali.

Restauro digitale e “inpainting”

L’IA sta aprendo nuove frontiere anche nel campo della conservazione del patrimonio librario grazie allo sviluppo di tecniche di restauro digitale basate su algoritmi di inpainting. Questi strumenti permettono di ricostruire virtualmente le parti mancanti o danneggiate di un manoscritto integrando lacune iconografiche, aree abrase o decorazioni dorate scomparse senza mai intervenire fisicamente sull’oggetto originale. Un esempio emblematico è rappresentato dal progetto Unveiling the Invisible, sviluppato dal Fitzwilliam Museum di Cambridge, che dimostra come l’uso congiunto di intelligenza artificiale, imaging multispettrale e competenze storico-artistiche possa restituire visibilità a dettagli perduti. Oltre a tutelare l’integrità degli originali, il restauro digitale consente una nuova modalità di fruizione: lo spettatore può esplorare tanto la ricostruzione virtuale quanto lo stato attuale del manufatto in un dialogo continuo tra passato e presente e tra perdita e recupero.

Ricomposizione digitale dei frammenti

La dispersione dei manoscritti antichi rappresenta una sfida costante per studiosi e conservatori. In questo contesto, l’IA si rivela uno strumento potente per la ricostruzione virtuale dell’unità originaria dei codici. Progetti come Fragmentarium applicano tecniche avanzate di machine learning combinate con analisi multivariata di caratteristiche come calligrafia, pigmenti, supporti e contenuti testuali, per suggerire ricongiungimenti plausibili tra frammenti appartenenti allo stesso manoscritto. Questo approccio interdisciplinare non solo amplia le possibilità di ricerca codicologica e paleografica, ma consente di restituire una forma – anche se solo digitale – a opere rovinate o perdute. Particolarmente significativi sono i risultati ottenuti su corpus ebraici medievali, spesso frammentati a seguito di smembramenti sistematici, ma oggi finalmente riaggregabili in ambienti virtuali.

Datazione paleografica e “handwriting analysis”

L’analisi automatica della scrittura antica – o handwriting analysis – sta conoscendo una grande evoluzione grazie all’intelligenza artificiale. Strumenti come Pythia, sviluppato congiuntamente da DeepMind e l’Università di Oxford, sono in grado non solo di proporre la ricostruzione di lettere mancanti in iscrizioni danneggiate, ma anche di formulare ipotesi semantiche e cronologiche, supportando in modo innovativo il lavoro degli epigrafisti. Ciò consente di affiancare la competenza umana e l’analisi su larga scala individuando regolarità e anomalie grafiche che sarebbero altrimenti invisibili. È il caso, ad esempio, dello studio condotto dall’Università di Groningen sui Rotoli del Mar Morto: grazie all’impiego di tecniche di riconoscimento della mano scribale e alla modellazione stilometrica, è stato possibile rivedere alcune datazioni, anticipando la composizione di alcuni frammenti dal II al III secolo a.C.

Lettura virtuale di rotoli carbonizzati

Tra le imprese più emblematiche dell’unione tra scienza dei materiali, tecnologia digitale e filologia si colloca la decifrazione dei rotoli carbonizzati di Ercolano, da secoli considerati illeggibili a causa della loro estrema fragilità. Grazie a tecniche di virtual unwrapping è stato possibile “srotolare” digitalmente questi testi senza mai aprirli fisicamente, restituendo le prime lettere greche leggibili dopo quasi duemila anni di silenzio.

Progetti italiani e internazionali

La digitalizzazione dei manoscritti antichi non è più soltanto una questione di conservazione: oggi rappresenta una vera e propria infrastruttura per la ricerca, la divulgazione e la valorizzazione del patrimonio scritto. In Italia, iniziative come Codex 4D – frutto della collaborazione tra il CNR-ISPC e l’Università di Roma Tor Vergata – mostrano quanto possa essere efficace l’integrazione tra scansioni multidimensionali, IA e interfacce interattive. In questo panorama, l’Università di Palermo emerge come polo di riferimento per le Digital Humanities. Attraverso l’Airh Lab (Artificial Intelligence, Robotics for Humanities), l’ateneo sperimenta soluzioni d’avanguardia che includono acquisizione 3D, realtà aumentata, reti neurali e robotica umanistica applicate alla catalogazione, analisi e valorizzazione di manoscritti e fondi religiosi-culturali.

La spinta verso un ecosistema aperto e condiviso supera però i confini nazionali: piattaforme come e‐codices (Università di Friburgo) e Digital Scriptorium (sviluppato da diverse Università americane) promuovono da anni la messa in rete di fondi di manoscritti medievali. Ancora più ambizioso, l’International Dunhuang Project lavora per rendere accessibili online migliaia di manoscritti e documenti provenienti dalla Via della Seta, molti dei quali scritti in lingue oggi poco conosciute, conservati in istituzioni sparse tra Asia ed Europa.