Intelligenza Artificiale per Manoscritti Medievali

Intelligenza Artificiale e manoscritti medievali: quando il Deep Learning incontra la paleografia

Indice dei contenuti

Attribuire un manoscritto medievale a uno specifico copista è un compito complesso, che da sempre richiede competenze altamente specialistiche. L’analisi delle mani scribali si fonda infatti sull’osservazione di pattern grafici ricorrenti nelle forme delle lettere, nell’andamento del tratto, nelle legature tra caratteri consecutivi e nelle spaziature, elementi che permettono di distinguere individualità scrittorie anche all’interno di tradizioni calligrafiche fortemente codificate.

Oggi, però, l’Intelligenza Artificiale apre nuove prospettive. Grazie ai progressi nel campo del Deep Learning, è possibile affiancare il lavoro dei paleografi con strumenti capaci di supportare l’analisi automatica di grandi collezioni di documenti. È in questo contesto che nasce la ricerca Towards High-level Explanations of Medieval Handwriting Identification Systems, realizzata grazie alla collaborazione tra Seeweb e il gruppo di ricerca di Basi di Dati e Big Data dell’Università “Roma Tre”, da tempo impegnato nello studio delle potenzialità dell’Intelligenza Artificiale applicata alle scienze umanistiche.

Riconoscere una mano scribale

Dal punto di vista tecnico, l’identificazione degli scribi può essere formulata come un problema di classificazione: l’obiettivo è assegnare correttamente le pagine dei manoscritti, che costituiscono l’input del sistema, ai diversi scribi (le classi) che hanno contribuito alla redazione.

Nel caso dei manoscritti medievali, tuttavia, il problema risulta particolarmente sfidante. Il degrado del supporto, lo sbiadimento dell’inchiostro e la qualità non uniforme delle immagini possono alterare l’aspetto della scrittura. A ciò si aggiunge un elemento propriamente storico: gli scribi medievali operavano entro convenzioni grafiche rigidamente codificate, che tendevano a sopprimere la variabilità individuale. Quando più copisti collaboravano alla redazione di uno stesso documento, era richiesto loro di armonizzare lo stile grafico, rendendo ancora più sottile la distinzione tra le diverse mani. In questo scenario, i segnali utili per l’attribuzione sono presenti, ma in forma debole, e risultano spesso difficili da isolare anche per sistemi automatizzati.

Il Deep Learning applicato ai manoscritti

Per affrontare queste criticità, la ricerca ha adottato modelli di Deep Learning consolidati nel campo della Computer Vision, adattandoli al particolare contesto dei documenti e delle scritture medievali. In particolare, sono state utilizzate le seguenti due architetture:

  • ResNet-18, una rete convoluzionale pre-addestrata tramite tecniche di Self-Supervised Learning.
  • Swin Transformer Tiny, un modello basato sull’architettura Transformer.

Le pagine dei manoscritti vengono suddivise in porzioni (crop) sovrapposte, ciascuna classificata singolarmente. La predizione finale a livello di pagina viene successivamente ottenuta tramite un meccanismo di majority vote sui crop che la compongono. La sperimentazione è stata condotta su diversi manoscritti medievali, tra cui codici conservati nella Biblioteca Apostolica Vaticana, caratterizzati da un numero variabile di mani scribali. I risultati hanno mostrato prestazioni di livello elevato, con valori di accuratezza sempre superiori all’80%.

Possiamo fidarci del modello?

Le ottime prestazioni predittive, da sole, non bastano però a giustificare l’impiego di questi strumenti. In un contesto come quello paleografico, un modello, seppur capace di produrre predizioni corrette, rischia di essere poco utile se non consente agli esperti di dominio di comprendere su quali elementi visivi fonda le proprie decisioni.

Per questo motivo, la ricerca si è concentrata sull’applicazione dell’Explainable AI (XAI), proponendo una metodologia per generare spiegazioni delle decisioni compiute dai sistemi automatizzati. L’obiettivo è mettere in evidenza le regioni della pagina che il modello considera più rilevanti per la corretta identificazione dello scriba. Il risultato è una mappa colorata che mette in evidenza, rispetto al comportamento del modello, le aree della pagina considerate più rilevanti o fuorvianti. Questa particolare visualizzazione gioca un ruolo fondamentale, poiché consente di esprimere il comportamento del modello in una forma leggibile anche per il paleografo stesso, che può integrare queste informazioni nella propria pratica.

Explainable AI

La fedeltà delle spiegazioni

Uno degli aspetti più significativi dello studio riguarda la valutazione della fedeltà delle spiegazioni. La domanda di partenza è semplice, ma cruciale: le aree evidenziate risultano veramente decisive per il modello?

Per verificarlo, i ricercatori hanno adottato una strategia basata sulla rimozione progressiva delle regioni considerate più rilevanti e sull’osservazione delle conseguenti variazioni di accuratezza del sistema. Il sostanziale calo delle prestazioni di riconoscimento registrato in questo contesto suggerisce che le spiegazioni prodotte non si limitano ad esprimere visualizzazioni plausibili, ma riflettono in misura significativa il processo decisionale del modello.

Il ruolo di Seeweb nella ricerca

Questa ricerca è stata possibile anche grazie alla collaborazione con Seeweb, che ha messo a disposizione infrastrutture e competenze fondamentali per l’addestramento e la sperimentazione dei modelli di Deep Learning.

L’unione tra ricerca accademica e infrastrutture cloud ad alte prestazioni dimostra come l’innovazione nasca dall’incontro tra mondi diversi: tecnologia, patrimonio culturale e intelligenza artificiale.

Conclusioni

Lo studio mostra come l’AI possa diventare un valido alleato delle scienze umanistiche, non solo migliorando le prestazioni, ma rendendo i modelli trasparenti, interpretabili e affidabili.

Per Seeweb, questa collaborazione rappresenta un esempio concreto di come le tecnologie cloud e l’AI possano supportare progetti di ricerca avanzata, contribuendo alla valorizzazione del patrimonio culturale attraverso soluzioni innovative.

CONDIVIDI SUI SOCIAL

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

47 − = 40