De Carli: Archivi di lett. it. su Cd Rom

[20-6-1998]

Archivi di letteratura italiana su CD-Rom

Come cambia il lavoro degli studiosi

di Lorenzo De Carli

Nonostante le diffidenze manifestate dai molti studiosi ai quali è cara la polvere che ricopre antichi gli tomi disposti su scaffali di biblioteche deserte, le tecnologie della comunicazione stanno fornendo nuovi sussidi nient’affatto trascurabili per lo studio della letteratura. Il più prezioso di questi sussidi è quello costituito dalla possibilità di consultare rapidamente banche di dati in cui sono depositati testi della tradizione letteraria. Possono essere testi raggiungibili per mezzo di collegamenti telematici, come per esempio la rete Internet, oppure grazie a reti telematiche interne ad una università; oppure possono essere testi registrati su supporti come i CD-Rom – cosicché si è soliti distinguere tra banche dati on-line (raggiungibili mediante collegamenti telematici) e off-line (di soluto registrati su supporti magneto-ottici).

Altro sussidio importante per gli studiosi di letteratura è l’uso delle tecnologie dell’informazione per la preparazioni di edizioni critiche. Si tratta di opere che, non solo si prefiggono l’obbiettivo di fornire al lettore il testo che l’autore avrebbe voluto venisse pubblicato, ma che mettono a disposizione sussidi critici utili allo studio approfondito del testo, come per esempio varianti d’autore o informazioni sulle fonti, che solitamente vengono disposti in apparati di note posti a pie’ di pagina oppure alla fine del volume. La realizzazione di queste edizioni presuppone la necessità di confrontare più testi per accertarne le differenze (collazione), così come presuppongono un’articolazione paratestuale che distingua il corpo del testo vero e proprio dall’apparato di note (spesso tanto complesso da richiedere la redazione di più ordini di note), attività queste alla realizzazione delle quali numerosi programmi applicativi forniscono un aiuto decisivo, accompagnando lo studioso editore di testi dai primi appunto alla preparazione del testo destinato alla tipografia (una breve introduzione a questi problemi è il saggio di Gino Roncaglia intitolato Alcune riflessioni su edizioni critiche, edizioni elettroniche, edizioni in rete che si legge in Internet e le muse, a cura di Patrizia Nerozzi Bellman).

Ma siccome il lavoro critico non è mai (o non dovrebbe essere mai) un’attività svolta in solitudine, le tecnologie della comunicazione non servono solo per procurarsi o preparare testi ma anche per delineare spazi di discussione virtuali, nei quali non solo è possibile dialogare ma anche mettere in comune documenti e risultati della ricerca.

Qui ci soffermeremo soprattutto sulle banche dati testuali, ma occorre dire che gli studi di autori come Fabio Ciotti e di Gino Roncaglia, che si occupano dell’applicazione di metodologie informatiche allo studio e all’edizione dei testi letterari, delineano mutamenti profondi nell’attività critica, rinnovando i lineamenti dello studio filologico e l’ethos della ricerca letteraria, la quale – secondo il modello della ricerca scientifica – è in procinto di diventare sempre più espressione di un’intelligenza collettiva, abbandonando il modello della gelosa ricerca solitaria.

Sussidi per gli studiosi

Sebbene l’Internet dia accesso a numerose banche dati dalle quali è assai agevole prelevare liberamente copie di testi da registrare nel proprio computer con lo scopo di studiarli, i testi dei quali si viene in questo modo in possesso, oltreché non essere sempre affidabili dal punto di vista filologico, non consentono ricerche approfondite perché ciò che occorre avere è un motore di ricerca che possa scandagliarli. Ad uno studioso di letteratura, infatti, non basta avere – sebbene sia assai più comodo usare il comando «ricerca» piuttosto che compulsare un pingue tomo per trovare una parola o un concetto – una versione elettronica registrata nel proprio computer del testo che sta studiando; gli servono ben altri strumenti, come per esempio la possibilità di avere concordanze, co-occorenze, liste di frequenza, indice di luoghi, rimari, indici inversi; tutto ciò che, insomma, è sempre stato sussidio fondamentale per la critica delle fonti, per la critica testuale, per l’analisi stilistica o per l’analisi morfo-sintattica. Allo studioso serve infatti un software che svolga automaticamente quello scandaglio del testo per la realizzazione del quale era necessario compulsare per lunghi mesi numerose pagine.

Un testo di Petrarca inedito dal 1554

Recentemente sono stati pubblicati quattro CD-Rom che hanno destato molte aspettative tra gli italianisti di tutto il mondo. Si tratta della terza versione, ora compatibile con Windows, della Letteratura italiana Zanichelli (LIZ), e delle prime tre opere dell’Archivio italiano promosso dalla casa editrice Lexis: l’Opera omnia di Francesco Petrarca, Tutte le opere di Torquato Tasso e l’Archivio della tradizione lirica da Petrarca a Marino.

Dal punto di vista filologico, tutt’e quattro i CD-Rom sembrano offrire buon garanzie. I testi che essi mettono a disposizione offrono sempre le lezioni criticamente più accreditate. Il CD-Rom di Petrarca, per esempio, complessivamente curato di Pasquale Stoppelli, reca del Canzoniere il testo stabilito da Marco Santagata, mentre nel CD-Rom dedicato al Tasso leggiamo la Gerusalemme liberata nel testo stabilito da Lanfranco Caretti.

Siccome per questi CD-Rom non sono state allestite edizioni nuove (se prescindiamo dal De remediis utriusque fortune di Petrarca, inedito dal 1554 ed oggi finalmente disponibile proprio grazie a questa edizione elettronica), né quindi sono stati adottati criteri omogenei si riscontra il difetto di notevoli difformità grafiche, con la conseguenza che, in fase di consultazione, occorre inserire nel motore di ricerca tutte le grafie possibili di una parola. Ma questo limite, più che da imputarsi a questi sussidi informatici, è da ascrivere allo stato della filologia e dell’editoria italiana, la quale, spesso, dà avvio a edizioni integrali e nazionali di opere che poi mai mette a termine.

Biblioteche elettroniche in casa

Il corpus di duecento testi della tradizione lirica dal Petrarca al Marino curato da Amedeo Quondam riproduce anch’esso lo stato della filologia italiana, tale quale essa si presenta alla fine del millennio. I tesi sono stati desunti da edizioni prodotte in un arco di tempo che va dal 1858 al 1996. E' dunque facile intuire l’assenza di omogeneità linguistica e filologica, a tal segno che il CD-Rom, più che costituire un corpus omogeneo di testi, è la fotografia fedele dalla biblioteca di classici che si potrebbe comporre allineando le edizioni tuttora disponibili.

Se i tre CD-Rom pubblicati da Lexis, anche in ragione del loro costo elevato, sembrano essere destinati alle biblioteche, la Letteratura italiana Zanichelli è la terza edizione di un’opera che aspira ad una più vasta diffusione. Essa raccoglie 770 testi che coprono un arco cronologico che va dalle Laudes creaturarum di Francesco d’Assisi alle opere di Pirandello e D’Annunzio. Rispetto alla precedente versione le numerose novità consistono, tra l’altro, nella presenza della Scuola poetica siciliana, del Baldus di Folengo, delle commedie di Goldoni, nonché di riviste come la Frusta letteraria di Baretti o il Caffé degli illuministi lombardi.

Non solo letteratura

Pregio cospicuo della Letteratura italiana Zanichelli è la decisione di includere nel corpus non solo testi propriamente letterari, ma anche opere come le Vite del Vasari, i libretti di Verdi o lo Zibaldone di Leopardi; scelta che rende questo CD-Rom un prezioso archivio della cultura italiana non solo letteraria. Anche in questo caso, la maggior parte delle edizioni di riferimento offrono buone garanzie filologiche. Per Svevo si sarebbe potuto scegliere edizioni più recenti, come quella dei Romanzi curata da Pietro Sarzana; per la Vita Nova dantesca di sarebbe potuto ricorrere all’edizione procurataci da Guglielmo Gorni; però abbiamo tutto il Dossi di Dante Isella, abbiamo lo Zibaldone leopardiano curato da Giuseppe Pacella, i quali, allineati con gli altri testi, costituiscono il canone della letteratura italiana dalle origini ai primi decenni del Novecento.

Tutti i testi archiviati nei quattro CD-Rom sono stati registrati ricorrendo a quella che è ormai divenuta la prassi consueta per opere di questo tipo: dapprima si son fatte leggere le pagine da uno scanner, poi se ne è corretto il testo per rimediare ai refusi della scansione ottica, e quindi si sono codificati i testi per renderli suscettibili di analisi dal motore di ricerca.

Il motore di ricerca

Sviluppato da Eugenio Picchi presso l’Istituto di Linguistica computazionale del Consiglio Nazionale delle Ricerche di Pisa, il motore di ricerca DBT (Data Base Testuale) è lo stesso sia per le opere pubblicate da Lexis, sia per la LIZ. Senza entrare nei dettagli del suo funzionamento, basterà segnalarne le funzioni principali.

Innanzitutto è da rilevare la capacità di cercare parole o stringhe di parole all’interno di un testo o di un corpus definito dall’utente. E' una funzione grazie alla quale, in pochi secondi, possiamo trovare tutti i luoghi dell’opera di Leopardi in cui occorre la parola «casa», o possiamo cerare la parola

«vespero» nel corpus integrale della LIZ. Poi occorre rilevare la possibilità di generare concordanze, scegliendo a piacimento la lunghezza dei contesti. Questa funzione più essere esercitata tanto su unità testuali come capitoli, parti, sezioni, canti ecc., quanto su unità più ampie e intertestuali.

Se le due prime funzioni sono utili per localizzare singole parole, il motore di ricerca offre anche una funzione che permette di generare contesti in cui occorrono insiemi di parole legati fra loro con gli operatori logici AND, OR, AND NOT. A questa funzione bisogna aggiungere quella di generare indici e quella di poter fare ricerche sequenziali. Naturalmente, tutti i risultati delle ricerche non solo possono essere letti a video e stampati, ma anche esportati per essere inclusi in documenti redatti usando il computer.

Tra carta e video

Questi quattro CD-Rom, sebbene la LIZ contempli anche una sezione intitolata «Sala di lettura», non possono sostituire né i libri, né la lettura. La possibilità di redigere rapidamente concordanze e co-occorenze, eseguendo in pochi minuti lavori che richiedevano anni di certosina dedizione, consente un esame analitico dei testi, sì, ma si corre anche il rischio di non fare un’esperienza estensiva della lettura. Motori di ricerca come il DBT permettono di rilevare non solo le parole ricercate ma anche i contesti nei quali sono state usate. Spesso, però, nei testi letterari sono proprio quelle pagine in cui non sembra esservi nulla di notevole da rilevare che concorrono in maniera decisiva a stabilire il senso di ciò che è rilevante.

L’informatica disseziona e perfora il testo letterario, ma questo è come se le sfuggisse sempre. Nell’esperienza di ciascuno di noi la lettura possiede un grado di gratuità tale, da far pensare alla nozione di sperpero elaborata dallo scrittore francese Georges Bataille. A questa gratuità si contrappone la funzionalità produttiva dei mezzi informatici che dissecano e liofilizzano.

Con ciò non si vuol dire che gli strumenti informatici non siano un utile sussidio, il rischio è che inibiscano un’esperienza vitale della letteratura, che introducano esigenze di profitto e efficienza là dove la gratuità del fare sembrava voler additare una condizione umana affrancata dal dominio della ragione strumentale.