Organizzare l’archivio digitale dei documenti
Così come in un archivio cartaceo i documenti sono normalmente inseriti in cartelle, raccoglitori, scaffali e librerie secondo una logica a matrioska, un archivio elettronico può mimare lo stesso modello, in cui i singoli file sono memorizzati secondo una struttura ad albero all’interno di directory nidificate su un volume di destinazione, sia esso locale o di rete.
Per fare un esempio, sul volume X l’archivio Fatture potrà essere diviso nelle due sottodirectory Fatture emesse e Fatture d’acquisto, che a loro volta conterranno cartelle singole per anno d’attività e, al livello inferiore, dodici folder separati per ciascun mese dell’anno, con i singoli file al loro interno. I file delle fatture emesse potranno essere nominati per numero progressivo, mentre la denominazione dei file delle fatture d’acquisto potrà seguire un diverso criterio che renderà comunque univoco e facilmente identificabile ciascun documento elettronico, per esempio tramite un numero di protocollo progressivo.
Scegliere il formato dei file
La logica apparente imporrebbe di impostare sempre una risoluzione di scansione elevata per ottenere la massima fedeltà e definizione dei documenti digitalizzati. Certamente, un documento da destinare alla ristampa richiederà una risoluzione superiore a quello destinato alla semplice visione su un monitor. Tuttavia, non è sempre necessario forzare lo scanner alla massima potenzialità per ricavare risultati ottimali, poiché in molti casi potrebbe essere preferibile optare per un accettabile compromesso tra qualità e dimensioni dei file, attributi strettamente correlati.
Documenti prevalentemente testuali non destinati alla modifica, ovvero da archiviare senza sottoporre ad alcun processo di riconoscimento ottico dei caratteri (Ocr), possono essere acquisiti in bianco e nero o in scala di grigi alla risoluzione di 200 ppi (spesso il valore predefinito in molti software), in modo da ottenere un documento perfettamente leggibile e stampabile, ma un file di ridotte dimensioni. Trovare il miglior equilibrio tra qualità e peso dei file non è un semplice esercizio di risparmio di spazio d’archiviazione, ma un modo per migliorare l’efficienza di un archivio composto di una grande quantità di elementi. In molti casi, i software di scansione implementano algoritmi di riconoscimento del tipo di documento per ottimizzare automaticamente l’output e far così risparmiare tempo prezioso all’operatore in fase di pre e post-scansione.
È opportuno qui dedicare qualche riga all’esame dei principali formati di output previsti dai programmi di scansione, per evidenziarne pregi e difetti.
In ambito documentale, il primato assoluto per importanza e diffusione spetta al formato Pdf, che costituisce lo standard di fatto nel mondo dell’archiviazione elettronica.
Acronimo di Portable Document Format, lo standard creato da Adobe è un linguaggio di descrizione della pagina che può essere inteso come un contenitore di elementi non modificabili (testi, immagini, grafica bitmap e vettoriale, collegamenti ipertestuali e contenuti multimediali), visualizzabili in modo uniforme su tutte le piattaforme software esistenti.
La scelta di salvare una scansione in formato Pdf assicura una copia perfetta del documento originale. Una sua variante, il Pdf/A, è stata adottata come standard Iso per l’archiviazione di documenti elettronici nel lungo periodo. Occorre tuttavia notare che per mantenere la compatibilità universale è stato necessario imporre alcune limitazioni rispetto alla versione standard del formato, come l’esclusione di contenuti multimediali e di collegamenti ipertestuali esterni, l’incorporazione delle font presenti nel documento e l’uso obbligatorio di metadati standard.
In ordine d’importanza, dopo il Pdf il posto d’onore spetta al Tiff (Tagged image file format), un formato raster versatile, caratterizzato da una buona compatibilità con tutti gli ambienti operativi e che supporta immagini dal bianco e nero fino al colore a 32 bit. Le immagini Tiff sono file lossless (senza perdita di qualità ), pertanto possono assumere dimensioni rilevanti se generati da scansioni ad alta risoluzione e profondità colore. Tiff è il formato preferito per l’archiviazione a lungo termine in ambito fotografico. Tra le sue caratteristiche avanzate vi è la capacità d’incorporare più immagini in un unico file e la possibilità di applicare algoritmi di compressione non distruttiva per ridurre le dimensioni dei file.
Poiché i file risultanti potrebbero non essere sempre leggibili da alcuni software grafici, queste opzioni dovrebbero essere usate con una certa cautela, soprattutto se i documenti elettronici dovessero essere distribuiti a destinatari esterni all’ufficio.
Il terzo formato più diffuso, largamente impiegato in ambito fotografico, è il Jpeg. La sua peculiarità è l’impiego di un algoritmo a perdita d’informazione che riduce le dimensioni del file eliminando in misura variabile le informazioni ridondanti e poco percepibili dall’occhio umano.
Il risultato è un’immagine che offre una qualità e un livello di dettaglio proporzionale alle dimensioni del file, che dipende dal livello di compressione impostato. I principali vantaggi del Jpeg consistono nella flessibilità e nella compatibilità . Si tratta di un formato che si adatta facilmente alle esigenze dell’output: immagini destinate alla presentazione a video, alle pagine web oppure a stampe di piccole dimensioni possono essere processate con un’elevata compressione per generare file leggeri; soggetti che richiedono una qualità superiore devono essere trattati in modo meno aggressivo, a fronte, però, di una maggior occupazione di spazio su disco.
In ogni caso, indipendentemente dall’entità della compressione, un file Jpeg manterrà la compatibilità con qualsiasi ambiente operativo e programma di visualizzazione, anche datato. Per queste ragioni, potrebbe rappresentare un compromesso accettabile per il salvataggio delle scansioni. Tuttavia, occorre tenere presente l’irreversibilità della compressione: i dati scartati non saranno recuperabili, perciò se ne sconsiglia l’impiego per generare file master destinati all’archiviazione conservativa oppure in previsione di successivi trattamenti che richiedono in partenza file di elevata qualità e definizione, come nel caso del riconoscimento ottico dei caratteri e della stampa fotografica in grande formato.
> Continua a leggere: dalla carta al file in pochi passaggi