Successivo
word

HowTo | Software

Come recuperare le immagini da un documento in formato Docx

Alfonso Maruccia | 15 Febbraio 2019

Microsoft Software

Il nuovo formato di documenti introdotto negli ultimi anni da Microsoft ha sposato un approccio “standard” che semplifica il recupero […]

Il nuovo formato di documenti introdotto negli ultimi anni da Microsoft ha sposato un approccio “standard” che semplifica il recupero dei singoli elementi che lo compongono. Le immagini, ad esempio, si estraggono con molta facilità.

In seguito a un processo di standardizzazione controverso e accidentato, la tecnologia Office Open XML (riconoscibile dall’estensione .docx) si è in questi anni imposta come uno dei formati più popolari per lo scambio di contenuti testuali ricchi di contenuti aggiuntivi e soluzioni di design elaborate. La “guerra” OOXML e ODF è finita da tempo, e i documenti .docx sono oggi largamente utilizzati – sempre assieme allo storico .doc – per i documenti di Microsoft Word e non solo.

Il formato Microsoft Word Document (.doc) classico è pensato per codificare tutti i contenuti di un documento in formato binario e in un singolo file; per contro, OOXML/DOCX adotta un approccio a base di linguaggio XML in cui testo, formattazione e metadati vengono salvati in singoli file di testo leggibili anche col semplice Blocco Note.

Di fatto, com’è consuetudine anche per altri popolari software recenti, un file .docx non è altro che un archivio .zip con un’estensione differente; basta rinominare l’estensione, da .docx a .zip, e l’archivio diverrà quindi liberamente leggibile – e modificabile – per via manuale. Ogni documento/archivio docx/zip contiene tre diverse cartelle: _rels contiene i metadati sui “rapporti” che intercorrono tra i file presenti in archivio; docProps descrive le proprietà del documento; word ospita i contenuti del documento propriamente detti.

Recupero immagini da Docx - 1

All’interno della sottocartella word sono poi ospitate anche le immagini eventualmente presenti nel documento (in una sottocartella dedicata e generalmente chiamata media); per recuperare le suddette immagini, quindi, basta navigare nella struttura dell’archivio fino a raggiungere e salvare i file grafici che ci interessano.

Recupero immagini da Docx - 2

La possibilità di copiare manualmente le immagini rinominando i documenti docx non protetti è un “trucco” che può risultare utile in diversi frangenti, permettendoci ad esempio di recuperare una parte dei contenuti da file docx corrotti o non più accessibili normalmente con Word o un altro word processor in grado di leggere il formato.