tutti i trucchi migliori

An italian free software tips and tricks blog

Estrarre il testo e le figure dai file PDF…

Pubblicato da cianix su Novembre 16, 2005

Questo è un post che dedico al Bisio, visto che utilizzerà questi trucchetti intensamente nella prossima settimana. Dovevo mandargli una mail, ma poi ho pensato che forse ci saranno altri ad apprezzare…

Per estrarre il testo da un file PDF basta utilizzare un programmino fornito con il visualizzatore xpdf che si chiama pdftotext. Con il comando:
# pdftotext nome_file.pdf
viene creato un file di testo nome_file.pdf che contiene il testo di tutto il documento. Semplicissimo.

Altrettanto semplice è estrarre le immagini da un file PDF. Utilizziamo un altro programma fornito con xpdf: pdfimages. La riga di comando da dare è la seguente:
# pdfimages nome_file.pdf cartella_destinazione
Tutte le immagini contenute nel documento nome_file.pdf vengono salvate nella directory cartella_destinazione.

Una Risposta a “Estrarre il testo e le figure dai file PDF…”

  1. Luigi detto

    Grazie ottimo consiglio e utile sito. Complimenti

Lascia un commento

XHTML: Puoi usare questi tag: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <pre> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>