Δημοσιεύτηκε: 26 Σεπ 2009, 12:27
από jennie
Έχω σε PDF ένα σκαναρισμένο βιβλίο περίπου 1000 σελίδες και θέλω να το μετατρέψω σε εικόνες (jpg, bmp, png ή tiff), που στη συνέχεια θα συμπιεστούν σε αρχείο .zip (για χρήση σε συγκεκριμένο πρόγραμμα που υποστηρίζει μόνο αυτά τα είδη αρχείων).
Η λύση που έχω χρησιμοποιήσει αυτή τη στιγμή είναι:
Κώδικας: Επιλογή όλων
pdftoppm
pnmtopng -compress 9

Το κείμενο που προκύπτει είναι μεν ευανάγνωστο, αλλά το μέγεθος αυξάνεται από τα 35ΜΒ του PDF σε 100ΜΒ.
Έχει κανείς να προτείνει κάποια καλύτερη λύση;
Έχω ήδη δοκιμάσει το imagemagick (από τερματικό και avconvert), αλλά το αποτέλεσμα δεν ήταν αναγνώσιμο.
Καθώς και το GIMP, που είχε καλό αποτέλεσμα (αν και νομίζω ότι πήρε περισσότερο χώρο), αλλά μάλλον θα χρειαστώ αναλυτικές οδηγίες για το πώς να κάνω batch μετατροπή.

ΕΝΗΜΕΡΩΣΗ:
Έχοντας δοκιμάσει όλες τις λύσεις που προτάθηκαν, θα πρότεινα δύο λύσεις για όσους ενδιαφέρονται για κάτι αντίστοιχο. Και οι δύο χρησιμοποιούν προεγκατεστημένα προγράμματα από τo τερματικό:
1. Εξάγει όλες τις εικόνες που περιέχονται στο pdf στην αρχική τους ανάλυση.
Κώδικας: Επιλογή όλων
pdfimages ΑΡΧΙΚΟ.pdf ΝΕΟ

2. Δημιουργεί μία εικόνα για κάθε σελίδα του pdf.
Κώδικας: Επιλογή όλων
pdftoppm ΑΡΧΙΚΟ.pdf ΝΕΟ

Και στις δύο περιπτώσεις το αποτέλεσμα είναι αρχεία .pbm. Μπορείτε να τα μετατρέψετε σε .png ή .jpg με τις εντολές:
Κώδικας: Επιλογή όλων
pnmtopng -compress 9

Κώδικας: Επιλογή όλων
pnmtojpeg

Για περισσότερα, δείτε το man των παραπάνω εντολών. (Επίσης, υπάρχει και το pdftotext που εξάγει το κείμενο από αρχεία .pdf)