Η λύση που έχω χρησιμοποιήσει αυτή τη στιγμή είναι:
- Κώδικας: Επιλογή όλων
pdftoppm
pnmtopng -compress 9
Το κείμενο που προκύπτει είναι μεν ευανάγνωστο, αλλά το μέγεθος αυξάνεται από τα 35ΜΒ του PDF σε 100ΜΒ.
Έχει κανείς να προτείνει κάποια καλύτερη λύση;
Έχω ήδη δοκιμάσει το imagemagick (από τερματικό και avconvert), αλλά το αποτέλεσμα δεν ήταν αναγνώσιμο.
Καθώς και το GIMP, που είχε καλό αποτέλεσμα (αν και νομίζω ότι πήρε περισσότερο χώρο), αλλά μάλλον θα χρειαστώ αναλυτικές οδηγίες για το πώς να κάνω batch μετατροπή.
ΕΝΗΜΕΡΩΣΗ:
Έχοντας δοκιμάσει όλες τις λύσεις που προτάθηκαν, θα πρότεινα δύο λύσεις για όσους ενδιαφέρονται για κάτι αντίστοιχο. Και οι δύο χρησιμοποιούν προεγκατεστημένα προγράμματα από τo τερματικό:
1. Εξάγει όλες τις εικόνες που περιέχονται στο pdf στην αρχική τους ανάλυση.
- Κώδικας: Επιλογή όλων
pdfimages ΑΡΧΙΚΟ.pdf ΝΕΟ
2. Δημιουργεί μία εικόνα για κάθε σελίδα του pdf.
- Κώδικας: Επιλογή όλων
pdftoppm ΑΡΧΙΚΟ.pdf ΝΕΟ
Και στις δύο περιπτώσεις το αποτέλεσμα είναι αρχεία .pbm. Μπορείτε να τα μετατρέψετε σε .png ή .jpg με τις εντολές:
- Κώδικας: Επιλογή όλων
pnmtopng -compress 9
- Κώδικας: Επιλογή όλων
pnmtojpeg
Για περισσότερα, δείτε το man των παραπάνω εντολών. (Επίσης, υπάρχει και το pdftotext που εξάγει το κείμενο από αρχεία .pdf)