Δημοσιεύτηκε: 21 Μάιος 2014, 14:03
από malos
Γεια σας φίλοι.
Ζητώ βοήθεια για τη δημιουργία ενός σεναρίου. Σαρώνω κάποιες σελίδες με κείμeνο και τις σώζω σε μορφή tiff. Με το tesseract τις μετατρέπω σε αρχεία txt.
Να σχολιασω εδώ ότι γίνεται πολύ ικανοποιητική δουλειά. Άντε να γίνει ένα μικρό σφάλμα σε ολόκληρη σελίδα. Για παράδειγμα σε κάποια λέξη το γράμμα "β" μου το έβγαλε ως
"8", αλλά μικρό το κακό. Θα τα ανοίξω μετά με κάνα libre officce και θα δουλέψω τον ορθογράφο και όλα καλά.
Tesseract λοιπόν εγγύηση :thumbup: Πλήρως ικανοποιημένος.

Το ζητούμενό μου είναι το εξής:
Πρόκειται να σαρώσω μπόλικες σελίδες και θα δημιουργηθούν μπόλικα tiff αρχεία. Κάτα το σώσιμο τα ονομάζω με αριθμούς 1, 2, 3, 4 κλπ.

Για να μη δίνω κάθε φορά την εντολή

Κώδικας: Επιλογή όλων
tesseract 1.tiff text1 -l ell


όπου θα μου φτιάξει το αρχείο text1 όπως βλέπετε,

μπορώ να φτιάξω ένα σκριπτάκι όπου να πάρει όλα τα αρχεία tiff από τον φάκελο και να δημιουργήσει τα αντίστοιχα txt ; Με το αντίστοιχο όνομα, ξέρετε.

Ξέρω ότι γίνεται και ότι έιναι εύκολο. Αλλά δεν πάει το μυαλό μου πως να το φτιάξω. Δεν ξέρω και πολλά. Και εντάξει στην ουσία ζητάω έτοιμο σκριπτάκι. Συγνώμη δηλαδή δεν είναι ακριβώς τεμπελιά.... αλλά δεν μπορώ ρε παιδιά.