Προηγμένη δωρεάν βιβλιοθήκη Ruby για φόρτωση και εξαγωγή κειμένου από εικόνες
Ένα κορυφαίο Ruby OCR API ανοιχτού κώδικα και μετατροπέας εικόνας σε κείμενο που επιτρέπει στους προγραμματιστές λογισμικού να φορτώνουν, να αναγνωρίζουν και να εξάγουν κείμενο από εικόνες (σαρωμένες εικόνες και αρχεία PDF)
Η οπτική αναγνώριση χαρακτήρων (OCR) είναι μια ισχυρή τεχνολογία που επιτρέπει στους υπολογιστές να αναγνωρίζουν και να εξάγουν κείμενο από εικόνες ή σαρωμένα έγγραφα. Έχει πολυάριθμες εφαρμογές, που κυμαίνονται από την ψηφιοποίηση έντυπου υλικού έως την αυτοματοποίηση διαδικασιών εισαγωγής δεδομένων. Στη γλώσσα προγραμματισμού Ruby, μια δημοφιλής βιβλιοθήκη για το OCR είναι η Ruby-Tesseract-OCR. Το Ruby-Tesseract-OCR είναι ένα στολίδι από Ruby που χρησιμεύει ως περιτύλιγμα για τον κινητήρα Tesseract OCR. Το Tesseract είναι μια μηχανή OCR ανοιχτού κώδικα που αναπτύχθηκε από την Google και είναι γνωστή για την ακρίβεια και την υποστήριξη γλώσσας.
Το Ruby-Tesseract-OCR υπερβαίνει τις βασικές δυνατότητες OCR και προσφέρει πρόσθετες λειτουργίες για προηγμένες περιπτώσεις χρήσης. Για παράδειγμα, οι προγραμματιστές λογισμικού μπορούν να καθορίσουν μια περιοχή ενδιαφέροντος (ROI) μέσα σε μια εικόνα για να περιορίσουν την ανάλυση OCR σε μια συγκεκριμένη περιοχή. Αυτό είναι ιδιαίτερα χρήσιμο όταν ασχολείστε με πολύπλοκα έγγραφα ή όταν χρειάζεται μόνο να εξαγάγετε κείμενο από μια συγκεκριμένη ενότητα. Η βιβλιοθήκη παρέχει πολλές πρόσθετες λειτουργίες για τη βελτίωση των δυνατοτήτων OCR, όπως φόρτωση υπάρχουσας εικόνας, εξαγωγή κειμένου από εικόνες ή σαρωμένα έγγραφα, λήψη εξόδου HOCR (HTML OCR) και πολλά άλλα.
Το στολίδι Ruby-Tesseract-OCR παρέχει μια εύχρηστη διεπαφή για αλληλεπίδραση με τη μηχανή Tesseract, επιτρέποντας στους προγραμματιστές της Ruby να ενσωματώνουν τις δυνατότητες OCR στα έργα τους χωρίς κόπο. Είτε χρειάζεστε εξαγωγή πληροφοριών από τιμολόγια, ψηφιοποίηση έντυπου υλικού ή αυτοματοποίηση εργασιών εισαγωγής δεδομένων, η βιβλιοθήκη ανοιχτού κώδικα παρέχει μια αξιόπιστη και αποτελεσματική λύση. Δοκιμάστε το και ξεκλειδώστε τις δυνατότητες του OCR στα έργα σας Ruby σήμερα.
Ξεκινώντας με το Ruby-Tesseract-OCR
Ο προτεινόμενος τρόπος εγκατάστασης του Ruby-Tesseract-OCR είναι η χρήση του Rubygems. Χρησιμοποιήστε την ακόλουθη εντολή για ομαλή εγκατάσταση.
Εγκαταστήστε το Ruby-Tesseract-OCR μέσω Rubygems
gem install tesseract-ocr
Μπορείτε να κάνετε λήψη της μεταγλωττισμένης κοινόχρηστης βιβλιοθήκης από το αποθετήριο Github.
Εξαγωγή κειμένου από εικόνες και σαρωμένα έγγραφα μέσω Ruby
Η Ruby-Tesseract-OCR είναι μια πολύ ισχυρή βιβλιοθήκη ανοιχτού κώδικα που επιτρέπει στους προγραμματιστές λογισμικού να φορτώνουν και να εξάγουν κείμενο από διάφορους τύπους εικόνων με λίγες μόνο γραμμές κώδικα Ruby. Η βιβλιοθήκη διευκολύνει την εξαγωγή κειμένου από εικόνες, PDF ή σαρωμένα έγγραφα. Η τυπική ροή εργασίας περιλαμβάνει τη φόρτωση μιας εικόνας, τη διαμόρφωση των παραμέτρων OCR και την κλήση της μηχανής OCR για την αναγνώριση του κειμένου. Για μια επιτυχημένη λειτουργία, οι προγραμματιστές πρέπει να παρέχουν τη διαδρομή προς την εικόνα που θέλουν να επεξεργαστούν και να καλέσουν τη μέθοδο text_for για να εξαγάγουν το κείμενο. Τέλος, το αποτέλεσμα θα εκτυπωθεί στην κονσόλα. Η βιβλιοθήκη προσφέρει διάφορες επιλογές Fconfiguration για τον έλεγχο της συμπεριφοράς OCR, όπως η λειτουργία τμηματοποίησης σελίδων, οι χαρακτήρες της λίστας επιτρεπόμενων και πολλά άλλα. Τα ακόλουθα παραδείγματα δείχνουν πώς οι προγραμματιστές λογισμικού μπορούν να φορτώσουν μια εικόνα JPEG και να εξάγουν κείμενο από αυτήν μέσα στις εφαρμογές Ruby.
Πώς να εξαγάγετε κείμενο από εικόνες χρησιμοποιώντας εντολές Ruby;
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
Εξαγωγή κειμένου από μια συγκεκριμένη περιοχή εικόνας μέσω Ruby
Η βιβλιοθήκη ανοιχτού κώδικα Ruby-Tesseract-OCR υπερβαίνει τις βασικές δυνατότητες OCR και προσφέρει πρόσθετες λειτουργίες για προηγμένες περιπτώσεις χρήσης. Για παράδειγμα, οι χρήστες μπορούν να καθορίσουν μια περιοχή ενδιαφέροντος (ROI) σε μια εικόνα για να περιορίσουν την ανάλυση OCR σε μια συγκεκριμένη περιοχή. Αυτό είναι ιδιαίτερα χρήσιμο όταν ασχολείστε με πολύπλοκα έγγραφα ή όταν οι χρήστες χρειάζονται μόνο εξαγωγή κειμένου από μια συγκεκριμένη ενότητα. Επιπλέον, η βιβλιοθήκη παρέχει μεθόδους για τη λήψη εξόδου HOCR (HTML OCR), η οποία περιλαμβάνει όχι μόνο το αναγνωρισμένο κείμενο αλλά και πληροφορίες σχετικά με τη διάταξη και τις συντεταγμένες των στοιχείων κειμένου. Η έξοδος HOCR είναι χρήσιμη όταν χρειάζεστε πιο αναλυτικά δεδομένα ή θέλετε να εκτελέσετε περαιτέρω ανάλυση στη δομή του κειμένου.
Πώς να εκτελέσετε το hOCR σε μια εικόνα μέσω της βιβλιοθήκης Ruby;
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')