Open Source Ruby Library για Μετατροπή εικόνων σε Κείμενο Online
Δωρεάν βιβλιοθήκη οπτικής αναγνώρισης χαρακτήρων Ruby (OCR) επιτρέπει στους προγραμματιστές λογισμικού να φορτώνουν, να διαβάζουν και να μετατρέπουν εικόνες, PDF ή σαρωμένα έγγραφα σε κείμενο ή έγγραφα με δυνατότητα αναζήτησης
Η τεχνολογία Optical Character Recognition (OCR) έχει σημειώσει σημαντικές προόδους τα τελευταία χρόνια, καθιστώντας ευκολότερη την αυτοματοποίηση της εξαγωγής δεδομένων από διάφορες πηγές. Επιτρέπει την αυτοματοποίηση, βελτιώνει την προσβασιμότητα των δεδομένων και ενισχύει την παραγωγικότητα σε διάφορους τομείς. Ένα τέτοιο ισχυρό εργαλείο είναι η βιβλιοθήκη OcrSpace Ruby, η οποία παρέχει στους προγραμματιστές μια απλή λύση για την ενσωμάτωση των δυνατοτήτων OCR στις εφαρμογές Ruby τους. Αυτή η βιβλιοθήκη απλοποιεί τη διαδικασία εξαγωγής κειμένου από εικόνες, σαρωμένα έγγραφα και αρχεία PDF, καθιστώντας την εξαιρετική επιλογή για προγραμματιστές που αναζητούν μια βολική λύση OCR.
Η βιβλιοθήκη OcrSpace Ruby προσφέρει μια απλή και διαισθητική διεπαφή, καθιστώντας εύκολη την ενσωμάτωση των δυνατοτήτων OCR σε εφαρμογές Ruby. Υπάρχουν πολλά σημαντικά χαρακτηριστικά που αποτελούν μέρος της βιβλιοθήκης, όπως η φόρτωση διαφόρων τύπων εικόνων, η εξαγωγή κειμένου από εικόνες, η μετατροπή σαρωμένων εγγράφων σε κείμενο, η εξαγωγή κειμένου από έγγραφα γραμμένα σε πολλές γλώσσες, η αναγνώριση κειμένου από εικόνες χαμηλής ανάλυσης, η εργασία με χειρόγραφο περιεχόμενο , ανάκτηση συντεταγμένων του αναγνωρισμένου κειμένου, ανίχνευση αριθμών σελίδων, προσδιορισμός συγκεκριμένων περιοχών ενδιαφέροντος και πολλά άλλα.
Η βιβλιοθήκη OcrSpace Ruby είναι ένα περιτύλιγμα γύρω από το Ocr.Space OCR API, το οποίο προσφέρει αξιόπιστη και ακριβή εξαγωγή κειμένου από εικόνες και έγγραφα PDF. Χτισμένη ειδικά για προγραμματιστές Ruby, αυτή η βιβλιοθήκη απλοποιεί τη διαδικασία ενσωμάτωσης, επιτρέποντας στους προγραμματιστές να ενσωματώνουν γρήγορα τη λειτουργικότητα OCR στις εφαρμογές τους χωρίς να ασχολούνται με την πολυπλοκότητα του υποκείμενου API. Είτε δημιουργείτε ένα σύστημα διαχείρισης εγγράφων, είτε αυτοματοποιείτε την εξαγωγή δεδομένων είτε βελτιώνετε την προσβασιμότητα, η βιβλιοθήκη OcrSpace Ruby είναι ένα ανεκτίμητο εργαλείο που εξορθολογίζει τη διαδικασία OCR και εξουσιοδοτεί τις εφαρμογές σας με ακριβείς δυνατότητες εξαγωγής κειμένου.
Ξεκινώντας με το OcrSpace
Ο προτεινόμενος τρόπος εγκατάστασης του OcrSpace είναι η χρήση του Rubygems. Χρησιμοποιήστε την ακόλουθη εντολή για ομαλή εγκατάσταση.
Εγκαταστήστε το OcrSpace μέσω Rubygems
$ gem install ocr_space
Μπορείτε να κάνετε λήψη της μεταγλωττισμένης κοινόχρηστης βιβλιοθήκης από το αποθετήριο Github.
Μετατροπή εικόνων από διεύθυνση URL σε κείμενο μέσω Ruby API
Η βιβλιοθήκη ανοιχτού κώδικα OcrSpace έχει συμπεριλάβει ορισμένες ισχυρές δυνατότητες για τη φόρτωση διαφόρων τύπων εικόνων και τη μετατροπή τους σε κείμενο με μερικές γραμμές κώδικα Ruby. Η βιβλιοθήκη υποστηρίζει διάφορες επιλογές OCR, συμπεριλαμβανομένης της εξαγωγής κειμένου από εικόνες, σαρωμένα έγγραφα και αρχεία PDF. Είτε οι προγραμματιστές λογισμικού χρειάζονται να επεξεργάζονται τιμολόγια, αποδείξεις ή οποιοδήποτε άλλο είδος εγγράφου, η βιβλιοθήκη OcrSpace Ruby μπορεί να το χειριστεί αποτελεσματικά. Το παρακάτω παράδειγμα δείχνει πώς οι προγραμματιστές λογισμικού μπορούν να μετατρέψουν εικόνες σε κείμενο μέσω URL χρησιμοποιώντας το Ruby API.
Μετατροπή εικόνων από διεύθυνση URL μέσω Ruby API
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
Προηγμένες δυνατότητες OCR μέσω Ruby API
Η βιβλιοθήκη ανοιχτού κώδικα OcrSpace έχει συμπεριλάβει μερικές πολύ χρήσιμες και προηγμένες λειτουργίες για το χειρισμό λειτουργιών OCR εντός εφαρμογών Ruby. Μπορεί να αναγνωρίσει με ακρίβεια κείμενο από εικόνες χαμηλής ανάλυσης, παραμορφωμένο κείμενο, ακόμα και χειρόγραφο περιεχόμενο, διασφαλίζοντας αξιόπιστα αποτελέσματα σε διάφορα σενάρια. Εκτός από την εξαγωγή κειμένου, η βιβλιοθήκη επιτρέπει επίσης στους προγραμματιστές να εξάγουν άλλες σημαντικές πληροφορίες από έγγραφα. Αυτό περιλαμβάνει την ανάκτηση συντεταγμένων του αναγνωρισμένου κειμένου, τον εντοπισμό αριθμών σελίδων και τον προσδιορισμό συγκεκριμένων περιοχών ενδιαφέροντος μέσα στο έγγραφο.
Πώς να εξαγάγετε κείμενο από ένα μεταφορτωμένο αρχείο μέσω του Ruby API;
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result