Δωρεάν Python API για ενσωμάτωση δυνατοτήτων OCR & εξαγωγή κειμένου
Ανοιχτού κώδικα Python OCR API για ακριβή και γρήγορη αναγνώριση κειμένου από εικόνες και έγγραφα. Διαβάστε και το Φυσικό Κείμενο Σκηνής και το Πυκνό Κείμενο σε έγγραφο χρησιμοποιώντας τη Βιβλιοθήκη Python.
Η τεχνολογία Optical Character Recognition (OCR) υπάρχει εδώ και καιρό και χρησιμοποιείται σε διάφορους κλάδους για την αυτοματοποίηση των εργασιών εισαγωγής δεδομένων και επεξεργασίας εγγράφων. Το EasyOCR είναι μια μηχανή ανοιχτού κώδικα OCR (Optical Character Recognition) που είναι γρήγορη, ακριβής και εύκολη στη χρήση. Παρέχει μια εύχρηστη διεπαφή για τους προγραμματιστές να ενσωματώσουν το OCR στις εφαρμογές τους. Με τη βιβλιοθήκη EasyOCR, οι προγραμματιστές λογισμικού μπορούν να εξαγάγουν κείμενο από εικόνες και σαρωμένα έγγραφα μέσα σε λίγα δευτερόλεπτα, καθιστώντας το ιδανικό εργαλείο για τη διαχείριση εγγράφων, την εξαγωγή δεδομένων και τον αυτοματισμό.
Το EasyOCR είναι γραμμένο σε Python και υποστηρίζεται πάνω από 80+ γλώσσες, καθιστώντας το ένα ισχυρό εργαλείο για επιχειρήσεις που λειτουργούν σε πολύγλωσσα περιβάλλοντα. Υπάρχουν πολλά σημαντικά χαρακτηριστικά της βιβλιοθήκης, όπως ακριβής εξαγωγή κειμένου, υποστήριξη πολλών γλωσσών, απλή ενσωμάτωση με υπάρχουσες εφαρμογές, προσαρμογή της μηχανής OCR για να καλύψει τις συγκεκριμένες ανάγκες σας, οικονομικά αποδοτικές λύσεις, εξαγωγή κειμένου από σαρωμένα έγγραφα, λήψη και αποθήκευση το εξαγόμενο κείμενο και πολλά άλλα. Το API είναι μια λύση που βασίζεται σε σύννεφο και δεν απαιτεί εγκατάσταση υλικού ή λογισμικού, γεγονός που το καθιστά μια οικονομικά αποδοτική λύση για επιχειρήσεις όλων των μεγεθών.
Το EasyOCR API χρησιμοποιεί αλγόριθμους βαθιάς εκμάθησης για να επιτύχει υψηλά ποσοστά ακρίβειας και μπορεί να επεξεργαστεί μεγάλους όγκους δεδομένων γρήγορα. Είναι μια ευέλικτη και επεκτάσιμη λύση που μπορεί να ενσωματωθεί σε υπάρχουσες ροές εργασίας χρησιμοποιώντας ένα απλό RESTful API. Το EasyOCR API είναι μια ισχυρή λύση OCR που μπορεί να βοηθήσει τις επιχειρήσεις όλων των μεγεθών να αυτοματοποιήσουν τις διαδικασίες εισαγωγής δεδομένων τους, να βελτιώσουν την ακρίβεια και να μειώσουν το κόστος. Με υποστήριξη για πολλές γλώσσες, είναι ένα ιδανικό εργαλείο για διαχείριση εγγράφων, εξαγωγή δεδομένων και αυτοματισμό. Εάν αναζητάτε μια μηχανή OCR για ενσωμάτωση στην εφαρμογή σας, δοκιμάστε το EasyOCR.
Ξεκινώντας με το EasyOCR
Ο προτεινόμενος τρόπος εγκατάστασης του EasyOCR είναι η χρήση του pip. Χρησιμοποιήστε την ακόλουθη εντολή για ομαλή εγκατάσταση.
Εγκαταστήστε το EasyOCR μέσω pip
pip install easyocr
Μπορείτε επίσης να το εγκαταστήσετε χειροκίνητα. κατεβάστε τα αρχεία τελευταίας έκδοσης απευθείας από το αποθετήριο GitHub.
Ανάγνωση και εξαγωγή κειμένου από εικόνα μέσω Python API
Το EasyOCR API ανοιχτού κώδικα χρησιμοποιεί αλγόριθμους βαθιάς εκμάθησης για τη φόρτωση, την αναγνώριση και την εξαγωγή κειμένου από εικόνες και αρχεία PDF εντός εφαρμογών Python. Το EasyOCR μπορεί να διαβάζει πολλές γλώσσες ταυτόχρονα, αλλά πρέπει να είναι συμβατές μεταξύ τους. Οι γλώσσες που μοιράζονται τον περισσότερο χαρακτήρα (π.χ. λατινική γραφή) μεταξύ τους είναι συμβατές. Το API επιτρέπει την ανάγνωση και την εξαγωγή κειμένου από εικόνες, συμπεριλαμβανομένου του τρόπου προεπεξεργασίας των εικόνων και προσαρμογής των παραμέτρων του κινητήρα OCR για βελτίωση της ακρίβειας. Το παρακάτω παράδειγμα δείχνει πώς να διαβάζετε και να εξάγετε κείμενο από εικόνες και να αυτοματοποιείτε εργασίες εισαγωγής δεδομένων με ευκολία.
Ανάγνωση και εξαγωγή κειμένου από εικόνες μέσω Python API
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')
# Use the OCR engine to extract text from the image.
result = reader.readtext(image, detail=0)
Αναγνώριση χαρακτήρων από πλαίσια κειμένου μέσω Python API
Η αναγνώριση χαρακτήρων από πλαίσια κειμένου είναι μια συνηθισμένη περίπτωση χρήσης για μηχανές OCR. Το ανοιχτού κώδικα EasyOCR API παρέχει μια ισχυρή και φιλική προς το χρήστη λύση σε αυτήν την περίπτωση χρήσης. Βοηθά τους προγραμματιστές λογισμικού να αναγνωρίζουν τους χαρακτήρες από τα πλαίσια κειμένου με ευκολία και πώς να προεπεξεργάζονται τις εικόνες και να προσαρμόζουν τις παραμέτρους της μηχανής OCR για να βελτιώσουν την ακρίβεια. Τα πλαίσια κειμένου μπορεί να έχουν διαφορετικά σχήματα, μεγέθη και προσανατολισμούς και αυτό μπορεί να επηρεάσει την ακρίβεια της μηχανής OCR. Επομένως, η εφαρμογή ορισμένων βημάτων προεπεξεργασίας μπορεί να βελτιώσει την ακρίβεια της μηχανής OCR, όπως το Deskew the image, το Apply binarization και το Apply Noise Reduction.
Πώς να αναγνωρίζετε χαρακτήρες από πλαίσια κειμένου μέσω του Python API;
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')
# OCR engine to recognize the characters in the text box
result = reader.readtext(image, detail=0)
# The result is a list of strings, where each string represents a recognized character in the text box.