Free Swift OCR Library to Perform OCR on Scanned Images & PDFs
Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS
Τι είναι το SwiftyTesseract;
SwiftyTesseract είναι μια κορυφαία, ανοιχτού κώδικα βιβλιοθήκη OCR σχεδιασμένη ειδικά για το οικοσύστημα Swift, επιτρέποντας στους προγραμματιστές λογισμικού να ενσωματώνουν αβίαστα προηγμένη οπτική αναγνώριση χαρακτήρων στις εφαρμογές iOS και macOS. Εκμεταλλευόμενη τη δυνατή, αποδεδειγμένη βιομηχανικά μηχανή Tesseract OCR, παρέχει μια διαισθητική και απλοποιημένη διεπαφή Swift για ακριβή εξαγωγή κειμένου από εικόνες, σαρωμένα έγγραφα και διάφορα ψηφιακά μέσα. Αυτό την καθιστά ιδανική βάση για προγραμματιστές που δημιουργούν από απλές βοηθητικές εφαρμογές ανάγνωσης κειμένου έως σύνθετα εργαλεία επεξεργασίας δεδομένων που απαιτούν αξιόπιστη σάρωση και αναγνώριση κειμένου στο οικοσύστημα της Apple.
Αυτή η βιβλιοθήκη απλοποιεί την ενσωμάτωση OCR τυλίγοντας τη λειτουργικότητα του Tesseract σε ένα απλό και φιλικό προς τον προγραμματιστή API. Προσφέρει εκτενή ευελιξία αμέσως από το κουτί, συμπεριλαμβανομένης της ισχυρής υποστήριξης για πολλές γλώσσες — ένα κρίσιμο χαρακτηριστικό για τη δημιουργία διεθνών εφαρμογών. Για να εξασφαλιστεί υψηλή ακρίβεια, το SwiftyTesseract ενσωματώνει βασικές δυνατότητες προεπεξεργασίας εικόνας που βελτιώνουν την καθαρότητα του κειμένου πριν από την αναγνώριση. Επιπλέον, οι προγραμματιστές διατηρούν λεπτομερή έλεγχο προσαρμόζοντας βασικές επιλογές διαμόρφωσης του Tesseract, όπως η λειτουργία μηχανής OCR και η λειτουργία τμηματοποίησης σελίδας. Ο συνδυασμός ευκολίας χρήσης, υποστήριξης πολλαπλών γλωσσών και βαθιάς προσαρμοστικότητας κάνει το SwiftyTesseract ένα μοναδικά ευέλικτο και ισχυρό εργαλείο για προγραμματιστές λογισμικού που αντιμετωπίζουν ένα ευρύ φάσμα έργων αναγνώρισης κειμένου.
Ξεκινώντας με το SwiftyTesseract
Ο συνιστώμενος τρόπος εγκατάστασης του SwiftyTesseract είναι μέσω CocoaPods. Παρακαλώ χρησιμοποιήστε την παρακάτω εντολή για μια ομαλή εγκατάσταση.
Εγκατάσταση SwiftyTesseract μέσω CocoaPods
pod 'SwiftyTesseract' Μπορείτε επίσης να το εγκαταστήσετε χειροκίνητα· κατεβάστε τα τελευταία αρχεία έκδοσης απευθείας από το αποθετήριο GitHub.
Εκτέλεση OCR σε εικόνα μέσω βιβλιοθήκης Swift
Η ανοιχτού κώδικα βιβλιοθήκη SwiftyTesseract διευκολύνει τους προγραμματιστές λογισμικού να φορτώνουν διάφορους τύπους εικόνων και να εκτελούν λειτουργίες OCR ανάλογα με τις ανάγκες τους μέσα σε εφαρμογές Swift. Μπορείτε να χρησιμοποιήσετε μια εικόνα από τα assets της εφαρμογής σας ή από οποιαδήποτε άλλη πηγή. Η βιβλιοθήκη μπορεί να αναγνωρίσει κείμενο σε διάφορες γραμματοσειρές, συμπεριλαμβανομένων Serif, Arial, Sans-serif και γραμματοσειρών script. Ακολουθεί ένα δείγμα κώδικα που δείχνει πώς οι προγραμματιστές μπορούν να αναγνωρίσουν κείμενο από μια εικόνα μέσα σε εφαρμογές Swift.
Πώς να αναγνωρίσετε κείμενο από μια εικόνα μέσα σε εφαρμογές Swift;
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Υποστήριξη Προεπεξεργασίας Εικόνας
Η βιβλιοθήκη SwiftyTesseract παρέχει πλήρη υποστήριξη για προεπεξεργασία εικόνων πριν την εκτέλεση λειτουργιών OCR μέσα σε εφαρμογές Swift. Για παράδειγμα, μπορείτε να μετατρέψετε εικόνες σε αποχρώσεις του γκρι, να αλλάξετε το μέγεθος ή να ρυθμίσετε την αντίθεση, να διορθώσετε την κλίση μιας εικόνας, να κάνετε δυαδικοποίηση κ.λπ. Ακολουθεί ένα παράδειγμα που δείχνει πώς οι προγραμματιστές μπορούν να αλλάξουν το μέγεθος μιας εικόνας πριν την εκτέλεση OCR. Σε αυτό το παράδειγμα κώδικα, η resizeImage αλλάζει το μέγεθος της εικόνας πριν υποβληθεί σε επεξεργασία, κάτι που μπορεί να είναι χρήσιμο όταν εργάζεστε με εικόνες υψηλής ανάλυσης.
Πώς να προεπεξεργαστείτε εικόνες πριν από λειτουργίες OCR σε εφαρμογές Swift;
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Πολυγλωσσικές λειτουργίες OCR μέσω βιβλιοθήκης Swift
Η ανοιχτού κώδικα βιβλιοθήκη SwiftyTesseract υποστηρίζει την αναγνώριση κειμένου σε πάνω από 100 γλώσσες, συμπεριλαμβανομένων Αγγλικών, Ισπανικών, Γαλλικών, Γερμανικών, Κινέζικων και πολλών άλλων. Μπορείτε να ορίσετε τη γλώσσα της επιλογής σας κατά την αρχικοποίηση της βιβλιοθήκης. Αυτή η δυνατότητα διευρύνει το φάσμα εφαρμογών της για διεθνείς χρήστες και απαιτήσεις πολυγλωσσικής επεξεργασίας. Επιπλέον, οι προγραμματιστές μπορούν να δημιουργήσουν προσαρμοσμένα λεξικά για να βελτιώσουν την ακρίβεια της διαδικασίας OCR. Ακολουθεί ένα παράδειγμα διαμόρφωσης της βιβλιοθήκης για Αγγλικά και Ισπανικά. Αυτός ο κώδικας ενεργοποιεί το OCR τόσο στα Αγγλικά όσο και στα Ισπανικά, κάτι που είναι χρήσιμο όταν επεξεργάζεστε έγγραφα με μεικτό γλωσσικό περιεχόμενο.
Πώς να επιλέξετε γλώσσες για πολυγλωσσικές λειτουργίες OCR σε εφαρμογές Swift;
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Προσαρμόσιμες Παράμετροι OCR
Χρησιμοποιώντας τη ανοιχτού κώδικα βιβλιοθήκη SwiftyTesseract, οι προγραμματιστές λογισμικού έχουν τη δυνατότητα να προσαρμόσουν τις ρυθμίσεις OCR για να βελτιώσουν την ακρίβεια για συγκεκριμένους τύπους εγγράφων ή γλωσσών. Επιτρέπει στους προγραμματιστές να ρυθμίσουν λεπτομερώς την επεξεργασία OCR, καθιστώντας τη βιβλιοθήκη προσαρμόσιμη για μοναδικά ή σύνθετα σενάρια OCR. Αυτό περιλαμβάνει τη δυνατότητα καθορισμού γλωσσών και μεταβλητών OCR βάσει των αναγκών του εγγράφου. Παρακάτω φαίνεται ένα παράδειγμα που δείχνει πώς οι προγραμματιστές μπορούν να προσαρμόσουν τη λειτουργία μηχανής OCR και τη λειτουργία τμηματοποίησης σελίδας.
Πώς να προσαρμόσετε τη λειτουργία μηχανής OCR και τη λειτουργία τμηματοποίησης σελίδας μέσω του Swift API;
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}