Free Swift OCR Library to Perform OCR on Scanned Images & PDFs
Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS
Qu’est‑ce que SwiftyTesseract ?
SwiftyTesseract est une bibliothèque OCR de premier plan, open‑source, conçue spécifiquement pour l’écosystème Swift, permettant aux développeurs de logiciels d’intégrer de façon transparente une reconnaissance optique de caractères sophistiquée dans leurs applications iOS et macOS. En s’appuyant sur le puissant moteur Tesseract OCR, reconnu dans l’industrie, elle offre une interface Swift intuitive et rationalisée pour extraire avec précision du texte à partir d’images, de documents numérisés et de divers médias numériques. Cela en fait une base idéale pour les développeurs créant tout, des utilitaires simples de lecture de texte aux outils complexes de traitement de données nécessitant des capacités fiables de numérisation et de reconnaissance de texte dans l’environnement Apple.
Cette bibliothèque simplifie l’intégration de l’OCR en encapsulant les fonctionnalités de Tesseract dans une API claire et conviviale. Elle propose une grande polyvalence dès le départ, incluant une prise en charge robuste de multiples langues — une caractéristique cruciale pour les applications internationales. Pour garantir une haute précision, SwiftyTesseract intègre des capacités essentielles de prétraitement d’image qui améliorent la clarté du texte avant la reconnaissance. De plus, les développeurs conservent un contrôle fin en personnalisant les options de configuration clés de Tesseract, telles que le mode du moteur OCR et le mode de segmentation de page. Cette combinaison de facilité d’utilisation, de support multilingue et de grande personnalisabilité fait de SwiftyTesseract un outil particulièrement versatile et puissant pour les développeurs travaillant sur une large gamme de projets de reconnaissance de texte.
Commencer avec SwiftyTesseract
La méthode recommandée pour installer SwiftyTesseract est d’utiliser CocoaPods. Veuillez exécuter la commande suivante pour une installation fluide.
Installer SwiftyTesseract via CocoaPods
pod 'SwiftyTesseract' Vous pouvez également l’installer manuellement ; téléchargez les derniers fichiers de version directement depuis le dépôt GitHub.
Effectuer l’OCR sur une image via la bibliothèque Swift
La bibliothèque open‑source SwiftyTesseract facilite le chargement de différents types d’images et l’exécution d’opérations OCR selon les besoins dans les applications Swift. Vous pouvez utiliser une image provenant des ressources de votre application ou toute autre source. La bibliothèque peut reconnaître le texte dans diverses polices, y compris Serif, Arial, Sans‑serif et les polices script. Voici un extrait de code illustrant comment les développeurs peuvent reconnaître du texte à partir d’une image dans les applications Swift.
Comment reconnaître du texte à partir d’une image dans les applications Swift ?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Support du prétraitement d’images
La bibliothèque SwiftyTesseract offre une prise en charge complète du prétraitement d’images avant d’effectuer des opérations OCR dans les applications Swift. Par exemple, vous pouvez convertir les images en niveaux de gris, redimensionner, ajuster le contraste, redresser une image, binariser, etc. Voici un exemple montrant comment les développeurs peuvent redimensionner une image avant l’OCR. Dans cet exemple, resizeImage redimensionne l’image avant son traitement, ce qui peut être utile lorsqu’on travaille avec des images haute résolution.
Comment prétraiter les images avant les opérations OCR dans les applications Swift ?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Opérations OCR multilingues via la bibliothèque Swift
La bibliothèque open‑source SwiftyTesseract prend en charge la reconnaissance de texte dans plus de 100 langues, dont l’anglais, l’espagnol, le français, l’allemand, le chinois et bien d’autres. Vous pouvez définir les langues de votre choix lors de l’initialisation de la bibliothèque. Cette fonctionnalité élargit son champ d’application pour les utilisateurs internationaux et les besoins de traitement multilingue. De plus, les développeurs peuvent créer des dictionnaires personnalisés afin d’améliorer la précision du processus OCR. Voici un exemple de configuration de la bibliothèque pour l’anglais et l’espagnol. Ce code active l’OCR en anglais et en espagnol, ce qui est utile lors du traitement de documents contenant plusieurs langues.
Comment sélectionner les langues pour les opérations OCR multilingues dans les applications Swift ?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Paramètres OCR personnalisables
En utilisant la bibliothèque open‑source SwiftyTesseract, les développeurs ont la possibilité de personnaliser les paramètres OCR afin d’améliorer la précision pour des types de documents ou des langues spécifiques. Cela permet aux développeurs d’ajuster finement le traitement OCR, rendant la bibliothèque adaptable à des scénarios OCR uniques ou complexes. Cela inclut la capacité de spécifier les langues et les variables OCR en fonction des besoins du document. Ci‑dessous un exemple montrant comment les développeurs peuvent personnaliser le mode du moteur OCR et le mode de segmentation de page.
Comment personnaliser le mode du moteur OCR et le mode de segmentation de page via l’API Swift ?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}