Free Swift OCR Library to Perform OCR on Scanned Images & PDFs

Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS

Qu’est‑ce que SwiftyTesseract ?

SwiftyTesseract est une bibliothèque OCR de premier plan, open‑source, conçue spécifiquement pour l’écosystème Swift, permettant aux développeurs de logiciels d’intégrer de façon transparente une reconnaissance optique de caractères sophistiquée dans leurs applications iOS et macOS. En s’appuyant sur le puissant moteur Tesseract OCR, reconnu dans l’industrie, elle offre une interface Swift intuitive et rationalisée pour extraire avec précision du texte à partir d’images, de documents numérisés et de divers médias numériques. Cela en fait une base idéale pour les développeurs créant tout, des utilitaires simples de lecture de texte aux outils complexes de traitement de données nécessitant des capacités fiables de numérisation et de reconnaissance de texte dans l’environnement Apple.

Cette bibliothèque simplifie l’intégration de l’OCR en encapsulant les fonctionnalités de Tesseract dans une API claire et conviviale. Elle propose une grande polyvalence dès le départ, incluant une prise en charge robuste de multiples langues — une caractéristique cruciale pour les applications internationales. Pour garantir une haute précision, SwiftyTesseract intègre des capacités essentielles de prétraitement d’image qui améliorent la clarté du texte avant la reconnaissance. De plus, les développeurs conservent un contrôle fin en personnalisant les options de configuration clés de Tesseract, telles que le mode du moteur OCR et le mode de segmentation de page. Cette combinaison de facilité d’utilisation, de support multilingue et de grande personnalisabilité fait de SwiftyTesseract un outil particulièrement versatile et puissant pour les développeurs travaillant sur une large gamme de projets de reconnaissance de texte.

En un coup d’œil

Un aperçu des fonctionnalités de SwiftyTesseract.

Vue d’ensemble des fonctionnalités

Effectuer des opérations OCR
Ajouter des capacités OCR
Reconnaître le texte d’image
Exportation d’image en texte
Reconnaître le texte de police
Rechercher dans les PDF
Plus de 100 langues
Créer des applications OCR
Enregistrer dans le navigateur
Extraire du texte
Prise en charge du multithreading
Reconnaître le texte des images

SwiftyTesseract

SwiftyTesseract prend en charge les formats de fichiers image populaires listés ci‑dessous.

Lecteur

PNG, JPEG, BMP, TIFF, TGA, DICOM

Écrivain

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Indépendance de plateforme

SwiftyTesseract peut fonctionner avec n’importe quel langage de programmation basé sur Swift

Swift 4.1 et supérieur.

SwiftyTesseract

Commencer avec SwiftyTesseract

La méthode recommandée pour installer SwiftyTesseract est d’utiliser CocoaPods. Veuillez exécuter la commande suivante pour une installation fluide.

Installer SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract'

Vous pouvez également l’installer manuellement ; téléchargez les derniers fichiers de version directement depuis le dépôt GitHub.

Effectuer l’OCR sur une image via la bibliothèque Swift

La bibliothèque open‑source SwiftyTesseract facilite le chargement de différents types d’images et l’exécution d’opérations OCR selon les besoins dans les applications Swift. Vous pouvez utiliser une image provenant des ressources de votre application ou toute autre source. La bibliothèque peut reconnaître le texte dans diverses polices, y compris Serif, Arial, Sans‑serif et les polices script. Voici un extrait de code illustrant comment les développeurs peuvent reconnaître du texte à partir d’une image dans les applications Swift.

Comment reconnaître du texte à partir d’une image dans les applications Swift ?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Support du prétraitement d’images

La bibliothèque SwiftyTesseract offre une prise en charge complète du prétraitement d’images avant d’effectuer des opérations OCR dans les applications Swift. Par exemple, vous pouvez convertir les images en niveaux de gris, redimensionner, ajuster le contraste, redresser une image, binariser, etc. Voici un exemple montrant comment les développeurs peuvent redimensionner une image avant l’OCR. Dans cet exemple, resizeImage redimensionne l’image avant son traitement, ce qui peut être utile lorsqu’on travaille avec des images haute résolution.

Comment prétraiter les images avant les opérations OCR dans les applications Swift ?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Opérations OCR multilingues via la bibliothèque Swift

La bibliothèque open‑source SwiftyTesseract prend en charge la reconnaissance de texte dans plus de 100 langues, dont l’anglais, l’espagnol, le français, l’allemand, le chinois et bien d’autres. Vous pouvez définir les langues de votre choix lors de l’initialisation de la bibliothèque. Cette fonctionnalité élargit son champ d’application pour les utilisateurs internationaux et les besoins de traitement multilingue. De plus, les développeurs peuvent créer des dictionnaires personnalisés afin d’améliorer la précision du processus OCR. Voici un exemple de configuration de la bibliothèque pour l’anglais et l’espagnol. Ce code active l’OCR en anglais et en espagnol, ce qui est utile lors du traitement de documents contenant plusieurs langues.

Comment sélectionner les langues pour les opérations OCR multilingues dans les applications Swift ?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Paramètres OCR personnalisables

En utilisant la bibliothèque open‑source SwiftyTesseract, les développeurs ont la possibilité de personnaliser les paramètres OCR afin d’améliorer la précision pour des types de documents ou des langues spécifiques. Cela permet aux développeurs d’ajuster finement le traitement OCR, rendant la bibliothèque adaptable à des scénarios OCR uniques ou complexes. Cela inclut la capacité de spécifier les langues et les variables OCR en fonction des besoins du document. Ci‑dessous un exemple montrant comment les développeurs peuvent personnaliser le mode du moteur OCR et le mode de segmentation de page.

Comment personnaliser le mode du moteur OCR et le mode de segmentation de page via l’API Swift ?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}

Free Swift OCR Library to Perform OCR on Scanned Images & PDFs

Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS

Qu’est‑ce que SwiftyTesseract ?

En un coup d’œil

Indépendance de plateforme

Commencer avec SwiftyTesseract

Installer SwiftyTesseract via CocoaPods

Effectuer l’OCR sur une image via la bibliothèque Swift

Comment reconnaître du texte à partir d’une image dans les applications Swift ?

Support du prétraitement d’images

Comment prétraiter les images avant les opérations OCR dans les applications Swift ?

Opérations OCR multilingues via la bibliothèque Swift

Comment sélectionner les langues pour les opérations OCR multilingues dans les applications Swift ?

Paramètres OCR personnalisables

Comment personnaliser le mode du moteur OCR et le mode de segmentation de page via l’API Swift ?

Qu’est‑ce que SwiftyTesseract ?

Comment reconnaître du texte à partir d’une image dans les applications Swift ?

Comment prétraiter les images avant les opérations OCR dans les applications Swift ?

Comment sélectionner les langues pour les opérations OCR multilingues dans les applications Swift ?

Comment personnaliser le mode du moteur OCR et le mode de segmentation de page via l’API Swift ?