Kostenlose Swift OCR-Bibliothek zum Durchführen von OCR auf gescannten Bildern & PDFs

Open-Source Swift Optical Character Recognition (OCR)-Bibliothek ermöglicht das Scannen, Erkennen und Extrahieren von Text aus Kameraaufnahmen, gescannten Bildern und PDFs kostenlos in iOS und macOS

Was ist SwiftyTesseract?

SwiftyTesseract ist eine erstklassige, Open‑Source‑OCR‑Bibliothek, die speziell für das Swift‑Ökosystem entwickelt wurde und Software‑Entwicklern ermöglicht, hochentwickelte optische Zeichenerkennung nahtlos in ihre iOS‑ und macOS‑Anwendungen zu integrieren. Durch die Nutzung der leistungsstarken, branchenbewährten Tesseract‑OCR‑Engine bietet sie eine intuitive und schlanke Swift‑Schnittstelle zum genauen Extrahieren von Text aus Bildern, gescannten Dokumenten und verschiedenen digitalen Medien. Damit ist sie ein ideales Fundament für Entwickler, die von einfachen Textlese‑Utilities bis hin zu komplexen Datenverarbeitungstools alles bauen, was zuverlässige Text‑Scanning‑ und Erkennungs‑Fähigkeiten im Apple‑Umfeld erfordert.

Diese Bibliothek vereinfacht die OCR‑Integration, indem sie die Funktionalität von Tesseract in eine unkomplizierte, entwicklerfreundliche API kapselt. Sie bietet sofort umfangreiche Vielseitigkeit, einschließlich robuster Unterstützung mehrerer Sprachen – ein kritisches Merkmal für internationale Anwendungen. Um hohe Genauigkeit zu gewährleisten, integriert SwiftyTesseract wesentliche Bild‑Vorverarbeitungs‑Funktionen, die die Textklarheit vor der Erkennung verbessern. Darüber hinaus behalten Entwickler die feinkörnige Kontrolle, indem sie zentrale Tesseract‑Konfigurationsoptionen wie den OCR‑Engine‑Modus und den Seiten‑Segmentierungs‑Modus anpassen können. Die Kombination aus Benutzerfreundlichkeit, Mehrsprachigkeit und tiefer Anpassbarkeit macht SwiftyTesseract zu einem einzigartig vielseitigen und leistungsstarken Werkzeug für Entwickler, die ein breites Spektrum an Text‑Erkennungs‑Projekten angehen.

Auf einen Blick

Ein Überblick über die Funktionen von SwiftyTesseract.

Features Overview

OCR-Operationen durchführen
OCR-Funktionen hinzufügen
Bildtext erkennen
Bild-zu-Text-Export
Schrifttext erkennen
PDF durchsuchen
Über 100 Sprachen
OCR-Apps erstellen
Im Browser speichern
Text extrahieren
Mehrthread‑Unterstützung
Bildtexte erkennen

SwiftyTesseract

SwiftyTesseract unterstützt die unten aufgeführten gängigen Bilddateiformate.

Leser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Schreiber

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Plattformunabhängigkeit

SwiftyTesseract kann mit jeder Swift‑basierten Programmiersprache arbeiten

Swift 4.1 und höher.

SwiftyTesseract

Erste Schritte mit SwiftyTesseract

Der empfohlene Weg, SwiftyTesseract zu installieren, ist die Verwendung von CocoaPods. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.

SwiftyTesseract via CocoaPods installieren

 pod 'SwiftyTesseract'

Sie können es auch manuell installieren; laden Sie die neuesten Release‑Dateien direkt aus dem GitHub Repository herunter.

OCR auf einem Bild mit der Swift‑Bibliothek durchführen

Die Open‑Source‑Bibliothek SwiftyTesseract erleichtert es Software‑Entwicklern, verschiedene Bildtypen zu laden und OCR‑Operationen nach Bedarf in Swift‑Anwendungen auszuführen. Sie können ein Bild aus den Assets Ihrer App oder aus einer anderen Quelle verwenden. Die Bibliothek kann Text in verschiedenen Schriftarten erkennen, darunter Serif, Arial, Sans‑Serif und Skript‑Schriften. Hier ein Beispiel‑Code‑Snippet, das zeigt, wie Entwickler Text aus einem Bild in Swift‑Anwendungen erkennen können.

Wie erkennt man Text aus einem Bild in Swift‑Anwendungen?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Unterstützung für Bildvorverarbeitung

Die SwiftyTesseract‑Bibliothek bietet vollständige Unterstützung für die Vorverarbeitung von Bildern, bevor OCR‑Operationen in Swift‑Anwendungen durchgeführt werden. Beispielsweise können Sie Bilder in Graustufen konvertieren, die Größe ändern, den Kontrast anpassen, ein Bild entzerren, binarisieren usw. Hier ein Beispiel, das zeigt, wie Entwickler ein Bild vor dem OCR‑Vorgang verkleinern können. In diesem Code‑Beispiel wird das Bild vor der Verarbeitung verkleinert, was bei hochauflösenden Bildern hilfreich sein kann.

Wie Bilder vor OCR‑Operationen in Swift‑Apps vorverarbeitet werden

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Mehrsprachige OCR‑Operationen mit der Swift‑Bibliothek

Die Open‑Source‑Bibliothek SwiftyTesseract unterstützt die Erkennung von Text in über 100 Sprachen, darunter Englisch, Spanisch, Französisch, Deutsch, Chinesisch und viele mehr. Sie können die gewünschten Sprachen beim Initialisieren der Bibliothek festlegen. Diese Funktion erweitert den Anwendungsbereich für internationale Nutzer und Anforderungen an mehrsprachige Verarbeitung. Darüber hinaus können Entwickler benutzerdefinierte Wörterbücher erstellen, um die Genauigkeit des OCR‑Prozesses zu verbessern. Hier ein Beispiel für die Konfiguration der Bibliothek für Englisch und Spanisch. Dieser Code ermöglicht OCR in beiden Sprachen, was bei Dokumenten mit gemischtem Sprachinhalt nützlich ist.

Wie wählt man Sprachen für mehrsprachige OCR‑Operationen in Swift‑Apps aus?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Anpassbare OCR‑Parameter

Mit der Open‑Source‑Bibliothek SwiftyTesseract können Entwickler OCR‑Einstellungen anpassen, um die Genauigkeit für bestimmte Dokumenttypen oder Sprachen zu verbessern. Sie ermöglicht es, die OCR‑Verarbeitung fein abzustimmen, wodurch die Bibliothek für einzigartige oder komplexe OCR‑Szenarien anpassbar wird. Dazu gehört die Möglichkeit, Sprachen und OCR‑Variablen basierend auf den Anforderungen des Dokuments festzulegen. Nachfolgend ein Beispiel, das zeigt, wie Entwickler den OCR‑Engine‑Modus und den Seiten‑Segmentierungs‑Modus anpassen können.

Wie passt man den OCR‑Engine‑Modus und den Seitensegmentierungsmodus über die Swift‑API an?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}