Gratis Swift OCR-bibliotek til at udføre OCR på scannede billeder og PDF'er

Open Source Swift Optical Character Recognition (OCR) bibliotek gør det muligt at scanne, genkende og udtrække tekst fra kamera-fotos, scannede billeder og PDF'er gratis i iOS og macOS

Hvad er SwiftyTesseract?

SwiftyTesseract er et førsteklasses, open-source OCR-bibliotek designet specifikt til Swift-økosystemet, som giver softwareudviklere mulighed for problemfrit at integrere avanceret optisk tegngenkendelse i deres iOS- og macOS‑applikationer. Ved at udnytte den kraftfulde, branchetestede Tesseract OCR‑motor leverer den en intuitiv og strømlinet Swift‑grænseflade til præcis udtrækning af tekst fra billeder, scannede dokumenter og diverse digitale medier. Dette gør den til et ideelt fundament for udviklere, der bygger alt fra simple tekst‑læse‑værktøjer til komplekse databehandlingssystemer, som kræver pålidelig tekst‑scanning og genkendelse i Apple‑miljøet.

Dette bibliotek forenkler OCR‑integration ved at indpakke Tesseract‑funktionaliteten i et ligetil og udvikler‑venligt API. Det tilbyder omfattende alsidighed fra starten, herunder robust understøttelse af flere sprog – en kritisk funktion for internationale applikationer. For at sikre høj nøjagtighed indarbejder SwiftyTesseract væsentlige billed‑forbehandlingsfunktioner, som forbedrer tekstens klarhed før genkendelse. Derudover bevarer udviklere fin‑grained kontrol ved at tilpasse centrale Tesseract‑konfigurationsindstillinger, såsom OCR‑motor‑tilstand og side‑segmenterings‑tilstand. Kombinationen af brugervenlighed, flersprogs‑support og dyb tilpasningsmulighed gør SwiftyTesseract til et unikt alsidigt og kraftfuldt værktøj for softwareudviklere, der tackler et bredt spektrum af tekst‑genkendelsesprojekter.

På et overblik

En oversigt over SwiftyTesseract-funktionerne.

Features Overview

Udfør OCR-operationer
Tilføj OCR-funktioner
Genkend billedtekst
Billede til tekst-eksport
Genkend skrifttype-tekst
Søg i PDF
Over 100 sprog
Opret OCR-apps
Gem til browser
Udtræk tekst
Understøttelse af multitrådning
Genkend billedtekst

SwiftyTesseract

SwiftyTesseract understøtter populære billedfilformater listet nedenfor.

Læser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Skriver

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Platformuafhængighed

SwiftyTesseract kan arbejde med ethvert Swift-baseret programmeringssprog

Swift 4.1 og nyere.

SwiftyTesseract

Kom i gang med SwiftyTesseract

Den anbefalede måde at installere SwiftyTesseract på er ved at bruge CocoaPods. Brug venligst følgende kommando for en problemfri installation.

Install SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract'

Du kan også installere det manuelt; download de seneste udgivelsesfiler direkte fra GitHub repository.

Udfør OCR på et billede via Swift-biblioteket

Det open source SwiftyTesseract-bibliotek gør det nemt for softwareudviklere at indlæse forskellige typer billeder og udføre OCR‑operationer efter deres behov i Swift‑applikationer. Du kan bruge et billede fra appens assets eller en anden kilde. Biblioteket kan genkende tekst i forskellige skrifttyper, herunder Serif, Arial, Sans‑serif og script‑fonte. Her er et eksempel på kode, der demonstrerer, hvordan softwareudviklere kan genkende tekst fra et billede i Swift‑applikationer.

How to Recognize Text from an Image inside Swift Applications?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Billedforbehandling understøttelse

SwiftyTesseract-biblioteket har leveret komplet understøttelse af forbehandling af billeder, inden OCR‑operationer udføres i Swift‑applikationer. For eksempel kan du konvertere billeder til gråtoner, ændre størrelse, justere kontrast, rette skævhed, binarisere osv. Her er et eksempel, der viser, hvordan udviklere kan ændre størrelsen på et billede, før OCR udføres. I dette kodeeksempel ændrer resizeImage billedets størrelse, før det behandles, hvilket kan være nyttigt ved arbejde med høj‑opløsnings‑billeder.

How to Preprocessing Images before OCR Operations inside Swift Apps?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Flersproget OCR-operationer via Swift-biblioteket

Det open source SwiftyTesseract-bibliotek understøtter genkendelse af tekst på over 100 sprog, herunder engelsk, spansk, fransk, tysk, kinesisk og mange flere. Du kan angive de ønskede sprog, når du initialiserer biblioteket. Denne funktion udvider anvendelsesområdet for internationale brugere og flersprogs‑behandlingsbehov. Derudover kan udviklere oprette brugerdefinerede ordbøger for at forbedre OCR‑processens nøjagtighed. Her er et eksempel på konfiguration af biblioteket til engelsk og spansk. Denne kode muliggør OCR på både engelsk og spansk, hvilket er nyttigt ved behandling af dokumenter med blandet sprogindhold.

How to Select Languages for Multi-language OCR Operations inside Swift Apps?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Tilpasningsbare OCR-parametre

Ved at bruge det open source SwiftyTesseract-bibliotek har softwareudviklere mulighed for at tilpasse OCR‑indstillinger for at forbedre nøjagtigheden for specifikke dokument‑ eller sprogtyper. Det giver udviklere mulighed for at finjustere OCR‑behandlingen, så biblioteket kan tilpasses unikke eller komplekse OCR‑scenarier. Dette inkluderer muligheden for at specificere sprog og OCR‑variabler baseret på dokumentets behov. Nedenfor er et eksempel, der viser, hvordan udviklere kan tilpasse OCR‑motor‑tilstand og side‑segmenterings‑tilstand.

How to Customize OCR Engine Mode and Page Segmentation Mode via Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}