Free Swift OCR Library to Perform OCR on Scanned Images & PDFs

Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS

Hva er SwiftyTesseract?

SwiftyTesseract er et førsteklasses, åpen kildekode OCR‑bibliotek designet spesielt for Swift‑økosystemet, og gir programvareutviklere muligheten til sømløst å integrere avansert optisk tegngjenkjenning i iOS‑ og macOS‑applikasjonene sine. Ved å utnytte den kraftige, bransjeprøvde Tesseract‑OCR‑motoren, tilbyr den et intuitivt og strømlinjeformet Swift‑grensesnitt for nøyaktig å trekke ut tekst fra bilder, skannede dokumenter og ulike digitale medier. Dette gjør den til et ideelt fundament for utviklere som bygger alt fra enkle tekstlesingsverktøy til komplekse databehandlingsverktøy som krever pålitelig tekstskanning og gjenkjenningskapasitet i Apple‑miljøet.

Dette biblioteket forenkler OCR‑integrasjon ved å pakke Tesseracts funksjonalitet inn i et rett‑fram‑og‑utviklervennlig API. Det tilbyr omfattende allsidighet rett ut av boksen, inkludert robust støtte for flere språk – en kritisk funksjon for å lage internasjonale applikasjoner. For å sikre høy nøyaktighet, inkluderer SwiftyTesseract viktige bildeforbehandlingsfunksjoner som forbedrer tekstklarhet før gjenkjenning. Videre beholder utviklere fin‑gradert kontroll ved å tilpasse sentrale Tesseract‑konfigurasjonsalternativer, som OCR‑motor‑modus og side‑segmenteringsmodus. Kombinasjonen av brukervennlighet, flerspråklig støtte og dyp tilpasningsmulighet gjør SwiftyTesseract til et unikt allsidig og kraftig verktøy for programvareutviklere som takler et bredt spekter av tekstgjenkjenningsprosjekter.

En oversikt

En oversikt over SwiftyTesseract‑funksjoner.

Funksjonsoversikt

Utfør OCR‑operasjoner
Legg til OCR‑funksjonalitet
Gjenkjenne bildetekst
Eksporter bilde til tekst
Gjenkjenne skrifttype‑tekst
Søk i PDF
Over 100 språk
Lag OCR‑apper
Lagre til nettleser
Ekstrahere tekst
Støtte for flertråding
Gjenkjenne bildetekst

SwiftyTesseract

SwiftyTesseract støtter populære bildeformater listet nedenfor.

Leser

PNG, JPEG, BMP, TIFF, TGA, DICOM

Skriver

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Plattformuavhengighet

SwiftyTesseract kan fungere med ethvert Swift‑basert programmeringsspråk

Swift 4.1 og nyere.

SwiftyTesseract

Kom i gang med SwiftyTesseract

Den anbefalte måten å installere SwiftyTesseract på er ved å bruke CocoaPods. Vennligst bruk følgende kommando for en smidig installasjon.

Installer SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract'

Du kan også installere den manuelt; last ned de nyeste utgivelsesfilene direkte fra GitHub repository.

Utfør OCR på et bilde via Swift‑biblioteket

Det åpne kildekode‑biblioteket SwiftyTesseract gjør det enkelt for programvareutviklere å laste inn ulike bildetyper og utføre OCR‑operasjoner etter behov i Swift‑applikasjoner. Du kan bruke et bilde fra appens ressurser eller en annen kilde. Biblioteket kan gjenkjenne tekst i ulike skrifttyper, inkludert Serif, Arial, Sans‑serif og skriptfonter. Her er et kodeeksempel som viser hvordan utviklere kan gjenkjenne tekst fra et bilde i Swift‑applikasjoner.

Hvordan gjenkjenne tekst fra et bilde i Swift‑applikasjoner?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Støtte for bildeforbehandling

SwiftyTesseract‑biblioteket gir full støtte for forbehandling av bilder før OCR‑operasjoner i Swift‑applikasjoner. Du kan for eksempel konvertere bilder til gråtoner, endre størrelse, justere kontrast, rette opp skjevheter, binarisere osv. Her er et eksempel som viser hvordan utviklere kan endre størrelse på et bilde før OCR. I dette kodeeksemplet endrer resizeImage størrelsen på bildet før det behandles, noe som er nyttig ved høy‑oppløselige bilder.

Hvordan forbehandle bilder før OCR‑operasjoner i Swift‑apper?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Flerspråklige OCR‑operasjoner via Swift‑biblioteket

Det åpne kildekode‑biblioteket SwiftyTesseract støtter gjenkjenning av tekst på over 100 språk, inkludert engelsk, spansk, fransk, tysk, kinesisk og mange flere. Du kan angi ønsket språk når du initialiserer biblioteket. Denne funksjonen utvider bruksområdet for internasjonale brukere og flerspråklige behandlingsbehov. Videre kan utviklere lage egendefinerte ordbøker for å forbedre OCR‑nøyaktigheten. Her er et eksempel på hvordan du konfigurerer biblioteket for engelsk og spansk. Koden gjør OCR mulig på både engelsk og spansk, noe som er nyttig når du behandler dokumenter med blandet språk.

Hvordan velge språk for flerspråklige OCR‑operasjoner i Swift‑apper?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Tilpassbare OCR‑parametere

Ved å bruke det åpne kildekode‑biblioteket SwiftyTesseract har programvareutviklere muligheten til å tilpasse OCR‑innstillinger for å forbedre nøyaktigheten for spesifikke dokument‑ eller språktyper. Det lar utviklere finjustere OCR‑prosessen, noe som gjør biblioteket tilpassbart for unike eller komplekse OCR‑scenarioer. Dette inkluderer muligheten til å spesifisere språk og OCR‑variabler basert på dokumentets behov. Nedenfor er et eksempel som viser hvordan utviklere kan tilpasse OCR‑motor‑modus og side‑segmenteringsmodus.

Hvordan tilpasse OCR‑motor‑modus og side‑segmenteringsmodus via Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}