Free Swift OCR Library to Perform OCR on Scanned Images & PDFs

Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS

Vad är SwiftyTesseract?

SwiftyTesseract är ett förstklassigt, öppet källkods-OCR-bibliotek designat specifikt för Swift-ekosystemet, vilket ger mjukvaruutvecklare möjlighet att sömlöst integrera sofistikerad optisk teckenigenkänning i sina iOS- och macOS-applikationer. Genom att utnyttja den kraftfulla, branschbeprövade Tesseract OCR-motorn, erbjuder det ett intuitivt och strömlinjeformat Swift‑gränssnitt för exakt extrahering av text från bilder, skannade dokument och diverse digitala medier. Detta gör det till en idealisk grund för utvecklare som bygger allt från enkla text‑läsningsverktyg till komplexa databehandlingsverktyg som kräver pålitlig text‑skanning och igenkänning i Apple‑miljön.

Detta bibliotek förenklar OCR‑integration genom att kapsla in Tesseracts funktionalitet i ett enkelt och utvecklarvänligt API. Det erbjuder omfattande mångsidighet direkt ur lådan, inklusive robust stöd för flera språk – en kritisk funktion för att skapa internationella applikationer. För att säkerställa hög noggrannhet innehåller SwiftyTesseract väsentliga bild‑förbehandlingsfunktioner som förbättrar textens klarhet före igenkänning. Dessutom behåller utvecklare fin‑granulär kontroll genom att anpassa nyckelkonfigurationer i Tesseract, såsom OCR‑motormod och sidsegmenteringsläge. Kombinationen av användarvänlighet, flerspråkigt stöd och djup anpassningsbarhet gör SwiftyTesseract till ett unikt mångsidigt och kraftfullt verktyg för mjukvaruutvecklare som tar sig an ett brett spektrum av textigenkänningsprojekt.

På en blick

En översikt av SwiftyTesseract-funktionerna.

Features Overview

Utför OCR-operationer
Lägg till OCR-funktioner
Känn igen bildtext
Exportera bild till text
Känn igen teckensnittstext
Sök i PDF
Över 100 språk
Skapa OCR-appar
Spara till webbläsare
Extrahera text
Stöd för flertrådad körning
Känn igen bildtext

SwiftyTesseract

SwiftyTesseract stöder populära bildfilformat som listas nedan.

Läsare

PNG, JPEG, BMP, TIFF, TGA, DICOM

Skrivare

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Plattformsoberoende

SwiftyTesseract kan fungera med alla Swift‑baserade programmeringsspråk

Swift 4.1 och senare.

SwiftyTesseract

Komma igång med SwiftyTesseract

Det rekommenderade sättet att installera SwiftyTesseract är att använda CocoaPods. Använd följande kommando för en smidig installation.

Installera SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract'

Du kan också installera det manuellt; ladda ner de senaste release-filerna direkt från GitHub repository.

Utför OCR på en bild via Swift-biblioteket

Det öppna källkods‑biblioteket SwiftyTesseract gör det enkelt för mjukvaruutvecklare att ladda olika typer av bilder och utföra OCR‑operationer enligt deras behov i Swift‑applikationer. Du kan använda en bild från appens resurser eller någon annan källa. Biblioteket kan känna igen text i olika typsnitt, inklusive Serif, Arial, Sans‑serif och skript‑typsnitt. Här är ett exempel på kod som demonstrerar hur mjukvaruutvecklare kan känna igen text från en bild i Swift‑applikationer.

Hur man känner igen text från en bild i Swift‑applikationer?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Stöd för bildförbehandling

SwiftyTesseract‑biblioteket har fullständigt stöd för förbehandling av bilder innan OCR‑operationer i Swift‑applikationer. Till exempel kan du konvertera bilder till gråskala, ändra storlek, justera kontrast, räta upp en sned bild, binarisera med mera. Här är ett exempel som visar hur utvecklare kan ändra storlek på en bild innan OCR. I detta kodexempel ändrar resizeImage bildens storlek innan den bearbetas, vilket kan vara hjälpsamt när man arbetar med högupplösta bilder.

Hur man förbehandlar bilder innan OCR‑operationer i Swift‑appar?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Flerspråkiga OCR‑operationer via Swift‑biblioteket

Det öppna källkods‑biblioteket SwiftyTesseract stödjer igenkänning av text på över 100 språk, inklusive engelska, spanska, franska, tyska, kinesiska och många fler. Du kan ange önskat språk när du initierar biblioteket. Denna funktion breddar användningsområdet för internationella användare och flerspråkiga bearbetningsbehov. Dessutom kan utvecklare skapa egna ordböcker för att förbättra OCR‑processens noggrannhet. Här är ett exempel på hur man konfigurerar biblioteket för engelska och spanska. Denna kod möjliggör OCR på både engelska och spanska, vilket är användbart när man bearbetar dokument med blandat språk.

Hur man väljer språk för flerspråkiga OCR‑operationer i Swift‑appar?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Anpassningsbara OCR‑parametrar

Med det öppna källkods‑biblioteket SwiftyTesseract har mjukvaruutvecklare möjlighet att anpassa OCR‑inställningarna för att förbättra noggrannheten för specifika dokumenttyper eller språk. Det låter utvecklare finjustera OCR‑bearbetning, vilket gör biblioteket anpassningsbart för unika eller komplexa OCR‑scenarier. Detta inkluderar möjligheten att specificera språk och OCR‑variabler baserat på dokumentets behov. Nedan följer ett exempel som visar hur utvecklare kan anpassa OCR‑motormod och sidsegmenteringsläge.

Hur man anpassar OCR‑motormod och sidsegmenteringsläge via Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}