Gratis Swift OCR Bibliotheek om OCR uit te voeren op gescande afbeeldingen en PDF's

Open Source Swift Optical Character Recognition (OCR) Bibliotheek maakt gratis scannen, herkennen en extraheren van tekst uit camerafoto's, gescande afbeeldingen en PDF's mogelijk binnen iOS en macOS

Wat is SwiftyTesseract?

SwiftyTesseract is een toonaangevende, open-source OCR-bibliotheek die specifiek is ontworpen voor het Swift‑ecosysteem, waardoor software‑ontwikkelaars naadloos geavanceerde optische tekenherkenning kunnen integreren in hun iOS‑ en macOS‑toepassingen. Door gebruik te maken van de krachtige, in de industrie bewezen Tesseract‑OCR‑engine, biedt het een intuïtieve en gestroomlijnde Swift‑interface voor het nauwkeurig extraheren van tekst uit afbeeldingen, gescande documenten en diverse digitale media. Dit maakt het een ideale basis voor ontwikkelaars die alles bouwen, van eenvoudige tekst‑lees‑hulpmiddelen tot complexe gegevensverwerkingstools die betrouwbare tekst‑scan‑ en herkenningsmogelijkheden binnen de Apple‑omgeving vereisen.

Deze bibliotheek vereenvoudigt OCR‑integratie door de functionaliteit van Tesseract te verpakken in een eenvoudige en ontwikkelaar‑vriendelijke API. Ze biedt direct uit de doos uitgebreide veelzijdigheid, inclusief robuuste ondersteuning voor meerdere talen – een cruciale eigenschap voor het maken van internationale applicaties. Om hoge nauwkeurigheid te garanderen, bevat SwiftyTesseract essentiële beeld‑voorbewerkingsmogelijkheden die de teksthelderheid vóór herkenning verbeteren. Bovendien behouden ontwikkelaars fijne controle door belangrijke Tesseract‑configuratie‑opties aan te passen, zoals de OCR‑engine‑modus en paginasegmentatiemodus. De combinatie van gebruiksgemak, meertalige ondersteuning en diepe aanpasbaarheid maakt SwiftyTesseract een uniek veelzijdig en krachtig hulpmiddel voor software‑ontwikkelaars die een breed scala aan tekstherkenningsprojecten aanpakken.

In één oogopslag

Een overzicht van SwiftyTesseract-functies.

Functieoverzicht

OCR-bewerkingen uitvoeren
OCR-mogelijkheden toevoegen
Afbeeldingstekst herkennen
Afbeelding-naar-tekst export
Lettertype-tekst herkennen
PDF doorzoeken
Meer dan 100 talen
OCR-apps maken
Opslaan in browser
Tekst extraheren
Ondersteuning voor multithreading
Afbeeldingstekst herkennen

SwiftyTesseract

SwiftyTesseract ondersteunt de populaire beeldbestandsformaten die hieronder worden vermeld.

Lezer

PNG, JPEG, BMP, TIFF, TGA, DICOM

Schrijver

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Platformonafhankelijkheid

SwiftyTesseract kan werken met elke op Swift gebaseerde programmeertaal

Swift 4.1 en hoger.

SwiftyTesseract

Aan de slag met SwiftyTesseract

De aanbevolen manier om SwiftyTesseract te installeren is via CocoaPods. Gebruik de volgende opdracht voor een soepele installatie.

Installeer SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract'

U kunt het ook handmatig installeren; download de nieuwste releasebestanden rechtstreeks van de GitHub repository.

OCR uitvoeren op een afbeelding via Swift-bibliotheek

De open‑source SwiftyTesseract‑bibliotheek maakt het eenvoudig voor software‑ontwikkelaars om verschillende soorten afbeeldingen te laden en OCR‑bewerkingen uit te voeren volgens hun behoeften binnen Swift‑applicaties. U kunt een afbeelding uit de assets van uw app of een andere bron gebruiken. De bibliotheek kan tekst herkennen in diverse lettertypen, waaronder Serif, Arial, Sans‑serif en script‑lettertypen. Hieronder staat een voorbeeldcodefragment dat laat zien hoe ontwikkelaars tekst uit een afbeelding kunnen herkennen binnen Swift‑applicaties.

Hoe tekst herkennen uit een afbeelding binnen Swift-toepassingen?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Ondersteuning voor beeldvoorbewerking

De SwiftyTesseract‑bibliotheek biedt volledige ondersteuning voor het voorbewerken van afbeeldingen voordat OCR‑bewerkingen worden uitgevoerd binnen Swift‑applicaties. U kunt bijvoorbeeld afbeeldingen converteren naar grijstinten, de grootte aanpassen, het contrast wijzigen, een afbeelding rechtzetten, binariseren, enzovoort. Hieronder staat een voorbeeld dat laat zien hoe ontwikkelaars een afbeelding kunnen verkleinen vóór OCR. In dit code‑voorbeeld wordt resizeImage gebruikt om de afbeelding te verkleinen voordat deze wordt verwerkt, wat handig kan zijn bij het werken met hoge resoluties.

Hoe afbeeldingen voorbewerken vóór OCR-bewerkingen in Swift-apps?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Meertalige OCR-bewerkingen via Swift-bibliotheek

De open‑source SwiftyTesseract‑bibliotheek ondersteunt herkenning van tekst in meer dan 100 talen, waaronder Engels, Spaans, Frans, Duits, Chinees en vele andere. U kunt de gewenste talen instellen bij het initialiseren van de bibliotheek. Deze functie vergroot de toepassingsmogelijkheden voor internationale gebruikers en meertalige verwerkingsvereisten. Bovendien kunnen ontwikkelaars aangepaste woordenboeken maken om de nauwkeurigheid van het OCR‑proces te verbeteren. Hieronder staat een voorbeeld van het configureren van de bibliotheek voor Engels en Spaans. Deze code maakt OCR mogelijk in zowel Engels als Spaans, wat nuttig is bij het verwerken van documenten met gemengde taalinhoud.

Hoe talen selecteren voor meertalige OCR-bewerkingen in Swift-apps?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Aanpasbare OCR-parameters

Met de open‑source SwiftyTesseract‑bibliotheek hebben software‑ontwikkelaars de mogelijkheid om OCR‑instellingen aan te passen om de nauwkeurigheid te verbeteren voor specifieke document‑ of taaltypen. Het stelt ontwikkelaars in staat om OCR‑verwerking fijn af te stemmen, waardoor de bibliotheek geschikt is voor unieke of complexe OCR‑scenario’s. Dit omvat de mogelijkheid om talen en OCR‑variabelen te specificeren op basis van de behoeften van het document. Hieronder staat een voorbeeld dat laat zien hoe ontwikkelaars de OCR‑engine‑modus en paginasegmentatiemodus kunnen aanpassen.

Hoe OCR-enginemodus en paginasegmentatiemodus aanpassen via Swift API?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}