Gratis Swift OCR Bibliotheek om OCR uit te voeren op gescande afbeeldingen en PDF's
Open Source Swift Optical Character Recognition (OCR) Bibliotheek maakt gratis scannen, herkennen en extraheren van tekst uit camerafoto's, gescande afbeeldingen en PDF's mogelijk binnen iOS en macOS
Wat is SwiftyTesseract?
SwiftyTesseract is een toonaangevende, open-source OCR-bibliotheek die specifiek is ontworpen voor het Swift‑ecosysteem, waardoor software‑ontwikkelaars naadloos geavanceerde optische tekenherkenning kunnen integreren in hun iOS‑ en macOS‑toepassingen. Door gebruik te maken van de krachtige, in de industrie bewezen Tesseract‑OCR‑engine, biedt het een intuïtieve en gestroomlijnde Swift‑interface voor het nauwkeurig extraheren van tekst uit afbeeldingen, gescande documenten en diverse digitale media. Dit maakt het een ideale basis voor ontwikkelaars die alles bouwen, van eenvoudige tekst‑lees‑hulpmiddelen tot complexe gegevensverwerkingstools die betrouwbare tekst‑scan‑ en herkenningsmogelijkheden binnen de Apple‑omgeving vereisen.
Deze bibliotheek vereenvoudigt OCR‑integratie door de functionaliteit van Tesseract te verpakken in een eenvoudige en ontwikkelaar‑vriendelijke API. Ze biedt direct uit de doos uitgebreide veelzijdigheid, inclusief robuuste ondersteuning voor meerdere talen – een cruciale eigenschap voor het maken van internationale applicaties. Om hoge nauwkeurigheid te garanderen, bevat SwiftyTesseract essentiële beeld‑voorbewerkingsmogelijkheden die de teksthelderheid vóór herkenning verbeteren. Bovendien behouden ontwikkelaars fijne controle door belangrijke Tesseract‑configuratie‑opties aan te passen, zoals de OCR‑engine‑modus en paginasegmentatiemodus. De combinatie van gebruiksgemak, meertalige ondersteuning en diepe aanpasbaarheid maakt SwiftyTesseract een uniek veelzijdig en krachtig hulpmiddel voor software‑ontwikkelaars die een breed scala aan tekstherkenningsprojecten aanpakken.
Aan de slag met SwiftyTesseract
De aanbevolen manier om SwiftyTesseract te installeren is via CocoaPods. Gebruik de volgende opdracht voor een soepele installatie.
Installeer SwiftyTesseract via CocoaPods
pod 'SwiftyTesseract' U kunt het ook handmatig installeren; download de nieuwste releasebestanden rechtstreeks van de GitHub repository.
OCR uitvoeren op een afbeelding via Swift-bibliotheek
De open‑source SwiftyTesseract‑bibliotheek maakt het eenvoudig voor software‑ontwikkelaars om verschillende soorten afbeeldingen te laden en OCR‑bewerkingen uit te voeren volgens hun behoeften binnen Swift‑applicaties. U kunt een afbeelding uit de assets van uw app of een andere bron gebruiken. De bibliotheek kan tekst herkennen in diverse lettertypen, waaronder Serif, Arial, Sans‑serif en script‑lettertypen. Hieronder staat een voorbeeldcodefragment dat laat zien hoe ontwikkelaars tekst uit een afbeelding kunnen herkennen binnen Swift‑applicaties.
Hoe tekst herkennen uit een afbeelding binnen Swift-toepassingen?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Ondersteuning voor beeldvoorbewerking
De SwiftyTesseract‑bibliotheek biedt volledige ondersteuning voor het voorbewerken van afbeeldingen voordat OCR‑bewerkingen worden uitgevoerd binnen Swift‑applicaties. U kunt bijvoorbeeld afbeeldingen converteren naar grijstinten, de grootte aanpassen, het contrast wijzigen, een afbeelding rechtzetten, binariseren, enzovoort. Hieronder staat een voorbeeld dat laat zien hoe ontwikkelaars een afbeelding kunnen verkleinen vóór OCR. In dit code‑voorbeeld wordt resizeImage gebruikt om de afbeelding te verkleinen voordat deze wordt verwerkt, wat handig kan zijn bij het werken met hoge resoluties.
Hoe afbeeldingen voorbewerken vóór OCR-bewerkingen in Swift-apps?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Meertalige OCR-bewerkingen via Swift-bibliotheek
De open‑source SwiftyTesseract‑bibliotheek ondersteunt herkenning van tekst in meer dan 100 talen, waaronder Engels, Spaans, Frans, Duits, Chinees en vele andere. U kunt de gewenste talen instellen bij het initialiseren van de bibliotheek. Deze functie vergroot de toepassingsmogelijkheden voor internationale gebruikers en meertalige verwerkingsvereisten. Bovendien kunnen ontwikkelaars aangepaste woordenboeken maken om de nauwkeurigheid van het OCR‑proces te verbeteren. Hieronder staat een voorbeeld van het configureren van de bibliotheek voor Engels en Spaans. Deze code maakt OCR mogelijk in zowel Engels als Spaans, wat nuttig is bij het verwerken van documenten met gemengde taalinhoud.
Hoe talen selecteren voor meertalige OCR-bewerkingen in Swift-apps?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Aanpasbare OCR-parameters
Met de open‑source SwiftyTesseract‑bibliotheek hebben software‑ontwikkelaars de mogelijkheid om OCR‑instellingen aan te passen om de nauwkeurigheid te verbeteren voor specifieke document‑ of taaltypen. Het stelt ontwikkelaars in staat om OCR‑verwerking fijn af te stemmen, waardoor de bibliotheek geschikt is voor unieke of complexe OCR‑scenario’s. Dit omvat de mogelijkheid om talen en OCR‑variabelen te specificeren op basis van de behoeften van het document. Hieronder staat een voorbeeld dat laat zien hoe ontwikkelaars de OCR‑engine‑modus en paginasegmentatiemodus kunnen aanpassen.
Hoe OCR-enginemodus en paginasegmentatiemodus aanpassen via Swift API?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}