Free Swift OCR Library to Perform OCR on Scanned Images & PDFs
Open Source Swift Optical Character Recognition (OCR) Library allows to Scan, Recognize, and Extract Text from Camera Photos Scanned Images & PDFs for free inside iOS and macOS
Hva er SwiftyTesseract?
SwiftyTesseract er et førsteklasses, åpen kildekode OCR‑bibliotek designet spesielt for Swift‑økosystemet, og gir programvareutviklere muligheten til sømløst å integrere avansert optisk tegngjenkjenning i iOS‑ og macOS‑applikasjonene sine. Ved å utnytte den kraftige, bransjeprøvde Tesseract‑OCR‑motoren, tilbyr den et intuitivt og strømlinjeformet Swift‑grensesnitt for nøyaktig å trekke ut tekst fra bilder, skannede dokumenter og ulike digitale medier. Dette gjør den til et ideelt fundament for utviklere som bygger alt fra enkle tekstlesingsverktøy til komplekse databehandlingsverktøy som krever pålitelig tekstskanning og gjenkjenningskapasitet i Apple‑miljøet.
Dette biblioteket forenkler OCR‑integrasjon ved å pakke Tesseracts funksjonalitet inn i et rett‑fram‑og‑utviklervennlig API. Det tilbyr omfattende allsidighet rett ut av boksen, inkludert robust støtte for flere språk – en kritisk funksjon for å lage internasjonale applikasjoner. For å sikre høy nøyaktighet, inkluderer SwiftyTesseract viktige bildeforbehandlingsfunksjoner som forbedrer tekstklarhet før gjenkjenning. Videre beholder utviklere fin‑gradert kontroll ved å tilpasse sentrale Tesseract‑konfigurasjonsalternativer, som OCR‑motor‑modus og side‑segmenteringsmodus. Kombinasjonen av brukervennlighet, flerspråklig støtte og dyp tilpasningsmulighet gjør SwiftyTesseract til et unikt allsidig og kraftig verktøy for programvareutviklere som takler et bredt spekter av tekstgjenkjenningsprosjekter.
Kom i gang med SwiftyTesseract
Den anbefalte måten å installere SwiftyTesseract på er ved å bruke CocoaPods. Vennligst bruk følgende kommando for en smidig installasjon.
Installer SwiftyTesseract via CocoaPods
pod 'SwiftyTesseract' Du kan også installere den manuelt; last ned de nyeste utgivelsesfilene direkte fra GitHub repository.
Utfør OCR på et bilde via Swift‑biblioteket
Det åpne kildekode‑biblioteket SwiftyTesseract gjør det enkelt for programvareutviklere å laste inn ulike bildetyper og utføre OCR‑operasjoner etter behov i Swift‑applikasjoner. Du kan bruke et bilde fra appens ressurser eller en annen kilde. Biblioteket kan gjenkjenne tekst i ulike skrifttyper, inkludert Serif, Arial, Sans‑serif og skriptfonter. Her er et kodeeksempel som viser hvordan utviklere kan gjenkjenne tekst fra et bilde i Swift‑applikasjoner.
Hvordan gjenkjenne tekst fra et bilde i Swift‑applikasjoner?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Støtte for bildeforbehandling
SwiftyTesseract‑biblioteket gir full støtte for forbehandling av bilder før OCR‑operasjoner i Swift‑applikasjoner. Du kan for eksempel konvertere bilder til gråtoner, endre størrelse, justere kontrast, rette opp skjevheter, binarisere osv. Her er et eksempel som viser hvordan utviklere kan endre størrelse på et bilde før OCR. I dette kodeeksemplet endrer resizeImage størrelsen på bildet før det behandles, noe som er nyttig ved høy‑oppløselige bilder.
Hvordan forbehandle bilder før OCR‑operasjoner i Swift‑apper?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Flerspråklige OCR‑operasjoner via Swift‑biblioteket
Det åpne kildekode‑biblioteket SwiftyTesseract støtter gjenkjenning av tekst på over 100 språk, inkludert engelsk, spansk, fransk, tysk, kinesisk og mange flere. Du kan angi ønsket språk når du initialiserer biblioteket. Denne funksjonen utvider bruksområdet for internasjonale brukere og flerspråklige behandlingsbehov. Videre kan utviklere lage egendefinerte ordbøker for å forbedre OCR‑nøyaktigheten. Her er et eksempel på hvordan du konfigurerer biblioteket for engelsk og spansk. Koden gjør OCR mulig på både engelsk og spansk, noe som er nyttig når du behandler dokumenter med blandet språk.
Hvordan velge språk for flerspråklige OCR‑operasjoner i Swift‑apper?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Tilpassbare OCR‑parametere
Ved å bruke det åpne kildekode‑biblioteket SwiftyTesseract har programvareutviklere muligheten til å tilpasse OCR‑innstillinger for å forbedre nøyaktigheten for spesifikke dokument‑ eller språktyper. Det lar utviklere finjustere OCR‑prosessen, noe som gjør biblioteket tilpassbart for unike eller komplekse OCR‑scenarioer. Dette inkluderer muligheten til å spesifisere språk og OCR‑variabler basert på dokumentets behov. Nedenfor er et eksempel som viser hvordan utviklere kan tilpasse OCR‑motor‑modus og side‑segmenteringsmodus.
Hvordan tilpasse OCR‑motor‑modus og side‑segmenteringsmodus via Swift API?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}