Bezplatná Swift OCR knihovna pro provádění OCR na skenovaných obrázcích a PDF
Open‑source Swift knihovna pro optické rozpoznávání znaků (OCR) umožňuje zdarma skenovat, rozpoznávat a extrahovat text z fotografií pořízených fotoaparátem, skenovaných obrázků a PDF v iOS a macOS
Co je SwiftyTesseract?
SwiftyTesseract je špičková, open‑source OCR knihovna navržená speciálně pro ekosystém Swift, která umožňuje vývojářům softwaru bez problémů integrovat pokročilé optické rozpoznávání znaků do jejich iOS a macOS aplikací. Využitím výkonného, průmyslem ověřeného Tesseract OCR enginu poskytuje intuitivní a zjednodušené rozhraní Swift pro přesné extrahování textu z obrázků, skenovaných dokumentů a různých digitálních médií. To z něj činí ideální základ pro vývojáře, kteří staví vše od jednoduchých utilit pro čtení textu až po složité nástroje pro zpracování dat, jež vyžadují spolehlivé skenování a rozpoznávání textu v prostředí Apple.
Tato knihovna zjednodušuje integraci OCR tím, že obaluje funkčnost Tesseractu do přehledného a vývojářsky přívětivého API. Nabízí rozsáhlou všestrannost hned z krabice, včetně robustní podpory více jazyků – klíčová funkce pro tvorbu mezinárodních aplikací. Pro zajištění vysoké přesnosti SwiftyTesseract zahrnuje nezbytné předzpracování obrazu, které zlepšuje čitelnost textu před rozpoznáním. Navíc vývojáři mají jemnou kontrolu díky možnosti přizpůsobit klíčové konfigurační volby Tesseractu, jako je režim OCR enginu a režim segmentace stránky. Kombinace snadného použití, podpory více jazyků a hluboké přizpůsobitelnosti dělá ze SwiftyTesseract jedinečně všestranný a výkonný nástroj pro vývojáře softwaru, kteří řeší široké spektrum projektů rozpoznávání textu.
Začínáme se SwiftyTesseract
Doporučený způsob instalace SwiftyTesseract je pomocí CocoaPods. Použijte prosím následující příkaz pro hladkou instalaci.
Instalace SwiftyTesseract pomocí CocoaPods
pod 'SwiftyTesseract' Můžete jej také nainstalovat ručně; stáhněte nejnovější soubory vydání přímo z GitHub repozitáře.
Provádění OCR na obrázku pomocí Swift knihovny
Open‑source knihovna SwiftyTesseract usnadňuje vývojářům načíst různé typy obrázků a provést OCR operaci podle jejich potřeb v rámci Swift aplikací. Můžete použít obrázek z aktiv aplikace nebo z jakéhokoli jiného zdroje. Knihovna dokáže rozpoznávat text v různých písmech, včetně Serif, Arial, Sans‑serif a skriptových fontů. Zde je ukázkový úryvek kódu, který demonstruje, jak vývojáři mohou rozpoznávat text z obrázku ve Swift aplikacích.
Jak rozpoznat text z obrázku ve Swift aplikacích?
import SwiftyTesseract
// Load the image
let image = UIImage(named: "image.jpg")!
// Create a Tesseract instance
let tesseract = Tesseract()
// Set the language to English
tesseract.language = "eng"
// Set the image
tesseract.image = image
// Recognize the text
tesseract.recognize() { result in
if let text = result.text {
print("Recognized text: \(text)")
} else {
print("Error recognizing text")
}
}
Podpora předzpracování obrázků
Knihovna SwiftyTesseract poskytuje kompletní podporu pro předzpracování obrázků před prováděním OCR operací ve Swift aplikacích. Například můžete převést obrázky na odstíny šedi, změnit jejich velikost, upravit kontrast, vyrovnat zkosení obrázku, binarizovat a podobně. Zde je příklad, který ukazuje, jak vývojáři mohou změnit velikost obrázku před provedením OCR. V tomto příkladu kódu funkce resizeImage mění velikost obrázku před jeho zpracováním, což může být užitečné při práci s obrázky vysokého rozlišení.
Jak předzpracovat obrázky před OCR operacemi ve Swift aplikacích?
func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
image.draw(in: CGRect(origin: .zero, size: newSize))
let newImage = UIGraphicsGetImageFromCurrentImageContext()
UIGraphicsEndImageContext()
return newImage
}
if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
tesseract.performOCR(on: resizedImage) { recognizedText in
print("Resized Image OCR result: \(recognizedText ?? "No text found")")
}
}
Vícejazyčné OCR operace pomocí Swift knihovny
Open‑source knihovna SwiftyTesseract podporuje rozpoznávání textu ve více než 100 jazycích, včetně angličtiny, španělštiny, francouzštiny, němčiny, čínštiny a mnoha dalších. Při inicializaci knihovny můžete nastavit požadované jazyky. Tato funkce rozšiřuje možnosti použití pro mezinárodní uživatele a požadavky na vícejazyčné zpracování. Navíc mohou vývojáři vytvářet vlastní slovníky ke zlepšení přesnosti OCR procesu. Zde je příklad konfigurace knihovny pro angličtinu a španělštinu. Tento kód umožňuje OCR v obou jazycích, což je užitečné při zpracování dokumentů s obsahem v různých jazycích.
Jak vybrat jazyky pro vícejazyčné OCR operace ve Swift aplikacích?
let tesseract = SwiftyTesseract(language: [.english, .spanish])
Přizpůsobitelné OCR parametry
Použitím open‑source knihovny SwiftyTesseract mají vývojáři možnost přizpůsobit nastavení OCR tak, aby zvýšili přesnost pro konkrétní typy dokumentů nebo jazyků. Umožňuje vývojářům jemně doladit zpracování OCR, což dělá knihovnu přizpůsobitelnou pro jedinečné či složité OCR scénáře. To zahrnuje možnost specifikovat jazyky a OCR proměnné podle potřeb dokumentu. Níže je příklad, který ukazuje, jak vývojáři mohou přizpůsobit režim OCR enginu a režim segmentace stránky.
Jak přizpůsobit režim OCR enginu a režim segmentace stránky pomocí Swift API?
let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
if let recognizedString = recognizedString {
print("Recognized text with custom PSM: \(recognizedString)")
}
}