Bibliotecă OCR Swift Gratuită pentru a Efectua OCR pe Imagini Scanate și PDF-uri

Bibliotecă Open Source Swift pentru Recunoaștere Optică a Caracterelor (OCR) permite să scaneze, să recunoască și să extragă text din fotografii de cameră, imagini scanate și PDF-uri gratuit în iOS și macOS

Ce este SwiftyTesseract?

SwiftyTesseract este o bibliotecă OCR de top, open-source, concepută special pentru ecosistemul Swift, oferind dezvoltatorilor de software posibilitatea de a integra fără efort recunoașterea optică sofisticată a caracterelor în aplicațiile lor iOS și macOS. Prin valorificarea motorului Tesseract OCR, puternic și dovedit în industrie, aceasta furnizează o interfață Swift intuitivă și simplificată pentru extragerea precisă a textului din imagini, documente scanate și diverse medii digitale. Astfel, devine o bază ideală pentru dezvoltatori care construiesc de la utilitare simple de citire a textului până la instrumente complexe de procesare a datelor ce necesită scanare și recunoaștere de text fiabile în mediul Apple.

Această bibliotecă simplifică integrarea OCR prin învelirea funcționalității Tesseract într-un API clar și prietenos pentru dezvoltatori. Oferă versatilitate extinsă direct din cutie, inclusiv suport robust pentru multiple limbi – o caracteristică esențială pentru crearea de aplicații internaționale. Pentru a asigura acuratețe ridicată, SwiftyTesseract include capabilități esențiale de preprocesare a imaginii care îmbunătățesc claritatea textului înainte de recunoaștere. În plus, dezvoltatorii păstrează controlul detaliat prin personalizarea opțiunilor de configurare Tesseract, cum ar fi modul motorului OCR și modul de segmentare a paginii. Combinația dintre ușurința în utilizare, suportul multi-limbă și personalizarea profundă face din SwiftyTesseract un instrument unic, versatil și puternic pentru dezvoltatorii de software care abordează o gamă largă de proiecte de recunoaștere a textului.

Prezentare generală

O prezentare a funcționalităților SwiftyTesseract.

Prezentare funcționalități

Efectuează operații OCR
Adaugă capabilități OCR
Recunoaște text din imagine
Export imagine în text
Recunoaște text din font
Caută în PDF
Peste 100 de limbi
Creează aplicații OCR
Salvează în browser
Extrage text
Suport multi-threading
Recunoaște text din imagini

SwiftyTesseract

SwiftyTesseract suportă formatele de fișiere imagine populare enumerate mai jos.

Cititor

PNG, JPEG, BMP, TIFF, TGA, DICOM

Scriitor

PNG, JPEG, BMP, TIFF

SwiftyTesseract

Independență de platformă

SwiftyTesseract poate lucra cu orice limbaj de programare bazat pe Swift

Swift 4.1 și versiuni ulterioare.

SwiftyTesseract

Începeți cu SwiftyTesseract

Metoda recomandată pentru instalarea SwiftyTesseract este utilizarea CocoaPods. Vă rugăm să folosiți comanda următoare pentru o instalare fără probleme.

Instalați SwiftyTesseract prin CocoaPods

 pod 'SwiftyTesseract'

De asemenea, îl puteți instala manual; descărcați cele mai recente fișiere de lansare direct din depozitul GitHub.

Efectuați OCR pe o imagine prin biblioteca Swift

Biblioteca open source SwiftyTesseract facilitează dezvoltatorilor de software încărcarea diferitelor tipuri de imagini și efectuarea operațiilor OCR conform nevoilor lor în cadrul aplicațiilor Swift. Puteți folosi o imagine din resursele aplicației sau din orice altă sursă. Biblioteca poate recunoaște text în diverse fonturi, inclusiv Serif, Arial, Sans-serif și fonturi de tip script. Iată un fragment de cod exemplu care demonstrează cum dezvoltatorii pot recunoaște text dintr-o imagine în aplicațiile Swift.

Cum să recunoașteți text dintr-o imagine în aplicațiile Swift?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Suport pentru preprocesarea imaginilor

Biblioteca SwiftyTesseract oferă suport complet pentru preprocesarea imaginilor înainte de efectuarea operațiilor OCR în aplicațiile Swift. De exemplu, puteți converti imaginile în tonuri de gri, redimensiona, ajusta contrastul, corecta înclinarea, binariza și altele. Iată un exemplu care arată cum dezvoltatorii pot redimensiona o imagine înainte de OCR. În acest exemplu, funcția resizeImage redimensionează imaginea înainte de a fi procesată, ceea ce poate fi util când lucrați cu imagini de înaltă rezoluție.

Cum să preprocesați imaginile înainte de operațiile OCR în aplicațiile Swift?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Operații OCR multilingve prin biblioteca Swift

Biblioteca open source SwiftyTesseract suportă recunoașterea textului în peste 100 de limbi, inclusiv engleză, spaniolă, franceză, germană, chineză și multe altele. Puteți seta limbile dorite la inițializarea bibliotecii. Această funcționalitate extinde domeniul de aplicare pentru utilizatorii internaționali și cerințele de procesare multi-limbă. În plus, dezvoltatorii pot crea dicționare personalizate pentru a îmbunătăți acuratețea procesului OCR. Iată un exemplu de configurare a bibliotecii pentru engleză și spaniolă. Acest cod permite OCR în ambele limbi, util când se procesează documente cu conținut mixt.

Cum să selectați limbile pentru operații OCR multilingve în aplicațiile Swift?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Parametri OCR personalizabili

Folosind biblioteca open source SwiftyTesseract, dezvoltatorii de software au posibilitatea de a personaliza setările OCR pentru a îmbunătăți acuratețea pentru tipuri specifice de documente sau limbi. Aceasta permite ajustarea fină a procesului OCR, făcând biblioteca adaptabilă pentru scenarii OCR unice sau complexe. Include posibilitatea de a specifica limbi și variabile OCR în funcție de nevoile documentului. Mai jos este un exemplu care arată cum dezvoltatorii pot personaliza modul motorului OCR și modul de segmentare a paginii.

Cum să personalizați modul motorului OCR și modul de segmentare a paginii prin API Swift?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}