1. Prodotti
  2.   OCR
  3.   Swift
  4.   SwiftyTesseract
 
  

Libreria OCR Swift Gratuita per Eseguire OCR su Immagini Scansionate e PDF

Libreria Open Source Swift per il Riconoscimento Ottico dei Caratteri (OCR) che consente di Scansionare, Riconoscere ed Estrarre Testo da Foto della Fotocamera, Immagini Scansionate e PDF gratuitamente su iOS e macOS

Che cos'è SwiftyTesseract?

SwiftyTesseract è una libreria OCR open-source di prima classe progettata specificamente per l'ecosistema Swift, che consente agli sviluppatori di software di integrare senza sforzo un sofisticato riconoscimento ottico dei caratteri nelle loro applicazioni iOS e macOS. Sfruttando il potente e collaudato motore Tesseract OCR, fornisce un'interfaccia Swift intuitiva e semplificata per estrarre con precisione testo da immagini, documenti scansionati e vari media digitali. Questo la rende una base ideale per sviluppatori che costruiscono da semplici utility di lettura del testo a complessi strumenti di elaborazione dati che richiedono capacità affidabili di scansione e riconoscimento del testo nell'ambiente Apple.

Questa libreria semplifica l'integrazione dell'OCR avvolgendo le funzionalità di Tesseract in un'API chiara e orientata allo sviluppatore. Offre una versatilità estesa fin dal primo utilizzo, inclusa un'ampia compatibilità con più lingue – una caratteristica cruciale per la creazione di applicazioni internazionali. Per garantire alta accuratezza, SwiftyTesseract incorpora capacità essenziali di preelaborazione delle immagini che migliorano la chiarezza del testo prima del riconoscimento. Inoltre, gli sviluppatori mantengono un controllo granulare personalizzando le principali opzioni di configurazione di Tesseract, come la modalità del motore OCR e la modalità di segmentazione della pagina. La combinazione di facilità d'uso, supporto multilingua e profonda personalizzabilità rende SwiftyTesseract uno strumento unico, versatile e potente per gli sviluppatori che affrontano una vasta gamma di progetti di riconoscimento del testo.

Previous Next

Iniziare con SwiftyTesseract

Il modo consigliato per installare SwiftyTesseract è utilizzare CocoaPods. Si prega di usare il comando seguente per un'installazione senza problemi.

Installa SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract' 

È possibile installarlo anche manualmente; scaricare i file dell'ultima release direttamente dal repository GitHub.

Eseguire OCR su un'Immagine tramite Libreria Swift

Libreria open source SwiftyTesseract rende facile per gli sviluppatori caricare diversi tipi di immagini ed eseguire operazioni OCR secondo le proprie necessità all'interno delle applicazioni Swift. È possibile utilizzare un'immagine dalle risorse dell'app o da qualsiasi altra fonte. La libreria può riconoscere testo in vari font, inclusi Serif, Arial, Sans-serif e font script. Ecco un frammento di codice di esempio che dimostra come gli sviluppatori possono riconoscere testo da un'immagine all'interno delle applicazioni Swift.

Come riconoscere testo da un'immagine all'interno delle applicazioni Swift?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Supporto al Preprocessamento delle Immagini

La libreria SwiftyTesseract offre un supporto completo al preprocessamento delle immagini prima di eseguire operazioni OCR all'interno delle applicazioni Swift. Ad esempio, è possibile convertire le immagini in scala di grigi, ridimensionarle, regolare il contrasto, raddrizzare un'immagine, binarizzare e così via. Ecco un esempio che mostra come gli sviluppatori possono ridimensionare un'immagine prima di eseguire l'OCR. In questo esempio di codice, resizeImage ridimensiona l'immagine prima che venga elaborata, il che può essere utile quando si lavora con immagini ad alta risoluzione.

Come preelaborare le immagini prima delle operazioni OCR nelle app Swift?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Operazioni OCR multilingua tramite Libreria Swift

La libreria open source SwiftyTesseract supporta il riconoscimento del testo in oltre 100 lingue, incluse Inglese, Spagnolo, Francese, Tedesco, Cinese e molte altre. È possibile impostare la lingua desiderata al momento dell'inizializzazione della libreria. Questa funzionalità amplia il suo ambito di utilizzo per utenti internazionali e requisiti di elaborazione multilingua. Inoltre, gli sviluppatori possono creare dizionari personalizzati per migliorare l'accuratezza del processo OCR. Ecco un esempio di configurazione della libreria per Inglese e Spagnolo. Questo codice abilita l'OCR sia in Inglese che in Spagnolo, utile quando si elaborano documenti con contenuti multilingua.

Come selezionare le lingue per operazioni OCR multilingua nelle app Swift?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Parametri OCR personalizzabili

Utilizzando la libreria open source SwiftyTesseract, gli sviluppatori hanno la possibilità di personalizzare le impostazioni OCR per migliorare l'accuratezza per tipi specifici di documenti o lingue. Consente di affinare l'elaborazione OCR, rendendo la libreria adattabile a scenari OCR unici o complessi. Ciò include la possibilità di specificare lingue e variabili OCR in base alle esigenze del documento. Di seguito è riportato un esempio che mostra come gli sviluppatori possono personalizzare la modalità del motore OCR e la modalità di segmentazione della pagina.

Come personalizzare la modalità del motore OCR e la modalità di segmentazione pagina tramite l'API Swift?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}

 Italiano