1. Produtos
  2.   OCR
  3.   Swift
  4.   SwiftyTesseract
 
  

Biblioteca OCR Swift Gratuita para Realizar OCR em Imagens Escaneadas & PDFs

Biblioteca de Reconhecimento Óptico de Caracteres (OCR) em Swift de Código Aberto permite Digitalizar, Reconhecer e Extrair Texto de Fotos de Câmera, Imagens Escaneadas & PDFs gratuitamente no iOS e macOS

O que é o SwiftyTesseract?

SwiftyTesseract é uma biblioteca OCR de código aberto de primeira linha, projetada especificamente para o ecossistema Swift, capacitando desenvolvedores de software a integrar de forma fluida o reconhecimento óptico de caracteres sofisticado em seus aplicativos iOS e macOS. Ao aproveitar o poderoso e comprovado motor Tesseract OCR, ela fornece uma interface Swift intuitiva e simplificada para extrair texto com precisão de imagens, documentos escaneados e diversos meios digitais. Isso a torna uma base ideal para desenvolvedores que criam desde utilitários simples de leitura de texto até ferramentas complexas de processamento de dados que exigem recursos confiáveis de digitalização e reconhecimento de texto no ambiente Apple.

Esta biblioteca simplifica a integração de OCR ao encapsular a funcionalidade do Tesseract em uma API direta e amigável ao desenvolvedor. Ela oferece ampla versatilidade imediatamente, incluindo suporte robusto a múltiplos idiomas – um recurso crítico para a criação de aplicações internacionais. Para garantir alta precisão, SwiftyTesseract incorpora capacidades essenciais de pré‑processamento de imagem que melhoram a clareza do texto antes do reconhecimento. Além disso, os desenvolvedores mantêm controle granular ao personalizar opções chave de configuração do Tesseract, como o modo do motor OCR e o modo de segmentação de página. Sua combinação de facilidade de uso, suporte multilíngue e profunda personalização faz do SwiftyTesseract uma ferramenta singularmente versátil e poderosa para desenvolvedores que enfrentam uma ampla gama de projetos de reconhecimento de texto.

Previous Next

Começando com SwiftyTesseract

A forma recomendada para instalar o SwiftyTesseract é usando CocoaPods. Por favor, use o comando abaixo para uma instalação tranquila.

Instalar SwiftyTesseract via CocoaPods

 pod 'SwiftyTesseract' 

Você também pode instalá‑lo manualmente; baixe os arquivos de lançamento mais recentes diretamente do GitHub repositório.

Realizar OCR em uma Imagem via Biblioteca Swift

A biblioteca de código aberto SwiftyTesseract facilita para desenvolvedores carregar diversos tipos de imagens e executar operações de OCR conforme suas necessidades dentro de aplicativos Swift. Você pode usar uma imagem dos recursos do seu app ou de qualquer outra fonte. A biblioteca pode reconhecer texto em várias fontes, incluindo Serif, Arial, Sans‑serif e fontes script. Aqui está um trecho de código de exemplo que demonstra como desenvolvedores podem reconhecer texto a partir de uma imagem dentro de aplicativos Swift.

Como Reconhecer Texto a partir de uma Imagem dentro de Aplicações Swift?

import SwiftyTesseract

// Load the image
let image = UIImage(named: "image.jpg")!

// Create a Tesseract instance
let tesseract = Tesseract()

// Set the language to English
tesseract.language = "eng"

// Set the image
tesseract.image = image

// Recognize the text
tesseract.recognize() { result in
    if let text = result.text {
        print("Recognized text: \(text)")
    } else {
        print("Error recognizing text")
    }
}

Suporte ao Pré‑processamento de Imagem

A biblioteca SwiftyTesseract oferece suporte completo ao pré‑processamento de imagens antes de executar operações de OCR dentro de aplicativos Swift. Por exemplo, você pode converter imagens para escala de cinza, redimensionar, ajustar contraste, corrigir inclinação, binarizar etc. Aqui está um exemplo que mostra como desenvolvedores podem redimensionar uma imagem antes de executar OCR. Neste exemplo de código, resizeImage redimensiona a imagem antes de ser processada, o que pode ser útil ao trabalhar com imagens de alta resolução.

Como Pré‑processar Imagens antes de Operações OCR dentro de Apps Swift?

func resizeImage(_ image: UIImage, newSize: CGSize) -> UIImage? {
    UIGraphicsBeginImageContextWithOptions(newSize, false, 0.0)
    image.draw(in: CGRect(origin: .zero, size: newSize))
    let newImage = UIGraphicsGetImageFromCurrentImageContext()
    UIGraphicsEndImageContext()
    return newImage
}

if let resizedImage = resizeImage(image, newSize: CGSize(width: 300, height: 300)) {
    tesseract.performOCR(on: resizedImage) { recognizedText in
        print("Resized Image OCR result: \(recognizedText ?? "No text found")")
    }
}

Operações OCR Multilíngues via Biblioteca Swift

A biblioteca de código aberto SwiftyTesseract suporta o reconhecimento de texto em mais de 100 idiomas, incluindo Inglês, Espanhol, Francês, Alemão, Chinês e muitos outros. Você pode definir o idioma de sua escolha ao inicializar a biblioteca. Esse recurso amplia seu escopo de aplicação para usuários internacionais e requisitos de processamento multilíngue. Além disso, desenvolvedores podem criar dicionários personalizados para melhorar a precisão do processo OCR. Aqui está um exemplo de configuração da biblioteca para Inglês e Espanhol. Este código habilita OCR em ambos os idiomas, o que é útil ao processar documentos com conteúdo de idiomas mistos.

Como Selecionar Idiomas para Operações OCR Multilíngues dentro de Apps Swift?

let tesseract = SwiftyTesseract(language: [.english, .spanish])

Parâmetros OCR Personalizáveis

Usando a biblioteca de código aberto SwiftyTesseract, desenvolvedores de software têm a capacidade de personalizar as configurações de OCR para melhorar a precisão para tipos específicos de documentos ou idiomas. Ela permite que os desenvolvedores ajustem finamente o processamento OCR, tornando a biblioteca adaptável a cenários únicos ou complexos de OCR. Isso inclui a capacidade de especificar idiomas e variáveis OCR com base nas necessidades do documento. Abaixo está um exemplo que mostra como desenvolvedores podem personalizar o modo do motor OCR e o modo de segmentação de página.

Como Personalizar o Modo do Motor OCR e o Modo de Segmentação de Página via API Swift?

let tesseract = SwiftyTesseract(language: .english, engineMode: .lstmOnly)
tesseract.performOCR(on: image, configuration: [.psm(.auto)]) { recognizedString in
    if let recognizedString = recognizedString {
        print("Recognized text with custom PSM: \(recognizedString)")
    }
}

 Português