1. Produtos
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Biblioteca Java de código aberto para processamento de texto e imagem OCR

Uma biblioteca Java gratuita líder que permite aos desenvolvedores de software adicionar recursos de OCR a aplicativos Java e executar OCR em imagens digitalizadas e arquivos PDF para extrair texto deles com facilidade.

O Asprise OCR SDK para Java é um poderoso SDK Java de código aberto que oferece a capacidade de realizar reconhecimento óptico de caracteres (OCR) em imagens digitalizadas, arquivos PDF e outros documentos. Com sua API Java fácil de usar, este SDK pode ajudar os desenvolvedores a adicionar recursos de OCR aos seus aplicativos Java de maneira rápida e fácil. OCR é uma tecnologia muito útil que permite aos computadores reconhecer texto em imagens ou documentos. O software OCR pode ser usado para converter imagens digitalizadas de texto em texto digital que pode ser editado, pesquisado ou processado por um computador.

O Asprise OCR SDK inclui vários recursos importantes para lidar com atividades relacionadas ao OCR, como processamento rápido de OCR, suporte a vários idiomas, recurso de aprimoramento de imagem, texto reconhecido em vários formatos e muito mais. O SDK é baseado em tecnologia avançada de OCR que pode reconhecer texto em uma ampla variedade de fontes e idiomas. A biblioteca pode ser usada para desenvolver aplicativos para miniaplicativos Java, aplicativos web, componentes Swing/JavaFX e aplicativos corporativos JEE.

O Asprise OCR SDK permite que os desenvolvedores de software produzam texto reconhecido em vários formatos, incluindo texto simples, PDF pesquisável e Microsoft Word. O SDK pode reconhecer texto em mais de 100 idiomas, incluindo inglês, chinês, japonês, árabe e muitos mais. Com sua tecnologia avançada de OCR, suporte abrangente a idiomas e API fácil de usar, este SDK pode ajudar os desenvolvedores a economizar tempo e esforço ao criar aplicativos de OCR.

Previous Next

Introdução ao Asprise OCR SDK para Java

Primeiros passos com o Asprise OCR SDK para Java A maneira recomendada de instalar o Asprise OCR SDK para Java é usando Maven. Use o seguinte comando para uma instalação tranquila.

Dependência Maven para Asprise OCR SDK para Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Install Asprise OCR SDK for Java via GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Extraia texto em formato de texto simples via Java

O Asprise OCR SDK para Java fornece funcionalidade completa para extrair texto de imagens em formato de texto simples. A biblioteca permite aos usuários recuperar facilmente o conteúdo de texto de documentos ou imagens digitalizados e usá-los para processamento ou análise posterior. Para realizar a tarefa de extração de texto simples, primeiro você precisa carregar a imagem de um arquivo, fluxo de entrada ou URL e aplicar o reconhecimento OCR à imagem carregada usando a API. Use a função apropriada para recuperar o texto reconhecido em formato de texto simples. A seguir mostra como carregar uma imagem e reconhecer o texto como texto simples e o resultado é impresso no console.

Carregar imagem e texto reconhecido via API Java

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Executar diversas operações de OCR em aplicativos Java

Asprise OCR SDK para Java API permite que desenvolvedores de software realizem diversas operações de OCR (Optical Character Recognition) em diferentes tipos de documentos. A biblioteca oferece suporte total a diferentes tipos de operações de OCR, como arquivos de imagem OCR, arquivos PDF OCR, texto manuscrito OCR, OCR em vários idiomas, executar OCR em parte da imagem, executar OCR em vários arquivos de entrada de uma só vez, executar OCR em um determinada página do arquivo TIFF especificado, processamento em lote de OCR e muito mais. A biblioteca fornece uma ferramenta poderosa e flexível para realizar operações de OCR em vários tipos de documentos. Com suporte para vários idiomas, arquivos de imagem e PDF, texto manuscrito e processamento em lote, você pode extrair texto de seus documentos com rapidez e precisão.

Realizar OCR em vários arquivos por meio da biblioteca Java

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Suporte multithreading usando Asprise OCR

Asprise OCR SDK for Java API inclui suporte completo para multi-threading, que permite aos desenvolvedores processar múltiplas tarefas de OCR simultaneamente. Esse recurso permite que os desenvolvedores melhorem o desempenho de seus aplicativos de OCR distribuindo o processamento de OCR por vários threads, que podem ser executados simultaneamente em vários núcleos ou processadores. O suporte multithreading é altamente personalizável, permitindo que os desenvolvedores ajustem o número de threads e mecanismos de OCR para corresponder aos recursos disponíveis e aos requisitos de processamento. Em grande parte, o suporte multithreading do Asprise OCR SDK para Java fornece aos desenvolvedores uma ferramenta poderosa e flexível para criar aplicativos de OCR de alto desempenho que podem processar grandes volumes de texto de forma rápida e eficiente.

Escrevendo código complicado de gerenciamento de threads

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Português