Aspose.OCR for Java
API Java OCR superior para adicionar operações de reconhecimento óptico de caracteres
Uma API Java líder permite construir aplicativos com recursos de reconhecimento óptico de caracteres (OCR). Leia e reconheça texto de documentos digitalizados, imagens e outros arquivos por meio da biblioteca Java.
Aspose.OCR for Java é um mecanismo líder de OCR (Optical Character Recognition) que oferece aos desenvolvedores de software a capacidade de integrar a funcionalidade de reconhecimento de texto em seus aplicativos Java. Ele foi projetado para ser muito simples de manusear e permite que os desenvolvedores de software reconheçam texto de documentos digitalizados, imagens e outras fontes, e pode ser usado para extrair texto de vários formatos de arquivo, incluindo JPEG, PNG, BMP, TIFF, HTML, PDF e muitos outros.
Aspose.OCR para Java usa algoritmos avançados de OCR para reconhecer com precisão texto de imagens, mesmo em digitalizações ou fotografias de baixa qualidade. Inclui suporte para mais de 50 idiomas diferentes, incluindo inglês, espanhol, francês, alemão, chinês e muito mais. Existem vários recursos importantes na biblioteca, como reconhecimento de texto manuscrito, extrair texto de capturas de tela, extrair texto de áreas específicas de uma imagem, criar PDFs pesquisáveis, suporte para fotos de smartphones, suporte para remoção de ruído, suporte para binarização de imagens, maior acessibilidade e muitos mais.
Aspose.OCR para Java usa algoritmos avançados de OCR que podem reconhecer com precisão texto de imagens, mesmo em digitalizações ou fotografias de baixa qualidade. A biblioteca pode melhorar a acessibilidade dos usuários, convertendo documentos digitalizados em documentos digitais pesquisáveis com facilidade. Com seus algoritmos de OCR avançados, suporte a vários idiomas e fácil integração, o Aspose.OCR para Java está rapidamente se tornando o software de OCR ideal para desenvolvedores que desejam adicionar funcionalidade de OCR aos seus aplicativos Java.
Primeiros passos com Aspose.OCR para Java
A maneira recomendada de instalar o Aspose.OCR para Java é usando o Maven Repository. Use o seguinte comando para uma instalação tranquila.
Instale Aspose.OCR para Java por meio do repositório Maven
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Você pode baixar a biblioteca diretamente da Aspose.OCR página do produto
Extrair texto de imagens via API Python
Aspose.OCR para Java incluiu recursos muito úteis que permitem aos desenvolvedores de software extrair texto de vários tipos de imagens dentro de aplicativos Python. A biblioteca inclui suporte para leitura de texto de imagens rasterizadas como JPEG, PNG, WBMP, BMP, GIF e muito mais. Existem outros recursos úteis na biblioteca para lidar com a extração de texto, como leitura de texto de imagens TIFF de várias páginas, extração de texto de matriz de pixels, leitura de imagens no modo de reconhecimento mais rápido, reconhecimento de linha única, extração de texto de recibos e muito mais. O exemplo a seguir mostra como extrair texto de uma imagem usando comandos Java.
Como extrair texto de imagem usando Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Ler áreas específicas de uma imagem via API Java
Aspose.OCR for Java é uma biblioteca de OCR útil que permite aos desenvolvedores de software encontrar e ler apenas áreas específicas de uma imagem, e não todo o texto, usando algumas linhas de código Java. É um recurso muito útil e pode ser muito útil no processamento em lote de documentos uniformes, como vistos, carteiras de motorista, carteiras de identidade e assim por diante. Ele suporta recursos como extração de texto dentro de um retângulo de imagem, extração de linhas com coordenadas, pesquisa automática de caixas delimitadoras de palavras e linhas e muito mais. O exemplo a seguir mostra como extrair texto dentro de um retângulo usando código Java.
Como extrair texto dentro de um retângulo via API Java?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Selecionar áreas específicas do documento por meio da API Java
Uma imagem de documento pode conter vários blocos de vários conteúdos, como parágrafos de texto, desenhos, diagramas, fórmulas, tabelas, mapas e assim por diante. Aspose.OCR para Java permite que os desenvolvedores de software selecionem e detectem áreas específicas de interesse em uma página com facilidade e executem operações de OCR nela. A biblioteca oferece suporte à detecção automática de área e você pode substituí-la selecionando manualmente as áreas de interesse. O exemplo a seguir demonstrou como os desenvolvedores de software podem ativar a detecção automática de áreas de documentos em seus aplicativos Java.
Detecção automática de áreas de documentos via API Java
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");