1. Productos
  2.   OCR
  3.   Java
  4.   Aspose.OCR for Java

Aspose.OCR for Java

 
 

Principal API de OCR de Java para agregar operaciones de reconocimiento óptico de caracteres

Una API de Java líder permite crear aplicaciones con capacidades de reconocimiento óptico de caracteres (OCR). Lea y reconozca texto de documentos escaneados, imágenes y otros archivos a través de la biblioteca Java.

Aspose.OCR para Java es un motor OCR (reconocimiento óptico de caracteres) líder que brinda a los desarrolladores de software la capacidad de integrar la funcionalidad de reconocimiento de texto en sus aplicaciones Java. Está diseñado para ser muy sencillo de manejar y permite a los desarrolladores de software reconocer texto de documentos escaneados, imágenes y otras fuentes, y puede usarse para extraer texto de varios formatos de archivo, incluidos JPEG, PNG, BMP, TIFF, HTML, PDF. y muchos otros.

Aspose.OCR para Java utiliza algoritmos OCR avanzados para reconocer con precisión el texto de las imágenes, incluso en fotografías o escaneos de baja calidad. Ha incluido soporte para más de 50 idiomas diferentes, incluidos inglés, español, francés, alemán, chino y más. Hay varias características importantes que forman parte de la biblioteca, como reconocimiento de texto escrito a mano, extracción de texto de capturas de pantalla, extracción de texto de áreas específicas de una imagen, creación de archivos PDF con capacidad de búsqueda, compatibilidad con fotos de teléfonos inteligentes, compatibilidad con eliminación de ruido, compatibilidad con binarización de imágenes, mayor accesibilidad y muchas más. más.

Aspose.OCR para Java utiliza algoritmos OCR avanzados que pueden reconocer con precisión texto de imágenes, incluso en fotografías o escaneos de baja calidad. La biblioteca puede mejorar la accesibilidad para los usuarios al convertir fácilmente documentos escaneados en documentos digitales con capacidad de búsqueda. Con sus algoritmos de OCR avanzados, compatibilidad con múltiples idiomas y fácil integración, Aspose.OCR para Java se está convirtiendo rápidamente en el software de OCR de referencia para los desarrolladores que buscan agregar funcionalidad de OCR a sus aplicaciones Java.

Previous Next

Introducción a Aspose.OCR para Java

La forma recomendada de instalar Aspose.OCR para Java es utilizar Maven Repository. Utilice el siguiente comando para una instalación sin problemas.

Instalar Aspose.OCR para Java a través del repositorio Maven

 <repositories>
	<repository>
	<Id>AsposeJavaAPI</Id>
	<name>Aspose Java API;/name>
	<url>http://repository.aspose.com/repo/</url>
    </repository>
</repositories>

Puede descargar la biblioteca directamente desde la Aspose.OCR página del producto

Extraer texto de imágenes mediante la API de Python

Aspose.OCR para Java ha incluido características muy útiles que permiten a los desarrolladores de software extraer texto de varios tipos de imágenes dentro de aplicaciones Python. La biblioteca ha incluido soporte para leer texto de imágenes rasterizadas como JPEG, PNG, WBMP, BMP, GIF y muchas más. Hay otras funciones útiles que forman parte de la biblioteca para manejar la extracción de texto, como leer texto de imágenes TIFF de varias páginas, extraer texto de una matriz de píxeles, leer imágenes en el modo de reconocimiento más rápido, reconocer una sola línea, extraer texto de recibos y muchas más. El siguiente ejemplo muestra cómo extraer texto de una imagen usando comandos Java.

¿Cómo extraer texto de una imagen usando la API de Java?

AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
	System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();

Leer áreas específicas de una imagen mediante la API de Java

Aspose.OCR para Java es una útil biblioteca de OCR que permite a los desarrolladores de software buscar y leer sólo áreas concretas de una imagen, no todo el texto, utilizando un par de líneas de código Java. Es una característica muy útil y puede resultar muy útil en el procesamiento por lotes de documentos uniformes como visas, licencias de conducir, tarjetas de identificación, etc. Admite funciones como extraer texto dentro de un rectángulo de imagen, extraer líneas con coordenadas, búsqueda automática de cuadros delimitadores de líneas y palabras, y muchas más. El siguiente ejemplo muestra cómo extraer texto dentro de un rectángulo usando código Java.

¿Cómo extraer texto dentro de un rectángulo mediante la API de Java?

AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);	
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));

Seleccione áreas específicas del documento mediante la API de Java

La imagen de un documento puede contener numerosos bloques de diversos contenidos, como párrafos de texto, dibujos, diagramas, fórmulas, tablas, mapas, etc. Aspose.OCR para Java permite a los desarrolladores de software seleccionar y detectar áreas de interés particulares en una página con facilidad y realizar operaciones de OCR en ella. La biblioteca admite la detección automática de áreas y puede anularla seleccionando manualmente áreas de interés. El siguiente ejemplo demostró cómo los desarrolladores de software pueden habilitar la detección automática de áreas de documentos dentro de sus aplicaciones Java.

Detección automática de áreas de documentos mediante API de Java

 // Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");

 Español