Aspose.OCR library for Node.js vía C++

Biblioteca OCR para Node.js para Reconocer/Extraer Texto de Imágenes

La API OCR para Node.js permite a los desarrolladores de software extraer texto de imágenes, documentos escaneados, fotos y capturas de pantalla, así como automatizar tareas que implican reconocimiento de texto.

Aspose.OCR library for Node.js vía C++ es una biblioteca poderosa que proporciona capacidades de reconocimiento óptico de caracteres (OCR) para desarrolladores de software que trabajan con aplicaciones Node.js. Esta biblioteca forma parte de la suite Aspose, conocida por sus soluciones robustas y fiables de procesamiento de documentos; su característica principal es su capacidad para reconocer y extraer texto de imágenes, documentos escaneados, fotos, capturas de pantalla, y así sucesivamente. La biblioteca también puede reconocer texto manuscrito además del texto impreso, ampliando su utilidad a una gama más amplia de documentos. Además de extraer texto plano, también puede preservar el formato del texto reconocido, incluidos los estilos de fuente, tamaños y colores.

Una de las características más destacadas de la biblioteca Aspose.OCR para Node.js es su compatibilidad con múltiples formatos de imagen, incluidos JPEG, PNG, BMP, TIFF y muchos más. Esta versatilidad permite a los desarrolladores trabajar con una amplia gama de imágenes, facilitando el procesamiento de diversos tipos de documentos y gráficos. Además, ofrece algoritmos OCR avanzados que garantizan una extracción de texto precisa y fiable. Al aprovechar técnicas de reconocimiento sofisticadas, la biblioteca puede interpretar eficazmente el texto de las imágenes, incluso en casos donde el texto está sesgado, borroso o distorsionado.

Aspose.OCR para Node.js admite varios idiomas, lo que la hace adecuada para aplicaciones globales. Puede reconocer texto en más de 130 idiomas, incluidos inglés, español, francés, alemán, italiano, portugués, chino, japonés y muchos otros. Diseñada con rendimiento y escalabilidad en mente, la biblioteca puede manejar grandes volúmenes de imágenes de manera eficiente. Permite a los desarrolladores definir plantillas personalizadas para documentos estructurados. Esta función es útil para extraer campos específicos de formularios, facturas y otros documentos con plantilla. En conjunto, la biblioteca Aspose.OCR es una herramienta valiosa para los desarrolladores que buscan incorporar funcionalidad OCR en sus aplicaciones Node.js.

A primera vista

Una visión general de las características de la biblioteca Aspose.OCR para Node.js vía C++.

Resumen de características

Operaciones OCR
Agregar capacidades OCR
Reconocer texto de imagen
Convertir imágenes de texto
Texto de fuente reconocido
Buscar PDF
27 idiomas de reconocimiento
Crear aplicaciones OCR
Guardar en el navegador
Extraer texto
Soporte multihilo

Resumen de características

Reconocer imagen rotada
Filtros de preprocesamiento
PDF a imágenes
Reconoce caracteres chinos
Detecta tipografías populares
Procesa la imagen completa
Soporte de imágenes rotadas
Reconocimiento por lotes
Corrector ortográfico integrado
Dividir PDF
PDF a Excel
PDF a SVG

Aspose.OCR library for Node.js vía C++

La API admite principalmente el formato OCR pero puede exportar documentos OCR a varios otros formatos.

Lector

PDF, PDF/A, TEX, XPS, SVG

Escritor

PDF, TXT, PNG, JPEG

Aspose.OCR library for Node.js vía C++

Independencia de plataforma

La biblioteca Aspose.OCR para Node.js vía C++ puede trabajar con cualquier lenguaje de programación basado en Java.

Entorno de ejecución Java

Aspose.OCR library for Node.js vía C++

Comenzando con la biblioteca Aspose.OCR para Node.js vía C++

La forma recomendada de instalar la biblioteca Aspose.OCR para Node.js vía C++ es usando npm. Por favor, use el siguiente comando para una instalación sin problemas.

Instalar la biblioteca Aspose.OCR para Node.js vía C++ mediante npm

 npm install aspose-ocr-cloud

Puede descargar la biblioteca directamente desde la página del producto Aspose.OCR

La biblioteca Aspose.OCR para Node.js vía C++ ha proporcionado una funcionalidad completa para realizar operaciones de reconocimiento óptico de caracteres (OCR) en diversas imágenes. Con solo un par de líneas de código, los desarrolladores pueden reconocer y extraer texto de imágenes dentro de aplicaciones Node.js. La API incluye soporte para varios formatos de archivo de imagen populares, como JPEG, PNG, GIF, TIFF, PDF, BMP y muchos más. Hay varias características importantes en la biblioteca, como el reconocimiento de imágenes rotadas, sesgadas y ruidosas. Además, los desarrolladores pueden guardar los resultados del reconocimiento en los formatos de documento e intercambio de datos más populares. El siguiente ejemplo muestra cómo se pueden usar comandos JavaScript para cargar y extraer texto de una imagen.

¿Cómo reconocer texto de una imagen en aplicaciones Node.js?

let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);

// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
              result, Module.ExportFormat.text);

console.log(text);

Reconocimiento de texto manuscrito en aplicaciones Node.js

La biblioteca Aspose.OCR para Node.js vía C++ facilita a los desarrolladores reconocer texto manuscrito dentro de sus propias aplicaciones Node.js. Puede reconocer texto manuscrito además del texto impreso, ampliando su utilidad a una gama más amplia de documentos. Los desarrolladores pueden reconocer texto manuscrito habilitando el modo de texto manuscrito. También es posible reconocer una imagen desde una URL sin descargarla localmente. El siguiente ejemplo muestra cómo los desarrolladores pueden cargar y reconocer texto manuscrito dentro de aplicaciones node.js.

¿Cómo reconocer texto manuscrito dentro de aplicaciones Node.js?

const recognizeHandwritten = true;

ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
  if (error) throw error;

  console.log('Extracted Handwritten Text:', data.text);
});

Soporte de reconocimiento basado en plantillas

El reconocimiento basado en plantillas implica definir una plantilla que especifica el diseño y las áreas de interés en un documento. El reconocimiento basado en plantillas con Aspose.OCR para Node.js vía C++ proporciona una forma estructurada y precisa de extraer datos de documentos con diseños fijos. Esta función es útil para extraer campos específicos de formularios, facturas y otros documentos con plantilla. Aquí hay un ejemplo muy útil que muestra cómo los desarrolladores pueden cargar la plantilla y aplicarla a una imagen para OCR dentro de aplicaciones Node.js.

¿Cómo cargar la plantilla y aplicarla a una imagen para OCR dentro de aplicaciones Node.js?

const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();
const templateApi = new TemplateApi();

const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  fs.readFile(templatePath, (err, templateBuffer) => {
    if (err) throw err;

    // Load the template
    templateApi.addTemplate(templateBuffer, (error, templateId) => {
      if (error) throw error;

      // Apply the template to the image
      ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
        if (error) throw error;

        console.log('Extracted Data:', result.fields);
      });
    });
  });
});

Preservar el formato del texto en operaciones OCR

Preservar el formato del texto durante las operaciones OCR es crucial para aplicaciones donde la estructura, los estilos de fuente y el diseño del texto son importantes. Además de extraer texto plano, Aspose.OCR para Node.js vía C++ también puede preservar el formato del texto reconocido, incluidos los estilos de fuente, tamaños y colores. Esto es particularmente útil para procesar documentos donde el formato del texto es esencial. A continuación se muestra un ejemplo que demuestra cómo los desarrolladores pueden preservar el formato del texto usando la API Aspose.OCR.

¿Cómo preservar el formato del texto en operaciones OCR dentro de aplicaciones Node.js?

const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();

const imagePath = 'path/to/your/document.jpg';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  const recognitionSettings = new OCRRecognitionSettings();
  recognitionSettings.setDetectAreas(true);
  recognitionSettings.setDetectText(true);
  recognitionSettings.setDetectItalic(true);
  recognitionSettings.setDetectBold(true);

  ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
    if (error) throw error;

    const formattedText = data.text;
    const formattingDetails = data.textAreas;

    console.log('Extracted Text with Formatting:', formattedText);
    console.log('Formatting Details:', formattingDetails);
  });
});