Aspose.OCR library for Node.js via C++

Node.js OCR 库用于识别/提取图像文本

Node.js OCR API 使软件开发人员能够从图像、扫描文档、照片和截图中提取文本，并自动化涉及文本识别的任务。

Aspose.OCR library for Node.js via C++ 是一个强大的库，为使用 Node.js 应用程序的软件开发人员提供光学字符识别（OCR）功能。该库是 Aspose 套件的一部分，以其稳健可靠的文档处理解决方案而闻名，其主要特性是能够识别并提取图像、扫描文档、照片、截图等中的文本。该库还可以识别手写文本，除了印刷文本之外，扩大了其在更广泛文档中的可用性。除了提取纯文本外，它还可以保留已识别文本的格式，包括字体样式、大小和颜色。

Aspose.OCR for Node.js 库的突出特点之一是支持多种图像格式，包括 JPEG、PNG、BMP、TIFF 等。此多功能性使软件开发人员能够处理各种图像，简化不同类型文档和图形的处理。此外，它提供先进的 OCR 算法，确保文本提取的准确性和可靠性。通过利用复杂的识别技术，即使在文本倾斜、模糊或失真的情况下，库也能有效解释图像中的文本。

Aspose.OCR for Node.js 支持多语言，适用于全球化应用。它能够识别超过 130 种语言，包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、中文、日语等。库在性能和可扩展性方面进行了优化，能够高效处理大量图像。它允许开发人员为结构化文档定义自定义模板，此功能对于从表单、发票及其他模板化文档中提取特定字段非常有用。总体而言，Aspose.OCR 库是希望在 Node.js 应用程序中集成 OCR 功能的开发人员的宝贵工具。

概览

Aspose.OCR 库（Node.js via C++）功能概览。

功能概览

OCR 操作
添加 OCR 功能
识别图像文本
转换文本图像
识别字体文本
搜索 PDF
27 种识别语言
创建 OCR 应用
保存到浏览器
提取文本
多线程支持

功能概览

识别旋转图像
预处理过滤器
PDF 转图像
识别中文字符
检测常用字体
处理整幅图像
支持旋转图像
批量识别
内置拼写检查器
拆分 PDF
PDF 转 Excel
PDF 转 SVG

Aspose.OCR library for Node.js via C++

API 主要支持 OCR 格式，但可以将 OCR 文档导出为多种其他格式。

读取器

PDF, PDF/A, TEX, XPS, SVG

写入器

PDF, TXT, PNG, JPEG

Aspose.OCR library for Node.js via C++

平台独立性

Aspose.OCR 库（Node.js via C++）可以与任何基于 Java 的编程语言一起使用。

Java 运行时

Aspose.OCR library for Node.js via C++

开始使用 Aspose.OCR 库（Node.js via C++）

推荐的安装方式是使用 npm。请使用以下命令进行顺利安装。

通过 npm 安装 Aspose.OCR 库（Node.js via C++）

 npm install aspose-ocr-cloud

您可以直接从 Aspose.OCR 产品页面下载库。

Aspose.OCR 库（Node.js via C++）提供了完整的光学字符识别（OCR）功能，可在各种图像上执行操作。只需几行代码，软件开发人员即可在 Node.js 应用程序中识别并提取图像文本。该 API 支持多种流行的图像文件格式，如 JPEG、PNG、GIF、TIFF、PDF、BMP 等。库还具备识别旋转、倾斜和噪声图像的关键特性。此外，软件开发人员可以将识别结果保存为最流行的文档和数据交换格式。以下示例展示了如何使用 JavaScript 命令加载并提取图像文本。

如何在 Node.js 应用中识别图像文本？

let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);

// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
              result, Module.ExportFormat.text);

console.log(text);

Node.js 应用中的手写文本识别

Aspose.OCR 库（Node.js via C++）让软件开发人员能够在自己的 Node.js 应用中识别手写文本。它除了能够识别印刷文本外，还能识别手写文本，扩大了在更广泛文档中的适用性。开发人员只需启用手写文本模式即可进行识别。也可以直接从 URL 加载图像而无需本地下载。以下示例展示了如何在 Node.js 应用中加载并识别手写文本。

如何在 Node.js 应用中识别手写文本

const recognizeHandwritten = true;

ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
  if (error) throw error;

  console.log('Extracted Handwritten Text:', data.text);
});

基于模板的识别支持

基于模板的识别涉及定义一个模板，指定文档的布局和感兴趣区域。使用 Aspose.OCR for Node.js via C++ 的基于模板的识别为从固定布局的文档中提取数据提供了结构化且精确的方式。此功能对于从表单、发票及其他模板化文档中提取特定字段非常有用。下面的示例展示了开发人员如何在 Node.js 应用中加载模板并将其应用于图像进行 OCR。

如何在 Node.js 应用中加载模板并将其应用于图像进行 OCR？

const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();
const templateApi = new TemplateApi();

const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  fs.readFile(templatePath, (err, templateBuffer) => {
    if (err) throw err;

    // Load the template
    templateApi.addTemplate(templateBuffer, (error, templateId) => {
      if (error) throw error;

      // Apply the template to the image
      ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
        if (error) throw error;

        console.log('Extracted Data:', result.fields);
      });
    });
  });
});

在 OCR 操作中保留文本格式

在 OCR 操作中保留文本格式对于结构、字体样式和布局重要的应用至关重要。除了提取纯文本外，Aspose.OCR for Node.js via C++ 还能保留已识别文本的格式，包括字体样式、大小和颜色。这对于处理对文本格式有严格要求的文档尤为有用。下面的示例演示了开发人员如何使用 Aspose.OCR API 在 Node.js 应用中保留文本格式。

如何在 Node.js 应用中保留 OCR 操作的文本格式？

const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();

const imagePath = 'path/to/your/document.jpg';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  const recognitionSettings = new OCRRecognitionSettings();
  recognitionSettings.setDetectAreas(true);
  recognitionSettings.setDetectText(true);
  recognitionSettings.setDetectItalic(true);
  recognitionSettings.setDetectBold(true);

  ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
    if (error) throw error;

    const formattedText = data.text;
    const formattingDetails = data.textAreas;

    console.log('Extracted Text with Formatting:', formattedText);
    console.log('Formatting Details:', formattingDetails);
  });
});