
Aspose.OCR library for Node.js via C++
Node.js OCR 库用于识别/提取图像文本
Node.js OCR API 使软件开发人员能够从图像、扫描文档、照片和截图中提取文本,并自动化涉及文本识别的任务。
Aspose.OCR library for Node.js via C++ 是一个强大的库,为使用 Node.js 应用程序的软件开发人员提供光学字符识别(OCR)功能。该库是 Aspose 套件的一部分,以其稳健可靠的文档处理解决方案而闻名,其主要特性是能够识别并提取图像、扫描文档、照片、截图等中的文本。该库还可以识别手写文本,除了印刷文本之外,扩大了其在更广泛文档中的可用性。除了提取纯文本外,它还可以保留已识别文本的格式,包括字体样式、大小和颜色。
Aspose.OCR for Node.js 库的突出特点之一是支持多种图像格式,包括 JPEG、PNG、BMP、TIFF 等。此多功能性使软件开发人员能够处理各种图像,简化不同类型文档和图形的处理。此外,它提供先进的 OCR 算法,确保文本提取的准确性和可靠性。通过利用复杂的识别技术,即使在文本倾斜、模糊或失真的情况下,库也能有效解释图像中的文本。
Aspose.OCR for Node.js 支持多语言,适用于全球化应用。它能够识别超过 130 种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、中文、日语等。库在性能和可扩展性方面进行了优化,能够高效处理大量图像。它允许开发人员为结构化文档定义自定义模板,此功能对于从表单、发票及其他模板化文档中提取特定字段非常有用。总体而言,Aspose.OCR 库是希望在 Node.js 应用程序中集成 OCR 功能的开发人员的宝贵工具。
开始使用 Aspose.OCR 库(Node.js via C++)
推荐的安装方式是使用 npm。请使用以下命令进行顺利安装。
Aspose.OCR 库(Node.js via C++)提供了完整的光学字符识别(OCR)功能,可在各种图像上执行操作。只需几行代码,软件开发人员即可在 Node.js 应用程序中识别并提取图像文本。该 API 支持多种流行的图像文件格式,如 JPEG、PNG、GIF、TIFF、PDF、BMP 等。库还具备识别旋转、倾斜和噪声图像的关键特性。此外,软件开发人员可以将识别结果保存为最流行的文档和数据交换格式。以下示例展示了如何使用 JavaScript 命令加载并提取图像文本。如何在 Node.js 应用中识别图像文本?
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
Node.js 应用中的手写文本识别
如何在 Node.js 应用中识别图像文本?
let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);
// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
result, Module.ExportFormat.text);
console.log(text);
Aspose.OCR 库(Node.js via C++)让软件开发人员能够在自己的 Node.js 应用中识别手写文本。它除了能够识别印刷文本外,还能识别手写文本,扩大了在更广泛文档中的适用性。开发人员只需启用手写文本模式即可进行识别。也可以直接从 URL 加载图像而无需本地下载。以下示例展示了如何在 Node.js 应用中加载并识别手写文本。
如何在 Node.js 应用中识别手写文本
const recognizeHandwritten = true;
ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
if (error) throw error;
console.log('Extracted Handwritten Text:', data.text);
});
基于模板的识别支持
基于模板的识别涉及定义一个模板,指定文档的布局和感兴趣区域。使用 Aspose.OCR for Node.js via C++ 的基于模板的识别为从固定布局的文档中提取数据提供了结构化且精确的方式。此功能对于从表单、发票及其他模板化文档中提取特定字段非常有用。下面的示例展示了开发人员如何在 Node.js 应用中加载模板并将其应用于图像进行 OCR。
如何在 Node.js 应用中加载模板并将其应用于图像进行 OCR?
const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const templateApi = new TemplateApi();
const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
fs.readFile(templatePath, (err, templateBuffer) => {
if (err) throw err;
// Load the template
templateApi.addTemplate(templateBuffer, (error, templateId) => {
if (error) throw error;
// Apply the template to the image
ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
if (error) throw error;
console.log('Extracted Data:', result.fields);
});
});
});
});
在 OCR 操作中保留文本格式
在 OCR 操作中保留文本格式对于结构、字体样式和布局重要的应用至关重要。除了提取纯文本外,Aspose.OCR for Node.js via C++ 还能保留已识别文本的格式,包括字体样式、大小和颜色。这对于处理对文本格式有严格要求的文档尤为有用。下面的示例演示了开发人员如何使用 Aspose.OCR API 在 Node.js 应用中保留文本格式。
如何在 Node.js 应用中保留 OCR 操作的文本格式?
const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');
const appSid = 'your-app-sid';
const appKey = 'your-app-key';
AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;
const ocrApi = new OcrApi();
const imagePath = 'path/to/your/document.jpg';
fs.readFile(imagePath, (err, imageBuffer) => {
if (err) throw err;
const recognitionSettings = new OCRRecognitionSettings();
recognitionSettings.setDetectAreas(true);
recognitionSettings.setDetectText(true);
recognitionSettings.setDetectItalic(true);
recognitionSettings.setDetectBold(true);
ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
if (error) throw error;
const formattedText = data.text;
const formattingDetails = data.textAreas;
console.log('Extracted Text with Formatting:', formattedText);
console.log('Formatting Details:', formattingDetails);
});
});
