Aspose.OCR библиотека для Node.js через C++

Node.js OCR библиотека для распознавания/извлечения текста из изображений

Node.js OCR API позволяет разработчикам извлекать текст из изображений, отсканированных документов, фотографий и скриншотов, а также автоматизировать задачи, связанные с распознаванием текста.

Aspose.OCR библиотека для Node.js через C++ — мощная библиотека, предоставляющая возможности оптического распознавания символов (OCR) для разработчиков, работающих с приложениями Node.js. Эта библиотека является частью набора Aspose, известного своими надёжными и устойчивыми решениями для обработки документов; её основной особенностью является способность распознавать и извлекать текст из изображений, отсканированных документов, фотографий, скриншотов и т.д. Библиотека также может распознавать рукописный текст наряду с печатным, расширяя область применения на более широкий спектр документов. Помимо извлечения простого текста, она может сохранять форматирование распознанного текста, включая стили шрифтов, размеры и цвета.

Одной из выдающихся возможностей Aspose.OCR для Node.js является поддержка множества форматов изображений, включая JPEG, PNG, BMP, TIFF и многие другие. Эта универсальность позволяет разработчикам работать с широким спектром изображений, упрощая обработку различных типов документов и графики. Кроме того, библиотека предлагает продвинутые OCR‑алгоритмы, обеспечивающие точное и надёжное извлечение текста. Благодаря использованию сложных методов распознавания, библиотека эффективно интерпретирует текст на изображениях, даже если он наклонён, размытый или искажённый.

Aspose.OCR для Node.js поддерживает множество языков, что делает её подходящей для глобальных приложений. Она может распознавать текст более чем на 130 языках, включая английский, испанский, французский, немецкий, итальянский, португальский, китайский, японский и многие другие. Разработана с учётом производительности и масштабируемости, библиотека эффективно обрабатывает большие объёмы изображений. Она позволяет разработчикам определять пользовательские шаблоны для структурированных документов. Эта функция полезна для извлечения конкретных полей из форм, счетов‑фактур и других шаблонных документов. В целом, Aspose.OCR библиотека — ценный инструмент для разработчиков, желающих внедрить OCR‑функциональность в свои Node.js приложения.

Обзор

Обзор возможностей библиотеки Aspose.OCR для Node.js через C++.

Обзор возможностей

Операции OCR
Добавление возможностей OCR
Распознавание текста изображения
Конвертировать изображения текста
Распознавание шрифтов
Поиск в PDF
27 языков распознавания
Создание OCR приложений
Сохранение в браузер
Извлечение текста
Поддержка многопоточности

Обзор возможностей

Распознавание повернутых изображений
Фильтры предварительной обработки
PDF в изображения
Распознавание китайских символов
Обнаружение популярных шрифтов
Обработка полного изображения
Поддержка повернутых изображений
Пакетное распознавание
Встроенный проверщик орфографии
Разделение PDF
PDF в Excel
PDF в SVG

Aspose.OCR библиотека для Node.js через C++

API в основном поддерживает формат OCR, но может экспортировать OCR документы в ряд других форматов.

Reader

PDF, PDF/A, TEX, XPS, SVG

Writer

PDF, TXT, PNG, JPEG

Aspose.OCR библиотека для Node.js через C++

Платформенная независимость

Aspose.OCR библиотека для Node.js через C++ может работать с любым языком программирования, основанным на Java.

Java Runtime

Aspose.OCR библиотека для Node.js через C++

Начало работы с Aspose.OCR библиотекой для Node.js через C++

Рекомендуемый способ установки Aspose.OCR библиотеки для Node.js через C++ — использование npm. Пожалуйста, выполните следующую команду для быстрой установки.

Установить Aspose.OCR библиотеку для Node.js через C++ с помощью npm

 npm install aspose-ocr-cloud

Вы можете скачать библиотеку напрямую со страницы продукта Aspose.OCR

Aspose.OCR библиотека для Node.js через C++ предоставляет полный набор функций для выполнения операций оптического распознавания символов (OCR) над различными изображениями. С помощью всего лишь нескольких строк кода разработчики могут распознавать и извлекать текст из изображений внутри Node.js приложений. API поддерживает множество популярных форматов файлов изображений, таких как JPEG, PNG, GIF, TIFF, PDF, BMP и многие другие. В библиотеку включены важные возможности, такие как распознавание повернутых, наклонённых и шумных изображений. Кроме того, разработчики могут сохранять результаты распознавания в самых популярных форматах документов и обмена данными. Ниже приведён пример, показывающий, как JavaScript‑команды могут быть использованы для загрузки и извлечения текста из изображения.

Как распознать текст из изображения в Node.js приложениях?

let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);

// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
              result, Module.ExportFormat.text);

console.log(text);

Распознавание рукописного текста в Node.js приложениях

Aspose.OCR библиотека для Node.js через C++ упрощает разработчикам задачу распознавания рукописного текста в собственных Node.js приложениях. Она может распознавать рукописный текст наряду с печатным, расширяя область применения на более широкий спектр документов. Разработчики могут включить режим распознавания рукописного текста. Также возможно распознавать изображение по URL без его локального скачивания. Ниже показан пример, как разработчики могут загрузить и распознать рукописный текст в Node.js приложениях.

Как распознать рукописный текст в Node.js приложениях

const recognizeHandwritten = true;

ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
  if (error) throw error;

  console.log('Extracted Handwritten Text:', data.text);
});

Поддержка распознавания на основе шаблонов

Распознавание на основе шаблонов подразумевает определение шаблона, который задаёт макет и области интереса в документе. Распознавание на основе шаблонов с помощью Aspose.OCR для Node.js через C++ предоставляет структурированный и точный способ извлечения данных из документов с фиксированными макетами. Эта функция полезна для извлечения конкретных полей из форм, счетов‑фактур и других шаблонных документов. Ниже представлен очень полезный пример, показывающий, как разработчики могут загрузить шаблон и применить его к изображению для OCR в Node.js приложениях.

Как загрузить шаблон и применить его к изображению для OCR в Node.js приложениях?

const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();
const templateApi = new TemplateApi();

const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  fs.readFile(templatePath, (err, templateBuffer) => {
    if (err) throw err;

    // Load the template
    templateApi.addTemplate(templateBuffer, (error, templateId) => {
      if (error) throw error;

      // Apply the template to the image
      ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
        if (error) throw error;

        console.log('Extracted Data:', result.fields);
      });
    });
  });
});

Сохранение форматирования текста в операциях OCR

Сохранение форматирования текста во время OCR‑операций критически важно для приложений, где важны структура, стили шрифтов и расположение текста. Помимо извлечения простого текста, Aspose.OCR для Node.js через C++ может также сохранять форматирование распознанного текста, включая стили шрифтов, размеры и цвета. Это особенно полезно при обработке документов, где форматирование текста имеет решающее значение. Ниже приведён пример, демонстрирующий, как разработчики могут сохранять форматирование текста с помощью Aspose.OCR API.

Как сохранить форматирование текста в операциях OCR в Node.js приложениях?

const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();

const imagePath = 'path/to/your/document.jpg';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  const recognitionSettings = new OCRRecognitionSettings();
  recognitionSettings.setDetectAreas(true);
  recognitionSettings.setDetectText(true);
  recognitionSettings.setDetectItalic(true);
  recognitionSettings.setDetectBold(true);

  ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
    if (error) throw error;

    const formattedText = data.text;
    const formattingDetails = data.textAreas;

    console.log('Extracted Text with Formatting:', formattedText);
    console.log('Formatting Details:', formattingDetails);
  });
});