Free Node.js API to Add OCR Capabilities to JS Projects.

Open Source Node.js OCR Library That Allows Programmers to Recognize & Extract Text from Various File Formats, including Images(JPEG, PNG), PDFs, and Documents for Free in Multi Languages.

Что такое Node-Tesseract-OCR?

В современную цифровую эпоху извлечение текста из изображений и документов стало важной задачей во многих отраслях, включая управление документами, обработку данных и искусственный интеллект. Технология оптического распознавания символов (OCR) позволяет преобразовывать отсканированные документы, изображения и PDF‑файлы в редактируемый текст. Node-Tesseract-OCR — открытый API, который использует мощность движка Tesseract OCR, предоставляя бесшовный и эффективный способ выполнения OCR‑задач в приложениях Node.js.

Node-Tesseract-OCR — это обёртка Node.js для движка Tesseract OCR, позволяющая разработчикам использовать мощные функции распознавания текста Tesseract в среде Node.js. API поддерживается в этом репозитории GitHub и предлагает широкий набор функций, подходящих для различных сценариев, от простого извлечения текста до сложной обработки документов. Разработчики могут извлекать текст из изображений и документов на множестве языков, делая инструмент универсальным для разных приложений.

API Node-Tesseract-OCR предоставляет расширенные возможности обработки изображений, включая фильтрацию, изменение размера и обрезку, чтобы гарантировать точность и надёжность извлечённого текста. Он поддерживает более 100 языков, что делает его гибким решением для OCR‑задач в разнообразных средах. Разработчики могут извлекать текст из изображений, PDF и документов и получать результат в различных форматах, таких как JSON, XML и простой текст. Он спроектирован как лёгкий, гибкий и простой в использовании, что делает его идеальным выбором для тех, кто хочет добавить возможности OCR в свои проекты. Благодаря расширенной обработке изображений, поддержке языков и механизмам обработки ошибок, он является отличным выбором для разработчиков.

Обзор

Обзор возможностей Node-Tesseract-OCR.

Обзор функций

Выполнять OCR
Добавлять возможности OCR
Распознавать текст на изображении
Преобразовывать изображения текста
Распознанный шрифт
Поиск PDF
Более 100 языков
Создавать OCR приложения
Сохранять в браузер
Извлекать текст
Поддержка многопоточности

Node-Tesseract-OCR

Node-Tesseract-OCR поддерживает популярные форматы изображений, перечисленные ниже.

Чтение

PNG, JPEG, BMP, TIFF, TGA, DICOM

Запись

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Платформенная независимость

Node-Tesseract-OCR может работать с любым языком программирования на базе Java

Java

Node-Tesseract-OCR

Начало работы с Node-Tesseract-OCR

Рекомендуемый способ установки Node-Tesseract-OCR — использовать npm. Пожалуйста, используйте следующую команду для беспроблемной установки

Установить Node-Tesseract-OCR через npm

npm install node-tesseract-ocr

Вы можете также установить его вручную; загрузите последние файлы релиза напрямую из GitHub репозитория.

Извлечение текста из изображений в Node.js API

Открытая библиотека Node-Tesseract-OCR упрощает задачу разработчикам создавать приложения, автоматически извлекающие текст из изображений внутри Node.js приложений. Она поддерживает извлечение текста из сканированных документов, PDF, фотографий с камеры или фотографий чеков. Это может быть полезно для создания поисковых архивов, автоматизации ввода данных или обработки больших объёмов документов в таких секторах, как финансы и здравоохранение. Ниже приведён простой пример, показывающий, как программно извлекать текст из изображений внутри Node.js приложений.

Как извлечь текст из изображений в среде Node.js?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Лучшее предварительное обработка изображений в Node.js

Предварительная обработка изображений перед применением OCR может значительно повысить точность распознавания текста. Открытая библиотека Node-Tesseract-OCR позволяет использовать базовые техники предобработки, такие как изменение размера, бинаризация и исправление наклона. Эти шаги могут быть реализованы с помощью дополнительных библиотек Node.js, например sharp или jimp, в сочетании с Node-Tesseract-OCR. Ниже показан пример, как разработчики используют предобработку для улучшения распознавания, особенно при работе с изображениями низкого качества.

Как применить шаги предобработки для улучшения распознавания через Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Распознанный текст на нескольких языках

Одна из выдающихся особенностей Node-Tesseract-OCR — обширная поддержка множества языков. Библиотека Tesseract OCR поддерживает более 100 языков, что делает её идеальным выбором для приложений, которым необходимо обрабатывать документы на разных языках. Разработчики могут указать язык(и), которые они хотят использовать, повышая точность распознавания для неанглийского текста. Ниже пример, показывающий, как разработчики могут распознавать текст на французском внутри Node.js приложений.

Как распознать текст на изображении на французском через JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });