Безплатен Node.js API за добавяне на OCR възможности към JS проекти.

Библиотека с отворен код за Node.js OCR, която позволява на програмистите да разпознават и извличат текст от различни файлови формати, включително изображения (JPEG, PNG), PDF файлове и документи, безплатно на множество езици.

Какво е Node-Tesseract-OCR?

В днешната дигитална ера извличането на текст от изображения и документи се превръща в ключова задача в различни индустрии, включително управление на документи, обработка на данни и изкуствен интелект. Технологията за оптично разпознаване на знаци (OCR) позволява конвертиране на сканирани документи, изображения и PDF файлове в редактиируеми текстови формати. Node-Tesseract-OCR е API с отворен код, което интегрира мощта на OCR двигателя Tesseract, предоставяйки безпроблемен и ефективен начин за изпълнение на OCR задачи в Node.js приложения.

Node-Tesseract-OCR е обвивка за Node.js на OCR двигателя Tesseract, позволяваща на софтуерните разработчици да използват мощните функции за разпознаване на текст на Tesseract в среда на Node.js. API‑то се поддържа в този GitHub репозитори и предлага набор от функционалности, подходящи за различни случаи на употреба – от простото извличане на текст до по-сложни задачи за обработка на документи. Софтуерните разработчици могат да извличат текст от изображения и документи на множество езици, което го прави универсален инструмент за различни приложения.

Node-Tesseract-OCR API‑то предоставя разширени възможности за обработка на изображения, включително филтриране, преоразмеряване и изрязване, за да се гарантира, че извлеченият текст е точен и надежден. Поддържа над 100 езика, което го прави гъвкаво решение за OCR задачи в разнообразни среди. Софтуерните разработчици могат да извличат текст от изображения, PDF файлове и документи и да връщат резултата в различни формати като JSON, XML и обикновен текст. Дизайнът е лек, гъвкав и лесен за употреба, което го прави идеален избор за разработчици, желаещи да добавят OCR възможности към проектите си. Със своите разширени възможности за обработка на изображения, поддръжка на езици и механизми за обработка на грешки, то е отличен избор за разработчици, които искат да интегрират OCR в своите решения.

At A Glance

An overview of Node-Tesseract-OCR features.

Features Overview

Извършване на OCR
Добавяне на OCR възможности
Разпознаване на текст от изображения
Конвертиране на изображения с текст
Разпознат текст от шрифт
Търсене в PDF
Над 100 езика
Създаване на OCR приложения
Запис в браузъра
Извличане на текст
Поддръжка на многопоточност

Node-Tesseract-OCR

Node-Tesseract-OCR supports popular image file formats listed below.

Reader

PNG, JPEG, BMP, TIFF, TGA, DICOM

Writer

PNG, JPEG, BMP, TIFF

Node-Tesseract-OCR

Platform Independence

Node-Tesseract-OCR може да работи с всякакъв Java-базиран програмен език

Java

Node-Tesseract-OCR

Започване с Node-Tesseract-OCR

Препоръчителният начин за инсталиране на Node-Tesseract-OCR е чрез npm. Моля, използвайте следната команда за гладка инсталация

Install Node-Tesseract-OCR via npm

npm install node-tesseract-ocr

Можете също да го инсталирате ръчно; изтеглете последните файлове от GitHub репозитори.

Извличане на текст от изображения в Node.js API

Отворената библиотека Node-Tesseract-OCR улеснява софтуерните разработчици да създават приложения, които автоматично извличат текст от изображения в Node.js приложения. Тя поддържа извличане на текст от сканирани документи, PDF файлове, снимки от камера или снимки на разписки. Това може да бъде полезно за създаване на търсими архиви, автоматизиране на въвеждане на данни или обработка на големи обеми документи в сектори като финанси и здравеопазване. По-долу е прост пример, който показва как програмно да се извлече текст от изображения в Node.js приложения.

How to Extract Text from Images inside Node.js Environment?

const tesseract = require("node-tesseract-ocr");

tesseract.recognize("path/to/image.jpg")
  .then(text => {
    console.log("Recognized Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Подобрена предварителна обработка на изображения в Node.js

Предварителната обработка на изображения преди прилагане на OCR може значително да подобри точността на разпознаването на текст. Отворената библиотека Node-Tesseract-OCR позволява базови техники за предварителна обработка, като преоразмеряване, бинаризация и изправяне. Тези стъпки могат да се реализират с помощта на допълнителни Node.js библиотеки като sharp или jimp в комбинация с Node-Tesseract-OCR. Следният пример показва как разработчиците използват тези стъпки за подобряване на разпознаването, особено при изображения с по-ниско качество.

How to Apply Preprocessing Steps to Improve Recognition via Node.js API?

const sharp = require("sharp");
const tesseract = require("node-tesseract-ocr");

sharp("path/to/input.jpg")
  .resize(800, 600) // Resize the image
  .greyscale() // Convert to greyscale
  .toBuffer()
  .then(data => {
    return tesseract.recognize(data, { lang: "eng" });
  })
  .then(text => {
    console.log("Preprocessed Image Text:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });

Разпознат текст на множество езици

Една от отличителните характеристики на Node-Tesseract-OCR е обширната поддръжка на множество езици. OCR библиотеката Tesseract поддържа над 100 езика, което я прави идеален избор за приложения, които трябва да обработват документи на различни езици. Софтуерните разработчици могат да зададат езика(ите), които желаят Tesseract да използва, като така подобряват точността на разпознаване за текстове, различни от английски. По-долу е пример, който показва как разработчиците могат да разпознаят текст на френски в Node.js приложения?

Как да разпознаем текст от изображение на френски чрез JavaScript API?

const config = {
  lang: "fra", // French language support
  oem: 1,
  psm: 3
};

tesseract.recognize("path/to/french-text-image.jpg", config)
  .then(text => {
    console.log("Recognized Text in French:", text);
  })
  .catch(error => {
    console.error("Error:", error.message);
  });