Безплатен Node.js API за разпознаване и извличане на текст от изображения

Безплатният Node.js е водещ Node.js API, който предлага висока точност при разпознаване на текст на множество езици и разнообразие от шрифтове и оформления.

В днешния свят на разработка, задвижван от AI, оптичното разпознаване на знаци (OCR) се превърна в съществено за автоматизиране на извличането на текст от изображения и документи. Разработчиците, които искат да създадат OCR в Node.js, могат да се възползват значително от Baidu-OCR-API, мощен инструмент, който поддържа извличане на текст от изображения, разпознаване на ръкописен текст и дори напреднали задачи като разпознаване на формуляри в Node.js приложения. Независимо дали става въпрос за сканиране на фактури, дигитализиране на документи или осигуряване на функции за достъпност, тази Node.js OCR библиотека предлага висока производителност и е лесна за интегриране с модерни приложения.

Baidu-OCR-API е безплатен Node.js OCR API, който използва дълбоко обучение за разпознаване на печатен и ръкописен текст на множество езици, включително китайски, английски, японски и други. Той се отличава в разпознаването на таблици в Node.js, сканиране на бизнес документи и разпознаване на текст в сложни условия като слаба светлина или изкривени изображения. Разработчиците могат също така да разпознават текст в естествени сцени, което го прави перфектен за мобилни приложения, разширена реалност и случаи на превод в реално време. Със своята точна разпознаваемост и разнообразни случаи на употреба, Baidu-OCR-API е идеален избор за всеки разработчик, който иска да интегрира надеждна OCR функционалност в Node.js приложения.

Накратко

Общ преглед на функциите на Baidu-OCR-API.

Общ преглед на функциите

Извършване на OCR
Добавяне на OCR възможности
Разпознаване на текст от изображение
Конвертиране на изображения с текст
Разпознаване на шрифтов текст
Търсене в PDF
Над 100 езика
Създаване на OCR приложения
Запазване в браузъра
Извличане на текст
Поддръжка на многопоточност

Baidu-OCR-API

Baidu-OCR-API поддържа популярните файлови формати за изображения, изброени по-долу.

Четец

PNG, JPEG, BMP, TIFF, TGA, DICOM

Записвач

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Платформена независимост

Baidu-OCR-API може да работи с всякакъв Java-базиран програмен език

Java

Baidu-OCR-API

Започване с Baidu-OCR-API

Препоръчителният начин за инсталиране на Baidu-OCR-API е чрез npm. Моля, използвайте следната команда за гладка инсталация

Инсталиране на Baidu-OCR-API чрез npm

 npm install baidu-ocr-api -g

Можете също така да го инсталирате ръчно; изтеглете последните файлове от GitHub репозитория.

Извличане на текст от изображения в Node.js приложения

Baidu-OCR-API улеснява софтуерните разработчици да зареждат и четат изображения и да извличат текст в Node.js приложения. Функцията за общо разпознаване на текст позволява на разработчиците да зареждат и извличат печатен текст от изображения, подходящ за широк спектър от документи. API‑то включва поддръжка за различни популярни файлови формати за изображения, като JPEG, PNG, GIF, TIFF, PDF, BMP и много други. Следният пример показва как софтуерните разработчици могат да заредят и извършат разпознаване на текст върху изображението в Node.js приложения.

Как да заредим и извършим разпознаване на текст върху изображение в Node.js приложения?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Разпознаване на формуляри и таблици в Node.js приложения

Отвореният код Baidu-OCR-API предоставя пълна функционалност за разпознаване на формуляри и таблици в Node.js приложения. За успешно изпълнение на задачата първо трябва да настроите вашия Baidu OCR клиент, използвайки вашите API идентификационни данни. След това напишете кода за четене на изображение и извършване на разпознаване на формуляри и таблици. Тази функционалност може да бъде особено полезна за автоматизиране на извличане на данни от структурирани документи и подобряване на продуктивността в различни приложения. Ето прост пример, който показва как софтуерният разработчик може да прочете изображение и да извърши разпознаване на формуляри и таблици в Node.js среда.

Как да прочетете изображение и да извършите разпознаване на формуляри и таблици в Node.js приложения?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Разпознаване на ръкописен текст чрез Node.js API

Отвореният код Baidu-OCR-API е много лесен за използване и е напълно способен да разпознава ръкописен текст с висока точност в Node.js приложения. За постигане на целта файлът с изображението се чете и конвертира в base64 низ, след което се извиква методът за ръкописен текст с base64‑кодираното изображение, а разпознатият ръкописен текст се записва в конзолата. Следният пример демонстрира как софтуерните разработчици могат да извършат разпознаване на ръкописен текст, използвайки отворения код Baidu OCR API в Node.js.

Как да извършите разпознаване на ръкописен текст в Node.js приложения?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word