Ilmainen Node.js API tunnistamaan ja poimimaan tekstiä kuvista

Ilmainen Node.js on johtava Node.js API, joka tarjoaa korkean tarkkuuden tekstintunnistuksessa useilla kielillä ja monenlaisilla fonteilla ja asetteluilla.

Nykyisessä tekoälyohjautuvassa kehitysympäristössä optinen merkkien tunnistus (OCR) on tullut olennaiseksi tekstin automaattiseksi poimimiseksi kuvista ja asiakirjoista. Node.js:ssä OCR:n luomista tavoittelevat kehittäjät voivat hyötyä suuresti Baidu-OCR-API:sta, tehokkaasta työkalusta, joka tukee tekstin poimintaa kuvista, käsinkirjoitetun tekstin tunnistusta ja jopa edistyneitä tehtäviä, kuten lomakkeiden tunnistusta Node.js-sovelluksissa. Olipa kyse laskujen skannaamisesta, asiakirjojen digitoimisesta tai saavutettavuusominaisuuksien mahdollistamisesta, tämä Node.js OCR -kirjasto tarjoaa korkean suorituskyvyn ja on helppo integroida nykyaikaisiin sovelluksiin.

Baidu-OCR-API on ilmainen Node.js OCR API, joka hyödyntää syväoppimista tunnistaakseen painetun ja käsinkirjoitetun tekstin useilla kielillä, mukaan lukien kiina, englanti, japani ja monet muut. Se erottuu taulukkojen tunnistuksessa Node.js:ssä, liiketoiminta-asiakirjojen skannauksessa sekä tekstin tunnistamisessa monimutkaisissa olosuhteissa, kuten heikossa valaistuksessa tai vääristyneissä kuvissa. Kehittäjät voivat myös tunnistaa tekstiä luonnollisissa ympäristöissä, mikä tekee siitä täydellisen mobiilisovelluksiin, lisättyyn todellisuuteen ja reaaliaikaisen käännöksen käyttötapauksiin. Tarkkuutensa ja monipuolisten käyttötapojen ansiosta Baidu-OCR-API on ihanteellinen valinta kaikille kehittäjille, jotka haluavat integroida luotettavaa OCR-toiminnallisuutta Node.js-sovelluksiin.

Yleiskatsaus

Katsaus Baidu-OCR-API:n ominaisuuksiin.

Features Overview

Suorita OCR
Lisää OCR-ominaisuuksia
Tunnista kuvan teksti
Muunna tekstiä sisältäviä kuvia
Tunnistettu fonttiteksti
Etsi PDF
Yli 100 kieltä
Luo OCR-sovelluksia
Tallenna selaimeen
Poimi teksti
Monisäikeinen tuki

Baidu-OCR-API

Baidu-OCR-API tukee alla lueteltuja suosittuja kuvamuotoja.

Lukija

PNG, JPEG, BMP, TIFF, TGA, DICOM

Kirjoittaja

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

Alustariippumattomuus

Baidu-OCR-API voi toimia minkä tahansa Java-pohjaisen ohjelmointikielen kanssa

Java

Baidu-OCR-API

Aloittaminen Baidu-OCR-API:n kanssa

Suositeltu tapa asentaa Baidu-OCR-API on npm:n käyttö. Käytä seuraavaa komentoa sujuvan asennuksen varmistamiseksi

Install Baidu-OCR-APIvia npm

 npm install baidu-ocr-api -g

Voit myös asentaa sen manuaalisesti; lataa uusimmat julkaisutiedostot suoraan GitHub-varastosta.

Poimi tekstiä kuvista Node.js-sovelluksissa

Baidu-OCR-API tekee ohjelmistokehittäjille helppoa ladata ja lukea kuvia sekä poimia tekstiä Node.js-sovelluksissa. Yleinen tekstintunnistusominaisuus mahdollistaa kehittäjille painetun tekstin lataamisen ja poimimisen kuvista, mikä soveltuu laajaan asiakirjavalikoimaan. API tukee useita suosittuja kuvamuotoja, kuten JPEG, PNG, GIF, TIFF, PDF, BMP ja monia muita. Seuraava esimerkki näyttää, miten kehittäjät voivat ladata ja suorittaa tekstintunnistuksen kuvassa Node.js-sovelluksissa.

Kuinka ladata ja suorittaa tekstintunnistus kuvaan Node.js-sovelluksissa?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Lomake- ja taulukontunnistus Node.js-sovelluksissa

Avoimen lähdekoodin Baidu-OCR-API tarjoaa täyden toiminnallisuuden lomakkeiden ja taulukoiden tunnistamiseen Node.js-sovelluksissa. Tehtävän onnistuneeseen suorittamiseen sinun tulee ensin määrittää Baidu OCR -asiakasohjelma API-tunnuksillasi. Sen jälkeen kirjoita koodi kuvan lukemiseksi ja lomake- sekä taulukontunnistuksen suorittamiseksi. Tämä toiminnallisuus on erityisen hyödyllinen strukturoitujen asiakirjojen tietojen automaattiseen poimintaan ja tuottavuuden parantamiseen eri sovelluksissa. Tässä on yksinkertainen esimerkki, joka näyttää, miten ohjelmistokehittäjä voi lukea kuvan ja suorittaa lomake- ja taulukontunnistuksen Node.js-ympäristössä.

Kuinka lukea kuva ja suorittaa lomake- ja taulukontunnistus Node.js-sovelluksissa?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Käsinkirjoitetun tekstin tunnistus Node.js API:n kautta

Avoimen lähdekoodin Baidu-OCR-API on erittäin helppokäyttöinen ja kykenee täysin tunnistamaan käsinkirjoitettua tekstiä tarkasti Node.js-sovelluksissa. Tavoitteen saavuttamiseksi kuvatiedosto luetaan ja muunnetaan base64-merkkijonoksi, jonka jälkeen kutsutaan handwriting-metodia base64-koodatulla kuvalla, ja tunnistettu käsinkirjoitettu teksti kirjataan konsoliin. Seuraava esimerkki osoittaa, miten ohjelmistokehittäjät voivat suorittaa käsinkirjoitetun tekstin tunnistuksen avoimen lähdekoodin Baidu OCR API:n avulla Node.js:ssä.

Kuinka suorittaa käsinkirjoitetun tekstin tunnistus Node.js-sovelluksissa?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word