1. Produkter
  2.   OCR
  3.   Node.js
  4.   Baidu-ocr-api
 
  

Gratis Node.js API för att känna igen & extrahera text från bilder

Ett gratis Node.js är ett ledande Node.js API som erbjuder hög noggrannhet i textigenkänning över flera språk samt en mängd olika typsnitt och layouter.

I dagens AI‑drivna utvecklingsvärld har optisk teckenigenkänning (OCR) blivit oumbärlig för att automatisera textutvinning från bilder och dokument. Utvecklare som vill skapa OCR i Node.js kan dra stor nytta av Baidu-OCR-API, ett kraftfullt verktyg som stödjer extrahering av text från bilder, handskriven textigenkänning och även avancerade uppgifter som formulärigenkänning i Node.js‑appar. Oavsett om det gäller att skanna fakturor, digitalisera dokument eller möjliggöra tillgänglighetsfunktioner, erbjuder detta Node.js OCR‑bibliotek hög prestanda och är enkelt att integrera med moderna applikationer.

Baidu-OCR-API är ett gratis Node.js OCR API som använder djupinlärning för att känna igen tryckt och handskriven text på flera språk, inklusive kinesiska, engelska, japanska och fler. Det utmärker sig i tabelligenkänning i Node.js, skanning av affärsdokument och igenkänning av text under svåra förhållanden såsom svagt ljus eller förvrängda bilder. Utvecklare kan också känna igen text i naturliga scener, vilket gör det perfekt för mobilappar, förstärkt verklighet och realtidsöversättning. Med sin precisa igenkänning och mångsidiga användningsområden är Baidu-OCR-API ett idealiskt val för alla som vill integrera pålitlig OCR‑funktionalitet i Node.js‑applikationer.

Previous Next

Komma igång med Baidu-OCR-API

Det rekommenderade sättet att installera Baidu-OCR-API är att använda npm. Använd följande kommando för en smidig installation

Install Baidu-OCR-API via npm

 npm install baidu-ocr-api -g 

Du kan också installera det manuellt; ladda ner de senaste release-filerna direkt från GitHub‑arkivet.

Extrahera text från bilder i Node.js‑appar

Baidu-OCR-API gör det enkelt för mjukvaruutvecklare att ladda och läsa bilder samt extrahera text i Node.js‑applikationer. Den generella textigenkänningsfunktionen låter utvecklare ladda och extrahera tryckt text från bilder, vilket passar ett brett spektrum av dokument. API:et har inkluderat stöd för olika populära bildfilformat, såsom JPEG, PNG, GIF, TIFF, PDF, BMP och många fler. Följande exempel visar hur mjukvaruutvecklare kan ladda och utföra textigenkänning på bilden i Node.js‑applikationer.

Hur laddar man och utför textigenkänning på en bild i Node.js‑appar?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Formulär- och tabelligenkänning i Node.js‑appar

Det öppna källkodsprojektet Baidu-OCR-API har tillhandahållit komplett funktionalitet för att känna igen formulär och tabeller i Node.js‑applikationer. För att utföra uppgiften framgångsrikt måste du först konfigurera din Baidu OCR‑klient med dina API‑uppgifter. Därefter skriver du kod för att läsa en bild och utföra formulär‑ och tabelligenkänning. Denna funktionalitet kan vara särskilt användbar för att automatisera datautvinning från strukturerade dokument och öka produktiviteten i olika applikationer. Här är ett enkelt exempel som visar hur en mjukvaruutvecklare kan läsa en bild och utföra formulär‑ och tabelligenkänning i en Node.js‑miljö.

Hur läser man en bild och utför formulär- och tabelligenkänning i Node.js‑appar?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Handskriven textigenkänning via Node.js‑API

Det öppna källkodsprojektet Baidu-OCR-API är mycket enkelt att använda och är fullt kapabelt att känna igen handskriven text med hög precision i Node.js‑applikationer. För att uppnå målet läses bildfilen och konverteras till en base64‑sträng och därefter anropas handskriftsmetoden med den base64‑kodade bilden, och den igenkända handskrivna texten loggas till konsolen. Följande exempel demonstrerar hur mjukvaruutvecklare kan utföra handskriven textigenkänning med det öppna källkods‑Baidu OCR‑API:et i Node.js.

Hur utför man handskriven textigenkänning i Node.js‑appar?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 Svenska