1. Produkter
  2.   OCR
  3.   Node.js
  4.   Baidu-ocr-api
 
  

Gratis Node.js API til at genkende & udtrække tekst fra billeder

En gratis Node.js er en førende Node.js API, der tilbyder høj nøjagtighed i tekstgenkendelse på tværs af flere sprog og en række skrifttyper og layout.

I dagens AI-drevne udviklingsverden er optisk tegngenkendelse (OCR) blevet essentiel for automatisering af tekstudtræk fra billeder og dokumenter. Udviklere, der ønsker at skabe OCR i Node.js, kan drage stor fordel af Baidu-OCR-API, et kraftfuldt værktøj, der understøtter udtræk af tekst fra billeder, håndskriftgenkendelse og endda avancerede opgaver som formulargenkendelse i Node.js‑apps. Uanset om det er scanning af fakturaer, digitalisering af dokumenter eller muliggørelse af tilgængelighedsfunktioner, tilbyder dette Node.js OCR-bibliotek høj ydeevne og er let at integrere i moderne applikationer.

Baidu-OCR-API er en gratis Node.js OCR API, der bruger dyb læring til at genkende trykt og håndskrevet tekst på tværs af flere sprog, herunder kinesisk, engelsk, japansk og flere. Den udmærker sig i tabelgenkendelse i Node.js, scanning af forretningsdokumenter og genkendelse af tekst under komplekse forhold som svagt lys eller forvrængede billeder. Udviklere kan også genkende tekst i naturlige scener, hvilket gør den perfekt til mobilapps, udvidet virkelighed og realtidsoversættelses‑use‑cases. Med sin præcise genkendelse og alsidige anvendelsesområder er Baidu-OCR-API et ideelt valg for enhver udvikler, der ønsker at integrere pålidelig OCR-funktionalitet i Node.js‑applikationer.

Previous Next

Kom i gang med Baidu-OCR-API

Den anbefalede måde at installere Baidu-OCR-API på er ved at bruge npm. Brug venligst følgende kommando for en problemfri installation

Installer Baidu-OCR-API via npm

 npm install baidu-ocr-api -g 

Du kan også installere den manuelt; download de seneste udgivelsesfiler direkte fra GitHub repository.

Udtræk tekst fra billeder i Node.js‑apps

Baidu-OCR-API gør det nemt for softwareudviklere at indlæse og læse billeder og udtrække tekst i Node.js‑applikationer. Den generelle tekstgenkendelsesfunktion gør det muligt for udviklere at indlæse og udtrække trykt tekst fra billeder, egnet til en bred vifte af dokumenter. API’en inkluderer understøttelse af forskellige populære billedfilformater, såsom JPEG, PNG, GIF, TIFF, PDF, BMP og mange flere. Følgende eksempel viser, hvordan softwareudviklere kan indlæse og udføre tekstgenkendelse på billedet i Node.js‑applikationer.

Hvordan indlæser og udfører du tekstgenkendelse på et billede i Node.js‑apps?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Formular- og tabelgenkendelse i Node.js‑apps

Den open‑source Baidu-OCR-API har leveret fuld funktionalitet til at genkende formularer og tabeller i Node.js‑applikationer. For at udføre opgaven succesfuldt skal du først konfigurere din Baidu OCR‑klient med dine API‑legitimationsoplysninger. Derefter skal du skrive kode til at læse et billede og udføre formular‑ og tabelgenkendelse. Denne funktionalitet kan være særligt nyttig til automatisering af dataudtræk fra strukturerede dokumenter og forbedring af produktiviteten i forskellige applikationer. Her er et enkelt eksempel, der viser, hvordan en softwareudvikler kan læse et billede og udføre formular‑ og tabelgenkendelse i et Node.js‑miljø.

Hvordan læser du et billede og udfører formular‑ og tabelgenkendelse i Node.js‑apps?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Håndskrift‑tekstgenkendelse via Node.js API

Den open‑source Baidu-OCR-API er meget nem at håndtere og er fuldt i stand til at genkende håndskrevet tekst med høj præcision i Node.js‑applikationer. For at opnå målet læses billedfilen og konverteres til en base64‑streng, hvorefter håndskrift‑metoden kaldes med det base64‑kodede billede, og den genkendte håndskrevne tekst logges til konsollen. Følgende eksempel demonstrerer, hvordan softwareudviklere kan udføre håndskrift‑tekstgenkendelse ved hjælp af den open‑source Baidu OCR API i Node.js.

Hvordan udføre håndskrift‑tekstgenkendelse i Node.js‑apps?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 Dansk