Kostenlose Node.js API zum Erkennen & Extrahieren von Text aus Bildern
Eine kostenlose Node.js ist eine führende Node.js API, die hohe Genauigkeit bei der Texterkennung in mehreren Sprachen und einer Vielzahl von Schriftarten und Layouts bietet.
Im heutigen KI‑getriebenen Entwicklungsumfeld ist die optische Zeichenerkennung (OCR) unverzichtbar geworden, um die Textextraktion aus Bildern und Dokumenten zu automatisieren. Entwickler, die OCR in Node.js erstellen möchten, können stark von der Baidu-OCR-API profitieren, einem leistungsstarken Werkzeug, das das Extrahieren von Text aus Bildern, Handschrift‑Texterkennung und sogar fortgeschrittene Aufgaben wie die Formularerkennung in Node.js‑Apps unterstützt. Ob beim Scannen von Rechnungen, Digitalisieren von Dokumenten oder Bereitstellen von Barrierefreiheitsfunktionen – diese Node.js OCR‑Bibliothek bietet hohe Leistung und lässt sich leicht in moderne Anwendungen integrieren.
Baidu-OCR-API ist eine kostenlose Node.js OCR API, die Deep Learning nutzt, um gedruckten und handgeschriebenen Text in mehreren Sprachen zu erkennen, darunter Chinesisch, Englisch, Japanisch und weitere. Sie zeichnet sich durch Tabellenerkennung in Node.js, das Scannen von Geschäftsdokumenten und die Erkennung von Text unter komplexen Bedingungen wie schwachem Licht oder verzerrten Bildern aus. Entwickler können zudem Text in natürlichen Szenen erkennen, was sie ideal für mobile Apps, Augmented Reality und Echtzeit‑Übersetzungs‑Anwendungsfälle macht. Mit ihrer genauen Erkennung und vielseitigen Einsatzmöglichkeiten ist Baidu-OCR-API die ideale Wahl für jeden Entwickler, der zuverlässige OCR‑Funktionalität in Node.js‑Anwendungen integrieren möchte.
Erste Schritte mit Baidu-OCR-API
Die empfohlene Methode, Baidu-OCR-API zu installieren, ist die Verwendung von npm. Bitte nutzen Sie den folgenden Befehl für eine reibungslose Installation
Installieren Sie Baidu-OCR-API via npm
npm install baidu-ocr-api -g Sie können es auch manuell installieren; laden Sie die neuesten Release‑Dateien direkt aus dem GitHub‑Repository herunter.
Text aus Bildern in Node.js‑Apps extrahieren
Baidu-OCR-API erleichtert Softwareentwicklern das Laden und Lesen von Bildern sowie das Extrahieren von Text in Node.js‑Anwendungen. Die allgemeine Texterkennungsfunktion ermöglicht es Entwicklern, gedruckten Text aus Bildern zu laden und zu extrahieren, was für eine Vielzahl von Dokumenten geeignet ist. Die API unterstützt verschiedene gängige Bilddateiformate wie JPEG, PNG, GIF, TIFF, PDF, BMP und viele weitere. Das folgende Beispiel zeigt, wie Softwareentwickler ein Bild laden und die Texterkennung in Node.js‑Anwendungen durchführen können.
Wie lädt man ein Bild und führt die Texterkennung in Node.js‑Apps durch?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Formular‑ und Tabellenerkennung in Node.js‑Apps
Die Open‑Source‑Baidu-OCR-API bietet vollständige Funktionalität zur Erkennung von Formularen und Tabellen in Node.js‑Anwendungen. Um die Aufgabe erfolgreich auszuführen, müssen Sie zunächst Ihren Baidu‑OCR‑Client mit Ihren API‑Zugangsdaten einrichten. Anschließend schreiben Sie den Code, um ein Bild zu lesen und die Formular‑ und Tabellenerkennung durchzuführen. Diese Funktionalität ist besonders nützlich, um die Datenerfassung aus strukturierten Dokumenten zu automatisieren und die Produktivität in verschiedenen Anwendungen zu steigern. Hier ist ein einfaches Beispiel, das zeigt, wie ein Softwareentwickler ein Bild liest und die Formular‑ und Tabellenerkennung in einer Node.js‑Umgebung durchführt.
Wie liest man ein Bild und führt die Formular‑ und Tabellenerkennung in Node.js‑Apps durch?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Handschrift‑Texterkennung über die Node.js‑API
Die Open‑Source‑Baidu-OCR-API ist sehr einfach zu handhaben und in der Lage, handgeschriebenen Text mit hoher Präzision in Node.js‑Anwendungen zu erkennen. Um das Ziel zu erreichen, wird die Bilddatei gelesen und in einen Base64‑String konvertiert; anschließend wird die Handschrift‑Methode mit dem Base64‑kodierten Bild aufgerufen, und der erkannte handgeschriebene Text wird in der Konsole ausgegeben. Das folgende Beispiel zeigt, wie Softwareentwickler die Handschrift‑Texterkennung mit der Open‑Source‑Baidu‑OCR‑API in Node.js durchführen können.
Wie führt man Handschrift‑Texterkennung in Node.js‑Apps durch?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word