Kostenlose Node.js API zum Erkennen & Extrahieren von Text aus Bildern
Eine kostenlose Node.js ist eine führende Node.js API, die hohe Genauigkeit bei der Texterkennung über mehrere Sprachen und eine Vielzahl von Schriftarten und Layouts bietet.
In der heutigen, von KI getriebenen Entwicklungswelt ist die optische Zeichenerkennung (OCR) unverzichtbar geworden, um die Textextraktion aus Bildern und Dokumenten zu automatisieren. Entwickler, die OCR in Node.js erstellen möchten, können stark von der Baidu-OCR-API profitieren, einem leistungsstarken Werkzeug, das das Extrahieren von Text aus Bildern, Handschrift-Erkennung und sogar fortgeschrittene Aufgaben wie Formulareerkennung in Node.js‑Apps unterstützt. Ob Rechnungen gescannt, Dokumente digitalisiert oder Barrierefreiheitsfunktionen aktiviert werden – diese Node.js OCR‑Bibliothek bietet hohe Leistung und lässt sich leicht in moderne Anwendungen integrieren.
Baidu-OCR-API ist eine kostenlose Node.js OCR‑API, die Deep Learning nutzt, um gedruckten und handgeschriebenen Text in mehreren Sprachen zu erkennen, darunter Chinesisch, Englisch, Japanisch und mehr. Sie glänzt bei der Tabellenerkennung in Node.js, beim Scannen von Geschäftsdokumenten und bei der Erkennung von Text unter schwierigen Bedingungen wie schwachem Licht oder verzerrten Bildern. Entwickler können zudem Text in natürlichen Szenen erkennen, was sie ideal für mobile Apps, Augmented Reality und Echtzeit‑Übersetzungs‑Anwendungsfälle macht. Mit ihrer genauen Erkennung und vielseitigen Einsatzmöglichkeiten ist die Baidu-OCR-API die ideale Wahl für jeden Entwickler, der zuverlässige OCR‑Funktionalität in Node.js‑Anwendungen integrieren möchte.
Erste Schritte mit Baidu-OCR-API
Die empfohlene Methode, Baidu-OCR-API zu installieren, ist die Verwendung von npm. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation
Install Baidu-OCR-API via npm
npm install baidu-ocr-api -g Sie können es auch manuell installieren; laden Sie die neuesten Release‑Dateien direkt vom GitHub-Repository herunter.
Text aus Bildern in Node.js-Anwendungen extrahieren
Baidu-OCR-API erleichtert es Software‑Entwicklern, Bilder zu laden und zu lesen und Text in Node.js‑Anwendungen zu extrahieren. Die allgemeine Texterkennungsfunktion ermöglicht es Entwicklern, gedruckten Text aus Bildern zu laden und zu extrahieren, geeignet für ein breites Spektrum an Dokumenten. Die API unterstützt verschiedene gängige Bilddateiformate, wie JPEG, PNG, GIF, TIFF, PDF, BMP und viele mehr. Das folgende Beispiel zeigt, wie Entwickler ein Bild laden und die Texterkennung in einer Node.js‑Anwendung ausführen können.
Wie lade ich ein Bild und führe die Texterkennung in einer Node.js‑App aus?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Formular- und Tabellenerkennung in Node.js-Anwendungen
Die Open‑Source‑Baidu-OCR-API bietet vollständige Funktionalität zur Erkennung von Formularen und Tabellen in Node.js‑Anwendungen. Um die Aufgabe erfolgreich auszuführen, müssen Sie zunächst Ihren Baidu‑OCR‑Client mit Ihren API‑Zugangsdaten einrichten. Anschließend schreiben Sie den Code, um ein Bild zu lesen und die Formular‑ und Tabellenerkennung durchzuführen. Diese Funktion ist besonders nützlich, um Datenextraktion aus strukturierten Dokumenten zu automatisieren und die Produktivität in verschiedenen Anwendungen zu steigern. Das folgende einfache Beispiel zeigt, wie ein Entwickler ein Bild liest und die Formular‑ und Tabellenerkennung in einer Node.js‑Umgebung ausführt.
Wie lese ich ein Bild und führe die Formular‑ und Tabellenerkennung in Node.js‑Apps aus?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Handschriftliche Texterkennung über die Node.js API
Die Open‑Source‑Baidu-OCR-API ist sehr einfach zu handhaben und vollständig in der Lage, handschriftlichen Text mit hoher Präzision in Node.js‑Anwendungen zu erkennen. Um das Ziel zu erreichen, wird die Bilddatei gelesen und in einen Base64‑String konvertiert; anschließend wird die Handschrift‑Methode mit dem Base64‑kodierten Bild aufgerufen, und der erkannte handschriftliche Text wird in der Konsole ausgegeben. Das folgende Beispiel demonstriert, wie Entwickler handschriftliche Texterkennung mithilfe der Open‑Source‑Baidu‑OCR‑API in Node.js durchführen können.
Wie führe ich handschriftliche Texterkennung in Node.js‑Apps aus?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word