Aspose.OCR library for Node.js via C++

Node.js OCR-Bibliothek zum Erkennen/Extrahieren von Bildtext

Die Node.js OCR-API ermöglicht Softwareentwicklern das Extrahieren von Text aus Bildern, gescannten Dokumenten, Fotos & Screenshots sowie die Automatisierung von Aufgaben, die Texterkennung erfordern.

Aspose.OCR-Bibliothek für Node.js via C++ ist eine leistungsstarke Bibliothek, die optische Zeichenerkennung (OCR) für Softwareentwickler bereitstellt, die mit Node.js-Anwendungen arbeiten. Diese Bibliothek ist Teil der Aspose-Suite, die für ihre robusten und zuverlässigen Dokumentenverarbeitungslösungen bekannt ist. Das Hauptmerkmal ist ihre Fähigkeit, Text aus Bildern, gescannten Dokumenten, Fotos, Screenshots usw. zu erkennen und zu extrahieren. Die Bibliothek kann zusätzlich zu gedrucktem Text auch handgeschriebenen Text erkennen, was ihre Einsatzmöglichkeiten auf ein breiteres Dokumentenspektrum ausweitet. Neben der Extraktion von Klartext kann sie auch die Formatierung des erkannten Textes beibehalten, einschließlich Schriftart, Größe und Farbe.

Ein herausragendes Merkmal der Aspose.OCR für Node.js Bibliothek ist die Unterstützung mehrerer Bildformate, darunter JPEG, PNG, BMP, TIFF und viele weitere. Diese Vielseitigkeit ermöglicht es Entwicklern, mit einer breiten Palette von Bildern zu arbeiten, was die Verarbeitung verschiedener Dokument- und Grafiktypen erleichtert. Darüber hinaus bietet sie fortschrittliche OCR-Algorithmen, die eine genaue und zuverlässige Textextraktion gewährleisten. Durch den Einsatz ausgeklügelter Erkennungstechniken kann die Bibliothek Text aus Bildern effektiv interpretieren, selbst wenn der Text schräg, unscharf oder verzerrt ist.

Aspose.OCR für Node.js unterstützt mehrere Sprachen und ist somit für globale Anwendungen geeignet. Sie kann Text in mehr als 130 Sprachen erkennen, darunter Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Chinesisch, Japanisch und viele andere. Entwickelt für Leistung und Skalierbarkeit kann die Bibliothek große Mengen an Bildern effizient verarbeiten. Sie ermöglicht Entwicklern das Definieren benutzerdefinierter Vorlagen für strukturierte Dokumente. Diese Funktion ist nützlich, um spezifische Felder aus Formularen, Rechnungen und anderen vorlagenbasierten Dokumenten zu extrahieren. Insgesamt ist die Aspose.OCR-Bibliothek ein wertvolles Werkzeug für Entwickler, die OCR-Funktionalität in ihre Node.js-Anwendungen integrieren möchten.

Auf einen Blick

Ein Überblick über die Funktionen der Aspose.OCR-Bibliothek für Node.js via C++.

Funktionsübersicht

OCR-Operationen
OCR-Funktionen hinzufügen
Bildtext erkennen
Texte aus Bildern konvertieren
Erkannten Schrifttext
PDF durchsuchen
27 Erkennungssprachen
OCR-Apps erstellen
Im Browser speichern
Text extrahieren
Multithreading-Unterstützung

Funktionsübersicht

Gedrehte Bilder erkennen
Vorverarbeitungsfilter
PDF zu Bildern
Chinesische Zeichen erkennen
Beliebte Schriftarten erkennen
Gesamtes Bild verarbeiten
Unterstützung für gedrehte Bilder
Batch-Erkennung
Eingebaute Rechtschreibprüfung
PDF teilen
PDF zu Excel
PDF zu SVG

Aspose.OCR-Bibliothek für Node.js via C++

Die API unterstützt hauptsächlich OCR-Formate, kann OCR-Dokumente jedoch in eine Reihe anderer Formate exportieren.

Leser

PDF, PDF/A, TEX, XPS, SVG

Schreiber

PDF, TXT, PNG, JPEG

Aspose.OCR-Bibliothek für Node.js via C++

Plattformunabhängigkeit

Aspose.OCR-Bibliothek für Node.js via C++ kann mit jeder Java‑basierten Programmiersprache arbeiten.

Java Runtime

Aspose.OCR-Bibliothek für Node.js via C++

Erste Schritte mit Aspose.OCR-Bibliothek für Node.js via C++

Der empfohlene Weg, die Aspose.OCR-Bibliothek für Node.js via C++ zu installieren, ist die Verwendung von npm. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.

Installieren Sie Aspose.OCR-Bibliothek für Node.js via C++ über npm

 npm install aspose-ocr-cloud

Sie können die Bibliothek direkt von der Aspose.OCR Produktseite herunterladen

Aspose.OCR-Bibliothek für Node.js via C++ bietet vollständige Funktionalität für die Durchführung von optischer Zeichenerkennung (OCR) in verschiedenen Bildern. Mit nur wenigen Codezeilen können Softwareentwickler Text aus Bildern in Node.js-Anwendungen erkennen und extrahieren. Die API unterstützt verschiedene beliebte Bilddateiformate, wie JPEG, PNG, GIF, TIFF, PDF, BMP und viele weitere. Es gibt mehrere wichtige Features der Bibliothek, wie die Erkennung von gedrehten, schiefen und verrauschten Bildern. Darüber hinaus können Entwickler die Erkennungsergebnisse in den gängigsten Dokument‑ und Datenaustauschformaten speichern. Das folgende Beispiel zeigt, wie JavaScript‑Befehle verwendet werden können, um ein Bild zu laden und Text zu extrahieren.

Wie Sie Text aus einem Bild in Node.js‑Apps erkennen?

let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);

// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
              result, Module.ExportFormat.text);

console.log(text);

Handschriftliche Texterkennung in Node.js‑Apps

Aspose.OCR-Bibliothek für Node.js via C++ erleichtert es Softwareentwicklern, handschriftlichen Text in ihren eigenen Node.js-Anwendungen zu erkennen. Sie kann handschriftlichen Text zusätzlich zu gedrucktem Text erkennen, wodurch die Einsatzmöglichkeiten auf ein breiteres Dokumentenspektrum ausgeweitet werden. Entwickler können handschriftlichen Text erkennen, indem sie den Handgeschrieben‑Modus aktivieren. Es ist zudem möglich, ein Bild über eine URL zu erkennen, ohne es lokal herunterzuladen. Das folgende Beispiel zeigt, wie Entwickler handschriftlichen Text in Node.js‑Anwendungen laden und erkennen können.

Wie handschriftlichen Text in Node.js‑Apps erkennen?

const recognizeHandwritten = true;

ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
  if (error) throw error;

  console.log('Extracted Handwritten Text:', data.text);
});

Vorlagenbasierte Erkennung unterstützen

Vorlagenbasierte Erkennung beinhaltet das Definieren einer Vorlage, die das Layout und die interessierenden Bereiche eines Dokuments festlegt. Die vorlagenbasierte Erkennung mit Aspose.OCR für Node.js via C++ bietet eine strukturierte und präzise Methode, Daten aus Dokumenten mit festem Layout zu extrahieren. Diese Funktion ist nützlich, um spezifische Felder aus Formularen, Rechnungen und anderen vorlagenbasierten Dokumenten zu extrahieren. Das folgende Beispiel zeigt, wie Entwickler die Vorlage laden und auf ein Bild anwenden können, um OCR in Node.js‑Apps durchzuführen.

Wie man die Vorlage lädt und auf ein Bild anwendet, um OCR in Node.js‑Apps durchzuführen?

const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();
const templateApi = new TemplateApi();

const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  fs.readFile(templatePath, (err, templateBuffer) => {
    if (err) throw err;

    // Load the template
    templateApi.addTemplate(templateBuffer, (error, templateId) => {
      if (error) throw error;

      // Apply the template to the image
      ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
        if (error) throw error;

        console.log('Extracted Data:', result.fields);
      });
    });
  });
});

Textformatierung bei OCR‑Operationen beibehalten

Die Beibehaltung der Textformatierung während OCR‑Operationen ist entscheidend für Anwendungen, bei denen Struktur, Schriftstile und Layout des Textes wichtig sind. Zusätzlich zur Extraktion von Klartext kann Aspose.OCR für Node.js via C++ auch die Formatierung des erkannten Textes beibehalten, einschließlich Schriftart, Größe und Farbe. Dies ist besonders nützlich für die Verarbeitung von Dokumenten, bei denen die Textformatierung entscheidend ist. Das folgende Beispiel demonstriert, wie Entwickler die Textformatierung mithilfe der Aspose.OCR‑API beibehalten können.

Wie man Textformatierung bei OCR‑Operationen in Node.js‑Apps beibehält?

const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();

const imagePath = 'path/to/your/document.jpg';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  const recognitionSettings = new OCRRecognitionSettings();
  recognitionSettings.setDetectAreas(true);
  recognitionSettings.setDetectText(true);
  recognitionSettings.setDetectItalic(true);
  recognitionSettings.setDetectBold(true);

  ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
    if (error) throw error;

    const formattedText = data.text;
    const formattingDetails = data.textAreas;

    console.log('Extracted Text with Formatting:', formattedText);
    console.log('Formatting Details:', formattingDetails);
  });
});