Aspose.OCR for C++

C++-OCR-API zum Hinzufügen von OCR-Funktionen

Integrieren Sie OCR-Funktionalität in C- und C++-Apps mithilfe der kostenlosen OCR-API. Es kann Text aus gescannten Bildern und PDFs, Smartphone-Fotos, Screenshots und Bildbereichen erkennen und extrahieren.

Da sich das digitale Zeitalter immer weiter ausdehnt, wird die Notwendigkeit einer effizienten Textextraktion aus Bildern, gescannten Dokumenten und anderen Quellen immer wichtiger. Hier spielt die Technologie der optischen Zeichenerkennung (OCR) eine entscheidende Rolle bei der Umwandlung visueller Daten in bearbeitbaren und durchsuchbaren Text. Aspose.OCR für C++ erweist sich als leistungsstarke Lösung, die Entwicklern ein umfassendes Toolkit zur nahtlosen Integration von OCR-Funktionen in ihre C++-Anwendungen bietet. Unabhängig davon, ob Entwickler Text aus gescannten Dokumenten, Bildern oder sogar Screenshots extrahieren müssen, bietet Aspose.OCR eine umfassende Lösung für verschiedene OCR-Anforderungen.

Aspose.OCR für C++ bietet zahlreiche Bildverarbeitungsfunktionen, die die OCR-Genauigkeit erhöhen und den Erkennungsprozess verbessern. Die Bibliothek verfügt über mehrere wichtige Funktionen, wie z. B. die Verarbeitung gedrehter und verrauschter Bilder, die Erkennung von Text in einer großen Anzahl von Sprachen, die Stapelerkennung aller Bilder, die Erkennung des gesamten Bilds, das Extrahieren von Text nur aus ausgewählten Bereichen, die Identifizierung von Wörtern oder Absätzen, Speichert die Erkennungsergebnisse auf der Festplatte, unterstützt die Bildvorverarbeitung, identifiziert die Zeichen auf einem Bild, identifiziert Zeichen auf einem Bild, liest nur bestimmte Bereiche eines Bildes und so weiter. Softwareentwickler können Bilder vorverarbeiten, indem sie unter anderem Filter anwenden, Kontrast und Helligkeit anpassen, Schräglagen korrigieren und Rauschen entfernen.

Aspose.OCR für C++ kann problemlos in Benutzeranwendungen sowie in andere Aspose-Produkte integriert werden. Die Bibliothek bietet eine sehr unkomplizierte API, die es Entwicklern ermöglicht, OCR-Funktionen nahtlos in ihre C++-Projekte zu integrieren. Mit nur wenigen Codezeilen können Entwickler die OCR-Engine initialisieren, das Bild oder Dokument laden und den Text extrahieren. Es ist plattformübergreifend konzipiert und kann zur Entwicklung plattformübergreifender Anwendungen für Windows, Linux und Web verwendet werden. Durch die Integration von Aspose.OCR in ihre Projekte können Softwareentwickler die Produktivität steigern, die Datenzugänglichkeit verbessern und neue Möglichkeiten für die Textverarbeitung und -analyse in ihren Anwendungen erschließen.

Auf einen Blick

Eine Übersicht über die Funktionen von Aspose.OCR für C++.

Funktionsübersicht

OCR durchführen
OCR-Funktionen hinzufügen
Bildtext erkennen
Convet-Textbilder
Erkannter Schriftarttext
PDF durchsuchen
27 Erkennungssprachen
OCR-Apps erstellen
Im Browser speichern
Text extrahieren
Multithreading-Unterstützung

Funktionsübersicht

Gedrehtes Bild erkennen
Vorverarbeitungsfilter
PDF in Bilder
Erkennt chinesische Zeichen
Erkennt beliebte Schriftarten
Verarbeitet das gesamte Bild
Unterstützung für gedrehte Bilder
Chargenerkennung
Integrierte Rechtschreibprüfung
PDF teilen
PDF nach Excel
PDF in SVG

Aspose.OCR for C++

API unterstützt hauptsächlich das PDF-Format, kann jedoch PDF-Dokumente in eine Reihe anderer Formate exportieren.

Leser

PDF, PDF/A, TEX, XPS, SVG

Schriftsteller

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for C++

Plattformunabhängigkeit

Aspose.OCR für C++ kann mit jeder C++-basierten Programmiersprache arbeiten.

C++ runtime.

Aspose.OCR for C++

Erste Schritte mit Aspose.OCR für C++

Die empfohlene Methode zur Installation von Aspose.OCR für C++ ist die Verwendung von NuGet. Für eine reibungslose Installation verwenden Sie bitte den folgenden Befehl.

Installieren Sie Aspose.OCR für C++ über den NuGet-Befehl

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Sie können die Bibliothek direkt von der Aspose.PDF-Produktseite

herunterladen

Effiziente Textextraktion in C++-Apps

Aspose.OCR für C++ bietet einen zuverlässigen und effizienten Ansatz zum Extrahieren von Text aus einer Vielzahl von Dateiformaten, einschließlich gescannter Dokumente, Bilder, PDF-Dateien, mehrseitiges TIFF, Pixelarray, Quittungen usw. Es nutzt hochentwickelte OCR-Algorithmen, um Text mit hoher Genauigkeit zu erkennen und zu extrahieren, wobei die ursprüngliche Formatierung und Struktur erhalten bleibt. Die Bibliothek unterstützt eine Vielzahl von Sprachen, wodurch sie für mehrsprachige Anwendungen geeignet ist und Entwicklern die mühelose Extraktion von Texten aus verschiedenen Quellen ermöglicht. Das folgende Beispiel zeigt, wie Text über die C++-API aus einem TIFF-Bild extrahiert wird.

Text aus TIFF-Bild über die C++-API extrahieren?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Bestimmte Bereiche von Bildern über C++ lesen

Aspose.OCR für C++ erleichtert Softwareentwicklern das Lesen eines bestimmten Bereichs eines Bildes und das Extrahieren von Text aus diesen Bereichen oder Regionen in C++-Anwendungen. Diese Funktion ist besonders nützlich, wenn Sie nur Text aus bestimmten Abschnitten eines Bildes extrahieren müssen und irrelevante Inhalte ausschließen möchten. Die Bibliothek bietet eine einfache und effiziente Methode, dies zu erreichen. Unten finden Sie ein Beispielcode-Snippet, das zeigt, wie bestimmte Bildbereiche mit Aspose.OCR für C++ gelesen werden.

Extrahieren Sie Text aus bestimmten Bereichen innerhalb eines Bildes über die C++-API

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Bildvorverarbeitung über C++ API

Aspose.OCR für C++ bietet eine standardisierte Möglichkeit, Ihre Inhalte für OCR vorzubereiten und genaue OCR-Ergebnisse zu erzielen. Die Bibliothek bietet eine Reihe fortschrittlicher Bildvorverarbeitungstechniken. Diese Techniken verbessern die Bildqualität, korrigieren perspektivische Verzerrungen, entfernen Rauschen und optimieren den Texterkennungsprozess. Durch den Einsatz der Bildvorverarbeitung können Entwickler die OCR-Genauigkeit erheblich verbessern, insbesondere beim Umgang mit anspruchsvollen Bildern oder Dokumenten mit komplexen Layouts. Auf dasselbe Bild können mehrere Vorverarbeitungsfilter angewendet werden, um die Erkennungsqualität weiter zu verbessern.

Rauschen automatisch vor der Erkennung über die C++-API aus dem Bild entfernen

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);

Erkennungsergebnisse in anderen Formaten speichern

Aspose.OCR für C++ ermöglicht Softwareentwicklern die Erkennung von Text aus zahlreichen gängigen Dateiformaten wie PDF, JPEG, PNG, TIFF, BMP und mehr. Mit der API können Entwickler Erkennungsergebnisse in mehreren Formaten speichern, sodass sie geteilt, in einer Datenbank gespeichert, angezeigt oder analysiert werden können. Softwareentwickler können Erkennungsergebnisse als Datei, Text, JSON oder XML speichern. Die Bibliothek ermöglicht das Festlegen von Schwellenwerten für die Erkennungszuverlässigkeit, sodass Softwareentwickler Texte mit niedrigem Konfidenzniveau herausfiltern können. Diese Funktion erweist sich bei der Verarbeitung großer Textmengen als unschätzbar wertvoll und stellt sicher, dass nur zuverlässige und genaue Ergebnisse extrahiert werden. Die folgenden Beispiele zeigen, wie Erkennungsergebnisse mithilfe von C++-Befehlen als Datei gespeichert werden.

Erkennungsergebnisse als mehrseitiges Dokument über die C++-API speichern

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);