Aspose.OCR for C++
C++ OCR-API zum Hinzufügen von OCR-Funktionen
Integrieren Sie OCR-Funktionen in C- und C++-Apps mithilfe der kostenlosen OCR-API. Es kann Text aus gescannten Bildern und PDFs, Smartphone-Fotos, Screenshots und Bildbereichen erkennen und extrahieren.
Mit dem Voranschreiten des digitalen Zeitalters wird eine effiziente Textextraktion aus Bildern, gescannten Dokumenten und anderen Quellen erforderlich. Hier spielt die optische Zeichenerkennungstechnologie (OCR) eine entscheidende Rolle bei der Umwandlung visueller Daten in bearbeitbaren und durchsuchbaren Text. Aspose.OCR für C++ erweist sich als leistungsstarke Lösung und bietet Entwicklern ein umfassendes Toolkit zur nahtlosen Integration von OCR-Funktionen in ihre C++-Anwendungen. Ob Entwickler nun Text aus gescannten Dokumenten, Bildern oder sogar Screenshots extrahieren müssen, Aspose.OCR bietet eine umfassende Lösung zur Bewältigung verschiedener OCR-Anforderungen.
Aspose.OCR für C++ bietet eine Vielzahl von Bildverarbeitungsfunktionen, die die OCR-Genauigkeit erhöhen und den Erkennungsprozess verbessern. Die Bibliothek umfasst mehrere wichtige Funktionen, wie z. B. die Verarbeitung gedrehter und verrauschter Bilder, die Texterkennung in einer großen Anzahl von Sprachen, die Stapelerkennung aller Bilder, die Erkennung des gesamten Bildes, die Textextraktion nur aus ausgewählten Bereichen, die Erkennung von Wörtern oder Absätzen, die Speicherung der Erkennungsergebnisse auf der Festplatte, die Unterstützung der Bildvorverarbeitung, die Erkennung der Zeichen auf einem Bild, die Erkennung von Zeichen auf einem Bild, das Lesen nur bestimmter Bereiche eines Bildes und so weiter. Softwareentwickler können Bilder vorverarbeiten, indem sie unter anderem Filter anwenden, Kontrast und Helligkeit anpassen, Verzerrungen korrigieren und Rauschen entfernen.
Aspose.OCR für C++ kann problemlos in Benutzeranwendungen sowie in andere Aspose-Produkte integriert werden. Die Bibliothek bietet eine sehr unkomplizierte API, mit der Entwickler OCR-Funktionen nahtlos in ihre C++-Projekte integrieren können. Mit nur wenigen Codezeilen können Entwickler die OCR-Engine initialisieren, das Bild oder Dokument laden und den Text extrahieren. Es ist plattformübergreifend konzipiert und kann zur Entwicklung plattformübergreifender Anwendungen für Windows, Linux und das Web verwendet werden. Durch die Integration von Aspose.OCR in ihre Projekte können Softwareentwickler die Produktivität steigern, die Datenzugänglichkeit verbessern und neue Möglichkeiten für die Textverarbeitung und -analyse in ihren Anwendungen erschließen.
Erste Schritte mit Aspose.OCR für C++
Die empfohlene Methode zur Installation von Aspose.OCR für C++ ist die Verwendung von NuGet. Bitte verwenden Sie den folgenden Befehl für eine reibungslose Installation.
Installieren Sie Aspose.OCR für C++ über den NuGet-Befehl
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Sie können die Bibliothek direkt von der Produktseite von Aspose.PDF herunterladen.
Effiziente Textextraktion in C++-Apps
Aspose.OCR für C++ bietet einen zuverlässigen und effizienten Ansatz zum Extrahieren von Text aus einer Vielzahl von Dateiformaten, darunter gescannte Dokumente, Bilder, PDF-Dateien, mehrseitige TIFF-Dateien, Pixelarrays, Quittungen usw. Es verwendet ausgefeilte OCR-Algorithmen, um Text mit hoher Genauigkeit zu erkennen und zu extrahieren und dabei die ursprüngliche Formatierung und Struktur beizubehalten. Die Bibliothek unterstützt eine Vielzahl von Sprachen, wodurch sie für mehrsprachige Anwendungen geeignet ist und Entwickler mühelos Text aus verschiedenen Quellen extrahieren können. Das folgende Beispiel zeigt, wie man Text aus einem TIFF-Bild über die C++-API extrahiert.
Text aus TIFF-Bild über C++-API extrahieren?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Bestimmte Bildbereiche über C++ lesen
Aspose.OCR für C++ erleichtert Softwareentwicklern das Lesen eines bestimmten Bildbereichs und das Extrahieren von Text aus diesen Bereichen oder Regionen in C++-Anwendungen. Diese Funktion ist besonders nützlich, wenn Sie nur Text aus bestimmten Abschnitten eines Bilds extrahieren müssen und irrelevante Inhalte ausschließen möchten. Die Bibliothek bietet eine einfache und effiziente Methode, um dies zu erreichen. Unten finden Sie ein Beispielcode-Snippet, das zeigt, wie bestimmte Bildbereiche mit Aspose.OCR für C++ gelesen werden.
Text aus bestimmten Bereichen eines Bildes über die C++-API extrahieren
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Bildvorverarbeitung über C++ API
Aspose.OCR für C++ bietet eine standardisierte Möglichkeit, Ihre Inhalte für OCR vorzubereiten und genaue OCR-Ergebnisse zu erzielen. Die Bibliothek bietet eine Reihe fortschrittlicher Bildvorverarbeitungstechniken. Diese Techniken verbessern die Bildqualität, korrigieren perspektivische Verzerrungen, entfernen Rauschen und optimieren den Texterkennungsprozess. Durch den Einsatz der Bildvorverarbeitung können Entwickler die OCR-Genauigkeit erheblich verbessern, insbesondere bei anspruchsvollen Bildern oder Dokumenten mit komplexen Layouts. Mehrere Vorverarbeitungsfilter können auf dasselbe Bild angewendet werden, um die Erkennungsqualität weiter zu verbessern.
Rauschen vor der Erkennung automatisch aus dem Bild entfernen über die C++-API
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Erkennungsergebnisse in anderen Formaten speichern
Aspose.OCR für C++ ermöglicht Softwareentwicklern, Text aus zahlreichen gängigen Dateiformaten zu erkennen, wie etwa PDF, JPEG, PNG, TIFF, BMP und mehr. Die API ermöglicht es Entwicklern, Erkennungsergebnisse in mehreren Formaten zu speichern, damit sie geteilt, in einer Datenbank gespeichert, angezeigt oder analysiert werden können. Softwareentwickler können Erkennungsergebnisse als Datei, Text, JSON oder XML speichern. Die Bibliothek ermöglicht das Festlegen von Erkennungssicherheitsschwellenwerten, sodass Softwareentwickler Text mit niedrigen Sicherheitsgraden herausfiltern können. Diese Funktion erweist sich bei der Verarbeitung großer Textmengen als unschätzbar wertvoll und stellt sicher, dass nur zuverlässige und genaue Ergebnisse extrahiert werden. Die folgenden Beispiele zeigen, wie Erkennungsergebnisse mithilfe von C++-Befehlen als Datei gespeichert werden.
Erkennungsergebnisse über die C++-API als mehrseitiges Dokument speichern
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);