Aspose.OCR for C++

API C++ OCR pour l'ajout de fonctionnalités OCR

Intégrez la fonctionnalité OCR dans les applications C & C++ à l'aide de l'API OCR gratuite. Il peut reconnaître et extraire du texte à partir d'images et de PDF numérisés, de photos de smartphone, de captures d'écran et de zones d'images.

À mesure que l'ère numérique continue de s'étendre, le besoin d'une extraction efficace de texte à partir d'images, de documents numérisés et d'autres sources devient nécessaire. C'est là que la technologie de reconnaissance optique de caractères (OCR) joue un rôle essentiel dans la conversion des données visuelles en texte modifiable et consultable. Aspose.OCR for C++ apparaît comme une solution puissante, offrant aux développeurs une boîte à outils complète pour intégrer les fonctionnalités OCR de manière transparente dans leurs applications C++. Que les développeurs aient besoin d'extraire du texte à partir de documents numérisés, d'images ou même de captures d'écran, Aspose.OCR fournit une solution complète pour répondre à diverses exigences OCR.

Aspose.OCR pour C++ offre un riche ensemble de fonctionnalités de traitement d'images qui améliorent la précision de l'OCR et améliorent le processus de reconnaissance. La bibliothèque comporte plusieurs fonctionnalités importantes, telles que le traitement des images pivotées et bruitées, la reconnaissance du texte dans un grand nombre de langues, la reconnaissance par lots de toutes les images, la reconnaissance de l'image entière, l'extraction du texte des zones sélectionnées uniquement, l'identification des mots ou des paragraphes, enregistre les résultats de reconnaissance sur le disque, prend en charge le prétraitement de l'image, identifie les caractères sur une image, identifie les caractères sur une image, lit uniquement certaines zones d'une image, etc. Les développeurs de logiciels peuvent prétraiter les images en appliquant des filtres, en ajustant le contraste et la luminosité, en redressant et en supprimant le bruit, entre autres opérations.

Aspose.OCR pour C++ peut être facilement intégré aux applications des utilisateurs ainsi qu'à d'autres produits Aspose. La bibliothèque fournit une API très simple qui permet aux développeurs d'intégrer de manière transparente les fonctionnalités OCR dans leurs projets C++. Avec seulement quelques lignes de code, les développeurs peuvent initialiser le moteur OCR, charger l'image ou le document et extraire le texte. Il est conçu pour être multiplateforme et peut être utilisé pour développer des applications multiplateformes pour Windows, Linux et Web. En intégrant Aspose.OCR dans leurs projets, les développeurs de logiciels peuvent améliorer la productivité, améliorer l'accessibilité des données et débloquer de nouvelles possibilités de traitement et d'analyse de texte dans leurs applications.

En un coup d'œil

Un aperçu des fonctionnalités d'Aspose.OCR pour C++.

Présentation des fonctionnalités

Effectuer l'OCR
Ajouter des fonctionnalités OCR
Reconnaître le texte de l'image
Convertir des images de texte
Texte de police reconnu
Rechercher un PDF
27 langues de reconnaissance
Créer des applications OCR
Enregistrer dans le navigateur
Extraire le texte
Support multithread

Présentation des fonctionnalités

Reconnaître l'image pivotée
Filtres de prétraitement
PDF en images
Reconnaît les caractères chinois
Détecte les polices populaires
Traite l'image entière
Support pour les images pivotées
Reconnaissance par lots
Vérificateur orthographique intégré
Diviser le PDF
PDF vers Excel
PDF vers SVG

Aspose.OCR for C++

L'API prend principalement en charge le format PDF, mais peut exporter des documents PDF vers un certain nombre d'autres formats.

Lecteur

PDF, PDF/A, TEX, XPS, SVG

Écrivain

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for C++

Indépendance de la plateforme

Aspose.OCR pour C++ peut fonctionner avec n'importe quel langage de programmation basé sur C++.

C++ runtime.

Aspose.OCR for C++

Premiers pas avec Aspose.OCR pour C++

La méthode recommandée pour installer Aspose.OCR pour C++ consiste à utiliser NuGet. Veuillez utiliser la commande suivante pour une installation fluide.

Installer Aspose.OCR pour C++ via la commande NuGet

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Vous pouvez télécharger la bibliothèque directement depuis la Aspose.PDF page produit

Extraction de texte efficace dans les applications C++

Aspose.OCR pour C++ offre une approche fiable et efficace pour extraire du texte à partir d'une grande variété de formats de fichiers, notamment des documents numérisés, des images, des fichiers PDF, des fichiers TIFF multipages, des matrices de pixels, des reçus, etc. Il utilise des algorithmes OCR sophistiqués pour reconnaître et extraire le texte avec une grande précision, en préservant le formatage et la structure d'origine. La bibliothèque prend en charge un large éventail de langues, ce qui la rend adaptée aux applications multilingues et permet aux développeurs d'extraire sans effort du texte de diverses sources. L'exemple suivant montre comment extraire le texte d'une image TIFF via l'API C++.

Extraire du texte d'une image TIFF via l'API C++ ?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Lire certaines zones d'images via C++

Aspose.OCR pour C++ permet aux développeurs de logiciels de lire facilement une zone particulière d'une image et d'extraire le texte de ces zones ou régions dans les applications C++. Cette fonctionnalité est particulièrement utile lorsque vous devez uniquement extraire du texte de sections spécifiques d'une image et que vous souhaitez exclure le contenu non pertinent. La bibliothèque propose une méthode simple et efficace pour y parvenir. Vous trouverez ci-dessous un exemple d'extrait de code montrant comment lire certaines zones d'images à l'aide d'Aspose.OCR pour C++.

Extraire le texte de régions spécifiques d'une image via l'API C++

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Prétraitement des images via l'API C++

Aspose.OCR for C++ fournit un moyen standardisé de préparer votre contenu pour l'OCR et d'obtenir des résultats OCR précis. La bibliothèque propose une gamme de techniques avancées de prétraitement d’images. Ces techniques améliorent la qualité de l'image, corrigent la distorsion de la perspective, suppriment le bruit et optimisent le processus de reconnaissance de texte. En utilisant le prétraitement des images, les développeurs peuvent améliorer considérablement la précision de l'OCR, en particulier lorsqu'ils traitent des images difficiles ou des documents aux mises en page complexes. Plusieurs filtres de prétraitement peuvent être appliqués à la même image pour améliorer encore la qualité de la reconnaissance.

Supprimer automatiquement le bruit de l'image avant la reconnaissance via l'API C++

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);

Enregistrer les résultats de la reconnaissance dans d'autres formats

Aspose.OCR pour C++ permet aux développeurs de logiciels de reconnaître le texte de nombreux formats de fichiers courants, tels que PDF, JPEG, PNG, TIFF, BMP et bien plus encore. L'API permet aux développeurs d'enregistrer les résultats de reconnaissance dans plusieurs formats afin qu'ils puissent être partagés, stockés dans une base de données, affichés ou analysés. Les développeurs de logiciels peuvent enregistrer les résultats de la reconnaissance sous forme de fichier, texte, JSON ou XML. La bibliothèque permet de définir des seuils de confiance en matière de reconnaissance, permettant aux développeurs de logiciels de filtrer le texte avec de faibles niveaux de confiance. Cette fonctionnalité s'avère inestimable lorsqu'il s'agit de traiter de gros volumes de texte, garantissant que seuls des résultats fiables et précis sont extraits. Les exemples suivants montrent comment enregistrer les résultats de la reconnaissance sous forme de fichier à l'aide de commandes C++.

Enregistrer les résultats de la reconnaissance sous forme de document de plusieurs pages via l'API C++

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);