Aspose.OCR for C++
API C++ OCR pour l'ajout de fonctionnalités OCR
Intégrez la fonctionnalité OCR dans les applications C & C++ à l'aide de l'API OCR gratuite. Il peut reconnaître et extraire du texte à partir d'images et de PDF numérisés, de photos de smartphone, de captures d'écran et de zones d'images.
À mesure que l'ère numérique continue de s'étendre, le besoin d'une extraction efficace de texte à partir d'images, de documents numérisés et d'autres sources devient nécessaire. C'est là que la technologie de reconnaissance optique de caractères (OCR) joue un rôle essentiel dans la conversion des données visuelles en texte modifiable et consultable. Aspose.OCR for C++ apparaît comme une solution puissante, offrant aux développeurs une boîte à outils complète pour intégrer les fonctionnalités OCR de manière transparente dans leurs applications C++. Que les développeurs aient besoin d'extraire du texte à partir de documents numérisés, d'images ou même de captures d'écran, Aspose.OCR fournit une solution complète pour répondre à diverses exigences OCR.
Aspose.OCR pour C++ offre un riche ensemble de fonctionnalités de traitement d'images qui améliorent la précision de l'OCR et améliorent le processus de reconnaissance. La bibliothèque comporte plusieurs fonctionnalités importantes, telles que le traitement des images pivotées et bruitées, la reconnaissance du texte dans un grand nombre de langues, la reconnaissance par lots de toutes les images, la reconnaissance de l'image entière, l'extraction du texte des zones sélectionnées uniquement, l'identification des mots ou des paragraphes, enregistre les résultats de reconnaissance sur le disque, prend en charge le prétraitement de l'image, identifie les caractères sur une image, identifie les caractères sur une image, lit uniquement certaines zones d'une image, etc. Les développeurs de logiciels peuvent prétraiter les images en appliquant des filtres, en ajustant le contraste et la luminosité, en redressant et en supprimant le bruit, entre autres opérations.
Aspose.OCR pour C++ peut être facilement intégré aux applications des utilisateurs ainsi qu'à d'autres produits Aspose. La bibliothèque fournit une API très simple qui permet aux développeurs d'intégrer de manière transparente les fonctionnalités OCR dans leurs projets C++. Avec seulement quelques lignes de code, les développeurs peuvent initialiser le moteur OCR, charger l'image ou le document et extraire le texte. Il est conçu pour être multiplateforme et peut être utilisé pour développer des applications multiplateformes pour Windows, Linux et Web. En intégrant Aspose.OCR dans leurs projets, les développeurs de logiciels peuvent améliorer la productivité, améliorer l'accessibilité des données et débloquer de nouvelles possibilités de traitement et d'analyse de texte dans leurs applications.
Premiers pas avec Aspose.OCR pour C++
La méthode recommandée pour installer Aspose.OCR pour C++ consiste à utiliser NuGet. Veuillez utiliser la commande suivante pour une installation fluide.
Installer Aspose.OCR pour C++ via la commande NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Vous pouvez télécharger la bibliothèque directement depuis la Aspose.PDF page produit
Extraction de texte efficace dans les applications C++
Aspose.OCR pour C++ offre une approche fiable et efficace pour extraire du texte à partir d'une grande variété de formats de fichiers, notamment des documents numérisés, des images, des fichiers PDF, des fichiers TIFF multipages, des matrices de pixels, des reçus, etc. Il utilise des algorithmes OCR sophistiqués pour reconnaître et extraire le texte avec une grande précision, en préservant le formatage et la structure d'origine. La bibliothèque prend en charge un large éventail de langues, ce qui la rend adaptée aux applications multilingues et permet aux développeurs d'extraire sans effort du texte de diverses sources. L'exemple suivant montre comment extraire le texte d'une image TIFF via l'API C++.
Extraire du texte d'une image TIFF via l'API C++ ?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Lire certaines zones d'images via C++
Aspose.OCR pour C++ permet aux développeurs de logiciels de lire facilement une zone particulière d'une image et d'extraire le texte de ces zones ou régions dans les applications C++. Cette fonctionnalité est particulièrement utile lorsque vous devez uniquement extraire du texte de sections spécifiques d'une image et que vous souhaitez exclure le contenu non pertinent. La bibliothèque propose une méthode simple et efficace pour y parvenir. Vous trouverez ci-dessous un exemple d'extrait de code montrant comment lire certaines zones d'images à l'aide d'Aspose.OCR pour C++.
Extraire le texte de régions spécifiques d'une image via l'API C++
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Prétraitement des images via l'API C++
Aspose.OCR for C++ fournit un moyen standardisé de préparer votre contenu pour l'OCR et d'obtenir des résultats OCR précis. La bibliothèque propose une gamme de techniques avancées de prétraitement d’images. Ces techniques améliorent la qualité de l'image, corrigent la distorsion de la perspective, suppriment le bruit et optimisent le processus de reconnaissance de texte. En utilisant le prétraitement des images, les développeurs peuvent améliorer considérablement la précision de l'OCR, en particulier lorsqu'ils traitent des images difficiles ou des documents aux mises en page complexes. Plusieurs filtres de prétraitement peuvent être appliqués à la même image pour améliorer encore la qualité de la reconnaissance.
Supprimer automatiquement le bruit de l'image avant la reconnaissance via l'API C++
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Enregistrer les résultats de la reconnaissance dans d'autres formats
Aspose.OCR pour C++ permet aux développeurs de logiciels de reconnaître le texte de nombreux formats de fichiers courants, tels que PDF, JPEG, PNG, TIFF, BMP et bien plus encore. L'API permet aux développeurs d'enregistrer les résultats de reconnaissance dans plusieurs formats afin qu'ils puissent être partagés, stockés dans une base de données, affichés ou analysés. Les développeurs de logiciels peuvent enregistrer les résultats de la reconnaissance sous forme de fichier, texte, JSON ou XML. La bibliothèque permet de définir des seuils de confiance en matière de reconnaissance, permettant aux développeurs de logiciels de filtrer le texte avec de faibles niveaux de confiance. Cette fonctionnalité s'avère inestimable lorsqu'il s'agit de traiter de gros volumes de texte, garantissant que seuls des résultats fiables et précis sont extraits. Les exemples suivants montrent comment enregistrer les résultats de la reconnaissance sous forme de fichier à l'aide de commandes C++.
Enregistrer les résultats de la reconnaissance sous forme de document de plusieurs pages via l'API C++
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);