Aspose.OCR for C++
C++ OCR API pentru adăugarea de capabilități OCR
Integrați funcționalitatea OCR în aplicațiile C și C++ folosind API-ul OCR gratuit. Poate recunoaște și extrage text din imagini și PDF-uri scanate, fotografii de pe smartphone, capturi de ecran și zone de imagini.
Pe măsură ce era digitală continuă să se extindă, devine necesară extragerea eficientă a textului din imagini, documente scanate și alte surse. Aici tehnologia de recunoaștere optică a caracterelor (OCR) joacă un rol vital în conversia datelor vizuale în text editabil și căutat. Aspose.OCR pentru C++ apare ca o soluție puternică, oferind dezvoltatorilor un set de instrumente cuprinzător pentru a integra capabilitățile OCR fără probleme în aplicațiile lor C++. Indiferent dacă dezvoltatorii trebuie să extragă text din documente scanate, imagini sau chiar capturi de ecran, Aspose.OCR oferă o soluție cuprinzătoare pentru a face față diferitelor cerințe OCR.
Aspose.OCR pentru C++ oferă un set bogat de caracteristici de procesare a imaginilor care îmbunătățesc acuratețea OCR și îmbunătățesc procesul de recunoaștere. Există câteva caracteristici importante ale bibliotecii, cum ar fi procesarea imaginilor rotite și zgomotoase, recunoașterea textului într-un număr mare de limbi, recunoașterea în lot a tuturor imaginilor, recunoașterea întregii imagini, extragerea textului numai din zonele selectate, identificarea cuvintelor sau a paragrafelor, salvează rezultatele recunoașterii pe disc, suport pentru preprocesarea imaginii, identifică caracterele dintr-o imagine, identifică caracterele unei imagini, citește doar anumite zone ale unei imagini și așa mai departe. Dezvoltatorii de software pot preprocesa imaginile aplicând filtre, ajustând contrastul și luminozitatea, deformarea și eliminarea zgomotului, printre alte operațiuni.
Aspose.OCR pentru C++ poate fi integrat cu ușurință în aplicațiile utilizatorului, precum și cu alte produse Aspose. Biblioteca oferă un API foarte simplu, care permite dezvoltatorilor să încorporeze fără probleme capabilități OCR în proiectele lor C++. Cu doar câteva linii de cod, dezvoltatorii pot inițializa motorul OCR, pot încărca imaginea sau documentul și pot extrage textul. Este conceput pentru a fi multiplatformă și poate fi folosit pentru a dezvolta aplicații multiplatformă pentru Windows, Linux și web. Prin integrarea Aspose.OCR în proiectele lor, dezvoltatorii de software pot îmbunătăți productivitatea, îmbunătăți accesibilitatea datelor și pot debloca noi posibilități de procesare și analiză a textului în aplicațiile lor.
Noțiuni introductive cu Aspose.OCR pentru C++
Modul recomandat de a instala Aspose.OCR pentru C++ este utilizarea NuGet. Vă rugăm să utilizați următoarea comandă pentru o instalare fără probleme.
Instalați Aspose.OCR pentru C++ prin comanda NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Puteți descărca biblioteca direct de pe Aspose.PDF pagina de produs
Extragere eficientă a textului în aplicațiile C++
Aspose.OCR pentru C++ oferă o abordare fiabilă și eficientă pentru extragerea textului dintr-o mare varietate de formate de fișiere, inclusiv documente scanate, imagini, fișiere PDF, TIFF cu mai multe pagini, matrice de pixeli, chitanțe și așa mai departe. Utilizează algoritmi OCR sofisticați pentru a recunoaște și extrage textul cu acuratețe ridicată, păstrând formatarea și structura originală. Biblioteca acceptă o gamă largă de limbi, făcând-o potrivită pentru aplicații multilingve și permițând dezvoltatorilor să extragă text din diverse surse fără efort. Următorul exemplu arată cum să extrageți text din imaginea TIFF prin API-ul C++.
Se extrage text din imaginea TIFF prin API-ul C++?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Citiți anumite zone ale imaginilor prin C++
Aspose.OCR pentru C++ facilitează pentru dezvoltatorii de software să citească o anumită zonă a unei imagini și să extragă text din acele zone sau regiuni din aplicațiile C++. Această caracteristică este utilă în special atunci când trebuie doar să extrageți text din anumite secțiuni ale unei imagini și doriți să excludeți conținutul irelevant. Biblioteca oferă o metodă simplă și eficientă pentru a realiza acest lucru. Mai jos este un exemplu de fragment de cod care demonstrează cum să citești anumite zone de imagini folosind Aspose.OCR pentru C++.
Extrageți text din anumite regiuni dintr-o imagine prin API-ul C++
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Preprocesarea imaginii prin API-ul C++
Aspose.OCR pentru C++ a oferit o modalitate standardizată de a vă pregăti conținutul pentru OCR și de a obține rezultate OCR precise. Biblioteca oferă o gamă de tehnici avansate de preprocesare a imaginii. Aceste tehnici îmbunătățesc calitatea imaginii, corectează distorsiunea perspectivei, elimină zgomotul și optimizează procesul de recunoaștere a textului. Utilizând preprocesarea imaginilor, dezvoltatorii pot îmbunătăți semnificativ acuratețea OCR, în special atunci când se confruntă cu imagini provocatoare sau documente cu aspect complex. Mai multe filtre de preprocesare pot fi aplicate aceleiași imagini pentru a îmbunătăți și mai mult calitatea recunoașterii.
Eliminați automat zgomotul din imagine înainte de recunoaștere prin API-ul C++
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Salvați rezultatele recunoașterii în alte formate
Aspose.OCR pentru C++ le permite dezvoltatorilor de software să recunoască text din numeroase formate de fișiere populare, cum ar fi PDF, JPEG, PNG, TIFF, BMP și multe altele. API-ul permite dezvoltatorilor să salveze rezultatele recunoașterii în mai multe formate, astfel încât acestea să poată fi partajate, stocate într-o bază de date, afișate sau analizate. Dezvoltatorii de software pot salva rezultatele recunoașterii ca fișier, text, JSON sau XML. Biblioteca permite setarea pragurilor de încredere de recunoaștere, permițând dezvoltatorilor de software să filtreze textul cu niveluri scăzute de încredere. Această caracteristică se dovedește neprețuită atunci când aveți de-a face cu volume mari de text, asigurând că sunt extrase numai rezultate fiabile și precise. Următoarele exemple arată cum să salvați rezultatele recunoașterii ca fișier folosind comenzi C++.
Salvați rezultatele recunoașterii ca document cu mai multe pagini prin API-ul C++
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);