1. Produktai
  2.   OCR
  3.   C++
  4.   Aspose.OCR for C++

Aspose.OCR for C++

 
 

C++ OCR API, skirta OCR galimybėms pridėti

Integruokite OCR funkcijas į C ir C++ programas naudodami nemokamą OCR API. Jis gali atpažinti ir išgauti tekstą iš nuskaitytų vaizdų ir PDF failų, išmaniųjų telefonų nuotraukų, ekrano kopijų ir vaizdų sričių.

Skaitmeninei erai toliau plečiantis, reikia efektyviai išgauti tekstą iš vaizdų, nuskaitytų dokumentų ir kitų šaltinių. Čia optinio simbolių atpažinimo (OCR) technologija atlieka gyvybiškai svarbų vaidmenį paverčiant vaizdinius duomenis į redaguojamą ir ieškomą tekstą. Aspose.OCR for C++ pasirodo kaip galingas sprendimas, siūlantis kūrėjams visapusišką įrankių rinkinį, leidžiantį sklandžiai integruoti OCR galimybes į savo C++ programas. Nesvarbu, ar kūrėjams reikia išgauti tekstą iš nuskaitytų dokumentų, vaizdų ar net ekrano kopijų, Aspose.OCR yra visapusiškas sprendimas įvairiems OCR reikalavimams patenkinti.

Aspose.OCR for C++ siūlo gausų vaizdo apdorojimo funkcijų rinkinį, kuris pagerina OCR tikslumą ir pagerina atpažinimo procesą. Yra keletas svarbių bibliotekos funkcijų, pavyzdžiui, apdoroja pasuktus ir triukšmingus vaizdus, ​​atpažįsta tekstą daugeliu kalbų, atpažįsta visus vaizdus, ​​atpažįsta visą vaizdą, išskiria tekstą tik iš pasirinktų sričių, identifikuoja žodžius ar pastraipas, išsaugo atpažinimo rezultatus diske, vaizdo išankstinio apdorojimo palaikymą, identifikuoja vaizdo simbolius, identifikuoja vaizdo simbolius, nuskaito tik tam tikras vaizdo sritis ir pan. Programinės įrangos kūrėjai gali iš anksto apdoroti vaizdus taikydami filtrus, reguliuodami kontrastą ir ryškumą, iškraipydami ir pašalindami triukšmą, be kitų veiksmų.

Aspose.OCR for C++ gali būti lengvai integruotas į vartotojo programas, taip pat su kitais Aspose produktais. Bibliotekoje yra labai paprasta API, leidžianti kūrėjams sklandžiai įtraukti OCR galimybes į savo C++ projektus. Turėdami vos kelias kodo eilutes, kūrėjai gali inicijuoti OCR variklį, įkelti vaizdą ar dokumentą ir išskleisti tekstą. Jis sukurtas kaip kelių platformų ir gali būti naudojamas kuriant kelių platformų programas, skirtas Windows, Linux ir žiniatinkliui. Integruodami Aspose.OCR į savo projektus, programinės įrangos kūrėjai gali padidinti produktyvumą, pagerinti duomenų prieinamumą ir atverti naujas teksto apdorojimo ir analizės galimybes savo programose.

Previous Next

Pradžia su Aspose.OCR, skirta C++

Rekomenduojamas būdas įdiegti Aspose.OCR for C++ yra naudoti NuGet. Norėdami sklandžiai įdiegti, naudokite šią komandą.

Įdiekite „Aspose.OCR“, skirtą C++, naudodami „NuGet Command“

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Biblioteką galite atsisiųsti tiesiai iš Aspose.PDF produkto puslapio

Efektyvus teksto išgavimas C++ programose

Aspose.OCR for C++ – tai patikimas ir efektyvus būdas išgauti tekstą iš įvairių failų formatų, įskaitant nuskaitytus dokumentus, vaizdus, ​​PDF failus, kelių puslapių TIFF, pikselių masyvą, kvitus ir pan. Jis naudoja sudėtingus OCR algoritmus, kad atpažintų ir ištrauktų tekstą labai tiksliai, išsaugant originalų formatavimą ir struktūrą. Biblioteka palaiko daugybę kalbų, todėl ji tinka daugiakalbėms programoms ir leidžia kūrėjams be vargo išgauti tekstą iš įvairių šaltinių. Šiame pavyzdyje parodyta, kaip išgauti tekstą iš TIFF vaizdo per C++ API.

Ištraukti tekstą iš TIFF vaizdo per C++ API?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Perskaitykite tam tikras vaizdų sritis naudodami C++

Aspose.OCR for C++ leidžia programinės įrangos kūrėjams lengvai perskaityti tam tikrą vaizdo sritį ir išgauti tekstą iš tų sričių ar regionų C++ programose. Ši funkcija ypač naudinga, kai reikia išskirti tekstą tik iš konkrečių vaizdo dalių ir norite išskirti nesusijusį turinį. Biblioteka siūlo paprastą ir efektyvų būdą tai pasiekti. Toliau pateikiamas kodo fragmento pavyzdys, rodantis, kaip skaityti tam tikras vaizdų sritis naudojant Aspose.OCR, skirtą C++.

Ištraukite tekstą iš konkrečių vaizdo regionų naudodami C++ API

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Išankstinis vaizdo apdorojimas naudojant C++ API

Aspose.OCR for C++ suteikė standartizuotą būdą paruošti turinį OCR ir pasiekti tikslius OCR rezultatus. Biblioteka siūlo daugybę pažangių išankstinio vaizdo apdorojimo metodų. Šie metodai pagerina vaizdo kokybę, koreguoja perspektyvos iškraipymą, pašalina triukšmą ir optimizuoja teksto atpažinimo procesą. Naudodami išankstinį vaizdų apdorojimą, kūrėjai gali žymiai pagerinti OCR tikslumą, ypač kai susiduria su sudėtingais vaizdais arba sudėtingo išdėstymo dokumentais. Tam pačiam vaizdui galima pritaikyti kelis išankstinio apdorojimo filtrus, kad būtų dar labiau pagerinta atpažinimo kokybė.

Automatiškai pašalinkite triukšmą iš vaizdo prieš atpažindami per C++ API

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
 

Išsaugoti atpažinimo rezultatus kitais formatais

Aspose.OCR for C++ leidžia programinės įrangos kūrėjams atpažinti tekstą iš daugelio populiarių failų formatų, tokių kaip PDF, JPEG, PNG, TIFF, BMP ir kt. API leidžia kūrėjams išsaugoti atpažinimo rezultatus keliais formatais, kad juos būtų galima bendrinti, saugoti duomenų bazėje, rodyti arba analizuoti. Programinės įrangos kūrėjai gali išsaugoti atpažinimo rezultatus kaip failą, tekstą, JSON arba XML. Biblioteka leidžia nustatyti atpažinimo patikimumo slenksčius, todėl programinės įrangos kūrėjai gali filtruoti tekstą su žemu patikimumo lygiu. Ši funkcija yra neįkainojama dirbant su dideliais teksto kiekiais, todėl gaunami tik patikimi ir tikslūs rezultatai. Šie pavyzdžiai parodo, kaip išsaugoti atpažinimo rezultatus kaip failą naudojant C++ komandas.

Išsaugoti atpažinimo rezultatus kaip kelių puslapių dokumentą per C++ API

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);

 Lietuvių