1. Produkti
  2.   OCR
  3.   C++
  4.   Aspose.OCR for C++

Aspose.OCR for C++

 
 

C++ OCR API OCR iespēju pievienošanai

Integrējiet OCR funkcionalitāti C un C++ lietotnēs, izmantojot bezmaksas OCR API. Tas var atpazīt un izvilkt tekstu no skenētajiem attēliem un PDF failiem, viedtālruņa fotoattēliem, ekrānuzņēmumiem un attēlu apgabaliem.

Tā kā digitālais laikmets turpina paplašināties, kļūst nepieciešama efektīva teksta izvilkšana no attēliem, skenētiem dokumentiem un citiem avotiem. Šeit optiskās rakstzīmju atpazīšanas (OCR) tehnoloģijai ir būtiska nozīme, pārvēršot vizuālos datus rediģējamā un meklējamā tekstā. Aspose.OCR for C++ parādās kā spēcīgs risinājums, piedāvājot izstrādātājiem visaptverošu rīku komplektu, lai nemanāmi integrētu OCR iespējas viņu C++ lietojumprogrammās. Neatkarīgi no tā, vai izstrādātājiem ir jāizņem teksts no skenētiem dokumentiem, attēliem vai pat ekrānuzņēmumiem, Aspose.OCR nodrošina visaptverošu risinājumu dažādu OCR prasību izpildei.

Aspose.OCR for C++ piedāvā bagātīgu attēlu apstrādes funkciju kopumu, kas uzlabo OCR precizitāti un uzlabo atpazīšanas procesu. Bibliotēkas daļai ir vairākas svarīgas funkcijas, piemēram, apstrādā pagrieztus un trokšņainus attēlus, atpazīst tekstu daudzās valodās, visu attēlu pakešu atpazīšana, atpazīst visu attēlu, izvelk tekstu tikai no atlasītajiem apgabaliem, identificē vārdus vai rindkopas, saglabā atpazīšanas rezultātus diskā, attēla priekšapstrādes atbalstu, identificē attēla rakstzīmes, identificē attēla rakstzīmes, nolasa tikai noteiktus attēla apgabalus un tā tālāk. Programmatūras izstrādātāji var iepriekš apstrādāt attēlus, cita starpā izmantojot filtrus, pielāgojot kontrastu un spilgtumu, izlīdzināšanu un trokšņu noņemšanu.

Aspose.OCR for C++ var viegli integrēt lietotāja lietojumprogrammās, kā arī citos Aspose produktos. Bibliotēka nodrošina ļoti vienkāršu API, kas ļauj izstrādātājiem nemanāmi iekļaut OCR iespējas savos C++ projektos. Izmantojot tikai dažas koda rindiņas, izstrādātāji var inicializēt OCR dzinēju, ielādēt attēlu vai dokumentu un izvilkt tekstu. Tas ir paredzēts vairāku platformu lietošanai, un to var izmantot, lai izstrādātu starpplatformu lietojumprogrammas operētājsistēmai Windows, Linux un tīmeklim. Integrējot Aspose.OCR savos projektos, programmatūras izstrādātāji var uzlabot produktivitāti, uzlabot datu pieejamību un atvērt jaunas iespējas teksta apstrādei un analīzei savās lietojumprogrammās.

Previous Next

Darba sākšana ar Aspose.OCR for C++

Ieteicamais veids, kā instalēt Aspose.OCR for C++, ir izmantot NuGet. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.

Instalējiet Aspose.OCR for C++, izmantojot NuGet Command

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Bibliotēku varat lejupielādēt tieši no Aspose.PDF produkta lapas

Efektīva teksta izvilkšana C++ lietotnēs

Aspose.OCR for C++ nodrošina uzticamu un efektīvu pieeju teksta izvilkšanai no dažādiem failu formātiem, tostarp skenētiem dokumentiem, attēliem, PDF failiem, vairāku lappušu TIFF, pikseļu masīva, kvītis un tā tālāk. Tas izmanto sarežģītus OCR algoritmus, lai atpazītu un izvilktu tekstu ar augstu precizitāti, saglabājot sākotnējo formatējumu un struktūru. Bibliotēka atbalsta plašu valodu klāstu, padarot to piemērotu daudzvalodu lietojumprogrammām un ļauj izstrādātājiem bez piepūles izvilkt tekstu no dažādiem avotiem. Šis piemērs parāda, kā izvilkt tekstu no TIFF attēla, izmantojot C++ API.

Vai izvilkt tekstu no TIFF attēla, izmantojot C++ API?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Lasiet noteiktus attēlu apgabalus, izmantojot C++

Aspose.OCR for C++ ļauj programmatūras izstrādātājiem viegli lasīt noteiktu attēla apgabalu un izvilkt tekstu no šiem apgabaliem vai reģioniem C++ lietojumprogrammās. Šī funkcija ir īpaši noderīga, ja nepieciešams tikai izvilkt tekstu no konkrētām attēla sadaļām un vēlaties izslēgt neatbilstošu saturu. Bibliotēka piedāvā vienkāršu un efektīvu metodi, kā to panākt. Tālāk ir sniegts koda fragmenta piemērs, kas parāda, kā lasīt noteiktus attēlu apgabalus, izmantojot Aspose.OCR for C++.

Izņemiet tekstu no noteiktiem attēla reģioniem, izmantojot C++ API

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Attēla priekšapstrāde, izmantojot C++ API

Aspose.OCR for C++ nodrošina standartizētu veidu, kā sagatavot saturu OCR un sasniegt precīzus OCR rezultātus. Bibliotēka piedāvā virkni progresīvu attēlu pirmapstrādes paņēmienu. Šīs metodes uzlabo attēla kvalitāti, koriģē perspektīvas kropļojumus, novērš troksni un optimizē teksta atpazīšanas procesu. Izmantojot attēlu priekšapstrādi, izstrādātāji var ievērojami uzlabot OCR precizitāti, īpaši, strādājot ar sarežģītiem attēliem vai dokumentiem ar sarežģītu izkārtojumu. Vienam attēlam var lietot vairākus priekšapstrādes filtrus, lai vēl vairāk uzlabotu atpazīšanas kvalitāti.

Automātiski noņemiet trokšņus no attēla pirms atpazīšanas, izmantojot C++ API

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
 

Saglabāt atpazīšanas rezultātus citos formātos

Aspose.OCR for C++ ļauj programmatūras izstrādātājiem atpazīt tekstu no daudziem populāriem failu formātiem, piemēram, PDF, JPEG, PNG, TIFF, BMP un citiem. API ļauj izstrādātājiem saglabāt atpazīšanas rezultātus vairākos formātos, lai tos varētu koplietot, uzglabāt datu bāzē, parādīt vai analizēt. Programmatūras izstrādātāji var saglabāt atpazīšanas rezultātus kā failu, tekstu, JSON vai XML. Bibliotēka ļauj iestatīt atpazīšanas uzticamības sliekšņus, ļaujot programmatūras izstrādātājiem filtrēt tekstu ar zemu ticamības līmeni. Šī funkcija ir nenovērtējama, strādājot ar lielu teksta apjomu, nodrošinot, ka tiek iegūti tikai uzticami un precīzi rezultāti. Šie piemēri parāda, kā saglabāt atpazīšanas rezultātus kā failu, izmantojot C++ komandas.

Saglabājiet atpazīšanas rezultātus kā vairāku lappušu dokumentu, izmantojot C++ API

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);

 Latviski