Aspose.OCR for C++
C++ OCR API för att lägga till OCR-funktioner
Integrera OCR-funktionalitet i C & C++-appar med gratis OCR API. Den kan känna igen och extrahera text från skannade bilder och PDF-filer, smartphonefoton, skärmdumpar och bildområden.
När den digitala eran fortsätter att expandera, blir behovet av effektiv textextraktion från bilder, skannade dokument och andra källor nödvändigt. Det är här tekniken för optisk teckenigenkänning (OCR) spelar en viktig roll för att konvertera visuell data till redigerbar och sökbar text. Aspose.OCR för C++ framstår som en kraftfull lösning som erbjuder utvecklare en omfattande verktygslåda för att sömlöst integrera OCR-funktioner i sina C++-applikationer. Oavsett om utvecklare behöver extrahera text från skannade dokument, bilder eller till och med skärmdumpar, tillhandahåller Aspose.OCR en heltäckande lösning för att hantera olika OCR-krav.
Aspose.OCR för C++ erbjuder en rik uppsättning bildbehandlingsfunktioner som förbättrar OCR-noggrannheten och förbättrar igenkänningsprocessen. Det finns flera viktiga funktioner i biblioteket, såsom bearbetar roterade och brusiga bilder, känner igen text på ett stort antal språk, batchigenkänning av alla bilder, känner igen hela bilden, extraherar endast text från utvalda områden, identifierar ord eller stycken, sparar igenkänningsresultaten på disken, stöd för bildförbehandling, Identifierar tecknen på en bild, Identifierar tecken på en bild, läser endast vissa delar av en bild och så vidare. Mjukvaruutvecklare kan förbehandla bilder bland annat genom att använda filter, justera kontrast och ljusstyrka, snedställning och brusborttagning.
Aspose.OCR för C++ kan enkelt integreras i användarens applikationer såväl som med andra Aspose-produkter. Biblioteket tillhandahåller ett mycket enkelt API som gör att utvecklare sömlöst kan integrera OCR-funktioner i sina C++-projekt. Med bara några rader kod kan utvecklare initiera OCR-motorn, ladda bilden eller dokumentet och extrahera texten. Det är designat för att vara plattformsoberoende och kan användas för att utveckla plattformsoberoende applikationer för Windows, Linux och webben. Genom att integrera Aspose.OCR i sina projekt kan mjukvaruutvecklare förbättra produktiviteten, förbättra datatillgängligheten och låsa upp nya möjligheter för textbearbetning och analys i sina applikationer.
Komma igång med Aspose.OCR för C++
Det rekommenderade sättet att installera Aspose.OCR för C++ är att använda NuGet. Använd följande kommando för en smidig installation.
Installera Aspose.OCR för C++ via NuGet Command
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Du kan ladda ner biblioteket direkt från Aspose.PDF produktsida
Effektiv textextraktion i C++-appar
Aspose.OCR för C++ ger en pålitlig och effektiv metod för att extrahera text från en mängd olika filformat, inklusive skannade dokument, bilder, PDF-filer, flersidig TIFF, pixeluppsättning, kvitton och så vidare. Den använder sofistikerade OCR-algoritmer för att känna igen och extrahera text med hög noggrannhet, och bevara den ursprungliga formateringen och strukturen. Biblioteket stöder ett brett utbud av språk, vilket gör det lämpligt för flerspråkiga applikationer och gör det möjligt för utvecklare att extrahera text från olika källor utan ansträngning. Följande exempel visar hur man extraherar text från TIFF-bild via C++ API.
Extraherar text från TIFF-bild via C++ API?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Läs vissa delar av bilder via C++
Aspose.OCR för C++ gör det enkelt för mjukvaruutvecklare att läsa en viss del av en bild och extrahera text från dessa områden eller regioner i C++-applikationer. Den här funktionen är särskilt användbar när du bara behöver extrahera text från specifika delar av en bild och vill utesluta irrelevant innehåll. Biblioteket erbjuder en enkel och effektiv metod för att uppnå detta. Nedan finns ett exempel på ett kodavsnitt som visar hur man läser vissa delar av bilder med Aspose.OCR för C++.
Extrahera text från specifika regioner i en bild via C++ API
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Bildförbehandling via C++ API
Aspose.OCR för C++ har tillhandahållit ett standardiserat sätt att förbereda ditt innehåll för OCR och uppnå korrekta OCR-resultat. Biblioteket erbjuder en rad avancerade bildförbehandlingstekniker. Dessa tekniker förbättrar bildkvaliteten, korrigerar perspektivförvrängning, tar bort brus och optimerar textigenkänningsprocessen. Genom att använda bildförbehandling kan utvecklare avsevärt förbättra OCR-noggrannheten, särskilt när de hanterar utmanande bilder eller dokument med komplexa layouter. Flera förbehandlingsfilter kan appliceras på samma bild för att ytterligare förbättra igenkänningskvaliteten.
Ta bort brus från bilden automatiskt före igenkänning via C++ API
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Spara igenkänningsresultat i andra format
Aspose.OCR för C++ gör det möjligt för mjukvaruutvecklare att känna igen text från många populära filformat, som PDF, JPEG, PNG, TIFF, BMP och mer. API:et tillåter utvecklare att spara igenkänningsresultat i flera format så att de kan delas, lagras i en databas, visas eller analyseras. Mjukvaruutvecklare kan spara igenkänningsresultat som fil, text, JSON eller XML. Biblioteket gör det möjligt att ställa in igenkänningsförtroendetrösklar, vilket gör det möjligt för mjukvaruutvecklare att filtrera bort text med låga konfidensnivåer. Denna funktion visar sig vara ovärderlig när man hanterar stora volymer text, vilket säkerställer att endast tillförlitliga och korrekta resultat extraheras. Följande exempel visar hur man sparar igenkänningsresultat som fil med C++-kommandon.
Spara igenkänningsresultat som ett flersidigt dokument via C++ API
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);