Aspose.OCR for C++
C++ OCR API pro přidávání možností OCR
Integrujte funkce OCR do aplikací C & C++ pomocí bezplatného OCR API. Dokáže rozpoznat a extrahovat text z naskenovaných obrázků a souborů PDF, fotografií smartphonu, snímků obrazovky a oblastí obrázků.
Vzhledem k tomu, že se digitální éra stále rozšiřuje, je potřeba efektivní extrakce textu z obrázků, naskenovaných dokumentů a dalších zdrojů. Zde hraje technologie optického rozpoznávání znaků (OCR) zásadní roli při převodu vizuálních dat na upravitelný a prohledávatelný text. Aspose.OCR for C++ se ukazuje jako výkonné řešení, které nabízí vývojářům komplexní sadu nástrojů pro bezproblémovou integraci funkcí OCR do jejich aplikací C++. Ať už vývojáři potřebují extrahovat text z naskenovaných dokumentů, obrázků nebo dokonce snímků obrazovky, Aspose.OCR poskytuje komplexní řešení pro řešení různých požadavků na OCR.
Aspose.OCR for C++ nabízí bohatou sadu funkcí pro zpracování obrazu, které zvyšují přesnost OCR a zlepšují proces rozpoznávání. Součástí knihovny je několik důležitých funkcí, jako je zpracování otočených a zašuměných obrázků, rozpoznávání textu ve velkém množství jazyků, hromadné rozpoznávání všech obrázků, rozpoznávání celého obrázku, extrahování textu pouze z vybraných oblastí, identifikace slov nebo odstavců, ukládá výsledky rozpoznávání na disk, podporuje předzpracování obrazu, identifikuje znaky na obrázku, identifikuje znaky na obrázku, čte pouze určité oblasti obrázku a tak dále. Softwaroví vývojáři mohou obrázky předzpracovat mimo jiné použitím filtrů, úpravou kontrastu a jasu, vyrovnáním sklonu a odstraněním šumu.
Aspose.OCR pro C++ lze snadno integrovat do uživatelských aplikací i do jiných produktů Aspose. Knihovna poskytuje velmi přímočaré API, které umožňuje vývojářům bezproblémově začlenit možnosti OCR do svých projektů v C++. Pomocí několika řádků kódu mohou vývojáři inicializovat OCR engine, načíst obrázek nebo dokument a extrahovat text. Je navržen jako multiplatformní a lze jej použít k vývoji multiplatformních aplikací pro Windows, Linux a web. Integrací Aspose.OCR do svých projektů mohou vývojáři softwaru zvýšit produktivitu, zlepšit dostupnost dat a otevřít nové možnosti pro zpracování a analýzu textu ve svých aplikacích.
Začínáme s Aspose.OCR pro C++
Doporučený způsob instalace Aspose.OCR pro C++ je pomocí NuGet. Pro bezproblémovou instalaci použijte prosím následující příkaz.
Nainstalujte Aspose.OCR pro C++ pomocí příkazu NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Knihovnu si můžete stáhnout přímo z stránky produktu Aspose.PDF
Efektivní extrakce textu v aplikacích C++
Aspose.OCR pro C++ poskytuje spolehlivý a účinný přístup k extrahování textu z široké škály formátů souborů, včetně naskenovaných dokumentů, obrázků, souborů PDF, vícestránkového TIFF, pixelového pole, účtenek a tak dále. Využívá sofistikované algoritmy OCR k rozpoznání a extrahování textu s vysokou přesností, přičemž zachovává původní formátování a strukturu. Knihovna podporuje širokou škálu jazyků, takže je vhodná pro vícejazyčné aplikace a umožňuje vývojářům bez námahy extrahovat text z různých zdrojů. Následující příklad ukazuje, jak extrahovat text z obrázku TIFF přes C++ API.
Extrahování textu z obrázku TIFF přes C++ API?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Přečtěte si určité oblasti obrázků pomocí C++
Aspose.OCR pro C++ usnadňuje vývojářům softwaru čtení konkrétní oblasti obrazu a extrahování textu z těchto oblastí nebo oblastí v aplikacích C++. Tato funkce je zvláště užitečná, když potřebujete vyjmout text pouze z určitých částí obrázku a chcete vyloučit irelevantní obsah. Knihovna nabízí jednoduchý a účinný způsob, jak toho dosáhnout. Níže je ukázkový úryvek kódu demonstrující, jak číst určité oblasti obrázků pomocí Aspose.OCR pro C++.
Extrahujte text ze specifických oblastí v rámci obrázku pomocí C++ API
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Předběžné zpracování obrázků prostřednictvím C++ API
Aspose.OCR pro C++ poskytuje standardizovaný způsob přípravy obsahu pro OCR a dosažení přesných výsledků OCR. Knihovna nabízí řadu pokročilých technik předběžného zpracování obrazu. Tyto techniky zlepšují kvalitu obrazu, opravují zkreslení perspektivy, odstraňují šum a optimalizují proces rozpoznávání textu. Využitím předzpracování obrazu mohou vývojáři výrazně zlepšit přesnost OCR, zejména při práci s náročnými obrázky nebo dokumenty se složitým rozvržením. Pro další zlepšení kvality rozpoznávání lze na stejný obrázek použít více filtrů předběžného zpracování.
Automaticky odstranit šum z obrazu před rozpoznáním pomocí C++ API
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Uložit výsledky rozpoznávání v jiných formátech
Aspose.OCR for C++ umožňuje vývojářům softwaru rozpoznat text z mnoha oblíbených formátů souborů, jako jsou PDF, JPEG, PNG, TIFF, BMP a další. Rozhraní API umožňuje vývojářům ukládat výsledky rozpoznávání v různých formátech, takže je lze sdílet, ukládat do databáze, zobrazovat nebo analyzovat. Vývojáři softwaru mohou uložit výsledky rozpoznávání jako soubor, text, JSON nebo XML. Knihovna umožňuje nastavení prahů spolehlivosti rozpoznávání, což umožňuje vývojářům softwaru odfiltrovat text s nízkou úrovní spolehlivosti. Tato funkce je neocenitelná při práci s velkými objemy textu a zajišťuje, že jsou extrahovány pouze spolehlivé a přesné výsledky. Následující příklady ukazují, jak uložit výsledky rozpoznávání jako soubor pomocí příkazů C++.
Uložit výsledky rozpoznávání jako vícestránkový dokument prostřednictvím C++ API
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);