Aspose.OCR for C++

C++ OCR API за добавяне на OCR възможности

Интегрирайте OCR функционалност в C & C++ приложения с помощта на безплатен OCR API. Може да разпознава и извлича текст от сканирани изображения и PDF файлове, снимки на смартфони, екранни снимки и области от изображения.

Тъй като цифровата ера продължава да се разширява, необходимостта от ефективно извличане на текст от изображения, сканирани документи и други източници става необходима. Това е мястото, където технологията за оптично разпознаване на символи (OCR) играе жизненоважна роля при преобразуването на визуални данни в редактируем и търсен текст. Aspose.OCR за C++ се очертава като мощно решение, предлагащо на разработчиците цялостен набор от инструменти за безпроблемно интегриране на възможностите за OCR в техните C++ приложения. Независимо дали разработчиците трябва да извлекат текст от сканирани документи, изображения или дори екранни снимки, Aspose.OCR предоставя цялостно решение за справяне с различни изисквания за OCR.

Aspose.OCR за C++ предлага богат набор от функции за обработка на изображения, които повишават точността на OCR и подобряват процеса на разпознаване. Има няколко важни функции част от библиотеката, като обработка на завъртяни и шумни изображения, разпознаване на текст на голям брой езици, пакетно разпознаване на всички изображения, разпознаване на цялото изображение, извличане на текст само от избрани области, идентифициране на думи или абзаци, записва резултатите от разпознаването на диска, поддръжка за предварителна обработка на изображение, Идентифицира знаците в изображение, Идентифицира знаци в изображение, чете само определени области от изображение и т.н. Разработчиците на софтуер могат да обработват предварително изображения чрез прилагане на филтри, регулиране на контраста и яркостта, изкривяване и премахване на шума, наред с други операции.

Aspose.OCR за C++ може лесно да се интегрира в потребителски приложения, както и с други продукти на Aspose. Библиотеката предоставя много лесен API, който позволява на разработчиците безпроблемно да включат OCR възможности в своите C++ проекти. Само с няколко реда код разработчиците могат да инициализират OCR двигателя, да заредят изображението или документа и да извлекат текста. Той е проектиран да бъде междуплатформен и може да се използва за разработване на междуплатформени приложения за Windows, Linux и уеб. Чрез интегрирането на Aspose.OCR в своите проекти разработчиците на софтуер могат да подобрят производителността, да подобрят достъпа до данни и да отключат нови възможности за обработка и анализ на текст в своите приложения.

С един поглед

Общ преглед на функциите на Aspose.OCR за C++.

Преглед на характеристиките

Извършване на OCR
Добавяне на възможности за OCR
Разпознаване на текст на изображение
Преобразувайте изображения на текст
Текст на разпознат шрифт
Търсене в PDF
27 езика за разпознаване
Създаване на OCR приложения
Запазване в браузър
Извличане на текст
Поддръжка на много нишки

Преглед на характеристиките

Разпознаване на завъртяно изображение
Филтри за предварителна обработка
PDF към изображения
Разпознава китайски символи
Открива популярни шрифтове
Обработва цялото изображение
Поддръжка на завъртяни изображения
Пакетно разпознаване
Вградена проверка на правописа
Разделяне на PDF
PDF към Excel
PDF към SVG

Aspose.OCR for C++

API поддържа главно PDF формат, но може да експортира PDF документи в редица други формати.

Читател

PDF, PDF/A, TEX, XPS, SVG

Писател

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for C++

Независимост на платформата

Aspose.OCR за C++ може да работи с всеки базиран на C++ език за програмиране.

C++ runtime.

Aspose.OCR for C++

Първи стъпки с Aspose.OCR за C++

Препоръчителният начин за инсталиране на Aspose.OCR за C++ е използването на NuGet. Моля, използвайте следната команда за гладка инсталация.

Инсталирайте Aspose.OCR за C++ чрез NuGet команда

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Можете да изтеглите библиотеката директно от страницата на продукта Aspose.PDF

Ефективно извличане на текст в C++ приложения

Aspose.OCR за C++ осигурява надежден и ефективен подход за извличане на текст от голямо разнообразие от файлови формати, включително сканирани документи, изображения, PDF файлове, многостранични TIFF, пикселни масиви, разписки и т.н. Той използва усъвършенствани OCR алгоритми за разпознаване и извличане на текст с висока точност, като запазва оригиналното форматиране и структура. Библиотеката поддържа широк набор от езици, което я прави подходяща за многоезични приложения и позволява на разработчиците да извличат текст от различни източници без усилие. Следващият пример показва как да извлечете текст от TIFF изображение чрез C++ API.

Извличане на текст от TIFF изображение чрез C++ API?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Четене на определени области от изображения чрез C++

Aspose.OCR за C++ улеснява разработчиците на софтуер да четат определена област от изображение и да извличат текст от тези области или региони в C++ приложения. Тази функция е особено полезна, когато трябва да извлечете текст само от определени секции на изображение и искате да изключите неподходящо съдържание. Библиотеката предлага прост и ефективен метод за постигане на това. По-долу е даден примерен кодов фрагмент, демонстриращ как да четете определени области от изображения с помощта на Aspose.OCR за C++.

Извличане на текст от конкретни региони в рамките на изображение чрез C++ API

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Предварителна обработка на изображения чрез C++ API

Aspose.OCR за C++ предостави стандартизиран начин за подготовка на вашето съдържание за OCR и постигане на точни резултати от OCR. Библиотеката предлага набор от усъвършенствани техники за предварителна обработка на изображения. Тези техники подобряват качеството на изображението, коригират изкривяването на перспективата, премахват шума и оптимизират процеса на разпознаване на текст. Използвайки предварителна обработка на изображения, разработчиците могат значително да подобрят точността на OCR, особено когато работят с предизвикателни изображения или документи със сложни оформления. Множество филтри за предварителна обработка могат да бъдат приложени към едно и също изображение за допълнително подобряване на качеството на разпознаване.

Автоматично премахване на шума от изображението преди разпознаване чрез C++ API

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);

Запазване на резултатите от разпознаването в други формати

Aspose.OCR за C++ позволява на разработчиците на софтуер да разпознават текст от множество популярни файлови формати, като PDF, JPEG, PNG, TIFF, BMP и други. API позволява на разработчиците да запазват резултатите от разпознаването в множество формати, така че да могат да бъдат споделяни, съхранявани в база данни, показвани или анализирани. Разработчиците на софтуер могат да запазват резултатите от разпознаването като файл, текст, JSON или XML. Библиотеката позволява задаване на прагове за достоверност на разпознаването, позволявайки на разработчиците на софтуер да филтрират текст с ниски нива на достоверност. Тази функция се оказва безценна при работа с големи обеми текст, като гарантира, че се извличат само надеждни и точни резултати. Следните примери показват как да запишете резултатите от разпознаването като файл с помощта на C++ команди.

Запазване на резултатите от разпознаването като многостраничен документ чрез C++ API

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);