Aspose.OCR for C++
API C++ OCR для добавления возможностей OCR
Интегрируйте функциональность OCR в приложения C и C++ с помощью бесплатного API OCR. Он может распознавать и извлекать текст из отсканированных изображений и PDF-файлов, фотографий со смартфона, снимков экрана и областей изображений.
Поскольку цифровая эра продолжает расширяться, возникает необходимость в эффективном извлечении текста из изображений, отсканированных документов и других источников. Именно здесь технология оптического распознавания символов (OCR) играет жизненно важную роль в преобразовании визуальных данных в редактируемый текст с возможностью поиска. Aspose.OCR для C++ представляет собой мощное решение, предлагающее разработчикам комплексный набор инструментов для беспрепятственной интеграции возможностей OCR в их приложения на C++. Если разработчикам необходимо извлечь текст из отсканированных документов, изображений или даже снимков экрана, Aspose.OCR предоставляет комплексное решение для удовлетворения различных требований к распознаванию текста.
Aspose.OCR для C++ предлагает богатый набор функций обработки изображений, которые повышают точность распознавания и улучшают процесс распознавания. В библиотеке имеется несколько важных функций, таких как обработка повернутых и зашумленных изображений, распознавание текста на большом количестве языков, пакетное распознавание всех изображений, распознавание всего изображения, извлечение текста только из выбранных областей, определение слов или абзацев, сохраняет результаты распознавания на диске, поддерживает предварительную обработку изображений, идентифицирует символы на изображении, идентифицирует символы на изображении, считывает только определенные области изображения и т. д. Разработчики программного обеспечения могут предварительно обрабатывать изображения, применяя фильтры, регулируя контрастность и яркость, выравнивая искажения и удаляя шум, а также другие операции.
Aspose.OCR для C++ можно легко интегрировать в пользовательские приложения, а также в другие продукты Aspose. Библиотека предоставляет очень простой API, который позволяет разработчикам легко включать возможности оптического распознавания символов в свои проекты на C++. Всего с помощью нескольких строк кода разработчики могут инициализировать механизм оптического распознавания символов, загрузить изображение или документ и извлечь текст. Он разработан как кроссплатформенный и может использоваться для разработки кроссплатформенных приложений для Windows, Linux и Интернета. Интегрируя Aspose.OCR в свои проекты, разработчики программного обеспечения могут повысить производительность, улучшить доступность данных и открыть новые возможности обработки и анализа текста в своих приложениях.
Начало работы с Aspose.OCR для C++
Рекомендуемый способ установки Aspose.OCR для C++ — использование NuGet. Пожалуйста, используйте следующую команду для плавной установки.
Установите Aspose.OCR для C++ с помощью команды NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Вы можете загрузить библиотеку непосредственно со страницы продукта Aspose.PDF
Эффективное извлечение текста в приложениях C++
Aspose.OCR для C++ обеспечивает надежный и эффективный подход к извлечению текста из самых разных форматов файлов, включая отсканированные документы, изображения, файлы PDF, многостраничные TIFF, массивы пикселей, квитанции и т. д. Он использует сложные алгоритмы оптического распознавания символов для распознавания и извлечения текста с высокой точностью, сохраняя исходное форматирование и структуру. Библиотека поддерживает широкий спектр языков, что делает ее подходящей для многоязычных приложений и позволяет разработчикам легко извлекать текст из различных источников. В следующем примере показано, как извлечь текст из изображения TIFF с помощью API C++.
Извлечение текста из изображения TIFF через C++ API?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Чтение определенных областей изображений с помощью C++
Aspose.OCR для C++ позволяет разработчикам программного обеспечения легко читать определенную область изображения и извлекать текст из этих областей или регионов внутри приложений C++. Эта функция особенно полезна, когда вам нужно извлечь текст только из определенных разделов изображения и исключить ненужный контент. Библиотека предлагает простой и эффективный метод достижения этой цели. Ниже приведен пример фрагмента кода, демонстрирующий, как читать определенные области изображений с помощью Aspose.OCR для C++.
sИзвлечение текста из определенных областей изображения с помощью C++ API
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Предварительная обработка изображений через C++ API
Aspose.OCR для C++ предоставляет стандартизированный способ подготовки контента к распознаванию текста и достижения точных результатов распознавания. Библиотека предлагает ряд передовых методов предварительной обработки изображений. Эти методы улучшают качество изображения, исправляют искажения перспективы, удаляют шум и оптимизируют процесс распознавания текста. Используя предварительную обработку изображений, разработчики могут значительно повысить точность распознавания, особенно при работе со сложными изображениями или документами со сложной компоновкой. К одному и тому же изображению можно применить несколько фильтров предварительной обработки для дальнейшего улучшения качества распознавания.
Автоматическое удаление шума из изображения перед распознаванием через C++ API
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Сохранить результаты распознавания в других форматах
Aspose.OCR для C++ позволяет разработчикам программного обеспечения распознавать текст из множества популярных форматов файлов, таких как PDF, JPEG, PNG, TIFF, BMP и других. API позволяет разработчикам сохранять результаты распознавания в нескольких форматах, чтобы их можно было использовать совместно, хранить в базе данных, отображать или анализировать. Разработчики программного обеспечения могут сохранять результаты распознавания в виде файла, текста, JSON или XML. Библиотека позволяет устанавливать пороги достоверности распознавания, что позволяет разработчикам программного обеспечения отфильтровывать текст с низким уровнем достоверности. Эта функция оказывается неоценимой при работе с большими объемами текста, гарантируя получение только надежных и точных результатов. В следующих примерах показано, как сохранить результаты распознавания в файл с помощью команд C++.
Сохранение результатов распознавания в виде многостраничного документа через C++ API
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);