Aspose.OCR for C++
API C++ OCR para adicionar recursos de OCR
Integre a funcionalidade de OCR em aplicativos C e C++ usando API de OCR gratuita. Ele pode reconhecer e extrair texto de imagens digitalizadas e PDFs, fotos de smartphones, capturas de tela e áreas de imagens.
À medida que a era digital continua a se expandir, torna-se necessária a extração eficiente de texto de imagens, documentos digitalizados e outras fontes. É aqui que a tecnologia de reconhecimento óptico de caracteres (OCR) desempenha um papel vital na conversão de dados visuais em texto editável e pesquisável. Aspose.OCR para C++ surge como uma solução poderosa, oferecendo aos desenvolvedores um kit de ferramentas abrangente para integrar recursos de OCR perfeitamente em seus aplicativos C++. Quer os desenvolvedores precisem extrair texto de documentos digitalizados, imagens ou até mesmo capturas de tela, o Aspose.OCR oferece uma solução abrangente para lidar com vários requisitos de OCR.
Aspose.OCR para C++ oferece um rico conjunto de recursos de processamento de imagem que melhoram a precisão do OCR e o processo de reconhecimento. Existem vários recursos importantes na biblioteca, como processar imagens giradas e com ruído, reconhecer texto em um grande número de idiomas, reconhecer em lote todas as imagens, reconhecer a imagem inteira, extrair texto apenas de áreas selecionadas, identificar palavras ou parágrafos, salva os resultados do reconhecimento no disco, suporta pré-processamento de imagem, identifica os caracteres em uma imagem, identifica caracteres em uma imagem, lê apenas certas áreas de uma imagem e assim por diante. Os desenvolvedores de software podem pré-processar imagens aplicando filtros, ajustando contraste e brilho, alinhamento e remoção de ruído, entre outras operações.
Aspose.OCR para C++ pode ser facilmente integrado aos aplicativos do usuário, bem como a outros produtos Aspose. A biblioteca fornece uma API muito simples que permite aos desenvolvedores incorporar perfeitamente recursos de OCR em seus projetos C++. Com apenas algumas linhas de código, os desenvolvedores podem inicializar o mecanismo de OCR, carregar a imagem ou documento e extrair o texto. Ele foi projetado para ser multiplataforma e pode ser usado para desenvolver aplicativos multiplataforma para Windows, Linux e web. Ao integrar o Aspose.OCR em seus projetos, os desenvolvedores de software podem aumentar a produtividade, melhorar a acessibilidade dos dados e desbloquear novas possibilidades de processamento e análise de texto em seus aplicativos.
Primeiros passos com Aspose.OCR para C++
A maneira recomendada de instalar o Aspose.OCR para C++ é usando NuGet. Use o seguinte comando para uma instalação tranquila.
Instale Aspose.OCR para C++ por meio do comando NuGet
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Você pode baixar a biblioteca diretamente da Aspose.PDF página do produto
Extração eficiente de texto em aplicativos C++
Aspose.OCR para C++ fornece uma abordagem confiável e eficiente para extrair texto de uma ampla variedade de formatos de arquivo, incluindo documentos digitalizados, imagens, arquivos PDF, TIFF de várias páginas, matriz de pixels, recibos e assim por diante. Utiliza algoritmos OCR sofisticados para reconhecer e extrair texto com alta precisão, preservando a formatação e estrutura originais. A biblioteca oferece suporte a uma ampla variedade de idiomas, tornando-a adequada para aplicativos multilíngues e permitindo que os desenvolvedores extraiam texto de diversas fontes sem esforço. O exemplo a seguir mostra como extrair texto de uma imagem TIFF por meio da API C++.
Extrair texto de imagem TIFF via API C++?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
Leia certas áreas das imagens via C++
O Aspose.OCR para C++ facilita aos desenvolvedores de software a leitura de uma área específica de uma imagem e a extração de texto dessas áreas ou regiões dentro de aplicativos C++. Este recurso é particularmente útil quando você só precisa extrair texto de seções específicas de uma imagem e deseja excluir conteúdo irrelevante. A biblioteca oferece um método simples e eficiente para conseguir isso. Abaixo está um exemplo de trecho de código que demonstra como ler certas áreas de imagens usando Aspose.OCR para C++.
Extrair texto de regiões específicas dentro de uma imagem via API C++
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
Pré-processamento de imagem via API C++
Aspose.OCR para C++ forneceu uma maneira padronizada de preparar seu conteúdo para OCR e obter resultados de OCR precisos. A biblioteca oferece uma variedade de técnicas avançadas de pré-processamento de imagens. Essas técnicas melhoram a qualidade da imagem, corrigem a distorção de perspectiva, removem ruídos e otimizam o processo de reconhecimento de texto. Ao empregar o pré-processamento de imagens, os desenvolvedores podem melhorar significativamente a precisão do OCR, especialmente ao lidar com imagens desafiadoras ou documentos com layouts complexos. Vários filtros de pré-processamento podem ser aplicados à mesma imagem para melhorar ainda mais a qualidade do reconhecimento.
Remover ruído da imagem automaticamente antes do reconhecimento via API C++
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
Salvar resultados de reconhecimento em outros formatos
Aspose.OCR para C++ permite que desenvolvedores de software reconheçam texto de vários formatos de arquivo populares, como PDF, JPEG, PNG, TIFF, BMP e muito mais. A API permite que os desenvolvedores salvem os resultados do reconhecimento em vários formatos para que possam ser compartilhados, armazenados em um banco de dados, exibidos ou analisados. Os desenvolvedores de software podem salvar os resultados do reconhecimento como arquivo, texto, JSON ou XML. A biblioteca permite definir limites de confiança de reconhecimento, permitindo que os desenvolvedores de software filtrem textos com baixos níveis de confiança. Esse recurso é inestimável ao lidar com grandes volumes de texto, garantindo que apenas resultados confiáveis e precisos sejam extraídos. Os exemplos a seguir mostram como salvar resultados de reconhecimento como arquivo usando comandos C++.
Salvar resultados de reconhecimento como um documento de várias páginas via API C++
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);