Aspose.OCR for C++

API C++ OCR para adicionar recursos de OCR

Integre a funcionalidade de OCR em aplicativos C e C++ usando API de OCR gratuita. Ele pode reconhecer e extrair texto de imagens digitalizadas e PDFs, fotos de smartphones, capturas de tela e áreas de imagens.

À medida que a era digital continua a se expandir, torna-se necessária a extração eficiente de texto de imagens, documentos digitalizados e outras fontes. É aqui que a tecnologia de reconhecimento óptico de caracteres (OCR) desempenha um papel vital na conversão de dados visuais em texto editável e pesquisável. Aspose.OCR para C++ surge como uma solução poderosa, oferecendo aos desenvolvedores um kit de ferramentas abrangente para integrar recursos de OCR perfeitamente em seus aplicativos C++. Quer os desenvolvedores precisem extrair texto de documentos digitalizados, imagens ou até mesmo capturas de tela, o Aspose.OCR oferece uma solução abrangente para lidar com vários requisitos de OCR.

Aspose.OCR para C++ oferece um rico conjunto de recursos de processamento de imagem que melhoram a precisão do OCR e o processo de reconhecimento. Existem vários recursos importantes na biblioteca, como processar imagens giradas e com ruído, reconhecer texto em um grande número de idiomas, reconhecer em lote todas as imagens, reconhecer a imagem inteira, extrair texto apenas de áreas selecionadas, identificar palavras ou parágrafos, salva os resultados do reconhecimento no disco, suporta pré-processamento de imagem, identifica os caracteres em uma imagem, identifica caracteres em uma imagem, lê apenas certas áreas de uma imagem e assim por diante. Os desenvolvedores de software podem pré-processar imagens aplicando filtros, ajustando contraste e brilho, alinhamento e remoção de ruído, entre outras operações.

Aspose.OCR para C++ pode ser facilmente integrado aos aplicativos do usuário, bem como a outros produtos Aspose. A biblioteca fornece uma API muito simples que permite aos desenvolvedores incorporar perfeitamente recursos de OCR em seus projetos C++. Com apenas algumas linhas de código, os desenvolvedores podem inicializar o mecanismo de OCR, carregar a imagem ou documento e extrair o texto. Ele foi projetado para ser multiplataforma e pode ser usado para desenvolver aplicativos multiplataforma para Windows, Linux e web. Ao integrar o Aspose.OCR em seus projetos, os desenvolvedores de software podem aumentar a produtividade, melhorar a acessibilidade dos dados e desbloquear novas possibilidades de processamento e análise de texto em seus aplicativos.

Resumo

Uma visão geral dos recursos do Aspose.OCR para C++.

Visão geral dos recursos

Executar OCR
Adicionar recursos de OCR
Reconhecer o texto da imagem
Converta imagens de texto
Texto de fonte reconhecida
Pesquisar PDF
27 idiomas de reconhecimento
Criar aplicativos de OCR
Salvar no navegador
Extrair texto
Suporte multithreading

Visão geral dos recursos

Reconhecer imagem girada
Filtros de pré-processamento
PDF para imagens
Reconhece caracteres chineses
Detecta fontes populares
Processa a imagem inteira
Suporte para imagens giradas
Reconhecimento de lote
Verificador ortográfico integrado
Dividir PDF
PDF para Excel
PDF para SVG

Aspose.OCR for C++

A API suporta principalmente o formato PDF, mas pode exportar documentos PDF para vários outros formatos.

Leitor

PDF, PDF/A, TEX, XPS, SVG

Escritor

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for C++

Independência de plataforma

Aspose.OCR para C++ pode funcionar com qualquer linguagem de programação baseada em C++.

C++ runtime.

Aspose.OCR for C++

Primeiros passos com Aspose.OCR para C++

A maneira recomendada de instalar o Aspose.OCR para C++ é usando NuGet. Use o seguinte comando para uma instalação tranquila.

Instale Aspose.OCR para C++ por meio do comando NuGet

 NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0

Você pode baixar a biblioteca diretamente da Aspose.PDF página do produto

Extração eficiente de texto em aplicativos C++

Aspose.OCR para C++ fornece uma abordagem confiável e eficiente para extrair texto de uma ampla variedade de formatos de arquivo, incluindo documentos digitalizados, imagens, arquivos PDF, TIFF de várias páginas, matriz de pixels, recibos e assim por diante. Utiliza algoritmos OCR sofisticados para reconhecer e extrair texto com alta precisão, preservando a formatação e estrutura originais. A biblioteca oferece suporte a uma ampla variedade de idiomas, tornando-a adequada para aplicativos multilíngues e permitindo que os desenvolvedores extraiam texto de diversas fontes sem esforço. O exemplo a seguir mostra como extrair texto de uma imagem TIFF por meio da API C++.

Extrair texto de imagem TIFF via API C++?

std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;

Leia certas áreas das imagens via C++

O Aspose.OCR para C++ facilita aos desenvolvedores de software a leitura de uma área específica de uma imagem e a extração de texto dessas áreas ou regiões dentro de aplicativos C++. Este recurso é particularmente útil quando você só precisa extrair texto de seções específicas de uma imagem e deseja excluir conteúdo irrelevante. A biblioteca oferece um método simples e eficiente para conseguir isso. Abaixo está um exemplo de trecho de código que demonstra como ler certas áreas de imagens usando Aspose.OCR para C++.

Extrair texto de regiões específicas dentro de uma imagem via API C++

// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;

Pré-processamento de imagem via API C++

Aspose.OCR para C++ forneceu uma maneira padronizada de preparar seu conteúdo para OCR e obter resultados de OCR precisos. A biblioteca oferece uma variedade de técnicas avançadas de pré-processamento de imagens. Essas técnicas melhoram a qualidade da imagem, corrigem a distorção de perspectiva, removem ruídos e otimizam o processo de reconhecimento de texto. Ao empregar o pré-processamento de imagens, os desenvolvedores podem melhorar significativamente a precisão do OCR, especialmente ao lidar com imagens desafiadoras ou documentos com layouts complexos. Vários filtros de pré-processamento podem ser aplicados à mesma imagem para melhorar ainda mais a qualidade do reconhecimento.

Remover ruído da imagem automaticamente antes do reconhecimento via API C++

 // Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;

// apply Preprocessing filter

std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);

Salvar resultados de reconhecimento em outros formatos

Aspose.OCR para C++ permite que desenvolvedores de software reconheçam texto de vários formatos de arquivo populares, como PDF, JPEG, PNG, TIFF, BMP e muito mais. A API permite que os desenvolvedores salvem os resultados do reconhecimento em vários formatos para que possam ser compartilhados, armazenados em um banco de dados, exibidos ou analisados. Os desenvolvedores de software podem salvar os resultados do reconhecimento como arquivo, texto, JSON ou XML. A biblioteca permite definir limites de confiança de reconhecimento, permitindo que os desenvolvedores de software filtrem textos com baixos níveis de confiança. Esse recurso é inestimável ao lidar com grandes volumes de texto, garantindo que apenas resultados confiáveis e precisos sejam extraídos. Os exemplos a seguir mostram como salvar resultados de reconhecimento como arquivo usando comandos C++.

Salvar resultados de reconhecimento como um documento de várias páginas via API C++

directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);