Aspose.OCR for C++
OCR 기능 추가를 위한 C++ OCR API
무료 OCR API를 사용하여 C 및 C++ 앱 내에 OCR 기능을 통합하세요. 스캔한 이미지와 PDF, 스마트폰 사진, 스크린샷, 이미지 영역에서 텍스트를 인식하고 추출할 수 있습니다..
디지털 시대가 계속 확장됨에 따라 이미지, 스캔한 문서, 기타 소스에서 효율적인 텍스트 추출이 필요해졌습니다. 여기서 OCR(광학 문자 인식) 기술은 시각적 데이터를 편집 및 검색 가능한 텍스트로 변환하는 데 중요한 역할을 합니다. C++용 Aspose.OCR은 개발자에게 OCR 기능을 C++ 애플리케이션에 원활하게 통합할 수 있는 포괄적인 툴킷을 제공하는 강력한 솔루션으로 등장합니다. 개발자가 스캔한 문서, 이미지 또는 스크린샷에서 텍스트를 추출해야 하는 경우 Aspose.OCR은 다양한 OCR 요구 사항을 처리할 수 있는 포괄적인 솔루션을 제공합니다.
C++용 Aspose.OCR은 OCR 정확도를 높이고 인식 프로세스를 개선하는 풍부한 이미지 처리 기능 세트를 제공합니다. 라이브러리에는 회전된 이미지와 노이즈가 있는 이미지 처리, 다수의 언어로 된 텍스트 인식, 모든 이미지 일괄 인식, 전체 이미지 인식, 선택한 영역에서만 텍스트 추출, 단어 또는 단락 식별 등 몇 가지 중요한 기능이 있습니다. 인식 결과를 디스크에 저장, 이미지 전처리 지원, 이미지의 문자 식별, 이미지의 문자 식별, 이미지의 특정 영역만 읽기 등이 가능합니다. 소프트웨어 개발자는 필터 적용, 대비 및 밝기 조정, 기울기 조정, 노이즈 제거 등의 작업을 통해 이미지를 전처리할 수 있습니다.
C++용 Aspose.OCR은 사용자 애플리케이션은 물론 다른 Aspose 제품에도 쉽게 통합될 수 있습니다. 라이브러리는 개발자가 OCR 기능을 C++ 프로젝트에 원활하게 통합할 수 있는 매우 간단한 API를 제공합니다. 단 몇 줄의 코드만으로 개발자는 OCR 엔진을 초기화하고, 이미지나 문서를 로드하고, 텍스트를 추출할 수 있습니다. 크로스 플랫폼으로 설계되었으며 Windows, Linux 및 웹용 크로스 플랫폼 애플리케이션을 개발하는 데 사용할 수 있습니다. Aspose.OCR을 프로젝트에 통합함으로써 소프트웨어 개발자는 생산성을 높이고, 데이터 접근성을 향상시키며, 애플리케이션에서 텍스트 처리 및 분석을 위한 새로운 가능성을 열어줄 수 있습니다.
C++용 Aspose.OCR 시작하기
C++용 Aspose.OCR을 설치하는 권장 방법은 NuGet을 사용하는 것입니다. 원활한 설치를 위해 다음 명령어를 사용하시기 바랍니다.
NuGet 명령을 통해 C++용 Aspose.OCR 설치
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
Aspose.PDF 제품 페이지에서 라이브러리를 직접 다운로드할 수 있습니다.
C++ 앱의 효율적인 텍스트 추출
C++용 Aspose.OCR은 스캔한 문서, 이미지, PDF 파일, 다중 페이지 TIFF, 픽셀 배열, 영수증 등을 포함한 다양한 파일 형식에서 텍스트를 추출하기 위한 안정적이고 효율적인 접근 방식을 제공합니다. 정교한 OCR 알고리즘을 활용하여 원본 형식과 구조를 유지하면서 높은 정확도로 텍스트를 인식하고 추출합니다. 라이브러리는 다양한 언어를 지원하므로 다국어 응용 프로그램에 적합하고 개발자가 다양한 소스에서 쉽게 텍스트를 추출할 수 있습니다. 다음 예에서는 C++ API를 통해 TIFF 이미지에서 텍스트를 추출하는 방법을 보여줍니다.
C++ API를 통해 TIFF 이미지에서 텍스트를 추출하시나요?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
C++를 통해 이미지의 특정 영역 읽기
C++용 Aspose.OCR을 사용하면 소프트웨어 개발자가 이미지의 특정 영역을 쉽게 읽고 C++ 애플리케이션 내의 해당 영역이나 영역에서 텍스트를 추출할 수 있습니다. 이 기능은 이미지의 특정 섹션에서만 텍스트를 추출하고 관련 없는 콘텐츠를 제외하려는 경우에 특히 유용합니다. 라이브러리는 이를 달성하기 위한 간단하고 효율적인 방법을 제공합니다. 다음은 C++용 Aspose.OCR을 사용하여 이미지의 특정 영역을 읽는 방법을 보여주는 예제 코드 조각입니다.
C++ API를 통해 이미지 내 특정 영역에서 텍스트 추출
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
C++ API를 통한 이미지 전처리
C++용 Aspose.OCR은 OCR용 콘텐츠를 준비하고 정확한 OCR 결과를 얻을 수 있는 표준화된 방법을 제공합니다. 라이브러리는 다양한 고급 이미지 전처리 기술을 제공합니다. 이러한 기술은 이미지 품질을 향상시키고, 원근 왜곡을 수정하고, 노이즈를 제거하고, 텍스트 인식 프로세스를 최적화합니다. 개발자는 이미지 전처리를 사용하여 특히 까다로운 이미지나 복잡한 레이아웃이 있는 문서를 처리할 때 OCR 정확도를 크게 향상시킬 수 있습니다. 동일한 이미지에 여러 전처리 필터를 적용하여 인식 품질을 더욱 향상시킬 수 있습니다.
C++ API를 통해 인식하기 전에 이미지에서 자동으로 노이즈 제거
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
인식 결과를 다른 형식으로 저장
C++용 Aspose.OCR을 사용하면 소프트웨어 개발자가 PDF, JPEG, PNG, TIFF, BMP 등과 같은 널리 사용되는 다양한 파일 형식의 텍스트를 인식할 수 있습니다. API를 사용하면 개발자는 인식 결과를 다양한 형식으로 저장할 수 있으므로 공유, 데이터베이스 저장, 표시 또는 분석이 가능합니다. 소프트웨어 개발자는 인식 결과를 파일, 텍스트, JSON 또는 XML로 저장할 수 있습니다. 라이브러리를 사용하면 인식 신뢰도 임계값을 설정할 수 있으므로 소프트웨어 개발자는 신뢰도가 낮은 텍스트를 필터링할 수 있습니다. 이 기능은 대용량 텍스트를 처리할 때 매우 유용하며 신뢰할 수 있고 정확한 결과만 추출되도록 보장합니다. 다음 예에서는 C++ 명령을 사용하여 인식 결과를 파일로 저장하는 방법을 보여줍니다.
C++ API를 통해 인식 결과를 다중 페이지 문서로 저장
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);