Aspose.OCR for C++
OCR 機能を追加するための C++ OCR API
無料の OCR API を使用して、C および C++ アプリ内に OCR 機能を統合します。 スキャンした画像や PDF、スマートフォンの写真、スクリーンショット、画像の領域からテキストを認識して抽出できます。
デジタル時代が拡大し続けるにつれて、画像、スキャンした文書、その他のソースから効率的にテキストを抽出する必要性が高まっています。 ここでは、視覚データを編集可能で検索可能なテキストに変換する光学式文字認識 (OCR) テクノロジーが重要な役割を果たします。 Aspose.OCR for C++ は強力なソリューションとして登場し、OCR 機能を C++ アプリケーションにシームレスに統合するための包括的なツールキットを開発者に提供します。 開発者がスキャンしたドキュメント、画像、またはスクリーンショットからテキストを抽出する必要がある場合でも、Aspose.OCR はさまざまな OCR 要件を処理するための包括的なソリューションを提供します。
Aspose.OCR for C++ は、OCR の精度を高め、認識プロセスを改善する豊富な画像処理機能を提供します。 ライブラリには、回転したノイズのある画像の処理、多数の言語のテキストの認識、すべての画像のバッチ認識、画像全体の認識、選択した領域のみからのテキストの抽出、単語または段落の識別など、重要な機能がいくつかあります。 認識結果のディスクへの保存、画像の前処理のサポート、画像上の文字の識別、画像上の文字の識別、画像の特定の領域のみの読み取りなど。 ソフトウェア開発者は、フィルタの適用、コントラストと明るさの調整、スキュー補正、ノイズ除去などの操作によって画像を前処理できます。
Aspose.OCR for C++ は、ユーザーのアプリケーションや他の Aspose 製品に簡単に統合できます。 このライブラリは、開発者が C++ プロジェクトに OCR 機能をシームレスに組み込むことを可能にする非常に簡単な API を提供します。 わずか数行のコードで、開発者は OCR エンジンを初期化し、画像またはドキュメントをロードし、テキストを抽出できます。 クロスプラットフォーム向けに設計されており、Windows、Linux、Web 用のクロスプラットフォーム アプリケーションの開発に使用できます。 Aspose.OCR をプロジェクトに統合することで、ソフトウェア開発者は生産性を向上させ、データ アクセシビリティを改善し、アプリケーションでのテキスト処理と分析の新たな可能性を解き放つことができます。
C++ 用 Aspose.OCR 入門
Aspose.OCR for C++ をインストールする推奨方法は、NuGet を使用することです。 スムーズにインストールするには、次のコマンドを使用してください。
NuGet コマンドを使用して Aspose.OCR for C++ をインストールする
NuGet\Install-Package Aspose.Ocr.Cpp -Version 23.4.0
ライブラリは、Aspose.PDF 製品ページから直接ダウンロードできます。
C++ アプリでの効率的なテキスト抽出
Aspose.OCR for C++ は、スキャンされたドキュメント、画像、PDF ファイル、マルチページ TIFF、ピクセル配列、レシートなどを含むさまざまなファイル形式からテキストを抽出するための信頼性が高く効率的なアプローチを提供します。 高度な OCR アルゴリズムを利用してテキストを高精度に認識および抽出し、元の書式と構造を維持します。 このライブラリは幅広い言語をサポートしているため、多言語アプリケーションに適しており、開発者はさまざまなソースからテキストを簡単に抽出できます。 次の例は、C++ API を介して TIFF 画像からテキストを抽出する方法を示しています。
C++ API 経由で TIFF 画像からテキストを抽出しますか?
std::string image_path = "source.tiff";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.language_alphabet = language::ukr;
size_t res_len = aspose::ocr::page_tiff("1.tif;2.tif", buffer, len, set);
std::wcout << buffer;
C++ 経由で画像の特定の領域を読み取る
Aspose.OCR for C++ を使用すると、ソフトウェア開発者は画像の特定の領域を読み取り、C++ アプリケーション内のその領域または領域からテキストを抽出することが容易になります。 この機能は、画像の特定のセクションからテキストを抽出する必要があるだけで、無関係なコンテンツを除外したい場合に特に便利です。 ライブラリは、これを実現するためのシンプルで効率的な方法を提供します。 以下は、Aspose.OCR for C++ を使用して画像の特定の領域を読み取る方法を示すコード スニペットの例です。
C++ API を使用して画像内の特定の領域からテキストを抽出する
// Load the image
System::SharedPtr imageStream = System::MakeObject(new System::IO::FileStream(u"image.jpg", System::IO::FileMode::Open));
// Initialize OCR engine
System::SharedPtr ocrEngine = System::MakeObject();
// Set the image for OCR
ocrEngine->Image = imageStream;
// Set the rectangle coordinates for the specific area to read
System::SharedPtr areaRect = System::MakeObject(10, 10, 200, 100);
ocrEngine->Config->SetArea(areaRect);
// Perform OCR on the specified area
ocrEngine->Process();
// Retrieve the extracted text from the specific area
System::String extractedText = ocrEngine->Text;
// Display the extracted text
std::cout << "Extracted Text: " << extractedText.ToUtf8String() << std::endl;
C++ API による画像の前処理
Aspose.OCR for C++ は、OCR 用にコンテンツを準備し、正確な OCR 結果を得る標準化された方法を提供します。 このライブラリは、さまざまな高度な画像前処理技術を提供します。 これらの技術により、画質が向上し、遠近法の歪みが補正され、ノイズが除去され、テキスト認識プロセスが最適化されます。 画像前処理を採用することで、開発者は、特に難しい画像や複雑なレイアウトを持つドキュメントを扱う場合に、OCR の精度を大幅に向上させることができます。 複数の前処理フィルターを同じ画像に適用して、認識品質をさらに向上させることができます。
C++ API 経由で認識する前に画像からノイズを自動的に除去します
// Recognition settings
std::string image_path = "source.png";
const size_t len = 4096;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.auto_denoising = true;
size_t res_len = aspose::ocr::page_settings(image_path.c_str(), buffer, len, settings);
std::wcout << buffer;
// apply Preprocessing filter
std::string image_path = "source.png";
custom_preprocessing_filters filters_;
filters_.filter_1 = OCR_IMG_PREPROCESS_AUTODENOISING;
asposeocr_preprocess_page_and_save(image_path.c_str(), "result.png", filters_);
認識結果を他の形式で保存する
Aspose.OCR for C++ を使用すると、ソフトウェア開発者は、PDF、JPEG、PNG、TIFF、BMP などの多数の一般的なファイル形式のテキストを認識できます。 API を使用すると、開発者は認識結果を複数の形式で保存できるため、認識結果を共有したり、データベースに保存したり、表示したり、分析したりすることができます。 ソフトウェア開発者は、認識結果をファイル、テキスト、JSON、または XML として保存できます。 このライブラリを使用すると、認識信頼度のしきい値を設定できるため、ソフトウェア開発者は信頼度の低いテキストを除外できます。 この機能は、大量のテキストを処理する場合に非常に役立ち、信頼性が高く正確な結果のみが抽出されるようにします。 次の例は、C++ コマンドを使用して認識結果をファイルとして保存する方法を示しています。
C++ API 経由で認識結果を複数ページのドキュメントとして保存する
directory dir(".");
const string current_dir = dir.full_name();
const string image = current_dir + "p.png";
const size_t len = 6000;
wchar_t buffer[len] = { 0 };
RecognitionSettings settings;
settings.save_format = file_format::docx;
aspose::ocr::page_save(image.c_str(), "result.docx", settings);