Aspose.OCR for Python via .NET

Python API で画像からテキストを読み取り・抽出

先進的な強力な Python OCR API は、開発者が画像、写真、スクリーンショット、スキャン文書、PDF ファイルからテキストを読み取り・抽出できるようにします。

今日のデジタル時代において、画像を編集可能なテキスト形式に変換することは、多くの企業や開発者にとって重要な作業となっています。Aspose.OCR for Python via .NET は、光学文字認識（OCR）の堅牢なソリューションを提供し、ソフトウェア開発者が画像からテキストを簡単に抽出できるようにします。Aspose.OCR for Python via .NET は OCR タスク向けに設計された強力なライブラリです。これは高品質な文書処理ツールで知られる Aspose 製品群の一部です。このライブラリにより、開発者は .NET フレームワークの機能を Python で活用でき、クロスプラットフォームのアプリケーションでシームレスに OCR 操作を実行できます。英語、スペイン語、フランス語、ドイツ語、イタリア語、中国語、日本語など、100 以上の言語のテキスト認識をサポートしています。

Aspose.OCR for Python via .NET は、JPEG、PNG、GIF、BMP、TIFF などさまざまな画像形式からテキストを認識・抽出できる .NET ベースの OCR ライブラリです。API は高度なアルゴリズムを使用し、さまざまな画像形式でのテキスト認識の高精度を保証します。異なるフォントやスタイルのテキスト認識もサポートします。認識精度を向上させるため、Aspose.OCR は二値化、傾き補正、ノイズ除去などの前処理機能を提供します。これにより、OCR 結果を向上させるための画像準備が可能になります。単一プロセスで複数の画像を処理でき、バッチ処理を実現し、大量の画像を処理するシナリオで時間を節約します。多言語サポート、画像前処理、レイアウト解析、エラーハンドリングなどの高度な機能を備えており、OCR ベースのプロジェクトに取り組むソフトウェア開発者にとって理想的な選択肢です。

概要

Aspose.OCR for Python via .NET の機能の概要です。

Features Overview

OCR を実行
OCR 機能の追加
画像テキストの認識
テキスト画像の変換
認識されたフォントテキスト
PDF の検索
27 の認識言語
OCR アプリの作成
ブラウザーに保存
テキストの抽出
マルチスレッドサポート

Features Overview

回転画像の認識
前処理フィルター
PDF から画像へ
中国語文字の認識
一般的な書体の検出
画像全体の処理
回転画像のサポート
バッチ認識
組み込みスペルチェッカー
PDF の分割
PDF から Excel へ
PDF から SVG へ

Aspose.OCR for Python via .NET

API は主に PDF 形式をサポートしていますが、PDF ドキュメントを多数の他形式にエクスポートできます。

リーダー

PDF, PDF/A, TEX, XPS, SVG

ライター

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR for Python via .NET

プラットフォームの独立性

Aspose.OCR for Python via .NET は、任意の Python ベースのプログラミング言語で動作できます。

Python 3.6 以降

Aspose.OCR for Python via .NET

Aspose.OCR for Python via .NET の開始方法

Aspose.OCR for Python via .NET をインストールする推奨方法は pip を使用することです。スムーズなインストールのために以下のコマンドをご利用ください。

Install Aspose.OCR for Python via .NET via pip

 pip install aspose-ocr-python-net

SDK は Aspose.OCR Python Cloud SDK 製品ページから直接ダウンロードできます。

Python で高精度な OCR 操作

Aspose.OCR for Python via .NET は、高精度と高信頼性を実現するよう設計されています。ライブラリは高度な機械学習モデルを組み込み、傾いた画像や低解像度画像でもテキスト抽出精度を向上させます。この機能により、スキャンしたフォームや文書からの自動データ抽出など、信頼できる文字認識が必要なアプリケーションに最適です。以下のコードスニペットは、画像を読み込み、処理し、認識されたテキストを表示するシンプルな実装例を示しています。

How to Load Images, Perform OCR and Extract Text via Python API?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

画像前処理機能

Aspose.OCR for Python via .NET ライブラリは、Python アプリケーション内で強力な画像前処理機能を提供します。傾き補正、ノイズ除去、画像正規化などの機能により OCR の精度が向上します。これらの前処理は、最適でない条件でスキャンされた画像を扱う際に特に重要です。以下の例は、画像がわずかに傾いている場合でもテキストを正確に検出できるようにする傾き補正操作の実装方法を示しています。

Python アプリで傾き補正を使用した OCR 操作を実行する方法

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Python による手書き文字認識

Aspose.OCR for Python via .NET は非常に扱いやすく、数行の Python コードだけで印刷文字と手書き文字の両方を認識できます。この機能は、手書きノートや署名のデジタル化などのアプリケーションに非常に有用です。さまざまな文字スタイルを解釈できるソフトウェアの能力は、教育や法的文書といった分野での有用性を高めます。以下は、Python コードで手書き文字認識を実行する例です。

Python ライブラリで手書き文字認識を実行する方法

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Python アプリでの OCR カスタム画像領域

Aspose.OCR for Python via .NET は、Python アプリケーション内で画像の特定領域からテキストを認識する完全なサポートを提供します。開発者は画像内の特定領域を指定して OCR を実行でき、画像の一部にのみテキストが含まれるシナリオで役立ちます。開発者は画像上のカスタム領域を定義し、認識モードを設定し、その他のパラメータを調整して、アプリケーション固有の要件に合わせて OCR プロセスを最適化できます。以下の例は、数行の Python コードだけで単一行テキストを認識する方法を示しています。

Python アプリで画像上の単一行テキストを認識する方法

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)