Aspose.OCR for .NET
光学式文字認識操作のための最先端の .NET OCR API
C# アプリケーション内に光学式文字認識 (OCR) 機能を追加するためのトップ .NET API。 印刷または手書きのテキストをデジタル形式に変換できます。
光学式文字認識 (OCR) は、テキスト画像や印刷された文書を機械が読み取り可能なテキスト形式に変換するための非常に便利なプロセスです。 Aspose.OCR for .NET は、ソフトウェア開発者が印刷された文書や手書きの文書やテキストをデジタル形式に簡単に変換できるようにする高度な OCR ライブラリで、検索、編集、他のユーザーとの共有が容易になります。 C# .NET ライブラリには、JPEG、PNG、TIFF、GIF、BMP 画像、PDF ドキュメント、TIFF、DjVu などのさまざまな一般的な画像ファイル形式を読み取ることができる強力なイメージ リーダーが含まれています。 ソフトウェア開発者は、認識結果を最も一般的なドキュメントおよびデータ交換形式で保存することもできます。
Aspose.OCR for .NET は、市場で主要な OCR ライブラリの 1 つで、ソフトウェア開発者が外部に依存することなく .NET アプリケーションに OCR 機能を追加できるようにします。 このライブラリは、高度なアルゴリズムを使用して、スキャンされた文書、画像、手書きテキスト、スマートフォンの写真、スクリーンショット、画像の特定の領域、その他のソースからテキストを認識し、編集可能なテキストに簡単に変換します。 英語、中国語、韓国語、スペイン語、フランス語、ドイツ語、イタリア語、ブルガリア語、カザフ語、ロシア語、日本語、アラビア語を含む 26 以上の言語をサポートしています。
Aspose.OCR for .NET は非常に安定しており、ソフトウェア開発者が QR コードや UPC コードなどの一般的なバーコード形式を認識できるようにするバーコード認識に非常に便利な機能が組み込まれています。 このライブラリには、プログラマーがわずか数行の C# コードで、回転、歪んだ、ノイズのある画像を認識できるようにするいくつかの強力な前処理フィルターが含まれています。 さらに、Aspose.PDF や Aspose.Words などの他の Aspose ライブラリと簡単に統合できるため、開発者は強力なドキュメント処理ワークフローを作成できます。 また、Web リンクとして提供された画像を認識し、フォルダーまたはアーカイブ内のすべての画像をバッチ認識することも非常に簡単です。
Aspose.OCR for .NET の入門
Aspose.OCR for .NET をインストールする推奨方法は、NuGet を使用することです。 スムーズにインストールするには、次のコマンドを使用してください。
NuGet コマンドを使用して Aspose.Pdf をインストールする
Install-Package Aspose.OCR
ライブラリは、Aspose.PDF 製品ページから直接ダウンロードできます。
C# を使用して画像の特定の領域を検出する
Aspose.OCR for .NET は、.NET アプリケーション内の画像内の特定の領域を検出する機能を提供します。 スキャンされたテキスト画像または写真には、テキストの段落、表、イラスト、数式などが含まれる場合があります。 ページ上の関心のある領域を検出、順序付け、分類することは、正確な OCR を成功させるための基礎です。 このタスクを達成するために、ソフトウェア開発者が特定の種類のコンテンツを検出できるようにするライブラリの一部として、いくつかのドキュメント領域検出アルゴリズムが用意されています。 以下に、C# コマンドを使用して画像をロードし、テキスト認識用の特定の領域を検出する方法を示します。
C# API 経由で画像をロードし、特定の画像領域を検出する方法
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
.NET API 経由で画像を処理する
Aspose.OCR for .NET を使用すると、ソフトウェア開発者は独自の .NET アプリケーション内の画像に対してさまざまな種類の操作を実行できます。 このライブラリには、ユーザーが OCR 操作 (傾き補正、回転、ノイズ除去、コントラスト補正、サイズ変更、二値化、グレースケールへの変換、色反転、膨張など) を実行する前に画像を強化するのに役立つ、完全に自動化された手動画像処理フィルターがいくつか含まれています。 、メディアンフィルターなど。 OCR プロセスのカスタマイズに使用できるオプションや設定は他にも多数あります。 画像認識品質を向上させるために、開発者は複数の処理フィルターを適用できます。 開発者は、画像の特定の領域に多数のフィルターを簡単に適用できます。
C# .NET API を使用して画像にフィルターを適用する
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
.NET API を介した画像内のテキストの比較
Aspose.OCR for .NET を使用すると、ソフトウェア開発者は、独自の C# アプリケーション内の 2 つの画像上のテキストを比較できます。 このライブラリでは、フォント、テキスト サイズ、大文字と小文字、スタイル、色に関係なく、2 つの画像上のテキストを比較できます。 画像テキストを比較する 1 つの方法は、画像からテキストを抽出することです。画像からテキストを抽出したら、任意のテキスト比較アルゴリズムを使用してそれらを比較できます。 Aspose.OCR for .NET は、String.Equals メソッドを使用して 2 つの文字列を比較する簡単な方法を提供します。 次の例は、C# コードを使用して 2 つの画像内のテキストを比較する方法を示しています。
.NET API を使用して 2 つの画像内のテキストを比較する方法
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
C# API を使用して画像内のテキストを検索
Aspose.OCR for .NET を使用すると、ソフトウェア開発者は独自の .NET アプリケーション内の画像内のテキストを簡単に検索できます。 このライブラリは、文字列内のテキスト断片を見つけるのと同じくらい簡単に、画像内のテキストを検索するためのサポートを提供しました。 このライブラリは、大文字と小文字を区別する文字列または大文字と小文字を区別しない文字列の検索をサポートし、画像テキストをパターンと照合して検証することもできます。 ソフトウェア開発者は、ImageHasText メソッドを使用して、わずか数行の C# コードで画像内のテキストを検索できます。 次の例は、画像をロードし、その中の特定のテキストを検索する方法を示しています。
.NET 経由で画像内のテキストを検索する方法
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}