オープンソースの C# .NET API による高速 OCR テキスト認識
スキャンしたドキュメント、複数ページの PDF、写真などの画像からのテキスト認識を高速化するための無料の C# .NET 光学式文字認識 (OCR) API。
光学文字認識 (OCR) は、機械が画像や文書からテキストを読み取り、機械可読テキストに変換できるようにする非常に便利なテクノロジーです。 最近では、デジタル化の進展と自動データ処理の必要性により、OCR の人気が高まっています。 開発者がアプリケーションに OCR を実装するために使用できる OCR API が多数あります。 このような API の 1 つが Free-OCR-API-CSharp です。これは、ソフトウェア開発者が OCR 操作を処理するための .NET アプリケーションを作成するのに役立つ高度な無料 OCR API です。 API は完全に無料で使用でき、登録料やサブスクリプション料金は必要ありません。
Free-OCR-API-CSharp は、ソフトウェア プログラマが外部依存関係なしに OCR 機能を C# アプリケーションに統合できる無料の OCR API です。 この API は高度な OCR テクノロジーを使用しており、スキャンされたドキュメント、PDF、写真などの画像からテキストを認識できます。 API は複数の言語をサポートしており、さまざまなフォント スタイルとサイズのテキストを認識できます。 API は、英語、フランス語、ドイツ語、イタリア語、ポルトガル語、スペイン語などの複数の言語をサポートしています。 API で使用される OCR テクノロジーは高速かつ正確で、迅速かつ効率的なテキスト認識が可能です。 全体として、ソフトウェア開発者にとって、高度な OCR 機能を C# アプリケーション内に簡単に追加できるのは素晴らしい選択肢です。
Free-OCR-API-CSharp の使用を開始する
Free-OCR-API-CSharp をインストールする推奨方法は、NuGet を使用することです。 スムーズにインストールするには、次のコマンドを使用してください。
NuGet 経由で Free-OCR-API-CSharp をインストールする
Install-Package Free-OCR-API-CSharp
手動でインストールすることもできます。 最新のリリース ファイルを GitHub リポジトリから直接ダウンロードします。
C# OCR API を介して画像からテキストを認識する
オープン ソース API Free-OCR-API-CSharp には、.NET アプリケーション内のさまざまな言語でさまざまな種類の画像からテキストを認識するための優れた機能のサポートが含まれています。 このタスクを達成するには、ソフトウェア開発者は画像をバイト配列にロードし、FreeOcrApi インスタンスの OCR メソッドを呼び出し、バイト配列と認識するテキストの言語を渡すだけです。 このライブラリは、複数のファイルのテキストを一度にバッチ認識するための優れた機能も提供しており、一度に大量のファイルを簡単に処理できます。 次の例は、C# .NET コードを使用して画像からテキストを認識する方法を示しています。
C# API 経由で画像からテキストを認識する方法
using System;
using System.IO;
using FreeOcrApi;
var ocr = new FreeOcrApi("your-api-key");
// Load your image file into a byte array:
byte[] imageData = File.ReadAllBytes("path-to-your-image-file");
string recognizedText = ocr.OCR(imageData, "eng");
// Finally, display the recognized text in the console or save it to a file:
Console.WriteLine(recognizedText);
File.WriteAllText("path-to-output-file", recognizedText);
C# API を使用して検索可能な PDF ファイルを作成する
オープン ソース API Free-OCR-API-CSharp を使用すると、ソフトウェア開発者は独自の C# アプリケーション内で直接検索可能な PDF (サンドイッチ PDF とも呼ばれます) を作成できます。 デフォルトでは、追加されたテキスト レイヤーが表示され、OCR 処理された出力をスキャン画像と直接比較できるため、結果をテストする絶好の機会がユーザーに与えられます。 次の例は、ソフトウェア開発者が C# コードを使用して画像をロードし、検索 PDF ドキュメントに変換する方法を示しています。
C# API 経由で検索可能な PDF を作成するにはどうすればよいですか?
using System.IO;
using FreeOcrApi;
using PdfSharpCore.Drawing;
using PdfSharpCore.Pdf;
namespace ConsoleApp
{
class Program
{
static void Main(string[] args)
{
FreeOcrApiWrapper api = new FreeOcrApiWrapper("YOUR_API_KEY");
MemoryStream imageStream = new MemoryStream(File.ReadAllBytes("path/to/image.jpg"));
string text = api.Recognize(imageStream);
PdfDocument pdf = new PdfDocument();
PdfPage page = pdf.AddPage();
XGraphics gfx = XGraphics.FromPdfPage(page);
XFont font = new XFont("Verdana", 12, XFontStyle.Regular);
gfx.DrawString(text, font, XBrushes.Black, new XRect(0, 0, page.Width, page.Height), XStringFormats.TopLeft);
pdf.Save("path/to/output.pdf");
}
}
}