1. 製品
  2.   OCR
  3.   .NET
  4.   Receipt-OCR
 
  

領収書のデータを認識するための無料の C# .NET API

オープンソースの C# 光学式文字認識 (OCR) API は、OCR を通じて領収書のすべてのテキストとデータを即座に検出、抽出、認識します。

今日のデジタル時代では、特に金融取引に関しては、企業も個人も同様に膨大な量のデータが氾濫しています。 領収書、請求書、請求書はすぐに山積みになり、貴重な情報を管理して抽出することが困難になります。 幸いなことに、このプロセスを効率化する強力なツールとして、Receipt-OCR (光学式文字認識) ライブラリが登場しました。 ライブラリはデータ抽出プロセスを自動化し、手動入力の必要性を排除します。 これにより時間を大幅に節約し、人的ミスのリスクを軽減します。 このライブラリは、複数の言語のテキストを認識できるように設計されているため、国際的に事業を展開する企業に適しています。

レシート OCR は、高度なアルゴリズムと機械学習を使用して、スキャンまたは写真撮影したレシートを編集および検索可能なテキストに変換するテクノロジーです。 このプロセスにより、ユーザーは日付、販売者名、購入した商品、価格、税金などの重要な情報をレシートから自動的に抽出できます。 レシート OCR ライブラリは、ソフトウェア開発者やユーザーがこの機能をアプリケーションやワークフローに統合するための事前構築されたツールと機能を提供するソフトウェア パッケージまたは API です。

領収書 OCR を使用すると、領収書データの検索、保存、取得が容易になり、監査、分析、コンプライアンスの目的で財務記録にアクセスしやすくなります。 手動データ入力の必要性を減らすことで、企業は人件費を節約できます。 さらに、エラーのリスクが軽減されるため、財務記録におけるコストのかかるミスを防ぐことができます。 小売業者は OCR を使用して購入レシートから製品情報を抽出し、在庫の追跡と管理に役立てることができます。 テクノロジーが進歩し続けるにつれて、領収書 OCR ライブラリは財務データ管理の最新化と簡素化においてますます重要な役割を果たすことになります。

Previous Next

領収書 OCR の使用を開始する

Receipt-OCR をインストールする推奨方法は、NuGet を使用することです。 スムーズにインストールするには、次のコマンドを使用してください。

NuGet 経由で Receipt-OCR をインストールする

 Install-Package Receipt-OCR 

GitHub 経由で Receipt-OCR をインストールする

 git clone https://github.com/Asprise/receipt-ocr.git 

C# 経由で領収書からテキストを認識して抽出する

オープン ソースの領収書 OCR ライブラリを使用すると、ソフトウェア開発者は C# アプリケーション内の領収書からテキストを読み込んで抽出することが簡単になります。 まずユーザーは、画像への完全なパスを指定して画像をロードし、その後、画像に対して OCR 操作を実行する必要があります。 OCR 操作の完了後、ソフトウェア開発者は、抽出されたテキストを印刷したり、必要に応じて使用したりできます。 次の例は、ソフトウェア開発者が C# コマンドを使用して領収書からテキストを読み込んで抽出する方法を示しています。

C# を使用して OCR 操作を実行してレシート画像からテキストを抽出する方法

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
        string imagePath = "path_to_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();
            
            // Print the extracted text or use it as needed.
            Console.WriteLine("Extracted Text from Receipt:");
            Console.WriteLine(extractedText);
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

.NET API を介した 1 つの画像上の 2 つの領収書からの OCR テキスト

オープンソースの領収書 OCR ライブラリを使用すると、ソフトウェア開発者は C# .NET API を使用して 1 つの画像内の 2 つの領収書に対して OCR 操作を実行できます。 C# のレシート OCR ライブラリを使用して、1 つの画像上の 2 つのレシートからテキストを認識して抽出するには、ソフトウェア開発者は次の一般的な手順を実行できます。 2 つのレシートを並べて含む画像があると仮定します。 まず、複数のレシート画像をロードし、それに対して OCR 操作を実行する必要があります。 その後、抽出されたテキストを区切り文字またはパターンに基づいて個別の領収書に分割し、抽出された各領収書を印刷したり、さらに処理したりできます。 次の例は、ソフトウェア開発者が C# アプリケーション内で複数のレシート画像からテキスト抽出を実行する方法を示しています。

C# API を使用して複数のレシート画像からテキストを抽出するための C# コード

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
        string imagePath = "path_to_multi_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the multi-receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();

            // Split the extracted text into separate receipts based on a delimiter or pattern.
            string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);

            // Print or process each extracted receipt.
            for (int i = 0; i < receipts.Length; i++)
            {
                Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
                Console.WriteLine(receipts[i]);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

 日本