1. Produkty
  2.   OCR
  3.   .NET
  4.   Receipt-OCR
 
  

Bezpłatny interfejs API C# .NET do rozpoznawania danych na paragonach

Interfejs API Open Source C# do optycznego rozpoznawania znaków (OCR), który natychmiast wykrywa, wyodrębnia i rozpoznaje cały tekst i dane na paragonach za pomocą OCR.

W dzisiejszej erze cyfrowej zarówno firmy, jak i osoby prywatne są zalewane ogromnymi ilościami danych, zwłaszcza jeśli chodzi o transakcje finansowe. Paragony, faktury i rachunki szybko się kumulują, co utrudnia zarządzanie i wydobywanie cennych informacji. Na szczęście biblioteki Receipt-OCR (optyczne rozpoznawanie znaków) okazały się potężnymi narzędziami usprawniającymi ten proces. Biblioteka automatyzuje proces ekstrakcji danych, eliminując potrzebę ręcznego ich wprowadzania. Oszczędza to znaczną ilość czasu i zmniejsza ryzyko błędu ludzkiego. Biblioteka została zaprojektowana tak, aby rozpoznawać tekst w wielu językach, dzięki czemu jest odpowiednia dla firm działających na arenie międzynarodowej.

OCR paragonów to technologia wykorzystująca zaawansowane algorytmy i uczenie maszynowe do konwertowania zeskanowanych lub sfotografowanych paragonów na tekst, który można edytować i przeszukiwać. Proces ten umożliwia użytkownikom automatyczne wyodrębnianie z paragonów niezbędnych informacji, takich jak data, nazwa sprzedawcy, zakupione przedmioty, ceny i podatki. Biblioteki Receipt OCR to pakiety oprogramowania lub interfejsy API udostępniające twórcom oprogramowania i użytkownikom gotowe narzędzia i funkcje umożliwiające integrację tej funkcjonalności z ich aplikacjami lub przepływami pracy.

Receipt-OCR ułatwia wyszukiwanie, przechowywanie i odzyskiwanie danych dotyczących paragonów, czyniąc dokumentację finansową bardziej dostępną do celów audytu, analiz i zgodności. Ograniczając potrzebę ręcznego wprowadzania danych, firmy mogą zaoszczędzić na kosztach pracy. Dodatkowo zmniejszone ryzyko błędów może zapobiec kosztownym błędom w dokumentacji finansowej. Sprzedawcy detaliczni mogą używać OCR do wyodrębniania informacji o produktach z dowodów zakupu, pomagając w śledzeniu zapasów i zarządzaniu nimi. W miarę ciągłego rozwoju technologii biblioteka Receipt-OCR będzie odgrywać coraz ważniejszą rolę w unowocześnianiu i upraszczaniu zarządzania danymi finansowymi.

Previous Next

Pierwsze kroki z OCR paragonów

Zalecanym sposobem instalacji Receipt-OCR jest użycie narzędzia NuGet. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.

Zainstaluj OCR potwierdzenia za pomocą NuGet

 Install-Package Receipt-OCR 

Zainstaluj Receipt-OCR przez GitHub

 git clone https://github.com/Asprise/receipt-ocr.git 

Rozpoznawanie i wyodrębnianie tekstu z paragonów za pomocą języka C#

Biblioteka Receipt-OCR typu open source ułatwia twórcom oprogramowania ładowanie i wyodrębnianie tekstu z paragonów w aplikacjach C#. Najpierw użytkownicy muszą załadować obraz, podając pełną ścieżkę do obrazu, a następnie wykonać operację OCR na obrazie. Po zakończeniu operacji OCR twórcy oprogramowania mogą wydrukować wyodrębniony tekst lub wykorzystać go w razie potrzeby. Poniższy przykład pokazuje, jak deweloperzy oprogramowania mogą ładować i wyodrębniać tekst z paragonu przy użyciu poleceń języka C#.

Jak wykonać operację OCR w celu wyodrębnienia tekstu z obrazu paragonu przy użyciu języka C#?

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
        string imagePath = "path_to_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();
            
            // Print the extracted text or use it as needed.
            Console.WriteLine("Extracted Text from Receipt:");
            Console.WriteLine(extractedText);
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

Tekst OCR z dwóch paragonów na jednym obrazie za pośrednictwem interfejsu API .NET

Biblioteka Receipt-OCR o otwartym kodzie źródłowym umożliwia twórcom oprogramowania wykonywanie operacji OCR na dwóch paragonach na jednym obrazie przy użyciu interfejsu API języka C# .NET. Aby rozpoznać i wyodrębnić tekst z dwóch paragonów na jednym obrazie przy użyciu biblioteki OCR paragonów w języku C#, programiści mogą wykonać te ogólne kroki. Zakładając, że masz obraz zawierający dwa rachunki obok siebie. Najpierw musisz załadować obraz wielu paragonów i wykonać na nim operację OCR. Następnie możesz podzielić wyodrębniony tekst na osobne paragony w oparciu o ogranicznik lub wzór i wydrukować lub dalej przetwarzać każdy wyodrębniony paragon. Poniższy przykład ilustruje, w jaki sposób twórcy oprogramowania mogą wyodrębniać tekst z obrazu wielu paragonów w aplikacjach C#.

Kod C# do wyodrębniania tekstu z obrazu zawierającego wiele paragonów przy użyciu interfejsu API C#

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
        string imagePath = "path_to_multi_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the multi-receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();

            // Split the extracted text into separate receipts based on a delimiter or pattern.
            string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);

            // Print or process each extracted receipt.
            for (int i = 0; i < receipts.Length; i++)
            {
                Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
                Console.WriteLine(receipts[i]);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

 Polski