Bezpłatny interfejs API C# .NET do rozpoznawania danych na paragonach

Interfejs API Open Source C# do optycznego rozpoznawania znaków (OCR), który natychmiast wykrywa, wyodrębnia i rozpoznaje cały tekst i dane na paragonach za pomocą OCR.

W dzisiejszej erze cyfrowej zarówno firmy, jak i osoby prywatne są zalewane ogromnymi ilościami danych, zwłaszcza jeśli chodzi o transakcje finansowe. Paragony, faktury i rachunki szybko się kumulują, co utrudnia zarządzanie i wydobywanie cennych informacji. Na szczęście biblioteki Receipt-OCR (optyczne rozpoznawanie znaków) okazały się potężnymi narzędziami usprawniającymi ten proces. Biblioteka automatyzuje proces ekstrakcji danych, eliminując potrzebę ręcznego ich wprowadzania. Oszczędza to znaczną ilość czasu i zmniejsza ryzyko błędu ludzkiego. Biblioteka została zaprojektowana tak, aby rozpoznawać tekst w wielu językach, dzięki czemu jest odpowiednia dla firm działających na arenie międzynarodowej.

OCR paragonów to technologia wykorzystująca zaawansowane algorytmy i uczenie maszynowe do konwertowania zeskanowanych lub sfotografowanych paragonów na tekst, który można edytować i przeszukiwać. Proces ten umożliwia użytkownikom automatyczne wyodrębnianie z paragonów niezbędnych informacji, takich jak data, nazwa sprzedawcy, zakupione przedmioty, ceny i podatki. Biblioteki Receipt OCR to pakiety oprogramowania lub interfejsy API udostępniające twórcom oprogramowania i użytkownikom gotowe narzędzia i funkcje umożliwiające integrację tej funkcjonalności z ich aplikacjami lub przepływami pracy.

Receipt-OCR ułatwia wyszukiwanie, przechowywanie i odzyskiwanie danych dotyczących paragonów, czyniąc dokumentację finansową bardziej dostępną do celów audytu, analiz i zgodności. Ograniczając potrzebę ręcznego wprowadzania danych, firmy mogą zaoszczędzić na kosztach pracy. Dodatkowo zmniejszone ryzyko błędów może zapobiec kosztownym błędom w dokumentacji finansowej. Sprzedawcy detaliczni mogą używać OCR do wyodrębniania informacji o produktach z dowodów zakupu, pomagając w śledzeniu zapasów i zarządzaniu nimi. W miarę ciągłego rozwoju technologii biblioteka Receipt-OCR będzie odgrywać coraz ważniejszą rolę w unowocześnianiu i upraszczaniu zarządzania danymi finansowymi.

W skrócie

Przegląd funkcji OCR paragonów.

Przegląd funkcji

Pobierz dane o rachunkach
Dodaj możliwości OCR
Rozpoznaj tekst obrazu
Przekształcaj obrazy tekstu
Rozpoznany tekst czcionki
Wspomaganie śledzenia zapasów
Ponad 100 języków
Twórz aplikacje OCR
Zapisz dane w przeglądarce
Wyodrębnij tekst
Obsługa wielu języków

Receipt-OCR

Receipt-OCR obsługuje popularne formaty plików graficznych wymienione poniżej.

Czytelnik

PNG, JPEG, BMP, TIFF, TGA, DICOM

Pisarz

PNG, JPEG, BMP, TIFF

Receipt-OCR

Niezależność od platformy

Receipt-OCR może współpracować z dowolnym językiem programowania .NET

.NET Framework 4.8

Receipt-OCR

Pierwsze kroki z OCR paragonów

Zalecanym sposobem instalacji Receipt-OCR jest użycie narzędzia NuGet. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.

Zainstaluj OCR potwierdzenia za pomocą NuGet

 Install-Package Receipt-OCR

Zainstaluj Receipt-OCR przez GitHub

 git clone https://github.com/Asprise/receipt-ocr.git

Rozpoznawanie i wyodrębnianie tekstu z paragonów za pomocą języka C#

Biblioteka Receipt-OCR typu open source ułatwia twórcom oprogramowania ładowanie i wyodrębnianie tekstu z paragonów w aplikacjach C#. Najpierw użytkownicy muszą załadować obraz, podając pełną ścieżkę do obrazu, a następnie wykonać operację OCR na obrazie. Po zakończeniu operacji OCR twórcy oprogramowania mogą wydrukować wyodrębniony tekst lub wykorzystać go w razie potrzeby. Poniższy przykład pokazuje, jak deweloperzy oprogramowania mogą ładować i wyodrębniać tekst z paragonu przy użyciu poleceń języka C#.

Jak wykonać operację OCR w celu wyodrębnienia tekstu z obrazu paragonu przy użyciu języka C#?

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
        string imagePath = "path_to_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();
            
            // Print the extracted text or use it as needed.
            Console.WriteLine("Extracted Text from Receipt:");
            Console.WriteLine(extractedText);
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

Tekst OCR z dwóch paragonów na jednym obrazie za pośrednictwem interfejsu API .NET

Biblioteka Receipt-OCR o otwartym kodzie źródłowym umożliwia twórcom oprogramowania wykonywanie operacji OCR na dwóch paragonach na jednym obrazie przy użyciu interfejsu API języka C# .NET. Aby rozpoznać i wyodrębnić tekst z dwóch paragonów na jednym obrazie przy użyciu biblioteki OCR paragonów w języku C#, programiści mogą wykonać te ogólne kroki. Zakładając, że masz obraz zawierający dwa rachunki obok siebie. Najpierw musisz załadować obraz wielu paragonów i wykonać na nim operację OCR. Następnie możesz podzielić wyodrębniony tekst na osobne paragony w oparciu o ogranicznik lub wzór i wydrukować lub dalej przetwarzać każdy wyodrębniony paragon. Poniższy przykład ilustruje, w jaki sposób twórcy oprogramowania mogą wyodrębniać tekst z obrazu wielu paragonów w aplikacjach C#.

Kod C# do wyodrębniania tekstu z obrazu zawierającego wiele paragonów przy użyciu interfejsu API C#

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
        string imagePath = "path_to_multi_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the multi-receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();

            // Split the extracted text into separate receipts based on a delimiter or pattern.
            string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);

            // Print or process each extracted receipt.
            for (int i = 0; i < receipts.Length; i++)
            {
                Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
                Console.WriteLine(receipts[i]);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}