Bezpłatny interfejs API C# .NET do rozpoznawania danych na paragonach
Interfejs API Open Source C# do optycznego rozpoznawania znaków (OCR), który natychmiast wykrywa, wyodrębnia i rozpoznaje cały tekst i dane na paragonach za pomocą OCR.
W dzisiejszej erze cyfrowej zarówno firmy, jak i osoby prywatne są zalewane ogromnymi ilościami danych, zwłaszcza jeśli chodzi o transakcje finansowe. Paragony, faktury i rachunki szybko się kumulują, co utrudnia zarządzanie i wydobywanie cennych informacji. Na szczęście biblioteki Receipt-OCR (optyczne rozpoznawanie znaków) okazały się potężnymi narzędziami usprawniającymi ten proces. Biblioteka automatyzuje proces ekstrakcji danych, eliminując potrzebę ręcznego ich wprowadzania. Oszczędza to znaczną ilość czasu i zmniejsza ryzyko błędu ludzkiego. Biblioteka została zaprojektowana tak, aby rozpoznawać tekst w wielu językach, dzięki czemu jest odpowiednia dla firm działających na arenie międzynarodowej.
OCR paragonów to technologia wykorzystująca zaawansowane algorytmy i uczenie maszynowe do konwertowania zeskanowanych lub sfotografowanych paragonów na tekst, który można edytować i przeszukiwać. Proces ten umożliwia użytkownikom automatyczne wyodrębnianie z paragonów niezbędnych informacji, takich jak data, nazwa sprzedawcy, zakupione przedmioty, ceny i podatki. Biblioteki Receipt OCR to pakiety oprogramowania lub interfejsy API udostępniające twórcom oprogramowania i użytkownikom gotowe narzędzia i funkcje umożliwiające integrację tej funkcjonalności z ich aplikacjami lub przepływami pracy.
Receipt-OCR ułatwia wyszukiwanie, przechowywanie i odzyskiwanie danych dotyczących paragonów, czyniąc dokumentację finansową bardziej dostępną do celów audytu, analiz i zgodności. Ograniczając potrzebę ręcznego wprowadzania danych, firmy mogą zaoszczędzić na kosztach pracy. Dodatkowo zmniejszone ryzyko błędów może zapobiec kosztownym błędom w dokumentacji finansowej. Sprzedawcy detaliczni mogą używać OCR do wyodrębniania informacji o produktach z dowodów zakupu, pomagając w śledzeniu zapasów i zarządzaniu nimi. W miarę ciągłego rozwoju technologii biblioteka Receipt-OCR będzie odgrywać coraz ważniejszą rolę w unowocześnianiu i upraszczaniu zarządzania danymi finansowymi.
Pierwsze kroki z OCR paragonów
Zalecanym sposobem instalacji Receipt-OCR jest użycie narzędzia NuGet. Aby instalacja przebiegła bezproblemowo, użyj poniższego polecenia.
Zainstaluj OCR potwierdzenia za pomocą NuGet
Install-Package Receipt-OCR
Zainstaluj Receipt-OCR przez GitHub
git clone https://github.com/Asprise/receipt-ocr.git
Rozpoznawanie i wyodrębnianie tekstu z paragonów za pomocą języka C#
Biblioteka Receipt-OCR typu open source ułatwia twórcom oprogramowania ładowanie i wyodrębnianie tekstu z paragonów w aplikacjach C#. Najpierw użytkownicy muszą załadować obraz, podając pełną ścieżkę do obrazu, a następnie wykonać operację OCR na obrazie. Po zakończeniu operacji OCR twórcy oprogramowania mogą wydrukować wyodrębniony tekst lub wykorzystać go w razie potrzeby. Poniższy przykład pokazuje, jak deweloperzy oprogramowania mogą ładować i wyodrębniać tekst z paragonu przy użyciu poleceń języka C#.
Jak wykonać operację OCR w celu wyodrębnienia tekstu z obrazu paragonu przy użyciu języka C#?
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
string imagePath = "path_to_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Print the extracted text or use it as needed.
Console.WriteLine("Extracted Text from Receipt:");
Console.WriteLine(extractedText);
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}
Tekst OCR z dwóch paragonów na jednym obrazie za pośrednictwem interfejsu API .NET
Biblioteka Receipt-OCR o otwartym kodzie źródłowym umożliwia twórcom oprogramowania wykonywanie operacji OCR na dwóch paragonach na jednym obrazie przy użyciu interfejsu API języka C# .NET. Aby rozpoznać i wyodrębnić tekst z dwóch paragonów na jednym obrazie przy użyciu biblioteki OCR paragonów w języku C#, programiści mogą wykonać te ogólne kroki. Zakładając, że masz obraz zawierający dwa rachunki obok siebie. Najpierw musisz załadować obraz wielu paragonów i wykonać na nim operację OCR. Następnie możesz podzielić wyodrębniony tekst na osobne paragony w oparciu o ogranicznik lub wzór i wydrukować lub dalej przetwarzać każdy wyodrębniony paragon. Poniższy przykład ilustruje, w jaki sposób twórcy oprogramowania mogą wyodrębniać tekst z obrazu wielu paragonów w aplikacjach C#.
Kod C# do wyodrębniania tekstu z obrazu zawierającego wiele paragonów przy użyciu interfejsu API C#
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
string imagePath = "path_to_multi_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the multi-receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Split the extracted text into separate receipts based on a delimiter or pattern.
string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);
// Print or process each extracted receipt.
for (int i = 0; i < receipts.Length; i++)
{
Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
Console.WriteLine(receipts[i]);
}
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}