1. produkty
  2.   OCR
  3.   .NET
  4.   Receipt-OCR
 
  

Zdarma C# .NET API pro rozpoznávání dat na účtenkách

Open Source C# API pro optické rozpoznávání znaků (OCR), které okamžitě detekuje, extrahuje a rozpoznává veškerý text a data na účtenkách prostřednictvím OCR.

V dnešním digitálním věku jsou podniky i jednotlivci zaplaveni obrovským množstvím dat, zejména pokud jde o finanční transakce. Účtenky, faktury a účty se rychle hromadí, takže je obtížné spravovat a extrahovat cenné informace. Naštěstí se knihovny Receipt-OCR (Optical Character Recognition) ukázaly jako mocné nástroje pro zefektivnění tohoto procesu. Knihovna automatizuje proces extrakce dat, čímž eliminuje potřebu ručního zadávání. To výrazně šetří čas a snižuje riziko lidské chyby. Knihovna je navržena tak, aby rozpoznávala text ve více jazycích, takže je vhodná pro podniky působící mezinárodně.

OCR účtenek je technologie, která využívá pokročilé algoritmy a strojové učení k převodu naskenovaných nebo vyfotografovaných účtenek na upravitelný a prohledávatelný text. Tento proces umožňuje uživatelům automaticky extrahovat základní informace z účtenek, jako je datum, jméno obchodníka, zakoupené položky, ceny a daně. Knihovny OCR účtenek jsou softwarové balíčky nebo rozhraní API, které vývojářům softwaru a uživatelům poskytují předem připravené nástroje a funkce k integraci těchto funkcí do jejich aplikací nebo pracovních postupů.

Receipt-OCR usnadňuje vyhledávání, ukládání a získávání dat účtenek, takže finanční záznamy jsou přístupnější pro účely auditu, analýzy a dodržování předpisů. Snížením potřeby ručního zadávání dat mohou podniky ušetřit peníze na mzdových nákladech. Snížené riziko chyb může navíc zabránit nákladným chybám ve finančních záznamech. Maloobchodníci mohou pomocí OCR extrahovat informace o produktech z nákupních účtenek, což pomáhá při sledování a správě zásob. S postupujícím pokrokem technologie bude knihovna Receipt-OCR hrát stále důležitější roli při modernizaci a zjednodušení správy finančních dat.

Previous Next

Začínáme s Receipt-OCR

Doporučeným způsobem instalace Receipt-OCR je použití NuGet. Pro bezproblémovou instalaci použijte prosím následující příkaz.

Instalace Receipt-OCR přes NuGet

 Install-Package Receipt-OCR 

Nainstalujte Receipt-OCR přes GitHub

 git clone https://github.com/Asprise/receipt-ocr.git 

Rozpoznání a extrahování textu z účtenek přes C#

Open source Receipt-OCR Library usnadňuje vývojářům softwaru načítání a extrahování textu z účtenek v aplikacích C#. První uživatelé musí načíst obrázek poskytnutím úplné cesty k obrázku a poté provést operaci OCR na obrázku. Po dokončení operace OCR mohou vývojáři softwaru vytisknout extrahovaný text nebo jej použít podle potřeby. Následující příklad ukazuje, jak mohou vývojáři softwaru načíst a extrahovat text z účtenky pomocí příkazů C#.

Jak provést operaci OCR pro extrahování textu z obrázku účtenky pomocí C#?

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
        string imagePath = "path_to_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();
            
            // Print the extracted text or use it as needed.
            Console.WriteLine("Extracted Text from Receipt:");
            Console.WriteLine(extractedText);
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

OCR text ze dvou účtenek na jednom obrázku prostřednictvím rozhraní .NET API

Open source Receipt-OCR Library umožňuje vývojářům softwaru provádět OCR operace na dvou účtenkách v jednom obrázku pomocí C# .NET API. Chcete-li rozpoznat a extrahovat text ze dvou účtenek na jednom obrázku pomocí knihovny OCR účtenek v jazyce C#, mohou vývojáři softwaru postupovat podle těchto obecných kroků. Za předpokladu, že máte obrázek obsahující dvě účtenky vedle sebe. Nejprve musíte načíst obrázek s více účtenkami a provést na něm operaci OCR. Poté můžete extrahovaný text rozdělit na samostatné účtenky na základě oddělovače nebo vzoru a každou extrahovanou účtenku vytisknout nebo dále zpracovat. Následující příklad ukazuje, jak mohou vývojáři softwaru provádět extrakci textu z obrázku s více účtenkami v aplikacích C#.

C# Kód pro extrakci textu z obrázku s více účtenkami pomocí C# API

using System;
using Asprise.OCR;

class Program
{
    static void Main(string[] args)
    {
        // Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
        string imagePath = "path_to_multi_receipt_image.jpg";

        // Create an OCR engine instance from the Receipt-OCR library.
        OCR ocr = new OCR();

        try
        {
            // Load the multi-receipt image.
            ocr.Image = imagePath;

            // Perform OCR text extraction.
            string extractedText = ocr.Recognize();

            // Split the extracted text into separate receipts based on a delimiter or pattern.
            string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);

            // Print or process each extracted receipt.
            for (int i = 0; i < receipts.Length; i++)
            {
                Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
                Console.WriteLine(receipts[i]);
            }
        }
        catch (Exception ex)
        {
            Console.WriteLine("Error: " + ex.Message);
        }
        finally
        {
            // Clean up the OCR engine.
            ocr.Dispose();
        }
    }
}

 Čeština