Bezmaksas C# .NET API, lai atpazītu datus kvītīs
Atvērtā pirmkoda C# optiskās rakstzīmju atpazīšanas (OCR) API, kas, izmantojot OCR, uzreiz nosaka, izvelk un atpazīst visu kvīšu tekstu un datus.
Mūsdienu digitālajā laikmetā gan uzņēmumi, gan privātpersonas ir pārpludinātas ar milzīgu datu apjomu, īpaši, ja runa ir par finanšu darījumiem. Kvītis, rēķini un rēķini ātri sakrājas, padarot vērtīgas informācijas pārvaldību un ieguvi sarežģītu. Par laimi Receipt-OCR (optiskās rakstzīmju atpazīšanas) bibliotēkas ir kļuvušas par spēcīgiem rīkiem šī procesa racionalizēšanai. Bibliotēka automatizē datu ieguves procesu, novēršot manuālu ievadi. Tas ievērojami ietaupa laiku un samazina cilvēka kļūdu risku. Bibliotēka ir izstrādāta, lai atpazītu tekstu vairākās valodās, padarot to piemērotu uzņēmumiem, kas darbojas starptautiski.
Kvīts OCR ir tehnoloģija, kas izmanto uzlabotus algoritmus un mašīnmācīšanos, lai pārveidotu skenētas vai fotografētas kvītis rediģējamā un meklējamā tekstā. Šis process ļauj lietotājiem automātiski iegūt no čekiem būtisku informāciju, piemēram, datumu, tirgotāja nosaukumu, iegādātās preces, cenas un nodokļus. Kvītu OCR bibliotēkas ir programmatūras pakotnes vai API, kas programmatūras izstrādātājiem un lietotājiem nodrošina iepriekš izveidotus rīkus un funkcijas, lai integrētu šo funkcionalitāti savās lietojumprogrammās vai darbplūsmās.
Receipt-OCR atvieglo kvīšu datu meklēšanu, glabāšanu un izgūšanu, padarot finanšu ierakstus pieejamākus audita, analīzes un atbilstības nolūkos. Samazinot vajadzību pēc manuālas datu ievades, uzņēmumi var ietaupīt naudu uz darbaspēka izmaksām. Turklāt samazināts kļūdu risks var novērst dārgas kļūdas finanšu uzskaitē. Mazumtirgotāji var izmantot OCR, lai iegūtu informāciju par produktu no pirkuma čekiem, tādējādi palīdzot izsekot un pārvaldīt krājumus. Tā kā tehnoloģija turpina attīstīties, Receipt-OCR bibliotēkai būs arvien lielāka nozīme finanšu datu pārvaldības modernizācijā un vienkāršošanā.
Darba sākšana ar Receipt-OCR
Ieteicamais Receipt-OCR instalēšanas veids ir izmantot NuGet. Lūdzu, izmantojiet šo komandu vienmērīgai instalēšanai.
Instalējiet Receipt-OCR, izmantojot NuGet
Install-Package Receipt-OCR
Instalējiet Receipt-OCR, izmantojot GitHub
git clone https://github.com/Asprise/receipt-ocr.git
Teksta atpazīšana un izvilkšana no kvītis, izmantojot C#
Atvērtā pirmkoda Receipt-OCR bibliotēka ļauj programmatūras izstrādātājiem viegli ielādēt un izvilkt tekstu no kvītis C# lietojumprogrammās. Vispirms lietotājiem ir jāielādē attēls, nodrošinot pilnu ceļu uz attēlu, un pēc tam ar attēlu jāveic OCR darbība. Pēc OCR darbības pabeigšanas programmatūras izstrādātāji var izdrukāt izvilkto tekstu vai izmantot to pēc vajadzības. Šis piemērs parāda, kā programmatūras izstrādātāji var ielādēt un izvilkt tekstu no kvīts, izmantojot C# komandas.
Kā veikt OCR darbību, lai izvilktu tekstu no kvīts attēla, izmantojot C#?
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
string imagePath = "path_to_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Print the extracted text or use it as needed.
Console.WriteLine("Extracted Text from Receipt:");
Console.WriteLine(extractedText);
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}
OCR teksts no divām kvītim vienā attēlā, izmantojot .NET API
Atvērtā pirmkoda Receipt-OCR bibliotēka ļauj programmatūras izstrādātājiem veikt OCR darbību ar divām kvītēm vienā attēlā, izmantojot C# .NET API. Lai atpazītu un izvilktu tekstu no divām kvītēm vienā attēlā, izmantojot kvīšu OCR bibliotēku C# valodā, programmatūras izstrādātāji var veikt šīs vispārīgās darbības. Pieņemot, ka jums ir attēls, kurā blakus ir divas kvītis. Vispirms jāielādē vairāku kvīšu attēls un jāveic OCR darbība. Pēc tam varat sadalīt izvilkto tekstu atsevišķās kvītīs, pamatojoties uz norobežotāju vai rakstu, un izdrukāt vai tālāk apstrādāt katru izvilkto kvīti. Šis piemērs parāda, kā programmatūras izstrādātāji var veikt teksta izvilkšanu no vairāku kvīšu attēla C# lietojumprogrammās.
C# kods teksta izvilkšanai no vairāku kvīšu attēla, izmantojot C# API
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
string imagePath = "path_to_multi_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the multi-receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Split the extracted text into separate receipts based on a delimiter or pattern.
string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);
// Print or process each extracted receipt.
for (int i = 0; i < receipts.Length; i++)
{
Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
Console.WriteLine(receipts[i]);
}
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}