API C# .NET miễn phí để nhận dạng dữ liệu trên biên lai
API Nhận dạng ký tự quang học (OCR) C# nguồn mở có thể phát hiện, trích xuất và nhận dạng ngay lập tức mọi văn bản và dữ liệu trên biên lai thông qua OCR.
Trong thời đại kỹ thuật số ngày nay, các doanh nghiệp và cá nhân đều bị ngập trong khối lượng dữ liệu khổng lồ, đặc biệt là khi nói đến các giao dịch tài chính. Biên lai, hóa đơn và chứng từ chồng chất nhanh chóng, khiến việc quản lý và trích xuất thông tin có giá trị trở nên khó khăn. May mắn thay, các thư viện Receipt-OCR (Nhận dạng ký tự quang học) đã nổi lên như những công cụ mạnh mẽ để hợp lý hóa quy trình này. Thư viện tự động hóa quy trình trích xuất dữ liệu, loại bỏ nhu cầu nhập thủ công. Điều này giúp tiết kiệm đáng kể thời gian và giảm nguy cơ lỗi của con người. Thư viện được thiết kế để nhận dạng văn bản bằng nhiều ngôn ngữ, phù hợp với các doanh nghiệp hoạt động quốc tế.
Receipt OCR là công nghệ sử dụng các thuật toán tiên tiến và máy học để chuyển đổi biên lai đã quét hoặc chụp thành văn bản có thể chỉnh sửa và tìm kiếm được. Quy trình này cho phép người dùng tự động trích xuất thông tin cần thiết từ biên lai, chẳng hạn như ngày, tên người bán, mặt hàng đã mua, giá cả và thuế. Thư viện Receipt OCR là các gói phần mềm hoặc API cung cấp các công cụ và chức năng được xây dựng sẵn cho các nhà phát triển phần mềm và người dùng để tích hợp chức năng này vào ứng dụng hoặc quy trình làm việc của họ.
Receipt-OCR giúp tìm kiếm, lưu trữ và truy xuất dữ liệu biên lai dễ dàng hơn, giúp hồ sơ tài chính dễ truy cập hơn cho mục đích kiểm toán, phân tích và tuân thủ. Bằng cách giảm nhu cầu nhập dữ liệu thủ công, các doanh nghiệp có thể tiết kiệm chi phí lao động. Ngoài ra, rủi ro lỗi giảm có thể ngăn ngừa những sai lầm tốn kém trong hồ sơ tài chính. Các nhà bán lẻ có thể sử dụng OCR để trích xuất thông tin sản phẩm từ biên lai mua hàng, hỗ trợ theo dõi và quản lý hàng tồn kho. Khi công nghệ tiếp tục phát triển, thư viện Receipt-OCR sẽ đóng vai trò ngày càng quan trọng trong việc hiện đại hóa và đơn giản hóa việc quản lý dữ liệu tài chính.
Bắt đầu với Receipt-OCR
Cách được khuyến nghị để cài đặt Receipt-OCR là sử dụng NuGet. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.
Cài đặt Receipt-OCR qua NuGet
Install-Package Receipt-OCR
Cài đặt Receipt-OCR qua GitHub
git clone https://github.com/Asprise/receipt-ocr.git
Nhận dạng & Trích xuất Văn bản từ Biên lai qua C#
Thư viện Receipt-OCR nguồn mở giúp các nhà phát triển phần mềm dễ dàng tải và trích xuất văn bản từ Biên lai bên trong các ứng dụng C#. Đầu tiên, người dùng cần tải hình ảnh bằng cách cung cấp đường dẫn đầy đủ đến hình ảnh và sau đó thực hiện thao tác OCR trên hình ảnh. Sau khi hoàn tất thao tác OCR, các nhà phát triển phần mềm có thể In văn bản đã trích xuất hoặc sử dụng khi cần. Ví dụ sau đây cho thấy cách các nhà phát triển phần mềm có thể tải và Trích xuất văn bản từ Biên lai bằng các lệnh C#.
Làm thế nào để thực hiện thao tác OCR để trích xuất văn bản từ hình ảnh biên lai bằng C#?
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
string imagePath = "path_to_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Print the extracted text or use it as needed.
Console.WriteLine("Extracted Text from Receipt:");
Console.WriteLine(extractedText);
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}
OCR Text từ Hai Biên lai trên Một Hình ảnh qua .NET API
Thư viện Receipt-OCR nguồn mở cho phép các nhà phát triển phần mềm thực hiện thao tác OCR trên hai biên lai trong một hình ảnh bằng cách sử dụng C# .NET API. Để nhận dạng và trích xuất văn bản từ hai biên lai trên một hình ảnh bằng cách sử dụng thư viện OCR biên lai trong C#, các nhà phát triển phần mềm có thể làm theo các bước chung sau. Giả sử bạn có một hình ảnh chứa hai biên lai cạnh nhau. Trước tiên, bạn cần tải hình ảnh nhiều biên lai và thực hiện thao tác OCR trên hình ảnh đó. Sau đó, bạn có thể chia văn bản đã trích xuất thành các biên lai riêng biệt dựa trên dấu phân cách hoặc mẫu và In hoặc xử lý thêm từng biên lai đã trích xuất. Ví dụ sau đây minh họa cách các nhà phát triển phần mềm có thể thực hiện Trích xuất văn bản từ Hình ảnh nhiều biên lai bên trong các ứng dụng C#.
Mã C# để trích xuất văn bản từ hình ảnh nhiều biên lai bằng API C#
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
string imagePath = "path_to_multi_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the multi-receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Split the extracted text into separate receipts based on a delimiter or pattern.
string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);
// Print or process each extracted receipt.
for (int i = 0; i < receipts.Length; i++)
{
Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
Console.WriteLine(receipts[i]);
}
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}