Бесплатный C# .NET API для распознавания данных в квитанциях
API оптического распознавания символов (OCR) C# с открытым исходным кодом, который мгновенно обнаруживает, извлекает и распознает весь текст и данные в квитанциях с помощью OCR.
В эпоху цифровых технологий как предприятия, так и частные лица завалены огромными объемами данных, особенно когда речь идет о финансовых транзакциях. Квитанции, счета-фактуры и счета быстро накапливаются, что усложняет управление и извлечение ценной информации. К счастью, библиотеки Receipt-OCR (оптическое распознавание символов) стали мощными инструментами для оптимизации этого процесса. Библиотека автоматизирует процесс извлечения данных, устраняя необходимость ручного ввода. Это существенно экономит время и снижает риск человеческой ошибки. Библиотека предназначена для распознавания текста на нескольких языках, что делает ее подходящей для компаний, работающих на международном уровне.
Оптическое распознавание текста квитанций – это технология, которая использует передовые алгоритмы и машинное обучение для преобразования отсканированных или сфотографированных квитанций в редактируемый текст с возможностью поиска. Этот процесс позволяет пользователям автоматически извлекать важную информацию из квитанций, такую как дата, название продавца, приобретенные товары, цены и налоги. Библиотеки распознавания текста квитанций – это программные пакеты или API-интерфейсы, которые предоставляют разработчикам программного обеспечения и пользователям готовые инструменты и функции для интеграции этих функций в свои приложения или рабочие процессы.
Receipt-OCR упрощает поиск, хранение и получение данных о квитанциях, делая финансовые записи более доступными для аудита, анализа и обеспечения соответствия требованиям. Уменьшая необходимость ручного ввода данных, предприятия могут сэкономить деньги на трудозатратах. Кроме того, снижение риска ошибок может предотвратить дорогостоящие ошибки в финансовых отчетах. Розничные продавцы могут использовать OCR для извлечения информации о продуктах из квитанций о покупках, что помогает отслеживать запасы и управлять ими. По мере развития технологий библиотека Receipt-OCR будет играть все более важную роль в модернизации и упрощении управления финансовыми данными.
Начало работы с Receipt-OCR
Рекомендуемый способ установки Receipt-OCR — использование NuGet. Пожалуйста, используйте следующую команду для плавной установки.
Установить Receipt-OCR через NuGet
Install-Package Receipt-OCR
Установить Receipt-OCR через GitHub
git clone https://github.com/Asprise/receipt-ocr.git
Распознавание и извлечение текста из квитанций с помощью C#
Библиотека Receipt-OCR с открытым исходным кодом позволяет разработчикам программного обеспечения легко загружать и извлекать текст из квитанций внутри приложений C#. Сначала пользователям необходимо загрузить изображение, указав полный путь к нему, а затем выполнить операцию распознавания текста на изображении. После завершения операции оптического распознавания разработчики программного обеспечения могут распечатать извлеченный текст или использовать его по мере необходимости. В следующем примере показано, как разработчики программного обеспечения могут загружать и извлекать текст из квитанции с помощью команд C#.
Как выполнить операцию распознавания текста для извлечения текста из изображения квитанции с помощью C#?
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_receipt_image.jpg' with the actual path to your receipt image file.
string imagePath = "path_to_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Print the extracted text or use it as needed.
Console.WriteLine("Extracted Text from Receipt:");
Console.WriteLine(extractedText);
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}
Текст OCR из двух квитанций на одном изображении через .NET API
Библиотека Receipt-OCR с открытым исходным кодом позволяет разработчикам программного обеспечения выполнять операцию распознавания двух квитанций в одном изображении с помощью C# .NET API. Чтобы распознать и извлечь текст из двух квитанций на одном изображении с помощью библиотеки OCR квитанций на C#, разработчики программного обеспечения могут выполнить следующие общие шаги. Предположим, у вас есть изображение, содержащее две квитанции рядом. Сначала вам нужно загрузить изображение с несколькими квитанциями и выполнить над ним операцию распознавания. После этого вы можете разделить извлеченный текст на отдельные квитанции на основе разделителя или шаблона и распечатать или дополнительно обработать каждую извлеченную квитанцию. В следующем примере показано, как разработчики программного обеспечения могут выполнять извлечение текста из изображения с несколькими квитанциями внутри приложений C#.
Код C# для извлечения текста из изображения с несколькими квитанциями с использованием API C#
using System;
using Asprise.OCR;
class Program
{
static void Main(string[] args)
{
// Replace 'path_to_multi_receipt_image.jpg' with the actual path to your image containing two receipts.
string imagePath = "path_to_multi_receipt_image.jpg";
// Create an OCR engine instance from the Receipt-OCR library.
OCR ocr = new OCR();
try
{
// Load the multi-receipt image.
ocr.Image = imagePath;
// Perform OCR text extraction.
string extractedText = ocr.Recognize();
// Split the extracted text into separate receipts based on a delimiter or pattern.
string[] receipts = extractedText.Split(new string[] { "=== RECEIPT ===" }, StringSplitOptions.RemoveEmptyEntries);
// Print or process each extracted receipt.
for (int i = 0; i < receipts.Length; i++)
{
Console.WriteLine($"Extracted Text from Receipt {i + 1}:");
Console.WriteLine(receipts[i]);
}
}
catch (Exception ex)
{
Console.WriteLine("Error: " + ex.Message);
}
finally
{
// Clean up the OCR engine.
ocr.Dispose();
}
}
}