Aspose.OCR for .NET
Ведущий API .NET OCR для операций оптического распознавания символов
Лучшие API .NET для добавления функций оптического распознавания символов (OCR) в приложения C#. Он позволяет конвертировать печатный или рукописный текст в цифровой формат.
Оптическое распознавание символов (OCR) — очень полезный процесс преобразования текстовых изображений, а также печатных документов в машиночитаемый текстовый формат. Aspose.OCR для .NET — это расширенная библиотека оптического распознавания символов, которая позволяет разработчикам программного обеспечения легко преобразовывать печатные, а также рукописные документы или текст в цифровой формат, упрощая их поиск, редактирование и обмен ими с другими пользователями. Библиотека C# .NET включает в себя мощную программу чтения изображений, которая может читать различные популярные форматы файлов изображений, такие как JPEG, PNG, TIFF, GIF, изображения BMP, документы PDF, TIFF, DjVu и многие другие. Разработчики программного обеспечения также могут сохранять результаты распознавания в наиболее популярном формате обмена документами и данными.
Aspose.OCR для .NET — одна из ведущих библиотек оптического распознавания символов на рынке, которая позволяет разработчикам программного обеспечения добавлять функции оптического распознавания символов в свои .NET-приложения без каких-либо внешних зависимостей. Библиотека использует передовые алгоритмы для распознавания текста из отсканированных документов, изображений, рукописного текста, фотографий со смартфона, снимков экрана, определенных областей изображений и других источников, а затем с легкостью преобразует его в редактируемый текст. Он поддерживает более 26 языков, включая английский, китайский, корейский, испанский, французский, немецкий, итальянский, болгарский, казахский, русский, японский и арабский.
Aspose.OCR для .NET очень стабилен и включает очень полезную функцию распознавания штрих-кодов, позволяющую разработчикам программного обеспечения распознавать популярные форматы штрих-кодов, такие как QR-коды и коды UPC. Библиотека включает в себя несколько мощных фильтров предварительной обработки, которые позволяют программистам распознавать повернутые, перекошенные и зашумленные изображения с помощью всего лишь пары строк кода C#. Более того, его можно легко интегрировать с другими библиотеками Aspose, такими как Aspose.PDF и Aspose.Words, что позволяет разработчикам создавать мощные рабочие процессы обработки документов. Также очень легко распознавать изображения, представленные в виде веб-ссылок, и выполнять пакетное распознавание всех изображений в папке или архиве.
Начало работы с Aspose.OCR для .NET
Рекомендуемый способ установки Aspose.OCR для .NET — использование NuGet. Пожалуйста, используйте следующую команду для плавной установки.
Установите Aspose.Pdf с помощью команды NuGet
s Install-Package Aspose.OCR
Вы можете загрузить библиотеку непосредственно со страницы продукта Aspose.PDF
Обнаружение определенной области изображения с помощью C#
Aspose.OCR для .NET предоставил возможность обнаруживать определенную область изображения внутри приложений .NET. Отсканированное текстовое изображение или фотография могут включать в себя текстовые абзацы, таблицы, иллюстрации, формулы и многое другое. Обнаружение, упорядочивание и классификация интересующих областей на странице — краеугольный камень успешного и точного распознавания текста. Для решения этой задачи в библиотеке имеется несколько алгоритмов обнаружения областей документов, помогающих разработчикам программного обеспечения обнаруживать определенный тип контента. Ниже показано, как загрузить изображение и определить определенную область для распознавания текста с помощью команд C#.
Как загрузить изображение и определить определенную область изображения через C# API?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Обработка изображений через .NET API
Aspose.OCR для .NET позволяет разработчикам программного обеспечения выполнять различные типы операций с изображениями внутри своих собственных .NET-приложений. Библиотека включает в себя несколько полностью автоматизированных и ручных фильтров обработки изображений, которые помогают пользователям улучшать свои изображения перед выполнением операций оптического распознавания символов, таких как коррекция перекоса, вращение, удаление шума, коррекция контраста, изменение размера, бинаризация, преобразование в оттенки серого, инверсия цвета, расширение. , Медианный фильтр и многое другое. Существует множество других опций и настроек, которые вы можете использовать для настройки процесса оптического распознавания символов. Для улучшения качества распознавания изображений разработчики могут применять несколько фильтров обработки. Разработчики могут легко применять многочисленные фильтры к определенным областям изображения.
Применение фильтров к изображениям с помощью C# .NET API
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Сравнение текста в изображениях через .NET API
Aspose.OCR для .NET дает разработчикам программного обеспечения возможность сравнивать текст на двух изображениях внутри своих собственных приложений C#. Библиотека может сравнивать тексты на двух изображениях независимо от шрифта, размера текста, регистра, стилей и цветов. Один из способов сравнения текста изображений путем извлечения текста из изображений, и после извлечения текста из изображений вы можете использовать любой алгоритм сравнения текста для их сравнения. Aspose.OCR для .NET предоставляет простой способ сравнения двух строк с помощью метода String.Equals. В следующем примере показано, как сравнить текст в двух изображениях с помощью кода C#.
Как сравнить текст в двух изображениях с помощью .NET API?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Поиск текста в изображении с помощью C# API
Aspose.OCR для .NET позволяет разработчикам программного обеспечения легко находить текст на изображении внутри своих собственных .NET-приложений. Библиотека обеспечила поддержку поиска текста в изображениях, столь же простого, как поиск фрагмента текста в строке. Библиотека поддерживает поиск строк с учетом или без учета регистра и даже проверяет текст изображения на соответствие шаблону. Разработчики программного обеспечения могут использовать метод ImageHasText для поиска текста внутри изображения с помощью всего лишь пары строк кода C#. В следующем примере показано, как загрузить изображение и выполнить поиск по определенному тексту внутри него.
Как найти текст в изображении с помощью .NET?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}