Aspose.OCR for .NET
Водещ .NET OCR API за операции за оптично разпознаване на символи
Топ .NET API за добавяне на функционалност за оптично разпознаване на знаци (OCR) в C# приложения. Позволява конвертиране на печатен или ръкописен текст в цифров формат.
Оптичното разпознаване на знаци (OCR) е много полезен процес за трансформиране на текстови изображения, както и на отпечатани документи в машинно четим текстов формат. Aspose.OCR за .NET е усъвършенствана OCR библиотека, която улеснява разработчиците на софтуер да конвертират отпечатани, както и ръкописни документи или текст в цифров формат, което улеснява търсенето, редактирането и споделянето им с други потребители. Библиотеката C# .NET включва мощен четец на изображения, който може да чете различни популярни файлови формати на изображения като JPEG, PNG, TIFF, GIF, BMP изображения, PDF документи, TIFF, DjVu и много други. Също така е възможно разработчиците на софтуер да съхраняват резултатите от разпознаването в най-популярния формат за обмен на документи и данни.
Aspose.OCR за .NET е една от водещите OCR библиотеки на пазара, която позволява на разработчиците на софтуер да добавят OCR функционалност към своите .NET приложения без никакви външни зависимости. Библиотеката използва усъвършенствани алгоритми за разпознаване на текст от сканирани документи, изображения, ръкописен текст, снимки на смартфони, екранни снимки, специфични области на изображения и други източници и след това го преобразува в редактируем текст с лекота. Поддържа повече от 26 езика, включително английски, китайски, корейски, испански, френски, немски, италиански, български, казахски, руски, японски и арабски.
Aspose.OCR за .NET е много стабилен и включва много полезна функция за разпознаване на баркод, позволяваща на разработчиците на софтуер да разпознават популярни формати на баркод, като QR кодове и UPC кодове. Библиотеката включва някои мощни филтри за предварителна обработка, които позволяват на програмистите да разпознават завъртяни, изкривени и шумни изображения само с няколко реда C# код. Освен това може лесно да се интегрира с други библиотеки на Aspose, като Aspose.PDF и Aspose.Words, което позволява на разработчиците да създават мощни работни процеси за обработка на документи. Също така е много лесно да разпознавате изображения, предоставени като уеб връзки, и да извършвате групово разпознаване на всички изображения в папка или архив.
Първи стъпки с Aspose.OCR за .NET
Препоръчителният начин за инсталиране на Aspose.OCR за .NET е използването на NuGet. Моля, използвайте следната команда за гладка инсталация.
Инсталирайте Aspose.Pdf чрез NuGet команда
Install-Package Aspose.OCR
Можете да изтеглите библиотеката директно от страницата на продукта Aspose.PDF
Откриване на определена област от изображение чрез C#
Aspose.OCR за .NET предоставя възможност за откриване на определена област в изображението в .NET приложения. Сканирано текстово изображение или снимка може да включва текстови параграфи, таблици, илюстрации, формули и др. Откриването, подреждането и класифицирането на интересни области на страница е крайъгълният камък на успешното и точно OCR. За постигане на задачата има няколко алгоритма за откриване на области на документи, които са част от библиотеката, помагайки на разработчиците на софтуер да открият определен тип съдържание. Следното показва как да заредите изображение и да откриете определена област за разпознаване на текст с помощта на C# команди.
Как да заредите изображение и да откриете конкретна област на изображението чрез C# API?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
Console.WriteLine(result.RecognitionText);
}
Обработка на изображения чрез .NET API
Aspose.OCR за .NET позволява на разработчиците на софтуер да извършват различни видове операции върху изображения в техните собствени .NET приложения. Библиотеката включва няколко напълно автоматизирани и ръчни филтъра за обработка на изображения, които помагат на потребителите да подобрят своите изображения, преди да извършат OCR операции, като корекция на изкривяване, завъртане, премахване на шума, корекция на контраста, преоразмеряване, бинаризация, преобразуване в скала на сивото, инверсия на цвета, разширяване , Медианен филтър и много други. Има много други опции и настройки, които можете да използвате, за да персонализирате процеса на OCR. За подобряване на качеството на разпознаване на изображения разработчиците могат да прилагат множество филтри за обработка. Разработчиците могат лесно да прилагат множество филтри към конкретни региони на изображение.
Прилагане на филтри върху изображения чрез C# .NET API
Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());
Сравнение на текст в изображения чрез .NET API
Aspose.OCR за .NET дава възможност на разработчиците на софтуер да сравняват текст на две изображения в техните собствени C# приложения. Библиотеката може да сравнява текстове на две изображения, независимо от шрифта, размера на текста, регистъра, стиловете и цветовете. Един от начините за сравняване на текст на изображения чрез извличане на текст от изображенията и след като сте извлекли текста от изображенията, можете да използвате всеки алгоритъм за сравнение на текст, за да ги сравните. Aspose.OCR за .NET предоставя лесен начин за сравняване на два низа с помощта на метода String.Equals. Следващият пример t демонстрира как да сравнявате текст в две изображения с помощта на C# код.
Как да сравняваме текст в две изображения с помощта на .NET API?
using System;
using Aspose.OCR;
using System.Drawing;
class Program
{
static void Main()
{
// Load the images
var image1 = Image.FromFile("image1.png");
var image2 = Image.FromFile("image2.png");
// Extract text from the images
var ocrEngine = new OcrEngine();
ocrEngine.Image = ImageStream.FromImage(image1);
ocrEngine.Process();
var text1 = ocrEngine.Text;
ocrEngine.Image = ImageStream.FromImage(image2);
ocrEngine.Process();
var text2 = ocrEngine.Text;
// Compare the extracted text
var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
Console.WriteLine("Are the texts equal? " + areEqual);
}
}
//Note that the above code only works for exact text matches.
Търсене на текст в изображение чрез C# API
Aspose.OCR за .NET улеснява разработчиците на софтуер да намират текст в изображение в техните собствени .NET приложения. Библиотеката предоставя поддръжка за търсене на текст в изображения толкова лесно, колкото намирането на текстов фрагмент в низ. Библиотеката поддържа търсене на низ, чувствителен към малки или малки букви, и дори проверява текст на изображение спрямо шаблон. Разработчиците на софтуер могат да използват метода ImageHasText за търсене на текст в изображение само с няколко реда C# код. Следващият пример показва как да заредите изображение и да търсите определен текст в него.
Как да намерите текст в изображение чрез .NET?
Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}