1. Các sản phẩm
  2.   OCR
  3.   .NET
  4.   Aspose.OCR for .NET

Aspose.OCR for .NET

 
 

API OCR .NET hàng đầu cho hoạt động nhận dạng ký tự quang học

Top .NET API để thêm chức năng Nhận dạng ký tự quang học (OCR) vào các ứng dụng C#. Nó cho phép chuyển đổi văn bản in hoặc viết tay sang định dạng kỹ thuật số.

Nhận dạng ký tự quang học (OCR) là một quy trình rất hữu ích để chuyển đổi hình ảnh văn bản cũng như tài liệu in thành định dạng văn bản có thể đọc bằng máy. Aspose.OCR cho .NET là một thư viện OCR tiên tiến giúp các nhà phát triển phần mềm dễ dàng chuyển đổi tài liệu in cũng như viết tay hoặc văn bản thành định dạng kỹ thuật số, giúp tìm kiếm, chỉnh sửa và chia sẻ dễ dàng hơn với những người dùng khác. Thư viện C# .NET đã bao gồm một trình đọc hình ảnh mạnh mẽ có thể đọc nhiều định dạng tệp hình ảnh phổ biến như JPEG, PNG, TIFF, GIF, hình ảnh BMP, tài liệu PDF, TIFF, DjVu và nhiều định dạng khác. Các nhà phát triển phần mềm cũng có thể lưu trữ kết quả nhận dạng ở định dạng trao đổi dữ liệu và tài liệu phổ biến nhất.

Aspose.OCR cho .NET là một trong những thư viện OCR hàng đầu trên thị trường cho phép các nhà phát triển phần mềm thêm chức năng OCR vào các ứng dụng .NET của họ mà không cần bất kỳ sự phụ thuộc bên ngoài nào. Thư viện sử dụng các thuật toán tiên tiến để nhận dạng văn bản từ các tài liệu được quét, hình ảnh, văn bản viết tay, ảnh chụp màn hình điện thoại thông minh, ảnh chụp màn hình, các vùng cụ thể của hình ảnh và các nguồn khác, sau đó chuyển đổi thành văn bản có thể chỉnh sửa một cách dễ dàng. Thư viện hỗ trợ hơn 26 ngôn ngữ, bao gồm tiếng Anh, tiếng Trung, tiếng Hàn, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Bulgaria, tiếng Kazakh, tiếng Nga, tiếng Nhật và tiếng Ả Rập.

Aspose.OCR cho .NET rất ổn định và bao gồm một tính năng rất hữu ích để nhận dạng mã vạch cho phép các nhà phát triển phần mềm nhận dạng các định dạng mã vạch phổ biến, chẳng hạn như mã QR và mã UPC. Thư viện đã bao gồm một số bộ lọc xử lý trước mạnh mẽ cho phép các lập trình viên nhận dạng hình ảnh bị xoay, lệch và nhiễu chỉ bằng một vài dòng mã C#. Hơn nữa, nó có thể dễ dàng tích hợp với các thư viện Aspose khác, chẳng hạn như Aspose.PDF và Aspose.Words, cho phép các nhà phát triển tạo ra các quy trình xử lý tài liệu mạnh mẽ. Nó cũng rất dễ nhận dạng hình ảnh được cung cấp dưới dạng liên kết web và thực hiện nhận dạng hàng loạt tất cả hình ảnh trong một thư mục hoặc kho lưu trữ.

Previous Next

Bắt đầu với Aspose.OCR cho .NET

Cách được khuyến nghị để cài đặt Aspose.OCR cho .NET là sử dụng NuGet. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.

Cài đặt Aspose.Pdf thông qua lệnh NuGet

 Install-Package Aspose.OCR

Bạn có thể tải xuống thư viện trực tiếp từ trang sản phẩm Aspose.PDF

Phát hiện khu vực cụ thể của hình ảnh thông qua C#

Aspose.OCR cho .NET đã cung cấp khả năng phát hiện một khu vực cụ thể trong hình ảnh bên trong các ứng dụng .NET. Một hình ảnh văn bản được quét hoặc ảnh chụp có thể bao gồm các đoạn văn bản, bảng, hình minh họa, công thức, v.v. Phát hiện, sắp xếp và phân loại các khu vực quan tâm trên một trang là nền tảng của OCR thành công và chính xác. Để hoàn thành nhiệm vụ, có một số thuật toán phát hiện khu vực tài liệu là một phần của thư viện giúp các nhà phát triển phần mềm phát hiện một loại nội dung cụ thể. Sau đây là cách tải hình ảnh và phát hiện một khu vực cụ thể để nhận dạng văn bản bằng các lệnh C#.

Làm thế nào để tải hình ảnh và phát hiện một vùng hình ảnh cụ thể thông qua API C#?

Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
// Add an image to OcrInput object
Aspose.OCR.OcrInput input = new Aspose.OCR.OcrInput(Aspose.OCR.InputType.SingleImage);
input.Add("source.png");
// Set document areas detection mode
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.DetectAreasMode = Aspose.OCR.DetectAreasMode.DOCUMENT;
// Recognize image
List results = recognitionEngine.Recognize(input, recognitionSettings);
foreach(Aspose.OCR.RecognitionResult result in results)
{
	Console.WriteLine(result.RecognitionText);
}

Xử lý hình ảnh qua API .NET

Aspose.OCR cho .NET cho phép các nhà phát triển phần mềm thực hiện các loại thao tác khác nhau trên hình ảnh bên trong ứng dụng .NET của riêng họ. Thư viện đã bao gồm một số bộ lọc xử lý hình ảnh hoàn toàn tự động và thủ công giúp người dùng cải thiện hình ảnh của họ trước khi thực hiện các thao tác OCR, chẳng hạn như Hiệu chỉnh độ lệch, Xoay, Loại bỏ nhiễu, Hiệu chỉnh độ tương phản, Thay đổi kích thước, Nhị phân hóa, Chuyển đổi sang thang độ xám, Đảo ngược màu, Giãn nở, Bộ lọc trung vị và nhiều hơn nữa. Có nhiều tùy chọn và cài đặt khác mà bạn có thể sử dụng để tùy chỉnh quy trình OCR. Để cải thiện chất lượng nhận dạng hình ảnh, các nhà phát triển có thể áp dụng nhiều bộ lọc xử lý. Các nhà phát triển có thể dễ dàng áp dụng nhiều bộ lọc cho các vùng cụ thể của hình ảnh.

Áp dụng Bộ lọc trên Hình ảnh bằng C# .NET API

Aspose.Drawing.Rectangle blackRectangle = new Aspose.Drawing.Rectangle(5, 161, 340, 113);
Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter filters = new Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter();
// (1) Invert black region
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.Invert(blackRectangle));
// (2) Denoise entire image
filters.Add(Aspose.OCR.Models.PreprocessingFilters.PreprocessingFilter.AutoDenoising());

So sánh văn bản trong hình ảnh qua API .NET

Aspose.OCR cho .NET cung cấp cho các nhà phát triển phần mềm khả năng so sánh văn bản trên hai hình ảnh bên trong các ứng dụng C# của riêng họ. Thư viện có thể so sánh văn bản trên hai hình ảnh, bất kể phông chữ, kích thước văn bản, trường hợp, kiểu và màu sắc. Một cách để so sánh hình ảnh văn bản bằng cách trích xuất văn bản từ hình ảnh và sau khi bạn đã trích xuất văn bản từ hình ảnh, bạn có thể sử dụng bất kỳ thuật toán so sánh văn bản nào để so sánh chúng. Aspose.OCR cho .NET cung cấp một cách đơn giản để so sánh hai chuỗi bằng phương pháp String.Equals. Ví dụ sau đây minh họa cách so sánh văn bản trong hai hình ảnh bằng mã C#.

Làm thế nào để so sánh văn bản trong hai hình ảnh bằng .NET API?

 
using System;
using Aspose.OCR;
using System.Drawing;
 
class Program
{
    static void Main()
    {
        // Load the images
        var image1 = Image.FromFile("image1.png");
        var image2 = Image.FromFile("image2.png");
 
        // Extract text from the images
        var ocrEngine = new OcrEngine();
        ocrEngine.Image = ImageStream.FromImage(image1);
        ocrEngine.Process();
        var text1 = ocrEngine.Text;
 
        ocrEngine.Image = ImageStream.FromImage(image2);
        ocrEngine.Process();
        var text2 = ocrEngine.Text;
 
        // Compare the extracted text
        var areEqual = string.Equals(text1, text2, StringComparison.OrdinalIgnoreCase);
        Console.WriteLine("Are the texts equal? " + areEqual);
    }
}
//Note that the above code only works for exact text matches. 

Tìm kiếm văn bản trong hình ảnh bằng API C#

Aspose.OCR cho .NET giúp các nhà phát triển phần mềm dễ dàng tìm thấy văn bản trong hình ảnh bên trong các ứng dụng .NET của riêng họ. Thư viện đã cung cấp hỗ trợ tìm kiếm văn bản trong hình ảnh dễ dàng như tìm đoạn văn bản trong chuỗi. Thư viện hỗ trợ tìm kiếm chuỗi phân biệt chữ hoa chữ thường hoặc không phân biệt chữ hoa chữ thường và thậm chí xác thực văn bản hình ảnh theo mẫu. Các nhà phát triển phần mềm có thể sử dụng phương thức ImageHasText để tìm kiếm văn bản bên trong hình ảnh chỉ bằng một vài dòng mã C#. Ví dụ sau đây cho thấy cách tải hình ảnh và tìm kiếm một văn bản cụ thể bên trong hình ảnh đó.

Làm thế nào để tìm văn bản trong hình ảnh thông qua .NET?

Aspose.OCR.AsposeOcr recognitionEngine = new Aspose.OCR.AsposeOcr();
Aspose.OCR.RecognitionSettings recognitionSettings = new Aspose.OCR.RecognitionSettings();
recognitionSettings.Language = Aspose.OCR.Language.Ukr;
if(recognitionEngine.ImageHasText("source.png", "Aspose", recognitionSettings))
{
	Console.WriteLine(@"The image contains the word ""Aspose""");
}
else
{
	Console.WriteLine(@"The image doesn't contain the word ""Aspose""");
}

 Tiếng Việt