Aspose.OCR for Python via .NET

Đọc & Trích xuất Văn bản từ Hình ảnh qua API Python

API OCR Python mạnh mẽ hàng đầu cho phép các nhà phát triển Đọc và Trích xuất Văn bản từ Hình ảnh, Ảnh, Ảnh chụp màn hình, Tài liệu quét và Tệp PDF.

Trong thời đại kỹ thuật số ngày nay, việc chuyển đổi hình ảnh thành các định dạng văn bản có thể chỉnh sửa đã trở thành một nhiệm vụ quan trọng đối với nhiều doanh nghiệp và nhà phát triển. Aspose.OCR cho Python qua .NET cung cấp một giải pháp vững chắc cho Nhận dạng ký tự quang học (OCR) cho phép các nhà phát triển phần mềm trích xuất văn bản từ hình ảnh một cách dễ dàng. Aspose.OCR cho Python qua .NET là một thư viện mạnh mẽ được thiết kế cho các tác vụ OCR. Nó là một phần của bộ sản phẩm Aspose, nổi tiếng với việc cung cấp các công cụ xử lý tài liệu chất lượng cao. Thư viện này cho phép các nhà phát triển tận dụng khả năng của nền tảng .NET trong khi lập trình bằng Python, do đó cho phép các ứng dụng đa nền tảng thực hiện các thao tác OCR một cách liền mạch. Nó hỗ trợ nhận dạng văn bản bằng hơn 100 ngôn ngữ, bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Ý, tiếng Trung, tiếng Nhật và nhiều ngôn ngữ khác.

Aspose.OCR cho Python qua .NET là một thư viện OCR dựa trên .NET cho phép các nhà phát triển nhận dạng và trích xuất văn bản từ nhiều định dạng hình ảnh, bao gồm JPEG, PNG, GIF, BMP và TIFF. API sử dụng các thuật toán tiên tiến để đảm bảo độ chính xác cao trong việc nhận dạng văn bản từ các định dạng hình ảnh khác nhau. Nó hỗ trợ nhận dạng văn bản trong các phông chữ và kiểu chữ khác nhau. Để nâng cao độ chính xác nhận dạng, Aspose.OCR cung cấp các khả năng tiền xử lý như nhị phân hoá, chỉnh nghiêng và loại bỏ nhiễu. Điều này giúp chuẩn bị hình ảnh để đạt kết quả OCR tốt hơn. Nó có thể xử lý nhiều hình ảnh trong một quy trình duy nhất, cho phép xử lý hàng loạt và tiết kiệm thời gian trong các trường hợp cần xử lý khối lượng lớn hình ảnh. Với các tính năng nâng cao, bao gồm hỗ trợ đa ngôn ngữ, tiền xử lý hình ảnh, phân tích bố cục và xử lý lỗi, Aspose.OCR là lựa chọn lý tưởng cho các nhà phát triển phần mềm muốn thực hiện các dự án dựa trên OCR.

Tổng quan

Một cái nhìn tổng quan về các tính năng của Aspose.OCR cho Python qua .NET.

Đánh giá Tính năng

Thực hiện OCR
Thêm khả năng OCR
Nhận dạng Văn bản Hình ảnh
Chuyển đổi hình ảnh chứa văn bản
Văn bản Phông chữ đã nhận dạng
Tìm kiếm PDF
27 Ngôn ngữ Nhận dạng
Tạo ứng dụng OCR
Lưu vào trình duyệt
Trích xuất Văn bản
Hỗ trợ đa luồng

Đánh giá Tính năng

Nhận dạng Hình ảnh xoay
Bộ lọc tiền xử lý
PDF sang Hình ảnh
Nhận dạng ký tự Trung Quốc
Phát hiện các phông chữ phổ biến
Xử lý toàn bộ hình ảnh
Hỗ trợ hình ảnh xoay
Nhận dạng hàng loạt
Trình kiểm tra chính tả tích hợp
Tách PDF
PDF sang Excel
PDF sang SVG

Aspose.OCR cho Python qua .NET

API chủ yếu hỗ trợ định dạng PDF nhưng có thể xuất tài liệu PDF sang một số định dạng khác.

Trình đọc

PDF, PDF/A, TEX, XPS, SVG

Trình ghi

PDF, TXT, PNG, JPEG , PDF/A, DOC, DOCX, TEX, XPS, SVG, XLSX, PPTX

Aspose.OCR cho Python qua .NET

Độc lập nền tảng

Aspose.OCR cho Python qua .NET có thể làm việc với bất kỳ ngôn ngữ lập trình dựa trên Python nào.

Python 3.6 trở lên.

Aspose.OCR cho Python qua .NET

Bắt đầu với Aspose.OCR cho Python qua .NET

Cách khuyến nghị để cài đặt Aspose.OCR cho Python qua .NET là sử dụng pip. Vui lòng dùng lệnh sau để cài đặt suôn sẻ.

Cài đặt Aspose.OCR cho Python qua .NET bằng pip

 pip install aspose-ocr-python-net

Bạn có thể tải SDK trực tiếp từ Aspose.OCR Python Cloud SDK trang sản phẩm

Các thao tác OCR với độ chính xác cao qua Python

Aspose.OCR cho Python qua .NET được thiết kế để đạt độ chính xác và độ tinh tế cao. Thư viện tích hợp các mô hình học máy tiên tiến giúp cải thiện độ chính xác trong việc trích xuất văn bản, ngay cả khi hình ảnh bị nghiêng hoặc có độ phân giải thấp. Tính năng này làm cho nó phù hợp với các ứng dụng yêu cầu nhận dạng văn bản đáng tin cậy, chẳng hạn như trích xuất dữ liệu tự động từ các mẫu hoặc tài liệu đã quét. Đoạn mã dưới đây minh họa một triển khai đơn giản, trong đó một hình ảnh được tải, xử lý và văn bản đã nhận dạng được hiển thị.

Cách tải Hình ảnh, Thực hiện OCR và Trích xuất Văn bản qua API Python?

# Initialize OCR engine
recognitionEngine = AsposeOcr()

# Add image to batch
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample.png")

# Extract text from image
result = recognitionEngine.recognize(input)
# Display the recognition result
print(result[0].recognition_text)

Khả năng Tiền xử lý Hình ảnh

Aspose.OCR cho Python qua .NET cung cấp các tính năng tiền xử lý hình ảnh mạnh mẽ trong các ứng dụng Python. Các tính năng này nâng cao độ chính xác của OCR, chẳng hạn như chỉnh sửa nghiêng, loại bỏ nhiễu và chuẩn hoá hình ảnh. Những bước tiền xử lý này rất quan trọng khi làm việc với các hình ảnh có thể đã được quét trong điều kiện không tối ưu. Ví dụ dưới đây cho thấy cách các nhà phát triển thực hiện thao tác chỉnh sửa nghiêng, đảm bảo văn bản được phát hiện một cách chính xác ngay cả khi hình ảnh hơi nghiêng hoặc không được căn chỉnh hoàn hảo.

Cách thực hiện thao tác OCR với chỉnh sửa nghiêng trong ứng dụng Python?

from aspose.ocr import OcrEngine, SkewCorrection

ocr_engine = OcrEngine()

# Enable skew correction
ocr_engine.set_skew_correction(SkewCorrection.True)

ocr_engine.image = "skewed_image.png"
recognized_text = ocr_engine.get_text()
print("Corrected and Recognized Text:", recognized_text)

Nhận dạng Văn bản viết tay qua Python

Aspose.OCR cho Python qua .NET rất dễ sử dụng và có thể nhận dạng cả văn bản in và viết tay chỉ với vài dòng mã Python. Tính năng này rất hữu ích cho các ứng dụng như số hoá ghi chú viết tay hoặc chữ ký. Khả năng của phần mềm trong việc diễn giải các kiểu chữ khác nhau tăng cường tính hữu dụng trong các lĩnh vực như giáo dục và tài liệu pháp lý. Dưới đây là một ví dụ cho thấy cách thực hiện Nhận dạng Văn bản viết tay bằng mã Python.

Cách thực hiện Nhận dạng Văn bản viết tay qua Thư viện Python?

api = ocr.AsposeOcr()

''' add filters if you need '''
filters = ocr.models.preprocessingfilters.PreprocessingFilter()
#filters.add(ocr.models.preprocessingfilters.PreprocessingFilter.contrast_correction_filter())

''' initialize image collection and put images into it '''
input = ocr.OcrInput(ocr.InputType.SINGLE_IMAGE, filters)
input.add("Data\\OCR\\handwritten.jpg")

''' change recognition options if you need '''
settings = ocr.RecognitionSettings()
settings.detect_areas_mode=ocr.DetectAreasMode.PHOTO

''' run recognition '''
res = api.recognize_handwritten_text(input)
print(res[0].recognition_text)

Khu vực Hình ảnh Tùy chỉnh OCR trong Ứng dụng Python

Aspose.OCR cho Python qua .NET đã cung cấp hỗ trợ đầy đủ cho việc nhận dạng văn bản từ một khu vực cụ thể của hình ảnh trong các ứng dụng Python. Các nhà phát triển phần mềm có thể chỉ định các khu vực cụ thể trong hình ảnh để thực hiện OCR, điều này hữu ích trong các trường hợp chỉ một phần của hình ảnh chứa văn bản liên quan. Các nhà phát triển có thể định nghĩa các khu vực tùy chỉnh cho OCR trên một hình ảnh, đặt chế độ nhận dạng và điều chỉnh các tham số khác để tối ưu quá trình OCR dựa trên yêu cầu cụ thể của ứng dụng. Dưới đây là một ví dụ cho thấy cách các nhà phát triển phần mềm có thể nhận dạng một dòng văn bản đơn chỉ với vài dòng mã Python.

Cách Nhận dạng một Dòng Văn bản Đơn trên Hình ảnh qua Ứng dụng Python?

api = AsposeOcr()

# Create OcrInput and add images
input = OcrInput(InputType.SINGLE_IMAGE)
input.add("sample_line.png")

# recognize without regions detection
settings = RecognitionSettings()
settings.recognize_single_line = True

result = api.recognize(input, settings)

print(result[0].recognition_text)