Aspose.OCR for Java
API Java OCR hàng đầu để thêm các hoạt động nhận dạng ký tự quang học
API Java hàng đầu cho phép xây dựng ứng dụng có khả năng Nhận dạng ký tự quang học (OCR). Đọc, nhận dạng văn bản từ tài liệu được quét, hình ảnh và các tệp khác thông qua Thư viện Java.
Aspose.OCR for Java là công cụ OCR (Nhận dạng ký tự quang học) hàng đầu cung cấp cho các nhà phát triển phần mềm khả năng tích hợp chức năng nhận dạng văn bản vào các ứng dụng Java của họ. Công cụ này được thiết kế để xử lý rất đơn giản và cho phép các nhà phát triển phần mềm nhận dạng văn bản từ các tài liệu được quét, hình ảnh và các nguồn khác, đồng thời có thể được sử dụng để trích xuất văn bản từ nhiều định dạng tệp khác nhau, bao gồm JPEG, PNG, BMP, TIFF, HTML, PDF và nhiều định dạng khác.
Aspose.OCR for Java sử dụng các thuật toán OCR tiên tiến để nhận dạng chính xác văn bản từ hình ảnh, ngay cả trong các bản quét hoặc ảnh chụp chất lượng thấp. Công cụ này hỗ trợ hơn 50 ngôn ngữ khác nhau, bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Pháp, tiếng Đức, tiếng Trung Quốc và nhiều ngôn ngữ khác. Thư viện có một số tính năng quan trọng như Nhận dạng văn bản viết tay, trích xuất văn bản từ ảnh chụp màn hình, trích xuất văn bản từ các vùng cụ thể của hình ảnh, tạo tệp PDF có thể tìm kiếm, hỗ trợ ảnh trên điện thoại thông minh, hỗ trợ loại bỏ nhiễu, hỗ trợ nhị phân hóa hình ảnh, Tăng khả năng truy cập và nhiều tính năng khác nữa.
Aspose.OCR for Java sử dụng các thuật toán OCR tiên tiến có thể nhận dạng chính xác văn bản từ hình ảnh, ngay cả trong các bản quét hoặc ảnh chụp chất lượng thấp. Thư viện có thể tăng cường khả năng truy cập cho người dùng bằng cách chuyển đổi các tài liệu được quét thành các tài liệu kỹ thuật số có thể tìm kiếm một cách dễ dàng. Với các thuật toán OCR tiên tiến, hỗ trợ nhiều ngôn ngữ và tích hợp dễ dàng, Aspose.OCR for Java đang nhanh chóng trở thành phần mềm OCR dành cho các nhà phát triển muốn thêm chức năng OCR vào các ứng dụng Java của họ.
Bắt đầu với Aspose.OCR cho Java
Cách được khuyến nghị để cài đặt Aspose.OCR cho Java là sử dụng Maven Repository. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.
Cài đặt Aspose.OCR cho Java thông qua Maven Repository
<repositories>
<repository>
<Id>AsposeJavaAPI</Id>
<name>Aspose Java API;/name>
<url>http://repository.aspose.com/repo/</url>
</repository>
</repositories>
Bạn có thể tải xuống thư viện trực tiếp từ trang sản phẩm Aspose.OCR
Trích xuất văn bản từ hình ảnh thông qua API Python
Aspose.OCR for Java đã bao gồm các tính năng rất hữu ích cho phép các nhà phát triển phần mềm trích xuất văn bản từ nhiều loại hình ảnh khác nhau bên trong các ứng dụng Python. Thư viện đã bao gồm hỗ trợ đọc văn bản từ hình ảnh raster như JPEG, PNG, WBMP, BMP, GIF và nhiều tính năng khác. Có những tính năng hữu ích khác trong thư viện để xử lý trích xuất văn bản như đọc văn bản từ hình ảnh TIFF nhiều trang, trích xuất văn bản từ mảng pixel, Đọc hình ảnh ở chế độ nhận dạng nhanh nhất, nhận dạng dòng đơn, trích xuất văn bản từ biên lai và nhiều tính năng khác. Ví dụ sau đây cho thấy cách trích xuất văn bản từ hình ảnh bằng lệnh Java.
Làm thế nào để trích xuất văn bản từ hình ảnh bằng Java API?
AsposeOCR api = new AsposeOCR();
// Customize recognition
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setLanguage(Language.Ukr);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
// Show non-critical recognition problems
result.warnings.forEach((w) -> {
System.out.println(w);
});
// Get recognition results as JSON
String resultJson = result.GetJson();
Đọc các vùng cụ thể của hình ảnh thông qua Java API
Aspose.OCR for Java là một thư viện OCR hữu ích cho phép các nhà phát triển phần mềm tìm và chỉ đọc các vùng cụ thể của hình ảnh, không phải toàn bộ văn bản bằng cách sử dụng một vài dòng mã Java. Đây là một tính năng rất hữu ích và có thể rất hữu ích trong quá trình xử lý hàng loạt các tài liệu thống nhất như thị thực, giấy phép lái xe, thẻ căn cước, v.v. Nó hỗ trợ các tính năng như trích xuất văn bản bên trong hình chữ nhật hình ảnh, trích xuất các dòng có tọa độ, tự động tìm kiếm các hộp giới hạn từ và dòng, v.v. Ví dụ sau đây cho thấy cách trích xuất văn bản bên trong hình chữ nhật bằng cách sử dụng mã Java.
Làm thế nào để trích xuất văn bản bên trong hình chữ nhật thông qua Java API?
AsposeOCR api = new AsposeOCR();
// Define image regions
ArrayList regions = new ArrayList();
regions.add(new Rectangle(231,101,430,42));
regions.add(new Rectangle(546,224,123,26));
// Specify recognition settings
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAutoDenoising(true);
recognitionSettings.setRecognitionAreas(regions);
// Extract text from selected regions
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Name: " + result.recognitionAreasText.get(0));
System.out.println("Expiry: " + result.recognitionAreasText.get(1));
Chọn các vùng cụ thể của tài liệu thông qua Java API
Một hình ảnh tài liệu có thể chứa nhiều khối nội dung khác nhau như đoạn văn bản, bản vẽ, sơ đồ, công thức, bảng, bản đồ, v.v. Aspose.OCR for Java cho phép các nhà phát triển phần mềm dễ dàng chọn và phát hiện các vùng quan tâm cụ thể trên một trang và thực hiện thao tác OCR trên đó. Thư viện hỗ trợ phát hiện vùng tự động cũng như bạn có thể ghi đè bằng cách chọn thủ công các vùng quan tâm. Ví dụ sau đây minh họa cách các nhà phát triển phần mềm có thể bật phát hiện vùng tài liệu tự động bên trong các ứng dụng Java của họ.
Phát hiện vùng tài liệu tự động thông qua Java API
// Create instance of OCR API
AsposeOCR api = new AsposeOCR();
// Enable automatic document areas detection
RecognitionSettings recognitionSettings = new RecognitionSettings();
recognitionSettings.setAllowedCharacters(CharactersAllowedType.LATIN_ALPHABET);
recognitionSettings.setDetectAreas(true);
// Extract text from image
RecognitionResult result = api.RecognizePage("source.png", recognitionSettings);
System.out.println("Recognition result:\n" + result.recognitionText + "\n\n");