1. Các sản phẩm
  2.   OCR
  3.   Java
  4.   Asprise OCR SDK for Java
 
  

Thư viện Java nguồn mở để xử lý văn bản và hình ảnh OCR

Thư viện Java miễn phí hàng đầu cho phép các nhà phát triển phần mềm thêm khả năng OCR vào ứng dụng Java và thực hiện OCR trên hình ảnh được quét và tệp PDF để trích xuất văn bản từ chúng một cách dễ dàng.

Asprise OCR SDK cho Java là một Java SDK mã nguồn mở mạnh mẽ cung cấp khả năng thực hiện nhận dạng ký tự quang học (OCR) trên hình ảnh được quét, tệp PDF và các tài liệu khác. Với Java API dễ sử dụng, SDK này có thể giúp các nhà phát triển thêm khả năng OCR vào các ứng dụng Java của họ một cách nhanh chóng và dễ dàng. OCR là một công nghệ rất hữu ích cho phép máy tính nhận dạng văn bản trong hình ảnh hoặc tài liệu. Phần mềm OCR có thể được sử dụng để chuyển đổi hình ảnh được quét của văn bản thành văn bản kỹ thuật số có thể được chỉnh sửa, tìm kiếm hoặc xử lý bằng máy tính.

Asprise OCR SDK đã bao gồm một số tính năng quan trọng để xử lý các hoạt động liên quan đến OCR, chẳng hạn như xử lý OCR nhanh, hỗ trợ nhiều ngôn ngữ, tiện ích nâng cao hình ảnh, văn bản được nhận dạng ở nhiều định dạng khác nhau và nhiều tính năng khác nữa. SDK dựa trên công nghệ OCR tiên tiến có thể nhận dạng văn bản ở nhiều phông chữ và ngôn ngữ khác nhau. Thư viện có thể được sử dụng để phát triển các ứng dụng cho Java applet, ứng dụng web, thành phần Swing/JavaFX và ứng dụng doanh nghiệp JEE.

SDK Asprise OCR cho phép các nhà phát triển phần mềm xuất văn bản được nhận dạng ở nhiều định dạng khác nhau, bao gồm văn bản thuần túy, PDF có thể tìm kiếm và Microsoft Word. SDK có thể nhận dạng văn bản ở hơn 100 ngôn ngữ, bao gồm tiếng Anh, tiếng Trung, tiếng Nhật, tiếng Ả Rập và nhiều ngôn ngữ khác. Với công nghệ OCR tiên tiến, hỗ trợ ngôn ngữ toàn diện và API dễ sử dụng, SDK này có thể giúp các nhà phát triển tiết kiệm thời gian và công sức khi xây dựng các ứng dụng OCR.

Previous Next

Bắt đầu với Asprise OCR SDK cho Java

Bắt đầu với Asprise OCR SDK cho Java Cách được khuyến nghị để cài đặt Asprise OCR SDK cho Java là sử dụng Maven. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.

Phụ thuộc Maven cho Asprise OCR SDK dành cho Java


<dependencies>
	<dependency>
	<groupId>com.asprise.ocr</groupId>
	<artifactId>java-ocr-api;/artifactId>
	<version>[15,)</version>
    </dependency>
</dependencies>

Cài đặt Asprise OCR SDK cho Java qua GitHub

 git clone https://github.com/Asprise/java-.net-ocr-api-library  

Trích xuất văn bản ở định dạng văn bản thuần túy thông qua Java

Asprise OCR SDK cho Java đã cung cấp chức năng hoàn chỉnh để trích xuất văn bản từ hình ảnh ở định dạng văn bản thuần túy. Thư viện cho phép người dùng dễ dàng truy xuất nội dung văn bản của tài liệu hoặc hình ảnh đã quét và sử dụng nội dung đó để xử lý hoặc phân tích thêm. Để thực hiện tác vụ trích xuất văn bản thuần túy, trước tiên bạn cần tải hình ảnh từ tệp, luồng đầu vào hoặc URL và áp dụng nhận dạng OCR cho hình ảnh đã tải bằng API. Sử dụng hàm thích hợp để truy xuất văn bản đã nhận dạng ở định dạng văn bản thuần túy. Sau đây là cách tải hình ảnh và văn bản đã nhận dạng dưới dạng văn bản thuần túy, và kết quả được in ra bảng điều khiển.

Tải hình ảnh và nhận dạng văn bản thông qua Java API

import com.asprise.ocr.Ocr;

public class OCRTest {

    public static void main(String[] args) throws Exception {
        
        // Load image from file
        Ocr ocr = new Ocr();
        ocr.startEngine("eng", Ocr.SPEED_FASTEST);
        String recognizedText = ocr.recognize(new File("image.png"), Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

        // Print the plain text output
        System.out.println("Recognized Text: " + recognizedText);

        ocr.stopEngine();
    }
}

Thực hiện nhiều thao tác OCR khác nhau trong ứng dụng Java

Asprise OCR SDK for Java API cho phép các nhà phát triển phần mềm thực hiện nhiều thao tác OCR (Nhận dạng ký tự quang học) khác nhau trên nhiều loại tài liệu khác nhau. Thư viện hỗ trợ đầy đủ các loại thao tác OCR khác nhau, chẳng hạn như Tệp hình ảnh OCR, Tệp PDF OCR, Văn bản viết tay OCR, OCR nhiều ngôn ngữ, thực hiện OCR trên một phần hình ảnh, thực hiện OCR trên nhiều tệp đầu vào trong một lần chụp, thực hiện OCR trên một trang nhất định từ tệp TIFF đã chỉ định, Xử lý hàng loạt OCR và nhiều hơn nữa. Thư viện cung cấp một công cụ mạnh mẽ và linh hoạt để thực hiện các thao tác OCR trên nhiều loại tài liệu khác nhau. Với khả năng hỗ trợ nhiều ngôn ngữ, tệp hình ảnh và PDF, văn bản viết tay và xử lý hàng loạt, bạn có thể trích xuất văn bản từ tài liệu của mình một cách nhanh chóng và chính xác.

Thực hiện OCR trên nhiều tệp thông qua Thư viện Java

String s = ocr.recognize("test.png;test2.jpg", -1, 0, 0, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

perform OCR on a PDF input file:
String s = ocr.recognize("test.pdf", -1, 100, 100, 400, 200,
   Ocr.RECOGNIZE_TYPE_TEXT, Ocr.OUTPUT_FORMAT_PLAINTEXT);

Hỗ trợ đa luồng bằng Asprise OCR

Asprise OCR SDK for Java API đã bao gồm hỗ trợ hoàn chỉnh cho đa luồng, cho phép các nhà phát triển xử lý nhiều tác vụ OCR cùng lúc. Tính năng này cho phép các nhà phát triển cải thiện hiệu suất của các ứng dụng OCR của họ bằng cách phân phối xử lý OCR trên nhiều luồng, có thể chạy đồng thời trên nhiều lõi hoặc bộ xử lý. Hỗ trợ đa luồng có thể tùy chỉnh cao, cho phép các nhà phát triển tinh chỉnh số lượng luồng và công cụ OCR để phù hợp với các tài nguyên và yêu cầu xử lý có sẵn. Về cơ bản, hỗ trợ đa luồng của Asprise OCR SDK for Java cung cấp cho các nhà phát triển một công cụ mạnh mẽ và linh hoạt để xây dựng các ứng dụng OCR hiệu suất cao có thể xử lý khối lượng lớn văn bản một cách nhanh chóng và hiệu quả.

Viết mã quản lý luồng khó khăn

OcrExecutorService oes =
  new OcrExecutorService("eng", Ocr.SPEED_FASTEST, 4); // 4 threads

List> futures = oes.invokeAll(Arrays.asList(
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test1.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML),
  new OcrExecutorService.OcrCallable(
    new File[] {new File("test2.png")},
      Ocr.RECOGNIZE_TYPE_ALL, Ocr.OUTPUT_FORMAT_XML)
);

System.out.println("Result of test1.png: " + futures.get(0).get());
System.out.println("Result of test2.png: " + futures.get(1).get());

oes.shutdown(); // stops all OCR engines and disposes all threads
 Tiếng Việt