Aspose.OCR library for Node.js via C++

Thư viện OCR Node.js để Nhận dạng/Trích xuất Văn bản của Hình ảnh

API OCR Node.js cho phép các nhà phát triển phần mềm trích xuất Văn bản từ Hình ảnh, Tài liệu Quét, Ảnh chụp & Ảnh chụp màn hình cũng như Tự động hoá các tác vụ liên quan đến Nhận dạng Văn bản.

Thư viện Aspose.OCR cho Node.js qua C++ là một thư viện mạnh mẽ cung cấp khả năng nhận dạng ký tự quang học (OCR) cho các nhà phát triển phần mềm làm việc với các ứng dụng Node.js. Thư viện này là một phần của bộ Aspose, nổi tiếng với các giải pháp xử lý tài liệu mạnh mẽ và đáng tin cậy; tính năng chính của nó là khả năng nhận dạng và trích xuất văn bản từ hình ảnh, tài liệu quét, ảnh chụp, ảnh chụp màn hình, v.v. Thư viện cũng có thể nhận dạng văn bản viết tay bên cạnh văn bản in, mở rộng khả năng sử dụng cho nhiều loại tài liệu hơn. Ngoài việc trích xuất văn bản thuần, nó còn có thể giữ nguyên định dạng của văn bản đã nhận dạng, bao gồm kiểu phông chữ, kích thước và màu sắc.

Một trong những tính năng nổi bật của Thư viện Aspose.OCR cho Node.js là hỗ trợ nhiều định dạng hình ảnh, bao gồm JPEG, PNG, BMP, TIFF và nhiều hơn nữa. Tính linh hoạt này cho phép các nhà phát triển phần mềm làm việc với đa dạng hình ảnh, giúp dễ dàng xử lý các loại tài liệu và đồ họa khác nhau. Hơn nữa, nó cung cấp các thuật toán OCR tiên tiến đảm bảo việc trích xuất văn bản chính xác và đáng tin cậy. Bằng cách tận dụng các kỹ thuật nhận dạng tinh vi, thư viện có thể hiệu quả giải mã văn bản từ hình ảnh, ngay cả khi văn bản bị nghiêng, mờ hoặc biến dạng.

Aspose.OCR cho Node.js hỗ trợ nhiều ngôn ngữ, phù hợp cho các ứng dụng toàn cầu. Nó có thể nhận dạng văn bản trong hơn 130 ngôn ngữ, bao gồm Tiếng Anh, Tiếng Tây Ban Nha, Tiếng Pháp, Tiếng Đức, Tiếng Ý, Tiếng Bồ Đào Nha, Tiếng Trung, Tiếng Nhật và nhiều ngôn ngữ khác. Được thiết kế với hiệu năng và khả năng mở rộng, thư viện có thể xử lý khối lượng lớn hình ảnh một cách hiệu quả. Nó cho phép các nhà phát triển định nghĩa các mẫu tùy chỉnh cho tài liệu có cấu trúc. Tính năng này hữu ích cho việc trích xuất các trường dữ liệu cụ thể từ biểu mẫu, hoá đơn và các tài liệu mẫu khác. Tổng thể, Thư viện Aspose.OCR là công cụ giá trị cho các nhà phát triển muốn tích hợp chức năng OCR vào ứng dụng Node.js của họ.

Tổng quan

Tổng quan về các tính năng của thư viện Aspose.OCR cho Node.js qua C++.

Tổng quan tính năng

Hoạt động OCR
Thêm khả năng OCR
Nhận dạng văn bản hình ảnh
Chuyển đổi hình ảnh thành văn bản
Văn bản phông chữ đã nhận dạng
Tìm kiếm PDF
27 ngôn ngữ nhận dạng
Tạo ứng dụng OCR
Lưu vào trình duyệt
Trích xuất Văn bản
Hỗ trợ đa luồng

Tổng quan tính năng

Nhận dạng hình ảnh xoay
Bộ lọc tiền xử lý
PDF sang Hình ảnh
Nhận dạng ký tự Trung Quốc
Phát hiện phông chữ phổ biến
Xử lý toàn bộ hình ảnh
Hỗ trợ hình ảnh xoay
Nhận dạng hàng loạt
Trình kiểm tra chính tả tích hợp
Tách PDF
PDF sang Excel
PDF sang SVG

Thư viện Aspose.OCR cho Node.js qua C++

API chủ yếu hỗ trợ định dạng OCR nhưng có thể xuất tài liệu OCR sang một số định dạng khác.

Đọc

PDF, PDF/A, TEX, XPS, SVG

Ghi

PDF, TXT, PNG, JPEG

Thư viện Aspose.OCR cho Node.js qua C++

Độc lập nền tảng

Thư viện Aspose.OCR cho Node.js qua C++ có thể làm việc với bất kỳ ngôn ngữ lập trình dựa trên Java nào.

Môi trường chạy Java

Thư viện Aspose.OCR cho Node.js qua C++

Bắt đầu với Thư viện Aspose.OCR cho Node.js qua C++

Cách khuyến nghị để cài đặt thư viện Aspose.OCR cho Node.js qua C++ là sử dụng npm. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ.

Cài đặt Thư viện Aspose.OCR cho Node.js qua C++ qua npm

 npm install aspose-ocr-cloud

Bạn có thể tải thư viện trực tiếp từ Aspose.OCR product page

Thư viện Aspose.OCR cho Node.js qua C++ đã cung cấp đầy đủ chức năng để thực hiện các thao tác nhận dạng ký tự quang học (OCR) trên nhiều hình ảnh khác nhau. Chỉ với một vài dòng mã, các nhà phát triển phần mềm có thể nhận dạng và trích xuất văn bản từ hình ảnh trong các ứng dụng Node.js. API đã bao gồm hỗ trợ nhiều định dạng tệp hình ảnh phổ biến, như JPEG, PNG, GIF, TIFF, PDF, BMP và nhiều hơn nữa. Có một số tính năng quan trọng của thư viện như nhận dạng các hình ảnh đã xoay, nghiêng và nhiễu. Hơn nữa, các nhà phát triển phần mềm có thể lưu kết quả nhận dạng ở các định dạng tài liệu và trao đổi dữ liệu phổ biến nhất. Ví dụ sau đây cho thấy cách các lệnh JavaScript có thể được sử dụng để tải và trích xuất văn bản từ một hình ảnh.

Làm thế nào để Nhận dạng Văn bản từ một Hình ảnh trong Ứng dụng Node.js?

let source = Module.WasmAsposeOCRInput();
source.url = internalFileName;
let batch = new Module.WasmAsposeOCRInputs();
batch.push_back(source);

// Send image for OCR
var result = Module.AsposeOCRRecognize(batch);
// Output extracted text to the console
var text = Module.AsposeOCRSerializeResult(
              result, Module.ExportFormat.text);

console.log(text);

Nhận dạng Văn bản Viết tay trong Ứng dụng Node.js

Thư viện Aspose.OCR cho Node.js qua C++ giúp các nhà phát triển phần mềm dễ dàng nhận dạng văn bản viết tay trong các ứng dụng Node.js của họ. Nó có thể nhận dạng văn bản viết tay bên cạnh văn bản in, mở rộng khả năng sử dụng cho nhiều loại tài liệu hơn. Các nhà phát triển phần mềm có thể nhận dạng văn bản viết tay bằng cách bật chế độ văn bản viết tay. Ngoài ra, cũng có thể nhận dạng hình ảnh từ URL mà không cần tải xuống cục bộ. Ví dụ sau đây cho thấy cách các nhà phát triển phần mềm có thể tải và nhận dạng văn bản viết tay trong các ứng dụng node.js.

Làm thế nào để Nhận dạng Văn bản Viết tay trong Ứng dụng Node.js

const recognizeHandwritten = true;

ocrApi.recognizeFromContent('eng', recognizeHandwritten, imageBuffer, (error, data) => {
  if (error) throw error;

  console.log('Extracted Handwritten Text:', data.text);
});

Hỗ trợ Nhận dạng Dựa trên Mẫu

Nhận dạng dựa trên mẫu liên quan đến việc định nghĩa một mẫu xác định bố cục và các khu vực quan tâm trong tài liệu. Nhận dạng dựa trên mẫu với Aspose.OCR cho Node.js qua C++ cung cấp cách có cấu trúc và chính xác để trích xuất dữ liệu từ các tài liệu có bố cục cố định. Tính năng này hữu ích cho việc trích xuất các trường cụ thể từ biểu mẫu, hoá đơn và các tài liệu mẫu khác. Dưới đây là một ví dụ rất hữu ích cho thấy cách các nhà phát triển phần mềm có thể tải mẫu và áp dụng nó cho một hình ảnh để thực hiện OCR trong các ứng dụng Node.js.

Làm thế nào để Tải Mẫu và Áp dụng Nó cho một Hình ảnh để OCR trong Ứng dụng Node.js?

const fs = require('fs');
const { OcrApi, AsposeApp, TemplateApi } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();
const templateApi = new TemplateApi();

const imagePath = 'path/to/your/invoice.jpg';
const templatePath = 'path/to/your/template.json';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  fs.readFile(templatePath, (err, templateBuffer) => {
    if (err) throw err;

    // Load the template
    templateApi.addTemplate(templateBuffer, (error, templateId) => {
      if (error) throw error;

      // Apply the template to the image
      ocrApi.recognizeFromTemplate(imageBuffer, templateId, (error, result) => {
        if (error) throw error;

        console.log('Extracted Data:', result.fields);
      });
    });
  });
});

Giữ Định dạng Văn bản trong Các Hoạt động OCR

Giữ định dạng văn bản trong các hoạt động OCR là rất quan trọng đối với các ứng dụng mà cấu trúc, kiểu phông chữ và bố cục của văn bản là quan trọng. Ngoài việc trích xuất văn bản thuần, Aspose.OCR cho Node.js qua C++ còn có thể giữ định dạng của văn bản đã nhận dạng, bao gồm kiểu phông chữ, kích thước và màu sắc. Điều này đặc biệt hữu ích cho việc xử lý các tài liệu mà định dạng văn bản là thiết yếu. Dưới đây là một ví dụ minh họa cách các nhà phát triển phần mềm có thể giữ định dạng văn bản bằng API Aspose.OCR.

Làm thế nào để Giữ Định dạng Văn bản trong Các Hoạt động OCR trong Ứng dụng Node.js?

const fs = require('fs');
const { OcrApi, AsposeApp, OCRFormat, OCRRecognitionSettings } = require('aspose-ocr-cloud');

const appSid = 'your-app-sid';
const appKey = 'your-app-key';

AsposeApp.appSID = appSid;
AsposeApp.appKey = appKey;

const ocrApi = new OcrApi();

const imagePath = 'path/to/your/document.jpg';

fs.readFile(imagePath, (err, imageBuffer) => {
  if (err) throw err;

  const recognitionSettings = new OCRRecognitionSettings();
  recognitionSettings.setDetectAreas(true);
  recognitionSettings.setDetectText(true);
  recognitionSettings.setDetectItalic(true);
  recognitionSettings.setDetectBold(true);

  ocrApi.recognizeWithSettings(imageBuffer, OCRFormat.TEXT, recognitionSettings, (error, data) => {
    if (error) throw error;

    const formattedText = data.text;
    const formattingDetails = data.textAreas;

    console.log('Extracted Text with Formatting:', formattedText);
    console.log('Formatting Details:', formattingDetails);
  });
});