API Node.js miễn phí để Nhận dạng & Trích xuất Văn bản từ Hình ảnh
Node.js miễn phí là một API Node.js hàng đầu, cung cấp độ chính xác cao trong nhận dạng văn bản trên nhiều ngôn ngữ và đa dạng phông chữ và bố cục.
Trong thế giới phát triển hiện nay được điều khiển bởi AI, Nhận dạng ký tự quang học (OCR) đã trở thành yếu tố thiết yếu để tự động trích xuất văn bản từ hình ảnh và tài liệu. Các nhà phát triển muốn tạo OCR trong Node.js có thể hưởng lợi rất lớn từ Baidu-OCR-API, một công cụ mạnh mẽ hỗ trợ trích xuất văn bản từ hình ảnh, nhận dạng văn bản viết tay, và thậm chí các nhiệm vụ nâng cao như nhận dạng biểu mẫu trong các ứng dụng Node.js. Cho dù là quét hoá đơn, số hoá tài liệu, hay kích hoạt các tính năng trợ năng, thư viện OCR Node.js này cung cấp hiệu năng cao và dễ dàng tích hợp với các ứng dụng hiện đại.
Baidu-OCR-API là một API OCR Node.js miễn phí sử dụng học sâu để nhận dạng văn bản in và viết tay trên nhiều ngôn ngữ, bao gồm tiếng Trung, tiếng Anh, tiếng Nhật và nhiều hơn nữa. Nó xuất sắc trong việc nhận dạng bảng trong Node.js, quét tài liệu doanh nghiệp, và nhận dạng văn bản trong các điều kiện phức tạp như ánh sáng yếu hoặc hình ảnh bị biến dạng. Các nhà phát triển cũng có thể nhận dạng văn bản trong các cảnh tự nhiên, làm cho nó trở nên hoàn hảo cho các ứng dụng di động, thực tế tăng cường, và các trường hợp sử dụng dịch thuật thời gian thực. Với độ chính xác cao và các trường hợp sử dụng đa dạng, Baidu-OCR-API là lựa chọn lý tưởng cho bất kỳ nhà phát triển nào muốn tích hợp chức năng OCR đáng tin cậy vào các ứng dụng Node.js.
Bắt đầu với Baidu-OCR-API
Cách khuyến nghị để cài đặt Baidu-OCR-API là sử dụng npm. Vui lòng sử dụng lệnh sau để cài đặt suôn sẻ
Cài đặt Baidu-OCR-API qua npm
npm install baidu-ocr-api -g Bạn cũng có thể cài đặt thủ công; tải xuống các tệp phát hành mới nhất trực tiếp từ GitHub repository.
Trích xuất Văn bản từ Hình ảnh trong Ứng dụng Node.js
Baidu-OCR-API giúp các nhà phát triển phần mềm dễ dàng tải và đọc hình ảnh và trích xuất văn bản trong các ứng dụng Node.js. Tính năng nhận dạng văn bản chung cho phép các nhà phát triển tải và trích xuất văn bản in từ hình ảnh, phù hợp với một loạt tài liệu rộng. API đã bao gồm hỗ trợ nhiều định dạng tệp hình ảnh phổ biến, như JPEG, PNG, GIF, TIFF, PDF, BMP và nhiều hơn nữa. Ví dụ dưới đây cho thấy cách các nhà phát triển phần mềm có thể tải và thực hiện nhận dạng văn bản trên hình ảnh trong các ứng dụng Node.js.
Cách tải và thực hiện nhận dạng văn bản trên một hình ảnh trong Ứng dụng Node.js?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Nhận dạng Biểu mẫu và Bảng trong Ứng dụng Node.js
Bạn có thể sử dụng Baidu-OCR-API mã nguồn mở để nhận dạng biểu mẫu và bảng trong các ứng dụng Node.js. Để thực hiện thành công, trước tiên bạn cần thiết lập client Baidu OCR của mình bằng thông tin xác thực API. Sau đó, viết mã để đọc hình ảnh và thực hiện nhận dạng biểu mẫu và bảng. Chức năng này đặc biệt hữu ích cho việc tự động trích xuất dữ liệu từ các tài liệu có cấu trúc và nâng cao năng suất trong nhiều ứng dụng. Dưới đây là ví dụ đơn giản cho thấy cách nhà phát triển phần mềm có thể đọc một hình ảnh và thực hiện nhận dạng biểu mẫu và bảng trong môi trường Node.js.
Cách đọc một hình ảnh và thực hiện nhận dạng Biểu mẫu và Bảng trong Ứng dụng Node.js?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Nhận dạng Văn bản viết tay qua API Node.js
Baidu-OCR-API mã nguồn mở rất dễ sử dụng và hoàn toàn có khả năng nhận dạng văn bản viết tay với độ chính xác cao trong các ứng dụng Node.js. Để đạt được mục tiêu, tệp hình ảnh được đọc và chuyển đổi thành chuỗi base64 và sau đó phương thức handwriting được gọi với hình ảnh đã mã hoá, và văn bản viết tay được nhận dạng sẽ được ghi vào console. Ví dụ dưới đây minh họa cách các nhà phát triển phần mềm có thể thực hiện nhận dạng văn bản viết tay bằng Baidu OCR API trong Node.js.
Cách thực hiện nhận dạng Văn bản viết tay trong Ứng dụng Node.js?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word