API Node.js Percuma untuk Mengenali & Mengekstrak Teks dari Imej
Node.js Percuma adalah API Node.js terkemuka yang Menawarkan Ketepatan Tinggi dalam Pengenalan Teks Merentasi Pelbagai Bahasa serta Pelbagai Fon dan Susun Atur.
Dalam dunia pembangunan yang didorong AI masa kini, Pengenalan Aksara Optik (OCR) telah menjadi penting untuk mengautomasi pengekstrakan teks daripada imej dan dokumen. Pembangun yang ingin mencipta OCR dalam Node.js boleh mendapat manfaat besar daripada Baidu-OCR-API, alat yang kuat yang menyokong pengekstrakan teks daripada imej, pengenalan teks tulisan tangan, dan juga tugas lanjutan seperti pengenalan borang dalam aplikasi Node.js. Sama ada mengimbas invois, mendigitalkan dokumen, atau membolehkan ciri kebolehcapaian, perpustakaan OCR Node.js ini menawarkan prestasi tinggi dan mudah diintegrasikan dengan aplikasi moden.
Baidu-OCR-API adalah API OCR Node.js percuma yang menggunakan pembelajaran mendalam untuk mengenali teks cetak dan tulisan tangan merentasi pelbagai bahasa, termasuk Cina, Inggeris, Jepun, dan lain-lain. Ia cemerlang dalam pengenalan jadual dalam Node.js, pengimbasan dokumen perniagaan, dan mengenali teks dalam keadaan sukar seperti cahaya rendah atau imej terdistorsi. Pembangun juga boleh mengenali teks dalam adegan semula jadi, menjadikannya sesuai untuk aplikasi mudah alih, realiti terimbuh, dan kes penggunaan terjemahan masa nyata. Dengan ketepatan pengenalan dan pelbagai kegunaan, Baidu-OCR-API adalah pilihan ideal bagi mana-mana pembangun yang ingin mengintegrasikan fungsi OCR yang boleh dipercayai ke dalam aplikasi Node.js.
Mula Menggunakan Baidu-OCR-API
Cara yang disarankan untuk memasang Baidu-OCR-API ialah menggunakan npm. Sila gunakan perintah berikut untuk pemasangan yang lancar
Pasang Baidu-OCR-API melalui npm
npm install baidu-ocr-api -g Anda juga boleh memasangnya secara manual; muat turun fail pelepasan terkini secara langsung dari GitHub repositori.
Ekstrak Teks dari Imej dalam Aplikasi Node.js
Baidu-OCR-API memudahkan pembangun perisian untuk memuatkan dan membaca imej serta mengekstrak teks dalam aplikasi Node.js. Ciri pengenalan teks umum membolehkan pembangun memuatkan dan mengekstrak teks cetak daripada imej, sesuai untuk pelbagai jenis dokumen. API ini menyokong pelbagai format fail imej popular, seperti JPEG, PNG, GIF, TIFF, PDF, BMP, dan banyak lagi. Contoh berikut menunjukkan bagaimana pembangun perisian boleh memuatkan dan melakukan pengenalan teks pada imej dalam aplikasi Node.js.
Bagaimana Memuatkan dan Melakukan Pengenalan Teks pada Imej dalam Aplikasi Node.js?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Pengenalan Borang dan Jadual dalam Aplikasi Node.js
Perisian sumber terbuka Baidu-OCR-API telah menyediakan fungsi lengkap untuk mengenali borang dan jadual dalam aplikasi Node.js. Untuk melaksanakan tugas ini dengan berjaya, pertama anda perlu menyediakan klien Baidu OCR anda menggunakan kelayakan API. Kemudian, tulis kod untuk membaca imej dan melakukan pengenalan borang serta jadual. Fungsi ini sangat berguna untuk mengautomasi pengekstrakan data daripada dokumen berstruktur dan meningkatkan produktiviti dalam pelbagai aplikasi. Berikut ialah contoh mudah yang menunjukkan bagaimana pembangun perisian boleh membaca imej dan melakukan pengenalan borang serta jadual dalam persekitaran Node.js.
Bagaimana Membaca Imej dan Melakukan Pengenalan Borang serta Jadual dalam Aplikasi Node.js?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Pengenalan Teks Tulisan Tangan melalui API Node.js
Perisian sumber terbuka Baidu-OCR-API sangat mudah digunakan dan sepenuhnya mampu mengenali teks tulisan tangan dengan ketepatan tinggi dalam aplikasi Node.js. Untuk mencapai matlamat tersebut, fail imej dibaca dan ditukar kepada rentetan base64, kemudian kaedah handwriting dipanggil dengan imej yang telah dienkod base64, dan teks tulisan tangan yang dikenali dipaparkan pada konsol. Contoh berikut menunjukkan bagaimana pembangun perisian boleh melakukan pengenalan teks tulisan tangan menggunakan Baidu OCR API sumber terbuka dalam Node.js.
Bagaimana Melakukan Pengenalan Teks Tulisan Tangan dalam Aplikasi Node.js?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word