API رایگان Node.js برای شناسایی و استخراج متن از تصاویر
یک Node.js رایگان یک API پیشرو Node.js است که دقت بالایی در شناسایی متن در چندین زبان و انواع فونتها و چیدمانها ارائه میدهد.
در دنیای امروز که توسعه بر پایه هوش مصنوعی پیش میرود، تشخیص نوری کاراکتر (OCR) بهعنوان یک ابزار اساسی برای خودکارسازی استخراج متن از تصاویر و اسناد تبدیل شده است. توسعهدهندگانی که به دنبال ایجاد OCR در Node.js هستند میتوانند بهطور قابلتوجهی از Baidu-OCR-API بهرهمند شوند؛ ابزاری قدرتمند که از استخراج متن از تصاویر، شناسایی متن دستنویس و حتی وظایف پیشرفتهای مانند شناسایی فرمها در برنامههای Node.js پشتیبانی میکند. چه اسکن فاکتورها، دیجیتالی کردن اسناد یا فعالسازی ویژگیهای دسترسیپذیری باشد، این کتابخانه OCR Node.js عملکرد بالایی دارد و بهراحتی میتواند در برنامههای مدرن ادغام شود.
Baidu-OCR-API یک API رایگان OCR Node.js است که از یادگیری عمیق برای شناسایی متن چاپی و دستنویس در چندین زبان شامل چینی، انگلیسی، ژاپنی و غیره استفاده میکند. این سرویس در شناسایی جدول در Node.js، اسکن اسناد تجاری و شناسایی متن در شرایط پیچیده مانند نور کم یا تصاویر مخدوش برتری دارد. توسعهدهندگان میتوانند متن را در صحنههای طبیعی نیز شناسایی کنند که این ویژگی آن را برای برنامههای موبایل، واقعیت افزوده و موارد استفاده ترجمه لحظهای ایدهآل میسازد. با دقت بالا و موارد استفاده متنوع، Baidu-OCR-API گزینهای ایدهآل برای هر توسعهدهندهای است که میخواهد عملکرد OCR قابلاعتماد را در برنامههای Node.js خود ادغام کند.
شروع کار با Baidu-OCR-API
روش پیشنهادی برای نصب Baidu-OCR-API استفاده از npm است. لطفاً برای نصب روان، دستور زیر را اجرا کنید
نصب Baidu-OCR-API از طریق npm
npm install baidu-ocr-api -g همچنین میتوانید بهصورت دستی نصب کنید؛ فایلهای آخرین نسخه را مستقیماً از مخزن GitHub دانلود کنید.
استخراج متن از تصاویر در برنامههای Node.js
Baidu-OCR-API به توسعهدهندگان اجازه میدهد بهراحتی تصاویر را بارگذاری و خوانده و متن را در برنامههای Node.js استخراج کنند. ویژگی شناسایی متن عمومی به توسعهدهندگان امکان میدهد متن چاپی را از تصاویر بارگذاری و استخراج کنند که برای طیف وسیعی از اسناد مناسب است. این API از فرمتهای محبوب تصویر مانند JPEG، PNG، GIF، TIFF، PDF، BMP و بسیاری دیگر پشتیبانی میکند. مثال زیر نشان میدهد چگونه میتوانید تصویر را بارگذاری کرده و شناسایی متن را در برنامههای Node.js انجام دهید.
چگونه یک تصویر را بارگذاری کرده و شناسایی متن را در برنامههای Node.js انجام دهیم؟
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
شناسایی فرم و جدول در برنامههای Node.js
Baidu-OCR-API منبع باز عملکرد کامل شناسایی فرم و جدول را در برنامههای Node.js فراهم میکند. برای انجام موفق این کار ابتدا باید کلاینت Baidu OCR خود را با استفاده از اعتبارنامههای API تنظیم کنید. سپس کد لازم برای خواندن تصویر و انجام شناسایی فرم و جدول را بنویسید. این قابلیت بهویژه برای خودکارسازی استخراج داده از اسناد ساختاریافته و افزایش بهرهوری در برنامههای مختلف مفید است. در ادامه مثال سادهای آورده شده که نشان میدهد چگونه میتوانید یک تصویر را خوانده و شناسایی فرم و جدول را در محیط Node.js انجام دهید.
چگونه یک تصویر را خوانده و شناسایی فرم و جدول را در برنامههای Node.js انجام دهیم؟
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
شناسایی متن دستنویس از طریق API Node.js
Baidu-OCR-API منبع باز بهراحتی قابل استفاده است و توانایی شناسایی دقیق متن دستنویس را در برنامههای Node.js دارد. برای رسیدن به این هدف، فایل تصویر خوانده شده و به رشته Base64 تبدیل میشود؛ سپس متد handwriting با تصویر Base64‑encoded فراخوانی میشود و متن دستنویس شناساییشده در کنسول لاگ میشود. مثال زیر نشان میدهد چگونه میتوانید شناسایی متن دستنویس را با استفاده از Baidu OCR API در Node.js انجام دهید.
چگونه شناسایی متن دستنویس را در برنامههای Node.js انجام دهیم؟
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word