API رایگان Node.js برای شناسایی و استخراج متن از تصاویر
یک Node.js رایگان، یک API پیشرو Node.js است که دقت بالایی در شناسایی متن در چندین زبان و انواع فونتها و چیدمانها ارائه میدهد.
در دنیای توسعه مبتنی بر هوش مصنوعی امروز، تشخیص نوری کاراکتر (OCR) برای خودکارسازی استخراج متن از تصاویر و اسناد ضروری شده است. توسعهدهندگانی که به دنبال ایجاد OCR در Node.js هستند میتوانند بهطور قابلتوجهی از Baidu-OCR-API بهرهمند شوند، ابزاری قدرتمند که از استخراج متن از تصاویر، شناسایی متن دستنویس، و حتی وظایف پیشرفتهای مانند شناسایی فرمها در برنامههای Node.js پشتیبانی میکند. چه اسکن فاکتورها، دیجیتالی کردن اسناد یا فعالسازی ویژگیهای دسترسی باشد، این کتابخانه OCR برای Node.js عملکرد بالایی دارد و بهراحتی با برنامههای مدرن یکپارچه میشود.
Baidu-OCR-API یک API رایگان OCR برای Node.js است که از یادگیری عمیق برای شناسایی متن چاپی و دستنویس در چندین زبان، از جمله چینی، انگلیسی، ژاپنی و غیره استفاده میکند. این API در شناسایی جداول در Node.js، اسکن اسناد تجاری، و شناسایی متن در شرایط پیچیده مانند نور کم یا تصاویر مخدوش برتری دارد. توسعهدهندگان میتوانند متن را در صحنههای طبیعی نیز شناسایی کنند، که این ویژگی برای برنامههای موبایل، واقعیت افزوده و موارد ترجمه زمان واقعی ایدهآل است. با دقت شناسایی بالا و موارد استفاده متنوع، Baidu-OCR-API گزینهای مناسب برای هر توسعهدهندهای است که میخواهد عملکرد OCR قابل اعتماد را در برنامههای Node.js خود ادغام کند.
شروع کار با Baidu-OCR-API
روش پیشنهادی برای نصب Baidu-OCR-API استفاده از npm است. لطفاً برای نصب روان، دستور زیر را اجرا کنید
نصب Baidu-OCR-API از طریق npm
npm install baidu-ocr-api -g همچنین میتوانید آن را بهصورت دستی نصب کنید؛ فایلهای آخرین نسخه را مستقیماً از مخزن GitHub دانلود کنید.
استخراج متن از تصاویر در برنامههای Node.js
Baidu-OCR-API برای توسعهدهندگان نرمافزار آسان میکند تا تصاویر را بارگذاری و خوانده و متن را در برنامههای Node.js استخراج کنند. ویژگی شناسایی متن عمومی به توسعهدهندگان اجازه میدهد متن چاپی را از تصاویر بارگذاری و استخراج کنند، که برای طیف وسیعی از اسناد مناسب است. این API از فرمتهای محبوب تصویر مختلفی مانند JPEG، PNG، GIF، TIFF، PDF، BMP و بسیاری دیگر پشتیبانی میکند. مثال زیر نشان میدهد چگونه توسعهدهندگان میتوانند تصویر را بارگذاری کرده و شناسایی متن را در برنامههای Node.js انجام دهند.
چگونه تصویر را بارگذاری کرده و شناسایی متن را در برنامههای Node.js انجام دهیم؟
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
شناسایی فرم و جدول در برنامههای Node.js
بسته منبع باز Baidu-OCR-API عملکرد کامل برای شناسایی فرم و جدول در برنامههای Node.js فراهم کرده است. برای انجام موفقیتآمیز این کار ابتدا باید کلاینت Baidu OCR خود را با استفاده از اعتبارنامههای API تنظیم کنید. سپس کدی بنویسید تا تصویر را بخوانید و شناسایی فرم و جدول را انجام دهید. این قابلیت میتواند برای خودکارسازی استخراج دادهها از اسناد ساختاریافته و افزایش بهرهوری در برنامههای مختلف بسیار مفید باشد. در اینجا یک مثال ساده نشان میدهد که چگونه یک توسعهدهنده نرمافزار میتواند تصویر را بخواند و شناسایی فرم و جدول را در محیط Node.js انجام دهد.
چگونه تصویر را بخوانیم و شناسایی فرم و جدول را در برنامههای Node.js انجام دهیم؟
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
شناسایی متن دستنویس از طریق API Node.js
بسته منبع باز Baidu-OCR-API بسیار آسان برای استفاده است و بهطور کامل قادر به شناسایی متن دستنویس با دقت بالا در برنامههای Node.js میباشد. برای رسیدن به هدف، فایل تصویر خوانده شده و به رشته base64 تبدیل میشود و سپس متد handwriting با تصویر رمزگذاریشده base64 فراخوانی میشود و متن دستنویس شناساییشده در کنسول ثبت میگردد. مثال زیر نشان میدهد چگونه توسعهدهندگان نرمافزار میتوانند شناسایی متن دستنویس را با استفاده از API منبع باز Baidu OCR در Node.js انجام دهند.
چگونه شناسایی متن دستنویس را در برنامههای Node.js انجام دهیم؟
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word