1. محصولات
  2.   OCR
  3.   JavaScript
  4.   Baidu-ocr-api
 
  

API رایگان Node.js برای شناسایی و استخراج متن از تصاویر

یک Node.js رایگان یک API پیشرو Node.js است که دقت بالایی در شناسایی متن در چندین زبان و انواع فونت‌ها و چیدمان‌ها ارائه می‌دهد.

در دنیای امروز که توسعه بر پایه هوش مصنوعی پیش می‌رود، تشخیص نوری کاراکتر (OCR) به‌عنوان یک ابزار اساسی برای خودکارسازی استخراج متن از تصاویر و اسناد تبدیل شده است. توسعه‌دهندگانی که به دنبال ایجاد OCR در Node.js هستند می‌توانند به‌طور قابل‌توجهی از Baidu-OCR-API بهره‌مند شوند؛ ابزاری قدرتمند که از استخراج متن از تصاویر، شناسایی متن دست‌نویس و حتی وظایف پیشرفته‌ای مانند شناسایی فرم‌ها در برنامه‌های Node.js پشتیبانی می‌کند. چه اسکن فاکتورها، دیجیتالی کردن اسناد یا فعال‌سازی ویژگی‌های دسترسی‌پذیری باشد، این کتابخانه OCR Node.js عملکرد بالایی دارد و به‌راحتی می‌تواند در برنامه‌های مدرن ادغام شود.

Baidu-OCR-API یک API رایگان OCR Node.js است که از یادگیری عمیق برای شناسایی متن چاپی و دست‌نویس در چندین زبان شامل چینی، انگلیسی، ژاپنی و غیره استفاده می‌کند. این سرویس در شناسایی جدول در Node.js، اسکن اسناد تجاری و شناسایی متن در شرایط پیچیده مانند نور کم یا تصاویر مخدوش برتری دارد. توسعه‌دهندگان می‌توانند متن را در صحنه‌های طبیعی نیز شناسایی کنند که این ویژگی آن را برای برنامه‌های موبایل، واقعیت افزوده و موارد استفاده ترجمه لحظه‌ای ایده‌آل می‌سازد. با دقت بالا و موارد استفاده متنوع، Baidu-OCR-API گزینه‌ای ایده‌آل برای هر توسعه‌دهنده‌ای است که می‌خواهد عملکرد OCR قابل‌اعتماد را در برنامه‌های Node.js خود ادغام کند.

Previous Next

شروع کار با Baidu-OCR-API

روش پیشنهادی برای نصب Baidu-OCR-API استفاده از npm است. لطفاً برای نصب روان، دستور زیر را اجرا کنید

نصب Baidu-OCR-API از طریق npm

 npm install baidu-ocr-api -g 

همچنین می‌توانید به‌صورت دستی نصب کنید؛ فایل‌های آخرین نسخه را مستقیماً از مخزن GitHub دانلود کنید.

استخراج متن از تصاویر در برنامه‌های Node.js

Baidu-OCR-API به توسعه‌دهندگان اجازه می‌دهد به‌راحتی تصاویر را بارگذاری و خوانده و متن را در برنامه‌های Node.js استخراج کنند. ویژگی شناسایی متن عمومی به توسعه‌دهندگان امکان می‌دهد متن چاپی را از تصاویر بارگذاری و استخراج کنند که برای طیف وسیعی از اسناد مناسب است. این API از فرمت‌های محبوب تصویر مانند JPEG، PNG، GIF، TIFF، PDF، BMP و بسیاری دیگر پشتیبانی می‌کند. مثال زیر نشان می‌دهد چگونه می‌توانید تصویر را بارگذاری کرده و شناسایی متن را در برنامه‌های Node.js انجام دهید.

چگونه یک تصویر را بارگذاری کرده و شناسایی متن را در برنامه‌های Node.js انجام دهیم؟

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

شناسایی فرم و جدول در برنامه‌های Node.js

Baidu-OCR-API منبع باز عملکرد کامل شناسایی فرم و جدول را در برنامه‌های Node.js فراهم می‌کند. برای انجام موفق این کار ابتدا باید کلاینت Baidu OCR خود را با استفاده از اعتبارنامه‌های API تنظیم کنید. سپس کد لازم برای خواندن تصویر و انجام شناسایی فرم و جدول را بنویسید. این قابلیت به‌ویژه برای خودکارسازی استخراج داده از اسناد ساختاریافته و افزایش بهره‌وری در برنامه‌های مختلف مفید است. در ادامه مثال ساده‌ای آورده شده که نشان می‌دهد چگونه می‌توانید یک تصویر را خوانده و شناسایی فرم و جدول را در محیط Node.js انجام دهید.

چگونه یک تصویر را خوانده و شناسایی فرم و جدول را در برنامه‌های Node.js انجام دهیم؟

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

شناسایی متن دست‌نویس از طریق API Node.js

Baidu-OCR-API منبع باز به‌راحتی قابل استفاده است و توانایی شناسایی دقیق متن دست‌نویس را در برنامه‌های Node.js دارد. برای رسیدن به این هدف، فایل تصویر خوانده شده و به رشته Base64 تبدیل می‌شود؛ سپس متد handwriting با تصویر Base64‑encoded فراخوانی می‌شود و متن دست‌نویس شناسایی‌شده در کنسول لاگ می‌شود. مثال زیر نشان می‌دهد چگونه می‌توانید شناسایی متن دست‌نویس را با استفاده از Baidu OCR API در Node.js انجام دهید.

چگونه شناسایی متن دست‌نویس را در برنامه‌های Node.js انجام دهیم؟

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 فارسی