1. محصولات
  2.   OCR
  3.   Node.js
  4.   Baidu-ocr-api
 
  

API رایگان Node.js برای شناسایی و استخراج متن از تصاویر

یک Node.js رایگان، یک API پیشرو Node.js است که دقت بالایی در شناسایی متن در چندین زبان و انواع فونت‌ها و چیدمان‌ها ارائه می‌دهد.

در دنیای توسعه مبتنی بر هوش مصنوعی امروز، تشخیص نوری کاراکتر (OCR) برای خودکارسازی استخراج متن از تصاویر و اسناد ضروری شده است. توسعه‌دهندگانی که به دنبال ایجاد OCR در Node.js هستند می‌توانند به‌طور قابل‌توجهی از Baidu-OCR-API بهره‌مند شوند، ابزاری قدرتمند که از استخراج متن از تصاویر، شناسایی متن دست‌نویس، و حتی وظایف پیشرفته‌ای مانند شناسایی فرم‌ها در برنامه‌های Node.js پشتیبانی می‌کند. چه اسکن فاکتورها، دیجیتالی کردن اسناد یا فعال‌سازی ویژگی‌های دسترسی باشد، این کتابخانه OCR برای Node.js عملکرد بالایی دارد و به‌راحتی با برنامه‌های مدرن یکپارچه می‌شود.

Baidu-OCR-API یک API رایگان OCR برای Node.js است که از یادگیری عمیق برای شناسایی متن چاپی و دست‌نویس در چندین زبان، از جمله چینی، انگلیسی، ژاپنی و غیره استفاده می‌کند. این API در شناسایی جداول در Node.js، اسکن اسناد تجاری، و شناسایی متن در شرایط پیچیده مانند نور کم یا تصاویر مخدوش برتری دارد. توسعه‌دهندگان می‌توانند متن را در صحنه‌های طبیعی نیز شناسایی کنند، که این ویژگی برای برنامه‌های موبایل، واقعیت افزوده و موارد ترجمه زمان واقعی ایده‌آل است. با دقت شناسایی بالا و موارد استفاده متنوع، Baidu-OCR-API گزینه‌ای مناسب برای هر توسعه‌دهنده‌ای است که می‌خواهد عملکرد OCR قابل اعتماد را در برنامه‌های Node.js خود ادغام کند.

Previous Next

شروع کار با Baidu-OCR-API

روش پیشنهادی برای نصب Baidu-OCR-API استفاده از npm است. لطفاً برای نصب روان، دستور زیر را اجرا کنید

نصب Baidu-OCR-API از طریق npm

 npm install baidu-ocr-api -g 

هم‌چنین می‌توانید آن را به‌صورت دستی نصب کنید؛ فایل‌های آخرین نسخه را مستقیماً از مخزن GitHub دانلود کنید.

استخراج متن از تصاویر در برنامه‌های Node.js

Baidu-OCR-API برای توسعه‌دهندگان نرم‌افزار آسان می‌کند تا تصاویر را بارگذاری و خوانده و متن را در برنامه‌های Node.js استخراج کنند. ویژگی شناسایی متن عمومی به توسعه‌دهندگان اجازه می‌دهد متن چاپی را از تصاویر بارگذاری و استخراج کنند، که برای طیف وسیعی از اسناد مناسب است. این API از فرمت‌های محبوب تصویر مختلفی مانند JPEG، PNG، GIF، TIFF، PDF، BMP و بسیاری دیگر پشتیبانی می‌کند. مثال زیر نشان می‌دهد چگونه توسعه‌دهندگان می‌توانند تصویر را بارگذاری کرده و شناسایی متن را در برنامه‌های Node.js انجام دهند.

چگونه تصویر را بارگذاری کرده و شناسایی متن را در برنامه‌های Node.js انجام دهیم؟

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

شناسایی فرم و جدول در برنامه‌های Node.js

بسته منبع باز Baidu-OCR-API عملکرد کامل برای شناسایی فرم و جدول در برنامه‌های Node.js فراهم کرده است. برای انجام موفقیت‌آمیز این کار ابتدا باید کلاینت Baidu OCR خود را با استفاده از اعتبارنامه‌های API تنظیم کنید. سپس کدی بنویسید تا تصویر را بخوانید و شناسایی فرم و جدول را انجام دهید. این قابلیت می‌تواند برای خودکارسازی استخراج داده‌ها از اسناد ساختاریافته و افزایش بهره‌وری در برنامه‌های مختلف بسیار مفید باشد. در اینجا یک مثال ساده نشان می‌دهد که چگونه یک توسعه‌دهنده نرم‌افزار می‌تواند تصویر را بخواند و شناسایی فرم و جدول را در محیط Node.js انجام دهد.

چگونه تصویر را بخوانیم و شناسایی فرم و جدول را در برنامه‌های Node.js انجام دهیم؟

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

شناسایی متن دست‌نویس از طریق API Node.js

بسته منبع باز Baidu-OCR-API بسیار آسان برای استفاده است و به‌طور کامل قادر به شناسایی متن دست‌نویس با دقت بالا در برنامه‌های Node.js می‌باشد. برای رسیدن به هدف، فایل تصویر خوانده شده و به رشته base64 تبدیل می‌شود و سپس متد handwriting با تصویر رمزگذاری‌شده base64 فراخوانی می‌شود و متن دست‌نویس شناسایی‌شده در کنسول ثبت می‌گردد. مثال زیر نشان می‌دهد چگونه توسعه‌دهندگان نرم‌افزار می‌توانند شناسایی متن دست‌نویس را با استفاده از API منبع باز Baidu OCR در Node.js انجام دهند.

چگونه شناسایی متن دست‌نویس را در برنامه‌های Node.js انجام دهیم؟

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 فارسی