1. পণ্য
  2.   OCR
  3.   JavaScript
  4.   Baidu-ocr-api
 
  

বিনামূল্যে Node.js API ছবি থেকে টেক্সট স্বীকৃতি ও নিষ্কাশনের জন্য

একটি বিনামূল্যের Node.js হল একটি শীর্ষস্থানীয় Node.js API যা একাধিক ভাষা ও বিভিন্ন ফন্ট ও লেআউটে টেক্সট স্বীকৃতিতে উচ্চ নির্ভুলতা প্রদান করে।

আজকের AI‑চালিত উন্নয়ন জগতে, অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ছবি ও ডকুমেন্ট থেকে টেক্সট স্বয়ংক্রিয়ভাবে বের করার জন্য অপরিহার্য হয়ে উঠেছে। Node.js‑এ OCR তৈরি করতে চাইছেন এমন ডেভেলপাররা Baidu-OCR-API থেকে বড় সুবিধা পেতে পারেন; এটি একটি শক্তিশালী টুল যা ছবি থেকে টেক্সট বের করা, হ্যান্ডরাইটিং টেক্সট স্বীকৃতি, এবং এমনকি ফর্ম স্বীকৃতি মতো উন্নত কাজগুলোকে সমর্থন করে। ইনভয়েস স্ক্যান করা, ডকুমেন্ট ডিজিটাইজ করা, অথবা অ্যাক্সেসিবিলিটি ফিচার সক্রিয় করা যাই হোক না কেন, এই Node.js OCR লাইব্রেরি উচ্চ পারফরম্যান্স প্রদান করে এবং আধুনিক অ্যাপ্লিকেশনের সঙ্গে সহজে সংযুক্ত করা যায়।

Baidu-OCR-API একটি বিনামূল্যে Node.js OCR API যা ডিপ লার্নিং ব্যবহার করে প্রিন্টেড ও হ্যান্ডরাইটিং টেক্সটকে একাধিক ভাষা, যেমন চাইনিজ, ইংরেজি, জাপানিজ ইত্যাদিতে স্বীকৃতি দেয়। এটি Node.js‑এ টেবিল স্বীকৃতি, ব্যবসায়িক ডকুমেন্ট স্ক্যানিং, এবং কম আলো বা বিকৃত ছবির মতো জটিল শর্তে টেক্সট স্বীকৃতিতে উৎকৃষ্ট। ডেভেলপাররা প্রাকৃতিক দৃশ্যের টেক্সটও স্বীকৃতি দিতে পারেন, যা মোবাইল অ্যাপ, অগমেন্টেড রিয়েলিটি, এবং রিয়েল‑টাইম ট্রান্সলেশন ব্যবহার ক্ষেত্রে আদর্শ। এর সঠিক স্বীকৃতি এবং বহুমুখী ব্যবহারিক ক্ষেত্রের সঙ্গে, Baidu-OCR-API যেকোনো ডেভেলপারকে Node.js অ্যাপ্লিকেশনে নির্ভরযোগ্য OCR ফাংশনালিটি সংযোজনের জন্য উপযুক্ত পছন্দ।

Previous Next

Baidu-OCR-API দিয়ে শুরু করা

Baidu-OCR-API ইনস্টল করার সুপারিশকৃত পদ্ধতি হল npm ব্যবহার করা। মসৃণ ইনস্টলেশনের জন্য নিম্নলিখিত কমান্ড ব্যবহার করুন।

npm এর মাধ্যমে Baidu-OCR-API ইনস্টল করুন

 npm install baidu-ocr-api -g 

আপনি এটি ম্যানুয়ালি ইনস্টলও করতে পারেন; সরাসরি GitHub রিপোজিটরি থেকে সর্বশেষ রিলিজ ফাইলগুলো ডাউনলোড করুন।

Node.js অ্যাপে ছবি থেকে টেক্সট নিষ্কাশন

Baidu-OCR-API সফটওয়্যার ডেভেলপারদের জন্য ছবি লোড ও রিড এবং Node.js অ্যাপ্লিকেশনের মধ্যে টেক্সট নিষ্কাশনকে সহজ করে তোলে। সাধারণ টেক্সট স্বীকৃতি ফিচারটি ডেভেলপারদেরকে ছবি থেকে প্রিন্টেড টেক্সট লোড ও নিষ্কাশন করতে দেয়, যা বিস্তৃত ডকুমেন্টের জন্য উপযুক্ত। API JPEG, PNG, GIF, TIFF, PDF, BMP ইত্যাদি বিভিন্ন জনপ্রিয় ইমেজ ফাইল ফরম্যাটকে সমর্থন করে। নিচের উদাহরণটি দেখায় কীভাবে সফটওয়্যার ডেভেলপাররা Node.js অ্যাপ্লিকেশনের মধ্যে ছবি লোড করে টেক্সট স্বীকৃতি সম্পাদন করতে পারে।

Node.js অ্যাপে একটি ছবি লোড করে টেক্সট স্বীকৃতি কীভাবে সম্পাদন করবেন?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Node.js অ্যাপে ফর্ম ও টেবিল স্বীকৃতি

ওপেন সোর্স Baidu-OCR-API Node.js অ্যাপ্লিকেশনের মধ্যে ফর্ম ও টেবিল স্বীকৃতির জন্য সম্পূর্ণ কার্যকারিতা প্রদান করে। কাজটি সফলভাবে সম্পাদন করতে প্রথমে আপনার Baidu OCR ক্লায়েন্টকে API ক্রেডেনশিয়াল দিয়ে সেটআপ করুন। তারপর, একটি ছবি রিড করে ফর্ম ও টেবিল স্বীকৃতি সম্পাদনের কোড লিখুন। এই ফিচারটি গঠনমূলক ডকুমেন্ট থেকে ডেটা এক্সট্র্যাকশন স্বয়ংক্রিয় করতে এবং বিভিন্ন অ্যাপ্লিকেশনে উৎপাদনশীলতা বাড়াতে বিশেষভাবে উপযোগী। নিচে একটি সহজ উদাহরণ দেওয়া হয়েছে, যা দেখায় কীভাবে সফটওয়্যার ডেভেলপার একটি ছবি রিড করে Node.js পরিবেশে ফর্ম ও টেবিল স্বীকৃতি সম্পাদন করতে পারে।

Node.js অ্যাপে একটি ছবি রিড করে ফর্ম ও টেবিল স্বীকৃতি কীভাবে সম্পাদন করবেন?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Node.js API মাধ্যমে হ্যান্ডরাইটিং টেক্সট স্বীকৃতি

ওপেন সোর্স Baidu-OCR-API খুবই সহজে ব্যবহারযোগ্য এবং Node.js অ্যাপ্লিকেশনের মধ্যে হ্যান্ডরাইটিং টেক্সটকে উচ্চ নির্ভুলতার সঙ্গে স্বীকৃতি দিতে সক্ষম। লক্ষ্য অর্জনের জন্য ছবি ফাইলটি রিড করে base64 স্ট্রিং-এ রূপান্তর করা হয় এবং তারপর হ্যান্ডরাইটিং মেথডটি base64‑এনকোডেড ছবির সঙ্গে কল করা হয়; স্বীকৃত হ্যান্ডরাইটিং টেক্সটটি কনসোলে লগ করা হয়। নিচের উদাহরণটি দেখায় কীভাবে সফটওয়্যার ডেভেলপাররা ওপেন‑সোর্স Baidu OCR API ব্যবহার করে Node.js‑এ হ্যান্ডরাইটিং টেক্সট স্বীকৃতি সম্পাদন করতে পারে।

Node.js অ্যাপে হ্যান্ডরাইটিং টেক্সট স্বীকৃতি কীভাবে সম্পাদন করবেন?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word
 বাংলা