Free Node.js API to Recognize & Extract Text from Images
A Free Node.js is a Leading Node.js API that Offers High Accuracy in Text Recognition Across Multiple Languages and a Variety of Fonts and Layouts.
আজকের AI‑চালিত ডেভেলপমেন্ট জগতে, অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ইমেজ ও ডকুমেন্ট থেকে টেক্সট স্বয়ংক্রিয়ভাবে বের করার জন্য অপরিহার্য হয়ে উঠেছে। Node.js‑এ OCR তৈরি করতে চাওয়া ডেভেলপাররা Baidu-OCR-API থেকে ব্যাপকভাবে উপকৃত হতে পারেন; এটি একটি শক্তিশালী টুল যা ইমেজ থেকে টেক্সট এক্সট্র্যাক্ট, হ্যান্ডরাইটিং টেক্সট স্বীকৃতি, এবং এমনকি ফর্ম স্বীকৃতি মতো উন্নত কাজগুলোকে সমর্থন করে। ইনভয়েস স্ক্যান করা, ডকুমেন্ট ডিজিটাইজ করা, অথবা অ্যাক্সেসিবিলিটি ফিচার সক্রিয় করা যাই হোক, এই Node.js OCR লাইব্রেরি উচ্চ পারফরম্যান্স প্রদান করে এবং আধুনিক অ্যাপ্লিকেশনের সাথে সহজে ইন্টিগ্রেট করা যায়।
Baidu-OCR-API একটি ফ্রি Node.js OCR API যা ডিপ লার্নিং ব্যবহার করে প্রিন্টেড ও হ্যান্ডরাইটেড টেক্সটকে বহু ভাষা, যেমন চীনা, ইংরেজি, জাপানি ইত্যাদিতে স্বীকৃতি দেয়। এটি Node.js‑এ টেবিল স্বীকৃতি, ব্যবসায়িক ডকুমেন্ট স্ক্যানিং, এবং কম আলো বা বিকৃত ইমেজের মতো জটিল শর্তে টেক্সট স্বীকৃতিতে উৎকৃষ্ট। ডেভেলপাররা প্রাকৃতিক দৃশ্যের মধ্যে টেক্সট স্বীকৃতিও করতে পারেন, যা মোবাইল অ্যাপ, অগমেন্টেড রিয়েলিটি, এবং রিয়েল‑টাইম ট্রান্সলেশন ব্যবহার ক্ষেত্রে আদর্শ। এর সঠিক স্বীকৃতি ও বহুমুখী ব্যবহারিক ক্ষেত্রের সঙ্গে, Baidu-OCR-API যে কোনো ডেভেলপারকে Node.js অ্যাপ্লিকেশনে নির্ভরযোগ্য OCR ফাংশনালিটি সংযোজনের জন্য আদর্শ পছন্দ।
Baidu-OCR-API দিয়ে শুরু করা
প্রস্তাবিত পদ্ধতি হল npm ব্যবহার করে Baidu-OCR-API ইনস্টল করা। মসৃণ ইনস্টলেশনের জন্য নিচের কমান্ডটি ব্যবহার করুন।
npm দিয়ে Baidu-OCR-API ইনস্টল করুন
npm install baidu-ocr-api -g আপনি ম্যানুয়ালি ইনস্টল করতে পারেন; সর্বশেষ রিলিজ ফাইলগুলি সরাসরি GitHub রিপোজিটরি থেকে ডাউনলোড করুন।
Node.js অ্যাপের মধ্যে ইমেজ থেকে টেক্সট এক্সট্র্যাক্ট করা
Baidu-OCR-API সফটওয়্যার ডেভেলপারদেরকে Node.js অ্যাপ্লিকেশনে ইমেজ লোড ও রিড করে টেক্সট এক্সট্র্যাক্ট করা সহজ করে দেয়। জেনারেল টেক্সট রিকগনিশন ফিচারটি ডেভেলপারদেরকে প্রিন্টেড টেক্সট লোড ও এক্সট্র্যাক্ট করার সুযোগ দেয়, যা বিভিন্ন ডকুমেন্টের জন্য উপযোগী। API JPEG, PNG, GIF, TIFF, PDF, BMP ইত্যাদি জনপ্রিয় ইমেজ ফরম্যাট সমর্থন করে। নিচের উদাহরণটি দেখায় কীভাবে ডেভেলপাররা Node.js অ্যাপের মধ্যে ইমেজ লোড করে টেক্সট রিকগনিশন সম্পাদন করতে পারেন।
Node.js অ্যাপের মধ্যে একটি ইমেজ লোড করে টেক্সট রিকগনিশন কীভাবে সম্পাদন করবেন?
//Read image
const fs = require('fs');
// Read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
const image = readImage('path_to_your_image.jpg');
// Perform OCR
client.generalBasic(image).then(result => {
console.log('Recognized Text:');
result.words_result.forEach(wordInfo => {
console.log(wordInfo.words);
});
}).catch(err => {
console.error(err);
});
Node.js অ্যাপের মধ্যে ফর্ম ও টেবিল রিকগনিশন
ওপেন সোর্স Baidu-OCR-API Node.js অ্যাপ্লিকেশনে ফর্ম ও টেবিল রিকগনিশনের সম্পূর্ণ কার্যকারিতা প্রদান করে। কাজটি সফলভাবে সম্পাদন করতে প্রথমে আপনার API ক্রেডেনশিয়াল দিয়ে Baidu OCR ক্লায়েন্ট সেটআপ করতে হবে। এরপর ইমেজ রিড করে ফর্ম ও টেবিল রিকগনিশন সম্পাদনের কোড লিখুন। এই ফিচারটি স্ট্রাকচার্ড ডকুমেন্ট থেকে ডেটা এক্সট্র্যাকশন অটোমেট করতে এবং বিভিন্ন অ্যাপ্লিকেশনে প্রোডাক্টিভিটি বাড়াতে বিশেষভাবে উপযোগী। নিচে একটি সহজ উদাহরণ রয়েছে যা দেখায় কীভাবে ডেভেলপাররা Node.js পরিবেশে ইমেজ রিড করে ফর্ম ও টেবিল রিকগনিশন সম্পাদন করতে পারেন।
Node.js অ্যাপের মধ্যে ইমেজ রিড করে ফর্ম ও টেবিল রিকগনিশন কীভাবে সম্পাদন করবেন?
const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');
// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';
// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);
// Function to read the image file and convert it to base64
function readImage(filePath) {
return fs.readFileSync(filePath, { encoding: 'base64' });
}
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Form and Table Recognition
client.form(image).then(result => {
console.log('Form and Table Data:');
console.log(JSON.stringify(result, null, 2));
}).catch(err => {
console.error('Error:', err);
});
Node.js API দিয়ে হ্যান্ডরাইটিং টেক্সট রিকগনিশন
ওপেন সোর্স Baidu-OCR-API ব্যবহার করা খুবই সহজ এবং এটি Node.js অ্যাপ্লিকেশনে হ্যান্ডরাইটেন টেক্সটকে উচ্চ নির্ভুলতার সঙ্গে স্বীকৃতি দিতে সক্ষম। লক্ষ্য অর্জনের জন্য ইমেজ ফাইলটি রিড করে base64 স্ট্রিং-এ রূপান্তর করা হয় এবং তারপর হ্যান্ডরাইটিং মেথডটি base64‑এনকোডেড ইমেজের সঙ্গে কল করা হয়; স্বীকৃত হ্যান্ডরাইটেন টেক্সটটি কনসোলে লগ করা হয়। নিচের উদাহরণটি দেখায় কীভাবে ডেভেলপাররা Node.js-এ ওপেন‑সোর্স Baidu OCR API ব্যবহার করে হ্যান্ডরাইটিং টেক্সট রিকগনিশন সম্পাদন করতে পারেন।
Node.js অ্যাপের মধ্যে হ্যান্ডরাইটিং টেক্সট রিকগনিশন কীভাবে সম্পাদন করবেন?
// Path to your image
const image = readImage('path_to_your_image.jpg');
// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
console.log('Recognized Handwritten Text:');
result.words_result.forEach(wordInfo => {
console.log(word