नि:शुल्क Node.js API जो छवियों से पाठ को पहचानता और निकालता है

एक नि:शुल्क Node.js अग्रणी Node.js API है जो कई भाषाओं और विभिन्न फ़ॉन्ट व लेआउट में पाठ पहचान की उच्च सटीकता प्रदान करता है.

आज के AI‑प्रेरित विकास संसार में, ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) छवियों और दस्तावेज़ों से पाठ को स्वचालित रूप से निकालने के लिए अनिवार्य हो गया है। Node.js में OCR बनाने की इच्छा रखने वाले डेवलपर्स Baidu-OCR-API से बहुत लाभ उठा सकते हैं, जो छवियों से पाठ निकालने, हस्तलेख पहचान, और यहाँ तक कि फॉर्म पहचान जैसे उन्नत कार्यों को भी सपोर्ट करता है। चाहे इनवॉइस स्कैन करना हो, दस्तावेज़ों को डिजिटल बनाना हो, या एक्सेसिबिलिटी फीचर जोड़ना हो, यह Node.js OCR लाइब्रेरी उच्च प्रदर्शन देती है और आधुनिक एप्लिकेशन में आसानी से एकीकृत की जा सकती है।

Baidu-OCR-API एक नि:शुल्क Node.js OCR API है जो डीप लर्निंग का उपयोग करके प्रिंटेड और हस्तलेखित पाठ को कई भाषाओं में पहचानता है, जिनमें चीनी, अंग्रेज़ी, जापानी आदि शामिल हैं। यह Node.js में टेबल पहचान, व्यावसायिक दस्तावेज़ स्कैनिंग, और कम रोशनी या विकृत छवियों जैसी जटिल स्थितियों में भी उत्कृष्ट है। डेवलपर्स प्राकृतिक दृश्यों में भी पाठ पहचान सकते हैं, जिससे यह मोबाइल ऐप, ऑगमेंटेड रियलिटी और रियल‑टाइम ट्रांसलेशन उपयोग मामलों के लिए आदर्श बन जाता है। सटीक पहचान और बहुमुखी उपयोग मामलों के साथ, Baidu-OCR-API उन सभी डेवलपर्स के लिए एक उत्तम विकल्प है जो अपने Node.js एप्लिकेशन में भरोसेमंद OCR कार्यक्षमता जोड़ना चाहते हैं।

एक नज़र में

Baidu-OCR-API की विशेषताओं का एक अवलोकन।

Features Overview

OCR करें
OCR क्षमताएँ जोड़ें
छवि पाठ को पहचानें
पाठ वाली छवियों को परिवर्तित करें
फ़ॉन्ट पाठ को पहचानें
PDF खोजें
100 से अधिक भाषाएँ
OCR ऐप बनाएं
ब्राउज़र में सहेजें
पाठ निकालें
मल्टी‑थ्रेडिंग समर्थन

Baidu-OCR-API

Baidu-OCR-API नीचे सूचीबद्ध लोकप्रिय छवि फ़ाइल फ़ॉर्मेट को सपोर्ट करता है।

रीडर

PNG, JPEG, BMP, TIFF, TGA, DICOM

राइटर

PNG, JPEG, BMP, TIFF

Baidu-OCR-API

प्लेटफ़ॉर्म स्वतंत्रता

Baidu-OCR-API किसी भी जावा‑आधारित प्रोग्रामिंग भाषा के साथ काम कर सकता है

Java

Baidu-OCR-API

Baidu-OCR-API के साथ शुरूआत

सिफ़ारिश किया गया तरीका Baidu-OCR-API को npm के माध्यम से स्थापित करना है। सुगम स्थापना के लिए नीचे दिया गया कमांड उपयोग करें।

npm के माध्यम से Baidu-OCR-API स्थापित करें

 npm install baidu-ocr-api -g

आप इसे मैन्युअली भी स्थापित कर सकते हैं; नवीनतम रिलीज़ फ़ाइलें सीधे GitHub रिपोज़िटरी से डाउनलोड करें।

Node.js एप्लिकेशन में छवियों से पाठ निकालें

Baidu-OCR-API सॉफ्टवेयर डेवलपर्स को छवियों को लोड करने, पढ़ने और Node.js एप्लिकेशन में पाठ निकालने में आसानी प्रदान करता है। सामान्य पाठ पहचान सुविधा डेवलपर्स को छवियों से प्रिंटेड पाठ को लोड करने और निकालने की अनुमति देती है, जो विभिन्न दस्तावेज़ों के लिए उपयुक्त है। API ने JPEG, PNG, GIF, TIFF, PDF, BMP आदि सहित कई लोकप्रिय छवि फ़ाइल फ़ॉर्मेट को सपोर्ट किया है। नीचे दिया गया उदाहरण दिखाता है कि कैसे सॉफ्टवेयर डेवलपर्स Node.js एप्लिकेशन में छवि को लोड करके पाठ पहचान कर सकते हैं।

Node.js एप्लिकेशन में छवि को लोड करके पाठ पहचान कैसे करें?

//Read image

const fs = require('fs');

// Read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

const image = readImage('path_to_your_image.jpg');

// Perform OCR
client.generalBasic(image).then(result => {
    console.log('Recognized Text:');
    result.words_result.forEach(wordInfo => {
        console.log(wordInfo.words);
    });
}).catch(err => {
    console.error(err);
});

Node.js एप्लिकेशन में फ़ॉर्म और टेबल पहचान

ओपन‑सोर्स Baidu-OCR-API ने Node.js एप्लिकेशन में फ़ॉर्म और टेबल पहचान के लिए पूर्ण कार्यक्षमता प्रदान की है। कार्य सफलतापूर्वक करने के लिए पहले आपको अपने Baidu OCR क्लाइंट को API क्रेडेंशियल्स के साथ सेट‑अप करना होगा। फिर, छवि को पढ़ने और फ़ॉर्म व टेबल पहचान करने के लिए कोड लिखें। यह सुविधा संरचित दस्तावेज़ों से डेटा निष्कर्षण को स्वचालित करने और विभिन्न एप्लिकेशन में उत्पादकता बढ़ाने में विशेष रूप से उपयोगी है। नीचे एक सरल उदाहरण है जो दिखाता है कि कैसे सॉफ्टवेयर डेवलपर Node.js वातावरण में छवि को पढ़कर फ़ॉर्म व टेबल पहचान कर सकता है।

Node.js एप्लिकेशन में छवि को पढ़कर फ़ॉर्म और टेबल पहचान कैसे करें?

const BaiduOCR = require('baidu-ocr-api');
const fs = require('fs');

// Your API credentials
const APP_ID = 'your-app-id';
const API_KEY = 'your-api-key';
const SECRET_KEY = 'your-secret-key';

// Initialize the Baidu OCR client
const client = new BaiduOCR(APP_ID, API_KEY, SECRET_KEY);

// Function to read the image file and convert it to base64
function readImage(filePath) {
    return fs.readFileSync(filePath, { encoding: 'base64' });
}

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Form and Table Recognition
client.form(image).then(result => {
    console.log('Form and Table Data:');
    console.log(JSON.stringify(result, null, 2));
}).catch(err => {
    console.error('Error:', err);
});

Node.js API के माध्यम से हस्तलेख पाठ पहचान

ओपन‑सोर्स Baidu-OCR-API बहुत आसान है और Node.js एप्लिकेशन में उच्च सटीकता के साथ हस्तलेखित पाठ को पहचानने में पूरी तरह सक्षम है। लक्ष्य प्राप्त करने के लिए छवि फ़ाइल को पढ़कर उसे base64 स्ट्रिंग में परिवर्तित किया जाता है और फिर handwriting मेथड को base64‑एन्कोडेड छवि के साथ कॉल किया जाता है, तथा पहचाना गया हस्तलेखित पाठ कंसोल में लॉग किया जाता है। नीचे दिया गया उदाहरण दिखाता है कि कैसे सॉफ्टवेयर डेवलपर्स ओपन‑सोर्स Baidu OCR API का उपयोग करके Node.js में हस्तलेख पाठ पहचान कर सकते हैं।

Node.js एप्लिकेशन में हस्तलेख पाठ पहचान कैसे करें?

// Path to your image
const image = readImage('path_to_your_image.jpg');

// Perform Handwriting Text Recognition
client.handwriting(image).then(result => {
    console.log('Recognized Handwritten Text:');
    result.words_result.forEach(wordInfo => {
        console.log(word