Node.js मुफ्त लाइब्रेरी स्कैन किए गए दस्तावेज़ से डेटा निकालने के लिए

शीर्ष ओपन सोर्स Node.js स्कैन किए गए दस्तावेज़ प्रोसेसिंग लाइब्रेरी Node.js ऐप्स के भीतर स्कैन किए गए दस्तावेज़ों को कुशलतापूर्वक लोड, पढ़, प्रोसेस और टेक्स्ट निकालने की अनुमति देती है।

DocumentVision क्या है?

आज के डिजिटल युग में, सभी आकार के संगठनों के लिए दस्तावेज़ों का कुशल प्रबंधन अत्यंत महत्वपूर्ण है। दस्तावेज़ों की बढ़ती मात्रा के साथ, उनकी अखंडता, सुरक्षा और पहुंच बनाए रखना चुनौतीपूर्ण हो सकता है। यहीं पर DocumentVision, एक ओपन-सोर्स लाइब्रेरी, काम आती है। DV एक शक्तिशाली ओपन सोर्स लाइब्रेरी है जो उन सॉफ़्टवेयर डेवलपर्स के लिए डिजाइन की गई है जिन्हें स्कैन किए गए दस्तावेज़ों के साथ काम करने की जरूरत होती है। Node.js पर बनी यह कई मजबूत तकनीकों का उपयोग करती है, जिसमें ऑप्टिकल कैरेक्टर रिकग्निशन (OCR) के लिए Tesseract, इमेज प्रोसेसिंग के लिए OpenCV, और बारकोड रीडिंग के लिए ZXing शामिल हैं। यह संयोजन सॉफ़्टवेयर डेवलपर्स को ऐसे एप्लिकेशन बनाने में सक्षम बनाता है जो दस्तावेज़ प्रबंधन कार्यों को कुशलतापूर्वक संभाल सकें।

DocumentVision एक Node.js लाइब्रेरी है जो Node.js एप्लिकेशनों के भीतर स्कैन किए गए दस्तावेज़ों को पढ़ने और प्रबंधित करने के लिए उपकरणों का व्यापक सेट प्रदान करती है। यह डेवलपर्स को दस्तावेज़ों से टेक्स्ट या इमेज लोड, पढ़ने, अपडेट करने, डिलीट करने या निकालने की अनुमति देती है, साथ ही केवल कुछ कोड लाइनों के साथ सर्चिंग, फ़िल्टरिंग और सॉर्टिंग जैसी उन्नत ऑपरेशन भी करती है। यह लाइब्रेरी लचीली और स्केलेबल होने के लिए डिज़ाइन की गई है, जिससे यह छोटे स्तर के दस्तावेज़ प्रबंधन सिस्टम से लेकर बड़े स्तर के एंटरप्राइज समाधान तक की व्यापक रेंज के अनुप्रयोगों के लिए उपयुक्त बनती है। सॉफ़्टवेयर डेवलपर्स के लिए, यह कच्चे दस्तावेज़ डेटा से निपटने की जटिलता को सरल बनाती है और स्कैन किए गए दस्तावेज़ों को संभालने, वर्कफ़्लो को ऑटोमेट करने, या इमेज से उपयोगी जानकारी निकालने वाले कस्टम एप्लिकेशनों के निर्माण की सुविधा देती है।

Previous Next

DocumentVision के साथ शुरूआत

DocumentVision को स्थापित करने के लिए, आप npm, जो JavaScript का पैकेज मैनेजर है, उपयोग कर सकते हैं। कृपया सफल इंस्टॉल के लिए निम्न कमांड्स उपयोग करें।

npm के माध्यम से DocumentVision स्थापित करें

$ npm install dv  

GitHub के माध्यम से DocumentVision स्थापित करें

clone https://github.com/creatale/node-dv.git

Node.js लाइब्रेरी के माध्यम से इमेज लोडिंग और मैनिपुलेशन

ओपन सोर्स DocumentVision लाइब्रेरी OpenCV के इंटेग्रेशन के माध्यम से सॉफ़्टवेयर डेवलपर्स को विभिन्न इमेज प्रोसेसिंग कार्य करने की अनुमति देती है। यह इमेज क्वालिटी को बेहतर बनाने, डाइमेंशन समायोजित करने, या बेहतर OCR परिणामों के लिए इमेज को प्रीप्रोसेस करने में सक्षम बनाती है। सॉफ़्टवेयर डेवलपर्स इमेज को लोड, रिसाइज़, रोटेट, और समायोजित कर सकते हैं ताकि प्रोसेसिंग से पहले उनकी क्वालिटी बढ़े। आप स्कैन किए गए दस्तावेज़ों को भी इमेज की तरह लोड कर सकते हैं और Node.js एप्लिकेशनों के भीतर से टेक्स्ट निकाल सकते हैं। नीचे एक उदाहरण दिया गया है जो दर्शाता है कि सॉफ़्टवेयर डेवलपर्स Node.js एप्लिकेशनों में इमेज को कैसे रिसाइज़ और रोटेट कर सकते हैं।

Node.js ऐप्स के भीतर इमेज को रिसाइज़ और रोटेट कैसे करें?

const image = new dv.Image('path/to/image.png');
// Resize and rotate the image
image.resize(800, 600).rotate(90).save('path/to/output.png')

Node.js में ऑप्टिकल कैरेक्टर रिकग्निशन (OCR)

DocumentVision Tesseract इंजन को एकीकृत करता है, जिससे उपयोगकर्ता स्कैन किए गए दस्तावेज़ों या इमेज से टेक्स्ट को Node.js एप्लिकेशनों के भीतर संपादन योग्य फ़ॉर्मेट में बदल सकते हैं। यह फ़ीचर दस्तावेज़ डिजिटलीकरण के लिए आवश्यक है, जिससे सॉफ़्टवेयर डेवलपर्स PDF या स्कैन किए गए JPEG जैसी इमेज फ़ाइलों से प्रिंटेड टेक्स्ट निकाल सकते हैं। नीचे दिया गया कोड उदाहरण दिखाता है कि डेवलपर्स Node.js वातावरण में PNG इमेज से टेक्स्ट कैसे लोड और निकाल सकते हैं।

Node.js ऐप्स के भीतर PNG इमेज से टेक्स्ट कैसे निकालें?

const dv = require('node-dv');
const ocr = new dv.OCR();

ocr.recognize('path/to/image.png', (err, text) => {
    if (err) {
        console.error('OCR Error:', err);
    } else {
        console.log('Extracted Text:', text);
    }
});

Node.js में बारकोड डिटेक्शन और डिकोडिंग

बारकोड रीडिंग ओपन सोर्स DocumentVision लाइब्रेरी की एक और आवश्यक फ़ीचर है, जो ZXing बारकोड स्कैनर के एकीकरण से संभव हुई है। यह कार्यक्षमता उन दस्तावेज़ों को प्रबंधित करने में उपयोगी है जिनमें बारकोड होते हैं, जैसे शिपिंग लेबल, इनवॉइस, या प्रोडक्ट जानकारी शीट। नीचे एक साधारण उदाहरण दिया गया है जो दिखाता है कि सॉफ़्टवेयर डेवलपर्स Node.js एप्लिकेशनों में बारकोड इमेज को कैसे लोड और डिकोड कर सकते हैं।

Node.js ऐप्स के भीतर बारकोड इमेज को लोड और डिकोड कैसे करें?

const barcode = new dv.Barcode();
barcode.decode('path/to/barcode.png', (err, result) => {
    if (err) {
        console.error('Barcode Error:', err);
    } else {
        console.log('Decoded Barcode:', result);
    }
}); 

कस्टमाइज़ेबल वर्कफ़्लो

DocumentVision डेवलपर्स को स्कैन किए गए दस्तावेज़ों के साथ काम करने वाले कस्टम एप्लिकेशन बनाने के लिए एक मजबूत और लचीला प्लेटफ़ॉर्म प्रदान करता है। लाइब्रेरी कस्टमाइज़ेशन की अनुमति देती है, जिससे डेवलपर्स अपनी विशिष्ट आवश्यकताओं के अनुसार प्रोसेसिंग पाइपलाइन को अनुकूलित कर सकते हैं। यह लचीलापन विशिष्ट उपयोग मामलों के लिए अधिक कुशल वर्कफ़्लो बनाने में मदद कर सकता है।

 हिन्दी