वेब ऐप्स में ओसीआर जोड़ने और प्रबंधित करने के लिए ओपन सोर्स जावास्क्रिप्ट एपीआई
जेएस वेब ऐप्स में ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) कार्यक्षमता जोड़ने और मुद्रित या हस्तलिखित टेक्स्ट की छवियों को मुफ्त में मशीन-पठनीय टेक्स्ट में बदलने के लिए एक अग्रणी मुफ्त जावास्क्रिप्ट लाइब्रेरी।
Tesseract.js एक बहुत ही उपयोगी ओपन-सोर्स जावास्क्रिप्ट लाइब्रेरी है जो सॉफ्टवेयर डेवलपर्स को न्यूनतम प्रयास और लागत के साथ अपने वेब अनुप्रयोगों के अंदर ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) कार्यक्षमता को एकीकृत करने में सक्षम बनाता है। ओसीआर मुद्रित या हस्तलिखित पाठ की छवियों को मशीन-पठनीय पाठ में परिवर्तित करने की प्रक्रिया है। Tesseract.js लोकप्रिय Tesseract OCR इंजन का एक पोर्ट है, जिसे मूल रूप से 1980 के दशक में Hewlett-Packard द्वारा विकसित किया गया था और बाद में Google द्वारा बनाए रखा गया था। Tesseract.js 100 से अधिक भाषाओं को पहचान सकता है, जिससे यह उन डेवलपर्स के लिए एक शक्तिशाली उपकरण बन गया है जो अपने वेब अनुप्रयोगों में OCR कार्यक्षमता जोड़ना चाहते हैं।
Tesseract.js को संभालना बहुत आसान है और इसका उपयोग विभिन्न प्रकार के कार्यों के लिए किया जा सकता है, जैसे स्कैन किए गए दस्तावेज़ों, रसीदों और बिजनेस कार्डों से टेक्स्ट निकालना, डेटा प्रविष्टि कार्यों को स्वचालित करना और साथ ही वेब अनुप्रयोगों के भीतर खोज कार्यक्षमता को बढ़ाना। Tesseract.js के प्रमुख लाभों में से एक इनपुट छवि खराब गुणवत्ता या रिज़ॉल्यूशन होने पर भी टेक्स्ट को पहचानने की क्षमता है। OCR परिणामों की सटीकता में सुधार के लिए लाइब्रेरी मशीन लर्निंग एल्गोरिदम का उपयोग करती है। यह पेज लेआउट विश्लेषण भी कर सकता है और छवि के भीतर रुचि के क्षेत्रों का पता लगा सकता है।
Tesseract.js अपने उपयोग में आसानी के साथ-साथ शक्तिशाली OCR क्षमताओं के कारण लोकप्रिय हो रहा है और इसे ब्राउज़र में या NodeJS वाले सर्वर पर आसानी से चलाया जा सकता है। यह एक सरल एपीआई प्रदान करता है जो सॉफ्टवेयर डेवलपर्स को भाषा, पृष्ठ विभाजन मोड और श्वेतसूची वर्ण जैसे ओसीआर विकल्पों को कॉन्फ़िगर करने की अनुमति देता है। खराब गुणवत्ता वाली छवियों से पाठ को पहचानने की इसकी क्षमता और कई भाषाओं के लिए समर्थन इसे अनुप्रयोगों की एक विस्तृत श्रृंखला के लिए एक मूल्यवान उपकरण बनाता है और अपने वेब अनुप्रयोगों में ओसीआर जोड़ने के इच्छुक डेवलपर्स के लिए एक उत्कृष्ट विकल्प बनाता है।
Tesseract.js के साथ शुरुआत करना
Tesseract.js को स्थापित करने का अनुशंसित तरीका npm का उपयोग करना है। कृपया सुचारू इंस्टालेशन के लिए निम्नलिखित कमांड का उपयोग करें
Tesseract.jsvia npm
इंस्टॉल करें npm install tesseract.js
आप इसे मैन्युअल रूप से भी इंस्टॉल कर सकते हैं; नवीनतम रिलीज़ फ़ाइलें सीधे GitHub रिपॉजिटरी से डाउनलोड करें।
जावास्क्रिप्ट एपीआई के माध्यम से छवि को टेक्स्ट में बदलें
ओपन सोर्स जावास्क्रिप्ट लाइब्रेरी Tesseract.js सॉफ्टवेयर डेवलपर्स के लिए बीएमपी, जेपीजी, पीएनजी, पीबीएम, वेबपी और अन्य विभिन्न प्रकार की छवियों के साथ काम करना आसान बनाती है। लाइब्रेरी छवियों, पीडीएफ और स्कैन किए गए दस्तावेज़ों पर पाठ के प्रसंस्करण को स्वचालित करने के लिए छवियों से पाठ निकालने का समर्थन करती है। निम्नलिखित उदाहरण दिखाता है कि कोड की केवल कुछ पंक्तियों के साथ एक छवि को कैसे लोड किया जाए और उसमें से टेक्स्ट कैसे निकाला जाए। भाषा तर्क का उपयोग छवियों के प्रसंस्करण में उपयोग किए जाने वाले प्रशिक्षित भाषा डेटा को निर्धारित करने के लिए किया जाता है। सॉफ़्टवेयर डेवलपर यहां अनेक भाषाओं का उपयोग कर सकते हैं.
जावास्क्रिप्ट एपीआई का उपयोग करके छवि को टेक्स्ट में कैसे बदलें?
Tesseract.recognize(
image,language,
{
logger: m => console.log(m)
}
)
.catch (err => {
console.error(err);
})
.then(result => {
console.log(result);
})
}
एक छवि क्षेत्र पढ़ें और JS API के माध्यम से टेक्स्ट निकालें
ओपन सोर्स जावास्क्रिप्ट लाइब्रेरी में एक छवि के अंदर किसी विशेष क्षेत्र को पढ़ने और जावास्क्रिप्ट अनुप्रयोगों के अंदर उसके डेटा को कैप्चर करने के लिए बहुत उपयोगी सुविधाएं शामिल हैं। एपीआई छवि क्षेत्र को कैप्चर करने का समर्थन करता है और आंतरिक शक्तिशाली ओसीआर इंजन का उपयोग करके इस क्षेत्र के अंदर पाठ को पहचानने का प्रयास करता है। निम्नलिखित उदाहरण दिखाते हैं कि सॉफ़्टवेयर डेवलपर छवि को यूआरएल कैसे प्रदान कर सकते हैं और एपीआई चयनित क्षेत्र में टेक्स्ट को आसानी से पहचान और पहचान सकता है।
JS API के माध्यम से किसी छवि के चयनित क्षेत्र में टेक्स्ट को पढ़ें और पहचानें
const { createWorker } = require('tesseract.js');
const worker = await createWorker();
const rectangle = { left: 0, top: 0, width: 500, height: 250 };
(async () => {
await worker.loadLanguage('eng');
await worker.initialize('eng');
const { data: { text } } = await worker.recognize('https://tesseract.projectnaptha.com/img/eng_bw.png', { rectangle });
console.log(text);
await worker.terminate();
})();