ओसीआर क्षमताओं को एकीकृत करने और टेक्स्ट निकालने के लिए निःशुल्क पायथन एपीआई
छवियों और दस्तावेज़ों से सटीक और तेज़ टेक्स्ट पहचान के लिए ओपन सोर्स पायथन ओसीआर एपीआई। पायथन लाइब्रेरी का उपयोग करके दस्तावेज़ में प्राकृतिक दृश्य पाठ और सघन पाठ दोनों पढ़ें।
ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) तकनीक कुछ समय से मौजूद है, और इसका उपयोग विभिन्न उद्योगों में डेटा प्रविष्टि और दस्तावेज़ प्रसंस्करण कार्यों को स्वचालित करने के लिए किया जाता है। EasyOCR एक ओपन-सोर्स OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) इंजन है जो तेज़, सटीक और उपयोग में आसान है। यह डेवलपर्स को अपने अनुप्रयोगों में ओसीआर को एकीकृत करने के लिए उपयोग में आसान इंटरफ़ेस प्रदान करता है। EasyOCR लाइब्रेरी के साथ, सॉफ़्टवेयर डेवलपर कुछ ही सेकंड में छवियों और स्कैन किए गए दस्तावेज़ों से टेक्स्ट निकाल सकते हैं, जिससे यह दस्तावेज़ प्रबंधन, डेटा निष्कर्षण और स्वचालन के लिए एक आदर्श उपकरण बन जाता है।
ईज़ीओसीआर पायथन में लिखा गया है और 80+ से अधिक भाषाओं में समर्थित है, जो इसे बहुभाषी वातावरण में काम करने वाले व्यवसायों के लिए एक शक्तिशाली उपकरण बनाता है। लाइब्रेरी में कई महत्वपूर्ण विशेषताएं हैं जैसे सटीक पाठ निष्कर्षण, बहु-भाषा समर्थन, मौजूदा अनुप्रयोगों के साथ सरल एकीकरण, आपकी विशिष्ट आवश्यकताओं को पूरा करने के लिए ओसीआर इंजन को अनुकूलित करना, लागत प्रभावी समाधान, स्कैन किए गए दस्तावेज़ों से पाठ निकालना, प्राप्त करना और संग्रहीत करना निकाला गया पाठ, और भी बहुत कुछ। एपीआई एक क्लाउड-आधारित समाधान है जिसके लिए किसी हार्डवेयर या सॉफ़्टवेयर इंस्टॉलेशन की आवश्यकता नहीं होती है, जो इसे सभी आकार के व्यवसायों के लिए एक लागत प्रभावी समाधान बनाता है।
ईज़ीओसीआर एपीआई उच्च सटीकता दर प्राप्त करने के लिए गहन शिक्षण एल्गोरिदम का उपयोग करता है और बड़ी मात्रा में डेटा को जल्दी से संसाधित कर सकता है। यह एक लचीला और स्केलेबल समाधान है जिसे एक सरल RESTful API का उपयोग करके मौजूदा वर्कफ़्लो में एकीकृत किया जा सकता है। ईज़ीओसीआर एपीआई एक शक्तिशाली ओसीआर समाधान है जो सभी आकार के व्यवसायों को उनकी डेटा प्रविष्टि प्रक्रियाओं को स्वचालित करने, सटीकता में सुधार करने और लागत कम करने में मदद कर सकता है। कई भाषाओं के समर्थन के साथ, यह दस्तावेज़ प्रबंधन, डेटा निष्कर्षण और स्वचालन के लिए एक आदर्श उपकरण है। यदि आप अपने एप्लिकेशन में एकीकृत करने के लिए OCR इंजन की तलाश कर रहे हैं, तो EasyOCR को आज़माएं।
EasyOCR के साथ शुरुआत करना
EasyOCR को स्थापित करने का अनुशंसित तरीका पाइप का उपयोग करना है। कृपया सुचारू इंस्टालेशन के लिए निम्नलिखित कमांड का उपयोग करें।
पाइप के माध्यम से EasyOCR इंस्टॉल करें
pip install easyocr
आप इसे मैन्युअल रूप से भी इंस्टॉल कर सकते हैं; नवीनतम रिलीज़ फ़ाइलें सीधे GitHub रिपोजिटरी
से डाउनलोड करें।पायथन एपीआई के माध्यम से छवि से पाठ पढ़ना और निकालना
ओपन सोर्स ईज़ीओसीआर एपीआई पायथन अनुप्रयोगों के अंदर छवियों और पीडीएफ फाइलों से टेक्स्ट को लोड करने, पहचानने और निकालने के लिए गहन शिक्षण एल्गोरिदम का उपयोग करता है। EasyOCR एक ही समय में कई भाषाएँ पढ़ सकता है लेकिन उन्हें एक-दूसरे के साथ संगत होना होगा। वे भाषाएँ जो अधिकांश चरित्र (जैसे लैटिन लिपि) को एक-दूसरे से साझा करती हैं, संगत होती हैं। एपीआई छवियों से पाठ को पढ़ने और निकालने की अनुमति देता है, जिसमें छवियों को प्रीप्रोसेस करना और सटीकता में सुधार के लिए ओसीआर इंजन के मापदंडों को समायोजित करना शामिल है। निम्नलिखित उदाहरण दिखाता है कि छवियों से पाठ को कैसे पढ़ा और निकाला जाए और डेटा प्रविष्टि कार्यों को आसानी से स्वचालित किया जाए।
पायथन एपीआई के माध्यम से छवियों से टेक्स्ट पढ़ें और निकालें
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')
# Use the OCR engine to extract text from the image.
result = reader.readtext(image, detail=0)
पायथन एपीआई के माध्यम से टेक्स्ट बॉक्स से वर्णों को पहचानना
टेक्स्ट बॉक्स से अक्षरों को पहचानना OCR इंजनों के लिए एक सामान्य उपयोग का मामला है। ओपन सोर्स ईज़ीओसीआर एपीआई इस उपयोग के मामले में एक शक्तिशाली और उपयोगकर्ता के अनुकूल समाधान प्रदान करता है। यह सॉफ़्टवेयर डेवलपर्स को टेक्स्ट बॉक्स से वर्णों को आसानी से पहचानने और छवियों को प्रीप्रोसेस करने और सटीकता में सुधार करने के लिए ओसीआर इंजन के मापदंडों को समायोजित करने में मदद करता है। टेक्स्ट बॉक्स में अलग-अलग आकार, आकार और अभिविन्यास हो सकते हैं, और यह ओसीआर इंजन की सटीकता को प्रभावित कर सकता है। इसलिए कुछ प्रीप्रोसेसिंग चरणों को लागू करने से ओसीआर इंजन की सटीकता में सुधार हो सकता है, जैसे कि छवि को डेस्क्यू करना, बाइनराइजेशन लागू करना और शोर में कमी लागू करना।
पायथन एपीआई के माध्यम से टेक्स्ट बॉक्स से वर्णों को कैसे पहचानें?
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')
# OCR engine to recognize the characters in the text box
result = reader.readtext(image, detail=0)
# The result is a list of strings, where each string represents a recognized character in the text box.