ओसीआर क्षमताओं को एकीकृत करने और टेक्स्ट निकालने के लिए निःशुल्क पायथन एपीआई

छवियों और दस्तावेज़ों से सटीक और तेज़ टेक्स्ट पहचान के लिए ओपन सोर्स पायथन ओसीआर एपीआई। पायथन लाइब्रेरी का उपयोग करके दस्तावेज़ में प्राकृतिक दृश्य पाठ और सघन पाठ दोनों पढ़ें।

ऑप्टिकल कैरेक्टर रिकॉग्निशन (ओसीआर) तकनीक कुछ समय से मौजूद है, और इसका उपयोग विभिन्न उद्योगों में डेटा प्रविष्टि और दस्तावेज़ प्रसंस्करण कार्यों को स्वचालित करने के लिए किया जाता है। EasyOCR एक ओपन-सोर्स OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) इंजन है जो तेज़, सटीक और उपयोग में आसान है। यह डेवलपर्स को अपने अनुप्रयोगों में ओसीआर को एकीकृत करने के लिए उपयोग में आसान इंटरफ़ेस प्रदान करता है। EasyOCR लाइब्रेरी के साथ, सॉफ़्टवेयर डेवलपर कुछ ही सेकंड में छवियों और स्कैन किए गए दस्तावेज़ों से टेक्स्ट निकाल सकते हैं, जिससे यह दस्तावेज़ प्रबंधन, डेटा निष्कर्षण और स्वचालन के लिए एक आदर्श उपकरण बन जाता है।

ईज़ीओसीआर पायथन में लिखा गया है और 80+ से अधिक भाषाओं में समर्थित है, जो इसे बहुभाषी वातावरण में काम करने वाले व्यवसायों के लिए एक शक्तिशाली उपकरण बनाता है। लाइब्रेरी में कई महत्वपूर्ण विशेषताएं हैं जैसे सटीक पाठ निष्कर्षण, बहु-भाषा समर्थन, मौजूदा अनुप्रयोगों के साथ सरल एकीकरण, आपकी विशिष्ट आवश्यकताओं को पूरा करने के लिए ओसीआर इंजन को अनुकूलित करना, लागत प्रभावी समाधान, स्कैन किए गए दस्तावेज़ों से पाठ निकालना, प्राप्त करना और संग्रहीत करना निकाला गया पाठ, और भी बहुत कुछ। एपीआई एक क्लाउड-आधारित समाधान है जिसके लिए किसी हार्डवेयर या सॉफ़्टवेयर इंस्टॉलेशन की आवश्यकता नहीं होती है, जो इसे सभी आकार के व्यवसायों के लिए एक लागत प्रभावी समाधान बनाता है।

ईज़ीओसीआर एपीआई उच्च सटीकता दर प्राप्त करने के लिए गहन शिक्षण एल्गोरिदम का उपयोग करता है और बड़ी मात्रा में डेटा को जल्दी से संसाधित कर सकता है। यह एक लचीला और स्केलेबल समाधान है जिसे एक सरल RESTful API का उपयोग करके मौजूदा वर्कफ़्लो में एकीकृत किया जा सकता है। ईज़ीओसीआर एपीआई एक शक्तिशाली ओसीआर समाधान है जो सभी आकार के व्यवसायों को उनकी डेटा प्रविष्टि प्रक्रियाओं को स्वचालित करने, सटीकता में सुधार करने और लागत कम करने में मदद कर सकता है। कई भाषाओं के समर्थन के साथ, यह दस्तावेज़ प्रबंधन, डेटा निष्कर्षण और स्वचालन के लिए एक आदर्श उपकरण है। यदि आप अपने एप्लिकेशन में एकीकृत करने के लिए OCR इंजन की तलाश कर रहे हैं, तो EasyOCR को आज़माएं।

एक नज़र में

EasyOCR सुविधाओं का अवलोकन।

सुविधाओं का अवलोकन

ओसीआर निष्पादित करें
ओसीआर क्षमताएं जोड़ें
छवि पाठ को पहचानें
पाठ की छवियों को संयोजित करें
मान्यताप्राप्त फ़ॉन्ट टेक्स्ट
पीडीएफ खोजें
अन्य भाषाएँ
ओसीआर ऐप्स बनाएं
ब्राउज़र में सहेजें
पाठ निकालें
मल्टी-थ्रेडिंग सपोर्ट

EasyOCR

EasyOCR नीचे सूचीबद्ध लोकप्रिय छवि फ़ाइल स्वरूपों का समर्थन करता है।

पाठक

PNG, JPEG, BMP, TIFF, TGA, DICOM

लेखक

PNG, JPEG, BMP, TIFF

EasyOCR

प्लेटफ़ॉर्म इंडिपेंडेंस

EasyOCR Python 2.7 और इसके बाद के संस्करण के साथ काम कर सकता है।

पायथन 2.7 और ऊपर।

EasyOCR

EasyOCR के साथ शुरुआत करना

EasyOCR को स्थापित करने का अनुशंसित तरीका पाइप का उपयोग करना है। कृपया सुचारू इंस्टालेशन के लिए निम्नलिखित कमांड का उपयोग करें।

पाइप के माध्यम से EasyOCR इंस्टॉल करें

 pip install easyocr

आप इसे मैन्युअल रूप से भी इंस्टॉल कर सकते हैं; नवीनतम रिलीज़ फ़ाइलें सीधे GitHub रिपोजिटरी

से डाउनलोड करें।

पायथन एपीआई के माध्यम से छवि से पाठ पढ़ना और निकालना

ओपन सोर्स ईज़ीओसीआर एपीआई पायथन अनुप्रयोगों के अंदर छवियों और पीडीएफ फाइलों से टेक्स्ट को लोड करने, पहचानने और निकालने के लिए गहन शिक्षण एल्गोरिदम का उपयोग करता है। EasyOCR एक ही समय में कई भाषाएँ पढ़ सकता है लेकिन उन्हें एक-दूसरे के साथ संगत होना होगा। वे भाषाएँ जो अधिकांश चरित्र (जैसे लैटिन लिपि) को एक-दूसरे से साझा करती हैं, संगत होती हैं। एपीआई छवियों से पाठ को पढ़ने और निकालने की अनुमति देता है, जिसमें छवियों को प्रीप्रोसेस करना और सटीकता में सुधार के लिए ओसीआर इंजन के मापदंडों को समायोजित करना शामिल है। निम्नलिखित उदाहरण दिखाता है कि छवियों से पाठ को कैसे पढ़ा और निकाला जाए और डेटा प्रविष्टि कार्यों को आसानी से स्वचालित किया जाए।

पायथन एपीआई के माध्यम से छवियों से टेक्स्ट पढ़ें और निकालें

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')

# Use the OCR engine to extract text from the image.

result = reader.readtext(image, detail=0)

पायथन एपीआई के माध्यम से टेक्स्ट बॉक्स से वर्णों को पहचानना

टेक्स्ट बॉक्स से अक्षरों को पहचानना OCR इंजनों के लिए एक सामान्य उपयोग का मामला है। ओपन सोर्स ईज़ीओसीआर एपीआई इस उपयोग के मामले में एक शक्तिशाली और उपयोगकर्ता के अनुकूल समाधान प्रदान करता है। यह सॉफ़्टवेयर डेवलपर्स को टेक्स्ट बॉक्स से वर्णों को आसानी से पहचानने और छवियों को प्रीप्रोसेस करने और सटीकता में सुधार करने के लिए ओसीआर इंजन के मापदंडों को समायोजित करने में मदद करता है। टेक्स्ट बॉक्स में अलग-अलग आकार, आकार और अभिविन्यास हो सकते हैं, और यह ओसीआर इंजन की सटीकता को प्रभावित कर सकता है। इसलिए कुछ प्रीप्रोसेसिंग चरणों को लागू करने से ओसीआर इंजन की सटीकता में सुधार हो सकता है, जैसे कि छवि को डेस्क्यू करना, बाइनराइजेशन लागू करना और शोर में कमी लागू करना।

पायथन एपीआई के माध्यम से टेक्स्ट बॉक्स से वर्णों को कैसे पहचानें?

import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine

# Load the image and preprocess it

from PIL import Image
import cv2

image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')

# OCR engine to recognize the characters in the text box

result = reader.readtext(image, detail=0)

# The result is a list of strings, where each string represents a recognized character in the text box.