OCR সক্ষমতা একীভূত করতে এবং পাঠ্য বের করার জন্য বিনামূল্যে পাইথন API
ছবি এবং নথি থেকে সঠিক এবং দ্রুত পাঠ্য স্বীকৃতির জন্য ওপেন সোর্স পাইথন OCR API। পাইথন লাইব্রেরি ব্যবহার করে নথিতে প্রাকৃতিক দৃশ্যের পাঠ্য এবং ঘন পাঠ্য উভয়ই পড়ুন।
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) প্রযুক্তি কিছু সময়ের জন্যই রয়েছে, এবং এটি বিভিন্ন শিল্পে ডেটা এন্ট্রি এবং নথি প্রক্রিয়াকরণের কাজগুলিকে স্বয়ংক্রিয় করতে ব্যবহৃত হয়। EasyOCR হল একটি ওপেন সোর্স OCR (অপটিক্যাল ক্যারেক্টার রিকগনিশন) ইঞ্জিন যা দ্রুত, নির্ভুল এবং ব্যবহার করা সহজ। এটি বিকাশকারীদের তাদের অ্যাপ্লিকেশনগুলিতে OCR সংহত করার জন্য একটি সহজে ব্যবহারযোগ্য ইন্টারফেস প্রদান করে। EasyOCR লাইব্রেরির মাধ্যমে, সফ্টওয়্যার বিকাশকারীরা ছবি এবং স্ক্যান করা নথিগুলি থেকে কয়েক সেকেন্ডের মধ্যে পাঠ্য বের করতে পারে, এটিকে নথি ব্যবস্থাপনা, ডেটা নিষ্কাশন এবং অটোমেশনের জন্য একটি আদর্শ হাতিয়ার করে তোলে৷
ইজিওসিআর পাইথনে লেখা এবং 80টিরও বেশি ভাষায় সমর্থিত, এটি বহু-ভাষিক পরিবেশে পরিচালিত ব্যবসার জন্য একটি শক্তিশালী হাতিয়ার করে তুলেছে। লাইব্রেরির বেশ কিছু গুরুত্বপূর্ণ বৈশিষ্ট্য রয়েছে যেমন সঠিক পাঠ্য নিষ্কাশন, বহু-ভাষা সমর্থন, বিদ্যমান অ্যাপ্লিকেশনগুলির সাথে সহজ একীকরণ, আপনার নির্দিষ্ট চাহিদা মেটাতে ওসিআর ইঞ্জিনকে কাস্টমাইজ করা, সাশ্রয়ী সমাধান, স্ক্যান করা নথি থেকে পাঠ্য বের করা, গ্রহণ করা এবং স্টোর করা। নিষ্কাশিত পাঠ্য, এবং আরো অনেক কিছু। API হল একটি ক্লাউড-ভিত্তিক সমাধান যার কোনো হার্ডওয়্যার বা সফ্টওয়্যার ইনস্টলেশনের প্রয়োজন হয় না, এটিকে সব আকারের ব্যবসার জন্য একটি সাশ্রয়ী সমাধান করে তোলে৷
ইজিওসিআর এপিআই উচ্চ নির্ভুলতার হার অর্জন করতে গভীর শিক্ষার অ্যালগরিদম ব্যবহার করে এবং দ্রুত প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে পারে। এটি একটি নমনীয় এবং স্কেলযোগ্য সমাধান যা একটি সাধারণ RESTful API ব্যবহার করে বিদ্যমান ওয়ার্কফ্লোতে একীভূত করা যেতে পারে। EasyOCR API হল একটি শক্তিশালী OCR সমাধান যা সমস্ত আকারের ব্যবসাগুলিকে তাদের ডেটা এন্ট্রি প্রক্রিয়াগুলি স্বয়ংক্রিয় করতে, নির্ভুলতা উন্নত করতে এবং খরচ কমাতে সাহায্য করতে পারে। একাধিক ভাষার সমর্থন সহ, এটি নথি ব্যবস্থাপনা, ডেটা নিষ্কাশন এবং অটোমেশনের জন্য একটি আদর্শ হাতিয়ার। আপনি যদি আপনার অ্যাপ্লিকেশনে একত্রিত করার জন্য একটি OCR ইঞ্জিন খুঁজছেন, তাহলে EasyOCR ব্যবহার করে দেখুন৷
EasyOCR দিয়ে শুরু করা
ইজিওসিআর ইনস্টল করার প্রস্তাবিত উপায় হল পিপ ব্যবহার করা। একটি মসৃণ ইনস্টলেশনের জন্য অনুগ্রহ করে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।
পিপের মাধ্যমে ইজিওসিআর ইনস্টল করুন
pip install easyocr
আপনি নিজেও এটি ইনস্টল করতে পারেন; সরাসরি GitHub রিপোজিটরি থেকে সর্বশেষ রিলিজ ফাইল ডাউনলোড করুন।
পাইথন API এর মাধ্যমে চিত্র থেকে পাঠ্য পড়া এবং নিষ্কাশন
ওপেন সোর্স ইজিওসিআর এপিআই পাইথন অ্যাপ্লিকেশনের ভিতরে ইমেজ এবং পিডিএফ ফাইলগুলি থেকে টেক্সট লোড করতে, চিনতে এবং বের করতে গভীর শিক্ষার অ্যালগরিদম ব্যবহার করে। EasyOCR একই সময়ে একাধিক ভাষা পড়তে পারে তবে তাদের একে অপরের সাথে সামঞ্জস্যপূর্ণ হতে হবে। যে ভাষাগুলি বেশিরভাগ অক্ষর ভাগ করে (যেমন ল্যাটিন স্ক্রিপ্ট) একে অপরের সাথে সামঞ্জস্যপূর্ণ। এপিআই ইমেজগুলিকে কিভাবে প্রিপ্রসেস করতে হয় এবং নির্ভুলতা উন্নত করতে ওসিআর ইঞ্জিনের পরামিতিগুলিকে সামঞ্জস্য করতে সহ ইমেজগুলি থেকে পাঠ্য পড়া এবং বের করার অনুমতি দেয়। নীচের উদাহরণটি দেখায় কিভাবে চিত্রগুলি থেকে পাঠ্য পড়তে এবং বের করতে হয় এবং সহজেই ডেটা এন্ট্রি কাজগুলি স্বয়ংক্রিয়ভাবে করা যায়।
পাইথন API এর মাধ্যমে চিত্রগুলি থেকে পাঠ্য পড়ুন এবং বের করুন
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_image.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_image.png')
# Use the OCR engine to extract text from the image.
result = reader.readtext(image, detail=0)
পাইথন API এর মাধ্যমে পাঠ্য বাক্স থেকে অক্ষর সনাক্ত করা
টেক্সট বক্স থেকে অক্ষর শনাক্ত করা OCR ইঞ্জিনের জন্য একটি সাধারণ ব্যবহার। ওপেন সোর্স EasyOCR API এই ব্যবহারের ক্ষেত্রে একটি শক্তিশালী এবং ব্যবহারকারী-বান্ধব সমাধান প্রদান করে। এটি সফ্টওয়্যার ডেভেলপারদের সহজে টেক্সট বক্স থেকে অক্ষর চিনতে সাহায্য করে এবং কীভাবে ইমেজগুলিকে প্রিপ্রসেস করতে হয় এবং নির্ভুলতা উন্নত করতে ওসিআর ইঞ্জিনের প্যারামিটারগুলি সামঞ্জস্য করে। টেক্সট বক্সের বিভিন্ন আকার, মাপ এবং অভিযোজন থাকতে পারে এবং এটি OCR ইঞ্জিনের নির্ভুলতাকে প্রভাবিত করতে পারে। তাই কিছু প্রিপ্রসেসিং ধাপ প্রয়োগ করলে ওসিআর ইঞ্জিনের যথার্থতা উন্নত করা যায়, যেমন ইমেজকে ডেস্কু করা, বাইনারিকরণ প্রয়োগ করা এবং শব্দ কমানো প্রয়োগ করা।
কিভাবে Python API এর মাধ্যমে টেক্সট বক্স থেকে অক্ষর চিনতে হয়?
import easyocr
reader = easyocr.Reader(['en']) # Set the language of the OCR engine
# Load the image and preprocess it
from PIL import Image
import cv2
image = Image.open('text_box.png')
image = image.convert('L') # Convert the image to grayscale
image = cv2.imread('text_box.png')
# OCR engine to recognize the characters in the text box
result = reader.readtext(image, detail=0)
# The result is a list of strings, where each string represents a recognized character in the text box.