ইমেজ থেকে টেক্সট লোড এবং এক্সট্রাক্ট করার জন্য উন্নত ফ্রি রুবি লাইব্রেরি
একটি লিডিং ওপেন সোর্স রুবি ওসিআর এপিআই এবং ইমেজ টু টেক্সট কনভার্টার যা সফটওয়্যার ডেভেলপারদের ইমেজ (স্ক্যান করা ছবি এবং পিডিএফ ফাইল) থেকে টেক্সট লোড, চিনতে এবং এক্সট্রাক্ট করতে দেয়
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) একটি শক্তিশালী প্রযুক্তি যা কম্পিউটারকে ছবি বা স্ক্যান করা নথি থেকে পাঠ্য সনাক্ত করতে এবং বের করতে সক্ষম করে। মুদ্রিত সামগ্রীগুলিকে ডিজিটাইজ করা থেকে শুরু করে স্বয়ংক্রিয় ডেটা এন্ট্রি প্রক্রিয়াগুলি পর্যন্ত এর অসংখ্য অ্যাপ্লিকেশন রয়েছে৷ রুবি প্রোগ্রামিং ভাষায়, ওসিআর-এর জন্য একটি জনপ্রিয় লাইব্রেরি হল রুবি-টেসার্যাক্ট-ওসিআর। Ruby-Tesseract-OCR হল একটি রুবি রত্ন যা Tesseract OCR ইঞ্জিনের জন্য একটি মোড়ক হিসাবে কাজ করে। Tesseract হল একটি ওপেন সোর্স ওসিআর ইঞ্জিন যা Google দ্বারা তৈরি করা হয়েছে এবং এটির নির্ভুলতা এবং ভাষা সমর্থনের জন্য বিখ্যাত৷
Ruby-Tesseract-OCR মৌলিক OCR ক্ষমতার বাইরে যায় এবং উন্নত ব্যবহারের ক্ষেত্রে অতিরিক্ত বৈশিষ্ট্য অফার করে। উদাহরণস্বরূপ, সফ্টওয়্যার বিকাশকারীরা একটি নির্দিষ্ট এলাকায় OCR বিশ্লেষণকে সীমাবদ্ধ করতে একটি চিত্রের মধ্যে আগ্রহের একটি অঞ্চল (ROI) নির্দিষ্ট করতে পারে। জটিল নথিগুলির সাথে কাজ করার সময় বা যখন আপনাকে শুধুমাত্র একটি নির্দিষ্ট বিভাগ থেকে পাঠ্য বের করতে হবে তখন এটি বিশেষভাবে কার্যকর। লাইব্রেরি ওসিআর ক্ষমতা বাড়াতে বেশ কিছু অতিরিক্ত বৈশিষ্ট্য প্রদান করে, যেমন একটি বিদ্যমান ছবি লোড করা, ছবি বা স্ক্যান করা নথি থেকে পাঠ্য বের করা, HOCR (HTML OCR) আউটপুট পাওয়া এবং আরও অনেক কিছু।
Ruby-Tesseract-OCR রত্নটি Tesseract ইঞ্জিনের সাথে ইন্টারঅ্যাক্ট করার জন্য একটি সহজে ব্যবহারযোগ্য ইন্টারফেস প্রদান করে, যা রুবি ডেভেলপারদের তাদের প্রকল্পে OCR ক্ষমতাগুলিকে অনায়াসে একীভূত করতে সক্ষম করে। আপনি চালান থেকে তথ্য আহরণ করতে হবে, মুদ্রিত উপকরণ ডিজিটাইজ করতে হবে, অথবা স্বয়ংক্রিয়ভাবে ডেটা এন্ট্রি কাজ করতে হবে, ওপেন সোর্স লাইব্রেরি একটি নির্ভরযোগ্য এবং দক্ষ সমাধান প্রদান করে। এটি একবার চেষ্টা করে দেখুন, এবং আজই আপনার রুবি প্রকল্পগুলিতে OCR এর সম্ভাব্যতা আনলক করুন৷
Ruby-Tesseract-OCR দিয়ে শুরু করা
Ruby-Tesseract-OCR ইনস্টল করার প্রস্তাবিত উপায় হল Rubygems ব্যবহার করা। একটি মসৃণ ইনস্টলেশনের জন্য অনুগ্রহ করে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।
Rubygems এর মাধ্যমে Ruby-Tesseract-OCR ইনস্টল করুন
gem install tesseract-ocr
আপনি Github সংগ্রহস্থল থেকে কম্পাইল করা শেয়ার করা লাইব্রেরি ডাউনলোড করতে পারেন।
রুবি এর মাধ্যমে ছবি ও স্ক্যান করা নথি থেকে পাঠ্য বের করুন
Ruby-Tesseract-OCR একটি অত্যন্ত শক্তিশালী ওপেন সোর্স লাইব্রেরি যা সফ্টওয়্যার ডেভেলপারদের রুবি কোডের মাত্র কয়েকটি লাইনের সাথে বিভিন্ন ধরণের চিত্র থেকে পাঠ্য লোড করতে এবং বের করতে দেয়। লাইব্রেরি ছবি, PDFS বা স্ক্যান করা নথি থেকে পাঠ্য বের করা সহজ করে তোলে। সাধারণ ওয়ার্কফ্লোতে একটি ইমেজ লোড করা, ওসিআর প্যারামিটার কনফিগার করা এবং টেক্সট চিনতে ওসিআর ইঞ্জিনকে আহ্বান করা জড়িত। একটি সফল ক্রিয়াকলাপের জন্য বিকাশকারীদের তারা যে চিত্রটি প্রক্রিয়া করতে চায় তার পথ সরবরাহ করতে হবে এবং পাঠ্যটি বের করার জন্য text_for পদ্ধতিতে কল করতে হবে। অবশেষে, ফলাফল কনসোলে মুদ্রিত হবে। লাইব্রেরি OCR আচরণ নিয়ন্ত্রণের জন্য বিভিন্ন Fconfiguration অপশন অফার করে, যেমন পৃষ্ঠা বিভাজন মোড, হোয়াইটলিস্ট অক্ষর এবং আরও অনেক কিছু। নিম্নলিখিত উদাহরণগুলি দেখায় যে কীভাবে সফ্টওয়্যার বিকাশকারীরা একটি JPEG চিত্র লোড করতে পারে এবং রুবি অ্যাপ্লিকেশনগুলির মধ্যে এটি থেকে পাঠ্য বের করতে পারে।
রুবি কমান্ড ব্যবহার করে ইমেজ থেকে কিভাবে টেক্সট এক্সট্রাক্ট করবেন?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
e.text_for('test/first.png').strip # => 'ABC'
রুবি এর মাধ্যমে একটি বিশেষ চিত্র এলাকা থেকে পাঠ্য বের করুন
ওপেন সোর্স Ruby-Tesseract-OCR লাইব্রেরি মৌলিক OCR ক্ষমতার বাইরে যায় এবং উন্নত ব্যবহারের ক্ষেত্রে অতিরিক্ত বৈশিষ্ট্যগুলি অফার করে। উদাহরণস্বরূপ, ব্যবহারকারীরা একটি নির্দিষ্ট এলাকায় OCR বিশ্লেষণকে সীমাবদ্ধ করতে একটি চিত্রের মধ্যে আগ্রহের একটি অঞ্চল (ROI) নির্দিষ্ট করতে পারেন। জটিল নথিগুলির সাথে কাজ করার সময় বা ব্যবহারকারীদের শুধুমাত্র একটি নির্দিষ্ট বিভাগ থেকে পাঠ্য বের করার প্রয়োজন হলে এটি বিশেষভাবে কার্যকর। উপরন্তু, লাইব্রেরি HOCR (HTML OCR) আউটপুট প্রাপ্ত করার পদ্ধতি প্রদান করে, যার মধ্যে শুধুমাত্র স্বীকৃত পাঠ্যই নয়, পাঠ্য উপাদানগুলির বিন্যাস এবং স্থানাঙ্ক সম্পর্কেও তথ্য রয়েছে। HOCR আউটপুট সহায়ক যখন আপনার আরও দানাদার ডেটার প্রয়োজন হয় বা পাঠ্য কাঠামোর উপর আরও বিশ্লেষণ করতে চান।
রুবি লাইব্রেরির মাধ্যমে কীভাবে একটি ছবিতে hOCR সম্পাদন করবেন?
require 'tesseract'
e = Tesseract::Engine.new {|e|
e.language = :eng
e.blacklist = '|'
}
puts e.hocr_for('test/first.png')