ওপেন সোর্স রুবি লাইব্রেরি ছবিগুলোকে অনলাইনে টেক্সটে রূপান্তর করতে
ফ্রি রুবি অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) লাইব্রেরি সফটওয়্যার ডেভেলপারদের ছবি, পিডিএফ, বা স্ক্যান করা নথিগুলিকে পাঠ্য বা অনুসন্ধানযোগ্য নথিতে লোড, পড়তে এবং রূপান্তর করতে দেয়
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) প্রযুক্তি সাম্প্রতিক বছরগুলিতে উল্লেখযোগ্য অগ্রগতি করেছে, এটি বিভিন্ন উত্স থেকে স্বয়ংক্রিয়ভাবে ডেটা নিষ্কাশনকে সহজ করে তুলেছে। এটি অটোমেশন সক্ষম করে, ডেটা অ্যাক্সেসযোগ্যতা উন্নত করে এবং বিভিন্ন ডোমেনে উৎপাদনশীলতা বাড়ায়। এরকম একটি শক্তিশালী টুল হল OcrSpace রুবি লাইব্রেরি, যা ডেভেলপারদের তাদের রুবি অ্যাপ্লিকেশনগুলিতে OCR ক্ষমতাগুলিকে একীভূত করার জন্য একটি সরল সমাধান প্রদান করে। এই লাইব্রেরিটি ইমেজ, স্ক্যান করা ডকুমেন্ট এবং পিডিএফ ফাইল থেকে টেক্সট এক্সট্র্যাক্ট করার প্রক্রিয়াকে সহজ করে, এটি একটি সুবিধাজনক OCR সমাধান খুঁজছেন এমন ডেভেলপারদের জন্য একটি চমৎকার পছন্দ করে তোলে।
OcrSpace রুবি লাইব্রেরি একটি সহজবোধ্য এবং স্বজ্ঞাত ইন্টারফেস অফার করে, যা রুবি অ্যাপ্লিকেশনগুলিতে OCR ক্ষমতাগুলিকে একীভূত করা সহজ করে তোলে। লাইব্রেরির বেশ কিছু গুরুত্বপূর্ণ বৈশিষ্ট্য রয়েছে, যেমন বিভিন্ন ধরনের ছবি লোড করা, ছবি থেকে টেক্সট বের করা, স্ক্যান করা ডকুমেন্টকে টেক্সটে রূপান্তর করা, একাধিক ভাষায় লেখা ডকুমেন্ট থেকে টেক্সট বের করা, কম-রেজোলিউশনের ছবি থেকে টেক্সট শনাক্ত করা, হাতে লেখা কন্টেন্টের সাথে কাজ করা। , স্বীকৃত পাঠ্যের স্থানাঙ্ক পুনরুদ্ধার করা, পৃষ্ঠা নম্বর সনাক্ত করা, আগ্রহের নির্দিষ্ট ক্ষেত্র চিহ্নিত করা এবং আরও অনেক কিছু।
OcrSpace রুবি লাইব্রেরি হল Ocr.Space OCR API এর চারপাশে একটি মোড়ক, যা ছবি এবং PDF নথি থেকে নির্ভরযোগ্য এবং নির্ভুল পাঠ্য নিষ্কাশন অফার করে। রুবি ডেভেলপারদের জন্য বিশেষভাবে নির্মিত, এই লাইব্রেরিটি ইন্টিগ্রেশন প্রক্রিয়াকে সহজ করে দেয়, যাতে প্রোগ্রামাররা অন্তর্নিহিত API-এর জটিলতার সঙ্গে কাজ না করেই তাদের অ্যাপ্লিকেশনে OCR কার্যকারিতা দ্রুত অন্তর্ভুক্ত করতে পারে। আপনি একটি ডকুমেন্ট ম্যানেজমেন্ট সিস্টেম তৈরি করছেন, স্বয়ংক্রিয়ভাবে ডেটা নিষ্কাশন বা অ্যাক্সেসযোগ্যতা বাড়াচ্ছেন, OcrSpace রুবি লাইব্রেরি হল একটি অমূল্য টুল যা OCR প্রক্রিয়াকে স্ট্রীমলাইন করে এবং সঠিক টেক্সট এক্সট্রাকশন ক্ষমতার সাথে আপনার অ্যাপ্লিকেশনগুলিকে শক্তিশালী করে৷
Rubygems এর মাধ্যমে OcrSpace ইনস্টল করুন
OcrSpace দিয়ে শুরু করা
OcrSpace ইনস্টল করার প্রস্তাবিত উপায় হল Rubygems ব্যবহার করা। একটি মসৃণ ইনস্টলেশনের জন্য অনুগ্রহ করে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।
Install OcrSpace via Rubygems
$ gem install ocr_space
আপনি Github সংগ্রহস্থল থেকে কম্পাইল করা শেয়ার করা লাইব্রেরি ডাউনলোড করতে পারেন।
রুবি API এর মাধ্যমে URL থেকে টেক্সটে ছবি রূপান্তর করুন
ওপেন সোর্স OcrSpace লাইব্রেরিতে বিভিন্ন ধরনের ইমেজ লোড করার জন্য এবং রুবি কোডের কয়েকটি লাইনের সাথে টেক্সটে রূপান্তর করার জন্য কিছু শক্তিশালী বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে। লাইব্রেরি বিভিন্ন OCR অপশনকে সমর্থন করে, যার মধ্যে ছবি, স্ক্যান করা ডকুমেন্ট এবং পিডিএফ ফাইল থেকে পাঠ্য বের করা। সফ্টওয়্যার বিকাশকারীদের চালান, রসিদ বা অন্য কোনও ধরণের নথি প্রক্রিয়া করতে হবে কিনা, OcrSpace রুবি লাইব্রেরি এটি দক্ষতার সাথে পরিচালনা করতে পারে। নিম্নলিখিত উদাহরণটি দেখায় কিভাবে সফ্টওয়্যার বিকাশকারীরা রুবি API ব্যবহার করে URL এর মাধ্যমে চিত্রগুলিকে পাঠ্যে রূপান্তর করতে পারে।
রুবি API এর মাধ্যমে URL থেকে চিত্রগুলি রূপান্তর করুন
result = resource.convert url: "http://bit.ly/2ih9aXt"
puts result
=> #[{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}]
result = resource.clean_convert url: "http://bit.ly/2ih9aXt"
puts result
=> #If you want to find the secrets of the universe, think in terms of energy, frequency and vibration. AZ QUOTES
রুবি API এর মাধ্যমে উন্নত OCR ক্ষমতা
ওপেন সোর্স OcrSpace লাইব্রেরিতে রুবি অ্যাপ্লিকেশনের অভ্যন্তরে OCR অপারেশন পরিচালনার জন্য কিছু খুব দরকারী এবং উন্নত বৈশিষ্ট্য অন্তর্ভুক্ত করা হয়েছে। এটি কম-রেজোলিউশনের ছবি, বিকৃত পাঠ্য এবং এমনকি হাতে লেখা বিষয়বস্তু থেকে পাঠ্যকে সঠিকভাবে চিনতে পারে, বিভিন্ন পরিস্থিতিতে নির্ভরযোগ্য ফলাফল নিশ্চিত করে। পাঠ্য নিষ্কাশন ছাড়াও, লাইব্রেরি ডেভেলপারদের নথি থেকে অন্যান্য গুরুত্বপূর্ণ তথ্য বের করার অনুমতি দেয়। এর মধ্যে রয়েছে স্বীকৃত পাঠ্যের স্থানাঙ্ক পুনরুদ্ধার করা, পৃষ্ঠা নম্বর সনাক্ত করা এবং নথির মধ্যে আগ্রহের নির্দিষ্ট ক্ষেত্রগুলি সনাক্ত করা।
রুবি API-এর মাধ্যমে আপলোড করা ফাইল থেকে পাঠ্য কীভাবে বের করবেন?
result = resource.convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result #Raw result
=> #{"TextOverlay"=>{"Lines"=>[], "HasOverlay"=>false, "Message"=>"Text overlay is not provided as it is not requested"}, "FileParseExitCode"=>1, "ParsedText"=>"If you want to find the secrets of the \r\nuniverse, think in terms of energy, \r\nfrequency and vibration. \r\nAZ QUOTES \r\n", "ErrorMessage"=>"", "ErrorDetails"=>""}
result = resource.clean_convert file: "/Users/suyesh/Desktop/nicola_tesla.jpg"
puts result