1. পণ্য
  2.   OCR
  3.   Python
  4.   OCRmyPDF
 
  

ওপেন সোর্স পাইথন ওসিআর এপিআই ইমেজ পিডিএফ সার্চযোগ্য করতে

OCR প্রক্রিয়াকে স্বয়ংক্রিয় করার জন্য একটি শক্তিশালী বিনামূল্যের Python OCR API এবং স্ক্যান করা ছবি PDF-এর রূপান্তর সহজে সম্পূর্ণ অনুসন্ধানযোগ্য নথিতে সহজতর করে।

অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) প্রযুক্তি আমাদের নথিগুলি পরিচালনা ও প্রক্রিয়া করার পদ্ধতিতে বৈপ্লবিক পরিবর্তন এনেছে, যা আমাদের দক্ষতার সাথে মূল্যবান তথ্য বের করতে সক্ষম করে। উপলব্ধ অনেকগুলি OCR সরঞ্জামগুলির মধ্যে, OCRmyPDF একটি বহুমুখী এবং শক্তিশালী পাইথন লাইব্রেরি হিসাবে দাঁড়িয়েছে যা ব্যতিক্রমী নির্ভুলতার সাথে ব্যবহারের সহজতাকে একত্রিত করে। OCRmyPDF হল একটি ওপেন-সোর্স কমান্ড-লাইন টুল এবং Python লাইব্রেরি যা বিদ্যমান পিডিএফ ফাইলগুলিতে OCR যোগ করার জন্য বিশেষভাবে ডিজাইন করা হয়েছে। লাইব্রেরি একটি PDF ফাইলের প্রতিটি পৃষ্ঠা বিশ্লেষণ করে কন্টেন্ট না হারিয়ে সেই পৃষ্ঠার সমস্ত তথ্য ক্যাপচার করার জন্য প্রয়োজনীয় রঙের স্থান এবং রেজোলিউশন (DPI) নির্ধারণ করে৷

ওপেন সোর্স OCRmyPDF লাইব্রেরি স্ক্যান করা ছবি, বিদ্যমান পিডিএফ, এমনকি DjVu ফাইল সহ বিস্তৃত ইনপুট ফরম্যাট সমর্থন করে। এটি "ইমেজ প্লাস টেক্সট" এর ভিত্তিতে কাজ করে এবং মূল নথির গঠন এবং বিন্যাস সংরক্ষণ করে উচ্চ-মানের আউটপুট তৈরি করার লক্ষ্য রাখে। লাইব্রেরি সর্বোচ্চ সম্ভাব্য গুণমান বজায় রেখে ফাইলের আকার কমাতে PDF অপ্টিমাইজেশন কৌশল নিযুক্ত করে। কম্প্রেশন এবং ডাউন-স্যাম্পলিং প্রয়োগ করে, এটি নিশ্চিত করে যে ফলস্বরূপ ওসিআর-সক্ষম পিডিএফ ফাইলগুলি সঞ্চয় করার জন্য দক্ষ এবং দ্রুত লোড হতে পারে।

OCRmyPDF শক্তিশালী Tesseract OCR ইঞ্জিন ব্যবহার করে, যা 100 টিরও বেশি ভাষা সমর্থন করে। এর উন্নত অ্যালগরিদম পাঠ্যের সঠিক স্বীকৃতি নিশ্চিত করে, এমনকি নিম্নমানের বা বিকৃত ছবি থেকেও। লাইব্রেরি সহজে একটি নিয়মিত PDF থেকে একটি অনুসন্ধানযোগ্য PDF/A ফাইল তৈরি করার জন্য সহায়তা প্রদান করেছে। এটি কিছু ইমেজ প্রসেসিং অপশনও প্রদান করে, যেমন ডেস্কউ, যা ফাইলের চেহারা এবং OCR এর গুণমান উন্নত করে। যখন এগুলি ব্যবহার করা হয়, OCR স্তরটি পরিবর্তে প্রক্রিয়াকৃত চিত্রের উপর গ্রাফ্ট করা হয়। একাধিক ভাষার সমর্থন, পিডিএফ অপ্টিমাইজেশান, টেক্সট লেয়ার কন্ট্রোল এবং স্বয়ংক্রিয় প্রক্রিয়াকরণ সহ এর ব্যাপক বৈশিষ্ট্য সেট, এটিকে ব্যবসা, গবেষক, আর্কাইভিস্ট এবং স্ক্যান করা ডকুমেন্টের বিশাল ভলিউম নিয়ে কাজ করে এমন সকলের জন্য একটি মূল্যবান হাতিয়ার করে তোলে৷

Previous Next

OCRmyPDF দিয়ে শুরু করা

ওসিআরমাইপিডিএফ ইনস্টল করার প্রস্তাবিত উপায় হল পিপ ব্যবহার করা। একটি মসৃণ ইনস্টলেশনের জন্য অনুগ্রহ করে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।

পিপের মাধ্যমে OCRmyPDF ইনস্টল করুন

 pip install ocrmypdf 

আপনি নিজেও এটি ইনস্টল করতে পারেন; GitHub রিপোজিটরি থেকে সরাসরি সাম্প্রতিক রিলিজ ফাইলগুলি ডাউনলোড করুন৷

পাইথন API ব্যবহার করে পিডিএফ অপ্টিমাইজেশান

ওপেন সোর্স OCRmyPDF লাইব্রেরি পাইথন অ্যাপ্লিকেশনের মধ্যে পিডিএফ ডকুমেন্টের আকার এবং গুণমান পরিচালনা করার জন্য একটি খুব দরকারী বৈশিষ্ট্য সমর্থন করেছে। লাইব্রেরি সর্বোচ্চ সম্ভাব্য গুণমান বজায় রেখে ফাইলের আকার কমাতে PDF অপ্টিমাইজেশন কৌশল নিযুক্ত করে। কম্প্রেশন এবং ডাউন-স্যাম্পলিং প্রয়োগ করে, এটি নিশ্চিত করে যে ফলস্বরূপ ওসিআর-সক্ষম পিডিএফ ফাইলগুলি সঞ্চয় করার জন্য দক্ষ এবং দ্রুত লোড হতে পারে। OCRmyPDF বেশ কয়েকটি অপ্টিমাইজেশান বিকল্প প্রদান করে যা আপনি আপনার প্রয়োজনীয়তার উপর ভিত্তি করে কাস্টমাইজ করতে পারেন। কিছু সাধারণভাবে ব্যবহৃত বিকল্পগুলির মধ্যে রয়েছে অস্থায়ী ফাইলগুলি সরানো, JBIG2 কম্প্রেশন প্রয়োগ করা, OCR যোগ করা এড়িয়ে যাওয়া, ফাইলের আকার হ্রাস করার জন্য ক্ষতিহীন কম্প্রেশন অক্ষম করা ইত্যাদি।

কিভাবে Python API ব্যবহার করে PDF ফাইল অপ্টিমাইজ করবেন?

import subprocess

def optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path):
    try:
        # OCRmyPDF command with optimization options
        command = ['ocrmypdf', '-l', 'eng', '--pdf-renderer', 'hocr', '--optimize', '0', input_pdf_path, output_pdf_path]
        
        # Execute the OCRmyPDF command
        subprocess.run(command, check=True)
        
        print("PDF optimization complete!")
    except subprocess.CalledProcessError as e:
        print(f"OCRmyPDF error: {e}")
        
# Example usage
input_pdf_path = 'input.pdf'
output_pdf_path = 'output.pdf'

optimize_pdf_with_ocrmypdf(input_pdf_path, output_pdf_path)

পাইথন API এর মাধ্যমে পিডিএফ টেক্সট লেয়ার ইন্টিগ্রেশন

OCRmyPDF, একটি ওপেন-সোর্স লাইব্রেরি, PDF ফাইলগুলিতে পাঠ্য স্তরগুলিকে একীভূত করার জন্য, নথির অ্যাক্সেসযোগ্যতা এবং অনুসন্ধান-ক্ষমতা উন্নত করার জন্য একটি শক্তিশালী সমাধান প্রদান করে। লাইব্রেরি মূল লেআউটের সংরক্ষণ নিশ্চিত করে সরাসরি PDF নথিতে OCR-জেনারেট করা পাঠ্য ধারণকারী একটি পাঠ্য স্তর যুক্ত করে। এই বৈশিষ্ট্যটি সম্পূর্ণ-পাঠ্য অনুসন্ধান, কপি-পেস্ট এবং পাঠ্য নিষ্কাশন সক্ষম করে। পিডিএফ নথিগুলির সাথে কাজ করার সময়, ফাইলের মধ্যে একটি পাঠ্য স্তর একত্রিত করা অত্যন্ত সুবিধাজনক। পাঠ্য স্তরে স্বীকৃত ওসিআর-উত্পাদিত পাঠ্য রয়েছে, যা পিডিএফ অনুসন্ধানযোগ্য করে তোলে এবং পাঠ্যের সহজ অনুলিপি এবং নিষ্কাশনের অনুমতি দেয়। এই ইন্টিগ্রেশন মূল ডকুমেন্ট লেআউট সংরক্ষণ করে যখন টেক্সট-ভিত্তিক ক্রিয়াকলাপগুলি সক্ষম করে, নথির ব্যবহারযোগ্যতা এবং দক্ষতা বাড়ায়৷

 বাংলা