পিডিএফ ফাইলগুলি প্রক্রিয়া করতে ওপেন সোর্স পাইথন লাইব্রেরি

ফ্রি পাইথন এপিআই পিডিএফ রৈখিককরণ এবং এনক্রিপ্ট করা পিডিএফ অ্যাক্সেস করার অনুমতি দেয়। এটি স্ক্র্যাচ থেকে পিডিএফ তৈরি করা, একটি পিডিএফ থেকে অন্য পিডিএফে পৃষ্ঠা কপি করা, পিডিএফগুলিকে বিভক্ত বা মার্জ করা এবং আরও অনেক কিছু সমর্থন করে।

পাইকপিডিএফ একটি খুব সাধারণ পাইথন পিডিএফ লাইব্রেরি যা সফ্টওয়্যার বিকাশকারীদের পাইথন অ্যাপ্লিকেশনগুলির মধ্যে পিডিএফ ফাইলগুলির সাথে কাজ করতে দেয়। এটি QPDF এর উপর ভিত্তি করে তৈরি করা হয়েছে, একটি শক্তিশালী পিডিএফ ম্যানিপুলেশন এবং মেরামত লাইব্রেরি। পাইকপিডিএফ একটি পিডিএফ কন্টেন্ট ট্রান্সফরমেশন লাইব্রেরি এবং পিডিএফ ফাইলগুলিতে নিম্ন-স্তরের অ্যাক্সেস প্রদান করে। এর মানে ব্যবহারকারীদের পিডিএফ অভ্যন্তরীণ জ্ঞান এবং পিডিএফ চশমাগুলির সাথে পরিচিতি প্রয়োজন। লাইব্রেরিটি ওপেন সোর্স এবং জনসাধারণের ব্যবহারের জন্য MIT লাইসেন্সের অধীনে উপলব্ধ। লাইব্রেরিটি ওপেন সোর্স এবং MPL-2.0 লাইসেন্সের অধীনে উপলব্ধ।

পাইকপিডিএফ পিডিএফ রৈখিককরণ এবং এনক্রিপ্ট করা পিডিএফ অ্যাক্সেস করার জন্য সমর্থন প্রদান করে। এতে পিডিএফ ম্যানেজমেন্ট সম্পর্কিত বৈশিষ্ট্যগুলির একটি খুব শক্তিশালী সেট অন্তর্ভুক্ত রয়েছে যেমন স্ক্র্যাচ থেকে পিডিএফ তৈরি করা, একটি পিডিএফ থেকে অন্যটিতে পৃষ্ঠাগুলি অনুলিপি করা, পিডিএফগুলিকে বিভক্ত বা মার্জ করা, পিডিএফ থেকে চিত্র বা পাঠ্য নিষ্কাশন, পিডিএফ-এ সামগ্রী প্রতিস্থাপন, পিডিএফ মেরামত সমর্থন, পৃষ্ঠা। সেটিংস সমর্থন, পিডিএফ মেটাডেটা পরিচালনা, পাসওয়ার্ড-সুরক্ষিত, পিডিএফ এক্সএমপি মেটাডেটা সম্পাদনা, বিদ্যমান পিডিএফ-এর রূপান্তর এবং আরও অনেক কিছুর সাথে কাজ।

.

Previous Next

পাইকপিডিএফ দিয়ে শুরু করা

PikePDF এর জন্য Python 3.6 এবং উচ্চতর প্রয়োজন। আপনি পাইপ ব্যবহার করে PikePDF ইনস্টল করতে পারেন। এটি ইনস্টল করতে নিম্নলিখিত কমান্ড ব্যবহার করুন.

পাইপের মাধ্যমে পাইকপিডিএফ ইনস্টল করুন

 pip install pikepdf

পাইথনের মাধ্যমে একটি পিডিএফ থেকে অন্য পৃষ্ঠাগুলি অনুলিপি করুন

ওপেন সোর্স পাইকপিডিএফ লাইব্রেরি সেই ক্ষমতা প্রদান করে যা সফ্টওয়্যার ডেভেলপারদের পাইথন কোডের কয়েকটি লাইন সহ একটি পিডিএফ থেকে অন্য পৃষ্ঠায় কপি করতে সক্ষম করে। পিডিএফ অবজেক্টের মধ্যে পৃষ্ঠাগুলি অনুলিপি করা লক্ষ্য পিডিএফ ফাইলের মধ্যে উত্স পৃষ্ঠার একটি অগভীর অনুলিপি তৈরি করবে এবং তাই পৃষ্ঠাগুলি সংশোধন করা মূল PDF নথিতে প্রভাব ফেলবে না। কাস্টম বিষয়বস্তুর সাথে নির্দিষ্ট পৃষ্ঠাগুলি প্রতিস্থাপন করাও সম্ভব। একটি নির্দিষ্ট পিডিএফের মধ্যে পৃষ্ঠাগুলি অনুলিপি করাও সম্ভব।

পাইথনের মাধ্যমে পিডিএফ ডকুমেন্ট খুলুন এবং ম্যানিপুলেট করুন

 # PDF Documents Manipulation 
  from pikepdf import Pdf
  new_pdf = Pdf.new()
  with Pdf.open('sample.pdf') as pdf:
    pdf.save('output.pdf') 
   # Copying pages from other PDFs
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  appendix = Pdf.open('../tests/resources/sandwich.pdf')
  pdf.pages.extend(appendix.pages)

পাইথনের মাধ্যমে পিডিএফ স্প্লিটিং ও মার্জিং

পিডিএফ পাইকপিডিএফ লাইব্রেরি সফ্টওয়্যার ডেভেলপারদের বিদ্যমান পিডিএফ ফাইলগুলি অ্যাক্সেস করার এবং সহজেই একাধিক পিডিএফ ফাইলে বিভক্ত করার ক্ষমতা দেয়। পিডিএফ বিভক্ত করার সময় আমাদের যা প্রয়োজন তা হল নতুন পিডিএফগুলিকে অবশ্যই গন্তব্য পৃষ্ঠাগুলি ধরে রাখতে হবে। লাইব্রেরি প্রতিটি পৃষ্ঠার সাথে সম্পর্কিত ডেটা স্থানান্তর করার বিষয়টিও নিশ্চিত করে, যাতে প্রতিটি পৃষ্ঠা তার নিজস্বভাবে দাঁড়িয়ে থাকে। লাইব্রেরিতে একাধিক পিডিএফ নথিকে এককভাবে একত্রিত করা বা সংযুক্ত করার জন্য সমর্থনও অন্তর্ভুক্ত রয়েছে। কোডের মাত্র কয়েক লাইন দিয়ে পিডিএফ পৃষ্ঠাগুলির ক্রম বিপরীত করাও সম্ভব।

পাইথনের মাধ্যমে পিডিএফ ডকুমেন্টগুলিকে বিভক্ত ও মার্জ করুন

 # PDF Splitting
  pdf = Pdf.open('../tests/resources/fourpages.pdf')
  for n, page in enumerate(pdf.pages):
  dst = Pdf.new()
  dst.pages.append(page)
  dst.save(f'{n:02d}.pdf')
  # Combine Multiple PDF pages into a single One
  from glob import glob
  pdf = Pdf.new()
  for file in glob('*.pdf'):
  src = Pdf.open(file)
  pdf.pages.extend(src.pages)
  pdf.save('merged.pdf')

পাইথনের মাধ্যমে পিডিএফ ডকুমেন্টের ভিতরে ছবি পরিচালনা করুন

পিডিএফ পাইকপিডিএফ লাইব্রেরি সফ্টওয়্যার বিকাশকারীদের জন্য পাইথন কমান্ড ব্যবহার করে একটি পিডিএফ ফাইলের ভিতরে চিত্রগুলি পরিচালনা করা সহজ করে তোলে। লাইব্রেরিতে ইমেজ পরিচালনার সাথে সম্পর্কিত বেশ কিছু গুরুত্বপূর্ণ ফাংশন অন্তর্ভুক্ত করা হয়েছে যেমন পিডিএফ পেজের মধ্যে ছবি কপি করা, পিডিএফ ওপেন করা এবং দেখা, ইমেজ রিসাইজ করা, পিডিএফ-এ ইমেজ ম্যানিপুলেট করা, পিডিএফ থেকে ইমেজ বের করা, ইমেজ রিপ্লেস করা, পিডিএফ থেকে ইমেজ ডিলিট করা এবং আরও অনেক কিছু। .

ইমেজ এক্সট্র্যাক্ট করুন এবং পাইথনের মাধ্যমে পিডিএফে প্রতিস্থাপন করুন

 # Extract Image & Replace PDF Images
  import zlib
  rawimage = pdfimage.obj
  pillowimage = pdfimage.as_pil_image()
  greyscale = pillowimage.convert('L')
  greyscale = greyscale.resize((32, 32))
  rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
  rawimage.ColorSpace = Name("/DeviceGray")
  rawimage.Width, rawimage.Height = 32, 32

পাইথনের মাধ্যমে পিডিএফ মেটাডেটা হ্যান্ডলিং

PDF মেটাডেটা একটি PDF নথি সম্পর্কে খুব দরকারী তথ্য যেমন লেখকের নাম, সৃষ্টি ও পরিবর্তনের তারিখ, কীওয়ার্ড, কপিরাইট তথ্য ইত্যাদি অন্তর্ভুক্ত করে। PDF PikePDF লাইব্রেরিতে মেটাডেটা অ্যাক্সেস এবং পড়ার জন্য সম্পূর্ণ কার্যকারিতা অন্তর্ভুক্ত করা হয়েছে, মেটাডেটা বের করা, PDF নথি থেকে মেটাডেটা এন্ট্রি মুছে ফেলা। নিম্নলিখিত কোড উদাহরণ দেখায় কিভাবে PDF নথি থেকে মেটাডেটা বের করতে হয়।

পাইথনের মাধ্যমে কীভাবে পিডিএফ মেটাডেটা বের করবেন

 # Extract PDF Metadata
  import pikepdf
  import sys
  # get the target pdf file from the command-line arguments
  pdf_filename = sys.argv[1]
  # read the pdf file
  pdf = pikepdf.Pdf.open(pdf_filename)
  docinfo = pdf.docinfo
  for key, value in docinfo.items():
    print(key, ":", value)
 বাংলা