পিডিএফ ফাইলগুলি প্রক্রিয়া করতে ওপেন সোর্স পাইথন লাইব্রেরি
ফ্রি পাইথন এপিআই পিডিএফ রৈখিককরণ এবং এনক্রিপ্ট করা পিডিএফ অ্যাক্সেস করার অনুমতি দেয়। এটি স্ক্র্যাচ থেকে পিডিএফ তৈরি করা, একটি পিডিএফ থেকে অন্য পিডিএফে পৃষ্ঠা কপি করা, পিডিএফগুলিকে বিভক্ত বা মার্জ করা এবং আরও অনেক কিছু সমর্থন করে।
পাইকপিডিএফ একটি খুব সাধারণ পাইথন পিডিএফ লাইব্রেরি যা সফ্টওয়্যার বিকাশকারীদের পাইথন অ্যাপ্লিকেশনগুলির মধ্যে পিডিএফ ফাইলগুলির সাথে কাজ করতে দেয়। এটি QPDF এর উপর ভিত্তি করে তৈরি করা হয়েছে, একটি শক্তিশালী পিডিএফ ম্যানিপুলেশন এবং মেরামত লাইব্রেরি। পাইকপিডিএফ একটি পিডিএফ কন্টেন্ট ট্রান্সফরমেশন লাইব্রেরি এবং পিডিএফ ফাইলগুলিতে নিম্ন-স্তরের অ্যাক্সেস প্রদান করে। এর মানে ব্যবহারকারীদের পিডিএফ অভ্যন্তরীণ জ্ঞান এবং পিডিএফ চশমাগুলির সাথে পরিচিতি প্রয়োজন। লাইব্রেরিটি ওপেন সোর্স এবং জনসাধারণের ব্যবহারের জন্য MIT লাইসেন্সের অধীনে উপলব্ধ। লাইব্রেরিটি ওপেন সোর্স এবং MPL-2.0 লাইসেন্সের অধীনে উপলব্ধ।
পাইকপিডিএফ পিডিএফ রৈখিককরণ এবং এনক্রিপ্ট করা পিডিএফ অ্যাক্সেস করার জন্য সমর্থন প্রদান করে। এতে পিডিএফ ম্যানেজমেন্ট সম্পর্কিত বৈশিষ্ট্যগুলির একটি খুব শক্তিশালী সেট অন্তর্ভুক্ত রয়েছে যেমন স্ক্র্যাচ থেকে পিডিএফ তৈরি করা, একটি পিডিএফ থেকে অন্যটিতে পৃষ্ঠাগুলি অনুলিপি করা, পিডিএফগুলিকে বিভক্ত বা মার্জ করা, পিডিএফ থেকে চিত্র বা পাঠ্য নিষ্কাশন, পিডিএফ-এ সামগ্রী প্রতিস্থাপন, পিডিএফ মেরামত সমর্থন, পৃষ্ঠা। সেটিংস সমর্থন, পিডিএফ মেটাডেটা পরিচালনা, পাসওয়ার্ড-সুরক্ষিত, পিডিএফ এক্সএমপি মেটাডেটা সম্পাদনা, বিদ্যমান পিডিএফ-এর রূপান্তর এবং আরও অনেক কিছুর সাথে কাজ।
.
পাইকপিডিএফ দিয়ে শুরু করা
PikePDF এর জন্য Python 3.6 এবং উচ্চতর প্রয়োজন। আপনি পাইপ ব্যবহার করে PikePDF ইনস্টল করতে পারেন। এটি ইনস্টল করতে নিম্নলিখিত কমান্ড ব্যবহার করুন.
পাইপের মাধ্যমে পাইকপিডিএফ ইনস্টল করুন
pip install pikepdf
পাইথনের মাধ্যমে একটি পিডিএফ থেকে অন্য পৃষ্ঠাগুলি অনুলিপি করুন
ওপেন সোর্স পাইকপিডিএফ লাইব্রেরি সেই ক্ষমতা প্রদান করে যা সফ্টওয়্যার ডেভেলপারদের পাইথন কোডের কয়েকটি লাইন সহ একটি পিডিএফ থেকে অন্য পৃষ্ঠায় কপি করতে সক্ষম করে। পিডিএফ অবজেক্টের মধ্যে পৃষ্ঠাগুলি অনুলিপি করা লক্ষ্য পিডিএফ ফাইলের মধ্যে উত্স পৃষ্ঠার একটি অগভীর অনুলিপি তৈরি করবে এবং তাই পৃষ্ঠাগুলি সংশোধন করা মূল PDF নথিতে প্রভাব ফেলবে না। কাস্টম বিষয়বস্তুর সাথে নির্দিষ্ট পৃষ্ঠাগুলি প্রতিস্থাপন করাও সম্ভব। একটি নির্দিষ্ট পিডিএফের মধ্যে পৃষ্ঠাগুলি অনুলিপি করাও সম্ভব।
পাইথনের মাধ্যমে পিডিএফ ডকুমেন্ট খুলুন এবং ম্যানিপুলেট করুন
# PDF Documents Manipulation
from pikepdf import Pdf
new_pdf = Pdf.new()
with Pdf.open('sample.pdf') as pdf:
pdf.save('output.pdf')
# Copying pages from other PDFs
pdf = Pdf.open('../tests/resources/fourpages.pdf')
appendix = Pdf.open('../tests/resources/sandwich.pdf')
pdf.pages.extend(appendix.pages)
পাইথনের মাধ্যমে পিডিএফ স্প্লিটিং ও মার্জিং
পিডিএফ পাইকপিডিএফ লাইব্রেরি সফ্টওয়্যার ডেভেলপারদের বিদ্যমান পিডিএফ ফাইলগুলি অ্যাক্সেস করার এবং সহজেই একাধিক পিডিএফ ফাইলে বিভক্ত করার ক্ষমতা দেয়। পিডিএফ বিভক্ত করার সময় আমাদের যা প্রয়োজন তা হল নতুন পিডিএফগুলিকে অবশ্যই গন্তব্য পৃষ্ঠাগুলি ধরে রাখতে হবে। লাইব্রেরি প্রতিটি পৃষ্ঠার সাথে সম্পর্কিত ডেটা স্থানান্তর করার বিষয়টিও নিশ্চিত করে, যাতে প্রতিটি পৃষ্ঠা তার নিজস্বভাবে দাঁড়িয়ে থাকে। লাইব্রেরিতে একাধিক পিডিএফ নথিকে এককভাবে একত্রিত করা বা সংযুক্ত করার জন্য সমর্থনও অন্তর্ভুক্ত রয়েছে। কোডের মাত্র কয়েক লাইন দিয়ে পিডিএফ পৃষ্ঠাগুলির ক্রম বিপরীত করাও সম্ভব।
পাইথনের মাধ্যমে পিডিএফ ডকুমেন্টগুলিকে বিভক্ত ও মার্জ করুন
# PDF Splitting
pdf = Pdf.open('../tests/resources/fourpages.pdf')
for n, page in enumerate(pdf.pages):
dst = Pdf.new()
dst.pages.append(page)
dst.save(f'{n:02d}.pdf')
# Combine Multiple PDF pages into a single One
from glob import glob
pdf = Pdf.new()
for file in glob('*.pdf'):
src = Pdf.open(file)
pdf.pages.extend(src.pages)
pdf.save('merged.pdf')
পাইথনের মাধ্যমে পিডিএফ ডকুমেন্টের ভিতরে ছবি পরিচালনা করুন
পিডিএফ পাইকপিডিএফ লাইব্রেরি সফ্টওয়্যার বিকাশকারীদের জন্য পাইথন কমান্ড ব্যবহার করে একটি পিডিএফ ফাইলের ভিতরে চিত্রগুলি পরিচালনা করা সহজ করে তোলে। লাইব্রেরিতে ইমেজ পরিচালনার সাথে সম্পর্কিত বেশ কিছু গুরুত্বপূর্ণ ফাংশন অন্তর্ভুক্ত করা হয়েছে যেমন পিডিএফ পেজের মধ্যে ছবি কপি করা, পিডিএফ ওপেন করা এবং দেখা, ইমেজ রিসাইজ করা, পিডিএফ-এ ইমেজ ম্যানিপুলেট করা, পিডিএফ থেকে ইমেজ বের করা, ইমেজ রিপ্লেস করা, পিডিএফ থেকে ইমেজ ডিলিট করা এবং আরও অনেক কিছু। .
ইমেজ এক্সট্র্যাক্ট করুন এবং পাইথনের মাধ্যমে পিডিএফে প্রতিস্থাপন করুন
# Extract Image & Replace PDF Images
import zlib
rawimage = pdfimage.obj
pillowimage = pdfimage.as_pil_image()
greyscale = pillowimage.convert('L')
greyscale = greyscale.resize((32, 32))
rawimage.write(zlib.compress(greyscale.tobytes()), filter=Name("/FlateDecode"))
rawimage.ColorSpace = Name("/DeviceGray")
rawimage.Width, rawimage.Height = 32, 32
পাইথনের মাধ্যমে পিডিএফ মেটাডেটা হ্যান্ডলিং
PDF মেটাডেটা একটি PDF নথি সম্পর্কে খুব দরকারী তথ্য যেমন লেখকের নাম, সৃষ্টি ও পরিবর্তনের তারিখ, কীওয়ার্ড, কপিরাইট তথ্য ইত্যাদি অন্তর্ভুক্ত করে। PDF PikePDF লাইব্রেরিতে মেটাডেটা অ্যাক্সেস এবং পড়ার জন্য সম্পূর্ণ কার্যকারিতা অন্তর্ভুক্ত করা হয়েছে, মেটাডেটা বের করা, PDF নথি থেকে মেটাডেটা এন্ট্রি মুছে ফেলা। নিম্নলিখিত কোড উদাহরণ দেখায় কিভাবে PDF নথি থেকে মেটাডেটা বের করতে হয়।
পাইথনের মাধ্যমে কীভাবে পিডিএফ মেটাডেটা বের করবেন
# Extract PDF Metadata
import pikepdf
import sys
# get the target pdf file from the command-line arguments
pdf_filename = sys.argv[1]
# read the pdf file
pdf = pikepdf.Pdf.open(pdf_filename)
docinfo = pdf.docinfo
for key, value in docinfo.items():
print(key, ":", value)