ফ্রি পাইথন এপিআই এর মাধ্যমে পিডিএফ ডকুমেন্ট তৈরি ও পরিচালনা করুন
পিডিএফ ফাইল তৈরি এবং কাস্টমাইজ করার জন্য ওপেন সোর্স পাইথন লাইব্রেরি, একাধিক পিডিএফ মার্জ করুন এবং পিডিএফ থেকে পাঠ্য বের করুন। এটি এইচটিএমএলকে পিডিএফে রূপান্তর করতে Wkhtmltopdf পাইথন র্যাপার ব্যবহার করে।
পাইথন এর সরলতা এবং বহুমুখীতার কারণে সফ্টওয়্যার বিকাশকারী এবং ডেটা বিজ্ঞানীদের জন্য দীর্ঘকাল ধরে একটি জনপ্রিয় ভাষা। পাইথনের অনেক সুবিধার মধ্যে একটি হল এর লাইব্রেরির সমৃদ্ধ ইকোসিস্টেম যা বিভিন্ন ডোমেইন কভার করে। এরকম একটি লাইব্রেরি হল পাইথন-পিডিএফকিট, পাইথনে পিডিএফ ম্যানিপুলেশনের জন্য একটি শক্তিশালী টুল। আপনার পিডিএফ তৈরি করতে হবে, বিদ্যমান থেকে তথ্য বের করতে হবে বা এমনকি এইচটিএমএল সামগ্রীকে পিডিএফ-এ রূপান্তর করতে হবে, পাইথন-পিডিএফকিট আপনাকে কভার করেছে। লাইব্রেরিটি পরিচালনা করা খুবই সহজ এবং ব্যবহারকারীদের HTML, URL, বা কাঁচা HTML স্ট্রিং থেকে নির্বিঘ্নে PDF তৈরি করতে সক্ষম করে৷
Python-PDFKit হল জনপ্রিয় PDF রূপান্তর টুল, wkhtmltopdf এর জন্য একটি পাইথন মোড়ক, যা C++ এ লেখা। এই লাইব্রেরির সাহায্যে, বিকাশকারীরা সহজেই তাদের পাইথন অ্যাপ্লিকেশনগুলিতে PDF জেনারেশন এবং ম্যানিপুলেশনকে একীভূত করতে পারে। এইচটিএমএল ফাইল থেকে পিডিএফ তৈরি করা, ইউআরএল থেকে পিডিএফ তৈরি করা, পিডিএফ তৈরির প্রক্রিয়া কাস্টমাইজ করা, এইচটিএমএল কন্টেন্টকে সরাসরি পিডিএফ-এ রূপান্তর করা, একাধিক পিডিএফ ডকুমেন্টকে একক ফাইলে মার্জ করা, পিডিএফ হিয়ার পরিচালনা করা ইত্যাদির মাধ্যমে পিডিএফ ডকুমেন্ট পরিচালনার জন্য লাইব্রেরির বেশ কিছু গুরুত্বপূর্ণ বৈশিষ্ট্য রয়েছে। /footers, PDF পৃষ্ঠার আকার সেট করা এবং আরও অনেক কিছু।
পাইথন-পিডিএফকিট লাইব্রেরি অন্তর্নিহিত wkhtmltopdf কমান্ড-লাইন টুলের সাথে ইন্টারঅ্যাক্ট করার জন্য একটি স্বজ্ঞাত এবং সহজবোধ্য ইন্টারফেস প্রদান করে, যা সফ্টওয়্যার ডেভেলপারদের অনায়াসে PDF নথি তৈরি, একত্রিত করতে এবং রূপান্তর করতে সক্ষম করে। এর অসংখ্য কনফিগারেশন বিকল্পগুলি নির্দিষ্ট প্রয়োজনীয়তা অনুসারে পিডিএফ আউটপুটকে সূক্ষ্ম-টিউনিং সক্ষম করে। এর সহজ ইনস্টলেশন প্রক্রিয়া এবং সহজবোধ্য ব্যবহারের সাথে, Python-PDFKit যেকোন বিকাশকারীর টুলকিটে একটি মূল্যবান সংযোজন। উপসংহারে, Python-PDFKit যেকোন পাইথন বিকাশকারীর জন্য একটি লাইব্রেরি যা পিডিএফ তৈরির কাজগুলিকে স্ট্রীমলাইন করতে এবং সহজেই পেশাদার চেহারার নথি তৈরি করতে চায়৷
পাইথন-পিডিএফকিট দিয়ে শুরু করা
পাইথন-পিডিএফকিট ইনস্টল করার প্রস্তাবিত এবং সবচেয়ে সহজ উপায় হল পিপ ব্যবহার করা। একটি মসৃণ ইনস্টলেশন নিম্নলিখিত কমান্ড ব্যবহার করুন.
পিপ এর মাধ্যমে Python-PDFKit ইনস্টল করুন
pip install pdfkit
আপনি নিজেও এটি ইনস্টল করতে পারেন; সরাসরি GitHub রিপোজিটরি থেকে সর্বশেষ রিলিজ ফাইল ডাউনলোড করুন।
পাইথনের মাধ্যমে PDF থেকে পাঠ্য বের করুন
পাইথন-পিডিএফকিট লাইব্রেরি পাইথনের মাধ্যমে পিডিএফ ফাইল থেকে প্রোগ্রাম্যাটিকভাবে পাঠ্য বের করার ক্ষমতা প্রদান করে। পিডিএফ ফাইল থেকে ডেটা পুনরুদ্ধার করা সহজ নয় কারণ পিডিএফ যেভাবে তথ্য সংরক্ষণ করে তা অর্জন করা কঠিন করে তোলে। পাইথন-পিডিএফকিট ডেভেলপারদের তথ্য পুনরুদ্ধারের জন্য বিল্ট-ইন ফাংশন ব্যবহার করা সহজ করে তাদের কাজ সহজ করে তোলে। পৃষ্ঠার পাঠ্য বিষয়বস্তু পেতে তারা পৃষ্ঠা অবজেক্টে extractText() পদ্ধতি ব্যবহার করতে পারে।
Python এর মাধ্যমে PDF থেকে টেক্সট এক্সট্রাক্ট করুন
// extract text from a PDF
from Python-PDFKit import PdfReader
reader = PdfReader("example.pdf")
page = reader.pages[0]
print(page.extract_text())
Python API এর মাধ্যমে PDF নথি তৈরি করা হচ্ছে
ওপেন সোর্স পাইথন-পিডিএফকিট লাইব্রেরি সফ্টওয়্যার বিকাশকারীদের জন্য তাদের পাইথন অ্যাপ্লিকেশনগুলির মধ্যে সহজে পিডিএফ ফাইল তৈরি করা সহজ করে তোলে। লাইব্রেরি বিভিন্ন উত্স থেকে পিডিএফ তৈরি করার জন্য সহায়তা প্রদান করেছে। লাইব্রেরি সফ্টওয়্যার বিকাশকারীদের HTML ফাইল, স্ট্রিং বা এমনকি URL থেকে PDF তৈরি করতে দেয়। পাইথন অ্যাপ্লিকেশনের ভিতরে ইমেজ, হেডার এবং ফুটার, পৃষ্ঠার আকার সেট, মার্জিন সেট করা এবং আরও অনেক কিছু যোগ করা সম্ভব। নিম্নলিখিত উদাহরণটি দেখায়, কিভাবে সফ্টওয়্যার বিকাশকারীরা পাইথন কোডের কয়েকটি লাইন দিয়ে বিভিন্ন উত্স থেকে পিডিএফ ফাইল তৈরি করতে পারে।
Python API এর মাধ্যমে একটি HTML ফাইল, স্ট্রিং বা URL থেকে একটি PDF তৈরি করুন
import pdfkit
# Generate a PDF from an HTML file
pdfkit.from_file("source.html", "output.pdf")
# Generate a PDF from an HTML string
html_string = "Hello, PDFKit!
"
pdfkit.from_string(html_string, "output.pdf")
# Generate a PDF from a URL
pdfkit.from_url("https://example.com", "output.pdf")
পাইথন অ্যাপের মধ্যে পিডিএফ জেনারেশন কাস্টমাইজ করা
ওপেন সোর্স পাইথন-পিডিএফকিট লাইব্রেরি সফটওয়্যার ডেভেলপারদের তাদের নিজস্ব অ্যাপ্লিকেশনের মধ্যে পিডিএফ তৈরির প্রক্রিয়া কাস্টমাইজ করতে সক্ষম করে। সফ্টওয়্যার বিকাশকারীরা বিভিন্ন বিকল্প যেমন পৃষ্ঠার আকার, মার্জিন, শিরোনাম/ফুটার, একাধিক পিডিএফ নথি মার্জ এবং আরও অনেক কিছু নির্দিষ্ট করতে পারে। এই অপশনগুলো wkhtmltopdf-এ কমান্ড-লাইন আর্গুমেন্ট হিসেবে পাঠানো হয়। নিম্নলিখিত উদাহরণটি দেখায় কিভাবে সফ্টওয়্যার বিকাশকারীরা পাইথন অ্যাপ্লিকেশনগুলির মধ্যে পিডিএফ তৈরির প্রক্রিয়াটি কাস্টমাইজ করতে পারে৷
কিভাবে Python API এর মাধ্যমে PDF জেনারেশন প্রক্রিয়া কাস্টমাইজ করবেন?
import pdfkit
options = {
'page-size': 'A4',
'margin-top': '0mm',
'margin-right': '0mm',
'margin-bottom': '0mm',
'margin-left': '0mm',
}
pdfkit.from_file("source.html", "output.pdf", options=options)
পাইথন লাইব্রেরির মাধ্যমে HTML কে PDF এ রূপান্তর করুন
ওপেন সোর্স পাইথন-পিডিএফকিট লাইব্রেরিটি এইচটিএমএল ডকুমেন্টগুলিকে তাদের পাইথন অ্যাপ্লিকেশনের মধ্যে পিডিএফ ফাইলগুলিতে লোড এবং রূপান্তর করার জন্য লাইব্রেরি ব্যবহার করা খুব সহজ। পিডিএফ তৈরি করার পাশাপাশি, লাইব্রেরি একটি মধ্যবর্তী ফাইল সংরক্ষণ না করে সরাসরি এইচটিএমএল সামগ্রীকে পিডিএফ-এ রূপান্তর করতে পারে। গতিশীল বিষয়বস্তু নিয়ে কাজ করার সময় বা অন-দ্য-ফ্লাই পিডিএফ তৈরি করার সময় এটি কার্যকর হতে পারে। নীচে একটি সাধারণ উদাহরণ যা দেখায় যে কীভাবে কম্পিউটার প্রোগ্রামাররা পাইথন অ্যাপ্লিকেশনগুলির মধ্যে এইচটিএমএল ডকুমেন্টগুলিকে পিডিএফ ফাইলগুলিতে রূপান্তর করতে পারে।
কিভাবে পাইথনের মাধ্যমে HTML ডকুমেন্টকে PDF ফাইলে রূপান্তর করবেন?
import pdfkit
html_string = "Hello, PDFKit!
"
pdf_bytes = pdfkit.from_string(html_string, False)
# Save the PDF bytes to a file
with open("output.pdf", "wb") as f:
f.write(pdf_bytes)