Apache POI HWPF

 
 

মাইক্রোসফট ওয়ার্ড বাইনারি ডকুমেন্ট প্রসেস করুন

ওপেন সোর্স জাভা লাইব্রেরির মাধ্যমে DOC ফাইলগুলি তৈরি করুন, পড়ুন, ম্যানিপুলেট করুন এবং রূপান্তর করুন।

Apache POI HWPF হল Microsoft Word DOC ফাইল বিন্যাসের জন্য একটি Apache POI পোর্ট। এটি কোনও অতিরিক্ত লাইব্রেরির প্রয়োজন ছাড়াই DOC ফাইলগুলি পড়ার এবং লেখার জন্য কার্যকারিতা সরবরাহ করে। এটি পুরানো Word 6 এবং Word 95 ফাইল ফরম্যাটের জন্য সীমিত পঠনযোগ্য সমর্থন প্রদান করে। এই পর্যায়ে, HWPF প্রধানত ফর্ম্যাট করা পাঠ্যের সাথে সম্পর্কিত। এটি মৌলিক পাঠ্য নিষ্কাশন, নির্দিষ্ট পাঠ্য নিষ্কাশন, শিরোনাম এবং পাদলেখগুলিতে অ্যাক্সেস এবং পাঠ্য বৈশিষ্ট্য পরিবর্তন করে।

এটি ডেভেলপারদের অনুচ্ছেদ ম্যানিপুলেট করার ক্ষমতা সহ MS-Word ডকুমেন্ট তৈরি করতে, টেক্সটে বিভিন্ন স্টাইল যোগ করতে, একটি টেবিল যোগ করতে, টেক্সট বের করতে এবং আরও অনেক কিছু করতে সাহায্য করে।

Previous Next

Apache POI HWPF দিয়ে শুরু করা

প্রথমত, আপনার সিস্টেমে জাভা ডেভেলপমেন্ট কিট (JDK) ইনস্টল করা দরকার। যদি আপনার কাছে এটি ইতিমধ্যেই থাকে তবে একটি সংরক্ষণাগারে সর্বশেষ স্থিতিশীল প্রকাশ পেতে Apache POI এর ডাউনলোড পৃষ্ঠাতে যান৷ যেকোন ডিরেক্টরিতে জিপ ফাইলের বিষয়বস্তু বের করুন যেখান থেকে প্রয়োজনীয় লাইব্রেরিগুলি আপনার জাভা প্রোগ্রামের সাথে লিঙ্ক করা যেতে পারে। যে সব!

আপনার Maven-ভিত্তিক জাভা প্রকল্পে Apache POI উল্লেখ করা আরও সহজ। আপনার যা দরকার তা হল আপনার pom.xml-এ নিম্নলিখিত নির্ভরতা যোগ করুন এবং আপনার IDE-কে Apache POI Jar ফাইলগুলি আনতে এবং উল্লেখ করতে দিন।

Apache POI Maven নির্ভরতা

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
  <dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-scratchpad</artifactId>
    <version>4.0.0</version>
  </dependency>
  

জাভা API ব্যবহার করে ওয়ার্ড ডকুমেন্ট তৈরি এবং পরিবর্তন করুন

Apache POI HWPF প্রোগ্রামারদের DOC ফাইল ফরম্যাটে নতুন Word নথি তৈরি করতে সক্ষম করে। এপিআই ডেভেলপারদের তাদের নিজস্ব প্রয়োজন অনুযায়ী বিদ্যমান ওয়ার্ড ডকুমেন্ট পরিবর্তন করার অনুমতি দেয়। API একটি Word নথিতে একটি অনুচ্ছেদ যোগ করা, পাঠ্য সারিবদ্ধকরণ এবং ফন্ট শৈলী প্রয়োগ করা এবং আরও অনেক কিছু সমর্থন করে।

DOC ফাইল পরিবর্তন করুন - জাভা

// open an empty doc file, using APACHE POI we cannot create .doc file format from scratch
HWPFDocument doc = new HWPFDocument(new FileInputStream("empty.doc"));
Range range = doc.getRange();
// inset text
CharacterRun run = range.insertAfter("File Format Developer Guide - " +
"Learn about computer files that you come across in " +
"your daily work at: www.fileformat.com ");
OutputStream out = new FileOutputStream("document.pdf");
// save document
doc.write(out);
out.close();

জাভা ব্যবহার করে ওয়ার্ড ডকুমেন্টকে অন্য ফরম্যাটে রূপান্তর করুন

pache POI HWPF সফ্টওয়্যার ডেভেলপারদের সহজে যেকোন সমর্থিত ফাইল ফরম্যাটে মাইক্রোসফট ওয়ার্ড ডকুমেন্ট রূপান্তর করতে সক্ষম করে। এই মুহূর্তে জাভা ডেভেলপাররা Word নথিগুলিকে HTML, FO, এবং Text ফরম্যাটে রূপান্তর করতে পারে। org.apache.poi.hwpf.converter প্যাকেজে Word-to-HTML এবং Word-to-FO রূপান্তরকারী রয়েছে।

DOC কে HTML এ রূপান্তর করুন

// load document
HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream("document.doc"));
Document newDocument = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
// initialize WordToHtmlConverter
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(newDocument );
// process document
wordToHtmlConverter.processDocument( wordDocument );
StringWriter stringWriter = new StringWriter();
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty( OutputKeys.INDENT, "yes" );
transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );
transformer.setOutputProperty( OutputKeys.METHOD, "html" );
transformer.transform(
    new DOMSource( wordToHtmlConverter.getDocument() ),
    new StreamResult( stringWriter ) );
// get html
String html = stringWriter.toString();

DOC ফাইল থেকে পাঠ্য পড়ুন

Apache POI HWPF Microsoft Word DOC ফাইল ফরম্যাট থেকে পাঠ্য পড়ার জন্য WordExtractor ক্লাস প্রদান করে। আপনি কোডের কয়েকটি লাইন দিয়ে ফাইল থেকে পাঠ্য বের করতে পারেন।

একটি DOC ফাইল থেকে পাঠ্য বের করুন

// load DOC file
FileInputStream fis = new FileInputStream(new File("document.doc"));
// open file
HWPFDocument doc = new HWPFDocument(fis);
// read text
WordExtractor extractor = new WordExtractor(doc);
// display text
System.out.println(extractor.getText());

DOC-তে কাস্টম হেডার এবং ফুটার যোগ করুন

Apache POI HWPF জাভা ডেভেলপারদের Word নথিতে কাস্টম হেডার এবং ফুটার তৈরি করতে সক্ষম করে। Apache POI HWPF কে "মাঝারিভাবে কার্যকরী" হিসাবে বর্ণনা করা হয়েছে। এটি মৌলিক পাঠ্য নিষ্কাশন, নির্দিষ্ট পাঠ্য নিষ্কাশন, শিরোনাম এবং পাদলেখ অ্যাক্সেস এবং পাঠ্য বৈশিষ্ট্য পরিবর্তনের জন্য সমর্থন প্রদান করে। getText() পদ্ধতিটি সমস্ত অনুচ্ছেদ থেকে পাঠ্য পেতে ব্যবহার করা যেতে পারে, অথবা প্রতিটি অনুচ্ছেদ থেকে পাঠ্য আনার জন্য getParagraphText() ব্যবহার করা যেতে পারে। 

Word DOC ফাইলে কাস্টম হেডার এবং ফুটার পরিচালনা করুন


// The path to the documents directory.
String dataDir = Utils.getDataDir(ApacheHeaders.class);
POIFSFileSystem fs = null;
fs = new POIFSFileSystem(new FileInputStream(dataDir + "MyHeader.doc"));
HWPFDocument doc = new HWPFDocument(fs);
int pageNumber = 1;
HeaderStories headerStore = new HeaderStories(doc);
String header = headerStore.getHeader(pageNumber);
System.out.println("Header Is: " + header);
 বাংলা