1. Məhsullar
  2.   Söz emalı
  3.   Java
  4.   Apache POI HWPF

Apache POI HWPF

 
 

Microsoft Word Binar Sənədlərini emal edin

Açıq Mənbəli Java Kitabxanası vasitəsilə DOC faylları yaradın, oxuyun, manipulyasiya edin və çevirin.

Apache POI HWPF Microsoft Word DOC fayl formatı üçün Apache POI portudur. Heç bir əlavə kitabxanaya ehtiyac duymadan DOC fayllarını oxumaq və yazmaq üçün funksionallıq təmin edir. O, həmçinin köhnə Word 6 və Word 95 fayl formatları üçün məhdud yalnız oxumaq üçün dəstək verir. Bu mərhələdə HWPF əsasən formatlaşdırılmış mətnlə məşğul olur. Bu, əsas mətn çıxarışını, xüsusi mətn çıxarılmasını, başlıq və altbilgilərə girişi və mətn xüsusiyyətlərini dəyişdirməyi təmin edir.

O, tərtibatçılara paraqrafları manipulyasiya etmək, mətnə müxtəlif üslublar əlavə etmək, cədvəl əlavə etmək, mətn çıxarmaq və s. imkanı ilə MS-Word Sənədləri yaratmağı asanlaşdırır.

Previous Next

Apache POI HWPF ilə işə başlamaq

İlk növbədə sisteminizdə Java Development Kit (JDK) quraşdırılmalıdır. Əgər sizdə artıq varsa, arxivdə ən son stabil buraxılışı əldə etmək üçün Apache POI-nin download səhifəsinə keçin. ZIP faylının məzmununu tələb olunan kitabxanaların Java proqramınızla əlaqələndirilə biləcəyi istənilən qovluqdan çıxarın. Bu qədər!

Maven əsaslı Java layihənizdə Apache POI-yə istinad etmək daha sadədir. Sizə lazım olan tək şey pom.xml-ə aşağıdakı asılılığı əlavə etmək və IDE-nin Apache POI Jar fayllarını götürməsinə və istinad etməsinə icazə verməkdir.

Apache POI Maven asılılığı

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
  <dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-scratchpad</artifactId>
    <version>4.0.0</version>
  </dependency>
  

Java API istifadə edərək Word sənədlərini yaradın və dəyişdirin

Apache POI HWPF proqramçılara DOC fayl formatlarında yeni Word Sənədləri yaratmağa imkan verir. API həmçinin tərtibatçılara mövcud Word Sənədlərini öz ehtiyaclarına uyğun olaraq dəyişdirməyə imkan verir. API həmçinin Word sənədinə paraqraf əlavə etməyi, mətn düzülmələrini və şrift üslublarını tətbiq etməyi və daha çox şeyləri dəstəkləyir.

DOC faylını dəyişdirin - Java

// open an empty doc file, using APACHE POI we cannot create .doc file format from scratch
HWPFDocument doc = new HWPFDocument(new FileInputStream("empty.doc"));
Range range = doc.getRange();
// inset text
CharacterRun run = range.insertAfter("File Format Developer Guide - " +
"Learn about computer files that you come across in " +
"your daily work at: www.fileformat.com ");
OutputStream out = new FileOutputStream("document.pdf");
// save document
doc.write(out);
out.close();

Java istifadə edərək Word sənədlərini digər formatlara çevirin

pache POI HWPF proqram tərtibatçılarına Microsoft Word sənədlərini istənilən dəstəklənən fayl formatlarına asanlıqla çevirməyə imkan verir. Hazırda Java tərtibatçıları Word sənədlərini HTML, FO və Mətn formatına çevirə bilirlər. org.apache.poi.hwpf.converter paketində Word-to-HTML və Word-to-FO çeviriciləri var.

DOC-u HTML-ə çevirin

// load document
HWPFDocumentCore wordDocument = WordToHtmlUtils.loadDoc(new FileInputStream("document.doc"));
Document newDocument = DocumentBuilderFactory.newInstance().newDocumentBuilder().newDocument();
// initialize WordToHtmlConverter
WordToHtmlConverter wordToHtmlConverter = new WordToHtmlConverter(newDocument );
// process document
wordToHtmlConverter.processDocument( wordDocument );
StringWriter stringWriter = new StringWriter();
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty( OutputKeys.INDENT, "yes" );
transformer.setOutputProperty( OutputKeys.ENCODING, "utf-8" );
transformer.setOutputProperty( OutputKeys.METHOD, "html" );
transformer.transform(
    new DOMSource( wordToHtmlConverter.getDocument() ),
    new StreamResult( stringWriter ) );
// get html
String html = stringWriter.toString();

DOC faylından mətni oxuyun

Apache POI HWPF Microsoft Word DOC fayl formatından mətni oxumaq üçün WordExtractor sinifini təmin edir. Siz yalnız bir neçə sətir kodla fayldan mətn çıxara bilərsiniz.

DOC faylından mətn çıxarın

// load DOC file
FileInputStream fis = new FileInputStream(new File("document.doc"));
// open file
HWPFDocument doc = new HWPFDocument(fis);
// read text
WordExtractor extractor = new WordExtractor(doc);
// display text
System.out.println(extractor.getText());

DOC-a Fərdi Başlıq və Altbilgi əlavə edin

Apache POI HWPF Java tərtibatçılarına Word sənədlərində fərdi başlıqlar və altbilgilər yaratmağa imkan verir. Apache POI HWPF "orta dərəcədə funksional" kimi təsvir edilir. O, əsas mətnin çıxarılması, xüsusi mətn çıxarılması, başlıq və altbilgilərə giriş və mətn xüsusiyyətlərinin dəyişdirilməsi üçün dəstək verir. Bütün abzaslardan mətni əldə etmək üçün getText() metodundan və ya getParagraphText() hər bir paraqrafdan mətni növbə ilə almaq üçün istifadə edilə bilər. 

Word DOC faylında Fərdi Başlıq və Altbilgini idarə edin


// The path to the documents directory.
String dataDir = Utils.getDataDir(ApacheHeaders.class);
POIFSFileSystem fs = null;
fs = new POIFSFileSystem(new FileInputStream(dataDir + "MyHeader.doc"));
HWPFDocument doc = new HWPFDocument(fs);
int pageNumber = 1;
HeaderStories headerStore = new HeaderStories(doc);
String header = headerStore.getHeader(pageNumber);
System.out.println("Header Is: " + header);
 Azəri