1. Produkter
  2.   Tekstbehandling
  3.   Java
  4.   Apache POI XWPF

Apache POI XWPF

 
 

Java API for Word OOXML Documents

Åpen kildekode-løsning for å opprette, lese, redigere og konvertere Microsoft Word DOCX-filer i Java-applikasjoner.

Apache POI XWPF gir funksjonaliteten til å lese og skrive Microsoft Word 2007 DOCX-filformat. XWPF har en ganske stabil kjerne-API, som gir tilgang til hoveddelene av en Word DOCX-fil. Den kan brukes til grunnleggende og spesifikk tekstutvinning, manipulering av topp- og bunntekst, tekstmanipulering og stilfunksjoner. 

Apache POI XWPF er mer kjent for Microsoft Word-filgenerering og dokumentredigering, formatering av tekst og avsnitt, bildeinnsetting, tabelloppretting og parsing, utskriftsflettingsfunksjoner, administrasjon av skjemaelementer og mye mer.

Previous Next

Komme i gang med Apache POI XWPF

Først av alt må du ha Java Development Kit (JDK) installert på systemet ditt. Hvis du allerede har det, fortsett til Apache POIs nedlastingsside for å få den siste stabile utgivelsen i et arkiv. Pakk ut innholdet i ZIP-filen i en hvilken som helst katalog der de nødvendige bibliotekene kan kobles til Java-programmet. Det er alt!

Å referere til Apache POI i ditt Maven-baserte Java-prosjekt er enda enklere. Alt du trenger er å legge til følgende avhengighet i pom.xml og la IDE-en hente og referere til Apache POI Jar-filene.

Apache POI Maven Dependency

<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
  <groupId>org.apache.poi</groupId>
  <artifactId>poi</artifactId>
  <version>4.1.0</version>
</dependency>

Generer og rediger Word-dokumenter ved hjelp av Java API

Apache POI XWPF gjør det mulig for programvareprogrammerere å lage nye Word-dokumenter i DOCX-filformat. Utviklere kan også laste inn en eksisterende Microsoft Word DOCX-fil for å redigere den i henhold til applikasjonsbehovene deres. Den lar deg legge til nye avsnitt, sette inn tekst, bruke tekstjustering og kantlinjer, endre tekststil og mer.

Generer en DOCX-fil fra bunnen av

// initialize a blank document
XWPFDocument document = new XWPFDocument();
// create a new file
FileOutputStream out = new FileOutputStream(new File("document.docx"));
// create a new paragraph paragraph
XWPFParagraph paragraph = document.createParagraph();
XWPFRun run = paragraph.createRun();
run.setText("File Format Developer Guide - " +
  "Learn about computer files that you come across in " +
  "your daily work at: www.fileformat.com ");
document.write(out);
out.close();

Legg til avsnitt, bilde og tabell i Word-dokumenter

Apache POI XWPF lar utviklerne legge til avsnitt og bilder i Word-dokumenter. API-en gir også funksjonen for å legge til tabeller i DOCX-dokumenter, samtidig som det gjør det mulig å lage enkle og nestede tabeller med brukerdefinerte data.

Opprett en ny DOCX-fil med en tabell

// initialize a blank document
XWPFDocument document = new XWPFDocument();
// create a new file
FileOutputStream out = new FileOutputStream(new File("table.docx"));
// create a new table
XWPFTable table = document.createTable();
// create first row
XWPFTableRow tableRowOne = table.getRow(0);
tableRowOne.getCell(0).setText("Serial No");
tableRowOne.addNewTableCell().setText("Products");
tableRowOne.addNewTableCell().setText("Formats");
// create second row
XWPFTableRow tableRowTwo = table.createRow();
tableRowTwo.getCell(0).setText("1");
tableRowTwo.getCell(1).setText("Apache POI XWPF");
tableRowTwo.getCell(2).setText("DOCX, HTML, FO, TXT, PDF");
// create third row
XWPFTableRow tableRowThree = table.createRow();
tableRowThree.getCell(0).setText("2");
tableRowThree.getCell(1).setText("Apache POI HWPF");
tableRowThree.getCell(2).setText("DOC, HTML, FO, TXT");
document.write(out);
out.close();

Trekk ut tekst fra Word OOXML-dokument

Apache POI XWPF gir den spesialiserte klassen for å trekke ut data fra Microsoft Word DOCX-dokumenter med bare noen få linjer med kode. På samme måte kan den også trekke ut overskrifter, fotnoter, tabelldata og så videre fra en Word-fil.

Trekk ut tekst fra en Word-fil

// load DOCX file
FileInputStream fis = new FileInputStream("document.docx");
// open file
XWPFDocument file  = new XWPFDocument(OPCPackage.open(fis));
// read text
XWPFWordExtractor ext = new XWPFWordExtractor(file);
// display text
System.out.println(ext.getText());

Legg til tilpasset topp- og bunntekst i DOCX-dokumenter

Topptekst og bunntekst er en viktig del av Word-dokumentet, da de vanligvis inneholder ekstra informasjon som datoer, sidetall, forfatterens navn og fotnoter, som hjelper til med å holde lengre dokumenter organisert og lettere å lese. Apache POI XWPF lar Java-utviklere legge til tilpassede topptekster og bunntekster i Word-dokumenter.

Administrer tilpasset topp- og bunntekst i Word DOCX-fil


public class HeaderFooterTable {
  public static void main(String[] args) throws IOException {
    try (XWPFDocument doc = new XWPFDocument()) {
      // Create a header with a 1 row, 3 column table
      XWPFHeader hdr = doc.createHeader(HeaderFooterType.DEFAULT);
      XWPFTable tbl = hdr.createTable(1, 3);
      // Set the padding around text in the cells to 1/10th of an inch
      int pad = (int) (.1 * 1440);
      tbl.setCellMargins(pad, pad, pad, pad);
      // Set table width to 6.5 inches in 1440ths of a point
      tbl.setWidth((int) (6.5 * 1440));
      CTTbl ctTbl = tbl.getCTTbl();
      CTTblPr ctTblPr = ctTbl.addNewTblPr();
      CTTblLayoutType layoutType = ctTblPr.addNewTblLayout();
      layoutType.setType(STTblLayoutType.FIXED);
      BigInteger w = new BigInteger("3120");
      CTTblGrid grid = ctTbl.addNewTblGrid();
      for (int i = 0; i < 3; i++) {
        CTTblGridCol gridCol = grid.addNewGridCol();
        gridCol.setW(w);
      }
      // Add paragraphs to the cells
      XWPFTableRow row = tbl.getRow(0);
      XWPFTableCell cell = row.getCell(0);
      XWPFParagraph p = cell.getParagraphArray(0);
      XWPFRun r = p.createRun();
      r.setText("header left cell");
      cell = row.getCell(1);
      p = cell.getParagraphArray(0);
      r = p.createRun();
      r.setText("header center cell");
      cell = row.getCell(2);
      p = cell.getParagraphArray(0);
      r = p.createRun();
      r.setText("header right cell");
      // Create a footer with a Paragraph
      XWPFFooter ftr = doc.createFooter(HeaderFooterType.DEFAULT);
      p = ftr.createParagraph();
      r = p.createRun();
      r.setText("footer text");
      try (OutputStream os = new FileOutputStream(new File("headertable.docx"))) {
        doc.write(os);
      }
    }
  }
}
 Norsk