Apache POI XWPF
Java API for Word OOXML Documents
Åpen kildekode-løsning for å opprette, lese, redigere og konvertere Microsoft Word DOCX-filer i Java-applikasjoner.
Apache POI XWPF gir funksjonaliteten til å lese og skrive Microsoft Word 2007 DOCX-filformat. XWPF har en ganske stabil kjerne-API, som gir tilgang til hoveddelene av en Word DOCX-fil. Den kan brukes til grunnleggende og spesifikk tekstutvinning, manipulering av topp- og bunntekst, tekstmanipulering og stilfunksjoner.
Apache POI XWPF er mer kjent for Microsoft Word-filgenerering og dokumentredigering, formatering av tekst og avsnitt, bildeinnsetting, tabelloppretting og parsing, utskriftsflettingsfunksjoner, administrasjon av skjemaelementer og mye mer.
Komme i gang med Apache POI XWPF
Først av alt må du ha Java Development Kit (JDK) installert på systemet ditt. Hvis du allerede har det, fortsett til Apache POIs nedlastingsside for å få den siste stabile utgivelsen i et arkiv. Pakk ut innholdet i ZIP-filen i en hvilken som helst katalog der de nødvendige bibliotekene kan kobles til Java-programmet. Det er alt!
Å referere til Apache POI i ditt Maven-baserte Java-prosjekt er enda enklere. Alt du trenger er å legge til følgende avhengighet i pom.xml og la IDE-en hente og referere til Apache POI Jar-filene.
Apache POI Maven Dependency
<!-- https://mvnrepository.com/artifact/org.apache.poi/poi -->
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi</artifactId>
<version>4.1.0</version>
</dependency>
Generer og rediger Word-dokumenter ved hjelp av Java API
Apache POI XWPF gjør det mulig for programvareprogrammerere å lage nye Word-dokumenter i DOCX-filformat. Utviklere kan også laste inn en eksisterende Microsoft Word DOCX-fil for å redigere den i henhold til applikasjonsbehovene deres. Den lar deg legge til nye avsnitt, sette inn tekst, bruke tekstjustering og kantlinjer, endre tekststil og mer.
Generer en DOCX-fil fra bunnen av
// initialize a blank document
XWPFDocument document = new XWPFDocument();
// create a new file
FileOutputStream out = new FileOutputStream(new File("document.docx"));
// create a new paragraph paragraph
XWPFParagraph paragraph = document.createParagraph();
XWPFRun run = paragraph.createRun();
run.setText("File Format Developer Guide - " +
"Learn about computer files that you come across in " +
"your daily work at: www.fileformat.com ");
document.write(out);
out.close();
Legg til avsnitt, bilde og tabell i Word-dokumenter
Apache POI XWPF lar utviklerne legge til avsnitt og bilder i Word-dokumenter. API-en gir også funksjonen for å legge til tabeller i DOCX-dokumenter, samtidig som det gjør det mulig å lage enkle og nestede tabeller med brukerdefinerte data.
Opprett en ny DOCX-fil med en tabell
// initialize a blank document
XWPFDocument document = new XWPFDocument();
// create a new file
FileOutputStream out = new FileOutputStream(new File("table.docx"));
// create a new table
XWPFTable table = document.createTable();
// create first row
XWPFTableRow tableRowOne = table.getRow(0);
tableRowOne.getCell(0).setText("Serial No");
tableRowOne.addNewTableCell().setText("Products");
tableRowOne.addNewTableCell().setText("Formats");
// create second row
XWPFTableRow tableRowTwo = table.createRow();
tableRowTwo.getCell(0).setText("1");
tableRowTwo.getCell(1).setText("Apache POI XWPF");
tableRowTwo.getCell(2).setText("DOCX, HTML, FO, TXT, PDF");
// create third row
XWPFTableRow tableRowThree = table.createRow();
tableRowThree.getCell(0).setText("2");
tableRowThree.getCell(1).setText("Apache POI HWPF");
tableRowThree.getCell(2).setText("DOC, HTML, FO, TXT");
document.write(out);
out.close();
Trekk ut tekst fra Word OOXML-dokument
Apache POI XWPF gir den spesialiserte klassen for å trekke ut data fra Microsoft Word DOCX-dokumenter med bare noen få linjer med kode. På samme måte kan den også trekke ut overskrifter, fotnoter, tabelldata og så videre fra en Word-fil.
Trekk ut tekst fra en Word-fil
// load DOCX file
FileInputStream fis = new FileInputStream("document.docx");
// open file
XWPFDocument file = new XWPFDocument(OPCPackage.open(fis));
// read text
XWPFWordExtractor ext = new XWPFWordExtractor(file);
// display text
System.out.println(ext.getText());
Legg til tilpasset topp- og bunntekst i DOCX-dokumenter
Topptekst og bunntekst er en viktig del av Word-dokumentet, da de vanligvis inneholder ekstra informasjon som datoer, sidetall, forfatterens navn og fotnoter, som hjelper til med å holde lengre dokumenter organisert og lettere å lese. Apache POI XWPF lar Java-utviklere legge til tilpassede topptekster og bunntekster i Word-dokumenter.
Administrer tilpasset topp- og bunntekst i Word DOCX-fil
public class HeaderFooterTable {
public static void main(String[] args) throws IOException {
try (XWPFDocument doc = new XWPFDocument()) {
// Create a header with a 1 row, 3 column table
XWPFHeader hdr = doc.createHeader(HeaderFooterType.DEFAULT);
XWPFTable tbl = hdr.createTable(1, 3);
// Set the padding around text in the cells to 1/10th of an inch
int pad = (int) (.1 * 1440);
tbl.setCellMargins(pad, pad, pad, pad);
// Set table width to 6.5 inches in 1440ths of a point
tbl.setWidth((int) (6.5 * 1440));
CTTbl ctTbl = tbl.getCTTbl();
CTTblPr ctTblPr = ctTbl.addNewTblPr();
CTTblLayoutType layoutType = ctTblPr.addNewTblLayout();
layoutType.setType(STTblLayoutType.FIXED);
BigInteger w = new BigInteger("3120");
CTTblGrid grid = ctTbl.addNewTblGrid();
for (int i = 0; i < 3; i++) {
CTTblGridCol gridCol = grid.addNewGridCol();
gridCol.setW(w);
}
// Add paragraphs to the cells
XWPFTableRow row = tbl.getRow(0);
XWPFTableCell cell = row.getCell(0);
XWPFParagraph p = cell.getParagraphArray(0);
XWPFRun r = p.createRun();
r.setText("header left cell");
cell = row.getCell(1);
p = cell.getParagraphArray(0);
r = p.createRun();
r.setText("header center cell");
cell = row.getCell(2);
p = cell.getParagraphArray(0);
r = p.createRun();
r.setText("header right cell");
// Create a footer with a Paragraph
XWPFFooter ftr = doc.createFooter(HeaderFooterType.DEFAULT);
p = ftr.createParagraph();
r = p.createRun();
r.setText("footer text");
try (OutputStream os = new FileOutputStream(new File("headertable.docx"))) {
doc.write(os);
}
}
}
}