Apache PDFBox
API Java pentru procesarea documentelor PDF
Bibliotecă Java deschisă pentru a crea, imprima și diviza sau îmbina documente PDF în cadrul aplicațiilor Java.
Apache PDFBox este o bibliotecă open source pur-Java pentru lucrul cu documente PDF. Folosind această bibliotecă, dezvoltatorii Java pot dezvolta programe Java care creează noi documente PDF și manipulează documentele PDF existente cu ușurință. De asemenea, permite dezvoltatorilor să citească și să extragă conținut din documente PDF. În plus, PDFBox include, de asemenea, un utilitar de linie de comandă pentru a efectua diverse operațiuni peste documente PDF folosind fișierul Jar disponibil.
Formatul de document portabil (PDF) este un format de fișier care ajută la prezentarea datelor într-o manieră care este independentă de software-ul aplicației, hardware-ul și sistemele de operare. Apache PDFBox acceptă mai multe funcții avansate, cum ar fi crearea, randarea, imprimarea, împărțirea, îmbinarea, modificarea, verificarea și extragerea textului și a metadatelor fișierelor PDF.
Noțiuni introductive cu Apache PDFBox
În primul rând, trebuie să descărcați cea mai recentă versiune de pe pagina descărcare PDFBox. Pentru a construi PDFBox cu succes, trebuie să instalați Java 7 sau o versiune ulterioară și Maven 3. Utilizați următoarea comandă de compilare
Comanda de instalare
mvn clean instal
Comanda va compila sursele Java și va împacheta clasele binare în pachete jar în mod implicit.
API Java pentru a crea și a modifica documente PDF noi
Apache PDFBox permite programatorilor să genereze un nou document PDF de la zero. După crearea documentului, dezvoltatorii pot salva documentul în locația dorită. PDF este unul dintre cele mai frecvent utilizate formate de fișiere în zilele noastre. Documentele PDF sunt compatibile pe diverse platforme și reprezintă un document independent de hardware-ul, sistemul de operare și software-ul aplicației utilizate pentru a-l crea. PDFBox facilitează, de asemenea, dezvoltatorilor să modifice documentele PDF existente. Dezvoltatorii pot adăuga pagini noi, precum și text la documentele existente ale paginii.
Creați document PDF - Java
// Create a new PDF document
PDDocument document = new PDDocument();
// Save document
document.save("fileformat.pdf");
// Close document
document.close();
Împărțirea și îmbinarea documentelor PDF utilizând Biblioteca Java
Apache PDFBox oferă capacitatea de a îmbina mai multe documente PDF într-un singur document PDF. Pentru a îmbina mai multe documente mai întâi trebuie să încărcați documentele PDF existente și apoi să setați o cale către fișierul de destinație. După aceea, dezvoltatorii pot adăuga toate fișierele PDF sursă în secvența pe care ar dori să le găsească în fișierul PDF combinat final. Putem împărți documentul PDF dat în mai multe fișiere PDF. Această clasă Splitter este folosită pentru a împărți documentul PDF dat în mai multe alte documente separate.
Îmbinare documente PDF - Java
// Initialize PDFMergerUtility object
PDFMergerUtility pdfMergerUtility = new PDFMergerUtility();
// Set output file path
pdfMergerUtility.setDestinationFileName("merged.pdf");
// Add source documents
pdfMergerUtility.addSource(new File("document1.pdf"));
pdfMergerUtility.addSource(new File("document2.pdf"));
// Merger documents
pdfMergerUtility.mergeDocuments(MemoryUsageSetting.setupMainMemoryOnly());
Adăugați și extrageți imagini în documente PDF în interiorul aplicațiilor Java
Apache PDFBox facilitează dezvoltatorilor Java să insereze imagini într-un document PDF existent. Imaginile adaugă întotdeauna valoare reală piesei de conținut. Imaginile ne ajută să învățăm, să atragem atenția, să explicăm concepte și să inspirăm. PDFBox oferă o bibliotecă pentru inserarea unei imagini într-un document PDF. Această bibliotecă folosește programul Java pentru inserarea imaginilor în documente PDF. De asemenea, API-ul le permite dezvoltatorilor să extragă imagini din documentul PDF existent și să le stocheze pe discul local.
Adăugați imagini în PDF - Java
// Create a new PDF document
PDDocument document = new PDDocument();
// Create a new page
PDPage page = new PDPage();
// Add page
document.addPage(page);
// Initialize PDImageXObject object
PDImageXObject pdImage = PDImageXObject.createFromFile("logo.png",document);
// Initialize PDPageContentStream object
PDPageContentStream contents = new PDPageContentStream(document, page);
// Drawing image
contents.drawImage(pdImage, 70, 250);
// Close contents
contents.close();
// save document
document.save("image.pdf");
Imprimați documente PDF în diverse moduri folosind Biblioteca Java
Apache PDFBox le permite dezvoltatorilor Java să imprime un document PDF utilizând API-ul standard de printare Java. Permite dezvoltatorilor să imprime documente PDF în diferite moduri. Dezvoltatorii pot imprima acum documentul la dimensiunea sa reală, care este modalitatea recomandată de imprimare. Acceptă imprimarea cu un dialog de previzualizare la imprimare, precum și cu atribute personalizate. De asemenea, dezvoltatorii pot imprima documente PDF folosind o dimensiune personalizată a paginii și margini personalizate.
Imprimați fișierul PDF prin API-ul Java
import java.awt.print.PrinterException;
import java.io.IOException;
import org.apache.pdfbox.pdmodel.PDDocument;
public class Print {
public static void main(String[] args) throws IOException, PrinterException
{
PDDocument pdf=PDDocument.load("d:\\filename.pdf");
pdf.print();
}
}