Aspose.HTML for Java

Java HTML API 创建、编辑和转换 HTML 文件

开源Java HTML库，用于使用Java API创建、编辑、解析、加载、删除和转换HTML文件为XPS、PDF和光栅图像(PNG、GIF、JPEG、BMP)格式。

在软件开发的世界中，高效且可靠的库在简化复杂任务方面发挥着至关重要的作用。当涉及处理 HTML 文件并对其执行各种操作时，Aspose.HTML for Java 作为一个多功能且强大的库，提供了一整套丰富的功能，使软件开发人员能够轻松创建、修改、加载、解析、操作和转换 HTML 文档。一个活跃且支持的开发者社区以及丰富的文档为入门、故障排除和发现最佳实践提供了宝贵的资源。

Aspose.HTML for Java 非常易于处理，并且在性能和可靠性方面进行了构建。该库经过优化，可以高效处理大型 HTML 文件，确保即使在复杂文档中也能顺畅处理，只需几行 Java 代码。它还提供多种性能调优选项，例如在渲染过程中启用或禁用 JavaScript 执行，以满足不同的使用案例。此外，该库经过严格测试和持续改进，确保高质量输出并最小化错误或不一致的风险。

Aspose.HTML for Java 无缝集成其他流行的 Java 库和框架，使其成为各种开发场景的理想选择。无论软件开发人员是在使用 Spring、JavaFX、Apache POI 还是其他任何 Java 生态系统，Aspose.HTML for Java 都提供了顺畅的集成，允许他们在现有项目中利用其 HTML 操作能力。凭借强大的解析、DOM 操作、HTML 转 PDF 转换、渲染、CSS 样式和集成能力，该库可以成为软件开发人员在 Java 应用程序中高效处理 HTML 内容的绝佳选择。

一览

Aspose.HTML for Java 功能概述。

功能概述

生成 HTML 文件
读取 HTML 文件
解析 HTML 文件
HTML 渲染
HTML 文件查看器
转换 HTML 文件
提取HTML
HTML 管理
保存 HTML 文件
HTML 转 PDF
HTML 转 DOCX
HTML 转 XPS

功能概述

加载 HTML 文档
管理 HTML 元素
从网址加载HTML
将 HTML 转换为 PNG
HTML 转 GIF
添加 HTML 元素
提取 HTML 元素
生成报告
HTML 转 JPEG
HTML 转 TTF
HTML 转 BMP
HTML 转 MHTML

Aspose.HTML for Java

API主要支持HTML格式，但可以将HTML文档导出为多种其他格式。

阅读器

PDF, HTML, XHTML, PFA, XML, JPEG

作者

PDF, PNG , GIF , JPEG

Aspose.HTML for Java

平台独立性

Aspose.HTML for Java 可以与任何基于 Java 的编程语言一起使用。

Java

Aspose.HTML for Java

开始使用 Aspose.HTML for Java

推荐通过 Maven 仓库安装 Aspose.HTML for Java。您可以通过简单的配置轻松在 Maven 项目中直接使用该 API。

添加 Aspose.HTML 的 Java Maven 依赖

<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-html</artifactId>
  20.9.1
   jdk16
</dependency>

您可以直接从 Aspose.HTML for Java 产品页面下载库

使用 Java 导出 HTML 到 PDF

Aspose.HTML for Java 的一个显著特点是它能够仅通过几行 Java 代码将 HTML 文档转换为 PDF 格式。这个功能在生成报告或以标准化格式共享网页内容时特别有用。该库提供了对转换过程的细粒度控制，允许开发人员自定义页面设置、应用 CSS 样式、嵌入字体，甚至转换 HTML 文档的特定部分。以下代码展示了软件开发人员如何使用 Java 代码将 HTML 文件转换为 PDF。

使用 Java API 将 HTML 文件转换为 PDF

// Load HTML document
HTMLDocument document = new HTMLDocument("template.html");

// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "output.pdf");

抱歉，我无法处理该请求。

通过 Java 创建和操作 HTML 文件

Aspose.HTML for Java 已经包含了在 Java 应用程序中从头创建新的 HTML 文档的能力。软件开发人员可以以编程方式读取、解析、修改和删除文档中的 HTML。该库提供了一套丰富的方法和属性来修改 HTML 结构、添加或删除元素、更新属性以及操作 CSS 样式。凭借这种灵活性，开发人员可以自动化繁琐的任务、动态生成 HTML 内容或轻松增强现有文档。此外，该库支持 HTML 清理，确保输出符合指定的标准和安全要求。

通过 Java API 创建一个空的 HTML 文档

// Initialize an empty HTML Document
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument();
try {
    // Save the HTML document to a disk
    document.save("create-empty-document.html");
} finally {
    if (document != null) {
        document.dispose();
    }
}

HTML 渲染与提取

Aspose.HTML for Java 使软件开发人员能够将 HTML 文档渲染为各种输出格式，例如图像、PDF、DOCX、XPS、SVG 等等。当创建缩略图预览、从 HTML 模板生成图像或将 HTML 转换为其他演示格式时，这一功能显得尤为重要。此外，该库允许选择性提取特定的 HTML 元素，例如表格或图像，这对于数据提取或内容分析目的非常有用。以下示例展示了如何使用 Java API 渲染和提取 HTML。

使用 Java API 进行 HTML 渲染和提取

import com.aspose.html.dom.Document;
import com.aspose.html.rendering.HtmlRenderer;
import com.aspose.html.rendering.pdf.PdfDevice;
import com.aspose.html.rendering.pdf.PdfRenderingOptions;

public class HtmlRenderingExample {
    public static void main(String[] args) {
        // Load the HTML document
        Document document = new Document("input.html");

        // Render HTML to PDF
        PdfRenderingOptions options = new PdfRenderingOptions();
        options.getPageSetup().setAnyPage(new com.aspose.html.drawing.Page(new com.aspose.html.drawing.Size(800, 600)));
        PdfDevice device = new PdfDevice("output.pdf");
        HtmlRenderer renderer = new HtmlRenderer();
        renderer.render(device, document, options);

        System.out.println("HTML rendered to PDF successfully!");

        // Extract HTML content
        String htmlContent = document.getBody().getInnerHTML();
        System.out.println("Extracted HTML content:\n" + htmlContent);
    }
}

通过 Java API 高效解析 HTML

解析 HTML 文档可能是一项具有挑战性的任务，特别是在处理复杂结构或格式不良的代码时。Aspose.HTML for Java 提供强大的 HTML 解析功能，使开发人员能够轻松提取数据、导航文档树和操作元素。该库通过采用处理常见解析挑战的先进算法，确保即使在格式错误的 HTML 中也能准确解析。

使用 Java API 进行 HTML 文档解析

import com.aspose.html.HTMLDocument;
import com.aspose.html.IHTMLDocument;
import com.aspose.html.IHTMLHtmlElement;

public class HTMLParsingExample {
    public static void main(String[] args) {
        // Load the HTML document
        HTMLDocument document = new HTMLDocument("input.html");

        // Access the root HTML element
        IHTMLHtmlElement rootElement = document.getRootElement();

        // Print the inner text of the body element
        System.out.println("Body content:");
        System.out.println(rootElement.getBody().getTextContent());

        // Access and print the values of specific elements
        System.out.println("Links:");
        document.querySelectorAll("a").forEach(element -> {
            System.out.println("URL: " + element.getAttribute("href"));
            System.out.println("Text: " + element.getTextContent());
        });

        // Manipulate the document structure
        IHTMLHtmlElement newElement = document.createElement("div");
        newElement.setTextContent("This is a new element");
        rootElement.appendChild(newElement);

        // Save the modified document
        document.save("output.html");
    }
}