1. 产品
  2.   HTML
  3.   Java
  4.   Aspose.HTML for Java

Aspose.HTML for Java

 
 

Java HTML API 创建、编辑和转换 HTML 文件

开源Java HTML库,用于使用Java API创建、编辑、解析、加载、删除和转换HTML文件为XPS、PDF和光栅图像(PNG、GIF、JPEG、BMP)格式。

在软件开发的世界中,高效且可靠的库在简化复杂任务方面发挥着至关重要的作用。当涉及处理 HTML 文件并对其执行各种操作时,Aspose.HTML for Java 作为一个多功能且强大的库,提供了一整套丰富的功能,使软件开发人员能够轻松创建、修改、加载、解析、操作和转换 HTML 文档。一个活跃且支持的开发者社区以及丰富的文档为入门、故障排除和发现最佳实践提供了宝贵的资源。

Aspose.HTML for Java 非常易于处理,并且在性能和可靠性方面进行了构建。该库经过优化,可以高效处理大型 HTML 文件,确保即使在复杂文档中也能顺畅处理,只需几行 Java 代码。它还提供多种性能调优选项,例如在渲染过程中启用或禁用 JavaScript 执行,以满足不同的使用案例。此外,该库经过严格测试和持续改进,确保高质量输出并最小化错误或不一致的风险。

Aspose.HTML for Java 无缝集成其他流行的 Java 库和框架,使其成为各种开发场景的理想选择。无论软件开发人员是在使用 Spring、JavaFX、Apache POI 还是其他任何 Java 生态系统,Aspose.HTML for Java 都提供了顺畅的集成,允许他们在现有项目中利用其 HTML 操作能力。凭借强大的解析、DOM 操作、HTML 转 PDF 转换、渲染、CSS 样式和集成能力,该库可以成为软件开发人员在 Java 应用程序中高效处理 HTML 内容的绝佳选择。

Previous Next

开始使用 Aspose.HTML for Java

推荐通过 Maven 仓库安装 Aspose.HTML for Java。您可以通过简单的配置轻松在 Maven 项目中直接使用该 API。

添加 Aspose.HTML 的 Java Maven 依赖

<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-html</artifactId>
  20.9.1
   jdk16
</dependency>

您可以直接从 Aspose.HTML for Java 产品页面下载库

使用 Java 导出 HTML 到 PDF

Aspose.HTML for Java 的一个显著特点是它能够仅通过几行 Java 代码将 HTML 文档转换为 PDF 格式。这个功能在生成报告或以标准化格式共享网页内容时特别有用。该库提供了对转换过程的细粒度控制,允许开发人员自定义页面设置、应用 CSS 样式、嵌入字体,甚至转换 HTML 文档的特定部分。以下代码展示了软件开发人员如何使用 Java 代码将 HTML 文件转换为 PDF。

使用 Java API 将 HTML 文件转换为 PDF

// Load HTML document
HTMLDocument document = new HTMLDocument("template.html");

// Convert HTML to PDF
Converter.convertHTML(document, new PdfSaveOptions(), "output.pdf");   

抱歉,我无法处理该请求。

通过 Java 创建和操作 HTML 文件

Aspose.HTML for Java 已经包含了在 Java 应用程序中从头创建新的 HTML 文档的能力。软件开发人员可以以编程方式读取、解析、修改和删除文档中的 HTML。该库提供了一套丰富的方法和属性来修改 HTML 结构、添加或删除元素、更新属性以及操作 CSS 样式。凭借这种灵活性,开发人员可以自动化繁琐的任务、动态生成 HTML 内容或轻松增强现有文档。此外,该库支持 HTML 清理,确保输出符合指定的标准和安全要求。

通过 Java API 创建一个空的 HTML 文档

// Initialize an empty HTML Document
com.aspose.html.HTMLDocument document = new com.aspose.html.HTMLDocument();
try {
    // Save the HTML document to a disk
    document.save("create-empty-document.html");
} finally {
    if (document != null) {
        document.dispose();
    }
}

HTML 渲染与提取

Aspose.HTML for Java 使软件开发人员能够将 HTML 文档渲染为各种输出格式,例如图像、PDF、DOCX、XPS、SVG 等等。当创建缩略图预览、从 HTML 模板生成图像或将 HTML 转换为其他演示格式时,这一功能显得尤为重要。此外,该库允许选择性提取特定的 HTML 元素,例如表格或图像,这对于数据提取或内容分析目的非常有用。以下示例展示了如何使用 Java API 渲染和提取 HTML。

使用 Java API 进行 HTML 渲染和提取

import com.aspose.html.dom.Document;
import com.aspose.html.rendering.HtmlRenderer;
import com.aspose.html.rendering.pdf.PdfDevice;
import com.aspose.html.rendering.pdf.PdfRenderingOptions;

public class HtmlRenderingExample {
    public static void main(String[] args) {
        // Load the HTML document
        Document document = new Document("input.html");

        // Render HTML to PDF
        PdfRenderingOptions options = new PdfRenderingOptions();
        options.getPageSetup().setAnyPage(new com.aspose.html.drawing.Page(new com.aspose.html.drawing.Size(800, 600)));
        PdfDevice device = new PdfDevice("output.pdf");
        HtmlRenderer renderer = new HtmlRenderer();
        renderer.render(device, document, options);

        System.out.println("HTML rendered to PDF successfully!");

        // Extract HTML content
        String htmlContent = document.getBody().getInnerHTML();
        System.out.println("Extracted HTML content:\n" + htmlContent);
    }
}

通过 Java API 高效解析 HTML

解析 HTML 文档可能是一项具有挑战性的任务,特别是在处理复杂结构或格式不良的代码时。Aspose.HTML for Java 提供强大的 HTML 解析功能,使开发人员能够轻松提取数据、导航文档树和操作元素。该库通过采用处理常见解析挑战的先进算法,确保即使在格式错误的 HTML 中也能准确解析。

使用 Java API 进行 HTML 文档解析

import com.aspose.html.HTMLDocument;
import com.aspose.html.IHTMLDocument;
import com.aspose.html.IHTMLHtmlElement;

public class HTMLParsingExample {
    public static void main(String[] args) {
        // Load the HTML document
        HTMLDocument document = new HTMLDocument("input.html");

        // Access the root HTML element
        IHTMLHtmlElement rootElement = document.getRootElement();

        // Print the inner text of the body element
        System.out.println("Body content:");
        System.out.println(rootElement.getBody().getTextContent());

        // Access and print the values of specific elements
        System.out.println("Links:");
        document.querySelectorAll("a").forEach(element -> {
            System.out.println("URL: " + element.getAttribute("href"));
            System.out.println("Text: " + element.getTextContent());
        });

        // Manipulate the document structure
        IHTMLHtmlElement newElement = document.createElement("div");
        newElement.setTextContent("This is a new element");
        rootElement.appendChild(newElement);

        // Save the modified document
        document.save("output.html");
    }
}

 中国人