gpt4 book ai didi

java - 将 PDF 转换为 HTML 文件 Java API

转载 作者:太空狗 更新时间:2023-10-29 13:14:25 26 4
gpt4 key购买 nike

我想使用 java 应用程序将 pdf 文件转换为 html 文件。 PDF 文件包含一些图像、文本等。有人知道一个好的 java API 吗? (请不要建议 Aspose)。我尝试了 Apache PDFBox 但不满意

最佳答案

CSSBox Pdf2Dom是一个允许(除其他外)将 PDF 转换为 HTML 的 Java 库。该发行版甚至包含 PDFToHTML基于此库的命令行工具,因此您可以检查结果是否符合您的需求。然而,如上所述,将 PDF 转换为 HTML 总是很棘手。结果取决于特定 PDF 文件的复杂性和结构,因此不同的工具可能适用于不同的 PDF 文件。

关于java - 将 PDF 转换为 HTML 文件 Java API,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/22906188/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com